next up previous index
suivant: D'autres caractères spéciaux monter: La syntaxe précédent: La syntaxe   Index

Les métacaractères

Chaque caractère correspond à lui-même, exception faite des métacaractères qui ont une signification particulière. Pour traiter un métacaractère comme un caractère normal, il suffit de le précéder d'un /TT>.

Voici quelques métacaractères, avec leur signification :

^ début de chaîne. Ce n'est pas un véritable caractère ;
$ fin de chaîne. Même remarque ;
. n'importe quel caractère, excepté newline ;
| alternative (à placer entre parenthèses) ;
() groupement et mémorisation ;
[] classe de caractères.

Quelques explications sont peut-être nécessaires. Une regexp du type /a[bc]d/ correspondra aux chaînes abd et acd. [] permet d'énumérer une classe de caractères. L'interprétation de cette expression sera donc : un a, suivi d'un b ou d'un c, puis un d.

L'ensemble des caractères composant la classe peut être précisée par énumération (comme précédement) ou bien en précisant un intervalle comme par exemple /[a-z]/ qui correspondra à tous les caractères compris entre a et z.

On peut également prendre le complémentaire de cet ensemble, en le précédant d'un ^5.4. Donc /a[^bc]d/ correspondra à toutes les chaînes du type a.d, sauf abd et acd. On peut donc lire : un a, suivi d'un caractère qui n'est ni un b ni un c, puis un d.

L'alternative permet de préciser que l'on recherche l'une ou l'autre des expressions séparées par des |. Par exemple, /arti(chaut|ste)/ correspondra aux chaînes artichaut et artiste. Il est bien sûr possible de mettre plus de deux alternatives.

Enfin, la mémorisation permet de mémoriser certaines des parties de la chaîne. Par exemple, appliquer l'expression /b(.+)ars/ à la chaîne beggars mémorisera la partie qui correspond à ce qui se trouve entre parenthèses, i.e. egg, et fixera la variable $1 à cette valeur. On peut donc lire : un b, suivi d'une série (+) de caractères quelconques (.), que l'on mémorisera (les parenthèses), puis la chaîne ars.


next up previous index
suivant: D'autres caractères spéciaux monter: La syntaxe précédent: La syntaxe   Index
Olivier Aubert
1999-06-01