Er zat een aapje op een stokje.
Een eenvoudige regular expression kan gewoon een woord zijn. Zo zal de regular expression zat
matchen met het woordje zat in de gegeven tekst.
Een meer complexe expression is [A-Z]r
Deze expressie matched met alle tweeletterpatronen die beginnen met een hoofdletter en eindigen met de letter r. In ons voorbeeld is dat het woordje Er.
Tussen de vierkante haken staat dus een range, waarvan de A het begin en de Z het einde is. Het streepje staat voor alle tussenliggende tekens. We kunnen tussen vierkante haken ook bijvoorbeeld alleen de letters A, E en I zetten. Dit ziet eruit
als [AEI]ls
. Dit matchet dus drieletterige wooren die beginnen met de hoofdletter A of E of I en vervolgens een l en een s hebben.
De vierkante haken hebben dus een speciale betekenis in regualr expressions.
Soms willen we echter de vierkante haak zelf in de regular expression hebben.
Dit kunnen we bereiken door er een backslash voor te zetten.
Deze backslash haalt de bijzondere betekenis van een symbool weg.
De backslash is dus zelf ook zo'n bijzonder symbool.
Veel tools passen de regular expression als zoekcriterium toe en kunnen dan op het gevondene of een deel daarvan een bewerking uitvoeren.
\ ^ $ . [ ] | ( ) * + ?
Een basis regular expression is een van de volgende dingen:
\*
het character *
.
\t
matched de TAB.
^
die matched met het begin van een regel.
$
die matched met het eind van een regel.
.
die matched met een willekeurig character.
^
die met geen van de characters uit de groep matched maar wel met elk ander character.
a|b
matched a of b
ab
matched ab (dus a gevolgd door b)
a*
matched nul of meer a's (bedenk dat a ook een andere regular expression kan zijn).
a+
matched een of meer a's (bedenk dat a ook een andere regular expression kan zijn).
a?
matched nul of een a (bedenk dat a ook een andere regular expression kan zijn).
^[0-9]+$
matched alle regels bestaande uit enkel cijfers
^[a-z].*$
matched alle regels beginnend met een kleine letter
^$
matched alle lege regels
[A-Z][a-z]*p
matched alle woorden beginnend met een hoofdletter gevolgd door nul of meer kleine letters en eindigend op de letter p.
De basisexpressies zijn te combineren en van operatoren te voorzien.
a|b
matched a of b
ab
matched ab (dus a gevolgd door b)
a*
matched nul of meer a's (bedenk dat a ook een andere regular expression kan zijn).
a+
matched een of meer a's (bedenk dat a ook een andere regular expression kan zijn).
a?
matched nul of een a (bedenk dat a ook een andere regular expression kan zijn).
^[0-9]+$
matched alle regels bestaande uit enkel cijfers
^[a-z].*$
matched alle regels beginnend met een kleine letter
^$
matched alle lege regels
[A-Z][a-z]*p
matched alle woorden beginnend met een hoofdletter gevolgd door nul of meer kleine letters en eindigend op de letter p.
COMMAND.COM CONFIG.SYS AUTOEXEC.BAT
\\\*[5-9]?
l.vanmoergestel@hvu.nl leovm@chello.nl LEOVM@CHELLO.NL lvanmoergestel@fnt.hvu.nl