Beruflich Dokumente
Kultur Dokumente
Seite 1 von 3
Stand: 02. 02 14
in GREP-Suchen/Ersetzen ab CS3 und GREP-Stil ab CS4
GREP kann nur auf markierbare Bereiche angewendet werden, Zeichen die in der automatische Nummerierung ver-
wendet werden oder Zeichen von Textvariablen können nicht ersetzt werden. Textvariablen können aber als ganzes
formatiert werden. Standard mäßig wird zwischen Groß- und Kleinschreibung unterschieden.
Das x ist ein Platzhalter für die Zeichen auf den der Befehl wirkt. Beim ersetzen „Ändern in:“ müssen ei-
nige Zeichen maskiert/escaped werden, damit sie als Zeichen eingefügt werden können – siehe Symbole.
Nicht in „Ändern in:“ enthalten oder zu verwenden!
Nicht in der „Sonderzeichen Auswahl“ enthalten. Marken
(?#) Kurzbeschreibung (?#x) besonders für GREP-Stile ~# Alle Seitenzahlen
(?#?) Kurzbeschreibung (?#x?) besonders für GREP-Stile ~N Aktuelle Seitenzahl 1
* *x deaktiviert GREP-Stil ~X Nächste Seitenzahl 2
1
\t Tabstopp/Tabulatorzeichen » ~V Vorherige Seitenzahl 1
~y Rechtsaustreibender Tabulator shift+Tab »| ~x Abschnittsmarke
\n Harter Zeilenumbruch (shift return) ¬ <000A> shift ⏎ ~a Marke für verankertes Objekt Ve r a n k e r t e s O b j e k t
\r 2 Absatzende findet bis auf \n alle Umbruch ~F Marke für Fußnotenverweis 3
zeichen (fügt einen Absatzumbruch ein) ~I Indexmarke (großes i) :
^
\x{ } Unicode (Hexwert) \x{0041} A Trenn- und Gedankenstriche
<> Unicode (Hexwert) <0061> a ~_ Geviertstrich —
\N{ } Unicode (Name) \N{AMPERSAND} & ~= Halbgeviertstrich –
[[. .]] Unicode (Name) [[.commercial AT.]] @ ~- Bedingter Trennstrich Trennungs
empfehlung cmd shift - - oder -!
Symbole
~~ Geschützter Trennstrich ‑
~8 Aufzählungszeichen •
Leerraum
\\ Backslash \ (als Text-Zeichen) <005c>
Leerzeichen (Leertaste) · \x{0020}
\^ Caret-Zeichen ^ (als Text-Zeichen)
~m Geviert — · cmd shift m
~2 Copyright-Symbol ©
~> Halbgeviert –· cmd shift n
~e Auslassungszeichen …
~f Ausgleichs-Leerzeichen · , treibt Bocksatz aus
~
\ ~ Tilde ~ (als Text-Zeichen) <007E>
~| 1/24-Geviert ¨· F4
~7 Absatzmarke ¶ (als Text-Zeichen)
~S Geschütztes Leerzeichen ^· cmd alt x
~r Symbol für eingetragene Marke
~6 Paragraphenzeichen §
® ~s Geschütztes Leerzeichen ^· (feste Breite) cmd F4
Unsichtbare geschützte Leerzeichen (feste Breite) :
~d Symbol für Marke ™ \x{0085}
\x{2028}
\x{2029}
4 \x{2000} ≙ ~s
\ ( Runde Klammer auf ( ~< Achtelgeviert ˇ· cmd alt shift m
\ ) Runde Klammer zu ) ~/ Ziffernleerzeichen #·
\ { Geschweifte Klammer auf { ~. Interpunktionsleerzeichen !·
\ } Geschweifte Klammer zu } ~3 Drittelgeviert •·
\ [ Eckige Klammer auf [ ~ 4 Viertelgeviert •·
\ ] Eckige Klammer zu ] ~% Sechstelgeviert ··
\x{27E8} Spitze Klammer auf ⟨ Anführungszeichen
\x{27E9} Spitze Klammer zu ⟩ " Alle doppelten Anführungszeichen5
6
\ x {00D7 } Mal-Zeichen × ' Alle einfachen Anführungsz. ' ’ ‚ ‘ ` (nicht ´′‵)7
(öffnend und schließend, alle Formen) Im Feld „Ändern in:“ bei " (shift 2) oder
\ x {2219} Mal-Zeichen ∙ ' (shift #) werden je nach Sprache die typografischen Zeichen eingefügt.
\ x {00F7} Geteilt-Zeichen ÷ ~" Gerade doppelte Anführungszeichen " <0022>
\ x {2215} Geteilt-Zeichen ∕ ~ { Öffnendes Anführungszeichen „ <201E>
\ x {2212} Minus-Zeichen − ~} Schließendes Anführungszeichen “ <201C>
\ x {00b5} Mikro-Zeichen µ ~' Gerades einfaches Anführungszeichen ' <0027>
\+ Plus + \x {2019} Apostroph/Hochkomma ’ (alt shift #) <2019>
\| vertikaler Strich | ~[ Öffnendes einfaches Anführungszeichen ‚<201A>
\ . Satzzeichen . ~] Schließendes einfaches Anführungszeichen ‘ <2018>
\x{0024} Dollar $ \$ wäre auch richtig, findet nur
das erste und letzte Dollar-Zeichen im Text 3 Fußnoten-Zeichen im Text und in der Fußnote
4 werden gefunden von \s [[:space:]] [[:print:]] \L \X nicht
\* Stern * von . [[:blank:]] \p{Zs}
5 " " „ “ » « « »
1 Kein rechtsaustreibender Tabulator ~y shift+Tab 6 GRAVE ACCENT wenn es alleine steht
2 Die Umkehrung mit \R funktioniert nicht, keine echte Zeichenklasse. 7 ACUTE ACCENT wenn es alleine steht und Prime-Zeichen
\w Alle Wortzeichen a – z A – Z 0 – 9 _ ß ü Ü ö Ö ä Ä ^ Nicht [^x] findet alles außer x, negiert x (Funktion wie Zeichen
17
(inkl. Wortzeichen anderer Sprachen, ohne - (Divis) satz) die Zeichen werden übersprungen.
@ Symbole wie Währungszeichen, Math.-Symbole | Logisches Oder x|y euro|eur zuerst die längere Zeichenkette!
usw.) (x|y) die Klammer begrenzt die Reichweite.
\W Beliebiges Zeichen, das kein Wortzeichen ist 11 Findet keine elektronisch versal gestellten Zeichen.
\x{0018} ~# (Marken) und ~v (Variable) fügt ~N ein 12 Findet den Beginn einer \w Zeichenkette ohne die \W (Trenner)
13 Findet das Ende einer \w Zeichenkette ohne die \W (Trenner)
14 Textkasten, Tabellenzelle, Fußnote – siehe auch: „Mehrzeilig“ aus
8 Ist ein Zeichen ohne Breite, kein Schriftzeichen, wird von Suchaus 15 Textkasten, Tabellenzelle, Fußnote – siehe auch: „Mehrzeilig“ aus
drücken nicht berücksichtigt, ist nur mit ~k zu finden. ID CS3 ignoriert die Textabschnitte in Tabellenzellen.
9 nicht Umbruchzeichen \n \x{0085}
\x{2028}
\x{2029} 16 Klammerinhalt wird nicht als Fundstelle gezählt.
10 ID CS3 findet nur Tabulatoren, Umbrüche und das Leerzeichen, keine 17 Wenn [^x] im Zusammenhang mit einer Ersetzung verwendet wird, ist [^x] in
Festabstände. eine Gruppe zu stellen – damit das fehlende Zeichen zurück geholt werden kann.
(?<=) Positives Lookbehind (?<= y18)x findet x wenn y zuvor [[:print:]] Alle Zeichen (inkl. Umbruchzeichen, Leerraum,
(?<!) Negatives Lookbehind (?<! y18)x findet x wenn nicht y zuvor \t ohne ~y )
(?=) Positives Lookahead x(?= y) findet x wenn y folgt [x[:zeichenklasse:]yz] im Posix können zusätzlich Zeichen
aufgenommen werden, siehe Zeichensatz
(?!) Negatives Lookahead x(?! y) findet x wenn y nicht folgt
Gefunden (einfügen)
(?<=)(?=) Positives Lookaround (?<=y)x(?=z) findet x wenn
$0 Text gefunden Alle gefundenen Zeichen die nicht
y zuvor und z folgt (Kombination aus + | − Lookbehind und + | − Lookahead)
(gruppiert) und (gruppiert) sind
Modifizierer 19
$1 1. Stelle gefunden ( )-Inhalt
(?i) Nicht zwischen Groß- und Kleinschreibung
unterscheiden (?i)x $2 2. Stelle gefunden ( )-Inhalt usw.
(?-i) Zwischen Groß- und Kleinschreibung unterscheiden Unicode-Kategorien
(?-i)x (Standard) Dies ist nur eine Auswahl von Ausdrücken wofür es
20 keine Alternativen gibt.
(?m) „Mehrzeilig“ ein (?m)^x oder (?m)x$ (Standard)
\p {Zs} Alle Leerräume 24 Leerraum und nichts anderes
(?-m) „Mehrzeilig“ aus21 (?-m)^x oder (?-m)x$
\p{L*} ≙ \w ohne _
funktionsgleich \Ax oder x\Z
\p{S*} Alle Symbole
(?s) „Eine Zeile“ ein (?s)x findet bis # ≙ \X
\p{Sc} Währungen
(?-s) „Eine Zeile“ aus (?-s)x findet nur bis zu einem
Umbruchzeichen22 (Standard) \p{Sm} Mathematische Symbole
(?x) Leerzeichen im Suchausdruck ignorieren (?x)x \p{So} andere Symbole © ¶ § ™ und
im Text platzierte Objekte
®
(?-x) Leerz. im Suchausdruck berücksichtigen (?-x)x (Standard)
Posix-Zeichenklassen \p{Nl} Römische Ziffern ⅣⅦⅬⅱⅺ usw.
Posix-Zeichenklassen können [[:zeichenklasse:]] oder besser \p{No} Bruch-Zeichen ¼ ½ ¾ u. ä.
\p{zeichenklasse} geschrieben werden, da mit \P{zeichenklasse} \p{Co} Private-Zeichen
negiert werden kann.
\p{Po} " ' ‘! ¡ ? ¿ # % ‰ & @ * • · … , . ; : \ / † ‡ #
[^[:zeichenklasse:]] negiert
[[:zeichenklasse:]^] oder $ nur erste Fundstelle im Absatz und nach \P{ } negiert den Suchausdruck
einem harten Zeilenumbruch oder Fußnote
Die Groß- Kleinschreibung ist zu beachten, z. B. L(etter)
[[:alnum:]] [[:alpha:][:digit:]] oder l(ower).
[[:alpha:]] [[:upper:][:lower:]] Platzhalter/Wildcard mit Unicode-Bereichen (Hex-
[[:digit:]] ≙ \d Werte) in einer Zeichenklasse selbst definieren.
[[:lower:]] ≙ \l [\x{ }-\x{ }\x{ }-\x{ } usw.]
[[:punct:]] „ “ « » ‹ › " ' ‘! ¡ ? ¿ # % ‰ & @ ( ) [ ] { }
* • · … , . ; : \ / † ‡ _ ‐ – — - # (nicht ⁄ ∕ −)23 Mit Unterstützung:
[[:space:]] Leerraum, Umbruchzeichen, \n und „InDesign automatisieren – Keine Angst vor Skripting
Tabulatoren \t ~y GREP & Co“ mit freundlicher Genehmigung von Gregor
[[:upper:]] ≙ \u Fellenz
[[:word:]] ≙ \w www.indd-skript.de
[[:xdigit:]] Alle Zeichen des Hexadezimalsystem 0 – 9 a – f A – F und das „Internet“
(0000 – FFFF)
[[==]] [[=x=]] Beliebiges Zeichen eines bestimmten Links zum Thema:
Glyphensatzes, z. B. a à á â ã ä å A À Á Â Ã Ä A Gerald Singelmann
[[:blank:]] Beliebiger Leerraum oder Tabulator \t nicht ~y www.scribd.com/doc/36288096/Grep-Intro
[[:control:]] Steuerzeichen Umbruchzeichen, \n, Marken, www.indesign-faq.de/de/grep-und-indesign
Tabulatoren \t ~y und Textvariablen http://de.wikipedia.org/wiki/Regulärer_Ausdruck
[[:graph:]] Alle sichtbaren Zeichen (ohne Leerräume usw.)
http://grepcode.com/file/repository.grepcode.com/java/
root/jdk/openjdk/6-b14/java/util/regex/Pattern.java
18 Wiederholungen ? * + {} sind nicht möglich, Ausnahme: {n}
19 Die Modi i s x können in beliebiger Reihenfolge zusammengefasst werden (?six)
Diese Zusammenstellung basiert auf der CS4, Mac 10. 6.8
20 ^ findet x am Anfang eines Textkasten, Tabellenzelle, Fußnote oder nach einem Wer Korrekturen oder weitere Befehle hat, bitte ich
Umbruchzeichen, nicht „Bedingter Zeilenumbruch“ ~k um eine Mitteilung.
$ findet x vor einem Umbruchzeichen oder der Endmarke #
21 ^ oder $ finden x nur am Anfang/Ende des Textkasten, Tabellenzelle, Fußnote
22 Alle Umbruchzeichen, nicht „Bedingter Zeilenumbruch“ ~k
23 Bruchstrich, Divisionstrich, Minus-Zeichen 24 nicht die unsichtbaren Leerräume: \x{0085}
\x{2028}
\x{2029}