Sie sind auf Seite 1von 40

Modul 6a

Strukturnormalisierung
und -kanonisierung
Wozu überhaupt?

Eingabe

Anfrage Ausgabe
H
N N

N N
Struktur DB

O
H
?
H O
N

O-
H+
O
Wozu überhaupt?

Eingabe

Anfrage Ausgabe
H
N N
Normalisierung
Normalisierung H

Kanonisierung
Kanonisierung H
N N
Registrierung
Registrierung N
H
O
O
H O
N O

O- Struktur DB
H+
O
Einige Eingabestrukturen
H

a N

O-
H+ H
O

b O
H

O
N

c
O
N
O
Normalisierung I
H H

a N N

O- O
H+ H
O O

b O
H

O
N

c
O
N
O
Normalisierung II
H H

H
a N N

O- O
H+ H
O O

b O
H

O
N

c
O
N
O
Normalisierung III
H H

H
a N N

O- O
H+ H
O O

b O
H

O
N

c
O
N
O
Normalisierung
H H

H
a N N

O- O
H+ H H
O O

H
b O
H O

O
O N
N

H H

c H

O O
N N
O O
Kanonisierung
20 12
H
2 H 11
1 3 10 14 13
H
a 6 21
N 9 N 4 15
O-
19O 17 5 16
H+ H O
8 7 H
O
18

H
b O
H O

O
O N
N

H H

c H

O O
N N
O O
Kanonisierung
20 12
H
2 H 11
1 3 10 14 13
H
a 6 21
N 9 N 4 15
O-
19O 17 5 16
H+ 8 7
17 2019
H O H
O
18
16 18 21
12 13 14
2 5 6 11 H
b H O 15
O
O
1 4 10
O
N 3 N 8 9
7
H H

c H

O O
N N
O O
Kanonisierung
12 -- 6 4
20 H
H
2 H 11 14
1 3 10 14 13 12 15 1617 7
H

a 6
H
21 3N 10 --
4 15 1318 19
N 9 N

O-
19O 17 5 16 2O 8 5 11
H+ 8 7 O 9
17 2019 --
H O H
O
18 1 H
16 18 21 19 7
18 17 4
12 13 14
2 5 6 11 H 13 16 6
b H O 15 2 9 11 15 H
--
O
O
1 4 10 O
85
O
N 3 N 8 9 O 14
7 1 3N 10 12
H H

c H

O O
N N
O O
Linearisierung und Registrierung
-- 6 4
H
14
12 15 1617 7
H
a 3N 10 -- 1O=8,2O-8,3N#5, ... ,16[R]-17, ...
1318 19
2O 8 5 11
O 9 Identisch
--
1 19
H
7
18 17 4
16
b 2 9 11 15 H -- 6 1O=8,2O-8,3N#5, ... ,16[R]-17, ...
13
O
85
O
N 10
14
1 12
1 3 12-- 6
14 H 4
c 12 15 16 1O=8,2O-8,3N#5, ... ,16[S]-17, ... Neu
17 H 7
9 10 --
13
11 18 19
2O 8 5
N
O1 3
Normalisierung: Ausgewählte Probleme
• Behandlung metallorganischer Verbindungen
– Ladungsausgleich
– Valenzzustände von Metallen
– Behandlung anorganischer Fragmente

• Funktionale Gruppen
– Z.B. Nitro-, Carbonyl-, ...

• Aromatizität
– Benzoide Systeme
– Planare Stickstoffe

• Stereochemie
– R,S und E/Z Systeme
– Chiralität bei Mesomeren
Beispiel Aromatizität
Das Problem

Der Begriff ist im Detail nicht eindeutig definiert

• Geruch ist „aromatisch“


– Wer entscheidet das?

• Ringstrom vorhanden
– Wer misst das?

• Reaktivität herabgesetzt
– Unter welchen Bedingungen?

• Hückel-Regel
Die Hückel-Regel

IUPAC
IUPAC Definition
Definition

Monozyklische
Monozyklische planare,
planare, sp2-hybridisierte
sp2-hybridisierte Systeme
Systeme mitmit (4n
(4n ++ 2)
2)
π-Elektronen sind
π-Elektronen sind aromatisch
aromatisch für
für nn == 0,
0, 1,
1, 2,
2, 3,
3, 4,
4, 5.
5.

+ -

Cyclopropenyl Kation Cyclopentadienyl Anion Benzol


(n = 0) (n = 1) (n = 1)
Beispiel Aromatizität

• Geruch ist „aromatisch“


– Wer entscheidet das?

• Ringstrom vorhanden
– Wer misst das?

• Reaktivität herabgesetzt
– Unter welchen Bedingungen?

• Hückel-Regel
– Was ist mit Polyzyklischen Verbindungen?

• Resonanzenergiegewinn
– Wie berechnet man das?
Beispiele für Aromatizität
?
=

?
=

?
=
Der Randic-Algorithmus
• Finde alle Kekule-Muster

• Zähle jeden konjugierten Ring und berechne den


Resonanzenergieeffekt RE dieses Rings

RE = Rn bei Hückel-Ring (4n+2 π-Elektronen)


RE = Qn bei Anti-Hückel-Ring (4n π-Elektronen)

• Berechne Randic-Aromatizitätsindex A:

RE( 4n + 2) + RE( 4n )
A=
RE( 4n + 2) − RE( 4n )
Beispiel Naphtalin
3 Kekule-Patterns

(1)
4 Ringe mit 6 π-Elektronen (R1)
2 Ringe mit 10 π-Elektronen (R2)

RE(4n+2) = ( 4 x R1 + 2 x R2 ) / 3
(2) RE(4n+2) = ( 4 x 0.87 eV + 2 x 0.25 eV ) / 3
RE(4n+2) = 1.33 eV

RE(4n) = 0
(3)

Randic-Aromatzitätsindex = 1.0
Beispiele für Aromatizität
RE = ( 4R1 + 2R2 ) / 3
= RE = 1.33 eV
A = 1.0

RE = ( 8R2 + 2R3 + 2Q3 ) / 4


= RE = 0.47 eV
A = 0.76

RE = 0.20 eV
A = 0.345
=
Grenzen des Randic-Algorithmus

N N

RE = ( 2R1 + 2R4 + 4Q2 + 4Q3 ) / 4


RE = -0.15 eV N
N
A = -0.14

Ist dieser Ring nicht doch aromatisch?

• Wie bewertet man Heteroatome?


• Was ist mit sp2-Stickstoffen?
Kanonisierung
Ziel:
Eindeutige Nummerierung der Atome einer chemischen Struktur in
2D-Darstellung.

Trivialer Ansatz:
• Erzeuge alle Nummerierungen, linearisiere die Darstellung (z.B.
mittels SMILES Notation), sortiere lexikografisch und nimm die
erste Nummerierung.
Anwendung: „Wiswesser Line Notation“
Nachteil: Sehr aufwändig

Die meisten Methoden, die heute im Einsatz sind, schränken die zu


Anzahl der Nummerierungen auf eine klar definierte Weise stark
ein, bevor ein lexikografischen Vergleich stattfindet.
Kanonisierung: Morgan-Algorithmus
• Betrachtung des normalisierten Strukturdiagramms
als mathematischer Graph. Atome sind Ecken,
Bindungen sind Kanten.

• Der Algorithmus ist zweigeteilt:


1) Im ersten Schritt werden Äquivalenzklassen gebildet und
jede Ecke einer Äquivalenzklasse zugeordnet.
2) Die Äquivalenzklassen werden sortiert und die Ecken
anhand dieser Sortierung eindeutig nummeriert. Hier
können chemische Eigenschaften ( z.B. Bindungsordnung,
Ordnungszahlen, etc. ) als Sortierkriterium eingebaut
werden.
Morgan-Algorithmus: Äquivalenzklassen I
1) initialisiere jede Ecke mit dem „Konnektivitätswert“ 1
2) Zähle die Anzahl C verschiedener
„Äquivalenzklassen“.

1 1
1 N1
1 1 C = 1 Äquivalenzklasse
N

1 1
1 1
O
1 1 1
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.

1
2 1
2
3
3 N 11
1
2 1
1
N

1 1
3
3 2
1 1
O 1
1 2 1 1 1 1
Morgan-Algorithmus: Äquivalenzklassen II
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)

Cneu = 3 Äquivalenzklassen:
2 2 1 (4x)
3 N1
2 3 2 (5x)
N 3 (4x)

3 3
1 2
O
2 1 1
Morgan-Algorithmus: Äquivalenzklassen II
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 3 Äquivalenzklassen:
2 2 1 (4x)
3 N1
2 3 2 (5x)
N 3 (4x)

3 3
1 2
O
2 1 1
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 3 Äquivalenzklassen:
5 6 3 (4x)
6 N3
5 6 5 (6x)
N 6 (3x)

5 5
3 5
O
5 3 3
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 8 Äquivalenzklassen:
11 12 5 (3x)
14 N6
10 16 6 (1x)
N 10 (2x)
11 (2x)
13 12 12 (2x)
5 11 13 (1x)
O 14 (1x)
10 5 5
16 (1x)
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 8 Äquivalenzklassen:
26 30 12 (2x)
30 N 14
24 34 13 (1x)
N 14 (1x)
24 (2x)
25 24 25 (1x)
13 26 26 (2x)
O 30 (2x)
24 12 12
34 (1x)
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 10 Äquivalenzklassen:
58 64 24 (2x) 58 (2x)
68 N 30
51 82 25 (1x) 61 (1x)
N 30 (1x) 64 (1x)
51 (2x) 68 (1x)
61 54 54 (1x) 82 (1x)
25 58
O
51 24 24
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 10 Äquivalenzklassen:
133 150 54 (2x) 127 (1x)
148 N 68
119 180 61 (1x) 133 (2x)
N 68 (1x) 148 (1x)
116 (1x) 150 (1x)
127 116 119 (2x) 180 (1x)
61 133
O
119 54
54
Morgan-Algorithmus: Äquivalenzklassen II
3) Weise jeder Ecke die Summe der Konnektivitäts-
werte ihrer direkten Nachbarn zu.
4) Ermittle die Anzahl Cneu verschiedener
„Äquivalenzklassen“ (wie Schritt 2)
5) Wenn Cneu ≥ C: Setze C = Cneu, weiter bei 3)

Cneu = 9 Äquivalenzklassen:
299 328 116 (2x) 299 (3x)
334 N
260 416 148 127 (1x) 328 (1x)
N 148 (1x) 334 (1x)
256 (1x) 416 (1x)
299 256 260 (2x)
127 299
O
260 116 116
Morgan-Algorithmus: Nummerierung
6) Setze Konnektivitätswerte auf vorletzte
Äquivalenzklassen.
7) Starte Nummerierung bei noch nicht nummerierter
Ecke mit maximalem Konnektivitätswert.

133 150
148 N 68
119 180
N
1
127 116
61 133
O
119 54
54
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht
nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten
unbenutzten Nummern.

133 150
148 N 68
119 180
2 N
1
127 116
61 133
O
119 54
54
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht
nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten
unbenutzten Nummern. Für Nachbaratome mit
gleichem Konnektivitätswert können
Bindungsordnungen und Ordnungszahlen zur
Gewichtung verwendet werden.

133 150
148 N 68
119 180
2 N
1
127 116
61 133
O
119 54
54
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht
nummerierten Nachbarn.
9) Nummeriere Nachbarn mit den nächsten
unbenutzten Nummern. Für Nachbaratome mit
gleichem Konnektivitätswert können
Bindungsordnungen und Ordnungszahlen zur
Gewichtung verwendet werden.

133 150
148 N 68
119 180
2 N
1
127 116
61 133
O
119 54
54
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten
Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern.
Für Nachbaratome mit gleichem Konnektivitätswert können
Bindungsordnungen und Ordnungszahlen zur Gewichtung
verwendet werden. Bei bleibender Gleichheit werden beide
alternativen nummeriert und nach lexikographischer Sortierung
die erste gewählt.

3/4
133 150
148 N 68
119 180
2 N
1
127 4/3 116
61 133
O
119 54
54
Morgan-Algorithmus: Nummerierung
8) Wähle kleinste nummerierte Ecke mit noch nicht nummerierten
Nachbarn.
9) Nummeriere Nachbarn mit den nächsten unbenutzten Nummern.
Für Nachbaratome mit gleichem Konnektivitätswert können
Bindungsordnungen und Ordnungszahlen zur Gewichtung
verwendet werden. Bei bleibender Gleichheit werden beide
alternativen nummeriert und nach lexikographischer Sortierung
die erste gewählt.
10) Weiter bei (8) bis alle Ecken nummeriert sind
1333/4 150 9
6/7 148 N 68
119 180
2 N
1 5
127 4/3 8 116
61 10 133
7/6 O 11
13 119 54
12 54
Ausgewählte Literatur
Aromatizität
M. Randic
Aromaticity and conjugation
J. Amer. Chem. Soc. 99 (1977) 444-450

Kanonisierung
H. L. Morgan
The Generation of a Unique Machine Description for Chemical
Structures - A Technique Developed at Chemical Abstracts
Service
J. Chem. Doc. 5 (1965) 107-113