Sie sind auf Seite 1von 51

Genetik und Genomforschung

- Molekulare Evolution II -
Katja Nowick
Themen der Vorlesung
Genregulation
• Zentrales Dogma der Molekularbiologie
• Transkriptionsfaktoren
• Nicht-kodierende RNAs
Biologische Netzwerke
• Beispiele für biologische Netze
• Analysierte Parameter
• Eigenschaften biologischer Netze
• Evolution biologischer Netze
Molekulare Evolution
• Vererbung und Variabilität
• Selektion und Netzwerke
Molekulare Evolution
 Vererbung
 Änderungen in Allelfrequenzen
 Komplexe Merkmale
 Genom des Menschen
 Neutral Theory
 Selektionstests
 Netzwerk-Evolution
Mutationen – Neue Allele entstehen

Nur Mutationen in Eizelle bzw. Spermium entscheidend,


da die der Körperzellen nicht an die nächste Generation
weitergegeben werden
Schätzung: jeder Mensch hat ca. 100 neue Mutationen

… ATGATAGGACTAGTTCGAGGCATAATT…
… Met Ile Gly Leu Val Arg Gly Ile Ile …
Mutationen sind zufällig!

… ATGATAGGACTAGCTCGAGGAATAATT…
… Met Ile Gly Leu Ala Arg Gly Ile Ile …
Neutrale Theorie der molekularen Evolution

“Neutral Theory”
Motoo Kimura

Großteil der Variation innerhalb einer


Population und zwischen Arten
kommt von genetischer Drift und nicht
von natürlicher Selektion
Neutrale Theorie der molekularen Evolution

Kimura sagt nicht, dass natürliche


Selektion nicht existiert
Sondern:
“Neutral Theory”
• Molekulare Evolution: dominiert Motoo Kimura
von selektiv neutralen Mutationen
und Drift
• Evolution des Phenotyps: dominiert
von natürlicher Selektion
Neutrale Theorie der molekularen Evolution

Vorteilhafte Mutationen: Relativ selten

Nachteilhafte Mutation: werden durch die natürliche Auslese schnell vom Genpool entfernt

Neutrale Mutation: Ein relativ großer Anteil der denkbaren Veränderungen der DNA-Sequenz
hat keinen wesentlichen Effekt auf die Funktion des Proteins (z.B. non-synonymous
mutations, Mutationen im Intergen-Bereich …)
Die Anhäufung (Akkumulation) dieser Mutationen hängt demnach nur von der Mutationsrate
ab, was mit der molekularen Uhr übereinstimmt

Mutationsrate = μ
Neutrale Mutationsrate = μ°
Molekulare Uhr
Wenn die meisten Mutationen neutral sind,
dann sollte die Anzahl Mutationen linear mit der Zeit ansteigen

Molekulare Uhr wird genutzt, um anhand von Sequenzunterschieden auf Zeitpunkt der Trennung zweier evolutionäre Linien zu
schließen (Alter von Arten)
Positionen im Alignment
Molekulare Evolution
 Vererbung
 Änderungen in Allelfrequenzen
 Komplexe Merkmale
 Genom des Menschen
 Neutral Theory
 Selektionstests • Codon-basierte Tests
• Allelfrequenz-basierte Tests
 Netzwerk-Evolution • Linkage-basierte Tests
Selektionstests
Evolviert mein Gen X unter Selektionsdruck oder neutral?
Codon-basierte Tests Allel-Frequenz basierte Tests LD-basierte Tests

Für Populationen und zwischen Arten Für Populationen Für Populationen


Für Proteine Für alle Arten an Sequenzen Für alle Arten an Sequenzen
ungleiche Mutationsraten im Genom Demographie muss berücksichtigt werden
werden berücksichtigt

e.g. dN/dS e.g. Fst e.g. EHH


McDonald-Kreitman Test XP-CLR XP-EHH
Tajima’s D
Hudson-Kreitman-Aguade (HKA) test

Vergleiche beobachtete Werte mit den bei neutraler Evolution erwarteten Werte
Mutationen – Neue Allele entstehen
Nicht-synonyme Änderungen können neue Merkmale hervorbringen
Oft “negativ”  Krankheitsbild
Selten “positiv”  evolutionäre Neuerungen

… ATGATAGGACTAGTTCGAGGCATAATT…
… Met Ile Gly Leu Val Arg Gly Ile Ile …
Mutationen sind zufällig!

… ATGATAGGACTAGCTCGAGGAATAATT…
… Met Ile Gly Leu Ala Arg Gly Ile Ile …
Nicht-synonyme Synonyme
Ӓnderung Ӓnderung
Codon-based tests

Selektion greift an der Funktion an (z.B. Proteine)

Genetischer Code:

Eine Aminosäure wird durch 3 Nukleotide kodiert


(= Triplet, Codon)

Die meisten Aminosäuren werden durch mehr als ein Codon kodiert
Dritte Codon-Position oft nicht entscheidend
 Codons können synonym sein (=synonymous)

Die Mutationsrate an synonymen Positionen wird als neutral angenommen


 Wird zur Normalisierung verwendet, also zum Vergleich zur Mutationsrate von nicht-synonymen Positionen
Vorteil: Berücksichtigung der variable Mutationsraten im Genom
Codon-based tests
Codon-Substitutionsmodelle:
Das Element, auf dem evolviert wird, ist das Codon (nicht einzelne Nukleotide oder Aminosäuren)
Am gebräuchlichsten: Modell von Yang und Nielsen 1998 (YN00):
Chemische Unterschiede zwischen den Aminosäuren werden ignoriert

Da die natürliche Selektion auf der Ebene der Proteine operiert, sind Nukleotidänderungen, die zu
einer Aminosäureänderung führen (nicht-synonyme Änderungen) unter höherem Selektionsdruck
• Non-synonymous changes: Aminosäure ändert sich
• Synonymous changes: Aminosäure ändert sich nicht, d.h. stille Mutation

dN (Ka) = Rate nicht-synonymer Ӓnderungen


# nicht-synonymer Substitutionen / # nicht-synonymer Positionen

dS (KS) = Rate synonymer Ӓnderungen


# synonymer Substitutionen / # synonymer Positionen
Codon-based tests

dN (Ka) = Rate nicht-synonymer Ӓnderungen


# nicht-synonymer Substitutionen / # nicht-synonymer Positionen

dS (KS) = Rate synonymer Ӓnderungen


# synonymer Substitutionen / # synonymer Positionen

ω = dN/dS (Ka/Ks)
wird verwendet, um die Stärke der Selektion zu bestimmen

ω < 1  negative Selektion


ω = 1  neutrale Evolution
ω > 1  positive Selektion
Codon-based tests
Beispiel: Genomweiter Scan nach Genen mit positiver Selektion in Menschen:
Nielsen et al. 2005
13731 Mensch-Schimpanse orthologe Gene
733 Gene mit ω > 1
35 Davon signifikant mit LRT gegen Nullhypothese von dN/dS = 1
Viele Gene kodieren für Proteine des Immunsystems und olfaktorische Rezeptoren
Codon-based tests
Jedoch: ω eines Gens ist selten größer als 1 !
Warum?

Normalerweise ist nur ein Teil eines Proteins positive selektiert


Während andere Teile unter starker negative Selektion stehen,
Um die prinzipielle Struktur und Funktion des Proteins aufrecht zu erhalten
 site models

Positive Selektion wirkt oft nur in begrenztem evolutionären Zeitfenster


 branch models

Es gibt auch branch-site models


McDonald-Kreitman-Test

Chimp Humans Chimp Humans


Neutral evolution Positive selection

Within species dN/dS = between species dN/dS Within species dN/dS < between species dN/dS
Evolution of ASPM
Beispiel: ASPM (Abnormal spindle-like microcephaly associated )
Beteiligt an Bestimmung der Gehirngröβe
Evans et al., 2003
ω in verschiedenen Linien:

 Ast zu Menschenaffen evolviert schneller: p < 0.001

McDonald-Kreitman-Test
mit 40 menschlichen Individuen:

 Relativ mehr nicht-synonyme Ӓnderungen im Mensch-


Schimpanse-Vergleich (Divergenz) als innerhalb der
menschlichen Population (Polymorphismen)

 ASPM evolviert unter positiver Selektion in Linien zu Menschenaffen und Menschen


Selektionstests

Codon-basierte Tests Allel-Frequenz basierte Tests LD-basierte Tests

Für Populationen und zwischen Arten Für Populationen Für Populationen


Für Proteine Für alle Arten an Sequenzen Für alle Arten an Sequenzen
ungleiche Mutationsraten im Genom Demographie muss berücksichtigt werden
werden berücksichtigt

e.g. dN/dS e.g. Fst e.g. EHH


McDonald-Kreitman Test XP-CLR XP-EHH
Tajima’s D
Hudson-Kreitman-Aguade (HKA) test

Vergleiche beobachtete Werte mit den bei neutraler Evolution erwarteten Werte
Fixation Index Fst
Es gibt mehrere Definitionen für Fst
Eine einfache übliche Definition:

π = mittlere Anzahl paarweiser Sequenz-Unterschiede zwischen zwei Individuen zweier verschiedener Populationen (“between”)
bzw. derselben Population (“within”)

 Variabilität zwischen Populationen genauso


groβ wie innerhalb der Population

 Maximale Differenzierung der Populationen


Fixation Index Fst
Fst –Werte hängen von den Populationen, die verglichen werden, ab
z.B. Dänen und Niederländer: Fst = 0,0009 (<0,01%)
Lappen und Sardinier: Fst = 0,067
Mbuti und Papuans: Fst =0,46

Population 1 Population 2 Permutationen


Signifikanz-Test:
z.B. Permutationstest (Simulieren von Populationen) 3x 1000 zufällige
Populationen
8x zusammenstellen

Häufigkeit
Permutierte Fst

Beobachteter Fst
Problem: Fst variiert stark zwischen Loci Fst
 es gibt keinen genomweiten sinnvollen Schwellenwert für einen signifikanten F -Wert
Zeitliche Allelfrequenzänderungen
Mutation erzeugt neue Varianten
Jedoch, welche Varianten in die nächste Generation übergehen, hängt von Selektion ab

(A)
Varianten einer Genomsequenz in einer Population:
t
Ausgangspopulation

Harmlose (neutrale) Variante


In (A) krankhafte Variante (B)
In (B) vorteilhafte Variante
Selektive sweeps
= Vorteilhaftes Allel nimmt aufgrund natürlicher Selektion sehr schnell an Häufigkeit in Population zu

Sweep = fegen, wegfegen Thesis Alvaro Perdomo Sabogal, 2016


XP-CLR: Selektionstest basierend auf Ӓnderung im
Allel-Frequenz-Muster
Beobachtete Allel-Frequenz in der Referenzpopulation wird genommen,
um neutrale Evolution zu modellieren
Dann werden Loci gesucht, für welche sich die Allel-Frequenzen zu schnell
geändert haben, um durch Drift erklärt zu werden

CLR and XPCLR

XP-CLR ist ähnlich einer Erweiterung von Fst auf mehrere Loci
Durch die Referenz-Population unabhängig von der Selektionsgeschichte des
Detektiert ältere Sweeps als XP-EHH Locus’  Loci werden untereinander vergleichbar Chen et al. Genome Res. 2010
Selektionstests

Codon-basierte Tests Allel-Frequenz basierte Tests LD-basierte Tests

Für Populationen und zwischen Arten Für Populationen Für Populationen


Für Proteine Für alle Arten an Sequenzen Für alle Arten an Sequenzen
ungleiche Mutationsraten im Genom Demographie muss berücksichtigt werden
werden berücksichtigt

e.g. dN/dS e.g. Fst e.g. EHH


McDonald-Kreitman Test XP-CLR XP-EHH
Tajima’s D
Hudson-Kreitman-Aguade (HKA) test

Vergleiche beobachtete Werte mit den bei neutraler Evolution erwarteten Werte
EHH: Selektionstest basierend auf LD
Genomweite Scans nach Regionen mit EHH, um
positiv selektierte Kandidaten-Regionen zu finden

LD nimmt zu
 Region mit “Extended
Haplotype Homozygosity (EHH)

EHH nimmt relative schnell wieder ab


 Nur sehr kürzlich geschehene
selective sweeps können detektiert
werden (ein paar tausend Generationen)

Sabeti et al. 2007


Detektiert jüngere Sweeps als XP-CLR Thesis Alvaro Perdomo Sabogal, 2016
XP-EHH: Selektionstest basierend auf LD
XP: “Cross-Population”
Genome zweier Populationen werden
verglichen, um Regionen zu finden, die EHH in
einer Population haben, aber nicht in der
anderen

LD nimmt zu
 Region mit “Extended
Haplotype Homozygosity (EHH)

Sabeti et al. 2007


Detektiert jüngere Sweeps als XP-CLR Thesis Alvaro Perdomo Sabogal, 2016
Genome Browser mit PopGen Statistiken

Pybus et al. 2014


Molekulare Evolution
 Vererbung
 Änderungen in Allelfrequenzen
 Komplexe Merkmale
 Genom des Menschen
 Neutral Theory
 Selektionstests • Netzwerkwachstum / Duplikationen
• Genregulatorische Netzwerke
 Netzwerk-Evolution • Protein-Protein-Interaktionsnetzwerke
• Hierarchie und Evolution
Netzwerk-Evolution
Komplexität von Organismen

• Korreliert mit Anzahl PPI-Domänen pro Protein

• Korreliert mit Größenzunahme gewisser Genfamilien (z.B. TFs)

Phänotyp wird durch die Summe aller Interaktionen in


Zellen und Interaktionen zwischen den Zellen bestimmt
Netzwerk-Evolution
Vergleich von Netzwerken zwischen biologischen Arten, um

• Universelle, konservierte Netzwerkkomponenten

• Linien-spezifische Netzwerkkomponenten

• Art-spezifische Netzwerkkomponenten

zu bestimmen
Duplikationen
Genome wachsen durch Duplikationen  Hinzufügen von Knoten zu molekularen Netzwerken

Einzelgen-Duplikation Gesamt-Genom-Duplikation
(Single Gene Duplication (SD)) Whole Genome Duplication (WGD)

Recht häufig Recht häufig


Neue Gene verschwinden auch häufig: Werden selten fixiert
Halbwertzeit eines Duplikats ca. 4 Millionen Jahre Fast alle Eukaryoten durchliefen 1 oder
Danach oft Pseudogenisierung mehr Runden an WGD
Fixierung in der Population: ca. 1 von 100 Gene z.B. am Ursprung der Vertebrates 2 WGDs
pro Millionen Jahre Wichtig bei Artbildung und Adaptation
Duplikationen
Genome wachsen durch Duplikationen  Hinzufügen von Knoten zu molekularen Netzwerken
“Original Netzwerk”
Z
TF TF
Z

Z
Z

Single Gene Duplication (SD) Whole Genome Duplication (WGD)


Evolution von SGDs

Pseudogenisierung Sequenzänderungen Expressionsänderungen

Schnell (wenige Millionen Jahre)!

Eine Kopie ändert sich: Neo-Funktionalisierung


Beide Kopien ändern sich: Sub-Funktionalisierung
Oft asymmetrische Evolution: eine Kopie behält viel mehr Kanten als die andere
Whole Genome Duplications
Duplizierte Gene werden auch Ohnologe genannt (Susumu Ohno, 1970)

Nach WGD:
Organismen sind für kurze Zeit tetraploid
danach starker Genverlust und genomische Rearrangements bis Organismus wieder diploid ist

Ohnologe bestehen im Genom viel häufiger fort als SGDs – Warum?

• Protein-Dosis-Effekt
• Pufferung essentieller Gene
• Verstärkung des metabolischen Fluxes
• Sehr schnelle Divergenz der Kopien

Netzwerk-Rewiring:

Obwohl WGDs und SGDs im Durchschnitt die gleiche Konnektivität haben (ca. 10 PPIs pro Protein)
haben Duplikate eines WGDs mehr gemeinsame Nachbarn als Duplikate eines SGDs
Duplikationen
Einzelgen-Duplikation Gesamt-Genom-Duplikation
(Single Gene Duplication (SD)) Whole Genome Duplication (WGD)

Recht häufig Recht häufig


Neue Gene verschwinden auch häufig: Werden selten fixiert
Halbwertzeit eines Duplikats ca. 4 Millionen Jahre Fast alle Eukaryoten durchliefen 1 oder
Danach oft Pseudogenisierung mehr Runden an WGD
Fixierung in der Population: ca. 1 von 100 Gene z.B. am Ursprung der Vertebrates 2 WGDs
pro Millionen Jahre Wichtig bei Artbildung und Adaptation

Ohnologe im Vergleich zu SGDs:

• Divergieren funktionell weniger


• Unterscheiden sich weniger in ihren Kanten
• Öfter in transiente Interaktionen involviert
• Sind öfter verzichtbar (da größere Redundanz)
Biologische Netze
• Genregulatorische Netzwerke

Knoten: Gene und Genregulatorische Faktoren


Kanten: Aktivierung oder Reprimierung der Transkription
gerichtet
Evolution von GRNs
“Original Netzwerk”
Whole genome duplication

TF-Duplikation
TF-Deletion

Sequenzänderung in TF Sequenzänderung in Bindestelle


Anzahl TFs in verschiedenen Arten
Anzahl TF-Domänen:

C2H2-ZNF Glc-receptor KRAB-A Homeobox Winged helix HLH HMG-box

Human
Mouse
Ciona
Drosophila
C.elegans
Archaea
Bacteria
0 1000 2000 3000 4000 5000 6000 7000 0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 700 0 100 200 300 400 500 600 0 100 200 300 400 500 0 100 200 300 0 50 100 150 200

bZIP Ets PAX T-box P53 POU SRF Runt

Human
Mouse
Ciona
Drosophila
C.elegans
Archaea
Bacteria
0 20 40 60 80 100 0 20 40 60 80 100 0 20 40 60 0 20 40 60 0 10 20 30 40 50 0 10 20 30 40 50 0 5 10 15 20 0 5 10 15

Nowick & Stubbs 2010


Beispiel: Neo-Funktionalisierung
Duplikation des TFs RUNT:

Runx 1: Blutzellen

Runx 1, 2, 3: Knochen

Runx 2, 3: Zähne

Runx 1, 2, 3

Runt  Ihh PTH  Sox9  Col2α1  Knorpel

T
Sequenz von Runx 1-3 ist sehr ähnlich
Unterscheiden sich stark im Expressionsmuster
Rewiring des GRN  Evolution neuer Gewebe
Beispiel: Sequenzänderung in einem TF
• Evolution von Sprache: Das Gen FOXP2
• 1990-er Jahre: Untersuchungen einer Londoner Familie
(“KE-Familie) mit mehreren Fällen von Sprachproblemen
•  2001 Mutation in dem Gen FOXP2 als Ursache gefunden
• Evolution von 2 human-spezifischen Aminosäuren

> 70 Mio 6 Mio


Jahre Jahre
Autosomal dominant
2
 FOXP2 – Unterschiede wichtig für Sprachevolution

humanes FOXP2 reguliert


FOXP2
anderes Set an Zielgenen
als FOXP2 vom
Schimpansen
Beispiel: Sequenzänderung in Bindestelle

Untersuchung von Bindestellen zweier TFs mittels ChIP-Seq: (A) CEBPA und (B) HNF4A
Pie charts: Anzahl überlappender Bindestellen und deren Lage im Genom für paarweise Vergleiche

 TFBS ändern sich schnell zwischen biologischen Arten


Schmidt et al. 2010
Biologische Netze
• Protein-Protein-Interaktions-Netzwerke

Knoten: Proteine
Kanten: Bindung, Aktivierung, Inaktivierung
ungerichtet oder gerichtet
Beispiel: Dimerisierungsnetzwerke
Ein TF kann verschiedene Dimersierungspartner haben
Je nach Partner unterschiedliche Funktion (Bindestellen im Genom)

Theoretisch ist die Anzahl möglicher Dimere = N Homodimere + (N * (N-1))/2 Heterodimere


 Im Menschen 118 bHLH  7021 Dimere
51 bZIPs  1326 Dimere
48 NRs  1176 Dimere

In der Praxis: Welche TFs interagieren hängt ab von:


o Konzentration jedes TFs
o Modifikationen an jedem TF (Aktivität)
o Affinität der TFs zueinander
o  nur 350 bZIP-Dimere bekannt

Wenn dimerisierende TFs dupliziert werden, behalten sie zunächst ihre Interaktionspartner;
später kann Divergenz erfolgen
Evolution von Dimerisierungsnetzwerken
SGD SGD WGD

Mutations Mutations

Gained interaction
Lost interaction
Beispiel: Dimerisierungsnetzwerke

Evolution bZIP network,


Amoutzias et al. 2008
Evolution und hierarchische Netzwerkorganisation
Top layer
Kernels
Initiale TFs

Hierarchie
Core layer

Bottom layer
Differenzierungsbatterien
Terminale TFs

 Netzwerk-Robustheit: gewisse Redundanz, um Funktionen aufrechtzuerhalten, selbst wenn einige Komponenten ausfallen
 Network-Evolution: “Ausprobieren” von Mutationen ohne fatale Folgen für das Individuum
Evolution und hierarchische Netzwerkorganisation
Großer Effekt:
Top layer
Kernels
Hubs
Initiale TFs Initiale TFs
seltener
Unterschiede zwischen Arten

Hierarchy
Krankheiten

Core layer
Kleiner Effekt:
Bottom layer
Periphere Knoten
Differenzierungsbatterien Terminale TFs
Terminale TFs
häufiger
Zelluläre Differenzierung

Vorhersagen:
• Mutationen in zentralen Knoten (z.B. Hub, core) und initialen Knoten (z.B. Kernels, Top-TFs), haben die
stärksten Auswirkungen auf das Individuum, da sie viele Teile des Netzwerkes beeinflussen
• Hubs, core, Kernels, Top-TFs evolvieren langsamer als andere Knoten, da Mutationen in ihnen oft kritische
Funktionen des Netzwerkes (zer)stören würden und letal sein können
Evolution und hierarchische Netzwerkorganisation

• Wichtigkeit eines TFs nicht nur durch seine Anzahl Kanten sondern auch durch seine Position in der Hierarchie bestimmt
• Konsequenzen von Mutationen können besser anhand der Position in der Hierarchie vorhergesagt werden

Bhardwaj et al. 2010


Beispiel: Langsame Evolution von Kernels

Herzentwicklung bei Drosophila (oben) und Wirbeltieren


(unten): Gemeinsame Spezifizierungs-Kernels (rechts).
Graue Boxen: unterschiedliche Wege, in welchen die
gleichen zwei Knoten in Drosophila und Vertebraten
miteinander verbunden sind
Differenzierung des Endomesoderms in Seeigel
(oben) und Seestern (Mitte):
Gemeinsame Spezifizierungs-Kernels (unten)

Kernels sind stark zwischen Arten konserviert  ähnliche Baupläne

Das könnte Ihnen auch gefallen