Sie sind auf Seite 1von 5

499

Diagnostische Verfahren

Sequenzierung in der nchsten


Generation Forschung und Diagnostik
Exom-Sequenzierung
JANINE ALTMLLER, BIRGIT BUDDE
COLOGNE CENTER FOR GENOMICS (CCG), UNIVERSITT ZU KLN

Advanced sequencing technologies have influenced genomic research


dramatically in the last five years. Whereas sequencing of the first human
genome needed tremendous efforts, time, and expense, re-sequencing of
an individuals genome or exome can nowadays be done in a very short
time period and for far less than 10,000 euros. Further development of
technologies, applications, and analysis software make next generation
sequencing (NGS) more and more attractive for labs performing diagnostics and planning to apply recent scientific findings to patients in clinical
settings.
10.1007/s12268-012-0221-9
Springer-Verlag 2012

Anforderungen an diagnostische
Assays
Diagnostische Verfahren mssen idealerweise schnell und flexibel einsetzbar sein,
um Patienten einen direkten Nutzen zu
bringen. Die qualitativen Ansprche im
Vergleich zur reinen Grundlagenforschung
sind hher hinsichtlich Sensitivitt, Spezifitt und Reproduzierbarkeit. In der routinemigen Anwendung spielen konomie und
Anwenderfreundlichkeit ebenfalls eine groe Rolle.
Whrend einzelne Keimbahnmutationen
sich auch mit der konventionellen SangerSequenzierung gut nachweisen lassen, wird
ein Next Generation Sequencing(NGS)-Versuch
bei hohem Durchsatz, z.B. bei vielen zu analysierenden genomischen Bereichen pro
Patient und auch bei mehreren Patienten in
einem Ansatz, kosteneffizient und zeitgerecht.
In DNA, isoliert aus Tumorgewebe oder Blutplasma, sind die Nachweisgrenzen unterreprsentierter Mutationen schnell erreicht
das deutlich sensitivere hochparallele NGS
macht solche Analysen erst mglich. Die
Balance zwischen Sensitivitt und Spezifitt
ist beim parallelen Sequenzieren vor allem
durch die erreichte coverage (Anzahl der reads,
die eine genomische Position abdecken) beeinflussbar, wobei die durchschnittliche Sequen-

BIOspektrum | 05.12 | 18. Jahrgang

zierfehlerrate der benutzten Technologie die


Sensitivitt des Assays limitiert. Ein kosteneffizienter Versuch erreicht eine definierte
Datenmenge, die den individuellen Applikationsanforderungen entspricht (Abb. 1).

Die Exom-Sequenzierung ist in den letzten


zwei Jahren mit bereits ber 1.000 se quenzierten Proben zur hufigsten Ap plikation der NGS-Plattform des Cologne
Center for Genomics (CCG) geworden. Das
Experiment besteht aus der Herstellung
einer Sequenzbibliothek, deren An rei cherung und Sequenzierung (Abb. 2A). Ein
Exom ist definiert als die Summe aller
Exons, die in mRNA transkribiert werden.
Damit handelt es sich um die funktionell
relevantesten ein bis zwei Prozent des
menschlichen Genoms. Fr die An rei cherung der Exomsequenzen sind Produkte mehrerer Anbieter (z. B. Illumina,
Nimblegen und Agilent) verfgbar, die alle
gemeinsam haben, dass genomische DNA
an Oligonukleotide hybridisiert und die
Zielsequenzen mittels magnetischer Stre pavidinbeads von den Nicht-Zielsequenzen
getrennt werden. Seit der Evaluation der
verschiedenen Produkte Anfang dieses

Spezitt
nichts falsch
diagnoszieren

Sensivitt
nichts bersehen

Keimbahnvariaonen
((Mendelsche Vererbung)
somasche Variaonen
(Tumorgewebe, Mosaik)
DNA aus Plasma (metastascher
Tumor prnatale Diagnosk)
Tumor,

Abb. 1: Sensitivitt versus Spezifitt eine Frage der Balance. Jeder diagnostische Assay sollte
hchste Anforderungen an Spezifitt und Sensitivitt erfllen. Diese beiden Kriterien beeinflussen
einander. Werden beispielsweise die Daten einer Exom-Sequenzierung keiner stringenten Filterung unterzogen, werden selten echte Mutationen bersehen; diese sind allerdings in einer Flut
gefundener Varianten gelistet, bei denen es sich zum groen Teil um falsch-positive Ergebnisse
handelt. Je strker die Mutation im Ausgangsmaterial unterreprsentiert ist, desto schwieriger
sind beide Kriterien zu erfllen und desto hher wird der Sequenzieraufwand.

500

W I S S ENS CH AFT S PECIA L : N EX T GE NE R ATI ON SE QUE NCI NG

Library-Prparation
ca. 1 Tag

Cluster generation
ca. 5 h

Sequenzierung
ca. 212 Tage

flow cell

1. Fragmentierung der DNA


2. Behandlung der Fragmentenden
3. Ligation der Adapter
4. Fragmentgrenselektion
5. Bindung der Fragmente an die flow cell
6. bridge amplification
7. Bildung von Clustern
8. Binden des Sequenzprimers
9. Anhang der ersten Base, Kontrolle der
Parameter
10. zyklische Wiederholung bis zur gewnschten Leselnge
11. Basendetektion

Illumina Control Software

Beladen der flow cell

Sequencer

Illumina cBOT-System
zur Cluster-Generierung

Abb. 2: Illumina-Sequenzierungstechnologie und Anwendungsbeispiel aus der Exom-Sequenzierungspipeline. A, Die Illumina-Sequenzierung gehrt
zu den Next Generation Sequencing-Technologien, bei denen mittels Synthese sequenziert wird. Die Sequenzbibliotheken werden mithilfe eines Illumina-cBot-Systems generiert (14) und ber spezifische Adapter auf einer flow cell gebunden (5). Eine spezielle Form der Amplifikation, die bridge amplification, vervielfltigt jedes einzelne Fragment der Sequenzbibliothek, wodurch Cluster auf der flow cell entstehen, die anschlieend sequenziert werden (68). Auf dem Illumina HiSeq 2000 erfolgt die Sequenzierung, wobei mit einem paired end-Lauf von zweimal 100 Basenpaaren 600 Gigabasen
Sequenzdaten produziert werden knnen (911). B, Anwendungsbeispiel aus der Exom-Sequenzierungspipeline. In einer Patientenblutprobe wurde mithilfe der Illumina-Sequenzierungstechnologie eine bereits bekannte Mutation detektiert, die zu einem vorzeitigen Abbruch der Translation des Gens
TRIOBP fhrt (HGMD: CM067723). Dargestellt ist das Sequenzalignment der erhaltenen Sequenzdaten auf Chromosom 22 der Basenpaare 38.119.595
bis 38.119.610 im Ensembl Genome Browser (www.ensembl.org). Die Position des Basenaustauschs von C nach T ist blau umrahmt.

Jahres ver wenden wir die beiden


NimbleGen-Kits v2 (44-Megabasen-Target)
und v3 (64-Megabasen-Target) als Stan dardanreicherungstechniken [1].
Am CCG sequenzieren wir hauptschlich
mit dem Illumina-HiSeq-2000-System. Datenmengen von 600 Gigabasen pro Lauf ermglichen es, drei bis fnf humane Exome auf
einer der 16 mglichen Probenauftragsspuren
(lanes) laufen zu lassen. Jede individuelle

Sequenzbibliothek trgt einen Code, der mitsequenziert wird, sodass gepoolte Proben
zusammen geladen werden knnen. Sogar
DNA aus FFPE(formalin-fixed, paraffin-embedded)-Gewebeproben kann ohne groe Qualittseinbuen als Ausgangsmaterial verwendet
werden.
Unsere Auswertepipeline umfasst zunchst
eine standardisierte Qualittskontrolle, das
Alignment an der Referenz, die Kontrolle der

Qualitt der Anreicherung [1] und die Listung der gefundenen Varianten. Diese Liste
wird weiter gefiltert, z.B. nach Vererbungsmodus und vorab vorhandenen Kopplungsdaten. Die verbleibenden Varianten werden
in einem weiteren Schritt bezglich ihrer
funktionellen Relevanz durch den Vergleich
mit SNP-Datenbanken und Programmen
bewertet, die Aussagen ber die evolutionre
Konservierung der betroffenen Sequenz und

BIOspektrum | 05.12 | 18. Jahrgang

ber mgliche Funktionsnderungen auf Proteinebene treffen knnen.


Die meisten Projekte dienen zur
Identifizierung genetischer Ursachen sowohl bei monogenen als auch
bei komplexen Erkrankungen. Bei
Krebspatienten wird sowohl DNA
aus Tumorgewebe als auch DNA aus
Normalgewebe, meist Blut, des
Patienten sequenziert, um die somatischen Mutationen des Tumors zu
identifizieren.
Gerade bei monogenen Erkrankungen [24] bestehen gute Erfolgsaussichten, bei ausgewhlten
Patienten eines Stammbaums die
verantwortlichen Mutationen schnell
zu identifizieren (Abb. 2B). Ein direkter klinischer Nutzen bei anschlieender genetischer Beratung
oder eventuell auch in der Prnataldiagnostik ist mglich ein direkter
Einfluss auf die Therapie dieses Patienten ist aber wohl eher noch die
Ausnahme, mittelfristig im Rahmen
verbreiteter personalisierter Medizin aber durchaus vorstellbar. Besonders wenn die Vernderung eines Gens erstmals in Zusammenhang mit einem bestimmten Phnotyp gebracht wird, ist weitere, nicht
unerhebliche Validierungsarbeit erforderlich, um die Kausalitt zu beweisen. Durch diese zeitliche Verzgerung ist die Exom-Sequenzierung
nicht als diagnostisches Mittel fr
den Routineeinsatz zu betrachten.
Auch in der Tumorgenomik und
bei der Sequenzierung von Patienten mit komplexen Phnotypen handelt es sich in der Regel nicht um
diagnostisch anwendbare Experimente. In den groen Probensammlungen wird zunchst nach wiederholt auftretenden Mutationen
gesucht, die dann gezielt im Rahmen
sogenannter Target-Sequenzierungen weiterverfolgt werden knnen.

Target-Sequenzierung
Der gezielte Nachweis von therapierelevanten Mutationen (companion
diagnostics) rckt immer strker in
den Fokus durch die Zunahme von
bekannten krankheitsassoziierten
genetischen Varianten. Die mit dem
untersuchten Phnotyp assoziierten

BIOspektrum | 05.12 | 18. Jahrgang

Genregionen werden dabei mit speziellen Verfahren angereichert und


sequenziert. Fr die Anreicherung
stehen unterschiedliche Produkte
zur Verfgung, die entweder PCRbasiert (Multiplex-PCR oder microdroplet-PCR, Abb. 3) oder hybridisierungsbasiert die Zielsequenz definieren. Welches Anreicherungsverfahren gewhlt wird, hngt entscheidend von der Gre des Targets
und der Anzahl der Proben bzw. dem
gewnschten Probendurchsatz ab
[5]. Tabelle 1 gibt einen berblick
ber die verfgbaren Produkte.
Die Sequenzierung erfolgt zumeist
auf den flexibleren BenchtopSequenziergerten von Life Technologies (Ion Torrent, Personal Genome Machine PGM), Illumina
(MiSeq, HiSeq) und Roche (GS
Junior). Am CCG erfolgt die Sequenzierung in der Regel ber die Ion Torrent-PGM (Abb. 3B), die eine sehr
schnelle und flexible Sequenzierung
ermglicht. Bei greren Targets
(grer als eine Megabase) und
hohem Probenaufkommen wird der
HiSeq 2000 von Illumina bevorzugt
[6].
Bei der Auswahl der anzureichernden Regionen ist der kausale
Zusammenhang der vernderten
Gene mit der Erkrankung meist
bekannt bzw. das Vorhandensein der
Mutationen, z.B. bei bestimmten
Krebsarten, therapierelevant. Hier
ist der flchendeckende Einsatz von
NGS-Technologien in naher Zukunft
routinemig zu erwarten.

NGS-Perspektiven fr
diagnostische Assays
Die erforderlichen Technologien sind
verfgbar und erfllen zum Teil
bereits die Anforderungen an die
Qualitt diagnostischer Assays. Zentrale Einrichtungen wie das CCG
implementieren die verschiedenen
Applikationen und generieren PilotDatenstze, die dazu dienen, die
bestmglichen Vorgehensweisen zu
eruieren und Spezifikationen zu definieren. Auch die Analyse-Software
entwickelt sich weiter und wird fr
einzelne Applikationen optimiert.
Die Standardisierung der diagnostischen Assays ist die wichtig-

502

W I S S ENS CH AFT S PECIA L : N EX T GE NE R ATI ON SE QUE NCI NG

Tab. 1: Vergleich hufig verwendeter Anreicherungstechniken.

Anreicherungs
-technik

Anbieter/
Produkt

Art der Nutzung

Vorteile

Nachteile

Targetgre und
Probenanzahl

hybrid capture,
in Lsung

Agilent SureSelect,
NimbleGen SeqCap EZ

vorgefertigte Panel-Kits
und Custom-Kits

anwenderfreundlich,
vielfach genutzt

1 g DNA erforderlich

174 Mb, ab 16 bzw.


24 Proben

selector probes

Agilent Haloplex

Custom-Kits

hohe Spezifitt,
200 ng DNA ausreichend

nur humanes Genom,


bislang keine vorgefertigten
Panels

0,0010,5 Mb,
ab 16 Proben

Multiplex-PCR

Fluidigm,
AmpliSeq Ion Torrent

vorgefertigte Panel-Kits
und Custom-Kits

nur 1050 ng DNA

nur fr kleinere Targets geeignet

150200 Amplikons
(bis 0,04 Mb),
ab 10 Proben

microdroplet-PCR

RainDance

vorgefertigte Panel-Kits
und Custom-Kits

gleichmige Abdeckung,
effizient bei groem
Durchsatz, 250 ng DNA

spezielles Gert erforderlich

0,22 Mb, ab 24 Proben

Abb. 3: Beispiele aus dem Bereich Target-Sequenzierung. A, Anreicherung. Oben: Ablaufschema der Anreicherung inklusive anschlieender Sequenzierung und Auswertung. Die Zielsequenzen werden dabei auf einem RDT 1000 Chip mithilfe der RainStormTM-microdroplet-based-Technologie (RainDance) angereichert. Unten: Sequenzalignment im Ensembl Genome Browser, resultierend aus der Anreicherung verschiedener krankheitsassoziierter
Gene bei einem Patienten, der zwei heterozygote Mutationen im Gen TMPRSS3 trgt (HGMD: 1. Mutation: CM073384, 2. Mutation: CM073383, jeweils
mit blauem Rahmen markiert). B, oben: Ion-PGMTM-Sequenziergert (links) und Sequenzier-Chip (Ion Torrent, rechts, beide Life Technologies). Unten:
verschiedene 15-Nukleotide-Deletionen in Exon 19 des EGFR-Gens, wie sie vor allem bei Lungenkrebs beobachtet werden, in sechs verschiedenen
Tumorproben (Integrative Genome Viewer-Software).

BIOspektrum | 05.12 | 18. Jahrgang

503

ste Voraussetzung, um die Fehlerrate im analytischen Schritt zu minimieren und Einzelentwicklungen zur Allgemeingltigkeit zu
verhelfen. Ein groer Datensatz ist erforderlich, um die Spezifikationen verbindlich zu
definieren dies steht fr die meisten Technologien und Assays noch aus.
Derzeit liegt der Schwerpunkt des diagnostischen Einsatzes der NGS-Technologien
noch in der Target-Sequenzierung. Durch weitere Kostenreduktion und die fortschreitende Entwicklung der Auswerteverfahren (hhere Geschwindigkeit und Standardisierung)
wird es aber zunehmend die Mglichkeit
geben, auch Exom-Sequenzierungen oder
sogar Genom-Sequenzierungen in der Diagnostik einzusetzen.
Nicht zuletzt mssen bei diesen Experimenten auch ethische Fragen geklrt werden.
Der verantwortungsbewusste Umgang mit
groen Datenmengen, die eine Vielzahl von
Informationen ber den Patienten enthalten,
welche nicht mit dem untersuchten Krankheitsbild in Zusammenhang stehen, muss
reglementiert werden.

AUTORINNEN
Janine Altmller
Jahrgang 1970. 19901997
Medizinstudium an der Universitt Aachen, Doktorarbeit
am Institut fr Pathologie.
19972000 Assistenzrztin
in der Unikinderklinik in
Aachen. 20002003 Postdoc
in der Arbeitsgruppe molekulare Epidemiologie von Dr. M.
Wjst, GSF in Mnchen. 2003
2004 Postdoc bei Prof. Dr. P.
Nrnberg am Max-DelbrckCentrum fr Molekulare Medizin (MDC), Berlin. Seit 2006
Postdoc am Cologne Center
for Genomics, Kln, bei Prof.
Dr. P. Nrnberg.

Birgit Budde
Jahrgang 1969. 19891991
Studium der Lebensmitteltechnologie an der HU Berlin.
19921996 Studium der Biotechnologie an der TU Berlin.
19962000 Promotion am
MPI fr Molekulare Genetik,
Berlin, in der Arbeitsgruppe
von Dr. W. Berger, Abteilung
Prof. H.-H. Ropers. 2000
2004 Postdoc bei Prof. Dr. P.
Nrnberg am MDC in Berlin.
Seit 2004 Postdoc bei Prof.
Dr. P. Nrnberg am Cologne
Center for Genomics, Universitt zu Kln.

BIOspektrum | 05.12 | 18. Jahrgang

Literatur
[1] Frommolt P, Abdallah AT, Altmller J et al. (2012)
Assessing the enrichment performance in targeted resequencing experiments. Hum Mutat 33:635641
[2] Weber S, Thiele H, Mir S et al. (2011) Muscarinic acetylcholine receptor M3 mutation causes urinary bladder disease
and a prune-belly-like syndrome. Am J Hum Genet
89:668674
[3] Asharani PV, Keupp K, Semler O et al. (2012) Attenuated
BMP1 function compromises osteogenesis, leading to bone
fragility in humans and zebrafish. Am J Hum Genet
90:661674
[4] Hussain MS, Baig SM, Neumann S et al. (2012) A truncating mutation of CEP135 causes primary microcephaly and
disturbed centrosomal function. Am J Hum Genet 90:871878
[5] Mertes F, Elsharawy A, Sauer S et al. (2011) Target enrichment of genomic DNA regions for next-generation sequencing. Brief Funct Genomics 10:374386

[6] Huebner AK, Gandia M, Frommolt P et al. (2011)


Nonsense mutations in SMPX, encoding a protein responsive
to physical force, result in X-chromosomal hearing loss. Am J
Hum Genet 88:621627

Korrespondenzadresse:
Dr. Janine Altmller
Cologne Center for Genomics (CCG)
Universitt zu Kln
Weyertal 115b
D-50931 Kln
Tel.: 0221-478-96819
janine.altmueller@uni-koeln.de