Sie sind auf Seite 1von 5

Evidenzbasierte Medizin

AMT

Systematische bersichtsarbeiten zu
Fragen der Therapie und Prvention
Eine Einfhrung in Frage und Antwort
Teil 3 Wie werden die Ergebnisse zusammengefasst und dargestellt?
Antje Timmer und Gerta Rcker, Freiburg

Wann und warum werden


Studienergebnisse
zusammengefasst?
Ein wesentliches Ergebnis einer syste
matischen bersichtsarbeit ist bereits,
ob Studien zur Fragestellung vorliegen,
wie viele Patienten jeweils eingeschlos
sen wurden und von welcher Qualitt
die Studien sind. In guten bersichts
arbeiten gibt es Informationen zu den
einzelnen Studien, beispielsweise in
Form einer Tabelle.
Ob die Einzelergebnisse der Studien
dann zusammengefasst werden, hngt
zum einen von der Intention der Verfas
ser ab, zum anderen mssen auch eini
ge Voraussetzungen erfllt sein. In der
Regel sollten die Studien ausreichend
vergleichbar sein, damit eine statisti
sche Zusammenfassung sinnvoll ist.
Diese Zusammenfassung (pooling)
erlaubt dann eine genauere Schtzung
des Therapieeffekts.
Durch die Zusammenfassung von Er
gebnissen aus Einzelstudien erhofft
man sich zum Beispiel ein robusteres
und genaueres Ergebnis. Ergebnisse
kleinerer Einzelstudien streuen und
haben relativ weite Konfidenzinter
valle, so dass man nicht sicher ist, wo
genau das eigentliche Ergebnis liegt. Es
knnen sich sogar anscheinend gegen
stzliche Ergebnisse zeigen.
In anderen Fllen sind Untersucher
vielleicht eher daran interessiert, die
Bandbreite der Wirksamkeit unter ver
schiedenen Studienbedingungen auf
zuzeigen. Dann wre eine statistische
Zusammenfassung nicht notwendig.
Eine weitere typische Fragestellung
wre zu untersuchen, von welchen

Variablen die Effektstrke abhngt


und wodurch Unterschiede in der
Wirksamkeit bedingt sind. Auch dann
ist eine Zusammenfassung der Einzel
ergebnisse nicht unbedingt notwendig
oder gewnscht. Es gibt sogar Metho
diker, die in solchen Untersuchungen
den eigentlichen Wert von Metaana
lysen sehen, nicht im Erhalt eines ge
poolten Effekts.

Welche verschiedenen
Mglichkeiten gibt es, den
gepoolten Effekt anzugeben?
In welcher Form ein gepoolter Effekt
angegeben wird, hngt von verschie
denen Faktoren ab. Entscheidend sollte
sicher sein, dass der Effekt mglichst
aussagefhig ist fr den gegebenen kli
nischen Zusammenhang. Zum ande
ren ist er aber auch von der gewhlten
statistischen Methode abhngig. Und
letztendlich ist der Untersucher davon
abhngig, welche Art von Ergebnissen
ihm aus den Einzelstudien zugnglich
ist. Allerdings gibt es hufig die Mg
lichkeit, ein Ergebnis in eine andere
Darstellung umzurechnen. Dafr ist
wichtig, dass die Einzelstudien ausrei
chend detailliert dargestellt sind. Re
lativ einfach ist beispielsweise die Be
rechnung auf der Basis von Fallzahlen
und Ereigniszahlen je Gruppe fr Stu
dien mit dichotomen Endpunkten (ja/
nein) und Mittelwerten mit Standard
abweichung je Gruppe fr Studien mit
kontinuierlichen Endpunkten.
Bei Studien mit dichotomen End
punkten, zum Beispiel Tod oder ent
zndlicher Schub innerhalb eines
bestimmten Zeitraums, bezeichnet

man den beobachteten Anteil der Er


eignisse in einer Gruppe als Risiko.
In klinischen Studien gibt es potenziell
unterschiedliche Risiken fr die Inter
ventionsgruppe und die Kontrollgrup
pe. Um nun die Risiken zwischen den
beiden Gruppen zu vergleichen, gibt es
mehrere mgliche Mazahlen.
Das relative Risiko (RR), das Verhlt
nis der Ereignishufigkeiten zwischen
den beiden Gruppen, ist in klinischen
Studien vielleicht am hufigsten zu
finden. Bei berlebenszeitanalysen ist
die Zeit bis zum Ereignis die Zielgre.
Hier findet sich statt des RR beispiels
weise eine HR (Hazard-Ratio). Sowohl
RR als auch HR knnen gepoolt werden
und dann als pooled RR oder pooled
HR angegeben werden.
Statt des Risikos betrachtet man in der
klinischen Epidemiologie auch hufig
so genannte Odds. Die zugrunde lie
gende berlegung ist dabei, dass man
eine Wahrscheinlichkeit als Risiko
(z.B. 33%=0,33=1/3) oder eben als
Odds, als Verhltnis (hier: 1:2=0,5)
darstellen kann. Zum Vergleich zwei
er Gruppen zieht man dann statt des
relativen Risikos das Verhltnis der
Odds, das Odds-Ratio (OR), heran. Be
trgt etwa das Risiko in der Interven
tionsgruppe 33%, in der Kontrollgrup

Priv.-Doz. Dr. med. Antje Timmer, Deutsches Cochrane


Zentrum, Stefan-Meier-Str. 26, 79104 Freiburg,
E-Mail: timmer@cochrane.de
Dipl.-Math. Gerta Rcker, Institut fr Medizinische
Biometrie und Informatik, Stefan-Meier-Str. 26,
79104 Freiburg

Arzneimitteltherapie 26. Jahrgang Heft 8 2008 299

AMT Evidenzbasierte Medizin

Abb. 1. Beispiel mit vier kleinen Studien, keine Heterogenitt, Fixed-Effect-Modell (Erluterung siehe
Text);
Forest-Plot (Azathioprin zur Remissionserhaltung bei Colitis ulcerosa [nach 2])

pe 40%, so ergibt sich ein relatives


Risiko von 0,33/0,40=0,825, also
82,5%. Die Odds sind 1:2 bzw. 2:3,
das Odds-Ratio demnach (1:2):(2:3)=
3:4=75%. Ist das Risiko in beiden
Gruppen gleich, so gilt RR=OR=1.
Auch bei sehr seltenen Ereignissen
(Risiko in beiden Gruppen kleiner als
10%) ergeben sich fr Risiko und Odds
hnliche Zahlenwerte und damit auch
hnliche Werte fr relatives Risiko und
Odds-Ratio. Fr hufige Ereignisse gilt
dies nicht allgemein, das Odds-Ratio
hat dann auch keine klinische Inter
pretation mehr. Es gibt verschiedene
Grnde, dieses Ma dennoch zu ver
wenden, beispielsweise basieren ver
schiedene statistische Modelle auf dem
Odds-Ratio.
Wird statt dichotomer Ereignisse und
Wahrscheinlichkeiten ein kontinuier
liches Ma verwendet, wird das Ergeb
nis meist als (gepoolte) gewichtete Mit
telwertdifferenz (WMD) angegeben.
Beispiele fr solche Ergebnisse sind
Tage im Krankenhaus oder Blut
drucksenkung. Es ist auch mglich,
Ergebnisse unterschiedlicher Skalen
zusammenzufassen,
beispielsweise
wenn verschiedene Instrumente fr
Lebensqualitt oder Schmerzen ver
wendet wurden. Dazu werden die
Ergebnisse zunchst standardisiert,
das heit in eine vergleichbare Skala
berfhrt. Der Effekt nennt sich dann
standardisierte Mittelwertdifferenz
(SMD). Hier ist es besonders hilfreich,
wenn die Autoren dem Leser (Anwen
der) einen Hinweis geben, ab wann von
einem klinisch relevanten Unterschied
auszugehen ist, da solche Ergebnisse
an intuitiver Begreifbarkeit verlieren.

300

Arzneimitteltherapie 26. Jahrgang Heft 8 2008

Was ist mit der Number needed to


treat (NNT)?
Die NNT gilt als besonders gut ver
stndlich und ntzlich fr die kli
nische Anwendung. So ergab sich im
spter nher thematisierten Beispiel
aus Abbildung 1 eine NNT von 5 fr
das gepoolte Odds-Ratio von 0,41. Das
heit im konkreten Beispiel, dass fnf
Personen mit Azathioprin behandelt
werden mssen, um einen Colitis-ulce
rosa-Schub zu verhindern.
In systematischen bersichtsarbeiten
ist die Angabe von NNT nicht Stan
dard. Dies hat unter anderem den
Grund, dass die NNT vor allem vom
Grundrisiko in einer Patientengruppe
abhngt, das heit, dem Risiko, dass
ein Ereignis eintritt, wenn das Medi
kament nicht gegeben wird (Kontroll
ereignisrate). Dieses Risiko ist jedoch
in den verschiedenen Studien meist
unterschiedlich. Es ist also fraglich,
wie sinnvoll diese Angabe in einer ge
poolten Analyse ist. Im gegebenen Fall
wurde die NNT auf der Basis der ber
die vier eingeschlossenen Studien ge
mittelten Kontrollereignisrate berech
net. NNT finden sich somit hufig in
Diskussion oder Zusammenfassung,
jedoch nicht in den detaillierten Ergeb
nissen oder im Forest-Plot (siehe dort).

Wie werden die Ergebnisse


dargestellt? Was ist ein
Forest-Plot?
blicherweise werden in einer Meta
analyse sowohl die Ergebnisse der
Einzelstudien als auch der zusammen
gefasste Effekt in einem so genannten
Forest-Plot dargestellt. Ein Beispiel
aus einer eigenen Arbeit ist in Ab-

bildung1 gezeigt [1]. In diesem Fall


fanden sich vier Studien zur gleichen
Fragestellung, die alle einen positiven
Effekt des Medikaments zeigten. Dies
ist daran zu erkennen, dass alle OddsRatios (markierte Punkte) auf der glei
chen Seite der vertikalen Linie liegen.
Diese vertikale Linie entspricht einem
Odds-Ratio von 1,0, das heit, der Situ
ation, dass Interventionsgruppe und
Vergleichsgruppe das gleiche Risiko
fr das Zielereignis haben. Welche
Seite einem Nutzen fr die Interven
tionsgruppe entspricht, ist idealerwei
se, aber nicht immer, in einem ForestPlot mit angegeben. In diesem Fall ist
das Zielereignis als Schub, bzw. failu
re to maintain remission definiert, so
dass ein Risiko (Odds-Ratio) kleiner als
1,0 einem Nutzen durch die Interven
tion entspricht. Diese Seite (links der
1,0-Linie) ist daher mit favors (active)
treatment beschrieben. Je nach De
finition des Zielereignisses kann dies
in anderen Metaanalysen auch anders
sein.
Die horizontalen Linien entsprechen
den Konfidenzintervallen. Je lnger
(weiter) sie sind, desto ungenauer ist
die Schtzung des Ergebnisses. Im
gegebenen Beispiel waren alle Einzel
studien recht klein, damit sind alle
Konfidenzintervalle recht weit. Alle
berschreiten die 1,0-Linie. Das be
deutet, dass alle Einzelergebnisse auch
noch mit Gleichheit vereinbar waren.
Es konnte also nicht ausgeschlossen
werden, dass die positiven Effekte noch
zufllige Abweichungen waren und in
Wahrheit eigentlich kein Unterschied
zwischen den Behandlungsgruppen
bestand. Erst durch die Zusammenfas
sung zeigt sich ein ausreichend enges
Konfidenzintervall ohne Einschluss
der 1,0. Somit konnte gezeigt werden,
dass das Medikament wirksam ist. In
Cochrane-Reviews wie diesem wird der
gepoolte Effekt mit seinem Konfidenz
intervall als Raute dargestellt. Andere
Software nutzt dagegen fr den ge
poolten Effekt die gleiche Darstellung
wie fr die Einzeleffekte (Punkt oder
Kstchen mit horizontaler Linie als
Konfidenzintervall).

Was hat es mit dem Begriff FixedEffect-Modell auf sich?


blicherweise
werden
klinische
Studien unter der Vorstellung ausge
wertet, dass das gefundene Ergebnis

Evidenzbasierte Medizin

ein wahres Ergebnis (Erwartungswert)


schtzt. Wrde die gleiche Studie unter
gleichen Bedingungen wiederholt,
wre ein hnliches, aber nicht unbe
dingt gleiches Ergebnis zu erwarten.
Da die Studienergebnisse dem Zufall
unterliegen, streuen die Ergebnisse um
den Erwartungswert, und zwar umso
weiter, je kleiner die Studien sind. Er
gebnisse grerer Studien haben eine
hhere Wahrscheinlichkeit, (nahe)
beim wahren Wert zu liegen.
Diese Annahme liegt dem FixedEffect-Modell zugrunde. Bei dieser
Analyse wird davon ausgegangen, dass
alle eingeschlossenen Studien der glei
chen Grundgesamtheit von Studien
entstammen. Ihre Ergebnisse unter
scheiden sich nur aufgrund zuflliger
Abweichung, und zwar umso mehr, je
kleiner sie sind. Der Gre der Studie
wird durch eine Gewichtung Rechnung
getragen je grer eine Studie ist,
und je genauer sie den wahren Effekt
schtzt, desto strker wird sie in der
Metaanalyse bercksichtigt. In einigen
Forest-Plots wird automatisch mitauf
gefhrt, wie viel die jeweilige Studie
zum gepoolten Ergebnis beigetragen
hat. In Abbildung1 haben beispiels
weise die beiden etwas greren Stu
dien (Hawthorne und Jewell) jeweils
zu etwa 30%, die kleinste Studie (Sood
2002) dagegen nur zu 18% beigetra
gen.
Fr die Anwendung eines Fixed-Ef
fect-Modell gibt es verschiedene Me
thoden. Zum Beispiel kann als Gewich
tungsfaktor der Kehrwert der Varianz
einer Studie verwendet werden. Die
darauf beruhende Inverse-VarianceMethode ist fr jede Art von Zielkri
terium anwendbar. Andere bekannte
Methoden sind nur fr dichotome
(ja/nein) Ergebnisse vorhanden, wie
etwa die Fixed-Effect-Variante der
Mantel-Haenszel-Methode.
Hufig
sieht man auch eine Methode nach
Peto erwhnt. Diese ist nur auf die
Zusammenfassung von Odds-Ratios
anwendbar, sie kann keine relativen
Risiken oder absoluten Differenzen
berechnen. Es gibt also kleinere Unter
schiede zwischen den verschiedenen
Methoden der Fixed-Effect-Modelle,
beispielsweise mit welchen Arten von
Zielkriterien sie umgehen knnen,
oder auch, wie mit kleinen Zahlen um
gegangen wird wenn zum Beispiel in
einer Gruppe das Zielereignis gar nicht

AMT

Abb. 2. Fiktives Beispiel mit fnf Studien, Hinweise auf Heterogenitt


Fixed-Effect-Modell (oben), Random-Effects-Modell (unten)

eintritt. Letztendlich sind alle diese


Methoden akzeptierter Standard.
Allen
Fixed-Effect-Modellen
ge
meinsam ist das Problem, dass sie
irrefhrend enge Konfidenzintervalle
erzeugen, wenn die Studien nicht aus
reichend hnlich sind, da sie eine Va
riabilitt zwischen Studien ber Zufall
hinaus nicht bercksichtigen. Sie sind
also nur gltig, wenn die Annahme
stimmt, dass Abweichungen nur auf
Zufall beruhen. Gibt es grere Unter
schiede zwischen den Studien, mssen
andere Modelle gewhlt werden.

Wie wird beurteilt, ob die Studien


ausreichend hnlich sind, um eine
Zusammenfassung mittels FixedEffect-Modell zu rechtfertigen?
Einen ersten, qualitativen Anhalt fr
die Vergleichbarkeit der Studien ber
klinisch-inhaltliche berlegungen hi
naus bietet sich beim Betrachten des
Forest-Plots wie weit liegen die Ef
fekte der Einzelstudien auseinander,
wie viel berschneiden sich jeweils die
Konfidenzintervalle?
Es gibt zudem statistische Methoden,
die die Heterogenitt der Studien un
tersuchen. Die Heterogenitt wird
modelliert durch die so genannte He

terogenittsvarianz tau2, die meist


nach der Methode von DerSimonian
und Laird geschtzt wird [2]. Darber
hinaus existieren statistische Tests auf
die Nullhypothese es gibt keine Hete
rogenitt = die Studien entstammen
der gleichen Grundgesamtheit, zum
Beispiel Cochranes Q-Test, bei dem ein
p-Wert angegeben wird [1]. p<0,10
entsprche dabei zum Beispiel einem
Hinweis auf Heterogenitt, wenn man
ein Signifikanzniveau von 0,10 an
nimmt. Bei einem groen p-Wert (z.B.
>0,10) wird eine Vergleichbarkeit der
Studien angenommen (die Nullhypo
these kann nicht verworfen werden).
Allerdings sind diese Signifikanztests
nicht sehr sensitiv. Ihre Aussagefhig
keit ist beispielsweise von der Anzahl
der gefundenen Studien abhngig.
Die Heterogenittsstatistik I2 wird aus
Q berechnet, hat aber den Vorteil, dass
sie nicht von der Anzahl der Studien
abhngt. Allerdings ist auch I2 nicht un
abhngig von der Przision bzw. Gre
der Studien. Ein I20% entspricht
einem Hinweis auf Heterogenitt. Teils
finden sich dazu noch Grenzwerte be
richtet, wie etwa I2>50% (betrcht
liche Heterogenitt), diese sind aller
dings willkrlich festgelegt und nicht

Arzneimitteltherapie 26. Jahrgang Heft 8 2008 301

AMT Evidenzbasierte Medizin

Abb. 3. Fiktives Beispiel: Subgruppenanalyse, Trennung nach Darreichungsform

allgemein verbindlich. Fr den nher


Interessierten gibt es gute Arbeiten,
die die verschiedenen Herangehens
weisen und ihre Vor- und Nachteile
vergleichend darstellen [2]. Zusam
menfassend kann man wohl sagen,
dass es im Moment keinen idealen Test
und kein ideales Ma gibt. Man sollte
sich weiterhin immer auch selbst ein
Bild davon machen, wie weit die Einzel
ergebnisse auseinanderklaffen und ob
dies jeweils einem klinisch relevanten
Unterschied entspricht.
Im dargestellten Beispiel konnte keine
Heterogenitt nachgewiesen werden
(I2=0%, p=0,88). Obwohl die Einzel
studien sehr unterschiedliche Designs
hatten, waren Unterschiede ber den
Zufall hinaus statistisch nicht nach
weisbar. Demgegenber gab es in
einem weiteren, weitgehend fiktiven
Beispiel (Abb. 2) einen Hinweis auf He
terogenitt zwar war p nicht kleiner
0,10, doch zeigte sich ein I2 ungleich 0
(I2=29%, p=0,23).

Was hat es mit dem RandomEffects-Modell auf sich?


Ergibt sich statistisch der Hinweis auf
Heterogenitt, ist ein Fixed-EffectModell nicht gltig: Es berschtzt
die Genauigkeit des gepoolten Ef
fekts. Praktisch gesehen wird das
Konfidenzintervall zu eng angegeben.
Konsequenz kann auch sein, dass der
Therapieeffekt statistisch signifikant
erscheint, was unter Bercksichtigung
der Studienunterschiede nicht auf
rechtzuerhalten wre.
Random-Effects-Modelle bercksich
tigen dagegen die Variabilitt zwischen
Studien, sie setzen keine Homogenitt

302

Arzneimitteltherapie 26. Jahrgang Heft 8 2008

voraus. Auch hier gibt es wiederum un


terschiedliche Modelle. Ein StandardVerfahren wre beispielsweise die Me
thode nach DerSimonian und Laird, es
gibt jedoch noch weitere Methoden [3,
4]. Sie unterscheiden sich unter ande
rem dadurch, auf wie viel Ebenen Vari
abilitt angenommen wird.
Grundstzlich gilt, dass die Ergebnisse
zwischen allen Modellen vergleichbar
sind, wenn keine Heterogenitt vor
liegt. So betragen gepoolter Effekt und
Konfidenzintervall fr das Beispiel in
Abbildung1 nach dem Random-Ef
fects-Modell 0,41 (0,24; 0,71), das Er
gebnis beim Fixed-Effect-Modell lag
bei 0,41 (0,24; 0,70). Diese Ergebnisse
sind praktisch gleich.
Liegt Heterogenitt vor, fhrt die An
wendung eines Random-Effects-Mo
dells zu einer Verbreiterung des Konfi
denzintervalls. Dies ist in Abbildung2
dargestellt. Oben findet sich das FixedEffect-Modell, nach dem sich ein statis
tisch signifikanter Effekt fr das unter
suchte Medikament ergibt. Darunter
sind die gleichen Studien nach einem
Random-Effects-Modell zusammen
gefasst. Das Konfidenzintervall ist
etwas breiter geworden (0,89 bis 1,00
statt 0,89 bis 0,98). Eine statistische Sig
nifikanz ist nicht mehr nachweisbar.
Es ergibt sich hier somit, obwohl die
Heterogenitt nicht sehr ausgeprgt
ist (I2=29%) und im Cochrane-Q-Test
nicht nachweisbar war (p>0,10), ein
substanzieller Unterschied, zumindest
wenn der statistischen Signifikanz eine
Bedeutung zugemessen wird.
Random-Effects-Modelle fhren also
in der Regel zu einer vorsichtigeren,
konservativeren Schtzung. Es gibt

auch einige Nachteile dieser Methode.


So kann es zu einer relativen berbe
wertung von kleineren Studien kom
men, da die Gewichtung nach Gre
bzw. Przision, wie sie im FixedEffect-Modell erfolgt, unterminiert
wird. Das ist insbesondere dann pro
blematisch, wenn man davon ausgeht,
dass die kleineren Studien, abgesehen
von ihrer greren Ungenauigkeit,
ein hheres Risiko fr Verzerrungen
haben. Ein Beispiel wre eine insuffi
ziente Randomisierung bei zu kleiner
Fallzahl. Auch ist gelegentlich (oder
auch regelhaft) zu hinterfragen, wie
sinnvoll es ist, Studien, die offensicht
lich unterschiedliche Dinge untersucht
haben, zusammenzufassen.

Wie kann man sonst noch mit


Heterogenitt umgehen?
Es ist umstritten, inwieweit eine Zu
sammenfassung der Ergebnisse trotz
Heterogenitt sinnvoll ist. Viele Un
tersucher messen der Heterogenitt,
zumal wenn sie wie in dem gegebenen
Beispiel relativ mig ist, wenig Bedeu
tung bei. Doch auch wenn es fr diese
Situation statistische Methoden gibt,
sollte man sich von seinem klinischen
Verstndnis leiten lassen. Die Ergeb
nisse sollen schlielich noch interpre
tierbar und damit anwendbar bleiben.
Bevor man mittels statistischer Ver
fahren Unterschiede zwischen Studien
ausgleicht, sollte daher versucht wer
den, die Ursache der Heterogenitt fest
zustellen. Typische Faktoren wren die
Zusammensetzung der Studiengruppe
(z.B. Grad der Komorbiditt, Spektrum
der Schweregrade der Erkrankung), die
Dosierung der Intervention oder die
Art der Vergleichsmedikation. Es gibt
Autoren, die den eigentlichen Wert von
Metaanalysen in genau dieser Mglich
keit der Untersuchung von Ursachen
der Heterogenitt sehen.
Eine mgliche Analysenmethode ist
die Metaregression. Hierbei versucht
man, in einem Regressionsmodell die
Abhngigkeit des Therapieeffekts von
den genannten Einflussfaktoren auf
Studienebene zu modellieren. Aller
dings muss man sich vor Overfitting
hten, einem Effekt, der sptestens
dann eintritt, wenn man mehr Ein
flussvariablen untersucht als man
berhaupt Studien hat [5].
Im fiktiven Beispiel aus Abbildung3
ergab sich der Verdacht, dass mgli

Evidenzbasierte Medizin

cherweise die Art der Zubereitung von


Bedeutung fr die Wirksamkeit war.
So war in 2 der 5Studien eine Trop
fenform verwendet worden, in den
anderen drei eine Tablettenform, aus
der mglicherweise zu wenig Wirk
stoff freigesetzt wurde. Poolt man nun
statt aller fnf Studien nur jeweils die
Studien, die die gleiche Prparation
verwenden, erhlt man in diesem Fall
zwei unterschiedliche Ergebnisse, die
jeweils auf homogenen Studiengrup
pen beruhen. In diesem Fall wirkt
das Medikament in der Tropfenform,
in der Tablettenform dagegen nicht.
Diese Subgruppenanalyse kam also zu
hilfreicheren Ergebnissen als das Ge
samt-Pooling.
Fr Subgruppenanalysen in systema
tischen bersichtsarbeiten gilt bri
gens das Gleiche wie fr Subgruppen
analysen in anderen Studien sie
sollten apriori geplant sein. Idealer
weise gibt es fr die systematische

bersichtsarbeit ein Protokoll, in dem


bereits aufgefhrt wurde, fr welche
Faktoren Subgruppenanalysen durch
gefhrt werden sollen.

Und was ist mit Nebenwirkungen?


Nebenwirkungen werden im Grunde
genauso behandelt wie erwnschte
Effekte. Das heit, es sollte von einer
systematischen bersichtsarbeit er
wartet werden, dass auch fr die wich
tigsten Nebenwirkungen, oder eine
Zusammenfassung davon, ein ForestPlot und ein gepooltes Ergebnis darge
stellt wird. Das Pooling von mehreren
Studien bietet eine bessere Basis fr
die Erfassung meist seltener Neben
wirkungen, als Einzelstudien dies in
der Regel leisten knnen. Allerdings
reichen auch systematische bersichts
arbeiten, insbesondere auf der Basis
von randomisierten kontrollierten Stu
dien meist nicht aus, hier zu einer ab
schlieenden Bewertung zu kommen,

AMT

da oft weder die erforderliche Fallzahl


noch die erforderliche Beobachtungs
dauer gegeben sind.

Wie geht es weiter?


In den nchsten Folgen der Miniserie
werden wir die Cochrane Collaboration
und die Cochrane Library vorstellen.

Literatur
1. Timmer A, McDonald J, Macdonald J. Azathio
prine and 6-mercaptopurine for maintenance
of remission in ulcerative colitis. Cochrane
Database Syst Rev 2007;(1):CD000478.
2. Higgins JP, Thompson SG. Quantifying he
terogeneity in a meta-analysis. Stat Med
2002;21:153958.
3. Berlin JA, Laird NM, Sacks HS, Chalmers TC. A
comparison of statistical methods for combi
ning event rates from clinical trials. Stat Med
1989;8:14151.
4. Sutton AJ, Higgins JP. Recent developments in
meta-analysis. Stat Med 2008;27:62550.
5. Higgins JP, Thompson SG. Controlling the risk
of spurious findings from meta-regression.
Stat Med 2004;23:166382.

Arzneimitteltherapie 26. Jahrgang Heft 8 2008 303