Wie man ausreichend große Teilnehmerzahlen für faire Therapietests gewinnt

Manchmal gelingt es in Therapietests, eine ausreichend große Anzahl von Forschungsdaten zu gewinnen, die aus einem oder zwei Studienzentren stammen. Um zuverlässige wissenschaftliche Daten zu erhalten und damit die Auswirkungen von Behandlungen auf seltene Behandlungsergebnisse (Outcomes) wie z. B. den Todesfall beurteilen zu können, muss man normalerweise Patienten in vielen Zentren und oftmals auch in vielen Ländern zur Teilnahme an einer Studie einladen. So ergab sich beispielsweise in einer Studie mit 10000 Patienten aus 13 Ländern, dass bei schweren Hirnverletzungen die Gabe von Steroiden – die mehr als drei Jahrzehnte lang praktiziert wurde – tödlich war. [2] In einem weiteren, von demselben Forscherteam organisierten fairen Test erbrachte die Teilnahme von 20000 Patienten aus 40 Ländern den Nachweis, dass ein kostengünstiges Medikament namens Tranexamsäure die Anzahl der blutungsbedingten Todesfälle nach Verletzungen senkt. [3] Da diese Studien darauf ausgelegt waren, systematische Fehler (Bias) sowie zufallsbedingte Unsicherheiten zu reduzieren, stellen sie vorbildliche Beispiele für faire Tests. Sie lieferten hochwertige Evidenz, die für die Gesundheitsversorgung weltweit von großer Bedeutung ist. Die zweite dieser randomisierten Studien wurde dementsprechend in einer vom British Medical Journal (BMJ) durchgeführten Umfrage zur wichtigsten Studie des Jahres 2010 gewählt.

Abbildung 12 beruht auf Daten, die uns freundlicherweise von dem preisgekrönten Forscherteam zur Verfügung gestellt wurden. Sie veranschaulichen, wie wichtig es ist, unsere Schätzungen von Therapieeffekten auf möglichst viele Informationen zu stützen, um die Gefahr zu verringern, dass wir uns vom Zufall täuschen lassen. Die Raute im unteren Abschnitt der Abbildung gibt das Gesamtergebnis der Studie über Tranexamsäure an. Sie zeigt, dass das Medikament die Anzahl der blutungsbedingten Todesfälle um nahezu 30 % reduziert (Risikoverhältnis knapp über 0,7). Dieses Gesamtergebnis stellt die zuverlässigste Schätzung der Wirkung dieses Medikaments dar, auch wenn der Schätzwert der Zentren in Kontinent A einen weniger deutlichen Effekt nahelegt (der statistisch nicht signifikant ist und wahrscheinlich eine Unterschätzung des wahren Effekts darstellt) und der Schätzwert aus Zentren in der Kategorie «andere Kontinente» auf einen stärkeren Effekt schließen lässt (wobei es sich wahrscheinlich um eine Überbewertung handelt).

Abbildung 12: Wirkungen von Tranexamsäure auf die Sterblichkeitsrate bei Trauma-Patienten mit signifikanten Blutungen: insgesamt sowie nach dem Kontinent, aus dem die Teilnehmer stammten (unveröffentlichte Daten aus CRASH-2: Lancet 2010; 376: 23-32).

Abbildung 12: Wirkungen von Tranexamsäure auf die Sterblichkeitsrate bei Trauma-Patienten mit signifikanten Blutungen: insgesamt sowie nach dem Kontinent, aus dem die Teilnehmer stammten (unveröffentlichte Daten aus CRASH-2: Lancet 2010; 376: 23-32).


Genauso, wie man den Zufallsfaktor mindern kann, indem man die Daten aus vielen Zentren in einer multinationalen klinischen Studie kombiniert, so können auch die Ergebnisse aus ähnlichen, aber voneinander unabhängigen Studien manchmal statistisch in einer «Meta-Analyse» (s. a. Kap. 8) zusammengefasst werden. Die Methoden für solche Meta-Analysen wurden viele Jahre lang von Statistikern entwickelt. In größerem Umfang wurden sie aber erst in den 1970er-Jahren eingesetzt, und zwar zunächst von Sozialwissenschaftlern in den USA und später dann von Medizinwissenschaftlern. Seit Ende des 20. Jahrhunderts sind Meta-Analysen überall als wichtiger Bestandteil fairer Therapietests anerkannt.

So wurden beispielsweise fünf Studien in fünf verschiedenen Ländern organisiert und unabhängig voneinander finanziert, um einer Frage nachzugehen, die seit 60 Jahren unbeantwortet geblieben war: «Bei welchem Sauerstoffspiegel im Blut ist die Wahrscheinlichkeit am höchsten, dass Frühgeborene ohne größere Behinderungen überleben?» Ist der Sauerstoffspiegel im Blut nämlich zu hoch, können die Säuglinge erblinden; ist er zu niedrig, können sie sterben oder eine Zerebralparese entwickeln. Da die verschiedenen Sauerstoffdosierungen selbst bei diesen winzigen Babys wahrscheinlich nur mäßige Unterschiede bewirken, braucht man eine große Anzahl von Säuglingen, um diese Unterschiede nachweisen zu können. Deshalb erklärten sich die für jede dieser fünf Studien verantwortlichen Forscherteams zu einer Zusammenfassung der Ergebnisse ihrer jeweiligen Studien bereit, um dadurch eine zuverlässigere Schätzung zu ermöglichen, die mit jeder einzelnen ihrer Studien nicht möglich gewesen wäre. [4]

  • Bei der Beurteilung der Frage, wie viel Vertrauen man in die Qualität und Quantität der verfügbaren Evidenz setzen kann, muss auch dem «Zufallsfaktor» Rechnung getragen werden.