Multilaborstudien erhöhen Aussagekraft von Tierversuchen

Studien mit Tierversuchen beruhen meist auf Einzellaborstudien unter hoch standardisierten Bedingungen; eine Praxis, die weltweit in Fachbüchern und Kursen gelehrt wird. In einer neuen Studie im Fachmagazin PLOS Biology belegen Forschende der Universitäten Bern und Edinburgh, dass dieses Streben nach Homogenität oft Ergebnisse liefert, die nur unter ganz spezifischen Bedingungen gelten. Im Gegensatz dazu verbesserten Multilaborstudien, die auf Diversität setzen, die Aussagekraft und Reproduzierbarkeit von Tierversuchen erheblich und könnten damit helfen, die Zahl der Versuchstiere weiter zu reduzieren.

Die Forschenden verwendeten Computer-Simulationen anhand von 440 präklinischen Studien zu 13 verschiedenen Versuchsbehandlungen für Hirnschlag, Herzinfarkt und Brustkrebs in Tiermodellen und verglichen die Reproduzierbarkeit der Ergebnisse zwischen Einzellabor- und Multilaborversuchen. Um Multilaborstudien zu simulieren, kombinierten die Forschenden Daten aus mehreren Einzelstudien, als wären diese gemeinsam durchgeführt worden. Dabei zeigte sich, dass die Ergebnisse von Einzellaborstudien sehr unterschiedlich ausfielen, während Multilaborstudien von zwei, drei oder vier Versuchslabors bei gleich grosser Gesamtstichprobe viel ähnlichere Ergebnisse lieferten und damit die Reproduzierbarkeit erheblich verbesserten. «Unsere Studie zeigt, dass die Standardisierung von Tierversuchen eine wichtige Ursache manglender Reproduzierbarkeit darstellt, weil mit der Standardisierung relevante biologische Variation ausgeblendet wird», sagt Studienleiter Prof. Hanno Würbel von der Abteilung Tierschutz an der Universität Bern.

Einzellaborstudien lieferten keine zuverlässige Schätzung

In einem ersten Schritt untersuchten die Forschenden 50 unabhängige Studien zum Effekt von therapeutischer Hypothermie (Unterkühlung) auf das Infarktvolumen in Tiermodellen für Hirnschlag. Eine Metaanalyse dieser 50 Studien ergab, dass Hypothermie das Infarktvolumen im Mittel um ca. 50% reduziert. Diesen Effekt nahmen die Forschenden als Messlatte, um die Reproduzierbarkeit von Ergebnissen aus Einzellaborstudien mit der von Multilaborstudien zu vergleichen. Trotz ausreichend grosser Stichprobe lieferten mehr als die Hälfte der Einzellaborstudien keine zuverlässige Schätzung dieses Effekts. Für die Simulation von Multilaborstudien wurden jeweils zwei, drei oder vier Studien zufällig aus dem Pool von 50 Studien ausgewählt und aus jeder dieser Studien anteilsmässig genau so viele Daten erhoben, dass Multilaborstudien und Einzellaborstudien insgesamt genau gleich grosse Stichproben aufwiesen. Der Anteil von Studien, welche den erwarteten Effekt der Hypothermie zuverlässig schätzten, stieg bei Zweilaborstudien gegenüber von Einzellaborstudien von unter 50% auf 73%, bei Dreilaborstudien auf 83% und bei Vierlaborstudien sogar auf 87%. «Diese Zunahme zuverlässiger Versuchsergebnisse widerspiegelt die verbesserte Reproduzierbarkeit von Multilaborstudien», sagt Mitautor Dr. Bernhard Völkl, der die Simulationen durchgeführt und ausgewertet hat.

Die Zuverlässigkeit der Ergebnisse nahm mit der Anzahl beteiligter Versuchslabors zu

In einem zweiten Schritt wiederholten die Forscher diese Analyse anhand von Studien zu 12 weiteren Versuchsmanipulationen an Tiermodellen für Hirnschlag, Herzinfarkt und Brustkrebs, um festzustellen, ob sich ihre Ergebnisse verallgemeinern lassen. In allen Fällen nahm die Zuverlässigkeit und Reproduzierbarkeit der Ergebnisse mit zunehmender Anzahl an den Multilaborstudien beteiligter Versuchslabors deutlich zu. Zudem konnten die Forschenden zeigen, dass eine Erhöhung der Stichprobengrösse bei Einzellaborstudien das Problem nicht lösen kann; im Gegenteil: durch grössere Stichproben wurden die Ergebnisse noch weniger zuverlässig.

Diese Ergebnisse belegen, dass die Standardisierung von Tierversuchen eine wichtige Ursache mangelnder Reproduzierbarkeit von Ergebnissen aus Tierversuchen darstellt. Eine geringe Reproduzierbarkeit stellt den Nutzen von Tierversuchen in Frage und bedeutet gleichzeitig, dass mehr Versuche nötig sind – und damit mehr Versuchstiere –, um eine Fragestellung schlüssig zu beantworten. «Dies widerspricht dem gesetzlichen Prinzip, wonach keine unnötigen Tierversuche durchgeführt werden dürfen und möglichst wenige Tiere eingesetzt werden sollten», erklärt Hanno Würbel. Die Ergebnisse zeigten, dass heterogenere und damit repräsentativere Versuchspopulationen die Aussagekraft und Reproduzierbarkeit von Tierversuchen erheblich verbessern würden. «Damit könnte erreicht werden, dass weniger Versuchstiere für nicht aussagekräftige Tierversuche eingesetzt werden», so Würbel weiter. Er empfielt deshalb: «Multilaborstudien sollten standardisierte Einzellaborstudien als Methode der Wahl ersetzen, zumindest in späteren Phasen präklinischer Tests». Dass diese Verbesserungen weder grosse Studien mit vielen Labors, noch grössere Stichproben erfordern, könnte bei der Umsetzung helfen.

 

Publikation:

Voelkl B, Vogt L, Sena ES, Würbel H (2018) Reproducibility of preclinical animal research improves with heterogeneity of study samples. PLoS Biol 16(2): e2003693. https://doi.org/10.1371/journal.pbio.2003693

 

22.02.2018