Besteht ein klinischer Nutzen bei einer antidepressiven Pharmakotherapie?


Pro

Hans-Peter Volz, Werneck

In den letzten Jahren ist der Nutzen der Antidepressiva deutlich angezweifelt worden. Waren zunächst in erster Linie die selektiven Serotonin-Wiederaufnahmehemmer (SSRI) in der Kritik, vornehmlich wegen ihrer vermeintlich schlechteren Wirksamkeit im Vergleich zu den trizyklischen Antidepressiva, ist in neuerer Zeit die Kritik ausgedehnt worden, und die Wirksamkeit der Antidepressiva generell, auch im Vergleich zu Plazebo, wird in Frage gestellt.

Diese kritische Diskussion ist hauptsächlich gegründet auf dem Ergebnis einiger Metaanalysen (z. B. Kirsch et al., 2008 [1]). Nun gibt es mittlerweile eine große Anzahl von Metaanalysen mit unterschiedlichen Ergebnissen. Bevor diese Metaanalysen einer kritischen methodischen Prüfung unterzogen werden, seien zwei Vorbemerkungen gestattet:

1. Metaanalysen stellen nur einen Teil der medizinischen Evidenz dar. Eine gut geplante und durchgeführte Einzelstudie kann beispielsweise einen deutlich höheren Erkenntnisgewinn erbringen als die Aggregation zahlreicher guter und schlechter Studien und deren gemeinsame Auswertung.

2. Die Parameter, anhand derer mit Metaanalysen die Wirksamkeit einer Intervention bestimmt wird, stimmen nur in Ausnahmefällen mit den primären Wirkparametern (auch primäre Zielkriterien genannt) der eingeschlossenen Einzelstudien (deren Gruppengröße auch entscheidend von der Auswahl und den statistischen Eigenschaften dieses Zielparameters abhängig ist) überein, so dass von vorneherein bei diesen Metaanalysen ein Informationsverlust auftreten kann.

Nun aber zu den so viel diskutierten Metaanalysen selbst. Unterschiedliche Metaanalysen können sich in zahlreichen Gesichtspunkten unterscheiden, so in den angewandten Verfahren zur Datenaggregation und -auswertung sowie den in die Metaanalyse eingeschlossenen und den ausgeschlossenen Studien. Beim letzteren Punkt stehen sich im Wesentlichen zwei Positionen gegenüber: Zum einen werden nach vorgegebenen Kriterien nur ganz bestimmte Studien eingeschlossen (ausgeprägte Selektion), zum anderen alle verfügbaren Studien (keine bzw. wenig a priori festgelegte Selektionskriterien).

Wozu dies führen kann, soll im Folgenden an einigen Beispielen verdeutlicht werden.

So erregte die Metaanalyse von Kirsch et al. [1] kürzlich großes Aufsehen, insbesondere in der Laienpresse, postulierte diese Untersuchung doch, dass zwischen modernen Antidepressiva und Plazebo kein Wirksamkeitsunterschied bestünde. In diese Untersuchung wurden ausschließlich der amerikanischen Food and Drug Administration (FDA) unterbreitete Zulassungsstudien eingeschlossen.

Zulassungsstudien sind aber nicht darauf ausgerichtet, die klinische Wirksamkeit im allgemeinen Sinne abzubilden, sondern zu versuchen, möglichst risikoarm die Wirksamkeit unter „optimalen“ Bedingungen zu zeigen.

Diese Zielsetzung der Zulassungsstudien hat in den letzten Jahren verstärkt dazu geführt, die Patienten, die in solche Studien eingeschlossen werden, sehr genau zu selektionieren. So werden in der Regel Ambulanzpatienten, deren Depression nicht allzu schwer ausgeprägt ist, eingeschlossen, die zudem nicht suizidal und auch frei von psychotischen Phänomenen sind. Mögen diese Faktoren, mit Ausnahme der nur mäßigen Depressionsschwere, noch die Wahrscheinlichkeit, einen Unterschied zwischen Antidepressivum und Plazebo zu finden, erhöhen, so wirken andere Faktoren dieser Untersuchungen in gegensätzlicher Richtung. Die Patienten werden vor dem Beginn und auch während der Studie sehr intensiv untersucht, was auch mit einer erheblichen Zuwendung verbunden ist. Ein Visitentermin dauert mitunter mehrere Stunden, die Visitentermine sind zum Teil wöchentlich. Mit diesem in den letzten Jahren immer weiter vorangetriebenen Designansatz wird die Plazebo-Responserate immer mehr erhöht, somit wird die Chance, einen signifikanten Verum-Plazebo-Unterschied zu finden, systematisch minimiert. Die zunehmende Realisierung dieser Zusammenhänge (mit der damit verbundenen Zunahme des Plazebo-Effekts in solchen Studien in den letzten Jahren; [3, 6]) hat erst in neuer Zeit dazu geführt, diese mit intensiven Untersuchungen verbundenen Designansätze zu überdenken und beispielsweise die Intervalle zwischen den einzelnen Visiten zu verlängern und auch den Aufwand während einer einzelnen Visite zu begrenzen.

Ergänzt werden muss an dieser Stelle des Weiteren, dass in der Metaanalyse von Kirsch et al. auch Dosisfindungsstudien, in denen zum Teil sehr niedrige Dosen, die sich als unwirksam erwiesen haben, aufgenommen worden sind und den positiven Effekt der Antidepressiva minimiert haben. Somit ist das von den Autoren in der Einleitung angeführte Argument, über die ausschließliche Berücksichtigung der bei der FDA eingereichten Daten einen Bias weitgehend zu vermeiden, meines Erachtens nicht nachvollziehbar.

Zudem wurden nur wenige der insgesamt zu einer bestimmten Substanz verfügbaren Studien berücksichtigt. So gingen beispielsweise von den 22 Plazebo-kontrollierten Studien, die zu Venlafaxin vorliegen, nur 6 in diese Metaanalyse ein.

Wenn es den Autoren um die Kontrolle eines Publikationsbias geht – wie sie es explizit in der Einleitung ihrer Arbeit formulieren –, ist zu fragen, warum sie nicht zuerst alle verfügbaren Daten berücksichtigen (um eine möglichst hohe statistische Aussagekraft zu erzielen) und dann prüfen, ob bestimmte Studien einen Bias ausüben (über so genannte Sensitivitätsanalysen).

Des Weiteren wird als klinisch relevanter Unterschied lediglich eine Mittelwertsdifferenz von 3 HAMD-Punkten betrachtet. Warum von vornherein die Maße Response und Remission ausgeschlossen wurden, die in der Regel klarere Ergebnisse bezüglich einer Überlegenheit von Antidepressiva über Plazebo erbringen und von höherer klinischer Relevanz als Mittelwertsunterschiede einer Depressionsskala sind, sollte zumindest erklärt werden.

Bei Responder- und Remitteranalysen wird auch das Problem reduziert, dass ein Teil der Patienten sehr gut, ein Teil nahezu nicht auf Gabe eines Antidepressivums anspricht, also der interindividuellen Schwankungsbreite des Ansprechens besser Rechnung getragen als durch das bloße Betrachten von Mittelwertsunterschieden. Den einzelnen Patienten interessiert nämlich vor allem, wie viel wahrscheinlicher eine symptomatische Gesundung (Remission) oder eine deutliche Besserung (in Relation zu der Ausgangssymptomatik, Response) zu erreichen ist. Hier sind die Unterschiede in Bezug auf Number needed to treat (NNT) zwischen Antidepressivum und Plazebo in der Größenordnung zwischen 5 und 10 und somit in einem sehr günstigen, über jeden Zweifel erhabenen Bereich.

All bisher aufgeführten Kritikpunkte an dem Zugang, den Kirsch und Kollegen gewählt haben, sind keinesfalls neu, sondern breit bekannt, gleichwohl wird an letztendlich überholten Methoden der Datenanalyse festgehalten. Dies wäre nicht weiter schlimm, wenn hierdurch nicht das Ergebnis in einer bestimmten Art und Weise vorherbestimmt werden kann; hier scheint sich inzwischen ein Bias ganz anderer Art einzuschleichen, nämlich der, über den Anspruch der objektiven Wahrheitsfindung relevante Information zum Nachteil der dann zu behandelnden Patienten nicht zu berücksichtigen.

Ein anderes, ähnliches Beispiel kann an der Datenanalyse zu vermuteten Wirksamkeitsunterschieden zwischen dem selektiven Serotonin-Noradrenalin-Wiederaufnahmehemmer (SSNRI) Venlafaxin und den SSRI dargestellt werden. Weinmann et al. [7] wählten einen hoch-selektiven Ansatz, der zu der Berücksichtigung von 28 Studien führte. Einen anderen Ansatz wählten Nemeroff et al. [2], die alle verfügbaren Studien zu diesem Vergleich einschlossen, insgesamt waren dies 48 Studien. (Die ursprüngliche Metaanalyse dieser Gruppe von Thase et al. [4] war heftig kritisiert worden, da sie nicht die gesamte verfügbare Information berücksichtigt habe; aus diesem Grunde wurde die Datenbasis sukzessive verbreitert.) Die Ergebnisse dieser beiden Metaanalysen sind gegensätzlich: Während Weinmann et al. keinen klaren Vorteil für Venlafaxin versus den SSRI finden, finden Nemeroff et al. einen klaren Wirksamkeitsvorteil für Venlafaxin. Wohlgemerkt, auch in der Arbeit von Nemeroff werden verschiedene Verfälschungsmöglichkeiten (publiziert vs. nicht publiziert, Industrie-gesponsert vs. nicht Industrie-gesponsert) berücksichtigt, aber zunächst wird alle verfügbare Information genutzt, es werden nicht von vornherein künstliche Ausschlusskriterien generiert.

Wem diese Diskussion zu methodisch erscheint, sollte nicht vergessen, dass genau solche Diskussionen und Festlegungen im Prozess der Studienevaluation des Instituts für Qualität und Wirtschaftlichkeit im Gesundheitswesen (IQWiG) eine zentrale Rolle spielen. Je nachdem, welche Studien in die zusammenfassenden Metaanalysen dieses Instituts eingehen, werden auch diese Analysen ausfallen, mit zum Teil weitreichenden Folgen für das Gesundheitssystem. Es bleibt zu hoffen, dass der Weg, den Weinmann et al. in der eben zitierten Publikation beschritten haben, nicht der einzige sein wird, wiewohl diese Gruppe, wie sie im Disclosure ihrer Arbeit angeben, wesentlich am HTA-Report der SSNRI für das IQWiG beteiligt sind.

Interessant, und über diese doch weitgehend methodisch geprägte Diskussion hinausgehend, ist aber die Tatsache, dass weitaus die meisten Metaanalysen zum Vergleich Antidepressiva – Plazebo eindeutig den Vorteil der Antidepressiva belegen; bekannt werden aber jene Metaanalysen, die keine oder marginale Unterschiede finden. Insbesondere diese Studien erhalten ein breites Medienecho. Die Gruppe um Nemeroff und Thase sowie um Freemantle hat zahlreiche Metaanalysen mit günstigem Ergebnis für Antidepressiva publiziert, es wäre interessant, eine Umfrage unter deutschen Psychiatern zu machen, ob diese Namen oder jener von Kirsch geläufig sind.

Abschließend muss natürlich auch nochmals deutlich auf die Bedeutung der täglichen klinischen Arbeit hingewiesen werden, und hier wird kein verantwortungsvoller Arzt im Ernst die Wirksamkeit dieser Substanzen in Zweifel ziehen. Gerade bei schwereren Depressionsformen ist mitunter schon nach einigen Tagen, spätestens nach einigen Wochen, eine deutliche Wirksamkeit bei einem großen Teil der Patienten zu erkennen – ein eindeutiger Beleg der Wirksamkeit der Antidepressiva.

Literatur

1. Kirsch I, Deacon BJ, Huedo-Medina TB, Scoboria A, et al. Initial severity and antidepressant benefits: A meta-analysis of data submitted to the Food and Drug Administration. PLoS Med 2008;5:e45.

2. Nemeroff CB, Entsuah R, Benattia I, Demitrack M, et al. Comprehensive analysis of remission (COMPARE) with venlafaxine versus SSRIs. Biol Psychiatry 2008;63:424–34.

3. Stolk P, Ten Berg MJ, Hemels ME, Einarson TR. Meta-analysis of placebo rates in major depressive disorder trials. Ann Pharmacother 2003;37:1891–9.

4. Thase ME, Entsuah AR, Rudolph RL. Remission rates during treatment with venlafaxine or selective serotonin reuptake inhibitors. Br J Psychiatry 2001;178:234–41.

5. Turner EH, Matthews AM, Linardatos E, Tell RA, et al. Selective publication of antidepressant trials and its influence on apparent efficacy. N Engl J Med 2008;358:252–60.

6. Walsh BT, Seidman SN, Sysko R, Gould M. Placebo response in studies of major depression: variable, substantial, and growing. JAMA 2002;287:1840–7.

7. Weinmann S, Becker T, Koesters M. Re-evaluation of the efficacy and tolerability of venlafaxine vs. SSRI: meta-analysis. Psychopharmacology 2008;196:511–20.

Prof. Dr. med. Hans-Peter Volz, Krankenhaus für Psychiatrie, Psychotherapie und Psychosomatische Medizin Schloss Werneck, Balthasar-Neumann-Platz 1, 97440 Werneck, E-Mail: hans-peter.volz@kh-schloss-werneck.de

Psychopharmakotherapie 2008; 15(04)