Einführung
Affektive und Angststörungen sind nicht nur weit verbreitet und für viele funktionelle Einschränkungen verantwortlich [1], sondern haben auch eine Prävalenz von etwa 10% in westlichen Ländern, die seit den 1970er-Jahren trotz der Entwicklung evidenzbasierter Behandlungen nicht zurückgegangen ist, wie epidemiologische Studien zeigen [2‒8]. Die Prävalenz bezeichnet den Prozentsatz der Erwachsenen in der Allgemeinbevölkerung, welche die diagnostischen Kriterien in einem definierten Zeitraum erfüllen, in der Regel die 30 Tage (Punktprävalenz) oder 12 Monate (12-Monats-Prävalenz) vor der Untersuchung, unabhängig von möglichen früheren Episoden.
Im scharfen Kontrast dazu haben mehrere Studien einen erheblichen Anstieg der Ausgaben für die Versorgung psychischer Erkrankungen und der Behandlungsraten in westlichen Ländern gezeigt [9‒15]. Die Evidenz zu erhöhten Behandlungsraten stammt sowohl aus Allgemeinarztpraxen [16‒18] und landesweiten Morbiditätserfassungen [19, 20] als auch aus wiederholten bevölkerungsbezogenen Erhebungen [8, 21]. Der Anstieg der Behandlungsraten wurde durch die Einführung einer neuen Klasse von Medikamenten in den 1980er-Jahren unterstützt, den selektiven Serotonin-Wiederaufnahmehemmern, die von der Pharmaindustrie aggressiv vermarktet wurden [22]. Darüber hinaus wurde eine Reihe evidenzbasierter psychologischer Behandlungen für Menschen mit affektiven und Angststörungen eingeführt.
Die Trenddaten zu Prävalenz und Behandlungsraten zeigen ein bemerkenswertes Paradoxon: mehr Behandlungen, aber nicht weniger Störungen, das Behandlung-Prävalenz-Paradoxon. Die Erwartung einer tendenziell rückläufigen Prävalenz von affektiven und Angststörungen bei steigender Behandlungsrate ist nicht unbegründet. Die Behandlung zielt darauf ab, Krankheitsepisoden zu verkürzen, eine Verschlechterung und die Entwicklung von Komorbiditäten zu verhindern, Rückfälle zu reduzieren und Rezidive einzudämmen. Wenn die Behandlung wirksam ist, sollten erhöhte Behandlungsraten zu niedrigeren Prävalenzraten in der Allgemeinbevölkerung führen, aber diese Reduktion der Prävalenz ist nicht eingetreten. Die zunehmende Verwendung von Statinen hat zu einer signifikanten Senkung des Cholesterinspiegels der Bevölkerung geführt [23]. Ebenso hat eine vermehrte und bessere Behandlung von Bluthochdruck zu weniger Bluthochdruck und damit verbundenen Krankheiten wie Herzinfarkten und Schlaganfällen geführt [24, 25]. Mindestens sieben Hypothesen können erklären, warum mehr und bessere Behandlungen die Prävalenz häufiger psychischer Störungen nicht verringert haben:
- 1.
Die erhöhte Bereitschaft von Personen, Symptome und Belastungen anzugeben, um Stress als Angst oder Depression zu diagnostizieren, hat die Prävalenzraten erhöht und einen echten behandlungsbedingten Prävalenzabfall verdeckt (im Folgenden: diagnostische Inflation).
- 2.
Die Erstinzidenz von affektiven und Angststörungen hat zugenommen und einen behandlungsbedingten Prävalenzrückgang ausgeglichen.
- 3.
Randomisierte kontrollierte Studien (RCTs) haben die Wirksamkeit der Akutbehandlung überschätzt, genauso wie
- 4.
Behandlungen, die auf die Aufrechterhaltung der akuten Behandlungserfolge abzielen.
- 5.
Die Wirksamkeit in Studien lässt sich nicht auf die Wirksamkeit in der Praxis verallgemeinern.
- 6.
Die Behandlung hat nicht wiederkehrenden/nicht chronischen Fällen mehr geholfen als chronisch wiederkehrenden Fällen, während die Auswirkung der Behandlung auf Bevölkerungsebene bei Letzteren viel größer ist.
- 7.
Kontraproduktive Wirkungen der Behandlung haben die Wirksamkeit von Therapie auf Bevölkerungsebene reduziert.
Diagnostische Inflation
Die Bereitschaft von Betroffenen, ihre Beschwerden im Behandlungssetting zu äußern, aber auch die Übermedikation durch die Anbieter:innen könnte in den letzten Jahrzehnten zugenommen haben [22, 26‒28]. In Kombination mit dem Fehlen physiologischer Marker, den Unzulänglichkeiten der Mess- und Diagnosesysteme, einschließlich der Zunahme diagnostischer Entitäten und Änderungen der diagnostischen Kriterien [29‒31], könnten diese Trends die Prävalenzraten in epidemiologischen Studien erhöht haben [32]. Stabile Prävalenzraten würden dann einen echten behandlungsbedingten Prävalenzabfall überdecken.
Obwohl es wahrscheinlich ist, dass die Trends der erhöhten Bereitschaft und Medikalisierung die Prävalenzraten im allgemeinmedizinischen Umfeld erhöht haben [22, 28, 33], deutet die Evidenz darauf hin, dass es weniger wahrscheinlich ist, dass eine systematische Verzerrung zu Gunsten von Diagnosen in epidemiologischen Erhebungen aufgetreten ist. Dies trifft zumindest dann zu, wenn diese Erhebungen von gut ausgebildeten Interviewer:innen unter Verwendung strukturierter Interviews (z.B. Diagnostic Interview Schedule, DIS; Composite International Diagnostic Interview, CIDI) durchgeführt wurden, um gut standardisierte diagnostische Klassifikationen (z.B. DSM-3 und -4) zu generieren [29‒31, 34, 35]. Daher ist es unwahrscheinlich, dass eine Zunahme falsch positiver Ergebnisse einen behandlungsbedingten Rückgang der „wahren“ Prävalenz verdeckt hat.
Die Erstinzidenz hat zugenommen und den behandlungsbedingten Prävalenzrückgang ausgeglichen
Eine weitere offensichtliche Erklärung ist, dass ein Anstieg der Erstinzidenz den erwarteten behandlungsbedingten Rückgang der Prävalenz von affektiven und Angststörungen ausgeglichen hat. Die Erstinzidenz bezieht sich auf den Prozentsatz der Personen in der Allgemeinbevölkerung, die zum ersten Mal in ihrem Leben während eines bestimmten Zeitraums, normalerweise eines Jahres, die diagnostischen Kriterien für eine bestimmte Erkrankung erfüllen (jährliche Erstinzidenzrate). Die Lebenszeitprävalenz bezieht sich auf den Prozentsatz der Personen in der Allgemeinbevölkerung, welche die diagnostischen Kriterien für eine bestimmte Erkrankung mindestens einmal im Leben erfüllen, und entspricht somit der ersten Inzidenz im Leben. Tabelle 1 zeigt die Inzidenzraten von affektiven und Angststörungen, wie sie in den wenigen Erstinzidenzstudien nach 1980 mit epidemiologischen Stichproben beobachtet wurden, welche die folgenden Kriterien erfüllen: N ≥ 1’000, operativ definierte diagnostische Klassifikation, standardisiertes psychiatrisches Interview, das von gut ausgebildeten Interviewer:innen durchgeführt wird, und Follow-up-Zeiten von ≤3 Jahren. Wenn die Erstinzidenz seit den 1980er-Jahren zugenommen hat, sollten die Jahresraten über die Jahre einen stetig steigenden Trend zeigen. Die jährlichen Inzidenzraten aus den Zeiträumen 1981–1982, 1997–1999, 2004–2006 und 2008–2011 deuten aber nicht auf einen stetigen Anstieg hin. Die Inzidenzraten von Major Depression, generalisierter Angststörung und Panikstörung zeigen einen vorübergehenden Anstieg in den späten 1990er-Jahren, während die Inzidenzrate der sozialen Angststörung zurückgegangen ist. Es sollte jedoch betont werden, dass die Evidenz zur Erstinzidenz spärlich und heterogen ist und etwa Anfang der 2010er-Jahre endet [36]. Wir kommen zu dem Schluss, dass es unwahrscheinlich ist, dass ein signifikanter Anstieg der Erstinzidenz einen behandlungsbedingten Prävalenzabfall ausgeglichen hat, aber die Daten sind zu begrenzt für eine eindeutige Schlussfolgerung [36].
Jährliche Inzidenz pro 1’000 pyar von Inzidenzstudien nach 1980 von CMDs, welche die Einschlusskriterien erfüllena
. | Land, Name der Studie und Referenz . | |||
---|---|---|---|---|
USA, ECA [Eaton, 1989, 1994] . | NL, NEMESIS-1 [Bijl, 2002] . | USA, NESARC [Grant, 2009] . | NL, NEMESIS-2 [de Graaf, 2013] . | |
Stichprobengröße/pyar | ∼10’861 (18+) | 4’757 (18–64) | 28’614 (18+) | ∼12’311 (18–64) |
Follow-up der Datenerhebung | 1981–1982 | 1997–1999 | 2004–2006 | 2008–2011 |
Jährliche Inzidenz pro 1’000 pyar (95%-KI) | ||||
MDD | 15,9 (1,7) | 27,2 (22,6–31,9)b | 15,2 (0,9)b | 15,8 (13,6–18,0)b |
GAD | - | 7,3 (5,0–9,4) | 11,3 (0,8) | 6,4 (5,1–7,7) |
PAN | 5,6 (0,9) | 7,8 (5,5–10,1) | 6,2 (0,5) | 5,3 (4,1–6,4) |
SOC | 9,4 (7,4–11,4) | 9,3 (6,7–11,9) | 3,2 (0,4) | 4,1 (3,0–5,1) |
Irgendeine Angststörung | - | - | 15,8 (0,9) | 16,9 (14,6–19,2) |
. | Land, Name der Studie und Referenz . | |||
---|---|---|---|---|
USA, ECA [Eaton, 1989, 1994] . | NL, NEMESIS-1 [Bijl, 2002] . | USA, NESARC [Grant, 2009] . | NL, NEMESIS-2 [de Graaf, 2013] . | |
Stichprobengröße/pyar | ∼10’861 (18+) | 4’757 (18–64) | 28’614 (18+) | ∼12’311 (18–64) |
Follow-up der Datenerhebung | 1981–1982 | 1997–1999 | 2004–2006 | 2008–2011 |
Jährliche Inzidenz pro 1’000 pyar (95%-KI) | ||||
MDD | 15,9 (1,7) | 27,2 (22,6–31,9)b | 15,2 (0,9)b | 15,8 (13,6–18,0)b |
GAD | - | 7,3 (5,0–9,4) | 11,3 (0,8) | 6,4 (5,1–7,7) |
PAN | 5,6 (0,9) | 7,8 (5,5–10,1) | 6,2 (0,5) | 5,3 (4,1–6,4) |
SOC | 9,4 (7,4–11,4) | 9,3 (6,7–11,9) | 3,2 (0,4) | 4,1 (3,0–5,1) |
Irgendeine Angststörung | - | - | 15,8 (0,9) | 16,9 (14,6–19,2) |
aEinschlusskriterien: prospektive Follow-up-Studie nach 1980 mit gemeindebasierter Stichprobe, Stichprobengröße 1’000+, operational definierte diagnostische Klassifikationen (z.B. DSM-3 oder 4), standardisierte psychiatrische Befragung durch Expert:innen oder geschulte Laieninterviewer:innen, Follow-up bis zu 3 Jahren. pyar, Risikopersonenjahre („person-years-at-risk“); MDD, schwere depressive Störung; GAD, generalisierte Angststörung; PAN, Panikstörung; SOC, soziale Angststörung. bDer Unterschied in der MDD-Inzidenz zwischen NEMESIS-1 (DSM-3-R) und den anderen beiden Studien (NEMESIS-2 und NESARC, beide DSM-4) könnte auf Unterschiede zwischen diesen DSM-Ausgaben zurückzuführen sein.
Wirksamkeit der Behandlung in der akuten Phase
Führende Leitlinien für die klinische Praxis zu Angst und Depression weisen darauf hin, dass Antidepressiva und Benzodiazepine und/oder eine der vorhandenen empirisch gestützten psychologischen Behandlungen wirksam sind. Wenn die Wirksamkeit der Behandlung jedoch bescheidener ist als die Leitlinien vermuten lassen, ist es möglich, dass selbst bei mehr Menschen, die Goldstandard-Interventionen erhalten, ein Rückgang der Prävalenz gering und schwer fassbar wäre. Dies könnte helfen, das Behandlungs-Prävalenz-Paradoxon zu erklären.
Obwohl Metaanalysen und Umbrella-Reviews1 nur stark eingeschränkt auf die klinische Praxis übertragbar sind [37‒39], sind sie nützlich, um die Auswirkungen methodischer Schwächen auf Wirksamkeitsschätzungen zu veranschaulichen (siehe Tabelle 2 für wichtige Verzerrungen). Metaanalysen, die Verzerrungen (Bias) ausgleichen, zeigen, dass die Wirksamkeit wesentlich geringer ist als allgemein angenommen. Zwei umfassende Umbrella-Reviews, die 2014 und 2022 veröffentlicht wurden, zeigen deutlich die Auswirkungen von Verzerrungen auf die berichtete Wirksamkeit. Das Review von 2014 [40] berichtet über eine mittlere Gesamteffektgröße (SMD = 0,50) über Psychotherapien und Medikamente hinweg. Im Gegensatz dazu fand das Review von 2022 [41] eine kleine Gesamteffektstärke von 0,34 für Psychotherapien und 0,36 für Medikamente. Das Review von 2022 schloss nur RCTs ein, die Placebo oder Care-as-usual als Vergleichsgruppe verwendet hatten, bewertete die Studienqualität formal und schloss Metaanalysen ein, die seit 2014 veröffentlicht wurden. Einzelne Metaanalysen, die um das Verzerrungsrisiko bereinigt sind, berichten von erheblichen Wirksamkeitseinbußen [42, 43].
Bias in RCTs und deren Metaanalysen
Art des Bias . | Beschreibung . |
---|---|
Selektionsbias (unangemessene Generierung zufälliger Sequenzen und/oder unangemessene Verblindung der Zuordnung) | Verzerrte Einteilung zu Interventionen aufgrund unzureichender Generierung einer randomisierten Sequenz und/oder verzerrte Einteilung zu Interventionen aufgrund unzureichender Verblindung bei der Zuweisung zu Therapiegruppen |
Selektive Berichterstattung oder Verzerrung der Ergebnisberichterstattung | Versäumnis, negative Befunde in einem veröffentlichten Bericht zu beschreiben, oder Vertauschen des Status von (nicht signifikanten) primären und (signifikanten) sekundären Befunden |
Fehlinterpretationen des Ergebnisses | Maßnahmen und Gutachter:innen sind nicht ausreichend. In Studien, die ADM absetzen, können sich Entzugssymptome als depressive Symptome tarnen, wodurch die beiden miteinander vermengt werden. |
Unvollkommene Verblindung | Patient:innen, Behandlungsanbieter:innen oder Gutachter:innen kennen den wahren Status der randomisierten Proband:innen: der Interventions- oder Kontrollbedingung. In ADM-Studien kann dies aufgrund von Nebenwirkungen auftreten. |
Spin-Bias | Berichtsstrategien auf eine Art und Weise, die Leser:innen oft in die Irre führt |
Citation Bias | Studien mit positiven Ergebnissen werden häufiger zitiert als negative Studien, was zu einer erhöhten Sichtbarkeit positiver Ergebnisse und einer geringeren Auffindbarkeit negativer Studien führt. |
Completer-Analyse-Bias | Nur Personen, welche die Behandlung und die Nachbehandlung abgeschlossen haben, werden in die Analyse aufgenommen, da der Behandlungsabschluss nicht zufällig ist und wahrscheinlich von der Art der Behandlung und der Kontrollbedingung abhängt. Die Ergebnisse können verzerrt sein, typischerweise zugunsten der experimentellen Behandlung. Diese Risiken werden vermieden, wenn Intention-to-treat verwendet wird, d.h. alle randomisierten Personen verwendet werden. |
Unangemessene Kontrollen | Die Kontrollen erfüllen nicht vollständig die Ziele der Studie. Wenn z.B. keine Behandlung angesichts der Studienziele die beste Kontrollbedingung ist, dann sind Warteliste (Nocebo-Effekt) und Behandlung wie üblich (heterogen) unvollkommene Kontrollen. |
Art des Bias . | Beschreibung . |
---|---|
Selektionsbias (unangemessene Generierung zufälliger Sequenzen und/oder unangemessene Verblindung der Zuordnung) | Verzerrte Einteilung zu Interventionen aufgrund unzureichender Generierung einer randomisierten Sequenz und/oder verzerrte Einteilung zu Interventionen aufgrund unzureichender Verblindung bei der Zuweisung zu Therapiegruppen |
Selektive Berichterstattung oder Verzerrung der Ergebnisberichterstattung | Versäumnis, negative Befunde in einem veröffentlichten Bericht zu beschreiben, oder Vertauschen des Status von (nicht signifikanten) primären und (signifikanten) sekundären Befunden |
Fehlinterpretationen des Ergebnisses | Maßnahmen und Gutachter:innen sind nicht ausreichend. In Studien, die ADM absetzen, können sich Entzugssymptome als depressive Symptome tarnen, wodurch die beiden miteinander vermengt werden. |
Unvollkommene Verblindung | Patient:innen, Behandlungsanbieter:innen oder Gutachter:innen kennen den wahren Status der randomisierten Proband:innen: der Interventions- oder Kontrollbedingung. In ADM-Studien kann dies aufgrund von Nebenwirkungen auftreten. |
Spin-Bias | Berichtsstrategien auf eine Art und Weise, die Leser:innen oft in die Irre führt |
Citation Bias | Studien mit positiven Ergebnissen werden häufiger zitiert als negative Studien, was zu einer erhöhten Sichtbarkeit positiver Ergebnisse und einer geringeren Auffindbarkeit negativer Studien führt. |
Completer-Analyse-Bias | Nur Personen, welche die Behandlung und die Nachbehandlung abgeschlossen haben, werden in die Analyse aufgenommen, da der Behandlungsabschluss nicht zufällig ist und wahrscheinlich von der Art der Behandlung und der Kontrollbedingung abhängt. Die Ergebnisse können verzerrt sein, typischerweise zugunsten der experimentellen Behandlung. Diese Risiken werden vermieden, wenn Intention-to-treat verwendet wird, d.h. alle randomisierten Personen verwendet werden. |
Unangemessene Kontrollen | Die Kontrollen erfüllen nicht vollständig die Ziele der Studie. Wenn z.B. keine Behandlung angesichts der Studienziele die beste Kontrollbedingung ist, dann sind Warteliste (Nocebo-Effekt) und Behandlung wie üblich (heterogen) unvollkommene Kontrollen. |
Was bedeutet eine mäßige Wirksamkeit für das Behandlungs-Prävalenz-Paradoxon? Hier müssen wir zunächst erkennen, dass es aus Sicht der Bevölkerung auf die Wirksamkeit im Vergleich zu keiner Behandlung ankommt und nicht im Vergleich mit Placebo oder einer üblichen Behandlung (Treatment-as-usual). Beide Kontrollbedingungen haben wahrscheinlich etwas bessere Ergebnisse als keine Behandlung, aber wie viel besser ist unbekannt, da Kontrollgruppen ohne jegliche Behandlung selten sind [44]. Der zweite Vorbehalt ist, dass die Anpassung typischerweise auf den Publikationsbias und den Ausschluss von Studien beschränkt war, die keine Intention-to-treat-Analyse berichten oder Wartelisten-Kontrollgruppen enthalten. Die Wirksamkeit könnte sogar geringer sein, da die kumulative Wirkung aller Verzerrungen unklar ist [45]. Insbesondere die Entblindung bleibt ein schwer quantifizierbarer Faktor, der die Validität gefährdet, offensichtlich für Psychotherapiestudien, aber auch für Arzneimittelstudien. Daher ist es möglich, dass selbst die Wirksamkeit im Vergleich zu keiner Behandlung zu gering ist, um auf Bevölkerungsebene eine Rolle zu spielen. Falls dies zutrifft, trägt es zur Erklärung des Behandlungs-Prävalenz-Paradoxons bei.
Wirksamkeit von Interventionen zur Verhinderung von Rückfällen und Rezidiven
Viele Patient:innen können ihr Ansprechen auf die Akutbehandlung nicht aufrechterhalten, etwa ein Fünftel (Psychotherapie) bis ein Drittel (Medikamente) erleiden innerhalb eines Jahres einen Rückfall [46‒50]. Es wurden Interventionen zur Rückfallprävention entwickelt und tatsächlich wurden erhebliche Vorteile berichtet für fortgesetzte Medikation und präventive Psychotherapie im Vergleich zu Kontrollgruppen, obwohl die Evidenz für Angststörungen begrenzt ist. Die Fortführung von Antidepressiva-Medikation halbiert das Risiko eines Rückfalls/Rezidivs relativ zur Substitution mit Placebo innerhalb des ersten Jahres [48, 49, 51, 52]. Psychotherapien sind signifikant besser als ein routinemäßiges klinisches Management bei der Verringerung des Rückfall-/Rezidivrisikos bei Patient:innen, die sich bei Randomisierung zumindest in teilweiser Remission befinden; interessanterweise scheinen sie auch etwas erfolgreicher zu sein als eine kontinuierliche Medikation [53]. Die meisten Follow-ups dauerten 12–24 Monate.
Es bleiben jedoch methodische Bedenken bestehen, welche die Interpretation erschweren, einschließlich Fehlklassifizierung von Medikamentenentzugssymptomen, Entblindung, Heterogenität der Kontrollbedingungen und Probleme mit der Therapieadhärenz. Darüber hinaus sind zwei weitere Themen relevant. Erstens kamen Patient:innen, die nicht auf eine Akutphasenbehandlung ansprachen, für diese Studien nicht in Frage. Zweitens blieb das Rückfall-/Rezidivrisiko signifikant, obwohl es durch fortgesetzte Medikation oder präventive Psychotherapie erheblich reduziert wurde [48, 54]. Trotz dieser Interpretationsprobleme sollten rückfallprophylaktische Interventionen eine gewisse Wirkung auf Bevölkerungsebene haben, wenn sie umfassend und angemessen in der realen Welt umgesetzt werden.
Lässt sich die Wirksamkeit von RCTs auf die Routineversorgung verallgemeinern?
Die begrenzte RCT-basierte Behandlungswirksamkeit lässt sich möglicherweise nicht gut auf die „reale“ Praxis verallgemeinern: Die wohlbekannte Unterscheidung zwischen der in RCTs nachgewiesenen Wirksamkeit einer Behandlung (d.h. unter optimalen Bedingungen) und der Effektivität der Behandlung, wie sie in der Routineversorgung (d.h. unter typischen Bedingungen) erreicht wird [55]. Erstens kann der/die typische Patient:in in der Routineversorgung zwei zusätzliche Nachteile im Vergleich zu seinem/ihrem RCT-Pendant haben: eine schlechtere Prognose und weniger optimale Behandlung [49]. Tatsächlich sind die Remissionsraten in der Routinepraxis wesentlich niedriger als in Metaanalysen für alle Behandlungsmethoden (32% vs. 40–74%) [56].
Darüber hinaus weist die Forschung auf erhebliche Behandlungslücken bei der Verbreitung und Umsetzung von Behandlungsprotokollen hin [57‒64]. Die World Mental Health Surveys der WHO berichteten, dass die 12-monatige Inanspruchnahme des Gesundheitssystems unter den 1’238 Teilnehmer:innen aus 10 Ländern mit hohem Einkommen mit einer schweren 12-monatigen CIDI-DSM-IV-Angststörung, Depression oder Substanzkonsumstörung zwischen 24% und 61% lag (durchschnittlich 55%). Nur durchschnittlich 35% dieser Leistungsnutzer:innen hatten eine minimal angemessene Behandlung erhalten [65]. Andere Studien berichten von ähnlichen Beobachtungen [66, 67]. Ein weiteres Problem besteht darin, dass einige RCT-basierte Behandlungen so hochspezialisiert sind, dass sie nur schwer in die Routineversorgung implementiert werden können. Obwohl die Folgen dieser Lücken nicht vollständig geklärt sind [68, 69], scheint die Schlussfolgerung unausweichlich, dass nicht nur die Wirksamkeit der Behandlung überschätzt wurde, sondern auch ihre Verallgemeinerbarkeit auf Routineversorgungssituationen. Daher trägt die schlechte Verallgemeinerbarkeit dazu bei, das Behandlungs-Prävalenz-Paradoxon zu erklären.
Nicht optimales Targeting der Behandlung und die Bedeutung rezidivierender chronischer Fälle in der Bevölkerung
Auch wenn bessere Behandlungen in größerem Umfang verfügbar sind, hängt ihr Einfluss auf die Prävalenz davon ab, wie optimal sie eingesetzt werden. Entscheidend ist hier die Unterscheidung zwischen rezidivierend-chronischen Fällen und solchen mit einer oder zwei Episoden im Lebensverlauf (Nichtrezidivfälle), da eine wirksame Behandlung rezidivierend-chronischer Fälle auf Bevölkerungsebene viel mehr Einfluss hat als eine wirksame Behandlung von Nichtrezidivfällen, selbst wenn es viel mehr Nichtrezidivfälle als rezidivierend-chronische Fälle gibt [70‒74]. Der Grund für die größeren Auswirkungen auf Bevölkerungsebene liegt darin, dass rezidivierend-chronische Fälle die Mehrheit der Prävalenzraten ausmachen. Die gesamte Lebenszeit, in der sie diagnostische Kriterien erfüllen, ist viel länger als bei Nichtakutfällen. Deshalb ist bei chronisch-rezidivierenden Verläufen die Wahrscheinlichkeit viel höher, dass die Betroffenen in einer epidemiologischen Erhebung erfasst werden.1
Das Problem mit Rezidiven hat zwei potenziell wichtige Implikationen oder Szenarien. Erstens, wenn die RCTs zur Wirksamkeit von Behandlungen größtenteils auf Episoden von nicht chronischen bzw. Nichtrezidivfällen bezogen sind und nicht auf Episoden von rezidivierend-chronischen Fällen, wurde die Wirksamkeit möglicherweise überschätzt, da nach allen klinischen Berichten erfolgreiche Behandlungen von rezidivierend-chronischen Fällen schwieriger sind [75, 76]. Zweitens, wenn in der Routineversorgung relativ wirksame Behandlungen zur Verhinderung von Rückfällen/Rezidiven nicht optimal ausgerichtet wurden, ist die Wirksamkeit auf Bevölkerungsebene gering.
Es bleibt unklar, inwieweit diese beiden Szenarien die bisherige klinische Praxis widerspiegeln. Wenn sie häufig und angemessen zur Verfügung gestellt wurden, sollten therapeutische Fortschritte zur Verhinderung von Rückfällen/Rezidiven zu einem starken behandlungsbedingten Rückgang der Prävalenz geführt haben. Wurden sie selten oder nicht optimal angeboten, könnte dies zur Erklärung des Behandlungs-Prävalenz-Paradoxons beitragen.
Kann eine Behandlung kontraproduktiv sein?
Sowohl die medikamentöse als auch die psychologische Behandlung von affektiven und Angststörungen können Nebenwirkungen haben [77]. Wie häufig diese Nebenwirkungen auftreten und die Vorteile der Behandlung zunichtemachen, ist weniger klar. Insbesondere Medikamente wurden mit einer Vielzahl von Nebenwirkungen in Verbindung gebracht: paradoxe Wirkungen, Toleranzmanifestationen (Verlust der klinischen Wirkung, Widerstände), Entzugssymptome bzw. Störungen im Rahmen des Entzugs [78‒81]. Signifikante Nebenwirkungen psychologischer Behandlungen wurden ebenfalls festgestellt [82, 83].
Zwei wichtige kontraproduktive Konsequenzen wurden vorgeschlagen: Verringerung der Selbsthilfeaktivitäten und Abgeben der Verantwortung an die Behandler:innen [84] und Verhaltenstoxizität einschließlich oppositioneller Störungen2 und Symptomrückkehr [77, 78, 80, 81]. Sie sollten berücksichtigt werden als mögliche Faktoren für das Behandlungs-Prävalenz-Paradoxon.
Reduktion von Selbsthilfeaktivitäten und Verlust der Handlungsfähigkeit: Eine medikamentöse Behandlung ohne Verhaltensmanagement und Psychoedukation (Monomedikation) hat das Risiko, kontraproduktiv zu sein, wenn sie die Selbsthilfeaktivität und die aktive Bewältigung reduziert [84]. Das Gleiche könnte für eine nicht richtlinienkonforme Psychotherapie gelten [80]. Das Argument ist, dass depressive und ängstliche Menschen häufig hilfreiche Strategien anwenden, die in Selbsthilfeprogrammen und psychologischen Behandlungen enthalten sind, wie z.B. das Sporttreiben, die Steigerung angenehmer Aktivitäten, die Reduzierung von Stresssituationen und Meditieren. Diese Strategien verbessern tendenziell ihre „Handlungsfähigkeit“, ihre „Selbstwirksamkeit“ für die Bewältigung zugrunde liegender Probleme [32] und vielleicht sogar ihre neuronale Plastizität [85]. Monomedikation und nicht richtlinienkonforme Psychotherapie bergen das Risiko, diese hilfreichen Strategien zu reduzieren.
Verhaltenstoxizität einschließlich entgegengerichteter Störungen: Verhaltenstoxizität bezieht sich auf die „pharmakologischen Wirkungen eines Arzneimittels, die innerhalb des Dosisbereichs, in dem es sich als klinisch nützlich erwiesen hat, Veränderungen der Stimmung, der Wahrnehmung, der kognitiven und der psychomotorischen Funktionen hervorrufen können, welche die Leistungsfähigkeit des Einzelnen einschränken oder eine Gefahr für sein Wohlbefinden darstellen“ ([77], S. 130). Eine wichtige Form der Verhaltenstoxizität sind gegenteilige bzw. Rebound-Effekte, mit denen unbeabsichtigte und unerwünschte Wirkungen von Medikamenten auf den Krankheitsverlauf erklärt werden, einschließlich des Wiederauftretens von Symptomen nach dem Absetzen und eines fortschreitenden Wirkungsverlusts (Tachyphylaxie) über wiederholte Studien mit Antidepressiva hinweg [78‒81]. Wichtig ist, dass direkte Beweise für entgegengerichtete Störungen fehlen, aber interessante indirekte Beweise verfügbar sind [78, 79].
In RCTs wurde nicht aktiv nach nachteiligen Folgen gesucht, möglicherweise weil dies nicht im Interesse der Fördereinrichtungen oder der Forscher:innen war. Medikationsmonotherapie und Low-Fidelity-to-Guideline-Psychotherapie sind wahrscheinlich selten in RCTs, in denen Behandlungsprotokolle spezifiziert und sorgfältig überwacht werden, im Gegensatz zur Behandlung im Routinesetting. Darüber hinaus werden behandlungsfreie Studien als unethisch angesehen, und Studien mit Medikamentenentzug haben aufgrund falsch interpretierter Entzugssymptome und zu kurzer Nachbeobachtungen möglicherweise das Gesamtbild der verbesserten Endergebnisse verfehlt [79, 86]. Obwohl harte Daten fehlen, lässt sich zusammenfassend sagen, dass kontraproduktive Wirkungen erheblich dazu beitragen könnten, das Behandlungs-Prävalenz-Paradoxon zu erklären, aber solide Beweise fehlen.
Abschließende Bemerkungen
Seit den frühen 1980er-Jahren sind die Ausgaben für die Versorgung psychischer Erkrankungen im Rahmen affektiver und Angststörungen in der westlichen Welt erheblich gestiegen, insbesondere für die Behandlung mit Medikamenten, typischerweise Serotonin-Wiederaufnahmehemmern. Eine Verringerung der Prävalenz von affektiven und Angststörungen ist jedoch nicht mit dieser Expansion einhergegangen: das Behandlungs-Prävalenz-Paradoxon. Unsere Analyse legt nahe, dass es unwahrscheinlich ist, dass ein erheblicher Anstieg falsch positiver Ergebnisse oder der Erstinzidenz eine echte behandlungsbedingte Verringerung der Prävalenz ausgeglichen hat. Stattdessen scheint es wahrscheinlich, dass das Behandlungs-Prävalenz-Paradoxon zumindest teilweise auf die überschätzte Wirksamkeit der Behandlung und große Qualitätslücken in der Routineversorgung zurückzuführen ist. Darüber hinaus ist es möglich, dass ein nicht optimales Targeting der Behandlung (zu wenig bei rezidivierenden und chronischen Fällen) und kontraproduktive Wirkungen der Behandlung einen Teil des Paradoxons ausmachen, aber überzeugende Beweise fehlen. Im Vergleich zum kurzfristigen Outcome ist viel weniger über den langfristigen Outcome und den Outcome in Bezug auf Lebensqualität und sozioökonomische Funktionsfähigkeit bekannt. Daher ist mehr Forschung zu langfristigen Behandlungsergebnissen, optimalem Targeting der Behandlung und kontraproduktiven Behandlungseffekten von entscheidender Bedeutung. Die zu optimistische Sicht der Wirksamkeit von Behandlungen in klinischen Leitlinien ist nicht nur auf erhebliche methodische Schwächen in RCTs und Metaanalysen zurückzuführen, sondern auch auf Publikations-, Ergebnisberichterstattungs-, Spin- und Citation Bias [45]. Darüber hinaus wurde Komorbidität in Behandlungsstudien kaum berücksichtigt. Es besteht ein klarer Bedarf an Behandlungsstudien, welche die Komorbidität der betroffenen Patient:innen berücksichtigen, nicht nur komorbide Ängstlichkeit und affektive Störungen, sondern auch Substanzmissbrauch [87].
Um die Prävalenz von affektiven und Angststörungen zu reduzieren, sind nicht nur wirksamere, besser implementierte und gezieltere Behandlungen erforderlich, sondern angesichts der begrenzten Auswirkungen der Behandlung auf Bevölkerungsebene und der erheblichen Kontinuität der Psychopathologie über Kindheit, Jugend und Erwachsenenalter hinaus auch Prävention [88‒91]. Wenn Prävention diese Kontinuität unterbrechen und maladaptive Entwicklungen umkehren könnte, würde die Prävalenz erheblich sinken. Um erfolgreich zu sein, haben verschiedene Autor:innen argumentiert, dass eine wirksame Prävention strukturell, gut finanziert, langfristig und sozial eingebettet sein muss, in einem frühen Alter beginnen muss, sowohl Eltern, Kinder als auch Schulen ansprechen und universelle (Gesundheitsförderung) und indizierte/selektive Prävention kombinieren muss [15, 92‒94]. Kurz gesagt, brauchen wir einen Paradigmenwechsel sowohl in der Behandlung als auch in der Prävention und deren Bewertung, um die Prävalenz psychischer Störungen zu verringern [15, 93].
Conflict of Interest Statement
Alle Autor:innen geben keine finanziellen Interessen oder potenzielle Interessenkonflikte an.
Funding Sources
Diese Arbeit wurde durch einen Zuschuss der Niederländischen Organisation für wissenschaftliche Forschung an den Erstautor unterstützt (Mother Grant NWO-Gravitation 024.001.003).
Author Contributions
Johan Ormel konzipierte und schrieb den ersten Entwurf des Manuskripts und der Überarbeitung. Paul M.G. Emmelkamp fügte relevante Daten zu Angststörungen hinzu und verbesserte die Überarbeitung.
Die Übersetzung wurde angefertigt von Christopher Williams, Ulrich Voderholzer und Elisabeth Schramm.
Additional Information
Übersetzung aus Psychother Psychosom 2023;92(2):73–80. Übersetzung durch Christopher Williams, Ulrich Voderholzer und Elisabeth Schramm.
Footnotes
Redaktionelle Anmerkung: Die Anzahl von Patient:innen mit chronischer Erkrankung zu reduzieren hätte einen stärkeren Effekt auf die Prävalenz als die Reduktion von Akutfällen.
Redaktionelle Anmerkung: Gemeint ist, dass Effekte vorhanden sind, die dem gewünschten Effekt entgegen sind, das heißt kontraproduktiv.