Zusammenfassung
Hintergrund: PatientInnen mit Zwangsstörungen werden in klinischer Forschung und Praxis häufig nicht erkannt oder fehldiagnostiziert, wodurch es zu verzögerten und unzureichenden Behandlungen kommt. Ein Aspekt, der maßgeblich dazu beiträgt, sind unter anderem unzureichende Screening- und Diagnostikinstrumente, da bestehende Fragebögen zur Erfassung von Zwangsstörungen zu einem großen Teil Limitationen hinsichtlich ihrer psychometrischen Qualitäten und ihrer Aktualität unterliegen. Mit der Dimensional Obsessive-Compulsive Scale (DOCS) steht im englischsprachigen Raum seit mehreren Jahren bereits ein vielversprechendes Instrument zur Erfassung von Zwangsstörungen zur Verfügung. Patienten und Methoden: Ziel der vorliegenden Arbeit war es, erstmalig die Faktorstruktur sowie die psychometrischen Eigenschaften der deutschsprachigen DOCS-Version zu überprüfen. Hierzu wurden 177 PatientInnen (107 mit Zwangsstörung, 30 mit Angststörungen und 40 mit Depression) sowie eine nicht-klinische Kontrollgruppe mit 223 Probanden untersucht. Ergebnisse: Die vierfaktorielle Originalstruktur der DOCS konnte in explorativen und konfirmatorischen Faktoranalysen repliziert werden. Interne Konsistenzen und die zeitliche Stabilität der DOCS fielen akzeptabel bis sehr gut aus. Die Konstruktvalidität der DOCS-Gesamtskala fiel zufriedenstellend bis gut aus. Die Kriteriumsvaliditäten fielen bedingt zufriedenstellend aus. Die diagnostische Genauigkeit der DOCS fiel befriedigend aus. Schlussfolgerung: Die deutsche Version der DOCS ist ein robustes, reliables und erstmals validiertes Instrument zur dimensionalen Beschreibung des Schweregrads von Zwangsstörungen.
Abstract
Background: Patients with obsessive-compulsive disorder are often misdiagnosed in clinical research and practice, resulting in delayed and inadequate treatment for patients. Deficient screening and diagnostic instruments contribute to this, since existing questionnaires for obsessive-compulsive disorders are subject to limitations with regard to their psychometric qualities and their topicality. The Dimensional Obsessive-Compulsive Scale (DOCS) is a promising instrument for assessing obsessive-compulsive disorders. Patients and Methods: The aim of the present study was to examine for the first time the factor structure and the psychometric properties of the German-language DOCS version. A total of 177 patients (107 with obsessive-compulsive disorder, 30 with anxiety disorder, and 40 with depression) and a non-clinical control group with 223 subjects were examined. Results: The original four-factor structure of the DOCS could be replicated in explorative and confirmatory factor analyses. Internal consistency and temporal stability of the DOCS were acceptable to very good. The construct validity of the overall DOCS scale was satisfactory to good. The criterion validities were conditionally satisfactory. The diagnostic accuracy of the DOCS was satisfactory. Conclusion: The German version of the DOCS is a robust, reliable, and for the first time validated instrument for the assessment of obsessive-compulsive disorders.
Keywords Obsessive-compulsive disorder, Dimensional Obsessive-Compulsive Scale (DOCS), Self-report questionnaire, Validation
Einleitung
Zwangsstörungen sind mit einer Lebenszeitprävalenz von 1–3% [Kessler et al., 2005; Ruscio et al., 2010] relativ häufige psychische Störungen. Die Störung bleibt oft unerkannt oder wird häufig fehldiagnostiziert [Heyman et al., 2001], was auch durch hohe Komorbiditäten mit anderen Angststörungen und Depressionen [Ruscio et al., 2010] erklärt wird. Die Herausforderungen in der Diagnostik von Zwangsstörungen liegen auch im heterogenen Symptombild [Abramowitz et al., 2010]. Es zeigen sich dabei verschiedene Symptomcluster, die beispielsweise Zwangssymptome wie Waschen und Säubern, Kontrollieren, Ordnen und inakzeptable Gedanken umfassen [Mataix-Cols et al., 2005]. Die Symptomcluster können, müssen aber nicht, Zwangsgedanken und Zwangshandlungen umfassen. So können kontaminationsbezogene Zwangsgedanken über Zwangshandlungen wie Waschen, Säubern und/oder Desinfizieren neutralisiert werden. Bei Zwangsgedanken bezüglich einer subjektiv erhöhten Verantwortung für Fehler aller Art werden dagegen häufig Kontrollhandlungen zur Neutralisierung verwendet. Zwangsgedanken bezüglich Symmetrie und Ordnung können mit Zwangshandlungen wie Anordnen und Ordnen neutralisiert werden. Und Zwangsgedanken über Sexualität, Religion und Gewalt werden oft über gedankliche Rituale neutralisiert.
Diese Heterogenität der Zwangsstörung führt in der Diagnostik vor allem bei Selbstberichtsfragebögen zu Problemen. Das Fremdbeurteilungsinstrument Yale-Brown Obsessive-Compulsive Scale (Y-BOCS) [Hand und Büttner-Westphal, 1991] gilt bislang meist als Goldstandard zur Diagnostik der Zwangsstörung [Storch et al., 2010]. Die Y-BOCS zeigt in der Originalversion von Goodman et al. [1989a] eine sehr hohe Interrater-Reliabilität. Daneben zeigt sich eine gute konvergente Validität und eine moderate diskriminante Validität [Goodman et al., 1989b]. Bei der Bewertung der Symptomatik mit der Y-BOCS nimmt der Interviewer eine Zusammenführung der dimensionalen (Heterogenität im Erscheinungsbild) und der quantitativen Aspekte der Zwangssymptomatik (Schweregrad) vor. Dies erfolgt über die Erfassung aller Symptome mittels einer Checkliste und der darauffolgenden Einschätzung von Zeitdauer, Vermeidung, Leid, Beeinträchtigung, und Widerstand. Hierbei geht allerdings der qualitative Aspekt der kategorialen Diagnostik verloren, weswegen die genaue Ausprägung jedes Symptoms nicht dargestellt werden kann.
Zur Erfassung von Zwangssymptomen gibt es bereits eine Reihe von bestehenden Selbstbeurteilungsfragebögen, wie das Obsessive-Compulsive Inventory (OCI) [Foa et al., 2002] und das Padua Inventory (PI) [Sanavio, 1988; Gönner et al., 2007, 2010]. Zusätzlich ist im deutschsprachigen Raum das Hamburger Zwangsinventar (HZI) [Zaworka et al., 1983; Klepsch et al., 1991] verbreitet. Die Fragebögen sind ökonomisch in der Durchführung und haben gute psychometrische Qualitäten, zeigen allerdings eine Reihe von Limitationen, die nachfolgend aufgelistet sind:
Die Zusammenführung der dimensionalen (Heterogenität im Erscheinungsbild) und der quantitativen Aspekte der Zwangssymptomatik (Schweregrad) fehlt. Zum Beispiel erfassen OCI-R und PI die Störungsschwere nur eindimensional und additiv über verschiedene Arten von Zwangssymptomen (Beeinträchtigung durch das Symptom). Das führt zu einer Überschätzung der Schwere, wenn PatientInnen viele verschiedene Symptome haben.
Zwangsgedanken und Zwangshandlungen werden getrennt beurteilt, obwohl sie häufig einen funktionalen Bezug zueinander aufweisen. So werden kontaminationsbezogene Zwangsgedanken und Zwangshandlungen wie Waschen, Säubern und/oder Desinfizieren in den meisten Fragebögen über zwei oder mehrere Fragen beurteilt. In der Funktionalität der Störung dienen Zwangshandlungen häufig dazu, Zwangsgedanken zu neutralisieren. Aus diesem Grund sollten diese also in der Schweregradbeurteilung gemeinsam betrachtet werden.
Vermeidungsstrategien werden gar nicht oder sehr spezifisch erfasst.
Oft erfolgt nur die Abfrage einiger weitverbreiteter Symptome, was den Schweregrad aber unterschätzen könnte, wenn Patienten durch einzelne Symptome sehr stark eingeschränkt sind.
Es zeigt sich eine nicht zufriedenstellende, geringe diskriminante Validität der Y-BOCS bezogen auf die depressive Symptomatik [Jacobsen et al., 2003].
Generell weisen die Instrumente eine niedrige diskriminante Validität zu Maßen der Depression auf [Woody et al., 1995; Foa et al., 2002].
Die Reliabilität der Y-BOCS als Fremdratingversion ist zudem abhängig vom Trainingsstand der Interviewer und relativ zeitaufwendig.
Die Symptomchecklisten (HZI und HZI-K) sind zusätzlich durch dichotome Antwortformate beschränkt.
Daneben entspricht beispielsweise der OCI-R nicht der neuesten klassifikatorischen Differenzierung von Zwangsstörungen und Zwangsspektrumsstörungen. So wird Horten mit in den Selbstbeurteilungsfragebogen eingeschlossen, was nicht mehr der aktuellen Klassifikation des DSM-5 [American Psychiatric Association, 2013] entspricht, wo Horten als eigenes Störungsbild den Zwangsspektrumsstörungen zugeordnet wird.
Um diese Limitationen zu überwinden, haben Abramowitz und seine Kollegen 2010 die Dimensional Obessive-Compulsive Scale (DOCS) entwickelt. Es handelt sich dabei um ein Selbstbeurteilungsinstrument mit 20 Items zu den vier oben bereits benannten Subtypen der Zwangsstörung, die als Kategorien abgefragt werden: Kontamination, Verantwortung für Unheil, Inakzeptable Gedanken und Symmetrie. Im Sinne der neuen klassifikatorischen Einordnung im DSM-5 [American Psychiatric Association, 2013] wird das Horten hierbei nicht eingeschlossen. Um die Kategorien deutlich zu machen, werden zu Beginn jeder Kategorie Beispiele genannt, die in diese Kategorie fallen, z.B. in der Kategorie “Kontamination” das Beispiel: “Das Gefühl, dass Sie verunreinigt sind, weil Sie sich an einem bestimmten Ort aufgehalten haben (wie z.B. der Toilette).” Hiernach werden zu jeder Symptomkategorie Fragen zu Zeitbedarf, Vermeidung, Leid, Beeinträchtigung und Widerstand auf einer 5-stufigen Skala erfragt, die ähnlich auch die Basis für die quantitative Erfassung innerhalb der Y-BOCS bilden. Somit wird die Symptomschwere mehrdimensional erfasst.
Die DOCS zeigt im Original eine gute psychometrische Qualität und ist sowohl für den klinischen, wie auch für den nicht-klinischen Bereich anwendbar [Abramowitz et al., 2010]. Die DOCS ist bereits in verschiedene Sprachen übersetzt und validiert worden, beispielsweise Chinesisch [Wang et al., 2012], Spanisch [López-Solà et al., 2014], Isländisch [Ólafsson et al., 2013] und Italienisch [Melli et al., 2015]. Im Großen und Ganzen bestätigen die Übersetzungen die guten psychometrischen Eigenschaften der Originalversion. Nach unserem Kenntnisstand liegt bisher keine deutsche Übersetzung der Langversion vor. Das Vorliegen einer reliablen und validen deutschen Version wäre sowohl zur Diagnostik im klinisch-praktischen Bereich wie auch für die Forschung eine wichtige Ergänzung, insbesondere für interkulturelle Vergleiche. Wie in der Originalstudie [Abramowitz et al., 2010] wird in der vorliegenden Studie die deutsche Langversion auf diagnostische Genauigkeit empirisch geprüft. Erstens werden ähnlich gute psychometrische Eigenschaften der deutschen Version wie in der Originalstudie vorhergesagt. Zweitens kann erwartet werden, dass die DOCS eine ähnlich gute Validität und diagnostische Genauigkeit aufweist wie PI-PR und OCI-R (mit Horten).
Methoden
DOCS – Itementwicklung, -beschreibung und -übersetzung
Initial entwickelt wurden die DOCS-Items von Jonathan S. Abramowitz und Brett J. Deacon [Abramowitz et al., 2010] mit dem Ziel, die am häufigsten gefundenen Symptomcluster der Zwangsstörung [McKay et al., 2004; Mataix-Cols et al., 2005] abzudecken. Daraus entstanden 20 Items, die sich auf vier Symptomcluster (Kontamination, Verantwortung, Symmetrie und Ordnung und Inakzeptable Gedanken) beziehen. Innerhalb dieser Symptomcluster wird über jeweils fünf Items (a) die Dauer, (b) das Vermeidungsverhalten, (c) das Leiden, (d) die Beeinträchtigung und (e) der persönliche Widerstand auf einer 5-stufigen Skala mit variierenden Schweregradbeschreibungen (0 = keine Beschwerden/Beeinträchtigungen, 4 = extreme Beschwerden/Beeinträchtigungen) erfasst. Die einzelnen Items sind, wie in der Originalversion, auch im Deutschen inhaltlich auf die Symptomcluster angepasst. Die Befragung bezieht sich auf den letzten Monat. Die deutschsprachige Version der DOCS ist online unter www.karger.com/doi/10.1159/000510093 verfügbar.
Die DOCS wurde im Rahmen einer an der Universität Leipzig durchgeführten Vorstudie von zwei deutschen Muttersprachlerinnen mit sehr guten Englischkenntnissen aus dem englischen Original ins Deutsche übersetzt. Aus den beiden entstandenen Versionen wurde, nach Prüfung auf Übereinstimmung, eine deutsche Version erstellt. Nach dem von Brislin [1970] empfohlenen Vorgehen der back translation technique wurde die deutsche Version von einer bilingualen Muttersprachlerin ins Englische rückübersetzt. Die so entstandene Version wurde von Abramowitz auf Äquivalenz mit der Originalversion überprüft. Nachdem kleine Abweichungen angepasst worden waren, gab Abramowitz sein Einverständnis für die semantische Übereinstimmung der deutschen Version der DOCS mit der englischen Originalversion.
Stichprobenbeschreibung
Die Diagnosen der PatientInnen wurden in allen Einrichtungen von approbierten PsychotherapeutInnen mithilfe des Strukturierten Klinischen Interviews für DSM-IV (SKID) [Wittchen et al., 1997] gestellt und in ICD-10-Diagnosen überführt. Die PsychotherapeutInnen haben die Ein- und Ausschlusskriterien geprüft, weswegen nur PatientInnen an der Studie teilnahmen, die von den PsychotherapeutInnen anhand dieser Kriterien als geeignet eingeschätzt wurden. Es hätten auch solche PatientInnen, deren Erstdiagnose eine andere psychische Erkrankung darstellte, eingeschlossen werden können, dies war aber nicht der Fall. Alle PatientInnen mit einer Zwangssymptomatik hatten eine Erstdiagnose Zwangsstörung. Aufgrund der Ausschlusskriterien Schwangerschaft, derzeitiger Tavor-Entzug, hirnorganische Störung und/oder Wahnvorstellungen und Halluzinationen wurden drei PatientInnen von der Studienteilnahme ausgeschlossen (einmal Tavor-Entzug, zweimal wegen einer falschen Zieldiagnose).
Insgesamt nahmen 400 Personen an der vorliegenden Validierungsstudie teil. Darunter waren 223 nicht-klinische TeilnehmerInnen, 107 PatientInnen mit Zwangsstörung, 30 PatientInnen mit Angststörungen und 40 PatientInnen mit Depression. Die stationäre und ambulante Behandlung basierte auf den Prinzipien der KVT und beinhaltete Exposition mit Reaktionsverhinderung. Die Daten der nicht-klinischen Kontrollgruppe (n = 223) wurden über soziale Netzwerke und E-Mail-Verteiler erhoben. Die demografischen Merkmale der TeilnehmerInnen, aufgeschlüsselt nach den einzelnen Gruppen, und die Erhebungsorte sind in Tabelle 1 dargestellt. Eine Sub-Stichprobe von 107 TeilnehmerInnen nahm drei bis zwölf Wochen nach dem erstmaligen Test an einer Re-Testung teil. Es liegt ein positives Votum der Ethikkommission der Medizinischen Fakultät der Universität Leipzig vom 23.06.2016 vor (217/16-ek).
Messinstrumente
Zusätzlich zur DOCS (die oben genauer beschrieben wurde) wurden die nachfolgenden Fragebögen in der Studie erhoben. Zur Erfassung der konvergenten Validität wurden die Yale-Brown Obsessive-Compulsive Scale (Y-BOCS), das Obsessive-Compulsive Inventory-Revised (OCI-R) und das Padua Inventory-Palantine Revision (PI-PR) verwendet. Zur Erfassung der diskriminanten Validität wurden das Beck-Depressions-Inventar (BDI-II), das Beck-Angst-Inventar (BAI) und die Social Interaction Anxiety Scale (SIAS) verwendet.
Demographische Daten
Erfragt wurden Geschlecht, Alter, höchster Schul- und Berufsabschluss, derzeitig ausgeübter Beruf, aktuelle Wohnsituation, Anzahl der Sozialkontakte und die aktuelle Medikation sowie die Ausschlusskriterien Hirnorganische Erkrankungen, Posttraumatische Belastungsstörung, Wahnvorstellungen oder Halluzinationen, Tavor-Entzug und Schwangerschaft.
Die Yale-Brown Obsessive-Compulsive Scale (Y-BOCS)
In der vorliegenden Studie wurde die Y-BOCS in der deutschen Selbstratingversion des von Goodman et al. [1989a] entwickelten und von Hand und Büttner-Westphal [1991] ins Deutsche übersetzten Fremdbeurteilungsinstruments zur Erfassung des Schweregrades von Zwangsstörungen verwendet. Die Y-BOCS besteht aus 10 Items und erfasst Zwangshandlungen und Zwangsgedanken getrennt voneinander, wobei die Schwere der Symptomatik über fünf Bereiche (Zeit, Vermeidung, Leid, Widerstand, Beeinträchtigung) in einem fünfstufigen Antwortformat erfragt wird (0 = keine Symptome bis 4 = schwere Symptome). Die deutsche Version der Y-BOCS verfügt über sehr gute psychometrische Eigenschaften [Jacobsen et al., 2003]. In der vorliegenden Studie wurde die Y-BOCS als Selbstratingverfahren eingesetzt [Schaible et al., 2001].
Obsessive-Compulsive Inventory-Revised (OCI-R)
Das OCI-R wurde in der vorliegenden Studie in der deutschen Kurzversion [Gönner et al., 2007] des ursprünglich von Foa et al. [2002] entwickelten Selbstbeurteilungsinstruments zur multidimensionalen Erfassung von Zwangssymptomen verwendet. Das OCI-R erfasst die sechs Symptomdimensionen Waschen, Kontrollieren, Ordnen, Zwangsgedanken, Horten und Mentales Neutralisieren. Jede Dimension wird mithilfe von drei Items erhoben, sodass das OCI-R insgesamt 18 Items umfasst, die auf einer fünfstufigen Antwortskala eingeschätzt werden (0 = gar nicht bis 4 = sehr stark). Die guten psychometrischen Eigenschaften des OCI-R konnten in der deutschen Version weitestgehend repliziert werden. Einzig die geringe diskriminante Validität bezüglich depressiver Symptome ist nicht zufriedenstellend. Sie fällt in der deutschen Übersetzung aber besser aus als in der Originalversion [Gönner et al., 2007]. Es stehen Cut-Off-Werte für die Gesamtskala sowie die Subskalen zur Verfügung.
Padua Inventory-Palatine Revision (PI-PR)
Das PI-PR [Gönner et al., 2010] ist die revidierte, deutsche Kurzversion des PI [Sanavio, 1988] mit 24 Items zur Erfassung von sechs Symptomdimensionen von Zwang: Kontamination und Waschen (4 Items), Kontrollieren (6 Items), Zahlen (3 Items), Ankleiden und Körperpflege (3 Items), Rumination (3 Items) sowie Bedrohliche Zwangsgedanken und Impulse (5 Items). Die Aussagen zum Schweregrad der Symptome werden auf einer fünfstufigen Likert-Skala eingeschätzt (0 = gar nicht bis 4 = sehr stark). Das PI-PR hat zufriedenstellende Reliabilitäts- und Validitätswerte, einzig die konvergente Validität mit dem Y-BOCS-Gesamtwert fällt moderat aus.
Beck-Depressions-Inventar (BDI-II)
Das BDI-II ist die deutsche, revidierte Version [Hautzinger et al., 2006] des von Beck et al. [1961] entwickelten Selbstbeurteilungsinstruments zur Erfassung des Schweregrads der depressiven Symptomatik. Das BDI-II umfasst 21 Items. Die Antwortmöglichkeiten sind nach aufsteigendem Schweregrad des Symptoms auf einer vierstufigen Skala (0 = keine Symptomatik bis 3 = schwere Symptomatik) geordnet. Das BDI-II zeigt insgesamt gute psychometrische Gütekriterien [Kühner et al., 2007].
Beck-Angst-Inventar (BAI)
Das BAI ist die deutsche Version [Prinz und Petermann, 2009] des von Beck et al. [1988] entwickelten Selbstbeurteilungsinstruments zur Erfassung der Schwere von Angstsymptomen. Das BAI besteht aus 21 vierstufigen (0 = überhaupt nicht bis 3 = stark/ich konnte es kaum aushalten) deskriptiven Items. Es liegen sehr gute psychometrische Kriterien der Originalversion vor [Beck et al., 1988]. Die deutsche Version weist eine gute Reliabilität und zufriedenstellende Validitäten auf [Prinz und Petermann, 2009].
Social Interaction Anxiety Scale (SIAS)
Das Selbstbeurteilungsinstrument SIAS wurde von Mattick und Clarke [1998] zur Erfassung allgemeiner Ängste vor sozialen Interaktionen entwickelt und wurde in der vorliegenden Studie in der deutschen Version von Stangier et al. [1999] verwendet. Die SIAS besteht aus 20 Aussagen zu sozialen Situationen, welche auf einer fünfstufigen Ratingskala (0 = überhaupt nicht zutreffend bis 4 = sehr stark zutreffend) eingeschätzt werden. Die SIAS ist ein reliables und valides Instrument zur Erfassung kognitiver, affektiver und behavioraler Komponenten von sozialer Angst [Mattick und Clarke, 1998] und weist auch in der deutschen Übersetzung sehr gute psychometrische Qualitäten auf, die mit denen der Originalversion vergleichbar sind [Stangier et al., 1999].
Ablauf der Untersuchung
Klinische Stichprobe
Die Erhebung für die Validierung wurde an der Schön-Klinik Bad Bramstedt, am Helios Parkkrankenhaus Leipzig, der Arbeitsgruppe Klinische Psychologie und Psychotherapie Universität Leipzig, der Psychotherapeutischen Hochschulambulanz der Universität Leipzig sowie dem Leipziger Ausbildungsinstitut für Psychologische Psychotherapie durchgeführt. Die TeilnehmerInnen füllten die oben beschriebenen Fragebögen im Paper-Pencil-Verfahren aus, nachdem ein Überblick über das Vorhaben, die Ziele und den Ablauf der Studie gegeben worden war und sie ihr Einverständnis zur Teilnahme gegeben hatten. Die PatientInnen wurden gebeten, sich für die Beantwortung der Fragebögen Zeit und Ruhe zu nehmen. Sie füllten die Fragebögen zu unterschiedlichen Zeitpunkten ihrer derzeitigen Behandlung aus.
Nicht-klinische Stichprobe
Der Gesamtfragebogen wurde von der nicht-klinischen Stichprobe online am Computer ausgefüllt. Ihnen wurde ein Überblick über das Vorhaben, die Ziele und den Ablauf der Studie gegeben. Nachdem die TeilnehmerInnen ihr Einverständnis zur Teilnahme an der Studie erklärt hatten, wurden ihnen alle Selbstbeurteilungsfragebögen mit Ausnahme der Y-BOCS präsentiert. Die technische Umsetzung erfolgte mittels Unipark (Questback GmbH).
Test-Retest-Sample
Eine Sub-Stichprobe von 107 Teilnehmenden aus der nicht-klinischen Stichprobe nahm nach Einladung via E-Mail an einem Retest teil, für den von ihnen ausschließlich die DOCS beantwortet wurde.
Datenaufbereitung und statistische Analyse
Für jeden Teilnehmenden wurden die Summenwerte für jeden Fragebogen gebildet, wobei bei der DOCS, beim PI-PR und beim OCI-R zusätzlich zu den Gesamtwerten Summenwerte der Subskalen gebildet wurden. Da ein Teil der klinischen Stichprobe (n = 58; 32,77%) das Item 10 des BAI (nervös) nicht beantwortet hatte, wurden diese Werte durch den jeweiligen Skalenmittelwert ersetzt. Andere fehlende Werte, die aufgrund des Paper-Pencil-Verfahrens ausschließlich in der klinischen Stichprobe vorkamen, wurden durch den Itemmittelwert desselben Items in der jeweiligen Stichprobe korrigiert, wenn nicht mehr als 30% der Items pro Fragebogen fehlten. Bei insgesamt drei Studienteilnehmenden waren mehr als 30% des jeweiligen Fragebogens unbeantwortet, sodass diese Werte nach Wirtz [2004] nicht ersetzt wurden. Diese Studienteilnehmenden wurden unter paarweisem Ausschluss in die Berechnungen miteinbezogen.
Danach wurde zuerst die faktorielle Struktur der DOCS untersucht. Die nicht-klinische Stichprobe wurde dazu zufällig in zwei Gruppen aufgeteilt. Die Faktorenstruktur der DOCS wurde wie im Originalartikel sowohl über eine explorative Faktorenanalyse (EFA) wie auch über eine konfirmatorische Faktorenanalyse (KFA) überprüft [Brown, 2006]. Hierfür wurden die R-Pakete psych (Version 1.9.12) [Revelle, 2019] und lavaan [Rosseel, 2012] verwendet. Mit der ersten Hälfte der Stichprobe wurde die untere Ordnung der Faktorenstruktur der DOCS mithilfe einer EFA erfasst. Danach wurde die Modellstruktur mithilfe der zweiten Hälfte der nicht-klinischen Stichprobe (n = 112) und mithilfe der zusammengenommenen klinischen Stichprobe (Zwangs-, Angst- und depressive PatientInnen, n = 177) im Rahmen von zwei KFAs überprüft. Die klinischen Stichproben wurden wie in der Originalarbeit zusammengefasst, um die zugrundeliegende Stichprobengröße zu maximieren.
Hiernach wurden die Trennschärfe der Items und die interne Konsistenz mittels Cronbachs α [Cronbach, 1951] geprüft. Die Retest-Reliabilität im Sinne der zeitlichen Stabilität der DOCS wurde für die nicht-klinische Stichprobe berechnet. Drittens wurden die konvergente und diskriminante Konstruktvalidität und die Kriteriumsvalidität berechnet. Viertens wurde die diagnostische Genauigkeit mithilfe von Receiver Operating Characteristic (ROC) Analysen berechnet und fünftens die Wahl eines optimalen Cut-Off-Werts berechnet. Um hierbei die Stichprobengröße zu berücksichtigen, haben wir die Spezifitäts- und Sensitivitätsdaten mithilfe von lokaler Regression geglättet. Da mit Bezug auf die Studie von Abramowitz et al. [2010] die Balance von Spezifität und Sensitivität berücksichtigt werden sollte, wurde der Datenpunkt ausgewählt, bei dem Sensitivität und Spezifität die geringste Abweichung haben. Berechnet haben wir dies durch das Minimum der voneinander subtrahierten geglätteten Absolutwerte der Sensitivität und geglätteten Absolutwerte der Spezifität (min(abs(Sen) – abs(Spe))). Hierzu wurde dann der Cut-Off-Wert bestimmt. Die statistische Auswertung wurde mit dem Programm R [R Core Team, 2019] durchgeführt.
Ergebnisse
EFA anhand der Daten der nicht-klinischen Stichprobe
Mit der Hälfte der Daten der nicht-klinischen Stichprobe wurde eine EFA mit obliquer Transformation (Promax) berechnet. Die fünf ersten Eigenwerte nach der Rotation betrugen 6,61, 2,25, 1,54, 1,07 und 0,46 und können insgesamt 57% der Varianz aufklären. Das Kaiser-Meyer-Olkin-Kriterium lag für alle Items bei >0,75; ebenso war der Bartletts-Test signifikant (χ2(190) = 1’264,44; p < 0,001). Diese Ergebnisse unterstützen das Vorliegen einer Vierfaktorenstruktur der DOCS [Field, 2014]. Weiterhin laden alle Items nur auf einem Faktor.
KFA anhand der Daten der zweiten Hälfte der nicht-klinischen Stichprobe
Um die Faktorenstruktur zu verifizieren und dabei der Überschätzung des Modell-Fits in größeren Stichproben entgegenzuwirken [Bollen, 1989], wurden KFAs mit der zweiten Hälfte der nicht-klinischen Stichprobe durchgeführt. Es wurde eine Goodness-of-Fit-Analyse anhand verschiedener Indizes vorgenommen [s. Hu und Bentler, 1999; Hooper et al., 2008; Abramowitz et al., 2010]. Dabei wurden die folgenden Werte zugrunde gelegt: standardisiertes Root-Mean, Residual (akzeptabel bis gut: 0,06 ≤ SRMR ≤ 0,08), Root-Mean-Square Error-of-Approximation (akzeptabel bis gut 0,06 ≤ RMSEA ≤ 0,08), Comparative-Fit-Index (akzeptabel bis gut : 0,95 ≥ CFI ≥ 0,9) und Tucker-Lewis-Index (gut, TLI ≥0,95). Die Goodness-of-Fit-Indizes der KFA sprechen für eine akzeptable bis gute Modellgüte für diese Gruppe (χ2(164, n = 112) = 279,77; p ˂ 0,001; χ2/df = 1,89; RMSEA = 0,08; CFI = 0,91; TLI = 0,89). Die Goodness-of-Fit-Indizes für ein Modell mit einem Faktor zweiter Ordnung sprechen für eine akzeptable bis gute Modellgüte (χ2(164, n = 112) = 284,78, p ˂ 0,001; χ2/df = 1,73; RMSEA = 0,08; CFI = 0,91; TLI = 0,989). Alle Faktoren der ersten Ordnung luden stark auf dem Faktor der höheren Ordnung (Ladungen zwischen 1,00 und 2,46). Da die höhere Ordnung nicht zu einer signifikanten Abnahme der Modellanpassung führte, kann zusammengefasst werden, dass das Modell die Korrelationen zwischen den Faktoren erster Ordnung gut wiedergibt [Brown, 2006].
KFA anhand der Daten der klinischen Stichprobe
Wie in der Originalstudie sollte die in der nicht-klinischen Stichprobe dokumentierte Struktur der DOCS auch in der klinischen Stichprobe vorliegen. Auch für diese KFA war die Modellgüte akzeptabel bis gut (χ2(164, n = 177) = 309,82; p ˂ 0,001; χ2/df = 1,67; RMSEA = 0,07; CFI = 0,97; TLI = 0,96). Auch der Model-Fit der zweiten Ordnung ist als akzeptabel bis gut (χ2(166, n = 81) = 310,58; p ˂ 0,001; χ2/df = 0,49; RMSEA = 0,07; CFI = 0,97; TLI = 0,96) zu interpretieren. Alle Faktoren der ersten Ordnung luden stark auf dem Faktor der höheren Ordnung (Ladungen zwischen 0,85 und 1,47). Außerdem zeigte sich, dass die höheren Faktorstrukturen signifikante Anteile der Varianz erklärten (R2: Kontamination = 0,66, Verantwortlichkeit = 0,19, Inakzeptable Gedanken = 0,95 und Symmetrie = 0,55). Auch hier führte die höhere Ordnung nicht zu einer signifikanten Abnahme der Modellanpassung. Demnach gibt das Modell die Korrelationen zwischen den Faktoren erster Ordnung gut wieder. Die Ladungen und Standardfehler des finalen Modells sind in Tabelle 2 dargestellt.
Reliabilität
Alle 20 Items weisen Trennschärfen von rjt > 0,5 auf. Cronbachs α für die DOCS-Gesamtskala liegt zwischen α = 0,9 und α = 0,94. Die Werte der internen Konsistenz für die Subskalen sind Tabelle 3 zu entnehmen. Alle bivariaten Zusammenhänge zwischen den DOCS-Subskalen und dem DOCS-Gesamtscore waren signifikant. Die Test-Retest-Reliabilität des DOCS-Gesamtwertes wurde mithilfe der Daten der nicht-klinischen Stichprobe (n = 107) berechnet. Dabei zeigte sich, dass sich der Gesamtwert von 11,38 (SD = 9,44) zu Zeitpunkt 1 und der Gesamtwert von 10,75 (SD = 8,70) nicht signifikant über das zeitliche Fenster von drei bis zwölf Wochen unterschieden (t(106) = 1,13; p = 0,26). Der Pearson-Korrelationskoeffizient zwischen den beiden Messzeitpunkten kann mit r = 0,8 als hoch interpretiert werden.
Validität
Konstruktvalidität
Wie in Tabelle 4 zu sehen ist, liegen die Korrelationskoeffizienten der DOCS mit den konstruktnahen Fragebogeninventaren (Y-BOCS, OCI-R und PI-PR) zwischen ρ = 0,4 (p < 0,001) und ρ = 0,76 (p < 0,001) und mit den konstruktfernen Instrumenten (BAI, BDI-II, SIAS) zwischen ρ = 0,20 (p = 0,3) und ρ = 0,59 (p < 0,001).
Ob die Korrelationskoeffizienten der konvergenten Validität sich signifikant von denen der diskriminanten Validität unterscheiden, wurde über eine z-Prüfgröße bei einseitiger Testung berechnet. Hierfür wurden die Korrelationskoeffizienten zwischen der DOCS und den konstruktnahen und konstruktfernen Fragebogeninventaren z-standardisiert und dann Mittelwerte für alle konstruktnahen und Mittelwerte für alle konstruktfernen Korrelationskoeffizienten für jede Gruppe gebildet. Für den Signifikanztest wurde nach Meng et al. [1992] berücksichtigt, dass die zu vergleichenden Korrelationen ebenfalls miteinander korreliert sind, weswegen die z-Prüfgröße berechnet wurde. Der Vergleich ergab signifikante Unterschiede für die Subgruppe der PatientInnen mit Angststörungen (z = 2,29; p = 0,01) und für die nicht-klinische Stichprobe (z = 3,71; p < 0,001), aber keine signifikanten Unterschiede für PatientInnen mit Zwangsstörungen (z = 0,26; p = 0,39) und Depression (z = 1,21; p = 0,11). Die Korrelationen der DOCS-Subskalen mit den jeweils konstruktnahen Subskalen zwischen DOCS und OCI-R und des PI-PR fallen für die nicht-klinische Stichprobe und für die Gruppe der ZwangspatientInnen moderat bis hoch aus (Tabelle 5).
Kriteriumsvalidität
Ein Vergleich der Mittelwerte der DOCS-Gesamtwerte mittels einfaktorieller Varianzanalyse ergab einen signifikanten Haupteffekt der Gruppe (F(3; 40,07) = 8.91; ηp2 = 0,15; p < 0,001). Post-hoc-Tests (Tukey Honest Significant Difference) zeigen, dass die Gruppe der PatientInnen mit Diagnose Zwangsstörungen höhere Gesamtwerte erzielte (M = 28,5; SD = 17,52) als PatientInnen mit Angststörungen (M = 13,37; SD = 11,04; p < 0,001), Depression (M = 14,30; SD = 11,56; p < 0,001) und die nicht-klinische Stichprobe (M = 11,85; SD = 9,09; p < 0,001). Die Werte der Subgruppen der PatientInnen mit Angststörungen, Depression und der nicht-klinischen TeilnehmerInnen unterscheiden sich nicht signifikant (Bonferroni-korrigiertes Signifikanzniveau von p = 0,008: ps > 0,6).
Es wurden vier einfaktorielle Varianzanalysen für jede Subskala (Verantwortung, Symmetrie, Inakzeptable Gedanken und Kontamination) mit dem Zwischen-Subjektfaktor Gruppenzugehörigkeit (Zwangsstörung, Angststörung, Depression und Kontrollgruppe) berechnet. Die Gruppen hatten signifikant unterschiedliche Werte auf den Subskalen Kontamination (F(2; 123) = 9,49; η2 = 0,13; p < 0,001), Inakzeptable Gedanken (F(2; 123) = 3,09; η2 = 0,048; p = 0,049) und Verantwortung (F(2; 123) = 7,104, η2 = 0,104; p = 0,014), nicht aber auf der Subskala Symmetrie (F(2; 123) = 1,2; η2 = 0,02; p = 0,304). Geplante Kontraste zeigten für alle vier Subskalen an, dass die Gruppe der PatientInnen mit Zwangsstörung höhere Werte angab als die Gruppe der PatientInnen mit Angststörung, Depression und die nicht-klinische Stichprobe (ps < 0,007). Die Gruppen der PatientInnen mit Depression und Angststörung und die nicht-klinische Stichprobe unterscheiden sich nicht signifikant.
Diagnostische Genauigkeit
Um zu prüfen, inwieweit sich die diagnostische Genauigkeit für die Gruppe der PatientInnen mit Zwangsstörung von (a) der Gruppe der Angst- oder depressiven PatientInnen und (b) der nicht-klinische Kontrollgruppe unterschied, wurden ROC-Analysen getrennt für den Gesamtwert und die Subskalen der DOCS berechnet. Bei der Prüfung der Diskriminierungsfähigkeit der DOCS zwischen PatientInnen mit Zwangsstörung und PatientInnen mit Angststörungen oder Depressionen zeigten sich AUC-Schätzungen von 0,59 (Subskala Symmetrie) bis 0,7 (Subskala Kontamination). Für den DOCS-Gesamtwert ergab sich im Vergleich zu den Subskalen die höchste AUC-Schätzung (AUC = 0,75; 95% Konfidenzintervall = 0,68–0,82). Bei der Unterscheidung der Gruppe der PatientInnen mit Zwangsstörung von den nicht-klinischen TeilnehmerInnen zeigten sich AUC-Schätzungen von 0,54 (Subskala Kontamination) bis 0,67 (Subskala Inakzeptable Gedanken). Für den DOCS-Gesamtwert ergab sich im Vergleich zu den Subskalen die höchste AUC-Schätzung (AUC = 0,80; 95% Konfidenzintervall = 0,75–0,85). Die Ergebnisse zeigen, dass der Gesamtwert der DOCS-PatientInnen mit Zwangsstörungen zufriedenstellend von PatientInnen mit Angststörungen oder Depressionen sowie von der nicht-klinischen Stichprobe unterschieden werden kann.
Der Vergleich der Diskriminierungsfähigkeit zwischen DOCS und OCI-R ergab signifikant größere AUC-Schätzer für den DOCS-Gesamtwert (Subgruppen mit Angststörungen oder Depressionen, DeLong-Test für korrelierte ROC-Kurven: AUC = 0,27, Z = 7,002; p < 0,001, Gruppe mit Zwangsstörung und der nicht-klinischen Kontrollgruppe: AUC = 0,28, Z = 8,002; p < 0,001). Ein direkter Vergleich zwischen DOCS und PI-PR ergab dagegen keinen signifikanten Unterschied der AUC-Schätzer. Demnach scheint die DOCS für die oben genannten Vergleiche eine größere diagnostische Genauigkeit aufzuweisen als der OCI-R, nicht aber als der PI-PR-Gesamtwert (beides Abb 1).
Receiver Operating Characteristic-Kurven (ROC-Kurven) für den Vergleich zwischen den PatientInnen mit Zwangsstörungen und den PatientInnen mit Depression und Angst auf der linken Seite (a) und Kurven für den Vergleich zwischen PatientInnen mit Zwangsstörungen und der nicht-klinischen Kontrollgruppe auf der rechten Seite (b).
Receiver Operating Characteristic-Kurven (ROC-Kurven) für den Vergleich zwischen den PatientInnen mit Zwangsstörungen und den PatientInnen mit Depression und Angst auf der linken Seite (a) und Kurven für den Vergleich zwischen PatientInnen mit Zwangsstörungen und der nicht-klinischen Kontrollgruppe auf der rechten Seite (b).
Entsprechend den Berechnungen liegt der optimale Cut-Off-Wert für die Unterscheidung von PatientInnen mit Zwangsstörung von PatientInnen mit Angststörung oder Depression bei 18. 65% der PatientInnen mit Zwangsstörung (Sensitivität) und 66% der PatientInnen mit Angststörung oder Depression (Spezifität) werden anhand dieses Wertes korrekt identifiziert. Für die Unterscheidung von PatientInnen mit Zwangsstörung von der nicht-klinischen Kontrollgruppe liegt der optimale Cut-Off-Wert bei 16. Hierbei werden 72% der PatientInnen mit Zwangsstörung (Sensitivität) und 71% der Kontrollgruppe (Spezifität) korrekt identifiziert.
Diskussion
In der vorliegenden Studie wurden die psychometrischen Eigenschaften der deutschsprachigen Version der DOCS in Stichproben von PatientInnen mit Zwangsstörung, Angststörung und Depression sowie nicht-klinischen TeilnehmerInnen überprüft. Insgesamt weist die deutschsprachige Version der DOCS akzeptable bis gute psychometrische Eigenschaften auf und ist damit vergleichbar mit der Originalversion und den bisherigen Übersetzungen [Abramowitz et al., 2010; López-Solà et al., 2014]. Die DOCS ist mit ihren 20 Items und durch ihren Verzicht auf eine umfangreiche Symptomliste ein Instrument, das eine relativ ökonomische Erfassung von Zwangssymptomen ermöglicht. Dennoch fielen bestimmte Kennwerte im Rahmen der EFA und der Konstruktvalidität etwas geringer als in den Vergleichsstudien aus. Entsprechend unserer Erwartungen zeigt die robuste und reliable deutschsprachige DOCS eine große Konstruktnähe zum PI-PR und eine höhere diagnostische Genauigkeit als der OCI-R-Fragebogen.
Unsere Ergebnisse zeigen, dass auch die deutsche Langversion der DOCS in klinischen und nicht-klinischen Stichproben eine Vier-Faktoren-Struktur aufweist. Die Ergebnisse sind robust und zeigten eine akzeptable bis gute Modellgüte. Die Abweichungen hinsichtlich der EFA könnten auf die deutlich kleinere nicht-klinische Kontrollstichprobe im Vergleich zur Originalpublikation von Abramowitz et al. [2010] (n = 223 vs. n = 1’044) zurückzuführen sein. Die Faktorenstruktur kann trotzdem als robust interpretiert werden, da sowohl die KFA für den zweiten Teil der nicht-klinischen Stichprobe wie auch die KFA für die zusammengefassten klinischen Stichproben eine vergleichbare Modellgüte zur Originalarbeit aufweisen.
Die Mittelwerte und Standardabweichungen für den Gesamtwert und die Subskalen waren denjenigen sehr ähnlich, die für die Originalversion berichtet wurden [Abramowitz et al., 2010]. Dieses Ergebnis zeigt im Zusammenhang mit den sehr guten Kennwerten der Reliabilität (Cronbachs α und die Test-Retest-Reliabilität) der deutschsprachigen DOCS, dass sowohl ein stabiler Gesamtwert als auch stabile Werte für die Subskalen berechnet werden können. In Anbetracht ähnlicher Ergebnisse der bisherigen Übersetzungen [Wang et al., 2012; Ólafsson et al., 2013; López-Solà et al., 2014; Melli et al., 2015] wird somit auch die länderübergreifende Verwendbarkeit der DOCS für die deutschsprachige Version bestätigt.
Die internen Konsistenzschätzungen für die Gesamt- und Subskalenwerte reichten von befriedigend bis gut. Wie erwartet waren für die nicht-klinische Kontrollstichprobe und die Gruppe der PatientInnen mit Angststörungen die Korrelationen zwischen dem DOCS-Gesamtwert und den konstruktfernen Messinstrumenten (BAI, BDI, SIAS) geringer als mit den konstruktnahen Messinstrumenten (PI-PR und OCI-R). Dieser Unterschied zeigte sich allerdings für die Gruppen der PatientInnen mit Zwangsstörungen und Depressionen nicht. Dies könnte auch daran liegen, dass viele Personen mit komorbiden Depressionen in der Gruppe der PatientInnen mit Zwangsstörungen waren, was sich auch in hohen BDI Werten zeigte. Auf eine weitere Ursache könnte der geringe bivariate Zusammenhang zwischen der DOCS und dem konstruktnahen OCI-R hinweisen. Da der OCI-R auch eine Skala zum Horten beinhaltet, könnte diese Subskala für die niedrige Korrelation zumindest mitverantwortlich sein. Dennoch ergibt sich insgesamt eine positive Beurteilung der Konstruktvalidität, da, wie erwartet, signifikante und hohe Zusammenhänge zwischen dem DOCS-Gesamtwert und den Gesamtwerten des PI-PR und der Y-BOCS in der Gruppe der PatientInnen mit Zwangsstörungen vorlagen. Bemerkenswert, auch im Vergleich zur Studie von Abramowitz et al. [2010], sind aber vor allem die unterschiedlichen Befunde zwischen den PatientInnen mit Angststörungen und den PatientInnen mit Depressionen. Dieser Unterschied zeigt, wie wichtig beide Störungsgruppen zum Vergleich bei einer solchen Validierungsstudie sind.
Bei den Ergebnissen zur Konstruktvalidität auf Skalenebene finden sich bei der Gruppe der PatientInnen mit Zwangsstörungen hohe Zusammenhänge zwischen den DOCS-Subskalen Kontamination und Symmetrie und dem OCI-R bzw. dem PI-PR andererseits. Dagegen scheint vor allem die Subskala Inakzeptable Gedanken wenig mit den konstruktnahen Subskalen des OCI-R und des PI-PR zusammenzuhängen. Dabei weist die DOCS-Skala Inakzeptable Gedanken eine etwas bessere Konstruktvalidität mit der PI-PR-Ruminationsskala (“Wenn ich beginne, an bestimmte Dinge zu denken, werde ich von den Gedanken völlig eingenommen und kann an nichts anderes mehr denken”) auf als mit der PI-PR-Impulsskala (“Wenn ich von einer Brücke oder aus einem hohen Fenster hinabsehe, verspüre ich einen Impuls, mich in die Tiefe zu stürzen”). Möglicherweise fällt die Selbsteinschätzung der Zeit und des Ausmaßes von Impulsen im Rahmen der DOCS schwerer als die Einschätzung über eine relativ unspezifische Likert-Skala im Rahmen des OCI-R und des PI-PR.
Die Kriteriumsvalidität fiel dagegen, wie oben bereits beschrieben, vergleichbar gut wie in der Originalarbeit aus. Insbesondere zeigten sich durchgehend höhere Werte auf dem Gesamtscore wie auch auf allen Subskalen bei der Gruppe mit Zwangsstörungen im Vergleich zu allen anderen Gruppen.
Für die Unterscheidung der klinischen Gruppen (Zwangsstörung vs. Depression/Angststörung) fiel die diagnostische Genauigkeit etwas geringer aus, als die Ergebnisse der Originalarbeit dies nahelegen. Die diagnostische Genauigkeit zur Unterscheidung von PatientInnen mit Zwangsstörungen und der nicht-klinischen Kontrollstichprobe fiel dagegen vergleichbar gut aus. Insgesamt fiel die Sensitivität und die Spezifität insbesondere für die Unterscheidung der PatientInnengruppen (Zwangsstörung vs. Depression/Angststörung) geringer aus als in der Originalarbeit. Dies zeigt sich in einem niedrigeren Cut-Off-Wert in der vorliegenden Studie (18 vs. 21 in der Originalstichprobe, nur Angststörung). Zur Unterscheidung der ZwangspatientInnen mit der nicht-klinischen Kontrollstichprobe waren Sensitivität und Spezifität sowie der daraus resultierende Cut-Off-Wert vergleichbar mit den Werten der Originalstichprobe (16 vs. 18 in der Originalstichprobe). Insgesamt zeigt sich ähnlich wie in anderen Validierungsstudien zur DOCS [Abramowitz et al., 2010; López-Solà et al., 2014] eine höhere Sensitivität der DOCS im Vergleich zum OCI-R, nicht aber im Vergleich zum PI-PR. Hierbei waren die Werte zur diagnostischen Genauigkeit des OCI-R in unserer Untersuchung deutlich schlechter als in der Arbeit von Abramowitz et al. [2010]. Dies könnte, zusammengenommen mit den oben beschriebenen Ergebnissen, auch auf eine generelle Verzerrung in den Antworten des OCI-R in der vorliegenden Studie hinweisen.
Auch wenn die DOCS durch ihre Verbindung aus dimensionalem und kategorialem Ansatz die neuere Forschung zu Zwangsstörungen besser abbildet und dadurch auch bei Menschen mit geringeren Einschränkungen differenzieren kann, ist das Verfahren nicht ohne Limitationen. So kann es sein, dass Menschen, die in einer Domäne schwer beeinträchtigt sind, geringere Gesamtwerte in der DOCS erreichen als Menschen, die in mehreren Domänen leichtere Beeinträchtigungen aufweisen. Hier empfehlen wir daher, immer auch die Werte der Subkategorien bei der Schweregradbeurteilung mit zu betrachten. Zu den Limitationen der vorliegenden Studie gehört zweitens, dass die Gruppen der PatientInnen mit Angststörungen und Depression deutlich kleiner waren als die der PatientInnen mit der Diagnose Zwangsstörung. Drittens konnte die Änderungssensitivität aufgrund zu geringer Fallzahlen noch nicht beurteilt werden. Viertens könnte eine Limitation der Studie sein, dass die Daten der nicht-klinischen TeilnehmerInnen im Internet erhoben wurden, während die klinischen Stichproben die Fragebögen per Paper-Pencil-Verfahren durchführten. Allerdings zeigte sich in vergleichenden Untersuchungen, dass Fragebögen unabhängig von der verwendeten Erhebungsmethode ähnliche Mittelwerte sowie ähnliche interne Konsistenzen und Intra-Korrelations-Koeffizienten aufzeigten [Coles et al., 2007]. Eine fünfte Limitation der Studie ist, dass sich Alter und Geschlechterverteilung zwischen den Gruppen unterschieden. Dies war zwar in der Originalstudie von Abramowitz et al. [2010] auch der Fall, trotzdem könnte es sein, dass die Gruppenunterschiede dieser beiden Variablen die Ergebnisse verzerrt haben. So könnte es sein, dass beispielsweise die diagnostische Genauigkeit zwischen den klinischen Gruppen auch durch unterschiedliche Alterseffekte verzerrt wurde.
Zusammenfassend ist die deutschsprachige DOCS aber ein robustes, reliables und erstmals validiertes Messinstrument zur dimensionalen Erfassung von Zwangssymptomen, das bisherigen Limitationen der Fragebogen- und Selbstbeurteilungsdiagnostik von Zwangsstörungen durch die Verknüpfung von dimensionaler und kategorialer Selbstbeurteilungsdiagnostik entgegenwirken kann.
Danksagung
Wir bedanken uns bei allen Teilnehmern und Teilnehmerinnen an der Studie. Wir bedanken uns bei Amal Kebir, Neeske Beckmann, Sina Klüver, Hille Stühring, Eva Mosig, den Therapeuten und Therapeutinnen an der Psychotherapeutischen Hochschulambulanz der Universität Leipzig und am Leipziger Ausbildungsinstitut für Psychologische Psychotherapie sowie den Mitarbeitern und Mitarbeiterinnen der Psychosomatischen Schön-Klinik Bad Bramstedt und des Helios Parkkrankenhaus Leipzig für die Unterstützung bei der Datenerhebung. Außerdem danken wir Jonathan Abramowitz für den zügigen Vergleich unserer Rückübersetzung mit der Originalversion.
Ethische Aspekte
Alle TeilnehmerInnen wurden über die Ziele und Abläufe der Studie aufgeklärt und gaben ihr Einverständnis zur Teilnahme an der Studie. Es liegt ein positives Votum der Ethikkommission der Medizinischen Fakultät der Universität Leipzig vom 23.06.2016 vor (217/16-ek).
Interessenkonflikt
Die Autoren erklären, dass kein Interessenkonflikt besteht.
Finanzielle Unterstützung
Diese Arbeit erhielt keine spezifischen Zuschüsse von Förderorganisationen aus dem öffentlichen, kommerziellen oder gemeinnützigen Sektor. Die Autoren werden durch die Deutsche Forschungsgemeinschaft (DFG) und die Universität Leipzig im Rahmen des Programms Open Access Publishing unterstützt.
Autorenmitwirkung
Die Studie wurde von C.E. entwickelt und im Rahmen ihres Lehrstuhls gefördert. Das Manuskript wurde von ihr überarbeitet. J.F.-L. und I.J. haben in dieser Studie federführend die Rekrutierung durchgeführt, die Daten ausgewertet und den ersten Entwurf des Manuskripts verfasst. I.J. ist psychologische Leiterin der Zwangsambulanz, in der ein Großteil der Zwangspatienten rekrutiert wurden. K.S. ist Leiterin dieser Klinik und hat die Rekrutierung gefördert. C.S. hat große Teile der weiteren klinischen Stichprobe rekrutiert. T.L. hat den Fragebogen aus dem Englischen ins Deutsche übersetzt und an der Überarbeitung des Manuskripts mitgewirkt. F.K. hat das Manuskript substantiell überarbeitet.
Literatur
Jakob Fink-Lamotte und Ina Jahn teilen sich die Erstautorenschaft.