Inleiding
Diagnostiek in de ggz heeft vaak het karakter van classificatie: het bepalen van de DSM-stoornis waar de patiënt aan voldoet. Het is dikwijls deze classificatie die bepaalt welke behandeling wordt toegepast. Deze keuze is gebaseerd op empirisch onderzoek. Het therapie-effectonderzoek dat vanaf de jaren tachtig van de vorige eeuw is gepubliceerd, bestudeert per studie vrijwel steeds patiënten uit een specifieke DSM-categorie. Doel was daarbij te documenteren wat de effecten van interventie X zijn op de symptomen van stoornis Y.
Dit onderzoek leverde bruikbare inzichten op. Bij de posttraumatische stressstoornis (PISS) bijvoorbeeld, kan men ‘debriefing’ maar beter niet toepassen omdat patiënten er doorgaans slechter van worden (Van Emmerik et al., 2002). Imaginaire exposure en Eye Movement Desensitization and Reprocessing (EMDR) werken veel beter (Cusack et al., 2016). Bij angststoornissen gaat de voorkeur uit naar cognitieve gedragstherapie (CGT; Bandelow et al., 2018). Bij depressies maakt het niet zoveel uit (Cuipers et al., 2008). Zo zijn er voor verschillende stoornissen specifieke behandeltechnieken waarvan op grond van therapie-effectstudies duidelijk is dat ze effectief zijn.
Toch is er een klinisch probleem. Lang niet iedereen knapt (voldoende) op van deze ‘evidence based’-therapieën. Kennelijk is, bij een evidence based-behandeling, de DSM-diagnose onvoldoende voorspellend voor behandelsucces. De vraag is of er andere patiëntkenmerken zijn die voorspellen of therapie werkt. De voorspellende kracht van bijvoorbeeld klinische factoren en patiëntkarakteristieken is over het algemeen gering. Het probleem is dat veel bevindingen niet repliceren in onafhankelijke steekproeven (Franklin et al., 2017)1. Wel is robuust aangetoond dat patiënten met een syndromale psychische stoornis (in pre-DSM-5 edities ‘as I stoornis’) én een co-morbide persoonlijkheidsstoornis er na therapie slechter aan toe zijn dan de As I-lotgenoten zonder co-morbide persoonlijkheidsstoornis. Dit was echter ook al vóór therapie het geval en bij patiënten mét en zonder co-morbide persoonlijkheidsstoornissen, is de daling in as-I klachten even groot (Erkens et al., 2018; Gordon et al., 2016; Keefe et al., 2018; Newton-Howes et al., 2017; Sanatinia et al., 2016; Telch, Kamphuis & Schmidt, 2011).
Patiënten met eenzelfde DSM-classificatie kunnen variëren in scores op persoonlijkheidsdimensies. De vraag is of deze individuele verschillen het therapie-effect kunnen voorspellen. Bij persoonlijkheidsdimensies lijkt hetzelfde patroon op te treden als bij persoonlijkheidsstoornissen: patiënten die hoog scoren op persoonlijkheidsdimensies die samenhangen met pathologie hebben meer (of minder; afhankelijk van de persoonlijkheidsdimensie) klachten dan patiënten met lagere scores. Echter, wederom is ook dit de situatie voor start van de behandeling, terwijl de daling in klachten even sterk is (Mulder, 2002; Van den Hout, Brouwers & Oomen, 2005).
Wellicht zijn het niet geïsoleerde persoonlijkheidstrekken of -stoornissen die voorspellende waarde hebben, maar de persoonlijkheidsorganisaties
Klinisch bruikbare resultaten levert therapievoorspelling op grond van anamnestische, sociaal demografische of persoonlijkheidsfactoren dus nog niet op. Maar wellicht zijn het niet geïsoleerde persoonlijkheidstrekken of -stoornissen die voorspellende waarde hebben, maar de persoonlijkheidsorganisaties. Dit is het centrale idee achter de Dynamische Theorie gestuurde Profielinterpretatie (DTP). Deze methode is ontwikkeld door Eurelings-Bontekoe en Snellen (Snellen, 1990; Snellen, 1993; Eurelings-Bontekoe & Snellen, 2017). Binnen dit model wordt verondersteld dat bepaalde combinaties van scores op persoonlijkheidstests de dynamiek en structuur van de persoonlijkheidsorganisatie (PO) blootleggen. Die combinaties leiden tot een dynamisch structureel label dat de PO weergeeft. Binnen dit model voldoet de patiënt bijvoorbeeld aan een neurotische persoonlijkheidsorganisatie als hij/zij (a) een score van µ 3 op de ernstige psychopathologieschaal van de Nederlandse Verkorte MMPI (NVM) heeft gecombineerd met een score van >20 op de verlegenheidsschaal van de NVM of (b) een score van >4 maar <7 op de ernstige psychopathologie schaal, gecombineerd met een score van >26 op de verlegenheidsschaal (Eurelings- Bontekoe & Snellen, 2017; Eurelings-Bontekoe et al., 2008). In het handboek beschrijft men dat op basis van de DTP een gefundeerde keuze gemaakt kan worden voor een bepaald type behandeling en dat voorspeld kan worden of de patiënt opknapt, niet opknapt of juist verslechtert (Eurelings- Bontekoe & Snellen, 2017, p.68). De DTP-methode wordt sinds de jaren negentig onderwezen aan psychologen in opleiding tot BIG-psycholoog en aan medewerkers in nascholingscursussen en zij wordt regelmatig toegepast in de ggz, vooral in de Randstad.
Kritiek bleef niet uit (Derksen, 2004; Smid & Kamphuis, 2005). Psychometrisch zou de procedure aan alle kanten rammelen, en het zou ongerijmd zijn dat iedereen die een diagnostische DTP-procedure doorloopt opgezadeld wordt met een pathologische PO. De eerder beschreven kritiekpunten zijn samengevat in tabel 1.
Deze kritiek laten we verder buiten beschouwing. We concentreren ons op wat, klinisch, het belangrijkste lijkt: kunnen we met de DTP voorspellen wie profiteert van psychologische behandelingen? Toen Derksen (2004) en Smid & Kamphuis (2005) hun kritiek publiceerden, werd de DTP-methode breed toegepast en onderwezen. Maar onderzoek was er niet, en de voorspellende kracht van de DTP was een hypothese zonder data. De grondleggers van de DTP namen deze kritiek ter harte en hebben onderzoek gedaan dat deze vraag moest beantwoorden: voorspelt de DTP succes of falen van therapie?
Vanaf 2009 zijn hierover vier artikelen gepubliceerd (Eurelings-Bontekoe et al., 2009; Eurelings-Bontekoe et al., 2012; Scholte et al., 2014; Van de Gaag et al., 2018). Daarvan geven drie studies een direct antwoord op de gestelde vraag. Het antwoord uit de vierde studie is indirect, maar niet minder belangrijk. In deze vier studies worden de PO’s gedefinieerd aan de hand van scores op drie verschillende schalen van de NVM: ernstige psychopathologie, verlegenheid en negativisme. Specifieke criteria voor de verschillende PO zijn elders te vinden (Eurelings-Bontekoe & Snellen, 2017; Eurelings-Bontekoe et al., 2008). We bespreken de vier studies hieronder.
Evaluatie van vier studies
Studie 1: persoonlijkheidsorganisaties voorspellen behandelrespons
In de eerste studie (Eurelings- Bontekoe et al., 2009) zijn hypotheses opgesteld en getoetst over patiënten met een psychotische PO en een borderline PO. Het onderzoek is uitgevoerd bij 576 patiënten met de diagnose angststoornis (89%), depressie (9%) en eetstoornis (2%). De patiënten zijn behandeld met gemiddeld dertien sessies CGT. Van deze 576 patiënten stoppen er 143 vroegtijdig met de behandeling. Het effect van therapie wordt vastgesteld door veranderingen op de Symptom Checklist (SCI-90; Arrindell & Ettema, 2003). Vier hypotheses hebben betrekking op de persoonlijkheidsorganisaties en het voorspellen van therapieresultaat.
Hypothese 1: Het risico op drop-out is het hoogst bij patiënten met een psychotische PO, gevolgd door patiënten met een low level borderline PO, gevolgd door de andere patiënten.
De data geven geen ondersteuning voor deze hypothese. Men zou bij deze hypothese verwachten dat de gehele psychotische PO-groep en de gehele low level borderline PO-groep onderling wordt vergeleken en dat deze groepen zijn vergeleken met de andere patiënten. De hypothese gaat immers over deze drie groepen. Maar in de resultatensectie wordt een onderscheid geïntroduceerd tussen twee nieuwe subgroepen binnen de psychotische PO (manifest psychotisch; N=25 en latent psychotisch; N=19). Ook bij de low level borderline PO wordt gewerkt met een latente subgroep (N= 58) en een manifeste subgroep (N=18). De auteurs suggereren in hun artikel dat men vindt dat de patiënten met een psychotische PO en borderline PO een verhoogd risico hebben op drop-out. Maar dit geldt alleen voor de kleine subgroep van manifest low level borderline PO (N=18; 56% drop-out) en latent psychotische patiënten (N=19; 53% drop-out). Voor de grotere andere subgroepen, de latent low level borderline PO (N=58; 26% drop-out) en de manifest psychotische PO (n=25; 28% drop-out) geldt dit daarentegen niet. Voor deze subgroepen geldt geen grotere uitval dan in de zeven andere persoonlijkheidsprofielen.
Als je een hypothese hebt over verschillen tussen groepen, dan moet je toetsen of die groepen verschillen
Als je een hypothese hebt over verschillen tussen groepen, dan moet je toetsen of die groepen verschillen. Er wordt niet getoetst of er in de psychotische PO-groep meer uitval is dan de low level borderline PO-patiënten en of die weer vaker wegblijven dan de rest. Als je de hypothese toetst zonder ad hoc geïntroduceerde subgroepen te onderscheiden, dan zijn er geen verschillen in uitval tussen patiënten met de genoemde persoonlijkheidsorganisaties (Chi2=10.71; df=7; p=0.18).
Hypothese 2: Patiënten met een psychotische PO verslechteren door CGT.
De hypothese wordt niet bevestigd door de bevindingen. Het geobserveerde verband is zelfs het omgekeerde van het voorspelde verband. De hypothese wordt, net als bij hypothese 1, niet getoetst bij de groep waarop de hypothese betrekking heeft, maar bij subgroepen: patiënten die manifest of latent psychotisch scoren. Patiënten met een manifest psychotische PO verslechteren niet, maar ze verbeteren. Ze gaan zelfs meer vooruit dan patiënten zonder deze PO. De data van de patiënten met een latente psychotische PO laten zien dat deze groep er na behandeling beter aan toe is dan daarvoor.
De bevindingen zijn in strijd met de hypothese. Weliswaar vallen ze terug bij een follow-upmeting, maar de hypothese gaat niet over terugval. De hypothese die de onderzoekers beschrijven in hun artikel betreft niet alleen de latente psychotische PO-subgroep, maar gaat over de gehele psychotische PO-groep.
Hypothese 3: Patiënten met een low level borderline po die niet afhaken, profiteren van therapie.
De gegevens ondersteunen deze hypothese. De hypothese is weliswaar apart getoetst voor patiënten met een manifeste en een latente borderline-PO, maar uit beide analyses blijkt dat borderline-patiënten (manifest en latent) verbeteren. De mate van verbetering wijkt niet af van de verbetering in de groepen met een andere PO. Maar negen van de tien patiënten zijn behandeld voor een angststoornis en onderzoek heeft aangetoond dat CGT bij deze groep effectief is (Bandelow et al., 2018) en voor deze voorspelling is de DTP niet nodig.
Hypothese 4: Patiënten met een psychotische PO die in behandeling blijven, vertonen een toename in hostiliteit en insufficiëntie.
De data zijn niet wat wordt voorspeld. Net als bij hypothese 2, blijkt het omgekeerde het geval: hostiliteit en insufficiëntie nemen niet toe, maar af. De hypothese gaat wederom over de omvattende groep psychotische PO-patiënten en niet over subgroepen met een manifeste of latente psychotische PO. Desalniettemin worden die subgroepen onderscheiden en getoetst. Wat de gegevens zeggen over die subgroepen is, voor de hypothese, niet zo interessant omdat de hypothese niet over subgroepen gaat. Maar voor de volledigheid melden we deze bevindingen.
Allereerst zijn er niet veel psychotische PO-patiënten die in behandeling blijven: negen met een latente psychotische PO en achttien met een manifeste psychotische PO. De patiënten met een manifeste en latente psychotische PO vertonen geen toename maar een afname van hostiliteit en insufficiëntie. Wel is er sprake van een terugval bij de latent psychotische patiënten. Maar de hypothese gaat over toename van problemen direct na de behandeling en niet over terugval na verbetering. Bovendien gaat de hypothese niet over de subgroep van negen patiënten met een latent psychotische PO maar over de hele groep van 27 patiënten.
Conclusies studie 1:
Voor de houdbaarheid van hypothese 1 wordt geen bewijs gevonden. De data laten voor hypothese 2 en 4 precies het omgekeerde zien van wat wordt voorspeld. Hypothese 3 wordt ondersteund door de data: ook patiënten met een low level borderline PO profiteren van CGT. Maar aangezien dit bij negen van de tien mensen gaat om patiënten met een angststoornis is deze uitkomst niet echt verrassend; angstpatiënten profiteren immers van CGT (Bandelow et al., 2018). Toch concluderen Eurelings-Bontekoe et al. (2009, p.449): ‘Therefore, theory driven profile approach to the Dutch Short Form of the MMPI may be a useful tool for the assessment of patients, aimed at predicting treatment response.’
Terwijl de onderzoekers enkel bevestiging voor één van hun vier hypotheses vinden. Blijkbaar menen Eurelings-Bontekoe et al. (2009) dat de hypotheses gelden als ‘partially confirmed’ (p. 449) wanneer een, niet in de hypothese genoemde subgroep, iets van het voorspelde patroon laat zien. Dit is ten onrechte, het gaat erom wat de data zeggen over de groep waarover de hypothese gaat. In de algemene discussie komen we hierop terug. Als men de hypotheses zoals afgeleid serieus neemt, dan wordt er alleen steun gevonden voor hypothese 3. Maar voor de voorspelling dat angstpatiënten, low level borderline PO of niet, profiteren van CGT hebben we zoals gezegd de DTP niet nodig.
Studie 2: behandelrespons van de subtypes borderline PO
De tweede studie onderzoekt de validiteit van verschillende types borderline PO’s (Eurelings-Bontekoe et al., 2012). Anders dan in de eerste studie worden er nu geen zeven maar vijf borderline PO’s gedestilleerd. Aanvankelijk zijn er 2.062 patiënten geïncludeerd. Deze patiënten hadden een stemmingsstoornis (40%), aanpassingsstoornis (20%), angststoornis (17%), middelenmisbruik (10%) of andere as-I-stoornissen (13%). Er vinden gemiddeld zes gesprekken plaats. Meer dan de helft (55%) van de patiënten wordt behandeld met steunende gesprekken, 22% krijgt psychotherapie of gezinstherapie en 23% krijgt psychofarmacotherapie. De klachten zijn voorafgaand aan de behandeling en zes maanden later in beeld gebracht. Van de 2.062 hebben 315 patiënten zowel bij de voormeting als nameting de Brief Symptom Inventory ingevuld (BSI De Beurs & Zitman, 2006) en 164 patiënten hebben de Outcome Questionnaire (OQ; de Jong et al., 2007) ingevuld. We lopen de hypotheses na.
Hypothese 1: Patiënten met een psychotische borderline po hebben a) de minst gunstige behandelrespons en b) het laagste percentage klinisch significante verbetering vergeleken met de andere borderline po-profielen.
Er wordt steun gevonden voor hypothese 1a) maar niet voor hypothese 1b). Met betrekking tot hypothese 1a) wordt er een significante interactie gevonden tussen behandelrespons en de verschillende borderline PO’s: de psychotische borderline PO verbeteren het minst en de high level borderline PO verbeteren het meest, zowel op de BSI als de OQ. Hypothese 1b), die voorspelt dat een relatief laag percentage van de psychotische borderline PO-patiënten klinisch significant verbetert, wordt niet getoetst. Wel is er gevonden dat de high level borderline PO-groep het hoogste percentage klinisch significante verbetering laat zien. Maar hier gaat de hypothese niet over. De percentages van de verschillende subgroepen zijn niet vermeld. Maar gezien het beperkt aantal patiënten dat een klinisch significante verbetering toont op de nameting qua ernst van hun klachten (BSI, N=16; 5,1%) en qua algemeen welbevinden (OQ, N=13; 3,2%) is het de vraag of significantietoetsing een zinvolle exercitie is. In het artikel zijn geen gegevens te vinden die laten zien dat de psychotische borderline PO, qua klinisch significante verbetering, zich onderscheidt van de andere borderline PO-groepen.
Hypothese 2: Patiënt-therapeut overeenstemming met betrekking tot de behandeluitkomsten is lager bij externaliserende borderline po-types dan bij de internaliserende types borderline PO.
De hypothese gaat over twee omvattende groepen: internaliserende en externaliserende borderline PO-patiënten. Die hypothese zou getoetst moeten worden door deze twee groepen met elkaar te vergelijken. Men vergelijkt echter (weer) subgroepen. Er worden twee subtypes externaliserende borderline PO onderscheiden (low level en narcistisch) en twee groepen internaliserende borderline PO-patiënten (high level en onrijp). Het is verdedigbaar, en vanuit DTP-standpunt misschien zelfs informatief, om die subgroepen te vergelijken. Maar dat zou 2 (externaliserend = low level en narcistisch) x 2 (internaliserend = high level en onrijp) = 4 vergelijkingen impliceren. In plaats daarvan worden maar twee vergelijkingen gemaakt: de onrijpe internaliserende borderline PO wordt vergeleken met de low level en met de narcistische borderline PO. En dan wordt inderdaad een verschil gevonden.
Maar we missen hier twee vergelijkingen. De aard van de hypothese dicteert dat deze wordt getoetst door of de complete internaliserende groep te vergelijken met de complete externaliserende groep, of de genoemde 2 x 2 vergelijking te maken. Geen van die analyses is gerapporteerd. Gezien de gerapporteerde kwantitatieve gegevens is het onwaarschijnlijk dat de hypothese een statistische test zou hebben overleefd.
Conclusies studie 2:
Beide hypotheses zijn inadequaat getoetst. Een deel van de verwachtingen wordt onderworpen aan statistische tests en een ander deel niet. Het deel dat getoetst wordt, blijkt in overeenstemming te zijn met (een deel) van de hypothese. Dit roept de vraag op waarom dit voor het andere deel niet gebeurt, maar de auteurs geven hier geen uitleg over.
Daarnaast, als je een hypothese toetst bij een proefgroep, wil je dat je de (substantiële) meerderheid van de groep geïncludeerd hebt. Of tenminste niet een kleine minderheid. Hier is gerekend met een minieme minderheid van de oorspronkelijke steekproef. Van de 2.062 geïncludeerde patiënten wordt een aantal berekeningen gedaan met 14% van deze groep (BSI), een aantal met 9% (overeenstemming tussen patiënt en therapeut) en soms zelfs met maar 7% (OQ).
Hypothese 1 gaat over klinisch significante verbetering. Die treedt maar op bij 2% van de patiënten. Dit teleurstellende therapeutische resultaat verbaast niet gezien de minimale aard van de interventie. Wat is van gemiddeld van één behandelsessie per maand te verwachten, met een gemiddeld aantal van amper zes sessies die bij meer dan de helft van de patiënten bestaat uit steunende gesprekken? Deze teleurstellende uitkomsten zijn natuurlijk een klinisch probleem. Hier is evenwel belangrijker dat het geringe percentage klinisch significante verbetering ook een methodisch probleem is.
Studie 3: persoonlijkheidsorganisaties en treatment respons van persoonlijkheidsstoornissen
Deze derde studie (Scholte et al., 2014) gaat over de samenhang van de PO en behandelresultaten in een opgenomen patiëntengroep met persoonlijkheidsstoornissen. De auteurs onderzoeken of de DTP-classificatie samenhangt met therapie-uitkomst. De psychotische PO doet vanwege het geringe aantal patiënten (N=2) niet mee. In deze naturalistische studie nemen 115 opgenomen patiënten met een persoonlijkheidsstoornis deel. Na de behandeling – opname van minimaal zes maanden tot maximaal één jaar – en 36 maanden na het stoppen van de behandeling wordt het behandeleffect gemeten met de BSI. Wat zeggen de data over de DTP-hypotheses?
Hypothese 1: Niveaus van persoonlijkheidsorganisaties zijn geassocieerd met therapie-resultaat.
De data zijn in strijd met de hypothese. De zes groepen met verschillende persoonlijkheidsorganisaties (vijf borderline en één neurotische PO) laten na afloop van de behandeling grote effect sizes (d > 1.12) zien. Er wordt, anders dan de hypothese doet verwachten, geen verschil gevonden tussen de verschillende niveaus van PO’s en het therapieresultaat.
Hypothese 2: De groep patiënten met een neurotische PO laat, zowel bij de nameting als bij de follow-up meting, een beter therapieresultaat zien dan de groep patiënten met een borderline PO.
De bevindingen zijn het omgekeerde van de hypothese. De neurotische PO-groep toont geen beter therapie effect dan de andere PO’s. Het grootste behandeleffect wordt juist gevonden voor de psychotische borderline PO (d=2.02) en voor de high level borderline PO (d=1.60). De neurotische PO-groep laat samen met de narcistische borderline PO juist lagere effect sizes zien (d=1.15 van de neurotische PO en d=1.12 van de narcistische borderline PO).
Conclusie studie 3:
Anders dan bij de eerste twee studies zijn er geen statistisch/methodische problemen zoals het introduceren van subgroepen van patiënten (studie 1) en het weglaten van analyses (studie 2). Scholte et al. (2014) concluderen, ons inziens terecht, dat er geen verschil is in therapieresultaat voor de groepen met verschillende PO’s en dat ook de psychotische PO-groep goed profiteert van behandeling. Het ontbreken van predictief vermogen van de DTP-classificatie is een belangrijke replicatie van de bevindingen uit studie 1.
De klinische implicaties lijken ons duidelijk: de DTP-classificatie moet men niet gebruiken om therapieresultaten te voorspellen omdat het model geen predictieve validiteit blijkt te hebben. Scholte et al. (2014, p.173) schetsen echter andere klinische implicaties, zoals bijvoorbeeld: ‘a strong tendency to internalize might be associated with poor long-term treatment outcome; therefore, it might be important to focus on patients’ tendency to internalize during treatment.’
Studie 4: Een psychotische PO voorspelt een hoog risico op psychose
De meest recente studie (Van der Gaag et al., 2018) gaat alleen indirect over het predictief vermogen. Het DTP-model veronderstelt dat mensen met een psychotische PO niet goed in staat zijn om angst te tolereren, een matige controle over zichzelf hebben en onder stress snel de greep op de werkelijkheid verliezen. Clinici zouden terughoudend moeten zijn met psychotherapeutische behandeling bij patiënten met een latent psychotische PO. Bij hen zou een klachtgerichte behandeling gecontra-indiceerd zijn (Eurelings-Bontekoe & Snellen, 2017; p.17 en p. 119).
Het DTP-model veronderstelt dat mensen met een psychotische PO niet goed in staat zijn om angst te tolereren en onder stress snel de greep op de werkelijkheid verliezen
Als de DTP hier klinisch-praktisch bruikbaar is dan zou de groep met een psychotische PO daadwerkelijk een verhoogd risico op psychotische decompensatie moeten hebben. Nagegaan wordt of het wel/niet voldoen aan de criteria voor een psychotische PO samenhangt met een ultrahoog risico voor een psychotische stoornis. Dat laatste wordt bepaald met de Comprehensive Assessment of At Risk Mental States (Yung et al., 2005) – een methode die, op goede empirische gronden, geldt als de gouden standaard bij het vaststellen van het risico op psychotische decompensatie. Er worden 73 patiënten met een ultrahoog risico en 119 niet-psychotisch kwetsbare patiënten geïncludeerd; allen aangemeld bij een ggz-instelling waar het onderzoek plaatsvindt.
Hypothese: patiënten met een psychotische PO komen vaker voor in de ultrahoog-risicogroep dan in de groep van psychiatrische patiënten zonder dit risico.
Er zijn geen aanwijzingen dat de hypothese klopt. Er is dus geen enkel verband tussen het hebben van een DTP-classificatie als psychotische PO en het risico op psychotische ontwikkeling zoals vastgesteld met de gouden standaard.
Conclusie studie 4:
Volgens het DTP-gedachtegoed is de identificatie van een psychotische PO belangrijk bij de therapie-indicatie. Patiënten met dit PO zouden namelijk een slechte therapie-prognose hebben, vanwege een verhoogd risico op psychotische ontwikkelingen. Cruciaal daarbij is de veronderstelling dat de DTP een verhoogd psychose-risico vast kan stellen. Dit blijkt niet het geval te zijn. In heldere bewoordingen komen de auteurs tot dezelfde conclusie.
Samenvattende conclusie
De claim dat de DTP succes en mislukking van behandeling kan voorspellen is onderzocht door één van de grondleggers van de DTP. Zij doet dat samen met een reeks coauteurs en toetst hypotheses die afgeleid zijn uit de theorie. De studies, hypotheses en bevindingen zijn op een rij gezet in tabel 2.
Tien hypotheses zijn getoetst. In acht van de tien gevallen wordt geen steun gevonden en in drie van die acht gevallen zijn de bevindingen het omgekeerde van wat wordt verwacht. Bij twee van de tien tests zijn de data in overeenstemming met de hypothese. Maar in het eerste geval (studie 1; hypothese 3) luidt de hypothese dat angst-patiënten verbeteren na CGT en dat dit ook geldt voor patiënten met een low level borderline PO. Die hypothese is triviaal: de DTP voegt niets toe aan de literatuur over CGT-effecten.
De tweede hypothese die steun vindt in de data (studie 2, hypothese 1a) is niet triviaal. Dat kan natuurlijk betekenen dat de DTP hier gelijk heeft. Maar er is een meer voor de hand liggende andere verklaring. Er zijn negen niet-triviale hypotheses. Op basis van puur toeval is de kans groter dan één derde dat je bij negen onafhankelijke tests tenminste één significant effect vindt (1–(1-0.05)^9=1–0.95^9=1–0.63=37%). Natuurlijk weten wij niet of de bevinding van studie 2 (hypothese 1a) een toevalstreffer is of een echt fenomeen. Maar voordat we de bevinding serieus nemen dat patiënten met een psychotische PO slechte therapie-effecten scoren (studie 2) en er klinisch beleid op baseren, is er wel een replicatiestudie nodig.
Wij mensen dat een aantal zaken goed en andere zaken fout zijn gegaan bij de pogingen de DTP empirisch te valideren. Laten we beginnen met wat er goed ging. Om de predictieclaims van de DTP te onderzoeken moeten ze gespecificeerd worden: in hypotheses. Dit doen de onderzoekers goed. Ook de gevolgde empirische en statistische methodes zijn eenduidig en na te rekenen. Verder stellen de gepresenteerde en geanalyseerde gegevens de lezer in staat genuanceerd te antwoorden op de vraag wat de data zeggen over de hypotheses, en daarmee, over de achterliggende theorie. Tot slot vereiste het moed om populaire diagnostische procedures bloot te stellen aan empirische kritiek.
Er gaan ook een aantal zaken niet goed. Een hypothese over een groep met kenmerk X moet getoetst worden bij een groep met kenmerk X en niet alleen bij een post hoc subgroep met kenmerk X. Maar dit pos hoc sub-groeperen is schering en inslag, en dat is een methodisch probleem. De reden dat dit problematisch is, is dat er altijd wel een subgroep met kenmerk X te vinden is waarbij de hypothese stand houdt: alleen bij vrouwen? Bij mensen met een hoog IQ? Schoenmaat 45? Maar liefst vijf van de tien hypotheses zijn getoetst bij ad hoc gespecificeerde subgroepen. Dat staat de onderzoekers natuurlijk vrij om te doen, maar er moet dan wel eerst expliciet gemeld worden dat de hypothese niet wordt bevestigd bij de omvattende groep met kenmerk X. Daarna kan worden getoetst of de hypothese misschien wel lijkt te gelden voor één of andere subgroep. Maar dat is dan post hoc en exploratief, en het is geen bonafide toets van de hypothese. Opvallend is dat er in studie 1 (Eurelings-Bontekoe et al., 2009) een onderscheid wordt gemaakt tussen latente en manifeste low level borderline PO. Die indeling lijkt uit de lucht te komen vallen. En als dat niet het geval is, en het onderscheid latent versus manifest borderline PO cruciaal is, dan is het onduidelijk waarom deze onderverdeling niet gebruikt wordt in de twee hierop volgende artikelen. Een tweede methodisch probleem treedt op bij studie 2; slechts delen van de hypothese worden getoetst. Dat dit problematisch is, spreekt voor zich.
Een pittig probleem is dat de DTP immuun lijkt voor tegenstrijdige bevindingen. De bevindingen laten bij drie van de tien hypotheses (tabel 2) het spiegelbeeld zien van wat is voorspeld. Dat raakt de theorie in het hart. Je verwacht dat naar aanleiding van deze bevindingen de auteurs de theorie opgeven of ingrijpend aanpassen. Dit is niet het geval. De auteurs houden de theorie immuun voor deze tegenstrijdige bevindingen. De on-ontvankelijkheid voor disconfirmatie klinkt door in de klinische aanbevelingen waarmee drie van de vier artikelen worden afgesloten. Zo concluderen Eurelings-Bontekoe et al. (2012, p. 389): ‘A growing body of literature shows that assessment of underlying structural personality features and personality dimensions that are not based on the DSM-IV classification system might be more useful in the process of designing and applying therapeutic interventions.’
Alleen Van der Gaag et al. (2018) formuleren implicaties die logischerwijs volgen uit de bevindingen. Die immuniteit voor disconfirmatie is niet één of ander academische discussie. Op basis van de DTP worden belangrijke beslissingen genomen over bijvoorbeeld opname of ontslag, over wel of niet (verder) behandelen, of over welke behandeling geïndiceerd is. Negeren van disconfirmerende evidentie bij het nemen van klinische besluiten heeft onfortuinlijke gevolgen voor de patiënten over wie die besluiten gaan. En, nog los van klinische besluiten, de uitslag van psychodiagnostisch onderzoek moet met patiënten besproken worden en ze kunnen hun dossier inzien. De vraag is wat het voor patiënten met een laag zelfbeeld (eerder regel dan uitzondering in de ggz) betekent als men van een psycholoog te horen krijgt dat een psychotische borderline PO is vastgesteld.
‘Toepassing Onderzoek’ is een riskante volgorde, die maar beter andersom doorlopen kan worden
De DTP werd, zoals gezegd, op grote schaal klinisch toegepast en gepropageerd voordat enig onderzoek werd verricht. ‘Toepassing Onderzoek’ is een riskante volgorde, die maar beter andersom doorlopen kan worden. Het had natuurlijk gunstig kunnen uitpakken voor de DTP, dat achteraf-onderzoek. Maar dit is niet het geval. De gegevens leveren gerepliceerd en overtuigend bewijs dat de DTP de pretenties niet waarmaakt. De DTP voorspelt geen therapieeffecten. Een keizer was het, de DTP, maar zonder kleren.