Inleiding
Het DSM-denken in de ggz is aan vernieuwing toe. Het standaardmodel om psychopathologie te beschrijven voldoet niet meer, het denken in onderscheidbare symptoomclusters waaraan latente stoornissen ten grondslag zouden liggen houdt geen stand (Borsboom, 2011)4. Door het probleemgedrag van een persoon in kaart te brengen, kunnen individuele clusters van symptomen gevonden worden die niet altijd hoeven samen te vallen met bestaande DSM-classificaties. En onder de gedragskenmerken van een bepaalde dsm-classificatie kunnen verschillende onderliggende neuropsychologische problemen schuilgaan (Lawson et al., 2015)12. De hoogste tijd om in de klinische praktijk minder uit te gaan van het klassieke denken in stoornissen die met standaardprotocollen kunnen worden aangepakt en meer rekening te gaan houden met individuele karakteristieken. Als kinderen met overeenkomstige gedragskenmerken, zoals deze bijvoorbeeld onder de DSM-classificatie ADHD beschreven worden, blijken te verschillen op onderliggende cognitieve vaardigheden, dan heeft dit consequenties voor de behandeling. Het uitvoeren van een standaard behandelprotocol, zonder rekening te houden met die onderliggende verschillen, is dan niet verstandig (Ponsioen & Ten Brink, 2014)18.
Geïndividualiseerde behandelingen vragen echter om ook effectmetingen van een ander kaliber dan binnen randomized control trials (RCT’s) gebruikt worden. Bij een RCT-studie wordt een klinische groep die een bepaalde behandeling krijgt (de experimentele groep) vergeleken met een vergelijkbare groep die geen behandeling of een placebo-behandeling krijgt (de controlegroep) . De deelnemers worden door het lot toegewezen aan één van de twee groepen (gerandomiseerde toewijzing). Door de groepsgemiddelden te vergelijken op één of meerder uitkomstmaten wordt de effectiviteit van de behandeling getoetst. Als de deelnemers aan RCT-studies alleen op basis van de dsm-classificatie adhd worden geselecteerd, dan kunnen deze op basis van de onderliggende cognitieve vaardigheidsprofielen van elkaar verschillen. Het is dan maar zeer de vraag in hoeverre er dan sprake is van vergelijkbare groepen.
In dit artikel wordt verslag gedaan van een Single Case Experimental Design (SCED)-onderzoek waarin met herhaalde metingen data worden verkregen om statistische analyses uit te kunnen voeren op het niveau van een individuele cliënt. Versluis, Maric en Peute (2014) hielden een pleidooi voor dit type onderzoek (ook wel N=1 onderzoek genoemd) als belangrijk alternatief voor RCT’s. Het doel van onderhavig artikel is de bruikbaarheid van dit type onderzoek voor de klinische praktijk te illustreren. Omdat bij SCED-studies de statistische technieken niet bij een ieder bekend mag worden verondersteld, zal hier een tipje van de sluier worden opgelicht. Voor wie deze analyses wil toepassen, raden we als handleiding in het gebruik van deze technieken het artikel van Maric et al. (2013) en het handboek van Bolger en Lauenceau (2013) aan. De SPSS-syntax van de in dit artikel gebruikte analyses zijn bij de auteurs op te vragen.
Single Case Experimental Design (SCED)
Met de SCED-studie worden bij een individuele persoon herhaalde metingen verricht. Door de metingen in de verschillende fasen van behandeling (voormeting, behandeling, nameting en follow-up) te verzamelen, kunnen de verschillen in de meetresultaten tussen deze fasen vergeleken worden. Ook kan eventueel inzicht worden verkregen in de veranderingsmechanismen door de gebeurtenissen te monitoren die van invloed kunnen zijn op de metingen. Dit kan door de interventies systematisch te beschrijven en vooral de gedane aanpassingen gedurende het onderzoekstraject bij te houden. Ook kan achteraf, bij plotseling optredende veranderingen in de metingen, worden gezocht naar mogelijke verklaringen. Om statistische uitspraken te kunnen doen, is het design van de N=1 studie bepalend; dat wil zeggen het aantal en typen fasen en aantal metingen, niet de groepsgrootte.
Zo’n dertig jaar geleden werd N=1 onderzoek al uitgevoerd in de klinische praktijk (Molenaar, 1987)15. Om verschillende redenen is deze methodiek evenwel geen common practice geworden, mogelijk als gevolg van de relatief onbekende statistische analysetechnieken binnen de sociale wetenschappen. Door het complexe samenspel van allerlei factoren die op het te meten gedrag op verschillende momenten van invloed zijn, is het verloop van dat gedrag over de tijd heen veelzeggender dan de scores op enkele tijdsmomenten.
In figuur 1 is uitgebeeld hoe enkele metingen (in dit geval alleen een voor- en nameting) tot een geheel andere conclusie kan leiden dan dagelijkse herhaalde metingen. Op de y-as is het klachtgedrag aangegeven – van 0 (geen sprake van het klachtgedrag) tot 8 (in ernstige mate sprake van het klachtgedrag). Op de x-as staat de tijd (dag 1 tot en met dag 81). Op basis van alleen de voor- en nameting zou men concluderen dat er sprake is van een toename van het klachtgedrag; op basis van de metingen met de dagelijkse vragenlijst zou er daarentegen sprake zijn van een afname van het klachtgedrag!
Computertrainingen en ADHD
Traditionele behandelvormen voor kinderen met ADHD-problemen waren vaak primair gericht op gedragskenmerken en op bewuste denkprocessen. Stop-Denk-Doe-programma’s maakten kinderen bewuster van hun gedrag en door het aanwenden van zelfinstructies zouden zij meer controle over hun gedrag krijgen (denk aan de Beertjes-methode van Meichenbaum – zie Timmerman, 2003)20.
Een groot probleem bij dit soort interventies is de geringe transfer van het geleerde in de behandelkamer naar het gedrag daarbuiten; het aanleren van vaardigheden vergt doorgaans meer trainingsarbeid dan in een behandelsetting wordt geboden. Langdurig, intensief en herhaling zijn de kernbegrippen om vaardigheden zo in te laten slijpen dat er sprake is van automatisering. En deze kernbegrippen staan nu eenmaal niet hoog op het prioriteitenlijstje van kinderen, laat staan van kinderen met ADHD-problematiek. Vooral ook omdat bij deze laatste groep kinderen de onderliggende problematiek niet alleen te maken heeft met de belangrijkste domeinen van de zogenaamde ‘koude’ Executieve Functies (EF), te weten inhibitie, flexibiliteit en werkgeheugen, maar tevens met motivationele problemen, die ook wel tot de ’warme’ EF gerekend worden (Barkley, 2012)1. Het is daarom noodzakelijk de training aan te bieden in een omgeving die voor kinderen voldoende aanlokkelijk is om hun aandacht bij de training te houden en ook langdurig de vaak als saai ervaren trainingsopdrachten uit te voeren. Computergames lijken aan deze voorwaarden te voldoen, kinderen met ernstige aandachtsproblemen lukt het vaak moeiteloos om uren achtereen een game te spelen.
Zo onderzochten Klingberg et al. (2005)11 de effectiviteit van een werkgeheugentraining met game-elementen in een gecontroleerde klinische trial, de Cogmed-training. De visueel-ruimtelijke werkgeheugenprestatie van de kinderen in de adaptieve werkgeheugentraining verbeterde significant op de nameting. Het effect van de training generaliseerde naar ADHD-symptomen (zoals gerapporteerd door ouders): de concentratie verbeterde en de hyperactiviteit en impulsiviteit namen significant af. Deze effecten bleven stabiel bij een drie maanden-follow-up.
Niet alle onderzoeken laten echter eenzelfde brede generalisatie van trainingseffecten zien. Sommige studies vinden een aanzienlijke transfer (bijv. Holmes et al., 2009)8, andere vinden weinig of helemaal geen generalisatie van het trainingseffect (bijv. Owen et al., 2010). Trainingsprogramma’s waarvan de effecten generaliseren naar niet-getrainde executieve functies of naar ecologisch valide maten – bijvoorbeeld prestaties op schooltaken of specifieke zelfregulatiegedragingen in de thuissituatie – zijn klinisch relevant, maar zeldzamer (Klingberg 2010; Shipstead et al., 2012; Melby- Lervåg & Hulme, 2012)101419.
De negatieve resultaten voor wat betreft generalisatie en stabiliteit van trainingseffecten lijken niet hoopgevend, maar het gaat bij de studies in de regel om RCT-studies waarbij door het ontbreken van significante effecten op groepsniveau de vaak sterke interindividuele variabiliteit aan effecten uit het zicht wordt gehouden. Een beperking aan veel experimentele studies is dat de training veelal artificieel wordt ingezet. Vanuit een klinisch setting worden trainingen in de regel juist ingebed in een breder behandelaanbod waarvan psychoeducatie en ouderbegeleiding deel uitmaken. Een voorbeeld van een breder ingezette computertraining voor EF is Braingame Brian.
Braingame Brian
Braingame Brian is een adaptieve training van EF binnen een spelwereld met game-elementen die zoveel mogelijk aansluit bij de belevingswereld van kinderen tussen de acht en twaalf jaar. De training is opgedeeld in 25 sessies die elk 30 tot 45 minuten in beslag nemen. Per sessie worden drie trainingstaken, gericht op de drie kern EF’s (inhibitie, werkgeheugen en flexibiliteit ) steeds tweemaal aangeboden. De gemiddelde trainingstijd per taak ligt rond de vijf minuten. Het kind kan voor, tussen en na het uitvoeren van de trainingstaken in de spelwereld rondlopen, opdrachtjes uitvoeren en naar eigen behoeften één of twee ‘mini-games’ doen die samenhangen met elementen uit de trainingstaken. De rest van de tijd wordt besteed aan het rondlopen in de spelwereld en het uitvoeren van de daarin aangeboden opdrachten (zie Ten Brink et al. (2011) voor een uitvoerige beschrijving van Braingame Brian)5.
Onderzoeksvragen
De effecten van Braingame Brian op de executieve functies zijn al eerder onderzocht en beschreven, maar met de traditionele RCT-aanpak (Dovis, 2014; De Vries, 2015)722. Dit artikel doet verslag van een methode om effectonderzoek te verrichten op individuele behandelingen. Het onderzoek richt zich met name op de transfereffecten van de behandelmethode: is er sprake van een verandering in het gedrag van het kind zoals geobserveerd door de ouder(s) en de leerkracht? Op de volgende drie onderzoeksvragen wordt getracht een antwoord te vinden:
1) Is er sprake van een verbetering van de prestatie op de EF-taken in Braingame Brian?
2) Is er sprake van een verbetering van het klachtgedrag en zo ja, is deze verbetering toe te schrijven aan de Braingame Brian training?
3) Worden er effecten gevonden op de EF-domeinen en de ADHD-kenmerken zoals gemeten met gedragsobservatielijsten thuis en op school?
Materiaal & Methode
Behandeling
De behandeling is uitgevoerd met het Braingame Brian-computerprogramma. Gedurende vijfentwintig trainingssessies van een half uur tot drie kwartier lopen de kinderen met het spelpersonage door een interactieve wereld die zich, naarmate de training vordert, uitbreidt en constant verandert. Elke trainingsessie bestaat uit het uitvoeren van drie verschillende taken die de executieve functies van het kind versterken, naast het exploreren van de spelwereld.
De volgende drie taken worden aangeboden gedurende een spelsessie in Braingame Brian:
Werkgeheugentaak: In deze taak moet de speler de volgorde onthouden waarin vierkantjes oplichten in een grid van 4×4 vierkantjes en deze vervolgens natikken. De taak verandert steeds na tien trainingssessies waarbij de werkgeheugenbelasting bij elke variant wordt opgevoerd. Bij variant 1 moeten de oplichtende vierkantjes in dezelfde volgorde worden nagetikt, bij variant 2 moet het natikken in de omgekeerde volgorde gebeuren. Bij variant 3 zijn de vierkantjes afwisselend oranje en blauw. Bij het natikken (in de aangegeven volgorde) moeten eerst de oranje vierkantjes en daarna de blauwe vierkantjes worden nagetikt. Bij variant 4 lichten achtereenvolgens twee van de vier randen om het grid heen op, gevolgd door een reeks van vierkantjes; de volgorde waarin de randen aan het begin oplichten moeten aan het eind van de nagetikte reeks worden onthouden. Variant 5 is een combinatie van de derde en vierde variant. Bij elke variant bestaat de moeilijkheidsgraad uit de gemiddelde lengte van de aangeboden reeksen vierkantjes (van drie tot maximaal zeven).
Stoptaak: De speler moet binnen een bepaald tijdsbestek reageren als een signaal wordt afgegeven, maar niet reageren als dit signaal onverwachts door een stopsignaal wordt gevolgd.
Switchtaak: De speler moet dozen sorteren op ‘vorm’ of op ‘kleur’. Deze sorteerregel verandert voortdurend op een onvoorspelbaar moment.
De drie taken hebben een functie in de spelwereld. Door deze te doen worden uitvindingen gerealiseerd die de personages in de spelwereld ten dienste staan (bijvoorbeeld een geautomatiseerde postsorteerder voor de postbode). Gedurende de looptijd van het programma wordt de moeilijkheid aangepast naar de prestaties van het kind, waardoor de speler constant uitgedaagd wordt. De laagste waarde van de stop- en schakeltaak is 1, de hoogste waarde 14. Van de vijf varianten van de werkgeheugentaak loopt de gemiddelde lengte van de aangeboden reeksen vierkantjes op indien het kind goed presteert.
Onderzoeksfasen en meetinstrumenten
Voor de dagelijkse metingen wordt een korte gedragsvragenlijst gebruikt, de Daily Report Scale (DRS). De DRS is een visueel-analoge schaal, bestaande uit een rechte lijn die loopt van ‘:(= in ernstige mate sprake van het betreffende klachtgedrag’ (een score 0) tot ‘:) = geen sprake van het betreffende klachtgedrag’ (een score 200).
Voor dit onderzoek werd een digitale versie van de DRS gebruikt die ouders op een computer of smartphone konden invullen. Door elke dag met een slider de stand van het betreffende klachtgedrag aan te geven en vervolgens op de knop ‘verzenden’ te klikken konden de metingen met de DRS worden verricht en verzameld (de digitale vragenlijst is bij de auteurs op te vragen).Om een indicatie te krijgen van de EF-problemen in het dagelijks leven zijn twee observatielijsten gebruikt. De BRIEF-vragenlijst voor vijf tot achttienjarigen (Huizinga & Smidts, 2012)9 en de Vragenlijst voor Gedragsproblemen bij Kinderen 6-16 jaar (VvGK; Oosterlaan et al., 2000)17.
Het onderzoekstraject bestaat uit vijf opeenvolgende fasen:
1. Intake
a. Uitleg over de training
b. Praktische afspraken
c. Voormetingen met BRIEF en VvGK
2. Voormeting: één à twee weken
a. dagelijkse metingen met DRS
3. Training: 6 weken
a. gemiddeld 4x per week trainingssessie
b. dagelijkse metingen met DRS
4. Nameting (direct na de training): één à twee weken
a. dagelijkse metingen met DRS
b. nametingen met BRIEF en VvGK
5. Follow-up (tien tot twaalf weken na beëindiging van de training): één à twee weken; weken na beëindiging van de training
a. dagelijkse metingen met DRS
b. follow-up metingen met BRIEF en VvGK
6. Eindgesprek
Statistische procedures
Voor elke uitkomstmaat zijn de statistische analyses afgestemd op de gebruikte meetinstrumenten en meetmomenten:
– visuele inspectie voor de prestaties op de trainingstaken van Braingame Brian;
– statistische analyse met Mixed Models van de dagelijkse metingen van het klachtgedrag;
– klinische analyse van de uitkomsten op de vragenlijsten met behulp van de Reliable Change Index (RCI)
Taakprestaties
De prestaties op de Stoptraining en de Schakeltraining binnen de Braingame zijn beoordeeld met de procedure ‘Curve estimation’ van SPSS 22.0. waarbij steeds een lineaire en een logaritmische trend getoetst werd. De lineaire toets om te zien in hoeverre er sprake was van een significante prestatieverbetering, een logaritmische toets om te checken in hoeverre het plafond van een prestatieverbetering bereikt werd. Omdat er bij de Werkgeheugentraining na tien trainingssessies een nieuwe variant wordt aangeboden, worden deze trainingsresultaten alleen visueel beoordeeld. Er zijn hierbij immers slechts tien metingen per fase.
Met de methode Curve estimation wordt getoetst of de gevonden scores op de trainingstaken (verticale y-as) gedurende de training gerelateerd zijn aan de tijd (horizontale x-as). Indien de prestatie op een trainingstaak elke trainingssessie constant toeneemt van het begin tot het einde van de training, dan is er sprake van een lineaire trend. In dit geval is een rechte lijn door de datapunten de best passende curve. Is er sprake van een afvlakking van de prestatie aan het eind van de training, dan is een kromme lijn (i.c. logaritmische functie) een beter passende curve.
In figuur 2 worden twee datasetjes met scores afgebeeld waarbij de betreffende regressievergelijkingen (respectievelijk een lineaire en een logaritmische functie) de scores op variabele y vrij nauwkeurig door de variabele x voorspeld of verklaard worden. De datapunten liggen vlak bij de beide curves. De afstand van een datapunt tot de curve is dat deel van de scores op de variabele y dat niet door de variabele x verklaard wordt, de term e (‘error’) in de bijbehorende algebraïsche vergelijkingen (resp. y = 0,1*x + e en y = 3*log[x] + e). Hoe kleiner de e is, hoe beter de scores op variabele y door x voorspeld kunnen worden. De coëfficiënt voor de term x in de vergelijking wordt de regressiecoëfficiënt genoemd en geeft de hellingshoek van de regressielijn aan. Een tweede parameter om een regressielijn te definiëren is de intercept, dit is de waarde van de variabele y als x nul is. In het voorbeeld (figuur 2) zijn de intercepten in beide gevallen 0. Het gaat hierbij louter om een beschrijving van de gevonden trainingsresultaten. De gevonden curves kunnen gebruikt worden om te beoordelen of een trainingstaak te moeilijk (een nauwelijks stijgende curve) dan wel te gemakkelijk is (een snel stijgende lineaire trend). Of is er sprake van een curve die meer overeenkomt met een standaard leerproces (logaritmische trend),mits de afvlakking van de curve niet te maken heeft met het bereiken van het plafond van de trainingstaak.
Daily Report Scale (DRS)
Een veel gebruikt model in SCED is het AB-design, waarbij er sprake is van een baseline en een behandelfase (Maric et al., 2014; Barlow et al., 2009)213. Dit wordt ook wel opgevat als een onderbroken tijdserie bestaande uit twee lineaire functies, een voor de baseline-fase en een voor de behandelfase.
Om de verandering van het klachtgedrag over de tijd heen te toetsen wordt de score op de DRS uitgedrukt als een lineaire functie van de tijd. Zoals in de vorige paragraaf al is aangegeven is een lineaire functies slechts één van de mogelijke kandidaten om de relatie tussen twee variabelen te omschrijven. Als de tijd de verklarende variabele is, wordt in het algemeen een lineaire functie gebruikt om de verandering over de tijd te modelleren (ook wel het lineaire groeimodel genoemd; Bolger & Laurenceau, 2013)3. Nu is er voor elke fase een regressielijn te bepalen met een intercept (b0), een regressiecoëfficiënt (b1) en een error-term (e).
Om onderlinge verschillen tussen de regressielijnen in de opeenvolgde fase te kunnen toetsen is er een aantal kunstgrepen nodig. In figuur 3 wordt voor twee opeenvolgende fasen (de voormeting- en behandelfase) afgebeeld welke veranderingen relevant zijn om te toetsen. Met het gebruik van de datamatrix (tabel 1) kunnen de veranderingen in intercepten en regressiecoëfficiënten in één vergelijking worden opgenomen en getoetst.
y(i) = b0 + b1*fase(i) + b2* tijd_in_fase(i) + b3 * fase(i)* tijd_in_fase(i) + e(i)
In deze vergelijking staat y(i) voor de score van de afhankelijke variabele (i.c. de DRS-score voor een bepaald klachtgedrag) op tijdsstip i. Fase(i) staat voor de fase waarin dit tijdsstip valt (met de code ‘0’ voor de voormetingsfase en ‘1’ voor de fase die met de voormetingsfase wordt vergeleken; in dit voorbeeld is dit alleen de behandelfase). De term ‘tijd_in_fase’ staat voor het verloop van de tijd binnen elke fase. De parameter y(i) =b0 is de intercept van de regressielijn in de voormetingsfase, y(i) =b1 het verschil in intercepten tussen de trainings- en voormetingsfase. De intercepten verwijzen naar de score op de DRS als de ‘tijd_in_fase’ nul is. In navolging van Maric et al. (2014) worden in deze studie steeds de scores aan het eind van elke fase met die aan het eind van de voormetingsfase getoetst omdat dit in klinisch opzicht relevanter is (hoe staat het met het klachtgedrag aan het eind van de behandel-/nametings- en follow-up fase?) dan steeds de start van een fase als uitgangspunt te nemen. Om deze reden is de tijd_in_fase een omgekeerde tijdsvariabele (zie tabel 1).
De laatste ‘error’-term e(i) staat voor de errorscore op tijdsstip i. Omdat er bij tijdserie-metingen in de regel geen sprake is van onafhankelijke metingen (de opeenvolgende metingen zijn gecorreleerd) moet er voor deze zogenaamde autocorrelaties rekening worden gehouden en in het gebruikte model worden opgenomen. Wordt dit niet gedaan dan vergroot dit de kans op het vinden van significante resultaten (Brossart et al., 2006)6. Een deel van de e(i)-term kan in een tijdserie worden beschouwd als een functie van e(i-1), de errorscore van het vorige tijdsmoment en een werkelijke onverklaarde errorscore. Met de regressiecoëfficiënt rho (ρ) wordt de sterkte van de relatie tussen de opeenvolgende tijdsmomenten aangeduid.
De statistische analyses op de scores van de DRS werden uitgevoerd met SPSS 22.0 Mixed models, waarbij voor de autocorrelatie wordt gecorrigeerd met de AutoRegressie (AR)parameter rho. Indien er sprake is van autocorrelatie zal deze in de regel het sterkst zijn tussen opeenvolgende tijdsmomenten en zwakker naarmate de tijdsmomenten verder uit elkaar liggen. Opnemen van AR(1) in het te toetsen model wordt bedoeld dat alleen de correlatie tussen opeenvolgende tijdsmomenten wordt getoetst. Als er geen sprake is van een significante autocorrelatie, is er geen noodzaak om de tijdsmomenten die verder uit elkaar liggen te toetsen.
Om bij meerdere fasen de regressielijnen steeds te vergelijken met die van de voormetingsfase is een uitbreiding van de regressievergelijking nodig. De uitwerkingen kunnen bij de auteurs worden opgevraagd.
BRIEF en VvGK
De verschillen tussen de opeenvolgende metingen met de brief en VvGK werden geanalyseerd met behulp van de Reliable Change Index (RCI). De RCI wordt berekend op basis van de standaardmeetfout Se van de beide vragenlijsten en wordt verondersteld statistische normaal verdeeld te zijn met een gemiddelde 0 en een standaarddeviatie 1.Omdat er een afname van de scores op de beide vragenlijsten wordt verwacht na de training, wordt uitgegaan van een éénzijdige toetsing waardoor RCI’scores groter of gelijk aan 1.645 als significant op 5% -niveau kan worden beschouwd.
Cliënt
De behandeling is uitgevoerd bij een negenjarige jongen ( P.) met een laag-gemiddelde intelligentie met executieve functieproblemen. P. volgt het reguliere basisonderwijs, groep 6. De ouders hebben toestemming gegeven de trainingsresultaten die in een centrale database zijn verzameld en de resultaten op de dagelijkse klachtenvragenlijst en op de BRIEF en VvGK voor nadere analyse te gebruiken en deze in een publicatie op te nemen.
Het profiel van de ouderversie van de brief verschilt op een aantal plekken met die van de leerkrachtversie. De ouders signaleren vooral problemen op de EF-domeinen initiatief nemen, plannen & organiseren en ordelijkheid & netheid. De leerkracht ziet eveneens EF-problemen met ordelijkheid & netheid, maar ook op het gebied van inhibitie en werkgeheugen. Deze verschillen komen ook tot uiting tussen de ouder- en leerkrachtversie van de VvGK, waarbij de leerkracht met name de ADHD-kenmerken signaleert. Wat betreft de inhoud van het klachtgedrag zoals gemeten met de digitale Daily Report Scale werden voor P. de volgende gedragingen met P. en zijn ouders afgesproken:
1. kan nee accepteren zonder (lang) na te zeuren;
2. eet met bestek, niet met vingers.
De scores met betrekking tot deze twee gedragingen worden afzonderlijk geanalyseerd.
Resultaten
Trainingsresultaten
Op de drie trainingstaken is er sprake van een opgaande moeilijkheidsgraad duidend op een positieve leercurve, uitgezonderd op de vierde variant van de werkgeheugentaak (zie figuur 4).
Bij de Stoptaak is er sprake van een afvlakkende trend waarbij uiteindelijk een prestatieniveau van 9 wordt bereikt (14 is het maximum), de logaritmische trend (R2=.76; F[1,48]=149,904; p< .000) is hierbij wat sterker dan de lineaire trend (R2=.53; F[1,48]=54.500; p<.000). De term R2 staat voor de ‘coefficient of determination’ en is indicatief voor de mate waarin de scores door de betreffende curve worden beschreven.
Bij de Switchtaak is er geen sprake van een afvlakking van de curve, het hoogst haalbare niveau lijkt bij deze taak nog niet bereikt. De lineaire trend (R2=.84; F[1,49]=260,975; p<.000) is daarom nu sterker dan de logaritmische trend (R2=.64; F[1,49]=88,379; p<.000).
Op vier van de vijf varianten van de Werkgeheugentaak is de stijging van het prestatieniveau redelijk te noemen: de hellingshoeken variëren van .152 tot .203 (p<.001).
Daily report Scale (DRS)
Gedrag1: kan nee accepteren zonder (lang) na te zeuren
Figuur 5 beeldt de resultaten op gedrag1 uit voor de vier onderzoeksfasen. Er is sprake van een stijgende lijn, wijzend op een afname van dit klachtgedrag en daarmee een toename van het gewenste gedrag. Hoewel de scores op gedrag1 aan het eind van de trainingsfase, de nametingsfase en de follow-up fase significant hoger zijn dan die aan het eind van de voormetingsfase (p<.001), duidt de stijgende regressielijn in de voormetingsfase op een afname van het klachtgedrag voordat de training begon. Omdat de scores steeds van het einde naar het begin van een fase geanalyseerd worden, in omgekeerde volgorde dus, wijst een negatieve hellingshoek (i.c. tijd_in_fase=-1.21; p=.12) op een oplopende score (zie figuur 5 en tabel 2).
Gedrag2: eet met bestek, niet met vingers
De scores op gedrag2 aan het eind van de trainingsfase, de nametingsfase en de follow-up fase zijn significant hoger dan die aan het eind van de voormetingsfase (p<.001). Er is geen sprake van verschillen tussen de hellingshoeken van de regressielijnen (zie figuur 6 en tabel 3). De in figuur 7 zichtbare toename van het gewenste gedrag in de trainingsfase verschilt niet significant van de hellingshoek van de regressielijn van de voormetingsfase.
Vragenlijsten
BRIEF
In figuur 7 en tabel 4 zijn de resultaten op de voormeting en follow-up meting op de hoofdschalen van de brief vragenlijst (Gedragsregulatie Index, Metacognitie Index, Totaalscore) ondergebracht. De ouders signaleren een significante positieve verandering op de drie schalen, de leerkracht alleen een significante vooruitgang op de Gedragsregulatie Index.
Het is echter van belang de hoogte van de voormetingsscores hierbij te betrekken (zie tabel 2). De ouders gaven een score in het klinische gebied aan op de Metacognitie Index en een subklinische score op de Totaalscore. Het oordeel van de leerkracht viel in de subklinische range op de Gedragsregulatie Index en de Totaalscore. In de follow-up meting was er geen sprake meer van (sub)klinische score op de drie hoofdschalen van de BRIEF, zowel wat betreft de ouderversie als de leerkrachtversie van de lijst.
Figuur 8 geeft inzicht in de subschalen van de BRIEF die van belang zijn voor wat betreft de getrainde EF’s (inhibitie, werkgeheugen en flexibiliteit). Om daarnaast ook enige informatie te hebben over een ‘warme’ EF-maat is de subschaal Emotieregulatie ook opgenomen in de figuur. Er worden significante RCI’s op de ouderversie voor de BRIEF-subschalen Cognitieve Flexibiliteit en Emotieregulatie gevonden (zie tabel 5). Bij de leerkrachtversie is een positieve trend te zien op de subschaal Inhibitie, temeer omdat bij de voormeting hierbij sprake was van een subklinische score.
VvGK
Op geen van de twee ADHD-subschalen van de VvGK is er sprake van een significante verbetering.
Samenvatting resultaten
De prestatiecurve op de trainingstaken laat voor vrijwel alle taken een stijgende trend zien. Een uitzondering vormt de vierde variant van de werkgeheugentaak. Maar de maximale scores worden niet gehaald. Vooral op de stoptaak lijkt P. zijn prestatieplafond bereikt te hebben op zo’n tachtig procent van de maximaal te behalen score.
De gedragingen in de DRS (het klachtgedrag thuis) hebben vooral te maken met emotieregulatieproblemen (gedrag1) en impulsiviteit (inhibitieproblemen; overig gedrag). Er is een significante verbetering van het klachtgedrag, waarbij deze verbetering op gedrag1 zich al voordat de training startte lijkt in te zetten. Een gevolg van een positief verwachtingspatroon bij ouders? De follow-up gegevens illustreren het beklijven van de positieve trends.
Op de vragenlijsten geven ouders aan een verbetering te zien op het gebied van de cognitieve flexibiliteit en het gebied van de emotieregulatie. De leerkracht rapporteert alleen een lichte verbetering op het gebied van de inhibitie. Op de VvGK worden geen verbeteringen aangegeven.
Discussie
Dit artikel is geen effectstudie van Braingame Brian als behandelvorm voor kinderen met ADHD-kenmerken. Het is een verslag waarin de resultaten van het inzetten van Braingame Brian bij een jongen van negen jaar worden beschreven, waarbij de problemen thuis en op school anders gezien dan wel geduid blijken te worden. In EF-termen: thuis worden vooral de emotieregulatie- en impulsiviteitsproblemen gezien, op school springen, naast de impulsiviteitsproblemen, de inhibitie- en aandachtsproblemen in het oog.
Heeft Braingame Brian nu iets bijgedragen aan de door ouders en leerkracht geconstateerde veranderingen bij P.? In ieder geval rapporteren op de brief de ouders een verbetering wat betreft de emotieregulatie en de leerkracht ziet verbeteringen op het gebied van de inhibitieproblemen. De impulsiviteitsproblemen zoals gemeten met de VvGK lijken niet verbeterd. Hierbij moet wel worden aangetekend dat de ouders op deze vragenlijst eigenlijk geen problemen aangaven. De verbeteringen op het geïndividualiseerde klachtenlijstje (DRS) lijken ondubbelzinnig. Maar in hoeverre heeft alleen de Braingame hiertoe bijgedragen, vooral omdat op Gedrag1 van de DRS de verbetering zich al inzette voordat de eerste trainingssessie gestart was? Natuurlijk spelen (positieve) verwachtingen van ouders en kind altijd een rol bij een interventie. De meerwaarde van de SCED/N=1 is echter dat dit zichtbaar wordt gemaakt. Overigens wijzen de analyses op de DRS-data wel uit naar een krachtig interventie- effect, inclusief de verwachtingen, dat ook nog lijkt te beklijven.
Wat zeggen de resultaten van de trainingen zelf? Bij de Stoptaak is er sprake van een leercurve waarbij aan het eind van de training het plafond bereikt lijkt. Bij de Schakeltaak lijkt het plafond aan het eind van de training echter nog niet bereikt. Waarom heeft P. moeite met de vierde variant van de Werkgeheugentaak? Is dit een gevolg van een afnemende motivatie vanaf trainingssessie dertig tot veertig? De dips in de trainingsresultaten van de Stop- en Schakeltaak in deze fase van de training lijken dit te bevestigen. Ook is er een dip zichtbaar rond deze fase tijdens de training op de DRS-gegevens (zie de figuren 4, 5 en 6). Deze cliënt is de dip zelf (en/of met hulp van zijn ouders) te boven gekomen, zonder tussenkomst van de behandelaar. Door op deze manier de resultaten te monitoren, kan een behandelaar tijdens de behandeling ingrijpen om de behandeling eventueel bij te stellen dan wel de cliënt extra te motiveren.
Wat deze SCED-studie in ieder geval heeft opgeleverd, is een stortvloed aan data – waarbij er nog informatie wordt gemist die de studie krachtiger zouden maken. Zo werden de specifieke interventies die naast Braingame Brian werden uitgevoerd (psychoeducatie; ouderbegeleiding) niet systematisch gemeten. Het is daarom niet mogelijk de verbeteringen op het klachtgedrag zoals gemeten met de DRS en de vragenlijsten direct te koppelen aan de Braingame. Wat eveneens duidelijk wordt, is dat het klachtgedrag van de cliënt onvoldoende gedekt wordt door de ADHD-kenmerken zoals gemeten door twee subschalen van de VvGK. Met name de ouders vinden het klachtgedrag bij aanvang van de interventie beter beschreven door de subschalen van de BRIEF-vragenlijst. Omdat de Braingame specifiek gericht is op kerndomeinen van EF, is het aan te bevelen specifieke diagnostische gegevens te hebben over met name deze domeinen. Een EF-training is gerichter in te zetten als men bij aanvang meer weet hoe een kind presteert op een inhibitie-taak, een werkgeheugentaak en een cognitieve flexibiliteit-taak. Aan het eind van een behandeltraject kan dan ook meer inzicht worden verkregen in de werkzame mechanismen bij een versterking van het gewenste gedrag. Spelen hierbij verwachtingen van ouders en kind een belangrijke (mediërende) rol? Het verloop van gedrag1 op de DRS lijkt dit te suggereren.
Behalve nieuwe behandelingen als Braingame Brian is SCED ook in te zetten om bestaande, empirisch gevalideerde behandelingen te toetsen in de praktijk. En met een bundeling van een aantal SCED-studies kan het hoogste kwaliteitsniveau voor een behandeling worden verkregen, de aanwijzing dat een behandeling ‘werkzaam’ is (Maric et al., 2014). Een vervolg op dit artikel wordt voorbereid waarin een multilevel SCED-studie met 10 cliënten wordt beschreven. Het belangrijkste doel van dit artikel is om de praktische toepasbaarheid van sced-onderzoek in de klinische praktijk aan te tonen. Het blijkt haalbaar om ouders een dagelijkse vragenlijst te laten invullen, de digitale vorm van deze vragenlijst heeft aan de gebruiksvriendelijkheid positief bijgedragen. Het doen van dagelijkse metingen met de DRS maakt het noodzakelijk om aan het begin van een behandeling met de ouders en het kind de behandeldoelen in concrete termen te beschrijven en ook duidelijk te maken waartoe de behandeling moet leiden. Het gaat in de klinische praktijk in de regel om het behalen van kleine stappen om vastlopende interactiepatronen tussen ouders en kind (en school) te doorbreken. Met de DRS is goed systematisch onderzoek in de klinische praktijk te doen, waardoor therapeuten wel over die specifieke informatie over het behandelverloop kunnen beschikken (Versluis et al., 2014)21.
De SCED-methode om effectonderzoek te doen lijkt op z’n minst een zinvolle aanvulling op de traditionele RCT-methode. En met het oog op een meer geïndividualiseerde geestelijke gezondheidszorg, waarin het DSM-denken in classificeerbare stoornissen aan slijtage onderhevig is, zal er noodzakelijkerwijs meer aandacht voor de interindividuele ruis moeten komen. Het wordt tijd om eindelijk de titel van een artikel van een van de grootste pleitbezorgers van dit type onderzoek ter harte te nemen: ‘Bringing the person back into scientific psychology, this time forever’ (Molenaar, 2004)16.
Voetnoot
1 Conflicts of interest: Albert Ponsioen is voorzitter van de stichting Gaming & Training, een non-profitorganisatie die zich bezighoudt met het ontwikkelen en onderzoeken van computertrainingen, zoals Braingame Brian, op het gebied van executieve functies. Fabienne van Vliet: heeft onderzoekswerk voor de stichting Gaming & Training verricht. Rachelle Blijderveen: verricht onderzoekswerk voor de stichting Gaming & Training. Stanny Zwiers: geen.