Lees verder
Hoe kan in de praktijk zo goed mogelijk worden ingeschat of een delinquent opnieuw de fout zal ingaan? Er zijn drie manieren waarop het recidiverisico wordt ingeschat, leggen Wineke Smid en Kasia Uzieblo uit: een ongestructureerd klinisch oordeel, actuariële risicotaxatie, en het gestructureerd klinisch oordeel. ‘Actuariële risicotaxatie is verre van volmaakt, maar nog steeds het minst slechte wat we hebben.’
Wineke Smid, Kasia Uzieblo

Mensenlevens zijn door de eeuwen heen geleidelijk steeds veiliger geworden (Pinker, 2011). Door de bank genomen was het nog nooit zo veilig als nu en vrijwel nergens zo veilig als hier in West-Europa. Maar het resterende (seksuele) geweld krijgt wel steeds meer aandacht. De Raad voor Maatschappelijke Ontwikkeling (2006) berekende bijvoorbeeld dat terwijl het aantal incidenten met tbs-gestelden op verlof tussen 2001 en 2005 gelijk bleef, de media-aandacht ervoor verachtvoudigde. Dat stimuleert het gevoel van onveiligheid en verklaart (deels) waarom de roep om geweldplegers streng te bestraffen en herhaling te voorkomen steeds weer luider klinkt.

In eerste instantie is de rechtspraak er voor die bestraffing. We hopen dat de pleger na zijn straf zijn ‘lesje geleerd’ heeft. Voor veel plegers werkt straffen prima, met name zedenplegers recidiveren in grote meerderheid niet (70 tot 80%; Hanson, 2018). Maar voor een deel van de gewelds- en zedendelinquenten is straffen alleen niet genoeg om te stoppen met het delictgedrag. Voor plegers voor wie straffen niet werkt, werkt zwaarder straffen doorgaans ook niet. Deze mensen hebben behandeling nodig om hen te ondersteunen bij het opbouwen van een delictvrij bestaan; soms vrijwillig, soms onder dwang in de vorm van tbs.

Volgens het Risk Need Responsivity-model (RNR; Andrews & Bonta, 2010) moet de intensiteit van de behandeling afgestemd zijn op het recidiverisico van de pleger: plegers met een hoog risico ondergaan intensieve en langdurige interventies, plegers met een laag risico krijgen weinig of geen behandeling. Het ligt voor de hand dat als iemand met een hoog risico te weinig behandeling krijgt, zijn risico onvoldoende wordt teruggedrongen. Inmiddels is ook duidelijk dat als iemand wordt over-behandeld, dit juist risicoverhogend kan werken (Lowenkamp et al., 2006; Wakeling et al., 2012).

Het is dus zaak risicovolle individuen op betrouwbare wijze uit de totale groep delinquenten te selecteren. Er zijn ruwweg drie manieren waarop het recidiverisico in de praktijk wordt ingeschat: een ongestructureerd klinisch oordeel, actuariële risicotaxatie, en het gestructureerd klinisch oordeel of structured professional judgment (SPJ). Alleen het gebruik van actuariële risicotaxatie voldoet aan de vereisten van het RNR-model. Hieronder leggen we beknopt uit waarom.1

Ongestructureerd klinisch oordeel

Bij een klinische werkwijze brengen beoordelaars een eigen structuur aan in hun risicotaxaties. Maar die structuur en de geïncludeerde factoren kunnen sterk verschillen per clinicus – en dat is waarnaar het woord ‘ongestructureerd’ verwijst: er zijn geen vaste regels. Het voordeel van deze manier van werken is dat goed kan worden gefocust op de individuele pleger. Alle beschikbare informatie kan worden gebruikt en factoren kunnen worden gewogen en geïnterpreteerd.

Er zijn echter grote nadelen: de methode is niet betrouwbaar. Elke klinische beoordelaar interpreteert en weegt anders. Met zo’n onbetrouwbare meetmethode is het onmogelijk goed te voorspellen. Onderzoek bevestigt dat: de voorspellende waarde van het ongestructureerd klinisch oordeel is gering (Monahan, 2007). Het maakt niet uit of de klinische beoordelaars beginnelingen zijn of veel ervaring hebben; er is geen verbetering over de tijd. Dat komt omdat het onmogelijk is om als individuele beoordelaar goede feedback te krijgen over de genomen beslissingen. Er kan niet geverifieerd worden welke meegewogen kenmerken wel of niet echt voorspellend zijn geweest voor het recidivegevaar. Daardoor wordt niet geleerd van fouten en successen.

Plegers met een hoog risico hebben intensieve en langdurige interventies nodig, plegers met een laag risico hebben weinig of geen behandeling nodig

Actuariële risicotaxatie

Actuariële risicotaxatie is een empirisch ontwikkelde, gestructureerde manier om het recidiverisico in te schatten. Door middel van meta-analyses is uitgezocht welke factoren significant vaker voorkomen bij recidivisten. Welbeschouwd is dit de collectieve feedback die het klinisch oordeel nodig heeft om zich te kunnen ontwikkelen.

Risicotaxatie-onderzoek heeft duidelijk wortels in de klinische praktijk. Daaruit komen hypothesen voort over factoren die kunnen samenhangen met recidiverisico. Onderzoek naar die factoren laat zien dat ruwweg de helft daarvan gerelateerd is aan recidive. Maar de andere helft hangt niet meetbaar samen met recidive, zoals ontkenning, ernst van het delict of slachtofferempathie. Die factoren worden vaak ten onrechte meegewogen in een klinisch oordeel. Als niet-voorspellende factoren toch meegewogen worden, ondermijnen ze de voorspellende waarde van de factoren die wel samenhangen met recidive. De winst van actuariële risicotaxatie zit dus enerzijds in het meewegen van datgene dat gewogen moet worden, maar anderzijds in het niet meewegen van dingen die niet gewogen moeten worden. Actuariële risicotaxatie is de kunst van het weglaten.

Actuariële instrumenten bevatten alleen risicofactoren die aantoonbaar samenhangen met recidive. De score op een instrument wordt berekend door itemscores op te tellen. De eindscores corresponderen met recidivepercentages in bijbehorende tabellen. Deze tabellen vormen een essentieel onderdeel van actuariële risicotaxatie. Elke pleger wordt gekoppeld aan een recidiverisico middels een bepaald percentage. Maar wat betekent het als iemand een recidiverisico van 15% heeft? Van de subgroep waarbij hij op basis van zijn score het beste past, recidiveert 15%. Het percentage van de subgroep wordt gebruikt om de individuele pleger in te schatten. Die toepassing leidt wel tot de kritiek dat risicotaxatie alleen iets zegt over groepen en niet over individuen. Dat is niet juist. Hoewel het percentage geen zekerheid geeft over wel of niet recidiveren van een individu, is het zeker informatief te weten of iemand deel uitmaakt van een subgroep met 5% of met 50% recidiverisico. Op grond daarvan kan bijvoorbeeld gekeken worden of een interventie nodig is en hoe intensief die moet zijn.

We zouden graag weten of onze individuele pleger bij de 50% recidivisten of bij de 50% nietrecidivisten in zijn risicocategorie behoort. Zo werkt het helaas niet. Binnen de categorie hebben alle plegers dezelfde kans te recidiveren. De resterende onzekerheid heeft deels te maken met dingen die we (nog) niet goed kunnen meten, deels met hoe het leven loopt. Maar dat de actuariële risicotaxatie-instrumenten dat onderscheid niet maken, betekent niet dat een klinische inschatting dat wel kan. Kritiek op groepspercentages van actuariële risicotaxatie gaat gepaard met de impliciete veronderstelling dat een klinische benadering een betere inschatting van het risico van een individu oplevert. Dat is onjuist: onderzoek laat telkens zien dat klinische risico-inschatting slechter is (bijv. Hilton et al., 2006) . Actuariële risicotaxatie is verre van volmaakt, maar nog steeds het minst slechte wat we hebben.

Statisch en dynamisch

Sinds eind vorige eeuw heeft de actuariële risicotaxatie een hoge vlucht genomen (Helmus, 2018). In Canada, Amerika en Engeland werden diverse zogeheten ‘statische actuarials’ ontwikkeld, met kleine onderlinge verschillen en grote overeenkomsten. Bijvoorbeeld de Static-99 (Hanson & Thornton, 2000) voor zedendelinquenten en de SIR-scale (Bonta et al.,1996) voor geweldsdelinquenten. Deze instrumenten vragen naar korte, feitelijke informatie: bijvoorbeeld hoeveel eerdere veroordelingen iemand op zijn strafblad heeft, wat het geslacht is van de slachtoffers. De items zijn grotendeels historisch/statisch van aard. Hoewel ze niet geheel onveranderbaar zijn (leeftijd maakt bijvoorbeeld deel uit van deze factoren), zijn het geen zaken waarop een behandeling invloed heeft. Deze instrumenten zijn geschikt om iemands basisrisico te bepalen en in te schatten hoeveel behandeling iemand nodig heeft om het risico te reduceren. Medewerking van de pleger bij gebruik van deze instrumenten is niet noodzakelijk; ze zijn meestal te scoren op basis van gegevens uit het dossier.

De vraag: ‘Laat de pleger veel impulsief gedrag zien?’ is van een andere orde dan de vraag: ‘Hoeveel eerdere veroordelingen heeft hij op zijn strafblad staan?’

Het statische karakter van deze eerste ‘actuarials’ maakte ze minder geschikt om de inhoud van de behandeling te sturen of de effecten van behandeling te evalueren. De makers begonnen daarom tegelijkertijd aan het ontwikkelen van actuariële dynamische risicotaxatie- instrumenten. De constructie daarvan was bewerkelijker. Het gebruik van de ‘statische actuarials’ raakte wijdverbreid voordat de dynamische actuariële instrumenten het licht zagen.

Dynamische actuariële instrumenten zoals de Stable-2007 (Hanson et al., 2007) of de Violence Risk Scale (Olver et al., 2007) hebben, net als hun statische tegenhangers, een vast aantal items die samenhangen met recidive. De items worden op een vaste manier gescoord en leiden op een vaste manier tot een eindscore. De eindscores zijn gerelateerd aan recidivepercentages in bijbehorende tabellen. Het scoren van dynamisch actuariële instrumenten is moeilijker dan het scoren van de statische actuarials. Het scoren van de individuele items vergt meer klinische expertise van de beoordelaar. De vraag: ‘Laat de pleger veel impulsief gedrag zien?’ is van een andere orde dan de vraag: ‘Hoeveel eerdere veroordelingen heeft de pleger op zijn strafblad staan?’ Het gebruik van deze instrumenten vereist dan ook specifieke deskundigheid, training en een consciëntieuze werkwijze, liefst gebruikmakend van diverse informatiebronnen. Enige medewerking van de pleger is bij het afnemen van deze instrumenten noodzakelijk.

De dynamische risicofactoren zijn bruikbaar bij het bepalen van inhoudelijke behandeldoelen en evaluatie daarvan. Recent onderzoek laat zien dat een afname van de score op dynamische instrumenten samenhangt met een afname van het recidiverisico (Hogan & Olver, 2019; Van den Berg et al., 2018). Bovendien voegen de dynamische factoren iets toe aan de voorspellende waarde van de statische factoren (Van den Berg et al., 2018): ze verfijnen de inschatting. Dat betekent dat voor een optimale risicotaxatie liefst een combinatie van actuarieel statische en actuarieel dynamische factoren wordt gebruikt.

Stoornissen

Zoals eerder besproken bevatten de instrumenten alleen risicofactoren die aantoonbaar samenhangen met recidive. Opvallend afwezig zijn psychiatrische stoornissen. Sommige symptomen van stoornissen voorspellen recidive, zoals impulsiviteit. Maar als we impulsiviteit als risicofactor meenemen, maakt het vervolgens niet meer uit van welke stoornis deze impulsiviteit deel uitmaakt.

Het meewegen van psychiatrische stoornissen boven op de gevalideerde risicofactoren heeft voor het inschatten van de recidiverisico’s geen zin (Bonta et al., 2014). Psychiatrische stoornissen kunnen wel invloed hebben op de behandelresponsiviteit van een pleger; de assessment ervan kan dus relevant zijn voor de behandeling.

Gestructureerd klinisch oordeel

Duidelijk is dat een actuariële inschatting beter voorspelt dan het ongestructureerd klinische oordeel. Maar lang bestond de hoop dat de combinatie van een instrument met een klinisch oordeel betere resultaten zou opleveren dan actuariële risicotaxatie alleen. Bij deze methode, het gestructureerd klinisch oordeel of ‘structured professional judgment’ (SPJ), kunnen extra factoren worden toegevoegd en kunnen factoren klinisch gewogen worden. Helaas leidt deze aanpak niet tot betere voorspellingen. Het toevoegen van een extra klinische weging levert geen meerwaarde op, maar juist een verslechtering ten opzichte van het zuiver actuariele oordeel bij het voorspellen van zeden- en geweldsrecidive. Hoewel er incidenteel onderzoeken zijn die een meerwaarde vinden voor het SPJ-eindoordeel (De Vogel et al., 2004), zijn er veel meer onderzoeken en meta-analyses die dat niet vinden (bijv. Guay & Parent, 2018; Hogan & Olver, 2019; De Vries Robbé et al., 2015).

Een deel van het SPJ-probleem zit in de onbetrouwbaarheid van het toegevoegde klinische oordeel. Beoordelaars zijn niet eensgezind over wanneer een extra klinische afweging gemaakt moet worden (Hanson et al., 2007). En als er extra informatie wordt meegenomen, is er weinig overeenstemming over wat precies. Daarnaast komt bij de SPJ-methode de kunst van het weglaten onder druk te staan. Er worden bijvoorbeeld factoren meegewogen die weliswaar van belang zijn in het leven van de patiënt, maar die niet samenhangen met het recidiverisico, zoals een psychische stoornis. Zo komen de empirisch verworpen factoren uit het ongestructureerde klinisch oordeel langs de achterdeur weer terug in de risicotaxatie en doen daarmee afbreuk aan de voorspelling.

De onontkoombare conclusie is dat actuariële voorspelling beter is dan (gestructureerd) klinische voorspelling. Deze conclusie is niet nieuw (Meehl, 1954) en ook niet uniek voor het forensisch veld.

First offenders

Bestaande (actuariële) risicotaxatie-instrumenten bevatten items die correleren met recidive. De items zijn niet onderzocht op hun samenhang met de ontwikkeling van het eerste (seksuele) delictgedrag. Ze kunnen daarom ook niet gebruikt worden voor de inschatting van het risico dat iemand voor het eerst een delict gaat plegen. Soms denken mensen daarom dat risicotaxatie niet gebruikt kan worden voor zogenaamde first offenders: plegers die voor het eerst met justitie in aanraking zijn gekomen. Maar dat kan wel; ook bij een rapportage pro Justitia, als de first offender nog niet veroordeeld is, het delict ontkent en niet meewerkt. Zelfs dan kan vrijwel altijd een statische actuarial zoals de Static-99R gebruikt worden.

In het Nederlandse rechtssysteem is het gebruikelijk dat de rechter op hetzelfde moment zowel uitspraak doet over de schuld van de aangeklaagde als over de op te leggen straf/ maatregel. Bij het bepalen van de schuld speelt risicotaxatie geen rol. Pas bij duidelijke schuld wordt het belangrijk te kijken naar het risico van recidive. Idealiter wordt een risicotaxatie dus na de schuldbepaling en voor de oplegging van straf/maatregel gedaan. Maar omdat daar geen tijd tussen zit, wordt de risicotaxatie alvast aangeleverd ingeval de verdachte schuldig wordt bevonden. Rechters mogen pas naar de risicotaxatie kijken nadat zij zich over de schuldvraag hebben gebogen. Wordt de verdachte niet schuldig bevonden, dan is de risicotaxatie niet van toepassing en wordt deze niet gebruikt.

Causaliteit

De erkende actuariële instrumenten bevatten geen discriminatoire factoren zoals huidskleur of woonbuurt, maar vooral factoren die te maken hebben met het delictgedrag, zoals aantal eerdere delicten en de relatie tot de slachtoffers. De opgenomen factoren correleren met recidive, maar hebben niet altijd een begrepen causaal verband met recidive. Het nut voor de behandeling wordt hierdoor beperkt, omdat ook de dynamische risicofactoren geen uitsluitsel geven over onderliggende mechanismen en hoe die te beïnvloeden zijn. Maar degenen wier dynamische risicoscores afnemen tijdens de behandeling, recidiveren minder (Sewall & Olver, 2019; Van den Berg et al., 2018).

Het gebrek aan causale theorie achter actuariële risicotaxatie is problematisch voor dieper inzicht in delictgedrag. Andermaal is het niet zo dat dit zomaar vervangen kan worden met klinische overwegingen. Ook voor de klinische inschattingen ontbreekt het immers aan empirisch onderbouwde causale verbanden.

Risicocommunicatie

Er is veel geschreven over de voorspellende waarde van risicotaxaties. Tot op heden is minder onder de aandacht gekomen hoe deze risico’s het best gecommuniceerd kunnen worden. Een risicotaxatie kan uitgevoerd zijn volgens de regelen van de kunst, maar als de communicatie niet helder is en de resultaten verkeerd begrepen worden, kan de taxatie alsnog tot verkeerde beslissingen leiden.

Doorgaans worden risico’s aan de hand van categorieën gecommuniceerd – bijvoorbeeld ‘Meneer heeft een laag, matig of hoog risico op terugval’. Soms worden numerieke inschattingen gegeven: ‘Meneer behoort tot de groep waarvan 15% over een periode van 5 jaar gerecidiveerd is’. Een derde mogelijkheid is een beschrijving van het risico aan de hand van de criminogene factoren en de concrete behandelbehoeften van de persoon. De keuze van rapportage wordt in eerste instantie bepaald door het gehanteerde instrument. Een actuarieel instrument laat alle beschrijvingen toe, een SPJ-instrument laat geen numerieke beschrijving van het risico toe. De voorkeuren van de rapporteur spelen een rol, aangezien er geen algemeen geldende richtlijnen zijn.

Opvallend is dat zowel clinici als rechters de categoriale omschrijvingen prefereren (Evans & Salekin, 2016; Singh et al., 2014). Maar de redenen voor deze voorkeur zijn op zijn minst twijfelachtig te noemen en in strijd met empirisch onderzoek. Clinici hechten vooral weinig geloof aan de voorspellende waarde van numerieke inschattingen; sterker, men beschouwt deze numerieke informatie als misleidend (Heilbrun et al., 1999). In de vakliteratuur duiken echter juist problemen op met de categoriale beschrijvingen. Zo ontbreekt het aan consensus onder clinici wat onder laag, matig of hoog risico moet worden verstaan (Scurich, 2018). Bijgevolg interpreteert iedereen deze opdeling op zijn eigen manier (Nationaal rapporteur, 2017). Ook lijken categoriale omschrijvingen, gezien hun vaagheid, tot een overschatting van het risico te leiden. Maar ook numerieke omschrijvingen ontkomen niet aan deze tendens tot overschatting. De oorzaak van deze overschattingen ligt in onvoldoende kennis over baserates en cijferonkunde (Peters et al., 2007).

Nieuwe ontwikkelingen

Nieuw ontdekte factoren die invloed hebben op het recidiverisico worden doorgaans in de actuariële instrumenten opgenomen. Een belangrijk voorbeeld daarvan is het afnemende risico van zedendelinquenten bij duurzaam delictvrij verblijf in de samenleving. Uit onderzoek (Hanson et al., 2018) komt naar voren dat de grootste groep recidivisten terugvalt binnen vijf jaar nadat ze at risk zijn; levend in een situatie waarin terugval mogelijk is, al of niet onder toezicht van bijvoorbeeld de reclassering. Plegers die na vijf jaar niet gerecidiveerd zijn, hebben een veel lagere kans om tussen de vijf en tien jaar alsnog te recidiveren. Plegers die na tien jaar niet gerecidiveerd zijn, hebben een nog veel lagere kans opnieuw te recidiveren.

Naarmate iemand langer delictvrij in de samenleving verblijft, wordt de kans dat hij alsnog zal recidiveren dus steeds kleiner. Daarom kan de risico- inschatting tegenwoordig aangepast worden op basis van een delictvrije periode. Ruwweg halveert het risico met elke vijf jaar dat iemand succesvol delictvrij in de samenleving verblijft (zie figuur 1).

Een andere recente ontwikkeling is het model van de gestandaardiseerde risicocategorieën (Hanson et al., 2017b) . In Nederland worden, net als in het buitenland, verschillende instrumenten gebruikt voor risicotaxatie. Deze instrumenten leiden, ook bij dezelfde delinquent, niet altijd tot overeenstemmende resultaten. Dat kan verwarring oproepen als overgeschakeld wordt van het ene instrument op het andere – bijvoorbeeld tussen pro Justitia rapportage en behandelinstelling, of bij overplaatsing van de ene tbs-kliniek naar de andere. In plaats van het dwingend voorschrijven van één instrument, zijn nu uitkomstcategorieën ontwikkeld die gekoppeld kunnen worden aan alle verschillende instrumenten. Het maakt dan dus niet meer uit welk instrument gebruikt wordt, de uitkomstcategorieën zijn steeds hetzelfde. Daarnaast zijn de categorieën op inhoudelijk zinnige wijze vormgegeven – zie de gestandaardiseerde risicocategorieën voor zedendelinquenten (tabel 1). In principe kunnen alle instrumenten geschikt gemaakt worden voor de gestandaardiseerde uitkomstcategorieën (Hanson et al., 2017b). De instrumenten moeten wel een goed voorspellend vermogen hebben laten zien en SPJ-instrumenten moeten voorzien worden van tabellen met daarin de gerelateerde scores aan risicocategorieën en recidivepercentages. Het gebruik van deze gestandaardiseerde uitkomstcategorieën betekent meer consistentie in behandel- en toezichttrajecten. Evenmin hoeft er discussie te zijn over welk instrument het beste is. Ieder kan zijn eigen instrument gebruiken, mits op voorgeschreven wijze gekoppeld aan de gestandaardiseerde uitkomstcategorieën.

Ten slotte

Veel professionals ervaren het als schraal om plegers te beoordelen aan de hand van een ‘lijstje’. Ook daarom is de combinatie van statische en dynamische instrumenten aanbevelenswaardig. Zo’n combinatie maakt meer gebruik van de klinische expertise van de beoordelaar bij het scoren van de individuele items. Dat levert een (iets) betere inschatting van de risico’s op en vooral meer zicht op de relevante probleemgebieden van de pleger.

Naarmate iemand langer delictvrij in de samenleving verblijft, wordt de kans dat hij alsnog zal recidiveren steeds kleiner

De meeste professionals hebben geen moeite met het wegen van de relevante factoren. Het probleem zit in het weglaten van factoren die klinisch relevant lijken, maar empirisch niets opleveren. Het blijkt ontzettend moeilijk voor de veelal gedreven professional deze zaken niet mee te wegen. Het blijft dus belangrijk gebruikers ervan te doordringen dat deze ‘schrale’ actuariële risicotaxatie de beste resultaten oplevert en dat achter een klinische beoordeling een misschien onbedoelde maar wel grotere willekeur schuilgaat. Het standaardgebruik van actuariële risicotaxatie is effectiever en objectiever; alle plegers worden langs dezelfde meetlat gelegd. Actuariële risicotaxatie is geen middel waarmee al het delictgedrag of alle recidive kan worden voorkomen. Het is vooral een geschikt hulpmiddel voor prioritering, zodat de beschikbare tijd en middelen optimaal ingezet kunnen worden en het aantal recidives zo optimaal mogelijk teruggedrongen kan worden. Besef tot slot dat risicotaxatie en de daarbij behorende instrumenten geen vaststaand geheel vormen, maar work in progress zijn. Nieuw onderzoek, grotere steekproeven en betere statistiek leiden regelmatig tot aanscherping van deze instrumenten. Daarnaast kunnen algemene, technische en maatschappelijk ontwikkelingen invloed hebben op het gedrag van plegers, waardoor risicofactoren kunnen veranderen. Denk aan de invloed van internet, social media, maar ook aan veranderingen in wetgeving, zoals verhoging van de age of consent.

Kortom, voor iedereen die met risicotaxatie werkt, is het belangrijk nieuwe ontwikkelingen goed bij te houden.

 

Beeld: Chiara Arkesteijn

1. Voor een uitgebreidere beschrijving zie Smid (2020).