Lees verder
Graag hadden we hen voor een lunch op het NIP uitgenodigd. Maar door corona gedwongen zoomen we met psychiater Floortje Scheepers (FS), neuro-informaticus Sennay Ghebreab (SG) en psycholoog Stefan van der Stigchel (SVDS). Zij discussiëren over Big Data aan de hand van een aantal vooraf verstrekte stellingen, met psycholoog/journalist Vittorio Busato (VB) als gesprekleider. ‘Er gaan enorme maatschappelijk problemen ontstaan als mensen niet weten wat data zijn, wat algoritmes zijn en hoe die beslissingen voor je nemen.’
Vittorio Busato, Anouk Bercht

Stelling

Big Data is gestolde werkelijkheid; echte kennis ontstaat in interactie. Data staan nooit los van de betekenis die patiënten, onderzoekers en professionals eraan geven.

FS: ‘Die stelling heb ik ingebracht. Big Data is alleen zinvol als je ook oog hebt voor “warme data”, ofwel de interactie tussen mensen als zij het over “koude data” hebben. Koude data is alles wat je kunt vastleggen en meten. Maar koude data zeggen niets over de dynamiek, adaptiviteit en complexiteit van het echte leven. Warme data ontstaan bijvoorbeeld als een patiënt samen met een professional betekenis geeft aan data.’

VB: ‘Levert ervaringskennis warme data op?’

FS: ‘Ja, ervaringskennis is uniek en moeilijk te onderzoeken op een traditioneel wetenschappelijke manier. Maar ik weet niet of je het data moet noemen. Het is natuurlijk een illusie dat alles in data om te zetten is. Om de waarde van zorg te meten bijvoorbeeld, blijft het nodig om empathisch vermogen en intuïtie van hulpverleners mee te nemen. Of hoe hulpverleners samen met patiënten tot conclusies komen over welke behandeling te starten of niet, of over wat er precies aan de hand is. Wij mensen zijn relationele wezens die betekenis geven aan alles wat er gebeurt. En dat is lastig in getallen te vangen, maar het doet er wel heel erg toe. Zeker in de zorg. ’

SvdS: ‘Ik denk ook dat interactie belangrijk is om tot echt kennis te komen, maar ik mis iets aan deze stelling: theorievorming. En dat is dé taak van de wetenschap. Mijn stelling zou zijn: echte kennis ontstaat pas door gevormde theorieën experimenteel te toetsen. Anders kun je niet zo veel met data.’

FS: ‘Maar theorieën en hypothesen moeten ook middels interacties gevormd worden, niet per se alleen door wetenschappelijk onderzoekers, zoals het nu gaat. Wetenschappers zijn gebiased in hoe zij tot hypothesen en theorieën komen. In interactie kom je tot veel zinvollere hypothesen. En daar kun je dan ook data voor gebruiken.’

SvdS: ‘Daar heb ik minder vertrouwen in. Data zijn een oerwoud, data zijn veel, data zijn vaak onvolledig en niet onschuldig. Als je je in theorie- en hypothesevormingen laat drijven door data, laat je je drijven door gegevens waarvan je misschien niet weet hoe ze zijn vergaard, hoe kwalitatief sterk ze zijn en hoe volledig ze zijn. Nee, ik verdedig hier graag de experimentele methode. Want theorieën die vanuit de praktijk ontstaan, zijn ook gebiased. Onderzoekers worden ten minste getraind hun bias los te laten.’

FS: ‘Er zit inderdaad absoluut ruis en bias in data, en daardoor in de hoofden van professionals. Maar daarom pleit ik juist voor meer interacties tussen wetenschap en praktijk. Want die kunnen aanzetten tot de juiste dialogen en verbeteringen. We registeren nu bijvoorbeeld veel van wat hulpverleners in de psychiatrische en psychologische zorg doen. Maar met die data doen we nauwelijks iets. We leren niet van elkaar. Dat is problematisch. En in het lab doe je de complexiteit van de werkelijkheid te kort.’

VB: ‘De ecologische validiteit van wetenschappelijke onderzoek moet omhoog?’

FS: ‘Zeker. Dat gebeurt bijvoorbeeld al door wearables [technologische apparaten die je dichtbij de huid draagt, red.] en smartphones te gebruiken voor je onderzoek. Daarmee volg je proefpersonen individueel in hun dagelijks leven. Nu baseren we conclusies over stress bijvoorbeeld op wat proefpersonen doen als ze in een ziekenhuiskamer een spreekbeurt geven. Ik vraag me ook af of de richtlijnen in de ggz, die bestaan uit 42 zorgstandaarden, wel gebaseerd zijn op de juiste type onderzoeken en groepen patiënten. Niet zelden is er binnen die groepen meer variatie dan overeenstemming. We hebben meer dan honderd vragenlijsten om depressie mee te meten. Als je al die vragen combineert, kom je tot meer dan een half miljoen vormen van depressie. Dat zegt iets over hoe we mensen onderzoeken en wat voor enorme bias we daarmee introduceren.’

SG: ‘Ik vind ook dat we theorieën continu zouden moeten aanpassen op basis van data. Het is zelfs immens belangrijk aan het worden. Het zou mooi zijn in een continue cyclus te zitten van data verzamelen, daarvan leren, experimenteren, theorieën vormen of aanpassen, en daar weer van leren. En het is belangrijk daar met een diverse groep mensen met verschillende achtergronden en disciplines aan te werken. Alleen zo kun je anomalieën uit je data halen. En nog even iets anders: ik denk dat je interacties ook prima in data kunt vatten, vrijwel alles kun je in data vatten. Ik begin me steeds vaker af te vragen: wat kun je niet in data vatten?’

FS: ‘Oh, echt genoeg hoor! Bijvoorbeeld het bewustzijn. Of taal. Stel je laat iemand de zin “Ik ben dol op Donald Trump” in zijn hoofd uitspreken, dus niet hardop. Tegelijk meet je zijn of haar hersenactiviteit. Vervolgens vraag je deze persoon de zin in het rood te denken, in het groen, of denk de zin geschreeuwd of gefluisterd. Dat kun je al niet meer meten. Dat gaat over betekenis en over subjectieve qualia (kwalitatieve eigenschappen van waarnemingen, red.). Die spelen zo’n grote rol in de psychiatrie en psychologie, en het is heel frustrerend dat we daar eigenlijk niets mee kunnen. Natuurlijk begrijp ik dat we als wetenschapper reductionistisch moeten zijn, maar tegelijkertijd moet je erkennen dat zulke qualia meespelen. Door ze te negeren krijg je een te eenzijdige blik en gaan we wellicht juist de verkeerde kant op.’

SvdS: ‘Om nog even terug te komen op die ecologische validiteit, ik denk juist dat laboratoriumstudies nodig zijn om de validiteit hoog te houden. Die zijn namelijk controleerbaar. Ik ben er niet van overtuigd dat je met wearables de complexe buitenwereld kunt meten. Gedrag moet je in een labsetting bestuderen. Daar heb je geen last van die te complexe buitenwereld. Meten in de buitenwereld wordt te rommelig en ruizig.’

SG: ‘Voor bedrijven als Google en Facebook is de hele wereld nu één groot laboratorium. Zij meten op zo’n grote schaal die complexe buitenwereld.’

VB: ‘Maar meten ze of schieten ze met hagel?’

SG: ‘Beide. Ik denk niet dat het goed is. Maar Google en Facebook laten wel zien dat je op zo’n grote schaal hele complexe zaken kúnt bestuderen. In een lab kan dat niet.’

SvdS: ‘Maar juist van deze bedrijven leren we dat het gebiasede troep oplevert, dat verkeerde informatie wordt gedeeld, dat de achterliggende mechanismes niet worden begrepen.’

FS: ‘Nee, dat is te kort door de bocht. Die bedrijven verdienen er klauwen met geld mee, dus het snijdt wel degelijk hout. Maar misschien gebruiken zij de data wel voor verkeerde doeleinden. Eerlijk gezegd vraag ik me af of je menselijk gedrag wel naar een lab kunt tillen. Met kankercellen kan dat, of met het coronavirus. Maar menselijk gedrag vindt juist plaats in die complexe buitenwereld. De afgelopen vijftig jaar heeft het labonderzoek in de psychologie en psychiatrie hoogtij gevierd, maar we hebben amper vooruitgang geboekt. Onze interventies zijn bijvoorbeeld niet specifieker geworden voor bepaalde stoornissen. Logisch, want ons classificatiesysteem staat steeds ter discussie. Na vijftig jaar ploeteren blijkt dat het echte leven veel complexer is dan wat we in het lab kunnen meten. Mijn hoop voor de toekomst is om andere paden te bewandelen, met nieuwe technieken, die ons dichterbij die complexiteit brengen. Zodat we patiënten beter kunnen helpen. Anders zoeken de grote bedrijven als Microsoft en Facebook het wel voor ons uit. Die vinden de gezondheidszorgmarkt super interessant, die groeit en groeit. Zeker als het gaat over mentale gezondheid.’

SvdS: ‘De modellen die grote bedrijven gebruiken zijn grote black boxes. Geen idee wat daarin gebeurt. Op basis daarvan gaan we toch geen medicatie voorschrijven? Ik houd geen pleidooi tegen big data, maar ik houd wel een pleidooi voor en big data én labonderzoek. Het een kan echt niet zonder het ander.’ VB: ‘Sluit dit niet erg aan bij de volgende stelling, toevallig uit mijn koker?’

Stelling

Big Data zeggen iets over ‘dat we ons zus of zo gedragen’, niet ‘waarom we ons zo gedragen’. Big Data registreren alleen uiterlijk gedrag en zijn daarmee een overwinning van het behaviorisme.

SvdS: ‘Jazeker. Wetenschap gaat over het begrijpen van het waarom, anders is het misschien wel geen wetenschap meer. We hebben de afgelopen vijftig jaar volgens mij best veel geleerd over gedrag en het brein. Onderzoek met vragenlijsten is inderdaad gebiased. Maar fysiologische maten zoals eyetracking, reactietijden, EEG­ en FMRI zijn relatief objectief. Het is zonde daar nu mee te stoppen. Misschien verschillen we van mening over hoeveel we hebben geleerde de afgelopen vijftig jaar, maar ik zie toch behoorlijk wat theorieën die kloppen.’

FS: ‘Begrijpen we door labonderzoek onderliggende mechanismen dan wél? Ook in het lab creëren we een soort schijnobjectiviteit over menselijk gedrag. Hoe weet je dat iedereen die bijvoorbeeld zijn of haar gemoed een zeven geeft zich precies hetzelfde voelt? Die stelling klopt dus wel, maar dat geldt niet alleen voor Big Data maar ook voor data in het lab. Het gaat altijd om een interpretatie van gedrag dat heel ingewikkeld is. Dus een overwinning van het behaviorisme, dat kun je wel zeggen!’

SG: ‘Met deze laatste stelling ben ik het eens. Er komt een nieuwe wereld aan, qua data, modellen en technologieën. De correlaties die Big Data nu opleveren, zijn snapshots van de wereld en van gedrag van mensen. De volgende uitdaging is daaraan betekenis te geven. Wat is de sociale en historische context? Momenteel worden er binnen de wetenschap allerlei technieken ontworpen om dat in beeld te krijgen. Hoe gaan we die gebruiken, hoe zullen ze ons denken als wetenschappers beïnvloeden? De big tech-bedrijven hebben daarin een voorsprong genomen. Daar kunnen mooie en positieve ontwikkelingen uit voortvloeien. Maar als wetenschappers dat overlaten aan de grote bedrijven of zich ertegen afzetten, krijgen grote bedrijven vrij spel om er vooral zelf beter van te worden. Technologie ís van de mens, wij maken die. Dus we moeten in menselijk kapitaal investeren.’

FS: ‘Eens. We moeten afstappen van de tradities en systemen in de wetenschap die ons een heel eind hebben gebracht, maar die voorbij geracet worden door de huidige technologische mogelijkheden. Universiteiten en ziekenhuizen zijn er niet goed in om werkwijzen en tradities los te laten. Het is ook spannend wat er gebeurt en hoe we ons ertoe moeten verhouden.’

VB: ‘Is de wetenschap te veel bezig met reflectie en te weinig met reflexen? Richten Facebook en Google zich op de reflexen om ons gedrag te begrijpen? Wat trouwens behavioristisch is.’

FS: ‘De wetenschappelijk wereld is best pervers geworden. Het gaat over zo veel mogelijk publiceren in zo hoog mogelijk aangeschreven tijdschriften, hoge rankings, h-indexen. We wilden graag kwaliteit van rommel scheiden, maar het is doorgeschoten. Microsoft en Google willen enkel geld verdienen. Als je daar als datascientist werkt, kun je de hele dag doen waar je zin in hebt, met fantastische arbeidsvoorwaarden. Daar werken heel veel slimme mensen.’

SvdS: ‘Er zijn gelukkig genoeg goede datawetenschappers die graag in de wetenschap willen werken, die echt het brein en menselijk gedrag willen begrijpen.’

FS: ‘Zouden die datawetenschappers die bij Google en zo werken niet net zo goed de achterliggende mechanismen willen begrijpen? Zij hebben alleen andere belangen en andere perspectieven op dezelfde werkelijkheid. Mechanismen begrijpen lukt niet beter in het lab dan in de buitenwereld.’

SvdS: ‘In de psychologie hebben we tot nu heel secuur data verzameld om onze theorieën op te baseren. Als we dat voortzetten met wearables zonder dat experimenteel te toetsen, is dat een compleet andere aanpak. Ik begrijp niet goed waarop dat vertrouwen is gebaseerd dat hele grote datasets en ingewikkelde statistische technieken ons verder gaan brengen dan hoe we nu bezig zijn.’

FS: ‘Ik geloof alleen in het echte leven, in de praktijk, in het aangaan van complexiteit. Dat lukt onvoldoende in het lab. We moeten bescheiden zijn. Met Big Data en nieuwe technologieën gaan we zeker ook niet alles oplossen. Maar ik zoek wel manieren om wetenschappers dichterbij de praktijk te brengen. Onderzoekers moeten met hun poten in de modder, het gesprek aangaan. Door het stelselmatig weglaten van dat wat we niet kunnen meten omdat het te complex zou zijn, zijn we een route ingeslagen met psychologie en psychiatrie die veel te biomedisch is en geen recht doet aan een holistische kijk op mensen.’

SG: ‘Labexperimenten laten zien dát er problemen zijn, maar niet hoe groot ze zijn. Neem discriminatie op de arbeidsmarkt. Dat kun je experimenteel aantonen, maar hoe groot dat probleem werkelijk is zie je pas als big tech-bedrijven algoritmes gaan gebruiken. Die blijken dan te discrimineren. Want dat is wat er in de maatschappij gebeurt. Dus daar zie ik kansen: waar laten big tech-bedrijven problemen en hoe kunnen we die oplossen? Daarom ben ik trouwens ook gestopt met mijn wetenschappelijke onderzoek naar visueel bewustzijn. Waar voorheen in het lab theorieën werden getoetst en ontwikkeld, gaat het nu andersom worden, verwacht ik. Grote theorieën zullen ontstaan in de praktijk en in het lab verder worden uitgewerkt en getoetst om de achterliggende mechanismen te ontdekken.’

Stelling

Psychodiagnostiek en het kiezen van een behandeling bieden binnen tien jaar geen werk meer aan psychologen. (De benodigde data worden via internet en andere digitale sporen geoogst. De interpretatie zal overgelaten worden aan algoritmen, opgebouwd via machine learning en Big Data.)

FS: ‘Oneens, co-creatie blijft nodig. Computers zullen een soort risicoanalyse geven: je hebt zoveel procent kans dat deze medicijnen aanslaan. Computers kunnen in de toekomst vast ook beter classificeren op basis van symptomen dan hulpverleners. Maar met een computer alleen komen we er niet. In de psychologie en psychiatrie is de relatie tussen patiënt en hulpverlener nu juist zo belangrijk. En goede diagnostiek bestaat uit luisteren naar iemands levensverhaal en een individuele probleemanalyse maken. Voor zulk vakmanschap hebben we mensen nodig!’

SvdS: ‘De kennis die psychologen in die gesprekken inbrengen, komt wel uit collegebanken en leerboeken waarin op een vrij klassieke manier wordt uitgelegd hoe het brein werkt, ons gedrag, het geheugen, aandacht…’

FS: ‘Als ik zelf ziek word, wil ik een psycholoog met ervaring, niet eentje net uit de schoolbanken. Echte kennis ontstaat pas als je handelingsverantwoordelijkheid krijgt. Vergelijk het met autorijden.’

SvdS: ‘De term ‘échte kennis’ vind ik ingewikkeld. Als ik naar een psycholoog of psychiater moet, wil ik iemand met een universitaire opleiding die daarin essentiële kennis opdeed en die bovendien veel ervaring heeft.’

SG: ‘Computers kunnen in de toekomst inderdaad beter classificeren dan mensen. Maar de echte uitdaging zit in mijn ogen in het bepalen van die verschillende categorieën, en daarvoor zijn mensen nodig. Die categorieën veranderen namelijk met de tijd en ruimte en overlappen deels. En nog even over ervaring: psychologen en psychiaters met veel ervaring weten wat er ontbreekt in de leerboeken. Die moeten die kennis teruggeven aan die boeken: co-creatie en interactie.’

VB: ‘Maar dat duurt toch heel lang?’

SG: ‘Niet als we meegaan met de tijd.’

FS: ‘De veranderingen gaan inderdaad heel hard, harder dan we soms denken. We krijgen amper tijd ons rustig aan te passen. Het Massachusets Institute of Technology (MIT) voorspelt dat er ergens tussen 2060 en 2070 een kantelpunt komt en dat computers dan intelligenter zijn dan alle mensen bij elkaar. Wie draaien er dan aan de knoppen?’ VB: ‘De wetenschap speelt deze “wedstrijd” in een lager tempo dan bedrijven zoals Facebook en Google?’

SvdS: ‘Klopt. Al spelen, althans in mijn ogen, big tech-bedrijven en de wetenschap een andere wedstrijd. Ik hoop dat academici de fundamentele mechanismes achter gedrag willen blijven ontrafelen. Facebook en Google hebben veel rekenkracht, maar stellen geen psychologische theorie op gesteun door hun algoritmes.’

FS: ‘In mijn omgeving zie ik trouwens wel dat het trage tempo in de wetenschap onderzoekers verleidt om over te stappen naar het bedrijfsleven. Waar meer kan, en sneller ook.’

SvdS: ‘Laten we dan vooral het tempo veranderen in de wetenschap!’

Stelling

‘Algoritmen zijn nooit neutraal. Daarom moet iedere datawetenschapper ethiek-les krijgen.’ (Computerethicus Katleen Gabriels in Het Parool, 21/11/20)

FS: ‘Goed punt.’ SvdS: ‘Zeker. Volgens mij begrijpen veel mensen die big data-technieken gebruiken die technieken niet. Data- en statistiekles worden op universiteiten belangrijker dan ooit, dus ook voor psychologen en psychiaters.’

SG: ‘Eens. Sterker nog, die lessen zijn een fundamenteel mensenrecht aan het worden. Als je niet weet hoe een algoritme werkt, ben je verloren. Op middelbare scholen en zelfs op lagere scholen moet hierin les worden gegeven. Daar pleit ik al langer voor. Zelf geef ik al tien jaar les op basisscholen over dit thema. Er gaan enorme maatschappelijk probleem ontstaan als mensen niet weten wat data zijn, wat intelligent lerende machines zijn, wat algoritmes zijn, hoe die beslissingen voor je nemen, wat patroonherkenning is. En ethiek is emergent dus we moeten blijven nadenken wat ethisch verantwoord is in deze snel veranderende maatschappij.’

FS: ‘Ethiek is niet enkel reactief. Je kunt je ook vooraf bewust worden van ethische aspecten die altijd een rol spelen, en daarop beslissingen baseren. Maar we moeten er inderdaad wel als hele samenleving mee bezig zijn en op tijd de dialoog daarover voeren.’

SvdS: ‘Hé, we zijn het een keer met elkaar eens! Een nadeel van grote datasets is nog wel dat je er van alles uit kunt halen, allerlei correlaties bijvoorbeeld. En die datasets zijn zo groot en uniek dat ze amper te repliceren zijn. Daar moeten we het wel met elkaar over hebben. Hoe gaan we daarmee om?’

SG: ‘Alles willen begrijpen is een illusie. Wij begrijpen ons brein niet eens. Of hoe een complexe organisatie als de belastingdienst tot bepaalde uitspraken komt. Het is goed om te willen begrijpen, maar ook om los te laten als je iets niet begrijpt. En als je altijd wacht met iets doen tot je iets begrijpt, stop je de ontwikkelingen.’

FS: ‘Kunnen we ook accepteren dat computers adviezen geven zonder dat we volledig begrijpen waarop die zijn gebaseerd?’

SvdS: ‘Als je als bedrijf heel veel geld wilt verdienen op de beurs, is dat geen enkel probleem. Als het maar werkt! De wetenschap zit anders in de wedstrijd. Wil je winnen of begrijpen waarom je aan het winnen bent?’

Stelling

De Mensch verdwijnt met Big Data.

SG: ‘De oude mensch verdwijnt maar de nieuwe mensch verschijnt! Big Data geven namelijk kansen. Computers zien beter hoe we ons gedragen. Sommige bedrijven gebruiken Big Data om er rijk van te worden. Universiteiten en overheden kunnen big data juist gebruiken voor andere, positievere doeleinden. Via Big Data reflecteren op eigen gedrag geeft ook nieuwe handvaten die we voorheen niet hadden. Als je al doemdenkende kijkt naar Big Data en algoritmes, ja, dan verdwijnt de mens. Maar je kunt ook kijken vanuit het perspectief dat Big Data kansen biedt. Aan Stanford University is een algoritme ontwikkeld op basis van data van vluchtelingen, over de landen waar ze terecht zijn gekomen en waar ze onderwijs gevolgd hebben. In Zwitserland wordt dit algoritme nu gebruikt om te zorgen dat vluchtelingen banen vinden die bij hen passen. Dat is een win-winsituatie! De vluchteling wordt gezien en krijgt kansen. Het huidige systeem in Nederland is daarvoor veel te bureaucratisch, er wordt hier alleen gekeken naar waar er plek is. Maar als we Big Data laten helpen om de juiste mens op de juiste plek te rijgen, dan verschijnt de mens!’

SvdS: ‘Ik heb ook een mooi voorbeeld! Een deel van ons labonderzoek moest door corona noodgedwongen online. En tot onze grote verrassing deden binnen no time deelnemers van over de hele wereld, met verschillende culturele en educatieve achtergronden, mee aan ons onderzoek. Dat is echt een verrijking en dat zullen we dus ook blijven doen. Big data-technieken zijn daarin dan ook zeer welkom.’

FS: ‘Ik heb ook een voorbeeld waarin de mens verschijnt, in plaats van verdwijnt. Op basis van agressieincidenten in de eerste 24 uur van opname hebben we in het ziekenhuis een algoritme gemaakt dat goed kan voorspellen bij welke patiënten de eerste maand de kans het grootst is op agressie-incidenten. Voorheen moesten verpleegkundigen daartoe vragenlijsten invullen waarmee ze een half uur bezig waren. Dat algoritme voorspelt dat nu veel beter dan de vragenlijst. Die tijd die verpleegkundigen uitsparen, kunnen ze dus nu aan de patiënt besteden!’

Beeld: 360b/shutterstock.com