Over het belang van een objectieve eindtoets ten behoeve van de advisering van vervolgonderwijs na de basisschool is altijd veel te doen. Recent verscheen een uiterst kritisch proefschrift (Heij, 2021), waar Meijer en Sijtsma (2022) kritische kanttekeningen bij plaatsten (zie ook Heij, 2022; Veenman, 2022). Het bestaan van vijf eindtoetsen van vijf verschillende aanbieders naast elkaar maakt het ook niet gemakkelijker om de waarde van een eindtoets in te schatten. Waarom vijf verschillende en niet één goede? Ook het beleid ten aanzien van eindtoetsen verandert regelmatig. De volgende verandering, van Centrale Toets naar Doorstroomtoets, staat in 2023-2024 alweer op de agenda.
In dit artikel bepleiten we het gebruik van een eindtoets ten behoeve van de advisering over vervolgonderwijs na de basisschool. Dat doen we op basis van wetenschappelijke argumenten. Daarvoor is nodig dat we de huidige, complexe situatie begrijpen, maar er niet in te verdwalen. We besteden daarom weinig aandacht aan de organisatie van de eindtoets in Nederland, de organisaties en gremia die daarbij betrokken zijn en de politieke, organisatie- en andere belangen die spelen. De complexiteit van een en ander zou afleiden van het punt dat we willen maken, maar helemaal ontkomen we er niet aan.
Daarnaast zijn er allerlei ontwikkelingen gaande, zoals de recente roep om kansengelijkheid in de politiek, de media en het onderwijsveld. Daarin spelen eindtoetsen soms ook een rol, vooral als men van mening is dat leerlingen niet gebaat zijn bij toetsen (bijv. Heij, 2021; maar ook diverse opiniemakers). We bespreken naast kansengelijkheid het wettelijke kader van het basisonderwijs en de marginale sturing op kwaliteit door de overheid, en benadrukken de rol die toetsen hierbinnen kunnen spelen. De psychometrische vereisten van een toets, de kwaliteit van de gangbare eindtoetsen, en de geschiedenis van het gebruik van eindtoetsen komen aan de orde. We sluiten we af met enkele aanbevelingen.
Het complexe veld van het basisonderwijs
We denken dat de volgende stelling door de meeste mensen wel gedeeld zal worden: elk kind moet dezelfde kans hebben op goed onderwijs. Onduidelijk is echter wat met het begrip kans wordt bedoeld en als je dat wel weet, hoe je in het kader van kansengelijkheid gelijke kansen in de praktijk realiseert en of dat wel kan. Vele instanties definiëren kansengelijkheid. We beperken ons tot twee belangrijke pogingen. De Onderwijsraad zegt het volgende (uit: Advies Later Selecteren Beter Differentiëren (2021), paragraaf 1.2, p. 16): De raad relateert kansengelijkheid aan de toegankelijkheid van het onderwijs: kinderen en jongeren met gelijke capaciteiten moeten gelijke kansen hebben om onderwijs te volgen waarin ze hun capaciteiten optimaal benutten. Het gaat niet om gelijke onderwijsuitkomsten, maar om gelijke onderwijskansen. Het streven is: voor iedereen meer gelijke kansen op goed onderwijs creëren. Alle jongeren – de meer begaafde, vroegrijpe, snel lerende én de minder snel of goed lerende en de laatbloeiers – moeten kansen krijgen op goed onderwijs, zodat ze zich vanuit hun capaciteiten kunnen ontwikkelen en kunnen leren, een diploma kunnen behalen en goed beslagen ten ijs komen in de samenleving en op de arbeidsmarkt.
Elk kind moet dezelfde kans hebben op goed onderwijs
De Onderwijsinspectie (uit: De Staat van het Onderwijs 2022, p. 36) laat het volgende weten: Het is nog steeds niet vanzelfsprekend dat leerlingen en studenten met dezelfde vaardigheden maar met een verschillende achtergrond dezelfde kansen krijgen. Schoolloopbanen van leerlingen en studenten met extra ondersteuningsbehoeften verlopen minder voorspoedig. Leerlingen en studenten met een migratieachtergrond ondervinden vaker drempels, al neemt dit de laatste jaren wel af. Leerlingen en studenten met lager opgeleide ouders hebben ook vaker te maken met een ongunstiger verloop van hun schoolloopbaan. Ook voor deze groep geldt dat er een afname zichtbaar is voor sommige van de verschillen.
Het volgende valt op. Ten eerste gaan achter de begrippen ‘kans’ en ‘kansen(on)gelijkheid’ vaak allerlei intuïties en opvattingen over rechtvaardigheid schuil. Centraal lijkt te staan dat kinderen met dezelfde capaciteiten dezelfde startpositie moeten hebben, wat wil zeggen dat ze hetzelfde onderwijs moeten krijgen ongeacht hun achtergrond in de brede zin van het woord. Dat klinkt eenvoudig maar is het niet, want achtergrond is een mededeterminant van capaciteit en dan is het gauw ingewikkeld.
Stel, kind A (hoogopgeleide ouders) en kind B (laagopgeleide ouders) hebben bij geboorte dezelfde aanleg, maar de stimulerende omgeving van A vergroot haar capaciteit en de niet-stimulerende omgeving van B onderdrukt de capaciteit. Na verloop van tijd verschillen ze dus in capaciteit, en selectie op basis van capaciteit plaatst hen in verschillende niveaugroepen die verschillend onderwijs krijgen. Maar als A een geringere aanleg had gehad dan B, dan zouden ze wel op hetzelfde niveau kunnen uitkomen. Wat is hier wel en niet rechtvaardig? Deze discussie lost overigens niets op, maar geeft wel aan hoe ingewikkeld de problematiek is.
Ten tweede is het vaststellen van een gelijke startpositie problematisch. Als je capaciteit zou definiëren als aanleg bij geboorte, hoe maak je capaciteit dan meetbaar en daarmee verschillen tussen kinderen zichtbaar? Van der Maas en Raijmakers (2019) bespreken de onmogelijkheid hiervan. Aanleg bij geboorte is niet meetbaar. Je zou dus op een later moment ieders capaciteit moeten vaststellen, maar we zagen net al hoezeer omgeving daarop van invloed is. We negeren dit ter wille van de discussie, nemen een praktisch uitgangspunt en vragen hoe je capaciteit bijvoorbeeld aan het begin van de basisschool vaststelt. Met een ‘Begintoets’? Op zesjarige leeftijd moeten kinderen hun schoolloopbaan nog beginnen, dus valt er nog niet zoveel te toetsen. Of ga je deze kinderen op intelligentie testen en ze selecteren op gelijke testprestaties? Diverse politici en opiniemakers vinden dat kinderen op hun twaalfde al erg vroeg worden voorgesorteerd, maar wil je dat dan al doen op hun zesde jaar, ook al is de bedoeling om meer onderwijs op maat te geven om langs die weg startkansen gelijker te maken?
Ten derde, de bovenstaande definities zeggen dit niet, maar volgers van de nurture-opvatting van ontwikkeling (bijv. Dweck & Leggett, 1988; Yeager & Dweck, 2012) suggereren dat verschillen in capaciteit tussen kinderen zijn weg te trainen. Los van de ongekende inspanning en vergroting van benodigde onderwijscapaciteit die nodig is om dit serieus te proberen, is in de differentiële psychologie allang bekend dat er vele individuele verschillen bestaan in allerlei capaciteiten en andere cognitieve, persoonlijkheids- en affectieve kenmerken, die niet zijn weg te trainen. Los van omgevingsinvloeden, bestaan er verschillen tussen leerlingen in vaardigheden, zoals in reken- en taalvaardigheid, maar ook in de mate waarin zij in staat zijn om zich kennis en inzicht eigen te maken op de terreinen van geschiedenis, maatschappijleer, aardrijkskunde, en vele andere vakken. Velen begrijpen en accepteren deze individuele verschillen, en de wens om kansengelijkheid te realiseren betreft eigenlijk het besef dat omgeving, met name afkomst, geen nadelige invloed mag hebben op de schoolloopbaan.
Als je mogelijkheden en onmogelijkheden doordenkt, lijkt de enige conclusie dat je alle kinderen hetzelfde goede onderwijs moet geven, ongeacht de vraag hoezeer ze in hun omgeving gestimuleerd worden. Daarbij moet in het onderwijs met de persoonlijke omstandigheden van kinderen rekening worden gehouden. Wel dienen verschillen in capaciteiten erkend te worden in de zin dat niet voor elk kind de schoolloopbaan hetzelfde eindpunt heeft. De discussie heeft geen repercussies voor het gebruik van eindtoetsen. Die zijn nuttig om individuele verschillen in kennis, inzicht en vaardigheden te meten. Dit is het summatieve gebruik van toetsen.
Daarnaast bestaan er formatieve toetsen die helpen om tijdens het onderwijsproces indien nodig hulp te bieden. De adaptieve benadering van Van der Maas en Raaijmakers (2019), waarbij kinderen ongemerkt op hun eigen niveau door oefening worden gestimuleerd om zich te verbeteren, verdient in dit verband aandacht. De wens om kansengelijkheid te bevorderen is begrijpelijk maar roept discussies op een hoog abstract niveau op, waar praktische uitvoeringsvragen gemakkelijk uit de weg worden gegaan.
Wettelijk kader
In Nederland liggen de schoolvakken bij wet vast, maar verder is er een grote diversiteit in de inhoudelijke invulling ervan, de weging van hun belang in een curriculum, en de onderwijsmethode. Je weet dus niet wat leerling A van een basisschool uit Doetinchem kan in vergelijking (relatief) met leerling B van een basisschool uit Leiden, en wat het rekenniveau (absoluut) is van leerling C. Voor zowel relatieve als absolute vergelijking heb je een criterium nodig waarop je aan het einde van de basisschool prestaties van leerlingen van verschillende scholen kunt vergelijken (relatief), en het niveau kunt bepalen (absoluut).
Hoe zit het met die verschillen tussen scholen die de beschikbaarheid van een criterium ter vergelijking achteraf noodzakelijk maken? Daarvoor nemen we de wettelijke regelingen, mogelijkheden en beperkingen voor het basisonderwijs onder de loep.
Weinigen zullen niet van Artikel 231 van de Grondwet hebben gehoord. Artikel 23 komt vaak in het nieuws omdat het de mogelijkheid biedt een school te stichten op basis van levensovertuiging. Het gaat ons er evenwel vooral om dat het iedereen het recht biedt een school op te richten volgens een zelfgekozen onderwijsmodel. Dit biedt de ruimte om bijvoorbeeld te kiezen voor onderwijsvormen die primair gericht zijn op de ontplooiing van individuele talenten maar ook op het aanleren van kennis en kunde die maatschappelijk van groot belang zijn.
De Wet op het primair onderwijs2 stelt de vakken voor die gegeven moeten worden maar laat veel ruimte voor de inhoudelijke invulling van het onderwijs. Artikel 9 somt de vakken op: zintuiglijke en lichamelijke oefening, Nederlandse taal, rekenen en wiskunde, Engelse taal (mogelijk: Frans, Duits), enkele kennisgebieden (verplicht: aardrijskunde, geschiedenis, biologie, maatschappelijke verhoudingen, geestelijke stromingen), expressie-activiteiten, bevordering van sociale redzaamheid, waaronder gedrag in het verkeer, en bevordering van gezond gedrag. Voor de school geldt de eis dat zij ten minste de kerndoelen bij haar onderwijsactiviteiten als aan het eind van het basisonderwijs te bereiken doelstellingen hanteert.
Artikel 9b (en ook Artikel 8, lid 6) gaat over toetsing. Lid 1 zegt dat in het achtste schooljaar de leerling in een volledige week tussen 15 april en 15 mei een centrale, dus landelijke, eindtoets aflegt. Terzijde merken we op dat er in de praktijk diverse aanbieders van eindtoetsen actief zijn, dus dat van een enkele toets geen sprake is. Lid 2 bepaalt dat de centrale eindtoets kennis en vaardigheden van de leerling meet op het terrein van Nederlandse taal en rekenen en wiskunde. Dit betekent dat de centrale eindtoets een ijkpunt is dat volgens verschillende onderwijsmodellen gegeven basisonderwijs in dezelfde richting stuurt. Zo is er enige controle op wat kinderen leren. Een tweede sturingsmechanisme wordt geboden door de Inspectie van het Onderwijs, die namens de overheid toezicht op de kwaliteit houdt.
De wet biedt veel vrijheid aan de keuze van het onderwijsmodel, de invulling van de vakken en de wijze waarop zij gegeven worden. Dit maakt onvergelijkbaarheid van relatieve en absolute schoolprestaties tot een reëel gevaar. Daarbij komt dat de onderbouwing van allerlei onderwijskeuzes lang niet altijd wetenschappelijk heeft plaatsgevonden. Ideologie, overtuiging, voorkeuren en modegevoeligheid spelen nogal eens een rol, terwijl het niet duidelijk is of het kind ervan profiteert of er wellicht nadeel van ondervindt. Zo vonden wij het bijzonder dat sommigen op een gegeven moment vonden dat tablets, zoals de iPad, een centrale plaats in het onderwijs zouden moeten innemen, terwijl deze apparaten toch vooral hulpmiddelen zijn, zoals een bibliotheek en een typemachine (weet nog iemand wat dat was?). Dan zijn een eindtoets en een toezichthouder nog bescheiden controlemaatregelen.
We gaan nu in op de eindtoets en zijn tegenwoordige verschijningsvorm.
Wat is een toets?
De klassieke Eindtoets Basisonderwijs van het Cito3 was tot 2014 de enige eindtoets en werd door ongeveer 90 procent van de basisscholen jaarlijks gebruikt. Sinds 2015 zijn er diverse aanbieders van eindtoetsen op de markt. Het cvte, de Commissie voor Toetsen en Examens4, dat valt onder het ministerie van Onderwijs, Cultuur en Wetenschap (ocw), bepaalt of een toets wordt toegelaten. Hiervoor is de Expertgroep Toetsen po (Expertgroep5) in het leven geroepen. Gebaseerd op onder andere externe onderwijskundige experts en de cotan (Commissie Testaangelegenheden Nederland6), beoordeelt de Expertgroep de eindtoetsen basisonderwijs en adviseert zij de minister over toelating van een eindtoets voor het primair onderwijs.
We houden voor het gemak de definitie7 van een toets aan zoals het Cito die geeft: Een toets is een instrument voor het meten van iemands kennis en vaardigheden (praktische vaardigheden en houdingen) die door middel van studie en/of onderwijs op een of ander vakgebied zijn verworven.
Aan een toets worden in het algemeen diverse psychometrische kwaliteitseisen gesteld, waarvan we de belangrijkste (De Groot, 1961; Drenth & Sijtsma, 2006; Evers, Lucassen, Meijer, & Sijtsma, 2009; zie ook Sanders, Brouwer, Eggen, & Veldkamp, 2018, voor een alternatief maar op vele punten vergelijkbaar beoordelingssysteem), kort noemen:
Inhoudsvaliditeit: De vragen moeten de stof goed dekken, dus niet eenzijdig over een bepaald onderwerp gaan, terwijl over andere onderwerpen geen vragen worden gesteld. Voor een goede toetsprestatie is het dus ook nodig dat een leerling de gehele stof leert en beheerst.
Predictieve (voorspellende) validiteit: De eindtoetsscore moet een goede voorspelling leveren van het meest geschikte vervolgonderwijs. Dat zou kunnen door na tenminste een jaar na te gaan waar een leerling terecht is gekomen en wat haar schoolprestaties zijn. Er zijn grofweg vier uitkomsten, waarvan twee gewenst (Goed) en twee ongewenst (Fout) zijn:

Als voorbeeld nemen we de voorspelling of een leerling het beste op het vmbo tot haar recht komt. De goede voorspellingen zijn dat geschikte leerlingen worden toegewezen (rechtsboven) en ongeschikte leerlingen afgewezen (linksonder). De twee fouten zijn dat ongeschikte leerlingen worden toegewezen (linksboven) en geschikte leerlingen afgewezen (rechtsonder). Door middel van empirisch onderzoek kan worden nagegaan of de cesuur (grensscore) het aantal goede voorspellingen maximaliseert en daarmee het aantal fouten minimaliseert. Aanpassingen van de cesuur zijn gering omdat het niveau van de cohorten over de jaren niet met grote sprongen verandert. Daardoor veranderen percentages weinig.
Betrouwbaarheid: De toetsprestatie moet herhaalbaar zijn onder dezelfde omstandigheden. Dus je wilt niet dat een toetsscore voor een bepaalde leerling vandaag leidt tot een vwo-advies en morgen tot een vmbo-advies (of andersom). Naarmate de toets langer is, dus meer vragen bevat en dus meer informatie oplevert, is de toetsscore betrouwbaarder en is de toetsscore minder een momentopname.
Normen: Een toetsscore moet ergens aan gerelateerd kunnen worden om betekenis te hebben. Dat kan door de score te relateren aan de verdeling van scores van alle leerlingen (relatief normeren; hoe doet iemand het in vergelijking met anderen?) en aan het niveau van de vakinhoud (absoluut normeren; hoe goed kan iemand rekenen?).
Het maken van een goede toets is lastig en vereist veel kennis en onderzoek. Organisaties zoals het Cito en in de Verenigde Staten Educational Testing Service8, dat ooit model stond voor het Cito, zijn erin gespecialiseerd. Maar ook aan de universiteiten is er veel kennis beschikbaar. Aan de buitenkant is niet zo goed zien of een toets psychometrisch aan de maat is. Het kan er allemaal glimmend en modern uitzien en toch weinig voorstellen, terwijl een saaie en ouderwets aandoende presentatie juist een uitstekende toets kan betreffen. Het duurt een tijd voordat je kunt nagaan of leerlingen op basis van een advies goed of fout zijn terechtgekomen. Van een weervoorspelling weet je morgen al of hij klopte en ook van een wasmachine of een auto weet je sneller of het een miskoop was.
De cotan beoordeelde vijf thans gangbare eindtoetsen op de zeven criteria waarop men alle tests en toetsen beoordeelt (Evers et al., 2009). Daar vielen ook onder de predictieve validiteit, waarvoor de cotan de benaming criteriumvaliditeit gebruikt, de betrouwbaarheid en de beschikbaarheid van normen, terwijl de inhoudsvaliditeit bij de cotan onder de bredere begripsvaliditeit valt. De overige drie criteria hebben betrekking op de kwaliteit van de toetsconstructie, het testmateriaal en de handleiding.
We slaan de details over en stellen vast dat voor vijf van de zeven beoordelingscriteria voor alle toetsen minstens een voldoende werd gegeven, maar dat bij enkele toetsen zich problemen voordeden op de criteria normen en criteriumvaliditeit. Dit zijn traditiegetrouw de criteria waar toetsen en psychologische tests vaak de grootste tekortkomingen hebben (Drenth & Sijtsma, 2006). Voor een goede normering is een grote en representatieve steekproef vereist en voor de criteriumvaliditeit is longitudinaal onderzoek vereist. Beide zijn vaak om uiteenlopende redenen lastig te realiseren.
Het bestaan van vijf eindtoetsen van vijf verschillende aanbieders naast elkaar maakt het niet gemakkelijker om de waarde van een eindtoets in te schatten
Geschiedenis, ontwikkeling, nabije toekomst
De Eindtoets Basisonderwijs van het Cito was de voortzetting van de Amsterdamse Schooltoets, die in 1966 werd ontwikkeld door de psycholoog Adriaan de Groot. De Groot, onder andere bekend van zijn indertijd opzienbarende publicatie Vijven en Zessen (De Groot, 1966) waarin hij een lans brak voor objectief toetsen en het terugdringen van de subjectiviteit van de leerkracht in de beoordeling van de leerling, was in 1968 de grondlegger van het Cito (Veldhuizen, 2019). Tot 2014/2015 bleef de Eindtoets Basisonderwijs voor de meeste scholen leidend bij schooladvies. Er was op dat moment zowel maatschappelijk als politiek veel weerstand ontstaan tegen de belangrijke rol die de Eindtoets speelde in het schooladvies na de basisschool. Middelbare scholen waren begonnen Eindtoetsscores als doorslaggevende selectiecriteria te gebruiken en basisscholen werden beoordeeld op gemiddelde Eindtoetsscores. Bij alle opwinding begon men de waarde van objectieve beoordeling te vergeten. Ook gingen commerciële partijen zich met de Eindtoets bemoeien en eisten zij een marktaandeel, wat vervolgens door de politiek mogelijk werd gemaakt.
In 2014 werd de wettelijke regeling Toetsbesluit po9 ingevoerd. De Eindtoets werd in het vervolg de Centrale Toets. De afname werd verplaatst van februari naar eind april. Er werden nu ook private toetsaanbieders op de markt toegelaten. De eindtoets, niet noodzakelijk de toets van het Cito, werd verplicht op alle basisscholen. Het naast elkaar bestaan van diverse eindtoetsen betekende echter dat de scores op verschillende toetsen onvergelijkbaar waren en achteraf vergelijkbaar moesten worden gemaakt. Hiervoor diende de overheid te zorgen, en deze taak kwam bij de Expertgroep terecht.
De toets ‘weet’ niet dat een tegenvallende toetsprestatie mede te wijten kan zijn aan de thuissituatie
De rol van de eindtoets veranderde. Deze toets werd in april afgenomen, terwijl het initiële schooladvies, dat voor 1 maart werd gegeven, leidend werd. Dit schooladvies kon (maar hoefde niet) naar boven bijgesteld te worden op basis van het resultaat van de eindtoets. Bijstelling naar beneden kon niet; een leerling die op basis van een schooladvies te hoog werd ingeschat, kon na een slechte toetsprestatie niet meer een lager schooladvies krijgen. Dit was voor 2014 anders. De score op de Eindtoets Basisonderwijs had een veel dominantere rol, ook al werd die rol niet wettelijk voorgeschreven. Na 2014 konden ouders nog meer druk uitoefenen op scholen om een hoger advies te geven. Overigens wil dit niet zeggen dat er voor 2014 niet onderhandeld werd. Toegenomen druk van ouders is een algemener maatschappelijk fenomeen.
Inmiddels is bij wet in 2022 de Centrale Toets alweer omgedoopt in de Doorstroomtoets. Dit gaat in per 2023-2024. De opvallendste verandering is dat een Doorstroomtoetsscore die een hoger schooladvies suggereert dan het eerder gegeven schooladvies, nu dwingend leidt tot een bijstelling van het schooladvies naar boven. Een bijstelling naar beneden was sinds 2014 al onmogelijk en een bijstelling naar boven was niet verplicht, maar nu is die verplichting er dus wel.10
We vragen ons af waarom bij wet de toetsscore moet worden gevolgd behalve wanneer dit tot een lager schooladvies zou leiden. Zo werk je in de hand dat sommige leerlingen een te hoog schooladvies krijgen en in het vervolgonderwijs op hun tenen moeten lopen. Ook geldt dat consequent te hoge initiële schooladviezen zelden door de toets kunnen worden gecorrigeerd. Trouwens, een leerling die bijles heeft gehad en daardoor een ongewoon goede toetsprestatie levert, verhoogt hiermee het initiële schooladvies. Is dit de bedoeling?
Vaste regels, geen willekeur
Een Eindtoets Basisonderwijs, Centrale Toets of Doorstroomtoets zijn bakens waarop scholen kunnen koersen. De Eindtoets Basisonderwijs had voor 2014 een belangrijke rol en gaf jaren vaak de doorslag bij het schooladvies. Er werden echter ook regelmatig bezwaren geopperd. Een viertal daarvan nemen we onder de loep.
1. Zo’n toets met een cruciale rol in de doorverwijzing naar vervolgonderwijs werkt ‘teaching to the test’ in de hand.
Dat zou waar kunnen zijn, maar is dat erg? Als de inhoudsvaliditeit in orde is, wordt getoetst wat belangrijk is. En dus wordt onderwezen wat belangrijk is. Het is niet zo dat de toets het onderwijs in een verkeerde richting leidt. Verder weet de school natuurlijk niet vooraf wat er precies getoetst gaat worden. Breed georiënteerd onderwijs is dus noodzakelijk.
2. De toets toetst vooral taal en rekenen en bevoordeelt daarmee kinderen van hoogopgeleide ouders.
Klopt, die ouders kunnen kun kinderen beter helpen en bijvoorbeeld voor bijles zorgen. Dat blijft zo, ook als je de toets qua inhoud zou verbreden en andere vakken zou opnemen; hoogopgeleide ouders kunnen hun kinderen ook daarmee beter helpen. Het is belangrijk dat de school aandacht heeft voor dit fenomeen en iedereen voldoende aandacht en ondersteuning geeft.
3. De toets geeft een mechanische indruk, het leerkrachtoordeel is beter.
Dat oordeel is zeker belangrijk, maar al lang is bekend dat mensen, inclusief onderwijzers, gebrekkige beoordelaars zijn (Kahneman, 2011). Een voorbeeld is selectieve beoordeling, waarbij – zonder dit expliciet te benoemen en misschien zelfs onbewust – een aspect van iemands functioneren wordt beoordeeld dat de beoordelaar nou net belangrijk vindt terwijl andere, relevante informatie wordt genegeerd. Zo kan bij leerlingen uit minderheidsgroepen de thuissituatie worden meegewogen ten koste van goede onderwijsprestaties terwijl dat bij anderen niet gebeurt. De psycholoog Paul Meehl (1954) vond al bijna 70 jaar geleden dat het gebruik van een vaste regel die eenvoudig alle informatie optelt tot minder fouten leidt dan het menselijk oordeel. Mensen kunnen dit resultaat maar moeilijk accepteren. Ze hebben de neiging zichzelf als uitzonderlijk en dus superieur aan een toets te beschouwen. Een toets kent ook beperkingen. Zo ‘weet’ de toets niet dat een tegenvallende toetsprestatie mede te wijten zou kunnen zijn aan de thuissituatie. Op basis van mogelijk eerdere, goede leerprestaties zou de docent dan de voorspelling kunnen bijstellen. Wat staat, is dat een toets geen last heeft van vooroordelen en slechts het niveau registreert.
4. De toets wordt gebruikt voor vroege selectie voor vervolgopleidingen, terwijl kinderen langer bij elkaar moeten blijven om van elkaar te leren.
Die vroege selectie is waar, maar het tijdstip van selectie is een politieke kwestie die niets met een toets te maken heeft. Je kunt ook selecteren na de eerste twee jaar van het voortgezet onderwijs. Daarvoor zou je ook weer een objectieve, centrale toets kunnen gebruiken. Een landelijke toets heeft ook het voordeel van vergelijkbaarheid.
Eindopmerkingen
Gezien de complexiteit van het onderwijsveld, is het onwaarschijnlijk dat de Eindtoets Basisonderwijs – een term die overigens al een tijd niet meer wordt gebruikt – de bron is van alle kwaad in het onderwijs, zoals kansenongelijkheid. We hopen duidelijk te hebben gemaakt dat kansenongelijkheid een tamelijk vaag begrip is dat in de praktijk niet valt te operationaliseren en toe te passen. Het enige dat kan helpen is uitstekend onderwijs voor iedereen en extra hulp voor diegenen die dat nodig hebben. Grondwet en Wet leggen heel weinig restricties op aan wat er onderwezen wordt en hoe. Dat vraagt om middelen die richting bieden en de vergelijkbaarheid herstellen. Toetsen kunnen die rol vervullen.
Voorafgaand aan 2014 was de Eindtoets Basisonderwijs van het Cito de enige toets die gebruikt werd voor het schooladvies. Deze toets kreeg zeer goede beoordelingen van de cotan (Evers et al., 2000a). Het bestaan van diverse eindtoetsen, ook al zijn ze door ocw op de markt toegelaten en hebben ze dus dat kwaliteitskeurmerk, noodzaakt basisscholen zich serieus te verdiepen in de wetenschappelijke kwaliteit van de toetsen en een goed onderbouwde keuze te maken. In de situatie na 2014 diende men zich te verdiepen in de vraag hoe een lerarenoordeel tot stand komt als men een toetsadvies dat hoger uitkwam naar beneden wilde bijstellen. Met de verplichting vanaf 2023 om de Doorstroomtoets te negeren als die lager uitvalt en te volgen als die hoger uitvalt, wordt er nadrukkelijk voor gekozen de toets selectief te gebruiken ten gunste van een hoog schooladvies.
Men kan zich natuurlijk afvragen of het wel zin heeft gehad om de stap te maken van een enkele eindtoets naar een situatie met diverse toetsaanbieders die een correctie achteraf ter wille van de vergelijkbaarheid nodig maken. Hiermee worden vele belangen gediend, maar wat heeft een leerling eraan? Een uitstekende eindtoets aan het einde van de basisschool, geregisseerd door de overheid en goed gebruikt in de voorspelling van het meest geschikte vervolgonderwijs, was zo gek nog niet. Leerlingen zijn gebaat bij een zo objectief mogelijk oordeel over hun geschiktheid en de vrijheid in ons onderwijssysteem wordt enigszins beteugeld door hetzelfde doel waarnaar alle scholen moeten streven.
Kansenongelijkheid was in de negentiende eeuw, zij het onuitgesproken, de basis van de sociale orde. Nederland was een standensamenleving, met een kleine bovenklasse voor wie het gymnasium en de universiteit toegankelijk waren. Voor de anderen, en zeker voor de zeer grote onderklasse, resteerde er bitter weinig op het gebied van onderwijs (Willink, 1998). Halverwege de negentiende eeuw veranderde er onder de regering van de liberale politicus Thorbecke wel wat, maar tot aan de jaren vijftig en zestig van de vorige eeuw was Nederland nog steeds een standensamenleving, met informele kansenongelijkheid. De zoon van de havenarbeider ging in de regel niet naar de hbs, en de zoon van de notaris wel. Voor meisjes en vrouwen bleef alles lange tijd nog restrictiever.
Er is sinds de jaren zestig veel veranderd, maar er zijn verschillen tussen gezinnen qua inkomen, opleiding, motivatie, enzovoort. We denken dat vrijwel iedereen wel vindt dat alle kinderen uitstekend onderwijs moeten krijgen. Bevorderen van toegang tot goed onderwijs betekent aandacht voor leerlingen uit minder bevoorrechte groepen door goed opgeleide en betaalde leraren, maar ook door gebruik van objectieve toetsen om het niveau vast te stellen. Toetsen zijn niet perfect, maar ze verwerken grote hoeveelheden informatie zonder noemenswaardige problemen, hebben geen last van vooroordelen, maken het schooladvies minder onderhandelbaar, en laten zien wat het kind kan.
Toetsen hebben geen last van vooroordelen, maken het schooladvies minder onderhandelbaar, en laten zien wat het kind kan
Bronnen:
- https://www.denederlandsegrondwet.nl/id/vi5kn3s122s4/artikel_23_het_openbaar_en_bijzonder
- https://wetten.overheid.nl/BWBR0003420/2022-07-14
- https://www.cito.nl
- https://www.cvte.nl
- https://www.expertgroeptoetsenpo.nl
- https://www.cotandocumentatie.nl/cotan/
- https://www2.cito.nl/static/oenw/ttb/beglist1.htm#TOETS
- https://www.ets.org
- https://wetten.overheid.nl/BWBR0035216/2019-08-01
- https://www.poraad.nl en https://www.poraad.nl/uploads/2022-11Wetsvoorstel%20doorstroomtoetsen%20po.pdf
Beeld: Shutterstock