Samenvatting

What to do with confidence intervals in intelligence tests?

K. Lek, W. van de Schoot-Hubeek, E. Kroesbergen & R. van de Schoot

The IQ-score of a child at a certain moment in time depends on many factors, including his/her attention and motivation, the test environment and the test leader. This makes that the IQ-score is not a perfect reflection of the intelligence of a child. In the interpretation of the IQ-score it is therefore advisable to take the accompanying 95% confidence interval into account, which acts as a ‘margin of error’. Problematic with this confidence interval, however, is that its meaning is often misunderstood. In this paper, we discuss the exact meaning and interpretation of the confidence interval in intelligence tests.


2609 Weergaven
23 Downloads
Log in
Het 95% betrouwbaarheidsinterval in de verslaglegging van intelligentietests kan grofweg geïnterpreteerd worden als een soort ‘foutenmarge’ rondom de verkregen IQ-score van het kind. De exacte interpretatie ligt ingewikkelder. Genoemd interval staat er dan ook om bekend vaak verkeerd geïnterpreteerd te worden. Daarom bieden Kimberley Lek en collega’s een ‘opfrisser’: hoe wordt een betrouwbaarheidsinterval ook al weer opgesteld ? De WISC-IIINL wordt gebruikt ter illustratie.

De IQ-score die een kind1 op een bepaald moment haalt, hangt af van allerlei factoren. Zo kunnen IQ-scores beïnvloed zijn door werkhoudings- en/of aandachtsproblemen (Pameijer, 2014)15, testleider-effecten, zoek- en rekenfouten bij de verwerking, storende factoren bij de afname (Tellegen, 2004)20, vermoeidheid, stemming, faalangst (Schouws, 2015)18 et cetera. Daarom kan de IQ-score niet té strikt geïnterpreteerd worden (Tellegen, 2004). Om al te absolute interpretatie tegen te gaan, is het raadzaam gebruik te maken van het bijbehorende betrouwbaarheidsinterval; een soort foutenmarge. Het interpreteren van dit betrouwbaarheidsinterval blijkt echter niet zo makkelijk te zijn.

Stel, bijvoorbeeld, dat u net een WISC-IIINL afgenomen heeft bij Julia. Zij heeft een (T)IQ-score behaald van 97, met bijbehorend 95% betrouwbaarheidsinterval lopend van 90 tot 104. Hoe zou u dit betrouwbaarheidsinterval interpreteren? Eind 2014 hebben wij deze vraag gesteld aan 293 psychologen verbonden aan het NIP. Analyse van de reacties toonde een variëteit aan van mogelijke interpretaties van het 95% betrouwbaarheidsinterval. Dit is

Literatuurlijst

  1. Barnett, A.G., van der Pols, J.C. & Dobson, A. J. (2005). Regression to the mean: what it is and how to deal with it. International Journal of Epidemiology, 34, 215-220.
  2. Borsboom, D., Romeijn, J.-W. & Wicherts, J.M. (2008). Measurement invariance versus selection invariance: is fair selection possible? Psychological Methods, 13(2), 75-98.
  3. Charter, R.A. & Feldt, L.S. (2001). Confi dence intervals for true scores: is there a correct approach? Journal of Psychoeducational Assessment, 19, 350-364.
  4. Crawford, J.R. (2004). Psychometric foundations of neuropsychological assessment. In L.H. Goldstein & J.E. McNeil (Eds.), Clinical neuropsychology: a practical guide to assessment and management for clinicians (p. 121–140). John Wiley & Sons, Ltd.
  5. Embretson, S.E. (1996). The new rules of measurement. Psychological Assessment, 8(4), 341-349.
  6. Evers, A., Lucassen, W., Meijer, R. & Sijtsma, K. (2010). COTAN beoordelingssysteem voor de kwaliteit van tests (geheel herziene versie). FMG: Psychology Research Institute.
  7. Glutting, J. & Oakland, T. (1993). GATSB Guide to the Assessment of Test Session Behavior for the WISC-III and the WIAT. Psychological Corporation.
  8. Guilford, J.P. (1936). Psychometric methods. New York: McGraw-Hill.
  9. Hoekstra, R., Morey, R.D., Rouder, J.N. & Wagenmakers, E.-J. (2014). Robust misinterpretation of confi dence intervals. Psychonomic Bulletin & Review, 21(5), 1157-1164.
  10. Huff, D. (2010). How to lie with statistics. New York: W. W. Norton & Company.
  11. Kelley, T.L. (1947). Fundamentals of statistics. Cambridge: Harvard University Press.
  12. Lord, F.M. & Novick, M.R. (1986). Statistical theories of mental test scores. Reading, MA: Addison-Wesley.
  13. McManus, I.C. (2012). The misinterpretation of the standard error of measurement in medical education: a primer on the problems, pitfalls and peculiarities of the three different standard errors of measurement. Medical Teacher, 34 (7), 569-576.
  14. Molenaar, P.C.M. (2004). A manifesto on psychology as idiographic science: Bringing the person back into scientifi c psychology – This time forever. Measurement, 2, 201-218.
  15. Pameijer, N. (2014). Waarom een ontwikkelingsperspectief meer is dan IQ en leerrendement. Geraadpleegd op 13-02-2017, van http://wijleren.nl/intelligentietest-passend-onderwijs.php
  16. Resing, W.C.M. & Blok, J.B. (2002). De classificatie van intelligentiescores: voorstel voor een eenduidig systeem. De Psycholoog, 37, 244-249.
  17. Sijtsma, K. (2009). On the use, the misuse, and the very limited usefulness of Cronbach’s Alpha. Psychometrika, 74(1), 107-120.
  18. Schouws, S. (2015). Zin en onzin van het meten van intelligentie. Psycho- Praktijk, 3, 34-36.
  19. Tellegen, P. (2002). De handleiding van de WISC-IIINL: correcties, opmerkingen en suggesties. Verkregen via: http://www.testresearch.nl/wisc/wiscopm.html,16 februari 2016.
  20. Tellegen, P. (2004). De waan van “het” IQ. Verkregen via: http://www.testresearch.nl/tstdiagn/waaniq.html, 3 februari 2017.
  21. Van Ravenzwaaij, D. & Hamel, R. (2006). De Nederlandstalige WAIS-III na hernormering. De Psycholoog, 268–271.
  22. Wainer, H. (2000). Kelley’s paradox. Chance, 13, 47-48.
  23. Wang, Z. & Osterlind, S. J. (2013). Classical test theory. In T. Teo (ed.), Handbook of Quantitative Methods for Educational Research (p. 31-44). SensePublishers.
  24. Zachary, R.A. & Gorsuch, R.L. (1985). Continuous norming: implications for the WAIS-R. Journal of Clinical Psychology, 41, 86-94.