R.L. Brennan (Ed.) (2006). Educational measurement (fourth edition). Westport: Praeger Publishers. ISBN 0-275-98125-8.
Aan de vierde editie van Educational measurement gingen drie eerdere edities vooraf die respectievelijk in 1951, 1971 en 1989 verschenen. Net zoals de eerste drie edities is ook de vierde editie weer een indrukwekkend naslagwerk van 21 hoofdstukken met in totaal 779 pagina’s. Deze vierde editie is dan ook verplichte literatuur voor iedereen die op een of andere wijze betrokken is bij educational measurement.
Hoofdstuk 1 is geschreven door de editor Robert Brennan en gaat in op de ontwikkeling en toekomst van educational measurement. Hij wijst op de wenselijkheid te komen tot een integratie van modellen van klassieke testtheorie, generaliseerbaarheidstheorie en itemresponstheorie.
In hoofdstuk 2, Validition, wordt de argument-based approach voor het valideren van meetinstrumenten (toetsen, examens, assessments) gepresenteerd. Bij deze benadering is sprake van twee soorten argumenten, het interpretatieve argument en het validiteitsargument. In het interpretatieve argument wordt uiteengezet hoe op basis van het getoonde gedrag in een test uitspraken over het gedrag buiten de test gedaan kunnen worden, terwijl in het validiteitsargument de aannemelijkheid van het interpretatieve argument aangetoond moet worden.
In hoofdstuk 3, Reliability, wordt naast een gedegen beschrijving van betrouwbaarheid binnen de kaders van de klassieke testtheorie en de generaliseerbaarheidstheorie, ook de nodige aandacht besteed aan de betrouwbaarheid van classificaties.
In hoofdstuk 4, Item Response Theory, wordt wel veel aandacht aan theoretische toepassingen maar weinig aandacht aan de vele creatieve toepassingen van deze modellen gegeven.
In hoofdstuk 5, Scaling and Norming, wordt er nogmaals op gewezen om bij de constructie van scoreschalen rekening te houden met de betrouwbaarheid van het meetinstrument.
Op een nogal theoretische en abstracte wijze wordt in hoofdstuk 6, Linking and Equating, beschreven hoe verschillende meetinstrumenten ‘vergelijkbaar’ gemaakt kunnen worden.
Voor ontwikkelaars van meetinstrumenten is hoofdstuk 7, Test Fairness, een interessant hoofdstuk met besprekingen over fairness, dif en bias.
In hoofdstuk 8, Cognitive Psychology and Educational Measurement, wordt geschetst hoe de kennisbasis van de cognitieve psychologie ingezet kan worden bij het ontwerpen van meetinstrumenten.
Hoofdstuk 9, Test Development, waarin zeven componenten van het toetsconstructieproces onderscheiden en besproken worden, is een informatief hoofdstuk voor iedereen die bij het ontwikkelen van toetsen betrokken is.
In hoofdstuk 10, Test Administration, Security, Scoring and Reporting, wordt uitgebreid aandacht besteed aan het opsporen en voorkomen van toetsfraude.
Hoofdstuk 11, Performance Assessment, bevat een gedegen beschrijving van het ontwerpen van assessments en wordt ingegaan op de beoordeling en analyse van de toetsresultaten.
In hoofdstuk 12, Setting Performance Standards, worden de voor- en nadelen van de vele standaardbepalingsprocedures die in omloop zijn besproken.
De technologische ontwikkelingen waarmee nagenoeg alle aspecten van educational measurement te maken hebben, komen in hoofdstuk 13, Technology and Testing, aan de orde.
De hoofdstukken 14 tot en met 21 hebben vooral betrekking op onderwerpen uit het Amerikaanse onderwijs. Hoofdstukken over tweede taaltoetsing, toelating tot het hoger onderwijs, ethische zaken, maar zeker ook het hoofdstuk over certificering, kunnen ook voor de Nederlandse lezer interessante informatie bevatten.
Hoewel alle hoofdstukken door Amerikaanse auteurs geschreven zijn, mag niet onvermeld blijven dat Nederlandse wetenschappers aan deze editie indirect een aanzienlijke bijdrage hebben geleverd. In de verschillende hoofdstukken wordt naar een groot aantal artikelen van ongeveer 40 Nederlandse wetenschappers, afkomstig van Nederlandse universiteiten en Cito, verwezen.
Dr. P.F. Sanders, Research Center voor Examinering en Certificering, Cito, Arnhem.