Onderzoek toont aan dat docenten eenzelfde prestatie van studenten zeer verschillend kunnen beoordelen. Inzichten van docenten, gewoonten op het gebied van beoordelen, voorkeur voor bepaalde onderwerpen, specifieke deskundigheden van docenten, enzovoort kunnen hieraan ten grondslag liggen. Hiermee is natuurlijk niet gezegd dat beoordelingen in al deze omstandigheden van minder goede kwaliteit zouden zijn. De goede kwaliteit van een beoordeling wordt nog wel eens verdedigd door te stellen dat de beoordeling van een tweede beoordelaar niet in belangrijke mate afweek van de eigen beoordeling.
Op zichzelf is dat natuurlijk goed, maar wat betekent ‘niet in belangrijke mate’? Laten we uitgaan van een groep van dertig leerlingen. Bij een vergelijking van de twee beoordelingen blijkt er bijvoorbeeld bij zes leerlingen een verschil te zijn van één punt op tien en bij twee leerlingen een verschil van twee punten op tien. Wanneer bij de betreffende groep leerlingen alle cijfers tussen 1 en 10 aan één of enkele leerlingen zijn toegekend is het resultaat zonder meer indrukwekkend, maar wanneer beide beoordelaars alleen de cijfers 5, 6, 7 en 8 hebben toegekend wijkt het resultaat nauwelijks af van toeval. Indien de gebruikelijke cijferschalen slechts in beperkte mate worden gebruikt – in de praktijk is dat nogal eens het geval – is het bericht dat er slechts weinig grote afwijkingen zijn, niet zo overtuigend. Daarnaast is het van belang na te gaan of een zogenaamde onafhankelijke tweede correctie wel echt onafhankelijk is. Wanneer de eerste corrector aantekeningen maakt op het door de leerling ingeleverde werk kan men vragen stellen bij de onafhankelijkheid. Wanneer er contact is tussen eerste en tweede corrector voordat de definitieve beoordeling wordt vastgesteld kan dat ook twijfels oproepen aan de onafhankelijkheid. Het voorgaande mag overigens niet suggereren dat er in de praktijk op ruime schaal sprake zou zijn van aanvechtbare onafhankelijkheid.
Wel mag worden geconstateerd dat overtuigende bewijzen voor een echte onafhankelijkheid niet altijd aanwezig of beschikbaar zijn. Het zou een goede zaak zijn meer aandacht te besteden aan het beschikbaar maken van deze overtuigende bewijzen. Duidelijk is immers dat bewijzen voor een goede kwaliteit van beoordelingen uitermate gewenst zijn. Alleen de enkelvoudige mededeling van een docent dat zijn beoordelingen van goede kwaliteit zijn is onvoldoende. Wanneer een docent stelt dat zijn beoordelingen van goede kwaliteit zijn, is dat het uitgangspunt. De vraag op grond waarvan die mededeling wordt gedaan is vervolgens aan de orde. Welke stappen heeft de docent genomen om de goede kwaliteit van zijn beoordelingen vast te stellen. Zijn de leerlingen tevreden? Zijn collega’s het met de beoordelingen eens? Heeft de leiding geen vragen? Zijn de slaagcijfers bevredigend? Welke criteria zijn daadwerkelijk aangelegd om de beoordelingen als kwalitatief goed te beoordelen? Het is niet nodig om de uitspraak over kwalitatief goede beoordelingen op voorhand te wantrouwen, maar het is wenselijk om na te gaan of alle voor de hand liggende valkuilen feitelijk zijn vermeden.
Prof.dr. W.H.F.W. Wijnen was hoogleraar Ontwikkeling en Onderzoek van het Hoger Onderwijs aan de Universiteit van Maastricht.