Ik ben maar een eenvoudige lesboer. Zo begon hij zijn bespiegeling. Ik laat ze de stof doorploegen en dan krijgen ze er een proefwerk over. Het doel van die toets is vast te stellen of ze de stof voldoende beheersen. Wie de stof voldoende beheerst, krijgt een zes. Wie iets beter presteert, krijgt een zeven en wie de toets heel goed gemaakt heeft, krijgt een acht of hoger. Mijn tienpuntsschaal is eigenlijk een combinatie van twee schalen: (a) voldoende of onvoldoende? en (b) in welke mate (on)voldoende? Mijn toetsen zijn er niet op gemaakt om exact vast te stellen of iemand een zeven dan wel een acht verdient. Als ik een acht geef, bedoel ik dat hij beter gepresteerd heeft dan een klasgenoot die een zeven heeft gekregen, maar ik heb niet de pretentie te kunnen verantwoorden hoevéél beter een acht is in vergelijking met een zeven. In absolute zin discrimineren mijn toetsen slechts binnen het cijfergebied rond de cesuur, dus tussen 4,5 en 6,5. Dat spreekt vanzelf: ik wil niet dat ze ten onrechte slagen en ook niet dat ze ten onrechte zakken. Aan het eind van het trimester bereken ik voor iedere leerling een rapportcijfer, een soort gewogen gemiddelde van de toetscijfers. Wiskundig gezien is dat uiterst aanvechtbaar: van scores op een ordinale schaal valt geen rekenkundig gemiddelde te berekenen. Maar ik vind het prima zo: (a) ik meet (absoluut) of hun toetsprestatie voldoende is; (b) de leerlingen komen (relatief) te weten hoe goed ze zijn in vergelijking met hun klasgenoten; en (c) op het rapport komt een cijfer waarin, naast mijn absolute beoordelingen (a), ook hun relatieve positie ten opzichte van hun klasgenoten (b) enigszins is meegewogen.
Lees verder … (PDF)