Doorzoek alle bundels


Bundel 15 | Vijftiende conferentie Het Schoolvak Nederlands (2002)

Bijdrage: De beoordeling van schrijfvaardigheid in de tweede fase (Bert Meuffels)
Download deze bijdrage in PDF-formaat »

voorgesteld om (schrijf)prestaties te beoordelen volgens een vaste, normale verdeling: 1% van de werkstukken moet een 10 krijgen, 6% een 9, 24% een 8, 38% een 7, 24% een 6, 6% een 5 en 1% een 4. Op deze manier worden verschillen tussen beoordelaars in gemiddelde, spreiding en percentages onvoldoende rigoureus tegengegaan. Maar dit voorstel, dat tegenwoordig nog steeds in het Amerikaanse onderwijssysteem wordt toegepast onder de naam `grading on the curve', tast de validiteit (d.w.z. de deugdelijkheid) van de beoordeling aan: een beoordelaar moet soms differentiaties aanbrengen waar hij ze niet ziet en - omgekeerd - verschillen veronachtzamen die hij wel degelijk aanwezig acht.

Ter bestrijding van de persoonlijke vergelijking zoekt men tegenwoordig meer zijn heil in schaalbeoordeling, met voorshands licht positieve resultaten (Schoonen 1991). Bij schaalbeoordeling moet een beoordelaar een opstel niet als een op zichzelf staand iets beoordelen, maar dit vergelijken met een reeks in kwaliteit oplopende voorbeeldopstellen (meestal vijf, soms ook drie) die al voorzien zijn van een cijfer. De taak van de beoordelaar bestaat eruit het te beoordelen opstel als het ware een plaats op die schaal te geven. Net zoals bij analytische beoordeling en bij het `grading on the curve' wordt ook bij schaalbeoordeling de vrijheid van een beoordelaar ingeperkt: elk product moet aan de hand van de gegeven voorbeelden, die al voorzien zijn van een cijfer, beoordeeld worden. Verwacht mag worden dat beoordelaars, doordat ze min of meer van hetzelfde interpretatiekader uitgaan, minder op 'drift' raken zodat de intersubjectieve overeenstemming toeneemt, een verwachting die enigszins bevestigd lijkt te worden door resultaten van empirisch onderzoek. Een praktisch nadeel van schaalbeoordeling is echter, zeker in het licht van de geringe betrouwbaarheidswinst die daarmee te behalen valt, dat voor elk te beoordelen tekstkenmerk en voor elke opdracht telkens nieuwe beoordelingsschalen geconstrueerd moeten worden, een nogal bewerkelijke klus. Per type opdracht moet immers een groot aantal 'proefteksten' verzameld worden die, na te zijn beoordeeld door een jury van deskundigen, kunnen dienen als uitgangspunt van de schaalconstructie. In didactisch opzicht is het bovendien problematisch – wil schaalbeoordeling effectief zijn – dat alle leerlingen over precies hetzelfde onderwerp moeten schrijven.

Weer een ander type effect dat de betrouwbaarheid van de beoordeling kan aantasten, is het contaminatie-effect in engere zin. Een docent is, zeker wat het afsluitende examen betreft, direct belanghebbende bij de uitslag en het resultaat van zijn onderwijs; in deze zin is zijn beoordeling gecontamineerd (in engere zin). Voor een leerkracht die zich heeft ingezet en zich moeite heeft getroost om de schrijfvaardigheid van zijn leerlingen op een hoger peil te brengen, is het in psychologisch opzicht moeilijk de werkstukken op het eindexamen strikt onbevangen, onpartijdig en onbevooroordeeld te beoordelen: zijn eigen status en goede naam zijn in het geding. Waarschijnlijk vallen zijn oordelen te positief uit. Afdoende maatregelen ter bestrijding van dit effect (zoals inschakeling van onpartijdige beoordelaars die geen enkel persoonlijk belang bij de uitslag van een beoordeling hebben) zijn in theorie weer gemakkelijker bedacht dan dat ze in de weerbarstige praktijk van alledag kunnen worden uitgevoerd.

Naast het signifisch effect, het halo-effect, de persoonlijke vergelijking en het contaminatie-effect (in engere zin) kunnen nog tal van andere effecten de kwaliteit

De beoordeling van schrijfvaardigheid in de Tweede Fase - Bert Meuffels 1133