Door René Kneyber

We zijn nu inmiddels beland bij mijn derde blogpost voor deze website, en in zoverre u daar al niet eerder van overtuigd was denkt u inmiddels natuurlijk dat ik mijn verstand al volledig heb verloren. Schreef ik niet met Dominique Sluijsmans de bundel Toetsrevolutie: naar een feedbackcultuur in het voortgezet onderwijs? Waarom dan in blog 1 beargumenteren dat formatief toetsen niets met toetsen te maken heeft (en daarom formatief handelen moet heten), om dan in blog 2 te bepleiten dat formatief handelen niet om feedback gaat. Waarom dan niet gewoon het boek Revolutie: naar een cultuur in het voortgezet/hoger onderwijs noemen?

Nou, onderliggend aan de ideeën van Toetsrevolutie ligt niet alleen een andere didactische aanpak, maar ook wel degelijk een andere omgang met toetsen. In deze blog wil ik wat meer ingaan op wat wij denken over toetsing zelf.

Een onbehulpzaam onderscheid

Al sinds mijn eerste gesprek met haar in 2015 hamert Dominique Sluijsmans op het feit dat het onderscheid tussen formatief en summatief toetsen niet heel erg behulpzaam is.

Met het onderscheid bent u vast bekend. De functie van een toets bepaalt of iets formatief of summatief is. Toetsinformatie die formatief wordt ingezet, zoals ik dat vaak vertel, om de toekomst te verbeteren, ‘wat kan ik hiervan leren en wat moet ik nu doen/anders gaan doen?’. Wanneer toetsinformatie summatief wordt ingezet, dan wordt dat vooral gedaan om een oordeel te vellen over het leren tot nu toe, ‘je inspanning/prestatie tot nu toe was onvoldoende/voldoende/9/2,7/5’. Kunnen deze functies niet samengaan? Over het algemeen wordt aangenomen van niet. Het idee is dat ‘het leren stopt’ als er een cijfer wordt gegeven en feedback over hoe het anders kan, niet wordt gewaardeerd. Zie bijvoorbeeld het boek ‘Cijfers geven werkt niet’.

Deze gedachte leidt er vervolgens al snel toe dat summatief slecht is en formatief goed, of dat er teveel summatief getoetst wordt, en te weinig formatief. Op zich is dat helemaal geen vreemde gedachtegang. Veel scholen in het voortgezet onderwijs die ik bezoek nemen zo’n 40 toetsen voor een cijfer af per rapportperiode. Er was een school waar op zo’n 170 dagen per jaar toetsen konden worden afgenomen en er op meer dan de helft van die dagen ook een of meer toetsen werden afgenomen. Op sociale media zijn er genoeg ouders te vinden die zich heel terecht beklagen over de enorme hoeveelheid toetsen die kinderen (met name in de onderbouw) op zich af zien komen. No wonder, dat scholieren zich beklagen over de stress die dit allemaal oplevert.

Toch zie ik een vermindering van het aantal summatieve toetsen niet als de principiële oplossing. In essentie gaat wat mij betreft niet om de functie die een toets in isolement heeft, maar vooral om de functie die iets heeft binnen een bepaald toetsprogramma.

 

Zwaarwegende beslissingen

Het geheel aan toetsen binnen een leerroute of opleiding kun je beschouwen als een toetsprogramma. En dit toetsprogramma heeft een functie. Wat mij betreft is de belangrijkste functie van dit programma om onderbouwd bepaalde zwaarwegende beslissingen te kunnen nemen. In het HBO is de hoofdvraag die beantwoord moet worden ‘Is deze student een goede beroepsbeoefenaar?’. Dit roept uiteraard op tot allerlei vervolgvragen: hoe weten we dat iemand een goede beroepsbeoefenaar is, over welke kennis en vaardigheden moet zo iemand dan beschikken? En zo verder. Het toetsprogramma kan dan beschouwd worden als een gestructureerde aanpak om voldoende bewijs te verzamelen om een dergelijke beslissing gerechtvaardigd te kunnen nemen.

Een tweede functie van een toetsprogramma kan in relatie hiertoe staan: ‘Welke stappen moet deze student nog zetten om een goede beroepbeoefenaar te worden?’ Het toetsprogramma kan dan beschouwd worden als poging om inzichtelijk te maken waar de student staat en welke stappen de student moet nog zetten.

Uiteraard zijn er wellicht nog andere vragen die beantwoord moeten worden, bijvoorbeeld ‘Denken we dat deze student deze opleiding kan afmaken?’. Maar waar het hier wat mij betreft telkens om gaat is dat een herziening van een toetsprogramma begint bij het formuleren van het doel of de doelen van het toetsprogramma, en dat er vervolgens wordt nagedacht welk bewijs verzameld moet worden om een bepaalde vraag of bepaalde vragen te beantwoorden. Deze gerichte informatieverzameling kun je dan beschouwen als functioneel toetsen.

Disfunctionele toetsing is de kern van het probleem in het vo

Als we naar de huidige toetspraktijken in bijvoorbeeld het voortgezet onderwijs kijken dan valt op dat de fundamentele vragen over het toetsprogramma niet gesteld worden: ‘Welke vraag willen we beantwoorden met ons toetsprogramma?’, en ‘Welk bewijs hebben we daarvoor eigenlijk minimaal nodig?’.

Welke belangrijke, zwaarwegende beslissingen willen we nemen in het voortgezet onderwijs? ‘Mag de leerling over’, ‘Op welk niveau heeft deze leerling de meeste kans van slagen?’, zijn typische vragen die we willen beantwoorden. De manier waarop vrijwel alle scholen deze vraag heden ten dage willen beantwoorden is door een hele batterij van toetsen af te nemen, het gemiddelde van de cijfers hiervan te nemen, en eventueel daar weer een gemiddelde van te nemen, om daar vervolgens conclusies aan te verbinden. ‘Wie hoger dan een 6,7 gemiddeld heeft, mag naar de havo.’

Het eerste wat ik hierover wil opmerken is dat het zo beschouwd al als niet heel zinnig overkomt, want al die vakken hebben andere inhouden, andere wegingen, en andere hoeveelheden aan toetsen, dus welke voorspellende waarde heeft zo’n gemiddelde nou?

Het wordt extra onzinnig als je beseft dat veel scholen die dit eens hebben laten evalueren erachter zijn gekomen dat de resultaten in klas-2 of in klas-1 een slechte graadmeter zijn voor hoe iemand het in het examenjaar doet. Daarnaast is het extra vreemd dat we met een hele armada aan testen een strikt onderscheid proberen vast te stellen (BB/KB/TL/havo/vwo/etc.) dat in de praktijk helemaal niet zo strikt bestaat. Het eerste disfunctionele wat we dus kunnen vaststellen is dat zowel leerlingen (die dit allemaal doormaken, en zich daar evt. op voorbereiden) en leraren (die al die toetsen moeten ontwerpen en dit na moeten kijken) heel veel tijd stoppen in het verzamelen van informatie waarbij niemand echt geholpen is. (Om overigens elk jaar weer tot de conclusie te komen dat 95% van de leerlingen gewoon over mag.)

“Zweten, weten en vergeten”

Het tweede is dat veel van deze informatieverzameling gericht is op het ‘in kaart’ brengen van de stand van zaken omtrent inhoudelijke kennis en vaardigheden. Maar wat we gemakkelijk vergeten is dat er een verschil zit tussen de geleverde prestaties en wat een leerling eventueel (voor de lange termijn) geleerd heeft. Bovendien is een gevolg van al die toetsen dat veel leerlingen kortetermijnstrategieën gaan hanteren, en vertonen de meeste inspanning juist vlak voor de toets, maar zijn daardoor juist snel daarna veel weer vergeten. Een cijfer zegt dan wel iets over het beheersingsniveau op dat moment, maar daar is dan ook alles mee gezegd. Ik zou niet durven beweren dat hier dan ook een voorspellende waarde van uit gaat. Het enige wat je hiervan opsteekt is dat iets zegt over het eventuele vermogen van de leerlingen om zich in de toekomst ook in een dergelijke onderwijscontext te handhaven.

Ik wil hiermee uiteraard het nut van een kennis- en vaardighedentoets niet afvlakken, maar ik wil hier wel vraagtekens zetten bij de hoeveelheid, de inhoud ervan, en de functie hiervan binnen een toetsprogramma.

Begin niet met wrikken aan het toetsprogramma

Wat mij betreft kan en moet het toetsprogramma in het voortgezet onderwijs anders. Maar dat zit hem dus niet automatisch in het verminderen van de summatieve toetsen en het vermeerderen van de formatieve toetsen of formatief handelen, het gaat – kortom – niet om de kwantiteit. Nee, we zullen eerst terug moeten naar de fundamentele vraag, waartoe toetsen we eigenlijk, en het bestaan, inhoud en vormgeving van iedere toets in het licht van deze vraag moeten beschouwen.

In een volgende post kan ik wat uitgebreider stil staan bij hoe samenhang tussen doelen en programma er uit kan zien, maar mijn waarschuwing is en blijft dat hoe onwenselijk een huidige toetspraktijk ook moge zijn, ik desondanks adviseer om eerst de vaardigheden van leraren in het formatief handelen te vergroten en pas daarna te gaan sleutelen aan het toetsprogramma.

Toetsing is tenslotte een fundamenteel onderdeel van het onderwijs, en ondanks de soms kwalijke kanten van de huidige praktijk ligt er ook vaak veel van waarde in verborgen. De ervaring op diverse scholen laat inmiddels dan ook zien dat wie eerst sleutelt aan het toetsprogramma zonder te werken aan de kwaliteit van de docent (in de vorm van formatief handelen) in 100% van de gevallen van een koude kermis thuiskomt.