Overzicht van concrete normen en vragen bij toetsing (versie 2025-2026)
Normen
Voor goede toetsing
en examinering
In deze bijdrage vindt u een overzicht van diverse normen en richtlijnen die wij hanteren bij onze audits en advisering. U vindt deze verwoord in vragende vorm, zodat u ze concreet kunt inzetten bij het beoordelen van uw eigen toetsing en examinering. Eerst geven we een korte toelichting / leeswijzer. Heeft u hulp of advies nodig? We denken graag mee.
Toelichting
Welke normen u kunt afleiden uit de acht uitgangspunten voor goede toetsing, verschilt per toets.
Zo maakt het bijvoorbeeld uit welke toetsvorm u hanteert.
Als u een multiple choice toets inzet, dan hanteren we andere normen (en stellen we andere vragen) dan als u een portfoliotoets met bewijsstukken gebruikt of een criterium gericht interview inzet als afsluiting van scholing, een training of cursus. De vraag of gebruik is gemaakt van een toetsmatrijs is bijvoorbeeld niet relevant voor iedere portfoliotoets. Ondanks dat de acht uitgangspunten voor goede toetsen hetzelfde zijn.
Om toch een beeld te geven van een groot aantal relevante normen vindt u hieronder een
overzicht van de meestvoorkomende vragen die wij stellen. Deze vragen geven op
een goede wijze aan welke normen relevant zijn. Het zijn vragen die tegelijkertijd u kunnen helpen bij het verder verbeteren van uw toetsing.
Zijn wij daarbij volledig? Zeker niet.
Zo zijn om te komen tot betrouwbare toetsing bij meerkeuzetoetsen nog veel meer vragen relevant. Vragen die bijvoorbeeld gaan over de kwaliteit van de vragen. Maakt u ook toetsnalayses? Dan gelden ook bepaalde normen wat betreft het gebruik en afleiden van de RIT-waarde, RIR-waarde, Cronbachs alfa, p-waardes, n-term, etc.
Of neem het criterium rechtmatigheid. Welke wet- en regelgeving bij uw toetsing geldt, zal verschillen van andere toetsing. Voor een opleider die een training aanbiedt die PE-punten oplevert, of een officiële certificering met zich meebrengt, gelden vaak meer regels dan gemiddeld. Dit is afhankelijk van uw training, cursus of nascholing. Al zal de AVG voor iedere opleider wel van toepassing zijn. Op deze pagina vindt u - ter inspiratie - een overzicht van regels die gelden voor het hoger onderwijs.
Het is daarnaast belangrijk om te benadrukken dat u als opleider in de
praktijk onmogelijk aan alle normen tegelijkertijd kunt voldoen. Dat verwachten
wij ook niet. Een aantal normen conflicteert zelfs met andere normen, of geven
dilemma's. De perfecte toets is in de praktijk nooit haalbaar. Ondanks dat onze auditors ook (onderwijs)jurist zijn, oordelen we
bijvoorbeeld niet uitgebreid op de rechtmatigheid van uw toetsing.
Wij beoordelen om die reden met name op de volgende criteria:
- Is er sprake van toetsing waarbij een cursist het ook niet kan halen (indien de cursist niet de gewenste prestatie levert)?
- In hoeverre bent u als opleider transparant over uw toetsing?
- In hoeverre hebt u uw toetsing doordacht en kunt u deze verantwoorden (gezien de andere uitgangspunten van goede toetsing)?
Overzicht normen en richtlijnen
Hieronder vindt u een overzicht van normen en richtlijnen die we hanteren bij een toetsscan / audit. U vindt deze in vragende vorm zodat u zich de vraag kunt stellen of en in welke mate u aan de norm voldoet en een eigen, eerste afweging kunt maken.
Eerst vindt u de normen en vragen die met name relevant zijn voor een specifiek criterium / uitgangspunt voor goede toetsing. Vervolgens vindt u de normen en vragen die criteria-overstijgend zijn.
NORMEN | VRAGEN
laatste update: 1 september 2025
- T1. Is er voor collega’s of externe auditors een toetsplan
waarin de belangrijkste toetskeuzes worden verantwoord (waarmee antwoord
gegeven kan worden op onderstaande vragen)?
- T2. In hoeverre hebben studenten / cursisten – voor zover relevant – inzicht in de volgende toetsinformatie?
- Toetsvorm
- Leerdoelen / leeruitkomsten /
competenties
- Toelichting op de toets / achtergrond / toetsopdracht
- Rubric
/ beoordelingsformulier
- Toetsmatrijs
- Eventueel een voorbeeldtoets of gelijkwaardige oefentoets (formatieve toets)
- Periode / tijdstip / deadline van de toets
- Groepsopdracht
of individuele toetsing
- De inzagemogelijkheden
- De
herkansingsmogelijkheden
- Gebruik van GenAI (ChatGPT, Claude, ...)
toegestaan / mogelijk
- Toegestane hulpmiddelen (bijvoorbeeld bij
juridische toetsen: welk gebruik van wettenbundels is toegestaan?)
- Cesuur (wanneer is het voldoende)
- Hoe
de normering wordt omgezet naar een cijfer (m.a.w. hoe het cijfer tot stand
komt)
- Overige informatie (relevant voor onderstaande punten)
- T3. Is de informatie in de verschillende systemen, informatiefolders, sites, leeromgevingen, regelingen e.d. aan elkaar gelijk?
Algemene vragen
- V1. Zijn de leerdoelen / leeruitkomsten afgeleid van de eindkwalificaties van de opleiding?
- V2. In hoeverre worden met de toets alle onderwerpen uit de leerdoelen / leeruitkomsten afgetoetst
- In hoeverre passen de gekozen leerdoelen / leeruitkomsten bij de hele opleiding, de visie van de opleiding, opleidingsinstituut, onderwijsprogramma, toetsprogramma, het landelijke beroeps- en opleidingsprofiel, de landelijke beroepseisen, de Body of Knowledge of Skills, de eindkwalificaties (van beroepsorganisaties), et cetera?
- V3. Zijn de beoordelingscriteria afgeleid van de leerdoelen / leeruitkomsten?
- V4. In hoeverre wordt aan het verschil in belang van de diverse onderwerpen - zoals verwoord in de leerdoelen / leeruitkomsten - recht gedaan?
Bijzondere aandachtspunten wat betreft de validiteit
- V5. Wordt gebruik gemaakt van een toetsmatrijs?
- V6. In welke mate speelt taalvaardigheid een rol bij de toets?
- Mogen en kunnen de studenten in hun eigen taal de vragen beantwoorden? Dit kan bijvoorbeeld bij tweetalig onderwijs een rol spelen. Met andere woorden: hoe wordt voorkomen dat een student wel het antwoord weet, maar dit niet in de gewenste taal kan uitdrukken? Of wordt taal ook getoetst? Is deze keuze dan te herleiden tot het toetsbeleid en/of het toetspogramma?
- Zitten er geen niet-Nederlandse begrippen in de vraagstelling die een leerling of student niet kan weten (dit levert een interessant dilemma op voor toetsontwikkelaars: zie onder dilemma's).
- V7. Is de (al dan niet digitale) toets op gelijkwaardige wijze toegankelijk voor en te maken door studenten met een (niet-relevante) beperking?
- V8. Zie ook onder Subjectiviteit wat betreft groepsopdrachten.
- V9. Zie ook onder Haalbaarheid wat betreft de lengte van de toets.
Algemene vragen
- B1. Is de toetsing zo ingericht dat verschillende beoordelaars in beginsel bij dezelfde cursist tot dezelfde beoordeling (zouden) komen?
- B2 Worden vergelijkbare antwoorden / prestaties (van andere cursisten) op dezelfde manier beoordeeld?
- B3 Zijn de kansen op meetfouten of beoordelaarsfouten zo veel mogelijk beperkt?
Bijzondere aandachtspunten
- B4. Is de toets door meerdere (bevoegde) docenten geconstrueerd?
- B5. Hebben de ontwerpers / beoordelaars de bevoegdheid om de toets op te stellen en/of te beoordelen (vergelijkbaar met een BKE in het hoger onderwijs)?
- B6. Past de beoordelingsschaal (bijvoorbeeld hele getallen van 1 t/m 10) bij de mate van toetsbetrouwbaarheid? Als het verschil tussen een 9 en 10 niet hardgemaakt kan worden of examinatoren hier verschillend over denken, dan is het misschien niet wenselijk dit onderscheid te maken? (zie bijvoorbeeld ook Henk van Berkel, Examens 21/3 September 2024, pagina 20)
- B7. Was de examinator ook docent bij de cursist of was het een onafhankelijke examinator?
- B8. Is bij de toets gebruik gemaakt van een antwoordmodel?
- B9. Is bij de toets gebruik gemaakt van een rubric?
- Voor welk soort rubric is gekozen en met welke reden? (analytische rubric, holistische rubric, ipsatieve rubric, single-point rubric)
- In hoeverre passen de voordelen / nadelen bij de gekozen rubric bij het product dat met deze rubric beoordeeld wordt? M.a.w. is het verdedigbaar dat voor deze vorm is gekozen?
- In hoeverre voldoet de rubric aan de rubric-rubric / criteria voor een goede rubric?
- Zijn de categorieën in de rubric onderscheidend?
- Zijn de concretisering van criteria niet meer synoniemen van het bovenliggende criterium? (dus niet: een teken van een goede argumentatie is dat sprake moet zijn van een deugdelijke argumentatie)?
- In hoeverre worden er voorwaarden gesteld die inhoudelijk (gezien de leerdoelen / leeruitkomsten of om de kwaliteit van de toetsing te borgen) niet onderbouwd kunnen worden?
- B10. Is de toets door meerdere examinatoren nagekeken?
- Hebben de docenten de toets horizontaal (vragen verdeeld over de examinatoren) of verticaal (iedere examinator de gehele toets en dan een deel van alle cursisten) nagekeken?
- Is bij het verticaal nakijken gekalibreerd of geeft het antwoordmodel genoeg duidelijkheid?
- H1. In hoeverre was de toets door de cursisten te maken binnen de gestelde tijd?
- H2. In hoeverre was de toets door de docenten te verwerken binnen de gestelde deadline en gegeven uren (inclusief inzage en eventuele herkansingen)?
- S1. In hoeverre betreft het een eigen uitwerking / prestatie van de cursist die beoordeeld wordt?
- Indien dit niet het geval is, wordt de leerdoelen dan ergens anders individueel getoetst?
- Indien dit ook niet het geval is, wordt dan alleen de samenwerking getoetst of – ten onrechte – ook de inhoud?
- Indien sprake is van een groepsopdracht en ook de inhoud wordt getoetst: in hoeverre is de toets nog individueel?
- In hoeverre kan de cursist GenAI hebben ingezet (anders dan was toegestaan)?
- In hoeverre kan de cursist andere deskundigen (familie, vrienden, collega’s, …) hebben gebruikt bij het maken van de toets?
- S2. In hoeverre is de beoordeling individueel?
- Hebben de examinatoren eerst hun eigen oordeel gevormd en is hier bewijs voor? (bijvoorbeeld met een voorbeoordeling die ook vastgelegd is?
- E1. Draagt de toets bij aan het streven om te komen tot onbetwistbare diploma's, getuigschriften of certificaten?
- E2. Levert de ook een bijdrage aan het leren van de cursist (en is niet alleen summatief)?
- E3. Rijkt de toets de cursist een realistisch beeld aan van geschiktheid voor het vak of opleiding?
- E4. Draagt de toetsing bij aan talentontwikkeling en voorkomt het onnodig uitval?
- E5. Biedt de toetsing mogelijkheden tot evaluatie van het onderwijs en toetsing?
- R1. Is de toets niet in strijd met het geldend recht?
- R2. In hoeverre herbergt de toets morele discussies / debatten die kunnen afleiden van wat getoetst wordt?
- W1. Is het opleidingsinstituut / de opleider / examinator / toetser / trainer in voldoende mate geïnformeerd over toetsing in het algemeen en deze toets in het bijzonder?
- W2. Heeft het opleidingsinstituut / de opleider / examinator / toetser / trainer de punten in deze lijst in voldoende mate doordacht?
- W3. Kan het opleidingsinstituut / de opleider / examinator / toetser / trainer de toets in voldoende mate verantwoorden?
- O1. Was er genoeg variatie qua bewijsmiddelen?
- O2. Was het bewijs dat aangevoerd werd relevant (gezien het criterium dat getoetst wordt)
- O3. Was het bewijs authentiek?
- O4. Was het bewijs actueel? (en dus niet in een niet te controleren verleden gefabriceerd)
- O5. Was er genoeg bewijs voorhanden (kwantiteit) en geen toevallige schot in de roos?
In welke mate is er vooraf gekalibreerd?
- O10. Zijn hier verslagen van?
- O11. Waarop is gekalibreerd?
- Op de resultaten / de beoordelingen?
- Op de gehanteerde rubrics / beoordelingsformulieren?
- Op de cesuurgrens (slagen / niet slagen, voldoende / niet voldoende, 5 of 6 e.d.) of is er ook gekalibreerd over andere niveaus (verschil tussen een negen en een tien)?
- O12. Wat was de uitkomst van de laatste sessies?
- O13. Hoe wordt gerealiseerd dat de uitkomsten van het kalibreren terugkomt in de toets (opdracht en/of beoordeling)?
- O14. Is bijgehouden welke examinatoren aanwezig waren bij de kalibratiesessies?
- O15. Wat waren de gevolgen voor de examinatoren die niet aanwezig waren bij de kalibratiesessies?
