Vergelijking van beoordelingen
In een oefening wordt een taak gewoonlijk twee keer beoordeeld. Een leerling beoordeelt zijn eigen werk voor hij het instuurt en de leraar zal de taak daarna opnieuw beoordelen. De beoordeling van de leraar gebruikt de beoordeling van de leerling als vertrekpunt. Een oefening laat de leraar toe een cijfer te geven op de zelfevaluatie van de leerling en een cijfer te geven voor de taak zelf. (de maximumcijfers voor beide onderdelen heten respectievelijk "Cijfer voor beoordeling van de leerling" en "Cijfer voor de inzending") Merk op dat het cijfer van de beoordeling door de leerling niet gebruikt wordt. De beoordeling door de leerling krijgt een cijfer, afhankelijk van hoe dicht die beoordeling ligt bij de beoordeling van de leraar.
De mate van overeenstemming tussen de beoordeling door de leraar en door de leerling is gebaseerd op verschillen tussen de scores op de individuele elementen (in werkelijkheid wordt het kwadraat van het verschil gebruikt) Het gemiddelde van deze verschillen moet dan omgezet worden in een betekenisvol cijfer. De optie "Vergelijking van de beoordelingen" laat een leraar toe een zekere controle uit te oefenen op de manier waarop deze vergelijkingen omgezet worden in cijfers.
Om een idee te krijgen van het effect van deze optie, gaan we uit van een (eerder eenvoudig) voorbeeld van een beoordeling met tien ja/nee vragen. De beoordeling zou kunnen bestaan uit vragen zoals "Is de grafiek juist getekend?", "Is de berekende besparing 100,66 euro?",enz. Veronderstel dat er zo tien vragen zijn. Wanneer de "Heel mild"-instelling gekozen is, dan geeft een perfecte overeenkomst tussen de beoordeling van de leraar en van de leerling een cijfer van 100%, als er slechts één niet overeenstemt, dan is het cijfer 90%, als er twee niet overeenkomen 80%, drie geven 70% enz. Misschien vind je dit erg redelijk en vraag je je af waarom deze instelling erg mild genoemd wordt. Overweeg dan eens het geval waarin een leerling compleet willekeurig zijn beoordeling invult en de antwoorden op de 10 vragen gewoon geraden worden. Gemiddeld genomen zou dit een resultaat van vijf op tien geven, deze slechte beoordeling zou dus een resultaat van ongeveer 50% geven. De situatie wordt iets gevoeliger met de instelling "Mild". Een willekeurige beoordeling krijgt dan nog ongeveer 20%. Met de instelling "Redelijk" krijgt een willekeurige beoordeling nul. Op dit niveau wordt er 50% gegeven wanneer de twee beoordelingen voor acht van de tien vragen overeenkomen. Als drie vragen niet overeenkomen, dan wordt er een cijfer van 25% gegeven. Als de optie op "Streng" gezet wordt, dan geven twee niet overeenkomende vragen 40%. Als de optie op "Heel streng" gezet wordt, dan zakt het cijfer bij twee vragen die niet overeenkomen tot 35% en één enkele vraag die niet overeenkomt geeft 65%.
Dit is een vrij artificiëel voorbeeld, omdat de meeste beoordelingen eerder elementen bevatten met een waardenreeks dan met ja/nee vragen. In die gevallen zal de vergelijking resulteren in wat hogere waarden dan de waarden uit het voorbeeld hierboven. De verschillende niveaus (Heel mild, Mild, Redelijk, ...) worden zo gekozen dat de leraar de vergelijking kan fijn-tunen. Als de leraar vindt dat de cijfers voor de vergelijking eerder laag zijn, dan kan hij de optie verplaatsen naar "mild" of zelfs "heel mild". En het omgekeerde kan natuurlijk ook: als de scores eerder te hoog gevonden worden kan deze optie naar de strenge kant verschoven worden. Het is wat uitproberen, maar de beste startpositie is de instelling "Redelijk".
Wyszukiwarka
Podobne podstrony:
An Empirical Comparison of Discretization Modelslanguage operators comparisonCompartmentsARowFilter ComparisonType2004 02 Distribution Comparison Test Intro16a KNX LonWorks Comparison OzadowiczDRAGNEA Slavic and Greek Roman Mythology, Comparative Mythologycomparisonsfunction mcal date comparewięcej podobnych podstron