Normou vztažená míra

Normativní měření je typ testu, hodnocení nebo evaluace, při kterém je testovaný jedinec srovnáván se vzorkem svých vrstevníků (označovaným jako "normativní vzorek"). Termín "normativní hodnocení" označuje proces porovnávání jednoho testovaného s jeho vrstevníky.

Alternativou k normativnímu testování mohou být testy ipsativní, tj. individuální hodnocení se porovnává se sebou samým v čase.

Naproti tomu je test vztažen ke kritériu, pokud je zajištěno převedení výsledku testu na výrok o chování, které se očekává od osoby s tímto výsledkem. Stejný test lze použít oběma způsoby. Robert Glaser původně zavedl termíny "normově vztažený test" a "kriteriálně vztažený test".

Mohlo by vás zajímat: Normované opatření

Reforma vzdělávání založená na standardech vychází z přesvědčení, že veřejné vzdělávání by mělo stanovit, co by měl každý žák znát a umět. Žáci by měli být testováni podle pevně stanoveného měřítka, nikoliv podle sebe navzájem nebo podle matematické křivky. Díky tomu, že každý student musí projít těmito novými, vyššími standardy, věří představitelé školství, že všichni studenti získají diplom, který je připraví na úspěch v 21. století.

Většina státních testů úspěšnosti je založena na kritériích. Jinými slovy, je stanovena předem přijatelná úroveň výkonu a žáci při dosažení nebo nedosažení této úrovně procházejí nebo neprocházejí. Testy, které stanovují cíle pro žáky na základě průměrného výkonu žáka, jsou testy vztažené k normě. Testy, které stanovují cíle pro žáky na základě stanovené normy (např. 80 správně napsaných slov), jsou testy vztažené ke kritériu.

Mnoho přijímacích zkoušek na vysoké školy a celostátně používaných školních testů používá normované testy. Testy SAT, Graduate Record Examination (GRE) a Wechslerova inteligenční škála pro děti (WISC) porovnávají výsledky jednotlivých studentů s výsledky normativního vzorku. V normativním testu nemůže testovaný "propadnout", protože každý účastník testu obdrží skóre, které se porovnává s ostatními účastníky testu a které se obvykle udává v percentilech. To je užitečné v případě, že existuje široký rozsah přijatelných výsledků, který je pro každou vysokou školu jiný. Například jeden z odhadů průměrného skóre testu SAT pro Harvardovu univerzitu je 2200 bodů z 2400 možných. Průměr pro Indiana University je 1650.

Naproti tomu téměř dvě třetiny amerických středoškoláků budou muset složit maturitní zkoušku podle kritérií. Jeden pevný výsledek je stanoven na úrovni, která je dostatečná pro přijetí na univerzitu, ať už absolvent střední školy míří na vysokou školu, nebo ne. Každý stát zadává vlastní test a stanovuje si vlastní úroveň úspěšnosti, přičemž státy jako Massachusetts vykazují velmi vysokou úspěšnost, zatímco ve státě Washington neuspějí ani průměrní studenti, stejně jako 80 % některých menšinových skupin. Proti této praxi se staví mnozí členové vzdělávací komunity, například Alfie Kohn, jako nespravedlivé vůči skupinám a jednotlivcům, kteří nedosahují tak vysokých výsledků jako ostatní.

Výhody a omezení

Zřejmou nevýhodou testů vztažených k normě je, že nemohou měřit pokrok celé populace, ale pouze to, jak se v rámci celku vyvíjejí jednotlivci. K měření úspěšnosti programu vzdělávací reformy, který se snaží zvýšit výsledky všech žáků, lze tedy použít pouze měření podle pevně stanoveného cíle, a to podle nových standardů, které se snaží hodnotit dovednosti přesahující výběr z několika možností. To je sice teoreticky lákavé, v praxi se však laťka často posunula tváří v tvář nadměrné míře neúspěšnosti a ke zlepšení někdy dochází jen díky obeznámenosti se stejným testem a výuce podle něj.

U normovaných testů se úroveň třídy tradičně stanovovala na základě 50 % výsledků. Naproti tomu Národní nadace pro dětské čtenářství (National Children's Reading Foundation) se domnívá, že je nezbytné zajistit, aby prakticky všechny naše děti četly ve třetí třídě na úrovni základní školy nebo nad ní, což je cíl, kterého nelze dosáhnout při normativní definici úrovně.

Kritici kriteriálně orientovaných testů poukazují na to, že hodnotitelé nastavují záložky kolem položek různé obtížnosti, aniž by zvažovali, zda jsou položky skutečně v souladu s obsahovými standardy dané třídy nebo zda jsou vývojově přiměřené. Původní vzorové úlohy z roku 1997 zveřejněné pro test WASL z matematiky pro 4. ročník tak obsahovaly položky, které byly obtížné pro vysokoškolsky vzdělané dospělé nebo snadno řešitelné metodami na úrovni 10. třídy, jako jsou například podobné trojúhelníky.

Úroveň obtížnosti samotných položek, stejně jako cut-scores pro určení úrovně úspěšnosti, se rovněž rok od roku mění. Míra úspěšnosti se také v některých státech výrazně liší od maturitních testů pro 4. až 7. a 10. třídu.

Jednou z chyb systému No Child Left Behind je, že si každý stát může zvolit nebo sestavit vlastní test, který nelze porovnávat s jiným státem. Randova studie výsledků v Kentucky zjistila známky umělé inflace úspěšnosti, která se neodrazila v rostoucích výsledcích v jiných testech, jako je NAEP nebo SAT, které byly zadány stejným skupinám žáků ve stejném období.

Standardy pro maturitní testy jsou obvykle nastaveny na úrovni odpovídající uchazečům o studium na čtyřletých univerzitách, kteří se narodili v České republice. Neobvyklým vedlejším efektem je, že zatímco vysoké školy často přijímají přistěhovalce s velmi dobrými matematickými schopnostmi, kteří mohou mít nedostatky v angličtině, u maturitních testů, které obvykle vyžadují absolvování všech částí, včetně jazykových, taková volnost neexistuje. Není tedy neobvyklé, že instituce jako Washingtonská univerzita přijímají silné asijsko-americké nebo latinskoamerické studenty, kteří neprošli písemnou částí státního testu WASL, ale takoví studenti by po zavedení požadavku na testování ani nedostali diplom.

Přestože testy, jako je WASL, mají být minimální hranicí pro vstup na střední školu, 27 % žáků desátých tříd, kteří se ve státě Washington hlásí do programu Running Start, neuspělo v matematické části WASL. Tito žáci se přihlásili na střední školu, kde navštěvují kurzy na vysokoškolské úrovni a dosahují mnohem vyšších výsledků než průměrní žáci. Stejná studiezjistila, že úroveň obtížnosti byla srovnatelná nebo vyšší než u testů určených k umístění studentů již přijatých na vysokou školu.

Testy založené na normě žádný z těchto problémů nemají, protože se nesnaží prosadit žádná očekávání, co by všichni žáci měli znát nebo umět, kromě toho, co žáci skutečně předvedou. Současná úroveň výkonů a nerovnosti jsou brány jako skutečnost, nikoli jako nedostatky, které by měly být odstraněny přepracovaným systémem. Cíle výkonu žáků se nezvyšují každý rok, dokud všichni nebudou mít dostatečné znalosti. Nevyžaduje se, aby výsledky vykazovaly neustálé zlepšování prostřednictvím systémů komplexního řízení kvality.

Systém založený na hodnocení poskytuje pouze údaje, které vypovídají o tom, kteří žáci dosahují průměrných výsledků, kteří žáci jsou lepší a kteří horší. To je v rozporu se základním přesvědčením, ať už optimistickým, nebo prostě neopodstatněným, že v systému založeném na standardech budou všichni dosahovat jednotně vysokých výkonů, pokud budou zavedeny dostatečné pobídky a tresty. Tento rozdíl v přesvědčeních je základem nejvýznamnějších rozdílů mezi tradičním a standardním vzdělávacím systémem.