Teorie odezvy na položku

V oblasti Teorie psychometrických testů Objevila se různá označení, která v současnosti nesou název „The Item Response Theory“ (F.M. Lord, 1980). Toto označení představuje určité rozdíly oproti klasickému modelu: 1. - vztah mezi očekávanou hodnotou skóre subjektu a vlastností (charakteristika odpovědná za hodnoty), obvykle se nejedná o typ lineární. 2. - Jeho cílem je vytvářet individuální předpovědi, aniž by bylo nutné odkazovat na charakteristiky normativní skupiny.

Mohlo by se vám také líbit: Teorie klasického testu

Index

Teorie odezvy na položku nebo modely latentních znaků v teorii zkoušek
Modely teorie odezvy na položku (tri)
Odhad parametrů
Zkouška konstrukce
Aplikace teorie odezvy na položku
Interpretace skóre

Teorie odezvy na položku nebo modely latentních znaků v teorii zkoušek.

Vidíme tedy, že tato teorie reakce na položky poskytuje možnost samostatně popisovat jak položky, tak jednotlivce; Rovněž se domnívá, že odpověď daného subjektu závisí na úrovni schopností, které má v uvažovaném rozsahu. Za vznik těchto modelů stojí Lazarsfeld z roku 1950, který zavedl pojem „latentní rys“.

Odtud se má za to, že každý jedinec má individuální parametr, který odpovídá za vlastnosti subjektu, nazývaný také „vlastnost“. Tato vlastnost není přímo měřitelná, proto se individuální parametr nazývá latentní proměnná. V době provádění testů lze získat dvě různé věci, skutečné skóre a stupnici schopností; Toho je dosaženo, pokud složíme dva testy o stejné schopnosti stejné skupině.

V teorii latentních vlastností nebo teorii odezvy na položku skutečné skóre je očekávaná hodnota pozorovaného skóre. Podle Pána jsou skutečné skóre a kondice totéž, ale vyjádřeny na různých stupnicích měření.

Modely teorie odezvy na položku (tri)

Binomické chybové modely: byly zavedeny Lordem (1965), který předpokládá, že sledované skóre odpovídá počtu správných odpovědí získaných v testu (jehož Všechny položky mají stejné potíže a mají místní nezávislost, to znamená, že pravděpodobnost správného zodpovězení jedné položky není ovlivněna odpověďmi poskytnutými jiným položkám. ).

Poissonovy modely: tyto modely jsou vhodné pro ty testy, které obsahují velké množství položek a u nichž je pravděpodobnost správné nebo nesprávné odpovědi malá. V rámci této skupiny máme zase různé modely:

Raschův Poissonův model, jehož hypotézy jsou: každý test má velké množství binárních položek, které jsou lokálně nezávislé. pravděpodobnost chyby v každé položce je malá. pravděpodobnost, že subjekt udělá chybu, závisí na dvou věcech, obtížnosti testu a schopnosti subjektu. aditivnost obtíží, chápaná jako výsledek smíchání dvou ekvivalentních testů v jednom testu, jehož obtížnost je součtem obtíží dvou počátečních testů.
Poissonův model pro vyhodnocení rychlosti: Tento model navrhl také Rasch a vyznačuje se zohledněním rychlosti při provádění testu. Model lze uvažovat dvěma způsoby: spočítat počet chyb a přečtených slov za jednotku času. spočítejte počet chyb a čas strávený dokončením čtení textu. Pravděpodobnost provedení určitého počtu slov testu (i) subjektem (j) v průběhu času (t)
Normální modely hlavic: je model navržený Lordem (1968), který se používá při testech s dichotomickými položkami a s jedinou společnou proměnnou. Jeho graf by byl následující: Základní předpoklady, které charakterizují tento model, jsou:

prostor latentní varianty je jednorozměrný (k = 1).
místní nezávislost mezi intemy.
metriku pro latentní proměnnou lze zvolit tak, aby křivka pro každou položku byla normální hlavicí.

Logistické modely; Jedná se o model velmi podobný předchozímu, ale má také více výhod, pokud jde o jeho matematické zpracování. Logistická funkce má následující podobu: Existují různé logistické modely v závislosti na počtu parametrů, které mají:

2parametrický logistický model„Birnbaum 1968, mezi jeho vlastnosti zmiňujeme, že je jednorozměrný, existuje místní nezávislost, položky jsou dichotomické atd.
3parametrový logistický modelPane, je to charakterizováno, protože pravděpodobnost zasažení hádáním je faktor, který ovlivní výkon testu. 4.3. 4parametrový logistický model: model navržený McDonaldem 1967 a Barton-Lordem v roce 1981, jehož účelem je vysvětlete ty případy, kdy subjekty, které mají vysokou úroveň nadání, nereagují správně na položka.
Logistický model Rasch: Tento model je ten, který generoval největší počet pracovních míst, přestože má nevýhodu, a to, že jeho přizpůsobení skutečným datům je obtížnější. Ale na rozdíl od toho, výhoda, díky které je tak široce používán, je, že pro svou úpravu nevyžaduje velké velikosti vzorku.

Odhad parametrů.

Nejčastěji používanou metodou je Maximum Likelihood, spolu s touto metodou se používají numerické aproximační postupy, jako jsou Newton-Raphson a Scoring (Rao). Metoda maximální pravděpodobnosti je založena na principu získávání odhadů neznámých parametrů, které maximalizují pravděpodobnost získání těchto vzorků. Kromě maximální pravděpodobnosti se používá také Bayesian odhad, založený na Bayesově teorému, který Skládá se z začlenění všech známých informací, a priori, které jsou relevantní pro proces vytváření závěrů. Podrobnější studii Bayesovské metody pro odhad fitness parametrů provádějí Birnbaum (1996) a Owen (1975).

INFORMAČNÍ FUNKCE

Nejlepší test, který lze sestavit, je ten, který poskytuje největší množství informací o latentním znaku. Kvantifikace těchto informací se provádí pomocí „informačních funkcí“. Vzorec informační funkce, Birnbaum 1968, je následující: Je třeba vzít v úvahu, že informace získané v testu je součet informací o každé položce, navíc příspěvek každé položky nezávisí na zbytku položek, které tvoří test. Obecně lze říci, že informace ve všech modelech:

se liší podle úrovně fitness.
čím větší je sklon křivky, tím více informací.
záleží na rozptylu skóre, čím vyšší je, tím méně informací.

Zkouška konstrukce.

První úkol a jedním z nejdůležitějších při konstrukci testu je výběr položek, předchozí souhlas s teoretickými předpoklady, které by měly definovat vlastnost, kterou má test v úmyslu měřit. Pojem „Analýza položek“ odkazuje na soubor těch formálních postupů, které se provádějí při výběru těch položek, které budou nakonec tvořit test. Informace, které se u položek považují za nejdůležitější, jsou:

Obtížnost položky, procento jednotlivců, kteří to napravili.
Diskriminace, korelace každé položky s celkovým skóre v testu.
Distraktory nebo analýza chyb, jejich vliv je relevantní, ovlivňuje obtížnost položky a způsobuje podceňování hodnot diskriminace.

Při stanovení indikátorů různých indexů se obvykle používají některé statistiky nebo indexy, přičemž nejpoužívanější jsou tyto:

Index obtížnosti diskriminace Index spolehlivosti Index platnosti Znát indexy, které je třeba vzít v úvahu pro výběr položek, které budou tvořit test, uvidíme, jaké kroky jsou nutné pro konstrukci test:

Specifikace problému.
Seznamte velkou sadu položek a odlaďte je.
Volba modelu.
Vyzkoušejte předvolené položky.
Vyberte ideální položky.
Prostudujte si vlastnosti testu
Stanovte pravidla interpretace získaného závěrečného testu.

Z předchozích bodů je třeba poznamenat, že výběr modelu, bod 3, bude záviset na cílech který provádí test, charakteristik a kvality údajů a zdrojů, které jsou k dispozici. Když je model vybrán, teoretické podmínky, ve kterých jej lze použít, jsou již uvedeny, nikoli navzdory svým ctnostem musí být analyzovány v každém případě a za konkrétních okolností. Vlastnosti, které lze přiřadit těm modelům, které tvoří Teorie reakce na položku (TRI), může být ovlivněn:

rozměrnost testu omezená dostupnost vzorku nedostatek počítačových zdrojů Existuje řada preferencí při použití jednoho nebo ostatních modelů se na ně podívejme: běžné bojové modely se v aplikacích obvykle nepoužívají, jejich hodnota je teoretický.
Rasch: vhodný pro horizontální srovnání (srovnatelné testy na úrovních obtížnosti s podobným rozdělením schopností). mít různé formy stejného testu. * Parametry 2 a 3: jsou to ty, které se nejlépe přizpůsobí různým problémům.
detekovat chybné vzorce odezvy. pro vertikální shodu testů (porovnává testy s různými úrovněmi obtížnosti a různým rozdělením pro aptitude).

Parametry 1 a 2:

vhodné pro konstrukci jedné stupnice, aby bylo možné porovnávat dovednosti na různých úrovních.

Volba modelu může být kromě sledovaného cíle ovlivněna velikostí vzorku; V případě, že je vzorek velký a reprezentativní, nebude problém, ať už jde o klasický nebo latentní znakový model. Ale v TRI ( teorie odezvy na položku ) malý vzorek síly k výběru modelů s malým počtem parametrů, dokonce i uniparametrický model.

Aplikace teorie odezvy na položku.

Podívejme se, které jsou nejběžnější aplikace: a) Vyrovnání testů, někdy je Je nutné dávat do souvislosti skóre získaná v různých testech, se dvěma možnými účely:

Horizontální ekvalizace: usiluje o získání různých forem stejného testu.
Vertikální ekvalizace: usiluje o vytvoření jednotné stupnice schopností s různými úrovněmi obtížnosti. Pokud jde o vyrovnání testů, Lord (1980) zavádí koncept „spravedlnosti“, což znamená, že pro každý předmět jsou dva testy Mohou být zaměnitelné, protože platí, že jedno nebo druhé nezmění úroveň talentu, která byla odhadnuta pro předmět.

Studie zaujatosti položky, položka je zaujatá, když v průměru poskytuje výrazně odlišné skóre ve specifických skupinách, u nichž se předpokládá, že jsou součástí stejné populace.

Upravené nebo průměrné testyPomocí IRT lze sestavit individualizované testy, které umožňují přesněji odvodit skutečnou hodnotu daného znaku. Položky budou spravovány postupně, prezentace jedné nebo druhé položky bude záviset na dříve uvedených odpovědích. Existují různé typy přizpůsobených testů, upozorňujeme na následující:

dvoustupňový postup, lord 1971; Bertz a Weiss 1973 - 1974. Stejný test projde jako první a v závislosti na výsledcích se provede druhý test.
Postup v několika fázích je stejný jako v předchozím, pouze proces zahrnuje více fází.
Opravený rozvětvený model, Lord 1970, 1971, 1974; Mussio 1973. Všechny předměty řeší stejnou položku, podle odpovědi je řešena sada položek.
Variabilní rozvětvený model je založen na nezávislosti mezi položkami a na vlastnostech odhadů maximální pravděpodobnosti.

Banka zbožíMít velkou sadu položek je něco, co zlepší kvalitu testu, ale pro to musí položky nejprve projít procesem ladění. Aby bylo možné položky klasifikovat, je nutné vzít v úvahu, jakou vlastnost má měřit test, jehož součástí bude tato položka.

Interpretace skóre.

Váhy: jeho účelem je nabídnout kontinuum, aby bylo možné objednat, klasifikovat nebo vědět, jaká je relativní velikost hodnocené vlastnosti; To nám umožní zjistit rozdíly a podobnosti u lidí ohledně této vlastnosti. Stupnice používané v psychologii jsou: nominální, ordinální, interval a poměr; Tyto stupnice jsou konstruovány z výsledků testů, tzv. Přímých skóre.

Znázornit: typizovat test znamená transformovat přímé skóre na jiné, které jsou snadno interpretovatelné, protože Typické skóre odhalí pozici subjektu vzhledem ke skupině a umožní nám provést intra a mezisubjekty. Existují dvě formy psaní:

Lineární, zachovávají tvar distribuce a nemění velikost korelací.
Nelineární, nezachovávají distribuci ani velikost korelací.

FITNESS SCALE V IRT je vytvořené měřítko měřítkem, které odpovídá úrovním aptitude; Tato stupnice se vyznačuje tím, že odhady a reference jsou vytvářeny přímo s ohledem na aptitude a její měřítko. Kromě toho tato odhadovaná schopnost závisí pouze na tvaru charakteristické křivky položek. Z možných měřítek označujeme dvě:

Scale, navržený Woodcockem (1978), a je definován následujícím vzorcem:
Škála WITS, kterou navrhl Wright (1977), je modifikací předchozí a je dána následujícím vztahem:

Tento článek je pouze informativní, v Psychology-Online nemáme pravomoc stanovit diagnózu nebo doporučit léčbu. Zveme vás k psychologovi, aby ošetřil váš konkrétní případ.

Pokud si chcete přečíst více podobných článků Teorie odezvy na položku - aplikace a test, doporučujeme vám zadat naši kategorii Experimentální psychologie.