Teorin för svar på objektet

  • Jul 26, 2021
click fraud protection
Teorin om svar på objekt - tillämpningar och test

Inom området Teori om psykometriska tester Olika valörer har dykt upp som för närvarande tar namnet "Item Response Theory" (F.M. Lord, 1980). Denna benämning presenterar vissa skillnader med avseende på den klassiska modellen: 1. - förhållandet mellan det förväntade värdet av ämnet och egenskaperna (egenskaper som är ansvariga för värdena) är det vanligtvis inte av typen linjär. 2.- Det syftar till att göra individuella förutsägelser utan att behöva hänvisa till egenskaperna hos den normativa gruppen.

Du kanske också gillar: Klassisk testteori

Index

  1. Teori om svar på objektet eller latenta egenskaper i testteorin
  2. Objektsvarsteorimodeller (tri)
  3. Parameteruppskattning
  4. Testkonstruktion
  5. Tillämpningar av artikelens svarsteori
  6. Tolkning av poäng

Teori om svar på objektet eller latenta egenskaper i testteorin.

Vi ser alltså att denna svarsvarsteori ger möjlighet att separat beskriva både artiklar och individer; Den anser också att svaret från ämnet beror på den förmåga han har inom det berörda intervallet. Ursprunget till dessa modeller beror på Lazarsfeld, 1950, som introducerade termen "latent drag".

Härifrån anses det att varje individ har en individuell parameter som är ansvarig för ämnets egenskaper, även kallad "drag". Detta drag är inte direkt mätbart, därför kallas den enskilda parametern en latent variabel. När testet tillämpas kan två olika saker erhållas, den verkliga poängen och lämplighetsskalan; Detta uppnås om vi skickar två tester om samma förmåga till samma grupp.

I Latent Trait Theory eller Item Response Theory den sanna poängen är det förväntade värdet på den observerade poängen. Enligt Lord är sann poäng och kondition samma sak men uttrycks på olika mått.

Objektsvarsteorimodeller (tri)

Binomial Error Models: de introducerades av Lord (1965), som antar att den observerade poängen motsvarar antalet korrekta svar som erhållits i testet (vars Objekt har alla samma svårigheter och har lokal självständighet, det vill säga sannolikheten för att svara på ett objekt påverkas inte av svaren som ges till andra objekt. ).

Poisson-modeller: dessa modeller är lämpliga för de tester som har ett stort antal objekt och där sannolikheten för ett korrekt eller felaktigt svar är liten. Inom denna grupp har vi i sin tur olika modeller:

  1. Raschs Poisson-modell, vars hypoteser är: varje test har ett stort antal binära objekt som är lokalt oberoende. sannolikheten för fel i varje artikel är liten. sannolikheten för att ämnet gör ett fel beror på två saker, testets svårighet och motivets förmåga. svårigheternas tillsats, förstått som resultatet av att blanda två ekvivalenta tester i ett enda test vars svårighet är summan av svårigheterna med de två inledande testerna.
  2. Poisson-modell för utvärdering av hastighet: Denna modell föreslogs också av Rasch och kännetecknas av att ta hänsyn till hastigheten vid genomförandet av testet. Modellen kan betraktas på två sätt: att räkna antalet misstag som gjorts och ord som läses i en tidsenhet. räkna antalet misstag som gjorts och den tid som har lagts på att läsa texten. Sannolikheten att ett ämne (j) utför ett visst antal ord i ett test (i) under en tid (t)
  3. Normala stridshuvudmodeller: är en modell som föreslagits av Lord (1968), som används i tester med dikotom föremål och med en enda variabel gemensamt. Grafen skulle vara följande: De grundläggande antagandena som kännetecknar denna modell är:
  • det latenta variantutrymmet är endimensionellt (k = 1).
  • lokal oberoende mellan intems.
  • mätvärdet för den latenta variabeln kan väljas så att kurvan för varje artikel är det normala stridsspetsen.

Logistikmodeller; Det är en modell som mycket liknar den tidigare, men den har också fler fördelar med avseende på dess matematiska behandling. Logistikfunktionen har följande form: Det finns olika logistikmodeller beroende på antalet parametrar de har:

  • Logistikmodell med två parametrar, Birnbaum 1968, bland dess egenskaper nämner vi att det är endimensionellt, det finns lokal självständighet, föremålen är dikotom etc.
  • 3-parameter logistisk modellHerre, det kännetecknas av att sannolikheten för att slå genom att gissa är en faktor som kommer att påverka testets utförande. 4.3. Logistikmodell med 4 parametrar: modell föreslagen av McDonald 1967 och Barton-Lord 1981, vars syfte är förklara de fall där ämnen som har hög kompetens inte svarar korrekt på Artikel.
  • Rasch logistisk modell: Denna modell är den som har genererat flest jobb trots att det har en nackdel, vilket är att dess anpassning till den verkliga informationen är svårare. Men i motsats till detta är fördelen som gör att den används så allmänt att den inte kräver stora provstorlekar för justering.

Parameteruppskattning.

Den metod som har använts mest är maximal sannolikhet, tillsammans med denna metod används numeriska approximationsförfaranden som Newton-Raphson och Scoring (Rao). Metoden för maximal sannolikhet är baserad på principen att erhålla uppskattningar av okända parametrar som maximerar sannolikheten för att erhålla sådana prover. Förutom maximal sannolikhet används också Bayesian Estimation, baserat på Bayes Theorem, som Den består av att införliva all känd information, a priori, som är relevant för slutsatserna. En mer ingående studie av Bayesian-metoden för att uppskatta konditionsparametrar utförs av Birnbaum (1996) och Owen (1975).

INFORMATIONSFUNKTIONER

Det bästa testet som kan konstrueras är det som ger mest information om det latenta drag. Kvantifieringen av denna information görs genom "informationsfunktionerna". Informationsfunktionsformeln, Birnbaum 1968, är följande: Det måste beaktas att den information som erhållits i ett test är summan av informationen för varje artikel, dessutom beror inte varje artikels bidrag på resten av artiklarna som utgör testa. Generellt sett kan vi säga att informationen i alla modeller:

  • varierar med träningsnivåer.
  • ju större kurvans lutning, desto mer information.
  • det beror på variansen av poängen, ju högre det är, desto mindre information.

Testkonstruktion.

Den första uppgiften och en av de viktigaste när man konstruerar ett test är valet av objekt, i förväg överens om de teoretiska antagandena som ska definiera det drag som testet avser att mäta. Begreppet "Artikelanalys" hänvisar till uppsättningen av de formella förfaranden som utförs för att välja de föremål som slutligen kommer att bilda testet. Den information som anses vara mest relevant för artiklarna är:

  1. Objektsvårighet, procent av individer som får rätt.
  2. Diskriminering, korrelation mellan varje objekt och den totala poängen på testet.
  3. Distraktorer eller felanalys, deras inflytande är relevant, påverkar artikelns svårighet och gör att diskrimineringsvärdena underskattas.

Vid fastställande av indikatorer för de olika indexen används vanligtvis en del statistik eller index, varvid följande är de mest använda:

Svårighetsindex Index för diskriminering Tillförlitlighetsindex Giltighetsindex Att känna till de index som måste beaktas för urval av de objekt som kommer att bilda testet, kommer vi att se vilka steg som är nödvändiga för konstruktionen av ett test:

  1. Specifikation av problemet.
  2. Lista en stor uppsättning objekt och felsök dem.
  3. Val av modell.
  4. Testa de förvalda objekten.
  5. Välj de perfekta artiklarna.
  6. Studera testets kvaliteter
  7. Upprätta tolkningsreglerna för det slutliga testet som erhållits.

Från de tidigare punkterna bör det noteras att valet av modell, punkt 3, beror på målen som bedriver testet, dataens egenskaper och kvalitet och de tillgängliga resurserna. När en modell väljs är de teoretiska förhållandena under vilka den kan tillämpas redan ges, inte trots dess dygder de måste analyseras i varje enskilt fall och under specifika omständigheter. Egenskaperna hänförliga till de modeller som utgör Artikelsvarsteori (TRI), kan påverkas av:

  • testets dimensionalitet den knappa tillgängligheten av provet brist på datorresurser Det finns en rad preferenser för när vi använder en eller andra modeller, låt oss se dem: vanliga stridsspetsmodeller används vanligtvis inte i applikationer, deras värde är teoretisk.
  • Rasch: lämplig för horisontell jämförelse (jämförbara tester vid svårighetsnivåer med liknande lämplighetsfördelningar). att ha olika former av samma test. * 2 och 3 parametrar: de är de som bäst anpassar sig till olika problem.
  • för att upptäcka felaktiga svarmönster. för vertikal matchning av tester (jämför tester med olika svårighetsgrader och olika fördelningar för skicklighet).

1 och 2 parametrar:

  • lämplig för att konstruera en enda skala så att färdigheter kan jämföras på olika nivåer.

Valet av modell, förutom det slut som ska eftersträvas, kan påverkas av storleken på provet; I händelse av att provet är stort och representativt kommer det inte att finnas några problem, vare sig det är den klassiska eller latenta dragmodellen. Men i TRI ( teorin för svar på objekt ) tvingar ett litet urval att välja modeller med ett litet antal parametrar, även den uniparametriska modellen.

Tillämpningar av artikelens svarsteori.

Låt oss se vilka som är de vanligaste applikationerna: a) Testmatchning, ibland är det Det är nödvändigt att relatera poängen som erhållits i olika tester, med två möjliga syften:

  • Horisontell utjämning: den försöker få olika former av samma test.
  • Vertikal utjämning: den strävar efter att bygga en enda lämplighetsskala med olika svårighetsgrader. När det gäller utjämning av tester introducerar Lord (1980) begreppet "eget kapital", vilket innebär att för varje ämne två tester De kan vara utbytbara eftersom det tillämpas att den ena eller den andra inte ändrar den skicklighet som hade uppskattats för ämne.

Studie av artikelbias, ett objekt är partiskt när det i genomsnitt ger signifikant olika poäng i specifika grupper som antas vara en del av samma population.

Anpassade eller genomsnittliga testerMed hjälp av IRT kan individualiserade tester konstrueras som gör att det verkliga värdet av det aktuella draget kan dras mer exakt. Objekten kommer att administreras sekventiellt, presentationen av ett eller annat objekt beror på svaren som ges tidigare. Det finns olika typer av anpassade tester, vi påpekar följande:

  • tvåstegsförfarande, Lord 1971; Bertz och Weiss 1973 - 1974. Samma test klaras först och beroende på resultaten administreras ett andra test.
  • Procedur i flera steg, den är densamma som den tidigare, bara att processen inkluderar fler steg.
  • Fast grenad modell, Lord 1970, 1971, 1974; Mussio 1973. Alla ämnen löser samma objekt, enligt svaret löses en uppsättning objekt.
  • Variabel grenad modell baseras på oberoende mellan artiklarna och på egenskaperna hos de maximala sannolikhetsuppskattningarna.

ArtikelbankAtt ha en stor uppsättning objekt är något som kommer att förbättra testets kvalitet, men för detta måste objekten först genomgå en felsökningsprocess. För att klassificera artiklarna är det nödvändigt att ta hänsyn till vilken egenskap testet som det här objektet kommer att ingå i är avsett att mäta.

Tolkning av poäng.

Vågar: Syftet är att erbjuda ett kontinuum för att kunna beställa, klassificera eller veta vad den utvärderade egenskapens relativa storlek är; Detta gör det möjligt för oss att fastställa skillnader och likheter hos människor angående denna egenskap. De skalor som används i psykologi är: nominell, ordinal, intervall och förhållande; Dessa skalor är konstruerade från testresultaten, resultat som kallas "direkta poäng".

Skriv: att skriva ett test är att omvandla de direkta poängen till andra som lätt kan tolkas sedan Typad poäng avslöjar ämnets position i förhållande till gruppen och gör det möjligt för oss att göra intra och intersubjects. Det finns två former av att skriva:

  1. Linjärt behåller de formen på distributionen och ändrar inte korrelationsstorleken.
  2. Icke-linjär behåller de inte fördelningen eller storleken på korrelationerna.

FITNESS SCALE I IRT är skalan som konstrueras den skala som motsvarar lämplighetsnivåerna; Denna skala kännetecknas av att uppskattningarna och referenserna görs direkt med avseende på skickligheten och dess skala. Dessutom beror denna förmåga som uppskattas endast på formen på föremålens karakteristiska kurva. Bland de möjliga skalorna anger vi två:

  1. Skala, föreslagen av Woodcock (1978) och definieras av följande formel:
  2. WITS-skala, föreslagen av Wright (1977), denna skala är en modifiering av den tidigare och ges av följande förhållande:

Den här artikeln är bara informativ, i Psychology-Online har vi inte makten att ställa en diagnos eller rekommendera en behandling. Vi inbjuder dig att gå till en psykolog för att behandla just ditt fall.

Om du vill läsa fler artiklar som liknar Teorin om svar på objekt - tillämpningar och testrekommenderar vi att du anger vår kategori av Experimentell psykologi.

instagram viewer