Teoria odpowiedzi na przedmiot

W zakresie Teoria testów psychometrycznych Pojawiły się różne denominacje, które obecnie przyjmują nazwę „Teoria odpowiedzi na przedmiot” (F.M. Lord, 1980). Nominał ten prezentuje pewne różnice w stosunku do modelu klasycznego: 1.- związek między wartością oczekiwaną oceny podmiotu i cechy (charakterystyka odpowiedzialna za wartości), zwykle nie jest tego typu liniowy. 2.- Ma na celu dokonywanie indywidualnych przewidywań bez konieczności odwoływania się do cech grupy normatywnej.

Może Ci się spodobać: Klasyczna teoria testów

Indeks

Teoria odpowiedzi na przedmiot lub utajone modele cech w teorii testów
Modele teorii odpowiedzi na przedmioty (tri)
Estymacja parametrów
Konstrukcja testowa
Zastosowania teorii odpowiedzi na przedmioty
Interpretacja partytur

Teoria odpowiedzi na przedmiot lub modele cech ukrytych w teorii testów.

Widzimy zatem, że ta teoria odpowiedzi na przedmiot daje możliwość oddzielnego opisywania zarówno przedmiotów, jak i jednostek; Uważa również, że odpowiedź udzielona przez badanego zależy od poziomu umiejętności, jakie posiada w rozważanym zakresie. Pochodzenie tych modeli wywodzi się od Lazarsfelda, 1950, który wprowadził termin „cecha utajona”.

Stąd uważa się, że każda osoba ma indywidualny parametr, który odpowiada za cechy podmiotu, zwany także „cechą”. Cecha ta nie jest bezpośrednio mierzalna, stąd indywidualny parametr nazywany jest zmienną utajoną. W momencie stosowania testów można uzyskać dwie różne rzeczy, prawdziwy wynik i skalę uzdolnień; Osiąga się to, jeśli zdamy dwa testy o tych samych umiejętnościach w tej samej grupie.

W teorii ukrytych cech lub teorii reakcji na przedmiot prawdziwy wynik to oczekiwana wartość obserwowanego wyniku. Według Lorda, prawdziwy wynik i dopasowanie to to samo, ale wyrażane na różnych skalach pomiaru.

Modele teorii odpowiedzi na przedmioty (tri)

Modele błędu dwumianowego: zostały wprowadzone przez Lorda (1965), które zakładają, że obserwowany wynik odpowiada liczbie poprawnych odpowiedzi uzyskanych w teście (którego Wszystkie pozycje mają tę samą trudność i mają lokalną niezależność, co oznacza, że na prawdopodobieństwo poprawnej odpowiedzi na jedną pozycję nie mają wpływu odpowiedzi udzielone w innych pozycjach. ).

Modele Poissona: modele te są odpowiednie dla tych testów, które mają dużą liczbę pozycji i w których prawdopodobieństwo poprawnej lub błędnej odpowiedzi jest małe. W tej grupie z kolei mamy różne modele:

Model Poissona Rascha, którego hipotezy brzmią: każdy test ma dużą liczbę elementów binarnych, które są lokalnie niezależne. prawdopodobieństwo błędu w każdej pozycji jest małe. prawdopodobieństwo, że badany popełni błąd, zależy od dwóch rzeczy: trudności testu i predyspozycji badanego. addytywność trudności, rozumiana jako wynik zmieszania dwóch równoważnych testów w jednym teście, którego trudność jest sumą trudności dwóch testów początkowych.
Model Poissona do oceny prędkości: Model ten został również zaproponowany przez Rascha i charakteryzuje się uwzględnianiem szybkości w wykonaniu testu. Model można rozpatrywać na dwa sposoby: policzyć liczbę popełnionych błędów i słowa odczytane w jednostce czasu. policz liczbę popełnionych błędów i czas poświęcony na ukończenie lektury tekstu. Prawdopodobieństwo wykonania określonej liczby słów testu (i) przez podmiot (j), w czasie (t)
Normalne modele głowic: to model zaproponowany przez Lorda (1968), który jest używany w testach z pozycjami dychotomicznymi i jedną wspólną zmienną. Jego wykres wyglądałby następująco: Podstawowe założenia charakteryzujące ten model to:

przestrzeń wariantu utajonego jest jednowymiarowa (k = 1).
lokalna niezależność między jednostkami.
metrykę dla zmiennej ukrytej można wybrać tak, aby krzywa dla każdego elementu była normalną głowicą.

Modele logistyczne; Jest to model bardzo podobny do poprzedniego, ale ma też więcej zalet pod względem matematycznego potraktowania. Funkcja logistyczna przyjmuje następującą postać: Istnieją różne modele logistyczne w zależności od liczby posiadanych parametrów:

2-parametrowy model logistyczny, Birnbaum 1968, wśród jego cech wymieniamy jednowymiarowość, niezależność lokalną, dychotomiczne pozycje itp.
3-parametrowy model logistycznyPanie, charakteryzuje się tym, że prawdopodobieństwo trafienia przez zgadywanie jest czynnikiem, który wpłynie na wykonanie testu. 4.3. 4-parametrowy model logistyczny: model zaproponowany przez McDonald 1967 i Barton-Lord w 1981, którego celem jest wyjaśnij przypadki, w których osoby o wysokim poziomie umiejętności nie reagują poprawnie na przedmiot.
Model logistyczny Rascha: Model ten jest tym, który wygenerował największą liczbę miejsc pracy, mimo że ma tę wadę, że jego dopasowanie do rzeczywistych danych jest trudniejsze. Ale w przeciwieństwie do tego zaletą, która sprawia, że jest tak szeroko stosowany, jest to, że nie wymaga dużych rozmiarów próbki do jej regulacji.

Estymacja parametrów.

Najczęściej stosowaną metodą jest Maksymalne prawdopodobieństwo, wraz z tą metodą stosowane są procedury aproksymacji liczbowej, takie jak Newton-Raphson i Scoring (Rao). Metoda maksymalnego prawdopodobieństwa opiera się na zasadzie uzyskiwania estymatorów nieznanych parametrów, które maksymalizują prawdopodobieństwo uzyskania takich próbek. Oprócz maksymalnego prawdopodobieństwa stosuje się również estymację bayesowską, opartą na twierdzeniu Bayesa, które Polega na włączeniu a priori wszystkich znanych informacji, które są istotne dla procesu wnioskowania. Bardziej dogłębne badanie bayesowskiej metody szacowania parametrów sprawności zostało przeprowadzone przez Birnbauma (1996) i Owena (1975).

FUNKCJE INFORMACYJNE

Najlepszym testem, jaki można skonstruować, jest taki, który dostarcza najwięcej informacji o ukrytej cesze. Kwantyfikacja tych informacji odbywa się za pomocą „funkcji informacyjnych”. Formuła funkcji informacyjnej, Birnbaum 1968, jest następująca: Należy wziąć pod uwagę, że informacje uzyskane w teście jest sumą informacji o każdej pozycji, ponadto wkład każdej pozycji nie zależy od pozostałych pozycji, które składają się na test. Ogólnie można powiedzieć, że informacje we wszystkich modelach:

zależy od poziomu sprawności.
im większe nachylenie krzywej, tym więcej informacji.
zależy to od wariancji wyników, im wyższy, tym mniej informacji.

Konstrukcja testowa.

Pierwsze zadanie a jednym z najważniejszych przy konstruowaniu testu jest wybór pozycji, uprzednie uzgodnienie założeń teoretycznych, które powinny określać cechę, którą test ma mierzyć. Pojęcie „Analiza pozycji” odnosi się do zestawu tych formalnych procedur, które są przeprowadzane w celu wybrania tych pozycji, które ostatecznie stworzą test. Informacje, które są uważane za najistotniejsze w odniesieniu do pozycji to:

Trudność przedmiotu, procent osób, które mają rację.
Dyskryminacja, korelacja każdej pozycji z łącznym wynikiem testu.
Dystraktory lub analiza błędów, ich wpływ jest istotny, wpływa na trudność przedmiotu i powoduje niedoszacowanie wartości dyskryminacji.

Przy ustalaniu wskaźników różnych wskaźników zwykle stosuje się niektóre statystyki lub wskaźniki, z których najczęściej używa się:

Wskaźnik trudności Indeks dyskryminacja Wskaźnik rzetelności Wskaźnik ważności Znajomość wskaźników, które muszą być brane pod uwagę, aby wybór elementów, które będą stanowić test, zobaczymy jakie kroki są niezbędne do budowy Badanie:

Specyfikacja problemu.
Wymień duży zestaw elementów i debuguj je.
Wybór modelu.
Przetestuj wstępnie wybrane elementy.
Wybierz idealne przedmioty.
Przestudiuj cechy testu
Ustal zasady interpretacji uzyskanego testu końcowego.

Z poprzednich punktów należy zauważyć, że wybór modelu, punkt 3, będzie zależał od celów przeprowadzający test, cech i jakości danych oraz dostępnych zasobów. Przy wyborze modelu podane są już teoretyczne warunki, w których można go zastosować, a nie pomimo swoich zalet muszą być analizowane w każdym przypadku i szczególnych okolicznościach. Właściwości przypisywane tym modelom, które składają się na Teoria reakcji na przedmiot (TRI), mogą mieć wpływ:

wymiarowość testu słaba dostępność próby brak zasobów obliczeniowych Istnieje szereg preferencji co do tego, podczas korzystania z jednego lub innych modeli, zobaczmy je: normalne modele głowic nie są zwykle używane w aplikacjach, ich wartość jest teoretyczny.
Rasch: odpowiedni do porównania poziomego (porównywalne testy na poziomach trudności z podobnymi rozkładami uzdolnień). mieć różne formy tego samego testu. * 2 i 3 parametry: to te, które najlepiej dostosowują się do różnych problemów.
wykrywanie błędnych wzorców odpowiedzi. do pionowego dopasowania testów (porównuje testy o różnych poziomach trudności i różnych rozkładach uzdolnień).

1 i 2 parametry:

nadaje się do konstruowania jednej skali, aby umiejętności można było porównywać na różnych poziomach.

Na wybór modelu, oprócz celu, do którego należy dążyć, może mieć wpływ wielkość próby; W przypadku, gdy próba jest duża i reprezentatywna, nie będzie problemu, niezależnie od tego, czy będzie to model cech klasycznych, czy ukrytych. Ale w TRI ( teoria odpowiedzi na przedmiot ) mała próbka powoduje konieczność wyboru modeli o małej liczbie parametrów, nawet modelu jednoparametrowego.

Zastosowania teorii odpowiedzi na przedmioty.

Zobaczmy, jakie są najczęstsze zastosowania: a) Wyrównanie testów, czasami jest Konieczne jest powiązanie wyników uzyskanych w różnych testach, z dwoma możliwymi cele:

Wyrównanie poziome: stara się uzyskać różne formy tego samego testu.
Wyrównanie pionowe: dąży do zbudowania jednej skali umiejętności o różnych poziomach trudności. W odniesieniu do wyrównywania testów Lord (1980) wprowadza pojęcie „słuszności”, co oznacza, że dla każdego przedmiotu dwa testy Mogą być wymienne, ponieważ stosuje się, że jedno lub drugie nie zmieni poziomu umiejętności, który został oszacowany dla Przedmiot.

Badanie stronniczości pozycji, pozycja jest stronnicza, gdy średnio daje znacząco różne wyniki w określonych grupach, które, jak się zakłada, należą do tej samej populacji.

Testy dostosowane lub uśrednioneZa pomocą IRT można skonstruować zindywidualizowane testy, które pozwalają na dokładniejsze wywnioskowanie prawdziwej wartości danej cechy. Pozycje będą podawane sekwencyjnie, prezentacja jednego lub drugiego punktu będzie zależeć od udzielonych wcześniej odpowiedzi. Istnieją różne rodzaje dostosowanych testów, zwracamy uwagę na następujące:

procedura dwuetapowa, Lord 1971; Bertz i Weiss 1973 - 1974. Ten sam test jest zdawany jako pierwszy i, w zależności od wyników, podawany jest drugi test.
Procedura w kilku etapach jest taka sama jak poprzednia, tylko że proces obejmuje więcej etapów.
Stały model rozgałęziony, Lord 1970, 1971, 1974; Mussio 1973. Wszyscy badani rozwiązują ten sam przedmiot, zgodnie z odpowiedzią zestaw przedmiotów jest rozwiązywany.
Model rozgałęziony zmiennych opiera się na niezależności między pozycjami oraz na właściwościach estymatorów największej wiarygodności.

Bank przedmiotówPosiadanie dużego zestawu elementów to coś, co poprawi jakość testu, ale w tym celu elementy muszą najpierw przejść przez proces debugowania. Aby sklasyfikować pozycje, należy wziąć pod uwagę, jaką cechę ma mierzyć test, którego częścią będzie ta pozycja.

Interpretacja partytur.

Waga: jego celem jest zaoferowanie kontinuum, aby móc uporządkować, sklasyfikować lub wiedzieć, jaka jest względna wielkość ocenianej cechy; To pozwoli nam ustalić różnice i podobieństwa u ludzi w zakresie tej cechy. Skale stosowane w psychologii to: nominalna, porządkowa, interwałowa i ilorazowa; Skale te zbudowane są z wyników testów, zwanych „wynikami bezpośrednimi”.

Charakteryzować: typowanie testu polega na przekształceniu bezpośrednich wyników w inne, które są łatwe do zinterpretowania, ponieważ Sformułowana partytura ujawni pozycję podmiotu w stosunku do grupy i pozwoli nam na wykonanie intra i międzyprzedmiotów. Istnieją dwie formy pisania:

Liniowe, zachowują kształt rozkładu i nie modyfikują wielkości korelacji.
Nieliniowe, nie zachowują rozkładu ani wielkości korelacji.

SKALA FITNESS W IRT konstruowana skala jest skalą odpowiadającą poziomom uzdolnień; Skala ta charakteryzuje się tym, że oszacowania i odniesienia są dokonywane bezpośrednio w odniesieniu do uzdolnienia i jego skali. Co więcej, ta szacowana zdolność zależy tylko od kształtu charakterystycznej krzywej przedmiotów. Wśród możliwych skal wskazujemy dwie:

Skala, zaproponowana przez Woodcocka (1978) i definiowana jest następującym wzorem:
Skala WITS, zaproponowana przez Wrighta (1977), jest modyfikacją poprzedniej i wynika z zależności:

Ten artykuł ma jedynie charakter informacyjny, w Psychology-Online nie możemy postawić diagnozy ani zalecić leczenia. Zapraszamy do wizyty u psychologa w celu leczenia konkretnego przypadku.

Jeśli chcesz przeczytać więcej artykułów podobnych do Teoria odpowiedzi na przedmiot - Aplikacje i test, zalecamy wpisanie naszej kategorii Psychologia eksperymentalna.