Théorie de la réponse aux items

Dans le domaine de Théorie des tests psychométriques Différentes dénominations sont apparues qui prennent actuellement le nom de « Item Response Theory » (F.M. Lord, 1980). Cette dénomination présente quelques différences par rapport au modèle classique: 1.- la relation entre la valeur attendue des scores du sujet et des traits (caractéristique responsable des valeurs), il n'est généralement pas du type linéaire. 2.- Il entend faire des prédictions individuelles sans avoir besoin de se référer aux caractéristiques du groupe normatif.

Tu pourrais aussi aimer: Théorie des tests classiques

Indice

Théorie de la réponse à l'item ou modèles de traits latents dans la théorie des tests
Modèles de théorie de la réponse aux items (tri)
Estimation des paramètres
Tester la construction
Applications de la théorie de la réponse aux items
Interprétation des partitions

Théorie de la réponse à l'item ou aux modèles de traits latents dans la théorie des tests.

Nous voyons donc que cette Théorie de la Réponse aux Items offre la possibilité de décrire séparément à la fois les items et les individus; Il considère également que la réponse donnée par le sujet dépend du niveau d'aptitude qu'il a dans la gamme considérée. L'origine de ces modèles est due à Lazarsfeld, 1950, qui a introduit le terme « trait latent ».

A partir de là, on considère que chaque individu possède un paramètre individuel qui est responsable des caractéristiques du sujet, également appelé « trait ». Ce trait n'est pas directement mesurable, c'est pourquoi le paramètre individuel est appelé variable latente. Au moment de l'application des tests, deux choses différentes peuvent être obtenues, le vrai score et l'échelle d'aptitude; Ceci est réalisé si nous passons deux tests sur la même aptitude au même groupe.

Dans la théorie des traits latents ou la théorie de la réponse aux items le vrai score est la valeur attendue du score observé. Selon Lord, le vrai score et la forme physique sont la même chose mais exprimés sur des échelles de mesure différentes.

Modèles de théorie de la réponse aux items (tri)

Modèles d'erreur binomiale: ils ont été introduits par Lord (1965), qui suppose que le score observé correspond au nombre de bonnes réponses obtenues au test (dont le Les items ont tous la même difficulté et ont une indépendance locale, c'est-à-dire que la probabilité de répondre correctement à un item n'est pas affectée par les réponses données aux autres items. ).

Modèles de Poisson: ces modèles sont appropriés pour les tests qui ont un grand nombre d'items et dans lesquels la probabilité d'une réponse correcte ou incorrecte est faible. Au sein de ce groupe, à son tour, nous avons différents modèles :

Le modèle de Poisson de Rasch, dont les hypothèses sont: chaque test comporte un grand nombre d'items binaires localement indépendants. la probabilité d'erreur dans chaque élément est faible. la probabilité que le sujet fasse une erreur dépend de deux choses, la difficulté du test et la capacité du sujet. l'additivité des difficultés, entendue comme le résultat du mélange de deux épreuves équivalentes en une seule épreuve dont la difficulté est la somme des difficultés des deux épreuves initiales.
Modèle de Poisson pour évaluer la vitesse : Ce modèle a également été proposé par Rasch et se caractérise par la prise en compte de la rapidité dans l'exécution du test. Le modèle peut être envisagé de deux manières: compter le nombre d'erreurs commises et de mots lus dans une unité de temps. compter le nombre d'erreurs commises et le temps passé à terminer la lecture du texte. La probabilité de réaliser un certain nombre de mots d'un test (i) par un sujet (j), pendant un temps (t)
Modèles d'ogives normales: est un modèle proposé par Lord (1968), qui est utilisé dans des tests avec des items dichotomiques et avec une seule variable en commun. Son graphe serait le suivant: Les hypothèses de base qui caractérisent ce modèle sont :

l'espace variant latent est unidimensionnel (k = 1).
indépendance locale entre les intems.
la métrique de la variable latente peut être choisie de sorte que la courbe pour chaque élément soit l'ogive normale.

Modèles logistiques; C'est un modèle très similaire au précédent, mais il a aussi plus d'avantages en ce qui concerne son traitement mathématique. La fonction logistique prend la forme suivante: Il existe différents modèles logistiques selon le nombre de paramètres dont ils disposent :

Modèle logistique à 2 paramètres, Birnbaum 1968, parmi ses caractéristiques, nous mentionnons qu'il est unidimensionnel, qu'il y a une indépendance locale, que les items sont dichotomiques, etc.
modèle logistique à 3 paramètresSeigneur, il se caractérise parce que la probabilité de toucher en devinant est un facteur qui va influencer la performance du test. 4.3. Modèle logistique à 4 paramètres: modèle proposé par McDonald 1967 et Barton-Lord en 1981, dont le but est expliquer les cas dans lesquels des sujets qui ont un haut niveau d'aptitude ne répondent pas correctement à la Objet.
Modèle logistique Rasch : Ce modèle est celui qui a généré le plus grand nombre d'emplois malgré un inconvénient qui est que son ajustement aux données réelles est plus difficile. Mais contrairement à cela, l'avantage qui le rend si largement utilisé est qu'il ne nécessite pas de grandes tailles d'échantillons pour son ajustement.

Estimation des paramètres.

La méthode qui a été la plus utilisée est le Maximum de Vraisemblance, avec cette méthode des procédures d'approximation numérique telles que Newton-Raphson et Scoring (Rao) sont utilisées. La méthode du maximum de vraisemblance repose sur le principe d'obtenir des estimateurs des paramètres inconnus qui maximisent la probabilité d'obtenir de tels échantillons. En plus du maximum de vraisemblance, l'estimation bayésienne est également utilisée, basée sur le théorème de Bayes, qui Elle consiste à incorporer toutes les informations connues, a priori, pertinentes pour le processus d'inférence. Une étude plus approfondie de la méthode bayésienne d'estimation des paramètres de fitness est réalisée par Birnbaum (1996) et Owen (1975).

FONCTIONS D'INFORMATION

Le meilleur test qui puisse être construit est celui qui fournit le plus d'informations sur le trait latent. La quantification de ces informations se fait à travers les « fonctions d'information ». La formule de la fonction d'information, Birnbaum 1968, est la suivante: Il faut tenir compte du fait que l'information obtenue dans un test est la somme des informations de chaque élément, de plus la contribution de chaque élément ne dépend pas du reste des éléments qui composent le test. De manière générale, on peut dire que les informations, dans tous les modèles :

varie avec les niveaux de condition physique.
plus la pente de la courbe est grande, plus il y a d'informations.
cela dépend de la variance des scores, plus elle est élevée, moins il y a d'informations.

Tester la construction.

La première tâche et l'un des plus importants lors de la construction d'un test est le choix des items, l'accord préalable des hypothèses théoriques qui doivent définir le trait que le test entend mesurer. Le concept « Analyse des éléments » fait référence à l'ensemble des procédures formelles qui sont effectuées pour sélectionner les éléments qui formeront finalement le test. Les informations considérées comme les plus pertinentes concernant les articles sont :

Difficulté de l'élément, pourcentage d'individus qui réussissent.
Discrimination, corrélation de chaque item avec le score total au test.
Distracteurs ou analyse d'erreur, leur influence est pertinente, affecte la difficulté de l'item et fait sous-estimer les valeurs de discrimination.

Lors de l'établissement des indicateurs des différents indices, certaines statistiques ou indices sont généralement utilisés, les suivants étant les plus utilisés :

Indice de difficulté Indice de discrimination Indice de fiabilité Indice de validité Connaître les indices qui doivent être pris en compte pour le sélection des items qui formeront le test, nous verrons quelles étapes sont nécessaires à la construction de un examen:

Spécification du problème.
Répertoriez un grand nombre d'éléments et déboguez-les.
Choix du modèle.
Testez les éléments présélectionnés.
Sélectionnez les articles idéaux.
Étudier les qualités du test
Etablir les règles d'interprétation du test final obtenu.

A partir des points précédents, il est à noter que le choix du modèle, point 3, dépendra des objectifs qui poursuit le test, des caractéristiques et de la qualité des données, et des ressources disponibles. Lorsqu'un modèle est choisi, les conditions théoriques dans lesquelles il peut être appliqué sont déjà données, non malgré ses vertus elles doivent être analysées au cas par cas et dans des circonstances particulières. Les propriétés attribuables à ces modèles qui composent le Théorie de la réponse aux items (TRI), peut être affecté par :

la dimensionnalité du test la rareté de l'échantillon le manque de ressources informatiques Il existe une série de préférences pour lors de l'utilisation de l'un ou l'autre des modèles, voyons-les: les modèles normaux d'ogives ne sont généralement pas utilisés dans les applications, leur valeur est théorique.
Rasch: adapté à la comparaison horizontale (tests comparables à des niveaux de difficulté avec des distributions d'aptitude similaires). avoir différentes formes du même test. * 2 et 3 paramètres: ce sont ceux qui s'adaptent le mieux à une variété de problèmes.
pour détecter des modèles de réponse erronés. pour l'appariement vertical des tests (compare les tests avec différents niveaux de difficulté et différentes distributions d'aptitude).

1 et 2 paramètres :

approprié pour construire une seule échelle afin que les compétences puissent être comparées à différents niveaux.

Le choix du modèle, outre la finalité à poursuivre, peut être affecté par la taille de l'échantillon; Dans le cas où l'échantillon est grand et représentatif, il n'y aura pas de problème, que ce soit le modèle de trait classique ou latent. Mais en TRI ( théorie de la réponse aux items ) un petit échantillon oblige à choisir des modèles avec un petit nombre de paramètres, même le modèle uniparamétrique.

Applications de la théorie de la réponse aux items.

Voyons quelles sont les applications les plus courantes: a) Test d'appariement, parfois c'est Il est nécessaire de mettre en relation les scores obtenus dans les différents tests, avec deux possibilités fins :

Égalisation horizontale: il cherche à obtenir différentes formes d'un même test.
Égalisation verticale: il cherche à construire une seule échelle d'aptitudes avec différents niveaux de difficulté. Concernant l'égalisation des épreuves, Lord (1980) introduit la notion d'« équité », qui implique que pour chaque matière deux épreuves Ils peuvent être interchangeables puisqu'il est appliqué que l'un ou l'autre ne changera pas le niveau d'aptitude qui avait été estimé pour le matière.

Etude du biais d'item, un item est biaisé lorsqu'en moyenne il donne des scores significativement différents dans des groupes spécifiques qui sont supposés faire partie de la même population.

Tests adaptés ou moyensGrâce à l'IRT, des tests individualisés peuvent être construits qui permettent d'inférer plus précisément la vraie valeur du trait en question. Les items seront administrés séquentiellement, la présentation d'un item ou d'un autre dépendra des réponses données précédemment. Il existe différents types de tests adaptés, nous rappelons les suivants :

procédure en deux étapes, Lord 1971; Bertz et Weiss 1973 - 1974. Le même test est passé en premier et, en fonction des résultats, un deuxième test est administré.
Procédure en plusieurs étapes, c'est la même que la précédente, seulement que le processus comprend plus d'étapes.
Modèle ramifié fixe, Lord 1970, 1971, 1974; Mussio 1973. Tous les sujets résolvent le même item, selon la réponse, un ensemble d'items est résolu.
Le modèle à branches variables est basé sur l'indépendance entre les items et sur les propriétés des estimateurs du maximum de vraisemblance.

Banque d'objetsAvoir un grand ensemble d'éléments est quelque chose qui améliorera la qualité du test, mais pour cela, les éléments doivent d'abord passer par un processus de débogage. Afin de classer les items, il est nécessaire de prendre en compte quel est le trait que le test dont cet item fera partie est destiné à mesurer.

Interprétation des partitions.

Balance: son but est d'offrir un continuum pour pouvoir ordonner, classer ou savoir quelle est l'importance relative du trait évalué; Cela nous permettra d'établir des différences et des similitudes chez les personnes concernant ce trait. Les échelles utilisées en psychologie sont: nominale, ordinale, intervalle et rapport; Ces échelles sont construites à partir des résultats des tests, résultats appelés « scores directs ».

Caractériser: caractériser un test, c'est transformer les scores directs en d'autres facilement interprétables puisque les La partition typée révélera la position du sujet par rapport au groupe, et nous permettra de faire des intersujets. Il existe deux formes de saisie :

Linéaires, ils préservent la forme de la distribution et ne modifient pas la taille des corrélations.
Non linéaires, ils ne préservent pas la distribution ou la taille des corrélations.

ÉCHELLE DE FITNESS En IRT, l'échelle qui est construite est l'échelle qui correspond aux niveaux d'aptitude; Cette échelle est caractérisée en ce que les estimations et références sont faites directement par rapport à l'aptitude et à son échelle. De plus, cette aptitude estimée ne dépend que de l'allure de la courbe caractéristique des articles. Parmi les échelles possibles, nous en indiquons deux :

Échelle, proposée par Woodcock (1978) et est définie par la formule suivante :
Échelle WITS, proposée par Wright (1977), cette échelle est une modification de la précédente et est donnée par la relation suivante :

Cet article est simplement informatif, dans Psychology-Online, nous n'avons pas le pouvoir de poser un diagnostic ou de recommander un traitement. Nous vous invitons à vous rendre chez un psychologue pour traiter votre cas particulier.

Si vous voulez lire plus d'articles similaires à Théorie de la réponse aux items - Applications et test, nous vous recommandons d'entrer dans notre catégorie de Psychologie expérimentale.