Teori respon barang

Dalam bidang Teori Tes Psikometri Berbagai denominasi telah muncul yang saat ini mengambil nama "Teori Respons Item" (F.M. Lord, 1980). Denominasi ini menyajikan beberapa perbedaan sehubungan dengan model klasik: 1.- hubungan antara nilai yang diharapkan nilai subjek dan sifat (karakteristik yang bertanggung jawab atas nilai-nilai), biasanya linier. 2.- Bermaksud membuat prediksi individu tanpa perlu mengacu pada karakteristik kelompok normatif.

Anda mungkin juga menyukai: Teori tes klasik

Indeks

Teori respons terhadap item atau model sifat laten dalam teori tes
Model teori respon item (tri)
Estimasi parameter
Konstruksi uji
Aplikasi teori respon item
Interpretasi skor

Teori respon terhadap item atau model sifat laten dalam teori tes.

Jadi, kita melihat bahwa Teori Respons Item ini memberikan kemungkinan untuk mendeskripsikan item dan individu secara terpisah; Juga menganggap bahwa respon yang diberikan subjek tergantung pada tingkat kemampuan yang dimilikinya dalam rentang yang dipertimbangkan. Asal usul model ini adalah karena Lazarsfeld, 1950, yang memperkenalkan istilah "sifat laten".

Dari sini dianggap bahwa setiap individu memiliki parameter individu yang bertanggung jawab atas karakteristik subjek, juga disebut "sifat". Sifat ini tidak dapat diukur secara langsung, oleh karena itu parameter individu disebut variabel laten. Pada saat menerapkan tes, dua hal yang berbeda dapat diperoleh, skor sebenarnya dan skala bakat; Hal ini dicapai jika kita lulus dua tes tentang bakat yang sama untuk kelompok yang sama.

Dalam Teori Sifat Laten atau Teori Respons Item skor sebenarnya adalah nilai yang diharapkan dari skor yang diamati. Menurut Lord, skor sejati dan kebugaran adalah hal yang sama tetapi dinyatakan pada skala pengukuran yang berbeda.

Model teori respon item (tri)

Model Kesalahan Binomial: mereka diperkenalkan oleh Lord (1965), yang mengasumsikan bahwa skor yang diamati sesuai dengan jumlah jawaban benar yang diperoleh dalam tes (yang Soal-soal tersebut semuanya memiliki kesukaran yang sama dan memiliki kemandirian lokal, yaitu probabilitas menjawab dengan benar suatu butir soal tidak dipengaruhi oleh jawaban yang diberikan pada butir soal lainnya. ).

Model Poisson: model-model ini sesuai untuk tes yang memiliki banyak item dan di mana probabilitas jawaban yang benar atau salah kecil. Dalam grup ini, pada gilirannya, kami memiliki model yang berbeda:

Model Poisson Raschis, yang hipotesisnya adalah: setiap tes memiliki sejumlah besar item biner yang independen secara lokal. probabilitas kesalahan dalam setiap item kecil. probabilitas subjek melakukan kesalahan tergantung pada dua hal, kesulitan tes dan kemampuan subjek. penambahan kesulitan, dipahami sebagai hasil pencampuran dua tes yang setara dalam satu tes yang kesulitannya adalah jumlah dari kesulitan dua tes awal.
Model Poisson untuk mengevaluasi kecepatan: Model ini juga diusulkan oleh Rasch dan dicirikan dengan memperhitungkan kecepatan dalam pelaksanaan tes. Model dapat dipertimbangkan dalam dua cara: menghitung jumlah kesalahan yang dibuat dan kata-kata yang dibaca dalam satu unit waktu. menghitung jumlah kesalahan yang dibuat dan waktu yang dihabiskan dalam menyelesaikan membaca teks. Probabilitas melaksanakan sejumlah kata tertentu dari tes (i) oleh subjek (j), selama waktu (t)
Model Hulu ledak Normal Normal: adalah model yang diusulkan oleh Lord (1968), yang digunakan dalam tes dengan item dikotomis dan dengan variabel tunggal yang sama. Grafiknya adalah sebagai berikut: Asumsi dasar yang mencirikan model ini adalah:

ruang varian laten adalah satu dimensi (k = 1).
kemandirian lokal antar intem.
metrik untuk variabel laten dapat dipilih sehingga kurva untuk setiap item adalah hulu ledak normal.

Model Logistik; Ini adalah model yang sangat mirip dengan yang sebelumnya tetapi juga memiliki lebih banyak keuntungan sehubungan dengan perlakuan matematisnya. Fungsi logistik mengambil bentuk berikut: Ada model logistik yang berbeda tergantung pada jumlah parameter yang mereka miliki:

model logistik 2-parameter, Birnbaum 1968, di antara ciri-cirinya kami menyebutkan bahwa itu satu dimensi, ada kemandirian lokal, itemnya dikotomis, dll.
Model logistik 3 parameterTuhan, hal ini ditandai karena kemungkinan memukul dengan menebak merupakan faktor yang akan mempengaruhi kinerja tes. 4.3. Model logistik 4 parameter: model yang diusulkan oleh McDonald 1967 dan Barton-Lord pada tahun 1981, yang tujuannya adalah purpose menjelaskan kasus-kasus di mana subjek yang memiliki tingkat bakat yang tinggi tidak merespon dengan benar terhadap barang.
Model logistik rasch: Model ini adalah yang paling banyak menghasilkan pekerjaan meskipun memiliki kekurangan, yaitu penyesuaiannya dengan data nyata lebih sulit. Namun berbeda dengan ini, keuntungan yang membuatnya begitu banyak digunakan adalah tidak memerlukan ukuran sampel yang besar untuk penyesuaiannya.

Estimasi parameter.

Metode yang paling banyak digunakan adalah Maximum Likelihood, bersama dengan metode ini digunakan prosedur aproksimasi numerik seperti Newton-Raphson dan Scoring (Rao). Metode Kemungkinan Maksimum didasarkan pada prinsip memperoleh penduga dari parameter yang tidak diketahui yang memaksimalkan kemungkinan untuk mendapatkan sampel tersebut. Selain Kemungkinan Maksimum, Estimasi Bayesian juga digunakan, berdasarkan Teorema Bayes, yang Ini terdiri dari menggabungkan semua informasi yang diketahui, apriori, yang relevan dengan proses membuat kesimpulan. Studi yang lebih mendalam tentang metode Bayesian untuk memperkirakan parameter kebugaran dilakukan oleh Birnbaum (1996) dan Owen (1975).

FUNGSI INFORMASI

Tes terbaik yang dapat dibangun adalah tes yang memberikan jumlah informasi terbesar tentang sifat laten. Kuantifikasi informasi ini dilakukan melalui "fungsi informasi". Rumus fungsi informasi, Birnbaum 1968, adalah sebagai berikut: Harus diperhitungkan bahwa informasi yang diperoleh dalam tes adalah jumlah informasi dari setiap item, selain itu kontribusi setiap item tidak tergantung pada sisa item yang membentuk uji. Secara umum, kita dapat mengatakan bahwa informasi, dalam semua model:

bervariasi dengan tingkat kebugaran.
semakin besar kemiringan kurva, semakin banyak informasi.
itu tergantung pada varians skor, semakin tinggi, semakin sedikit informasi.

Konstruksi tes.

Tugas pertama dan salah satu yang paling penting ketika menyusun tes adalah pilihan item, persetujuan sebelumnya dari asumsi teoretis yang harus menentukan sifat yang ingin diukur oleh tes. Konsep "Analisis item" mengacu pada serangkaian prosedur formal yang dilakukan untuk memilih item-item yang pada akhirnya akan membentuk tes. Informasi yang dianggap paling relevan mengenai item tersebut adalah:

Kesulitan item, persentase individu yang melakukannya dengan benar.
Diskriminasi, korelasi setiap item dengan skor total pada tes.
Distraktor atau analisis kesalahan, pengaruhnya relevan, mempengaruhi kesulitan item dan menyebabkan nilai diskriminasi diremehkan.

Saat menetapkan indikator dari indeks yang berbeda, beberapa statistik atau indeks biasanya digunakan, berikut ini yang paling banyak digunakan:

Indeks indeks kesulitan diskriminasi Indeks reliabilitas Indeks validitas Mengetahui indeks yang harus diperhitungkan untuk pemilihan item yang akan membentuk tes, kita akan melihat langkah-langkah apa yang diperlukan untuk pembangunan sebuah tes:

Spesifikasi masalah.
Buat daftar kumpulan item yang luas dan debugnya.
Pilihan model.
Uji item yang dipilih sebelumnya.
Pilih item yang ideal.
Pelajari kualitas tes
Menetapkan aturan interpretasi dari tes akhir yang diperoleh.

Dari poin sebelumnya, perlu dicatat bahwa pilihan model, poin 3, akan tergantung pada tujuan depend yang mengejar pengujian, karakteristik dan kualitas data, dan sumber daya yang tersedia. Ketika sebuah model dipilih, kondisi teoretis di mana model itu dapat diterapkan sudah diberikan, bukan terlepas dari kelebihannya mereka harus dianalisis dalam setiap kasus dan keadaan tertentu. Sifat-sifat yang diatribusikan kepada model-model yang membentuk Teori Respon Item (TRI), dapat dipengaruhi oleh:

dimensi tes ketersediaan langka sampel kurangnya sumber daya komputer Ada serangkaian preferensi untuk saat menggunakan satu atau model lain, mari kita lihat: model hulu ledak normal biasanya tidak digunakan dalam aplikasi, nilainya adalah teoretis.
Rasch: cocok untuk perbandingan horizontal (tes yang sebanding pada tingkat kesulitan dengan distribusi bakat yang serupa). memiliki bentuk yang berbeda dari tes yang sama. * Parameter 2 dan 3: mereka adalah yang paling sesuai dengan berbagai masalah.
untuk mendeteksi pola respon yang salah. untuk pencocokan vertikal tes (membandingkan tes dengan tingkat kesulitan yang berbeda dan distribusi yang berbeda untuk bakat).

1 dan 2 parameter:

cocok untuk membangun skala tunggal sehingga keterampilan dapat dibandingkan pada tingkat yang berbeda.

Pilihan model, selain tujuan yang akan dikejar, dapat dipengaruhi oleh ukuran sampel; Dalam hal sampel besar dan representatif, tidak akan ada masalah, baik model sifat klasik maupun laten. Tapi di TRI ( teori respon item ) sampel kecil memaksa untuk memilih model dengan sejumlah kecil parameter, bahkan model uniparametrik.

Aplikasi dari teori respon item.

Mari kita lihat aplikasi mana yang paling umum: a) Uji pencocokan, kadang-kadang Penting untuk menghubungkan skor yang diperoleh dalam tes yang berbeda, dengan dua kemungkinan two tujuan:

Pemerataan Horisontal: itu berusaha untuk mendapatkan bentuk yang berbeda dari tes yang sama.
Pemerataan Vertikal: berusaha untuk membangun skala bakat tunggal dengan tingkat kesulitan yang berbeda. Mengenai pemerataan tes, Lord (1980) memperkenalkan konsep "ekuitas", yang menyiratkan bahwa untuk setiap mata pelajaran dua tes Mereka dapat dipertukarkan karena diterapkan bahwa satu atau yang lain tidak akan mengubah tingkat bakat yang telah diperkirakan untuk subjek.

Study of item bias, suatu item menjadi bias ketika rata-rata memberikan skor yang berbeda secara signifikan pada kelompok tertentu yang diasumsikan sebagai bagian dari populasi yang sama.

Tes yang disesuaikan atau rata-rataMelalui IRT, tes individual dapat dibangun yang memungkinkan nilai sebenarnya dari sifat yang bersangkutan disimpulkan dengan lebih tepat. Soal-soal akan diadministrasikan secara berurutan, penyajian satu soal atau lainnya akan tergantung pada jawaban yang diberikan sebelumnya. Ada berbagai jenis tes yang disesuaikan, kami tunjukkan hal berikut:

prosedur dua tahap, Lord 1971; Bertz dan Weiss 1973 - 1974. Tes yang sama dilakukan terlebih dahulu dan, tergantung pada hasilnya, tes kedua dilakukan.
Prosedur dalam beberapa tahap, sama dengan yang sebelumnya, hanya saja prosesnya mencakup lebih banyak tahap.
Model bercabang tetap, Lord 1970, 1971, 1974; Mussio 1973. Semua mata pelajaran menyelesaikan soal yang sama, menurut jawabannya, satu set soal diselesaikan.
Model bercabang variabel didasarkan pada independensi antara item dan properti dari penduga kemungkinan maksimum.

Bank barangMemiliki set item yang besar adalah sesuatu yang akan meningkatkan kualitas tes, tetapi untuk ini item harus melalui proses debugging terlebih dahulu. Untuk mengklasifikasikan item-item, perlu diperhitungkan sifat apa yang akan diukur dari tes yang item ini akan menjadi bagiannya.

Interpretasi skor.

Timbangan: tujuannya adalah untuk menawarkan suatu kontinum untuk dapat mengurutkan, mengklasifikasikan atau mengetahui berapa besaran relatif dari sifat yang dievaluasi; Ini akan memungkinkan kita untuk membangun perbedaan dan persamaan pada orang-orang mengenai sifat ini. Skala yang digunakan dalam Psikologi adalah: nominal, ordinal, interval dan rasio; Skala ini dibangun dari hasil tes, hasil yang disebut "skor langsung".

Melambangkan: mencirikan suatu tes berarti mengubah skor langsung menjadi skor lain yang mudah diinterpretasikan karena Skor yang ditentukan akan mengungkapkan posisi subjek sehubungan dengan grup, dan akan memungkinkan kita untuk membuat intra dan antar mata pelajaran. Ada dua bentuk pengetikan:

Linier, mereka mempertahankan bentuk distribusi dan tidak mengubah ukuran korelasi.
Nonlinier, mereka tidak mempertahankan distribusi atau ukuran korelasi.

SKALA KEBUGARAN Dalam IRT, skala yang dibangun adalah skala yang sesuai dengan tingkat aptitude; Skala ini dicirikan bahwa perkiraan dan referensi dibuat secara langsung sehubungan dengan bakat dan skalanya. Selanjutnya, bakat yang diperkirakan hanya bergantung pada bentuk kurva karakteristik item. Di antara skala yang mungkin, kami menunjukkan dua:

Skala, diusulkan oleh Woodcock (1978) dan didefinisikan dengan rumus berikut:
Skala WITS, diusulkan oleh Wright (1977), skala ini merupakan modifikasi dari yang sebelumnya dan diberikan oleh hubungan berikut:

Artikel ini hanya informatif, di Psikologi-Online kami tidak memiliki kekuatan untuk membuat diagnosis atau merekomendasikan pengobatan. Kami mengundang Anda untuk pergi ke psikolog untuk menangani kasus khusus Anda.

Jika Anda ingin membaca lebih banyak artikel serupa dengan Teori respons item - Aplikasi dan Tes, kami sarankan Anda memasukkan kategori kami Psikologi eksperimental.