Теория на класическия тест

  • Jul 26, 2021
click fraud protection
Теория на класическия тест

Тестът е a научен инструмент доколкото измерва това, което твърди, тоест е валидно и измерва добре, тоест е точно или надеждно. Ако намерим инструмент, на който не можем да се доверим на измерванията, които те предоставят, тъй като те се променят от време на време, когато измерваме един и същ обект, тогава ще кажем, че той не е надежден. Инструмент, за измерване правилно Нещо трябва да е точно, защото ако не, измервайте това, което измервате, ще го измерите погрешно. Следователно точността е необходимо, но не достатъчно условие. Освен това той трябва да е валиден, тоест това, което измерва с точност, ще бъде това, което е предназначено да измерва, а не нещо друго.

Абсолютна и относителна надеждност: Можем да подходим към проблема за надеждността на даден тест по два различни начина, въпреки че те в основата си съвпадат.

Надеждност и неточността на измерванията: Когато субектът отговори на тест, той получава емпиричен резултат, който е повлиян от грешка. Ако нямаше грешки, субектът щеше да получи истинския си резултат. Тестът е неточен, тъй като емпиричният резултат не съвпада с истинския истински резултат. Тази разлика между двата резултата е грешка в извадката, грешка в измерването. The

стандартна грешка в измерването ще бъде стандартното отклонение на грешките в измерването. The стандартна грешка в измерването показва абсолютната точност на теста, тъй като позволява да се изчисли разликата между полученото измерване и това, което би се получило, ако няма грешка.

Надеждност и стабилност на измерванията: Тестът ще бъде по-надежден, колкото по-постоянни или стабилни са резултатите, които той осигурява, когато се повтарят. Колкото по-стабилни са резултатите два пъти, толкова по-голяма е връзката между тях. Тази корелация се нарича коефициент на надеждност. Това ни казва не размерът на грешката, а последователността на теста със себе си и последователността на информацията, която предлага. The коефициент на надеждност изразява относителната надеждност на теста.

Коефициентът на надеждност и индексът на надеждност: - Коефициентът на надеждност на тест е корелацията на теста със себе си, получена например в две паралелни форми: rxx. - Индексът на точност е корелацията между емпиричните резултати на даден тест и истинските му резултати: rxv Индексът на точност винаги ще бъде по-голям от коефициента на надеждност За да се установи коефициентът на надеждност, тези три метода трябва да бъдат подчертани класика:

  • Намерете връзката между теста и неговото повторение: Методът на повторение или методът за повторно тестване: Състои се от приложи два пъти един и същ тест към една и съща група и изчисли корелацията между двете серии на резултати. Тази корелация е коефициентът на надеждност. Този метод обикновено дава по-висок коефициент на надеждност от този, получен при други процедури, и може да бъде замърсен от смущаващи фактори.
  • Намерете връзката между две паралелни форми на теста: Методът на паралелни форми: Подготвени са две форми успоредни линии на един и същ тест, тоест две еквивалентни форми, които дават една и съща информация и се прилагат към една и съща група от субекти. Корелацията между двете форми е коефициентът на надеждност. С този метод, като не се повтаря един и същ тест, се избягват смущаващи източници на надеждност при повторно тестване.
  • Намерете корелацията между две паралелни половини на теста: Методът на двете половини: Тестът е разделен на две еквивалентни половини и е намерена корелацията между тях. Това е предпочитаният метод, тъй като е прост и избягва ограниченията на предишните процедури. Можете да изберете нечетните елементи на теста, които да съставляват едната половина, а четните елементи да съставляват другата.

Коефициентът на надеждност и корелацията между паралелните тестове

The коефициент на надеждност на тест показва съотношението, че истинската дисперсия е на емпиричната дисперсия: графика33 Коефициентът на надеждност на теста варира между 0 и 1. Например: ако корелацията между два паралелни теста е rxx´ = 0'80, това означава, че 80% от дисперсията от теста се дължи на истинската мярка, а останалата част, т.е. 20% от дисперсията на теста, се дължи на грешка. The индекс на надеждност на теста е корелацията между неговите емпирични резултати и неговите истински резултати индекс на надеждност = Индексът на надеждност е равен на квадратния корен от коефициента на надеждност

След като са разработени две паралелни форми на тест, се прилага процедура за анализ на дисперсията, за да се провери хомогенността на дисперсиите и разликата между мерките. Ако отклоненията са еднородни, разликата между средните не е значителна и двете форми са конструирани с еднакъв брой елементи от един и същи тип и психологическо съдържание, може да се каже, че са паралелно. Ако не, трябва да ги реформирате, докато не станат. Липсата на надеждност се идентифицира със стойността rxx´ = 0 4. - Типичната грешка в измерването: Разликата между емпиричната оценка и истинската е случайната грешка, наречена грешка в измерването. Стандартното отклонение на грешките в измерването се нарича стандартна грешка в измерването. The стандартна грешка в измерването позволява да се правят оценки за абсолютната надеждност на теста, т.е. да се изчислява колко грешка в измерването влияе върху даден резултат.

Надеждност и дължина: Дължината на теста се отнася до броя на неговите елементи. Надеждността му зависи от тази дължина. Ако тестът се състои от три елемента, субектът може да получи резултат 1 по един повод и резултат 1 при другия или паралелно.

От един случай до друг, резултатът варира с една точка; една точка от три е 33% вариация, голяма вариация. Ако участниците получат случайни вариации от този тип, корелацията на теста със себе си или тази на двете паралелни форми на теста ще бъде значително намалена и не може да бъде висока. Ако тестът е много по-дълъг, ако има например 100 елемента, субектът може да получи 70 точки по един повод и 67 по паралелен начин. От време на време тя варира 3 точки; това е относително малка вариация спрямо общия тест, по-специално 3%. Тези малки случайни промени от този мащаб, които се случват в десетките на субектите, когато излизат от паралелна форма, са относително маловажни и няма да намалят толкова, колкото преди корелацията между и двете.

Коефициентът на надеждност ще бъде много по-висок, отколкото в предишния случай. Уравнението на Спирман-Браун изразява връзката между надеждността и дължината. Точността на теста е нула, когато дължината е 0, и се увеличава с увеличаване на дължината. Въпреки че увеличението е относително по-малко, тъй като дължината на детайла е по-голяма. Това означава, че точността нараства много в началото и относително по-малко след това. Когато дължината клони към безкрайност, коефициентът на надеждност клони към

С увеличаване на дължината на теста, неговата точност се увеличава, защото истинската дисперсия се увеличава с по-висока скорост от дисперсията на грешката. Това означава, че точността на теста се увеличава, тъй като делът на дисперсията поради грешката намалява. Формулата на Рулон, както и формулата на Фланаган и Гутман, са особено приложими при изчисляване на коефициента на надеждност по метода на две половини. Това са формули, използвани за изчисляване на коефициента на надеждност.

Надеждност и последователност: Коефициентът на надеждност може да бъде намерен и по друг начин, той се нарича алфа коефициент или коефициент на обобщаемост или представителност (Cronbach). Този алфа коефициент показва колко точно някои елементи измерват аспект на личността или поведението. Може да се тълкува като: Оценка на средната корелация на всички възможни елементи в определен аспект. Мярка за прецизността на теста въз основа на неговата съгласуваност или вътрешна последователност (взаимовръзка между неговите елементи; до каква степен всички тестови елементи се измерват еднакво) и тяхната дължина. Посочвайки представителността на теста, т.е. количеството, в което извадката от елементи, която го съставя, е представителна за популацията от възможни елементи от същия тип и психологично съдържание. The алфа коефициент Той отразява главно две основни концепции в прецизността на теста: 1. Взаимовръзката между неговите елементи: степента, в която всички те измерват едно и също нещо добре.

Продължителността на теста: чрез увеличаване на броя на случаите в извадката и ако грешките са елиминирани систематична, извадката по-добре представя популацията, от която е взета, и случайна грешка. Ако тестовите елементи са дихотомични (да или не, 1 или 0, съгласни или несъгласни и т.н.), уравнението на алфа коефициента се опростява, което води до уравненията на Кудър-Ричардсън (KR20 и KR21). Като се има предвид определен брой елементи, тестът ще бъде толкова по-надежден, колкото по-хомогенен е. Алфа коефициентът показва надеждността, тъй като представлява хомогенност и съгласуваност или вътрешна последователност на елементите на теста.

Според модела на пространството за извадка, целта на теста е да се оцени мярката, която би била получена, ако бяха използвани всички предмети в пробата. Това измерване би било истинският резултат, който е приблизително близък до действителните измервания. В зависимост от степента, в която извадка от елементи корелира с истинските резултати, тестът е повече или по-малко надежден. В центъра на този модел е матрицата на корелациите между всички елементи в пространството на извадката. Този примерен модел настоява по-пряко за вътрешна последователност и доколкото го постига, косвено гарантира стабилност.

Линейният модел на паралелни тестове настоява повече за стабилността на резултатите и доколкото постига стабилност, косвено благоприятства вътрешната последователност. Ако прилагаме тест за установяване на индивидуални диагнози и прогнози, коефициентът на надеждност трябва да бъде 0,90 нагоре. В прогнозите и колективните класификации изискването не е толкова голямо, въпреки че не е удобно да се отклонявате твърде далеч от 0,90 до 0,80.

Понякога при някои видове тестове, като личностни тестове, е трудно да се постигнат коефициенти над 0,70. Ако паралелните фигури или паралелните половини се прилагат след повече или по-голям интервал, случайните грешки може да са по-многобройни от тези, засягащи алфа коефициента. Това е така, защото това, което намалява корелацията, са не само случайните грешки, присъщи на теста и за един случай, които са тези, които се вземат предвид влияят алфа коефициентът, но и всички грешки, които могат да произтичат от двете различни ситуации, които могат да се различават в много детайли. Следователно алфа коефициентът обикновено е по-висок от останалите коефициенти.

С изключение на коефициента, открит чрез повторение на същия тест, тъй като има по-голяма вероятност грешките случайните модели от първото приложение се повтарят във второто и вместо да намалява корелацията между двете, нараства. Трябва да се внимава второто приложение да е напълно независимо от първото. Ако постигнем това, това ще бъде най-лесният и евтин метод и препоръчителен, когато се опитваме да оценим стабилността на резултатите, особено през дълги периоди от време и със сложни тестове. > Напред: Валидност на тестовете

instagram viewer