Κλασική θεωρία δοκιμών

  • Jul 26, 2021
click fraud protection
Κλασική θεωρία δοκιμών

Ένα τεστ είναι ένα επιστημονικό όργανο στο μέτρο που μετρά αυτό που ισχυρίζεται, δηλαδή είναι έγκυρο και μετρά καλά, δηλαδή είναι ακριβές ή αξιόπιστο. Εάν βρούμε ένα όργανο που δεν μπορούμε να εμπιστευτούμε τις μετρήσεις που παρέχουν, καθώς ποικίλλουν από καιρό σε καιρό όταν μετράμε το ίδιο αντικείμενο, τότε θα πούμε ότι δεν είναι αξιόπιστο. Ένα όργανο για μέτρηση σωστά Κάτι πρέπει να είναι ακριβές, γιατί αν όχι, μετρήστε αυτό που μετράτε, θα το μετρήσετε λάθος. Επομένως, η ακρίβεια είναι απαραίτητη αλλά όχι επαρκής προϋπόθεση. Επιπλέον, πρέπει να είναι έγκυρο, δηλαδή, αυτό που μετρά με ακρίβεια θα είναι αυτό που σκοπεύει να μετρήσει και όχι κάτι άλλο.

Απόλυτη και σχετική αξιοπιστία: Μπορούμε να προσεγγίσουμε το πρόβλημα της αξιοπιστίας μιας δοκιμής με δύο διαφορετικούς τρόπους, αν και βασικά συμπίπτουν.

Η αξιοπιστία και η ανακρίβεια των μετρήσεών του: Όταν ένα άτομο ανταποκρίνεται σε ένα τεστ, λαμβάνει μια εμπειρική βαθμολογία, η οποία επηρεάζεται από ένα σφάλμα. Εάν δεν υπήρχαν σφάλματα, το θέμα θα είχε την πραγματική βαθμολογία του. Το τεστ είναι ανακριβές επειδή η εμπειρική βαθμολογία δεν ταιριάζει με το πραγματικό πραγματικό σκορ. Αυτή η διαφορά μεταξύ των δύο βαθμολογιών είναι το σφάλμα δειγματοληψίας, το σφάλμα μέτρησης. ο

τυπικό σφάλμα μέτρησης θα είναι η τυπική απόκλιση των σφαλμάτων μέτρησης. ο τυπικό σφάλμα μέτρησης υποδεικνύει την απόλυτη ακρίβεια της δοκιμής, καθώς επιτρέπει την εκτίμηση της διαφοράς μεταξύ της ληφθείσας μέτρησης και αυτής που θα ληφθεί εάν δεν υπήρχε σφάλμα.

Αξιοπιστία και σταθερότητα των μετρήσεων: Μια δοκιμή θα είναι πιο αξιόπιστη όσο πιο σταθερά ή σταθερά τα αποτελέσματα που παρέχει διατηρούνται όταν επαναλαμβάνονται. Όσο πιο σταθερά είναι τα αποτελέσματα σε δύο περιπτώσεις, τόσο μεγαλύτερη είναι η σχέση μεταξύ τους. Αυτή η συσχέτιση ονομάζεται συντελεστής αξιοπιστίας. Αυτό μας λέει, όχι το ποσό του σφάλματος, αλλά τη συνέπεια της δοκιμής με τον εαυτό του και τη συνέπεια των πληροφοριών που προσφέρει. ο συντελεστής αξιοπιστίας εκφράζει τη σχετική αξιοπιστία του τεστ.

Ο συντελεστής αξιοπιστίας και ο δείκτης αξιοπιστίας: - Ο συντελεστής αξιοπιστίας μιας δοκιμής είναι η συσχέτιση της δοκιμής με τον εαυτό της, που λαμβάνεται για παράδειγμα, σε δύο παράλληλες μορφές: rxx. - Ο δείκτης ακριβείας είναι η συσχέτιση μεταξύ των εμπειρικών βαθμολογιών ενός τεστ και των πραγματικών βαθμολογιών του: rxv Ο δείκτης ακριβείας πάντα θα είναι μεγαλύτερη από τον συντελεστή αξιοπιστίας Για να μάθετε τον συντελεστή αξιοπιστίας, αυτές οι τρεις μέθοδοι πρέπει να επισημανθούν κλασικά:

  • Βρείτε τη συσχέτιση μεταξύ της δοκιμής και της επανάληψής της: Η μέθοδος επανάληψης ή η μέθοδος δοκιμής δοκιμής: Αποτελείται από εφαρμόστε το ίδιο τεστ στην ίδια ομάδα δύο φορές και υπολογίστε τη συσχέτιση μεταξύ των δύο σειρών του σκορ. Αυτός ο συσχετισμός είναι ο συντελεστής αξιοπιστίας. Αυτή η μέθοδος δίνει συνήθως υψηλότερο συντελεστή αξιοπιστίας από αυτόν που λαμβάνεται με άλλες διαδικασίες και μπορεί να μολυνθεί από ενοχλητικούς παράγοντες.
  • Βρείτε τη συσχέτιση μεταξύ δύο παράλληλων μορφών του τεστ: Η μέθοδος των παράλληλων μορφών: Παρασκευάζονται δύο μορφές παράλληλες γραμμές του ίδιου τεστ, δηλαδή, δύο ισοδύναμες μορφές που δίνουν τις ίδιες πληροφορίες και εφαρμόζονται στην ίδια ομάδα του μαθήματα. Ο συσχετισμός μεταξύ των δύο μορφών είναι ο συντελεστής αξιοπιστίας. Με αυτήν τη μέθοδο, αποφεύγοντας την επανάληψη της ίδιας δοκιμής, αποφεύγονται ενοχλητικές πηγές αξιοπιστίας δοκιμής.
  • Βρείτε τη συσχέτιση μεταξύ δύο παράλληλων μισών της δοκιμής: Η μέθοδος των δύο μισών: Η δοκιμή χωρίζεται σε δύο ισοδύναμα μισά και βρίσκεται η συσχέτιση μεταξύ τους. Είναι η προτιμώμενη μέθοδος, καθώς είναι απλή και αποφεύγει τους περιορισμούς των προηγούμενων διαδικασιών. Μπορείτε να επιλέξετε τα περίεργα στοιχεία του τεστ, να αποτελούν το μισό και τα ομοιόμορφα στοιχεία να αποτελούν το άλλο.

Ο συντελεστής αξιοπιστίας και ο συσχετισμός μεταξύ παράλληλων δοκιμών

ο συντελεστής αξιοπιστίας μιας δοκιμής δείχνει την αναλογία ότι η πραγματική διακύμανση είναι της εμπειρικής διακύμανσης: γράφημα33 Ο συντελεστής αξιοπιστίας μιας δοκιμής κυμαίνεται μεταξύ 0 και 1. Για παράδειγμα: εάν η συσχέτιση μεταξύ δύο παράλληλων δοκιμών είναι rxx´ = 0'80, αυτό σημαίνει ότι το 80% της διακύμανσης του τεστ οφείλεται στο πραγματικό μέτρο και το υπόλοιπο, δηλαδή, το 20% της διακύμανσης του τεστ οφείλεται στο λάθος. ο δείκτης αξιοπιστίας μιας δοκιμής είναι η συσχέτιση μεταξύ των εμπειρικών βαθμολογιών και του πραγματικού δείκτη αξιοπιστίας βαθμολογίας = Ο δείκτης αξιοπιστίας ισούται με την τετραγωνική ρίζα του συντελεστή αξιοπιστίας

Μόλις αναπτυχθούν δύο παράλληλες μορφές δοκιμής, εφαρμόζεται η διαδικασία ανάλυσης διακύμανσης για τον έλεγχο της ομοιογένειας των παραλλαγών και της διαφοράς μεταξύ των μετρήσεων. Εάν οι διακυμάνσεις είναι ομοιογενείς, η διαφορά μεταξύ των μέσων δεν είναι σημαντική και οι δύο μορφές είναι κατασκευασμένο με τον ίδιο αριθμό στοιχείων του ίδιου τύπου και ψυχολογικού περιεχομένου, μπορεί να ειπωθεί ότι είναι παράλληλο. Εάν όχι, πρέπει να τα μεταρρυθμίσετε έως ότου είναι. Η έλλειψη αξιοπιστίας αναγνωρίζεται με την τιμή rxx´ = 0 4.- Το τυπικό σφάλμα μέτρησης: Η διαφορά μεταξύ της εμπειρικής βαθμολογίας και του πραγματικού είναι το τυχαίο σφάλμα, που ονομάζεται σφάλμα μέτρησης. Η τυπική απόκλιση των σφαλμάτων μέτρησης ονομάζεται τυπικό σφάλμα μέτρησης. ο τυπικό σφάλμα μέτρησης επιτρέπει την πραγματοποίηση εκτιμήσεων σχετικά με την απόλυτη αξιοπιστία της δοκιμής, δηλαδή την εκτίμηση του ποσοστού σφάλματος μέτρησης που επηρεάζει μια βαθμολογία.

Αξιοπιστία και μήκος: Το μήκος της δοκιμής αναφέρεται στον αριθμό των στοιχείων του. Η αξιοπιστία του εξαρτάται από αυτό το μήκος. Εάν μια δοκιμασία αποτελείται από τρία στοιχεία, ένα θέμα μπορεί να λάβει βαθμολογία 1 σε μία περίπτωση και βαθμολογία 1 στην άλλη ή παράλληλα.

Από τη μία στιγμή στην άλλη, το σκορ ποικίλλει κατά ένα σημείο. ένα σημείο στα τρία είναι μια παραλλαγή 33%, μια υψηλή παραλλαγή. Εάν τα υποκείμενα λάβουν τυχαίες παραλλαγές αυτού του τύπου, η συσχέτιση του τεστ με τον εαυτό του ή με τις δύο παράλληλες μορφές του τεστ θα μειωθεί σημαντικά και δεν μπορεί να είναι υψηλή. Εάν το τεστ είναι πολύ μεγαλύτερο, αν έχει, για παράδειγμα, 100 στοιχεία, ένα άτομο μπορεί να αποκτήσει 70 πόντους σε μία περίπτωση και 67 με παράλληλο τρόπο. Από τη μια στιγμή στην άλλη έχει ποικίλει 3 βαθμούς. Είναι μια σχετικά μικρή διακύμανση σε σχέση με τη συνολική δοκιμή, συγκεκριμένα το 3%. Αυτές οι μικρές τυχαίες μεταβολές αυτού του μεγέθους, οι οποίες εμφανίζονται στις βαθμολογίες των θεμάτων, όταν πηγαίνετε από παράλληλο σχήμα, είναι σχετικά ασήμαντο και δεν θα μειωθεί όσο πριν από τη συσχέτιση μεταξύ και τα δυο.

Ο συντελεστής αξιοπιστίας θα είναι πολύ υψηλότερος από ό, τι στην προηγούμενη περίπτωση. Η εξίσωση Spearman-Brown εκφράζει τη σχέση μεταξύ αξιοπιστίας και μήκους. Η ακρίβεια μιας δοκιμής είναι μηδενική όταν το μήκος είναι 0 και αυξάνεται καθώς αυξάνεται το μήκος. Αν και η αύξηση είναι σχετικά μικρότερη καθώς το μήκος του εξαρτήματος είναι μεγαλύτερο. Αυτό σημαίνει ότι η ακρίβεια αυξάνεται πολύ στην αρχή και σχετικά λιγότερο μετά. Όταν το μήκος τείνει στο άπειρο, ο συντελεστής αξιοπιστίας τείνει

Καθώς αυξάνεται η διάρκεια μιας δοκιμής, η ακρίβειά της αυξάνεται επειδή η πραγματική διακύμανση αυξάνεται με υψηλότερο ρυθμό από τη διακύμανση σφάλματος. Αυτό σημαίνει ότι η ακρίβεια της δοκιμής αυξάνεται επειδή μειώνεται το ποσοστό διακύμανσης λόγω του σφάλματος. Ο τύπος Rulon, καθώς και ο τύπος Flanagan και Guttman, είναι ιδιαίτερα εφαρμόσιμοι κατά τον υπολογισμό του συντελεστή αξιοπιστίας με τη μέθοδο των δύο ημίσεων. Αυτοί είναι τύποι που χρησιμοποιούνται για τον υπολογισμό του συντελεστή αξιοπιστίας.

Αξιοπιστία και συνέπεια: Ο συντελεστής αξιοπιστίας μπορεί επίσης να βρεθεί με άλλο τρόπο, λέγεται συντελεστής άλφα ή συντελεστής γενικευσιμότητας ή αντιπροσωπευτικότητας (Cronbach). Αυτός ο συντελεστής άλφα δείχνει πόσο ακριβή ορισμένα στοιχεία μετρούν μια πτυχή της προσωπικότητας ή της συμπεριφοράς. Μπορεί να ερμηνευθεί ως: Μια εκτίμηση της μέσης συσχέτισης όλων των πιθανών στοιχείων σε μια συγκεκριμένη πτυχή. Ένα μέτρο της ακρίβειας της δοκιμής με βάση τη συνοχή ή την εσωτερική του συνέπεια (αλληλεπίδραση μεταξύ των στοιχείων του · σε ποιο βαθμό όλα τα δοκιμαστικά στοιχεία έχουν το ίδιο μέγεθος) και το μήκος τους. Υποδεικνύοντας την αντιπροσωπευτικότητα του τεστ, δηλαδή, το ποσό στο οποίο το δείγμα των αντικειμένων που το συνθέτει είναι αντιπροσωπευτικό του πληθυσμού πιθανών στοιχείων του ίδιου τύπου και ψυχολογικού περιεχομένου. ο συντελεστής άλφα Αντικατοπτρίζει κυρίως δύο βασικές έννοιες στην ακρίβεια ενός τεστ: 1. Η σχέση μεταξύ των στοιχείων της: ο βαθμός στον οποίο όλα μετράνε το ίδιο πράγμα καλά.

Η διάρκεια της δοκιμής: αυξάνοντας τον αριθμό των περιπτώσεων σε ένα δείγμα και εάν εξαλειφθούν σφάλματα συστηματικά, το δείγμα αντιπροσωπεύει καλύτερα τον πληθυσμό από τον οποίο αντλείται και το περιστασιακό λάθος. Εάν τα στοιχεία δοκιμής είναι διχοτόμου, (ναι ή όχι, 1 ή 0, συμφωνούν ή διαφωνούν, κ.λπ.), η εξίσωση του συντελεστή άλφα απλοποιείται, δημιουργώντας τις εξισώσεις του Kuder-Richardson (KR20 και KR21). Λαμβάνοντας υπόψη έναν ορισμένο αριθμό αντικειμένων, μια δοκιμή θα είναι όσο πιο αξιόπιστη, τόσο πιο ομοιογενής. Ο συντελεστής άλφα μας λέει την αξιοπιστία στο βαθμό που αντιπροσωπεύει την ομοιογένεια και τη συνοχή ή την εσωτερική συνοχή των στοιχείων μιας δοκιμής.

Σύμφωνα με το μοντέλο χώρου δείγματος αντικειμένου, ο στόχος της δοκιμής είναι να εκτιμηθεί το μέτρο που θα ληφθεί εάν χρησιμοποιηθούν όλα τα στοιχεία του χώρου δείγματος. Αυτή η μέτρηση θα είναι η πραγματική βαθμολογία, η οποία είναι σχεδόν κοντά στις πραγματικές μετρήσεις. Ανάλογα με τον βαθμό στον οποίο ένα δείγμα αντικειμένων συσχετίζεται με τις πραγματικές βαθμολογίες, το τεστ είναι λίγο πολύ αξιόπιστο. Κεντρικό σημείο αυτού του μοντέλου είναι ο πίνακας συσχέτισης μεταξύ όλων των στοιχείων στο χώρο του δείγματος. Αυτό το μοντέλο δείγματος επιμένει πιο άμεσα στην εσωτερική συνέπεια, και στο βαθμό που το επιτυγχάνει, εγγυάται έμμεσα τη σταθερότητα.

Το γραμμικό μοντέλο παράλληλων δοκιμών επιμένει περισσότερο στη σταθερότητα των βαθμολογιών και στο βαθμό που επιτυγχάνει σταθερότητα, ευνοεί έμμεσα την εσωτερική συνέπεια. Εάν εφαρμόσουμε μια δοκιμή για τον προσδιορισμό μεμονωμένων διαγνώσεων και προγνώσεων, ο συντελεστής αξιοπιστίας πρέπει να είναι 0,90 προς τα πάνω. Στις προβλέψεις και τις συλλογικές ταξινομήσεις, η απαίτηση δεν είναι τόσο μεγάλη, αν και δεν είναι βολικό να απομακρυνθείτε πολύ από 0,90 έως 0,80.

Μερικές φορές σε ορισμένα είδη δοκιμών, όπως τεστ προσωπικότητας, είναι δύσκολο να επιτευχθούν συντελεστές άνω των 0,70. Εάν τα παράλληλα σχήματα, ή παράλληλα μισά, εφαρμόζονται μετά από περισσότερο ή λιγότερο μεγάλο διάστημα, τα πιθανά σφάλματα μπορεί να είναι πολυάριθμα από αυτά που επηρεάζουν τον συντελεστή άλφα. Αυτό συμβαίνει επειδή αυτό που μειώνει τη συσχέτιση δεν είναι μόνο τα τυχαία σφάλματα που είναι εγγενή στη δοκιμή και σε μία μόνο περίπτωση, τα οποία λαμβάνονται υπόψη ο συντελεστής άλφα, αλλά και όλα τα σφάλματα που μπορεί να προέρχονται από τις δύο διαφορετικές καταστάσεις, τα οποία μπορεί να διαφέρουν σε πολλές λεπτομέρειες, επηρεάζουν. Επομένως, ο συντελεστής άλφα είναι συνήθως υψηλότερος από τους άλλους συντελεστές.

Με την εξαίρεση του συντελεστή που βρέθηκε επαναλαμβάνοντας την ίδια δοκιμή, καθώς υπάρχει μεγαλύτερη πιθανότητα ότι τα σφάλματα Τα τυχαία μοτίβα από την πρώτη εφαρμογή επαναλαμβάνονται στη δεύτερη, και αντί να μειωθεί ο συσχετισμός μεταξύ των δύο, το αυξάνουν. Πρέπει να ληφθεί μέριμνα ώστε η δεύτερη εφαρμογή να είναι εντελώς ανεξάρτητη από την πρώτη. Εάν το πετύχουμε αυτό, θα είναι η ευκολότερη και φθηνότερη μέθοδος και θα ήταν σκόπιμο όταν προσπαθούμε να εκτιμήσουμε τη σταθερότητα των βαθμολογιών, ειδικά σε μεγάλες χρονικές περιόδους και με πολύπλοκες δοκιμές. > Επόμενο: Ισχύς των δοκιμών

instagram viewer