ทฤษฎีการทดสอบคลาสสิก

  • Jul 26, 2021
click fraud protection
ทฤษฎีการทดสอบคลาสสิก

การทดสอบคือ เครื่องมือวิทยาศาสตร์ ตราบเท่าที่มันวัดสิ่งที่ตั้งใจ นั่นคือ มันถูกต้อง และมันวัดได้ดี นั่นคือ มันถูกต้องหรือเชื่อถือได้ หากเราพบเครื่องมือที่เราไม่สามารถวางใจในการวัดที่พวกเขาให้ เพราะมันแตกต่างกันไปเป็นครั้งคราวเมื่อเราวัดวัตถุเดียวกัน เราจะบอกว่ามันไม่น่าเชื่อถือ เครื่องมือวัด อย่างถูกต้อง บางอย่างต้องแม่นๆ เพราะถ้าไม่วัดที่วัดก็วัดผิดครับ ดังนั้นความแม่นยำจึงเป็นเงื่อนไขที่จำเป็นแต่ไม่เพียงพอ นอกจากนี้ จะต้องถูกต้อง นั่นคือ สิ่งที่วัดได้อย่างแม่นยำ จะเป็นสิ่งที่มีจุดมุ่งหมายเพื่อวัด ไม่ใช่อย่างอื่น

ความน่าเชื่อถือแบบสัมบูรณ์และแบบสัมพัทธ์: เราสามารถเข้าถึงปัญหาความน่าเชื่อถือของการทดสอบได้สองวิธี แม้ว่าโดยพื้นฐานแล้วมันจะเกิดขึ้นพร้อมกัน

ความน่าเชื่อถือและความไม่ถูกต้องของการวัด: เมื่อผู้รับการทดสอบตอบสนองต่อการทดสอบ เขาจะได้คะแนนเชิงประจักษ์ซึ่งได้รับผลกระทบจากข้อผิดพลาด หากไม่มีข้อผิดพลาด ผู้ทดลองจะได้รับคะแนนที่แท้จริงของเขา การทดสอบไม่ชัดเจนเนื่องจากคะแนนเชิงประจักษ์ไม่ตรงกับคะแนนจริง ความแตกต่างระหว่างคะแนนทั้งสองนี้คือข้อผิดพลาดในการสุ่มตัวอย่าง ข้อผิดพลาดในการวัด NS

ข้อผิดพลาดมาตรฐานของการวัด จะ ค่าเบี่ยงเบนมาตรฐานของข้อผิดพลาดในการวัด. NS ข้อผิดพลาดมาตรฐานของการวัด บ่งชี้ถึงความแม่นยำสัมบูรณ์ของการทดสอบ เนื่องจากช่วยให้สามารถประมาณความแตกต่างระหว่างการวัดที่ได้รับกับค่าที่จะเกิดขึ้นได้หากไม่มีข้อผิดพลาด

ความน่าเชื่อถือและความเสถียรของการวัด: การทดสอบจะเชื่อถือได้มากขึ้นเมื่อผลลัพธ์ที่ได้จะคงที่หรือเสถียรยิ่งขึ้นจะคงอยู่เมื่อทำซ้ำ ยิ่งผลลัพธ์มีความเสถียร 2 ครั้งมากเท่าใด ความสัมพันธ์ระหว่างทั้งสองก็จะยิ่งมากขึ้นเท่านั้น ความสัมพันธ์นี้เรียกว่า ค่าสัมประสิทธิ์ความน่าเชื่อถือ. สิ่งนี้บอกเรา ไม่ใช่จำนวนข้อผิดพลาด แต่เป็นความสอดคล้องของการทดสอบกับตัวเองและความสอดคล้องของข้อมูลที่นำเสนอ NS ค่าสัมประสิทธิ์ความน่าเชื่อถือ แสดงความน่าเชื่อถือสัมพัทธ์ของการทดสอบ

ค่าสัมประสิทธิ์ความน่าเชื่อถือและดัชนีความน่าเชื่อถือ: - ค่าสัมประสิทธิ์ความน่าเชื่อถือ ของการทดสอบคือความสัมพันธ์ของการทดสอบกับตัวมันเอง ซึ่งได้มาจากตัวอย่างในรูปแบบคู่ขนานสองรูปแบบ: rxx - ดัชนีความแม่นยำ คือความสัมพันธ์ระหว่างคะแนนเชิงประจักษ์ของการทดสอบกับคะแนนจริง: rxv ดัชนีความแม่นยำเสมอ จะมากกว่าค่าสัมประสิทธิ์ความน่าเชื่อถือ เพื่อหาค่าสัมประสิทธิ์ความน่าเชื่อถือ ควรเน้นทั้งสามวิธีนี้ คลาสสิก:

  • ค้นหาความสัมพันธ์ระหว่างการทดสอบกับการทำซ้ำ: วิธีการทดสอบซ้ำหรือวิธีทดสอบซ้ำ: ประกอบด้วย ใช้การทดสอบเดียวกันกับกลุ่มเดียวกันสองครั้งและคำนวณความสัมพันธ์ระหว่างชุดของ two ทั้งสองชุด คะแนน ความสัมพันธ์นี้เป็นค่าสัมประสิทธิ์ความน่าเชื่อถือ วิธีนี้มักจะให้ค่าสัมประสิทธิ์ความน่าเชื่อถือที่สูงกว่าที่ได้จากขั้นตอนอื่น และอาจปนเปื้อนด้วยปัจจัยรบกวน
  • หาความสัมพันธ์ระหว่างแบบทดสอบสองรูปแบบขนานกัน วิธีการของรูปแบบขนาน: เตรียมสองรูปแบบ Two เส้นขนานของการทดสอบเดียวกัน นั่นคือ สองรูปแบบที่เทียบเท่ากันซึ่งให้ข้อมูลเหมือนกัน และนำไปใช้กับกลุ่มของ. เดียวกัน วิชา ความสัมพันธ์ระหว่างทั้งสองรูปแบบคือค่าสัมประสิทธิ์ความน่าเชื่อถือ ด้วยวิธีนี้ โดยไม่ทำการทดสอบซ้ำแบบเดิม จะหลีกเลี่ยงแหล่งที่มาของความน่าเชื่อถือในการทดสอบซ้ำที่รบกวน
  • ค้นหาความสัมพันธ์ระหว่างครึ่งคู่ขนานของการทดสอบ: วิธีสองส่วน: การทดสอบแบ่งออกเป็นสองส่วนเท่า ๆ กันและพบความสัมพันธ์ระหว่างกัน เป็นวิธีที่แนะนำ เนื่องจากเป็นวิธีที่ง่ายและหลีกเลี่ยงข้อจำกัดของขั้นตอนก่อนหน้า คุณสามารถเลือกองค์ประกอบแปลก ๆ ของการทดสอบเพื่อสร้างครึ่งหนึ่งและองค์ประกอบคู่เพื่อสร้างอีกองค์ประกอบหนึ่ง

ค่าสัมประสิทธิ์ความน่าเชื่อถือและความสัมพันธ์ระหว่างการทดสอบแบบขนาน

NS ค่าสัมประสิทธิ์ความน่าเชื่อถือ ของการทดสอบระบุสัดส่วนที่ความแปรปรวนที่แท้จริงคือความแปรปรวนเชิงประจักษ์: กราฟ33 ค่าสัมประสิทธิ์ความน่าเชื่อถือของการทดสอบแตกต่างกันไประหว่าง 0 ถึง 1 ตัวอย่างเช่น หากความสัมพันธ์ระหว่างการทดสอบแบบขนานสองครั้งคือ rxx´ = 0'80 หมายความว่า 80% ของความแปรปรวน ของการทดสอบเกิดจากการวัดจริง ส่วนที่เหลือคือ 20% ของความแปรปรวนของการทดสอบเกิดจาก ข้อผิดพลาด NS ดัชนีความน่าเชื่อถือ ของการทดสอบคือความสัมพันธ์ระหว่างคะแนนเชิงประจักษ์กับคะแนนจริง ดัชนีความน่าเชื่อถือ = ดัชนีความน่าเชื่อถือเท่ากับรากที่สองของค่าสัมประสิทธิ์ความน่าเชื่อถือ

เมื่อมีการพัฒนารูปแบบคู่ขนานสองแบบของการทดสอบแล้ว ขั้นตอนการวิเคราะห์ความแปรปรวนจะถูกนำไปใช้เพื่อตรวจสอบความเป็นเนื้อเดียวกันของความแปรปรวนและความแตกต่างระหว่างการวัด ถ้าความแปรปรวนเป็นเนื้อเดียวกัน ความแตกต่างระหว่างค่าเฉลี่ยไม่มีนัยสำคัญและทั้งสองรูปแบบคือ สร้างด้วยธาตุชนิดเดียวกันและเนื้อหาทางจิตวิทยาจำนวนเท่ากัน กล่าวได้ว่า เป็น ขนาน. ถ้าไม่คุณต้องปฏิรูปพวกเขาจนกว่าพวกเขาจะเป็น การขาดความน่าเชื่อถือระบุด้วยค่า rxx´ = 0 4.- ข้อผิดพลาดในการวัดทั่วไป: ความแตกต่างระหว่างคะแนนเชิงประจักษ์กับค่าจริงคือข้อผิดพลาดแบบสุ่ม ซึ่งเรียกว่าข้อผิดพลาดในการวัด ค่าเบี่ยงเบนมาตรฐานของข้อผิดพลาดในการวัดเรียกว่าข้อผิดพลาดในการวัดมาตรฐาน NS ข้อผิดพลาดมาตรฐานของการวัด ช่วยให้สามารถประมาณค่าความน่าเชื่อถือสัมบูรณ์ของการทดสอบได้ กล่าวคือ การประเมินข้อผิดพลาดในการวัดที่ส่งผลต่อคะแนน

ความน่าเชื่อถือและความยาว: ความยาวของการทดสอบหมายถึงจำนวนขององค์ประกอบ ความน่าเชื่อถือขึ้นอยู่กับความยาวนี้ หากการทดสอบประกอบด้วยสามองค์ประกอบ ผู้รับการทดสอบอาจได้รับ 1 คะแนนในคราวเดียวและได้ 1 คะแนนในอีกด้านหนึ่งหรือแบบคู่ขนานกัน

จากคราวหนึ่งไปสู่อีกวาระหนึ่ง คะแนนได้แปรเปลี่ยนไปตามจุดหนึ่ง จุดหนึ่งในสามคือรูปแบบ 33% ซึ่งเป็นรูปแบบที่สูง หากผู้เข้าร่วมการทดลองได้รับการเปลี่ยนแปลงประเภทนี้โดยไม่ได้ตั้งใจ ความสัมพันธ์ของการทดสอบกับตัวมันเองหรือของแบบทดสอบทั้งสองแบบคู่ขนานกันของแบบทดสอบจะลดลงอย่างมากและไม่สามารถสูงได้ หากการทดสอบใช้เวลานานกว่านั้นมาก หากมี เช่น 100 องค์ประกอบ ผู้ทดสอบจะได้รับ 70 คะแนนในคราวเดียวและ 67 คะแนนในลักษณะคู่ขนานกัน จากคราวหนึ่งไปอีกคราวหนึ่งจะมีการเปลี่ยนแปลง 3 คะแนน; เป็นความแปรปรวนที่ค่อนข้างเล็กเมื่อเทียบกับการทดสอบทั้งหมด โดยเฉพาะ 3% การเปลี่ยนแปลงขนาดโดยไม่ได้ตั้งใจเล็กๆ น้อยๆ เหล่านี้ ซึ่งเกิดขึ้นในคะแนนของตัวแบบเมื่อไปจาก รูปร่างคู่ขนานค่อนข้างไม่สำคัญและจะไม่ลดลงมากเท่ากับก่อนความสัมพันธ์ระหว่าง ทั้งสอง

ค่าสัมประสิทธิ์ความน่าเชื่อถือจะสูงกว่าในกรณีก่อนหน้ามาก สมการสเปียร์แมน-บราวน์แสดงความสัมพันธ์ระหว่างความน่าเชื่อถือและความยาว ความแม่นยำของการทดสอบจะเป็นโมฆะเมื่อความยาวเป็น 0 และจะเพิ่มขึ้นตามความยาวที่เพิ่มขึ้น แม้ว่าการเพิ่มขึ้นจะค่อนข้างน้อยตามความยาวของชิ้นส่วนที่มากขึ้น ซึ่งหมายความว่าความแม่นยำจะเพิ่มขึ้นอย่างมากในช่วงเริ่มต้นและค่อนข้างน้อยลงในภายหลัง เมื่อความยาวมีแนวโน้มเป็นอนันต์ ค่าสัมประสิทธิ์ความน่าเชื่อถือมีแนวโน้มที่จะ

เมื่อความยาวของการทดสอบเพิ่มขึ้น ความแม่นยำของการทดสอบจะเพิ่มขึ้นเนื่องจากความแปรปรวนที่แท้จริงเพิ่มขึ้นในอัตราที่สูงกว่าความแปรปรวนของข้อผิดพลาด ซึ่งหมายความว่าความแม่นยำของการทดสอบเพิ่มขึ้นเนื่องจากสัดส่วนของความแปรปรวนเนื่องจากข้อผิดพลาดลดลง สูตร Rulon รวมถึงสูตร Flanagan และ Guttman นั้นเหมาะสมอย่างยิ่งเมื่อคำนวณค่าสัมประสิทธิ์ความน่าเชื่อถือโดยวิธีสองส่วน เป็นสูตรที่ใช้คำนวณค่าสัมประสิทธิ์ความน่าเชื่อถือ

ความน่าเชื่อถือและความสม่ำเสมอ: ค่าสัมประสิทธิ์ความน่าเชื่อถือสามารถพบได้ในอีกทางหนึ่งเรียกว่า ค่าสัมประสิทธิ์อัลฟา หรือ ค่าสัมประสิทธิ์ของการวางนัยทั่วไปหรือการเป็นตัวแทน (Cronbach). ค่าสัมประสิทธิ์อัลฟานี้บ่งชี้ว่าบางรายการวัดลักษณะของบุคลิกภาพหรือพฤติกรรมได้อย่างแม่นยำเพียงใด สามารถตีความได้ว่า: การประมาณค่าความสัมพันธ์เฉลี่ยของรายการที่เป็นไปได้ทั้งหมดในบางแง่มุม การวัดความแม่นยำของการทดสอบโดยพิจารณาจากการเชื่อมโยงกันหรือความสอดคล้องภายใน (ความสัมพันธ์ระหว่างองค์ประกอบต่างๆ รายการทดสอบทั้งหมดมีขนาดเท่ากัน) และความยาวของรายการทดสอบ ระบุความเป็นตัวแทนของการทดสอบ นั่นคือ จำนวนที่กลุ่มตัวอย่างของรายการที่ประกอบขึ้นนั้นเป็นตัวแทนของประชากรของรายการที่เป็นไปได้ในประเภทเดียวกันและเนื้อหาทางจิตวิทยา NS ค่าสัมประสิทธิ์อัลฟา ส่วนใหญ่สะท้อนแนวคิดพื้นฐานสองประการในความแม่นยำของการทดสอบ: 1. ความสัมพันธ์ระหว่างองค์ประกอบ: ขอบเขตที่พวกเขาวัดสิ่งเดียวกันได้ดี

ความยาวของการทดสอบ: โดยการเพิ่มจำนวนกรณีในตัวอย่าง และถ้าข้อผิดพลาดถูกกำจัด อย่างเป็นระบบ กลุ่มตัวอย่างแสดงถึงประชากรที่ดึงออกมาได้ดีกว่าและ ความผิดพลาดอย่างไม่เป็นทางการ หากรายการทดสอบเป็นแบบสองขั้ว (ใช่หรือไม่ใช่ 1 หรือ 0 เห็นด้วยหรือไม่เห็นด้วย เป็นต้น) สมการของสัมประสิทธิ์อัลฟาจะลดความซับซ้อนลง ทำให้เกิดสมการของ คูเดอร์-ริชาร์ดสัน (KR20 และ KR21). เมื่อพิจารณาจากจำนวนรายการ การทดสอบยิ่งน่าเชื่อถือ ยิ่งมีความเป็นเนื้อเดียวกันมากขึ้น ค่าสัมประสิทธิ์อัลฟาบอกเราถึงความน่าเชื่อถือตราบเท่าที่มันแสดงถึงความเป็นเนื้อเดียวกันและความสอดคล้องกันหรือความสอดคล้องภายในขององค์ประกอบของการทดสอบ

ตามแบบจำลองพื้นที่ตัวอย่างรายการ วัตถุประสงค์ของการทดสอบคือการประมาณค่าการวัดที่จะได้รับหากใช้รายการทั้งหมดในพื้นที่ตัวอย่าง การวัดนี้จะเป็นคะแนนจริงซึ่งใกล้เคียงกับการวัดจริงโดยประมาณ ขึ้นอยู่กับระดับที่ตัวอย่างของรายการมีความสัมพันธ์กับคะแนนจริง การทดสอบมีความน่าเชื่อถือมากหรือน้อย ศูนย์กลางของโมเดลนี้คือเมทริกซ์สหสัมพันธ์ระหว่างรายการทั้งหมดในพื้นที่ตัวอย่าง โมเดลตัวอย่างนี้ยืนยันโดยตรงมากขึ้นเกี่ยวกับความสอดคล้องภายใน และในขอบเขตที่ทำได้ จะรับประกันความเสถียรโดยอ้อม

แบบจำลองเชิงเส้นของการทดสอบแบบขนานจะยืนยันความเสถียรของคะแนนมากกว่า และในขอบเขตที่บรรลุความเสถียร ก็จะสนับสนุนความสอดคล้องภายในโดยอ้อม หากเราใช้การทดสอบเพื่อสร้างการวินิจฉัยและการพยากรณ์โรคเป็นรายบุคคล ค่าสัมประสิทธิ์ความน่าเชื่อถือจะต้องสูงกว่า 0.90 ในการคาดการณ์และการแบ่งประเภทโดยรวม ความต้องการนั้นไม่ค่อยดีนัก แม้ว่าจะไม่สะดวกที่จะหลงทางจาก 0.90 ถึง 0.80 มากเกินไปก็ตาม

บางครั้งในการทดสอบบางประเภท เช่น การทดสอบบุคลิกภาพ เป็นเรื่องยากที่จะบรรลุค่าสัมประสิทธิ์ที่มากกว่า 0.70 หากใช้รูปร่างคู่ขนานหรือครึ่งคู่ขนานกันหลังจากช่วงห่างที่มากหรือน้อย โอกาสที่ผิดพลาดอาจมีจำนวนมากกว่าที่ส่งผลต่อค่าสัมประสิทธิ์อัลฟา ที่เป็นเช่นนี้เพราะว่าสิ่งที่ลดความสัมพันธ์นั้นไม่ได้เป็นเพียงข้อผิดพลาดแบบสุ่มที่เกิดขึ้นจริงในการทดสอบและในโอกาสเดียวซึ่งเป็นข้อผิดพลาดที่นำมาพิจารณา ค่าสัมประสิทธิ์อัลฟา แต่ยังรวมถึงข้อผิดพลาดทั้งหมดที่อาจมาจากสองสถานการณ์ที่แตกต่างกัน ซึ่งสามารถแตกต่างกันในรายละเอียดมากมาย อิทธิพล ดังนั้นค่าสัมประสิทธิ์อัลฟาจึงมักจะสูงกว่าค่าสัมประสิทธิ์อื่นๆ

ยกเว้นสัมประสิทธิ์ที่พบโดยการทดสอบซ้ำ เนื่องจากมีโอกาสผิดพลาดมากกว่า รูปแบบสุ่มจากแอปพลิเคชันแรกจะทำซ้ำในครั้งที่สอง และแทนที่จะลดความสัมพันธ์ระหว่างทั้งสอง เพิ่ม. ต้องใช้ความระมัดระวังว่าแอปพลิเคชันที่สองนั้นไม่ขึ้นกับแอปพลิเคชันแรกอย่างสมบูรณ์ หากเราทำสำเร็จ วิธีนี้จะเป็นวิธีที่ง่ายที่สุดและถูกที่สุด และแนะนำเมื่อพยายามชื่นชมความเสถียรของคะแนน โดยเฉพาะอย่างยิ่งในช่วงเวลาที่ยาวนานและด้วยการทดสอบที่ซับซ้อน > ถัดไป: ความถูกต้องของการทดสอบ

instagram viewer