ตามสถิติแล้ว ฮิสโตแกรม เป็นเครื่องมือที่มีประโยชน์ที่ช่วยอำนวยความสะดวกในการทำความเข้าใจข้อมูลตัวเลขที่เข้าใจยาก ภายใต้ความเป็นไปได้ของการสร้างภาพที่เป็นระเบียบและเข้าใจได้
ในบทความนี้คุณจะพบ:
ฮิสโตแกรมหมายถึงอะไร?
NS ฮิสโตแกรมคือการแสดงกราฟิกในรูปแบบของแท่งบาร์ซึ่งเป็นสัญลักษณ์ของการกระจายชุดข้อมูล โดยทั่วไป เครื่องมือนี้ถูกใช้โดยสถิติ หน้าที่ของมันคือการแสดงตัวเลข ตัวแปร และตัวเลข สำหรับการแสดงที่เป็นระเบียบและชัดเจนยิ่งขึ้น
โฆษณา
เนื่องจากประเภทของข้อมูลและวิธีการที่มีอยู่ จึงถือว่าเป็นประโยชน์อย่างยิ่งใน สังคมศาสตร์ ให้เปรียบเทียบข้อมูลในสำมะโน เพศ การรู้หนังสือ การเกิด การตาย เป็นต้น
โดยทั่วไป พวกมันทำหน้าที่ให้มุมมองหรือพาโนรามาของการกระจายตัวอย่าง สัมพันธ์กับลักษณะเชิงปริมาณที่แน่นอน อนุญาตให้สังเกตการตั้งค่าทีละส่วน ของสิ่งเดียวกันซึ่งพิสูจน์พฤติกรรมความสม่ำเสมอหรือข้อตกลงระหว่างค่าต่าง ๆ ของชิ้นส่วนที่ประกอบขึ้นเป็นตัวอย่างหรือในทางตรงกันข้ามสังเกตระดับการกระจายของ ค่า
โฆษณา
คุณจะสร้างฮิสโตแกรมได้อย่างไร?
การแสดงนี้อยู่ในรูปของแท่งเสมอ ส่วนขยายของแต่ละแท่งจะเป็นสัดส่วนกับความต่อเนื่องของค่าที่แสดง
โฆษณา
แกนนอนแทนค่าของตัวแปรจากต่ำสุดไปสูงสุดและแกนตั้งรวมความถี่ เครื่องหมายคลาสมักจะระบุ นั่นคือ ค่าเฉลี่ยของช่วงการจัดกลุ่มของข้อมูล เรียกว่า ความถี่ ญาติ.
ถึง สร้างฮิสโตแกรมอย่างเหมาะสม ก่อนหน้านี้จำเป็นต้องดำเนินการสร้างตารางความถี่
โฆษณา
แถบถูกวาดด้วยความกว้างและสัดส่วนเท่ากันกับช่วงเวลา ความสูงจะได้รับจากความถี่สัมบูรณ์ แท่งเหล่านี้ถูกวาดติดกัน แท่งหนึ่งอยู่ติดกัน โดยไม่ตัดกัน นั่นคือ แท่งเหล่านั้นสัมผัสแท่งที่ด้านข้าง เว้นแต่จะมีช่วงความถี่เป็นศูนย์
วันนี้มี ซอฟต์แวร์ประยุกต์ทางสถิติซึ่งอำนวยความสะดวกในการสร้างฮิสโตแกรมเหล่านี้ ดังนั้นเราต้องเน้นที่การตีความ อย่างไรก็ตาม ยังสามารถทำได้ด้วยตนเองโดยใช้เครื่องมือที่เหมาะสม
โฆษณา
ฮิสโตแกรมใช้ทำอะไร?
ดิ ฮิสโตแกรมมีประโยชน์ ถึง:
- ตีความความแปรผันของข้อมูลด้วยวิธีง่ายๆ
- ให้มุมมองที่ชัดเจนของข้อมูลที่ได้รับจากข้อมูล อำนวยความสะดวกในการตีความ
- เปรียบเทียบค่าและระบุสาเหตุที่เป็นไปได้ของปัญหา
- ตรวจสอบสาเหตุ
- ประเมินแนวทางแก้ไขที่เป็นไปได้ เมื่อขจัดสาเหตุของปัญหาแล้ว
ลักษณะของฮิสโตแกรม
- แสดงการกระจายของชุดข้อมูล
- กราฟแท่งแนวตั้ง
- แสดงแถบที่ติดกับแถบอื่นโดยไม่มีช่องว่างระหว่างแถบนั้น
- แต่ละแถบประกอบด้วยชุดย่อยของข้อมูล
- โดยจะคำนวณการสะสมหรือแนวโน้ม ความแปรปรวนหรือการกระจายตัวและการกระจายตัวอย่าง
- ใช้เพื่อแสดงตัวแปรต่อเนื่องและตัวแปรไม่ต่อเนื่อง
- ข้อมูลถูกจัดกลุ่มเป็นคลาส ซึ่งเป็นช่วงที่มีขนาดเท่ากัน
ประเภทฮิสโตแกรม
การแสดงภาพกราฟิกมีหลายประเภท ที่พบบ่อยที่สุดคือ:
ฮิสโตแกรมแถบอย่างง่าย
พวกมันเป็นตัวแทนของความถี่อย่างง่าย ทั้งแบบสัมบูรณ์หรือแบบสัมพัทธ์ ผ่านความสูงที่ตั้งไว้ที่แถบ ซึ่งจะต้องเป็นสัดส่วนกับความถี่ของคลาสที่แสดง
ฮิสโตแกรมแถบคอมโพสิต
มันถูกใช้ในการเป็นตัวแทนของตัวแปร 2 ตัวซึ่งแสดงตามความถี่อย่างง่ายของโหมดตัวแปรและความสูงเป็นสัดส่วนกับมัน
ฮิสโตแกรมของแถบคลัสเตอร์
มันถูกใช้ในการแสดงข้อมูลของตัวแปรสองตัว โดยที่ชุดของแท่งจะแสดงถึงรังสีที่แตกต่างกัน
รูปหลายเหลี่ยมความถี่
เป็นการแสดงเส้นแบบกราฟิกที่ใช้แสดงความถี่สัมบูรณ์ของค่าทั้งหมดใน a การแจกแจง โดยสามารถสังเกตได้ว่าความสูงของจุดที่ติดกับค่าของตัวแปรนั้นแปรผันตามความเพียรของ มูลค่าดังกล่าว
เปอร์เซ็นต์หัวรบ
เป็นการแทนแบบกราฟิกสะสม ซึ่งมีประโยชน์เมื่อมีการแสดงระดับเปอร์เซ็นต์ของแต่ละค่าในการแจกแจงความถี่
การตีความฮิสโตแกรม
การประเมินลักษณะสำคัญ
ในขั้นตอนนี้ ต้องตรวจสอบยอดและการกระจายในการแจกแจงโดยละเอียด การประเมินว่าขนาดกลุ่มตัวอย่างอาจส่งผลต่อลักษณะที่ปรากฏสุดท้ายของฮิสโตแกรมอย่างไร
ค้นหาตัวบ่งชี้ข้อมูลที่ผิดปกติ
ข้อมูลเบ้ทั่วไปและต่อเนื่องหลายรูปแบบบ่งชี้ความผิดปกติในข้อมูล ค่าผิดปกติอาจระบุเงื่อนไขประเภทอื่นๆ ในข้อมูล
เมื่อมีข้อมูลเบ้ ข้อมูลส่วนใหญ่จะอยู่ที่ส่วนล่างหรือส่วนบนของกราฟ ความไม่สมมาตรนี้บ่งชี้ว่าข้อมูลดังกล่าวอาจมีการกระจายอย่างผิดปกติ
ค่าผิดปกติคือค่าที่อยู่ห่างไกลจากค่าอื่นๆ และอาจส่งผลอย่างมากต่อผลลัพธ์
การประเมินความพอดีในการแจกแจง
มันเกิดขึ้นในกรณีที่ฮิสโตแกรมแสดงเส้นการแจกแจงที่แน่นมาก ดังนั้นจึงต้องประเมินว่าความสูงของแท่งและรูปร่างของเส้นนั้นอยู่ใกล้แค่ไหน
หากแถบเหล่านี้เข้าใกล้เส้นการกระจาย ข้อมูลจะต้องพอดีกับการกระจายอย่างเหมาะสม
การประเมินผลและการเปรียบเทียบกลุ่ม
ในกรณีที่ฮิสโตแกรมมีกลุ่มข้อมูล จะต้องเปรียบเทียบและประเมินจุดศูนย์กลางและการกระจายของกลุ่มเหล่านี้
มองหาความแตกต่างระหว่างจุดศูนย์กลางและการกระจายตัวของกลุ่ม
โดยสรุปเป็นมูลค่าการกล่าวขวัญว่า ฮิสโตแกรมถือเป็นบทสรุปกราฟิกของค่า ได้มาจากความผันแปรของคุณลักษณะที่กำหนด ซึ่งแสดงถึงความถี่ที่แสดงหมวดหมู่ต่างๆ ในชุดดังกล่าว
วัตถุประสงค์หลักของ การวิเคราะห์และตีความฮิสโตแกรมในสถิติ คือการระบุและจำแนกแบบจำลองความผันแปรในชุดข้อมูลที่ศึกษาและดำเนินการ a คำอธิบายที่เกี่ยวข้องและยอมรับได้สำหรับแบบจำลองดังกล่าว โดยที่ความแปรผันเกี่ยวข้องกับปรากฏการณ์ใน ศึกษา. ผลของการวิเคราะห์นี้ถือเป็นทฤษฎีที่เป็นไปได้เกี่ยวกับกระบวนการหรือสาเหตุของปัญหาที่กำลังศึกษาและอำนวยความสะดวกในการค้นหาแนวทางแก้ไขที่เป็นไปได้