แผนภาพกระจายเป็นการแสดงกราฟิกซึ่งสามารถทราบความสัมพันธ์ที่มีอยู่ระหว่างสองตัวแปรได้โดยใช้ระนาบ คาร์ทีเซียน มีประโยชน์อย่างมากในการกำหนดและแสดงความสัมพันธ์ที่มีอยู่ระหว่างข้อมูลของตัวแปรศึกษาสองตัว เช่น ความสัมพันธ์ระหว่าง เหตุและผล.
Scatterplots คือ การแสดงตัวแปรในระนาบคาร์ทีเซียนโดยใช้ข้อมูลเชิงปริมาณ
ในบทความนี้คุณจะพบกับ:
Scatterplot คืออะไร และมีประโยชน์อย่างไร?
scatterplot เป็นการแสดงกราฟิกประเภทหนึ่งซึ่ง เป็นไปได้ที่จะทราบความสัมพันธ์ที่มีอยู่ระหว่างสองตัวแปร การใช้ระนาบคาร์ทีเซียนสำหรับค่าหรือข้อมูลของตัวแปรนี้ถูกกำหนดให้กับ แกน (X, Y) และจุดตัดระหว่างตัวแปรทั้งสองแทนจุดบนกราฟของ แบน.
โฆษณา
จุดเหล่านี้รวมกันจะแสดงเป็นกลุ่มก้อน ซึ่งแสดงถึงแผนภาพกระจาย
โฆษณา
Scatterplot มีประโยชน์อย่างไร? แผนภาพการกระจายนี้มีประโยชน์มากในการระบุและแสดงความสัมพันธ์ที่มีอยู่ระหว่างข้อมูลของตัวแปรศึกษาสองตัว เช่น ความสัมพันธ์ระหว่างเหตุกับผลหรือความสัมพันธ์ระหว่างเหตุ
ไดอะแกรมประเภทนี้ มีการนำไปใช้อย่างกว้างขวางในสถิติประยุกต์ เช่นเดียวกับในเศรษฐศาสตร์และในการตลาด เนื่องจากช่วยให้บริษัทต่างๆ เข้าใจข้อมูลการตลาดที่สำคัญ แม้ว่าขอบเขตการใช้งานจะหลากหลายมากก็ตาม
โฆษณา
ขั้นตอนในการสร้างแผนภาพกระจาย
แม้ว่าการสร้าง scatterplot จะเป็นกระบวนการง่ายๆ แต่เราต้องคำนึงถึงขั้นตอนต่อไปนี้:
- กำหนดสถานการณ์ที่มีปัจจัยที่คุณต้องการแสดงในไดอะแกรม
- รวบรวมข้อมูลของปัจจัยเหล่านี้ ข้อมูลต้องเป็นตัวแทนของสถานการณ์ โดยตัวแปรทั้งสองต้องมีข้อมูลตัวอย่างจำนวนเท่ากัน
- ระบุตัวแปร บนแกน (Y) ของตัวแปรตาม ซึ่งแสดงถึงปัจจัยที่มีพฤติกรรม ได้รับอิทธิพลจากตัวแปรอีกตัวหนึ่ง โดยอีกตัวหนึ่งเป็นตัวแปรอิสระที่แสดงบนแกน (X)
- แสดงค่าของตัวแปรแต่ละตัวบนกราฟและทำเครื่องหมายจุดตัดของข้อมูลบนแกน (Y) กับจุดบนแกน (X)
- การวิเคราะห์ข้อมูลการกระจายที่แสดงในกราฟเพื่อกำหนดความสัมพันธ์ที่มีอยู่
ความสัมพันธ์เชิงเส้นในการวิเคราะห์แผนภาพกระจาย
ความสัมพันธ์เชิงเส้น บนแผนภาพกระจาย ทำให้เราสามารถตีความความเข้มของตัวแปรทั้งสองที่เกี่ยวข้องกัน ในแง่นี้ ความสัมพันธ์สามารถเป็น:
โฆษณา
- ความสัมพันธ์เชิงบวก: แสดงว่าตัวแปรทั้งสองมีพฤติกรรมที่เพิ่มขึ้น ถ้าตัวแปรหนึ่งเพิ่มขึ้นอีกตัวแปรหนึ่งด้วย
-
ความสัมพันธ์เชิงลบ: ในการแทนค่านี้เมื่อตัวแปรหนึ่งเพิ่มขึ้น อีกตัวแปรหนึ่งจะลดลง
ความสัมพันธ์ที่เป็นโมฆะ: ไม่มีความสัมพันธ์ระหว่างตัวแปรทั้งสอง
แต่ถึงอย่างไร, ความสัมพันธ์นั้นสมบูรณ์แบบหรือสมบูรณ์แบบ เนื่องจากความสัมพันธ์ระหว่างตัวแปรทั้งสองมีพฤติกรรมเป็นสัดส่วนเท่าๆ กัน โดยมี ค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับหนึ่ง
โฆษณา
ถ้าเราต้องการ กำหนดค่าสัมประสิทธิ์สหสัมพันธ์ได้อย่างแม่นยำ, ใน เอ็กเซล สามารถ เพิ่มสูตร ค่าเริ่มต้น “=COEFF.DE.CORREL(…,..)” คุณแค่ใส่สูตร ลากข้อมูลจากตัวแปรตัวแรก ใส่เครื่องหมายจุลภาค ลากข้อมูลจากตัวแปรตัวที่สอง เท่านี้ก็เรียบร้อย
1. ตัวอย่างพล็อตกระจาย
ในตัวอย่างนี้ บริษัทต้องการทราบว่า ความสัมพันธ์ระหว่างจำนวนชั่วโมงการทำงานกับจำนวนสินค้าที่บกพร่องสำหรับสิ่งนี้ บริษัท ดำเนินการ เรียน 20 สัปดาห์การติดตามดังกล่าวให้ข้อมูลต่อไปนี้:
เมื่อข้อมูลที่จำเป็นได้รับการระบุแล้ว เราจะดำเนินการแสดงกราฟิกต่อไปในการทำเช่นนี้จำเป็นต้องระบุว่าปัจจัยใดแสดงถึงตัวแปรตามและปัจจัยใดแสดงถึงตัวแปรอิสระ
เราสามารถระบุได้ว่า ชั่วโมงการทำงานเป็นตัวแปรอิสระ แสดงบนแกน (X) และ ผลิตภัณฑ์ที่มีข้อบกพร่องขึ้นอยู่ ซึ่งจะสะท้อนอยู่ในแกน (y) เสมอ
เราเห็นข้อมูลที่แสดงในกราฟ:
ดังกราฟแสดงความสัมพันธ์ระหว่าง ข้อมูลที่เก็บรวบรวมจะสะท้อนด้วยจุดสีน้ำเงินที่กระจัดกระจาย แต่ละจุดแสดงถึงความสัมพันธ์ของชั่วโมงการทำงานและผลิตภัณฑ์ที่มีข้อบกพร่องที่นำเสนอต่อสัปดาห์
ถึง เพิ่มเส้นแนวโน้มลงในกราฟ เราสามารถกำหนดได้ว่า ในกราฟนี้มีความสัมพันธ์เชิงบวก เนื่องจากเมื่อชั่วโมงการทำงานเพิ่มขึ้น เปอร์เซ็นต์ของผลิตภัณฑ์ที่บกพร่องก็เพิ่มขึ้นเช่นกัน
เส้นแนวโน้มนี้แสดงถึง ค่าสัมประสิทธิ์สหสัมพันธ์ 0.91.
2. ตัวอย่างพล็อตกระจาย
ในกรณีนี้ เราต้องการทราบว่ามี ความสัมพันธ์ระหว่างน้ำหนักและส่วนสูงของ 18 คนที่สุ่มเลือก ในท้องที่ที่กำหนดควรสังเกตว่า ยิ่งเก็บรวบรวมข้อมูลมากเท่าใด กลุ่มตัวอย่างก็ยิ่งเป็นตัวแทนมากขึ้นเท่านั้น ของสภาพของประชากรทั้งหมด มาดูข้อมูลกัน:
ลองดูที่การแสดงในแผนภาพกระจาย:
ดังที่เห็นในแผนภาพ มีความสัมพันธ์เชิงบวกระดับกลางเนื่องจากความสูงแม้ว่าจะมีผลต่อน้ำหนัก แต่อุบัติการณ์ไม่สูงมากซึ่งมีค่าสัมประสิทธิ์สหสัมพันธ์เท่ากับ 0.59
สำหรับรายละเอียดของแผนภาพ เราสามารถใช้ Microsoft Office Excel เป็นเครื่องมือเราเพียงแค่ไปที่แถบเครื่องมือของ Excel แล้วใส่ scatterplot และเพิ่มข้อมูลที่จำเป็นเข้าไป