การกระจายแบบปกติในสถิติ (สูตรและการใช้งาน)

  • Jul 26, 2021
click fraud protection

การกระจายแบบปกติ normal เป็นการแจกแจงความน่าจะเป็นที่สำคัญที่สุดในสถิติ รู้จักจำนวนปรากฏการณ์ที่อธิบาย มันถูกเรียกว่า ระฆังเกาส์เซียนเนื่องจากเมื่อเป็นตัวแทนของฟังก์ชันความน่าจะเป็น มันมีรูประฆัง.

เป็นโปรแกรมที่ใช้บ่อยที่สุด สถิติเนื่องจากมีการใช้งานอย่างกว้างขวาง โดยได้รับการสนับสนุนจากความถี่ที่ปรากฏการณ์บางอย่างมักจะมีลักษณะคล้ายกัน

โฆษณา

เพื่อความชัดเจนในการใช้งาน สามารถอ้างอิงถึงที่มาของชื่อตัวเองซึ่งมาจาก ความจริงที่ว่าแพทย์และนักชีววิทยาเชื่อมาช้านานแล้วว่าตัวแปรทางธรรมชาติที่น่าสนใจทั้งหมดเป็นไปตามนี้ รุ่น

ในบทความนี้คุณจะพบ:

ความสำคัญของการแจกแจงแบบปกติ

เป็นรูปแบบต่อเนื่องที่สำคัญที่สุดในสถิติเนื่องจากเหตุผลดังต่อไปนี้:

โฆษณา

  • การประยุกต์ใช้งานโดยตรงและช่วยให้สังเกตตัวแปรที่น่าสนใจมากมาย ซึ่งสามารถอธิบายได้อย่างง่ายดายด้วยแบบจำลองนี้
  • มันทำหน้าที่ในการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องหลายแบบ รวมถึงการแจกแจงแบบปัวซองและการแจกแจงทวินาม
  • คุณสมบัติของมันทำให้สามารถพัฒนาเทคนิคการอนุมานทางสถิติได้หลายอย่าง มอบรากฐานให้ สถิติอนุมานคลาสสิก classicalสำหรับความสัมพันธ์กับทฤษฎีบทขีดจำกัดกลาง

การแจกแจงปกติเมื่อใด

การกระจายแบบเกาส์เซียน หรือ การกระจายแบบปกติ คือ การกระจาย ต่อไปที่เรามักใช้ในด้านสถิติ … มีวัตถุประสงค์เพื่อ ใกล้เคียงกับการแจกแจงความน่าจะเป็นแบบแยกส่วนต่างๆ เช่นเดียวกับกรณีของ การกระจายปัวซองและการกระจาย ทวินาม

แนวคิดพื้นฐานในการแจกแจงแบบปกติ

เพื่อให้เข้าใจและทำงานอย่างถูกต้องกับการแจกแจงแบบปกติในสถิติ จำเป็นต้องรู้และชัดเจนเกี่ยวกับแนวคิดบางอย่างที่เป็นพื้นฐานของโมเดลนี้

โฆษณา

ตัวแปรสุ่มต่อเนื่อง

เป็นสิ่งที่ได้รับค่าจำนวนอนันต์ภายในช่วงที่กำหนด ตัวอย่างเช่น น้ำหนักของบุคคลตามความแม่นยำของเครื่องชั่งสามารถเป็น 80.5, 80.52 เป็นต้น

ดูเพิ่มเติมของ ตัวแปรสุ่มต่อเนื่องที่นี่.

โฆษณา

การแจกแจงแบบปกติ

การแจกแจงความน่าจะเป็นปกติ

ตัวแปรสุ่มจำนวนมากติดตามการแจกแจงแบบปกติหรือใกล้เคียงกัน ลักษณะเด่นที่สุดของมันคือการแจกแจงความน่าจะเป็นส่วนใหญ่ ไม่ว่าจะแบบไม่ต่อเนื่องหรือต่อเนื่อง สามารถประมาณด้วยความน่าจะเป็นปกติภายใต้เงื่อนไขบางประการ

โฆษณา

ลักษณะของทั้งการแจกแจงความน่าจะเป็นปกติและเส้นโค้งที่แสดงแทนคือ:

  • เส้นโค้งเป็นรูประฆังมียอดอยู่ตรงกลางของการกระจาย ดังนั้นค่าเฉลี่ยเลขคณิต โหมด และค่ามัธยฐานจึงเท่ากันและอยู่ที่จุดสูงสุด
  • มันสมมาตรรอบ ๆ ค่าเฉลี่ย ครึ่งหนึ่งของพื้นที่ใต้เส้นโค้งอยู่ทางขวาของจุดศูนย์กลางนี้ และอีกครึ่งหนึ่งอยู่ทางซ้าย
  • เส้นโค้งลาดเอียงเล็กน้อยในทั้งสองทิศทางจากค่ากลาง
  • มันเป็นแบบไม่แสดง นั่นคือ เส้นโค้งค่อนข้างใกล้กับแกน X แต่ไม่สัมผัสมัน

สูตรฟังก์ชั่นความหนาแน่นของความน่าจะเป็น

มันใช้การคำนวณที่ลำบาก มันสามารถแสดงให้เห็นได้โดยการใช้สูตรคือ

ฟังก์ชันความหนาแน่นดังกล่าว:

  • คุณสามารถใช้ค่าใดก็ได้ (- ∞, + ∞)
  • ค่าที่ใกล้จุดศูนย์กลาง (mean) มีแนวโน้มสูงขึ้น
  • เมื่อคุณย้ายออกจากค่า µ ความน่าจะเป็นจะลดลงไปทางขวาและซ้าย (สมมาตร) ในลักษณะเดียวกัน
  • เมื่อคุณย้ายออกจากค่า µ ความน่าจะเป็นจะลดลงอย่างรวดเร็วมากหรือน้อยขึ้นอยู่กับค่าเบี่ยงเบนมาตรฐาน (พารามิเตอร์ s)
การกระจายเปอร์เซ็นต์ในการแจกแจงแบบปกติ

การใช้การกระจายในการหักทางสถิติ

แนวคิดของความน่าจะเป็นและการแจกแจงตัวอย่างใช้เป็นข้อมูลเบื้องต้นเกี่ยวกับวิธีการอนุมานทางสถิติ ซึ่งประกอบด้วย:

  • การประมาณค่า: ซึ่งพยายามประเมินพารามิเตอร์ของประชากรตามกลุ่มตัวอย่าง
  • การทดสอบสมมติฐาน: กระบวนการที่เกี่ยวข้องกับการยอมรับหรือปฏิเสธข้อความใดๆ เกี่ยวกับพารามิเตอร์ของประชากร

เมื่อทำการวัดใดๆ และกระจายผลลัพธ์ภายใต้เกณฑ์บางอย่าง เป็นเรื่องปกติมากที่จะพบว่าข้อมูลถูกจัดกลุ่มในลักษณะเอกพจน์ใน บางครั้งการแจกแจงเหล่านี้เป็นไปตามรูปแบบที่มีการสังเกตจำนวนมากขึ้นสำหรับค่าที่กำหนด ลดการสังเกตทั้งสองด้านของสิ่งนี้มากขึ้น บ่อย.

การใช้การกระจายนี้พบได้ในความรู้หลากหลายแขนง ประยุกต์ใช้กับข้อสังเกตต่างๆ ทางชีววิทยา ดาราศาสตร์ ภูมิศาสตร์และเศรษฐศาสตร์

ปรากฏการณ์หลายอย่างในธรรมชาติสามารถประมาณได้ด้วยการแจกแจงแบบปกติ โดยทั่วไป สามารถตรวจสอบได้จากการปฏิสัมพันธ์ของผลกระทบแบบสุ่มจำนวนมากต่อตัวแปรที่อยู่ระหว่างการศึกษา

ในการแจกแจงประเภทนี้ คุณสามารถคำนวณความเป็นไปได้ที่เหตุการณ์บางอย่างจะเกิดขึ้นภายในช่วงเวลาที่กำหนดหรือ อย่างไรก็ตาม ช่วง ความน่าจะเป็นที่แน่นอนของค่าภายในการกระจายแบบต่อเนื่อง เช่น การแจกแจงแบบปกติ จะเท่ากับศูนย์ (0). คุณสมบัตินี้แยกความแตกต่างของตัวแปรต่อเนื่องซึ่งวัดจากตัวแปรที่ไม่ต่อเนื่องซึ่งจะถูกนับ

ตัวอย่างเช่น เวลา (เป็นวินาที นาที หรือชั่วโมง) ถูกวัดโดยไม่นับ จึงเป็นตัวแปรที่สามารถกำหนดได้ ความน่าจะเป็นที่เวลาการติดตั้งยูทิลิตี้บางอย่างหยุดบนคอมพิวเตอร์อยู่ระหว่าง 8 ถึง 15 วินาที หรือความน่าจะเป็นอาจอยู่ระหว่าง 8 ถึง 9 วินาที อย่างไรก็ตาม ความน่าจะเป็นที่เวลาในการติดตั้งเท่ากับ 9 วินาทีจะเป็นศูนย์

instagram viewer