ვარიანტები სტატისტიკაში (გამოყენება, განმარტება და ფორმულა)

  • Jul 26, 2021
click fraud protection

ვარიაცია ან ვარიაცია არის შემთხვევითი ცვლადის დისპერსიის საზომი (მნიშვნელობები, რომლებიც შემთხვევით მიიღება). იგი ფართოდ გამოიყენება სტატისტიკის სფეროში, რითიც გამოხატავს ხსენებული დისპერსიის ცვალებადობას.

რონალდ ფიშერი, ინგლისელი მათემატიკოსი, ფიზიკოსი, ბიოლოგი და სტატისტიკოსი, 1918 წელს პირველად შემოიტანა ტერმინი ვარიაცია, მის ერთ – ერთ გამოქვეყნებულ კვლევაში ბიომეტრიკაზე. თავის მხრივ, მან შემოიტანა კვლევები ვარიანტის ანალიზზე.

რეკლამები

ამ სტატიაში ნახავთ:

რა არის ვარიაცია?

ვარიაცია ნიმუშის ან მნიშვნელობთა სიმრავლის, ეს არის კვადრატული გადახრების ჯამი საშუალო ან საშუალო მნიშვნელობის მიმართ, ეს ყველაფერი იყოფა დაკვირვების საერთო რაოდენობაზე მინუს 1.

ძალიან ზოგადი მეთოდით, შეიძლება ითქვას, რომ ვარიაცია სტანდარტული გადახრაა კვადრატში.

რეკლამები

ეკონომიკისა და ფინანსების სფეროებში, ეს დისპერსია განიმარტება, როგორც რისკი, რომ ზოგიერთ პროცედურაში შესრულებული ანაზღაურება განსხვავდება მოსალოდნელი მოგებისგან. ჩვეულებრივ, როდესაც უფრო მაღალი მოგებაა მოსალოდნელი, რისკი თავის მხრივ უფრო მაღალია.

ვარიაცია, როგორც დისპერსიის საზომი

ვარიაცია, სტანდარტულ გადახრასთან ერთად, წარმოადგენს მონაცემების ან დაკვირვების დისპერსიული ზომების მიღებას. ამ მონაცემების დისპერსია მიუთითებს მრავალფეროვნებაზე, რომლებიც წარმოდგენილია, ანუ თუ ყველა მნიშვნელობა ა მონაცემთა ნაკრები ტოლია, მაშინ დისპერსია არ არის, სამაგიეროდ, თუ ყველა ტოლია, მაშინ არსებობს დისპერსია.

რეკლამები

ეს დისპერსია შეიძლება იყოს დიდი ან მცირე, დამოკიდებულია იმაზე, თუ რამდენად ახლოსაა მნიშვნელობები საშუალო მნიშვნელობასთან.

ნიმუშის ვარიაცია სიმბოლოა, როგორც S2, ხოლო პოპულაციის ვარიაცია სიმბოლოა, როგორც σ2.

რეკლამები

ნიმუშის ვარიაცია გამოიყენება პოპულაციის ვარიანტის შესაფასებლად, რომელიც ხშირად უცნობია. ამიტომ ს2 ასევე ხშირად განიხილება როგორც სტატისტიკა და σ2 როგორც პარამეტრი.

ვარიანტის ფორმულა

ნიმუშის ვარიანტს აქვს შემდეგი ფორმულა:

რეკლამები

2 =

სადაც, წარმოადგენს გამოკლების ჯამს თითოეულ შერჩეულ მნიშვნელობას () და საშუალოზე, კვადრატში.

თავის მხრივ, იგი წარმოადგენს დაკვირვების ან შერჩეული მონაცემების საერთო რაოდენობას. ძალიან დიდი მნიშვნელობებისთვის ვარიაცია მინიმალურია ან თუნდაც უმნიშვნელო.

ამის ნაცვლად, პოპულაციის ვარიანტს აქვს შემდეგი ფორმულა:

σ2 =

სადაც N წარმოადგენს დაკვირვების ან შერჩეული მონაცემების საერთო რაოდენობას.

უმეტეს შემთხვევაში ძალზე ძნელია, თუ არა შეუძლებელი მთლიანი N მონაცემების მიღება, მაგალითად, საუბრისას პოპულაციიდან ინდივიდუალური პირების შერჩევა შეუძლებელია, ვინაიდან არსებობს დროის და რესურსების ფაქტორი შემზღუდველი.

ამიტომ მოსახლეობის პარამეტრების შესაფასებლად ხშირად იყენებენ სტატისტიკას. ამ ფორმულის დაწერის მეთოდის მიხედვით, ვარიანტის ერთეულებს აქვთ ცვლადის იგივე ერთეულები, მაგრამ კვადრატში.

ასევე, ჩვენ ვხედავთ, რომ ვარიაცია არ შეიძლება იყოს უარყოფითი, ამიტომ მინიმალური მნიშვნელობა, რომლის მიღებაც მასში არის, ნულოვანია.

ნიმუშის სტანდარტული გადახრა

განსხვავებით ვარიაციიდან, სტანდარტული გადახრა ნიმუში წარმოდგენილია შემდეგნაირად:

S =

ამ შემთხვევაში, ამ ღონისძიებაში წარმოდგენილია შერჩეული ცვლადის იგივე ერთეულები.

ვარიაციის მაგალითი

ვარიაციის გამოსათვლელად ჯერ უნდა გამოთვალოთ გამოყენებული მონაცემების საშუალო ან საშუალო. მეორეს მხრივ, თუ თქვენ გაქვთ სტანდარტული გადახრა, თქვენ მხოლოდ კვადრატში აიღებთ შედეგს და მიიღებთ დისპერსიას.

აქ მოცემულია მაგალითი იმის გასაგებად, თუ როგორ გამოითვლება დისპერსია და რა შეიძლება იყოს მისი ინტერპრეტაცია.

დავუშვათ, რომ გვაქვს ერთი და იგივე მეწარმის კუთვნილი ხუთი სხვადასხვა კომპანიის წლიური შემოსავალი, რომლებიც:

  • კომპანია A: 2500 დოლარი
  • კომპანია B: 1800 დოლარი
  • კომპანია C: 2,300 დოლარი
  • კომპანია D: 3000 დოლარი
  • კომპანია E: $ 2,700

შემდეგ გამოვთვლით ნახევარი შემოსავლების, უბრალოდ თითოეული ციფრის დამატება და მისი დაყოფა კომპანიების საერთო რაოდენობაზე, რაც იძლევა: 2,460 აშშ დოლარს.

მონაცემები საშუალო მონაცემები - საშუალო
მონაცემები 1 2500 2460 40 1600
მონაცემები 2 1800 2460 -660 435600
ფაქტი 3 2300 2460 -160 25600
მონაცემები 4 3000 2460 540 291600
მონაცემები 5 2700 2460 240 57600
სულ 812000

პოპულაციის ვარიაცია არის მონაცემების განსხვავების ჯამი კვადრატულ საშუალოზე, გაყოფილი n- ზე, ამ შემთხვევაში ის 5-ია.

812000/5 = 203000

σ2=162400

ამ შედეგის კვადრატული ფესვის გათვალისწინებით, ჩვენ მივიღებთ სტანდარტულ გადახრას, ეს არის $ 402 სხვაობა ხუთი კომპანიის შემოსავლებს შორის.

ამ ღონისძიების გამოყენება

ვარიაციას, როგორც დისპერსიის საზომი, მრავალჯერადი გამოყენება აქვს სხვადასხვა სფეროში, მისი ზოგიერთი პროგრამაა:

  • წარმოადგენს დახმარებას ინვესტიციის შესახებ გადაწყვეტილების მიღებისას (ასევე ინტერპრეტირებულია როგორც ინვესტიციის რისკი). თუ ინვესტიციის უკუგების ანაზღაურება ან ალბათობა განაწილებულია, ეს შეიძლება მიუთითებდეს არახელსაყრელ ინვესტიციაზე.
  • დროთა განმავლობაში ცვლადის ქცევის აღწერა, ანალიზი და გაგება.
  • საშუალებას გაძლევთ შეადაროთ მონაცემთა სხვადასხვა ჯგუფებს შორის.
  • ეს საშუალებას გაძლევთ გააანალიზოთ, რომელი იქნება საუკეთესო გადაწყვეტილების მიღება. ეს, ეპიზოდის ანალიზის საშუალებით, მაგალითად, იმის გადაწყვეტა, თუ რომელი მეთოდი წარმოადგენს საუკეთესო სწავლას, ან იმის გადაწყვეტა, თუ რომელი ინვესტიცია იქნება უფრო მაღალი შემოსავალი წელიწადში.

დასკვნა

ვარიანტების ანალიზის დროს, შესწავლილია მნიშვნელოვანი განსხვავებები ნიმუშის ორ ან მეტ საშუალებას შორის. ეს ანალიზი საყოველთაოდ ცნობილია როგორც ANOVA და საშუალებას გვაძლევს განვსაზღვროთ, მოდის თუ არა ეს საშუალებები ა იგივე მოსახლეობა (ეს შეიძლება იყოს კომპანიის თანამშრომელთა საერთო რაოდენობა), ან თუ ორი პოპულაციის საშუალებაა თანაბარი

მეორეს მხრივ, ვარიაცია, ასევე სტანდარტული გადახრა ისინი ძალიან მგრძნობიარენი არიან განსაცდელის მიმართ, ეს არის მნიშვნელობები, რომლებიც ძალიან შორსაა საშუალო მნიშვნელობიდან ან ძალიან განსხვავდება მისგან.

ასე რომ, ამ ზომებზე ასე არ იმოქმედა, ამ განტოლებების იგნორირება მოხდება ანალიზების და გამოთვლების ჩატარების დროსაც. ასევე შეიძლება გამოყენებულ იქნას დისპერსიის სხვა ზომები, რომლებიც ამ შემთხვევებში უფრო სასარგებლოა.

ინვესტიციის რისკის გაანალიზების შემთხვევაში, მხედველობაში მიიღება ორი მნიშვნელოვანი ასპექტი, ერთია ინვესტირებული მოგება და მეორე მოსალოდნელია განხორციელებული ინვესტიციის შესაბამისად. როგორც უკვე აღვნიშნეთ, ამ რისკის გასაანალიზებლად შესაძლებელია ვარიაციის გამოყენება.

instagram viewer