- สูตร
- ลักษณะของการแจกแจงปกติ
- ช่วงความมั่นใจ
- การประยุกต์ใช้การแจกแจงปกติ
- ตัวอย่าง
- การออกกำลังกายได้รับการแก้ไข
- อ้างอิง
การแจกแจงแบบปกติหรือการแจกแจงแบบเกาส์เซียนคือการแจกแจงความน่าจะเป็นในตัวแปรต่อเนื่องซึ่งฟังก์ชันความหนาแน่นของความน่าจะเป็นถูกอธิบายโดยฟังก์ชันเอกซ์โพเนนเชียลของอาร์กิวเมนต์กำลังสองและอาร์กิวเมนต์เชิงลบซึ่งก่อให้เกิดรูประฆัง
ชื่อของการแจกแจงปกติมาจากข้อเท็จจริงที่ว่าการแจกแจงนี้เป็นชื่อที่ใช้กับสถานการณ์จำนวนมากที่สุดที่ตัวแปรสุ่มแบบต่อเนื่องบางตัวเกี่ยวข้องกับกลุ่มหรือประชากรที่กำหนด
รูปที่ 1. การแจกแจงแบบปกติ N (x; μ, σ) และความหนาแน่นของความน่าจะเป็น f (s; μ, σ) (ความประณีตของตัวเอง)
ตัวอย่างที่ใช้การแจกแจงแบบปกติ ได้แก่ ความสูงของชายหรือหญิงความแตกต่างของการวัดขนาดทางกายภาพบางอย่างหรือในลักษณะทางจิตวิทยาหรือสังคมวิทยาที่วัดได้เช่นความฉลาดทางสติปัญญาหรือพฤติกรรมการบริโภคผลิตภัณฑ์บางอย่าง
ในทางกลับกันมันถูกเรียกว่าการแจกแจงแบบเสียนหรือ Gaussian bell เนื่องจากเป็นอัจฉริยะทางคณิตศาสตร์ชาวเยอรมันคนนี้ที่ได้รับการยกย่องจากการค้นพบของเขาสำหรับการใช้งานที่เขาให้ไว้เพื่ออธิบายข้อผิดพลาดทางสถิติของการวัดทางดาราศาสตร์ในปี 1800
อย่างไรก็ตามมีการระบุว่าก่อนหน้านี้การแจกแจงทางสถิตินี้ได้รับการตีพิมพ์โดยนักคณิตศาสตร์ที่มีต้นกำเนิดจากฝรั่งเศสเช่น Abraham de Moivre ย้อนกลับไปในปี 1733
สูตร
ฟังก์ชันการแจกแจงปกติในตัวแปรต่อเนื่อง x พร้อมพารามิเตอร์μและσแสดงโดย:
N (x; μ, σ)
และมีการเขียนไว้อย่างชัดเจนดังนี้:
N (x; μ, σ) = ∫- ∞ x f (s; μ, σ) ds
โดยที่ f (u; μ, σ) คือฟังก์ชันความหนาแน่นของความน่าจะเป็น:
f (s; μ, σ) = (1 / (σ√ (2π)) ประสบการณ์ (- s 2 / (2σ 2 ))
ค่าคงที่ที่คูณฟังก์ชันเอกซ์โพเนนเชียลในฟังก์ชันความหนาแน่นของความน่าจะเป็นเรียกว่าค่าคงที่การทำให้เป็นมาตรฐานและถูกเลือกในลักษณะที่:
N (+ ∞, μ, σ) = 1
นิพจน์ก่อนหน้านี้ทำให้แน่ใจว่าความน่าจะเป็นที่ตัวแปรสุ่ม x อยู่ระหว่าง-∞ถึง + ∞คือ 1 นั่นคือความน่าจะเป็น 100%
พารามิเตอร์μคือค่าเฉลี่ยเลขคณิตของตัวแปรสุ่มต่อเนื่อง x และσส่วนเบี่ยงเบนมาตรฐานหรือรากที่สองของความแปรปรวนของตัวแปรเดียวกันนั้น ในกรณีที่μ = 0 และσ = 1 เราจะมีการแจกแจงปกติมาตรฐานหรือการแจกแจงปกติทั่วไป:
ยังไม่มีข้อความ (x; μ = 0, σ = 1)
ลักษณะของการแจกแจงปกติ
1- ถ้าตัวแปรทางสถิติแบบสุ่มตามการแจกแจงแบบปกติของความหนาแน่นของความน่าจะเป็น f (s; μ, σ) ข้อมูลส่วนใหญ่จะถูกจัดกลุ่มตามค่าเฉลี่ยμและกระจัดกระจายไปรอบ ๆ ในลักษณะที่มากกว่าเล็กน้อย ⅔ของข้อมูลอยู่ระหว่างμ - σและμ + σ
2- ค่าเบี่ยงเบนมาตรฐานσเป็นค่าบวกเสมอ
3- รูปร่างของฟังก์ชันความหนาแน่น f นั้นคล้ายกับกระดิ่งซึ่งเป็นสาเหตุที่ฟังก์ชันนี้มักเรียกว่าระฆังแบบเสียนหรือฟังก์ชันเกาส์เซียน
4- ในการแจกแจงแบบ Gaussian ค่าเฉลี่ยมัธยฐานและโหมดตรงกัน
5- จุดเบี่ยงเบนของฟังก์ชันความหนาแน่นของความน่าจะเป็นแม่นยำที่μ - σและμ + σ
6- ฟังก์ชัน f สมมาตรเกี่ยวกับแกนที่ผ่านค่าเฉลี่ยμและมีศูนย์สำหรับ x ⟶ + ∞และ x ⟶-∞แบบไม่มีอาการ
7- ยิ่งค่า higher สูงเท่าใดการกระจายสัญญาณรบกวนหรือระยะห่างของข้อมูลรอบ ๆ ค่าเฉลี่ยก็จะยิ่งมากขึ้นเท่านั้น กล่าวอีกนัยหนึ่ง the ที่สูงขึ้นรูประฆังจะเปิดมากขึ้น ในทางกลับกันσเล็กแสดงว่าลูกเต๋าอยู่ใกล้ค่าเฉลี่ยและรูปร่างของกระดิ่งจะปิดหรือแหลมมากกว่า
8- ฟังก์ชันการแจกแจง N (x; μ, σ) บ่งชี้ความน่าจะเป็นที่ตัวแปรสุ่มน้อยกว่าหรือเท่ากับ x ตัวอย่างเช่นในรูปที่ 1 (ด้านบน) ความน่าจะเป็น P ที่ตัวแปร x น้อยกว่าหรือเท่ากับ 1.5 คือ 84% และสอดคล้องกับพื้นที่ภายใต้ฟังก์ชันความหนาแน่นของความน่าจะเป็น f (x; μ, σ) จาก -∞ถึง x
ช่วงความมั่นใจ
9- หากข้อมูลเป็นไปตามการแจกแจงปกติ 68.26% ของข้อมูลเหล่านี้อยู่ระหว่างμ - σและμ + σ
10- 95.44% ของข้อมูลที่เป็นไปตามการแจกแจงปกติอยู่ระหว่างμ - 2σและμ + 2σ
11- 99.74% ของข้อมูลที่เป็นไปตามการแจกแจงปกติอยู่ระหว่างμ - 3σและμ + 3σ
12- ถ้าตัวแปรสุ่ม x ตามหลังการแจกแจง N (x; μ, σ) ดังนั้นตัวแปร
z = (x - μ) / σเป็นไปตามการแจกแจงปกติมาตรฐาน N (z; 0.1)
การเปลี่ยนตัวแปร x เป็น z เรียกว่าการกำหนดมาตรฐานหรือการพิมพ์และมีประโยชน์มากเมื่อใช้ตารางของการแจกแจงมาตรฐานกับข้อมูลที่เป็นไปตามการแจกแจงปกติที่ไม่ได้มาตรฐาน
การประยุกต์ใช้การแจกแจงปกติ
ในการใช้การแจกแจงแบบปกติจำเป็นต้องผ่านการคำนวณอินทิกรัลของความหนาแน่นของความน่าจะเป็นซึ่งจากมุมมองการวิเคราะห์นั้นไม่ใช่เรื่องง่ายและไม่มีโปรแกรมคอมพิวเตอร์ที่อนุญาตให้คำนวณตัวเลขได้เสมอไป เพื่อจุดประสงค์นี้จึงใช้ตารางของค่าปกติหรือค่ามาตรฐานซึ่งไม่มีอะไรมากไปกว่าการแจกแจงปกติในกรณีμ = 0 และσ = 1
ตารางการแจกแจงปกติแบบมาตรฐาน (ตอนที่ 1/2)
ตารางการแจกแจงปกติแบบมาตรฐาน (ตอนที่ 2/2)
ควรสังเกตว่าตารางเหล่านี้ไม่มีค่าลบ อย่างไรก็ตามการใช้คุณสมบัติสมมาตรของฟังก์ชันความหนาแน่นของความน่าจะเป็นแบบเกาส์เซียนสามารถหาค่าที่สอดคล้องกันได้ แบบฝึกหัดที่แก้ไขได้ที่แสดงด้านล่างแสดงถึงการใช้ตารางในกรณีเหล่านี้
ตัวอย่าง
สมมติว่าคุณมีชุดข้อมูลสุ่ม x ที่เป็นไปตามการแจกแจงปกติของค่าเฉลี่ย 10 และส่วนเบี่ยงเบนมาตรฐาน 2 ระบบจะขอให้คุณค้นหาความน่าจะเป็นที่:
a) ตัวแปรสุ่ม x น้อยกว่าหรือเท่ากับ 8
b) น้อยกว่าหรือเท่ากับ 10
c) ตัวแปร x ต่ำกว่า 12
d) ความน่าจะเป็นที่ค่า x อยู่ระหว่าง 8 ถึง 12
สารละลาย:
ก) ในการตอบคำถามแรกคุณต้องคำนวณ:
N (x; μ, σ)
ด้วย x = 8, μ = 10 และσ = 2 เราตระหนักดีว่าเป็นอินทิกรัลที่ไม่มีโซลูชันการวิเคราะห์ในฟังก์ชันพื้นฐาน แต่โซลูชันจะแสดงเป็นฟังก์ชันของฟังก์ชันข้อผิดพลาด erf (x)
ในทางกลับกันมีความเป็นไปได้ในการแก้อินทิกรัลในรูปแบบตัวเลขซึ่งเป็นสิ่งที่เครื่องคิดเลขสเปรดชีตและโปรแกรมคอมพิวเตอร์จำนวนมากเช่น GeoGebra ทำ รูปต่อไปนี้แสดงวิธีแก้ปัญหาเชิงตัวเลขที่ตรงกับกรณีแรก:
รูปที่ 2. ความหนาแน่นของความน่าจะเป็น f (x; μ, σ) พื้นที่สีเทาแสดงถึง P (x ≤ 8) (ความประณีตของตัวเอง)
และคำตอบก็คือความน่าจะเป็นที่ x ต่ำกว่า 8 คือ:
P (x ≤ 8) = N (x = 8; μ = 10, σ = 2) = 0.1587
b) ในกรณีนี้เราพยายามหาความน่าจะเป็นที่ตัวแปรสุ่ม x อยู่ต่ำกว่าค่าเฉลี่ยซึ่งในกรณีนี้มีค่า 10 คำตอบไม่ต้องการการคำนวณใด ๆ เนื่องจากเรารู้ว่าครึ่งหนึ่งของข้อมูลอยู่ด้านล่าง ค่าเฉลี่ยและอีกครึ่งหนึ่งสูงกว่าค่าเฉลี่ย ดังนั้นคำตอบคือ:
P (x ≤ 10) = N (x = 10; μ = 10, σ = 2) = 0.5
c) ในการตอบคำถามนี้เราต้องคำนวณ N (x = 12; μ = 10, σ = 2) ซึ่งสามารถทำได้ด้วยเครื่องคิดเลขที่มีฟังก์ชันทางสถิติหรือผ่านทางซอฟต์แวร์เช่น GeoGebra:
รูปที่ 3. ความหนาแน่นของความน่าจะเป็น f (x; μ, σ) พื้นที่สีเทาแสดงถึง P (x ≤ 12) (ความประณีตของตัวเอง)
คำตอบของส่วน c สามารถเห็นได้ในรูปที่ 3 และคือ:
P (x ≤ 12) = N (x = 12; μ = 10, σ = 2) = 0.8413
d) ในการหาความน่าจะเป็นที่ตัวแปรสุ่ม x อยู่ระหว่าง 8 ถึง 12 เราสามารถใช้ผลลัพธ์ของส่วน a และ c ได้ดังนี้:
P (8 ≤ x ≤ 12) = P (x ≤ 12) - P (x ≤ 8) = 0.8413 - 0.1587 = 0.6826 = 68.26%
การออกกำลังกายได้รับการแก้ไข
ราคาเฉลี่ยของหุ้นของ บริษัท คือ $ 25 โดยมีค่าเบี่ยงเบนมาตรฐานอยู่ที่ $ 4 กำหนดความน่าจะเป็นที่:
ก) การดำเนินการมีค่าใช้จ่ายน้อยกว่า $ 20
b) มีราคาสูงกว่า $ 30
c) ราคาอยู่ระหว่าง $ 20 ถึง $ 30
ใช้ตารางการแจกแจงปกติมาตรฐานเพื่อค้นหาคำตอบ
สารละลาย:
ในการใช้ประโยชน์จากตารางจำเป็นต้องส่งผ่านไปยังตัวแปร z ที่เป็นมาตรฐานหรือพิมพ์:
$ 20 ในตัวแปรมาตรฐานเท่ากับ z = ($ 20 - $ 25) / $ 4 = -5/4 = -1.25 และ
$ 30 ในตัวแปรมาตรฐานเท่ากับ z = ($ 30 - $ 25) / $ 4 = +5/4 = +1.25
a) $ 20 เท่ากับ -1.25 ในตัวแปรนอร์มัลไลซ์ แต่ตารางไม่มีค่าติดลบดังนั้นเราจึงวางค่า +1.25 ซึ่งให้ค่า 0.8944
ถ้า 0.5 ถูกลบออกจากค่านี้ผลลัพธ์จะเป็นพื้นที่ระหว่าง 0 ถึง 1.25 ซึ่งโดยวิธีแล้วจะเหมือนกัน (โดยสมมาตร) กับพื้นที่ระหว่าง -1.25 ถึง 0 ผลลัพธ์ของการลบคือ 0.8944 - 0.5 = 0.3944 ซึ่งเป็นพื้นที่ระหว่าง -1.25 ถึง 0
แต่พื้นที่จาก-∞ถึง -1.25 เป็นที่สนใจซึ่งจะเป็น 0.5 - 0.3944 = 0.1056 ดังนั้นจึงสรุปได้ว่าความน่าจะเป็นที่หุ้นต่ำกว่า $ 20 คือ 10.56%
b) $ 30 ในตัวแปรที่พิมพ์ z คือ 1.25 สำหรับค่านี้ตารางจะแสดงหมายเลข 0.8944 ซึ่งสอดคล้องกับพื้นที่ตั้งแต่-∞ถึง +1.25 พื้นที่ระหว่าง +1.25 ถึง + ∞คือ (1 - 0.8944) = 0.1056 กล่าวอีกนัยหนึ่งความน่าจะเป็นที่หุ้นมีค่าใช้จ่ายมากกว่า $ 30 คือ 10.56%
c) ความน่าจะเป็นที่การกระทำมีต้นทุนระหว่าง $ 20 ถึง $ 30 จะคำนวณได้ดังนี้:
100% -10.56% - 10.56% = 78.88%
อ้างอิง
- สถิติและความน่าจะเป็น การแจกแจงปกติ สืบค้นจาก: projectdescartes.org
- GeoGebra Geogebra คลาสสิกแคลคูลัสความน่าจะเป็น กู้คืนจาก geogebra.org
- MathWorks การแจกแจงแบบเสียน สืบค้นจาก: es.mathworks.com
- Mendenhall, W. 1981. สถิติสำหรับการจัดการและเศรษฐศาสตร์. 3 ฉบับ Grupo Editorial Iberoamérica
- สถิติ Trek สอนสถิติตัวเอง การกระจายปัวซอง ดึงมาจาก: stattrek.com,
- Triola, M. 2012. สถิติเบื้องต้น. วันที่ 11 เอ็ดการศึกษาของเพียร์สัน
- มหาวิทยาลัยบีโก. การแจกแจงแบบต่อเนื่องหลัก สืบค้นจาก: anapg.webs.uvigo.es
- วิกิพีเดีย การแจกแจงปกติ สืบค้นจาก: es.wikipedia.org