- สูตรและสมการ
- ตัวแปรทางสถิติที่สำคัญ
- แบบจำลองและคุณสมบัติ
- คุณสมบัติหลักของการแจกแจงแบบไฮเปอร์จีโอเมตริก
- การประมาณโดยใช้การแจกแจงแบบทวินาม
- ตัวอย่าง 2
- แบบฝึกหัดที่แก้ไข
- แบบฝึกหัด 1
- สารละลาย
- แบบฝึกหัด 2
- สารละลาย
- แบบฝึกหัด 3
- วิธีแก้ปัญหา
- แนวทางแก้ไข c
- อ้างอิง
การแจกแจงแบบไฮเปอร์จีโอเมตริกเป็นฟังก์ชันทางสถิติที่ไม่ต่อเนื่องเหมาะสำหรับการคำนวณความน่าจะเป็นในการทดลองแบบสุ่มโดยมีผลลัพธ์ที่เป็นไปได้สองประการ เงื่อนไขที่จำเป็นต้องใช้ก็คือพวกเขาเป็นประชากรจำนวนน้อยซึ่งการถอนจะไม่ถูกแทนที่และความน่าจะเป็นไม่คงที่
ดังนั้นเมื่อมีการเลือกองค์ประกอบของประชากรเพื่อให้ทราบผลลัพธ์ (จริงหรือเท็จ) ของลักษณะเฉพาะองค์ประกอบเดียวกันนั้นจะไม่สามารถเลือกได้อีก

รูปที่ 1. ในประชากรโบลต์เช่นนี้มีตัวอย่างที่มีข้อบกพร่องอย่างแน่นอน ที่มา: Pixabay
แน่นอนว่าองค์ประกอบถัดไปที่เลือกจึงมีแนวโน้มที่จะได้ผลลัพธ์ที่แท้จริงหากองค์ประกอบก่อนหน้ามีผลลบ ซึ่งหมายความว่าความน่าจะเป็นจะแตกต่างกันไปเนื่องจากองค์ประกอบถูกดึงออกมาจากตัวอย่าง
การใช้งานหลักของการแจกแจงแบบไฮเปอร์จีโอเมตริก ได้แก่ การควบคุมคุณภาพในกระบวนการที่มีประชากรน้อยและการคำนวณความน่าจะเป็นในเกมแห่งโอกาส
สำหรับฟังก์ชันทางคณิตศาสตร์ที่กำหนดการแจกแจงไฮเพอร์จีโอเมตริกประกอบด้วยพารามิเตอร์ 3 ตัว ได้แก่
- จำนวนองค์ประกอบประชากร (N)
- ขนาดตัวอย่าง (ม.)
- จำนวนเหตุการณ์ในประชากรทั้งหมดที่มีผลดี (หรือไม่เอื้ออำนวย) ของลักษณะการศึกษา (n)
สูตรและสมการ
สูตรสำหรับการแจกแจงไฮเพอร์จีโอเมตริกให้ความน่าจะเป็น P ที่ x กรณีที่ดีของลักษณะเฉพาะเกิดขึ้น วิธีเขียนทางคณิตศาสตร์โดยพิจารณาจากจำนวน Combinatorial คือ:

ในนิพจน์ก่อนหน้า N, n และ m เป็นพารามิเตอร์และ x คือตัวแปรเอง
- ประชากรทั้งหมดคือ N
- จำนวนผลลัพธ์ที่เป็นบวกของลักษณะเลขฐานสองที่เกี่ยวกับจำนวนประชากรทั้งหมดคือ n
- จำนวนองค์ประกอบในตัวอย่างคือม.
ในกรณีนี้ X เป็นตัวแปรสุ่มที่รับค่า x และ P (x) บ่งชี้ความน่าจะเป็นของการเกิด x กรณีที่เป็นประโยชน์ของลักษณะที่ศึกษา
ตัวแปรทางสถิติที่สำคัญ
ตัวแปรทางสถิติอื่น ๆ สำหรับการแจกแจงไฮเพอร์จีโอเมตริก ได้แก่
- ค่าเฉลี่ยμ = m * n / N
- ความแปรปรวนσ ^ 2 = m * (n / N) * (1-n / N) * (Nm) / (N-1)
- ค่าเบี่ยงเบนมาตรฐานσซึ่งเป็นรากที่สองของความแปรปรวน
แบบจำลองและคุณสมบัติ
ในการมาถึงแบบจำลองของการแจกแจงแบบไฮเปอร์จีโอเมตริกเราเริ่มจากความน่าจะเป็นที่จะได้รับ x กรณีที่ดีในตัวอย่างขนาด m ตัวอย่างนี้ประกอบด้วยองค์ประกอบที่สอดคล้องกับคุณสมบัติภายใต้การศึกษาและองค์ประกอบที่ไม่
จำไว้ว่า n หมายถึงจำนวนกรณีที่ดีในประชากรทั้งหมดขององค์ประกอบ N จากนั้นจะคำนวณความน่าจะเป็นดังนี้:
การแสดงข้างต้นในรูปแบบของตัวเลขเชิงบวกจะได้รูปแบบการแจกแจงความน่าจะเป็นดังต่อไปนี้:

คุณสมบัติหลักของการแจกแจงแบบไฮเปอร์จีโอเมตริก
มีดังต่อไปนี้:
- กลุ่มตัวอย่างต้องมีขนาดเล็กเสมอแม้ว่าประชากรจะมากก็ตาม
- องค์ประกอบของตัวอย่างจะถูกดึงออกมาทีละองค์ประกอบโดยไม่รวมกลับเข้าไปในประชากร
- คุณสมบัติที่จะศึกษาคือไบนารีนั่นคือสามารถรับได้สองค่าเท่านั้น: 1 หรือ 0 หรือจริงหรือเท็จ
ในแต่ละขั้นตอนการสกัดองค์ประกอบความน่าจะเป็นจะเปลี่ยนไปขึ้นอยู่กับผลลัพธ์ก่อนหน้านี้
การประมาณโดยใช้การแจกแจงแบบทวินาม
คุณสมบัติอีกประการหนึ่งของการแจกแจงแบบไฮเปอร์จีโอเมตริกคือสามารถประมาณได้โดยการแจกแจงแบบทวินามซึ่งแสดงเป็น Bi ตราบใดที่ประชากร N มีขนาดใหญ่และมีขนาดใหญ่กว่าตัวอย่าง m อย่างน้อย 10 เท่า ในกรณีนี้จะมีลักษณะดังนี้:
ความน่าจะเป็นที่สกรู x = 3 ในตัวอย่างมีข้อบกพร่องคือ: P (500, 5, 60, 3) = 0.0129
ในส่วนของมันความน่าจะเป็นที่ x = 4 สกรูจากหกสิบตัวอย่างมีข้อบกพร่องคือ: P (500, 5, 60; 4) = 0.0008
สุดท้ายความน่าจะเป็นที่สกรู x = 5 ในตัวอย่างนั้นมีข้อบกพร่องคือ: P (500, 5, 60; 5) = 0
แต่ถ้าคุณต้องการทราบความน่าจะเป็นที่ในตัวอย่างนั้นมีสกรูที่มีข้อบกพร่องมากกว่า 3 ตัวคุณจะต้องได้รับความน่าจะเป็นสะสมโดยเพิ่ม:
ตัวอย่างนี้แสดงในรูปที่ 2 ซึ่งได้มาจากการใช้ GeoGebra ซึ่งเป็นซอฟต์แวร์ฟรีที่ใช้กันอย่างแพร่หลายในโรงเรียนสถาบันและมหาวิทยาลัย

รูปที่ 2. ตัวอย่างการแจกแจงแบบไฮเปอร์จีโอเมตริก จัดทำโดย F. Zapata ด้วย GeoGebra
ตัวอย่าง 2
สำรับสำรับภาษาสเปนมีไพ่ 40 ใบซึ่ง 10 ใบมีทองและอีก 30 ใบที่เหลือไม่มี สมมติว่าไพ่ 7 ใบถูกสุ่มจากสำรับนั้นซึ่งจะไม่ถูกรวมเข้าไปในสำรับ
ถ้า X คือจำนวนทองที่มีอยู่ในไพ่ 7 ใบความน่าจะเป็นที่คุณจะได้ x ทองในการจั่วไพ่ 7 ใบจะได้รับจากการแจกแจงแบบไฮเปอร์จีโอเมตริก P (40,10,7; x)
ลองดูสิ่งนี้: ในการคำนวณความน่าจะเป็นที่จะมี 4 ทองในการจั่วไพ่ 7 ใบเราใช้สูตรการแจกแจงไฮเปอร์จีโอเมตริกที่มีค่าต่อไปนี้:

และผลลัพธ์คือ: ความน่าจะเป็น 4.57%
แต่ถ้าคุณต้องการทราบความน่าจะเป็นที่จะได้ไพ่มากกว่า 4 ใบคุณต้องเพิ่ม:
แบบฝึกหัดที่แก้ไข
แบบฝึกหัดชุดต่อไปนี้มีวัตถุประสงค์เพื่อแสดงให้เห็นและผสมผสานแนวคิดที่นำเสนอในบทความนี้ เป็นสิ่งสำคัญที่ผู้อ่านจะต้องพยายามแก้ไขด้วยตนเองก่อนที่จะมองหาวิธีแก้ปัญหา
แบบฝึกหัด 1
โรงงานผลิตถุงยางอนามัยแห่งหนึ่งพบว่าถุงยางอนามัยทุก ๆ 1,000 ชิ้นที่ผลิตโดยเครื่องจักรบางชิ้นมีข้อบกพร่อง 5 ชิ้น สำหรับการควบคุมคุณภาพถุงยางอนามัย 100 ชิ้นจะถูกสุ่มและจำนวนมากจะถูกปฏิเสธหากมีข้อบกพร่องอย่างน้อยหนึ่งชิ้นขึ้นไป ตอบ:
ก) อะไรคือความเป็นไปได้ที่จะมีการทิ้งล็อต 100?
b) เกณฑ์การควบคุมคุณภาพนี้มีประสิทธิภาพหรือไม่?
สารละลาย
ในกรณีนี้ตัวเลข Combinatorial ขนาดใหญ่มากจะปรากฏขึ้น การคำนวณทำได้ยากเว้นแต่คุณจะมีโปรแกรมสำเร็จรูปที่เหมาะสม
แต่เนื่องจากเป็นประชากรจำนวนมากและกลุ่มตัวอย่างมีขนาดเล็กกว่าประชากรทั้งหมดถึง 10 เท่าจึงสามารถใช้การประมาณของการแจกแจงแบบไฮเปอร์จีโอเมตริกโดยการแจกแจงแบบทวินาม:
ในนิพจน์ด้านบน C (100, x) คือจำนวนคอมบิเนเตอร์ จากนั้นความน่าจะเป็นที่จะมีข้อบกพร่องมากกว่าหนึ่งข้อจะถูกคำนวณดังนี้:
เป็นการประมาณที่ยอดเยี่ยมหากเทียบกับค่าที่ได้จากการใช้การแจกแจงแบบไฮเปอร์จีโอเมตริก: 0.4102
กล่าวได้ว่าด้วยความน่าจะเป็น 40% ควรทิ้งชุดป้องกันโรค 100 ชุดซึ่งไม่มีประสิทธิภาพมากนัก
แต่การที่มีความต้องการน้อยกว่าเล็กน้อยในกระบวนการควบคุมคุณภาพและการทิ้งล็อต 100 ก็ต่อเมื่อมีข้อบกพร่องตั้งแต่สองชิ้นขึ้นไปความน่าจะเป็นในการทิ้งล็อตจะลดลงเหลือเพียง 8%
แบบฝึกหัด 2
เครื่องบล็อกพลาสติกทำงานในลักษณะที่ทุกๆ 10 ชิ้นออกมาผิดรูป ในตัวอย่าง 5 ชิ้นมีความเป็นไปได้ที่จะมีข้อบกพร่องเพียงชิ้นเดียว?
สารละลาย
ประชากร: N = 10
จำนวน n ของข้อบกพร่องสำหรับทุกๆ N: n = 1
ขนาดตัวอย่าง: m = 5

ดังนั้นจึงมีความเป็นไปได้ 50% ที่ในตัวอย่าง 5 บล็อกจะผิดรูป
แบบฝึกหัด 3
ในการประชุมของผู้สำเร็จการศึกษาระดับมัธยมศึกษาตอนปลายมีสุภาพสตรี 7 คนและสุภาพบุรุษ 6 คน ในบรรดาเด็กผู้หญิง 4 คนเรียนมนุษยศาสตร์และวิทยาศาสตร์ 3 คน ในกลุ่มเด็กชาย 1 คนเรียนมนุษยศาสตร์และวิทยาศาสตร์ 5 คน คำนวณสิ่งต่อไปนี้:
ก) การสุ่มเลือกเด็กผู้หญิงสามคน: พวกเขาทั้งหมดเรียนมนุษยศาสตร์มีความเป็นไปได้อย่างไร?
b) หากเลือกผู้เข้าร่วมการประชุมของเพื่อนสามคนโดยสุ่ม: มีความเป็นไปได้อย่างไรที่ทั้งสามคนไม่ว่าจะเป็นเพศใดเรียนวิทยาศาสตร์ทั้งสามคนหรือมนุษยศาสตร์ทั้งสามคนด้วย?
c) ตอนนี้เลือกเพื่อนสองคนแบบสุ่มและเรียกตัวแปรสุ่มว่า "จำนวนคนที่เรียนมนุษยศาสตร์" ระหว่างทั้งสองที่เลือกกำหนดค่าเฉลี่ยหรือค่าที่คาดหวังของ x และความแปรปรวนσ ^ 2
วิธีแก้ปัญหา
ค่าที่จะใช้ตอนนี้คือ:
- ประชากร: N = 14
- ปริมาณที่ศึกษาตัวอักษรคือ: n = 6 และ
- ขนาดของตัวอย่าง: m = 3
- จำนวนเพื่อนที่เรียนมนุษยศาสตร์: x
ตามนี้ x = 3 หมายความว่าทั้งสามศึกษามนุษยศาสตร์ แต่ x = 0 หมายความว่าไม่มีใครศึกษามนุษยศาสตร์ ความน่าจะเป็นที่ทั้งสามการศึกษาเหมือนกันได้รับจากผลรวม:
P (14, 6, 3, x = 0) + P (14, 6, 3, x = 3) = 0.0560 + 0.1539 = 0.2099
จากนั้นเรามีความเป็นไปได้ 21% ที่ผู้เข้าร่วมการประชุมสามคนที่เลือกโดยการสุ่มจะศึกษาสิ่งเดียวกัน
แนวทางแก้ไข c
เรามีค่าดังต่อไปนี้:
N = ประชากรทั้งหมด 14 คนของเพื่อน n = 6 จำนวนทั้งหมดในกลุ่มประชากรที่ศึกษาด้านมนุษยศาสตร์ขนาดตัวอย่างคือ m = 2
ความหวังคือ:
E (x) = m * (n / N) = 2 * (6/14) = 0.8572
และความแปรปรวน:
σ (x) ^ 2 = ม. * (n / N) * (1-n / N) * (Nm) / (N-1) = 2 * (6/14) * (1-6 / 14) * ( 14-2) / (14-1) =
= 2 * (6/14) * (1-6 / 14) * (14-2) / (14-1) = 2 * (3/7) * (1-3 / 7) * (12) / ( 13) = 0.4521
อ้างอิง
- การแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่อง กู้คืนจาก: biplot.usal.es
- สถิติและความน่าจะเป็น การแจกแจงแบบไฮเปอร์จีโอเมตริก สืบค้นจาก: projectdescartes.org
- CDPYE-UGR การแจกแจงแบบไฮเปอร์จีโอเมตริก กู้คืนจาก: ugr.es
- GeoGebra Geogebra คลาสสิกแคลคูลัสความน่าจะเป็น กู้คืนจาก geogebra.org
- ลองง่าย แก้ไขปัญหาการแจกแจงแบบไฮเปอร์จีโอเมตริก ดึงมาจาก: probafacil.com
- Minitab การแจกแจงแบบไฮเปอร์จีโอเมตริก ดึงมาจาก: support.minitab.com
- มหาวิทยาลัยบีโก. การแจกแจงแบบไม่ต่อเนื่องหลัก สืบค้นจาก: anapg.webs.uvigo.es
- Vitutor สถิติและคอมบิเนเตอร์ ดึงมาจาก: vitutor.net
- Weisstein, Eric W. การแจกแจงแบบไฮเปอร์จีโอเมตริก สืบค้นจาก: mathworld.wolfram.com
- วิกิพีเดีย การแจกแจงแบบไฮเปอร์จีโอเมตริก สืบค้นจาก: es.wikipedia.com
