- สูตรและสมการ
- วิธีคำนวณข้อผิดพลาดในการสุ่มตัวอย่าง
- เพื่อความมั่นใจในระดับหนึ่ง
- ตัวอย่าง
- - ตัวอย่าง 1
- สารละลาย
- - ตัวอย่าง 2
- สารละลาย
- - ตัวอย่าง 3
- สารละลาย
- - ตัวอย่างที่ 4
- สารละลาย
- - แบบฝึกหัด 5
- สารละลาย
- อ้างอิง
สุ่มตัวอย่างผิดพลาดหรือการสุ่มตัวอย่างข้อผิดพลาดในสถิติคือความแตกต่างระหว่างค่าเฉลี่ยของกลุ่มตัวอย่างและค่าเฉลี่ยของประชากรทั้งหมด เพื่อแสดงแนวคิดนี้ลองนึกภาพว่าประชากรทั้งหมดของเมืองหนึ่งล้านคนซึ่งคุณต้องการขนาดรองเท้าโดยเฉลี่ยซึ่งสุ่มตัวอย่างจากประชากรหนึ่งพันคน
ขนาดเฉลี่ยที่ปรากฏจากตัวอย่างไม่จำเป็นต้องตรงกับจำนวนประชากรทั้งหมดแม้ว่าตัวอย่างจะไม่เอนเอียงก็ตามค่าจะต้องใกล้เคียงกัน ความแตกต่างระหว่างค่าเฉลี่ยของตัวอย่างกับจำนวนประชากรทั้งหมดนี้เป็นข้อผิดพลาดในการสุ่มตัวอย่าง
รูปที่ 1. เนื่องจากตัวอย่างเป็นส่วนย่อยของจำนวนประชากรทั้งหมดค่าเฉลี่ยตัวอย่างจึงมีข้อผิดพลาดเล็กน้อย ที่มา: F. Zapata
โดยทั่วไปไม่ทราบค่าเฉลี่ยของประชากรทั้งหมด แต่มีเทคนิคในการลดข้อผิดพลาดนี้และสูตรเพื่อประมาณระยะขอบของข้อผิดพลาดในการสุ่มตัวอย่างที่จะกล่าวถึงในบทความนี้
สูตรและสมการ
สมมติว่าเราต้องการทราบค่าเฉลี่ยของลักษณะที่วัดได้ x ในประชากรขนาด N แต่เนื่องจาก N เป็นจำนวนมากจึงไม่สามารถทำการศึกษาเกี่ยวกับประชากรทั้งหมดได้จากนั้นเราจึงทำการสุ่มตัวอย่าง ขนาด n <
ค่าเฉลี่ยของตัวอย่างแสดงด้วย
สมมติว่าตัวอย่าง m ถูกนำมาจากประชากรทั้งหมด N ซึ่งมีขนาดเท่ากับ n ทั้งหมดที่มีค่าเฉลี่ย
ค่าเฉลี่ยเหล่านี้จะไม่เหมือนกันและจะอยู่รอบ ๆ ค่าเฉลี่ยประชากรμ ระยะขอบข้อผิดพลาดในการสุ่มตัวอย่าง E ระบุการแยกที่คาดไว้ของค่าเฉลี่ย
ขอบข้อผิดพลาดมาตรฐานεของตัวอย่างขนาด n คือ:
ε = σ / √n
โดยที่σคือค่าเบี่ยงเบนมาตรฐาน (รากที่สองของความแปรปรวน) ซึ่งคำนวณโดยใช้สูตรต่อไปนี้:
σ = √
ความหมายของขอบข้อผิดพลาดมาตรฐานεมีดังนี้:
ค่าเฉลี่ย
วิธีคำนวณข้อผิดพลาดในการสุ่มตัวอย่าง
ในส่วนก่อนหน้านี้มีการกำหนดสูตรเพื่อค้นหาขอบข้อผิดพลาดมาตรฐานของตัวอย่างขนาด n โดยที่คำว่ามาตรฐานระบุว่าเป็นค่าความคลาดเคลื่อนที่มีความเชื่อมั่น 68%
สิ่งนี้บ่งชี้ว่าหากนำตัวอย่างที่มีขนาดเท่ากันจำนวนมากจำนวน 68% จะให้ค่าเฉลี่ย
มีกฎง่ายๆที่เรียกว่ากฎ 68-95-99.7 ที่ช่วยให้เราค้นหาระยะขอบข้อผิดพลาดในการสุ่มตัวอย่าง E สำหรับระดับความเชื่อมั่น 68%, 95% และ 99.7% ได้อย่างง่ายดายเนื่องจากระยะขอบนี้คือ1⋅ε, 2 ⋅εและ3⋅εตามลำดับ
เพื่อความมั่นใจในระดับหนึ่ง
หากระดับความเชื่อมั่นγไม่ใช่ข้อใดข้อหนึ่งข้างต้นข้อผิดพลาดในการสุ่มตัวอย่างคือค่าเบี่ยงเบนมาตรฐานσคูณด้วยปัจจัยZγซึ่งได้มาจากขั้นตอนต่อไปนี้:
1.- ขั้นแรกกำหนดระดับนัยสำคัญαซึ่งคำนวณจากระดับความเชื่อมั่นγผ่านความสัมพันธ์ต่อไปนี้: α = 1 - γ
2.- จากนั้นเราจะต้องคำนวณค่า 1 - α / 2 = (1 + γ) / 2 ซึ่งสอดคล้องกับความถี่ปกติสะสมระหว่าง-∞และZγในการแจกแจงแบบปกติหรือแบบเกาส์เซียนที่พิมพ์ F (z) ซึ่งมีนิยาม สามารถเห็นได้ในรูปที่ 2
3.- สม F (Zγ) = 1 - α / 2 จะแก้ไขได้โดยวิธีการของตารางของการกระจายปกติ (สะสม) F หรือโดยวิธีการของการประยุกต์ใช้คอมพิวเตอร์ที่มีฟังก์ชั่นแบบเกาส์ผกผัน F -1
ในกรณีหลังเรามี:
Zγ = G -1 (1 - α / 2)
4.- สุดท้ายสูตรนี้จะใช้สำหรับข้อผิดพลาดในการสุ่มตัวอย่างที่มีระดับความน่าเชื่อถือγ:
E = Zγ⋅ (σ / √n)
รูปที่ 2. ตารางการแจกแจงปกติ ที่มา: Wikimedia Commons
ตัวอย่าง
- ตัวอย่าง 1
คำนวณขอบผิดพลาดมาตรฐานในน้ำหนักเฉลี่ยของตัวอย่างทารกแรกเกิด 100 คน การคำนวณน้ำหนักเฉลี่ยคือ
สารละลาย
ความคลาดเคลื่อนมาตรฐานคือε = σ / √n = (1,500 กก.) / √100 = 0.15 กก. ซึ่งหมายความว่าจากข้อมูลเหล่านี้สามารถสรุปได้ว่าน้ำหนักของทารกแรกเกิด 68% อยู่ระหว่าง 2,950 กก. ถึง 3.25 กก.
- ตัวอย่าง 2
กำหนดระยะขอบของข้อผิดพลาดในการสุ่มตัวอย่าง E และช่วงน้ำหนักของทารกแรกเกิด 100 คนโดยมีระดับความเชื่อมั่น 95% หากน้ำหนักเฉลี่ย 3,100 กก. โดยมีค่าเบี่ยงเบนมาตรฐานσ = 1,500 กก.
สารละลาย
ถ้ากฎ 68 บังคับใช้; 95; 99.7 →1⋅ε; 2⋅ε; 3⋅εเรามี:
E = 2⋅ε = 2⋅0.15กก. = 0.30 กก
กล่าวอีกนัยหนึ่ง 95% ของทารกแรกเกิดจะมีน้ำหนักระหว่าง 2,800 กก. ถึง 3,400 กก.
- ตัวอย่าง 3
กำหนดช่วงน้ำหนักของทารกแรกเกิดในตัวอย่างที่ 1 โดยมีค่าความเชื่อมั่น 99.7%
สารละลาย
ข้อผิดพลาดในการสุ่มตัวอย่างที่มีความเชื่อมั่น 99.7% คือ 3 σ / √nซึ่งสำหรับตัวอย่างของเราคือ E = 3 * 0.15 กก. = 0.45 กก. จากนี้ไป 99.7% ของทารกแรกเกิดจะมีน้ำหนักระหว่าง 2,650 กก. ถึง 3,550 กก.
- ตัวอย่างที่ 4
กำหนดปัจจัยZγสำหรับระดับความเชื่อมั่น 75% กำหนดขอบของข้อผิดพลาดในการสุ่มตัวอย่างด้วยระดับความน่าเชื่อถือนี้สำหรับกรณีที่แสดงในตัวอย่างที่ 1
สารละลาย
ระดับความเชื่อมั่นคือγ = 75% = 0.75 ซึ่งสัมพันธ์กับระดับนัยสำคัญαผ่านความสัมพันธ์γ = (1 - α) ดังนั้นระดับนัยสำคัญคือα = 1 - 0.75 = 0 , 25.
ซึ่งหมายความว่าความน่าจะเป็นปกติสะสมระหว่าง-∞และZγคือ:
P (Z ≤Zγ) = 1 - 0.125 = 0.875
ซึ่งสอดคล้องกับค่าZγที่ 1.1503 ดังแสดงในรูปที่ 3
รูปที่ 3. การกำหนดปัจจัยZγที่สอดคล้องกับระดับความเชื่อมั่น 75% ที่มา: F. Zapata ผ่าน Geogebra
กล่าวอีกนัยหนึ่งข้อผิดพลาดในการสุ่มตัวอย่างคือ E = Zγ⋅ (σ / √n) = 1.15 ⋅ (σ / √n)
เมื่อนำไปใช้กับข้อมูลจากตัวอย่างที่ 1 จะมีข้อผิดพลาดดังนี้
E = 1.15 * 0.15 กก. = 0.17 กก
ด้วยระดับความเชื่อมั่น 75%.
- แบบฝึกหัด 5
ระดับความเชื่อมั่นเป็นอย่างไรถ้า Z α / 2 = 2.4?
สารละลาย
P (Z ≤ Z α / 2 ) = 1 - α / 2
P (Z ≤ 2.4) = 1 - α / 2 = 0.9918 →α / 2 = 1 - 0.9918 = 0.0082 →α = 0.0164
ระดับความสำคัญคือ:
α = 0.0164 = 1.64%
และในที่สุดระดับความเชื่อมั่นยังคงอยู่:
1- α = 1 - 0.0164 = 100% - 1.64% = 98.36%
อ้างอิง
- Canavos, G. 1988. ความน่าจะเป็นและสถิติ: การประยุกต์ใช้และวิธีการ. McGraw Hill
- Devore, J. 2012. ความน่าจะเป็นและสถิติสำหรับวิศวกรรมและวิทยาศาสตร์. 8 ฉบับ คลิกที่นี่
- Levin, R. 1988. สถิติสำหรับผู้ดูแลระบบ. ครั้งที่ 2 ฉบับ ศิษย์ฮอลล์.
- Sudman, S. 1982 การถามคำถาม: แนวทางปฏิบัติในการออกแบบแบบสอบถาม ซานฟรานซิสโก. Jossey Bass
- Walpole, R. 2007. ความน่าจะเป็นและสถิติสำหรับวิศวกรรมและวิทยาศาสตร์. เพียร์สัน
- Wonnacott, TH และ RJ Wonnacott 2533. สถิติเบื้องต้น. 5th เอ็ดไวลีย์
- วิกิพีเดีย ข้อผิดพลาดในการสุ่มตัวอย่าง สืบค้นจาก: en.wikipedia.com
- วิกิพีเดีย ขอบของข้อผิดพลาด สืบค้นจาก: en.wikipedia.com