- ข้อดีและข้อเสีย
- ข้อเสียของช่วงเป็นตัวชี้วัดการกระจายตัว
- ช่วงระหว่างควอไทล์ควอไทล์และตัวอย่างการทำงาน
- - การคำนวณควอไทล์
- ควอร์ไทล์แรก
- ควอไทล์ที่สองหรือค่ามัธยฐาน
- ควอร์ไทล์ที่สาม
- ตัวอย่างที่ใช้งานได้
- วิธีแก้ปัญหา
- แนวทางแก้ไข b
- แนวทางแก้ไข c
- อ้างอิง
ช่วง , ช่วงหรือกว้างในสถิติคือความแตกต่าง (ลบ) ระหว่างค่าสูงสุดและค่าต่ำสุดของชุดของข้อมูลจากตัวอย่างหรือประชากร หากช่วงแสดงด้วยตัวอักษร R และข้อมูลแสดงด้วย x สูตรสำหรับช่วงจะเป็นเพียง:
R = x สูงสุด - x นาที
โดยที่ x maxคือค่าสูงสุดของข้อมูลและ x minคือค่าต่ำสุด
รูปที่ 1. ช่วงของข้อมูลที่สอดคล้องกับประชากรของCádizในช่วงสองศตวรรษที่ผ่านมา ที่มา: Wikimedia Commons
แนวคิดนี้มีประโยชน์มากในการวัดการกระจายอย่างง่าย ๆ เพื่อชื่นชมความแปรปรวนของข้อมูลได้อย่างรวดเร็วเนื่องจากเป็นการบ่งชี้ส่วนขยายหรือความยาวของช่วงเวลาที่พบสิ่งเหล่านี้
ตัวอย่างเช่นสมมติว่ามีการวัดความสูงของกลุ่มนักศึกษาวิศวกรรมชายชั้นปีที่ 1 จำนวน 25 คนในมหาวิทยาลัยแห่งหนึ่ง นักเรียนที่สูงที่สุดในกลุ่มคือ 1.93 ม. และสั้นที่สุด 1.67 ม. ค่าเหล่านี้เป็นค่าสูงสุดของข้อมูลตัวอย่างดังนั้นเส้นทางของพวกเขาคือ:
R = 1.93 - 1.67 ม. = 0.26 ม. หรือ 26 ซม.
ความสูงของนักเรียนในกลุ่มนี้จะกระจายไปตามช่วงนี้
ข้อดีและข้อเสีย
ช่วงคือดังที่เราได้กล่าวไว้ก่อนหน้านี้การวัดว่าข้อมูลกระจายออกไปอย่างไร ช่วงเล็ก ๆ บ่งชี้ว่าข้อมูลใกล้เคียงมากหรือน้อยและการแพร่กระจายต่ำ ในทางกลับกันช่วงที่กว้างขึ้นบ่งชี้ว่าข้อมูลมีการกระจายตัวมากขึ้น
ข้อดีของการคำนวณช่วงนั้นชัดเจนคือหาได้ง่ายและรวดเร็วเนื่องจากเป็นข้อแตกต่างง่ายๆ
นอกจากนี้ยังมีหน่วยเดียวกับข้อมูลที่ใช้งานได้และแนวคิดนี้ง่ายต่อการตีความสำหรับผู้สังเกตการณ์ทุกคน
ในตัวอย่างความสูงของนักศึกษาวิศวกรรมถ้าช่วงเป็น 5 ซม. เราจะบอกว่านักเรียนมีขนาดเท่ากันโดยประมาณ แต่ด้วยระยะ 26 ซม. เราจะสันนิษฐานได้ทันทีว่ามีนักเรียนที่มีความสูงระดับกลางทั้งหมดอยู่ในกลุ่มตัวอย่าง สมมติฐานนี้ถูกต้องเสมอไปหรือไม่?
ข้อเสียของช่วงเป็นตัวชี้วัดการกระจายตัว
หากเราดูอย่างละเอียดอาจเป็นไปได้ว่าในกลุ่มตัวอย่างของนักศึกษาวิศวกรรม 25 คนมีเพียงคนเดียวเท่านั้นที่วัดได้ 1.93 และอีก 24 คนที่เหลือมีความสูงใกล้ 1.67 ม.
และถึงกระนั้นช่วงก็ยังคงเหมือนเดิมแม้ว่าจะตรงกันข้ามก็เป็นไปได้อย่างสมบูรณ์: ความสูงของส่วนใหญ่อยู่ที่ประมาณ 1.90 ม. และมีเพียง 1.67 ม.
ไม่ว่าในกรณีใดการกระจายของข้อมูลจะแตกต่างกันมาก
ข้อเสียของช่วงเป็นตัวชี้วัดการกระจายเนื่องจากใช้เฉพาะค่ามากและไม่สนใจสิ่งอื่น ๆ ทั้งหมด เนื่องจากข้อมูลส่วนใหญ่สูญหายคุณจึงไม่รู้ว่าจะกระจายข้อมูลตัวอย่างอย่างไร
ลักษณะสำคัญอีกประการหนึ่งคือช่วงของตัวอย่างไม่เคยลดลง หากเราเพิ่มข้อมูลเพิ่มเติมนั่นคือเราพิจารณาข้อมูลมากขึ้นช่วงจะเพิ่มขึ้นหรือคงเดิม
และไม่ว่าในกรณีใดจะมีประโยชน์เฉพาะเมื่อทำงานกับตัวอย่างขนาดเล็กไม่แนะนำให้ใช้เพียงอย่างเดียวเพื่อวัดการกระจายในตัวอย่างขนาดใหญ่
สิ่งที่ต้องทำคือเสริมด้วยการคำนวณการวัดการกระจายอื่น ๆ ที่คำนึงถึงข้อมูลที่มาจากข้อมูลทั้งหมด: ช่วงระหว่างควอไทล์ความแปรปรวนส่วนเบี่ยงเบนมาตรฐานและสัมประสิทธิ์การแปรผัน
ช่วงระหว่างควอไทล์ควอไทล์และตัวอย่างการทำงาน
เราได้ตระหนักว่าจุดอ่อนของช่วงที่เป็นตัวชี้วัดการกระจายคือการใช้ประโยชน์จากค่าสูงสุดของการกระจายข้อมูลเท่านั้นโดยละเว้นค่าอื่น ๆ
เพื่อหลีกเลี่ยงความไม่สะดวกนี้จะใช้ควอไทล์: ค่าสามค่าที่เรียกว่าการวัดตำแหน่ง
พวกเขาแจกจ่ายข้อมูลที่ไม่ได้จัดกลุ่มออกเป็นสี่ส่วน (มาตรการตำแหน่งอื่น ๆ ที่ใช้กันอย่างแพร่หลายคือเดซิลและเปอร์เซ็นไทล์) นี่คือลักษณะของมัน:
-The แรกควอไทล์ Q 1คือค่าของข้อมูลดังกล่าวว่า 25% ของทั้งหมดของพวกเขาน้อยกว่าคิว1
- ควอไทล์ที่สอง Q 2คือค่ามัธยฐานของการแจกแจงซึ่งหมายความว่าครึ่งหนึ่ง (50%) ของข้อมูลน้อยกว่าค่านี้
-Finally ที่สามควอไทล์ Q 3แสดงให้เห็นว่า 75% ของข้อมูลที่น้อยกว่า Q 3
จากนั้นช่วงระหว่างควอไทล์หรือช่วงระหว่างควอไทล์ถูกกำหนดให้เป็นความแตกต่างระหว่างควอไทล์ที่สาม Q 3และควอไทล์แรก Q 1ของข้อมูล:
ช่วงอินเตอร์ควอไทล์ = R Q = Q 3 - Q 1
ด้วยวิธีนี้ค่าของช่วง R Q จึงไม่ได้รับผลกระทบจากค่ามาก ด้วยเหตุนี้จึงแนะนำให้ใช้เมื่อต้องจัดการกับการแจกแจงที่เบ้เช่นนักเรียนที่สูงมากหรือเตี้ยมากที่อธิบายไว้ข้างต้น
- การคำนวณควอไทล์
มีหลายวิธีในการคำนวณพวกเขาที่นี่เราจะเสนอวิธีหนึ่ง แต่ในกรณีใด ๆ จำเป็นต้องทราบหมายเลขคำสั่งซื้อ "N o " ซึ่งเป็นสถานที่ที่ควอไทล์ที่เกี่ยวข้องครอบครองในการแจกแจง
นั่นคือถ้าตัวอย่างเช่นคำที่ตรงกับ Q 1คือวินาทีที่สามหรือสี่และอื่น ๆ ของการแจกแจง
ควอร์ไทล์แรก
N หรือ (Q 1 ) = (N + 1) / 4
ควอไทล์ที่สองหรือค่ามัธยฐาน
N หรือ (Q 2 ) = (N + 1) / 2
ควอร์ไทล์ที่สาม
N หรือ (Q 3 ) = 3 (N + 1) / 4
โดยที่ N คือจำนวนข้อมูล
มัธยฐานคือค่าที่อยู่ตรงกลางของการแจกแจง หากจำนวนข้อมูลเป็นเลขคี่จะไม่มีปัญหาในการค้นหา แต่ถ้าเป็นค่าคู่ค่ากลางทั้งสองจะถูกเฉลี่ยเพื่อให้เป็นหนึ่งเดียวกัน
เมื่อคำนวณหมายเลขคำสั่งซื้อแล้วจะปฏิบัติตามกฎข้อใดข้อหนึ่งในสามข้อนี้:
- หากไม่มีทศนิยมข้อมูลที่ระบุในการแจกแจงจะถูกค้นหาและนี่จะเป็นควอไทล์ที่ค้นหา
- เมื่อหมายเลขคำสั่งซื้ออยู่กึ่งกลางระหว่างสองรายการข้อมูลที่ระบุโดยส่วนจำนวนเต็มจะถูกนำมาเฉลี่ยด้วยข้อมูลต่อไปนี้และผลลัพธ์คือควอไทล์ที่ตรงกัน
- ไม่ว่าในกรณีอื่นมันจะถูกปัดเศษเป็นจำนวนเต็มที่ใกล้ที่สุดและนั่นจะเป็นตำแหน่งของควอไทล์
ตัวอย่างที่ใช้งานได้
ในระดับ 0 ถึง 20 นักเรียนกลุ่มคณิตศาสตร์ I 16 คนได้คะแนน (คะแนน) ต่อไปนี้ในการสอบกลางภาค:
16, 10, 12, 8, 9, 15, 18, 20, 9, 11, 1, 13, 17, 9, 10, 14
หา:
ก) ช่วงหรือช่วงของข้อมูล
b) ค่าของควอไทล์ Q 1และ Q 3
c) ช่วงระหว่างควอไทล์
รูปที่ 2. คะแนนในการทดสอบคณิตศาสตร์นี้มีความแปรปรวนมากขนาดนั้นเลยหรือ? ที่มา: Pixabay
วิธีแก้ปัญหา
สิ่งแรกที่ต้องทำเพื่อค้นหาเส้นทางคือการจัดลำดับข้อมูลตามลำดับการเพิ่มหรือลด ตัวอย่างเช่นในการเพิ่มลำดับคุณมี:
1, 8, 9, 9, 9, 10, 10, 11, 12, 13, 14, 15, 16, 17, 18, 20
ใช้สูตรที่กำหนดไว้ตอนต้น: R = x max - x min
R = 20 - 1 คะแนน = 19 คะแนน
จากผลที่ตามมาการจัดอันดับเหล่านี้มีการกระจายอย่างมาก
แนวทางแก้ไข b
N = 16
N หรือ (Q 1 ) = (N + 1) / 4 = (16 + 1) / 4 = 17/4 = 4.25
มันคือตัวเลขที่มีทศนิยมซึ่งมีส่วนของจำนวนเต็มคือ 4 จากนั้นเราไปที่การแจกแจงเรามองหาข้อมูลที่อยู่ในตำแหน่งที่สี่และค่าของมันจะถูกเฉลี่ยด้วยตำแหน่งที่ห้า เนื่องจากทั้งคู่เป็น 9 ค่าเฉลี่ยจึงเป็น 9 เช่นกัน:
คำถาม1 = 9
ตอนนี้เราทำซ้ำขั้นตอนเพื่อค้นหา Q 3 :
N หรือ (Q 3 ) = 3 (N + 1) / 4 = 3 (16 +1) / 4 = 12.75
อีกครั้งมันเป็นทศนิยม แต่เนื่องจากไม่ใช่ครึ่งทางจึงถูกปัดเศษเป็น 13 ควอไทล์ที่ค้นหาจะอยู่ในตำแหน่งที่สิบสามและเป็น:
คำถาม3 = 16
แนวทางแก้ไข c
R Q = Q 3 - Q 1 = 16 - 9 = 7 คะแนน
ซึ่งอย่างที่เราเห็นมีขนาดเล็กกว่าช่วงของข้อมูลที่คำนวณในส่วนก) มากเนื่องจากคะแนนต่ำสุดคือ 1 คะแนนซึ่งเป็นค่าที่ห่างจากส่วนที่เหลือมาก
อ้างอิง
- Berenson, M. 1985. สถิติสำหรับการจัดการและเศรษฐศาสตร์. Interamericana SA
- Canavos, G. 1988. ความน่าจะเป็นและสถิติ: การประยุกต์ใช้และวิธีการ. McGraw Hill
- Devore, J. 2012. ความน่าจะเป็นและสถิติสำหรับวิศวกรรมและวิทยาศาสตร์. 8. ฉบับ กรง
- ตัวอย่างของควอไทล์ สืบค้นจาก: matematicas10.net.
- Levin, R. 1988. สถิติสำหรับผู้ดูแลระบบ. ครั้งที่ 2 ฉบับ ศิษย์ฮอลล์.
- Walpole, R. 2007. ความน่าจะเป็นและสถิติสำหรับวิศวกรรมและวิทยาศาสตร์. เพียร์สัน