กฎ Sturgesเป็นเกณฑ์ที่ใช้ในการตรวจสอบจำนวนของชั้นเรียนหรือช่วงที่มีความจำเป็นสำหรับการวางแผนชุดของข้อมูลทางสถิติ กฎนี้ประกาศใช้ในปีพ. ศ. 2469 โดย Herbert Sturges นักคณิตศาสตร์ชาวเยอรมัน
Sturges เสนอวิธีการง่ายๆโดยพิจารณาจากจำนวนตัวอย่าง x ที่จะช่วยให้เราสามารถหาจำนวนคลาสและความกว้างของช่วงได้ กฎของ Sturges ถูกใช้กันอย่างแพร่หลายโดยเฉพาะอย่างยิ่งในด้านสถิติโดยเฉพาะเพื่อสร้างฮิสโทแกรมความถี่

คำอธิบาย
กฎของ Sturges เป็นวิธีการเชิงประจักษ์ที่ใช้กันอย่างแพร่หลายในสถิติเชิงพรรณนาเพื่อกำหนดจำนวนคลาสที่ต้องมีอยู่ในฮิสโตแกรมความถี่เพื่อจำแนกชุดข้อมูลที่แสดงถึงกลุ่มตัวอย่างหรือประชากร
โดยทั่วไปกฎนี้จะกำหนดความกว้างของคอนเทนเนอร์กราฟิกของฮิสโทแกรมความถี่
ในการสร้างกฎของเขา Herbert Sturges ได้พิจารณาแผนภาพความถี่ในอุดมคติซึ่งประกอบด้วยช่วงเวลา K โดยที่ช่วง i-th มีตัวอย่างจำนวนหนึ่ง (i = 0, … k - 1) ซึ่งแสดงเป็น:

จำนวนตัวอย่างนั้นจะได้รับจากจำนวนวิธีที่สามารถแยกส่วนย่อยของเซตได้ นั่นคือโดยสัมประสิทธิ์ทวินามแสดงดังนี้:


เพื่อลดความซับซ้อนของนิพจน์เขาใช้คุณสมบัติของลอการิทึมกับทั้งสองส่วนของสมการ:

ดังนั้น Sturges จึงกำหนดว่าจำนวนช่วงเวลาที่เหมาะสมที่สุดจะได้รับจากนิพจน์:

นอกจากนี้ยังสามารถแสดงเป็น:

ในนิพจน์นี้:
- k คือจำนวนชั้นเรียน
- N คือจำนวนการสังเกตทั้งหมดในกลุ่มตัวอย่าง
- Log คือลอการิทึมทั่วไปของฐาน 10
ตัวอย่างเช่นในการสร้างฮิสโตแกรมความถี่ที่แสดงตัวอย่างสุ่มที่มีความสูง 142 คนจำนวนช่วงหรือชั้นเรียนที่การแจกแจงจะมีดังนี้
k = 1 + 3.322 *บันทึก10 (N)
k = 1 + 3,322 *บันทึก (142)
k = 1 + 3.322 * 2.1523
k = 8.14 ≈ 8
ดังนั้นการกระจายจะเป็น 8 ช่วงเวลา
จำนวนช่วงเวลาต้องแสดงด้วยจำนวนเต็มเสมอ ในกรณีที่ค่าเป็นทศนิยมควรทำการประมาณให้ใกล้เคียงกับจำนวนเต็มมากที่สุด
การประยุกต์ใช้งาน
กฎของ Sturges ใช้เป็นหลักในสถิติเนื่องจากอนุญาตให้มีการแจกแจงความถี่ผ่านการคำนวณจำนวนคลาส (k) รวมถึงความยาวของแต่ละประเภทหรือที่เรียกว่าแอมพลิจูด
แอมพลิจูดคือความแตกต่างของขีด จำกัด บนและล่างของคลาสหารด้วยจำนวนคลาสและแสดง:

มีกฎมากมายที่อนุญาตให้ทำการแจกแจงความถี่ อย่างไรก็ตามกฎของ Sturges มักใช้เนื่องจากประมาณจำนวนคลาสซึ่งโดยทั่วไปอยู่ในช่วง 5 ถึง 15
ดังนั้นจึงพิจารณาค่าที่แสดงถึงกลุ่มตัวอย่างหรือประชากรอย่างเพียงพอ นั่นคือการประมาณไม่ได้แสดงถึงการจัดกลุ่มที่รุนแรงและไม่ทำงานกับคลาสจำนวนมากเกินไปซึ่งไม่อนุญาตให้สรุปตัวอย่าง
ตัวอย่าง
จำเป็นต้องสร้างฮิสโตแกรมความถี่ตามข้อมูลที่กำหนดซึ่งสอดคล้องกับอายุที่ได้รับจากการสำรวจผู้ชายที่ออกกำลังกายในโรงยิมในพื้นที่

ในการกำหนดช่วงเวลาเราต้องทราบขนาดของตัวอย่างหรือจำนวนข้อสังเกต ในกรณีนี้มี 30
จากนั้นกฎของ Sturges ใช้:
k = 1 + 3.322 *บันทึก10 (N)
k = 1 + 3,322 *บันทึก (30)
k = 1 + 3.322 * 1.4771
k = 5.90 ≈ 6 ช่วง
จากจำนวนช่วงเวลาสามารถคำนวณแอมพลิจูดที่จะมีได้ นั่นคือความกว้างของแต่ละแท่งที่แสดงในฮิสโตแกรมความถี่:

ขีด จำกัด ล่างถือเป็นค่าที่น้อยที่สุดของข้อมูลและขีด จำกัด บนคือค่าที่ใหญ่ที่สุด ความแตกต่างระหว่างขีด จำกัด บนและล่างเรียกว่า range หรือช่วงของตัวแปร (R)
จากตารางเราพบว่าขีด จำกัด บนคือ 46 และขีด จำกัด ล่างคือ 13 ดังนั้นแอมพลิจูดของแต่ละคลาสจะเป็น:

ช่วงเวลาจะประกอบด้วยขีด จำกัด บนและล่าง ในการกำหนดช่วงเวลาเหล่านี้เราเริ่มต้นด้วยการนับจากขีด จำกัด ล่างเพิ่มแอมพลิจูดที่กำหนดโดยกฎ (6) ตามวิธีต่อไปนี้:

จากนั้นคำนวณความถี่สัมบูรณ์เพื่อกำหนดจำนวนผู้ชายที่สอดคล้องกับแต่ละช่วงเวลา ในกรณีนี้คือ:
- ช่วงเวลา 1: 13 - 18 = 9
- ช่วง 2: 19 - 24 = 9
- ช่วงเวลา 3: 25 - 30 = 5
- ช่วงเวลา 4: 31 - 36 = 2
- ช่วงเวลา 5: 37 - 42 = 2
- ช่วง 6: 43 - 48 = 3
เมื่อเพิ่มความถี่สัมบูรณ์ของแต่ละคลาสจะต้องเท่ากับจำนวนทั้งหมดของตัวอย่าง ในกรณีนี้ 30.
จากนั้นจะคำนวณความถี่สัมพัทธ์ของแต่ละช่วงโดยหารความถี่สัมบูรณ์ด้วยจำนวนการสังเกตทั้งหมด:

- ช่วงที่ 1: fi = 9 ÷ 30 = 0.30
- ช่วงที่ 2: fi = 9 ÷ 30 = 0.30
- ช่วงที่ 3: fi = 5 ÷ 30 = 0.1666
- ช่วงที่ 4: fi = 2 ÷ 30 = 0.0666
- ช่วงที่ 5: fi = 2 ÷ 30 = 0.0666
- ช่วงที่ 4: fi = 3 ÷ 30 = 0.10
จากนั้นคุณสามารถสร้างตารางที่สะท้อนข้อมูลและแผนภาพจากความถี่สัมพัทธ์ที่สัมพันธ์กับช่วงเวลาที่ได้รับดังที่เห็นในภาพต่อไปนี้:


ด้วยวิธีนี้กฎ Sturges อนุญาตให้กำหนดจำนวนคลาสหรือช่วงเวลาที่สามารถแบ่งกลุ่มตัวอย่างเพื่อสรุปตัวอย่างข้อมูลผ่านการทำตารางและกราฟอย่างละเอียด
อ้างอิง
- Alfonso Urquía, MV (2013). การสร้างแบบจำลองและการจำลองเหตุการณ์ไม่ต่อเนื่อง UNED,.
- Altman Naomi, MK (2015). "การถดถอยเชิงเส้นอย่างง่าย" วิธีธรรมชาติ
- Antúnez, RJ (2014). สถิติทางการศึกษา. หน่วยดิจิทัล
- ฟ็อกซ์, J. (1997. ). การวิเคราะห์การถดถอยประยุกต์แบบจำลองเชิงเส้นและวิธีการที่เกี่ยวข้อง สิ่งพิมพ์ SAGE
- Humberto Llinás Solano, CR (2005). สถิติเชิงพรรณนาและการแจกแจงความน่าจะเป็น มหาวิทยาลัยนอร์ทเทิร์น.
- Panteleeva, OV (2005). พื้นฐานของความน่าจะเป็นและสถิติ
- O. Kuehl, MO (2544). การออกแบบการทดลอง: หลักการทางสถิติของการออกแบบและวิเคราะห์การวิจัย บรรณาธิการทอมสัน
