- ประเภทขององศาอิสระ
- ในกรณีเชิงกล
- ในชุดของค่าสุ่ม
- ตัวอย่าง
- ความแปรปรวนและระดับความอิสระ
- ในการแจกแจงไคสแควร์
- ในการทดสอบสมมติฐาน (พร้อมตัวอย่างแก้ไข)
- อ้างอิง
องศาอิสระในสถิติมีจำนวนขององค์ประกอบที่เป็นอิสระของเวกเตอร์สุ่ม ถ้าเวกเตอร์มีองค์ประกอบ n และมีสมการเชิงเส้นที่เกี่ยวข้องกับส่วนประกอบของมันระดับความอิสระจะเป็น np
แนวคิดเรื่ององศาอิสระยังปรากฏในกลศาสตร์เชิงทฤษฎีซึ่งเทียบเท่ากับมิติของอวกาศที่อนุภาคเคลื่อนที่โดยลบด้วยจำนวนพันธะ
รูปที่ 1. ลูกตุ้มเคลื่อนที่ในสองมิติ แต่มีอิสระเพียงหนึ่งองศาเนื่องจากถูกบังคับให้เคลื่อนที่ในส่วนโค้งของรัศมี L ที่มา: F. Zapata
บทความนี้จะกล่าวถึงแนวคิดเรื่ององศาอิสระที่ใช้กับสถิติ แต่ตัวอย่างเชิงกลนั้นง่ายกว่าในการมองเห็นในรูปแบบเรขาคณิต
ประเภทขององศาอิสระ
ขึ้นอยู่กับบริบทที่ใช้วิธีคำนวณจำนวนองศาอิสระอาจแตกต่างกันไป แต่แนวคิดพื้นฐานจะเหมือนกันเสมอ: มิติข้อมูลทั้งหมดน้อยกว่าข้อ จำกัด
ในกรณีเชิงกล
ให้เราพิจารณาอนุภาคที่กำลังสั่นซึ่งผูกติดกับสตริง (ลูกตุ้ม) ที่เคลื่อนที่ในระนาบ xy แนวตั้ง (2 มิติ) อย่างไรก็ตามอนุภาคถูกบังคับให้เคลื่อนที่ไปตามเส้นรอบวงรัศมีเท่ากับความยาวของคอร์ด
เนื่องจากอนุภาคเคลื่อนที่ได้เฉพาะในส่วนโค้งนั้นจำนวนองศาอิสระจึงเป็น 1 ซึ่งสามารถเห็นได้ในรูปที่ 1
วิธีคำนวณจำนวนองศาอิสระคือการเอาผลต่างของจำนวนมิติลบด้วยจำนวนข้อ จำกัด :
องศาอิสระ: = 2 (ขนาด) - 1 (มัด) = 1
คำอธิบายอื่นที่ช่วยให้เราได้ผลลัพธ์มีดังต่อไปนี้:
- เรารู้ว่าตำแหน่งในสองมิติแสดงด้วยจุดพิกัด (x, y)
- แต่เนื่องจากจุดต้องเป็นไปตามสมการของเส้นรอบวง (x 2 + y 2 = L 2 ) สำหรับค่าที่กำหนดของตัวแปร x ตัวแปร y จะถูกกำหนดโดยสมการหรือข้อ จำกัด ดังกล่าว
ด้วยวิธีนี้ตัวแปรเพียงตัวเดียวเท่านั้นที่เป็นอิสระและระบบมีอิสระหนึ่ง (1) ระดับ
ในชุดของค่าสุ่ม
เพื่อแสดงให้เห็นถึงความหมายของแนวคิดสมมติว่าเวกเตอร์
x = (x 1 , x 2 , … , x n )
เป็นตัวแทนของตัวอย่างของ n ค่าสุ่มที่กระจายตามปกติ ในกรณีนี้เวกเตอร์สุ่มxมีองค์ประกอบอิสระ n ดังนั้นจึงกล่าวว่าxมีองศาอิสระ n
ตอนนี้ให้เราสร้างเวกเตอร์rของเศษเหลือ
r = (x 1 -
ที่ไหน
ดังนั้นผลรวม
(x 1 -
เป็นสมการที่แสดงถึงข้อ จำกัด (หรือการผูก) ในองค์ประกอบของเวกเตอร์rของเศษเหลือเนื่องจากถ้าทราบส่วนประกอบ n-1 ของเวกเตอร์rสมการข้อ จำกัด จะกำหนดองค์ประกอบที่ไม่รู้จัก
ดังนั้นเวกเตอร์rของมิติ n ที่มีข้อ จำกัด :
∑ (x i -
มีองศาอิสระ (n - 1)
อีกครั้งมีการใช้การคำนวณจำนวนองศาอิสระคือ:
องศาอิสระ: = n (ขนาด) - 1 (ข้อ จำกัด ) = n-1
ตัวอย่าง
ความแปรปรวนและระดับความอิสระ
ความแปรปรวน s 2ถูกกำหนดให้เป็นค่าเฉลี่ยของกำลังสองของส่วนเบี่ยงเบน (หรือส่วนที่เหลือ) ของตัวอย่างของข้อมูล n:
s 2 = ( r • r ) / (n-1)
โดยที่rคือเวกเตอร์ของเศษเหลือr = (x1 -
s 2 = ∑ (x ผม -
ไม่ว่าในกรณีใดควรสังเกตว่าเมื่อคำนวณค่าเฉลี่ยของกำลังสองของเศษเหลือจะหารด้วย (n-1) ไม่ใช่ด้วย n เนื่องจากตามที่กล่าวไว้ในหัวข้อก่อนหน้าจำนวนองศาอิสระของเวกเตอร์rคือ ( n-1)
หากสำหรับการคำนวณความแปรปรวนนั้นหารด้วย n แทน (n-1) ผลลัพธ์จะมีอคติที่มีนัยสำคัญมากสำหรับค่า n ที่น้อยกว่า 50
ในวรรณคดีสูตรความแปรปรวนยังปรากฏขึ้นพร้อมกับตัวหาร n แทน (n-1) เมื่อพูดถึงความแปรปรวนของประชากร
แต่ชุดของตัวแปรสุ่มของส่วนที่เหลือซึ่งแสดงโดยเวกเตอร์rแม้ว่าจะมีมิติ n แต่ก็มีองศาอิสระ (n-1) เท่านั้น อย่างไรก็ตามหากจำนวนข้อมูลมากพอ (n> 500) สูตรทั้งสองจะมาบรรจบกันเป็นผลลัพธ์เดียวกัน
เครื่องคำนวณและสเปรดชีตให้ความแปรปรวนทั้งสองเวอร์ชันและส่วนเบี่ยงเบนมาตรฐาน (ซึ่งเป็นรากที่สองของความแปรปรวน)
คำแนะนำของเราในมุมมองของการวิเคราะห์ที่นำเสนอนี้คือการเลือกเวอร์ชันที่มี (n-1) ทุกครั้งที่จำเป็นต้องใช้ในการคำนวณความแปรปรวนหรือส่วนเบี่ยงเบนมาตรฐานเพื่อหลีกเลี่ยงผลลัพธ์ที่เอนเอียง
ในการแจกแจงไคสแควร์
การแจกแจงความน่าจะเป็นบางส่วนในตัวแปรสุ่มแบบต่อเนื่องขึ้นอยู่กับพารามิเตอร์ที่เรียกว่าองศาอิสระนี่คือกรณีของการแจกแจงไคสแควร์ (χ 2 )
ชื่อของพารามิเตอร์นี้มาจากระดับความเป็นอิสระของเวกเตอร์สุ่มพื้นฐานที่ใช้การแจกแจงนี้
สมมติว่าเรามีประชากร g ซึ่งเป็นตัวอย่างขนาด n:
X 1 = (x1 1 , x1 2 … ..x1 n )
X2 = (x2 1 , x 2 2 … ..x2 n )
…
X J = (XJ 1 , XJ 2 … ..xj n )
…
Xg = (xg 1 , xg 2 , … ..xg n )
ประชากร j ที่มีค่าเฉลี่ย
ตัวแปรมาตรฐานหรือตัวแปรมาตรฐาน zj iถูกกำหนดให้เป็น:
zj ฉัน = (xj ฉัน -
และเวกเตอร์Zjถูกกำหนดดังนี้:
Zj = ( zj 1 , zj 2 , …, zj i , …, zj n ) และเป็นไปตามการแจกแจงปกติมาตรฐาน N (0,1)
ดังนั้นตัวแปร:
Q = ((z1 1 ^ 2 + z2 1 ^ 2 + …. + Zg 1 ^ 2), …., (Z1 n ^ 2 + z2 n ^ 2 + …. + Zg n ^ 2))
ตามการแจกแจงχ 2 (g) เรียกว่าการแจกแจงแบบไคสแควร์โดยมีระดับอิสระ g
ในการทดสอบสมมติฐาน (พร้อมตัวอย่างแก้ไข)
เมื่อคุณต้องการทดสอบสมมติฐานจากข้อมูลสุ่มชุดหนึ่งคุณจำเป็นต้องทราบจำนวนองศาอิสระ g เพื่อใช้การทดสอบไคสแควร์
รูปที่ 2 ความสัมพันธ์ระหว่างความชอบของรสชาติไอศกรีมกับเพศของลูกค้าหรือไม่? ที่มา: F. Zapata
ตัวอย่างเช่นข้อมูลที่รวบรวมเกี่ยวกับความชอบของไอศกรีมช็อกโกแลตหรือสตรอเบอร์รี่ของชายและหญิงในร้านไอศกรีมบางแห่งจะได้รับการวิเคราะห์ ความถี่ที่ผู้ชายและผู้หญิงเลือกสตรอเบอร์รี่หรือช็อกโกแลตสรุปไว้ในรูปที่ 2
ขั้นแรกให้คำนวณตารางความถี่ที่คาดไว้ซึ่งจัดทำขึ้นโดยการคูณจำนวนแถวทั้งหมดด้วยจำนวนคอลัมน์ทั้งหมดหารด้วยข้อมูลทั้งหมด ผลลัพธ์จะแสดงในรูปต่อไปนี้:
รูปที่ 3. การคำนวณความถี่ที่คาดหวังตามความถี่ที่สังเกตได้ (ค่าเป็นสีน้ำเงินในรูปที่ 2) ที่มา: F. Zapata
จากนั้นคำนวณ Chi square (จากข้อมูล) โดยใช้สูตรต่อไปนี้:
χ 2 = ∑ (F o - F e ) 2 / F e
โดยที่ F oคือความถี่ที่สังเกตได้ (รูปที่ 2) และ F eคือความถี่ที่คาดหวัง (รูปที่ 3) ผลรวมจะอยู่เหนือแถวและคอลัมน์ทั้งหมดซึ่งในตัวอย่างของเราให้สี่คำ
หลังจากดำเนินการคุณจะได้รับ:
χ 2 = 0.2043
ตอนนี้จำเป็นต้องเปรียบเทียบกับ Chi square ตามทฤษฎีซึ่งขึ้นอยู่กับจำนวนองศาอิสระ g
ในกรณีของเราตัวเลขนี้ถูกกำหนดดังนี้:
g = (# แถว - 1) (#columns - 1) = (2 - 1) (2 - 1) = 1 * 1 = 1
ปรากฎว่าจำนวนองศาอิสระ g ในตัวอย่างนี้คือ 1
หากคุณต้องการตรวจสอบหรือปฏิเสธสมมติฐานว่าง (H0: ไม่มีความสัมพันธ์ระหว่าง TASTE และ GENDER) ที่มีระดับนัยสำคัญ 1% ค่าไคสแควร์ทางทฤษฎีจะคำนวณด้วยระดับอิสระ g = 1
หาค่าที่ทำให้ความถี่สะสม (1 - 0.01) = 0.99 นั่นคือ 99% ค่านี้ (ซึ่งหาได้จากตาราง) คือ 6,636
เนื่องจาก Chi ทางทฤษฎีมีค่าเกินค่าที่คำนวณได้จึงมีการตรวจสอบสมมติฐานว่าง
กล่าวอีกนัยหนึ่งคือเมื่อรวบรวมข้อมูลแล้วจะไม่มีการสังเกตความสัมพันธ์ระหว่างตัวแปร TASTE และ GENDER
อ้างอิง
- Minitab ระดับความอิสระคืออะไร? ดึงมาจาก: support.minitab.com.
- มัวร์เดวิด (2552) สถิติประยุกต์พื้นฐาน. บรรณาธิการ Antoni Bosch
- ลีห์เจนนิเฟอร์ วิธีคำนวณองศาอิสระในแบบจำลองทางสถิติ สืบค้นจาก: geniolandia.com
- วิกิพีเดีย ระดับเสรีภาพ (สถิติ) สืบค้นจาก: es.wikipedia.com
- วิกิพีเดีย ระดับความอิสระ (ทางกายภาพ) สืบค้นจาก: es.wikipedia.com