- วิธีการคำนวณค่าสัมประสิทธิ์การกำหนด?
- กรณีตัวอย่าง
- การตีความ
- ตัวอย่าง
- - ตัวอย่าง 1
- สารละลาย
- - ตัวอย่าง 2
- สารละลาย
- - ตัวอย่าง 3
- สารละลาย
- เปรียบเทียบพอดี
- สรุปผลการวิจัย
- อ้างอิง
ค่าสัมประสิทธิ์การตัดสินใจเป็นตัวเลขระหว่าง 0 และ 1 ที่แสดงถึงส่วนของคะแนน (X, Y) ที่เป็นไปตามสายการถดถอยของความเหมาะสมของชุดข้อมูลที่มีสองตัวแปร
นอกจากนี้ยังเป็นที่รู้จักกันเป็นความดีของพอดีและจะเขียนแทนด้วย R 2 ในการคำนวณผลหารระหว่างความแปรปรวนของข้อมูลŶiที่ประมาณโดยแบบจำลองการถดถอยและความแปรปรวนของข้อมูล Yi ที่สอดคล้องกับ Xi ของข้อมูลแต่ละตัวจะถูกนำมา
R 2 = Sŷ / Sy

รูปที่ 1. ค่าสัมประสิทธิ์สหสัมพันธ์สำหรับข้อมูลสี่คู่ ที่มา: F. Zapata
ถ้า 100% ของข้อมูลอยู่ในบรรทัดของฟังก์ชันการถดถอยค่าสัมประสิทธิ์การกำหนดจะเป็น 1
ในทางตรงกันข้ามหากสำหรับชุดข้อมูลและฟังก์ชันความพอดีค่าสัมประสิทธิ์ R 2จะเท่ากับ 0.5 ก็สามารถกล่าวได้ว่าความพอดีนั้นน่าพอใจหรือดี 50%
ในทำนองเดียวกันเมื่อแบบจำลองการถดถอยให้ค่า R 2ต่ำกว่า 0.5 แสดงว่าฟังก์ชันการปรับแต่งที่เลือกไม่ปรับให้เข้ากับข้อมูลได้อย่างน่าพอใจดังนั้นจึงจำเป็นต้องค้นหาฟังก์ชันการปรับแต่งอื่น
และเมื่อความแปรปรวนร่วมหรือค่าสัมประสิทธิ์สหสัมพันธ์มีแนวโน้มที่จะเป็นศูนย์ดังนั้นตัวแปร X และ Y ในข้อมูลจะไม่สัมพันธ์กันดังนั้น R 2จะมีแนวโน้มเป็นศูนย์ด้วย
วิธีการคำนวณค่าสัมประสิทธิ์การกำหนด?
ในส่วนก่อนหน้าได้กล่าวไว้ว่าค่าสัมประสิทธิ์ของการกำหนดคำนวณโดยการหาผลหารระหว่างผลต่าง:
- ประเมินโดยฟังก์ชันการถดถอยของตัวแปร Y
- ตัวแปร Yi ที่สอดคล้องกับตัวแปร Xi แต่ละคู่ของคู่ข้อมูล N
ระบุไว้ในทางคณิตศาสตร์ดูเหมือนว่า:
R 2 = Sŷ / Sy
จากสูตรนี้จะเป็นไปตามที่ R 2แสดงถึงสัดส่วนของความแปรปรวนที่อธิบายโดยแบบจำลองการถดถอย หรืออีกวิธีหนึ่งคือ R 2สามารถคำนวณได้โดยใช้สูตรต่อไปนี้ซึ่งเทียบเท่ากับสูตรก่อนหน้านี้:
ร2 = 1 - (Sε / Sy)
โดยที่Sεแสดงถึงความแปรปรวนของเศษเหลือεi = Ŷi - Yi ในขณะที่ Sy คือความแปรปรวนของชุดค่า Yi ของข้อมูล ในการตรวจสอบŶiจะใช้ฟังก์ชันการถดถอยซึ่งหมายถึงการยืนยันว่าŶi = f (Xi)
ความแปรปรวนของชุดข้อมูล Yi โดยมี i ตั้งแต่ 1 ถึง N คำนวณด้วยวิธีนี้:
Sy =
จากนั้นดำเนินการในลักษณะเดียวกันสำหรับSŷหรือSε
กรณีตัวอย่าง
ในการแสดงรายละเอียดวิธีการคำนวณค่าสัมประสิทธิ์การกำหนดเราจะใช้ชุดข้อมูลสี่คู่ต่อไปนี้:
(X, Y): {(1, 1); (2. 3); (3, 6) และ (4, 7)}
มีการเสนอความพอดีของการถดถอยเชิงเส้นสำหรับชุดข้อมูลนี้ซึ่งได้มาโดยใช้วิธีกำลังสองน้อยที่สุด:
f (x) = 2.1 x - 1
ใช้ฟังก์ชั่นการปรับแต่งนี้จะได้รับแรงบิด:
(X, Ŷ): {(1, 1.1); (2, 3.2); (3, 5.3) และ (4, 7.4)}
จากนั้นเราคำนวณค่าเฉลี่ยเลขคณิตสำหรับ X และ Y:
ความแปรปรวน Sy
ไซ = / (4-1) =
= = 7,583
ความแปรปรวนSŷ
Sŷ = / (4-1) =
= = 7.35
ค่าสัมประสิทธิ์การกำหนด R 2
R 2 = Sŷ / Sy = 7.35 / 7.58 = 0.97
การตีความ
ค่าสัมประสิทธิ์การกำหนดสำหรับกรณีตัวอย่างที่พิจารณาในส่วนก่อนหน้ากลายเป็น 0.98 กล่าวอีกนัยหนึ่งคือการปรับเชิงเส้นผ่านฟังก์ชัน:
f (x) = 2.1x - 1
มีความน่าเชื่อถือ 98% ในการอธิบายข้อมูลที่ได้มาโดยใช้วิธีกำลังสองน้อยที่สุด
นอกจากค่าสัมประสิทธิ์การกำหนดแล้วยังมีค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นหรือเรียกอีกอย่างว่าสัมประสิทธิ์ของเพียร์สัน ค่าสัมประสิทธิ์นี้แสดงเป็น r คำนวณโดยความสัมพันธ์ต่อไปนี้:
r = Sxy / (Sx ไซ)
ที่นี่ตัวเศษแสดงถึงความแปรปรวนร่วมระหว่างตัวแปร X และ Y ในขณะที่ตัวส่วนคือผลคูณของค่าเบี่ยงเบนมาตรฐานสำหรับตัวแปร X และส่วนเบี่ยงเบนมาตรฐานสำหรับตัวแปร Y
ค่าสัมประสิทธิ์ของเพียร์สันสามารถรับค่าได้ระหว่าง -1 ถึง +1 เมื่อสัมประสิทธิ์นี้มีแนวโน้มที่ +1 จะมีความสัมพันธ์เชิงเส้นตรงระหว่าง X และ Y หากมีแนวโน้มที่จะเป็น -1 แทนแสดงว่ามีความสัมพันธ์เชิงเส้น แต่เมื่อ X เพิ่มขึ้น Y จะลดลง ในที่สุดมันก็ใกล้เคียงกับ 0 ไม่มีความสัมพันธ์ระหว่างสองตัวแปร
ควรสังเกตว่าค่าสัมประสิทธิ์ของการกำหนดเกิดขึ้นพร้อมกับกำลังสองของสัมประสิทธิ์เพียร์สันเฉพาะเมื่อค่าแรกได้รับการคำนวณตามความพอดีเชิงเส้น แต่ความเท่าเทียมกันนี้ใช้ไม่ได้กับความพอดีที่ไม่ใช่เชิงเส้นอื่น ๆ
ตัวอย่าง
- ตัวอย่าง 1
นักเรียนมัธยมปลายกลุ่มหนึ่งเริ่มกำหนดกฎหมายเชิงประจักษ์สำหรับช่วงเวลาของลูกตุ้มตามความยาวของมัน เพื่อให้บรรลุวัตถุประสงค์นี้พวกเขาจะทำการวัดแบบต่างๆซึ่งวัดเวลาของการสั่นของลูกตุ้มสำหรับความยาวที่แตกต่างกันโดยได้รับค่าต่อไปนี้:
| ความยาว (ม.) | ช่วงเวลา |
|---|---|
| 0.1 | 0.6 |
| 0.4 | 1.31 |
| 0.7 | 1.78 |
| หนึ่ง | 1.93 |
| 1.3 | 2.19 |
| 1.6 | 2.66 |
| 1.9 | 2.77 |
| 3 | 3.62 |
ขอให้สร้างพล็อตข้อมูลกระจายและดำเนินการพอดีเชิงเส้นผ่านการถดถอย นอกจากนี้แสดงสมการการถดถอยและสัมประสิทธิ์การกำหนด
สารละลาย

รูปที่ 2. กราฟเฉลยแบบฝึกหัด 1. ที่มา: F. Zapata.
สามารถสังเกตค่าสัมประสิทธิ์การกำหนดได้ค่อนข้างสูง (95%) จึงคิดได้ว่าความพอดีเชิงเส้นเหมาะสมที่สุด อย่างไรก็ตามหากดูจุดร่วมกันดูเหมือนว่าจะมีแนวโน้มที่จะโค้งลง รายละเอียดนี้ไม่ได้พิจารณาในโมเดลเชิงเส้น
- ตัวอย่าง 2
สำหรับข้อมูลเดียวกันในตัวอย่างที่ 1 ให้สร้างแผนภูมิกระจายของข้อมูล ในโอกาสนี้ไม่เหมือนกับตัวอย่างที่ 1 การปรับการถดถอยจะถูกร้องขอโดยใช้ฟังก์ชันที่เป็นไปได้

รูปที่ 3. กราฟเฉลยแบบฝึกหัด 2. ที่มา: F. Zapata.
แสดงฟังก์ชันความพอดีและค่าสัมประสิทธิ์การกำหนด R 2ด้วย
สารละลาย
ฟังก์ชันที่เป็นไปได้อยู่ในรูปแบบ f (x) = Ax Bโดยที่ A และ B เป็นค่าคงที่ที่กำหนดโดยวิธีกำลังสองน้อยที่สุด
รูปก่อนหน้านี้แสดงฟังก์ชันที่เป็นไปได้และพารามิเตอร์ตลอดจนค่าสัมประสิทธิ์การกำหนดที่มีค่าสูงมากถึง 99% สังเกตว่าข้อมูลเป็นไปตามความโค้งของเส้นแนวโน้ม
- ตัวอย่าง 3
การใช้ข้อมูลเดียวกันจากตัวอย่างที่ 1 และตัวอย่างที่ 2 ทำการพอดีกับพหุนามดีกรีที่สอง แสดงกราฟพหุนามพอดีและสัมประสิทธิ์การกำหนดที่สอดคล้องกันR 2
สารละลาย

รูปที่ 4. กราฟเฉลยแบบฝึกหัด 3. ที่มา: F. Zapata.
ด้วยความพอดีของพหุนามดีกรีที่สองคุณจะเห็นเส้นแนวโน้มที่พอดีกับความโค้งของข้อมูล นอกจากนี้ค่าสัมประสิทธิ์การกำหนดยังอยู่เหนือความพอดีเชิงเส้นและต่ำกว่าความพอดีที่เป็นไปได้
เปรียบเทียบพอดี
จากสามความพอดีที่แสดงสิ่งที่มีค่าสัมประสิทธิ์การกำหนดสูงสุดคือความพอดีที่เป็นไปได้ (ตัวอย่างที่ 2)
ความพอดีที่เป็นไปได้เกิดขึ้นพร้อมกับทฤษฎีทางกายภาพของลูกตุ้มซึ่งเป็นที่ทราบกันดีว่าระยะเวลาของลูกตุ้มเป็นสัดส่วนกับรากที่สองของความยาวค่าคงที่ของสัดส่วนคือ2π / √gโดยที่ g คือความเร่งของแรงโน้มถ่วง
ความพอดีประเภทนี้ไม่เพียง แต่มีค่าสัมประสิทธิ์การกำหนดสูงสุด แต่เลขชี้กำลังและค่าคงที่ของสัดส่วนตรงกับแบบจำลองทางกายภาพ
สรุปผลการวิจัย
- การปรับการถดถอยจะกำหนดพารามิเตอร์ของฟังก์ชันที่มีจุดมุ่งหมายเพื่ออธิบายข้อมูลโดยใช้วิธีกำลังสองน้อยที่สุด วิธีนี้ประกอบด้วยการลดผลรวมของความแตกต่างของกำลังสองระหว่างค่า Y การปรับปรุงและค่า Yi ของข้อมูลสำหรับค่า Xi ของข้อมูล สิ่งนี้กำหนดพารามิเตอร์ของฟังก์ชันการปรับแต่ง
- อย่างที่เราเห็นกันแล้วว่าฟังก์ชันการปรับค่าที่พบมากที่สุดคือเส้น แต่ไม่ใช่ฟังก์ชันเดียวเนื่องจากการปรับเปลี่ยนยังสามารถเป็นพหุนามศักยภาพเลขชี้กำลังลอการิทึมและอื่น ๆ
- ไม่ว่าในกรณีใดค่าสัมประสิทธิ์ของการกำหนดจะขึ้นอยู่กับข้อมูลและประเภทของการปรับปรุงและเป็นตัวบ่งชี้ความดีของการปรับปรุงที่ใช้
สุดท้ายค่าสัมประสิทธิ์ของการกำหนดจะระบุเปอร์เซ็นต์ของความแปรปรวนทั้งหมดระหว่างค่า Y ของข้อมูลที่เกี่ยวข้องกับค่าŶของการปรับปรุงสำหรับ X ที่กำหนด
อ้างอิง
- González C. สถิติทั่วไป. กู้คืนจาก: tarwi.lamolina.edu.pe
- IACS สถาบันวิทยาศาสตร์สุขภาพอาราโกเนส สืบค้นจาก: ics-aragon.com
- Salazar C. และ Castillo S. หลักการพื้นฐานของสถิติ (2018) กู้คืนจาก: dspace.uce.edu.ec
- Superprof ค่าสัมประสิทธิ์การกำหนด ดึงมาจาก: superprof.es
- USAC คู่มือสถิติเชิงพรรณนา. (2011) ดึงมาจาก: statistics.ingenieria.usac.edu.gt.
- วิกิพีเดีย ค่าสัมประสิทธิ์การกำหนด สืบค้นจาก: es.wikipedia.com.
