- วิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์?
- ความแปรปรวนร่วมและความแปรปรวน
- กรณีตัวอย่าง
- ความแปรปรวนร่วม Sxy
- ค่าเบี่ยงเบนมาตรฐาน Sx
- ค่าเบี่ยงเบนมาตรฐาน Sy
- ค่าสัมประสิทธิ์สหสัมพันธ์ r
- การตีความ
- การถดถอยเชิงเส้น
- ตัวอย่าง
- อ้างอิง
ค่าสัมประสิทธิ์สหสัมพันธ์ในสถิติเป็นตัวบ่งชี้ว่ามาตรการแนวโน้มของสองตัวแปรเชิงปริมาณ X และ Y ที่จะมีเส้นหรือสัดส่วนความสัมพันธ์ระหว่างพวกเขา
โดยทั่วไปคู่ของตัวแปร X และ Y เป็นสองลักษณะของประชากรเดียวกัน ตัวอย่างเช่น X อาจเป็นส่วนสูงของบุคคลและ Y น้ำหนักของเขา
รูปที่ 1. ค่าสัมประสิทธิ์สหสัมพันธ์สำหรับคู่ข้อมูลสี่คู่ (X, Y) ที่มา: F. Zapata
ในกรณีนี้ค่าสัมประสิทธิ์สหสัมพันธ์จะบ่งชี้ว่ามีแนวโน้มต่อความสัมพันธ์ตามสัดส่วนระหว่างความสูงและน้ำหนักในประชากรที่ระบุหรือไม่
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นของเพียร์สันแสดงด้วยอักษรตัวพิมพ์เล็ก r และค่าต่ำสุดและสูงสุดคือ -1 และ +1 ตามลำดับ
ค่า r = +1 จะบ่งชี้ว่าชุดของคู่ (X, Y) อยู่ในแนวเดียวกันและเมื่อ X เติบโตขึ้น Y จะเพิ่มขึ้นในสัดส่วนเดียวกัน ในทางกลับกันถ้ามันเกิดขึ้นที่ r = -1 เซตของคู่ก็จะเรียงกันอย่างสมบูรณ์แบบเช่นกัน แต่ในกรณีนี้เมื่อ X เพิ่มขึ้น Y จะลดลงในสัดส่วนเดียวกัน
รูปที่ 2. ค่าต่าง ๆ ของค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้น ที่มา: Wikimedia Commons
ในทางกลับกันค่า r = 0 จะบ่งชี้ว่าไม่มีความสัมพันธ์เชิงเส้นระหว่างตัวแปร X และ Y ในขณะที่ค่า r = +0.8 จะบ่งชี้ว่าคู่ (X, Y) มีแนวโน้มที่จะรวมกลุ่มกันในด้านหนึ่งและ อีกบรรทัดหนึ่ง
สูตรคำนวณค่าสัมประสิทธิ์สหสัมพันธ์ r มีดังนี้:
วิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์?
ค่าสัมประสิทธิ์สหสัมพันธ์เชิงเส้นคือปริมาณทางสถิติที่สร้างขึ้นในเครื่องคำนวณทางวิทยาศาสตร์สเปรดชีตส่วนใหญ่และโปรแกรมทางสถิติ
อย่างไรก็ตามมันสะดวกที่จะทราบว่าสูตรที่กำหนดมันถูกนำไปใช้อย่างไรและสำหรับสิ่งนี้จะแสดงการคำนวณโดยละเอียดโดยดำเนินการกับชุดข้อมูลขนาดเล็ก
และตามที่ระบุไว้ในส่วนก่อนหน้าค่าสัมประสิทธิ์สหสัมพันธ์คือความแปรปรวนร่วม Sxy หารด้วยผลคูณของค่าเบี่ยงเบนมาตรฐาน Sx สำหรับตัวแปร X และ Sy สำหรับตัวแปร Y
ความแปรปรวนร่วมและความแปรปรวน
ความแปรปรวนร่วม Sxy คือ:
Sxy = / (N-1)
โดยที่ผลรวมจะไปจาก 1 ถึง N คู่ของข้อมูล (Xi, Yi)
ในส่วนนี้ค่าเบี่ยงเบนมาตรฐานสำหรับตัวแปร X คือรากที่สองของความแปรปรวนของชุดข้อมูล Xi โดยมี i ตั้งแต่ 1 ถึง N:
Sx = √
ในทำนองเดียวกันค่าเบี่ยงเบนมาตรฐานสำหรับตัวแปร Y คือรากที่สองของความแปรปรวนของชุดข้อมูล Yi โดยมี i ตั้งแต่ 1 ถึง N:
ไซ = √
กรณีตัวอย่าง
เพื่อแสดงรายละเอียดวิธีการคำนวณค่าสัมประสิทธิ์สหสัมพันธ์เราจะใช้ชุดข้อมูลสี่คู่ต่อไปนี้
(X, Y): {(1, 1); (2. 3); (3, 6) และ (4, 7)}
อันดับแรกเราคำนวณค่าเฉลี่ยเลขคณิตสำหรับ X และ Y ดังนี้:
จากนั้นจะคำนวณพารามิเตอร์ที่เหลือ:
ความแปรปรวนร่วม Sxy
Sxy = / (4-1)
Sxy = / (3) = 10.5 / 3 = 3.5
ค่าเบี่ยงเบนมาตรฐาน Sx
Sx = √ = √ = 1.29
ค่าเบี่ยงเบนมาตรฐาน Sy
Sx = √ =
√ = 2.75
ค่าสัมประสิทธิ์สหสัมพันธ์ r
r = 3.5 / (1.29 * 2.75) = 0.98
การตีความ
ในชุดข้อมูลของกรณีก่อนหน้าจะสังเกตเห็นความสัมพันธ์เชิงเส้นที่แข็งแกร่งระหว่างตัวแปร X และ Y ซึ่งแสดงให้เห็นทั้งในรูปแบบการกระจาย (แสดงในรูปที่ 1) และในค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งให้ผล a ค่าค่อนข้างใกล้เคียงกับความสามัคคี
ในขอบเขตที่ค่าสัมประสิทธิ์สหสัมพันธ์ใกล้เคียงกับ 1 หรือถึง -1 ยิ่งมีความหมายมากขึ้นในการปรับข้อมูลให้พอดีกับเส้นซึ่งเป็นผลมาจากการถดถอยเชิงเส้น
การถดถอยเชิงเส้น
เส้นถดถอยเชิงเส้นหาได้จากวิธีกำลังสองน้อยที่สุด ซึ่งพารามิเตอร์ของเส้นการถดถอยได้มาจากการย่อขนาดของผลรวมของกำลังสองของความแตกต่างระหว่างค่า Y โดยประมาณกับข้อมูล Yi ของ N
ในทางกลับกันพารามิเตอร์ a และ b ของเส้นการถดถอย y = a + bx ซึ่งหาได้จากวิธีกำลังสองน้อยที่สุดคือ:
* b = Sxy / (Sx 2 ) สำหรับความชัน
* a =
โปรดจำไว้ว่า Sxy คือความแปรปรวนร่วมที่กำหนดไว้ข้างต้นและ Sx 2คือความแปรปรวนหรือกำลังสองของส่วนเบี่ยงเบนมาตรฐานที่กำหนดไว้ข้างต้น
ตัวอย่าง
ค่าสัมประสิทธิ์สหสัมพันธ์ใช้เพื่อพิจารณาว่ามีความสัมพันธ์เชิงเส้นระหว่างสองตัวแปรหรือไม่ สามารถใช้ได้เมื่อตัวแปรที่จะศึกษาเป็นเชิงปริมาณและยิ่งไปกว่านั้นถือว่าเป็นไปตามการแจกแจงแบบปกติ
เรามีตัวอย่างประกอบด้านล่าง: การวัดระดับความอ้วนคือดัชนีมวลกายซึ่งได้จากการหารน้ำหนักของคนเป็นกิโลกรัมด้วยความสูงกำลังสองของบุคคลในหน่วยเมตรกำลังสอง
คุณต้องการทราบว่าความสัมพันธ์ระหว่างดัชนีมวลกายกับความเข้มข้นของ HDL คอเลสเตอรอลในเลือดมีหน่วยเป็นมิลลิโมลต่อลิตรหรือไม่ เพื่อจุดประสงค์นี้การศึกษาได้ดำเนินการกับคน 533 คนซึ่งสรุปได้ในกราฟต่อไปนี้ซึ่งแต่ละจุดแสดงถึงข้อมูลของบุคคลหนึ่งคน
รูปที่ 3 การศึกษาค่า BMI และ HDL cholesterol ในผู้ป่วย 533 ราย ที่มา: สถาบันวิทยาศาสตร์สุขภาพ Aragonese (IACS)
การสังเกตกราฟอย่างรอบคอบแสดงให้เห็นว่ามีแนวโน้มเชิงเส้นบางอย่าง (ไม่ได้ทำเครื่องหมายมาก) ระหว่างความเข้มข้นของ HDL คอเลสเตอรอลและดัชนีมวลกาย การวัดเชิงปริมาณของแนวโน้มนี้คือค่าสัมประสิทธิ์สหสัมพันธ์ซึ่งในกรณีนี้กลายเป็น r = -0.276
อ้างอิง
- González C. สถิติทั่วไป. กู้คืนจาก: tarwi.lamolina.edu.pe
- IACS สถาบันวิทยาศาสตร์สุขภาพอาราโกเนส สืบค้นจาก: ics-aragon.com
- Salazar C. และ Castillo S. หลักการพื้นฐานของสถิติ (2018) กู้คืนจาก: dspace.uce.edu.ec
- Superprof ค่าสัมประสิทธิ์สหสัมพันธ์ ดึงมาจาก: superprof.es
- USAC คู่มือสถิติเชิงพรรณนา. (2011) ดึงมาจาก: statistics.ingenieria.usac.edu.gt
- วิกิพีเดีย ค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สัน สืบค้นจาก: es.wikipedia.com.