การทดสอบ Regression เป็นเครื่องมือทางสถิติที่ใช้ในการวิเคราะห์ความสัมพันธ์ระหว่างตัวแปรสองตัวหรือมากกว่า โดยตัวแปรหนึ่ง (ตัวแปรอิสระ) ถูกใช้เพื่ออธิบายหรือทำนายอีกตัวแปรหนึ่ง (ตัวแปรตาม) ผลลัพธ์ของการทดสอบ Regression นั้นประกอบไปด้วยข้อมูลมากมาย บทความนี้จะอธิบายวิธีการตีความผลลัพธ์เหล่านี้
1. ค่า R-squared
ค่า R-squared (หรือ R^2) แสดงถึงสัดส่วนของความแปรปรวนของตัวแปรตามที่อธิบายได้โดยตัวแปรอิสระ ค่า R-squared อยู่ระหว่าง 0 ถึง 1 โดยค่า 0 หมายความว่าตัวแปรอิสระไม่มีความสัมพันธ์กับตัวแปรตาม และค่า 1 หมายความว่าตัวแปรอิสระอธิบายความแปรปรวนของตัวแปรตามได้ทั้งหมด
ตัวอย่าง: ค่า R-squared ของ 0.5 หมายความว่าตัวแปรอิสระอธิบายความแปรปรวนของตัวแปรตามได้ 50%
2. ค่าสัมประสิทธิ์การถดถอย (β)
ค่าสัมประสิทธิ์การถดถอย (β) แสดงถึงความสัมพันธ์ระหว่างตัวแปรอิสระหนึ่งตัวกับตัวแปรตาม ค่า β บวก หมายความว่าเมื่อตัวแปรอิสระเพิ่มขึ้นหนึ่งหน่วย ตัวแปรตามจะเพิ่มขึ้น β หน่วย ค่า β ลบ หมายความว่าเมื่อตัวแปรอิสระเพิ่มขึ้นหนึ่งหน่วย ตัวแปรตามจะลดลง β หน่วย
ตัวอย่าง: ค่า β ของ 0.2 หมายความว่าเมื่อตัวแปรอิสระเพิ่มขึ้นหนึ่งหน่วย ตัวแปรตามจะเพิ่มขึ้น 0.2 หน่วย
3. ค่า p-value
ค่า p-value เป็นค่าความน่าจะเป็นที่เราจะพบค่าสัมประสิทธิ์การถดถอยที่มากกว่าหรือเท่ากับค่าที่สังเกตได้ โดยบังเอิญ
- ค่า p-value น้อยกว่า 0.05 หมายความว่ามีความสัมพันธ์ทางสถิติที่สำคัญระหว่างตัวแปรอิสระและตัวแปรตาม
- ค่า p-value มากกว่า 0.05 หมายความว่าไม่มีความสัมพันธ์ทางสถิติที่สำคัญระหว่างตัวแปรอิสระและตัวแปรตาม
ตัวอย่าง: ค่า p-value ของ 0.01 หมายความว่ามีเพียง 1% โอกาสที่เราจะพบค่าสัมประสิทธิ์การถดถอยที่มากกว่าหรือเท่ากับค่าที่สังเกตได้ โดยบังเอิญ
4. กราฟ Residuals
กราฟ Residuals แสดงถึงความแตกต่างระหว่างค่าจริงของตัวแปรตามกับค่าที่คาดการณ์โดยตัวแบบการถดถอย กราฟนี้ควรมีรูปแบบสุ่ม
- หากกราฟมีรูปแบบที่ไม่สุ่ม อาจหมายความว่าตัวแบบการถดถอยไม่เหมาะสม
ตัวอย่าง: กราฟ Residuals ที่มีรูปแบบคลื่น อาจหมายความว่ามีความสัมพันธ์แบบ Non-linear ระหว่างตัวแปรอิสระและตัวแปรตาม
5. การทดสอบ Assumptions
การทดสอบ Assumptions เป็นการตรวจสอบว่าข้อมูลของเรานั้นเป็นไปตามสมมติฐานของการทดสอบ Regression หรือไม่
- การทดสอบ Assumptions ที่พบบ่อย ได้แก่ การทดสอบ normality ของ residuals การทดสอบ homoscedasticity ของ residuals และการทดสอบ multicollinearity ของตัวแปรอิสระ
ตัวอย่าง: หาก residuals ไม่เป็นไปตาม normality เราอาจต้องใช้ตัวแปลงข้อมูล หรือใช้โมเดลการถดถอยที่ไม่ parametric
สรุป
การตีความผลลัพธ์ของการทดสอบ Regression นั้นต้องพิจารณาองค์ประกอบหลายอย่าง
- ค่า R-squared
- ค่าสัมประสิทธิ์การถดถอย (β)
- ค่า p-value
- กราฟ Residuals
- การทดสอบ Assumptions