Multicollinearity คือ ปัญหาที่เกิดขึ้นเมื่อตัวแปรอิสระใน การวิเคราะห์แบบจำลองการถดถอย มีความสัมพันธ์กันสูง ส่งผลต่อประสิทธิภาพและความน่าเชื่อถือของผลลัพธ์
บทความนี้ มุ่งเน้นไปที่การอธิบายวิธีการตรวจสอบปัญหา Multicollinearity ดังนี้
1. ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient)
- ตรวจสอบค่าสัมประสิทธิ์สหสัมพันธ์ (Pearson correlation coefficient) ระหว่างตัวแปรอิสระแต่ละคู่
- ค่าสัมประสิทธิ์สหสัมพันธ์ที่มีค่าใกล้เคียง 1 หรือ -1 บ่งบอกถึงความสัมพันธ์เชิงเส้นที่สูง
2. ค่า Tolerance และ Variance Inflation Factor (VIF)
- ค่า Tolerance: ค่าที่แสดงสัดส่วนของความแปรปรวนของตัวแปรอิสระที่ไม่สามารถอธิบายได้จากตัวแปรอิสระอื่น ๆ
- ค่า VIF: ค่าที่แสดงถึงความแปรปรวนของตัวแปรอิสระที่อธิบายได้จากตัวแปรอิสระอื่น ๆ
- ค่า Tolerance ที่ต่ำ (น้อยกว่า 0.1) หรือค่า VIF ที่สูง (มากกว่า 10) บ่งบอกถึงปัญหา Multicollinearity
3. การวิเคราะห์ค่า Eigenvalues
- การวิเคราะห์ค่า Eigenvalues ของเมทริกซ์ความสัมพันธ์ระหว่างตัวแปรอิสระ
- ค่า Eigenvalues ที่ใกล้เคียง 0 บ่งบอกถึงปัญหา Multicollinearity
4. การวิเคราะห์ค่า Condition Number
- ค่า Condition Number: ค่าที่แสดงถึงความไวของค่าประมาณค่าสัมประสิทธิ์การถดถอยต่อการเปลี่ยนแปลงของข้อมูล
- ค่า Condition Number ที่สูง บ่งบอกถึงปัญหา Multicollinearity
5. การวิเคราะห์ภาพประกอบ
- การใช้แผนภาพกระจาย (scatter plot) เพื่อตรวจสอบความสัมพันธ์เชิงเส้นระหว่างตัวแปรอิสระ
แนวทางแก้ไข
- การตัดตัวแปรที่มีความสัมพันธ์สูงออกจากโมเดล
- การรวมตัวแปรใหม่เป็นตัวแปรเดียว
- การแปลงตัวแปร