การตรวจสอบปัญหา Multicollinearity

Multicollinearity คือ ปัญหาที่เกิดขึ้นเมื่อตัวแปรอิสระใน การวิเคราะห์แบบจำลองการถดถอย มีความสัมพันธ์กันสูง ส่งผลต่อประสิทธิภาพและความน่าเชื่อถือของผลลัพธ์

บทความนี้ มุ่งเน้นไปที่การอธิบายวิธีการตรวจสอบปัญหา Multicollinearity ดังนี้

1. ค่าสัมประสิทธิ์สหสัมพันธ์ (Correlation Coefficient)

  • ตรวจสอบค่าสัมประสิทธิ์สหสัมพันธ์ (Pearson correlation coefficient) ระหว่างตัวแปรอิสระแต่ละคู่
  • ค่าสัมประสิทธิ์สหสัมพันธ์ที่มีค่าใกล้เคียง 1 หรือ -1 บ่งบอกถึงความสัมพันธ์เชิงเส้นที่สูง

2. ค่า Tolerance และ Variance Inflation Factor (VIF)

  • ค่า Tolerance: ค่าที่แสดงสัดส่วนของความแปรปรวนของตัวแปรอิสระที่ไม่สามารถอธิบายได้จากตัวแปรอิสระอื่น ๆ
  • ค่า VIF: ค่าที่แสดงถึงความแปรปรวนของตัวแปรอิสระที่อธิบายได้จากตัวแปรอิสระอื่น ๆ
  • ค่า Tolerance ที่ต่ำ (น้อยกว่า 0.1) หรือค่า VIF ที่สูง (มากกว่า 10) บ่งบอกถึงปัญหา Multicollinearity

3. การวิเคราะห์ค่า Eigenvalues

  • การวิเคราะห์ค่า Eigenvalues ของเมทริกซ์ความสัมพันธ์ระหว่างตัวแปรอิสระ
  • ค่า Eigenvalues ที่ใกล้เคียง 0 บ่งบอกถึงปัญหา Multicollinearity

4. การวิเคราะห์ค่า Condition Number

  • ค่า Condition Number: ค่าที่แสดงถึงความไวของค่าประมาณค่าสัมประสิทธิ์การถดถอยต่อการเปลี่ยนแปลงของข้อมูล
  • ค่า Condition Number ที่สูง บ่งบอกถึงปัญหา Multicollinearity

5. การวิเคราะห์ภาพประกอบ

  • การใช้แผนภาพกระจาย (scatter plot) เพื่อตรวจสอบความสัมพันธ์เชิงเส้นระหว่างตัวแปรอิสระ

แนวทางแก้ไข

  • การตัดตัวแปรที่มีความสัมพันธ์สูงออกจากโมเดล
  • การรวมตัวแปรใหม่เป็นตัวแปรเดียว
  • การแปลงตัวแปร