การเปรียบเทียบประสิทธิภาพวิธีการประมาณค่าสัมประสิทธิ์การถดถอย สำหรับตัวแบบการถดถอยเชิงเส้นพหุคูณ เมื่อข้อมูลมีค่านอกเกณฑ์ในตัวแปรตาม

Authors

  • กฤตพร ธิตะจารี
  • จุฑาภรณ์ สินสมบูรณ์ทอง
  • ธิดาพร ศุภภากร

Keywords:

การถดถอยเชิงเส้นพหุคูณ, ค่านอกเกณฑ์, สัมประสิทธิ์การถดถอย, วิธีกำลังสองน้อยที่สุด, ความคลาดเคลื่อนกำลังสองเฉลี่ย

Abstract

          การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบประสิทธิภาพวิธีการประมาณค่าสัมประสิทธิ์การถดถอย สำหรับตัวแบบการถดถอยเชิงเส้นพหุคูณ เมื่อข้อมูลมีค่านอกเกณฑ์ระดับไม่รุนแรงในตัวแปรตาม โดยศึกษาวิธีการประมาณ 5 วิธี คือวิธีกำลังสองน้อยที่สุด วิธี LTS วิธี M เมื่อใช้ฟังก์ชันถ่วงน้ำหนักของ Andrews และ Welsch และ วิธี GM โดยใช้ฟังก์ชันถ่วงน้ำหนักของ Huber ทั้งนี้เกณฑ์ในการเปรียบเทียบประสิทธิภาพ คือ ค่าประมาณความคลาดเคลื่อนกำลังสองเฉลี่ย (EMSE) ข้อมูลที่ใช้ในการวิจัยได้จากการจำลองด้วยเทคนิคมอนติคาร์โล จำนวน 78 สถานการณ์ ทำซ้ำ 1,000 ครั้ง ในแต่ละสถานการณ์ผลการวิจัยสรุปได้ดังนี้ กรณีที่ไม่เกิดค่านอกเกณฑ์ในตัวแปรตาม พบว่าวิธีกำลังสองน้อยที่สุดมีประสิทธิภาพสูงที่สุด กรณีเกิดค่านอกเกณฑ์ในตัวแปรตามเมื่อความคลาดเคลื่อนสุ่มมีการแจกแจงปรกติ สำหรับขนาดตัวอย่างเท่ากับ 10, 20 และ 30 ส่วนใหญ่วิธี M โดยใช้ฟังก์ชันถ่วงน้ำหนัก Welsch มีประสิทธิภาพสูงที่สุด และสำหรับขนาดตัวอย่างเท่ากับ 50, 100 และ 150 วิธี M โดยใช้ฟังก์ชันถ่วงน้ำหนัก Andrews มีประสิทธิภาพสูงที่สุด อย่างไรก็ตามเมื่อความคลาดเคลื่อนสุ่มมีการแจกแจงแบบที ที่องศาเสรีเท่ากับ 1 วิธี GM ให้ประสิทธิภาพสูงที่สุดในทุกขนาดตัวอย่าง และเมื่อองศาเสรีเพิ่มสูงขึ้น พบว่า วิธี M โดยใช้ฟังก์ชันถ่วงน้ำหนักของ Welsch มีแนวโน้มให้ประสิทธิภาพสูงที่สุด เมื่อขนาดตัวอย่างไม่เกิน 30 แต่เมื่อขนาดตัวอย่างมากกว่า 30 ส่วนใหญ่พบว่าวิธี M โดยใช้ฟังก์ชันถ่วงน้ำหนักของ Andrews มีแนวโน้มให้ประสิทธิภาพสูงที่สุด           The purpose of this research was to compare the efficiency of five regression coefficient estimation methods for multiple linear regression model when data containing mild outliers in dependent variable. The five methods composed of ordinary least squares method, least trimmed squares method, M method using Andrews and Welsch weight functions and GM method using Huber weight function. The criterion for efficiency comparison was estimated mean square error (EMSE). The data was generated by Monte Carlo simulation technique for 78 situations and repeated 1,000 times for each situation. The results of this research were as follow: in case of no outliers in dependent variable, ordinary least squares method was the most efficient method. In case of outliers in dependent variable and random error was normally distributed, when sample size was10, 20 and 30, M method using Welsch weight function provided the most efficient estimator. In addition, when sample size was 50, 100 and 150, M method using Andrews weight function provided the most efficient estimator. However, when random error was t-distributed with 1 degree of freedom, GM tended to be the most efficient estimator for all situations. Moreover, when degree of freedom increased and sample size was not greater than 30, M method using Welsch weight function was likely to be the most efficient estimator. However, when sample size was greater than 30, M method using Andrews weight function tended to be the most efficient estimator.

Downloads