การเปรียบเทียบการทดสอบและวิธีการแก้ปัญหาความแปรปรวนไม่คงที่ของความคลาดเคลื่อนในการถดถอยเชิงเส้นอย่างง่าย
The Comparison of Tests and Corrections for Heteroscedasticity Problem in Simple Linear Regression
Keywords:
ความแปรปรวนไม่คงที่, ความคลาดเคลื่อน , การทดสอบขงโกลด์เฟลด์-ควอนท์ , การทดสอบของธิล , ถ่วงน้ำหนักAbstract
งานวิจัยนี้เป็นการเปรียบเทียบค่าประมาณอำนาจการทดสอบความแปรปรวนไม่คงที่ของความคลาดเคลื่อนระหว่างการทดสอบของโกลด์เฟลด์-ควอนท์ (Goldfeld-Quandt Test) กับการทดสอบของธิล (Theil’ F Test) และเปรียบเทียบวิธีการแก้ปัญหาความแปรปรวนไม่คงที่ของความคลาดเคลื่อน โดยใช้วิธีกำลังสองน้อยที่สุดถ่วงน้ำหนักเมื่อทราบค่าน้ำหนัก และไม่ทราบค่าน้ำหนักโดยการประมาณค่าน้ำหนักจากข้อมูลที่แบ่งออกเป็น 2, 3 และ 5 กลุ่ม เกณฑ์ที่ใช้ในการเปรียบเทียบวิธีการแก้ปัญหา คือ ค่าร้อยละการยอมรับสมมุติฐานว่างหลังการแก้ปัญหา การศึกษาใช้วิธีการสร้างแบบจำลองในตัวแบบถดถอยเชิงเส้นอย่างง่าย กรณีข้อมูลภาคตัดขวาง เมื่อความแปรปรวนของความคลาดเคลื่อนมีลักษณะไม่คงที่ตามค่าของตัวแปรอิสระในรูปแบบ Var( ɛi) = XiȢ ; Ȣ = -4.0, -3.6, …, 0.0, 0.4, 0.8, …, 4.0 ขนาดตัวอย่าง 10, 15, 30, 60 และ 120 โดยทำการทดสอบที่ระดับนัยสำคัญ 0.01 และ 0.05 ซึ่งจะกระทำซ้ำ 1,000 ครั้ง ในแต่ละสถานการณ์ การเปรียบเทียบค่าประมาณอำนาจการทดสอบความแปรปรวนไม่คงที่ของความคลาดเคลื่อน พบว่า การทดสอบของโกลด์เฟลด์-ควอนท์ ให้ค่าประมาณอำนาจการทดสอบสูงกว่าของธิลเกือบทุกกรณี ยกเว้นกรณีที่ค่าตัวแปรอิสระและรูปแบบความแปรปรวนของความคลาดเคลื่อนเพิ่มขึ้น เมื่อตัวอย่างมีขนาดเล็ก (n = 10) และกรณีที่รูปแบบความแปรปรวนของความคลาดเคลื่อนลดลง ค่าตัวแปรอิสระเพิ่มขึ้นเมื่อตัวอย่างมีขนาด 10 และ 15 การทดสอบของธิลจะดีกว่าการทดสอบของโกลด์เฟลด์-ควอนท์ ในทุกระดับความแปรปรวนของความคลาดเคลื่อนและระดับนัยสำคัญ โดยการทดสอบทั้ง 2 จะมีค่าประมาณอำนาจการทดสอบสูงใกล้เคียงกันเมื่อตัวอย่างมีขนาดใหญ่ (n = 60, 120) และความแปรปรนของความคลาดเคลื่นอยู่ในระดับสูง (2.8 < IȢI ≤ 4.0) การเปรียบเทียบวิธีการแก้ปัญหาความแปรปรวนไม่คงที่ของความคลาดเคลื่อน สรุปได้ว่า ทุกระดับความแปรปรวนของความคลาดเคลื่อน วิธีกำลังสองน้อยที่สุดถ่วงน้ำหนักเมื่อไม่ทราบค่าน้ำหนักโดยการประมาณค่าน้ำหนักจากข้อมูลที่แบ่งออกเป็น 3 และ 5 กลุ่ม สามารถแก้ปัญหาได้ดี ทั้งนี้วิธีกำลังสองน้อยที่สุดถ่วงน้ำหนักเมื่อทราบค่าน้ำหนักและไม่ทราบค่าน้ำหนัก สามารถแก้ปัญหาได้ดีใกล้เคียงกัน ในกรณีค่าของตัวแปรอิสระและรูปแบบความแปรปรวนของความคลาดเคลื่นเพิ่มขึ้นอยู่ในระดับปานกลางถึงสูง (1.6 < IȢI ≤ 4.0) เมื่อตัวอย่างมีขนาดเล็กถึงปานกลาง (n = 10, 15, 30) และในทุกระดับความแปรปรวนของความคลาดเคลื่อน เมื่อตัวอย่างมีขนาดใหญ่ This research focuses on comparing the approximate power of heteroscedasticity tests between Goldfeld-Quandt test and Theil’F test and the heteroscedasticity corrections by using the method of weighted least squares with the known weights and the unknown weights. However, the unknown weights could be estimated by dividing the data into 2, 3 and 5 groups. The comparison criterion of the correction effectiveness is defined as the percentage of the accepted null hypothesis after correction. Moreover, the simple linear regression model in case of cross sectional data is used in this research when the variance of error varies with the independent variable as Var( ɛi) = XiȢ ; Ȣ = -4.0, -3.6, …, 0.0, 0.4, 0.8, …, 4.0. The samples at size 10, 15, 30, 60 and 120 are repeated 1,000 times for each case. The tests are conducted at the significant level of 0.01 and 0.05. The comparison of the approximate power of heteroscedasticity tests finds that the Goldfeld-Quandt test gives higher approximate power of the test than Theil’F test at all simulation conditions of error variance and significance except in the case of the small sample size (n = 10) when the variance error increases as a function of independent variable, and in case of the sample size equal to 10 and 15 when the variance error decreases as a function of independent variable. Moreover, both tests tend to give the similar high approximate power of the test in the case of large sample size (n = 60, 120) and large error variance (2.8 < IȢI ≤ 4.0). The comparison of the heteroscedasticity corrections reveals that at all above mentioned levels of error variance, the method of weighted least squares with the unknown weights, estimating from the data that are divided into 3 and 5 groups outperforms the other methods that mentioned above. Moreover, it is found that when the variance of error increases as a function of independent variable. The method of weighted least squares with the known weights and the unknown weights give the same correction effectiveness and the same conclusion can be made for the case that the small and medium sample size (n = 10, 15, 30) with the error variance is between medium and large (1.6 < < and for the large sample size with all of the error variance.References
Goldfeld, S.M. & Quandt, R.E. (1965). Some Tests for Homoscedasticity. Journal of The American Statistical Association, 60(310), 539-547.
Griffiths, W.E., Hill, C.R., Judge, G.G., Lee T., & Lutkepohl, H. (1985). The Theory and Practice of Econometrics. 2nd ed. New York: Wiley.
Gujarati, D.N. (2006). Essentials of Econometrics. 3rd ed. Boston.Mass: Mcgraw-Hill/Irwin.
Koerts, J. (1967). Some Further Notes on Disturbance Estimates in Regression Analysis. Journal of The American Statistical Association, 62(317), 169-183.
Magnus, J.R. and Sinha, A.K. (2005). On Theil’s Errors. Econometrics Journal, 8, 39-54.
Ramanathan, R. (2008). Introductory Econometrics with Applications. 5th ed. Fort Worth: Harcourt College Publishers.
Theil, H. (1965). The Analysis of Disturbance in Regression Analysis. Journal of The American Statistical Association, 60(312), 1067-1079.
Theil, H. (1968). A Simplification of the Blus Procedure for Analyzing Regression Disturbances. Journal of The American Statistical Association, 63 (321), 242-251.
Theil, H. (1971). Principles of Econometrics. Amsterdam: North-Holland.