การเปรียบเทียบตัวแบบลอจิตและการใช้ ROC Curve ในการวิเคราะห์ปัจจัยที่ส่งผลต่อระดับค่าจ้าง

Authors

  • กันยาพร หาญกล้า
  • วีรานันท์ พงศาภักดี

Keywords:

ตัวแบบลอจิตสองกลุ่ม, ROC Curve, ตัวแบบ Proportional odds, ระดับค่าจ้าง, Dichotomous Logit model, Proportional odds model, Wage levels

Abstract

บทคัดย่อ         ความหลากหลายและระดับของค่าจ้างที่ลูกจ้างได้รับนั้น อาจเป็นผลมาจากปัจจัยต่างๆ ที่ส่งผลกระทบต่อระดับค่าจ้าง งานวิจัยนี้ ศึกษาเปรียบเทียบตัวแบบด้วยวิธีการวิเคราะห์ทางสถิติต่างๆ เพื่อหาตัวแบบที่เหมาะสม โดยใช้ตัวอย่างของข้อมูลจริงชุดหนึ่งเกี่ยวกับระดับค่าจ้างและปัจจัยต่างๆ ที่อาจส่งผลต่อระดับค่าจ้าง ด้วยการสร้างตัวแบบลอจิตสองกลุ่ม (Dichotomous logit models) เมื่อตัวแปรตอบสนองมี 2 ระดับ (สูงและต่ำ) และตัวแบบลอจิตสะสม (Cumulative logit models) กรณี Proportional odds models เมื่อตัวแปรตอบสนองมี 3 ระดับ (สูง ปานกลาง และต่ำ) โดยตัวแปรอธิบายหรือปัจจัยที่เกี่ยวข้องต่างๆ ของลูกจ้าง เช่น การศึกษา อาชีพ ประสบการณ์การทํางาน การเปรียบเทียบตัวแบบพิจารณาจาก ตัวสถิติวาลด์ (Wald), AIC (Akaike’s Information Criterion), SC (Schwarz Criterion), อัตราส่วนภาวะน่าจะเป็น (G2, -2logL) และการตรวจสอบการพยากรณ์ของตัวแบบให้ถูกต้องด้วยเส้นโค้งROC (Receiver Operating Characteristic) ข้อมูลจริงจากเว็บไซด์ http://lib.stat.cmu.edu เป็นตัวแทนจากการสํารวจตัวอย่าง ลูกจ้าง จํานวน 534 คน ผลการวิจัยพบว่า ปัจจัยที่ส่งผลต่อระดับค่าจ้างมี 6 ปัจจัย คือ การศึกษา ประสบการณ์การทํางานอาชีพ แผนก เพศ และ การเข้าร่วมเป็นสหภาพแรงงาน อย่างมีนัยสําคัญทางสถิติที่ 0.05 โดยตัวแบบที่เหมาะสมกับข้อมูลมากกว่าคือ ตัวแบบลอจิตสองกลุ่ม ซึ่งให้ค่าสถิติ AIC, SC และอัตราส่วนภาวะน่าจะเป็นที่ดีกว่าตัวแบบอื่นที่ใช้ และมีร้อยละการจําแนกกลุ่มได้ถูกต้องในภาพรวมร้อยละ 73.6 ภายใต้ ROC Curve ซึ่งแสดงความไวได้ค่อนข้างสูง รวมทั้งการตรวจสอบส่วนเหลือพบว่า ตัวแบบลอจิตสองกลุ่มให้ค่า ส่วนเหลือที่มีการ กระจายตัวได้ดีกว่า ดังนั้นตัวแบบจึงมีประโยชน์และอาจนําไปพยากรณ์ระดับค่าจ้างและตรวจสอบปัจจัยที่ส่งผลกระทบต่อระดับค่าจ้างต่อไป ABSTRACT          Different employee wages’ levels are probably associated to various factors. This research aims to compare two logit models that are demonstrated through the analysis of factors affecting wage levels under several goodness-of-fitstatistics such that Wald, AIC (Akaike’s Information Criterion), SC (Schwarz Criterion), likelihood ratio statistics (G2, -2logL) and that the use of ROC (Receiver OperatingCharacteristic) curve. The analysis models are the logit model for dichotomous response categories: high and low wages and the proportional odds model for ordinal trichotomous response categories: high, medium and low wages. All real data are from website http://lib.stat.cmu.edu. These data consist of a random sample of 534 persons. The response variable is wage and the explanatory variables include several characteristics of the workers. The research results show that the effective factors at the 0.05 level ofsignificance are the number of years of education, work experience, occupational status, sex and region of residence, sector, and union membership. The dichotomous logit model gives better fitss due to AIC, SC and Likelihood ratio estimates compared to those of proportional odds model. In conclusion, the dichotomous logit model has an adequate of fit with the overall percent correct classification of 73.6%, or a high sensitivity under the ROC curve. Moreover, the residual plots of the dichotomous logit model are more spread out than others. Therefore, it may be a very helpful tool to predict the employee wages levels and that to assess the essential factors affecting the wages levels.

Downloads