การเปรียบเทียบตัวแบบการถดถอยควอไซปัวซงและตัวแบบการถดถอยทวินามเชิงลบที่มีีศูนย์มากสำหรับข้อมูลนับที่ค่าความแปรปรวนมากกว่าค่าเฉลี่ย

Authors

  • นวพรรณ เชื้ออ่ำ
  • บุญอ้อม โฉมที
  • อภิญญา หิรัญวงษ์

Keywords:

ข้อมูลนับ, ค่าความแปรปรวน, ค่าเฉลี่ย, ตัวแบบการถดถอยควอไซปัวซง, ตัวแบบการถดถอย ทวินามเชิงลบที่มีศูนย์มาก

Abstract

          การวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบความเหมาะสมของตัวแบบการถดถอย 2 ตัวแบบ คือ ตัวแบบการถดถอย ควอไซปัวซง (QP) และตัวแบบการถดถอยทวินามเชิงลบที่มีศูนย์มาก (ZINB) ส าหรับตัวแปรตามที่มีลักษณะเป็นข้อมูลนับและมีค่าความแปรปรวนมากกว่าค่าเฉลี่ย โดยการศึกษากับข้อมูลจริงที่ตัวแปรตาม คือ จำนวนผู้บาดเจ็บในการเกิดอุบัติเหตุแต่ละครั้ง ซึ่งแบ่งตามลักษณะของข้อมูลเป็น 3 กรณี คือ ตัวอย่างขนาดเล็ก (n =17) กลาง (n =32) และใหญ่ (n =56) โดยตัวอย่างขนาดเล็กมีค่าความน่าจะเป็นที่จะเกิดศูนย์ของตัวแปรตามเท่ากับ 0.25 และสำหรับตัวอย่างขนาดกลางและใหญ่มีค่าความน่าจะเป็นที่จะเกิดศูนย์ของตัวแปรตามเท่ากับ 0.50 มีตัวแปรอิสระ 3 ตัวแปร คือ ลักษณะบริเวณที่เกิดอุบัติเหตุ สาเหตุของการเกิดอุบัติเหตุและช่วงเวลาในการเกิดอุบัติเหตุ และข้อมูลจำลองที่ตัวแปรตามมีการแจกแจงทวินามเชิงลบที่มีศูนย์มาก โดยกำหนดค่าพารามิเตอร์การกระจาย (k) เท่ากับ 1.25 1.50 และ 1.75 ค่าความน่าจะเป็นที่จะเกิดศูนย์ (π) เท่ากับ 0.25 และ 0.50 ค่าเฉลี่ย (λ) เท่ากับ 1.4 2 และ 3 และกำหนดให้มีตัวแปรอิสระจำนวน 3 ตัวแปรโดยตัวแปรอิสระมีการแจกแจง แบร์นูลลีที่ความน่าเป็นของการเกิดความสำเร็จ (p) เท่ากับ 0.3 0.5 และ 0.8 ข้อมูลที่ศึกษา คือ ขนาดเล็ก (n = 15, 20) กลาง (n =30, 35) และใหญ่ (n =45, 50) เกณฑ์พิจารณาตัวแบบที่เหมาะสม คือ รากของค่าคลาดเคลื่อนกำลังสองเฉลี่ย (RMSE) และค่าคลาดเคลื่อนสัมบูรณ์เฉลี่ย (AAE) โดยตัวแบบที่ให้ค่า RMSE และค่า AAE ต่ำกว่าแสดงว่าตัวแบบนั้นมีความเหมาะสมมากกว่า ผลการศึกษาพบว่า สำหรับข้อมูลจริงและข้อมูลจำลองที่ศึกษา เมื่อพิจารณาจากค่า RMSE และค่า AAE ตัวแบบการถดถอยควอไซปัวซงมีความเหมาะสมมากกว่าตัวแบบการถดถอยทวินามเชิงลบที่มีศูนย์มากเกือบทุกกรณีที่ศึกษา           In this research study aimed to compare the appropriation of regression models between Quasi-Poisson (QP) and Zero inflated negative binomial (ZINB) which dependent variable was count data and the variance was greater than the mean. The dependent variable for the real data was the number of injured in each accident which there are three cases: small (n =17), medium (n =32) and large (n =56).The probabilities of zero event (π) were 0.25for the small sample size and 0.50for the medium and large sample sizes. In the real data set, there are three independent variables. For the simulation data, the dependent variable had Zero inflated negative binomial distribution. The dispersion parameter of the distribution (k) were 1.25,1.50 and 1.75, the probability of zero events (π) were 0.25 and 0.50 and the mean ( λ ) were 1.4, 2 and 3. For the simulation data set, Three independent variables were determined with bernoulli distribution and the probability of success events (p) were 0.3, 0.5 and 0.8. The sample size of the simulation data (n) were small (n =15, 20), medium (n =30, 35) and large (n =45, 50). The criteria of model appropriation were root mean square error (RMSE) and absolute average error (AAE). The smaller values of RMSE or AAE indicate the better model. For the results based on RMSE and AAE, it is found that the Quasi-Poisson regression model was more appropriate than Zero inflated negative binomial regression model at almost case of study for both the real and simulation data.

Downloads