ตัวแบบโพลิโคโทมัสโลจิทสำหรับตัวแปรตอบสนองเชิงกลุ่มแบบมีลำดับ : การวิเคราะห์ความไว
Polychotomous logit models with Ordinal Categorical Responses: A Sensitivity Analysis
Keywords:
สถิติ, ตัวแบบโพลิโคโทมัสโลจิท, ตัวแปรตอบสนองเชิงกลุ่มแบบมีลำดับ, การวิเคราะห์ความไว, Polychotomous logit models, Sensitivity, Deviances, Bayesian’s Information CriteriaAbstract
ในการตรวจสอบตัวแบบโพลิโคโทมัสโลจิทที่มีอิทธิพลร่วมของตัวแปรอธิบายสองตัวแปร อาศัยตัวสถิติผลรวมของการพยากรณ์ กลุ่มทุกกลุ่มได้ถูกต้อง (Sensitivity) และตัวสถิติภาวะสารูปดี เมื่อตัวแปรตอบสนองเชิงกลุ่ม Y เป็นแบบมีลำดับ 3 กลุ่มและตัวแปรอธิบาย (X1, X2) เป็นแบบแบ่งกลุ่ม ประกอบด้วยตัวสถิติ Likelihood Ratio statistic (GM)), Generalized Coefficients of Determination (R2 analogs), Bayesian’s Information Criteria (BIC), Akaike Information Criteria (AIC) ศึกษาภายใต้การแจกแจงของตัวแปรอธิบาย 3 แบบคือ (X1, X2) ~ multinomial (π1, π2, π3, π4) : (0.10, 0.35, 0.45, 0.10), (0.50, 0.30, 0.10, 0.10), (0.25, 0.25, 0.25, 0.25) ที่สอดคล้องกับค่าของ (X1, X2) = (0, 0), (0, 1), (1, 0), (1, 1) ตามลำดับ และพารามิเตอร์ของตัวแบบคือ α1 = log α1 = log , ß1 = log 2, ß2 = log 3, ß12 = log 2 =0-4.5 (เพิ่มทีละ 0.3) และการแจกแจงของ Y’s 4 แบบคือ Y ~ multinomial (p1, p2, p3): (0.05, 0.20, 0.75), (0.25, 0.50, 0.25), (0.5, 0.20, 0.25), และ (0.33, 0.33, 0.33) โดยใช้ขนาดตัวอย่าง 4 ขนาด คือ 600, 800, 1,000, และ 1,500 การจำลองแบบทำซ้ำในแต่ละเงื่อนไข 1,000 ครั้งด้วยโปรแกรม Macro ที่พัฒนาขึ้นมาประมวลผลร่วมกับ MINITAB Version 11 (ไวยากรณ์คำสั่ง) และ 15 (กราฟพล็อต) ผลของการวิจัย ประเด็นแรกพิจารณาจากลักษณะการแจกแจงของ Y’s ภายใต้แต่ละการแจกแจงของ (X1, X2) พบว่าเมื่อลักษณะของการแจกแจงของ Y ซึ่งมีสัดส่วนของแนวโน้มชัดเจนคือ Y ~ multinomial (0.05, 0.20, 0.75) ตัวแบบมี Sensitivity ของการพยากรณ์กลุ่มถูกต้องได้ดีกว่าของตัวแบบภายใต้การแจกแจงของ Y’s แบบอื่นอีก 3 แบบในทุกลักษณะการแจกแจงของ (X1,X2)’s รองลงมาคือ Y ~ multinomial (0.33, 0.33, 0.33), (0.25, 0.50, 0.25) และ (0.55, 0.20, 0.25) ตามลำดับ โดยค่าของ Sensitivity เพิ่มขึ้นเมื่อค่าของ ß12 และขนาดตัวอย่างเพิ่มขึ้น ประเด็นที่สองพิจารณาจากลักษณะการแจกแจงของ (X1,X2)’s ภายใต้แต่ละการแจกแจงของ Y พบว่า เมื่อการแจกแจงของ (X1,X2) มีลักษณะของสัดส่วนความน่าจะเป็นแบบสมมาตร คือ (X1,X2) ~ multinomial (0.25, 0.25, 0.25, 0.25) ตัวแบบมี Sensitivity ของการพยากรณ์กลุ่มได้ถูกต้องดีกว่าของตัวแบบภายใต้การแจกแจงของ (X1,X2)’s แบบอื่น ๆ ในเกือบทุกลักษณะการแจกแจงของ Y’s รองลงมาคือ (X1,X2) ~ multinomial (0.50, 0.30, 0.10, 0.10) และ (0.10, 0.35, 0.45, 0.10) ตามลำดับ ยกเว้นกรณีเดียวที่ Y ~ multinomial (0.5, 0.20, 0.25) และ (X1,X2) ~ multinomial (0.10, 0.35, 0.45, 0.10) ตัวแบบให้ผลลัพธ์ดีกว่าของการแจกแจงของ (X1,X2) อีก 2 แบบ ณ Y เดียวกัน แต่ผลลัพธ์ดังกล่าวยังมีความแปรปรวนค่อนข้างสูง ประเด็นสุดท้ายพิจารณาจากตัวสถิติภาวะสารูปคดีต่าง ๆ พบว่า เมื่อลักษณะการแจกแจงของ Y แบบมีสัดส่วนของแนวโน้มชัดเจนและแบบสมมาตร ส่วนของตัวแปรอธิบายเป็นแบบสมมาตร ตัวแบบมี Sensitivity ของการพยากรณ์กลุ่มได้ถูกต้องดีกว่าของตัวแบบภายใต้การแจกแจงของแบบอื่น ๆ นอกจากนี้ค่าของตัวสถิติภาวะสารูปดี R2 analogs ยังมีแนวโน้มเพิ่มขึ้น ส่วน GM, AIC, และ BIC มีแนวโน้มลดลง ตามขนาดตัวอย่างและขนาดของพารามิเตอร์อิทธิพลร่วมของสองตัวแปรอธิบายตามลำดับ ซึ่งให้ผลลัพธ์ดีขึ้นทุกค่า และมีความคงเน้นคงวาที่สอดคล้องกับผลลัพธ์ทางทฤษฎีซึ่งสามารถใช้ในการตรวจสอบตัวแบบต่อไป The sensitivity analyses of polychotomous logit models with ordinal response categories and two nominal explanatory variables with interaction term are performed. The magnitude of goodness-of-fit statistics, the coefficients of determination or R2 analogs, and the likelihood ratio statistic, GM, AIC (Akaike Information Criterion, Akaike, 1973), BIC (Baysian Information Criterion, Schwarz, 1978) are also calculated. Simulations have been conducted for the multinomial logit models with K=3 response categories and two explanatory variables (X1, X2) whose joint distribution of (X1, X2) is assumed to be multinomial with probabilities of π1, π2, π3, π4 corresponding to (X1, X2) values of (0, 0), (0,1), (1, 0), (1, 1), respectively. Three sets of (π1, π2, π3, π4) are studied to represent different distributional shapes, which were chosen to induce possibly strong effects such that ß1 = log 2, ß2 = log 3, and ß12 = 0.0-4.5, namely (X1, X2) ~ multinomial (0.10, 0.35, 0.45, 0.10), (X1, X2) ~ multinomial (0.50, 0.30, 0.10, 0.10), and (X1, X2) ~ multinomial (0.25, 0.25, 0.25, 0.25). Four sets of the three ordered category distributing corresponding with the (X1, X2) were again generated through the models under the proportions of (p1, p2, p3), namely Y ~ multinomial (p1, p2, p3): (0.05, 0.20, 0.75), (0.25, 0.50, 0.25), (0.55, 0.20, 0.25), and (0.33, 0.33, 0.33) from which it follows that the true model intercepts are α1 = log α1 = log corresponding to the proportions of Y = 1, 2, 3, respectively. Four sample sizes of 600, 800, 1,000, and 1,500 units were conducted. Each condition was carried out for 1,000 simulations using the developed macro program run with the Minitab Release 11 (command syntax) and 15 (graph plots). The research results, based on the sensitivity and goodness-of-fit statistics, show that the models under the distributions of Y ~ multinomial (0.05, 0.20, 0.75) and Y ~ multinomial (0.33, 0.33, 0.33) perform better than those of other conditions of Y’s, for every distribution of (X1, X2) in term of the sensitivity totals, of which the values also tend to increase as ß12 and the sample size are increased. In addition when (X1, X2) ~ multinomial (0.25, 0.25, 0.25, 0.25), the sensitivity results are superior to those of other distributions of (X1, X2)’s for most distributions of Y’s. The goodness-of-fit statistics, R2 analogs, increase, while as the GM, AIC and BIC statistics decrease, as the ß12 and the sample size are increased. Therefore, not only the sensitivity plots but also the goodness-of-fit statistics are generally consistent, of which the results improve the model fits as sample sizes are large.References
Agresti, A. (1990). Categorical Data Analysis. New York: John Wiley & Sons.
Agresti, A. (2002). Categorical Data Analysis. Second edition. New York: John Wiley & Sons.
Akaike, H. (1973). Information theory and an extension of the maximum likelihood principle, in second Intenational Symposium on Information Theory (eds. B.N. Petrov and F. Czake). Akademiai, Kiado, Budapest, 267-81.
Aldrich, J. H. and F. D. Nelson. (1984). Linear Probability Logit and Probit Models. Beverly Hills and London: Sage Publications.
Anderson, J. A. (1984). Regression and ordered categorical variables. J. Roy. Statist,. B 46, 1-30.
Aitkin, M. D. Anderson, B. Francis, and J. Hinde. (1989). Statistical Modelling in GLIM. Oxford: Clarendon Press.
Burnham, K. P., D. R. Anderson and G. C. White. (1994). Evaluation of the Kullback-Leibler discrepancy for model selection in open population capture-recapture models. Biometric, 36, 299-315.
Cross, P. C. and S.R. Beissinger. (2001). Using logistic regression to analyze the sensitivity of PVA models: A comparison of methods based on African Wild Dog Models. Conservation Biology, 15(5), 1135-1346.
Cole, S.R., P.D. Allison, and C.V. Ananth. (2004). Estimation of cummulative odds ratios. AEP14(3), 172-178.
Cox, D. R. and E. G. Snell. (1989). The Analysis of Binary Data. 2nd edition. London: Chapman and Hall.