การพัฒนาค่าปรับแก้สถิติทดสอบไค-สแควร์ กรณีความถี่ที่คาดหวังมีขนาดเล็ก
Development of Chi-Square Correction Values for Contingency Tables With Small Expected Frequencies
Keywords:
การแจกแจงแบบไค-สแควร์, คณิตศาสตร์สถิติAbstract
การวิจัยครั้งนี้มีจุดมุ่งหมายเพื่อพัฒนาค่าปรับแก้สถิติทดสอบไค-สแควร์ กรณีความถี่ที่คาดหวังมีขนาดเล็ก โดยใช้สถานการณ์จำลองด้วยเทคนิคมอนติคาร์โล ทดลองหาค่าปรับแก้ กรณีความถี่ที่คาดหวังมีขนาดเล็ก เพื่อให้สามารถควบคุมอัตราความคลาดเคลื่อนประเภที่ I ได้ ซึ่งได้ทดลองกับตารางขนาด 2x2, 2x3 และ 3x3 โดยในแต่ละสถานการณ์ทดลองซ้ำเป็นจำนวน 10,000 ครั้ง แล้วคำนวณหาอัตราความคลาดเคลื่อนประเภทที่ I และทดลองซ้ำ ๆ จนกว่าอัตราความคลาดเคลื่อนประเภทที่ I ที่ได้เท่ากับหรือใกล้เคียงกับระดับนัยสำคัญที่กำหนดมากที่สุด จึงบันทึกค่าปรับแก้ที่ได้เป็นผลการทดลอง ที่ระดับนัยสำคัญ 0.05 และ 0.01 ผลการวิจัยปรากฏว่า 1. สูตรที่ใช้ทดลองหาค่าปรับแก้สถิติทดสอบไค-สแควร์ กรณีความถี่ที่คาดหวังมีขนาดเล็ก คือ ∑j = 1c ∑I = 1r เมื่อ C เป็นค่าปรับแก้ 2. สำหรับตารางขนาด 2x2 ที่ระดับนัยสำคัญ 0.05 สามารถควบคุมอัตราความคลาดเคลื่อนประเภทที่ I ได้ไม่น้อยกว่า 80% ของจำนวนสถานการณ์การทดลอง ส่วนที่ระดับนัยสำคัญ 0.01 สามารถควบคุมอัตราความคลาดเคลื่อนประเภทที่ I ได้น้อยกว่า 80% ของจำนวนสถานการณ์การทดลอง นอกจากนี้ยังพบว่า เมื่อตัวอย่างมีขนาดใหญ่ขึ้น สถิติทดสอบไค-สแควร์ที่ใช้ค่าปรับแก้ที่ผู้วิจัยพัฒนาขึ้น สามารถควบคุมอัตราความคลาดเคลื่อนประเภทที่ I ได้ดีขึ้น 3. สำหรับตารางขนาด 2x2 ที่ระดับนัยสำคัญ 0.05 และ 0.01 สามารถควบคุมอัตราความคลาดเคลื่อนประเภทที่ I ได้ดีว่าสถิติทดสอบไค-สแควร์แบบเดิม และดีกว่าสถิติทดสอบไค-สแควร์ที่ใช้ค่าปรับแก้ของเยทส์ 4. สำหรับตารางขนาด 2x3 และ 3x3 ที่ระดับนัยสำคัญ 0.05 และ 0.01 สามารถควบคุมอัตราความคลาดเคลื่อนประเภทที่ I ได้ไม่น้อยกว่า 80% ของจำนวนสถานการณ์การทดลอง 5. สำหรับตารางขนาด 2x3 และ 3x3 ที่ระดับนัยสำคัญ 0.05 และ 0.01 สามารถควบคุมอัตราความคลาดเคลื่อนประเภทที่ I ได้ดีกว่าสถิติทดสอบไค-สแควร์แบบเดิม The purpose of this study was to determine chi-square correction values for contingency tables with small expected frequencies. Monte Carlo simulation methods were used to create test contingency tables, and to determine correction values. Ten thousand (10,000) tables were generated for each of several table sizes. Type I error rates were determined using 0.05 and 0.01 levels of significance, under varying correction values and sample size. Results: 1. The formula tested was ∑j = 1c ∑I = 1r where C is the correction value. 2. For 2x2 contingency tables, the formula controlled for Type I error rates at the 0.05 level in over 80% of cases. Results at the 0.01 level were less reliable. Larger sample sizes resulted in better control at both levels of significance. 3. For 2x2 contingency tables, the formula provided better Type I error rate control over the normal Pearson chi-square test, and over the Pearson test with Yates’ correction, at both 0.05 and 0.01 levels. 4. For 2x3 and 3x3 contingency tables, the formula controlled for Type I error rates in over 80% of cases at both the 0.05 and 0.01 levels. 5. For 2x3 and 3x3 contingency tables, the formula provided better error rate control over the normal Pearson chi-square test, at both 0.05 and 0.01 levels.References
วิศิษฐ์ เสรีอรุโณ. (2531). ความแม่นยำในการใช้การทดสอบไค-สแควร์ สำหรับการทดสอบความเป็นเอกพันธ์ของสัดส่วนเมื่อความถี่ที่คาดหวังมีขนาดเล็ก. วิทยานิพนธ์ปริญญาครุศาสตรมหาบัณฑิต, ภาควิชาวิจัยการศึกษาบัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.
วันทิพย์ เดชชูไชย. (2529). การศึกษาเปรียบเทียบการทดสอบความเป็นอิสระระหว่างตัวแปร 2 ตัวโดยใช้สัมประสิทธิ์สหสัมพันธ์และการทดสอบไค-สแควร์. วิทยานิพนธ์สถิติศาสตรมหาบัณฑิต, ภาควิชาสถิติ บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.
สำราญ มีแจ้ง. (2534). การพัฒนาดัชนีชี้ความบกพร่องของผู้ตอบแบบทดสอบโดยการวิเคราะห์แบบแผนการตอบข้อกระทง. วิทยานิพนธ์ปริญญาครุศาสตรดุษฎีบัณฑิต, บัณฑิตวิทยาลัย จุฬาลงกรณ์มหาวิทยาลัย.
Cochran, W. G. (1954). Some methods for strengthening the common X2 test. Biometrics, 10(12), 417-451.
Grizzle, J. E. (1967). Continuity correction in the X2 test for 2x2 tables. The American Statistician, 21(4), 28-32.
Neyman, J. & Pearson, E.S. (1931). Further notes on the Chi-square distribution. Biometrika, 22(3/4), 298-305.
Kirk, R.E. (1995). Experimental design: procedures for the behavioral sciences. California: Brooks/Cole Publishing Company.
Marascuilo, L.A. & McSweeney, M (1977). Nonparametric and Distribution-Free methods for the social sciences. California: Brooks/Cole Publishing Company.