การเปรียบเทียบการทดสอบค่าเฉลี่ยภายใต้ความแปรปรวนวิวิธพันธ์ ในการทดลองสุ่มสมบูรณ์

Authors

  • ปรีชญา หะสะเล็ม
  • จิราวัลย์ จิตรถเวช

Keywords:

แผนแบบการทดลอง, แบบสุ่มสมบูรณ์, ผลกระทบแบบตรึง, การทดสอบเอฟ, การทดสอบเวลช์, การทดสอบเอฟวางนัยทั่วไป

Abstract

          งานวิจัยนี้มีวัตถุประสงค์เพื่อเปรียบเทียบความสามารถในการควบคุมความน่าจะเป็นที่จะเกิดความคลาดเคลื่อน ประเภทที่ 1 คือค่าความน่าจะเป็นของจำนวนครั้งที่ปฏิเสธสมมุติฐานหลักเมื่อสมมุติฐานหลักเป็น จริง และร้อยละของการตัดสินใจถูกต้อง คือร้อยละของจำนวนครั้งที่ปฏิเสธสมมุติฐานหลักเมื่อสมมุติฐานทางเลือกเป็นจริงของการทดสอบความเท่ากันของค่าเฉลี่ยประชากร 3 ชุด โดยใช้การทดสอบเอฟ การทดสอบเวลช์ และการทดสอบเอฟวางนัยทั่วไป โดยจำลองข้อมูลในแผนแบบการทดลองแบบสุ่มสมบูรณ์ กำหนดปัจจัยการทดลองมีผลกระทบแบบตรึง กรณีที่ประชากรมีการแจกแจงปกติ กำหนดความแปรปรวนของประชากรเป็น 6 กรณีขนาดตัวอย่างที่สุ่มจากประชากรแต่ละชุดมีขนาดเท่ากัน n = 10, 15, 30, 50, 100, 200 และกระทำการทดสอบซ้ำจำนวน 1000 รอบในแต่ละกรณี ผลการวิจัยพบว่ากรณีความแปรปรวน ของประชากรเท่ากัน และมีค่าความแปรปรวนน้อยเท่ากับ 1 ความแปรปรวนปานกลางเท่ากับ 25 และความแปรปรวนมาก เท่ากับ 100 พบว่าการทดสอบเอฟสามารถควบคุมความน่าจะเป็นที่จะเกิดความคลาดเคลื่อนประเภทที่ 1 ได้ และให้ร้อยละของการตัดสินใจถูกต้องมากที่สุด และกรณีความแปรปรวนของประชากรแตกต่างกันน้อย (𝜎 1 21 2 = 1, 𝜎2 2 = 9, 𝜎3 2 = 25) ความแปรปรวนของประชากรแตกต่างกันปานกลาง (𝜎1 2 = 4, 𝜎2 2 = 36, 𝜎3 2 = 100) และความแปรปรวนของประชากรแตกต่างกันแตกต่างกันมาก (𝜎1 2 = 9, 𝜎2 2 = 81, 𝜎3 2 = 225) พบว่าการทดสอบเอฟวางนัยทั่วไปสามารถควบคุมความน่าจะเป็นที่จะเกิดความคลาดเคลื่อนประเภทที่ 1 ได้ และให้ร้อยละของการตัดสินใจถูกต้องมากที่สุด นอกจากนั้นพบว่าค่าร้อยละของการตัดสินใจถูกต้องของการทดสอบเอฟ การทดสอบเวลช์ และการทดสอบเอฟวางนัยทั่วไปมีค่าใกล้เคียงกันและเพิ่มขึ้น เมื่อขนาดตัวอย่างใหญ่ขึ้นในทุกกรณี           The objective of the research is to compare the ability to control probability of type I error of testing the equality of means from a completely randomized design (CRD) by F test, Welch’s test and Generalized F test when the population variance is heterogeneous. The ability to control probability of type I error is measured by the probability of the number of “reject” when the null hypothesis is true and the percentage of accuracy is measured by the number of “reject” when the alternative hypothesis is true. The data are generated from the fixed effect CRD simulation of normal distributed error population with zero mean and six cases of variance. The sample sizes are 𝑛 = 10, 15, 30, 50, 100, 200 and the replication in each case is 1,000. The research results can be summarized as follows. In the cases of homogeneous variance with small variance equal to 1, medium variance equal to 25 and large variance equal to 100, it is found that the F test yields the highest result. In the cases of heterogeneous variance with small variation in variance (𝜎1 2 = 1, 𝜎2 2 = 9, 𝜎3 2 = 25), medium variation in variance (𝜎1 2 = 4, 𝜎2 2 = 36, 𝜎3 2 = 100) and large variation in variance (𝜎1 2 = 9, 𝜎2 2 = 81, 𝜎3 2 = 225), it is found that the generalized F test yields the highest result. However, the percentage of accuracy by the F test, Welch’s test and generalized F test are nearly the same and increases as the sample size increases in all cases.

Downloads