การเปรียบเทียบประสิทธิผลการประมาณค่าพารามิเตอร์และการทำหน้าที่ต่างกัน ของข้อสอบ ด้วยวิธีแมกซิมัมไลค์ลิฮู๊ด วิธีของเบย์แบบไม่คำนึงถึงอิทธิพล ของเทสเลท และวิธีของเบย์แบบคำนึงถึงอิทธิพลของเทสเลท

Authors

  • อริสฬา เตหลิ่ม
  • ไพรัตน์ วงษ์นาม
  • สมพงษ์ ปั้นหุ่น

Keywords:

เทสเลท, วิธีของเบย

Abstract

          การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อศึกษาประสิทธิผลในการประมาณค่าพารามิเตอร์ของผู้สอบ (ความสามารถ) และเพื่อศึกษาผลการตรวจสอบการทำหน้าที่ต่างกันของข้อสอบ (DIF) ระหว่างวิธีแมกซิมัมไลค์ ลิฮู๊ด (ML) วิธีของเบย์แบบไม่คำนึงถึงอิทธิพลของเทสเลท (Bayes) และวิธีของเบย์แบบคำนึงถึงอิทธิพลของ เทสเลท (Bayesγ) ข้อมูลที่ศึกษาเป็นข้อมูลจำลองภายใต้ปัจจัยที่แปรเปลี่ยน 4 ปัจจัย คือ อิทธิพลของเทสเลท (เท่ากันทุกเทสเลท และข้อสอบที่เป็นอิสระในเทสเลท) การแจกแจงของความสามารถ (ปกติ เบ้ซ้าย เบ้ขวา) จำนวนข้อสอบที่ทำหน้าที่ต่างกันในแบบสอบ (5 ข้อและ 8 ข้อจากแบบสอบ 40 ข้อ) และอัตราส่วนของกลุ่ม เปรียบเทียบต่อกลุ่มอ้างอิง (1000:1000, 1000:100) รวมจำนวนเงื่อนไขทั้งหมด 24 เงื่อนไข (2 x 3 x 2 x 2) กำหนดจำนวนรอบในการประมาณค่าพารามิเตอร์ในแต่ละเงื่อนไข 100 รอบ ผลการวิจัยสรุปได้ ดังนี้          1. เมื่อเปรียบเทียบประสิทธิภาพในการประมาณค่าพารามิเตอร์ของผู้สอบระหว่างวิธี ML วิธี Bayes และวิธี Bayesγ พบว่า วิธี Bayesγ ประมาณค่าพารามิเตอร์ได้ดีที่สุด          2. การตรวจสอบการทำหน้าที่ต่างกันของข้อสอบ พบว่า วิธี Bayes และวิธี Bayesγ สามารถควบคุม อัตราความคาดเคลื่อนประเภทที่ 1 ได้ตามเกณฑ์ที่กำหนด และมีอำนาจการตรวจสอบสูงเมื่อมีการแจกแจงความ สามารถแบบเบ้ซ้ายและจำนวนตัวอย่างมาก แต่ไม่มากถึงเกณฑ์ที่กำหนด ตรงข้ามกับวิธี ML ซึ่งไม่สามารถควบคุม อัตราความคาดเคลื่อนประเภทที่ 1 แต่มีอำนาจการตรวจสอบสูง           The objectives of this research were (1) to study the effectiveness of person parameter estimation, and (2) to study the differential item functioning by Using Maximum Likelihood (ML), Bayesian (Bayes), and Bayesian with Testlet (Bayesγ). In this study, the data were simulated. All conditions were consists of 2 levels of testlet effect (equal effect, independent + testlet), 3 levels of ability distribution (normal, negative, and positive skew distributions), 2 amount of items with DIF (5, and 8 items in the 40-item test length), and 2 levels of ratio of a reference and focal group (1000:1000, 1000:100) The entire total of testing conditions was 24 (2 x 3 x 2 x 2). The 100 replications used to estimate the item parameters and test statistics in each condition. The research results were as follows:          1. From the comparison of ML, Bayes, and Bayesγ for person parameter estimation, it was found that Bayesγ had the best estimator          2. From the study of the detection of Differential Item Functioning, it was found that the Bayes, and Bayes γ estimate procedures had well-control of Type I error rate and higher the power rate when negatively skewed ability distributions and sample sizes were increased but it is not adequate for criteria, whereas ML estimate procedures had not control of Type I error rate and high power of DIF detection.

Downloads