การเปรียบเทียบผลการตรวจสอบการทําหน้าที่ต่างกันของข้อสอบในแบบทดสอบระดับชาติ ด้านภาษา ด้านคํานวณ และด้านเหตุผล ชั้นประถมศึกษาปีที่ 3 ด้วยวิธี HGLM วิธี MIMIC และวิธี IRT-LR


  • สุธาทิพย์ ตรีสิน
  • ปิยะทิพย์ ประดุจพรม


การทำหน้าที่ต่างกันของข้อสอบ, วิธี HGLM, วิธี MIMIC, วิธี IRT-LR, แบบทดสอบระดับชาติ


          การวิจัยนี้มีวัตถุประสงค์เพื่อวิเคราะห์คุณภาพของแบบทดสอบระดับชาติ (NT) และตรวจสอบการทำ หน้าที่ต่างกันของข้อสอบในแบบทดสอบระดับชาติชั้นประถมศึกษาปีที่ 3 ด้านภาษา ด้านคำนวณ และด้าน เหตุผลด้วยวิธี HGLM วิธี MIMIC และวิธี IRT-LR การดำเนินการวิจัยแบ่งเป็น 3 ระยะ ดังนี้ 1) วิเคราะห์ คุณภาพของแบบทดสอบระดับชาติ ทั้ง 3 ด้าน 2) ตรวจสอบการทำหน้าที่ต่างกันของข้อสอบในแบบทดสอบ ระดับชาติ ด้วยวิธี HGLM วิธี MIMIC และวิธี  IRT-LR และ 3) เปรียบเทียบผลการวิเคราะห์การทำหน้าที่ ต่างกันของข้อสอบ ด้วยวิธีการตรวจสอบ 3 วิธีข้อมูลที่นำมาใช้วิเคราะห์เป็นข้อมูลทุติยภูมิ จากผลการตอบแบบทดสอบระดับชาติของนักเรียนชั้นประถมศึกษาปีที่ 3 ปีการศึกษา 2556 จำนวน 9,600 คน          ผลการวิจัยปรากฏว่า          1) แบบทดสอบระดับชาติชั้นประถมศึกษาปีที่ 3 มีค่าความยากของข้อสอบ (b) อยู่ในระดับค่อนข้างยากมีค่าอำนาจจำแนกของข้อสอบ (a) อยู่ในระดับที่สามารถจำแนกผู้สอบได้ดี และมีค่าโอกาสในการเดาของข้อสอบ (c) ไม่เกิน 0.3          2) การตรวจสอบการทำหน้าที่ต่างกันของข้อสอบทั้ง 3 ด้าน ชี้ให้เห็นว่า เพศส่งผลให้เกิดการทำหน้าที่ต่างกันของข้อสอบ โดยเพศหญิงจะได้เปรียบในการตอบข้อสอบด้านภาษา และด้านเหตุผล ในขณะที่เพศชายจะได้เปรียบในการตอบข้อสอบด้านคำนวณ โดยวิธี HGLM ตรวจพบข้อสอบทำหน้าที่ต่างกัน จำนวนมากที่สุดคิดเป็นร้อยละ 69 ของข้อสอบทั้งฉบับ รองลงมาคือ วิธี IRT-LR ร้อยละ 54 และวิธี MIMIC ร้อยละ 16 ตามลำดับ          3) การเปรียบเทียบผลการตรวจสอบการทำหน้าที่ต่างกันของข้อสอบ พบว่า วิธี HGLM ตรวจพบ DIF มากกว่าวิธี MIMIC ในด้านภาษา ด้านคำนวณ และด้านเหตุผล คิดเป็นร้อยละ 70, 36 และ 53 ตามลำดับ และวิธี HGLM ตรวจพบ DIF มากกว่าวิธี IRT-LR ด้านภาษา และด้านคำนวณ คิดเป็นร้อยละ 37 และ 13 และวิธี IRT-LR ตรวจพบ DIF มากกว่าวิธี MIMIC ทั้ง 3 ด้าน คิดเป็นร้อยละ 33, 43 และ 40 ตามลำดับ ส่วนวิธี HGLM ตรวจพบ DIF น้อยกว่าวิธี IRT-LR ด้านคำนวณ คิดเป็นร้อยละ 7 (p<.05)           The objectives of this research were to analyze the quality of National Tests (NT) and to investigate the possibility of Differential Item Functioning (DIF) in three subjects: Literacy, Numeracy, and Reasoning by using HGLM, MIMIC, and IRT-LR methods. The research methods were divided into three phases: 1) Analyzing the quality of NT exam item for three subjects; 2) Testing DIF detection of the items in NT using HGLM, MIMIC, and IRT-LR methods; and 3) Comparing the results of DIF three methods using secondary data from NT examination of 9,600 Grade three students academic year 2013.          Results were as follows:          1. The national tests had IRT difficulty parameter values at relatively difficult levels, discrimination parameter values capable of differentiating examiners at a good level, and guessing parameters not exceeding 0.30.          2. The examination of possible DIF in the three subjects revealed that gender affected the test scores; female students had an advantage when answering the Literacy, and Reasoning subjects, while male students had an advantage in the Numeracy subject. In addition, the HGLM method indicated that the three most common DIF tests could account for 69% of the test, followed by the IRT-LR at 54% and MIMIC at 16%, respectively.          3. Comparison of the DIF test results revealed that the HGLM method outperformed the MIMIC method in terms of DIF detection, namely 70% for Literacy, 36% for Numeracy, and 53% for Reasoning subjects. The HGLM method also outperformed the IRT-LR method in terms of DIF detection, namely 37% for Literacy and 13% for Numeracy subjects. The IRT-LR method outperformed the MIMIC method in terms of DIF detection, namely 33% for Literacy, 43% for Numeracy, and 40% for Reasoning subjects. Also, the HGLM method outperformed the IRT-LR method in terms of DIF detection for only Numeracy subjects (7%) (p<.05).
