การพัฒนาแบบสอบผลสัมฤทธิ์ทางการเรียนวิชา การวัดและประเมินผลในชั้นเรียนโดยการกำหนดมาตรฐานด้วยวิธีบุ๊คมาร์ค

A Development of Measurement and Assessment in the Classroom Achievement Test: using the Bookmark standard setting procedure


  • สุรีพร อนุศาสนนันท์


การกำหนดมาตรฐาน , คะแนนจุดตัด , การกำหนดมาตรฐานด้วยวิธีบุคมาร์ค , การพัฒนาแบบสอบ, standard setting, cut off scores, Bookmark standard setting, development of test


การวิจัยครั้งในวัตถุประสงค์เพื่อ 1) สร้างแบบสอบผลสัมฤทธิ์ทางการเรียนวิชาการวัดและประเมินผลในชั้นเรียนต่อในสอบความยาก อำนาจจำแนก ความตรงและความเที่ยงของแบบสอบผลสัมฤทธิ์ทางการเรียน วิชาการวัดผลและประเมินผลในชั้นเรียนที่สร้างขึ้น และ 3) หาคะแนนจุดตัดของแบบสอบที่สร้างขึ้นโดยการกำหนด มาตรฐานด้วยวิธีบุ๊คมาร์ต กลุ่มตัวอย่าง มี 2 กลุ่มคือ 1) ผู้ตัดสิน คือ อาจารย์ที่สอนรายวิชา การวัดและประเมินผลในชั้นเรียน จำนวน 6 คน 2) ผู้สอบเองได้ชั้นปีที่ 3 คณะศึกษาศาสตร์ที่ลงเรียนรายวิชา 400204 การวัดและประเมินในชั้นเรียน ปีการศึกษา 2553 ใช้วิธีการสุ่มแบบยกกลุ่ม (cluster Briping) จำนวน 667 คน เครื่องมือที่ใช้ในการวิจัย ได้แก่ 1) แบบสอบวัดผลสัมฤทธิ์ทางการเรียนวิชาการวัดและประเมินผลในชั้นเรียน แบบเลือกตอบ 4 ตัวเลือก  และแบบอัตนัย จำนวน 2 ฉบับ ผลการสอบนำมาวิเคราะห์ค่าความยาก อำนาจจำแนกความเที่ยงโดยใช้ทฤษฎีตอบสนองข้อสอบแบบ 3 พารามิเตอร์ และ Partial-Credit Model (KM) วิเคราะห์ ความตรงโดยหาสหสัมพันธ์ 2) คู่มือการจัดเรียงข้อสอบ (ordered items booklet : OIB) เพื่อใช้กำหนดมาตรฐานด้วยวิธีบุ๊คมาร์ค ผลการวิจัยสรุปได้ ดังนี้ 1) แบบสอบวัดผลสัมฤทธิ์ทางการเรียนวิชาการวัดและประเมินในชั้นเรียนประเภทเลือกตอบที่พัฒนาแล้ว ฉบับที่ 1 มีค่าความยากระหว่าง -2.50 ถึง 3.00 ค่าอำนาจจำแนกระหว่าง .49 ถึง .88 และค่าการเดาระหว่าง .11 ถึง .29 และประเภทอัตนัย ค่าอำนาจจำแนกเท่ากับ .98 และทำความยากมีค่าระหว่าง -2.17 ถึง .47 ส่วน ฉบับที่ 2 ค่าความยากระหว่าง -1.39 ถึง 3.00 ค่าอำนาจจำแนกระหว่าง .50 ถึง .90 และการเดาระหว่าง .11 ถึง .29 และประเภทอัตนัย ค่าอำนาจจำแนกเท่ากับ .47 และค่าความยากระหว่าง -0.98 ถึง 59 2) ค่าสารสนเทศของแบบสอบฉบับที่ 1 อยู่ในช่วงประมาณ 3.9 ถึง 5.0 และมีค่าสูงสุดอยู่ที่ระดับความสามารถ (0) ประมาณ -1.0 ฉบับที่ 2 ค่าสารสนเทศของแบบสอบอยู่ในช่วงประมาณ 3.9 ถึง 12.0 และมีค่าสูงสุดอยู่ที่ระดับความสามารถ (0) ประมาณ -0.5  3) คะแนนจุดตัดที่อยู่ในรูปคะแนนดิน และคะแนนความสามารถ จากแบบสอบวัดผลสัมฤทธิ์ทางการเรียนวิชาการวัดและประเมินในชั้นเรียน ซึ่งกำหนดคะแนนขุดตัดด้วยวิธีบุ๊คมาร์ต 7 ระดับ ดังนี้ ระดับดีเยี่ยม (A) เท่ากับ 109 (1,453) ระดับดีมาก (B+) เท่ากับ 91 (123) ระดับดี (B) เท่ากับ 83 (1.203) ระดับดีพอใช้ (C+) เท่ากับ 65 (1.133) ระดับพอใช้ (C) เท่ากับ 49 (1.093) ระดับอ่อน (D+) เท่ากับ 30 (1.0130) และระดับอ่อนมาก (D) 13 (.933)  The objectives of this study are 1) to develop achievement tests for the educational measurement and evaluation of hachelor degrees at Burapha University 2) to investigate the item difficulty indices, the item discriminating indices and validity and reliability in achievement tests, and 3) to investigate the cut stores in Be bookmark standard setting in the sample was divided into two groups 1) 6 Educational Measurement and Evaluation in the Classroom lecturers assessors (aging as assessors) from the Education faculty of Burapha University, and 2) 677 undergraduate students who studies Educational Measurement and Evaluation in the Classroom, in 2010. The research instruments included: 1) both of midterm and final in educational measurement and evaluation achievement tests: multiple choice items and essay items. Their scores were analyzed to find difficulty indices discriminating indices the reliability by using the IRT model 3 PL model and the Partial-Credit Model (PCM) and the validity - by finding the Correlation 2) the ordered item booklet the OIB used in Bookmark standard setting method The following are the research findings: 1. The first test, multiple choice items, indicated difficulty index were 2.50 to 3.00, the discriminating index were .49 to .88 and the guessing index were .11 to .29. The eassy items indicated the discrimination index was 0.98 and the item difficulty indices were -2.17 to .47. The second test, multiple choice items, the difficulty index were-1.39 to 3.00, the discriminating index were .50 to .90 and the guessing were .11 to .29. The eassy items indicated the discriminating index was 0.47 and the item difficulty indices were - .98 to .59.  2. The test information function of the first test was between 3.9 and 5.0, and the highest ability level (0) was -1.0. For the second test, the test information function was between 3.9 to 12 and the highest ability level (0) was -0.5 3. The cut scores in raw scores and examinee's ability (0) of the achievement tests were divided into 7 levels using the Bookmark method, as follows: excellent (A) was 109 (1.453 = (0), very good (B+) was 91 (1.293= 0), good (B) was 83 (1.203= 0), rather growl (C+) was 65 (1.133-0), Tair (C) was 49.5 (1.093-0), poor (D+) was 30 (1,013- (0), and very your (D) was 13 (0.933 = 0)


