การเปรียบเทียบวิธีการประมาณค่าพารามิเตอร์ ในการวิเคราะห์พหระดับ เมื่อกลุ่มตัวอย่างมีขนาดเล็ก

A Comparison of Paramiter Estimators in Multilevel Analysis for Small Sample Size

Authors

  • มนตรี สังข์ทอง

Keywords:

การวิเคราะห์พหุระดับ , โมเดลเชิงเส้นลำดับชั้น, Multilevel Analysis, Hierarchical Linear Models

Abstract

การวิจัยครั้งนี้มีวัตถุประสงค์เพื่อประยุกต์ใช้แนวคิดการประมาณค่าพารามิเตอร์แบบบูทสแตรปในการ วิเคราะห์พหุระดับ เมื่อกลุ่มตัวอย่างมีขนาดเล็ก และเพื่อเปรียบเทียบค่าความเอนเอียงของวิธีการประมาณค่า พารามิเตอร์ในการวิเคราะห์พหุระดับเมื่อกลุ่มตัวอย่างมีขนาดเล็ก ทั้ง 5 วิธี ประกอบด้วย วิธีภาวะความน่าจะเป็น สูงสุดแบบเต็ม (FML) วิธีภาวะความน่าจะเป็นสูงสุดแบบจำกัด (RML) วิธี Shrinkage Estimator (SE) วิธี SM1 และวิธี SM2 สำหรับวิธี SM1 และวิธี SM2 เป็นวิธีที่ประยุกต์ใช้แนวคิดการประมาณค่าพารามิเตอร์แบบบูทสแตรป โดยงานวิจัยนี้จำลองแบบปัญหาด้วยเทคนิคมอนติคาร์โล ซึ่งมีเงื่อนไขการจำลองแบบปัญหา คือ 1) ประชากรมีการ แจกแจงแบบเบ้ขวา และเบ้ซ้าย 2) ตัวแปรอิสระระดับละ 1 ตัวแปรและ 2 ตัวแปร 3) ค่าสัมประสิทธิ์สหสัมพันธ์ภายในชั้น (Intraclass Correlation Coefficient) เท่ากับ 0.20 4) ขนาดตัวอย่าง ระดับละ 5 ขนาด คือ 3, 5, 10, 45 และ 20 โดยในแต่ละสถานการณ์จำลองชุดข้อมูลจำนวน 10,000 ชุด และสถิติที่ใช้ในการเปรียบเทียบค่าความเอนเอียง คือ การวิเคราะห์ความแปรปรวนพหุคูณแบบทางเดียว (One-way MANOVA) ผลการวิจัย พบว่า  1. การประยุกต์ใช้แนวคิดการประมาณค่าพารามิเตอร์แบบบูทสแตรปในการวิเคราะห์พหุระดับ เมื่อกลุ่มตัวอย่าง มีขนาดเล็ก ประกอบด้วย 4 ขั้นตอน คือ ขั้นที่ 1 สุ่มตัวอย่างข้อมูลในระดับสูงสุดแบบใส่คืน (With replacement) ขั้นที่ 2 คํานวณค่า θ โดยมีหลักการในการประมาณค่าพารามิเตอร์ คือ การใช้กลุ่มตัวอย่างย่อย (Subsampling Algorithm) ในการประมาณค่าของ θ คือ θ มีสูตร คือ วิธี SM1 = θ = (A’A)-1 (A’B) ปรับค่า θ กรณี 2 ระดับ ด้วย λj = T/(T+Ó2/nj) และกรณี 3 ระดับด้วย λk = TB/TB+(∑(Tπ + Ó2/njk)-1)-1 และวิธี SM2 = θ = (A’A)-1 (A’B) ขั้นที่ 3 ทํา ซ้ำตามขั้นที่ 1 และขั้นที่ 2 จะได้ค่าสัมประสิทธิ์ในแต่ละระดับ ขั้นที่ 4 คํานวณหาตัวแทนของค่าสัมประสิทธิ์ในแต่ละ ระดับ โดยนำค่าประมาณสัมประสิทธิ์การถดถอยที่ได้มาใช้ในการหาค่าความคลาดเคลื่อนในตัวแบบการวิเคราะห์พหุระดับ ซึ่งพิจารณาจากค่าคลาดเคลื่อนในระดับสูงสุด โดยเรียงลำดับค่ามัธยฐานของความคลาดเคลื่อนกำลังสองจากน้อยไปมาก โดยค่ามัธยฐานของความคลาดเคลื่อนกำลังสองในรอบใดเป็นค่ากลาง ค่าประมาณพารามิเตอร์ที่ได้ในรอบนั้นเป็นตัวประมาณค่าในแต่ละระดับ  2. ผลการเปรียบเทียบค่าความเอนเอียงของการประมาณค่าพารามิเตอร์ในการวิเคราะห์พหุระดับ เมื่อกลุ่มตัวอย่างมีขนาดเล็ก พบว่า ที่ระดับนัยสำคัญ 0.01 ค่าความเอียนเอียงของการประมาณค่าอิทธิพลแบบคงที่ (FB) มีทั้งกรณีที่แตกต่างกันและไม่แตกต่างกันขึ้นอยู่กับเงื่อนไขการจําลองแบบปัญหา สำหรับค่าความเอียนเอียงของการประมาณค่าอิทธิพลแบบสุ่ม (RB) พบว่า แตกต่างกันอย่างมีนัยสำคัญทางสถิติที่ระดับ 0.01  This research was aimed to apply ideas of parametric bootstrap estimation in multilevel analysis of small sample groups and also compare 5 methods of bias value of parameter estimation in multilevel analysis of small sample groups. They were FML, RML, SE, SM1, and SM2. For the SM1 and SM2, they were the methods which applied the ideas of parametric bootstrap estimation. This research study was modeled the problems by using the Monte Carlo method which consisted of the following problem conditions: 1) the population were categorized by right skew and left skew; 2) 1 and 2 independent variables; 3) Intraclass Correlation Coefficient was 0.20; and 4) sample sizes, 5 for each level which were 3, 5, 10, 15, and 20. Each situation was modeled by 10,000 series of information and compare statistic of bias value was One-way Multivariate Analysis of Variance (One-way MANOVA)  The results were as follows:  1. The application of parametric bootstrap estimation in multilevel analysis of small sample groups comprise of 4 stages. They are: Stage 1: Random sampling in the highest level with replacement. Stage2: Calculate θ by using parametric estimation with Subsampling Algorithm to estimate θ and θ The Formulas are as follows: SM1 = = θ = (A’A)-1 (A’B) Adjusted θ Case of 2 levels by λj = T/(T+Ó2/nj) and Case of 2 levels by λk = TB/TB+(∑(Tπ + Ó2/njk)-1)-1 and SM2 = θ = (A’A)-1 (A’B) Stage 3: Repeat Stage 1 and 2, coefficient in each level is revealed. Stage 4 Estimation of representatives of coefficient value in each level was done by taking regress coefficient to find error in Multi-Level Analysis which was considered from the highest level of error by ordering the median of the double error from the lowest to the highest. The median of the double error in any round is the estimated middle value of the parameter. It is the value estimator in each level.  2. The comparison of bias in estimating parameter in multilevel analysis when the sample groups were small, it was found that at the significant level of 0.01, the fixed bias showed both differences and no differences depending on conditions of the modeled problems. For the estimation of random effect, difference was found at the statistical significant level of 0.01.

Downloads

Published

2024-03-14