การเลือกลักษณะสําหรับการแทนค่าข้อมูลสูญหายในการวัดประสิทธิภาพการผลิตปลานิลในจังหวัด สุพรรณบุรี
Keywords:
การเลือกลักษณะ, การแทนค่าข้อมูลสูญหาย, ข้อมูลสูญหาย, ประสิทธิภาพการผลิตAbstract
การวิจัยนี้มีวัตถุประสงค์เพื่อ 1) พัฒนาวิธีการแทนค่าข้อมูลสูญหายแบบใหม่ (FSNNR) โดยการรวม วิธีการเลือกลักษณะ (Feature selection) กับการแทนค่าข้อมูลสูญหายด้วยวิธี Nearest Neighbor Regression Imputation 2) เปรียบเทียบประสิทธิภาพของวิธีการแทนค่าข้อมูลสูญหายแบบใหม่กับวิธีการ แทนค่าข้อมูลสูญหายแบบเดิม 3 วิธี (RI, KNN และ NNR) ภายใต้ 36 สถานการณ์ จาก 3 เงื่อนไข ได้แก่ ขนาดตัวอย่าง ร้อยละของการสูญหายของข้อมูล และขนาดของส่วนเบี่ยงเบนมาตรฐานของความคลาดเคลื่อน ของข้อมูล โดยใช้การจำลองสถานการณ์ด้วยวิธีมอนติคาร์โล ทดลองซ้ำเป็นจำนวน 1,000 ครั้ง ในแต่ละสถานการณ์ และ 3) เพื่อนำวิธีการแทนค่าข้อมูลสูญหายที่พัฒนาขึ้นไปใช้แทนค่าในแบบจำลองการวัดประสิทธิภาพการผลิตปลานิลของจังหวัดสุพรรณบุรี ผลการศึกษาปรากฏว่า 1) วิธีการแทนค่าข้อมูลสูญหายแบบใหม่ (FSNNR) มีขั้นตอนดังนี้ ขั้นตอนที่ 1 เลือกลักษณะของข้อมูล 2 ลักษณะ ด้วยวิธี Nearest Neighbor โดยใช้สูตร Euclidean distance ขั้นตอนที่ 2 แทนค่าข้อมูลสูญหายด้วยวิธี K-Nearest Neighbor Imputation โดยกำหนดค่า k = 2 และขั้นตอนที่ 3 นำข้อมูลสมบูรณ์ที่ได้จากขั้นตอนที่ 2 มาแทนค่าข้อมูลสูญหายด้วยวิธี Regression Imputation 2) ประสิทธิภาพของการแทนค่าข้อมูลสูญหายแบบใหม่ ดีกว่าการแทนค่าข้อมูลสูญหายแบบเดิม จำนวน 33 สถานการณ์ 3) ประสิทธิภาพทางเทคนิคของการผลิตปลานิลของเกษตรกรแต่ละราย เมื่อแทนค่าข้อมูลสูญหายด้วยวิธี FSNNR ปรากฏว่า ส่วนใหญ่ของเกษตรกรผู้เลี้ยงปลานิลเป็นกลุ่มที่มีค่าประสิทธิภาพทางเทคนิคระดับมากที่สุด ร้อยละ 82.76 และมีค่าประสิทธิภาพทางเทคนิคระดับมาก ร้อยละ 24.14 The objectives of this research were: 1) to development of a new method (FSNNR) for imputation of missing data that combined feature selection with the nearest neighbor regression imputation method, 2) to compare the efficiency of FSNNR and three imputations (RI, KNN and NNR) under 36 situations from these three conditions; the sample sizes; the missing percentages; and the data deviations. The data were simulated using the Monte Carlo technique; repeated 1,000 times for each situation, and 3) to measure the efficiency of Nile tilapia production in Suphanburi Province. The results were as followed: 1) The new method for imputation of missing data was as follows: First, we select two features of data using the Nearest Neighbor. Next, we impute the missing value using the K-Nearest Neighbor Imputation (k=2). Finally, complete the data obtained from step 2 to impute missing data with Regression Imputation. 2) The FSNNR was better performed than the other imputations under 33 combinations of simulated conditions. 3) The technical efficiency of each Nile Tilapia farmer when replacing missing data with FSNNR method, it was found that the Nile Tilapia farmers have the highest level of technical efficiency 82.76% and high technical efficiency of 24.14%.Downloads
Issue
Section
Articles