การเปรียบเทียบความแม่นยำของการศึกษาปัจจัยที่สัมพันธ์กับการเกิดโรคเบาหวานด้วยวิธีการวิเคราะห์การถดถอยโลจิสติกและการวิเคราะห์การถดถอยโลจิสติกพหุระดับ : ฐานข้อมูล TCNAP ของประเทศไทย ปี 2561
A Comparison of Accuracy of Factors Related to Diabetes Mellitus by using Logistic Regression and Multilevel Logistic Regression: TCNAP database 2018
Keywords:
โรคเบาหวาน, ความแม่นยำ , การถดถอยโลจิสติก , พหุระดับAbstract
ข้อจำกัดการวิเคราะห์ถดถอยโลจิสติก คือ การลดระดับชั้นเพื่อให้ตัวแปรต้นมีระดับเท่ากันทำให้ความละเอียดข้อมูลลดลง การวิเคราะห์ข้อมูลจึงเกิดความลำเอียง การวิจัยมีวัตถุประสงค์เพื่อเปรียบเทียบความแม่นยำระหว่างการวิเคราะห์ถดถอยโลจิสติกพหุระดับและการวิเคราะห์ถดถอยโลจิสติก โดยใช้ข้อมูลสำนักงานกองทุนสนับสนุนการสร้างเสริมสุขภาพ ปี พ.ศ. 2561 จำนวน 8,327,459 คน ผลการศึกษาพบว่า ความแตกต่างของ 95% CI ของอัตราส่วนออดส์ระหว่างทั้งสองวิธีอยู่ระหว่าง ร้อยละ 5.65 ถึง 72.14 (บางตัวแปรเกินเกณฑ์ที่กำหนดไว้คือร้อยละ 20) และความแม่นยำในภาพรวมพบว่าการวิเคราะห์การถดถอยโลจิสติกพหุระดับ (AIC=2,007,527, BIC=2,007,834, Brier score=0.0316, AUC=0.8511) ให้ผลแม่นยำกว่าการวิเคราะห์ถดถอยโลจิสติก (AIC=2,032,180, BIC=2,032,473, Brier score=0.0313, AUC=0.8505) แม้ผลเป็นเช่นนั้นแต่ค่า AUC ของทั้งสองวิธีการแตกต่างกันไม่ถึงร้อยละ 1 (น้อยกว่าเกณฑ์ที่กำหนดไว้คือ ร้อยละ 5) และจากการศึกษาครั้งนี้ข้อมูลไม่มีความแตกต่างระหว่างกลุ่ม (ICC=0.2656) ดังนั้นควรพิจารณาเลือกใช้การวิเคราะห์การถดถอยโลจิสติก ซึ่งข้อค้นพบที่ได้จากการศึกษาครั้งนี้นำไปสู่ข้อเสนอแนะที่ว่า หากข้อมูลมีแตกต่างระหว่างกลุ่มมาก ควรเลือกใช้สถิติการวิเคราะห์การถดถอยโลจิสติกพหุระดับ แต่หากข้อมูลไม่มีความแตกต่างระหว่างกลุ่มควรเลือกใช้สถิติการวิเคราะห์การถดถอยโลจิสติก นอกจากนี้ควรนำข้อมูลชุดนี้ไปศึกษาเพิ่มเติมในแบบจำลองสมการโครงสร้างและการประมาณค่า The limitation of traditional logistic regression analysis is that the reduction level of independent variables decrease in level of detailed data, which leads to bias in data analysis. Therefore, this study aims to evaluate and compare accuracy of traditional logistic regression and multilevel logistic regression using data from TCNAP database of the Office of Health Promotion Fund, Bureau 3, Community Health Support Office. It was observed that both technique result the different in 95% CI of odds ratio around 5.65 to 72.14% (Some variables exceeded the specified criteria, which is 20 percent.). The multilevel regression analysis (AIC=2,007,527, BIC=2,007,834, Brier score=0.0316, AUC=0.8511) gives higher accuracy compare with traditional logistic regression (AIC=2,032,180, BIC=2,032,473, Brier score=0.0313, AUC=0.8505). However, the AUC value from both techniques is less than 1% which less than standard limit 5%. Because the data used in this study have not much difference between groups (ICC=0.2656), the logistic regression can be selected. The observation from this study suggest that the multilevel regression is suitable for data that significant difference between groups, while the logistic regression is good for a small difference between groups. Nonetheless, further studies on structural equation models and model estimation are needed.References
วชิระ เพ็งจันทร์. (2558). “เบาหวาน สาเหตุเสียชีวิต อันดับ 3 ในผู้หญิง และอันดับ 8 ในผู้ชาย”. เจาะลึกระบบสุขภาพ. เข้าถึงได้จาก https://www.hfocus.org/content/2015/11/11245. [28 สิงหาคม 2562]
International diabetes federation. (2018). IDF DIABETES ATLAS. 8th. Brussels: International diabetes federation.
สำนักโรคไม่ติดต่อ กระทรวงสาธารณสุข. (2561). ประเด็นสารรณรงค์เบาหวานโลกปี 2561. นนทบุรี: กระทรวงสาธารณสุข.
สำนักระบาดวิทยา กระทรวงสาธารณสุข. (2559). “โรคเบาหวาน”. สรุปรายงานการเฝ้าระวังโรค ประจำปี 2558. นนทบุรี: กระทรวงสาธารณสุข.
Esti Iturralde, Joseph R. Rausch, Jill Weissberg-Benchell, Korey K. Hood. (2019). “Diabetes-Related Emotional Distress Over Time”. Pediatrics. 143(6): 1-8.
N.C. Vaz, A.M. Ferreira, M.S. Kulkarni, F.S. Vaz. (2011). “Prevalence of diabetes mellitus in a rural population of Goa, India”. The National Medical Journal of India. 24(1): 16-18.
Martijn Lappenschaar, Arjen Hommersom, Peter J.F. Lucas, Joep Lagro, Stefan Visscher. (2013). “Multilevel Bayesian networks for the analysis of hierarchical health care data”. Artificial Intelligence in Medicine. 57(3): 171-183.
Ashis Talukder and Zobayer Hossain. (2020). “Prevalence of Diabetes Mellitus and Its Associated Factors in Bangladesh: Application of Twolevel Logistic Regression Model”. Scientific Reports. 10(10237): 1-7.
Randa M. Kutob, Violet Perez Siwik, Mikel Aickin, Cheryl Ritenbaugh. (2014). Families United/Familias Unidas: Family Group Office Visits to Reduce Risk Factors for Type 2 Diabetes. The Diabetes Educator. 40(2): 191-201.
รติภาคย์ ตามรภาค. (2561). ปัจจัยที่สัมพันธ์กับการเกิดโรคเบาหวานชนิดที่ 2 และประสบการณ์การดูแลตนเองในการควบคุมระดับน้ำตาลในเลือดของผู้สูงอายุชาวไทยภูเขา จังหวัดเชียงราย ประเทศไทย. วิทยานิพนธ์วิทยาศาสตรมหาบัณฑิต สาขาวิชาสาธารณสุขศาสตร์ สำนักวิชาวิทยาศาสตร์สุขภาพ มหาวิทยาลัยแม่ฟ้าหลวง.
อกนิษฐ์ ทองจิตร. (2561). การพัฒนาวิธีจำแนกประเภทข้อมูลโดยใช้โครงข่ายประสาทเทียมแบบปรับเหมาะผสมผสานการหาค่าเหมาะสมที่สุดแบบกลุ่มอนุภาค สำหรับการจำแนกประเภทกลุ่มเสี่ยงในการเป็นโรคเบาหวาน. ดุษฎีนิพนธ์ปรัชญาดุษฎีบัณฑิต สาขาวิชาการวิจัยและสถิติทางวิทยาการปัญญา วิทยาลัยวิทยาการวิจัยและวิทยาการปัญญา มหาวิทยาลัยบูรพา.
กัณฑิมา อยู่รวม. (2557). ปัจจัยคัดสรรที่สัมพันธ์กับระดับน้ำตาลเฉลี่ยสะสมในเลือดของข้าราชการตำรวจที่เป็นโรคเบาหวาน ชนิดที่ 2 ที่ไม่สามารถควบคุมระดับน้ำตาลเฉลี่ยสะสมในเลือดได้. วิทยานิพนธ์พยาบาลศาสตรมหาบัณฑิต สาขาวิชาพยาบาลศาสตร์ คณะพยาบาลศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย.
ชลธิดา โยธารินทร์. (2556). ปัจจัยเสี่ยงของโรคเบาหวานชนิดที่ 2 ในประชากรอายุ 40 ปีขึ้นไป ที่ตำบลนามะเขือ อำเภอสหัสขันธ์ จังหวัดกาฬสินธุ์ ประเทศไทย. วิทยานิพนธ์สาธารณสุขศาสตร มหาบัณฑิต สาขาวิชาสาธารณสุขศาสตร์ วิทยาลัยวิทยาศาสตร์สาธารณสุข จุฬาลงกรณ์มหาวิทยาลัย.
อนัญญา ประดิษฐปรีชา. (2554). ปัจจัยด้านการบริโภคอาหารที่มีผลต่อการเป็นโรคเบาหวาน ชนิดที่ 2 ในประชากร อำเภอนากลาง จังหวัดหนองบัวลำภู. วิทยานิพนธ์สาธารณสุขศาสตรมหาบัณฑิต สาขาวิชาโภชนศาสตร์เพื่อสุขภาพ บัณฑิตวิทยาลัย มหาวิทยาลัยขอนแก่น.
จารุพร สฤษฎิ์สุข. (2553). การพยากรณ์ความเสี่ยงในการเป็นโรคเบาหวานโดยวิธีแบบจำลองสมการโครงสร้าง. วิทยานิพนธ์วิทยาศาสตรมหาบัณฑิต สาขาวิชาวิทยาการคอมพิวเตอร์ บัณฑิตวิทยาลัย มหาวิทยาลัยเทคโนโลยีพระจอมเกล้าธนบุรี.
ชำนาญ สูญสิ้นภัย. (2553). การศึกษาและพัฒนาระบบผู้เชี่ยวชาญในการคัดกรองโรคเบาหวาน. วิทยานิพนธ์วิทยาศาสตรมหาบัณฑิต สาขาวิชาเทคโนโลยีคอมพิวเตอร์เพื่อการศึกษา คณะวิทยาศาสตร์และเทคโนโลยี มหาวิทยาลัยราชภัฏนครปฐม.
สุดสงวน ชิณโน. (2553). บริโภคนิสัยของประชาชนกลุ่มเสี่ยงต่อการป่วยเป็นโรคเบาหวาน อำเภอนาคู จังหวัดกาฬสินธุ์. วิทยานิพนธ์สาธารณสุขศาสตรมหาบัณฑิต คณะสาธารณสุขศาสตร์ มหาวิทยาลัยบูรพา.
วิชิต อินทร์ลำพันธ์. (2549). ภาวะเสี่ยงต่อการเป็นโรคเบาหวานของประชาชนอายุ 40 ปีขึ้นไป จังหวัด สุพรรณบุรี. สารนิพนธ์วิทยาศาสตรมหาบัณฑิต สาขาวิชาวิทยาการสังคมและการจัดการระบบสุขภาพบัณฑิตวิทยาลัย มหาวิทยาลัยศิลปากร.
Azra Ramezankhani, Kamran Guity, Fereidoun Azizi, and Farzad Hadaegh. (2019). “Sex differences in the association between spousal metabolic risk factors with incidence of type 2 diabetes: a longitudinal study of the Iranian population”. Biology of Sex Differences. 10(41): 1-8.
S. Carlsson, N. Hammar, V. Grill. (2005). Alcohol consumption and type 2 diabetes. Diabetologia. 40: 1051–1054.
Nick Robinson. (2018). The Disadvantages of Logistic Regression. Retrieve from https://www.theclassroom.com/ disadvantages-statistical-analysis-8471854.html, [June 28, 2018].
Anita R. Kothari and Stephen Birch. (2004). “Multilevel Health Promotion Research: Conceptual and Analytical Considerations”. Canadian Journal of Nursing Research. 36(1): 56-75.
John Neumann. (2016). “Model selection and overfitting”. NATURE METHODS. 13(9): 703-704.
Jindra Reissigova, Zdenek Monhart, Jana Zvarova, Petr Hanzlicek, Hana Grunfeldova, Petr Jansky, Jan Vojacek, Petr Widimsky. (2013). In-hospital Death Prediction by Multilevel Logistic Regression in Patients with Acute Coronary Syndromes. European Journal of Biomedical Informatics. 9(1): 11-17.
Terry K. Koo, and Mae Y. Li. (2016). “A Guideline of Selecting and Reporting Intraclass Correlation Coefficients for Reliability Research”. Journal of Chiropractic Medicine. 15: 155-163
Roxana Alexandrescu, Min-Hua Jen, Alex Bottle, Brian Jarman, and Paul Aylin. (2011). “Logistic Versus Hierarchical Modeling: An Analysis of a Statewide Inpatient Sample”. Journal of American College of Surgeons. 213(3): 392-401.