ความถูกต้องในการแทนค่าข้อมูลสูญหายในการจำแนกประเภทกรณีข้อมูลสองกลุ่มMissing Data Imputation Based on Accuracy of Binary Classification

วารสารวิชาการพระจอมเกล้าพระนครเหนือ (The Journal of King Mongkut's University of Technology North Bangkok)

View Publication Info
 
 
Field Value
 
Title ความถูกต้องในการแทนค่าข้อมูลสูญหายในการจำแนกประเภทกรณีข้อมูลสองกลุ่มMissing Data Imputation Based on Accuracy of Binary Classification
 
Creator Vongprasert, Jumlong; Applied Statistics Department, Faculty of Science, Ubon Ratchathani Rajabhat University, Ubon Ratchathani
 
Subject ข้อมูลสูญหาย; การแทนค่า; การจำแนกประเภทกรณีข้อมูลสองกลุ่มMissing Data; Imputation; Binary Classification
 
Description การศึกษาครั้งนี้มีวัตถุประสงค์เพื่อเปรียบเทียบความถูกต้องของการจำแนกประเภทกรณีข้อมูลสองกลุ่ม ด้วยวิธีซัพพอร์ตเวกเตอร์แมชชิน (Support Vector Machines; SVM) โครงข่ายประสาทเทียม (Artificial Neural Networks; ANN) แรนดอมฟอร์เรส (Random Forests; RF) การแทนค่าแบบพหุ (Multiple Imputation; MI) และ การแทนค่าแบบแบ็กทรี (Bagged Tree Imputation; BTI) โดยใช้ชุดข้อมูล 3 ชุด ได้แก่ ข้อมูลชุดที่ 1 ประกอบด้วย ตัวแปรอิสระที่เป็นข้อมูลเชิงกลุ่ม 7 ตัวแปรและข้อมูลต่อเนื่องจำนวน 9 ตัวแปร ข้อมูลชุดที่ 2 ประกอบด้วย ตัวแปรอิสระที่เป็นข้อมูลเชิงกลุ่ม 9 ตัวแปร และข้อมูลชุดที่ 3 ประกอบด้วย ตัวแปรอิสระที่เป็นข้อมูลต่อเนื่องจำนวน 9 ตัวแปร การเปรียบเทียบดำเนินการภายใต้เงื่อนไข 1) ข้อมูลจำนวน 3 ชุด 2) ข้อมูลสูญหาย 3 ประเภท ได้แก่ การสูญหายแบบสุ่มอย่างสมบูรณ์ (Missing Completely at Random; MCAR) การสูญหายแบบสุ่ม (Missing at Random; MAR) และการสูญหายแบบไม่สุ่ม (Not Missing at Random; NMAR) 3) ร้อยละของข้อมูลสูญหาย ได้แก่ ร้อยละ 5, 10, 15, 20, 25 และ 30 ผลการวิเคราะห์ความถูกต้องของการจำแนกประเภทพบว่า ในภาพรวมภายใต้ทุกเงื่อนไขของการทดลองเราแนะนำให้ใช้วิธี RF และ SVM ภายใต้เงื่อนไขการสูญหายแบบสุ่มอย่างสมบูรณ์ และการสูญหายแบบสุ่ม แนะนำให้ใช้วิธี SVM ภายใต้เงื่อนไขการสูญหายแบบไม่สุ่ม เราแนะนำให้ใช้วิธี RFThe purpose of this study was to compare accuracy of binary classification based on missing data imputations methods namely: Support Vector Machines (SVM); Neural Networks (NN); Random Forests (RF); Multiple Imputation (MI) and Bagged Tree Imputation (BTI). Three data sets comprise: 1) 7 categorical and 9 continuous independent variables, 2) 9 categorical independent variables and 3) 9 continuous independent variables. The comparisons were made with the following conditions: 1) Three data sets; 2) three types of missing data: Missing Completely at Random (MCAR), Missing at Random (MAR) and Not Missing at Random (NMAR); 3) six levels of percentage of missing data (5, 10, 15, 20, 25 and 30). We analyze which imputation method influences most the classifiers’ accuracy. The best imputations in overall were obtained using RF and SVM, the imputation under MAR and MCAR were obtained sing SVM, the imputation under NMAR were obtained using RF.
 
Publisher The Journal of King Mongkut's University of Technology North Bangkok
 
Contributor Doctor of Philosophy (Educational Research and Evaluation) Department, Faculty of Education, Ubon Ratchathani Rajabhat University, Thailand.
 
Date 2020-07-02
 
Type info:eu-repo/semantics/article
info:eu-repo/semantics/publishedVersion

 
Format application/pdf
 
Identifier http://ojs.kmutnb.ac.th/index.php/kjournal/article/view/2638
10.14416/j.kmutnb.2020.07.002
 
Source วารสารวิชาการพระจอมเกล้าพระนครเหนือ (The Journal of King Mongkut's University of Technology North Bangkok); Vol 31, No 1 (2021): January-March; 90-98
2465-4698
0857-684X
 
Relation http://ojs.kmutnb.ac.th/index.php/kjournal/article/view/2638/3339
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/600
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/601
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/602
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/603
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/604
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/605
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/606
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/607
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/608
http://ojs.kmutnb.ac.th/index.php/kjournal/article/downloadSuppFile/2638/609
 

Contact Us

The PKP Index is an initiative of the Public Knowledge Project.

For PKP Publishing Services please use the PKP|PS contact form.

For support with PKP software we encourage users to consult our wiki for documentation and search our support forums.

For any other correspondence feel free to contact us using the PKP contact form.

Find Us

Twitter

Copyright © 2015-2018 Simon Fraser University Library