ชื่อเรื่อง |
การเปรียบเทียบประสิทธิภาพในการทำนายผลความไม่สมดุลของข้อมูลการเสียชีวิต จากอุบัติเหตุบนโครงข่ายถนน โดยใช้เทคนิคการทำเหมืองข้อมูล Comparison of Imbalanced data classification efficiency to predict road accident deaths using data mining techniques |
บทคัดย่อ (ไทย) |
งานวิจัยนี้มีวัตถุประสงค์เพื่อวิเคราะห์ปัจจัยที่เกี่ยวข้องในการเสียชีวิตจากอุบัติเหตุบนโครงข่ายถนน และเพื่อเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลการเสียชีวิตบนโครงข่ายถนนของแบบจำลองการพยากรณ์ ประกอบด้วยเทคนิคเกรเดียนท์บูตทรีส์ เทคนิคต้นไม้ตัดสินใจ เทคนิคนาอีฟเบย์ เทคนิคแรนดอมฟอร์เรสต์ และเทคนิคการเรียนรู้เชิงลึก ซึ่งเป็นเทคนิคในการทำเหมืองข้อมูล กระบวนการวิจัยเป็นไปตามขั้นตอนของ CRISP- DM โดยศึกษาและรวบรวมข้อมูลอุบัติเหตุจากศูนย์เทคโนโลยีสารสนเทศและการสื่อสาร สำนักงานปลัดกระทรวงคมนาคม ระหว่างวันที่ 1 มกราคม 2562 - 30 มิถุนายน 2564 จำนวน 51,384 แถว ทำการคัดเลือกข้อมูล การกลั่นกรองข้อมูล การแปลงข้อมูลให้อยู่ในรูปแบบที่เหมาะสมก่อนนำไปวิเคราะห์และสร้างแบบจำลอง ผลการวิเคราะห์ปัจจัยที่เกี่ยวข้องในการเสียชีวิตจากอุบัติเหตุบนโครงข่ายถนน จากการคำนวณค่าน้ำหนักของข้อมูลที่มีความเกี่ยวข้องหรือสัมพันธ์ของแอตทริบิวต์ด้วยวิธีการ Gain Ratio พบว่าประเภทผู้ใช้รถหรือใช้ถนนมีค่าน้ำหนักมากที่สุด 0.1030 ผลการเปรียบเทียบประสิทธิภาพการจำแนกข้อมูลของแบบจำลองการพยากรณ์ด้วยการวัดประสิทธิภาพของแบบจำลองการพยากรณ์ด้วยวิธีการ K-Fold Cross Validation โดยแบ่งชุดข้อมูลออกเป็น 30 ส่วน พบว่าเทคนิคที่มีประสิทธิภาพการจำแนกข้อมูลดีที่สุด คือ เทคนิคนาอีฟเบย์มีค่าความถูกต้อง 72.23% ค่าประสิทธิภาพโดยรวม 73.35% และค่าเฉลี่ยเรขาคณิต 72.10% จากการวิจัยนี้สามารถนำไปใช้เป็นข้อมูลป้องกันอุบัติภัยทางถนนในแต่ละพื้นที่ได้อย่างมีประสิทธิภาพ ลดความเสี่ยง ลดผลกระทบ และเตรียมความพร้อมในการป้องกันอุบัติภัยบนโครงข่ายถนนที่อาจจะเกิดขึ้น
[-]
|
บทคัดย่อ (อังกฤษ) |
This research has an objective to analyze the factors involved in road accident deaths and to compare the classification efficiency of road fatalities data of forecasting models. Consists of Gradient Boosted Tree, Decision Tree, Naïve Bayes, Random Forest, and Deep Learning which is a data mining technique based on the CRISP-DM methodology. Study and collect accident data 51,384-row from the Information and Communication Technology Center Office of the Permanent Secretary for Transport between 1 January 2019 - 30 June 2021. The data was prepared and cleaned before being analyzed and modeled. The results of the analysis of factors involved in road accident deaths by calculating the weight of relevant data or related attributes using the Gain Ratio method, it was found that the type of vehicle or road user weighted 0.1030. The results of the comparison of the classification efficiency of forecast model data by measuring the performance of the forecast model using the K-Fold Cross Validation method; it was divided into 30 fold, showed that the Naïve Bayes technique had the highest accuracy of 72.23% F1-measure of 73.35% and G-mean of 72.10%. The results of this research can be used as information to effectively prevent road accidents in each area, reduce risks, reduce impacts and prepare for road accident prevention that may occur.
[-] |
ผู้แต่ง |
นรินทร์ จิวิตัน
|
ปีที่เผยแพร่ (ค.ศ.) |
2022 |
ปีที่เผยแพร่ (พ.ศ.) |
2565 |
วารสาร |
ชื่อวารสาร : วารสารเทคโนโลยีสารสนเทศ
ปีที่ : 18
ฉบับที่ : 1
|
หน้า |
75-84 |
ประเภทเอกสาร |
บทความตีพิมพ์วารสารวิชาการ |
ประเภทของวารสาร |
ภายในประเทศ |
คำสำคัญ |
อุบัติเหตุ; เกรเดียนท์บูตทรีส์; แรนดอมฟอร์เรสต์; นาอีฟเบย์; การเรียนรู้เชิงลึก |
หมวดหมู่ |
การให้ความรู้และรณรงค์ ประชาสัมพันธ์; การวางแผนป้องกันและแก้ไขอุบัติเหตุทางถนน; การวิเคราะห์ข้อมูลสะท้อนสถานการณ์ความปลอดภัยทางถนน; แบบจำลองและการวิเคราะห์ปัจจัยของอุบัติเหตุและการบาดเจ็บ |
ภาษา |
ภาษาไทย |
ลิงค์แหล่งที่มา |
https://ph01.tci-thaijo.org/index.php/IT_Journal/article/view/248868 |
ไฟล์ดาวน์โหลด |
|
อัพเดทล่าสุด |
Friday, July 1, 2022 |