IVETIVET

Joined Journal (Journal of Informatics Education)Joined Journal (Journal of Informatics Education)

Demam Berdarah Dengue (DBD) merupakan penyakit endemis yang masih menjadi tantangan kesehatan masyarakat di Indonesia. Deteksi dini terhadap potensi munculnya kasus DBD sangat krusial untuk penanggulangan yang cepat dan tepat. Penelitian ini bertujuan untuk mengembangkan model prediksi kasus DBD menggunakan Regresi Logistik Biner dengan penanganan data tidak seimbang melalui teknik Synthetic Minority Over-sampling Technique (SMOTE) dan optimasi model menggunakan hyperparameter tuning. Dataset yang digunakan mencakup data cuaca dan kasus DBD di wilayah Purwokerto tahun 2022–2024. Hasil penelitian menunjukkan bahwa setelah dilakukan penyeimbangan data dan tuning parameter, model mampu mencapai akurasi validasi silang sebesar 84,12%, meskipun akurasi pada data uji menurun menjadi 64%. Meskipun demikian, pendekatan ini menunjukkan potensi dalam pemodelan prediktif kasus DBD yang lebih akurat dan inklusif.

Penelitian ini berhasil merancang model prediksi kejadian Demam Berdarah Dengue (DBD) di wilayah Purwokerto menggunakan algoritma Regresi Logistik Biner yang dioptimalkan melalui penerapan teknik Synthetic Minority Over-sampling Technique (SMOTE) untuk penanganan ketidakseimbangan data, serta tuning hyperparameter guna memperoleh konfigurasi model terbaik.Hasil tuning menunjukkan bahwa konfigurasi optimal diperoleh pada regularisasi L2 dengan nilai parameter C sebesar 1, yang menghasilkan akurasi validasi silang sebesar 84,12%.Namun demikian, akurasi model pada data pengujian turun menjadi 64%, menunjukkan adanya perbedaan performa antara proses pelatihan dan generalisasi terhadap data baru.Upaya penyesuaian threshold prediksi dari 0,5 ke 0,3 terbukti meningkatkan recall pada kelas minoritas dari 0,43 menjadi 0,57, walaupun disertai peningkatan prediksi positif palsu.

Penelitian lanjutan dapat mengkaji algoritma klasifikasi alternatif yang lebih adaptif terhadap ketidakseimbangan kelas, seperti Random Forest atau XGBoost, untuk meningkatkan sensitivitas deteksi kasus berisiko. Selain itu, penambahan variabel demografi atau faktor lingkungan lain seperti kepadatan populasi atau upaya pengendalian nyamuk dapat memperkaya model prediksi. Terakhir, validasi model di wilayah lain dengan karakteristik iklim dan dinamika penyakit berbeda dapat meningkatkan generalisasi dan relevansi hasil penelitian ini.

  1. A study of the behavior of several methods for balancing machine learning training data | ACM SIGKDD... dl.acm.org/doi/10.1145/1007730.1007735A study of the behavior of several methods for balancing machine learning training data ACM SIGKDD dl acm doi 10 1145 1007730 1007735
Read online
File size515.83 KB
Pages10
DMCAReport

Related /

ads-block-test