UNDANAUNDANA

J-ICON: Jurnal Komputer dan InformatikaJ-ICON: Jurnal Komputer dan Informatika

Studi ini menyajikan metodologi terstruktur untuk pengembangan dataset khusus dari catatan kunjungan pasien yang dikumpulkan antara 1 Januari 2019 dan 31 Desember 2021 di fasilitas kesehatan Kabupaten Bandung, Indonesia. Catatan medis mentah ditransformasikan menjadi dataset yang siap untuk pembelajaran mesin melalui proses seperti ekstraksi fitur, pelabelan, dan pengayaan spasial menggunakan koordinasi garis bujur dan lintang. Informasi identifikasi pribadi dihapus, dan gejala klinis distandarisasi menjadi variabel terstruktur untuk mendukung tugas pembelajaran mesin, termasuk klasifikasi penyakit, prediksi rujukan, dan deteksi kluster spasial. Dataset akhir terdiri dari 1.015 kasus COV, 1.356 kasus DHF, dan 308 kasus VAR. Dataset ini telah digunakan dalam eksperimen yang melibatkan analisis penting fitur dengan SHAP dan LIME, klaster spasial, dan pembangkitan data sintetis untuk mengatasi masalah privasi dan ketersediaan data. Metodologi ini dirancang untuk mendukung penelitian masa depan dalam analitik kesehatan dan pengembangan sistem pendukung keputusan dan alat perencanaan kesehatan masyarakat.

Studi ini berkontribusi pada pengembangan sistem pendukung keputusan, meskipun diperlukan validasi lebih lanjut dengan pemangku kepentingan kesehatan.Metodologi mencakup ekstraksi data, transformasi, anonimisasi, rekayasa fitur, dan pengayaan spasial, memastikan dataset memenuhi standar analitik dan etis mengenai kerahasiaan pasien.Hasil eksperimen menunjukkan utilitas dataset dalam tugas pembelajaran mesin, termasuk klasifikasi penyakit, prediksi rujukan, dan analisis spasial klaster.Integrasi teknik interpretabilitas model (SHAP dan LIME) meningkatkan transparansi dan kepercayaan pada output prediktif.Pembangkitan data sintetis mengatasi keterbatasan ketersediaan data dan privasi, menawarkan jalur layak untuk pelatihan dan validasi model di konteks kesehatan yang sensitif.

Kemungkinan penelitian lanjutan meliputi: (1) pengembangan dataset yang terintegrasi dari berbagai wilayah geografis dengan tren penyakit berbeda untuk meningkatkan generalisasi model; (2) eksplorasi metode sintesis data alternatif yang mempertimbangkan karakteristik epidemiologi penyakit; (3) analisis interaksi antara gejala klinis dan faktor lingkungan seperti perubahan iklim untuk memperkuat prediksi kluster spasial.

  1. The Effect of Combined Synthetic Tabular Data Generated Using CTGAN Model with Actual Data on Performance... journal.esrgroups.org/jes/article/view/3797The Effect of Combined Synthetic Tabular Data Generated Using CTGAN Model with Actual Data on Performance journal esrgroups jes article view 3797
  2. Browser Not SupportedPredicting Infectious Diseases Using XGBoost Algorithm and Discovering Dominant... doi.org/10.1109/ICoCSETI63724.2025.11019611Browser Not SupportedPredicting Infectious Diseases Using XGBoost Algorithm and Discovering Dominant doi 10 1109 ICoCSETI63724 2025 11019611
  3. J-ICON: Jurnal Komputer dan Informatika. constructing dataset infectious disease prediction spatial cluster... doi.org/10.35508/jicon.v13i2.23729J ICON Jurnal Komputer dan Informatika constructing dataset infectious disease prediction spatial cluster doi 10 35508 jicon v13i2 23729
  4. Prediction of DHF (Dengue Hemorrhagic Fever) Severity Using Random Forest, KNN, Decision Tree and Naïve... doi.org/10.1109/ICITDA55840.2022.9971377Prediction of DHF Dengue Hemorrhagic Fever Severity Using Random Forest KNN Decision Tree and Nayve doi 10 1109 ICITDA55840 2022 9971377
Read online
File size351.49 KB
Pages8
DMCAReport

Related /

ads-block-test