JRTPPIJRTPPI

Jurnal Riset Teknologi Pencegahan Pencemaran IndustriJurnal Riset Teknologi Pencegahan Pencemaran Industri

Pemantauan kualitas udara sering menghadapi masalah data yang hilang akibat kesalahan teknis, kerusakan peralatan, atau penyebab lainnya. Penelitian ini menggunakan dataset PM2.5 dan PM10 dari stasiun 6, menghitung probabilitas bobot yang beragam untuk imputasi. Metodologi yang digunakan dalam penelitian ini mencakup simulasi pola data yang hilang menggunakan teknik amputasi multivariat (MCAR, MAR, dan MNAR), diikuti dengan penerapan metode imputasi berbasis machine learning - Random Forest dan missForest. Kinerja setiap metode dinilai menggunakan metrik evaluasi statistik: Root Mean Square Error (RMSE), Nash-Sutcliffe Efficiency (NSE), dan Kling-Gupta Efficiency (KGE) dengan nilai hilang diperkenalkan pada tingkat 10%, 40%, dan 70%. Hasil menunjukkan bahwa missForest secara konsisten outperforms Random Forest di semua tingkat kekurangan dan jenis amputasi. Misalnya, dalam skenario data yang hilang rendah (10%), MF mencapai nilai RMSE sebesar 0,83 (PM2.5) dan 1,76 (PM10), dengan skor NSE dan KGE sempurna (1,00), sedangkan RF menghasilkan RMSE yang lebih tinggi dan efisiensi yang sedikit lebih rendah. Bahkan di bawah kondisi data yang hilang tinggi (70%), MF mempertahankan kinerja yang kuat dengan nilai RMSE sebesar 10,54 dan NSE di atas 0,87. Temuan ini menunjukkan keunggulan MF dalam akurasi dan ketahanan dalam menangani data kualitas udara yang hilang.

Penelitian ini menekankan pentingnya teknik imputasi data yang akurat, dengan MissForest terbukti menjadi metode yang andal dan kuat untuk menangani data yang hilang pada berbagai tingkat kompleksitas dalam Indeks Kualitas Udara.Temuan menekankan pentingnya pendekatan yang disesuaikan dan menyoroti keterbatasan serta kekuatan strategi imputasi yang berbeda untuk meningkatkan integritas dan analisis data.

Untuk penelitian lanjutan, disarankan untuk menerapkan teknik imputasi data yang lebih canggih, seperti MissForest, untuk menangani data kualitas udara yang hilang. Penelitian ini menunjukkan bahwa MissForest mampu menangani data yang hilang dengan akurasi tinggi, bahkan pada tingkat kekurangan yang tinggi. Oleh karena itu, penelitian lanjutan dapat berfokus pada pengembangan dan penerapan teknik imputasi yang lebih canggih untuk meningkatkan akurasi dan ketahanan dalam menangani data kualitas udara yang hilang. Selain itu, penelitian dapat mengeksplorasi penggunaan teknik imputasi yang berbeda untuk berbagai jenis data kualitas udara, seperti data kontinu, diskrit, biner, atau kategorik. Dengan demikian, penelitian lanjutan dapat memberikan kontribusi pada pengembangan metode imputasi yang lebih efektif dan akurat untuk analisis kualitas udara.

  1. Missing Value Imputation via Clusterwise Linear Regression | IEEE Journals & Magazine | IEEE Xplore.... doi.org/10.1109/TKDE.2020.3001694Missing Value Imputation via Clusterwise Linear Regression IEEE Journals Magazine IEEE Xplore doi 10 1109 TKDE 2020 3001694
  2. 0. ask publishers restore access books wayback machine texts audio software images donate archive sign... doi.org/10.1177/09622802135110270 ask publishers restore access books wayback machine texts audio software images donate archive sign doi 10 1177 0962280213511027
Read online
File size420.65 KB
Pages9
DMCAReport

Related /

ads-block-test