STMIKJAYAKARTASTMIKJAYAKARTA

Jurnal Manajamen Informatika JayakartaJurnal Manajamen Informatika Jayakarta

Data merupakan salah satu komponen terpenting dalam melakukan sebuah penelitian. Ketersediaan data dapat memudahkan penelitian yang akan dilakukan. Dalam penelitian di berbagai bidang membutuhkan data yang lengkap. Namun kenyataannya adalah selalu ada beberapa komponen data yang tidak lengkap atau dikenal dengan istilah Missing Value. Penyebab terjadinya Missing Value karena informasi tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada. Salah satu proses yang digunakan dalam menentukan serta menetapkan nilai dalam mengganti Missing Value disebut dengan teknik imputasi. Pada Option Test dengan menggunakan k-fold cross validation dengan fold sebesar 10 menghasilkan nilai akurasi tertinggi adalah dengan melakukan penanganan Missing Value dengan menghapus data sebesar 0,985 dengan Missing Value sebesar 10%. Dari total data 136, 2 data salah diprediksi dan 134 data berhasil diprediksi dengan benar. Dari ketiga metode, nilai akurasi paling tinggi sebesar 0,985 dengan penanganan Missing Value dilakukan dengan menghapus data dengan tingkat Missing Value sebesar 10%. Adapun presisi dan Recall sebesar 0,984 dan 0,985. Sedangkan dengan Option Test percetage split menghasilkan pengolahan data dengan penanganan Missing Value dengan menghapus data menghasilkan nilai akurasi tertinggi sebesar 1 dengan nilai Recall dan presisi pun sebesar 1. Dari 44 data, semua data berhasil diprediksi dengan benar. Dari beberapa hasil pengolahan data dari data hasil imputasi menunjukkan bahwa nilai akurasi tertinggi berada pada data hasil penanganan Missing Value dengan cara menghapus data.

Penanganan Missing Value dapat dilakukan dengan tiga metode.imputasi menggunakan algoritma K-Means, imputasi berdasarkan rata-rata (Mean), dan penghapusan data yang memiliki Missing Value.Ketiga metode ini diterapkan pada data dengan tingkat Missing Value sebesar 10%, 20%, dan 30%.Hasil menunjukkan bahwa performa klasifikasi menggunakan algoritma Naïve Bayes paling tinggi ketika Missing Value ditangani dengan menghapus data, terutama pada tingkat Missing Value 10%, yang menghasilkan akurasi hingga 0,985.Meskipun imputasi K-Means dan Mean memberikan hasil yang stabil di atas 90%, metode penghapusan data memberikan akurasi, presisi, dan recall tertinggi dibandingkan metode imputasi.

Pertama, perlu diteliti bagaimana pengaruh penggunaan teknik imputasi K-Means dengan jumlah cluster yang dinamis terhadap performa klasifikasi Naïve Bayes pada dataset dengan karakteristik berbeda, seperti data berdimensi tinggi atau data tidak seimbang. Kedua, sebaiknya dikembangkan penelitian yang membandingkan gabungan metode imputasi, misalnya K-Means dengan Mean secara hibrida, untuk melihat apakah pendekatan campuran dapat mengurangi bias dan meningkatkan akurasi dibandingkan metode tunggal. Ketiga, penting untuk dievaluasi dampak penanganan Missing Value terhadap kinerja algoritma lain selain Naïve Bayes, seperti Decision Tree atau SVM, dalam konteks yang sama, agar hasil temuan lebih generalisasi dan dapat dijadikan pedoman pemilihan strategi pra-pemrosesan data secara luas. Ketiga ide ini membuka arah baru dalam optimasi kualitas data dan pemilihan metode klasifikasi yang lebih tepat. Penelitian lanjutan sebaiknya tidak hanya fokus pada satu teknik atau satu algoritma, tetapi menjajaki kombinasi strategi untuk meningkatkan robustness sistem klasifikasi. Dengan demikian, hasil penelitian dapat lebih relevan untuk diterapkan dalam berbagai skenario dunia nyata. Pendekatan hibrida dan perbandingan lintas algoritma menjadi kunci dalam pengembangan sistem data mining yang lebih andal. Fokus pada generalisasi hasil juga penting agar temuan tidak terbatas pada dataset iris semata. Melalui eksplorasi ini, diharapkan dapat ditemukan panduan komprehensif dalam penanganan nilai hilang yang adaptif dan efektif.

  1. PENERAPAN TEKNIK IMPUTASI K-MEANS TERHADAP PERFORMA HASIL KLASIFIKASI ALGORITMA NAÏVE BAYES | Jurnal... journal.stmikjayakarta.ac.id/index.php/JMIJayakarta/article/view/1765PENERAPAN TEKNIK IMPUTASI K MEANS TERHADAP PERFORMA HASIL KLASIFIKASI ALGORITMA NAyaVE BAYES Jurnal journal stmikjayakarta ac index php JMIJayakarta article view 1765
Read online
File size557.13 KB
Pages11
DMCAReport

Related /

ads-block-test