STMIKJAYAKARTASTMIKJAYAKARTA
Jurnal Manajamen Informatika JayakartaJurnal Manajamen Informatika JayakartaData merupakan salah satu komponen terpenting dalam melakukan sebuah penelitian. Ketersediaan data dapat memudahkan penelitian yang akan dilakukan. Dalam penelitian di berbagai bidang membutuhkan data yang lengkap. Namun kenyataannya adalah selalu ada beberapa komponen data yang tidak lengkap atau dikenal dengan istilah Missing Value. Penyebab terjadinya Missing Value karena informasi tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada. Salah satu proses yang digunakan dalam menentukan serta menetapkan nilai dalam mengganti Missing Value disebut dengan teknik imputasi. Pada Option Test dengan menggunakan k-fold cross validation dengan fold sebesar 10 menghasilkan nilai akurasi tertinggi adalah dengan melakukan penanganan Missing Value dengan menghapus data sebesar 0,985 dengan Missing Value sebesar 10%. Dari total data 136, 2 data salah diprediksi dan 134 data berhasil diprediksi dengan benar. Dari ketiga metode, nilai akurasi paling tinggi sebesar 0,985 dengan penanganan Missing Value dilakukan dengan menghapus data dengan tingkat Missing Value sebesar 10%. Adapun presisi dan Recall sebesar 0,984 dan 0,985. Sedangkan dengan Option Test percetage split menghasilkan pengolahan data dengan penanganan Missing Value dengan menghapus data menghasilkan nilai akurasi tertinggi sebesar 1 dengan nilai Recall dan presisi pun sebesar 1. Dari 44 data, semua data berhasil diprediksi dengan benar. Dari beberapa hasil pengolahan data dari data hasil imputasi menunjukkan bahwa nilai akurasi tertinggi berada pada data hasil penanganan Missing Value dengan cara menghapus data.
Penanganan Missing Value dapat dilakukan dengan tiga metode.imputasi menggunakan algoritma K-Means, imputasi berdasarkan rata-rata (Mean), dan penghapusan data yang memiliki Missing Value.Ketiga metode ini diterapkan pada data dengan tingkat Missing Value sebesar 10%, 20%, dan 30%.Hasil menunjukkan bahwa performa klasifikasi menggunakan algoritma Naïve Bayes paling tinggi ketika Missing Value ditangani dengan menghapus data, terutama pada tingkat Missing Value 10%, yang menghasilkan akurasi hingga 0,985.Meskipun imputasi K-Means dan Mean memberikan hasil yang stabil di atas 90%, metode penghapusan data memberikan akurasi, presisi, dan recall tertinggi dibandingkan metode imputasi.
Pertama, perlu diteliti bagaimana pengaruh penggunaan teknik imputasi K-Means dengan jumlah cluster yang dinamis terhadap performa klasifikasi Naïve Bayes pada dataset dengan karakteristik berbeda, seperti data berdimensi tinggi atau data tidak seimbang. Kedua, sebaiknya dikembangkan penelitian yang membandingkan gabungan metode imputasi, misalnya K-Means dengan Mean secara hibrida, untuk melihat apakah pendekatan campuran dapat mengurangi bias dan meningkatkan akurasi dibandingkan metode tunggal. Ketiga, penting untuk dievaluasi dampak penanganan Missing Value terhadap kinerja algoritma lain selain Naïve Bayes, seperti Decision Tree atau SVM, dalam konteks yang sama, agar hasil temuan lebih generalisasi dan dapat dijadikan pedoman pemilihan strategi pra-pemrosesan data secara luas. Ketiga ide ini membuka arah baru dalam optimasi kualitas data dan pemilihan metode klasifikasi yang lebih tepat. Penelitian lanjutan sebaiknya tidak hanya fokus pada satu teknik atau satu algoritma, tetapi menjajaki kombinasi strategi untuk meningkatkan robustness sistem klasifikasi. Dengan demikian, hasil penelitian dapat lebih relevan untuk diterapkan dalam berbagai skenario dunia nyata. Pendekatan hibrida dan perbandingan lintas algoritma menjadi kunci dalam pengembangan sistem data mining yang lebih andal. Fokus pada generalisasi hasil juga penting agar temuan tidak terbatas pada dataset iris semata. Melalui eksplorasi ini, diharapkan dapat ditemukan panduan komprehensif dalam penanganan nilai hilang yang adaptif dan efektif.
| File size | 557.13 KB |
| Pages | 11 |
| DMCA | Report |
Related /
STMIKJAYAKARTASTMIKJAYAKARTA Aplikasi ini bertujuan untuk meningkatkan efisiensi pengelolaan tugas akhir dan mempermudah koordinator program studi, dosen, dan mahasiswa dalam memantauAplikasi ini bertujuan untuk meningkatkan efisiensi pengelolaan tugas akhir dan mempermudah koordinator program studi, dosen, dan mahasiswa dalam memantau
UNDIRAUNDIRA Hasil Pengolahan Data PKM (2021) Pemilik Catering Shakira mengusulkan agar di masa yang akan datang diadakan pelatihan lagi ke crew Catering Shakira lainnya,Hasil Pengolahan Data PKM (2021) Pemilik Catering Shakira mengusulkan agar di masa yang akan datang diadakan pelatihan lagi ke crew Catering Shakira lainnya,
POLTEKKES DENPASARPOLTEKKES DENPASAR Kelelahan dapat disebabkan oleh beberapa faktor risiko seperti usia, hipertensi, indeks massa tubuh (IMT), masa kerja, durasi kerja, pola kerja, dan perokokKelelahan dapat disebabkan oleh beberapa faktor risiko seperti usia, hipertensi, indeks massa tubuh (IMT), masa kerja, durasi kerja, pola kerja, dan perokok
STMIKJAYAKARTASTMIKJAYAKARTA Salah satu sumber nutrisi selain ASI adalah Susu Formula (SUFOR), yang berperan signifikan dalam melengkapi kebutuhan gizi balita. Namun, banyaknya variasiSalah satu sumber nutrisi selain ASI adalah Susu Formula (SUFOR), yang berperan signifikan dalam melengkapi kebutuhan gizi balita. Namun, banyaknya variasi
STMIKJAYAKARTASTMIKJAYAKARTA Terkenal karena kemampuannya mempercantik ruang di rumah dan kantor, Logofurni memperluas kehadirannya melalui platform online dengan desain UI/UX untukTerkenal karena kemampuannya mempercantik ruang di rumah dan kantor, Logofurni memperluas kehadirannya melalui platform online dengan desain UI/UX untuk
STMIKJAYAKARTASTMIKJAYAKARTA Hal ini menjadi sebuah masalah karena pada prakteknya, pengguna membutuhkan kategori surat yang dapat disesuaikan terhadap kebutuhan pengguna. MelaluiHal ini menjadi sebuah masalah karena pada prakteknya, pengguna membutuhkan kategori surat yang dapat disesuaikan terhadap kebutuhan pengguna. Melalui
STMIKJAYAKARTASTMIKJAYAKARTA Penelitian ini dibuat berdasarkan data yang telah ada sebelumnya yaitu dengan 100 data training dan 9 data uji menggunakan metode data mining Naïve BayesPenelitian ini dibuat berdasarkan data yang telah ada sebelumnya yaitu dengan 100 data training dan 9 data uji menggunakan metode data mining Naïve Bayes
STMIKJAYAKARTASTMIKJAYAKARTA Setelah seleksi, dataset dibagi menjadi subset pelatihan dan pengujian, tanpa adanya data anomali atau kesalahan cetak. Tidak diperlukan transformasi data,Setelah seleksi, dataset dibagi menjadi subset pelatihan dan pengujian, tanpa adanya data anomali atau kesalahan cetak. Tidak diperlukan transformasi data,
Useful /
STMIKJAYAKARTASTMIKJAYAKARTA Penelitian ini bertujuan mengembangkan media pembelajaran interaktif berbasis AR dengan fitur Head tracking quiz sebagai solusi pembelajaran dan pelestarianPenelitian ini bertujuan mengembangkan media pembelajaran interaktif berbasis AR dengan fitur Head tracking quiz sebagai solusi pembelajaran dan pelestarian
POLTEKKES DENPASARPOLTEKKES DENPASAR Jeruk bali dikenal mengandung bahan aktif seperti alkaloid, tanin, dan vitamin C. Senyawa aktif paling banyak terdapat pada kulitnya, namun belum dimanfaatkanJeruk bali dikenal mengandung bahan aktif seperti alkaloid, tanin, dan vitamin C. Senyawa aktif paling banyak terdapat pada kulitnya, namun belum dimanfaatkan
POLTEKKES DENPASARPOLTEKKES DENPASAR Ibu hamil di Rumah Sakit Umum Daerah Bali Mandara secara umum memiliki pengetahuan yang baik tentang vaksinasi COVID-19, meskipun sebagian kecil masihIbu hamil di Rumah Sakit Umum Daerah Bali Mandara secara umum memiliki pengetahuan yang baik tentang vaksinasi COVID-19, meskipun sebagian kecil masih
POLTEKKES DENPASARPOLTEKKES DENPASAR This writing aims to determine the difference in the level of anxiety of third trimester pregnant women in dealing with labor given prenatal yoga at theThis writing aims to determine the difference in the level of anxiety of third trimester pregnant women in dealing with labor given prenatal yoga at the