STMIKJAYAKARTASTMIKJAYAKARTA
Jurnal Manajamen Informatika JayakartaJurnal Manajamen Informatika JayakartaData merupakan salah satu komponen terpenting dalam melakukan sebuah penelitian. Ketersediaan data dapat memudahkan penelitian yang akan dilakukan. Dalam penelitian di berbagai bidang membutuhkan data yang lengkap. Namun kenyataannya adalah selalu ada beberapa komponen data yang tidak lengkap atau dikenal dengan istilah Missing Value. Penyebab terjadinya Missing Value karena informasi tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada. Salah satu proses yang digunakan dalam menentukan serta menetapkan nilai dalam mengganti Missing Value disebut dengan teknik imputasi. Pada Option Test dengan menggunakan k-fold cross validation dengan fold sebesar 10 menghasilkan nilai akurasi tertinggi adalah dengan melakukan penanganan Missing Value dengan menghapus data sebesar 0,985 dengan Missing Value sebesar 10%. Dari total data 136, 2 data salah diprediksi dan 134 data berhasil diprediksi dengan benar. Dari ketiga metode, nilai akurasi paling tinggi sebesar 0,985 dengan penanganan Missing Value dilakukan dengan menghapus data dengan tingkat Missing Value sebesar 10%. Adapun presisi dan Recall sebesar 0,984 dan 0,985. Sedangkan dengan Option Test percetage split menghasilkan pengolahan data dengan penanganan Missing Value dengan menghapus data menghasilkan nilai akurasi tertinggi sebesar 1 dengan nilai Recall dan presisi pun sebesar 1. Dari 44 data, semua data berhasil diprediksi dengan benar. Dari beberapa hasil pengolahan data dari data hasil imputasi menunjukkan bahwa nilai akurasi tertinggi berada pada data hasil penanganan Missing Value dengan cara menghapus data.
Penanganan Missing Value dapat dilakukan dengan tiga metode.imputasi menggunakan algoritma K-Means, imputasi berdasarkan rata-rata (Mean), dan penghapusan data yang memiliki Missing Value.Ketiga metode ini diterapkan pada data dengan tingkat Missing Value sebesar 10%, 20%, dan 30%.Hasil menunjukkan bahwa performa klasifikasi menggunakan algoritma Naïve Bayes paling tinggi ketika Missing Value ditangani dengan menghapus data, terutama pada tingkat Missing Value 10%, yang menghasilkan akurasi hingga 0,985.Meskipun imputasi K-Means dan Mean memberikan hasil yang stabil di atas 90%, metode penghapusan data memberikan akurasi, presisi, dan recall tertinggi dibandingkan metode imputasi.
Pertama, perlu diteliti bagaimana pengaruh penggunaan teknik imputasi K-Means dengan jumlah cluster yang dinamis terhadap performa klasifikasi Naïve Bayes pada dataset dengan karakteristik berbeda, seperti data berdimensi tinggi atau data tidak seimbang. Kedua, sebaiknya dikembangkan penelitian yang membandingkan gabungan metode imputasi, misalnya K-Means dengan Mean secara hibrida, untuk melihat apakah pendekatan campuran dapat mengurangi bias dan meningkatkan akurasi dibandingkan metode tunggal. Ketiga, penting untuk dievaluasi dampak penanganan Missing Value terhadap kinerja algoritma lain selain Naïve Bayes, seperti Decision Tree atau SVM, dalam konteks yang sama, agar hasil temuan lebih generalisasi dan dapat dijadikan pedoman pemilihan strategi pra-pemrosesan data secara luas. Ketiga ide ini membuka arah baru dalam optimasi kualitas data dan pemilihan metode klasifikasi yang lebih tepat. Penelitian lanjutan sebaiknya tidak hanya fokus pada satu teknik atau satu algoritma, tetapi menjajaki kombinasi strategi untuk meningkatkan robustness sistem klasifikasi. Dengan demikian, hasil penelitian dapat lebih relevan untuk diterapkan dalam berbagai skenario dunia nyata. Pendekatan hibrida dan perbandingan lintas algoritma menjadi kunci dalam pengembangan sistem data mining yang lebih andal. Fokus pada generalisasi hasil juga penting agar temuan tidak terbatas pada dataset iris semata. Melalui eksplorasi ini, diharapkan dapat ditemukan panduan komprehensif dalam penanganan nilai hilang yang adaptif dan efektif.
| File size | 557.13 KB |
| Pages | 11 |
| DMCA | Report |
Related /
POLIMEDIAPOLIMEDIA Penelitian ini menyimpulkan bahwa pembuatan sistem informasi harus melalui tahapan perancangan yang sistematis sesuai teori yang berlaku. Sistem InformasiPenelitian ini menyimpulkan bahwa pembuatan sistem informasi harus melalui tahapan perancangan yang sistematis sesuai teori yang berlaku. Sistem Informasi
PANDAWANPANDAWAN Integrasi desentralisasi, ketidakubahannya, dan otomatisasi kontrak cerdas dalam struktur blockchain berizin memastikan transaksi akademik yang aman danIntegrasi desentralisasi, ketidakubahannya, dan otomatisasi kontrak cerdas dalam struktur blockchain berizin memastikan transaksi akademik yang aman dan
HOSTJOURNALSHOSTJOURNALS Permasalahan yang terjadi banyak proses kinerja karyawan perusahaan yang dinilai tidak efisien dalam melakukan proses pelaporan. Pelaporan perusahaan menggunakanPermasalahan yang terjadi banyak proses kinerja karyawan perusahaan yang dinilai tidak efisien dalam melakukan proses pelaporan. Pelaporan perusahaan menggunakan
IVETIVET Jumlah siswa di SDN 04 Talago Lubuk Sikaping yang banyak menyebabkan sering terjadi kesalahan dalam penginputan nilai siswa. Hal ini menyebabkan prosesJumlah siswa di SDN 04 Talago Lubuk Sikaping yang banyak menyebabkan sering terjadi kesalahan dalam penginputan nilai siswa. Hal ini menyebabkan proses
PENERBITPENERBIT Studi tentang variabel tersebut masih jarang dilakukan dalam konteks Perguruan Tinggi Keagamaan Islam (PTKI). Oleh karena itu, penelitian ini bertujuanStudi tentang variabel tersebut masih jarang dilakukan dalam konteks Perguruan Tinggi Keagamaan Islam (PTKI). Oleh karena itu, penelitian ini bertujuan
LMULMU ada akses jalan Jalan Usaha Tani, dekat dengan tempat ibadah, kontur tanah lebih tinggi dan sebagian besar lahan di bekas tanaman keras (karet) sehinggaada akses jalan Jalan Usaha Tani, dekat dengan tempat ibadah, kontur tanah lebih tinggi dan sebagian besar lahan di bekas tanaman keras (karet) sehingga
UNIKOMUNIKOM Persentase kombinasi metode hybrid sampling memengaruhi efisiensi algoritma. Penggunaan kombinasi goal biasing sampling 90%, boundary sampling 5%, danPersentase kombinasi metode hybrid sampling memengaruhi efisiensi algoritma. Penggunaan kombinasi goal biasing sampling 90%, boundary sampling 5%, dan
ATIDEWANTARAATIDEWANTARA Kegiatan PKM dilaksanakan di PT. Tunas Baru Lampung (TBK) yang merupakan suatu industri pabrik yang menghasilkan beragam produk komersial bagi masyarakat.Kegiatan PKM dilaksanakan di PT. Tunas Baru Lampung (TBK) yang merupakan suatu industri pabrik yang menghasilkan beragam produk komersial bagi masyarakat.
Useful /
IVETIVET Hasilnya berupa produk flipbook yang meningkatkan minat literasi peserta didik sebesar 81,6% dibandingkan sebelum menggunakan flipbook. Flipbook menawarkanHasilnya berupa produk flipbook yang meningkatkan minat literasi peserta didik sebesar 81,6% dibandingkan sebelum menggunakan flipbook. Flipbook menawarkan
ALMAATAALMAATA Tujuan: Mengetahui pengaruh pemberian tepung ulat sagu terhadap kadar albumin dan Hemoglobin (Hb) tikus wistar KEP. Metode: Penelitian true experimentalTujuan: Mengetahui pengaruh pemberian tepung ulat sagu terhadap kadar albumin dan Hemoglobin (Hb) tikus wistar KEP. Metode: Penelitian true experimental
STIKESNHSTIKESNH Salah satu intervensi keperawatan untuk menurunkan tekanan darah adalah terapi rendam kaki air hangat. Tujuan penelitian ini adalah untuk mengetahui pengaruhSalah satu intervensi keperawatan untuk menurunkan tekanan darah adalah terapi rendam kaki air hangat. Tujuan penelitian ini adalah untuk mengetahui pengaruh
PCUPCU Berdasarkan penelitian, dapat disimpulkan bahwa karakteristik generasi Y berdasarkan perspektifnya secara umum adalah keinginan untuk berkembang. GenerasiBerdasarkan penelitian, dapat disimpulkan bahwa karakteristik generasi Y berdasarkan perspektifnya secara umum adalah keinginan untuk berkembang. Generasi