Penerapan Teknik Imputasi K Means Terhadap Performa Hasil Klasifikasi Algoritma Na ve Bayes

Anonymous journal.stmikjayakarta.ac.id

Publisher

STMIKJAYAKARTASTMIKJAYAKARTA

Journal Jurnal Manajamen Informatika Jayakarta Abstract

Data merupakan salah satu komponen terpenting dalam melakukan sebuah penelitian. Ketersediaan data dapat memudahkan penelitian yang akan dilakukan. Dalam penelitian di berbagai bidang membutuhkan data yang lengkap. Namun kenyataannya adalah selalu ada beberapa komponen data yang tidak lengkap atau dikenal dengan istilah Missing Value. Penyebab terjadinya Missing Value karena informasi tentang objek tidak diberikan, sulit dicari, atau memang informasi tersebut tidak ada. Salah satu proses yang digunakan dalam menentukan serta menetapkan nilai dalam mengganti Missing Value disebut dengan teknik imputasi. Pada Option Test dengan menggunakan k-fold cross validation dengan fold sebesar 10 menghasilkan nilai akurasi tertinggi adalah dengan melakukan penanganan Missing Value dengan menghapus data sebesar 0,985 dengan Missing Value sebesar 10%. Dari total data 136, 2 data salah diprediksi dan 134 data berhasil diprediksi dengan benar. Dari ketiga metode, nilai akurasi paling tinggi sebesar 0,985 dengan penanganan Missing Value dilakukan dengan menghapus data dengan tingkat Missing Value sebesar 10%. Adapun presisi dan Recall sebesar 0,984 dan 0,985. Sedangkan dengan Option Test percetage split menghasilkan pengolahan data dengan penanganan Missing Value dengan menghapus data menghasilkan nilai akurasi tertinggi sebesar 1 dengan nilai Recall dan presisi pun sebesar 1. Dari 44 data, semua data berhasil diprediksi dengan benar. Dari beberapa hasil pengolahan data dari data hasil imputasi menunjukkan bahwa nilai akurasi tertinggi berada pada data hasil penanganan Missing Value dengan cara menghapus data.

Conclusion

Penanganan Missing Value dapat dilakukan dengan tiga metode.imputasi menggunakan algoritma K-Means, imputasi berdasarkan rata-rata (Mean), dan penghapusan data yang memiliki Missing Value.Ketiga metode ini diterapkan pada data dengan tingkat Missing Value sebesar 10%, 20%, dan 30%.Hasil menunjukkan bahwa performa klasifikasi menggunakan algoritma Naïve Bayes paling tinggi ketika Missing Value ditangani dengan menghapus data, terutama pada tingkat Missing Value 10%, yang menghasilkan akurasi hingga 0,985.Meskipun imputasi K-Means dan Mean memberikan hasil yang stabil di atas 90%, metode penghapusan data memberikan akurasi, presisi, dan recall tertinggi dibandingkan metode imputasi.

Future Research

Pertama, perlu diteliti bagaimana pengaruh penggunaan teknik imputasi K-Means dengan jumlah cluster yang dinamis terhadap performa klasifikasi Naïve Bayes pada dataset dengan karakteristik berbeda, seperti data berdimensi tinggi atau data tidak seimbang. Kedua, sebaiknya dikembangkan penelitian yang membandingkan gabungan metode imputasi, misalnya K-Means dengan Mean secara hibrida, untuk melihat apakah pendekatan campuran dapat mengurangi bias dan meningkatkan akurasi dibandingkan metode tunggal. Ketiga, penting untuk dievaluasi dampak penanganan Missing Value terhadap kinerja algoritma lain selain Naïve Bayes, seperti Decision Tree atau SVM, dalam konteks yang sama, agar hasil temuan lebih generalisasi dan dapat dijadikan pedoman pemilihan strategi pra-pemrosesan data secara luas. Ketiga ide ini membuka arah baru dalam optimasi kualitas data dan pemilihan metode klasifikasi yang lebih tepat. Penelitian lanjutan sebaiknya tidak hanya fokus pada satu teknik atau satu algoritma, tetapi menjajaki kombinasi strategi untuk meningkatkan robustness sistem klasifikasi. Dengan demikian, hasil penelitian dapat lebih relevan untuk diterapkan dalam berbagai skenario dunia nyata. Pendekatan hibrida dan perbandingan lintas algoritma menjadi kunci dalam pengembangan sistem data mining yang lebih andal. Fokus pada generalisasi hasil juga penting agar temuan tidak terbatas pada dataset iris semata. Melalui eksplorasi ini, diharapkan dapat ditemukan panduan komprehensif dalam penanganan nilai hilang yang adaptif dan efektif.

References

PENERAPAN TEKNIK IMPUTASI K-MEANS TERHADAP PERFORMA HASIL KLASIFIKASI ALGORITMA NAÏVE BAYES | Jurnal... journal.stmikjayakarta.ac.id/index.php/JMIJayakarta/article/view/1765PENERAPAN TEKNIK IMPUTASI K MEANS TERHADAP PERFORMA HASIL KLASIFIKASI ALGORITMA NAyaVE BAYES Jurnal journal stmikjayakarta ac index php JMIJayakarta article view 1765

Download Read online Download

Metadata

File size	557.13 KB
Pages	11
DMCA	Report

Related /

JURIS Implementation of E Report Cards in Summative Assessment Management to Improve the Effectiveness of Reporting Student Learning Outcomes

2026

JURNALEDUKASIAJURNALEDUKASIA The main focus is how e-Reports overcomes the weaknesses of the manual system, such as late grade announcements, high recapitulation errors, and limitedThe main focus is how e-Reports overcomes the weaknesses of the manual system, such as late grade announcements, high recapitulation errors, and limited

JURIS Efektivitas E Berpadu Elektronik Berkas Pidana Terpadu Terkait Pengolahan dan Pertukaran Dokumen Administrasi Perkara Pidana

2026

UNIPASUNIPAS Tahapan penelitian meliputi perencanaan, pengumpulan, pengolahan, analisis data, dan penyusunan laporan. Data yang terkumpul dianalisis secara kualitatifTahapan penelitian meliputi perencanaan, pengumpulan, pengolahan, analisis data, dan penyusunan laporan. Data yang terkumpul dianalisis secara kualitatif

JURIS Sistem Pendukung Keputusan Penentuan Program Keluarga Harapan di Dinas Sosial Kabupaten Sumba Barat Menggunakan Metode Na ve Bayes

2025

APTIIAPTII Selain itu, sistem ini mampu memperbaiki transparansi, keadilan, dan kecepatan dalam prosedur pemilihan penerima. Dengan adanya sistem ini, diharapkanSelain itu, sistem ini mampu memperbaiki transparansi, keadilan, dan kecepatan dalam prosedur pemilihan penerima. Dengan adanya sistem ini, diharapkan

JURIS Implementation of Cyber Policy in Indonesia Study of Data Hacking Control by BSSN Dittipidsiber and the Ministry of Communication and Information at BPJS Health in 2021

2025

MANDALANURSAMANDALANURSA Hasil penelitian menunjukkan bahwa proses mitigasi kebocoran data menjadi lebih sulit akibat fragmentasi tugas, tumpang tindih wewenang, dan tidak adanyaHasil penelitian menunjukkan bahwa proses mitigasi kebocoran data menjadi lebih sulit akibat fragmentasi tugas, tumpang tindih wewenang, dan tidak adanya

JURIS Big Data Concepts Opportunities Challenges and Paradoxes

2025

MEDIAPUBLIKASIMEDIAPUBLIKASI Isu privasi dan hukum menjadi tantangan dalam penggunaan big data.meskipun big data memiliki banyak manfaat bagi perusahaan, di sisi lain big data jugaIsu privasi dan hukum menjadi tantangan dalam penggunaan big data.meskipun big data memiliki banyak manfaat bagi perusahaan, di sisi lain big data juga

2024

TEKNOKRATTEKNOKRAT Untuk mengatasi masalah tersebut diperlukan pendekatan manajemen basis data secara komprehensif melalui penggunaan data warehouse untuk mendukung prosesUntuk mengatasi masalah tersebut diperlukan pendekatan manajemen basis data secara komprehensif melalui penggunaan data warehouse untuk mendukung proses

2023

MEDIAPUBLIKASIMEDIAPUBLIKASI Di saat yang sama, penerapan teknologi melalui pengembangan sistem informasi pada fasilitas sekolah di SMP Negeri 2 Airmadidi ini juga memberikan pengetahuanDi saat yang sama, penerapan teknologi melalui pengembangan sistem informasi pada fasilitas sekolah di SMP Negeri 2 Airmadidi ini juga memberikan pengetahuan

2021

STMIKJAYAKARTASTMIKJAYAKARTA Putra Sumber Abadi merupakan suatu perusahaan yang bergerak dalam bidang penjualan electrical dan technical. Pembangunan situs e-commerce ini mengacu padaPutra Sumber Abadi merupakan suatu perusahaan yang bergerak dalam bidang penjualan electrical dan technical. Pembangunan situs e-commerce ini mengacu pada

Useful /

2026

STMIKJAYAKARTASTMIKJAYAKARTA Melalui fitur Head tracking quiz, pengguna dapat mempelajari budaya Kampung Raja Prailiu dengan menggerakkan kepala untuk memilih jawaban dalam quiz interaktif.Melalui fitur Head tracking quiz, pengguna dapat mempelajari budaya Kampung Raja Prailiu dengan menggerakkan kepala untuk memilih jawaban dalam quiz interaktif.

2026

IAIN SUIAIN SU Penelitian ini bertujuan menganalisis praktik overkriminalisasi terhadap tenaga pendidik melalui perspektif maqasid al-syariah, khususnya terkait PutusanPenelitian ini bertujuan menganalisis praktik overkriminalisasi terhadap tenaga pendidik melalui perspektif maqasid al-syariah, khususnya terkait Putusan

2025

STMIKJAYAKARTASTMIKJAYAKARTA Penelitian ini menunjukkan bahwa pendekatan Technology Acceptance Model (TAM) efektif dalam menganalisis penerimaan Sistem Informasi Akademik (SIAKAD).Penelitian ini menunjukkan bahwa pendekatan Technology Acceptance Model (TAM) efektif dalam menganalisis penerimaan Sistem Informasi Akademik (SIAKAD).

2025

STMIKJAYAKARTASTMIKJAYAKARTA Hasil penelitian ini untuk memberikan rekomendasi kepada guru apakah stimulasi yang diberikan kepada siswa berdasarkan gaya belajar sudah tepat serta memantauHasil penelitian ini untuk memberikan rekomendasi kepada guru apakah stimulasi yang diberikan kepada siswa berdasarkan gaya belajar sudah tepat serta memantau