UNIMALUNIMAL
Journal of Renewable Energy, Electrical, and Computer EngineeringJournal of Renewable Energy, Electrical, and Computer EngineeringPenelitian ini membandingkan efektivitas algoritma Random Forest dan Naïve Bayes dalam mengklasifikasikan pesan WhatsApp menjadi tiga kategori: pesan normal, promosi, dan penipuan. Dengan lebih dari 2,78 miliar pengguna aktif di seluruh dunia dan 90% pengguna internet di Indonesia yang memanfaatkan WhatsApp, enkripsi end-to-end platform tersebut menimbulkan tantangan untuk pendeteksian spam otomatis, sehingga diperlukan pendekatan machine learning. Sebuah dataset yang terdiri dari 300 pesan, didistribusikan secara merata di tiga kategori, mengalami pra-pengolahan yang meliputi pembersihan, case folding, penghapusan stopword, normalisasi, dan stemming sebelum dikonversi ke bentuk numerik menggunakan vektorisasi TF-IDF. Hasil eksperimen menunjukkan bahwa Naïve Bayes outperform Random Forest dengan akurasi yang lebih tinggi (88,67% vs 86,00%), presisi (89,64% vs 88,95%), recall (88,67% vs 86,00%), dan F1-score (88,61% vs 85,99%). Analisis cross-validation dengan validasi 10-fold lebih lanjut mengonfirmasi keunggulan Naïve Bayes dalam konsistensi dan stabilitas di seluruh metrik evaluasi. Selain itu, Naïve Bayes menunjukkan efisiensi komputasi yang luar biasa, hanya membutuhkan 0,13 detik untuk pelatihan dibandingkan dengan Random Forest yang membutuhkan 3,65 detik. Analisis matriks kebingungan mengungkapkan bahwa Naïve Bayes sangat efektif dalam membedakan antara pesan normal dan penipuan, yang sangat penting untuk mencegah pengguna menjadi korban penipuan. Model berhasil mengidentifikasi indikator penipuan kunci seperti klaim, akun, dan verifikasi sambil menunjukkan presisi dalam kasus ambigu. Temuan ini berkontribusi signifikan dalam mengembangkan sistem pendeteksi spam yang lebih efektif untuk platform pesan terenkripsi di mana mekanisme penyaringan tradisional tidak dapat diterapkan, akhirnya meningkatkan keselamatan dan pengalaman pengguna melalui identifikasi otomatis konten yang mungkin berbahaya.
Penelitian ini berhasil mengevaluasi dan membandingkan kinerja Naive Bayes dan algoritma Random Forest dalam mengklasifikasikan pesan WhatsApp menjadi tiga kategori.Hasil eksperimen menunjukkan bahwa algoritma Naive Bayes outperform Random Forest di semua metrik evaluasi dengan akurasi rata-rata 88,67% dibandingkan dengan Random Forest 86,00%.Model Naive Bayes juga unggul dalam presisi (89,64%), recall (88,67%), dan F1-score (88,61%), menunjukkan kemampuan superior dalam mengidentifikasi dan mengkategorikan pesan WhatsApp dengan benar.Analisis cross-validation lebih lanjut mengonfirmasi konsistensi dan stabilitas Naive Bayes, seperti yang ditunjukkan oleh standar deviasi yang lebih kecil dalam metrik kinerja di semua lipatan.Konsistensi ini sangat berharga dalam aplikasi dunia nyata di mana kinerja yang andal sangat penting.Selain itu, algoritma Naive Bayes menunjukkan efisiensi komputasi yang signifikan, hanya membutuhkan 0,13 detik untuk pelatihan dibandingkan dengan Random Forest 3,65 detik, membuatnya lebih cocok untuk penerapan di lingkungan sumber daya terbatas atau aplikasi yang memerlukan klasifikasi pesan waktu nyata.Analisis matriks kebingungan mengungkapkan bahwa Naive Bayes sangat efektif dalam membedakan antara pesan normal dan penipuan, yang sangat penting untuk mencegah pengguna menjadi korban penipuan atau upaya phishing.Kedua algoritma berhasil mengklasifikasikan pola penipuan yang jelas yang mengandung kata kunci seperti klaim, akun, dan verifikasi, tetapi Naive Bayes menunjukkan presisi yang lebih besar dalam kasus ambigu.Temuan ini berkontribusi pada pengembangan sistem pendeteksi spam yang lebih efektif untuk platform pesan terenkripsi seperti WhatsApp, di mana mekanisme penyaringan tradisional tidak dapat diterapkan karena enkripsi end-to-end.Implementasi model klasifikasi berbasis Naive Bayes dapat meningkatkan keselamatan dan pengalaman pengguna dengan mengidentifikasi secara otomatis pesan yang mungkin berbahaya.Penelitian masa depan harus fokus pada perluasan dataset dengan pola pesan yang lebih beragam, memasukkan fitur tambahan seperti panjang pesan dan karakteristik struktural, serta mengeksplorasi pendekatan hibrida yang menggabungkan kekuatan kedua algoritma untuk meningkatkan lebih lanjut kinerja klasifikasi.
Berdasarkan hasil penelitian ini, berikut adalah saran penelitian lanjutan: Pertama, perluasan dataset dengan lebih banyak pesan yang beragam, termasuk pola penipuan yang lebih kompleks dan promosi yang lebih bervariasi, akan meningkatkan akurasi dan generalisasi model. Kedua, penelitian dapat mengeksplorasi fitur tambahan seperti panjang pesan, struktur kalimat, dan penggunaan kata-kata tertentu yang mungkin menjadi indikator penipuan atau promosi. Ketiga, pendekatan hibrida yang menggabungkan kekuatan Naive Bayes dan Random Forest dapat dikembangkan untuk meningkatkan kinerja klasifikasi, terutama dalam menangani pesan ambigu. Dengan menggabungkan algoritma ini, model dapat memanfaatkan keunggulan masing-masing algoritma dan meningkatkan akurasi secara keseluruhan. Penelitian lanjutan ini akan membantu mengembangkan sistem pendeteksi spam yang lebih andal dan akurat untuk platform pesan terenkripsi seperti WhatsApp, sehingga meningkatkan keselamatan dan pengalaman pengguna secara keseluruhan.
| File size | 4.06 MB |
| Pages | 9 |
| DMCA | Report |
Related /
BSIBSI Penelitian ini bertujuan membangun sistem informasi pengelolaan surat administrasi penduduk elektronik seperti surat keterangan domisili, surat keteranganPenelitian ini bertujuan membangun sistem informasi pengelolaan surat administrasi penduduk elektronik seperti surat keterangan domisili, surat keterangan
POLBANPOLBAN Sekolah menengah kejuruan (SMK) sebagai institusi pendidikan vokasi yang menerapkan teknologi informasi dalam kegiatan operasional dan pembelajaran memilikiSekolah menengah kejuruan (SMK) sebagai institusi pendidikan vokasi yang menerapkan teknologi informasi dalam kegiatan operasional dan pembelajaran memiliki
POLBANGTANBOGORPOLBANGTANBOGOR Indonesia dengan kepadatan penduduk yang tinggi mengakibatkan peningkatan alih guna lahan dan pengurangan lahan produksi pangan. Salah satu konsep yangIndonesia dengan kepadatan penduduk yang tinggi mengakibatkan peningkatan alih guna lahan dan pengurangan lahan produksi pangan. Salah satu konsep yang
STKIP PESSELSTKIP PESSEL mengetahui kebutuhan mahasiswa tunanetra dalam pembelajaran bentuk kalimat Bahasa Inggris, (2). merancang dan mengembangkan media audio podcast “Podlish,mengetahui kebutuhan mahasiswa tunanetra dalam pembelajaran bentuk kalimat Bahasa Inggris, (2). merancang dan mengembangkan media audio podcast “Podlish,
UNAIRUNAIR Yang terpenting, penelitian saat ini menunjukkan bahwa dataset yang terlabel dengan baik sangat penting bagi model untuk mengidentifikasi fitur dan simetriYang terpenting, penelitian saat ini menunjukkan bahwa dataset yang terlabel dengan baik sangat penting bagi model untuk mengidentifikasi fitur dan simetri
BSIBSI Efisiensi kerja diukur berdasarkan tersedianya alur kerja yang lebih terstruktur dan pengurangan kemungkinan miskomunikasi dalam penugasan. Evaluasi sistemEfisiensi kerja diukur berdasarkan tersedianya alur kerja yang lebih terstruktur dan pengurangan kemungkinan miskomunikasi dalam penugasan. Evaluasi sistem
UNIMALUNIMAL Setelah pra-pemrosesan yang komprehensif, data diubah menggunakan TF-IDF, dan kinerja model dievaluasi dengan akurasi, presisi, recall, F1-score, matriksSetelah pra-pemrosesan yang komprehensif, data diubah menggunakan TF-IDF, dan kinerja model dievaluasi dengan akurasi, presisi, recall, F1-score, matriks
UNIPOLUNIPOL Aplikasi ini berfokus pada pengamanan isi pesan email, memastikan hanya penerima yang dituju dan memiliki kunci yang sama dapat membaca konten yang terenkripsi.Aplikasi ini berfokus pada pengamanan isi pesan email, memastikan hanya penerima yang dituju dan memiliki kunci yang sama dapat membaca konten yang terenkripsi.
Useful /
BSIBSI Berdasarkan hasil perancangan dan implementasi, dapat disimpulkan bahwa penerapan metode Extreme Programming (XP) dalam pengembangan sistem informasi persediaanBerdasarkan hasil perancangan dan implementasi, dapat disimpulkan bahwa penerapan metode Extreme Programming (XP) dalam pengembangan sistem informasi persediaan
BSIBSI Penelitian ini menghadirkan pendekatan inovatif melalui penerapan model pengembangan perangkat lunak Scrum untuk membangun aplikasi penerimaan siswa baruPenelitian ini menghadirkan pendekatan inovatif melalui penerapan model pengembangan perangkat lunak Scrum untuk membangun aplikasi penerimaan siswa baru
SUMBARPROVSUMBARPROV Penelitian ini menyimpulkan bahwa keberadaan pabrik pengolahan gambir di Kecamatan Pangkalan Koto Baru memiliki pengaruh signifikan terhadap kondisi sosialPenelitian ini menyimpulkan bahwa keberadaan pabrik pengolahan gambir di Kecamatan Pangkalan Koto Baru memiliki pengaruh signifikan terhadap kondisi sosial
UNIPOLUNIPOL Alat ini bekerja pada saat sensor mendeteksi tangan kurang dari 10 cm, kemudian servo akan menarik tuas dan mengeluarkan cairan hand sanitizer tersebut.Alat ini bekerja pada saat sensor mendeteksi tangan kurang dari 10 cm, kemudian servo akan menarik tuas dan mengeluarkan cairan hand sanitizer tersebut.