STMIK DCISTMIK DCI

JUTEKIN (Jurnal Teknik Informatika)JUTEKIN (Jurnal Teknik Informatika)

Perkembangan teknologi informasi telah mendorong peningkatan interaksi publik di media sosial seperti X (sebelumnya Twitter), tempat berbagai opini dibagikan. Analisis sentimen menjadi pendekatan yang tepat untuk memahami persepsi publik, terutama terhadap isu tertentu yang dicari melalui kata kunci. Penelitian ini mengimplementasikan algoritma Naive Bayes yang dipilih karena kesederhanaan, efisiensi, dan kesesuaiannya untuk klasifikasi teks. Proses yang dilakukan meliputi crawling data berdasarkan keyword, preprocessing teks, ekstraksi fitur dengan Term Frequency – Inverse Document Frequency (TF‑IDF), penyeimbangan kelas menggunakan Synthetic Minority Over-sampling Technique (SMOTE), pelatihan model Naive Bayes, dan penyajian hasil dalam bentuk tabel serta grafik. Sistem juga dilengkapi dengan deteksi bot dan penanganan ketidakseimbangan kelas untuk meningkatkan akurasi. Model berhasil mengklasifikasikan sentimen dengan akurasi sekitar 72%. Meskipun performa untuk sentimen netral masih terbatas akibat data latih netral yang sedikit, sistem ini dapat membantu dalam memahami opini publik dan berpotensi dikembangkan lebih lanjut.

Penelitian ini berhasil mengembangkan model klasifikasi sentimen berbasis Naive Bayes yang dapat mengidentifikasi opini publik pada platform media sosial X berdasarkan keyword tertentu, dengan proses preprocessing, ekstraksi fitur TF‑IDF, penyeimbangan kelas menggunakan SMOTE, dan deteksi bot.Evaluasi menunjukkan akurasi keseluruhan sekitar 72%, dengan kinerja baik pada kelas positif dan negatif namun masih rendah pada kelas netral.Hasil tersebut menunjukkan bahwa pendekatan Naive Bayes efektif dan efisien untuk memahami persepsi publik, sekaligus memberikan dasar bagi pengembangan sistem analisis sentimen yang lebih luas.

Penelitian selanjutnya dapat mengevaluasi penggunaan model berbasis pembelajaran mendalam seperti BERT atau transformer untuk meningkatkan akurasi klasifikasi sentimen netral pada data X, dengan membandingkan performanya terhadap Naive Bayes tradisional serta menganalisis kebutuhan sumber daya komputasi dan kecepatan inferensi. Selain itu, pengembangan dataset multibahasa yang mencakup bahasa Indonesia, Inggris, dan bahasa regional lainnya dapat diuji melalui teknik transfer learning untuk menilai kemampuan generalisasi model lintas bahasa, sekaligus mempelajari dampak variasi morfologi dan sintaks pada hasil klasifikasi. Selanjutnya, mekanisme deteksi bot dapat ditingkatkan dengan memanfaatkan jaringan saraf graf (Graph Neural Network) guna mengidentifikasi pola interaksi bot secara real‑time, serta meneliti dampaknya terhadap kualitas data pelatihan, tingkat false positive, dan stabilitas model klasifikasi dalam menghadapi serangan bot yang semakin canggih.

Read online
File size501.83 KB
Pages10
DMCAReport

Related /

ads-block-test