ITENASITENAS

Rekayasa Hijau : Jurnal Teknologi Ramah LingkunganRekayasa Hijau : Jurnal Teknologi Ramah Lingkungan

Cyberbullying dalam bahasa Sunda semakin marak di media sosial, dengan kasus seperti penghinaan fisik, body shaming, dan ancaman yang dapat berdampak negatif pada korban. Namun, deteksi otomatis masih menghadapi tantangan, terutama dalam keterbatasan dataset dan efektivitas metode pemrosesan bahasa alami. Penelitian ini bertujuan untuk mengembangkan sistem deteksi cyberbullying bahasa Sunda menggunakan gabungan model stemming dan hybrid learning. Peneliti menerapkan beberapa model machine learning yaitu random forest dan Support Vector Machine (SVM) serta model deep learning yaitu convolutional neural network-bidirectional long short-term memory (CNN-BiLSTM), CNN, dan BiLSTM. Peneliti melakukan eksperimen untuk mengevaluasi kinerja masing-masing model dengan mengukur akurasi dan F1-score. Berdasarkan hasil penelitian, model hybrid learning memperoleh kinerja terbaik dengan akurasi sebesar 97,3% dan F1-score sebesar 97%. Selain itu, waktu pelatihan pada CNN-BiLSTM lebih cepat dibandingkan dengan model lainnya yaitu sekitar 30 detik per epoch.

Penelitian ini berhasil mengembangkan sistem deteksi cyberbullying dalam bahasa Sunda menggunakan stemming dan model hybrid learning.Model CNN-BiLSTM menunjukkan kinerja terbaik dengan akurasi 97,3% dan F1-score 97%.Untuk mengatasi overfitting dan meningkatkan kinerja, disarankan penerapan regularisasi, penambahan data augmentation, hyperparameter tuning, early stopping, serta eksplorasi model Bi-GRU yang digabungkan dengan CNN.

Pertama, perlu dikembangkan penelitian untuk mengidentifikasi efektivitas model hybrid lain seperti CNN-BiGRU dalam mendeteksi cyberbullying bahasa Sunda, mengingat potensi BiGRU yang lebih efisien dibanding BiLSTM dalam memproses urutan teks. Kedua, penting untuk mengevaluasi penggunaan teknik augmentasi data berbasis morfologi Sunda, seperti generasi sinonim lokal atau transformasi afiks, agar dapat meningkatkan keragaman dataset dan mengurangi overfitting pada model pembelajaran mesin. Ketiga, diperlukan studi lebih lanjut mengenai kombinasi antara stemming berbasis aturan dan pendekatan embedding kontekstual (seperti m-BERT) untuk memahami sejauh mana representasi kata yang kaya konteks dapat meningkatkan akurasi deteksi cyberbullying pada bahasa daerah yang kurang sumbernya. Penelitian-penelitian ini dapat memperkuat sistem deteksi otomatis yang lebih adaptif, akurat, dan sensitif terhadap nuansa budaya dan linguistik pengguna media sosial berbahasa Sunda.

  1. Bag of Tricks for Efficient Text Classification - ACL Anthology. bag tricks efficient text acl anthology... doi.org/10.18653/v1/e17-2068Bag of Tricks for Efficient Text Classification ACL Anthology bag tricks efficient text acl anthology doi 10 18653 v1 e17 2068
  2. Tracing Twitter: The rise of a microblogging platform | Intellect. tracing twitter rise platform intellect... doi.org/10.1386/macp.7.3.333_1Tracing Twitter The rise of a microblogging platform Intellect tracing twitter rise platform intellect doi 10 1386 macp 7 3 333 1
  3. Cyberbullying Detection: An Ensemble Based Machine Learning Approach | IEEE Conference Publication |... doi.org/10.1109/ICICV50876.2021.9388499Cyberbullying Detection An Ensemble Based Machine Learning Approach IEEE Conference Publication doi 10 1109 ICICV50876 2021 9388499
  4. Sentiment Analysis using Word2vec-CNN-BiLSTM Classification | IEEE Conference Publication | IEEE Xplore.... doi.org/10.1109/SNAMS52053.2020.9336549Sentiment Analysis using Word2vec CNN BiLSTM Classification IEEE Conference Publication IEEE Xplore doi 10 1109 SNAMS52053 2020 9336549
Read online
File size549.21 KB
Pages12
DMCAReport

Related /

ads-block-test