SUBSETSUBSET

The Indonesian Journal of Computer Science ResearchThe Indonesian Journal of Computer Science Research

Penelitian ini bertujuan untuk mengevaluasi dan membandingkan performa dari dua arsitektur deep learning, yaitu BERT (Bidirectional Encoder Representations from Transformers) dan RNN-LSTM (Recurrent Neural Network – Long Short-Term Memory), dalam mengklasifikasikan sentimen pada tanggapan pengguna aplikasi BRImo. Kumpulan data diperoleh melalui teknik web scraping di platform Google Play dengan metode pengambilan acak (random sampling), sehingga terkumpul 10.000 ulasan dari total sekitar satu juta ulasan yang tersedia. Proses preprocessing awal mencakup pembersihan teks, penghapusan simbol, angka, URL, serta tokenisasi. Evaluasi awal menunjukkan bahwa model BERT memiliki akurasi sebesar 54%, sedangkan RNN-LSTM memperoleh akurasi 53%. Selanjutnya, dilakukan eksperimen lanjutan dengan menghilangkan proses tokenisasi tambahan pada preprocessing. Hasilnya, akurasi meningkat secara signifikan menjadi 73% untuk BERT dan 70% untuk RNN-LSTM. Peningkatan ini menunjukkan bahwa tokenisasi ganda dapat menurunkan kualitas input ke dalam model. Secara keseluruhan, model BERT terbukti lebih unggul dalam memahami konteks linguistik dalam bahasa Indonesia, terutama dalam menangani ambiguitas dan struktur kalimat kompleks dalam teks ulasan pengguna aplikasi.

000 ulasan aplikasi BRImo melalui metode random sampling.Hasil pengujian menunjukkan bahwa model BERT mencapai akurasi 73% dan RNN-LSTM 70% setelah menghilangkan proses tokenisasi ganda.Kesimpulannya, model BERT lebih unggul dalam menangkap konteks bahasa Indonesia, terutama dalam menangani ambiguitas dan struktur kalimat kompleks dalam teks ulasan pengguna.

Penelitian lanjutan dapat dilakukan dengan menyetel hiperparameter secara lebih rinci, termasuk laju pembelajaran, ukuran batch, dan jumlah epoch, untuk meningkatkan efisiensi model. Selain itu, evaluasi dengan metrik tambahan seperti AUC dan Macro-F1 Score perlu dipertimbangkan untuk mengukur performa model pada data yang tidak seimbang. Lebih lanjut, eksplorasi penggunaan teknik augmentasi data dapat dilakukan untuk mengatasi masalah ketidakseimbangan kelas dan meningkatkan generalisasi model. Penelitian ini juga dapat diperluas dengan mengintegrasikan informasi tambahan, seperti metadata pengguna atau fitur aplikasi, untuk meningkatkan akurasi analisis sentimen. Terakhir, pengembangan model yang mampu mengidentifikasi dan menangani sarkasme atau ironi dalam ulasan pengguna dapat menjadi arah penelitian yang menarik.

  1. Weak Supervision Dengan Pendekatan Labeling Function Untuk Analisis Sentimen Pada Twitter | The Indonesian... subset.id/index.php/IJCSR/article/view/93Weak Supervision Dengan Pendekatan Labeling Function Untuk Analisis Sentimen Pada Twitter The Indonesian subset index php IJCSR article view 93
  2. Proceedings of the 5th International Conference on Humanities and Social Science (ICHSS 2024) | Atlantis... atlantis-press.com/proceedings/ichss-24Proceedings of the 5th International Conference on Humanities and Social Science ICHSS 2024 Atlantis atlantis press proceedings ichss 24
  3. Comparison Performance of K-NN and NBC Algorithm for Classification of Heart Disease | Jurnal Sistem... doi.org/10.32503/jtecs.v2i2.2708Comparison Performance of K NN and NBC Algorithm for Classification of Heart Disease Jurnal Sistem doi 10 32503 jtecs v2i2 2708
  4. APPLICATION OF WEB SCRAPING PRODUCT DESCRIPTION USING SELENIUM PYTHON AND LARAVEL FRAMEWORK | JATISI.... doi.org/10.35957/jatisi.v9i4.2727APPLICATION OF WEB SCRAPING PRODUCT DESCRIPTION USING SELENIUM PYTHON AND LARAVEL FRAMEWORK JATISI doi 10 35957 jatisi v9i4 2727
Read online
File size473.92 KB
Pages11
DMCAReport

Related /

ads-block-test