IDID
Jurnal Ilmu Komputer dan InformatikaJurnal Ilmu Komputer dan InformatikaSocial media platforms like Twitter have become highly influential in shaping public opinion, making sentiment analysis on tweet data crucial. However, traditional techniques struggle with the nuances and complexities of informal social media text. This research addresses these challenges by conducting a comparative analysis between the non-optimized BERT (Bidirectional Encoder Representations from Transformers) model and the BERT model optimized with Fine-Tuning techniques for sentiment analysis on Indonesian Twitter data using text mining methods. Employing the CRISP-DM methodology, the study involves data collection through Twitter crawling using the keyword biznet, data preprocessing steps such as case folding, cleaning, tokenization, normalization, and data augmentation, with the dataset split into training, validation, and testing subsets for modeling and evaluation using the IndoBERT-base-p1 model specifically trained for the Indonesian language. The results demonstrate that the Fine-Tuned BERT model significantly outperforms the non-optimized BERT, achieving 91% accuracy, 0.91 precision, 0.90 recall, and 0.91 F1-score on the test set. Fine-Tuning enables BERT to adapt to the unique characteristics of Twitter sentiment data, allowing better recognition of language and context patterns associated with sentiment expressions. The optimized model is implemented as a web application for practical utilization. This research affirms the superiority of Fine-Tuned BERT for accurate sentiment analysis on Indonesian Twitter data, providing valuable insights for businesses, governments, and researchers leveraging social media data.
This research confirms the superiority of the Fine-Tuned BERT model for sentiment analysis on Indonesian Twitter data.The Fine-Tuning process successfully adapted the BERT model to the characteristics of Twitter sentiment data, resulting in improved recognition of language and context patterns.The results demonstrate that Fine-Tuned BERT outperforms the non-optimized BERT model, providing valuable insights for utilizing Twitter data in various fields.
Future research could explore the integration of additional text preprocessing techniques, such as stemming or lemmatization, to further refine the data and potentially improve model accuracy. Investigating the use of different BERT variants or exploring alternative transformer-based models could also lead to enhanced performance in Indonesian Twitter sentiment analysis. Furthermore, expanding the dataset with a wider range of keywords and incorporating contextual information, such as user demographics or network characteristics, could provide a more comprehensive understanding of sentiment expression on Twitter and enable the development of more nuanced and accurate sentiment analysis models. These advancements would contribute to a more robust and reliable system for analyzing public opinion and extracting valuable insights from social media data.
- Unsupervised extractive multi-document summarization method based on transfer learning from BERT multi-task... journals.sagepub.com/doi/10.1177/0165551521990616Unsupervised extractive multi document summarization method based on transfer learning from BERT multi task journals sagepub doi 10 1177 0165551521990616
- LiDA: Language-Independent Data Augmentation for Text Classification | IEEE Journals & Magazine |... doi.org/10.1109/ACCESS.2023.3234019LiDA Language Independent Data Augmentation for Text Classification IEEE Journals Magazine doi 10 1109 ACCESS 2023 3234019
| File size | 712.27 KB |
| Pages | 16 |
| DMCA | Report |
Related /
LENTERADUALENTERADUA Kesimpulannya, deteksi proaktif dan penerapan mekanisme pencegahan yang terstruktur, yang menggabungkan validasi input dan kontrol akses berbasis server,Kesimpulannya, deteksi proaktif dan penerapan mekanisme pencegahan yang terstruktur, yang menggabungkan validasi input dan kontrol akses berbasis server,
PIKSIPIKSI Hasil penelitian menunjukkan bahwa sistem otomatisasi mampu mempercepat proses pendaftaran, mengurangi kesalahan input data, dan meningkatkan kepuasanHasil penelitian menunjukkan bahwa sistem otomatisasi mampu mempercepat proses pendaftaran, mengurangi kesalahan input data, dan meningkatkan kepuasan
STMIK DCISTMIK DCI Hasil pengujian menunjukkan bahwa alat bekerja dengan baik, mampu membaca kartu pada jarak yang sesuai, mengirim data ke database, serta memberikan notifikasiHasil pengujian menunjukkan bahwa alat bekerja dengan baik, mampu membaca kartu pada jarak yang sesuai, mengirim data ke database, serta memberikan notifikasi
DCCKOTABUMIDCCKOTABUMI Peneliti kemudian meneliti lebih lanjut dengan menggunakan Information System Security Assessment Framework (ISSAF) dan OWASP ZAP untuk mengidentifikasiPeneliti kemudian meneliti lebih lanjut dengan menggunakan Information System Security Assessment Framework (ISSAF) dan OWASP ZAP untuk mengidentifikasi
ATMALUHURATMALUHUR The system, built using the Naïve Bayes algorithm, involved data collection, text preprocessing, sentiment labeling, and classification. The evaluationThe system, built using the Naïve Bayes algorithm, involved data collection, text preprocessing, sentiment labeling, and classification. The evaluation
UNJAYAUNJAYA Penelitian ini menyimpulkan bahwa CNN unggul untuk klasifikasi gambar berbasis warna. Penelitian ini menunjukkan bahwa CNN memiliki performa yang lebihPenelitian ini menyimpulkan bahwa CNN unggul untuk klasifikasi gambar berbasis warna. Penelitian ini menunjukkan bahwa CNN memiliki performa yang lebih
POLITANI SAMARINDAPOLITANI SAMARINDA Sistem informasi ini dapat mengatasi kesalahan dalam perhitungan penjualan dan transaksi pembelian, serta memudahkan pengumpulan data jenis barang di TokoSistem informasi ini dapat mengatasi kesalahan dalam perhitungan penjualan dan transaksi pembelian, serta memudahkan pengumpulan data jenis barang di Toko
UPSUPS Analisis pada kajian ini direncanakan bisa digunakan untuk tujuan panduan praktis, bagi teknisi dan pembelajar, data – data diambil dari hasil pembacaanAnalisis pada kajian ini direncanakan bisa digunakan untuk tujuan panduan praktis, bagi teknisi dan pembelajar, data – data diambil dari hasil pembacaan
Useful /
ATMALUHURATMALUHUR Studi ini menunjukkan efektivitas menggabungkan TF-IDF dan SVM untuk klasifikasi sentimen dalam domain gaming, dan menawarkan pendekatan yang dapat diskalakanStudi ini menunjukkan efektivitas menggabungkan TF-IDF dan SVM untuk klasifikasi sentimen dalam domain gaming, dan menawarkan pendekatan yang dapat diskalakan
UBYUBY Materi yang digunakan dalam penelitian ini adalah susu kambing Peranakan Etawa, rosemary, air, dan gula. Rancangan percobaan yang digunakan adalah rancanganMateri yang digunakan dalam penelitian ini adalah susu kambing Peranakan Etawa, rosemary, air, dan gula. Rancangan percobaan yang digunakan adalah rancangan
PPNIUNIMMANPPNIUNIMMAN Sampel diperiksa dengan menggunakan kriteria penilaian indeks gingiva dan indeks CPITN. Hasil menunjukkan bahwa yang mengalami periodontitis dengan skorSampel diperiksa dengan menggunakan kriteria penilaian indeks gingiva dan indeks CPITN. Hasil menunjukkan bahwa yang mengalami periodontitis dengan skor
PPNIUNIMMANPPNIUNIMMAN Penelitian ini bertujuan untuk memformulasikan deodoran spray ekstrak etanol daun kemangi, menguji sifat fisik sediaan deodoran spray, dan mengetahui apakahPenelitian ini bertujuan untuk memformulasikan deodoran spray ekstrak etanol daun kemangi, menguji sifat fisik sediaan deodoran spray, dan mengetahui apakah