Comparative Analysis of Bidirectional Encoder Representations from Transformers Models for Twitter Sentiment Classification using Text Mining on Streamlit

Ahmad Fajar Tatang; Mohammad Hasbi Assidiqi

Publisher

IDID

Journal Jurnal Ilmu Komputer dan Informatika Abstract

Social media platforms like Twitter have become highly influential in shaping public opinion, making sentiment analysis on tweet data crucial. However, traditional techniques struggle with the nuances and complexities of informal social media text. This research addresses these challenges by conducting a comparative analysis between the non-optimized BERT (Bidirectional Encoder Representations from Transformers) model and the BERT model optimized with Fine-Tuning techniques for sentiment analysis on Indonesian Twitter data using text mining methods. Employing the CRISP-DM methodology, the study involves data collection through Twitter crawling using the keyword biznet, data preprocessing steps such as case folding, cleaning, tokenization, normalization, and data augmentation, with the dataset split into training, validation, and testing subsets for modeling and evaluation using the IndoBERT-base-p1 model specifically trained for the Indonesian language. The results demonstrate that the Fine-Tuned BERT model significantly outperforms the non-optimized BERT, achieving 91% accuracy, 0.91 precision, 0.90 recall, and 0.91 F1-score on the test set. Fine-Tuning enables BERT to adapt to the unique characteristics of Twitter sentiment data, allowing better recognition of language and context patterns associated with sentiment expressions. The optimized model is implemented as a web application for practical utilization. This research affirms the superiority of Fine-Tuned BERT for accurate sentiment analysis on Indonesian Twitter data, providing valuable insights for businesses, governments, and researchers leveraging social media data.

Conclusion

This research confirms the superiority of the Fine-Tuned BERT model for sentiment analysis on Indonesian Twitter data.The Fine-Tuning process successfully adapted the BERT model to the characteristics of Twitter sentiment data, resulting in improved recognition of language and context patterns.The results demonstrate that Fine-Tuned BERT outperforms the non-optimized BERT model, providing valuable insights for utilizing Twitter data in various fields.

Future Research

Future research could explore the integration of additional text preprocessing techniques, such as stemming or lemmatization, to further refine the data and potentially improve model accuracy. Investigating the use of different BERT variants or exploring alternative transformer-based models could also lead to enhanced performance in Indonesian Twitter sentiment analysis. Furthermore, expanding the dataset with a wider range of keywords and incorporating contextual information, such as user demographics or network characteristics, could provide a more comprehensive understanding of sentiment expression on Twitter and enable the development of more nuanced and accurate sentiment analysis models. These advancements would contribute to a more robust and reliable system for analyzing public opinion and extracting valuable insights from social media data.

References

Download Read online Download

Metadata

File size	712.27 KB
Pages	16
DMCA	Report

Related /

JURIS Detection and Prevention of Stored Cross Site Scripting XSS Vulnerabilities and Broken Access Control in the Kaspedia Web Application

2026

LENTERADUALENTERADUA 1 OWASP Top 10 2021, memungkinkan penyerang mengakses data sensitif dan fungsi admin tanpa autentikasi yang memadai, membuktikan urgensi pencegahan melalui1 OWASP Top 10 2021, memungkinkan penyerang mengakses data sensitif dan fungsi admin tanpa autentikasi yang memadai, membuktikan urgensi pencegahan melalui

JURIS Evaluasi Keamanan Open Journal Systems OJS Versi Lama Menggunakan Kerangka ISSAF

2025

DCCKOTABUMIDCCKOTABUMI Namun, seperti halnya system berbasis website lainnya, OJS memiliki kerentanan system yang memerlukan pemabaruan untuk menutup celah kemanan, meningkatkanNamun, seperti halnya system berbasis website lainnya, OJS memiliki kerentanan system yang memerlukan pemabaruan untuk menutup celah kemanan, meningkatkan

JURIS Colaboration Strategy on Prevention and Handling of Sexual Violence on Adolescents between Indonesian Family Planning Association

2025

PHBPHB The sampling technique used purposive sampling with 4 informants. Triangulation was carried out on 3 informants from Indonesian family planning association.The sampling technique used purposive sampling with 4 informants. Triangulation was carried out on 3 informants from Indonesian family planning association.

JURIS Media Wordwall alternatif Peningkatan Motivasi Belajar Anak Usia Dini di KB Santika Arum

2025

MULYALITERASIMULYALITERASI Populasi pada penelitian ini yaitu seluruh siswa KB Santika Arum dan sampel diambil 15 orang. Teknik pengumpulan data yang digunakan yaitu observasi danPopulasi pada penelitian ini yaitu seluruh siswa KB Santika Arum dan sampel diambil 15 orang. Teknik pengumpulan data yang digunakan yaitu observasi dan

JURIS Phreatic Groundwater Quality Analysis Based on Physical and Chemical Parameters in Kuta Raja Sub District

2024

UMSUMS Hasil menunjukkan bahwa kualitas fisik air tanah dalam kondisi baik. Sekitar 64% sampel memiliki karakteristik kuning, tidak berbau, dan tidak berwarna.Hasil menunjukkan bahwa kualitas fisik air tanah dalam kondisi baik. Sekitar 64% sampel memiliki karakteristik kuning, tidak berbau, dan tidak berwarna.

2024

ALMEERAEDUCATIONALMEERAEDUCATION Kegiatan pembelajaran matematika pada siswa kelas V UPT SPF SD Inpres Jongaya masih berjalan monoton, dan kurang variatif dalam menyampaikan materi. HalKegiatan pembelajaran matematika pada siswa kelas V UPT SPF SD Inpres Jongaya masih berjalan monoton, dan kurang variatif dalam menyampaikan materi. Hal

2023

POLITANI SAMARINDAPOLITANI SAMARINDA Perkembangan globalisasi ekonomi, politik, dan teknologi saat ini menuntut implementasi orientasi Pemerintahan Baik dan Bersih. Untuk mencapai tujuan ini,Perkembangan globalisasi ekonomi, politik, dan teknologi saat ini menuntut implementasi orientasi Pemerintahan Baik dan Bersih. Untuk mencapai tujuan ini,

2023

POLITANI SAMARINDAPOLITANI SAMARINDA However, this growth hasnt translated into a proportional increase in parking revenue due to a lack of clear transaction records and the prevalence ofHowever, this growth hasnt translated into a proportional increase in parking revenue due to a lack of clear transaction records and the prevalence of

Useful /

2025

STIKESRSHUSADASTIKESRSHUSADA Hasil penelitian menunjukkan bahwa karakteristik individu yang berhubungan dengan kejadian IMS adalah faktor umur dan lama bekerja, sedangkan faktor statusHasil penelitian menunjukkan bahwa karakteristik individu yang berhubungan dengan kejadian IMS adalah faktor umur dan lama bekerja, sedangkan faktor status

2025

UMWUMW ) dan saliva penderita diabetes melitus sebagai sampel dalam penelitian. Hasil penelitian menunjukkan pada enzim α-amilase murni diperoleh nilai IC50) dan saliva penderita diabetes melitus sebagai sampel dalam penelitian. Hasil penelitian menunjukkan pada enzim α-amilase murni diperoleh nilai IC50

2023

POLITANI SAMARINDAPOLITANI SAMARINDA Tujuan dari penelitian ini adalah untuk membuat sistem informasi penjualan berbasis web di toko Resty Sarah. Hasil yang diharapkan dari penelitian iniTujuan dari penelitian ini adalah untuk membuat sistem informasi penjualan berbasis web di toko Resty Sarah. Hasil yang diharapkan dari penelitian ini

2023

ATIDEWANTARAATIDEWANTARA Sanitasi dan bakti sosial yang diadakan oleh Desa Buntu Nanna yang Edukasi Sanitasi dengan memberikan pengarahan pada lingkungan guna meningkatkan tarafSanitasi dan bakti sosial yang diadakan oleh Desa Buntu Nanna yang Edukasi Sanitasi dengan memberikan pengarahan pada lingkungan guna meningkatkan taraf