IDID
Jurnal Ilmu Komputer dan InformatikaJurnal Ilmu Komputer dan InformatikaSocial media platforms like Twitter have become highly influential in shaping public opinion, making sentiment analysis on tweet data crucial. However, traditional techniques struggle with the nuances and complexities of informal social media text. This research addresses these challenges by conducting a comparative analysis between the non-optimized BERT (Bidirectional Encoder Representations from Transformers) model and the BERT model optimized with Fine-Tuning techniques for sentiment analysis on Indonesian Twitter data using text mining methods. Employing the CRISP-DM methodology, the study involves data collection through Twitter crawling using the keyword biznet, data preprocessing steps such as case folding, cleaning, tokenization, normalization, and data augmentation, with the dataset split into training, validation, and testing subsets for modeling and evaluation using the IndoBERT-base-p1 model specifically trained for the Indonesian language. The results demonstrate that the Fine-Tuned BERT model significantly outperforms the non-optimized BERT, achieving 91% accuracy, 0.91 precision, 0.90 recall, and 0.91 F1-score on the test set. Fine-Tuning enables BERT to adapt to the unique characteristics of Twitter sentiment data, allowing better recognition of language and context patterns associated with sentiment expressions. The optimized model is implemented as a web application for practical utilization. This research affirms the superiority of Fine-Tuned BERT for accurate sentiment analysis on Indonesian Twitter data, providing valuable insights for businesses, governments, and researchers leveraging social media data.
This research confirms the superiority of the Fine-Tuned BERT model for sentiment analysis on Indonesian Twitter data.The Fine-Tuning process successfully adapted the BERT model to the characteristics of Twitter sentiment data, resulting in improved recognition of language and context patterns.The results demonstrate that Fine-Tuned BERT outperforms the non-optimized BERT model, providing valuable insights for utilizing Twitter data in various fields.
Future research could explore the integration of additional text preprocessing techniques, such as stemming or lemmatization, to further refine the data and potentially improve model accuracy. Investigating the use of different BERT variants or exploring alternative transformer-based models could also lead to enhanced performance in Indonesian Twitter sentiment analysis. Furthermore, expanding the dataset with a wider range of keywords and incorporating contextual information, such as user demographics or network characteristics, could provide a more comprehensive understanding of sentiment expression on Twitter and enable the development of more nuanced and accurate sentiment analysis models. These advancements would contribute to a more robust and reliable system for analyzing public opinion and extracting valuable insights from social media data.
- Unsupervised extractive multi-document summarization method based on transfer learning from BERT multi-task... journals.sagepub.com/doi/10.1177/0165551521990616Unsupervised extractive multi document summarization method based on transfer learning from BERT multi task journals sagepub doi 10 1177 0165551521990616
- LiDA: Language-Independent Data Augmentation for Text Classification | IEEE Journals & Magazine |... doi.org/10.1109/ACCESS.2023.3234019LiDA Language Independent Data Augmentation for Text Classification IEEE Journals Magazine doi 10 1109 ACCESS 2023 3234019
| File size | 712.27 KB |
| Pages | 16 |
| DMCA | Report |
Related /
LENTERADUALENTERADUA 1 OWASP Top 10 2021, memungkinkan penyerang mengakses data sensitif dan fungsi admin tanpa autentikasi yang memadai, membuktikan urgensi pencegahan melalui1 OWASP Top 10 2021, memungkinkan penyerang mengakses data sensitif dan fungsi admin tanpa autentikasi yang memadai, membuktikan urgensi pencegahan melalui
DCCKOTABUMIDCCKOTABUMI Namun, seperti halnya system berbasis website lainnya, OJS memiliki kerentanan system yang memerlukan pemabaruan untuk menutup celah kemanan, meningkatkanNamun, seperti halnya system berbasis website lainnya, OJS memiliki kerentanan system yang memerlukan pemabaruan untuk menutup celah kemanan, meningkatkan
PHBPHB The sampling technique used purposive sampling with 4 informants. Triangulation was carried out on 3 informants from Indonesian family planning association.The sampling technique used purposive sampling with 4 informants. Triangulation was carried out on 3 informants from Indonesian family planning association.
MULYALITERASIMULYALITERASI Populasi pada penelitian ini yaitu seluruh siswa KB Santika Arum dan sampel diambil 15 orang. Teknik pengumpulan data yang digunakan yaitu observasi danPopulasi pada penelitian ini yaitu seluruh siswa KB Santika Arum dan sampel diambil 15 orang. Teknik pengumpulan data yang digunakan yaitu observasi dan
UMSUMS Hasil menunjukkan bahwa kualitas fisik air tanah dalam kondisi baik. Sekitar 64% sampel memiliki karakteristik kuning, tidak berbau, dan tidak berwarna.Hasil menunjukkan bahwa kualitas fisik air tanah dalam kondisi baik. Sekitar 64% sampel memiliki karakteristik kuning, tidak berbau, dan tidak berwarna.
ALMEERAEDUCATIONALMEERAEDUCATION Kegiatan pembelajaran matematika pada siswa kelas V UPT SPF SD Inpres Jongaya masih berjalan monoton, dan kurang variatif dalam menyampaikan materi. HalKegiatan pembelajaran matematika pada siswa kelas V UPT SPF SD Inpres Jongaya masih berjalan monoton, dan kurang variatif dalam menyampaikan materi. Hal
POLITANI SAMARINDAPOLITANI SAMARINDA Perkembangan globalisasi ekonomi, politik, dan teknologi saat ini menuntut implementasi orientasi Pemerintahan Baik dan Bersih. Untuk mencapai tujuan ini,Perkembangan globalisasi ekonomi, politik, dan teknologi saat ini menuntut implementasi orientasi Pemerintahan Baik dan Bersih. Untuk mencapai tujuan ini,
POLITANI SAMARINDAPOLITANI SAMARINDA However, this growth hasnt translated into a proportional increase in parking revenue due to a lack of clear transaction records and the prevalence ofHowever, this growth hasnt translated into a proportional increase in parking revenue due to a lack of clear transaction records and the prevalence of
Useful /
STIKESRSHUSADASTIKESRSHUSADA Hasil penelitian menunjukkan bahwa karakteristik individu yang berhubungan dengan kejadian IMS adalah faktor umur dan lama bekerja, sedangkan faktor statusHasil penelitian menunjukkan bahwa karakteristik individu yang berhubungan dengan kejadian IMS adalah faktor umur dan lama bekerja, sedangkan faktor status
UMWUMW ) dan saliva penderita diabetes melitus sebagai sampel dalam penelitian. Hasil penelitian menunjukkan pada enzim α-amilase murni diperoleh nilai IC50) dan saliva penderita diabetes melitus sebagai sampel dalam penelitian. Hasil penelitian menunjukkan pada enzim α-amilase murni diperoleh nilai IC50
POLITANI SAMARINDAPOLITANI SAMARINDA Tujuan dari penelitian ini adalah untuk membuat sistem informasi penjualan berbasis web di toko Resty Sarah. Hasil yang diharapkan dari penelitian iniTujuan dari penelitian ini adalah untuk membuat sistem informasi penjualan berbasis web di toko Resty Sarah. Hasil yang diharapkan dari penelitian ini
ATIDEWANTARAATIDEWANTARA Sanitasi dan bakti sosial yang diadakan oleh Desa Buntu Nanna yang Edukasi Sanitasi dengan memberikan pengarahan pada lingkungan guna meningkatkan tarafSanitasi dan bakti sosial yang diadakan oleh Desa Buntu Nanna yang Edukasi Sanitasi dengan memberikan pengarahan pada lingkungan guna meningkatkan taraf