IRPIIRPI
MALCOM: Indonesian Journal of Machine Learning and Computer ScienceMALCOM: Indonesian Journal of Machine Learning and Computer ScienceAnalisis sentimen terhadap opini publik di media sosial menjadi tantangan signifikan karena kompleksitas bahasa informal dan volume data yang besar. Penelitian ini bertujuan untuk mengevaluasi pengaruh lima pendekatan pelabelan data manual, IndoBERT, IndoBERTweet, RoBERTa, dan InSet Lexicon terhadap performa model Indonesian Bidirectional Encoder Representations from Transformers (IndoBERT) dalam klasifikasi sentimen terkait isu Coretax. Sebanyak 8.035 tweet dikumpulkan, diproses, dan dilabeli menggunakan masing-masing pendekatan. Dataset hasil pelabelan kemudian digunakan untuk melatih ulang model IndoBERT, yang dievaluasi menggunakan metrik akurasi, F1-score, confusion matrix, dan kurva Receiver Operating Characteristic-Area Under the Curve (ROC-AUC). Hasil menunjukkan bahwa pelabelan otomatis menggunakan Indonesian Bidirectional Encoder Representations from Transformers for Tweet (IndoBERTweet) menghasilkan metrik tertinggi F1-Score (0,9802), tetapi mengalami dominasi kelas netral yang menunjukkan overfitting. Pelabelan manual menghasilkan distribusi kelas yang lebih merata meskipun dengan metrik lebih rendah F1-Score (0,8684), sedangkan Robustly Optimized BERT Pretraining Approach (RoBERTa) menunjukkan keseimbangan terbaik antara performa metrik dan distribusi label. InSet Lexicon dan IndoBERT menunjukkan kecenderungan bias terhadap kelas tertentu. Simpulan dari penelitian ini menegaskan bahwa efektivitas pelabelan tidak hanya ditentukan oleh skor metrik, tetapi juga oleh distribusi kelas yang seimbang untuk menghasilkan model yang adil dan dapat digeneralisasi.
Metode pelabelan data memengaruhi performa model IndoBERT.Pelabelan otomatis dengan IndoBERTweet memiliki metrik tinggi tetapi tidak seimbang, sementara pelabelan manual lebih seimbang.RoBERTa menawarkan keseimbangan terbaik antara akurasi dan distribusi kelas.
1. Penelitian lanjutan dapat mengembangkan pendekatan hybrid yang menggabungkan pelabelan manual dan otomatis untuk meningkatkan akurasi sekaligus menjaga keseimbangan kelas. 2. Studi lebih lanjut diperlukan untuk mengatasi masalah ketidakseimbangan kelas dalam metode pelabelan otomatis, terutama untuk data dengan dominasi kelas tertentu. 3. Perbandingan kinerja model transformer lain seperti BERT atau XLNet pada dataset Coretax dapat dilakukan untuk mengevaluasi potensi peningkatan performa yang lebih signifikan.
- Klasifikasi Sentimen Pada Dataset yang Terbatas Menggunakan Algoritma Convolutional Neural Network |... Doi.Org/10.47065/Bulletincsr.V5i4.613Klasifikasi Sentimen Pada Dataset yang Terbatas Menggunakan Algoritma Convolutional Neural Network Doi Org 10 47065 Bulletincsr V5i4 613
- PENERAPAN METODE BERT UNTUK ANALISIS SENTIMEN ULASAN PENGGUNA APLIKASI SEGARI DI GOOGLE PLAY STORE |... doi.org/10.56127/Juit.V4i1.1902PENERAPAN METODE BERT UNTUK ANALISIS SENTIMEN ULASAN PENGGUNA APLIKASI SEGARI DI GOOGLE PLAY STORE doi 10 56127 Juit V4i1 1902
- Pengaruh Tahapan Preprocessing Terhadap Model Indobert dan Indobertweet untuk Mendeteksi Emosi pada Komentar... jtiik.ub.ac.id/index.php/jtiik/article/view/8315Pengaruh Tahapan Preprocessing Terhadap Model Indobert dan Indobertweet untuk Mendeteksi Emosi pada Komentar jtiik ub ac index php jtiik article view 8315
- Comparative Analysis using Various Performance Metrics in Imbalanced Data for Multi-class Text Classification.... thesai.org/Publications/ViewPaper?Volume=14&Issue=6&Code=IJACSA&SerialNo=116Comparative Analysis using Various Performance Metrics in Imbalanced Data for Multi class Text Classification thesai Publications ViewPaper Volume 14 Issue 6 Code IJACSA SerialNo 116
| File size | 646.52 KB |
| Pages | 12 |
| DMCA | Report |
Related /
UMGOUMGO Setalah itu akan di bagi menjadi dua data yaitu train dan validasi Gambar grafik di atas tersebut menunjukkan hubungan antara rasio data latih-uji denganSetalah itu akan di bagi menjadi dua data yaitu train dan validasi Gambar grafik di atas tersebut menunjukkan hubungan antara rasio data latih-uji dengan
IRPIIRPI Adapun pada model tersebut juga menunjukkan hasil pengukuran evaluasi yang paling unggul dibandingkan model RNN dan LSTM. Dengan demikian, model CNN dapatAdapun pada model tersebut juga menunjukkan hasil pengukuran evaluasi yang paling unggul dibandingkan model RNN dan LSTM. Dengan demikian, model CNN dapat
IRPIIRPI Temuan ini mengindikasikan bahwa pendekatan N-BEATS dengan Optuna efektif dalam meningkatkan akurasi prediksi inflasi dan dapat menjadi alat bantu pentingTemuan ini mengindikasikan bahwa pendekatan N-BEATS dengan Optuna efektif dalam meningkatkan akurasi prediksi inflasi dan dapat menjadi alat bantu penting
IRPIIRPI Proses analisis dilakukan melalui tahap prapemrosesan, pembobotan TF-IDF, dan klasifikasi menggunakan algoritma Naïve Bayes dan Support Vector MachineProses analisis dilakukan melalui tahap prapemrosesan, pembobotan TF-IDF, dan klasifikasi menggunakan algoritma Naïve Bayes dan Support Vector Machine
IRPIIRPI Dari hasil penelitian dan pengujian yang dilakukan dapat disimpulkan bahwa algoritma Dijkstra cukup efektif dalam mencari rute yang terpendek sehinggaDari hasil penelitian dan pengujian yang dilakukan dapat disimpulkan bahwa algoritma Dijkstra cukup efektif dalam mencari rute yang terpendek sehingga
IRPIIRPI Namun, sistem ini masih memerlukan pengembangan fitur notifikasi otomatis dan visualisasi interaktif. Selain itu, integrasi sistem log histori replikasiNamun, sistem ini masih memerlukan pengembangan fitur notifikasi otomatis dan visualisasi interaktif. Selain itu, integrasi sistem log histori replikasi
UNAIUNAI Data utama yang dikumpulkan mencakup tanggal dan waktu dari berbagai langkah dalam proses pendaftaran, seperti pembaruan profil mahasiswa, proses persetujuan,Data utama yang dikumpulkan mencakup tanggal dan waktu dari berbagai langkah dalam proses pendaftaran, seperti pembaruan profil mahasiswa, proses persetujuan,
UNAIUNAI Artikel ini merupakan hasil penelitian mengenai persepsi dan kepuasan mahasiswa terhadap evaluasi dosen. Tujuan penelitian ini adalah untuk melihat tingkatArtikel ini merupakan hasil penelitian mengenai persepsi dan kepuasan mahasiswa terhadap evaluasi dosen. Tujuan penelitian ini adalah untuk melihat tingkat
Useful /
IRPIIRPI Hasil menunjukkan daya tarik (1,909) dan stimulasi (1,909) kategori excellent, efisiensi (1,75), ketepatan (1,682), dan kebaruan (1,523) kategori good,Hasil menunjukkan daya tarik (1,909) dan stimulasi (1,909) kategori excellent, efisiensi (1,75), ketepatan (1,682), dan kebaruan (1,523) kategori good,
IRPIIRPI Bahasa isyarat adalah alat komunikasi utama bagi para penyandang tunarungu dan tunawicara. Namun, terbatasnya pemahaman bahasa isyarat oleh masyarakatBahasa isyarat adalah alat komunikasi utama bagi para penyandang tunarungu dan tunawicara. Namun, terbatasnya pemahaman bahasa isyarat oleh masyarakat
IRPIIRPI Temuan ini menggarisbawahi pentingnya strategi segmentasi dalam pengembangan layanan keuangan digital yang lebih inklusif dan relevan dengan kebutuhanTemuan ini menggarisbawahi pentingnya strategi segmentasi dalam pengembangan layanan keuangan digital yang lebih inklusif dan relevan dengan kebutuhan
UNAIUNAI Penelitian ini menunjukkan bahwa integrabilitas fungsi terbatas secara esensial dapat dibahas secara lengkap dalam kerangka teori integrasi Henstock-Kurzweil.Penelitian ini menunjukkan bahwa integrabilitas fungsi terbatas secara esensial dapat dibahas secara lengkap dalam kerangka teori integrasi Henstock-Kurzweil.