IRPIIRPI
MALCOM: Indonesian Journal of Machine Learning and Computer ScienceMALCOM: Indonesian Journal of Machine Learning and Computer ScienceAnalisis sentimen terhadap opini publik di media sosial menjadi tantangan signifikan karena kompleksitas bahasa informal dan volume data yang besar. Penelitian ini bertujuan untuk mengevaluasi pengaruh lima pendekatan pelabelan data manual, IndoBERT, IndoBERTweet, RoBERTa, dan InSet Lexicon terhadap performa model Indonesian Bidirectional Encoder Representations from Transformers (IndoBERT) dalam klasifikasi sentimen terkait isu Coretax. Sebanyak 8.035 tweet dikumpulkan, diproses, dan dilabeli menggunakan masing-masing pendekatan. Dataset hasil pelabelan kemudian digunakan untuk melatih ulang model IndoBERT, yang dievaluasi menggunakan metrik akurasi, F1-score, confusion matrix, dan kurva Receiver Operating Characteristic-Area Under the Curve (ROC-AUC). Hasil menunjukkan bahwa pelabelan otomatis menggunakan Indonesian Bidirectional Encoder Representations from Transformers for Tweet (IndoBERTweet) menghasilkan metrik tertinggi F1-Score (0,9802), tetapi mengalami dominasi kelas netral yang menunjukkan overfitting. Pelabelan manual menghasilkan distribusi kelas yang lebih merata meskipun dengan metrik lebih rendah F1-Score (0,8684), sedangkan Robustly Optimized BERT Pretraining Approach (RoBERTa) menunjukkan keseimbangan terbaik antara performa metrik dan distribusi label. InSet Lexicon dan IndoBERT menunjukkan kecenderungan bias terhadap kelas tertentu. Simpulan dari penelitian ini menegaskan bahwa efektivitas pelabelan tidak hanya ditentukan oleh skor metrik, tetapi juga oleh distribusi kelas yang seimbang untuk menghasilkan model yang adil dan dapat digeneralisasi.
Metode pelabelan data memengaruhi performa model IndoBERT.Pelabelan otomatis dengan IndoBERTweet memiliki metrik tinggi tetapi tidak seimbang, sementara pelabelan manual lebih seimbang.RoBERTa menawarkan keseimbangan terbaik antara akurasi dan distribusi kelas.
1. Penelitian lanjutan dapat mengembangkan pendekatan hybrid yang menggabungkan pelabelan manual dan otomatis untuk meningkatkan akurasi sekaligus menjaga keseimbangan kelas. 2. Studi lebih lanjut diperlukan untuk mengatasi masalah ketidakseimbangan kelas dalam metode pelabelan otomatis, terutama untuk data dengan dominasi kelas tertentu. 3. Perbandingan kinerja model transformer lain seperti BERT atau XLNet pada dataset Coretax dapat dilakukan untuk mengevaluasi potensi peningkatan performa yang lebih signifikan.
- Klasifikasi Sentimen Pada Dataset yang Terbatas Menggunakan Algoritma Convolutional Neural Network |... Doi.Org/10.47065/Bulletincsr.V5i4.613Klasifikasi Sentimen Pada Dataset yang Terbatas Menggunakan Algoritma Convolutional Neural Network Doi Org 10 47065 Bulletincsr V5i4 613
- PENERAPAN METODE BERT UNTUK ANALISIS SENTIMEN ULASAN PENGGUNA APLIKASI SEGARI DI GOOGLE PLAY STORE |... doi.org/10.56127/Juit.V4i1.1902PENERAPAN METODE BERT UNTUK ANALISIS SENTIMEN ULASAN PENGGUNA APLIKASI SEGARI DI GOOGLE PLAY STORE doi 10 56127 Juit V4i1 1902
- Pengaruh Tahapan Preprocessing Terhadap Model Indobert dan Indobertweet untuk Mendeteksi Emosi pada Komentar... jtiik.ub.ac.id/index.php/jtiik/article/view/8315Pengaruh Tahapan Preprocessing Terhadap Model Indobert dan Indobertweet untuk Mendeteksi Emosi pada Komentar jtiik ub ac index php jtiik article view 8315
- Comparative Analysis using Various Performance Metrics in Imbalanced Data for Multi-class Text Classification.... thesai.org/Publications/ViewPaper?Volume=14&Issue=6&Code=IJACSA&SerialNo=116Comparative Analysis using Various Performance Metrics in Imbalanced Data for Multi class Text Classification thesai Publications ViewPaper Volume 14 Issue 6 Code IJACSA SerialNo 116
| File size | 646.52 KB |
| Pages | 12 |
| DMCA | Report |
Related /
STAIRUSTAIRU Selain itu dapat diartikan juga cocok, patut, sesuai, atau mendekati. Dikatakan A munasabah dengan B, berarti A mendekati atau menyerupai B. PerbedaanSelain itu dapat diartikan juga cocok, patut, sesuai, atau mendekati. Dikatakan A munasabah dengan B, berarti A mendekati atau menyerupai B. Perbedaan
STAITARUNASTAITARUNA Pendekatan tafsir kontekstual Abdullah Saeed berhasil mengintegrasikan strukturalisme linguistik Saussure dengan hermeneutika Qurani, menghasilkan metodePendekatan tafsir kontekstual Abdullah Saeed berhasil mengintegrasikan strukturalisme linguistik Saussure dengan hermeneutika Qurani, menghasilkan metode
STAITARUNASTAITARUNA Penelitian ini mengkaji makna simbolik empat anggota wudhu dalam Tafsir Al-Mishbah pada Surah Al-Maidah ayat 6 dengan pendekatan deskriptif-analitis berbasisPenelitian ini mengkaji makna simbolik empat anggota wudhu dalam Tafsir Al-Mishbah pada Surah Al-Maidah ayat 6 dengan pendekatan deskriptif-analitis berbasis
IAIN GORONTALOIAIN GORONTALO Kesadaran untuk bijak dalam memilih konten akan sangat berpengaruh terhadap kelancaran proses penerapan pendidikan karakter. Konten edukasi tentang HalalKesadaran untuk bijak dalam memilih konten akan sangat berpengaruh terhadap kelancaran proses penerapan pendidikan karakter. Konten edukasi tentang Halal
IAIN GORONTALOIAIN GORONTALO Studi tersebut menemukan bahwa teknologi mempunyai dampak signifikan terhadap peningkatan efektivitas proses belajar mengajar, optimalisasi pengelolaanStudi tersebut menemukan bahwa teknologi mempunyai dampak signifikan terhadap peningkatan efektivitas proses belajar mengajar, optimalisasi pengelolaan
IAIN GORONTALOIAIN GORONTALO Al-Ghazali gives value in terms of material and Islamic knowledge. Ibn Khaldun gave knowledge of naqliyah and aqliyah. This affects the development ofAl-Ghazali gives value in terms of material and Islamic knowledge. Ibn Khaldun gave knowledge of naqliyah and aqliyah. This affects the development of
IAIN GORONTALOIAIN GORONTALO Blended Learning merupakan langkah progresif dalam meningkatkan self-regulated learning dan motivasi belajar siswa di era digital saat ini. Blended LearningBlended Learning merupakan langkah progresif dalam meningkatkan self-regulated learning dan motivasi belajar siswa di era digital saat ini. Blended Learning
IAIN GORONTALOIAIN GORONTALO Dari sebuah studi teoretis pemikiran tentang kurikulum pendidikan Islam Indonesia di tengah globalisasi, dapat disimpulkan bahwa pentingnya transformasiDari sebuah studi teoretis pemikiran tentang kurikulum pendidikan Islam Indonesia di tengah globalisasi, dapat disimpulkan bahwa pentingnya transformasi
Useful /
UNTUNT Analisis hubungan antar variabel dialkukan dengan menggunakan uji t-test dengan signifikansi statistik p < 0,05. Hasil: Temuan penelitian menunjukkan bahwaAnalisis hubungan antar variabel dialkukan dengan menggunakan uji t-test dengan signifikansi statistik p < 0,05. Hasil: Temuan penelitian menunjukkan bahwa
IRPIIRPI Stunting masih menjadi masalah serius dengan prevalensi tinggi di Indonesia (21,6% pada tahun 2022). Salah satu hambatan utama adalah kurangnya akses mudahStunting masih menjadi masalah serius dengan prevalensi tinggi di Indonesia (21,6% pada tahun 2022). Salah satu hambatan utama adalah kurangnya akses mudah
IRPIIRPI Algoritma Dijkstra sangat tepat digunakan untuk mencari rute terpendek menuju Universitas Pamulang. Dari hasil penelitian dan pengujian yang dilakukanAlgoritma Dijkstra sangat tepat digunakan untuk mencari rute terpendek menuju Universitas Pamulang. Dari hasil penelitian dan pengujian yang dilakukan
ATIDEWANTARAATIDEWANTARA Dalam sesi persiapan, guru diberikan software Anates untuk di-install dalam laptop masing-masing (bagi guru yang membawa laptop). Selanjutnya pemaparanDalam sesi persiapan, guru diberikan software Anates untuk di-install dalam laptop masing-masing (bagi guru yang membawa laptop). Selanjutnya pemaparan