Kinerja Metode Fine Tuning IndoBERT untuk Klasifikasi Emosi Multi Kelas pada Teks Informal Bahasa Indonesia

Haikal Fawwaz Karim; Adityo Permana Wibowo

Publisher

HOSTJOURNALSHOSTJOURNALS

Journal Bulletin of Computer Science Research Abstract

Analisis emosi otomatis pada teks informal berbahasa Indonesia merupakan tugas yang menantang karena tingginya variasi linguistik, penggunaan bahasa gaul, dan singkatan. Penelitian ini berfokus pada pengembangan dan evaluasi model klasifikasi emosi yang akurat, yang dapat menjadi komponen dasar yang andal untuk berbagai aplikasi Natural Language Processing (NLP) yang relevan. Metode yang diusulkan adalah fine-tuning model bahasa pre-trained IndoBERT untuk mengklasifikasikan teks dari media sosial Twitter (X) ke dalam lima kelas emosi: anger (marah), fear (takut), happy (senang), love (cinta), dan sadness (sedih). Sebuah dataset kustom yang terdiri dari 4.940 cuitan Twitter dibangun melalui proses scraping bertarget dan pelabelan yang tervalidasi secara statistik untuk memastikan relevansi dan keseimbangan data. Eksperimen menunjukkan bahwa setelah melalui tahapan pra-pemrosesan teks yang komprehensif, termasuk normalisasi menggunakan kamus singkatan kustom dan stemming, model yang di-fine-tuning mampu mencapai kinerja yang sangat tinggi. Hasil evaluasi pada data uji menunjukkan model berhasil mencapai akurasi sebesar 94% dan F1-score rata-rata tertimbang 0.94. Analisis kurva pembelajaran juga mengonfirmasi bahwa model tidak mengalami overfitting dan memiliki kemampuan generalisasi yang baik. Hasil ini membuktikan bahwa pendekatan fine-tuning IndoBERT merupakan solusi yang sangat efektif dan andal untuk klasifikasi emosi pada domain teks informal bahasa Indonesia.

Conclusion

Penelitian ini berhasil menunjukkan efektivitas metode fine-tuning model IndoBERT untuk tugas klasifikasi emosi multi-kelas pada teks informal bahasa Indonesia yang berasal dari media sosial Twitter.Dengan membangun sebuah dataset kustom yang seimbang melalui scraping bertarget dan menerapkan proses pelabelan yang tervalidasi secara statistik, model yang dikembangkan mampu mengatasi tantangan linguistik seperti penggunaan bahasa gaul dan singkatan.Hasil evaluasi pada data uji membuktikan bahwa model yang di-fine-tuning mencapai kinerja yang sangat tinggi dengan akurasi sebesar 94% dan F1-Score rata-rata tertimbang 0.Analisis kurva pembelajaran juga mengonfirmasi bahwa model yang dilatih sehat secara teknis dan tidak mengalami overfitting, sehingga memiliki kemampuan generalisasi yang andal pada data baru.Kinerja yang kuat dan seimbang di kelima kelas emosi (marah, takut, senang, cinta, dan sedih) menegaskan bahwa IndoBERT, ketika diadaptasi dengan benar, merupakan solusi yang sangat kuat untuk tugas-tugas Natural Language Processing pada domain teks informal bahasa Indonesia.Kinerja model yang tinggi ini menunjukkan potensinya sebagai komponen inti yang andal untuk berbagai aplikasi praktis yang bergantung pada pemahaman emosi pengguna.Selain itu, model ini dapat diaplikasikan dalam analisis sentimen publik, pemantauan citra merek, atau layanan pelanggan cerdas.

Future Research

Berdasarkan hasil penelitian ini, beberapa saran penelitian lanjutan yang dapat dilakukan adalah: 1. Membandingkan kinerja IndoBERT dengan model-model baseline lain, seperti machine learning tradisional (misalnya, SVM atau Naïve Bayes) atau arsitektur deep learning alternatif (seperti LSTM/Bi-LSTM), untuk melihat keunggulan dan kelemahan masing-masing model dalam klasifikasi emosi multi-kelas pada teks informal bahasa Indonesia. 2. Mengembangkan teknik khusus untuk mendeteksi ekspresi emosi yang lebih kompleks seperti sarkasme dan ironi, yang seringkali sulit untuk diidentifikasi oleh model-model klasifikasi emosi konvensional. 3. Menambah kelas emosi yang lebih beragam (misalnya, terkejut atau jijik) untuk meningkatkan cakupan dan akurasi model dalam memahami spektrum emosi yang lebih luas. Dengan melakukan penelitian lanjutan ini, diharapkan dapat meningkatkan kinerja dan kemampuan model dalam memahami emosi pengguna dalam teks informal bahasa Indonesia, serta membuka peluang untuk aplikasi-aplikasi praktis yang lebih canggih dan personal.

References

Download Read online Download

Metadata

File size	713.95 KB
Pages	12
DMCA	Report

Related /

JURIS Pembuatan Sediaan Pasta Gigi Gel Ekstrak Etanol Daun Kelor Moringa Oleifera Asal Lancirang Kab Sidrap

2026

STIKMARSTIKMAR Konsentrasi zat aktif yang digunakan dalam setiap formula adalah 3%, 6%, dan 9%. Kemudian dilakukan uji organoleptis terhadap sediaan pasta gigi gel yangKonsentrasi zat aktif yang digunakan dalam setiap formula adalah 3%, 6%, dan 9%. Kemudian dilakukan uji organoleptis terhadap sediaan pasta gigi gel yang

JURIS APLIKASI MESIN LEARNING DENGAN MODEL NAIVE BAYES UNTUK EVALUASI KEPUASAN MAHASISWA STUDI KASUS PERPUSTAKAAN KAMPUS UNSURYA

2026

UNSURYAUNSURYA Evaluasi kepuasan mahasiswa menjadi elemen penting dalam meningkatkan kualitas layanan perpustakaan, karena memungkinkan identifikasi area yang memerlukanEvaluasi kepuasan mahasiswa menjadi elemen penting dalam meningkatkan kualitas layanan perpustakaan, karena memungkinkan identifikasi area yang memerlukan

JURIS Evaluasi Kebijakan Penerapan Aplikasi Srikandi di Sekretariat Jenderal Dewan Perwakilan Daerah Republik Indonesia Tahun 2023 2024

2025

STIAMISTIAMI Aplikasi Srikandi dirancang untuk meningkatkan efektivitas, efisiensi, dan aksesibilitas dokumen secara real-time dalam pengelolaan administrasi. PenelitianAplikasi Srikandi dirancang untuk meningkatkan efektivitas, efisiensi, dan aksesibilitas dokumen secara real-time dalam pengelolaan administrasi. Penelitian

JURIS Analisis Sistem Penggajian pada Kantor Jasa Akuntan Neny Mariyani

2025

UNDHIRA BALIUNDHIRA BALI Hal ini membuktikan dari hasil evaluasi bahwa petugas fungsi yang terkait dengan prosedur pembayaran gaji pegawai dalam sistem penggajian Kantor Jasa AkuntanHal ini membuktikan dari hasil evaluasi bahwa petugas fungsi yang terkait dengan prosedur pembayaran gaji pegawai dalam sistem penggajian Kantor Jasa Akuntan

JURIS Segmentasi Pelanggan E Commerce Menggunakan Fitur Recency Frequency Monetary RFM dan Algoritma Klasterisasi K Means

2024

UIN SUKAUIN SUKA Ketiga, output dari analisis dapat disajikan secara visual melalui aplikasi web menggunakan pustaka Streamlit, sehingga dapat memberikan dukungan untukKetiga, output dari analisis dapat disajikan secara visual melalui aplikasi web menggunakan pustaka Streamlit, sehingga dapat memberikan dukungan untuk

2024

UNAMAUNAMA Berdasarkan hasil rekapitulasi evaluasi dari 30 responden terhadap aplikasi MakanKuy dengan menggunakan 10 kriteria penilaian, dapat disimpulkan bahwaBerdasarkan hasil rekapitulasi evaluasi dari 30 responden terhadap aplikasi MakanKuy dengan menggunakan 10 kriteria penilaian, dapat disimpulkan bahwa

2023

MEDIAPUBLIKASIMEDIAPUBLIKASI Tujuan dari kegiatan pengabdian ini yaitu untuk mengenalkan dan meningkatkan pengetahuan masyarakat pada tempat perindukan nyamuk sebagai upaya pengendalianTujuan dari kegiatan pengabdian ini yaitu untuk mengenalkan dan meningkatkan pengetahuan masyarakat pada tempat perindukan nyamuk sebagai upaya pengendalian

2019

UBTUBT Saat ini kedua mitra masih memiliki kendala dalam menjalankan usaha mereka, diantaranya keterbatasan dalam alat produksi, kendala dalam memasarkan hasilSaat ini kedua mitra masih memiliki kendala dalam menjalankan usaha mereka, diantaranya keterbatasan dalam alat produksi, kendala dalam memasarkan hasil

Useful /

2026

UNSURYAUNSURYA Maka dari itu, penerapan teknologi blockchain di platform e-commerce dapat menjadi solusi untuk membangun kepercayaan konsumen dan meningkatkan keamananMaka dari itu, penerapan teknologi blockchain di platform e-commerce dapat menjadi solusi untuk membangun kepercayaan konsumen dan meningkatkan keamanan

2026

UNSURYAUNSURYA Dalam prakteknya sering kali terjadi ketidaksesuaian antara rating dan komentar yang diberikan sehingga terjadi bias sentimen, sehingga perlu dilakukanDalam prakteknya sering kali terjadi ketidaksesuaian antara rating dan komentar yang diberikan sehingga terjadi bias sentimen, sehingga perlu dilakukan

2026

UNSURYAUNSURYA Pada penelitian ini akan menggunakan metode Single Exponential Smoothing dan Double Exponential Smoothing. Hasil perbandingan yang didapat yaitu DoublePada penelitian ini akan menggunakan metode Single Exponential Smoothing dan Double Exponential Smoothing. Hasil perbandingan yang didapat yaitu Double

2019

UBTUBT Kegiatan Kemitraan Program Masyarakat berbasis Revolusi mental dengan gerakan Indonesia Bersih, Gerakan Indonesia Mandiri dan Gerakan indonesia melayaniKegiatan Kemitraan Program Masyarakat berbasis Revolusi mental dengan gerakan Indonesia Bersih, Gerakan Indonesia Mandiri dan Gerakan indonesia melayani