HOSTJOURNALSHOSTJOURNALS

Bulletin of Computer Science ResearchBulletin of Computer Science Research

Analisis emosi otomatis pada teks informal berbahasa Indonesia merupakan tugas yang menantang karena tingginya variasi linguistik, penggunaan bahasa gaul, dan singkatan. Penelitian ini berfokus pada pengembangan dan evaluasi model klasifikasi emosi yang akurat, yang dapat menjadi komponen dasar yang andal untuk berbagai aplikasi Natural Language Processing (NLP) yang relevan. Metode yang diusulkan adalah fine-tuning model bahasa pre-trained IndoBERT untuk mengklasifikasikan teks dari media sosial Twitter (X) ke dalam lima kelas emosi: anger (marah), fear (takut), happy (senang), love (cinta), dan sadness (sedih). Sebuah dataset kustom yang terdiri dari 4.940 cuitan Twitter dibangun melalui proses scraping bertarget dan pelabelan yang tervalidasi secara statistik untuk memastikan relevansi dan keseimbangan data. Eksperimen menunjukkan bahwa setelah melalui tahapan pra-pemrosesan teks yang komprehensif, termasuk normalisasi menggunakan kamus singkatan kustom dan stemming, model yang di-fine-tuning mampu mencapai kinerja yang sangat tinggi. Hasil evaluasi pada data uji menunjukkan model berhasil mencapai akurasi sebesar 94% dan F1-score rata-rata tertimbang 0.94. Analisis kurva pembelajaran juga mengonfirmasi bahwa model tidak mengalami overfitting dan memiliki kemampuan generalisasi yang baik. Hasil ini membuktikan bahwa pendekatan fine-tuning IndoBERT merupakan solusi yang sangat efektif dan andal untuk klasifikasi emosi pada domain teks informal bahasa Indonesia.

Penelitian ini berhasil menunjukkan efektivitas metode fine-tuning model IndoBERT untuk tugas klasifikasi emosi multi-kelas pada teks informal bahasa Indonesia yang berasal dari media sosial Twitter.Dengan membangun sebuah dataset kustom yang seimbang melalui scraping bertarget dan menerapkan proses pelabelan yang tervalidasi secara statistik, model yang dikembangkan mampu mengatasi tantangan linguistik seperti penggunaan bahasa gaul dan singkatan.Hasil evaluasi pada data uji membuktikan bahwa model yang di-fine-tuning mencapai kinerja yang sangat tinggi dengan akurasi sebesar 94% dan F1-Score rata-rata tertimbang 0.Analisis kurva pembelajaran juga mengonfirmasi bahwa model yang dilatih sehat secara teknis dan tidak mengalami overfitting, sehingga memiliki kemampuan generalisasi yang andal pada data baru.Kinerja yang kuat dan seimbang di kelima kelas emosi (marah, takut, senang, cinta, dan sedih) menegaskan bahwa IndoBERT, ketika diadaptasi dengan benar, merupakan solusi yang sangat kuat untuk tugas-tugas Natural Language Processing pada domain teks informal bahasa Indonesia.Kinerja model yang tinggi ini menunjukkan potensinya sebagai komponen inti yang andal untuk berbagai aplikasi praktis yang bergantung pada pemahaman emosi pengguna.Selain itu, model ini dapat diaplikasikan dalam analisis sentimen publik, pemantauan citra merek, atau layanan pelanggan cerdas.

Berdasarkan hasil penelitian ini, beberapa saran penelitian lanjutan yang dapat dilakukan adalah: 1. Membandingkan kinerja IndoBERT dengan model-model baseline lain, seperti machine learning tradisional (misalnya, SVM atau Naïve Bayes) atau arsitektur deep learning alternatif (seperti LSTM/Bi-LSTM), untuk melihat keunggulan dan kelemahan masing-masing model dalam klasifikasi emosi multi-kelas pada teks informal bahasa Indonesia. 2. Mengembangkan teknik khusus untuk mendeteksi ekspresi emosi yang lebih kompleks seperti sarkasme dan ironi, yang seringkali sulit untuk diidentifikasi oleh model-model klasifikasi emosi konvensional. 3. Menambah kelas emosi yang lebih beragam (misalnya, terkejut atau jijik) untuk meningkatkan cakupan dan akurasi model dalam memahami spektrum emosi yang lebih luas. Dengan melakukan penelitian lanjutan ini, diharapkan dapat meningkatkan kinerja dan kemampuan model dalam memahami emosi pengguna dalam teks informal bahasa Indonesia, serta membuka peluang untuk aplikasi-aplikasi praktis yang lebih canggih dan personal.

  1. Klasifikasi Gelembung Gas Menggunakan Multibeam Echosounder dan Machine Learning | Rabbani | Jurnal Kelautan... doi.org/10.14710/jkt.v28i2.26778Klasifikasi Gelembung Gas Menggunakan Multibeam Echosounder dan Machine Learning Rabbani Jurnal Kelautan doi 10 14710 jkt v28i2 26778
  2. Domain-Specific Language Model Post-Training for Indonesian Financial NLP | IEEE Conference Publication... ieeexplore.ieee.org/document/10346625Domain Specific Language Model Post Training for Indonesian Financial NLP IEEE Conference Publication ieeexplore ieee document 10346625
  3. OJS Installation. ojs installation table contents close loading previous next ejournal.patria-artha.ac.id/index.php/patj/installOJS Installation ojs installation table contents close loading previous next ejournal patria artha ac index php patj install
  4. Analisis Sentimen Terhadap PERMENDIKBUD No.30 pada Media Sosial Twitter Menggunakan Metode Naive Bayes... ejournal.poltekharber.ac.id/index.php/informatika/article/view/3191Analisis Sentimen Terhadap PERMENDIKBUD No 30 pada Media Sosial Twitter Menggunakan Metode Naive Bayes ejournal poltekharber ac index php informatika article view 3191
  5. The hybrid of BERT and deep learning models for Indonesian sentiment analysis | Guna Mandhasiya | Indonesian... ijeecs.iaescore.com/index.php/IJEECS/article/view/33790The hybrid of BERT and deep learning models for Indonesian sentiment analysis Guna Mandhasiya Indonesian ijeecs iaescore index php IJEECS article view 33790
Read online
File size713.95 KB
Pages12
DMCAReport

Related /

ads-block-test