IDID

Jurnal Ilmu Komputer dan InformatikaJurnal Ilmu Komputer dan Informatika

Pertumbuhan pesat aplikasi seluler telah menghasilkan volume besar ulasan pengguna, sehingga analisis sentimen otomatis menjadi penting untuk memahami persepsi pengguna. Penelitian sebelumnya menunjukkan bahwa meskipun model pembelajaran mesin dapat berprestasi baik pada klasifikasi sentimen biner, mereka sering mengalami kesulitan pada pengaturan multi‑kelas, khususnya dalam mengidentifikasi sentimen netral karena ambiguitas linguistik dan ketidakseimbangan kelas. Penelitian ini bertujuan untuk mengevaluasi secara komparatif kinerja Support Vector Machine (SVM) dan Random Forest dalam analisis sentimen multi‑kelas, dengan fokus khusus pada kemampuan mereka menangani kategori sentimen netral. Pendekatan pembelajaran terawasi diterapkan menggunakan 2.112 ulasan pengguna berbahasa Indonesia yang dikumpulkan dari Google Play Store. Data dipra‑proses dengan teknik Pengolahan Bahasa Alami standar dan direpresentasikan menggunakan fitur TF‑IDF. Kedua model dilatih dan dievaluasi menggunakan akurasi, presisi, recall, skor F1, serta matriks kebingungan. Hasil menunjukkan bahwa SVM mencapai akurasi 86,52 %, melampaui Random Forest yang memperoleh 83,45 %. Namun, kedua model sama sekali gagal mengklasifikasikan kelas sentimen netral, menghasilkan nilai presisi dan recall nol untuk kategori tersebut. Kegagalan ini menyoroti pengaruh dominan ketidakseimbangan kelas yang parah serta kurangnya diskriminasi fitur untuk sentimen netral. Temuan tersebut menegaskan keterbatasan kritis pendekatan pembelajaran mesin tradisional dalam analisis sentimen multi‑kelas dan menekankan kebutuhan akan strategi yang lebih baik, seperti resampling data, representasi fitur tingkat lanjut, atau model hibrida, untuk meningkatkan deteksi sentimen netral pada aplikasi dunia nyata.

Penelitian ini membandingkan algoritma SVM dan Random Forest untuk analisis sentimen multi‑kelas pada ulasan aplikasi Indonesia, dimana SVM menunjukkan akurasi keseluruhan 86,52 % dan lebih unggul dibandingkan Random Forest.Kedua model berhasil membedakan sentimen negatif dan positif namun gagal total mengklasifikasikan sentimen netral akibat ketidakseimbangan kelas yang sangat tinggi.Oleh karena itu, penelitian selanjutnya disarankan untuk mengatasi ketidakseimbangan tersebut melalui teknik resampling atau pendekatan pembelajaran transfer, atau mempertimbangkan pengubahan masalah menjadi klasifikasi biner untuk memperoleh hasil yang lebih andal.

Penelitian lanjutan dapat mengeksplorasi (1) efektivitas teknik augmentasi data berbasis teks, seperti SMOTE‑NLP atau generative adversarial networks, untuk meningkatkan jumlah sampel sentimen netral pada korpus ulasan berbahasa Indonesia, sehingga memperbaiki representasi kelas minoritas dan evaluasi performa menggunakan metrik kelas‑spesifik; (2) pengembangan model hibrida yang menggabungkan representasi konteksual transformer (misalnya BERT Bahasa Indonesia) dengan classifier tradisional seperti SVM atau Random Forest, untuk memanfaatkan keunggulan fitur semantik dalam mendeteksi sentimen netral yang ambigu serta analisis error pada kelas netral; serta (3) penerapan pembelajaran transfer dari dataset sentimen berbahasa Inggris yang kaya akan contoh netral ke bahasa Indonesia, dengan melakukan fine‑tuning model multilingual dan membandingkan strategi oversampling tradisional, guna menilai apakah pengetahuan lintas bahasa dapat mengurangi dampak ketidakseimbangan kelas. Ketiga arah penelitian ini tidak hanya menjawab keterbatasan yang diidentifikasi dalam studi ini, tetapi juga membuka peluang untuk meningkatkan akurasi dan keandalan sistem analisis sentimen pada aplikasi seluler di lingkungan berbahasa Indonesia.

  1. Tackling the Problem of Class Imbalance in Multi-class.... tackling problem class imbalance multi skip... doi.org/10.2478/fcds-2019-0009Tackling the Problem of Class Imbalance in Multi class tackling problem class imbalance multi skip doi 10 2478 fcds 2019 0009
Read online
File size4.26 MB
Pages10
DMCAReport

Related /

ads-block-test