Analisis Sentimen Ulasan Pengguna Online Single Submission Menggunakan SVM dan Random Forest Sebuah Studi Perbandingan

Ardy Wicaksono; Suyahman Suyahman; Muhammad Anwar Fauzi; Deny Prasetyo; Dwi Utari Iswavigra; Yulaikha Mar'atullatifah; Agatha Pricillia Sekar  Tamtomo; Muhammad Adi Pratama

Publisher

IDID

Journal Jurnal Ilmu Komputer dan Informatika Abstract

Pertumbuhan pesat aplikasi seluler telah menghasilkan volume besar ulasan pengguna, sehingga analisis sentimen otomatis menjadi penting untuk memahami persepsi pengguna. Penelitian sebelumnya menunjukkan bahwa meskipun model pembelajaran mesin dapat berprestasi baik pada klasifikasi sentimen biner, mereka sering mengalami kesulitan pada pengaturan multi‑kelas, khususnya dalam mengidentifikasi sentimen netral karena ambiguitas linguistik dan ketidakseimbangan kelas. Penelitian ini bertujuan untuk mengevaluasi secara komparatif kinerja Support Vector Machine (SVM) dan Random Forest dalam analisis sentimen multi‑kelas, dengan fokus khusus pada kemampuan mereka menangani kategori sentimen netral. Pendekatan pembelajaran terawasi diterapkan menggunakan 2.112 ulasan pengguna berbahasa Indonesia yang dikumpulkan dari Google Play Store. Data dipra‑proses dengan teknik Pengolahan Bahasa Alami standar dan direpresentasikan menggunakan fitur TF‑IDF. Kedua model dilatih dan dievaluasi menggunakan akurasi, presisi, recall, skor F1, serta matriks kebingungan. Hasil menunjukkan bahwa SVM mencapai akurasi 86,52 %, melampaui Random Forest yang memperoleh 83,45 %. Namun, kedua model sama sekali gagal mengklasifikasikan kelas sentimen netral, menghasilkan nilai presisi dan recall nol untuk kategori tersebut. Kegagalan ini menyoroti pengaruh dominan ketidakseimbangan kelas yang parah serta kurangnya diskriminasi fitur untuk sentimen netral. Temuan tersebut menegaskan keterbatasan kritis pendekatan pembelajaran mesin tradisional dalam analisis sentimen multi‑kelas dan menekankan kebutuhan akan strategi yang lebih baik, seperti resampling data, representasi fitur tingkat lanjut, atau model hibrida, untuk meningkatkan deteksi sentimen netral pada aplikasi dunia nyata.

Conclusion

Penelitian ini membandingkan algoritma SVM dan Random Forest untuk analisis sentimen multi‑kelas pada ulasan aplikasi Indonesia, dimana SVM menunjukkan akurasi keseluruhan 86,52 % dan lebih unggul dibandingkan Random Forest.Kedua model berhasil membedakan sentimen negatif dan positif namun gagal total mengklasifikasikan sentimen netral akibat ketidakseimbangan kelas yang sangat tinggi.Oleh karena itu, penelitian selanjutnya disarankan untuk mengatasi ketidakseimbangan tersebut melalui teknik resampling atau pendekatan pembelajaran transfer, atau mempertimbangkan pengubahan masalah menjadi klasifikasi biner untuk memperoleh hasil yang lebih andal.

Future Research

Penelitian lanjutan dapat mengeksplorasi (1) efektivitas teknik augmentasi data berbasis teks, seperti SMOTE‑NLP atau generative adversarial networks, untuk meningkatkan jumlah sampel sentimen netral pada korpus ulasan berbahasa Indonesia, sehingga memperbaiki representasi kelas minoritas dan evaluasi performa menggunakan metrik kelas‑spesifik; (2) pengembangan model hibrida yang menggabungkan representasi konteksual transformer (misalnya BERT Bahasa Indonesia) dengan classifier tradisional seperti SVM atau Random Forest, untuk memanfaatkan keunggulan fitur semantik dalam mendeteksi sentimen netral yang ambigu serta analisis error pada kelas netral; serta (3) penerapan pembelajaran transfer dari dataset sentimen berbahasa Inggris yang kaya akan contoh netral ke bahasa Indonesia, dengan melakukan fine‑tuning model multilingual dan membandingkan strategi oversampling tradisional, guna menilai apakah pengetahuan lintas bahasa dapat mengurangi dampak ketidakseimbangan kelas. Ketiga arah penelitian ini tidak hanya menjawab keterbatasan yang diidentifikasi dalam studi ini, tetapi juga membuka peluang untuk meningkatkan akurasi dan keandalan sistem analisis sentimen pada aplikasi seluler di lingkungan berbahasa Indonesia.

References

Tackling the Problem of Class Imbalance in Multi-class.... tackling problem class imbalance multi skip... doi.org/10.2478/fcds-2019-0009Tackling the Problem of Class Imbalance in Multi class tackling problem class imbalance multi skip doi 10 2478 fcds 2019 0009

Download Read online Download

Metadata

File size	4.26 MB
Pages	10
DMCA	Report

Related /

JURIS The Relationship Between Sleep Quality With Anxiety Level Clinical Clerkship Students of The Medical Faculty Universitas Pembangunan Nasional Veteran Jakarta

2026

YARSIYARSI Desain penelitian ini berupa deskriptif analitik dengan pendekatan cross sectiona. Kualitas tidur pada responden akan dinilai menggunakan kuesioner PittsburghDesain penelitian ini berupa deskriptif analitik dengan pendekatan cross sectiona. Kualitas tidur pada responden akan dinilai menggunakan kuesioner Pittsburgh

JURIS Identification of Social Media Addiction Levels on TikTok Among Students Using Mamdani Fuzzy Logic

2026

UNITOMOUNITOMO Penelitian ini mengukur tingkat kecanduan TikTok pada mahasiswa dengan menganalisis variabel durasi penggunaan, dampak produktivitas, dan pengabaian interaksiPenelitian ini mengukur tingkat kecanduan TikTok pada mahasiswa dengan menganalisis variabel durasi penggunaan, dampak produktivitas, dan pengabaian interaksi

JURIS Analisis Sentimen Ulasan Pengguna Aplikasi Atma Menggunakan Algoritma Na ve Bayes

2025

APTIKOMAPTIKOM Hasil pengujian menunjukkan bahwa akurasi algoritma meningkat secara signifikan setelah penerapan SMOTE. Akurasi tertinggi yang dicapai adalah sebesarHasil pengujian menunjukkan bahwa akurasi algoritma meningkat secara signifikan setelah penerapan SMOTE. Akurasi tertinggi yang dicapai adalah sebesar

JURIS Pengembangan Model Prediksi Keberhasilan Mahasiswa Menggunakan Algoritma Machine Learning Dalam Learning Management System

2025

MEDIAPUBLIKASIMEDIAPUBLIKASI Dari empat algoritma yang diuji, Random Forest memberikan performa terbaik dengan akurasi mencapai 89%. Penerapan model ini dapat mendukung sistem pembelajaranDari empat algoritma yang diuji, Random Forest memberikan performa terbaik dengan akurasi mencapai 89%. Penerapan model ini dapat mendukung sistem pembelajaran

JURIS Comparative Analysis of Decision Tree and Artificial Neural Network Methods for Predicting Potential Heart Disease

2025

UNITOMOUNITOMO Penelitian ini bertujuan untuk membandingkan kinerja model Decision Tree dan Artificial Neural Network (ANN), termasuk varian Elman dan Jordan, untuk mengidentifikasiPenelitian ini bertujuan untuk membandingkan kinerja model Decision Tree dan Artificial Neural Network (ANN), termasuk varian Elman dan Jordan, untuk mengidentifikasi

2023

UNITOMOUNITOMO Jurnal yang dipilih diterbitkan tidak lebih dari 5 tahun, dari tahun 2017 hingga 2022.identifikasi data analitis dalam jurnal studi pustaka menghasilkanJurnal yang dipilih diterbitkan tidak lebih dari 5 tahun, dari tahun 2017 hingga 2022.identifikasi data analitis dalam jurnal studi pustaka menghasilkan

2021

JOIVJOIV Terdapat kebutuhan besar akan dataset yang lebih realistis untuk menguji kemampuan model secara menyeluruh, dan di sinilah N‑BaIoT berperan, karena jugaTerdapat kebutuhan besar akan dataset yang lebih realistis untuk menguji kemampuan model secara menyeluruh, dan di sinilah N‑BaIoT berperan, karena juga

2021

STMIKLOMBOKSTMIKLOMBOK Seseorang yang memiliki sindroma metabolik biasanya sulit mendeteksi, karena dibutuhkan ahli dalam menganalisanya. Fuzzy Sistem Pakar (Fuzzy Expert System)Seseorang yang memiliki sindroma metabolik biasanya sulit mendeteksi, karena dibutuhkan ahli dalam menganalisanya. Fuzzy Sistem Pakar (Fuzzy Expert System)

Useful /

2026

IDID This study investigates the effect of Random Search–based hyperparameter optimization on a Decision Tree model for heart failure risk prediction usingThis study investigates the effect of Random Search–based hyperparameter optimization on a Decision Tree model for heart failure risk prediction using

2021

JOIVJOIV Namun, metode ini memiliki kelemahan yaitu cenderung merekomendasikan berita yang memiliki kesamaan konten seperti judul dan isi berita kepada pengguna.Namun, metode ini memiliki kelemahan yaitu cenderung merekomendasikan berita yang memiliki kesamaan konten seperti judul dan isi berita kepada pengguna.

2021

JOIVJOIV Tujuan penelitian ini adalah mengekstraksi dan menganalisis secara otomatis apakah buku teks mencerminkan unsur-unsur pembelajaran kurikulum informatikaTujuan penelitian ini adalah mengekstraksi dan menganalisis secara otomatis apakah buku teks mencerminkan unsur-unsur pembelajaran kurikulum informatika

2021

JOIVJOIV Teknik DSR untuk mengembangkan aplikasi interaktif yang sangat dapat digunakan dan dapat diakses diterapkan dalam merancang pendekatan ini. Desain antarmukaTeknik DSR untuk mengembangkan aplikasi interaktif yang sangat dapat digunakan dan dapat diakses diterapkan dalam merancang pendekatan ini. Desain antarmuka