Optimalisasi Random Forest untuk Sentimen Bahasa Indonesia dengan GridSearch dan SMOTE

Ahmad Fauzi; Agus Heri Yunial; Dede Eko Saputro; Reza Saputra

Publisher

UNITY ACADEMYUNITY ACADEMY

Journal Jurnal Ilmu Komputer dan Sistem Informasi Abstract

Penelitian ini berfokus pada optimasi algoritma Random Forest untuk analisis sentimen media sosial berbahasa Indonesia dengan menggunakan TextBlob sebagai alat labeling, diikuti oleh teknik balancing data SMOTE dan optimasi hyperparameter dengan GridSearch. Data yang digunakan diambil dari 611 tweet dengan keyword ukt (uang kuliah tunggal). Labeling sentimen menggunakan TextBlob menghasilkan 438 sentimen negatif dan 173 sentimen positif. Metode SMOTE digunakan untuk menyeimbangkan data dengan terlebih dahulu membagi data menjadi 75% data latih dan 25% data uji. Vektorisasi data menggunakan tf-idf. Model algoritma Random Forest dievaluasi dengan akurasi awal menggunakan split data sebesar 73%, dan evaluasi cross validation dengan 10 k-fold menghasilkan nilai akurasi 75%. Optimasi yang dilakukan dengan hyperparameter GridSearch berhasil meningkatkan nilai akurasi menjadi 74%, sementara evaluasi cross validation menggunakan 10 k-fold akurasinya menjadi 89%. Dalam penelitian ini metode SMOTE efektif dalam menyeimbangkan data yang tidak seimbang, dan optimasi hyperparameter gridsearch berhasil meningkatkan nilai akurasi algoritma Random Forest dalam klasifikasi sentimen media sosial berbahasa Indonesia dengan labeling otomatis texblob.

Conclusion

Analisis sentimen media sosial x bahasa Indonesia mengenai ukt, dengan klasifikasi sentimen positif dan negatif dari hasil lebeling otomatis mengggunakan textblob, memiliki nilai akurasi 73% dari hasil penghitungan algoritma random forest dengan pembagian data latih 75% dan data uji 25%, sementara hasil cross validation menggunakan 10 k-fold adalah sebesar 75%.Optimasi algoritma random forest dengan hyperparameter gridsearch berhasil meningkatkan nilai akurasi sebesar 1% menjadi 74%, sementara evaluasi dengan cross validation menggunakan 10 k-fold mengalami peningkatan sebesar 14% sehingga nilai akurasi datanya menjadi 89%.Penelitian ini dapat dilanjutkan dengan vektorisasi lain seperti BOW dengan algoritma klasifikasi seperti SVM, Decision Tree dan lain sebagainya, serta dilakukan labeling otomatis dengan menggunkan Lexicon base bahasa Indonesia untuk mendapatkan hasil akurasi yang lebih baik lagi.

Future Research

Berdasarkan penelitian ini, terdapat beberapa saran penelitian lanjutan yang dapat dikembangkan. Pertama, perlu dilakukan eksplorasi terhadap metode vektorisasi teks lain seperti Bag of Words (BOW) untuk melihat apakah metode ini dapat memberikan hasil yang lebih baik dibandingkan TF-IDF dalam konteks analisis sentimen bahasa Indonesia. Kedua, dapat dilakukan perbandingan kinerja algoritma klasifikasi lain seperti Support Vector Machine (SVM) atau Decision Tree dengan Random Forest untuk mengidentifikasi algoritma yang paling optimal untuk masalah ini. Ketiga, pengembangan sistem labeling otomatis menggunakan lexicon berbasis bahasa Indonesia dapat menjadi fokus penelitian selanjutnya untuk meningkatkan efisiensi dan akurasi proses labeling data sentimen.

References

Download Read online Download

Metadata

File size	551.06 KB
Pages	16
DMCA	Report

Related /

JURIS Evaluasi Kinerja Sistem Drainase dan Rumah Pompa dalam Pengendalian Banjir di Kawasan Pasar Waru Kota Semarang

2026

USMUSM Penelitian ini bertujuan menganalisis efektivitas sistem drainase dan rumah pompa dalam mengalirkan debit limpasan dari wilayah studi menggunakan analisisPenelitian ini bertujuan menganalisis efektivitas sistem drainase dan rumah pompa dalam mengalirkan debit limpasan dari wilayah studi menggunakan analisis

JURIS Peningkatan Pemahaman Konsep Diri Guru TK Cahaya Ilmu Semarang

2026

USMUSM Kegiatan Pengabdian Kepada Masyarakat (PkM) ini bertujuan meningkatkan pemahaman konsep diri guru TK Cahaya Ilmu Semarang guna menunjang profesionalismeKegiatan Pengabdian Kepada Masyarakat (PkM) ini bertujuan meningkatkan pemahaman konsep diri guru TK Cahaya Ilmu Semarang guna menunjang profesionalisme

JURIS Peran Tutor Sebaya dalam Mengembangkan Keterampilan Sosial Siswa Tunarungu Di TK Inklusi

2026

UAIUAI Penelitian ini menggunakan metode kualitatif dengan jenis penelitian studi kasus. Pengumpulan data menggunakan observasi, wawancara dan dokumentasi denganPenelitian ini menggunakan metode kualitatif dengan jenis penelitian studi kasus. Pengumpulan data menggunakan observasi, wawancara dan dokumentasi dengan

JURIS Negosiasi Ideologi Dalam Cerpen Kurik Karya Hasan Al Banna Kajian Hegemoni Gramsci Dalam Pembelajaran Psikologi Sastra

2025

NUSANTARAGLOBALNUSANTARAGLOBAL The short story Kurik depicts how dominant ideologies like capitalism work in society and influence individual perspectives and actions. Hasan Al BannaThe short story Kurik depicts how dominant ideologies like capitalism work in society and influence individual perspectives and actions. Hasan Al Banna

JURIS Kualitas Water Kefir Nanas Ananas comosus dengan Penggunaan Jenis Gula Berbeda

2025

NUSANTARAGLOBALNUSANTARAGLOBAL Oleh karena itu, diperlukan pengembangan makanan fungsional rendah kalori, seperti water kefir nanas yang menggunakan gula tebu, jagung, atau stevia. MetodeOleh karena itu, diperlukan pengembangan makanan fungsional rendah kalori, seperti water kefir nanas yang menggunakan gula tebu, jagung, atau stevia. Metode

2025

NUSANTARAGLOBALNUSANTARAGLOBAL Penelitian ini bertujuan untuk mengidentifikasi struktur komunitas makrozoobentos di ekosistem mangrove Pantai Solop, Indragiri Hilir, dan menentukan validitasPenelitian ini bertujuan untuk mengidentifikasi struktur komunitas makrozoobentos di ekosistem mangrove Pantai Solop, Indragiri Hilir, dan menentukan validitas

2025

NUSANTARAGLOBALNUSANTARAGLOBAL Selain itu, keterlibatan siswa dalam proses belajar meningkat secara signifikan. Temuan ini menunjukkan bahwa metode Role Playing efektif meningkatkanSelain itu, keterlibatan siswa dalam proses belajar meningkat secara signifikan. Temuan ini menunjukkan bahwa metode Role Playing efektif meningkatkan

2025

NUSANTARAGLOBALNUSANTARAGLOBAL Media ini juga membantu menciptakan suasana belajar yang lebih menarik dan kontekstual, meskipun masih terdapat kendala teknis seperti keterbatasan perangkat.Media ini juga membantu menciptakan suasana belajar yang lebih menarik dan kontekstual, meskipun masih terdapat kendala teknis seperti keterbatasan perangkat.

Useful /

2026

USMUSM Analisis scouring dengan HEC-RAS menunjukkan scouring terjadi pada STA 808,98 (5,01 meter), STA 559,1 (4,73 meter), dan STA 503,18 (5,24 meter). PengendalianAnalisis scouring dengan HEC-RAS menunjukkan scouring terjadi pada STA 808,98 (5,01 meter), STA 559,1 (4,73 meter), dan STA 503,18 (5,24 meter). Pengendalian

2025

UNITY ACADEMYUNITY ACADEMY Penerapan image enhancement dapat memperbaiki kualitas citra yang awalnya kabur atau tidak sesuai dengan keinginan pemiliknya menjadi lebih baik. SalahPenerapan image enhancement dapat memperbaiki kualitas citra yang awalnya kabur atau tidak sesuai dengan keinginan pemiliknya menjadi lebih baik. Salah

2025

IAIN PONOROGOIAIN PONOROGO Setelah runtuhnya dinasti Ottoman pada tahun 1924, Turki mengalami perubahan politik dan pemerintahan yang signifikan. Sebelumnya, Turki menjadi bagianSetelah runtuhnya dinasti Ottoman pada tahun 1924, Turki mengalami perubahan politik dan pemerintahan yang signifikan. Sebelumnya, Turki menjadi bagian

2024

IAIN PONOROGOIAIN PONOROGO Penelitian ini menyoroti tradisi sahur-sahur di Mempawah yang tidak hanya sekedar praktik ritual keagamaan, tetapi juga sebagai warisan budaya. Dari sini,Penelitian ini menyoroti tradisi sahur-sahur di Mempawah yang tidak hanya sekedar praktik ritual keagamaan, tetapi juga sebagai warisan budaya. Dari sini,