UNITY ACADEMYUNITY ACADEMY

Jurnal Ilmu Komputer dan Sistem InformasiJurnal Ilmu Komputer dan Sistem Informasi

Penelitian ini berfokus pada optimasi algoritma Random Forest untuk analisis sentimen media sosial berbahasa Indonesia dengan menggunakan TextBlob sebagai alat labeling, diikuti oleh teknik balancing data SMOTE dan optimasi hyperparameter dengan GridSearch. Data yang digunakan diambil dari 611 tweet dengan keyword ukt (uang kuliah tunggal). Labeling sentimen menggunakan TextBlob menghasilkan 438 sentimen negatif dan 173 sentimen positif. Metode SMOTE digunakan untuk menyeimbangkan data dengan terlebih dahulu membagi data menjadi 75% data latih dan 25% data uji. Vektorisasi data menggunakan tf-idf. Model algoritma Random Forest dievaluasi dengan akurasi awal menggunakan split data sebesar 73%, dan evaluasi cross validation dengan 10 k-fold menghasilkan nilai akurasi 75%. Optimasi yang dilakukan dengan hyperparameter GridSearch berhasil meningkatkan nilai akurasi menjadi 74%, sementara evaluasi cross validation menggunakan 10 k-fold akurasinya menjadi 89%. Dalam penelitian ini metode SMOTE efektif dalam menyeimbangkan data yang tidak seimbang, dan optimasi hyperparameter gridsearch berhasil meningkatkan nilai akurasi algoritma Random Forest dalam klasifikasi sentimen media sosial berbahasa Indonesia dengan labeling otomatis texblob.

Analisis sentimen media sosial x bahasa Indonesia mengenai ukt, dengan klasifikasi sentimen positif dan negatif dari hasil lebeling otomatis mengggunakan textblob, memiliki nilai akurasi 73% dari hasil penghitungan algoritma random forest dengan pembagian data latih 75% dan data uji 25%, sementara hasil cross validation menggunakan 10 k-fold adalah sebesar 75%.Optimasi algoritma random forest dengan hyperparameter gridsearch berhasil meningkatkan nilai akurasi sebesar 1% menjadi 74%, sementara evaluasi dengan cross validation menggunakan 10 k-fold mengalami peningkatan sebesar 14% sehingga nilai akurasi datanya menjadi 89%.Penelitian ini dapat dilanjutkan dengan vektorisasi lain seperti BOW dengan algoritma klasifikasi seperti SVM, Decision Tree dan lain sebagainya, serta dilakukan labeling otomatis dengan menggunkan Lexicon base bahasa Indonesia untuk mendapatkan hasil akurasi yang lebih baik lagi.

Berdasarkan penelitian ini, terdapat beberapa saran penelitian lanjutan yang dapat dikembangkan. Pertama, perlu dilakukan eksplorasi terhadap metode vektorisasi teks lain seperti Bag of Words (BOW) untuk melihat apakah metode ini dapat memberikan hasil yang lebih baik dibandingkan TF-IDF dalam konteks analisis sentimen bahasa Indonesia. Kedua, dapat dilakukan perbandingan kinerja algoritma klasifikasi lain seperti Support Vector Machine (SVM) atau Decision Tree dengan Random Forest untuk mengidentifikasi algoritma yang paling optimal untuk masalah ini. Ketiga, pengembangan sistem labeling otomatis menggunakan lexicon berbasis bahasa Indonesia dapat menjadi fokus penelitian selanjutnya untuk meningkatkan efisiensi dan akurasi proses labeling data sentimen.

  1. Metode SVM dan Naive Bayes untuk Analisis Sentimen ChatGPT di Twitter | The Indonesian Journal of Computer... ijcs.net/ijcs/index.php/ijcs/article/view/3341Metode SVM dan Naive Bayes untuk Analisis Sentimen ChatGPT di Twitter The Indonesian Journal of Computer ijcs ijcs index php ijcs article view 3341
  2. Implementation of Diffusion Variational Autoencoder for Stock Price Prediction with the Integration of... doi.org/10.62146/ijecbe.v2i2.55Implementation of Diffusion Variational Autoencoder for Stock Price Prediction with the Integration of doi 10 62146 ijecbe v2i2 55
  3. Sentiment Analysis of the 2024 Indonesia Presidential Election on Twitter | Sinkron : jurnal dan penelitian... jurnal.polgan.ac.id/index.php/sinkron/article/view/13379Sentiment Analysis of the 2024 Indonesia Presidential Election on Twitter Sinkron jurnal dan penelitian jurnal polgan ac index php sinkron article view 13379
Read online
File size551.06 KB
Pages16
DMCAReport

Related /

ads-block-test