UBUB

Jurnal Teknologi Informasi dan Ilmu KomputerJurnal Teknologi Informasi dan Ilmu Komputer

Perkembangan pesat media sosial telah memberikan ruang bagi setiap individu untuk menyampaikan pendapat, baik berupa komentar positif maupun negatif terhadap konten yang mereka akses. Kemudahan dalam memberikan opini secara daring ini berdampak pada semakin besarnya jumlah ulasan yang tersedia. Namun, volume ulasan yang sangat besar sering kali sulit untuk dianalisis secara manual dan berpotensi menimbulkan bias dalam penilaian. Untuk mengatasi permasalahan tersebut, diperlukan pendekatan otomatis melalui klasifikasi sentimen yang bertujuan mengelompokkan opini pengguna ke dalam kategori positif atau negatif. Dalam penelitian ini digunakan tiga algoritma pembelajaran mesin, yaitu Naïve Bayes (NB), K-Nearest Neighbor (KNN), dan Random Forest (RF). Data penelitian diperoleh dari public dataset UCI Machine Learning. Fokus penelitian adalah meningkatkan kinerja klasifikasi dengan memanfaatkan teknik seleksi fitur information gain. Hasil eksperimen menunjukkan bahwa penerapan information gain secara konsisten meningkatkan performa semua algoritma yang diuji, baik pada metrik akurasi, presisi, recall, maupun f1-score. Naïve Bayes awalnya memperoleh akurasi tertinggi sebesar 74,33% pada kondisi tanpa fitur tambahan. Namun, setelah penerapan information gain, algoritma KNN menunjukkan hasil paling optimal dengan akurasi mencapai 81,28% serta performa yang relatif seimbang pada semua metrik evaluasi. Sementara itu, Random Forest juga mengalami peningkatan, meskipun tidak melampaui KNN. Secara keseluruhan, penelitian ini menegaskan bahwa pemilihan fitur yang relevan melalui information gain mampu meningkatkan efisiensi dan efektivitas klasifikasi sentimen, serta dapat menjadi pendekatan yang potensial untuk menganalisis opini dalam skala besar.

Eksperimen menunjukkan peningkatan akurasi, presisi, recall, dan f1-score pada semua algoritma setelah penerapan information gain.KNN memberikan akurasi tertinggi 81,28% dan kinerja seimbang pada semua metrik.Kelemahan masih terletak pada tinggi rasio false positive dan false negative.Penelitian lanjutan dapat difokuskan pada optimasi hyperparameter, penerapan teknik praproses lanjutan, dan perluasan dataset untuk meningkatkan akurasi serta generalisasi model.

Pengembangan penelitian selanjutnya dapat menyelidiki integrasi algoritma ensemble seperti Voting Classifier atau Blending untuk menggabungkan keunggulan Naïve Bayes, KNN, dan Random Forest sehingga dapat menurunkan tingkat false positive dan false negative secara simultan; melanjutkan studi dengan menerapkan teknik augmentasi teks dan balancing data (misalnya SMOTE) guna menghadapi ketidakseimbangan kelas spam dan ham serta memaksimalkan pemanfaatan informasi konteks kalimat melalui model embedding modern seperti BERT atau FastText; serta melakukan evaluasi transfer learning dengan memanfaatkan dataset komentar YouTube lain atau platform media sosial berbeda agar model dapat lebih generalisasi, sehingga dapat menyediakan sistem deteksi spam real-time yang adaptif terhadap dinamika konten dan perilaku pengguna.

  1. Optimalisasi Seleksi Fitur Untuk Deteksi Serangan Pada IoT Menggunakan Classifier Subset Evaluator |... doi.org/10.30865/jurikom.v9i4.4618Optimalisasi Seleksi Fitur Untuk Deteksi Serangan Pada IoT Menggunakan Classifier Subset Evaluator doi 10 30865 jurikom v9i4 4618
  2. Aktualisasi Kinerja melalui Pelatihan Pembuatan Video Iklan Berbasis Artificial Intellegence untuk Mendukung... doi.org/10.32764/abdimasif.v6i1.5339Aktualisasi Kinerja melalui Pelatihan Pembuatan Video Iklan Berbasis Artificial Intellegence untuk Mendukung doi 10 32764 abdimasif v6i1 5339
  3. Bigram feature extraction and conditional random fields model to improve text classification clinical... doi.org/10.12928/TELKOMNIKA.v19i3.18357Bigram feature extraction and conditional random fields model to improve text classification clinical doi 10 12928 TELKOMNIKA v19i3 18357
  4. Optimalisasi Ekstraksi Fitur dan Klasifikasi untuk Deteksi Objek di IoT | Jurnal Sistem dan Informatika... doi.org/10.30864/jsi.v18i1.602Optimalisasi Ekstraksi Fitur dan Klasifikasi untuk Deteksi Objek di IoT Jurnal Sistem dan Informatika doi 10 30864 jsi v18i1 602
Read online
File size417.18 KB
Pages7
DMCAReport

Related /

ads-block-test