Fitur Information Gain untuk Meningkatkan Nilai Performa Pengklasifikasi Machine Learning pada Analisis Sentimen Komentar Spam Pengguna Youtube

Gunardi Gunardi; Eni  Rohaini; Ronald  Naibaho; Bambang  Sukoco; Jasmir Jasmir

Publisher

UBUB

Journal Jurnal Teknologi Informasi dan Ilmu Komputer Abstract

Perkembangan pesat media sosial telah memberikan ruang bagi setiap individu untuk menyampaikan pendapat, baik berupa komentar positif maupun negatif terhadap konten yang mereka akses. Kemudahan dalam memberikan opini secara daring ini berdampak pada semakin besarnya jumlah ulasan yang tersedia. Namun, volume ulasan yang sangat besar sering kali sulit untuk dianalisis secara manual dan berpotensi menimbulkan bias dalam penilaian. Untuk mengatasi permasalahan tersebut, diperlukan pendekatan otomatis melalui klasifikasi sentimen yang bertujuan mengelompokkan opini pengguna ke dalam kategori positif atau negatif. Dalam penelitian ini digunakan tiga algoritma pembelajaran mesin, yaitu Naïve Bayes (NB), K-Nearest Neighbor (KNN), dan Random Forest (RF). Data penelitian diperoleh dari public dataset UCI Machine Learning. Fokus penelitian adalah meningkatkan kinerja klasifikasi dengan memanfaatkan teknik seleksi fitur information gain. Hasil eksperimen menunjukkan bahwa penerapan information gain secara konsisten meningkatkan performa semua algoritma yang diuji, baik pada metrik akurasi, presisi, recall, maupun f1-score. Naïve Bayes awalnya memperoleh akurasi tertinggi sebesar 74,33% pada kondisi tanpa fitur tambahan. Namun, setelah penerapan information gain, algoritma KNN menunjukkan hasil paling optimal dengan akurasi mencapai 81,28% serta performa yang relatif seimbang pada semua metrik evaluasi. Sementara itu, Random Forest juga mengalami peningkatan, meskipun tidak melampaui KNN. Secara keseluruhan, penelitian ini menegaskan bahwa pemilihan fitur yang relevan melalui information gain mampu meningkatkan efisiensi dan efektivitas klasifikasi sentimen, serta dapat menjadi pendekatan yang potensial untuk menganalisis opini dalam skala besar.

Conclusion

Eksperimen menunjukkan peningkatan akurasi, presisi, recall, dan f1-score pada semua algoritma setelah penerapan information gain.KNN memberikan akurasi tertinggi 81,28% dan kinerja seimbang pada semua metrik.Kelemahan masih terletak pada tinggi rasio false positive dan false negative.Penelitian lanjutan dapat difokuskan pada optimasi hyperparameter, penerapan teknik praproses lanjutan, dan perluasan dataset untuk meningkatkan akurasi serta generalisasi model.

Future Research

Pengembangan penelitian selanjutnya dapat menyelidiki integrasi algoritma ensemble seperti Voting Classifier atau Blending untuk menggabungkan keunggulan Naïve Bayes, KNN, dan Random Forest sehingga dapat menurunkan tingkat false positive dan false negative secara simultan; melanjutkan studi dengan menerapkan teknik augmentasi teks dan balancing data (misalnya SMOTE) guna menghadapi ketidakseimbangan kelas spam dan ham serta memaksimalkan pemanfaatan informasi konteks kalimat melalui model embedding modern seperti BERT atau FastText; serta melakukan evaluasi transfer learning dengan memanfaatkan dataset komentar YouTube lain atau platform media sosial berbeda agar model dapat lebih generalisasi, sehingga dapat menyediakan sistem deteksi spam real-time yang adaptif terhadap dinamika konten dan perilaku pengguna.

References

Download Read online Download

Metadata

File size	417.18 KB
Pages	7
DMCA	Report

Related /

JURIS Implementasi TinyML dengan Edge AI untuk Deteksi Anomali Sensor IoT pada Kondisi Lingkungan Tropis

2026

UNIPOLUNIPOL Hasil simulasi menunjukkan model TinyML mencapai akurasi deteksi anomali sebesar 89,4%, ukuran model 142 KB, dan latensi inferensi rata-rata 28 ms. ModelHasil simulasi menunjukkan model TinyML mencapai akurasi deteksi anomali sebesar 89,4%, ukuran model 142 KB, dan latensi inferensi rata-rata 28 ms. Model

JURIS Klasifikasi Jenis Kurma Berdasarkan Fitur Warna Bentuk dan Tekstur Dengan Support Vector Machine

2026

UNIPOLUNIPOL Penerapan preprocessing, segmentasi adaptif, dan ekstraksi fitur mendukung representasi visual ketiga jenis kurma secara konsisten. Rekomendasi selanjutnyaPenerapan preprocessing, segmentasi adaptif, dan ekstraksi fitur mendukung representasi visual ketiga jenis kurma secara konsisten. Rekomendasi selanjutnya

JURIS Pengembangan Sistem E Learning Inklusif Cerdas untuk Tuna Netra dengan Integrasi Teknologi Voice Command dan Text To Speech

2026

UBUB Evaluasi langsung dengan pengguna tunanetra diperlukan untuk menilai efektivitas nyata. Pengembangan lebih lanjut sebaiknya menambahkan opsi bahasa, penyesuaianEvaluasi langsung dengan pengguna tunanetra diperlukan untuk menilai efektivitas nyata. Pengembangan lebih lanjut sebaiknya menambahkan opsi bahasa, penyesuaian

JURIS Optimasi Formula Blending Produk Marine Fuel Oil Low Sulfur MFO LS untuk Pemenuhan Bahan Bakar Kapal Berstandar International Maritim Organization IMO 2020

2026

PNLPNL Studi menunjukkan bahwa blending residu dan distilat dengan proporsi yang tepat dapat mengontrol parameter seperti viskositas, densitas, dan kandunganStudi menunjukkan bahwa blending residu dan distilat dengan proporsi yang tepat dapat mengontrol parameter seperti viskositas, densitas, dan kandungan

JURIS Tinjauan Literatur Tentang Event Log dan Process Mining Implementasi Tools dan Algoritma

2026

UBUB Pendekatan ini memanfaatkan alat bantu seperti Disco, ProM, dan metode berbasis machine learning untuk menggali pola perilaku, memahami proses, dan mengevaluasiPendekatan ini memanfaatkan alat bantu seperti Disco, ProM, dan metode berbasis machine learning untuk menggali pola perilaku, memahami proses, dan mengevaluasi

2026

UBUB Penelitian ini berhasil mengembangkan dan mengevaluasi model Convolutional Neural Network (CNN) untuk mengklasifikasikan gambar buah dalam 14 kelas berdasarkanPenelitian ini berhasil mengembangkan dan mengevaluasi model Convolutional Neural Network (CNN) untuk mengklasifikasikan gambar buah dalam 14 kelas berdasarkan

2026

UNIPOLUNIPOL Produktivitas jagung dipengaruhi oleh faktor agroklimat dan karakteristik tanah yang saling berinteraksi secara kompleks, sehingga diperlukan pendekatanProduktivitas jagung dipengaruhi oleh faktor agroklimat dan karakteristik tanah yang saling berinteraksi secara kompleks, sehingga diperlukan pendekatan

2026

UNIPOLUNIPOL Adapun metode dan pendekatan yang digunakan dalam penelitian adalah metode pengumpulan data meliputi teknik observasi, kepustakaan, terstruktur yang menggunakanAdapun metode dan pendekatan yang digunakan dalam penelitian adalah metode pengumpulan data meliputi teknik observasi, kepustakaan, terstruktur yang menggunakan

Useful /

2026

SIBERPUBLISHERSIBERPUBLISHER Penelitian kualitatif digunakan dengan pendekatan studi kasus melalui wawancara dengan pemangku kepentingan pemerintah, pengelola destinasi, dan masyarakatPenelitian kualitatif digunakan dengan pendekatan studi kasus melalui wawancara dengan pemangku kepentingan pemerintah, pengelola destinasi, dan masyarakat

2026

UBUB Penelitian ini menggunakan model YOLOv8n untuk mendeteksi penyakit pada daun tanaman padi. 999 citra yang kemudian dibagi menjadi 70% untuk pelatihan,Penelitian ini menggunakan model YOLOv8n untuk mendeteksi penyakit pada daun tanaman padi. 999 citra yang kemudian dibagi menjadi 70% untuk pelatihan,

2026

UBUB Berdasarkan pengujian, posisi kendali metode LQG paling stabil terdapat pada posisi -3 m dengan waktu ajeg rise time 2,31 detik, settling time 2,44 detik,Berdasarkan pengujian, posisi kendali metode LQG paling stabil terdapat pada posisi -3 m dengan waktu ajeg rise time 2,31 detik, settling time 2,44 detik,

2026

UNIPOLUNIPOL Pengujian di lahan pertanian serta simulasi numerik mengindikasikan jarak ≤70 m sebagai jarak ideal dengan akurasi ≥92 % dan efisiensi energi yangPengujian di lahan pertanian serta simulasi numerik mengindikasikan jarak ≤70 m sebagai jarak ideal dengan akurasi ≥92 % dan efisiensi energi yang