NINETYJOURNALNINETYJOURNAL

Jurnal Kecerdasan Buatan dan Teknologi InformasiJurnal Kecerdasan Buatan dan Teknologi Informasi

Penelitian ini bertujuan mengembangkan model klasifikasi topik berita politik yang efisien dan interpretable untuk mengatasi tantangan pengelolaan informasi di era digital. Pendekatan ini memanfaatkan algoritma Logistic Regression yang dipadukan dengan representasi fitur Bag of Words (BoW) untuk mengotomatisasi proses pengelompokan berita. Model diimplementasikan menggunakan bahasa pemrograman Python. Proses dimulai dari pengumpulan dataset berita berbahasa Indonesia, dilanjutkan dengan preprocessing teks (case folding, tokenisasi, penghapusan stopwords, dan stemming). Representasi teks dilakukan dengan metode Bag of Words, kemudian data dibagi menjadi 80% untuk pelatihan dan 20% untuk pengujian. Model Logistic Regression dilatih dan dievaluasi menggunakan metrik akurasi, presisi, recall, F1-score, MSE, dan RMSE. Model menunjukkan performa yang kuat dengan akurasi 84% dan F1-score rata-rata 0,84 pada enam kategori topik (politik, ekonomi, hiburan, olahraga, bisnis, teknologi). Pada klasifikasi biner (Politik vs Non-Politik), model mencapai akurasi sempurna 100% dengan MSE dan RMSE 0,00. Visualisasi fitur mengonfirmasi bahwa model mampu mengidentifikasi kata kunci politik seperti “pemilu dan “partai secara konsisten. Penelitian membuktikan bahwa kombinasi Logistic Regression dan BoW merupakan solusi yang efektif, efisien, dan transparan untuk klasifikasi berita politik. Meskipun hasilnya sangat akurat, potensi overfitting akibat ukuran dataset yang kecil (215 sampel) perlu menjadi pertimbangan untuk pengembangan model di masa depan.

Penelitian ini berhasil membangun dan menguji model klasifikasi topik berita politik menggunakan algoritma Logistic Regression yang dipadukan dengan representasi fitur Bag of Words (BoW).Model menunjukkan performa yang sangat tinggi, mencapai akurasi 100% pada data uji untuk klasifikasi biner (Politik vs Non-Politik), dengan nilai Precision, Recall, dan F1-Score masing-masing 1.0, serta MSE dan RMSE sebesar 0.00, yang secara teknis menunjukkan tidak adanya kesalahan prediksi.Visualisasi koefisien model mengungkapkan bahwa kata-kata kunci seperti “politik, “pemilu, “partai, dan “jokowi menjadi fitur paling dominan dalam mengidentifikasi berita politik, membuktikan bahwa model tidak hanya akurat tetapi juga interpretatif.

Melihat hasil penelitian ini, saran untuk studi selanjutnya adalah untuk mengeksplorasi penggunaan dataset yang lebih besar dan beraneka ragam guna memastikan bahwa model tidak hanya bekerja dengan baik pada data yang ada saat ini. Pertanyaan yang menarik untuk diteliti adalah bagaimana pengaruh ukuran dataset terhadap ketepatan model dalam klasifikasi berita politik. Selain itu, perlu juga dilakukan penelitian mengenai integrasi berbagai teknik representasi teks lainnya dan algoritma pembelajaran mesin agar dapat dibandingkan dengan hasil yang diperoleh dari metode Logistic Regression dan Bag of Words ini.

  1. Klasifikasi Sentimen pada Aplikasi Shopee Menggunakan Fitur Bag of Word dan Algoritma Random Forest |... jurnal.ranahresearch.com/index.php/R2J/article/view/994Klasifikasi Sentimen pada Aplikasi Shopee Menggunakan Fitur Bag of Word dan Algoritma Random Forest jurnal ranahresearch index php R2J article view 994
  2. Sentiment Analysis of University Social Media Using Support Vector Machine and Logistic Regression Methods... socjs.telkomuniversity.ac.id/ojs/index.php/indojc/article/view/638Sentiment Analysis of University Social Media Using Support Vector Machine and Logistic Regression Methods socjs telkomuniversity ac ojs index php indojc article view 638
  3. Analisis Kinerja Algoritma Klasifikasi Teks Bert dalam Mendeteksi Berita Hoaks | Jurnal Teknologi Informasi... jtiik.ub.ac.id/index.php/jtiik/article/view/8093Analisis Kinerja Algoritma Klasifikasi Teks Bert dalam Mendeteksi Berita Hoaks Jurnal Teknologi Informasi jtiik ub ac index php jtiik article view 8093
  4. KLASIFIKASI TOPIK BERITA POLITIK MENGGUNAKAN MODEL LOGISTIC REGRESSION DAN FITUR BAG OF WORDS | Jurnal... ojs.ninetyjournal.com/index.php/JKBTI/article/view/375KLASIFIKASI TOPIK BERITA POLITIK MENGGUNAKAN MODEL LOGISTIC REGRESSION DAN FITUR BAG OF WORDS Jurnal ojs ninetyjournal index php JKBTI article view 375
File size587.15 KB
Pages10
DMCAReportReport

ads-block-test