NINETYJOURNALNINETYJOURNAL
Jurnal Kecerdasan Buatan dan Teknologi InformasiJurnal Kecerdasan Buatan dan Teknologi InformasiPenelitian ini bertujuan mengembangkan model klasifikasi topik berita politik yang efisien dan interpretable untuk mengatasi tantangan pengelolaan informasi di era digital. Pendekatan ini memanfaatkan algoritma Logistic Regression yang dipadukan dengan representasi fitur Bag of Words (BoW) untuk mengotomatisasi proses pengelompokan berita. Model diimplementasikan menggunakan bahasa pemrograman Python. Proses dimulai dari pengumpulan dataset berita berbahasa Indonesia, dilanjutkan dengan preprocessing teks (case folding, tokenisasi, penghapusan stopwords, dan stemming). Representasi teks dilakukan dengan metode Bag of Words, kemudian data dibagi menjadi 80% untuk pelatihan dan 20% untuk pengujian. Model Logistic Regression dilatih dan dievaluasi menggunakan metrik akurasi, presisi, recall, F1-score, MSE, dan RMSE. Model menunjukkan performa yang kuat dengan akurasi 84% dan F1-score rata-rata 0,84 pada enam kategori topik (politik, ekonomi, hiburan, olahraga, bisnis, teknologi). Pada klasifikasi biner (Politik vs Non-Politik), model mencapai akurasi sempurna 100% dengan MSE dan RMSE 0,00. Visualisasi fitur mengonfirmasi bahwa model mampu mengidentifikasi kata kunci politik seperti “pemilu dan “partai secara konsisten. Penelitian membuktikan bahwa kombinasi Logistic Regression dan BoW merupakan solusi yang efektif, efisien, dan transparan untuk klasifikasi berita politik. Meskipun hasilnya sangat akurat, potensi overfitting akibat ukuran dataset yang kecil (215 sampel) perlu menjadi pertimbangan untuk pengembangan model di masa depan.
Penelitian ini berhasil membangun dan menguji model klasifikasi topik berita politik menggunakan algoritma Logistic Regression yang dipadukan dengan representasi fitur Bag of Words (BoW).Model menunjukkan performa yang sangat tinggi, mencapai akurasi 100% pada data uji untuk klasifikasi biner (Politik vs Non-Politik), dengan nilai Precision, Recall, dan F1-Score masing-masing 1.0, serta MSE dan RMSE sebesar 0.00, yang secara teknis menunjukkan tidak adanya kesalahan prediksi.Visualisasi koefisien model mengungkapkan bahwa kata-kata kunci seperti “politik, “pemilu, “partai, dan “jokowi menjadi fitur paling dominan dalam mengidentifikasi berita politik, membuktikan bahwa model tidak hanya akurat tetapi juga interpretatif.
Melihat hasil penelitian ini, saran untuk studi selanjutnya adalah untuk mengeksplorasi penggunaan dataset yang lebih besar dan beraneka ragam guna memastikan bahwa model tidak hanya bekerja dengan baik pada data yang ada saat ini. Pertanyaan yang menarik untuk diteliti adalah bagaimana pengaruh ukuran dataset terhadap ketepatan model dalam klasifikasi berita politik. Selain itu, perlu juga dilakukan penelitian mengenai integrasi berbagai teknik representasi teks lainnya dan algoritma pembelajaran mesin agar dapat dibandingkan dengan hasil yang diperoleh dari metode Logistic Regression dan Bag of Words ini.
- Klasifikasi Sentimen pada Aplikasi Shopee Menggunakan Fitur Bag of Word dan Algoritma Random Forest |... jurnal.ranahresearch.com/index.php/R2J/article/view/994Klasifikasi Sentimen pada Aplikasi Shopee Menggunakan Fitur Bag of Word dan Algoritma Random Forest jurnal ranahresearch index php R2J article view 994
- Sentiment Analysis of University Social Media Using Support Vector Machine and Logistic Regression Methods... socjs.telkomuniversity.ac.id/ojs/index.php/indojc/article/view/638Sentiment Analysis of University Social Media Using Support Vector Machine and Logistic Regression Methods socjs telkomuniversity ac ojs index php indojc article view 638
- Analisis Kinerja Algoritma Klasifikasi Teks Bert dalam Mendeteksi Berita Hoaks | Jurnal Teknologi Informasi... jtiik.ub.ac.id/index.php/jtiik/article/view/8093Analisis Kinerja Algoritma Klasifikasi Teks Bert dalam Mendeteksi Berita Hoaks Jurnal Teknologi Informasi jtiik ub ac index php jtiik article view 8093
- KLASIFIKASI TOPIK BERITA POLITIK MENGGUNAKAN MODEL LOGISTIC REGRESSION DAN FITUR BAG OF WORDS | Jurnal... ojs.ninetyjournal.com/index.php/JKBTI/article/view/375KLASIFIKASI TOPIK BERITA POLITIK MENGGUNAKAN MODEL LOGISTIC REGRESSION DAN FITUR BAG OF WORDS Jurnal ojs ninetyjournal index php JKBTI article view 375
| File size | 587.15 KB |
| Pages | 10 |
| DMCA | ReportReport |
Related /
NINETYJOURNALNINETYJOURNAL Perkembangan industri kopi yang pesat menimbulkan tantangan bagi pembeli dalam memilih menu yang sesuai dengan preferensi mereka, terutama ketika banyaknyaPerkembangan industri kopi yang pesat menimbulkan tantangan bagi pembeli dalam memilih menu yang sesuai dengan preferensi mereka, terutama ketika banyaknya
NINETYJOURNALNINETYJOURNAL Sistem ini dirancang untuk memfasilitasi dua aktor utama, yaitu Admin (pengelola) dan Pengguna (nasabah), dengan fitur-fitur utama seperti manajemen dataSistem ini dirancang untuk memfasilitasi dua aktor utama, yaitu Admin (pengelola) dan Pengguna (nasabah), dengan fitur-fitur utama seperti manajemen data
NINETYJOURNALNINETYJOURNAL Data studio dapat diolah dengan baik, mulai dari kondisi awal yang kosong hingga tersimpan lengkap dengan informasi nama, rating, jam operasional, lokasi,Data studio dapat diolah dengan baik, mulai dari kondisi awal yang kosong hingga tersimpan lengkap dengan informasi nama, rating, jam operasional, lokasi,
NINETYJOURNALNINETYJOURNAL Fokus pengujian ini adalah form pencarian program promo, yang memungkinkan pencarian promo yang sedang berlangsung maupun yang telah selesai. Proses pengujianFokus pengujian ini adalah form pencarian program promo, yang memungkinkan pencarian promo yang sedang berlangsung maupun yang telah selesai. Proses pengujian
Useful /
NINETYJOURNALNINETYJOURNAL Berdasarkan implementasi Sistem Pendukung Keputusan (SPK) menggunakan metode Simple Additive Weighting (SAW) untuk rekomendasi pemilihan jurusan sesuaiBerdasarkan implementasi Sistem Pendukung Keputusan (SPK) menggunakan metode Simple Additive Weighting (SAW) untuk rekomendasi pemilihan jurusan sesuai
NINETYJOURNALNINETYJOURNAL Dengan mengumpulkan 2. 581 sampel data dari platform media sosial X, Instagram, dan TikTok, penelitian ini bertujuan untuk memahami respons publik secaraDengan mengumpulkan 2. 581 sampel data dari platform media sosial X, Instagram, dan TikTok, penelitian ini bertujuan untuk memahami respons publik secara
NINETYJOURNALNINETYJOURNAL Pada penelitian menggunakan sebanyak 300 gambar data dengan tiga kelas yaitu apel, jeruk dan pisang. Hasil penelitian menunjukan algoritma (YOLO) dapatPada penelitian menggunakan sebanyak 300 gambar data dengan tiga kelas yaitu apel, jeruk dan pisang. Hasil penelitian menunjukan algoritma (YOLO) dapat
NINETYJOURNALNINETYJOURNAL Dengan adanya aplikasi ini penyakit ISPA dapat didiagnosa berdasarkan gejala-gejala yang ada pada pasien. Aplikasi ini memuat basis pengetahuan, halamanDengan adanya aplikasi ini penyakit ISPA dapat didiagnosa berdasarkan gejala-gejala yang ada pada pasien. Aplikasi ini memuat basis pengetahuan, halaman