JOIVJOIV

JOIV : International Journal on Informatics VisualizationJOIV : International Journal on Informatics Visualization

Jumlah berita yang diproduksi setiap hari mencapai 3 juta, sehingga pembaca memiliki banyak pilihan berita sesuai dengan preferensi topik dan kategori masing‑masing. Sistem rekomendasi dapat mempermudah pengguna dalam memilih berita yang akan dibaca. Metode yang dapat digunakan untuk memberikan rekomendasi bagi pengguna yang sama adalah collaborative filtering. Neural collaborative filtering biasanya digunakan pada sistem rekomendasi dengan menggabungkan collaborative filtering dan jaringan saraf. Namun, metode ini memiliki kelemahan yaitu cenderung merekomendasikan berita yang memiliki kesamaan konten seperti judul dan isi berita kepada pengguna. Penelitian ini bertujuan mengembangkan neural collaborative filtering dengan memanfaatkan Sentence BERT. Sentence BERT diterapkan pada judul dan isi berita yang diubah menjadi sentence embedding. Hasil embedding tersebut digunakan dalam neural collaborative bersama dengan item id, user id, dan kategori berita. Dataset Microsoft News yang digunakan terdiri atas 50.000 pengguna dan 51.282 berita, dengan 5.475.542 interaksi antara pengguna dan berita. Evaluasi dalam penelitian ini menggunakan metrik precision, recall, dan kurva ROC untuk memprediksi klik berita oleh pengguna. Evaluasi lain menggunakan hit ratio dengan metode leave‑one‑out. Hasil evaluasi memperoleh nilai precision 99,14 %, recall 92,48 %, f1‑score 95,69 %, dan ROC 98 %. Pengukuran hit ratio@10 menghasilkan hit ratio 74 % pada epoch kelima puluh untuk neural collaborative dengan Sentence BERT, yang lebih baik dibandingkan neural collaborative filtering (NCF) dan NCF dengan kategori berita.

Penelitian ini mengembangkan model sistem rekomendasi hibrida dengan menggabungkan neural collaborative filtering dan Sentence BERT, menggunakan model pra‑latih paraphrase‑mpnet‑base‑v2 untuk menghasilkan embedding judul dan isi berita.Evaluasi menunjukkan bahwa model hibrida menghasilkan hit ratio yang lebih tinggi dibandingkan neural collaborative filtering konvensional, meskipun penambahan kategori berita tidak meningkatkan performa secara signifikan.Penelitian selanjutnya disarankan untuk mengeksplorasi variasi embedding kalimat, melakukan tuning hyperparameter, serta menguji dataset dengan kategori yang lebih homogen.

Penelitian selanjutnya dapat mengkaji pengaruh penggunaan model embedding kalimat alternatif, seperti SimCSE atau Universal Sentence Encoder, terhadap akurasi rekomendasi berita dengan membandingkan precision, recall, dan hit ratio pada dataset yang sama; selanjutnya, dilakukan optimasi hyperparameter jaringan neural collaborative filtering menggunakan algoritma metaheuristik seperti Dragonfly atau Bayesian Optimization untuk mempelajari dampaknya terhadap konvergensi model serta kualitas rekomendasi; terakhir, penelitian dapat mengevaluasi efektivitas model pada kumpulan data yang memiliki distribusi kategori berita lebih homogen, guna menentukan apakah reduksi variasi kategori dapat meningkatkan kualitas embedding dan menghasilkan hit ratio yang lebih tinggi.

  1. #sentence bert#sentence bert
File size3.96 MB
Pages8
DMCAReportReport

ads-block-test