IKMIIKMI

Jurnal ICT: Information Communication & TechnologyJurnal ICT: Information Communication & Technology

Pertumbuhan publikasi ilmiah di Indonesia menuntut mekanisme pencarian metadata yang efisien. Penelitian ini bertujuan membandingkan performa algoritma Term Frequency-Inverse Document Frequency (TF-IDF) dan Best Matching 25 (BM25) pada platform agregator Temujurnal.com. Metodologi yang digunakan meliputi pra-pemrosesan teks dan penerapan logika Hybrid Retrieval yang mengintegrasikan variabel tekstual dengan filter peringkat Sinta, bulan terbit dan biaya publikasi. Pengujian dilakukan menggunakan 100 metadata jurnal dan 20 kueri uji dengan metrik evaluasi Precision, Recall, F1-Score, dan Mean Average Precision (MAP). Hasil penelitian menunjukkan bahwa BM25 secara signifikan mengungguli TF-IDF dengan nilai MAP 0,74 berbanding 0,59. Algoritma BM25 terbukti lebih stabil dalam menangani variasi panjang metadata jurnal dibandingkan TF-IDF. Penelitian ini merekomendasikan implementasi BM25 pada platform Temujurnal untuk meningkatkan akurasi dan efisiensi sistem temu kembali literatur ilmiah nasional.

Berdasarkan hasil analisis dan eksperimen yang telah dilakukan dalam membandingkan algoritma BM25 dan TF-IDF untuk temu kembali metadata jurnal pada platform Temujurnal.Pertama, Algoritma BM25 terbukti lebih unggul dibandingkan TF-IDF dalam seluruh metrik evaluasi yang digunakan.Kedua, Keunggulan BM25 terletak pada penggunaan parameter normalisasi dokumen (b=0,75) yang mampu menangani heterogenitas metadata jurnal secara stabil.Ketiga, Implementasi logika Hybrid Retrieval yang menggabungkan filter Peringkat Sinta, Periode Terbit dan Biaya Publikasi sebagai hard constraints dengan algoritma pembobotan probabilistik terbukti sangat efektif.

Berdasarkan hasil penelitian, terdapat beberapa saran penelitian lanjutan yang dapat dilakukan untuk meningkatkan kualitas sistem temu kembali informasi pada domain metadata jurnal ilmiah. Pertama, disarankan agar penelitian selanjutnya memperluas cakupan dataset hingga mencakup seluruh populasi jurnal nasional yang terindeks di SINTA atau Garuda untuk menguji konsistensi dan skalabilitas algoritma BM25. Kedua, perlu dilakukan optimasi parameter k1 dan b pada BM25 menggunakan metode pencarian parameter otomatis agar mendapatkan nilai yang paling presisi sesuai dengan karakteristik bahasa Indonesia. Ketiga, untuk memperkuat akuntabilitas perbandingan, penelitian masa depan dapat menyertakan uji signifikansi statistik seperti Paired Sample T-test atau Wilcoxon Signed-Rank Test.

Read online
File size494.68 KB
Pages8
DMCAReport

Related /

ads-block-test