PNCPNC

InfotekmesinInfotekmesin

Tingginya tingkat kemiripan judul tugas akhir mahasiswa menjadi isu penting dalam menjaga orisinalitas karya ilmiah di lingkungan perguruan tinggi. Penelitian ini bertujuan mengembangkan sistem pendeteksi kemiripan judul secara otomatis dengan menggabungkan algoritma Term Frequency–Inverse Document Frequency dan Weighted Dice Similarity. Metode TF-IDF digunakan untuk memberikan bobot pada kata-kata penting dalam judul, sedangkan Weighted Dice Similarity digunakan untuk mengukur tingkat kesamaan antar judul berdasarkan distribusi dan bobot kata-kata tersebut. Penelitian ini menggunakan data judul tugas akhir yang telah melalui proses anotasi manual sebagai ground truth. Hasil penelitian menunjukkan bahwa sistem mencapai akurasi sebesar 94%, presisi 66,67%, recall 81,3%, serta nilai similarity rata-rata dengan metode Weighted Dice sebesar 0,62. Meskipun nilai presisi tidak terlalu tinggi, kombinasi kedua metode dinilai efektif karena mampu mengidentifikasi kemiripan judul berdasarkan representasi semantik dan struktur leksikal secara bersamaan, yang tidak ditangkap hanya dengan metode pembobotan atau pengukuran kesamaan saja.

Penelitian ini menyimpulkan bahwa kombinasi algoritma TF-IDF dan Weighted Dice Similarity terbukti efektif dalam mendeteksi tingkat kemiripan antar judul tugas akhir mahasiswa.Sistem yang dibangun mampu mengidentifikasi pasangan judul yang memiliki struktur atau makna yang serupa dengan cukup akurat, meskipun redaksional judul berbeda.Dari hasil pengujian judul tugas akhir yang telah dilakukan, sistem menunjukkan performa evaluasi yang baik, dengan nilai akurasi sebesar 94%, presisi sebesar 66,67%, dan recall sebesar 81,3%.Nilai recall yang tinggi menunjukkan bahwa sistem memiliki sensitivitas yang kuat dalam mengenali judul-judul yang memang mirip, meskipun masih terdapat kelemahan pada aspek presisi yang menunjukkan adanya prediksi mirip yang tidak sepenuhnya tepat.

Berdasarkan hasil penelitian, sistem pendeteksi kemiripan judul tugas akhir yang dikembangkan terbukti efektif dalam mengidentifikasi kemiripan judul berdasarkan representasi semantik dan struktur leksikal. Namun, masih terdapat kelemahan pada aspek presisi yang menunjukkan adanya prediksi mirip yang tidak sepenuhnya tepat. Untuk meningkatkan presisi sistem, dapat dipertimbangkan integrasi pendekatan berbasis semantik seperti word embeddings (contoh: Word2Vec atau BERT) untuk menangkap kesamaan makna yang tidak tergambar melalui kata-kata eksplisit. Selain itu, sistem ini berpotensi besar untuk diterapkan secara luas dalam validasi judul tugas akhir di institusi pendidikan tinggi sebagai alat bantu administratif dalam menjaga orisinalitas dan mengurangi risiko duplikasi penelitian. Pengembangan lebih lanjut dapat dilakukan dengan mengoptimalkan metode pembobotan kata melalui TF-IDF dan mengkombinasikan dengan teknik-teknik lain seperti stemmer atau lemmatizer untuk meningkatkan akurasi dalam mengidentifikasi kata-kata penting dalam judul.

  1. THE INFLUENCE OF TEXT PREPROCESSING METHODS AND TOOLS ON CALCULATING TEXT SIMILARITY | Petrović | Facta... casopisi.junis.ni.ac.rs/index.php/FUMathInf/article/view/4657THE INFLUENCE OF TEXT PREPROCESSING METHODS AND TOOLS ON CALCULATING TEXT SIMILARITY PetroviN Facta casopisi junis ni ac rs index php FUMathInf article view 4657
  2. A Novel Support Vector Machine based Improved Aquila Optimizer-based Text Mining Mechanism for the Healthcare... journal.esrgroups.org/jes/article/view/3204A Novel Support Vector Machine based Improved Aquila Optimizer based Text Mining Mechanism for the Healthcare journal esrgroups jes article view 3204
  3. Recommendation System from Microsoft News Data using TF-IDF and Cosine Similarity Methods | Building... ejurnal.seminar-id.com/index.php/bits/article/view/1670Recommendation System from Microsoft News Data using TF IDF and Cosine Similarity Methods Building ejurnal seminar id index php bits article view 1670
Read online
File size393.84 KB
Pages10
DMCAReport

Related /

ads-block-test