Kombinasi Algoritma TF IDF dan Weighted Dice Similarity untuk Pengukuran Kemiripan Judul Tugas Akhir

Santi  Purwaningrum; Agus Susanto; Annas Setiawan Prabowo

Publisher

PNCPNC

Journal Infotekmesin Abstract

Tingginya tingkat kemiripan judul tugas akhir mahasiswa menjadi isu penting dalam menjaga orisinalitas karya ilmiah di lingkungan perguruan tinggi. Penelitian ini bertujuan mengembangkan sistem pendeteksi kemiripan judul secara otomatis dengan menggabungkan algoritma Term Frequency–Inverse Document Frequency dan Weighted Dice Similarity. Metode TF-IDF digunakan untuk memberikan bobot pada kata-kata penting dalam judul, sedangkan Weighted Dice Similarity digunakan untuk mengukur tingkat kesamaan antar judul berdasarkan distribusi dan bobot kata-kata tersebut. Penelitian ini menggunakan data judul tugas akhir yang telah melalui proses anotasi manual sebagai ground truth. Hasil penelitian menunjukkan bahwa sistem mencapai akurasi sebesar 94%, presisi 66,67%, recall 81,3%, serta nilai similarity rata-rata dengan metode Weighted Dice sebesar 0,62. Meskipun nilai presisi tidak terlalu tinggi, kombinasi kedua metode dinilai efektif karena mampu mengidentifikasi kemiripan judul berdasarkan representasi semantik dan struktur leksikal secara bersamaan, yang tidak ditangkap hanya dengan metode pembobotan atau pengukuran kesamaan saja.

Conclusion

Penelitian ini menyimpulkan bahwa kombinasi algoritma TF-IDF dan Weighted Dice Similarity terbukti efektif dalam mendeteksi tingkat kemiripan antar judul tugas akhir mahasiswa.Sistem yang dibangun mampu mengidentifikasi pasangan judul yang memiliki struktur atau makna yang serupa dengan cukup akurat, meskipun redaksional judul berbeda.Dari hasil pengujian judul tugas akhir yang telah dilakukan, sistem menunjukkan performa evaluasi yang baik, dengan nilai akurasi sebesar 94%, presisi sebesar 66,67%, dan recall sebesar 81,3%.Nilai recall yang tinggi menunjukkan bahwa sistem memiliki sensitivitas yang kuat dalam mengenali judul-judul yang memang mirip, meskipun masih terdapat kelemahan pada aspek presisi yang menunjukkan adanya prediksi mirip yang tidak sepenuhnya tepat.

Future Research

Berdasarkan hasil penelitian, sistem pendeteksi kemiripan judul tugas akhir yang dikembangkan terbukti efektif dalam mengidentifikasi kemiripan judul berdasarkan representasi semantik dan struktur leksikal. Namun, masih terdapat kelemahan pada aspek presisi yang menunjukkan adanya prediksi mirip yang tidak sepenuhnya tepat. Untuk meningkatkan presisi sistem, dapat dipertimbangkan integrasi pendekatan berbasis semantik seperti word embeddings (contoh: Word2Vec atau BERT) untuk menangkap kesamaan makna yang tidak tergambar melalui kata-kata eksplisit. Selain itu, sistem ini berpotensi besar untuk diterapkan secara luas dalam validasi judul tugas akhir di institusi pendidikan tinggi sebagai alat bantu administratif dalam menjaga orisinalitas dan mengurangi risiko duplikasi penelitian. Pengembangan lebih lanjut dapat dilakukan dengan mengoptimalkan metode pembobotan kata melalui TF-IDF dan mengkombinasikan dengan teknik-teknik lain seperti stemmer atau lemmatizer untuk meningkatkan akurasi dalam mengidentifikasi kata-kata penting dalam judul.

References

Download Read online Download

Metadata

File size	393.84 KB
Pages	10
DMCA	Report

Related /

JURIS Evaluasi Perancangan Sistem Informasi Pengelolaan Pengarsipan Surat Berbasis Web

2025

STMIKDHARMAPALARIAUSTMIKDHARMAPALARIAU Hasil dalam penelitian ini yaitu, proses bisnis model yang ada saat ini dan yang diusulkan, analisis persyaratan yang mencakup 19 fitur, 15 persyaratanHasil dalam penelitian ini yaitu, proses bisnis model yang ada saat ini dan yang diusulkan, analisis persyaratan yang mencakup 19 fitur, 15 persyaratan

JURIS Implementasi Sistem Transaksi Pembelian Barang Di Mustika Swalayan Menggunakan Pola Association Rule Dan Algoritma Apriori Berbasis Web

2025

LLDIKTI13LLDIKTI13 Pengujian sistem dilakukan dengan pendekatan black-box untuk memastikan seluruh fungsi berjalan sesuai kebutuhan pengguna. Hasil pengolahan data menunjukkanPengujian sistem dilakukan dengan pendekatan black-box untuk memastikan seluruh fungsi berjalan sesuai kebutuhan pengguna. Hasil pengolahan data menunjukkan

JURIS System Recommendation of Destination Countries for PMI Based on Web with MOORA Method

2025

DCCKOTABUMIDCCKOTABUMI Hasil studi menunjukkan bahwa sistem dapat mengolah data masukan dengan efisien dan menghasilkan rekomendasi negara yang tepat serta konsisten dengan perhitunganHasil studi menunjukkan bahwa sistem dapat mengolah data masukan dengan efisien dan menghasilkan rekomendasi negara yang tepat serta konsisten dengan perhitungan

JURIS Perancangan Sistem Pelaporan Harian Menggunakan Metode SDLC Pada Stasiun Pengumpul Minyak dan Stasiun Kompresor Gas

2024

HOSTJOURNALSHOSTJOURNALS Permasalahan yang terjadi banyak proses kinerja karyawan perusahaan yang dinilai tidak efisien dalam melakukan proses pelaporan. Pelaporan perusahaan menggunakanPermasalahan yang terjadi banyak proses kinerja karyawan perusahaan yang dinilai tidak efisien dalam melakukan proses pelaporan. Pelaporan perusahaan menggunakan

JURIS Implementasi Metode Dempster Shafer dalam Mendiagnosis Kelainan Neurologis Berdasarkan Perbedaan Onset Nyeri

2024

ITHBITHB Onset nyeri ditandai dengan nyeri yang datang tiba-tiba dan perlahan. Tahapan penelitian meliputi identifikasi masalah, pengumpulan data, implementasiOnset nyeri ditandai dengan nyeri yang datang tiba-tiba dan perlahan. Tahapan penelitian meliputi identifikasi masalah, pengumpulan data, implementasi

2024

STMIK ROYALSTMIK ROYAL Dalam sistem akan menampilkan hasil keputusan berupa peringkat pegawai berdasarkan ranking. Penelitian ini bertujuan merekomendasikan pegawai berprestasiDalam sistem akan menampilkan hasil keputusan berupa peringkat pegawai berdasarkan ranking. Penelitian ini bertujuan merekomendasikan pegawai berprestasi

2023

STIM YKPNSTIM YKPN Industri produk kecantikan dan perdagangan di Indonesia diproyeksikan meningkat sebesar USD 7,5 miliar dengan pertumbuhan 6,5% setiap tahun selama limaIndustri produk kecantikan dan perdagangan di Indonesia diproyeksikan meningkat sebesar USD 7,5 miliar dengan pertumbuhan 6,5% setiap tahun selama lima

2021

STMIKJAYAKARTASTMIKJAYAKARTA Sistem ini diharapkan dapat mempercepat dan mempermudah proses pencatatan data buku dan transaksi peminjaman serta pengembalian buku oleh petugas dan anggotaSistem ini diharapkan dapat mempercepat dan mempermudah proses pencatatan data buku dan transaksi peminjaman serta pengembalian buku oleh petugas dan anggota

Useful /

2024

ITSMITSM Desa Kasiyan Timur Kecamatan Puger merupakan salah satu desa yang sangat dekat dengan pusat produksi ikan, tepatnya TPI (Tempat Pelelangan Ikan). WilayahDesa Kasiyan Timur Kecamatan Puger merupakan salah satu desa yang sangat dekat dengan pusat produksi ikan, tepatnya TPI (Tempat Pelelangan Ikan). Wilayah

2022

ALMAATAALMAATA Metode: Penelitian yang dilakukan adalah penelitian observasional dengan rancangan penelitian potong lintang pada 68 siswa SMP di Kota Yogyakarta yangMetode: Penelitian yang dilakukan adalah penelitian observasional dengan rancangan penelitian potong lintang pada 68 siswa SMP di Kota Yogyakarta yang

2022

ALMAATAALMAATA Penelitian ini menggunakan metode quasi eksperimental dengan desain pre-posttest. Hasil penelitian menunjukkan bahwa yogurt bengkuang dapat menurunkanPenelitian ini menggunakan metode quasi eksperimental dengan desain pre-posttest. Hasil penelitian menunjukkan bahwa yogurt bengkuang dapat menurunkan

2021

STIKESNHSTIKESNH Salah satu intervensi keperawatan untuk menurunkan tekanan darah adalah terapi rendam kaki air hangat. Tujuan penelitian ini adalah untuk mengetahui pengaruhSalah satu intervensi keperawatan untuk menurunkan tekanan darah adalah terapi rendam kaki air hangat. Tujuan penelitian ini adalah untuk mengetahui pengaruh