PNCPNC
InfotekmesinInfotekmesinTingginya tingkat kemiripan judul tugas akhir mahasiswa menjadi isu penting dalam menjaga orisinalitas karya ilmiah di lingkungan perguruan tinggi. Penelitian ini bertujuan mengembangkan sistem pendeteksi kemiripan judul secara otomatis dengan menggabungkan algoritma Term Frequency–Inverse Document Frequency dan Weighted Dice Similarity. Metode TF-IDF digunakan untuk memberikan bobot pada kata-kata penting dalam judul, sedangkan Weighted Dice Similarity digunakan untuk mengukur tingkat kesamaan antar judul berdasarkan distribusi dan bobot kata-kata tersebut. Penelitian ini menggunakan data judul tugas akhir yang telah melalui proses anotasi manual sebagai ground truth. Hasil penelitian menunjukkan bahwa sistem mencapai akurasi sebesar 94%, presisi 66,67%, recall 81,3%, serta nilai similarity rata-rata dengan metode Weighted Dice sebesar 0,62. Meskipun nilai presisi tidak terlalu tinggi, kombinasi kedua metode dinilai efektif karena mampu mengidentifikasi kemiripan judul berdasarkan representasi semantik dan struktur leksikal secara bersamaan, yang tidak ditangkap hanya dengan metode pembobotan atau pengukuran kesamaan saja.
Penelitian ini menyimpulkan bahwa kombinasi algoritma TF-IDF dan Weighted Dice Similarity terbukti efektif dalam mendeteksi tingkat kemiripan antar judul tugas akhir mahasiswa.Sistem yang dibangun mampu mengidentifikasi pasangan judul yang memiliki struktur atau makna yang serupa dengan cukup akurat, meskipun redaksional judul berbeda.Dari hasil pengujian judul tugas akhir yang telah dilakukan, sistem menunjukkan performa evaluasi yang baik, dengan nilai akurasi sebesar 94%, presisi sebesar 66,67%, dan recall sebesar 81,3%.Nilai recall yang tinggi menunjukkan bahwa sistem memiliki sensitivitas yang kuat dalam mengenali judul-judul yang memang mirip, meskipun masih terdapat kelemahan pada aspek presisi yang menunjukkan adanya prediksi mirip yang tidak sepenuhnya tepat.
Berdasarkan hasil penelitian, sistem pendeteksi kemiripan judul tugas akhir yang dikembangkan terbukti efektif dalam mengidentifikasi kemiripan judul berdasarkan representasi semantik dan struktur leksikal. Namun, masih terdapat kelemahan pada aspek presisi yang menunjukkan adanya prediksi mirip yang tidak sepenuhnya tepat. Untuk meningkatkan presisi sistem, dapat dipertimbangkan integrasi pendekatan berbasis semantik seperti word embeddings (contoh: Word2Vec atau BERT) untuk menangkap kesamaan makna yang tidak tergambar melalui kata-kata eksplisit. Selain itu, sistem ini berpotensi besar untuk diterapkan secara luas dalam validasi judul tugas akhir di institusi pendidikan tinggi sebagai alat bantu administratif dalam menjaga orisinalitas dan mengurangi risiko duplikasi penelitian. Pengembangan lebih lanjut dapat dilakukan dengan mengoptimalkan metode pembobotan kata melalui TF-IDF dan mengkombinasikan dengan teknik-teknik lain seperti stemmer atau lemmatizer untuk meningkatkan akurasi dalam mengidentifikasi kata-kata penting dalam judul.
- THE INFLUENCE OF TEXT PREPROCESSING METHODS AND TOOLS ON CALCULATING TEXT SIMILARITY | Petrović | Facta... casopisi.junis.ni.ac.rs/index.php/FUMathInf/article/view/4657THE INFLUENCE OF TEXT PREPROCESSING METHODS AND TOOLS ON CALCULATING TEXT SIMILARITY PetroviN Facta casopisi junis ni ac rs index php FUMathInf article view 4657
- A Novel Support Vector Machine based Improved Aquila Optimizer-based Text Mining Mechanism for the Healthcare... journal.esrgroups.org/jes/article/view/3204A Novel Support Vector Machine based Improved Aquila Optimizer based Text Mining Mechanism for the Healthcare journal esrgroups jes article view 3204
- Recommendation System from Microsoft News Data using TF-IDF and Cosine Similarity Methods | Building... ejurnal.seminar-id.com/index.php/bits/article/view/1670Recommendation System from Microsoft News Data using TF IDF and Cosine Similarity Methods Building ejurnal seminar id index php bits article view 1670
| File size | 393.84 KB |
| Pages | 10 |
| DMCA | Report |
Related /
STMIKDHARMAPALARIAUSTMIKDHARMAPALARIAU Hasil dalam penelitian ini yaitu, proses bisnis model yang ada saat ini dan yang diusulkan, analisis persyaratan yang mencakup 19 fitur, 15 persyaratanHasil dalam penelitian ini yaitu, proses bisnis model yang ada saat ini dan yang diusulkan, analisis persyaratan yang mencakup 19 fitur, 15 persyaratan
LLDIKTI13LLDIKTI13 Pengujian sistem dilakukan dengan pendekatan black-box untuk memastikan seluruh fungsi berjalan sesuai kebutuhan pengguna. Hasil pengolahan data menunjukkanPengujian sistem dilakukan dengan pendekatan black-box untuk memastikan seluruh fungsi berjalan sesuai kebutuhan pengguna. Hasil pengolahan data menunjukkan
DCCKOTABUMIDCCKOTABUMI Hasil studi menunjukkan bahwa sistem dapat mengolah data masukan dengan efisien dan menghasilkan rekomendasi negara yang tepat serta konsisten dengan perhitunganHasil studi menunjukkan bahwa sistem dapat mengolah data masukan dengan efisien dan menghasilkan rekomendasi negara yang tepat serta konsisten dengan perhitungan
HOSTJOURNALSHOSTJOURNALS Permasalahan yang terjadi banyak proses kinerja karyawan perusahaan yang dinilai tidak efisien dalam melakukan proses pelaporan. Pelaporan perusahaan menggunakanPermasalahan yang terjadi banyak proses kinerja karyawan perusahaan yang dinilai tidak efisien dalam melakukan proses pelaporan. Pelaporan perusahaan menggunakan
ITHBITHB Onset nyeri ditandai dengan nyeri yang datang tiba-tiba dan perlahan. Tahapan penelitian meliputi identifikasi masalah, pengumpulan data, implementasiOnset nyeri ditandai dengan nyeri yang datang tiba-tiba dan perlahan. Tahapan penelitian meliputi identifikasi masalah, pengumpulan data, implementasi
STMIK ROYALSTMIK ROYAL Dalam sistem akan menampilkan hasil keputusan berupa peringkat pegawai berdasarkan ranking. Penelitian ini bertujuan merekomendasikan pegawai berprestasiDalam sistem akan menampilkan hasil keputusan berupa peringkat pegawai berdasarkan ranking. Penelitian ini bertujuan merekomendasikan pegawai berprestasi
STIM YKPNSTIM YKPN Industri produk kecantikan dan perdagangan di Indonesia diproyeksikan meningkat sebesar USD 7,5 miliar dengan pertumbuhan 6,5% setiap tahun selama limaIndustri produk kecantikan dan perdagangan di Indonesia diproyeksikan meningkat sebesar USD 7,5 miliar dengan pertumbuhan 6,5% setiap tahun selama lima
STMIKJAYAKARTASTMIKJAYAKARTA Sistem ini diharapkan dapat mempercepat dan mempermudah proses pencatatan data buku dan transaksi peminjaman serta pengembalian buku oleh petugas dan anggotaSistem ini diharapkan dapat mempercepat dan mempermudah proses pencatatan data buku dan transaksi peminjaman serta pengembalian buku oleh petugas dan anggota
Useful /
ITSMITSM Desa Kasiyan Timur Kecamatan Puger merupakan salah satu desa yang sangat dekat dengan pusat produksi ikan, tepatnya TPI (Tempat Pelelangan Ikan). WilayahDesa Kasiyan Timur Kecamatan Puger merupakan salah satu desa yang sangat dekat dengan pusat produksi ikan, tepatnya TPI (Tempat Pelelangan Ikan). Wilayah
ALMAATAALMAATA Metode: Penelitian yang dilakukan adalah penelitian observasional dengan rancangan penelitian potong lintang pada 68 siswa SMP di Kota Yogyakarta yangMetode: Penelitian yang dilakukan adalah penelitian observasional dengan rancangan penelitian potong lintang pada 68 siswa SMP di Kota Yogyakarta yang
ALMAATAALMAATA Penelitian ini menggunakan metode quasi eksperimental dengan desain pre-posttest. Hasil penelitian menunjukkan bahwa yogurt bengkuang dapat menurunkanPenelitian ini menggunakan metode quasi eksperimental dengan desain pre-posttest. Hasil penelitian menunjukkan bahwa yogurt bengkuang dapat menurunkan
STIKESNHSTIKESNH Salah satu intervensi keperawatan untuk menurunkan tekanan darah adalah terapi rendam kaki air hangat. Tujuan penelitian ini adalah untuk mengetahui pengaruhSalah satu intervensi keperawatan untuk menurunkan tekanan darah adalah terapi rendam kaki air hangat. Tujuan penelitian ini adalah untuk mengetahui pengaruh