UNISSULAUNISSULA

Jurnal Ilmiah Sultan AgungJurnal Ilmiah Sultan Agung

Plagiarisme pada novel berbahasa Inggris tidak hanya berupa penyalinan langsung, tetapi juga peniruan gaya penulisan (paraphrase plagiarism). Penelitian ini mengembangkan sistem deteksi berbasis authorship attribution dengan stylometry, Support Vector Machine (SVM), dan Sentence-BERT (SBERT). Data berupa 15 novel dari lima penulis klasik diproses melalui preprocessing dan chunking menjadi 1000, 5000, dan 10000 kata. Hasil pengujian menunjukkan akurasi SVM sebesar 84.38% (1000 kata), 82.50% (5000 kata), dan tertinggi 90.48% (10000 kata). Jane Austen konsisten mudah dikenali dengan f1-score 0.90, sementara Mary Shelley meningkat signifikan pada teks panjang (recall 1.00). Analisis SBERT menghasilkan skor kesamaan semantik 0.55–0.63, dengan nilai tertinggi juga pada Austen (0.63). Integrasi SVM dan SBERT terbukti saling melengkapi serta stylometry efektif mengenali gaya, sedangkan SBERT menangkap kesamaan makna. Dengan demikian, sistem mampu mendeteksi plagiarisme secara lebih akurat dan komprehensif.

Algoritma Support Vector Machine (SVM) mampu mengenali gaya penulisan dengan akurasi hingga 90,48% pada teks panjang, menunjukkan bahwa panjang potongan teks sangat memengaruhi kinerja model karena memberikan lebih banyak ciri linguistik untuk analisis.Metode stylometry efektif mendeteksi kesesuaian gaya penulisan, sementara semantic similarity berbasis SBERT unggul dalam mengidentifikasi kesamaan makna, sehingga kombinasi keduanya menghasilkan deteksi plagiarisme yang lebih akurat dan komprehensif.Integrasi pendekatan berbasis gaya dan makna penting untuk menghadapi plagiarisme modern yang kompleks, seperti peniruan gaya dan parafrasa semantik.

Pertama, perlu dikembangkan penelitian yang menguji efektivitas sistem deteksi plagiarisme ini terhadap jumlah penulis dan karya yang lebih luas, termasuk penulis kontemporer dan dari berbagai latar belakang budaya, untuk mengevaluasi sejauh mana model dapat digeneralisasi dan robust terhadap variasi gaya yang lebih heterogen. Kedua, perlu dirancang studi yang menyelidiki integrasi model bahasa besar (seperti LLM) secara real-time dalam sistem deteksi untuk menganalisis apakah kemampuan generatif model tersebut dapat digunakan bukan hanya sebagai data tiruan, tetapi juga sebagai alat bantu verifikasi plagiarisme berbasis gaya dan semantik secara dinamis. Ketiga, layak dilakukan penelitian tentang transformasi sistem ini ke dalam aplikasi berbasis web atau mobile yang interaktif, untuk mengeksplorasi bagaimana antarmuka pengguna yang intuitif dapat meningkatkan aksesibilitas dan keterlibatan pengguna, serta menilai dampaknya terhadap efektivitas deteksi plagiarisme dalam konteks pendidikan atau penerbitan digital.

  1. Analisis Tingkat Akurasi Metode Pendeteksian Plagiarisme Ide dengan menggunakan Yake dan Sentence Transformer... journal.ugm.ac.id/v3/JISE/article/view/9073Analisis Tingkat Akurasi Metode Pendeteksian Plagiarisme Ide dengan menggunakan Yake dan Sentence Transformer journal ugm ac v3 JISE article view 9073
  2. Crossing Linguistic Barriers: Authorship Attribution in Sinhala Texts | ACM Transactions on Asian and... dl.acm.org/doi/10.1145/3655620Crossing Linguistic Barriers Authorship Attribution in Sinhala Texts ACM Transactions on Asian and dl acm doi 10 1145 3655620
  3. International Journal of Engineering and Geosciences » Submission » Comparison between random... doi.org/10.26833/ijeg.987605International Journal of Engineering and Geosciences A Submission A Comparison between random doi 10 26833 ijeg 987605
  4. Estimating Intelligence Quotient Using Stylometry and Machine Learning Techniques: A Review | TUP Journals... ieeexplore.ieee.org/document/9793359Estimating Intelligence Quotient Using Stylometry and Machine Learning Techniques A Review TUP Journals ieeexplore ieee document 9793359
Read online
File size182.17 KB
Pages14
DMCAReport

Related /

ads-block-test