Deteksi Plagiarisme Pada Novel Berbahasa Inggris Menggunakan Authorship Attribution Berbasis Stylometry Dan Support Vector Machine Svm

Mey Rini Rz.; Badieah .

Publisher

UNISSULAUNISSULA

Journal Jurnal Ilmiah Sultan Agung Abstract

Plagiarisme pada novel berbahasa Inggris tidak hanya berupa penyalinan langsung, tetapi juga peniruan gaya penulisan (paraphrase plagiarism). Penelitian ini mengembangkan sistem deteksi berbasis authorship attribution dengan stylometry, Support Vector Machine (SVM), dan Sentence-BERT (SBERT). Data berupa 15 novel dari lima penulis klasik diproses melalui preprocessing dan chunking menjadi 1000, 5000, dan 10000 kata. Hasil pengujian menunjukkan akurasi SVM sebesar 84.38% (1000 kata), 82.50% (5000 kata), dan tertinggi 90.48% (10000 kata). Jane Austen konsisten mudah dikenali dengan f1-score 0.90, sementara Mary Shelley meningkat signifikan pada teks panjang (recall 1.00). Analisis SBERT menghasilkan skor kesamaan semantik 0.55–0.63, dengan nilai tertinggi juga pada Austen (0.63). Integrasi SVM dan SBERT terbukti saling melengkapi serta stylometry efektif mengenali gaya, sedangkan SBERT menangkap kesamaan makna. Dengan demikian, sistem mampu mendeteksi plagiarisme secara lebih akurat dan komprehensif.

Conclusion

Algoritma Support Vector Machine (SVM) mampu mengenali gaya penulisan dengan akurasi hingga 90,48% pada teks panjang, menunjukkan bahwa panjang potongan teks sangat memengaruhi kinerja model karena memberikan lebih banyak ciri linguistik untuk analisis.Metode stylometry efektif mendeteksi kesesuaian gaya penulisan, sementara semantic similarity berbasis SBERT unggul dalam mengidentifikasi kesamaan makna, sehingga kombinasi keduanya menghasilkan deteksi plagiarisme yang lebih akurat dan komprehensif.Integrasi pendekatan berbasis gaya dan makna penting untuk menghadapi plagiarisme modern yang kompleks, seperti peniruan gaya dan parafrasa semantik.

Future Research

Pertama, perlu dikembangkan penelitian yang menguji efektivitas sistem deteksi plagiarisme ini terhadap jumlah penulis dan karya yang lebih luas, termasuk penulis kontemporer dan dari berbagai latar belakang budaya, untuk mengevaluasi sejauh mana model dapat digeneralisasi dan robust terhadap variasi gaya yang lebih heterogen. Kedua, perlu dirancang studi yang menyelidiki integrasi model bahasa besar (seperti LLM) secara real-time dalam sistem deteksi untuk menganalisis apakah kemampuan generatif model tersebut dapat digunakan bukan hanya sebagai data tiruan, tetapi juga sebagai alat bantu verifikasi plagiarisme berbasis gaya dan semantik secara dinamis. Ketiga, layak dilakukan penelitian tentang transformasi sistem ini ke dalam aplikasi berbasis web atau mobile yang interaktif, untuk mengeksplorasi bagaimana antarmuka pengguna yang intuitif dapat meningkatkan aksesibilitas dan keterlibatan pengguna, serta menilai dampaknya terhadap efektivitas deteksi plagiarisme dalam konteks pendidikan atau penerbitan digital.

References

Download Read online Download

Metadata

File size	182.17 KB
Pages	14
DMCA	Report

Related /

JURIS Analisis Pengalaman Pengguna Sistem Informasi MBKM FKIP Universitas Muhammadiyah Kendari

2026

UNZAHUNZAH Survei dilakukan terhadap 40 mahasiswa yang berpartisipasi dalam program MBKM untuk mengevaluasi kemudahan penggunaan, stabilitas sistem, kelengkapan informasi,Survei dilakukan terhadap 40 mahasiswa yang berpartisipasi dalam program MBKM untuk mengevaluasi kemudahan penggunaan, stabilitas sistem, kelengkapan informasi,

JURIS Analisis Kemampuan Berpikir Kritis Siswa Kelas VII SMPN 20 Kota Bengkulu dalam Menyelesaikan Soal Cerita Materi Aljabar Ditinjau dari Gender

2026

PAPANDAPAPANDA Ditinjau dari aspek gender, tidak ditemukan perbedaan yang signifikan terhadap kualitas kemampuan berpikir kritis, karena siswa laki-laki dan perempuanDitinjau dari aspek gender, tidak ditemukan perbedaan yang signifikan terhadap kualitas kemampuan berpikir kritis, karena siswa laki-laki dan perempuan

JURIS Sistem Pendataan Siswa Berbasis AI untuk Analisis Karakter dan Monitoring Perkembangan di SD IT Ananda Empat Lawang

2025

UNAMAUNAMA Penelitian ini bertujuan untuk mengembangkan sistem pendataan siswa berbasis kecerdasan buatan (AI) yang terintegrasi dengan pemrosesan bahasa alami (NLP)Penelitian ini bertujuan untuk mengembangkan sistem pendataan siswa berbasis kecerdasan buatan (AI) yang terintegrasi dengan pemrosesan bahasa alami (NLP)

JURIS Desain Ilustrasi Sebagai Sarana Pengenalan 3 Puspa Nasional Indonesia

2025

COMPARTDIGITALCOMPARTDIGITAL Indonesia memiliki tiga puspa nasional sebagai simbol identitas bangsa, yaitu melati putih (Jasminum sambac), anggrek bulan (Phalaenopsis amabilis), danIndonesia memiliki tiga puspa nasional sebagai simbol identitas bangsa, yaitu melati putih (Jasminum sambac), anggrek bulan (Phalaenopsis amabilis), dan

JURIS Gender and Language Analyzing Communication Styles in Argumentative Writing

2025

LSPRLSPR Penelitian ini menekankan pentingnya memahami perbedaan ini untuk meningkatkan metode pengajaran dan mendorong pengembangan keseimbangan keterampilan menulisPenelitian ini menekankan pentingnya memahami perbedaan ini untuk meningkatkan metode pengajaran dan mendorong pengembangan keseimbangan keterampilan menulis

2023

STIEKRAKATAUSTIEKRAKATAU Data dianalisis menggunakan rumus regresi linear sederhana dan uji hipotesis. Hasil penelitian menunjukkan bahwa kepemimpinan berpengaruh positif dan signifikanData dianalisis menggunakan rumus regresi linear sederhana dan uji hipotesis. Hasil penelitian menunjukkan bahwa kepemimpinan berpengaruh positif dan signifikan

2022

UMSIDAUMSIDA Setelah langkah terdeteksi, pengukuran ini akan dikalikan dengan lebar kaki saat berjalan, kemudian diperoleh jarak. Berdasarkan hasil penelitian dan pengujianSetelah langkah terdeteksi, pengukuran ini akan dikalikan dengan lebar kaki saat berjalan, kemudian diperoleh jarak. Berdasarkan hasil penelitian dan pengujian

2018

ANTARBANGSAANTARBANGSA Pengukuran berdasarkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur. Evaluasi dilakukan menggunakan 10 fold cross validation.Pengukuran berdasarkan akurasi Naive Bayes sebelum dan sesudah penambahan metode pemilihan fitur. Evaluasi dilakukan menggunakan 10 fold cross validation.

Useful /

2026

PPICURUGPPICURUG Strategically, the deployment of FPV-TLM enhances surveillance operational effectiveness by 47% compared to conventional ground patrols and supports nationalStrategically, the deployment of FPV-TLM enhances surveillance operational effectiveness by 47% compared to conventional ground patrols and supports national

2025

JOURNAL LAAROIBAJOURNAL LAAROIBA Metode penelitian yang digunakan adalah analisis deskriptif kualitatif dengan pendekatan hukum Islam, mengkaji dasar hukum, instrumen pasar modal syariah,Metode penelitian yang digunakan adalah analisis deskriptif kualitatif dengan pendekatan hukum Islam, mengkaji dasar hukum, instrumen pasar modal syariah,

2025

UNAIUNAI The study reveals that girls in Benue States internally displaced camps endure appalling living conditions, including limited access to basic amenities,The study reveals that girls in Benue States internally displaced camps endure appalling living conditions, including limited access to basic amenities,

2022

ASY SYUKRIYYAHASY SYUKRIYYAH Keimanan adalah tolak ukur dari kesuksesan seorang hamba dimata Allah, tidaklah bermanfaat semua yang telah dikerjakan dan diusahakan tanpa adanya keimananKeimanan adalah tolak ukur dari kesuksesan seorang hamba dimata Allah, tidaklah bermanfaat semua yang telah dikerjakan dan diusahakan tanpa adanya keimanan