LENTERADUALENTERADUA

JNANALOKAJNANALOKA

Bagi masyarakat di Indonesia bahasa daerah merupakan bahasa sehari-hari yang biasa digunakan untuk berkomunikasi. Salah satunya adalah bahasa Jawa. Pada penelitian berbasis bahasa alami, bahasa daerah tergolong bahasa yang sulit untuk dikembangkan, mengingat ketersediaan jumlah dataset yang terbatas. Penelitian ini melakukan analisis terhadap 2 metode stemming kata, yaitu metode Nazief- Adriani dan Levenshtein Distance untuk menyelesaikan proses stemming kata berbahasa Jawa. Penelitian ini ingin mengetahui metode yang sesuai dengan akurasi terbaik untuk stemming kata berbahasa Jawa. Selain itu penelitian ini juga mempertimbangkan pembobotan kata untuk menghasilkan akurasi similaritas artikel yang lebih baik. Metode Nazief Adriani menghasilkan nilai rata-rata similaritas sebesar 6,8% dengan waktu rata-rata eksekusi 0,0443 detik.

Kesimpulan dari penelitian ini adalah bahwa proses stemming mempengaruhi pada hasil nilai similaritas, jika tanpa stemming maka nilai similaritas lebih tinggi dibanding dengan proses dengan stemming.Hal tersebut disebabkan karena jika tanpa stemming dan proses text preprocessing, maka dokumen tersebut masih bentuk dokumen asli, yang di mana masih ada kata hubung, tanda baca, angka, sehingga yang dapat mempengaruhi tingkat akurasi.Proses stemming menggunakan metode Levenshtein lebih akurat daripada metode Nazief Adriani dilihat dari 3 kali uji coba, menghasilkan hasil similaritas rata-rata 16,95% untuk metode Levenshtein dan 11,9% untuk metode Nazief Adriani.

Berdasarkan hasil penelitian, terdapat beberapa saran penelitian lanjutan yang dapat dikembangkan. Pertama, perlu dilakukan pengembangan dataset bahasa Jawa yang lebih besar dan beragam untuk meningkatkan akurasi stemming dan pengukuran similaritas. Kedua, eksplorasi metode stemming lain selain Nazief Adriani dan Levenshtein Distance, seperti metode berbasis deep learning, dapat dipertimbangkan untuk menghasilkan akurasi yang lebih tinggi. Ketiga, penelitian dapat difokuskan pada pengembangan model yang mampu menangani variasi dialek bahasa Jawa, sehingga pengukuran similaritas dapat lebih akurat dan relevan dengan konteks penggunaan bahasa yang berbeda-beda.

Read online
File size724.09 KB
Pages10
DMCAReport

Related /

ads-block-test