UNDHIRA BALIUNDHIRA BALI

Jurnal Teknologi Informasi dan KomputerJurnal Teknologi Informasi dan Komputer

Dengan banyaknya informasi yang terdapat pada sebuah berita digital, membuat pembaca terkadang mengalami kesulitan untuk mengetahui intisari dari kumpulan teks ini. Untuk itu dibutuhkan sebuah sistem yang bisa meringkas berita digital berbahasa Indonesia secara otomatis. Peringkasan dokumen adalah proses mengambil teks dari sebuah dokumen, menggali dan menyajikan informasi penting bagi user atau aplikasi dalam bentuk rangkuman yang singkat dan padat. Ketika kita dihadapkan pada struktur bahasa yang cukup kompleks, seperti pada Bahasa manusia, kemudian menangkap ide dan makna utama teks asli. Disinilah digunakan model Transformer yang merupakan model peringkas yang berkinerja tinggi. T5 merupakan contoh model transformer abstraktif yang menulis ulang kembali kalimatnya daripada hanya mengambil kalimat langsung dari teks aslinya. Pada penelitian ini dilakukan proses peringkasan dokumen berita berbahasa Indonesia dengan metode transformer T5. Penelitian ini dikerjakan dengan tiga skenario. Bagian yang membedakan masing-masing skenario adalah pada bagian preprocessing katanya. Pada skenario 1 diimplementasikan stemming dan stopwords removal, pada skenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidak diimplementasikan keduanya. Adapun kesimpulan yang dapat diambil pada penelitian ini adalah terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu dengan mengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.17568.

Pada penelitian ini dilakukan proses peringkasan dokumen berita berbahasa Indonesia dengan metode transformer T5.Bagian yang membedakan masing-masing skenario adalah pada bagian preprocessing katanya.Pada skenario 1 diimplementasikan stemming dan stopwords removal, pada skenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidak diimplementasikan keduanya.Adapun kesimpulan yang dapat diambil pada penelitian ini adalah terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu dengan mengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.Tetapi hasil tersebut hanya berbeda sedikit daripada skenario 3 yang tidak mengimplementasikan stopwords removal dan stemming, dimana nilai ROUGE yang diperoleh 0.Stemming memberikan pengaruh yang tidak terlalu signifikan dibandingkan dengan proses penghapusan stop wods.

Berdasarkan hasil penelitian ini, saran penelitian lanjutan yang dapat diusulkan adalah: (1) Mengembangkan model peringkas dokumen yang lebih canggih dengan menggabungkan teknik-teknik pemrosesan bahasa alami terbaru, seperti BERT atau GPT-3, untuk meningkatkan kualitas ringkasan. (2) Menerapkan teknik-teknik pengolahan bahasa yang lebih canggih, seperti pemodelan bahasa berbasis konteks atau pemrosesan bahasa yang lebih kompleks, untuk meningkatkan akurasi dan relevansi ringkasan. (3) Mengeksplorasi penggunaan teknik-teknik pengolahan bahasa yang lebih efisien, seperti pemodelan bahasa berbasis vektor atau teknik-teknik pengurangan dimensi, untuk mengurangi kompleksitas komputasi dan meningkatkan kecepatan peringkasan.

  1. BESKlus : BERT Extractive Summarization with K-Means Clustering in Scientific Paper | Jurnal Teknik Informatika... journal.maranatha.edu/index.php/jutisi/article/view/4474BESKlus BERT Extractive Summarization with K Means Clustering in Scientific Paper Jurnal Teknik Informatika journal maranatha edu index php jutisi article view 4474
  2. Sistem Automatic Text Summarization Menggunakan Algoritma Textrank | Zamzam | MATICS: Jurnal Ilmu Komputer... doi.org/10.18860/mat.v12i2.8372Sistem Automatic Text Summarization Menggunakan Algoritma Textrank Zamzam MATICS Jurnal Ilmu Komputer doi 10 18860 mat v12i2 8372
Read online
File size264.21 KB
Pages11
DMCAReport

Related /

ads-block-test