UNDHIRA BALIUNDHIRA BALI
Jurnal Teknologi Informasi dan KomputerJurnal Teknologi Informasi dan KomputerDengan banyaknya informasi yang terdapat pada sebuah berita digital, membuat pembaca terkadang mengalami kesulitan untuk mengetahui intisari dari kumpulan teks ini. Untuk itu dibutuhkan sebuah sistem yang bisa meringkas berita digital berbahasa Indonesia secara otomatis. Peringkasan dokumen adalah proses mengambil teks dari sebuah dokumen, menggali dan menyajikan informasi penting bagi user atau aplikasi dalam bentuk rangkuman yang singkat dan padat. Ketika kita dihadapkan pada struktur bahasa yang cukup kompleks, seperti pada Bahasa manusia, kemudian menangkap ide dan makna utama teks asli. Disinilah digunakan model Transformer yang merupakan model peringkas yang berkinerja tinggi. T5 merupakan contoh model transformer abstraktif yang menulis ulang kembali kalimatnya daripada hanya mengambil kalimat langsung dari teks aslinya. Pada penelitian ini dilakukan proses peringkasan dokumen berita berbahasa Indonesia dengan metode transformer T5. Penelitian ini dikerjakan dengan tiga skenario. Bagian yang membedakan masing-masing skenario adalah pada bagian preprocessing katanya. Pada skenario 1 diimplementasikan stemming dan stopwords removal, pada skenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidak diimplementasikan keduanya. Adapun kesimpulan yang dapat diambil pada penelitian ini adalah terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu dengan mengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.17568.
Pada penelitian ini dilakukan proses peringkasan dokumen berita berbahasa Indonesia dengan metode transformer T5.Bagian yang membedakan masing-masing skenario adalah pada bagian preprocessing katanya.Pada skenario 1 diimplementasikan stemming dan stopwords removal, pada skenario 2 diimplementasikan stemming tanpa stopwords removal, dan pada skenario 3 tidak diimplementasikan keduanya.Adapun kesimpulan yang dapat diambil pada penelitian ini adalah terbaik yang didapatkan adalah pengujian dengan skenario 2, yaitu dengan mengimplementasikan stemming tanpa stopwords removal dengan nilai evaluasi ROUGE-1 0.Tetapi hasil tersebut hanya berbeda sedikit daripada skenario 3 yang tidak mengimplementasikan stopwords removal dan stemming, dimana nilai ROUGE yang diperoleh 0.Stemming memberikan pengaruh yang tidak terlalu signifikan dibandingkan dengan proses penghapusan stop wods.
Berdasarkan hasil penelitian ini, saran penelitian lanjutan yang dapat diusulkan adalah: (1) Mengembangkan model peringkas dokumen yang lebih canggih dengan menggabungkan teknik-teknik pemrosesan bahasa alami terbaru, seperti BERT atau GPT-3, untuk meningkatkan kualitas ringkasan. (2) Menerapkan teknik-teknik pengolahan bahasa yang lebih canggih, seperti pemodelan bahasa berbasis konteks atau pemrosesan bahasa yang lebih kompleks, untuk meningkatkan akurasi dan relevansi ringkasan. (3) Mengeksplorasi penggunaan teknik-teknik pengolahan bahasa yang lebih efisien, seperti pemodelan bahasa berbasis vektor atau teknik-teknik pengurangan dimensi, untuk mengurangi kompleksitas komputasi dan meningkatkan kecepatan peringkasan.
- BESKlus : BERT Extractive Summarization with K-Means Clustering in Scientific Paper | Jurnal Teknik Informatika... journal.maranatha.edu/index.php/jutisi/article/view/4474BESKlus BERT Extractive Summarization with K Means Clustering in Scientific Paper Jurnal Teknik Informatika journal maranatha edu index php jutisi article view 4474
- Sistem Automatic Text Summarization Menggunakan Algoritma Textrank | Zamzam | MATICS: Jurnal Ilmu Komputer... doi.org/10.18860/mat.v12i2.8372Sistem Automatic Text Summarization Menggunakan Algoritma Textrank Zamzam MATICS Jurnal Ilmu Komputer doi 10 18860 mat v12i2 8372
| File size | 264.21 KB |
| Pages | 11 |
| DMCA | Report |
Related /
PPJBSIPPPJBSIP Temuan mengungkapkan bahwa strategi kepolisan off-record dibentuk oleh peran karakter dan hubungan kekuasaan. Mother Gothel sering bergantung pada sarkasme,Temuan mengungkapkan bahwa strategi kepolisan off-record dibentuk oleh peran karakter dan hubungan kekuasaan. Mother Gothel sering bergantung pada sarkasme,
STIMLASHARANJAYASTIMLASHARANJAYA Data diperoleh melalui wawancara dengan staf Marketing Communication, observasi langsung terhadap kegiatan promosi dan media relations, serta dokumentasiData diperoleh melalui wawancara dengan staf Marketing Communication, observasi langsung terhadap kegiatan promosi dan media relations, serta dokumentasi
UNDHIRA BALIUNDHIRA BALI Penelitian ini menunjukkan bahwa SVM memiliki akurasi yang lebih tinggi (61.39%) dibandingkan dengan CNN (35%) dalam klasifikasi ekspresi wajah pada datasetPenelitian ini menunjukkan bahwa SVM memiliki akurasi yang lebih tinggi (61.39%) dibandingkan dengan CNN (35%) dalam klasifikasi ekspresi wajah pada dataset
UNDHIRA BALIUNDHIRA BALI Penelitian ini bertujuan untuk mengetahui pengaruh penerapan manajemen pengetahuan dalam peningkatan kapasitas dan kualitas hasil produk gula merah kristalPenelitian ini bertujuan untuk mengetahui pengaruh penerapan manajemen pengetahuan dalam peningkatan kapasitas dan kualitas hasil produk gula merah kristal
UNDHIRA BALIUNDHIRA BALI Tunneling IPv6IP merupakan metode yang hanya membawa paket IPv6, sehingga sesuai dengan topologi yang hanya memakai IPv6 pada setiap perangkat yang kemudianTunneling IPv6IP merupakan metode yang hanya membawa paket IPv6, sehingga sesuai dengan topologi yang hanya memakai IPv6 pada setiap perangkat yang kemudian
UNDHIRA BALIUNDHIRA BALI Pembatasan ini dimaksudkan untuk mencegah setiap pengguna mengakses situs web tertentu yang tidak penting atau berbahaya bagi pengguna itu sendiri. ParameterPembatasan ini dimaksudkan untuk mencegah setiap pengguna mengakses situs web tertentu yang tidak penting atau berbahaya bagi pengguna itu sendiri. Parameter
MARANATHAMARANATHA Stadium kanker payudara tidak berbeda pada kelompok usia (p=0,368). Subtipe molekuler menunjukkan hubungan dengan kelompok usia, (p=0,013, OR 2,993 CI95%Stadium kanker payudara tidak berbeda pada kelompok usia (p=0,368). Subtipe molekuler menunjukkan hubungan dengan kelompok usia, (p=0,013, OR 2,993 CI95%
AKRABJUARAAKRABJUARA Jenis penelitian yang peneliti gunakan adalah metode deskriptif, yaitu metode yang dirancang untuk mengumpulkan informasi tentang keadaan-keadaan nyataJenis penelitian yang peneliti gunakan adalah metode deskriptif, yaitu metode yang dirancang untuk mengumpulkan informasi tentang keadaan-keadaan nyata
Useful /
STIMLASHARANJAYASTIMLASHARANJAYA Hasil studi menunjukkan bahwa Malaysia telah mengintegrasikan bank asing dan investor asing, terutama dari Timur Tengah, dan telah memperkenalkan sekuritasHasil studi menunjukkan bahwa Malaysia telah mengintegrasikan bank asing dan investor asing, terutama dari Timur Tengah, dan telah memperkenalkan sekuritas
MARANATHAMARANATHA Penelitian ini bertujuan untuk mengetahui faktor-faktor yang memengaruhi kejadian BBLR di RSKIA Kota Bandung periode Januari-Desember 2019 dengan metodePenelitian ini bertujuan untuk mengetahui faktor-faktor yang memengaruhi kejadian BBLR di RSKIA Kota Bandung periode Januari-Desember 2019 dengan metode
MARANATHAMARANATHA Distribusi tertinggi keluhan utama pada pasien adalah nyeri perut, dengan temperatur tubuh pasien ≤38ºC. Pasien pada studi ini memiliki jumlah leukositDistribusi tertinggi keluhan utama pada pasien adalah nyeri perut, dengan temperatur tubuh pasien ≤38ºC. Pasien pada studi ini memiliki jumlah leukosit
MARANATHAMARANATHA Penanganan karies dengan restorasi (74,6%), perawatan saluran akar (11,3%) dan ekstraksi (14,1%). Simpulan: Kerusakan gigi M1 masih tinggi dan sudah ditemukanPenanganan karies dengan restorasi (74,6%), perawatan saluran akar (11,3%) dan ekstraksi (14,1%). Simpulan: Kerusakan gigi M1 masih tinggi dan sudah ditemukan