STMIK ROYALSTMIK ROYAL

JURTEKSI (jurnal Teknologi dan Sistem Informasi)JURTEKSI (jurnal Teknologi dan Sistem Informasi)

Dokumentasi rapat manual rentan menghilangkan informasi penting akibat keterbatasan kognitif. Meskipun model peringkas otomatis telah berkembang, implementasi sistem terintegrasi (end-to-end) khusus percakapan lisan berbahasa Indonesia masih sangat terbatas. Penelitian ini bertujuan merancang dan mengevaluasi arsitektur peringkas rapat otomatis end-to-end yang mengintegrasikan langsung Automatic Speech Recognition (ASR) melalui OpenAI Whisper untuk transkripsi dan model bahasa IndoT5 untuk peringkasan abstraktif. Adaptasi domain dilakukan melalui fine-tuning IndoT5 menggunakan 486 pasang dataset transkrip lisan berbahasa Indonesia. Pengujian pada infrastruktur CPU menggunakan format MP4, MP3, dan WAV. Hasil pengujian menunjukkan konfigurasi fine-tuning optimal berhasil meningkatkan akurasi, dengan skor ROUGE-1 (0,4167), ROUGE-2 (0,1973), dan ROUGE-L (0,2701). Sistem mendemonstrasikan efisiensi komputasi dengan nilai Real-Time Factor di bawah 1, mengindikasikan waktu pemrosesan lebih cepat dari durasi rekaman asli. Kesimpulannya, integrasi Whisper dan IndoT5 menunjukkan potensi dalam menghasilkan ringkasan yang koheren dengan beban komputasi ringan, sehingga layak diimplementasikan pada infrastruktur lokal organisasi untuk menjaga privasi data.

Kesimpulannya, integrasi Whisper dan IndoT5 menunjukkan potensi dalam menghasilkan ringkasan yang koheren dengan beban komputasi ringan, sehingga layak diimplementasikan pada infrastruktur lokal organisasi untuk menjaga privasi data.

Berdasarkan hasil penelitian ini, beberapa saran penelitian lanjutan yang dapat dilakukan adalah: Pertama, mengintegrasikan fitur Speaker Diarization untuk meningkatkan fungsi sistem dalam mengidentifikasi transisi pembicara dalam skenario rapat multi-peserta, sehingga menghasilkan ringkasan rapat yang lebih informatif. Kedua, melakukan evaluasi lebih lanjut terhadap model IndoT5 yang telah di-fine-tune untuk memastikan kinerjanya dalam berbagai skenario dan kondisi. Ketiga, mengembangkan sistem yang dapat menangani berbagai bahasa, terutama bahasa Indonesia, untuk mengakomodasi kebutuhan dokumentasi rapat dalam organisasi yang beragam.

  1. Speech Recognition Technologies: Design, Challenges, and Real-World Applications | International Journal... doi.org/10.55524/ijircst.2025.13.3.9Speech Recognition Technologies Design Challenges and Real World Applications International Journal doi 10 55524 ijircst 2025 13 3 9
  2. Journal of Medical Internet Research - Findings and Guidelines on Provider Technology, Fatigue, and Well-being:... jmir.org/2022/5/e34451Journal of Medical Internet Research Findings and Guidelines on Provider Technology Fatigue and Well being jmir 2022 5 e34451
Read online
File size369.04 KB
Pages8
DMCAReport

Related /

ads-block-test