SUBSETSUBSET
The Indonesian Journal of Computer Science ResearchThe Indonesian Journal of Computer Science ResearchAbstraksi. Penelitian ini bertujuan untuk membangun dan mengevaluasi model Named Entity Recognition (NER) berbasis arsitektur Bidirectional Long Short-Term Memory (Bi-LSTM) yang mampu mengenali entitas secara otomatis dalam teks berbahasa Indonesia. Urgensi penelitian ini terletak pada masih minimnya sistem NER yang efektif untuk bahasa Indonesia, terutama pada teks non-formal yang memiliki struktur dan kosakata unik. Permasalahan utama yang diangkat adalah rendahnya akurasi ekstraksi entitas akibat keterbatasan model-model NER sebelumnya dalam memahami konteks bahasa Indonesia yang kompleks dan tidak baku. Data dikumpulkan dari korpus teks Indonesia yang telah dianotasi format BIO (Beginning-Inside-Outside) dan diklasifikasikan dalam jenis entitas seperti Person, Location, Organization, Quantity, dan Time. Proses melibatkan preprocessing (tokenisasi, pelabelan BIO, dan padding), pembangunan arsitektur Bi-LSTM, pelatihan model teknik train-test split (80:20), serta evaluasi menggunakan metrik Precision, Recall, F1-Score, dan confusion matrix. Hasil penelitian menunjukkan model Bi-LSTM berhasil mencapai akurasi keseluruhan sebesar 99% dan F1-Score sebesar 0.99, dengan performa terbaik pada entitas ORGANIZATION dan PERSON. Penelitian ini berkontribusi pada pengembangan NER berbasis budaya lokal serta potensial diterapkan dalam pendidikan, pelestarian budaya, dan pencarian informasi kontekstual berbahasa Indonesia.
Penelitian ini berhasil membangun model NER berbasis Bi-LSTM yang mencapai akurasi tinggi dalam mengenali entitas utama seperti ORGANIZATION dan PERSON pada teks Bahasa Indonesia.Namun, model masih mengalami kesulitan pada entitas minor seperti TIME dan QUANTITY akibat ketidakseimbangan data serta transisi label BIO.Oleh karena itu, disarankan penelitian lanjutan menggunakan teknik penyeimbangan data, mengintegrasikan arsitektur BiLSTM‑CRF atau model pra‑latih seperti BERT, serta memperluas variasi dataset regional.
Penelitian selanjutnya dapat menyelidiki penggunaan teknik penyeimbangan data berbasis generative adversarial networks (GAN) untuk menghasilkan contoh sintetik entitas minor seperti TIME dan QUANTITY, sehingga mengurangi bias kelas dan meningkatkan kemampuan model dalam mengenali entitas yang jarang muncul. Selain itu, perlu dikembangkan model hybrid yang menggabungkan arsitektur BiLSTM‑CRF dengan pretrained IndoBERT atau model BERT yang telah disesuaikan untuk Bahasa Indonesia, guna memanfaatkan kemampuan representasi semantik yang lebih dalam serta memperbaiki transisi label BIO pada teks naratif. Selanjutnya, penting untuk melakukan evaluasi lintas‑domain dengan membangun dataset multiregional yang mencakup variasi dialek, kosakata lokal, dan gaya penulisan dari berbagai daerah di Indonesia, sehingga dapat menguji generalisasi model serta mengidentifikasi kebutuhan adaptasi tambahan untuk bahasa yang beragam. Ketiga arah penelitian ini diharapkan dapat memperkuat keandalan sistem NER pada teks non‑formal, meningkatkan akurasi pada entitas minor, dan memperluas aplikasi teknologi NLP dalam konteks budaya Indonesia. Hasilnya diharapkan dapat menjadi dasar bagi pengembangan aplikasi praktis seperti sistem pencarian informasi budaya dan asisten virtual berbahasa Indonesia.
- End-to-end Sequence Labeling via Bi-directional LSTM-CNNs-CRF - ACL Anthology. end sequence labeling... doi.org/10.18653/v1/P16-1101End to end Sequence Labeling via Bi directional LSTM CNNs CRF ACL Anthology end sequence labeling doi 10 18653 v1 P16 1101
- Aksara: Jurnal Ilmu Pendidikan Nonformal. aksara jurnal ilmu pendidikan nonformal issn print peer reviewed... ejurnal.pps.ung.ac.id/index.php/AksaraAksara Jurnal Ilmu Pendidikan Nonformal aksara jurnal ilmu pendidikan nonformal issn print peer reviewed ejurnal pps ung ac index php Aksara
- Scaling Within Document Coreference to Long Texts - ACL Anthology. scaling document coreference long... aclanthology.org/2021.findings-acl.343Scaling Within Document Coreference to Long Texts ACL Anthology scaling document coreference long aclanthology 2021 findings acl 343
- Indonesian Folk Narratives: On the Interstices of National.... indonesian folk narratives interstices... doi.org/10.2478/jef-2022-0006Indonesian Folk Narratives On the Interstices of National indonesian folk narratives interstices doi 10 2478 jef 2022 0006
| File size | 503.61 KB |
| Pages | 11 |
| DMCA | Report |
Related /
UMCUMC Munculnya beragam platfrom media sosial menjadi sebuah tanda kesuksesan teknologi di era kontemporer ini. Perbincangan politik pun bergeser dari yang tadinyaMunculnya beragam platfrom media sosial menjadi sebuah tanda kesuksesan teknologi di era kontemporer ini. Perbincangan politik pun bergeser dari yang tadinya
SKILLERINDONESIASKILLERINDONESIA Kepraktisan bahan ajar dinilai melalui analisis data uji coba dan kuesioner yang diisi oleh guru dan siswa. Guru menilai kepraktisan sebesar 100%, dikategorikanKepraktisan bahan ajar dinilai melalui analisis data uji coba dan kuesioner yang diisi oleh guru dan siswa. Guru menilai kepraktisan sebesar 100%, dikategorikan
USMUSM Metode penelitian yang digunakan beragam, seperti simulasi komputer, pengujian lapangan, dan analisis biaya-manfaat. Hasil penelitian mengungkapkan bahwaMetode penelitian yang digunakan beragam, seperti simulasi komputer, pengujian lapangan, dan analisis biaya-manfaat. Hasil penelitian mengungkapkan bahwa
STIBASTIBA Tujuan penelitian adalah untuk menganalisis kondisi serta perkembangan kajian hadis di kawasan tersebut dan menelaah kontribusi serta kesungguhan paraTujuan penelitian adalah untuk menganalisis kondisi serta perkembangan kajian hadis di kawasan tersebut dan menelaah kontribusi serta kesungguhan para
POLIBANPOLIBAN Algoritma KNN dengan nilai k optimal dapat digunakan untuk mengklasifikasi status gizi pasien dewasa secara akurat dan dapat dikembangkan menjadi sistemAlgoritma KNN dengan nilai k optimal dapat digunakan untuk mengklasifikasi status gizi pasien dewasa secara akurat dan dapat dikembangkan menjadi sistem
STEKOMSTEKOM Penelitian ini bertujuan untuk merancang antarmuka pengguna untuk aplikasi penjadwalan media sosial berbasis web menggunakan metode Rapid Application DevelopmentPenelitian ini bertujuan untuk merancang antarmuka pengguna untuk aplikasi penjadwalan media sosial berbasis web menggunakan metode Rapid Application Development
UM SURABAYAUM SURABAYA Penelitian ini menggali ekspektasi investor yang tercermin pada sentimen investasi, dimana pasar modal sebagai salah satu barometer penting perekonomianPenelitian ini menggali ekspektasi investor yang tercermin pada sentimen investasi, dimana pasar modal sebagai salah satu barometer penting perekonomian
STMIKJAYAKARTASTMIKJAYAKARTA Pengelompokan tingkat keparahan pada sistem keamanan jaringan komputer biasa disebut severity. Pada penelitian ini pembatasan tingkatan keparahan seranganPengelompokan tingkat keparahan pada sistem keamanan jaringan komputer biasa disebut severity. Pada penelitian ini pembatasan tingkatan keparahan serangan
Useful /
STIT ALKIFAYAHRIAUSTIT ALKIFAYAHRIAU Kegiatan dengan menggunakan media bermain dapat memenuhi seluruh aspek perkembangan anak. Penelitian ini menunjukkan bahwa terdapat pengaruh signifikanKegiatan dengan menggunakan media bermain dapat memenuhi seluruh aspek perkembangan anak. Penelitian ini menunjukkan bahwa terdapat pengaruh signifikan
STMIKJAYAKARTASTMIKJAYAKARTA Sistem Informasi penerimaan peserta didik baru berbasis web pada hasil penelitian ini bisa membantu kemudahan akses informasi dan metode pendaftaran kepadaSistem Informasi penerimaan peserta didik baru berbasis web pada hasil penelitian ini bisa membantu kemudahan akses informasi dan metode pendaftaran kepada
STMIKJAYAKARTASTMIKJAYAKARTA Untuk memantau aktifitas jaminan mutu perguruan tinggi secara cepat dan tepat, maka harus memiliki sistem dokumentasi elektronik. Electronic Document ManagementUntuk memantau aktifitas jaminan mutu perguruan tinggi secara cepat dan tepat, maka harus memiliki sistem dokumentasi elektronik. Electronic Document Management
STMIKJAYAKARTASTMIKJAYAKARTA Perpustakaan Keliling pada Suku Dinas Perpustakaan dan Kearsipan Kota Administrasi Jakarta Utara merupakan perpustakaan keliling yang bergerak di bidangPerpustakaan Keliling pada Suku Dinas Perpustakaan dan Kearsipan Kota Administrasi Jakarta Utara merupakan perpustakaan keliling yang bergerak di bidang