NURISNURIS
Sains Data Jurnal Studi Matematika dan TeknologiSains Data Jurnal Studi Matematika dan TeknologiUlasan daring mengenai destinasi wisata pantai di Kabupaten Sumenep merupakan sumber data krusial, namun analisisnya terhambat oleh data yang tidak terstruktur, terutama kesalahan ketik (typo) yang signifikan menurunkan akurasi model. Penelitian ini berhasil mengatasi tantangan tersebut dengan membangun dan mengevaluasi beberapa skenario model analisis sentimen multi-aspek yang akurat menggunakan IndoBERT. Untuk memaksimalkan performa, penelitian ini menguji dampak dari dua inovasi utama yaitu sebuah modul koreksi ejaan cerdas yang mengkombinasikan Damerau-Levenshtein Distance dengan N-Gram, serta teknik teks augmentasi. Dengan kerangka kerja Cross-Industry Standard Process for Data Mining (CRISP-DM), penelitian menerapkan alur kerja sistematis mulai dari pra-pemrosesan hingga fine-tuning model. Hasil evaluasi perbandingan menunjukkan temuan yang menarik, model baseline (tanpa perlakuan pra-pemrosesan lanjutan) justru mencapai kinerja tertinggi dengan akurasi 96.12%. Sementara itu, model yang menggunakan koreksi ejaan dan augmentasi teks menunjukkan performa yang sedikit lebih rendah. Penelitian ini menghasilkan sebuah model yang sangat akurat dari data asli dan memberikan wawasan penting bahwa pada dataset tertentu, peforma model Transformer seperti IndoBERT sudah mampu menangani noise bahasa informal tanpa memerlukan pra-pemrosesan yang kompleks.
Penelitian ini menyimpulkan bahwa model IndoBERT menunjukkan ketangguhan yang sangat tinggi dalam menangani teks ulasan pariwisata berbahasa Indonesia yang informal.Model baseline, tanpa pra-pemrosesan Damerau-Levenshtein Distance dengan N-Gram, mencapai akurasi tertinggi sebesar 96.Penerapan modul koreksi ejaan dan augmentasi teks tidak memberikan peningkatan performa, mengindikasikan bahwa untuk model Transformer yang sudah tangguh, pra-pemrosesan yang kompleks tidak selalu diperlukan.
Penelitian selanjutnya dapat mengeksplorasi penggunaan metode pra-pemrosesan yang lebih ringan dan spesifik untuk konteks bahasa Indonesia informal, seperti normalisasi singkatan dan slang, untuk melihat apakah kombinasi dengan IndoBERT dapat meningkatkan akurasi. Selain itu, studi lebih lanjut dapat dilakukan untuk menguji efektivitas berbagai teknik augmentasi data yang lebih canggih, seperti penggunaan model bahasa generatif untuk menghasilkan data ulasan sintetis yang lebih realistis dan beragam. Terakhir, penelitian dapat diperluas dengan mengintegrasikan analisis sentimen multi-aspek dengan data demografis dan perilaku wisatawan untuk memberikan rekomendasi yang lebih personal dan relevan bagi pengelola destinasi wisata, sehingga dapat meningkatkan pengalaman wisatawan dan efektivitas strategi pemasaran. Penelitian ini diharapkan dapat memberikan kontribusi signifikan dalam pengembangan sistem analisis sentimen yang lebih akurat dan bermanfaat bagi industri pariwisata di Indonesia.
- EDA: Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks - ACL Anthology.... doi.org/10.18653/v1/d19-1670EDA Easy Data Augmentation Techniques for Boosting Performance on Text Classification Tasks ACL Anthology doi 10 18653 v1 d19 1670
- Dampak Pra-pemrosesan Teks pada Akurasi Analisis Sentimen Multi-Aspek Menggunakan IndoBERT | Hibrizi... pub.nuris.ac.id/sainsdata/article/view/301Dampak Pra pemrosesan Teks pada Akurasi Analisis Sentimen Multi Aspek Menggunakan IndoBERT Hibrizi pub nuris ac sainsdata article view 301
- A technique for computer detection and correction of spelling errors | Communications of the ACM. technique... doi.org/10.1145/363958.363994A technique for computer detection and correction of spelling errors Communications of the ACM technique doi 10 1145 363958 363994
- A Survey of Data Augmentation Approaches for NLP - ACL Anthology. survey data augmentation approaches... aclanthology.org/2021.findings-acl.84A Survey of Data Augmentation Approaches for NLP ACL Anthology survey data augmentation approaches aclanthology 2021 findings acl 84
- Penerapan Text Augmentation untuk Mengatasi Data yang Tidak Seimbang pada Klasifikasi Teks Berbahasa... jtiik.ub.ac.id/index.php/jtiik/article/view/7325Penerapan Text Augmentation untuk Mengatasi Data yang Tidak Seimbang pada Klasifikasi Teks Berbahasa jtiik ub ac index php jtiik article view 7325
| File size | 487.39 KB |
| Pages | 7 |
| DMCA | Report |
Related /
JOURNALCENTERJOURNALCENTER Penelitian ini bertujuan mengidentifikasi bentuk konflik serta potensi peluang sosial ekonomi yang timbul akibat keterbatasan lahan parkir bagi karyawan.Penelitian ini bertujuan mengidentifikasi bentuk konflik serta potensi peluang sosial ekonomi yang timbul akibat keterbatasan lahan parkir bagi karyawan.
JOURNALCENTERJOURNALCENTER Peningkatan rata-rata peminjaman buku mencapai 808,44% setelah implementasi sistem. Fitur rekomendasi dan notifikasi sinopsis buku berkontribusi pada pembangkitanPeningkatan rata-rata peminjaman buku mencapai 808,44% setelah implementasi sistem. Fitur rekomendasi dan notifikasi sinopsis buku berkontribusi pada pembangkitan
JOURNALCENTERJOURNALCENTER Oleh karena itu, penelitian ini bertujuan untuk merancang dan mengimplementasikan Sistem Informasi Tracer Study berbasis web pada AMIK Luwuk Banggai yangOleh karena itu, penelitian ini bertujuan untuk merancang dan mengimplementasikan Sistem Informasi Tracer Study berbasis web pada AMIK Luwuk Banggai yang
JOURNALCENTERJOURNALCENTER Temuan utama menunjukkan bahwa pendekatan perawatan saat ini menderita dari strategi pengadaan suku cadang yang tidak memadai, pengembangan kompetensiTemuan utama menunjukkan bahwa pendekatan perawatan saat ini menderita dari strategi pengadaan suku cadang yang tidak memadai, pengembangan kompetensi
JOURNALCENTERJOURNALCENTER Hasil uji coba menunjukkan bahwa sistem dapat berjalan sesuai kebutuhan, dengan antarmuka yang sederhana dan mudah digunakan oleh tiga jenis pengguna,Hasil uji coba menunjukkan bahwa sistem dapat berjalan sesuai kebutuhan, dengan antarmuka yang sederhana dan mudah digunakan oleh tiga jenis pengguna,
JOURNALCENTERJOURNALCENTER Sistem yang dikembangkan mampu memfasilitasi proses pengelolaan dokumen, penetapan standar, pelaksanaan kegiatan, evaluasi, hingga audit mutu internalSistem yang dikembangkan mampu memfasilitasi proses pengelolaan dokumen, penetapan standar, pelaksanaan kegiatan, evaluasi, hingga audit mutu internal
JOURNALCENTERJOURNALCENTER Hasil penelitian menunjukkan bahwa perceived quality berpengaruh positif dan signifikan terhadap brand image, demikian pula brand awareness berpengaruhHasil penelitian menunjukkan bahwa perceived quality berpengaruh positif dan signifikan terhadap brand image, demikian pula brand awareness berpengaruh
JOURNALCENTERJOURNALCENTER Penelitian ini bertujuan untuk menganalisis pengaruh literasi keuangan digital, kepercayaan konsumen, dan perilaku risiko keuangan terhadap minat bertransaksiPenelitian ini bertujuan untuk menganalisis pengaruh literasi keuangan digital, kepercayaan konsumen, dan perilaku risiko keuangan terhadap minat bertransaksi
Useful /
JOURNALCENTERJOURNALCENTER Sampel penelitian terdiri dari 4 perusahaan perbankan yang dipilih berdasarkan kriteria purposive sampling. Teknik analisis menggunakan regresi data panelSampel penelitian terdiri dari 4 perusahaan perbankan yang dipilih berdasarkan kriteria purposive sampling. Teknik analisis menggunakan regresi data panel
JOURNALCENTERJOURNALCENTER Nilai asli: Penelitian sebelumnya telah secara luas mengeksplorasi kinerja terminal kontainer dan kebijakan pelabuhan hijau, tetapi studi yang mengkajiNilai asli: Penelitian sebelumnya telah secara luas mengeksplorasi kinerja terminal kontainer dan kebijakan pelabuhan hijau, tetapi studi yang mengkaji
PUSDIKRA PUBLISHINGPUSDIKRA PUBLISHING Kuesioner berjudul Kuesioner Hasil Belajar Anak Prasekolah dan Animasi (APNCLOQ) dengan koefisien reliabilitas 0,93 digunakan untuk memperoleh tanggapanKuesioner berjudul Kuesioner Hasil Belajar Anak Prasekolah dan Animasi (APNCLOQ) dengan koefisien reliabilitas 0,93 digunakan untuk memperoleh tanggapan
UKRIMUKRIM Sidjabat; dan ketiga, menjelaskan bagaimana Daniel dapat dijadikan rujukan dalam pembentukan karakter guru PAK. Metode penelitian yang digunakan adalahSidjabat; dan ketiga, menjelaskan bagaimana Daniel dapat dijadikan rujukan dalam pembentukan karakter guru PAK. Metode penelitian yang digunakan adalah