Dampak Pra pemrosesan Teks pada Akurasi Analisis Sentimen Multi Aspek Menggunakan IndoBERT

Muhammad Akmal Nabil Hibrizi; Doni Abdul Fatah

Publisher

NURISNURIS

Journal Sains Data Jurnal Studi Matematika dan Teknologi Abstract

Ulasan daring mengenai destinasi wisata pantai di Kabupaten Sumenep merupakan sumber data krusial, namun analisisnya terhambat oleh data yang tidak terstruktur, terutama kesalahan ketik (typo) yang signifikan menurunkan akurasi model. Penelitian ini berhasil mengatasi tantangan tersebut dengan membangun dan mengevaluasi beberapa skenario model analisis sentimen multi-aspek yang akurat menggunakan IndoBERT. Untuk memaksimalkan performa, penelitian ini menguji dampak dari dua inovasi utama yaitu sebuah modul koreksi ejaan cerdas yang mengkombinasikan Damerau-Levenshtein Distance dengan N-Gram, serta teknik teks augmentasi. Dengan kerangka kerja Cross-Industry Standard Process for Data Mining (CRISP-DM), penelitian menerapkan alur kerja sistematis mulai dari pra-pemrosesan hingga fine-tuning model. Hasil evaluasi perbandingan menunjukkan temuan yang menarik, model baseline (tanpa perlakuan pra-pemrosesan lanjutan) justru mencapai kinerja tertinggi dengan akurasi 96.12%. Sementara itu, model yang menggunakan koreksi ejaan dan augmentasi teks menunjukkan performa yang sedikit lebih rendah. Penelitian ini menghasilkan sebuah model yang sangat akurat dari data asli dan memberikan wawasan penting bahwa pada dataset tertentu, peforma model Transformer seperti IndoBERT sudah mampu menangani noise bahasa informal tanpa memerlukan pra-pemrosesan yang kompleks.

Conclusion

Penelitian ini menyimpulkan bahwa model IndoBERT menunjukkan ketangguhan yang sangat tinggi dalam menangani teks ulasan pariwisata berbahasa Indonesia yang informal.Model baseline, tanpa pra-pemrosesan Damerau-Levenshtein Distance dengan N-Gram, mencapai akurasi tertinggi sebesar 96.Penerapan modul koreksi ejaan dan augmentasi teks tidak memberikan peningkatan performa, mengindikasikan bahwa untuk model Transformer yang sudah tangguh, pra-pemrosesan yang kompleks tidak selalu diperlukan.

Future Research

Penelitian selanjutnya dapat mengeksplorasi penggunaan metode pra-pemrosesan yang lebih ringan dan spesifik untuk konteks bahasa Indonesia informal, seperti normalisasi singkatan dan slang, untuk melihat apakah kombinasi dengan IndoBERT dapat meningkatkan akurasi. Selain itu, studi lebih lanjut dapat dilakukan untuk menguji efektivitas berbagai teknik augmentasi data yang lebih canggih, seperti penggunaan model bahasa generatif untuk menghasilkan data ulasan sintetis yang lebih realistis dan beragam. Terakhir, penelitian dapat diperluas dengan mengintegrasikan analisis sentimen multi-aspek dengan data demografis dan perilaku wisatawan untuk memberikan rekomendasi yang lebih personal dan relevan bagi pengelola destinasi wisata, sehingga dapat meningkatkan pengalaman wisatawan dan efektivitas strategi pemasaran. Penelitian ini diharapkan dapat memberikan kontribusi signifikan dalam pengembangan sistem analisis sentimen yang lebih akurat dan bermanfaat bagi industri pariwisata di Indonesia.

References

Download Read online Download

Metadata

File size	487.39 KB
Pages	7
DMCA	Report

Related /

JURIS Implementasi Sistem Layar Sentuh Pada Televisi Untuk Menampilkan Denah Universitas Dirgantara Marsekal Suryadarma

2026

UNSURYAUNSURYA Rata-rata waktu respons layar tercatat sebesar 0,0494 detik/cm pada arah horizontal, 0,0684 detik/cm pada arah vertikal, dan 0,0459 detik/cm pada arahRata-rata waktu respons layar tercatat sebesar 0,0494 detik/cm pada arah horizontal, 0,0684 detik/cm pada arah vertikal, dan 0,0459 detik/cm pada arah

JURIS Implementasi Algoritma RFID Pada Sistem Portal Parkir Otomatis Berbasis IoT Menggunakan Kartu Tanda Mahasiswa Di Universitas Dirgantara Marsekal Suryadarma

2026

UNSURYAUNSURYA Hasil pengujian menunjukkan waktu respon rata-rata 396,5 ms untuk proses autentikasi, dengan total waktu portal terbuka penuh sebesar 2,41 detik. SistemHasil pengujian menunjukkan waktu respon rata-rata 396,5 ms untuk proses autentikasi, dengan total waktu portal terbuka penuh sebesar 2,41 detik. Sistem

JURIS Efektivitas Program 3P Peel Prepare Protect untuk Meningkatkan Pengetahuan Duta Generasi Berencana Kota Bukittinggi Tahun 2023 Mengenai Perilaku Seks Pranikah

2025

JURNALEMPATHYJURNALEMPATHY Program 3P (Peel, Prepare, Protect) berhasil meningkatkan pengetahuan Duta Generasi Berencana Kota Bukittinggi Tahun 2023 mengenai perilaku seks pranikah,Program 3P (Peel, Prepare, Protect) berhasil meningkatkan pengetahuan Duta Generasi Berencana Kota Bukittinggi Tahun 2023 mengenai perilaku seks pranikah,

JURIS Transfer Iptek Penggunaan Black Garlic Sebagai Terapi Nonfarmakologi Untuk Mengendalikan Tekanan Darah

2025

LPPMDIANHUSADALPPMDIANHUSADA Rendahnya kesadaran terhadap kondisi ini, ditambah pola hidup tidak sehat seperti konsumsi garam berlebih, kurangnya aktivitas fisik, dan tingginya tingkatRendahnya kesadaran terhadap kondisi ini, ditambah pola hidup tidak sehat seperti konsumsi garam berlebih, kurangnya aktivitas fisik, dan tingginya tingkat

JURIS Implementasi Sistem ERP Modul Pos Dan Manajemen Karyawan di KB TK Alfath Malang

2024

AMIKOMAMIKOM Tujuan dari program ini adalah untuk meningkatkan kualitas manajemen serta meningkatkan efisiensi operasional sekolah. Hasil dari program ini diharapkanTujuan dari program ini adalah untuk meningkatkan kualitas manajemen serta meningkatkan efisiensi operasional sekolah. Hasil dari program ini diharapkan

2024

UINSUNAUINSUNA Perbankan syariah menerapkan pola pembiayaan usaha dengan prinsip bagi hasil, sebagai salah satu pokok dalam kegiatan perbankan syariah akan menumbuhkanPerbankan syariah menerapkan pola pembiayaan usaha dengan prinsip bagi hasil, sebagai salah satu pokok dalam kegiatan perbankan syariah akan menumbuhkan

2024

UNSURYAUNSURYA Kesejahteraan anggota meningkat dengan pengelolaan aset koperasi yang baik. Kinerja keuangan yang baik berdampak pada peningkatan keuntungan dan pembagianKesejahteraan anggota meningkat dengan pengelolaan aset koperasi yang baik. Kinerja keuangan yang baik berdampak pada peningkatan keuntungan dan pembagian

2022

UGMUGM Oleh karena itu diperlukan satu upaya perancangan dan pembuatan mesin bubut untuk memenuhi kebutuhan industri tersebut. Pada penelitian ini dilakukan evaluasiOleh karena itu diperlukan satu upaya perancangan dan pembuatan mesin bubut untuk memenuhi kebutuhan industri tersebut. Pada penelitian ini dilakukan evaluasi

Useful /

2023

SEMINAR IDSEMINAR ID Selain itu, pelaku usaha UMKM juga telah mencoba melakukan promosi produk di media sosial seperti WhatsApp Story dan Instagram Story. Pelatihan digitalSelain itu, pelaku usaha UMKM juga telah mencoba melakukan promosi produk di media sosial seperti WhatsApp Story dan Instagram Story. Pelatihan digital

2019

UGMUGM Pada saat yang sama, bagaimanapun, dia memperkuat posisinya dengan menggunakan taktik menakut-nakuti untuk mendisiplinkan kadernya, menghindari potensiPada saat yang sama, bagaimanapun, dia memperkuat posisinya dengan menggunakan taktik menakut-nakuti untuk mendisiplinkan kadernya, menghindari potensi

2019

UGMUGM This article explores how certain elements of society show resistance against the process of depoliticisation that works through development. Drawing onThis article explores how certain elements of society show resistance against the process of depoliticisation that works through development. Drawing on

2019

UGMUGM Kerstens study underscores the conclusion reached by several political scientists. the discursive and ideological contestations in Indonesia, particularlyKerstens study underscores the conclusion reached by several political scientists. the discursive and ideological contestations in Indonesia, particularly