IRPIIRPI

MALCOM: Indonesian Journal of Machine Learning and Computer ScienceMALCOM: Indonesian Journal of Machine Learning and Computer Science

Hadis merupakan sumber hukum kedua dalam Islam, dan salah satu kitab hadis yang paling dikenal adalah Shahih al-Bukhari. Untuk mendukung pemahaman dan pengamalan yang tepat, hadis perlu diklasifikasikan secara akurat. Mengingat satu hadis dapat mengandung lebih dari satu informasi, pendekatan klasifikasi multilabel menjadi sangat relevan. Penelitian ini bertujuan untuk memberikan kontribusi dalam bidang klasifikasi teks dengan mengeksplorasi kombinasi metode dan parameter yang optimal untuk klasifikasi multilabel hadis. Hasil penelitian menunjukkan bahwa Support Vector Machine (SVM) memberikan performa terbaik pada label Larangan dengan Macro F1-score sebesar 82,57%, melalui kombinasi SVM TF-IDF menggunakan kernel = linear, parameter C (regularization parameter) = 1 tanpa stopword removal dan tanpa balancing. Sementara itu, Long Short Term Memory (LSTM) juga unggul pada label Larangan dengan Macro F1-score 82,66% pada kombinasi parameter Epoch = 20, Dropout = 0.5, Dense = 128 dan Batch Size = 64 tanpa stopword removal dan tanpa balancing kombinasi ini juga menghasilkan nilai Hamming Loss terendah sebesar 10,452%, yang lebih baik dibandingkan dengan penelitian sebelumnya serta menunjukkan bahwa LSTM terbukti lebih efektif secara keseluruhan dengan penyetelan parameter yang tepat. Penelitian ini juga berkontribusi dalam peningkatan kualitas data dengan melengkapi matan hadis yang digunakan, sehingga menghasilkan performa klasifikasi yang lebih baik.

Berdasarkan hasil penelitian, metode LSTM mengungguli SVM pada label Larangan dan Anjuran dengan nilai Macro F1-score masing-masing 82,66% dan 71,04%, sementara SVM lebih unggul pada label Informasi dengan 67,40%, menunjukkan bahwa penyetelan parameter yang tepat dapat meningkatkan performa klasifikasi secara signifikan.Penerapan stopword removal dan teknik balancing seperti hybridsampling tidak memberikan hasil optimal, karena berpotensi menghilangkan informasi penting dalam teks hadis, terutama pada data yang tidak seimbang.Secara keseluruhan, LSTM mencapai Hamming Loss terendah sebesar 10,452% tanpa stopword removal dan balancing, yang lebih baik dibandingkan SVM dan penelitian sebelumnya, dengan pelengkapan matan hadis berkontribusi pada peningkatan kualitas klasifikasi.

Untuk penelitian lanjutan, bagaimana jika kita mengembangkan teknik balancing data yang lebih adaptif, seperti oversampling berbasis sintetik khusus untuk teks hadis, agar dapat menangani ketidakseimbangan label tanpa menghilangkan konteks asli? Selain itu, arah studi selanjutnya bisa mengeksplorasi integrasi hybrid antara SVM dan LSTM, misalnya dengan menggabungkan fitur TF-IDF dari SVM ke dalam model LSTM untuk meningkatkan pemahaman sekuensial pada matan hadis yang panjang. Akhirnya, penelitian baru dapat difokuskan pada perluasan dataset dengan menambahkan label kategori hadis lebih detail, seperti membedakan sub-tema dalam larangan atau anjuran, guna menguji performa model pada skala yang lebih komprehensif sambil mempertahankan pendekatan tanpa stemming untuk menjaga makna kontekstual.

  1. Perbandingan Performa Klasifikasi Terjemahan Al-Qur'an Menggunakan Metode Random Forest dan Long... ejurnal.seminar-id.com/index.php/josyc/article/view/5156Perbandingan Performa Klasifikasi Terjemahan Al Quran Menggunakan Metode Random Forest dan Long ejurnal seminar id index php josyc article view 5156
  2. IJSRSET- Publication Details. ijsrset publication details ijsrset.com/IJSRSET229235IJSRSET Publication Details ijsrset publication details ijsrset IJSRSET229235
  3. Text Classification Using Long Short-Term Memory With GloVe Features | Jurnal Ilmiah Teknik Elektro Komputer... journal.uad.ac.id/index.php/JITEKI/article/view/15021Text Classification Using Long Short Term Memory With GloVe Features Jurnal Ilmiah Teknik Elektro Komputer journal uad ac index php JITEKI article view 15021
File size408.08 KB
Pages12
DMCAReportReport

ads-block-test