UNIMALUNIMAL

Journal of Renewable Energy, Electrical, and Computer EngineeringJournal of Renewable Energy, Electrical, and Computer Engineering

Jaringan saraf konvolusi (CNN) akan mengembangkan sistem klasifikasi hadist untuk mengkategorikan teks berdasarkan topik atau kategori tertentu. Penelitian ini membandingkan dua teknik representasi teks, yaitu Term Frequency-Inverse Document Frequency (TF-IDF) dan Word2Vec, dengan mempertimbangkan aplikasi stemming dan tanpa stemming dalam prosesnya. Penelitian ini memanfaatkan Category ID 0-5. Sekitar 2.845 data telah diproses sesuai dengan persyaratan untuk pengujian. Data dibagi menjadi dua bagian, dengan proporsi 80:20 untuk pelatihan dan pengujian. Selanjutnya, beberapa model dievaluasi, yaitu Word2Vec dengan stemming, TFIDFCNN tanpa stemming, dan TFIDFCNN dengan stemming. Metrik akurasi, presisi, recall, dan F1 score digunakan untuk menilai kinerja. Hasil menunjukkan bahwa model TFIDFCNN tanpa stemming menunjukkan kinerja terbaik dengan akurasi 85% dalam klasifikasi teks berdasarkan topik. Hal ini disebabkan oleh stabilitas dan efisiensi model dalam memproses data.

Hasil menunjukkan bahwa tujuan telah tercapai dengan baik.Model TFIDFCNN tanpa stemming dibandingkan dengan Word2VecCNN dengan stemming dan TFIDFCNN dengan stemming pada berbagai metrik evaluasi kunci seperti akurasi, presisi, dan F1-score.Model TFIDFCNN tanpa stemming mencatat tingkat presisi 0,90, 0,92, 0,80, 0,90, 0,84, dan 0,96, dengan skor recall 0,85, 0,76, 0,85, 0,87, 0,85, dan 0,90, masing-masing.Selain itu, skor F1 untuk enam category_ids dengan nilai 0 hingga 5 adalah 0,87, 0,83, 0,82, 0,88, 0,85, dan 0,93, dengan akurasi total 0,85.Secara keseluruhan, model terbukti unggul dalam mengenali pola dan mengklasifikasikan data secara efektif.Selain itu, model terbukti lebih efektif dalam mengenali pola dan mengklasifikasikan data dengan tingkat akurasi yang tinggi.Temuan ini menunjukkan bahwa representasi teks menggunakan TF-IDF tanpa pra-pemrosesan tambahan seperti stemming lebih cocok untuk dataset yang digunakan.Temuan ini sejalan dengan tujuan penelitian, yaitu untuk mengidentifikasi metode optimal untuk pengembangan sistem klasifikasi hadist.

Berdasarkan hasil penelitian ini, ada beberapa saran penelitian lanjutan yang dapat dipertimbangkan. Pertama, penelitian dapat dilakukan untuk mengeksplorasi teknik representasi teks alternatif, seperti Doc2Vec, dan membandingkannya dengan TF-IDF dan Word2Vec dalam konteks klasifikasi hadist. Kedua, penelitian dapat berfokus pada pengembangan sistem klasifikasi hadist yang lebih canggih dengan menggabungkan teknik-teknik pra-pemrosesan yang berbeda, seperti stemming dan normalisasi, untuk meningkatkan kinerja model. Terakhir, penelitian dapat mengeksplorasi penggunaan arsitektur jaringan saraf konvolusi yang lebih dalam (deep CNN) atau teknik-teknik pengolahan bahasa alami (NLP) lainnya untuk meningkatkan akurasi dan efisiensi sistem klasifikasi hadist.

  1. Text classification algorithm of tourist attractions subcategories with modified TF-IDF and Word2Vec... doi.org/10.1371/journal.pone.0305095Text classification algorithm of tourist attractions subcategories with modified TF IDF and Word2Vec doi 10 1371 journal pone 0305095
  2. Klasifikasi Multi Label pada Hadis Bukhari Terjemahan Bahasa Indonesia Menggunakan Mutual Information... doi.org/10.32736/sisfokom.v9i3.980Klasifikasi Multi Label pada Hadis Bukhari Terjemahan Bahasa Indonesia Menggunakan Mutual Information doi 10 32736 sisfokom v9i3 980
  3. Comparative Assessment to Predict and Forecast Water-Cooled Chiller Power Consumption Using Machine Learning... doi.org/10.3390/su13020744Comparative Assessment to Predict and Forecast Water Cooled Chiller Power Consumption Using Machine Learning doi 10 3390 su13020744
Read online
File size426.32 KB
Pages7
DMCAReport

Related /

ads-block-test