NURISNURIS

Sains Data Jurnal Studi Matematika dan TeknologiSains Data Jurnal Studi Matematika dan Teknologi

Hepatitis adalah kondisi peradangan pada hati yang disebabkan oleh berbagai jenis virus, baik menular maupun tidak menular, yang dapat menyebabkan komplikasi serius hingga kematian. Ada lima jenis utama virus hepatitis, yaitu A, B, C, D, dan E. Penelitian ini bertujuan untuk mengklasifikasikan penyakit Hepatitis C menggunakan algoritma K-Nearest Neighbor (KNN) dengan pendekatan penanganan data tidak seimbang melalui teknik Random Oversampling. Dataset yang digunakan adalah HCV dari UCI Machine Learning Repository, yang terdiri dari 615 data dengan 14 fitur dan 5 kategori kelas. Karena data bersifat tidak seimbang, dilakukan peningkatan jumlah data pada kelas minoritas menggunakan Random Oversampling. Proses evaluasi dilakukan dengan membandingkan performa KNN tanpa dan dengan oversampling, serta menentukan nilai K terbaik melalui skenario pengujian menggunakan 5-fold Cross Validation. Hasil menunjukkan bahwa KNN tanpa oversampling menghasilkan akurasi tertinggi sebesar 94% pada nilai K=3, sementara dengan oversampling, akurasi meningkat menjadi 96,70% pada nilai K yang sama. Dengan demikian, dapat disimpulkan bahwa penerapan Random Oversampling mampu meningkatkan performa klasifikasi algoritma KNN pada data Hepatitis C yang tidak seimbang.

Berdasarkan hasil penelitian, diperoleh perbandingan performa algoritma K-Nearest Neighbor (KNN) dalam mengklasifikasikan data Hepatitis C sebelum dan sesudah diterapkan metode Random Oversampling.KNN tanpa oversampling menghasilkan akurasi tertinggi sebesar 94% pada nilai K-nearest = 3.Setelah diterapkan Random Oversampling, akurasi meningkat menjadi 97% pada nilai K-nearest yang sama.Peningkatan akurasi sebesar 3% ini menunjukkan bahwa metode oversampling efektif dalam menangani ketidakseimbangan data (imbalanced data) dan meningkatkan kinerja model klasifikasi.Selain itu, variasi akurasi yang diperoleh dari setiap pengujian menunjukkan bahwa pembagian data menggunakan k-fold cross validation turut memengaruhi hasil klasifikasi.Oleh karena itu, pemilihan nilai k-fold yang tepat sangat penting untuk memperoleh hasil yang optimal dan representatif.

Meskipun hasil klasifikasi menggunakan algoritma KNN menunjukkan performa yang cukup baik, penelitian ini masih memiliki keterbatasan, salah satunya adalah dominasi satu kelas dalam hasil klasifikasi, baik sebelum maupun sesudah diterapkannya metode oversampling. Hal ini kemungkinan besar disebabkan oleh proses pembagian data secara acak melalui k-fold cross validation serta pemilihan metode resampling yang belum sepenuhnya sesuai dengan karakteristik data. Untuk penelitian selanjutnya, disarankan untuk mengeksplorasi metode pembagian data dan teknik resampling lain yang lebih sesuai, seperti SMOTE (Synthetic Minority Over-sampling Technique) atau stratified sampling, guna mengurangi dominasi kelas dan meningkatkan generalisasi model. Selain itu, dapat pula dilakukan perbandingan dengan algoritma klasifikasi lain seperti Random Forest, Support Vector Machine, atau XGBoost untuk memperoleh wawasan yang lebih komprehensif terkait performa klasifikasi data Hepatitis C.

  1. Relevance of the Retrieval of Hadith Information (RoHI) using Bidirectional Encoder Representations from... doi.org/10.1051/bioconf/202414601041Relevance of the Retrieval of Hadith Information RoHI using Bidirectional Encoder Representations from doi 10 1051 bioconf 202414601041
  2. Prevalensi Hepatitis C Pada Donor Darah Sebelum Dan Pada Saat Pandemi Covid 19 Di Unit Transfusi Darah... doi.org/10.33024/mnj.v4i6.6460Prevalensi Hepatitis C Pada Donor Darah Sebelum Dan Pada Saat Pandemi Covid 19 Di Unit Transfusi Darah doi 10 33024 mnj v4i6 6460
  3. Relevance of the Retrieval of Hadith Information (RoHI) using Bidirectional Encoder Representations from... bio-conferences.org/10.1051/bioconf/202414601041Relevance of the Retrieval of Hadith Information RoHI using Bidirectional Encoder Representations from bio conferences 10 1051 bioconf 202414601041
  4. Perbandingan Metode Term Weighting terhadap Hasil Klasifikasi Teks pada Dataset Terjemahan Kitab Hadis... journal.trunojoyo.ac.id/rekayasa/article/view/6412Perbandingan Metode Term Weighting terhadap Hasil Klasifikasi Teks pada Dataset Terjemahan Kitab Hadis journal trunojoyo ac rekayasa article view 6412
  5. Perbandingan Implementasi Algoritma Naïve Bayes dan K-Nearest Neighbor Pada Klasifikasi Penyakit... doi.org/10.51717/simkom.v7i2.96Perbandingan Implementasi Algoritma Nayve Bayes dan K Nearest Neighbor Pada Klasifikasi Penyakit doi 10 51717 simkom v7i2 96
Read online
File size437.55 KB
Pages10
DMCAReport

Related /

ads-block-test