UNITOMOUNITOMO

Inform: Jurnal Ilmiah Bidang Teknologi Informasi dan KomunikasiInform: Jurnal Ilmiah Bidang Teknologi Informasi dan Komunikasi

Polycystic Ovary Syndrome (PCOS) adalah gangguan hormonal yang memengaruhi wanita usia reproduksi, dengan prevalensi global 8‑13%. Sekitar 70% kasus tidak terdiagnosis. Penelitian ini bertujuan mengembangkan dan membandingkan delapan model klasifikasi Random Forest untuk deteksi PCOS menggunakan dataset publik Kaggle. Metodologi mencakup tiga teknik preprocessing penting: penanganan outlier menggunakan metode Interquartile Range (IQR), pemilihan fitur melalui Mutual Information, dan penyeimbangan kelas menggunakan SMOTE‑Tomek. Hasil menunjukkan bahwa model terbaik—yang menerapkan penghapusan outlier dan SMOTE tanpa pemilihan fitur—menyajikan akurasi 94,11%, jauh melampaui model dasar Random Forest (87,27%) tanpa preprocessing. Model yang hanya menggunakan SMOTE mencapai akurasi 93,84%, menegaskan pentingnya penanganan ketidakseimbangan kelas. Pemilihan fitur tidak konsisten meningkatkan akurasi, karena Random Forest secara inheren menangani redundansi fitur. Temuan ini menyoroti pentingnya strategi preprocessing khusus, terutama penghapusan outlier dan penyeimbangan kelas, untuk mengoptimalkan klasifikasi data medis. Penelitian lanjutan harus mengeksplorasi teknik pemilihan fitur yang diinformasikan klinis dan menilai generalisasi temuan ini pada dataset beragam untuk meningkatkan relevansi klinis model deteksi PCOS.

Penggunaan penghapusan outlier bersama dengan penyeimbangan kelas menggunakan SMOTE‑Tomek meningkatkan akurasi klasifikasi PCOS secara signifikan, mencapai 94,11% tanpa pemilihan fitur.Penyeimbangan kelas saja juga efektif, mencapai 93,84%, sementara pemilihan fitur saja menurunkan performa.Random Forest secara alami mengelola redundansi fitur sehingga pemilihan fitur tidak selalu meningkatkan akurasi.Strategi preprocessing khusus—terutama penghapusan outlier dan penyeimbangan kelas—berperan krusial dalam mengoptimalkan model klasifikasi medis.

Penelitian selanjutnya dapat mengkaji pengembangan metode pemilihan fitur yang diinformasikan klinis, misalnya dengan memanfaatkan pengetahuan biomarker spesifik PCOS, guna mengidentifikasi subset fitur yang lebih relevan sambil mempertahankan keragaman informasi penting bagi model Random Forest; memvalidasi keandalan model pada dataset lain yang berasal dari populasi berbeda di berbagai wilayah geografis, agar dapat menilai generalisasi dan robuste model serta menyesuaikan parameter preprocessing; serta mengevaluasi integrasi model dengan sistem keputusan klinis berbasis pengetahuan, dengan meneliti bagaimana hasil klasifikasi dapat diinterpretasikan dan diimplementasikan secara praktis dalam alur kerja diagnosis klinis, guna meningkatkan akurasi dan kepercayaan tenaga medis terhadap alat diagnostik berbasis AI.

  1. Inform: Jurnal Ilmiah Bidang Teknologi Informasi dan Komunikasi. smote tomek re sampling based random... doi.org/10.25139/inform.v9i2.8410Inform Jurnal Ilmiah Bidang Teknologi Informasi dan Komunikasi smote tomek re sampling based random doi 10 25139 inform v9i2 8410
  2. Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT | JATISI. implementasi... doi.org/10.35957/jatisi.v7i2.289Implementasi Random Forest Untuk Klasifikasi Motif Songket Palembang Berdasarkan SIFT JATISI implementasi doi 10 35957 jatisi v7i2 289
  3. Inform: Jurnal Ilmiah Bidang Teknologi Informasi dan Komunikasi. comparative analysis pcos random forest... doi.org/10.25139/inform.v10i1.9231Inform Jurnal Ilmiah Bidang Teknologi Informasi dan Komunikasi comparative analysis pcos random forest doi 10 25139 inform v10i1 9231
Read online
File size655.09 KB
Pages10
DMCAReport

Related /

ads-block-test