UNIDHAUNIDHA

Jurnal Sistem Informasi Dan InformatikaJurnal Sistem Informasi Dan Informatika

Kanker payudara merupakan salah satu tantangan kesehatan global yang paling kritis, dengan Indonesia mencatat 66.271 kasus baru pada tahun 2022 berdasarkan data GLOBOCAN yang diterbitkan oleh International Agency for Research on Cancer (IARC/WHO). Deteksi dini yang akurat merupakan faktor penting dalam meningkatkan angka kelangsungan hidup pasien, namun diagnosis konvensional masih bergantung pada ketersediaan tenaga ahli dan bersifat memakan waktu. Penelitian ini mengimplementasikan algoritma Random Forest untuk mengklasifikasikan diagnosis kanker payudara menggunakan dataset Wisconsin Breast Cancer Diagnostic (WBCD) dari UCI Machine Learning Repository. Dataset terdiri dari 569 sampel dengan 30 fitur numerik yang diekstraksi dari citra aspirasi jarum halus (FNA), berlabel jinak (benign) atau ganas (malignant). Praproses data meliputi penghapusan kolom tidak prediktif, konversi label kategorikal ke format biner, penanganan outlier menggunakan IQR Clipping, serta standardisasi menggunakan StandardScaler. Dataset dibagi menjadi 80% data latih dan 20% data uji menggunakan stratified splitting, dengan konfigurasi Random Forest Classifier menggunakan 100 pohon keputusan dan class_weight=balanced untuk menangani ketidakseimbangan kelas. Evaluasi model menggunakan metrik akurasi, presisi, recall, dan F1-score, analisis confusion matrix, serta 5-Fold Stratified Cross Validation. Model mencapai akurasi 97,37% pada data uji tanpa satu pun prediksi False Positive, artinya tidak ada pasien jinak yang salah didiagnosis sebagai ganas. Validasi silang mengkonfirmasi kemampuan generalisasi model dengan rata-rata akurasi 96,31%, menunjukkan tidak terjadi overfitting. Analisis feature importance mengidentifikasi area_worst, concave points_worst, dan perimeter_worst sebagai fitur paling dominan, konsisten dengan karakteristik morfologi klinis sel kanker ganas.

Penelitian ini berhasil menerapkan algoritma Random Forest untuk klasifikasi kanker payudara berbasis dataset WBCD dengan akurasi tinggi sebesar 97,37% dan tidak ada False Positive, menunjukkan keandalan model dalam menghindari diagnosis palsu.Model menunjukkan kemampuan generalisasi yang baik dengan rata-rata akurasi 96,31% dari validasi silang, serta fitur-fitur terpenting yang teridentifikasi memiliki relevansi klinis terhadap morfologi sel kanker ganas.Meskipun demikian, keterbatasan seperti usia dan sifat statis dataset WBCD menunjukkan perlunya pengujian pada data yang lebih representatif dan dinamis di masa depan.

Pertama, perlu dikembangkan penelitian yang menguji penerapan model Random Forest ini pada dataset kanker payudara lokal dari populasi Indonesia untuk melihat sejauh mana model dapat beradaptasi dengan karakteristik genetik dan lingkungan pasien di Indonesia. Kedua, penelitian lanjutan bisa mengeksplorasi penggunaan pendekatan deep learning seperti Convolutional Neural Network (CNN) yang langsung bekerja pada citra medis mentah, bukan hanya fitur terstruktur, untuk mengevaluasi apakah hasilnya lebih akurat dibanding model berbasis fitur statistik. Ketiga, diperlukan studi yang mengintegrasikan teknik Explainable AI (XAI) seperti SHAP atau LIME ke dalam model agar keputusan klasifikasi dapat dijelaskan secara transparan kepada dokter dan pasien, sehingga meningkatkan kepercayaan dalam implementasi klinis. Kombinasi ketiga arah penelitian ini akan membawa sistem diagnosis berbasis AI lebih dekat ke dunia nyata, khususnya di wilayah dengan keterbatasan akses terhadap tenaga ahli patologi. Studi tentang adaptasi model terhadap data lokal sangat penting karena variasi genetik dan faktor risiko lingkungan bisa memengaruhi morfologi sel kanker. Sementara itu, beralih ke data citra mentah membuka peluang untuk menangkap pola yang tidak terdeteksi dalam ekstraksi fitur manual. Integrasi XAI juga krusial agar sistem tidak menjadi kotak hitam yang sulit dipercaya oleh profesional medis. Melalui pendekatan yang lebih holistik, penelitian di masa depan dapat tidak hanya meningkatkan akurasi, tetapi juga keterbacaan dan keterterapan sistem AI dalam praktik klinis di Indonesia.

  1. Prediction and Diagnosis of Breast Cancer Using Machine and Modern Deep Learning Models. prediction diagnosis... journal.waocp.org/article_91068.htmlPrediction and Diagnosis of Breast Cancer Using Machine and Modern Deep Learning Models prediction diagnosis journal waocp article 91068 html
Read online
File size454.83 KB
Pages6
DMCAReport

Related /

ads-block-test