PIKSIPIKSI

INFOKOM (Informatika & Komputer)INFOKOM (Informatika & Komputer)

Penelitian ini mengevaluasi dan membandingkan kinerja tiga model machine learning (ML) utama—XGBoost, Random Forest, dan Support Vector Machine (SVM)—untuk prediksi risiko diabetes menggunakan Pima Indians Diabetes Dataset. Pokok permasalahan yang diangkat adalah kebutuhan akan deteksi dini yang akurat dan efektif untuk mengurangi komplikasi serius seperti penyakit kardiovaskular dan gagal ginjal. Pendekatan yang diusulkan melibatkan pelatihan dan evaluasi model-model ini pada dataset yang telah melalui preprocessing, dengan menggunakan metrik seperti akurasi, precision, recall, F1-score, dan Area Under the Curve (AUC) pada ROC Curve. Random Forest mencapai kinerja terbaik, menunjukkan akurasi tertinggi (0.76) dan AUC tertinggi (0.82). Lebih lanjut, Random Forest unggul dalam mendeteksi kasus positif (diabetes) sebagaimana dibuktikan oleh analisis confusion matrix, yang sangat penting dalam konteks medis. Glucose dan BMI diidentifikasi sebagai fitur paling krusial untuk prediksi pada kedua model yang dianalisis. Temuan utama adalah Random Forest merupakan model yang paling efektif dan stabil, memberikan kemampuan diskriminasi yang lebih baik untuk mendukung keputusan klinis dalam prediksi dini risiko diabetes.

Penelitian ini berhasil mengevaluasi dan membandingkan kinerja Random Forest, XGBoost, dan SVM dalam prediksi risiko diabetes menggunakan dataset Pima Indians.Random Forest menunjukkan performa paling unggul dengan akurasi 0.82, serta efektif dalam mendeteksi kasus positif yang krusial dalam diagnosis medis.Analisis fitur penting juga konsisten menunjukkan bahwa kadar Glukosa dan BMI adalah faktor utama.Dengan demikian, Random Forest direkomendasikan sebagai model ML paling efektif dan stabil untuk prediksi awal risiko diabetes, mendukung pengambilan keputusan klinis yang lebih baik.

Untuk penelitian lanjutan, disarankan untuk memperluas cakupan dataset yang digunakan. Studi berikutnya bisa melibatkan data pasien yang lebih beragam secara etnis dan geografis, atau dataset yang lebih besar yang mencakup faktor-faktor tambahan seperti riwayat gaya hidup dan data genetik. Hal ini penting untuk menguji sejauh mana model-model prediksi diabetes dapat digeneralisasi dan berfungsi efektif di populasi yang berbeda. Selain itu, menarik untuk mengeksplorasi penggunaan model machine learning yang lebih canggih, seperti arsitektur deep learning atau teknik ensemble yang mengombinasikan kekuatan beberapa model terbaik. Misalnya, bagaimana kinerja ensemble yang mengintegrasikan Random Forest dengan model lain yang memiliki performa berbeda dapat meningkatkan akurasi atau sensitivitas deteksi diabetes secara keseluruhan. Terakhir, mengingat pentingnya fitur Glukosa dan BMI dalam prediksi diabetes, penelitian selanjutnya dapat fokus pada pengembangan model kecerdasan buatan yang lebih interpretatif. Ini akan membantu menjelaskan secara transparan mengapa fitur-fitur tertentu sangat berpengaruh, sehingga hasil prediksi tidak hanya akurat tetapi juga dapat dipahami dan dipercaya oleh tenaga medis untuk mendukung pengambilan keputusan klinis.

  1. Enhancing Diabetes Detection: A Weighted Averaging Approach for Combined Model Accuracy | IEEE Conference... doi.org/10.1109/I2CT61223.2024.10543684Enhancing Diabetes Detection A Weighted Averaging Approach for Combined Model Accuracy IEEE Conference doi 10 1109 I2CT61223 2024 10543684
  2. Gazi Üniversitesi Mühendislik Mimarlık Fakültesi Dergisi » Makale » Diyabet... doi.org/10.17341/gazimmfd.1552790Gazi yuniversitesi Myhendislik Mimarlk Fakyltesi Dergisi A Makale A Diyabet doi 10 17341 gazimmfd 1552790
  1. #random forest#random forest
  2. #algoritma random forest#algoritma random forest
Read online
File size809.48 KB
Pages11
Short Linkhttps://juris.id/p-2A7
Lookup LinksGoogle ScholarGoogle Scholar, Semantic ScholarSemantic Scholar, CORE.ac.ukCORE.ac.uk, WorldcatWorldcat, ZenodoZenodo, Research GateResearch Gate, Academia.eduAcademia.edu, OpenAlexOpenAlex, Hollis HarvardHollis Harvard
DMCAReport

Related /

ads-block-test