BUMIGORABUMIGORA

MATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa KomputerMATRIK : Jurnal Manajemen, Teknik Informatika dan Rekayasa Komputer

Berdasarkan data dari WHO, stroke merupakan penyakit yang menduduki peringkat kedua sebagai penyakit paling mematikan. Penyebab stroke adalah ketika pembuluh darah terkena atau pecah, sehingga bagian otak tidak mendapatkan pasokan darah yang membawa oksigen yang dibutuhkan, yang berujung pada kematian. Dengan memanfaatkan teknologi di bidang ilmu kesehatan, khususnya di sektor kesehatan, model-model machine learning dapat menyesuaikan dan memudahkan pengguna dalam memprediksi penyakit tertentu. Penelitian sebelumnya mengalami masalah dengan akurasi yang rendah saat digunakan di bidang kesehatan. Tujuan penelitian ini adalah untuk meningkatkan akurasi dengan mengusulkan penerapan salah satu algoritma ensemble learning, yaitu algoritma Xtreme Gradient Boosting. Penelitian prediksi stroke ini menggunakan algoritma Xtreme Gradient Boosting; penerapan metode ini dengan data yang dibagi menjadi data training dan data test dengan perbandingan 70/30, di mana 70% data training berjumlah 3582, dan 30% data test berjumlah 1536, menghasilkan akurasi sebesar 96% dengan hasil yang baik. Penelitian ini meningkatkan akurasi dalam memprediksi kasus stroke dan mendapatkan akurasi yang lebih baik daripada penelitian sebelumnya.

Hasil penelitian ini menunjukkan bahwa akurasi yang diperoleh lebih baik daripada penelitian sebelumnya yang menggunakan pola dataset yang sama.Dataset yang digunakan adalah Stroke Prediction Dataset.Penelitian ini terdiri dari empat tahap dalam Stroke Prediction Dataset.preprocessing data, Split data, klasifikasi dengan XGBClassifier, dan evaluasi klasifikasi.Perubahan yang dilakukan dalam penelitian ini dari penelitian sebelumnya termasuk proses preprocessing data.Penelitian sebelumnya melakukan penghapusan data yang akan kehilangan 202 data dalam pengolahan data, dan ada juga penelitian sebelumnya yang belum menghapus data atau hal lain yang dapat mengatasi nilai kosong yang terkandung dalam data.Atribut BMI, dengan hasil klasifikasi akan bias.Teknik preprocessing yang dilakukan dalam penelitian ini membuat nilai kosong yang terkandung dalam atribut BMI dengan rata-rata BMI stroke dan rata-rata tanpa stroke, tidak ada data yang hilang, dan juga hasil klasifikasi karena nilai pada atribut BMI telah diselesaikan.Perubahan kedua berkaitan dengan distribusi data training dan testing.Dalam penelitian ini, ada peningkatan 10% data test menjadi 30% data test dibandingkan dengan penelitian sebelumnya yang hanya menggunakan 20% data test.Hasilnya menunjukkan bahwa klasifikasi menggunakan XGBoost (Xtreme Gradient Boosting) mencapai akurasi terbaik sebesar 96%, yang merupakan hasil yang lebih baik daripada penelitian sebelumnya.

Saran penelitian lanjutan adalah untuk mengatasi ketidakseimbangan kelas dataset. Dataset yang digunakan adalah dataset prediksi stroke dari Kaggle, kelas dataset memiliki kelas yang tidak seimbang, kelas seseorang yang mengalami stroke adalah 249 dan tidak mengalami stroke adalah 4860. Ketidakseimbangan kelas seperti pada dataset ini dapat mempengaruhi model selama klasifikasi. Model hanya dapat menentukan kelas mayoritas. Kemungkinan besar kelas minoritas yang diprediksi akan diprediksi sebagai kelas mayoritas. Dengan ketidakseimbangan pada dataset ini, diperlukan penerapan metode untuk mengatasi hal ini.

Read online
File size524.76 KB
Pages12
DMCAReport

Related /

ads-block-test