PDSIPDSI
Bulletin of Informatics and Data ScienceBulletin of Informatics and Data ScienceDiabetes is a major cause of many chronic diseases such as visual impairment, stroke and kidney failure. Early detection especially in groups that have a high risk of developing diabetes needs to be done to prevent problems that have a wide impact. Indonesia is ranked seventh in the world with a prevalence of 10.7% of the total number of people with diabetes. This research aims to determine the attributes in the diabetes dataset that most affect the classification and apply the Support Vector Machine method for diabetes classification. For the determination process, Gain Ratio feature selection technique is applied. The dataset used consists of 768 data with 8 attributes. In this classification process, 3 SVM kernels (Linear, Polynomial, and RBF) are used with three possible data divisions using the ratio (70:30; 80:20; 90:10). Before applying feature selection, there were 8 attributes used and achieved the highest accuracy of 94.81% at a ratio of 80:20 using the RBF kernel with a combination of two parameters namely C = 100, Gamma = 3 and C = 100, Gamma = Scale. Feature selection parameters in the form of thresholds used include 0.02; 0.03; and 0.05. After applying feature selection, the attribute that produces the highest accuracy uses 6 attributes. The highest accuracy after applying feature selection reached 95.45% at a threshold of 0.02 with a ratio of 80:20 using the RBF kernel with parameters C = 100 and Gamma = Scale. The results showed that there was an increase in accuracy after applying feature selection.
The application of the Gain Ratio feature selection in the Support Vector Machine method successfully increased the accuracy of diabetes classification by 0.20 data ratio, and the RBF kernel with parameters C = 100 and Gamma = Scale.The RBF kernel consistently demonstrated optimal performance.The right combination of threshold, data ratio, and kernel parameters can produce a more reliable model for predicting diabetes risk.
Penelitian lebih lanjut dapat dilakukan dengan mengeksplorasi teknik data balancing untuk mengatasi ketidakseimbangan jumlah data antara kelas diabetes dan non-diabetes, karena hal ini berpotensi meningkatkan kinerja model klasifikasi. Selain itu, penelitian dapat diperluas dengan menguji kombinasi parameter yang lebih beragam pada algoritma SVM, termasuk penggunaan teknik optimasi parameter otomatis untuk menemukan konfigurasi terbaik. Sebagai pengembangan, studi komparatif dapat dilakukan dengan menerapkan teknik seleksi fitur Gain Ratio pada algoritma machine learning lainnya, seperti Random Forest atau Decision Tree, untuk mengidentifikasi algoritma mana yang paling efektif dalam memprediksi risiko diabetes. Penelitian ini juga dapat diperkaya dengan mempertimbangkan faktor-faktor lain yang mungkin mempengaruhi risiko diabetes, seperti data gaya hidup, riwayat keluarga, atau informasi genetik, untuk membangun model prediksi yang lebih komprehensif dan akurat. Terakhir, validasi model pada dataset yang lebih besar dan beragam dari berbagai populasi dapat dilakukan untuk memastikan generalisasi dan keandalan model dalam aplikasi dunia nyata.
- Komparasi Information Gain, Gain Ratio, CFs-Bestfirst dan CFs-PSO Search Terhadap Performa Deteksi Anomali... ejurnal.stmik-budidarma.ac.id/index.php/mib/article/view/2258Komparasi Information Gain Gain Ratio CFs Bestfirst dan CFs PSO Search Terhadap Performa Deteksi Anomali ejurnal stmik budidarma ac index php mib article view 2258
- Performance Analysis of LVQ 1 Using Feature Selection Gain Ratio for Sex Classification in Forensic Anthropology... ejurnal.seminar-id.com/index.php/bits/article/view/3625Performance Analysis of LVQ 1 Using Feature Selection Gain Ratio for Sex Classification in Forensic Anthropology ejurnal seminar id index php bits article view 3625
| File size | 706.23 KB |
| Pages | 12 |
| DMCA | Report |
Related /
UBHINUSUBHINUS Gizi buruk menjadi masalah serius di negara-negara berkembang, disebabkan oleh kekurangan asupan makanan yang mengandung zat-zat esensial seperti proteinGizi buruk menjadi masalah serius di negara-negara berkembang, disebabkan oleh kekurangan asupan makanan yang mengandung zat-zat esensial seperti protein
STMIKLOMBOKSTMIKLOMBOK Salah satu metode yang dapat digunakan untuk memonitoring jantung untuk menditeksi aritmia adalah Heart Rate Variability (HRV) analisis. Dalam penelitianSalah satu metode yang dapat digunakan untuk memonitoring jantung untuk menditeksi aritmia adalah Heart Rate Variability (HRV) analisis. Dalam penelitian
STMIKLOMBOKSTMIKLOMBOK Sebagai perusahaan konveksi, UD Darmawan kadang menghadapi permasalahan terkait ketersediaan bahan baku yang digunakan, ketidaktepatan jadwal pengirimanSebagai perusahaan konveksi, UD Darmawan kadang menghadapi permasalahan terkait ketersediaan bahan baku yang digunakan, ketidaktepatan jadwal pengiriman
STMIKLOMBOKSTMIKLOMBOK Penelitian ini menggunakan prosentase butiran beras pecah dan keseragaman warna untuk menentukan kualitas beras. Kami mengusulkan fitur tekstur denganPenelitian ini menggunakan prosentase butiran beras pecah dan keseragaman warna untuk menentukan kualitas beras. Kami mengusulkan fitur tekstur dengan
STMIKLOMBOKSTMIKLOMBOK Hasil dari dataset gambar yang telah diperoleh menyatakan bahwa api memiliki potensi ketakutan. Dimana menurut kriteria ketakutan dengan nilai rata rataHasil dari dataset gambar yang telah diperoleh menyatakan bahwa api memiliki potensi ketakutan. Dimana menurut kriteria ketakutan dengan nilai rata rata
STMIKLOMBOKSTMIKLOMBOK Kinerja karyawan dan pemantauan keamanan perusahaan sangat penting untuk diperhatikan. Teknologi CCTV juga dapat dimanfaatkan untuk pemantauan karyawanKinerja karyawan dan pemantauan keamanan perusahaan sangat penting untuk diperhatikan. Teknologi CCTV juga dapat dimanfaatkan untuk pemantauan karyawan
STMIKLOMBOKSTMIKLOMBOK 999. Sedangkan perolehan accuracy terbaik Machine Learning dihasilkan dari algoritma Random Forest sebesar 0. 98. Berdasarkan hasil penelitian yang telah999. Sedangkan perolehan accuracy terbaik Machine Learning dihasilkan dari algoritma Random Forest sebesar 0. 98. Berdasarkan hasil penelitian yang telah
STMIKLOMBOKSTMIKLOMBOK Kesimpulan kemungkinan terjadi reaksi darah dapat dideteksi secara dini dan dapat dilakukan oleh Sistem Pendukung Keputusan (SPK) penentuan reaksi darah.Kesimpulan kemungkinan terjadi reaksi darah dapat dideteksi secara dini dan dapat dilakukan oleh Sistem Pendukung Keputusan (SPK) penentuan reaksi darah.
Useful /
UNIBUNIB 4. 9. 41, Quizzes, Canva, Google Form, Ms. Word, Dolby On, Nitro Pdf. The module consists of 3 main components, namely the introductory, core, and closing4. 9. 41, Quizzes, Canva, Google Form, Ms. Word, Dolby On, Nitro Pdf. The module consists of 3 main components, namely the introductory, core, and closing
UBHINUSUBHINUS Penerimaan mahasiswa baru merupakan aktivitas krusial bagi perguruan tinggi, terutama perguruan tinggi swasta, dalam memperoleh mahasiswa baru. FTI UnmerPenerimaan mahasiswa baru merupakan aktivitas krusial bagi perguruan tinggi, terutama perguruan tinggi swasta, dalam memperoleh mahasiswa baru. FTI Unmer
UBHINUSUBHINUS Hasil perhitungan probabilitas menunjukkan bahwa persediaan stok obat Abu (Anti Bisa Ular) Inj lebih mungkin diklasifikasikan sebagai Cukup. ImplementasiHasil perhitungan probabilitas menunjukkan bahwa persediaan stok obat Abu (Anti Bisa Ular) Inj lebih mungkin diklasifikasikan sebagai Cukup. Implementasi
UNIBUNIB Untuk indikator materi, dua belas mahasiswa menyatakan setuju, delapan belas mahasiswa menyatakan setuju sekali. Sementara itu, untuk indikator tampilanUntuk indikator materi, dua belas mahasiswa menyatakan setuju, delapan belas mahasiswa menyatakan setuju sekali. Sementara itu, untuk indikator tampilan