BSIBSI

Computer Science (CO-SCIENCE)Computer Science (CO-SCIENCE)

Penilaian kinerja akademik siswa secara objektif tetap menjadi tantangan di SMP Negeri 16 Bogor karena faktor internal dan eksternal yang beragam dalam catatan siswa. Penelitian ini bertujuan untuk membandingkan kinerja klasifikasi algoritma Random Forest dan Support Vector Machine (SVM) menggunakan dataset 403 siswa yang berisi atribut demografis, sosioekonomi, dan terkait sekolah. Meskipun atribut-atribut ini bukan indikator akademik tradisional (misalnya, nilai tugas atau ujian), mereka digunakan untuk mengeksplorasi apakah fitur non-akademik dapat berkontribusi pada model prediktif. Setelah pra-pemrosesan data - menangani nilai yang hilang, mengkode variabel kategorik, dan mengelola ketidakseimbangan kelas - kedua algoritma dievaluasi menggunakan akurasi, presisi, recall, dan analisis matriks kebingungan. Hasil menunjukkan bahwa SVM lebih unggul daripada Random Forest dengan akurasi 78,00%, presisi 89,98%, dan recall 70,24%. Temuan ini menunjukkan bahwa SVM lebih tangguh untuk tugas klasifikasi yang tidak seimbang dan dapat memberikan wawasan yang berguna bahkan ketika label kinerja akademik diprediksi dari atribut non-akademik.

Penelitian ini bertujuan untuk mengatasi tantangan yang dihadapi SMP Negeri 16 Bogor dalam mengevaluasi kinerja akademik siswa menggunakan atribut demografis, sosioekonomi, dan lingkungan yang beragam.Dengan menerapkan dua algoritma machine learning - Random Forest dan Support Vector Machine (SVM) - penelitian ini menunjukkan bahwa SVM, khususnya dengan kernel RBF, memberikan kinerja klasifikasi yang lebih andal dan tangguh pada data pendidikan yang tidak seimbang dibandingkan dengan Random Forest.Keunggulan ini didorong oleh mekanisme pembelajaran berbasis margin SVM dan sensitivitasnya terhadap distribusi fitur yang dinormalisasi, yang memungkinkan generalisasi yang lebih efektif ketika kelas minoritas kurang terwakili.Temuan ini menegaskan bahwa SVM adalah algoritma yang lebih cocok untuk konteks sekolah, di mana kategori akademik didistribusikan secara tidak merata dan dipengaruhi oleh faktor non-akademik yang heterogen.

Untuk memperkuat model, disarankan untuk mengadopsi k-fold cross-validation, memperluas penyesuaian hiperparameter untuk SVM dan Random Forest, dan bereksperimen dengan klasifikasi canggih seperti XGBoost, LightGBM, atau jaringan saraf dalam. Selain itu, menggabungkan fitur akademik yang lebih kaya (misalnya, nilai tugas, pola kehadiran, data perilaku) dapat meningkatkan akurasi prediksi dan memberikan wawasan yang lebih dalam tentang pola belajar siswa. Penelitian masa depan juga harus mengeksplorasi metode pembelajaran sensitif biaya atau metode penanganan ketidakseimbangan ensembel yang secara eksplisit memprioritaskan kelas minoritas daripada hanya mengandalkan oversampling. Setelah mencapai kinerja prediktif yang kuat, langkah selanjutnya adalah mengembangkan sistem dukungan keputusan peringatan dini yang dapat diterapkan di sekolah untuk mengidentifikasi siswa berisiko dan memandu strategi intervensi.

  1. A Comparative Analysis of Prediction of Student Results Using Decision Trees and Random Forest | Journal... irojournals.com/tcsst/article/view/2010A Comparative Analysis of Prediction of Student Results Using Decision Trees and Random Forest Journal irojournals tcsst article view 2010
Read online
File size343.67 KB
Pages9
DMCAReport

Related /

ads-block-test