UNDANAUNDANA

J-ICON: Jurnal Komputer dan InformatikaJ-ICON: Jurnal Komputer dan Informatika

Penentuan Uang Kuliah Tunggal (UKT) di perguruan tinggi negeri selama ini masih bergantung pada verifikasi manual dokumen sosio-ekonomi, yang rentan subjektivitas, memakan waktu, dan memicu banding. Penelitian ini mengkaji efektivitas lima teknik seleksi fitur-filter (Chi-Square), embedded (Random Forest Importance, LASSO), wrapper (Recursive Feature Elimination), dan reduksi tak berlabel (Exploratory Factor Analysis) dalam meningkatkan kinerja lima algoritma klasifikasi (Decision Tree, Random Forest, SVM-RBF, K-Nearest Neighbor, Naïve Bayes) pada dataset UKT UNESA (9.369 entri × 53 variabel). Data dipra-proses dengan imputasi, scaling, encoding, dan SMOTE-NC, kemudian dievaluasi menggunakan Stratified 5-fold CV dan hold-out test (80:20). Hasil menunjukkan bahwa penggunaan seluruh 53 fitur (baseline) memberikan weighted-average akurasi sebesar 0,6244 ± 0,0057. Seleksi fitur menggunakan LASSO-13 dan Chi-Square-13 secara signifikan meningkatkan akurasi rata-rata menjadi 0,7300 dan 0,6775, masing-masing, serta mengurangi waktu pelatihan hingga 40–70%. SVM-RBF dengan LASSO-13 mencapai akurasi tertinggi (0,7939), diikuti Random Forest-Chi-Square (0,6987) dan Decision Tree-LASSO (0,7111). Uji Friedman terhadap distribusi akurasi model pada enam kondisi mengonfirmasi perbedaan signifikan (χ²=15,06; p=0,010). Temuan ini menegaskan bahwa seleksi fitur khususnya LASSO dan Chi-Square mampu mereduksi kompleksitas data (dari 53 ke 13 fitur) tanpa mengorbankan, bahkan meningkatkan performa prediktif model UKT. Rekomendasi meliputi integrasi metode seleksi terpilih dalam verifikasi UKT otomatis dan publikasi daftar fitur untuk transparansi. Kebaruan penelitian ini terletak pada perbandingan lima metode seleksi fitur dalam satu pipeline praproses terstandar pada data riil UKT UNESA, menghasilkan subset 13 fitur yang sesuai dengan kebijakan UKT saat ini. Temuan ini diintegrasikan ke sistem verifikasi UKT otomatis untuk meningkatkan akurasi dan efisiensi keputusan.

Penelitian ini menunjukkan bahwa seleksi fitur sangat penting untuk meningkatkan akurasi dan efisiensi model klasifikasi UKT.Metode LASSO-13 dan Chi-Square-13 secara signifikan meningkatkan akurasi dibandingkan dengan penggunaan seluruh fitur.SVM-RBF dengan LASSO-13 memberikan performa terbaik, menunjukkan potensi untuk integrasi dalam sistem verifikasi UKT otomatis guna meningkatkan akurasi dan efisiensi pengambilan keputusan.

Penelitian lanjutan dapat difokuskan pada pengembangan model prediktif UKT yang lebih adaptif dengan mempertimbangkan perubahan kebijakan dan karakteristik sosio-ekonomi mahasiswa dari berbagai universitas di Indonesia. Selain itu, eksplorasi metode seleksi fitur hibrida yang menggabungkan kekuatan filter dan embedded methods dapat menghasilkan subset fitur yang lebih optimal dan robust. Terakhir, penelitian perlu dilakukan untuk mengintegrasikan data non-struktural seperti esai motivasi atau data media sosial ke dalam model UKT untuk memberikan gambaran yang lebih komprehensif tentang kondisi sosio-ekonomi calon mahasiswa, sehingga meningkatkan keadilan dan akurasi dalam penentuan UKT.

  1. J-ICON: Jurnal Komputer dan Informatika. comparative study supervised feature selection methods predicting... doi.org/10.35508/jicon.v13i2.23893J ICON Jurnal Komputer dan Informatika comparative study supervised feature selection methods predicting doi 10 35508 jicon v13i2 23893
Read online
File size317.48 KB
Pages9
DMCAReport

Related /

ads-block-test