SUBSETSUBSET

The Indonesian Journal of Computer Science ResearchThe Indonesian Journal of Computer Science Research

Penentuan kelayakan penerimaan kredit merupakan proses yang sangat penting dalam industri perbankan dan keuangan. Hal ini sangat berpengaruh bagi badan keuangan tersebut, bahkan dapat menyebabkan kondisi finansial badan keuangan tersebut tidak sehat karena kesalahan dalam keputusan kelayakan kredit. Machine learning hadir untuk meminimalisir kesalahan tersebut. Untuk meningkatkan akurasi dan efisiensi dalam klasifikasi kelayakan kredit, penelitian ini berfokus pada penerapan dua model machine learning, yaitu Logistic Regression dan Random Forest Classifier. Logistic Regression dipilih karena kemampuannya dalam mengidentifikasi hubungan linear antara variabel input dan output, sedangkan Random Forest Classifier memiliki keunggulan dalam menangani dataset yang kompleks dan non-linear. Tujuan utama dari penelitian ini adalah untuk membandingkan performa kedua model tersebut dalam tugas klasifikasi kelayakan kredit. Perbandingan dilakukan dengan tahapan Studi Literatur, Akuisisi Data (Pengumpulan data) yang mengambil dataset perbankan public di kaggle, EDA, Pre-Processing, Modelling, Evaluasi, dan Analisis Evaluasi Model. Dataset yang akan digunakan mencakup informasi data finansial dari nasabah. Perbandingan performa pada penelitian ini menggunakan matrix akurasi, precision, recall, F1-Score dan AUC-ROC untuk mengevaluasi kinerja masing-masing model. Penelitian ini menghasilkan bahwa model random forest lebih unggul dengan skor Akurasi 0.95, Presisi 0.93, Recall 0.98 dan F1 Score 0.96. Skor AUC yang digunakan untuk melihat seberapa baik model dalam membedakan class 1 dan 0 mencapai 0.98. Hasil penelitian ini diharapkan mampu memberikan rekomendasi yang bermanfaat bagi industri perbankan dalam memilih model yang paling tepat untuk penilaian kelayakan kredit.

Model Logistic Regression memerlukan waktu 173 ms untuk pelatihan dan mencapai skor Akurasi 0.Model Random Forest Classifier membutuhkan waktu 1.35 detik untuk pelatihan dengan hasil Akurasi 0.Berdasarkan hasil tersebut, Random Forest Classifier merupakan model terbaik dalam klasifikasi kelayakan kredit karena unggul dalam semua metrik evaluasi kecuali waktu pelatihan dibandingkan Logistic Regression.

Pertama, penelitian lanjutan dapat menguji kombinasi dari Logistic Regression dan Random Forest dalam ensemble model untuk melihat apakah integrasi kedua pendekatan linier dan non-linier dapat meningkatkan akurasi sekaligus mengurangi waktu pelatihan. Kedua, perlu dilakukan studi tentang dampak penyesuaian hyperparameter pada Random Forest, terutama dalam konteks dataset kredit yang seimbang, untuk mengidentifikasi konfigurasi optimal yang dapat mempertahankan kinerja tinggi namun dengan efisiensi komputasi yang lebih baik. Ketiga, pengembangan model hibrida yang memanfaatkan feature selection berbasis heatmap dan teknik undersampling lain seperti Tomek Links atau SMOTE-ENN perlu dieksplorasi untuk menilai apakah pendekatan tersebut dapat menghasilkan kualitas prediksi yang lebih stabil di berbagai kondisi data kredit yang tidak seimbang. Idealnya, penelitian juga membandingkan performa model pada data aktual dari lembaga keuangan lokal untuk memastikan relevansi praktis. Selain itu, penting untuk mengevaluasi interpretabilitas model terbaik agar hasil prediksi dapat dijelaskan kepada pihak manajemen risiko. Studi lebih lanjut juga bisa mengeksplorasi penambahan fitur non-finansial seperti riwayat sosial media atau pola transaksi digital. Pengujian model pada dataset dengan karakteristik berbeda, seperti lebih dominan linear atau non-linear, akan memberikan wawasan tentang generalisasi model. Penerapan teknik cross-validation yang lebih robust juga sebaiknya diintegrasikan untuk menguji konsistensi hasil. Terakhir, penelitian bisa mengevaluasi trade-off antara akurasi dan kecepatan dalam skenario dunia nyata yang membutuhkan keputusan real-time.

  1. Jurnal RESTI (Rekayasa Sistem dan Teknologi Informas)i. perbandingan performansi algoritma terpandu penyakit... jurnal.iaii.or.id/index.php/RESTI/article/view/2316Jurnal RESTI Rekayasa Sistem dan Teknologi Informas i perbandingan performansi algoritma terpandu penyakit jurnal iaii index php RESTI article view 2316
  2. Implementasi Metode K-Means dan Naïve Bayes Classifier untuk Analisis Sentimen Pemilihan... doi.org/10.30864/eksplora.v9i1.237Implementasi Metode K Means dan NayEAve Bayes Classifier untuk Analisis Sentimen Pemilihan doi 10 30864 eksplora v9i1 237
  3. Analisis Prediksi Stroke Menggunakan Pendekatan Decision Tree dengan Seleksi Fitur dan Neural Network... doi.org/10.37396/jsc.v6i3.310Analisis Prediksi Stroke Menggunakan Pendekatan Decision Tree dengan Seleksi Fitur dan Neural Network doi 10 37396 jsc v6i3 310
Read online
File size497.34 KB
Pages11
DMCAReport

Related /

ads-block-test