RESCOLLACOMMRESCOLLACOMM

International Journal of Research in Community ServicesInternational Journal of Research in Community Services

Penanaman padi merupakan salah satu pilar keamanan pangan di negara agraris seperti Indonesia, namun tetap rentan terhadap serangan hama yang dapat berdampak signifikan pada produktivitas tanaman. Identifikasi hama secara manual memakan waktu dan rentan kesalahan, terutama ketika spesies hama memiliki karakteristik morfologis yang serupa. Penelitian ini bertujuan untuk menerapkan dan mengevaluasi kinerja empat algoritma machine learning klasik, yaitu Support Vector Machine (SVM), K-Nearest Neighbor (KNN), Random Forest (RF), dan Logistic Regression (LR), untuk mengklasifikasikan hama padi berdasarkan data gambar. Dataset yang digunakan berasal dari Kaggles Rice Pest Detection Dataset, yang mencakup 12 kelas hama dan telah melalui serangkaian langkah pra-pemrosesan: konversi ke skala abu-abu, penyesuaian ukuran gambar menjadi 128x128 piksel, ekstraksi fitur menggunakan Histogram of Oriented Gradients (HOG), encoding label, dan balancing kelas menggunakan SMOTE. Pengaturan eksperimen menggunakan 80% data untuk pelatihan dan 20% untuk pengujian. Kinerja dievaluasi menggunakan presisi, recall, F1-score, dan matriks kebingungan. Di antara empat model, SVM menunjukkan kinerja yang paling konsisten dan kuat, dengan F1-score mencapai hingga 0.98 pada beberapa kelas hama dan klasifikasi yang seimbang secara keseluruhan pada dataset.

Berdasarkan hasil evaluasi metrik kinerja (presisi, recall, dan F1-score) serta matriks kebingungan, dapat disimpulkan bahwa SVM memberikan kinerja yang paling konsisten dan seimbang, dengan F1-score yang tinggi pada hampir semua kelas.Random Forest juga menunjukkan kinerja yang kompetitif, terutama pada kelas yang lebih mudah dikenali, meskipun sedikit lebih bervariasi dibandingkan SVM.Sebaliknya, KNN dan Logistic Regression menunjukkan kelemahan, terutama pada kelas dengan fitur visual yang serupa, seperti kelas 7 (Rice Stem Fly) dan kelas 11 (Thrips), di mana kedua model sering mengalami kesalahan klasifikasi dan menunjukkan gejala overfitting pada nilai recall.Analisis matriks kebingungan memperkuat temuan ini, dengan menunjukkan bahwa model cenderung kesulitan membedakan kelas-kelas yang memiliki kesamaan visual, seperti kelas 7 dan 11.Visualisasi prediksi yang benar dan salah juga menunjukkan bahwa sebagian besar kesalahan prediksi terjadi akibat morfologi hama yang serupa, yang membutuhkan model dengan kemampuan ekstraksi fitur yang lebih dalam untuk membedakan dengan akurat.

Untuk penelitian lanjutan, disarankan untuk mengembangkan model yang lebih canggih dengan kemampuan ekstraksi fitur yang lebih dalam, seperti menggunakan teknik-teknik pengolahan citra yang lebih kompleks atau jaringan saraf tiruan (convolutional neural network). Selain itu, dapat dilakukan penelitian lebih lanjut untuk mengeksplorasi teknik-teknik pengurangan dimensi data, seperti Principal Component Analysis (PCA) atau t-Distributed Stochastic Neighbor Embedding (t-SNE), untuk meningkatkan interpretabilitas model dan memudahkan pemahaman visualisasi hasil klasifikasi. Selain itu, penelitian lanjutan dapat fokus pada pengembangan model yang lebih tahan terhadap overfitting, dengan menggunakan teknik-teknik regulasi seperti dropout atau early stopping. Dengan demikian, model yang dihasilkan diharapkan dapat lebih akurat dan dapat diandalkan dalam mengklasifikasikan hama padi berdasarkan data gambar.

Read online
File size745.05 KB
Pages9
DMCAReport

Related /

ads-block-test