UNAMAUNAMA

Jurnal PROCESSORJurnal PROCESSOR

Penyakit depresi menjadi permasalahan penting saat ini, karena ada peningkatan secara global penderita depresi. Faktor depresi banyak dan kompleks, dapat menjangkau semua kalangan baik anak-anak hingga lansia. Tujuan penelitian ini untuk mengetahui pola depresi dan sehat berdasarkan ekstraksi fitur suara. Metode ekstraksi fitur yang digunakan Mel-Frequency Cepstral Coefficients (MFCC). Ketiga model yang digunakan untuk mengukur performa dan evaluasi yaitu Naïve Bayes (NB), Decision Tree (DT), dan Random Forest (RD). Dataset yang digunakan EATD-Corpus berisi 162 rekaman mahasiswa Universitas Tongji Tiongkok. Hasil penelitian menunjukkan pola depresi dan sehat berhasil nampak dengan parameter MFCC yaitu 25 ukuran masing-masing frame, 10 jarak antar frame, alpha 0,97 sebagai nilai koefisien pre-emphasis, 40 jumlah maksimum koefisien mel filterbank, dan 12 jumlah cepstral coefficients. Klasifikasi thresholds diperoleh dua kelas yaitu sehat thresholds  53,00 dan depresi diatas ≥ 53,00 menggunakan Self-rating Depression Scale. Performa model, akurasi terbaik dicapai RF 0,8481. Pada kelas sehat, presisi dicapai DT 0,8814, recall dan F1-score dicapai RF masing-masing sebesar 0,9706, dan 0,9167. Pada kelas depresi, presisi dicapai RF nilai 0,3333, recall dan F1-score dicapai NB masing-masing sebesar 0,3636, dan 0,2581.

Hasil penelitian menunjukkan pola depresi berhasil terlihat menggunakan parameter MFCC yaitu 25 ukuran masing-masing frame, 10 jarak antar frame, alpha 0,97 sebagai nilai koefisien pre-emphasis, 40 jumlah maksimum koefisien mel filterbank, dan 12 jumlah cepstral coefficients.Klasifikasi thresholds dapat diperoleh dua kelas yaitu sehat dengan thresholds  53,00 dan depresi diatas ≥ 53,00 menggunakan Self-rating Depression Scale.Secara visual, grafik yang dihasilkan mengindikasikan ada perbedaan karakteristik suara antara orang depresi dan sehat.Suara orang depresi cenderung memiliki pola yang lebih datar dan stabil, sedangkan suara sehat lebih berfluktuasi dan kaya secara spektral.

Berdasarkan penelitian ini, terdapat beberapa saran penelitian lanjutan yang dapat dilakukan. Pertama, perlu dilakukan pengembangan dataset yang lebih besar dan beragam, mencakup berbagai aksen, bahasa, dan demografi untuk meningkatkan generalisasi model. Kedua, eksplorasi metode deep learning yang lebih canggih, seperti recurrent neural networks (RNN) atau transformers, dapat meningkatkan akurasi deteksi depresi dengan memanfaatkan konteks temporal dalam data suara. Ketiga, penelitian dapat difokuskan pada pengembangan model yang mampu mengidentifikasi tingkat keparahan depresi berdasarkan fitur suara, sehingga dapat memberikan informasi yang lebih rinci untuk diagnosis dan penanganan.

  1. ISCA Archive - Glottal Source Features for Automatic Speech-Based Depression Assessment. isca archive... doi.org/10.21437/Interspeech.2017-1251ISCA Archive Glottal Source Features for Automatic Speech Based Depression Assessment isca archive doi 10 21437 Interspeech 2017 1251
  2. JMIR mHealth and uHealth - Depression Prediction by Using Ecological Momentary Assessment, Actiwatch... doi.org/10.2196/14149JMIR mHealth and uHealth Depression Prediction by Using Ecological Momentary Assessment Actiwatch doi 10 2196 14149
  3. Voice-Based Depression Pattern Recognition Using Mel-Frequency Cepstral Coefficients Feature Extraction... ejournal.unama.ac.id/index.php/processor/article/view/2513Voice Based Depression Pattern Recognition Using Mel Frequency Cepstral Coefficients Feature Extraction ejournal unama ac index php processor article view 2513
Read online
File size883.42 KB
Pages11
DMCAReport

Related /

ads-block-test