UMMATUMMAT

Education, Social Sciences, and Linguistics: Conference SeriesEducation, Social Sciences, and Linguistics: Conference Series

Penelitian ini bertujuan untuk mengidentifikasi dan mengklasifikasikan model-model Artificial Intelligence (AI) yang diterapkan dalam assessment pendidikan, menganalisis bagaimana aspek validitas dan reliabilitas dikaji dalam penelitian sebelumnya, serta mengevaluasi implikasi evaluatif dan etis dari penerapan AI. Metode penelitian menggunakan pendekatan kualitatif dengan desain Systematic Literature Review (SLR), yang menelaah literatur dari basis data Scopus, DOAJ, dan Google Scholar, dengan rentang publikasi 10 tahun terakhir (2016–2025). Proses seleksi dilakukan secara sistematis berdasarkan kriteria inklusi dan eksklusi, diikuti dengan ekstraksi dan analisis data menggunakan teknik analisis tematik. Hasil kajian menunjukkan adanya tren peningkatan penggunaan AI dalam assessment pendidikan, khususnya pada automated scoring, predictive analytics, dan adaptive testing, dengan fokus pada peningkatan efisiensi, personalisasi evaluasi, dan umpan balik adaptif. Studi juga menemukan bahwa validitas konstruk dan reliabilitas skor tetap menjadi tantangan utama, sementara implikasi evaluatif dan etis, termasuk transparansi algoritma dan perlindungan data peserta didik, menjadi perhatian penting. Sintesis literatur ini memberikan pemahaman komprehensif mengenai perkembangan model AI, tantangan metodologis, serta rekomendasi praktik dan kebijakan untuk mengoptimalkan penggunaan AI dalam evaluasi pendidikan yang akuntabel, sahih, dan adil.

Penelitian ini menyimpulkan bahwa penerapan Artificial Intelligence (AI) dalam assessment pendidikan telah menghadirkan inovasi signifikan dalam meningkatkan efisiensi, personalisasi, dan responsivitas evaluasi pembelajaran, sekaligus mendukung prediksi performa dan pengambilan keputusan akademik berbasis data.Namun, penerapan AI masih menghadapi tantangan kritis terkait validitas konstruk, reliabilitas yang bergantung pada kualitas dan representativitas dataset, transparansi algoritma, serta potensi bias yang dapat memengaruhi keadilan dan akuntabilitas penilaian.Oleh karena itu, disarankan agar penelitian dan pengembangan ke depan fokus pada integrasi dimensi teknis, psikometrik, dan etis dalam satu kerangka evaluasi AI.

Berdasarkan temuan penelitian, beberapa saran penelitian lanjutan dapat dipertimbangkan. Pertama, perlu dilakukan studi mendalam mengenai pengembangan model AI yang mampu mengintegrasikan prinsip-prinsip psikometrika secara komprehensif, sehingga validitas konstruk dan reliabilitas skor dapat terjamin. Kedua, penelitian lebih lanjut diperlukan untuk mengidentifikasi dan memitigasi potensi bias algoritmik dalam sistem penilaian berbasis AI, dengan mempertimbangkan keberagaman karakteristik peserta didik dan konteks pendidikan. Ketiga, eksplorasi mengenai kerangka etika yang komprehensif untuk penggunaan AI dalam assessment pendidikan sangat penting, termasuk regulasi terkait transparansi algoritma, akuntabilitas pengambilan keputusan, dan perlindungan data pribadi peserta didik. Penelitian-penelitian ini diharapkan dapat memberikan kontribusi signifikan dalam pengembangan praktik evaluasi pendidikan yang lebih akuntabel, adil, dan berorientasi pada peningkatan kualitas pembelajaran, serta memastikan bahwa pemanfaatan AI tidak hanya efisien secara teknis, tetapi juga selaras dengan nilai-nilai pendidikan yang menjunjung tinggi keadilan dan kesetaraan.

Read online
File size434.33 KB
Pages9
DMCAReport

Related /

ads-block-test