Discount factor based data driven reinforcement learning cascade control structure for unmanned aerial vehicle systems

Ngoc Trung Dang; Quynh Nga Duong

Publisher

IAESCOREIAESCORE

Journal International Journal of Electrical and Computer Engineering (IJECE) Abstract

This article investigates the discount factor-based data-driven reinforcement learning control (DDRLC) algorithm for completely uncertain unmanned aerial vehicle (UAV) quadrotors. The proposed cascade control structure of UAV is categorized with two control loops of attitude and position sub-systems, which are established the proposed discount factor-based DDRLC algorithm. Through the analysis of the Bellman functions time derivative from two perspectives, a revised Hamilton-Jacobi-Bellman (HJB) equation including a discount factor is developed. Then, in the view of off-policy consideration, an equation is formulated to simultaneously solve the approximate Bellman function and approximate optimal control law in the proposed DDRLC algorithm with guaranteed convergence. According to the modified state variables vector, the development of the discount factor-based DDRLC algorithm in each control loop is indirectly implemented by transforming the time-varying tracking error model into the time invariant system. Finally, a simulation study on the proposed discount factor-based DDRLC algorithm is provided to validate its effectiveness.

Conclusion

The proposed data-driven reinforcement learning algorithm incorporating a discount factor was developed for the two subsystems of a UAV quadrotor to address performance challenges in fully uncertain UAV systems.Utilizing the off-policy approach, the model-free cascade control framework was constructed to simultaneously obtain the optimal control law and the corresponding Bellman function.The network weights were adjusted to approximate the solution of the modified Hamilton-Jacobi-Bellman (HJB) equation, with theoretical guarantees of both convergence and stability.

Future Research

Berdasarkan penelitian ini, beberapa saran penelitian lanjutan dapat diajukan untuk memperluas pemahaman dan penerapan kontrol UAV yang lebih canggih. Pertama, penelitian dapat difokuskan pada pengembangan algoritma RL yang lebih adaptif terhadap perubahan lingkungan dan parameter UAV secara real-time, sehingga meningkatkan robustitas sistem kontrol. Kedua, eksplorasi integrasi sensor yang lebih beragam, seperti LiDAR atau kamera termal, dapat memberikan informasi tambahan untuk pengambilan keputusan kontrol yang lebih akurat dan aman, terutama dalam kondisi cuaca buruk atau lingkungan yang kompleks. Ketiga, penelitian dapat mengarah pada pengembangan arsitektur kontrol terdistribusi untuk swarm UAV, di mana setiap UAV dapat berkoordinasi secara otonom untuk mencapai tujuan bersama, membuka peluang aplikasi baru dalam bidang survei, pengiriman, dan pencarian dan penyelamatan.

Download Read online Download

Metadata

File size	678.89 KB
Pages	13
DMCA	Report

Related /

JURIS Analisis Sistem Pengendalian Internal untuk Penerimaan Kas di Masjid Assalam Surabaya Timur Merujuk pada Definisi dan Prosedur

2026

DHSJOURNALDHSJOURNAL Metode yang digunakan adalah deskriptif kualitatif dengan teknik pengumpulan data wawancara mendalam, observasi langsung, dan analisis dokumen. Hasil menunjukkanMetode yang digunakan adalah deskriptif kualitatif dengan teknik pengumpulan data wawancara mendalam, observasi langsung, dan analisis dokumen. Hasil menunjukkan

JURIS The Influence of Halal Perception Trust and Social Influence on Gen Z Purchasing Decisions in Social Commerce

2026

UMPARUMPAR Penelitian ini bertujuan untuk menganalisis pengaruh persepsi halal, kepercayaan, dan social influence terhadap keputusan pembelian Generasi Z (Gen Z)Penelitian ini bertujuan untuk menganalisis pengaruh persepsi halal, kepercayaan, dan social influence terhadap keputusan pembelian Generasi Z (Gen Z)

JURIS Advocacy For Village Budgeting To Promote Inclusive Development For Women And Children In Cemba Village Enrekang Regency

2026

UMPARUMPAR Namun, implementasi GRB memungkinkan alokasi anggaran lebih responsif terhadap kebutuhan kelompok rentan, meningkatkan partisipasi perempuan dan anak dalamNamun, implementasi GRB memungkinkan alokasi anggaran lebih responsif terhadap kebutuhan kelompok rentan, meningkatkan partisipasi perempuan dan anak dalam

JURIS The Influence of Beauty Vloggers and E WOM on the Decision of Young Women in Pontianak City to Purchase Local Cosmetic Products through Customer Trust

2026

UMPARUMPAR Kepercayaan pelanggan memiliki pengaruh positif yang signifikan terhadap keputusan pembelian. Uji Sobel membuktikan bahwa kepercayaan pelanggan memediasiKepercayaan pelanggan memiliki pengaruh positif yang signifikan terhadap keputusan pembelian. Uji Sobel membuktikan bahwa kepercayaan pelanggan memediasi

JURIS The Effect Of Entrepreneurial Orientation On Marketing Performance Of Street Food MSMEs In Pontianak City With Product Innovation as a Mediation

2026

UMPARUMPAR Data dikumpulkan dari 140 pelaku UMKM street food menggunakan pendekatan kuantitatif dan analisis Structural Equation Modeling (SEM). Hasil menunjukkanData dikumpulkan dari 140 pelaku UMKM street food menggunakan pendekatan kuantitatif dan analisis Structural Equation Modeling (SEM). Hasil menunjukkan

2026

UMPARUMPAR Penelitian ini menemukan bahwa gaya kepemimpinan secara parsial tidak berpengaruh positif dan signifikan terhadap kinerja pegawai. Temuan ini menunjukkanPenelitian ini menemukan bahwa gaya kepemimpinan secara parsial tidak berpengaruh positif dan signifikan terhadap kinerja pegawai. Temuan ini menunjukkan

2025

AZZUKHRUFCENDIKIAAZZUKHRUFCENDIKIA The findings reveal that both Return on Asset and inflation variables have a positive, but statistically insignificant, effect on stock prices. The researchThe findings reveal that both Return on Asset and inflation variables have a positive, but statistically insignificant, effect on stock prices. The research

2024

IAINU KEBUMENIAINU KEBUMEN Metode penelitian yang digunakan adalah studi kasus dengan pendekatan kualitatif. Data dikumpulkan melalui wawancara, observasi, dan dokumentasi, dan keabsahannyaMetode penelitian yang digunakan adalah studi kasus dengan pendekatan kualitatif. Data dikumpulkan melalui wawancara, observasi, dan dokumentasi, dan keabsahannya

Useful /

2026

UMSIUMSI Adapun permasalahan yang dibahas saat ini ini adalah bagaimana bentuk praktek rente yang dilakukan oleh masyarakat. Berdasarkan data yang ditemukan diAdapun permasalahan yang dibahas saat ini ini adalah bagaimana bentuk praktek rente yang dilakukan oleh masyarakat. Berdasarkan data yang ditemukan di

2025

IAESCOREIAESCORE The experimental setup consisted of three different bifacial photovoltaic module configurations: two vertically mounted with facing East-West (E/W) andThe experimental setup consisted of three different bifacial photovoltaic module configurations: two vertically mounted with facing East-West (E/W) and

2024

UNP KEDIRIUNP KEDIRI Terdiri dari tahap mendefinisikan, mendesain, mengembangkan, dan menyebarluaskan. Tulisan ini khusus menguraikan secara rinci pada tahap develop, yangTerdiri dari tahap mendefinisikan, mendesain, mengembangkan, dan menyebarluaskan. Tulisan ini khusus menguraikan secara rinci pada tahap develop, yang

2019

SARI MUTIARASARI MUTIARA Variabel konsep diri memberikan kontribusi efektif sebesar 28,0 persen terhadap perilaku bullying, sementara sisanya dipengaruhi oleh faktor-faktor lainVariabel konsep diri memberikan kontribusi efektif sebesar 28,0 persen terhadap perilaku bullying, sementara sisanya dipengaruhi oleh faktor-faktor lain