IAESCOREIAESCORE
International Journal of Electrical and Computer Engineering (IJECE)International Journal of Electrical and Computer Engineering (IJECE)This article investigates the discount factor-based data-driven reinforcement learning control (DDRLC) algorithm for completely uncertain unmanned aerial vehicle (UAV) quadrotors. The proposed cascade control structure of UAV is categorized with two control loops of attitude and position sub-systems, which are established the proposed discount factor-based DDRLC algorithm. Through the analysis of the Bellman functions time derivative from two perspectives, a revised Hamilton-Jacobi-Bellman (HJB) equation including a discount factor is developed. Then, in the view of off-policy consideration, an equation is formulated to simultaneously solve the approximate Bellman function and approximate optimal control law in the proposed DDRLC algorithm with guaranteed convergence. According to the modified state variables vector, the development of the discount factor-based DDRLC algorithm in each control loop is indirectly implemented by transforming the time-varying tracking error model into the time invariant system. Finally, a simulation study on the proposed discount factor-based DDRLC algorithm is provided to validate its effectiveness.
The proposed data-driven reinforcement learning algorithm incorporating a discount factor was developed for the two subsystems of a UAV quadrotor to address performance challenges in fully uncertain UAV systems.Utilizing the off-policy approach, the model-free cascade control framework was constructed to simultaneously obtain the optimal control law and the corresponding Bellman function.The network weights were adjusted to approximate the solution of the modified Hamilton-Jacobi-Bellman (HJB) equation, with theoretical guarantees of both convergence and stability.
Berdasarkan penelitian ini, beberapa saran penelitian lanjutan dapat diajukan untuk memperluas pemahaman dan penerapan kontrol UAV yang lebih canggih. Pertama, penelitian dapat difokuskan pada pengembangan algoritma RL yang lebih adaptif terhadap perubahan lingkungan dan parameter UAV secara real-time, sehingga meningkatkan robustitas sistem kontrol. Kedua, eksplorasi integrasi sensor yang lebih beragam, seperti LiDAR atau kamera termal, dapat memberikan informasi tambahan untuk pengambilan keputusan kontrol yang lebih akurat dan aman, terutama dalam kondisi cuaca buruk atau lingkungan yang kompleks. Ketiga, penelitian dapat mengarah pada pengembangan arsitektur kontrol terdistribusi untuk swarm UAV, di mana setiap UAV dapat berkoordinasi secara otonom untuk mencapai tujuan bersama, membuka peluang aplikasi baru dalam bidang survei, pengiriman, dan pencarian dan penyelamatan.
| File size | 678.89 KB |
| Pages | 13 |
| DMCA | Report |
Related /
ADAIADAI Kompetensi sumber daya manusia memiliki pengaruh positif terhadap sistem pengendalian internal. Kompetensi sumber daya manusia juga berpengaruh positifKompetensi sumber daya manusia memiliki pengaruh positif terhadap sistem pengendalian internal. Kompetensi sumber daya manusia juga berpengaruh positif
AZZUKHRUFCENDIKIAAZZUKHRUFCENDIKIA The research concludes that Return on Asset has a positive and statistically significant effect on stock prices, indicating that effective asset managementThe research concludes that Return on Asset has a positive and statistically significant effect on stock prices, indicating that effective asset management
AZZUKHRUFCENDIKIAAZZUKHRUFCENDIKIA Pendapatan asli daerah berpengaruh positif dan signifikan terhadap belanja modal, sementara dana alokasi umum berpengaruh negatif tetapi tidak signifikan.Pendapatan asli daerah berpengaruh positif dan signifikan terhadap belanja modal, sementara dana alokasi umum berpengaruh negatif tetapi tidak signifikan.
MIKROSKILMIKROSKIL Penelitian ini bertujuan untuk menganalisis pengaruh citra merek, promosi, dan harga terhadap keputusan pembelian produk pasta gigi Pepsodent di wilayahPenelitian ini bertujuan untuk menganalisis pengaruh citra merek, promosi, dan harga terhadap keputusan pembelian produk pasta gigi Pepsodent di wilayah
PIPI Penelitian ini menegaskan bahwa keberhasilan penerapan SIA tidak hanya ditentukan oleh teknologi, tetapi juga oleh kebijakan internal, kompetensi SDM,Penelitian ini menegaskan bahwa keberhasilan penerapan SIA tidak hanya ditentukan oleh teknologi, tetapi juga oleh kebijakan internal, kompetensi SDM,
UVERSUVERS Oleh karena itu, penanganannya memerlukan perlakuan yang sangat khusus sehingga kerugian atas piutang tak tertagih dapat dihindari. Pengelolaan piutangOleh karena itu, penanganannya memerlukan perlakuan yang sangat khusus sehingga kerugian atas piutang tak tertagih dapat dihindari. Pengelolaan piutang
STIEMULIA SINGKAWANGSTIEMULIA SINGKAWANG Lingkungan pengendalian, aktivitas pengendalian, informasi komunikasi, dan pemantauan sudah berjalan sesuai prosedur. Risiko pengelolaan obat berhasilLingkungan pengendalian, aktivitas pengendalian, informasi komunikasi, dan pemantauan sudah berjalan sesuai prosedur. Risiko pengelolaan obat berhasil
STIEMULIA SINGKAWANGSTIEMULIA SINGKAWANG Tujuan dari penelitian ini untuk mengetahui bagimana penerapan siklus penjualan pada perusahaan apakah sudah memadai, dan bagaimana penerapan pengendalianTujuan dari penelitian ini untuk mengetahui bagimana penerapan siklus penjualan pada perusahaan apakah sudah memadai, dan bagaimana penerapan pengendalian
Useful /
KALBISKALBIS Hasil temuan menunjukkan bahwa respon individu terhadap culture shock sangat bervariasi. ketidakmampuan beradaptasi dapat menimbulkan tekanan mental, menurunkanHasil temuan menunjukkan bahwa respon individu terhadap culture shock sangat bervariasi. ketidakmampuan beradaptasi dapat menimbulkan tekanan mental, menurunkan
IAESCOREIAESCORE The proposed prototypes performance is compared to that of conventional boost converters based on criteria such as input voltage, output voltage, componentThe proposed prototypes performance is compared to that of conventional boost converters based on criteria such as input voltage, output voltage, component
IAESCOREIAESCORE Pendekatan ini memungkinkan perluasan rentang variasi yang diperbolehkan dalam parameter regulator, sehingga memastikan perilaku dinamis yang diinginkanPendekatan ini memungkinkan perluasan rentang variasi yang diperbolehkan dalam parameter regulator, sehingga memastikan perilaku dinamis yang diinginkan
IAESCOREIAESCORE Lima area aplikasi robotika bantuan diidentifikasi yang bermanfaat bagi anak-anak, orang lanjut usia, memberikan bantuan rumah sakit, membantu orang denganLima area aplikasi robotika bantuan diidentifikasi yang bermanfaat bagi anak-anak, orang lanjut usia, memberikan bantuan rumah sakit, membantu orang dengan