IAESCOREIAESCORE
International Journal of Electrical and Computer Engineering (IJECE)International Journal of Electrical and Computer Engineering (IJECE)This article investigates the discount factor-based data-driven reinforcement learning control (DDRLC) algorithm for completely uncertain unmanned aerial vehicle (UAV) quadrotors. The proposed cascade control structure of UAV is categorized with two control loops of attitude and position sub-systems, which are established the proposed discount factor-based DDRLC algorithm. Through the analysis of the Bellman functions time derivative from two perspectives, a revised Hamilton-Jacobi-Bellman (HJB) equation including a discount factor is developed. Then, in the view of off-policy consideration, an equation is formulated to simultaneously solve the approximate Bellman function and approximate optimal control law in the proposed DDRLC algorithm with guaranteed convergence. According to the modified state variables vector, the development of the discount factor-based DDRLC algorithm in each control loop is indirectly implemented by transforming the time-varying tracking error model into the time invariant system. Finally, a simulation study on the proposed discount factor-based DDRLC algorithm is provided to validate its effectiveness.
The proposed data-driven reinforcement learning algorithm incorporating a discount factor was developed for the two subsystems of a UAV quadrotor to address performance challenges in fully uncertain UAV systems.Utilizing the off-policy approach, the model-free cascade control framework was constructed to simultaneously obtain the optimal control law and the corresponding Bellman function.The network weights were adjusted to approximate the solution of the modified Hamilton-Jacobi-Bellman (HJB) equation, with theoretical guarantees of both convergence and stability.
Berdasarkan penelitian ini, beberapa saran penelitian lanjutan dapat diajukan untuk memperluas pemahaman dan penerapan kontrol UAV yang lebih canggih. Pertama, penelitian dapat difokuskan pada pengembangan algoritma RL yang lebih adaptif terhadap perubahan lingkungan dan parameter UAV secara real-time, sehingga meningkatkan robustitas sistem kontrol. Kedua, eksplorasi integrasi sensor yang lebih beragam, seperti LiDAR atau kamera termal, dapat memberikan informasi tambahan untuk pengambilan keputusan kontrol yang lebih akurat dan aman, terutama dalam kondisi cuaca buruk atau lingkungan yang kompleks. Ketiga, penelitian dapat mengarah pada pengembangan arsitektur kontrol terdistribusi untuk swarm UAV, di mana setiap UAV dapat berkoordinasi secara otonom untuk mencapai tujuan bersama, membuka peluang aplikasi baru dalam bidang survei, pengiriman, dan pencarian dan penyelamatan.
| File size | 678.89 KB |
| Pages | 13 |
| DMCA | Report |
Related /
ITB ADITB AD Disiplin kerja berpengaruh positif dan signifikan terhadap kinerja guru. budaya organisasi juga berpengaruh positif dan signifikan terhadap kinerja guru.Disiplin kerja berpengaruh positif dan signifikan terhadap kinerja guru. budaya organisasi juga berpengaruh positif dan signifikan terhadap kinerja guru.
UNIVERSITASPUTRABANGSAUNIVERSITASPUTRABANGSA Penelitian ini bertujuan untuk menjawab pertanyaan mengapa terjadi deviasi antara rencana dengan realisasi belanja satuan kerja K/L. Penelitian dilakukanPenelitian ini bertujuan untuk menjawab pertanyaan mengapa terjadi deviasi antara rencana dengan realisasi belanja satuan kerja K/L. Penelitian dilakukan
ECOJOINECOJOIN Hasil penelitian menunjukkan bahwa variabel proporsi komisaris independen, remunerasi direksi dan kepemilikan asing berpengaruh positif terhadap kinerjaHasil penelitian menunjukkan bahwa variabel proporsi komisaris independen, remunerasi direksi dan kepemilikan asing berpengaruh positif terhadap kinerja
ECOJOINECOJOIN Studi masa depan perlu mempertimbangkan melanjutkan pengujian variabel yang tidak berpengaruh dengan memunculkan indikator perhitungan lain dan memperpanjangStudi masa depan perlu mempertimbangkan melanjutkan pengujian variabel yang tidak berpengaruh dengan memunculkan indikator perhitungan lain dan memperpanjang
ECOJOINECOJOIN , 2013), sedangkan variabel Praktik Green Accounting menggunakan Global reporting index yang terdapat dalam laporan keuangan perusahaan. Penelitian ini, 2013), sedangkan variabel Praktik Green Accounting menggunakan Global reporting index yang terdapat dalam laporan keuangan perusahaan. Penelitian ini
STIEMULIA SINGKAWANGSTIEMULIA SINGKAWANG Aktivitas pengendalian yang dilakukan Puskesmas mengenai pengendalian persediaan obat-obatan sudah cukup baik. Informasi dan komunikasi di UPT PuskesmasAktivitas pengendalian yang dilakukan Puskesmas mengenai pengendalian persediaan obat-obatan sudah cukup baik. Informasi dan komunikasi di UPT Puskesmas
STIEMULIA SINGKAWANGSTIEMULIA SINGKAWANG Kesimpulan dari penelitian ini adalah lingkungan pengendalian yang dilakukan perusahaan sudah baik. Hal ini terlihat dari berbagai faktor yang membentukKesimpulan dari penelitian ini adalah lingkungan pengendalian yang dilakukan perusahaan sudah baik. Hal ini terlihat dari berbagai faktor yang membentuk
LAPANLAPAN Sehingga penelitian mengenai konsep sistem rudal anti kapal permukaan bagi Kapal Cepat Rudal (KCR) Indonesia dilakukan di Fakultas Teknologi Pertahanan,Sehingga penelitian mengenai konsep sistem rudal anti kapal permukaan bagi Kapal Cepat Rudal (KCR) Indonesia dilakukan di Fakultas Teknologi Pertahanan,
Useful /
IAESCOREIAESCORE 1% and 0. 2%. The addition of a heat sink to the back of the PV panel enhances convective heat transfer, improving its cooling capability. Heat sinks with1% and 0. 2%. The addition of a heat sink to the back of the PV panel enhances convective heat transfer, improving its cooling capability. Heat sinks with
IAESCOREIAESCORE Through comprehensive theoretical analysis, simulations, and experimental validation, the research unveils a distinctive converter design that achievesThrough comprehensive theoretical analysis, simulations, and experimental validation, the research unveils a distinctive converter design that achieves
IAESCOREIAESCORE Disimpulkan bahwa ada banyak kemajuan dalam robotika bantuan yang menunjukkan perkembangan robotik progresif dan masih dalam pengembangan, dan memberikanDisimpulkan bahwa ada banyak kemajuan dalam robotika bantuan yang menunjukkan perkembangan robotik progresif dan masih dalam pengembangan, dan memberikan
ECOJOINECOJOIN Pengambilan data sampel adalah menggunakan teknik purposive sampling, dan diperoleh 20 perusahaan pertambangan yang listing di Bursa Efek Indonesia BEIPengambilan data sampel adalah menggunakan teknik purposive sampling, dan diperoleh 20 perusahaan pertambangan yang listing di Bursa Efek Indonesia BEI