PLBPLB

TEMATIKTEMATIK

Perkembangan kecerdasan buatan, khususnya reinforcement learning (RL), telah mendorong inovasi dalam otomatisasi pengambilan keputusan di pasar keuangan. Meskipun Deep Reinforcement Learning (DRL) sering digunakan, pendekatan ini membutuhkan sumber daya besar dan kurang transparan. Penelitian ini mengusulkan pembangunan bot trading berbasis algoritma value-based RL (Q-Learning) yang ringan, mudah direplikasi, dan menggunakan data terbuka dari Yahoo Finance. Sistem dikembangkan meliputi akuisisi data, preprocessing, desain agen RL, dan pengujian strategi. Agen Q-Learning dilatih untuk menentukan aksi harian (buy, sell, hold) dengan tujuan memaksimalkan cumulative return dan meminimalkan risiko. Hasil eksperimen menunjukkan Q-Learning Bot menghasilkan cumulative return 180%, Sharpe Ratio 1,2, dan win rate 55%. Temuan ini menunjukkan bahwa Tabular Q-Learning memiliki potensi sebagai pendekatan trading adaptif yang efektif dengan biaya komputasi rendah.

Dari eksperimen ini, dapat disimpulkan bahwa pendekatan Tabular Q-Learning memiliki potensi untuk memberikan return yang cukup tinggi dibandingkan strategi pasif.Peningkatan kinerja berasal dari kemampuan Q-Learning ditambah dengan stabilisasi dari double Q learning, horizon pengamatan yang lebih luas dengan multi step, serta konvergensi yang dipercepat dengan prioritized update.Penggabungan beragam teknik ini memungkinkan agen dapat menyesuaikan posisi berdasarkan pola harga dan indikator teknikal yang di-discretize, sehingga keputusan perdagangan lebih adaptif terhadap kondisi pasar yang berubah-ubah walaupun masih menggunakan teknik tabular yang ringan dan dapat diimplementasikan tanpa memerlukan GPU maupun kebutuhan sumber daya yang besar.

Penelitian lanjutan dapat fokus pada pengembangan metode adaptif untuk representasi state, seperti binning berbasis volatilitas atau distribusi harga, agar pola pasar dapat ditangkap lebih efektif tanpa meningkatkan beban komputasi. Selain itu, integrasi faktor makroekonomi dan sentimen berita ke dalam model bisa meningkatkan akurasi prediksi. Terakhir, penggunaan biaya transaksi dinamis yang berubah sesuai volatilitas dan likuiditas pasar juga perlu dieksplorasi untuk memperbaiki realisme simulasi. Dengan pendekatan ini, Tabular Q-Learning dapat lebih relevan untuk aplikasi trading nyata. Penelitian juga bisa membandingkan performa Q-Learning dengan algoritma lain seperti UCB atau permutation decision trees dalam konteks data terbuka. Pengujian pada portofolio multi-aset dengan mempertimbangkan korelasi antar aset juga menjadi arah penting untuk meningkatkan robustness model. Selain itu, pengembangan framework open-source yang memudahkan replikasi penelitian ini akan mendukung edukasi dan riset skala kecil. Kombinasi analisis sentimen dengan RL juga bisa menjadi arah inovasi untuk memperkaya konteks keputusan trading.

  1. Algoritma Value Based Untuk Pembangunan Bot Trading Yahoo Finance | TEMATIK. algoritma value based pembangunan... doi.org/10.38204/tematik.v12i2.2679Algoritma Value Based Untuk Pembangunan Bot Trading Yahoo Finance TEMATIK algoritma value based pembangunan doi 10 38204 tematik v12i2 2679
Read online
File size271.17 KB
Pages6
DMCAReport

Related /

ads-block-test