[RL] Continuous Action 일 때 참고 (A2C)
2020. 9. 6. 13:12ㆍ관심있는 주제/RL
A2C Continuous Reward (Online)
https://github.com/hermesdt/reinforcement-learning/blob/master/a2c/pendulum_a2c_online.ipynb
github.com/colinskow/move37/blob/master/actor_critic/a2c_continuous.py
incredible.ai/reinforcement-learning/2019/07/20/Advantage-A2C/
www.datahubbs.com/policy-gradients-and-advantage-actor-critic/
728x90
'관심있는 주제 > RL' 카테고리의 다른 글
[RL] Great Reward Function 만들 때 참고 (0) | 2020.09.06 |
---|---|
[RL] Create Environment 만들 때 참고 (2) | 2020.09.06 |
N-STEP On-Policy SARSA, N-STEP Off-Policy SARSA wiht Importance Sampling, N-STEP Expected SARA 코드 비교해보기 (0) | 2020.07.19 |
강화학습 기초 자료 모음집 (0) | 2020.07.18 |
Sarsa, Q-Learning , Expected Sarsa, Double Q-Learning 코드 비교하기 (2) | 2020.07.18 |