state value / state action value 관련 자료
2020. 4. 27. 00:00ㆍ관심있는 주제/RL
backup diagram 잘 설명
https://towardsdatascience.com/all-about-backup-diagram-fefb25aaf804
수식적으로 State-Value function 과 State-Action Value Function 비교해놓은 자료
https://towardsdatascience.com/reinforcement-learning-markov-decision-process-part-2-96837c936ec3
Bellman Equation state-value function state action value function 그림 좋음
728x90
'관심있는 주제 > RL' 카테고리의 다른 글
chapter 4 Dynamic Programming Example Grid World (0) | 2020.05.05 |
---|---|
강화학습 - Dynamic Programming 공부 (0) | 2020.05.01 |
Contextual Bandits and Reinforcement Learning - 리뷰 (0) | 2020.02.18 |
Using Deep Q-Learning in the Classification of an Imbalanced Dataset - 리뷰 (0) | 2020.01.07 |
RL A2C 관련 Loss Function, Advantage 확인 자료 (0) | 2019.11.16 |