2020. 4. 27. 00:00ㆍ관심있는 주제/RL
backup diagram 잘 설명
https://towardsdatascience.com/all-about-backup-diagram-fefb25aaf804
All About Backup Diagram
Diagram that explains Reinforcement Learning Algorithms
towardsdatascience.com
수식적으로 State-Value function 과 State-Action Value Function 비교해놓은 자료
https://towardsdatascience.com/reinforcement-learning-markov-decision-process-part-2-96837c936ec3
Reinforcement Learning : Markov-Decision Process (Part 2)
This story is in continuation with the previous, Reinforcement Learning : Markov-Decision Process (Part 1) story, where we talked about…
towardsdatascience.com
Bellman Equation state-value function state action value function 그림 좋음
[Ch.3] Bellman Equation
이번 포스팅에서는 Ch.2의 연장선으로 MDP로 정의된 문제를 풀 때 등장하는 2가지 value function들의 관계에 대해 다루겠습니다. Ch.2의 state value function과 action value function들의 관계로 현재 state/ac..
sumniya.tistory.com
'관심있는 주제 > RL' 카테고리의 다른 글
chapter 4 Dynamic Programming Example Grid World (0) | 2020.05.05 |
---|---|
강화학습 - Dynamic Programming 공부 (0) | 2020.05.01 |
Contextual Bandits and Reinforcement Learning - 리뷰 (0) | 2020.02.18 |
Using Deep Q-Learning in the Classification of an Imbalanced Dataset - 리뷰 (0) | 2020.01.07 |
RL A2C 관련 Loss Function, Advantage 확인 자료 (0) | 2019.11.16 |