강화학습 Action-Selection Strategies for Exploration
강화 학습에서는 에이전트의 행동에서 탐색이 수행하는 역할에 대해서 알아보고자 한다. 이 미디엠 글에서는 행동 선택에 초점을 맞추고 비교 강점과 약점을 보여줄 뿐만 아니라 Tensorflow를 사용하여 각각을 구현하는 방법을 보여주는 탐색에 일반적으로 사용되는 몇 가지 접근법을 살펴볼 것이라고 한다. 이 글에 대한 결과물은 아래를 들어가면 된다. http://awjuliani.github.io/exploration/index.html Reinforcement Learning Exploration Bayesian Approach Sample Network Certain Uncertain awjuliani.github.io 그렇다면 왜 강화학습에서는 탐험(Explore)을 해야 할까? 개인적으로 이 질문은 항..
2020.06.27