본문 바로가기

dqn1

강화학습(Reinforcement Learning) 정리노트-DQN 본 자료는 김성훈 교수님의 모두를 위한 강화학습을 기반으로 작성되었습니다. 별도의 목차가 없습니다. 한 호흡에 읽어야 해서 부담스러울수도 있습니다. Agent는 자신이 할 수 있는 여러 Action들 중 하나의 Action을 선택하고, 그 선택을 Environment에게 넘긴다. Agent로부터 Action을 넘겨받은 Environment는 그 Action에 대하여 두 가지 결과물을 내는데, 일단, Action의 결과인, 어떤 상황으로 변했는지에 해당하는 state 정보를 넘긴다. 그리고, 넘겨받은 Action을 평가한 점수인 reward를 넘긴다. Environment는 openAI gym에서 제공하는 Environment을 사용하게 되는데, environment는 우리가 직접 만들 수도 있다. ope.. 2019. 8. 28.

이전 1 다음

티스토리툴바