강화학습
Off-Policy Deep Reinforcement Learning without Exploration 리뷰
강화학습은 정말 매력적인 분야이다. 못 걷던 로봇을 걷게 하고, 로봇이 물체를 알아서 집게하고, 사람보다 게임을 더 잘하게 되고 심지어 자동차도 스스로 굴러가게 학습 시킬 수 있다. 그렇다면 이러한 강화학습이 지도학습에 비해서 널리 쓰이지 못하는 이유가 무엇일까? Sergey Levine 교수님의 설명을 빌리자면 “The fact that reinforcement learning algorithm provide a fundamentall online learning paradigm is also one of the biggest obastacles to their widespread adoption” 라는 것이다. 즉, 우리가 강화학습은 online learning의 성격이 강해서 이를 실제 환경에 적용..
강화학습 개념
1. 강화학습이란? 머신러닝에서는 학습하는 방식으로 크게 4가지로 나누게 됩니다. 지도학습, 비지도학습, 준지도학습, 강화학습 강화학습은 학습하는 방식이 다른 머신러닝과 달라 다른 분류 기준에 들어가게 됩니다. 가장 크게 차이나는 거는 데이터가 필요없다는 겁니다. 필요한 강화학습 방식도 있긴 합니다만(ex. GAIL, Model based등등...) 개념파트니 이 부분은 넘어가도록 하죠. 나중에 기회가 된다면 해당 부분도 포스팅을 해보도록 하겠습니다. 제가 강화학습을 공부 했을 때는 가장 어려웠던 부분은 모델링을 예상하고 공부를 시작했는데 알고리즘의 성향이 강해서 이에 대해 적응하기가 조금 어려웠습니다. 계속 지도학습의 입장에서 이해하려고 했던 탓에 처음에 받아들이기가 어려웠죠. 앞으로 내용은 지도학습을..