인공지능/논문
Off-Policy Deep Reinforcement Learning without Exploration 리뷰
강화학습은 정말 매력적인 분야이다. 못 걷던 로봇을 걷게 하고, 로봇이 물체를 알아서 집게하고, 사람보다 게임을 더 잘하게 되고 심지어 자동차도 스스로 굴러가게 학습 시킬 수 있다. 그렇다면 이러한 강화학습이 지도학습에 비해서 널리 쓰이지 못하는 이유가 무엇일까? Sergey Levine 교수님의 설명을 빌리자면 “The fact that reinforcement learning algorithm provide a fundamentall online learning paradigm is also one of the biggest obastacles to their widespread adoption” 라는 것이다. 즉, 우리가 강화학습은 online learning의 성격이 강해서 이를 실제 환경에 적용..
Adversarial Policies : Attacking Deep reinforcement Learning 리뷰
오늘 2020년 ICLR에 Publish 된 Adversarial Policies : Attacking Deep reinforcement Learning이라는 논문에 대해 리뷰를 하려고 합니다. 논문 원본 링크 : https://arxiv.org/abs/1905.10615 Adversarial Policies: Attacking Deep Reinforcement Learning Deep reinforcement learning (RL) policies are known to be vulnerable to adversarial perturbations to their observations, similar to adversarial examples for classifiers. However, an att..