작성자 : 박정은 (baro980906@gmail.com)

발표일 : 20201116 at DeepLAB 논문반

논문 링크 https://arxiv.org/abs/2010.09163

Inductive biases in deep learning

기존 RL의 문제점

generality of the DRL framework이 문제를 야기한다.

게임/금융/로봇 등 하나의 테스크를 위한 하나의 식이 아닌 일반화된 식을 사용.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/78999061-9013-4a91-b0c7-f5da5f63f6a4/Untitled.png

→ 특정 행동이나 유도 편향을 제어하는 것이 어려워짐

일반 딥러닝에서 이를 해결 하기 위한 기법들

우리는 architecture designs in DRL 을 건드려 보겠다.

PRELIMINARIES

1. Actor Critic Method