<aside> ▪️ 간단 요약
시퀀스 데이터를 처리하기 위한 신경망
다층 퍼셉트론 + 순환 엣지 + 가중치 공유
Sequence Data, Recurrent Edge, 가중치 공유, 잠재 AR 모델, BPTT, MLP, LSTM
다층 퍼셉트론 + 순환 엣지 + 가중치 공유
순환 엣지를 통해 은닉층 노드끼리 가중치를 공유한다.
즉, 구조상 RNN은 MLP와 모두 동일하며, 순환 에지의 존재 여부만 다르다.
구조는 살짝 달라졌지만, 가중치 집합에서 두드러지게 차이가 발생한다.
다층 퍼셉트론 $\{U, V\}$
순환 신경망 $\{U, V, \underline W\}$
가중치 집합
은닉층에서 일어나는 계산
$$ \mathbf{h}^i=\tau_1\left(\mathbf{W} \mathbf{h}^{i-1}+\mathbf{U} \mathbf{a}^i\right) $$
출력층에서 일어나는 계산
$$ \mathbf{o}^i=\tau_2\left(\mathbf{V h} \mathbf{h}^i\right) $$
학습 알고리즘
BPTT(Back-propagation through time)
LSTM(Long Short Term Memory)을 통해 RNN의 기억력을 보완한다.