<aside> ▪️ 간단 요약


시퀀스 데이터를 처리하기 위한 신경망

다층 퍼셉트론 + 순환 엣지 + 가중치 공유

Sequence Data, Recurrent Edge, 가중치 공유, 잠재 AR 모델, BPTT, MLP, LSTM

배경


구조적 특성

다층 퍼셉트론 + 순환 엣지 + 가중치 공유

순환 엣지를 통해 은닉층 노드끼리 가중치를 공유한다.

즉, 구조상 RNN은 MLP와 모두 동일하며, 순환 에지의 존재 여부만 다르다.

구조는 살짝 달라졌지만, 가중치 집합에서 두드러지게 차이가 발생한다.

다층 퍼셉트론 $\{U, V\}$

순환 신경망 $\{U, V, \underline W\}$

가중치 집합

Untitled

은닉층에서 일어나는 계산

$$ \mathbf{h}^i=\tau_1\left(\mathbf{W} \mathbf{h}^{i-1}+\mathbf{U} \mathbf{a}^i\right) $$

출력층에서 일어나는 계산

$$ \mathbf{o}^i=\tau_2\left(\mathbf{V h} \mathbf{h}^i\right) $$

학습 알고리즘

BPTT(Back-propagation through time)

Untitled

LSTM(Long Short Term Memory)을 통해 RNN의 기억력을 보완한다.

기능적 특성

RNN의 기억력 한계