일화적 알고리즘 (episode algorithm)
행위자 - 비평자 알고리즘
분산 훈련
N-단계 학습
이익 행위자-비평자