일화적 알고리즘 (episode algorithm)

행위자 - 비평자 알고리즘

분산 훈련

N-단계 학습

이익 행위자-비평자