Transformer.pdf

Abstract

용어정리

Attention

sequence transduction model

BLEU score

Residual learning

Residual dropout

label smoothing

Introduction

                                        <그림1 : Recurrence model - encoder의 처리방식>

                                    <그림1 : Recurrence model - encoder의 처리방식>