原論文

BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding

関連論文:Attention Is All You Need

解説

【深層学習】BERT - 実務家必修。実務で超応用されまくっている自然言語処理モデル【ディープラーニングの世界vol.32】#110 #VRアカデミア #DeepLearning - YouTube

アイシア・ソリッド先生による解説動画。

https://youtu.be/IaTCGRL41_k

モデルについて

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/d65d9d9d-c808-4b8c-a0e2-eebe30b7fdcf/Untitled.png

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/321f6475-9572-4759-9383-98462443d7c0/Untitled.png