進擊的 BERT:NLP 界的巨人之力與遷移學習
BERT 中的tokenizer和wordpiece和bpe(byte pair encoding)分词算法_枪枪枪的博客-CSDN博客
深入理解NLP Subword算法:BPE、WordPiece、ULM