base是指沒做過alignment
有chat的話是有做過
2.71 vs 8.63
20000多筆資料微調其實就夠了
上面的研究只用1000筆資料用來微調資料就足夠
品質很重要
用人力介入生成訓練資料