Llama Tutorial 大语言模型实践 [V]

这个tutorial的契机是yy突然看到了一个workshop 所以类似于一周大作业的形式，输入command输出使用了自动驾驶哪些模块，代码在这里所以就干一干，顺便写一个tutorial给大家参考和教程引申更多的应用

参考资料：

所有模型参数和所需要的GPU并行，注意这只是模型load占用的memory 如果token或者batch size较大也需要很多GPU显存，表格下方会说明每个之间的区别

7B, 13B, 34B 指示模型参数量
chat 指示经过了对话的fine-tuned 【 llama2论文原文：a fine-tuned version of Llama 2 that is optimized for dialogue use cases】
code 指示此llama版本经过了code数据集的训练，can use text prompts to generate and discuss code. 此处为官方blog

温馨提示下列内容和此 https://github.com/KTH-RPL/DriveCmd_LLM README 有重复：里面包含了example和我们写的prompt流程等 and yy尝试的chatgpt api那边的script

1. 申请下载模型

具体如图：

Untitled