顺序阅读代码:

首先按顺序看run_hw1.py 可以从main()看,

  1. 添加参数
  2. do_dagger 是否使用专家数据
  3. 使用logging的目录等
  4. 重点 建立BC_Trainer
  5. 重点 运行训练

BC_Trainer

  1. 导入参数
  2. 构建BCAgent
  3. 构建RL的训练对象