1. NVDA GPU並行計算框架
  2. GPU 硬件組成
  3. 程序架構
    1. Thread :最小单元, 中文称作执行绪/线程
    2. Block :非常多个thread组成一个block
    3. Grid :多个block组成一个grid
    4. Warp :每32个thread组成一组warp, 一组warp中所有thread执行相同的指令
  4. 執行流程