image.png

image.png

特点 16 小上下文 4 大上下文
线程数 16 4
每线程存储
延迟隐藏能力 强(很多线程可切换) 弱(线程少,容易 stall)
适合场景 GPU、吞吐量导向,高并发、轻量任务 CPU、延迟敏感任务,单线程更复杂计算

多线程处理器可以避免 stall(停顿):

当一个线程因为 高延迟操作(比如内存访问) 卡住时,处理器可以调度其他线程的指令来继续执行。

注意:多线程 并不会减少内存操作的延迟,只是让 CPU 不会闲着,保持高利用率。

例子:

image.png

🔑 总结

image.png

Kayvon’s fictitious multi-core chip

  1. 16 cores
  2. 8 SIMD ALUs per core(共 128 个 ALU)
  3. 4 threads per core
  4. 16 simultaneous instruction streams
  5. 64 total concurrent instruction streams
  6. 512 independent pieces of work needed for maximal latency hiding

🔑 总结