深度思考

打造 Reasoning Model 的方法

不用微調參數

更強的思維鏈 (CoT Prompting??)

給模型推論工作流程 (亂槍打鳥??)

需要微調參數

教模型推理過程 (Imitation Learning)

以結果為導向學習推理 (RL)

DeepSeek-R1