自ChatGPT发布以来,AI领域的技术、产品和创业生态几乎在以周为单位迭代。2023年3月更是经历了疯狂2周,昨日充满希望的技术或产品逻辑似乎第二天就可能被颠覆,行业生态格局在迅速演变,很多创业者和投资人都陷入了学习焦虑和迷惘状态。OpenAI作为这次AI热潮的导火索和行业事实的领先者(且可能长期保持),对行业生态有广泛和深远的影响。我们认为,深入理解OpenAI的愿景和技术选择本质,有助于对其历史行为产生更深刻的认知,以及对其未来的动作进行某种程度的预测,进而辅助我们进行生态的推演。
目录
自OpenAI成立开始,就一直坚持以追求普惠的AGI为目标。2015年12月11日发布的《 Introducing OpenAI》中写道:“Our goal is to advance digital intelligence in the way that is most likely to benefit humanity as a whole, unconstrained by a need to generate financial return.”
同时我们注意到在在2023年2月14日发布的《Planning for AGI and beyond》中,OpenAI的措辞发生了细微变化:“Our mission is to ensure that artificial general intelligence—AI systems that are generally smarter than humans—benefits all of humanity.”
第一个变化是增加了对AGI的描述,指明了AGI的智慧程度会高于人类智能。
第二个变化是由不以财务回报为目的改为了普惠人类。
AGI本是一个充满了歧义的模糊术语,并没有精准定义。前者变化是OpenAI基于过去几年的探索给出的判断,其追求AGI的本质没有改变。后者则是OpenAI在更深入的技术探索后,进行了股权结构和商业化策略的调整,背后逻辑后续会详细展开。
总体而言,鉴于OpenAI的历史言论和行动保持高度一致性,我们有理由相信:OpenAI一直并将继续以追求普惠的AGI为第一目标——这个假设是本文后续进行生态推演的基本前提。
在AGI愿景下,我们看到OpenAI在过去5年坚定的选择了**用GPT(Generative Pre-trainning Transformer)架构持续加注LLM(Large Language Model)**的技术路径。这个期间OpenAI孤独且惊人的巨大投入,让外部觉得这是信仰的程度。但如果理解了OpenAI的技术选择本质回头看,我们会发现这其实是OpenAI在对技术的深刻洞见下的理性判断。
OpenAI的在发展上可大致分为三个阶段:
这个时期的OpenAI走向AGI的技术路径并没有收敛,开展了包括OpenAI Gym(RL),OpenAI Five(Dota2)和一系列Generative Model(生成式模型)的项目探索。值得注意的是,这些项目使用的是Unsupervised Learning(无监督学习)或RL(Reinforcement Learning, 强化学习),都不需要标注数据,有较好的可拓展性。Unsupervised Learning和RL在OpenAI成立之初是一个难以实践更难以Scale(规模化)的算法路径,OpenAI却似乎只关注这个工业上不成熟的技术路径并尝试Scale。
研究这期间OpenAI的文章和Ilya Sutskever(OpenAI 首席科学家)的演讲,可以窥见OpenAI当时两个重要的技术判断: