文章来源:AI工程化
在红杉资本在最新发布的文章《Generative AI’s Act O1 :The Agentic Reasoning Era Begins》中,讨论了当下生成式AI正在从以训练时计算的快思考,向以推理时计算的慢思考发展。OpenAI 的新模型 o1便是重要的标志。慢思考的到来也将会带来新的机会,行业认知的重要性被高度重视起来,过去对于AI应用以及背后的商业理解也将被刷新。
简单说,过去以模型服务商作为绝对主角的时代将过去,大众对通用基座模型抱着只要把它越训越大,它就能无所不能的期望,这曾一度给上层应用开发者极大的不安全感焦虑,而事实上,这两年实践下来,这一认知正在不断被纠正。应用服务商也不再是模型的wrapper,随时可能被降维打击,未来的空间大大扩展。
随着底层模型能力突破遭遇瓶颈,加上白热化的竞争,模型服务商已经不再那么吸引人,最近,有消息称国内做预训练大模型的厂商越来越多正在选择放弃基础大模型的投入,转战应用层。
下面就一起来了解红杉在文中提到的重要观点以及笔者解读。
从“快思考”到“慢思考”的转变
如果说,快思考是动物都具备的本能反应,那么快思考就是人类特有的理智活动。显然,人类期待的AI解决的不简单是快思考的问题,而更在意慢思考的能力。例如,以 AlphaGo 击败围棋大师李世石为例,AlphaGo 通过深思熟虑的策略而非简单依赖以往的经验,从而走向胜利。 过去,生成式 AI 主要依赖于快速的预训练模型进行响应,这种思维属于系统 1(快思考),简单的模式匹配和快速响应。然而,随着 o1 模型的推出,AI 开始具备更复杂的推理能力,体现为系统 2思维(慢思考)。这种思维方式强调深度思考和复杂决策,能够让 AI 在面对新问题时进行深入分析和推理,有效应对复杂问题。
同时,o1 发布让大家看到推理时计算(或“测试时计算”)侧的价值,它的出现带来了新的 scaling law(推理时),也给众多模型服务商新的启发,开始从卷训练计算,向卷推理计算转变,简单堆机器堆数据的资源竞争格局将带来缓解。
延伸阅读:
OpenAI o1模型推理能力大幅提升的背后:重复采样如何提升AI推理能力
一模统管并未发生,从模型算法向领域KnowHow迈进
红杉称,过去猜测未来AI的巨大机会可能会被几家基座模型提供商所垄断,随着模型能力的不断提升,应用层开发也毫无价值和壁垒。但事实上,这两个推测都没发生,不仅模型服务商陷入了激烈的成本竞争,基础模型做应用产品成功的案例也少之又少。
另一方面,虽然模型能力已经从“预训练层”向“推理计算层”推进,但混乱的现实世界仍然有有大量的领域和应用特定推理,也就是行业认知,这些无法有效地编码在通用模型中。因此,还会有“定制认知架构(Custom Cognitive Architectures)”层,即代码和模型交互的流程,它接收用户输入并执行操作或生成响应,教模型如何思考。实际上就是领域应用逻辑,它是模型到落地的最后一公里。比方说,在工厂环境中,每款“机器人”产品都配备了一个定制化的认知架构,旨在模拟人类的思维方式来应对特定的任务。例如,它们能够审查拉取请求、编写并实施迁移计划,将服务从旧的后端迁移到新的后端。这些机器人会分析所有依赖项,提出必要的代码修改,添加相应的单元测试,并邀请人类进行审查。一旦获得批准,它们将在开发环境中执行所有更改,并且在所有测试通过后,才会合并这些代码。整个过程类似于人类处理任务的方式——通过一系列明确的步骤,而不是提供一个笼统的、不透明的解决方案。
转变会带来什么?
慢思考,以及领域认知将会给未来带来什么?不难想象,沿此思路将会有比原来多得多的场景被解锁,行业认知+模型的强大能力将使得AI应用层产品价值大大强化,进而颠覆原有的业务模式。
应用层价值被强化
伴随着推理能力的提升,一大批新的Agent应用程序将会诞生,这里说的新,不再是简单的模型包装,而是可能同时结合多个基础模型和复杂的认知架构的应用服务。
文章中提到了这些优秀的应用层产品:
- Harvey:作为 AI 律师,它能够分析复杂的法律文本,辅助律师更高效地进行案件准备;
- Glean:一款 AI 工作助手,致力于信息处理和任务优化,提高团队的工作效率;
- Abridge:AI 医疗记录助手,通过自动化生成医疗记录,减轻了医生的负担;
- XBOW:自动化渗透测试工具,能够为企业提供高效的网络安全测试服务。
不难发现,他们都是面向领域的,具有复杂业务流程和认知复杂度的场景的产品。在过去两年的实践来看,想要一个通用模型搞定所有事情,应用层专注做界面包装的认识被打破了。过去开发者被OpenAI等模型服务商的降维打击的压迫感以及无助感在迅速缓解,AI应用的繁荣正在发生。特别是最近cursor等产品的出现,更让大家看到了应用产品的价值。
延伸阅读:
大胆问,别尴尬,AI IDE(Cursor)可能比你想的强大(中外实际体验对比差距大【有视频】)
ChatGPT逆向工程后续:用v0 Chat和Cursor重塑前端开发流程,开启AI编程新纪元
服务即软件(Service-as-a-Software),AI Native企业将涌现
不难想象,随着AI应用的不断深入到行业,能力不断强化,个体能效不断提升,这将极大地降低人力成本,对于人力密集型和知识密集型服务业市场将是巨大冲击,比如律师,会计,编辑,程序员等行业。有了AI加持,同样的事情可能会使用很少的人就能搞定,进而显著降低了企业在开发软件时所需的人力成本,提升企业的市场竞争优势。这样传统的人力外包型业务将快速被服务型AI应用所替代,外包化将更加流行。
以软件公司为例,传统提供saas服务给客户帮助解决问题,而变成了直接承包业务,从传统的“软件即服务”模式向“服务即软件”转变。这一转变将市场重心从简单的软件使用转向更复杂的工作成果,潜在市场规模可达数万亿美元,按价值付费变得不再是口号。
人机协作正在从AI辅助,到AI in loop,再到human in loop,再到AGI这一进程快速迈进。这在我之前的文章《Dify构建全AI雇员的BPO公司示例,揭示AI Native公司的创建方法》中也有介绍,某种意义上讲,或许我们苦苦寻找的AI Native产品并不存在,而Ai Native的企业将比比皆是。未来的外包市场或将是最为火爆的行业之一。
投资重点
最后,红杉指明了受投资者喜欢的新方向,那就是应用层产品,他们表示,企业业务在云计算过渡期间,大约有 20 家应用层公司创造了 10 亿美元以上的收入,而在移动过渡期间,又有大约 20 家公司创造了类似的成就。那么,企业AINative化可能也将来如此大的规模效应,甚至更大。
点此原文:https://www.sequoiacap.com/article/generative-ais-act-o1/
近期原创文章: