文章来源:定焦(dingjiaoone)
作者 | 金玙璠
编辑 | 魏佳
从Sora到Suno,从OpenAI到Copilot、Blackwell,这些热词在大众眼里或许还分不清楚,但很多人已经用上各种“ChatGPT”,或聊天或创作。不知不觉间,我们已经卷入新一轮AI浪潮中。
这轮人工智能浪潮,自ChatGPT这类生成式AI工具问世,被迅速引爆,因AI大模型从研究走向应用,复用成本大幅降低,各种应用得以更快渗透进各行各业,故被行业称为AI2.0
这对国内人工智能行业而言是一场“及时雨”,对国内头部公司来说,更是业绩的强心针。
以商汤科技为例,据其3月26日发布的财报显示,2023年,商汤实现营收34亿元,其中,生成式AI业务收入达到12亿元,同比增长翻倍。
作为AI2.0时代国内的开路先锋之一,日前,商汤科技董事长兼CEO徐立在2024 GDC的演讲中提出前瞻性观点:“生成式AI如果能在知识、推理、执行三层能力上实现突破,将真正带来整个社会生产力的跨越式发展。”
过去一年多,中国AI行业盛况空前、大模型井喷,不过,还需要达成一些行业共识。3月初,商汤联合多家机构发布《新一代人工智能基础设施白皮书》,明确了“新一代AI基础设施”的定义、特点和价值,并首次提出“新一代AI基础设施评估体系”。
以商汤为代表的中国公司的投入力度空前、进化速度惊人,带领中国的AI大模型快速从抢人才、拼算力,进到拼生态阶段。本文试图以商汤为例,看看中国公司在这一波人工智能浪潮中取得了什么样的成绩?有哪些积累?处于什么位置?
生成式AI业务收入翻倍,
不止靠大模型
竞争不等人,美国企业OpenAI推出聊天机器人ChatGPT、掀起新一轮生成式AI浪潮一年多以来,中国公司从互联网巨头到初创企业,要么紧锣密鼓地发布大模型,要么火速将大模型引入业务。
几乎所有公司都认识到了生成式AI的颠覆性,但从业者更想知道,如此火爆的生成式AI能让公司赚到钱吗?大模型公司都想向外界证明自己具备赚钱能力,投资人也很想搞清楚,哪些公司能把人工智能的前景转化为长期利润?
目前看来,商汤是这波生成式AI大潮中,最早赚到钱的公司之一。
商汤2023年年报显示,全年收入34亿元,毛利润15亿元。其中,最受外界关注的是,它的生成式AI收入达12亿元,同比增速200%。
这是商汤成立十年来,最快超过10亿元收入体量的新业务,在它总收入中的占比,从2022年的10%迅速涨到2023年的35%,成为公司的核心业务。商汤为客户提供的生成式AI的模型训练、微调、推理服务,都纳入这个版块。
商汤是怎么靠生成式AI赚钱的?谁在买单?
去年上半年,基于新型人工智能基础设施SenseCore AI大装置,商汤发布了“日日新”大模型。这是中国首批通过《生成式AI服务管理暂行办法》备案的八家大模型之一,有不少政企客户买单。
商汤靠大模型赚钱的方式,是为客户提供API接口和服务,具体而言,为金融、医疗、能源、教育等领域的客户,进行行业大模型的定制化和私有化部署。
另一部分为商汤创收的,是它基于日日新大模型体系,发布的一系列面向企业的生成式AI应用,包括数字人生成平台如影、高精度3D物体建模平台格物、数据标注平台明眸、高精实景三维重建平台琼宇等,服务电商和直播、智慧医疗、智能驾驶等领域的客户。
虽然国内基础大模型起步较晚,应用层发展的条件不够成熟,但商汤在国内走通了一条路:靠基础大模型赚钱,也通过行业应用创收。
这就相当于商汤先开了一座商场(平台),把场地、水电、设备等基础设施建设好,让商家(开发者、企业)进来开店,对商家提供服务并收费,同时,商汤自己也开店赚钱。
为商汤买单的客户覆盖各行各业。它拿下的代表客户包括三大运营商,招商银行、海通证券等金融机构,京东、小米、阅文等头部互联网公司,HiDream.AI、澜舟科技、Tiamat等AI初创公司,以及清华大学、上海交通大学等学术机构。
在AI领域投资人李尧看来,随着SenseCore AI大装置的持续升级、生成式AI延展出更多业务,商汤的赚钱方式将更加多样,公司亏损将继续收窄。财报显示,商汤2023年EBITDA亏损收窄至54亿元。
蓄力多年,生成式AI“赚了”
客户之所以买单,最看重的还是技术实力。这轮生成式AI浪潮是算法、算力和数据三者的全面竞争,通过这几个维度可以大致判断一家公司的行业地位。AI创业者吴策对商汤的核心能力进行分析后,拆解成技术积累、算力底座、端侧部署、B端场景四个方面,我们逐一来看。
首先是商汤过去十年在感知智能、决策智能领域的积累,为它储备了多模态数据和能力。
AI的发展,经历了从1.0时代的感知智能到决策智能,再到AI2.0时代的生成式AI的演变。
1.0时代,AI从原来的视觉类、语音语义类AI,向决策类AI演进的过程中,决策AI是所有AI公司必争的高地,包括以计算机视觉技术起家的商汤。在这个过程中,商汤开源的决策智能平台OpenDILab,以及SenseCore AI大装置的支持,起到了推动作用。
实现从感知到决策智能的转折点,是跨模态生成技术,也就是把不同类型的数据(如图像、视频、文本等)融合起来,让基础模型通过迁移学习和规模涌现达到能力跃迁,让AI从“决策判别”进化出了“创造生成”的能力。
商汤一直把研发多模态大模型作为战略投入方向,因而,积累的多模态数据和能力,也就成了它发展生成式AI的“弹药”。
GPT的诞生,引燃了生成式AI的浪潮,这本质上是大模型成为AI主流路线的验证。再往上游看,“大模型”训练需要构建在大的算力中心上,就像OpenAI的ChatGPT是构建在微软云服务的算力中心上一样,因此,“大模型”数据参数大,“大算力”投入成本大,“大算力”配合“大模型”就是重要的护城河。“大装置+大模型”的深度协同,正是商汤多年积累的领域。
商汤在“大算力”上的投入属于行业前列,它自建了一整套AI基础设施,也就是前文提到的SenseCore商汤AI大装置,可以把它理解为GPT-3、AlphaFold路径上的更大规模落地。
算力就是生产力,大模型浪潮之下,大量厂商都在急切地投资购买芯片、增强算力,实际上是在竞争数据中心(IDC)的资源。商汤早在2018年就投资数十亿,自建AI算力中心(AIDC),于2022年初投入使用,后续持续扩建。据介绍,商汤AIDC已经成为全国规模最大的人工智能计算中心之一,大装置上架的GPU数量达4.5万张,总算力规模突破12000P。
算力中心只是商汤AI大装置的一部分,大装置的全貌包含算力层(AI芯片及处理卡+AIDC+AI传感器)、平台层(模型生产+训练平台+数据平台)、算法层(算法工具箱+开源框架)三层,是大数据、大模型和大算力三位一体的基础设施。
国际知名调研机构弗若斯特沙利文在报告中给出结论:商汤AI大装置的市场综合竞争表现国内第一。
过去半年,AI模型这把火从云端烧到终端,端侧模型的竞争已经趋于白热化。而商汤在端侧部署上也有将近十年的积累。
模型首先要在云端经过训练、调优与测试,再转移到端侧,如今,随着云端模型不断下放,再加上很多端侧的计算需求原本无需动用云端方案,将经过训练的模型引入终端设备,如手机、汽车、机器人等的需求,越来越旺盛。
端侧部署主打的是轻量化和本地化,对于企业来说,能大幅节省算力成本,对用户而言,有保护隐私和安全方面的优势。最近半年火爆的AI手机概念,就是手机厂商在宣传端侧模型。
商汤从成立之初就帮客户优化端侧推理,全球几乎所有安卓手机厂商、主流车厂、互联网APP都是它的客户。根据财报,商汤的感知和决策类的AI模型,至少植入了20亿台手机和上百万台汽车,目前能最快推出业界性能最好、推理速度最快的端侧小模型。这么看来,商汤的端侧生成式AI业务能快速发展,正是因为此前在端侧部署上的储备。
总结来看,商汤的核心技术优势有三:感知智能、决策智能领域的储备、“大装置+大模型”的技术底座、端侧部署的积累,最后,还要看AI to B的能力。
想靠生成式AI赚到B端的钱,前提是让企业受益,才能跟着赚到钱,所以说,客户积累、技术能力是否成熟稳定,是关键。
从人脸识别起步,到转型成为AI平台公司,商汤始终在深耕B端场景。李尧对「定焦」称,商汤在传统AI业务领域,攒下了大量优质客户群,基本都是生成式AI业务的目标群体;在生成式AI方面,商汤还是国内少有的拥有完整体系和成熟能力的公司,这为它开拓新客户铺好了路。
商汤在财报中提到,生成式AI业务为公司带来了7成新客户,剩下30%的存量客户的客单价有50%的增速。
AI2.0时代,商汤的野心有多大?
和很多行业不同,AI行业的风口并不容易追,人们津津乐道的风口上的故事,实际都是长期坚持换来的“等风来”。
商汤作为技术流和实战派的结合体,因为有十年来在芯片、框架、模型、算力、应用等各个层面的积累和实践,这才赶上了AI2.0的快车,换来了业绩转型成功。
生成式AI浪潮是国内AI行业的“及时雨”,不过,现在依然有很多公司角色尴尬,没找到技术方向,也养不活自己。
吴策建议,这类公司与其无意义地“内卷”,不如利用头部公司提供的服务,尽快找到商业化出口。
在行业里,商汤的角色不止一面。
在模型层,掌握AI基础设施的商汤,承担着“大模型产业孵化器”的角色。
ChatGPT是行业标杆,但不代表所有公司都能成为OpenAI,堆显卡、堆算力,不是一般公司能承受的。商汤做的是底座,它的愿景之一就是帮初创公司入局大模型,为上层应用公司提供AI基础设施。具体而言,包括对外提供各种算力的服务、数据的服务和AI的服务等,尤其是核心的计算力的生产中心。
根据财报,初创公司如澜舟科技的孟子GPT大模型、Tiamat的文生图大模型,都借用了商汤大装置的能力。
前文提到,商汤“大装置+大模型”的前瞻性布局,不但让它拥有了中国第一梯队的大算力,还能以模块化平台套件迭代大模型、开发生成式AI产品族。因此,商汤在平台层、应用层都有一席之地,既是产业链接者,也是新质生产工具开发者。
平台层大有可为。在AI1.0阶段,AI的每次应用都是割裂的,不能形成有效的平台,但在AI2.0阶段,会诞生像操作系统一样的全新平台。吴策对「定焦」表示,头部厂商都在从基座之争转向生态之争,组建各自的生态圈,这是大厂商现在的核心竞争点之一。
生态圈越丰富,行业认可度就越高。一个例证是,近日,SenseCore商汤大装置AI云、商汤日日新·商量SenseChat大语言模型,均与华为昇腾Atlas服务器,完成了互信认证。这将继续提高商汤大装置、大模型的行业地位。
应用层的商业价值和产业价值同样很大。
我们现在看到的生成式AI热潮,就是应用与研发相互促进的结果。在李尧看来,AI大公司之间的竞争,最终会落到应用层面。技术只有在市场应用中,才能找到发展方向,大模型一定要和应用结合才能形成闭环,并不断优化打磨。
所以,商汤把触角伸向下游应用层,在C端、B端都有代表作,既能保持竞争优势,也能不断优化底层能力,填补技术和企业应用实际需求之间的鸿沟。
商汤近日更新的AI办公辅助软件“小浣熊”就是例子,它在去年代码补助工具的基础上,升级成了数据分析工具。
如果问中国公司在这一波AI浪潮中处于什么位置,商汤或许就是国内AI产业进化的缩影。
AI1.0时代,它是赋能者和服务者的角色,核心能力偏重底层。到了AI2.0时代,如果把AI比作电力,大模型相当于“发电机”,商汤则进化成了产业升级的“发动机”,先把大模型打造成像电、水一样随取随用的公共资源,再将生成式AI技术应用于各行各业,为行业打样。
*题图来源于Unsplash。应受访者要求,文中李尧、吴策为化名。