文章来源:AI新智能

原文链接:https://mp.weixin.qq.com/s/x2KC93PZm_1-LmoyoLbyxA

图片来源:由无界AI生成

图片来源:由无界AI生成

根据与开发者和帮助企业使用人工智能的多位谷歌员工的采访,谷歌的对话式AI“Gemini”相比竞争对手的技术而言,对应用开发者和企业来说过于复杂,难以使用。

Topology初创公司创始人艾登·麦克劳克林便是其中之一。他的公司专注于开发提升现有AI模型推理能力的软件。麦克劳克林表示,首次使用OpenAI的应用程序接口只花了30秒,而使用谷歌的Gemini却耗费了4个小时,因为谷歌要求他设置一个云账户并进行大量配置。此外,谷歌系统中的一些漏洞有时还迫使他不得不回退。

他表示:“如果谷歌的模型远远优于OpenAI和Anthropic的产品,我愿意跳过所有这些障碍。”但他补充道:“最重要的是模型的性能有多好,然而除了少数特殊情况,谷歌的模型似乎只能排在第三。”

开发者在使用Gemini时遇到的困难对谷歌的云业务也有影响,谷歌希望通过Gemini吸引更多客户使用其服务器租赁服务。部分谷歌员工认为,这些问题还可能影响Gemini本身的开发。

OpenAI通过吸引大量付费用户购买其AI模型或使用ChatGPT,获得了大量关于其AI性能的隐性和显性反馈,从而进行改进。如果谷歌的Gemini无法达到同样的使用量,该公司可能在制定改进计划时面临更多不确定性。

两名曾参与Gemini开发的员工表示,这可能还会影响谷歌为其消费者产品和广告产品开发Gemini模型的进程,特别是在搜索引擎和语音助手中提供对话式回答的功能。

Abacus AI公司首席执行官宾杜·雷迪表示:“让开发者使用Gemini解决复杂的现实世界问题……是为下一代Gemini提供至关重要的反馈。使用越多,改进的效果越好。”她还指出,尽管Gemini今年取得了巨大进步,但在支持企业AI应用方面,其可靠性仍不如竞争对手的模型。

谷歌发言人表示,开发者反馈对于改进Gemini模型非常重要,但这并非唯一的数据来源。部分AI研究人员认为,通过让AI向各个领域的专家学习,也可以带来显著的进步。

无论是小型开发者还是大公司,都在使用像OpenAI的GPT-4这样的大型语言模型开发各种应用,涵盖从自动化客服、数据分析到欺诈检测和生成计算机代码的广泛领域。OpenAI和微软每月通过向开发者销售大型语言模型大约创造1亿美元的收入,客户包括量化交易公司Jane Street、摩根士丹利等银行以及金融科技公司Stripe等。

谷歌列举了几家使用Gemini的客户,包括梅赛德斯-奔驰、高盛集团和优步。这些公司表示,AI用于从客户服务到代码辅助等各个领域,但具体的采购规模尚未得知。(谷歌此前设定了今年在北美通过AI云服务创造10亿美元收入的目标,但其销售的AI服务不止限于LLM。)

Alphabet公司首席执行官桑达尔·皮查伊在7月的第二季度财报电话会议上表示,自年初以来,已有超过200万名开发者使用了Gemini,但并不清楚其中是否包括仅尝试过一次或两次的开发者。

相较于OpenAI的模型,Gemini在开发者中的不受欢迎似乎在谷歌内部和外界已是公开的秘密。

1、对比分析

例如,企业软件初创公司Retool在6月对超过750名科技工作者进行的调查显示,只有2.6%的受访者表示他们最常使用谷歌的Gemini来构建AI应用程序,而使用OpenAI的比例高达76%。虽然Gemini略微领先于Anthropic的Claude(后者的使用率为2.3%),但Retool公司指出,Claude的使用率自2023年11月报告以来已增长了四倍多。(Gemini直到一个月后才对开发者开放。)

Similarweb的数据显示,从6月到8月,OpenAI的开发者页面获得了8280万次访问,而谷歌在同期仅有840万次浏览量。

一些小规模的非正式调查也提供了类似的证据。上月底,Finetune初创公司创始人朱利安·萨克斯在旧金山的共享办公空间内询问了50位AI初创公司开发者,他们主要使用的对话式AI模型是什么。几乎所有人都表示他们大多使用Anthropic或OpenAI的模型,而没有人主要使用Gemini。对此,萨克斯并不感到惊讶。

他表示:“我觉得在编程方面,Gemini无法与其他模型相比。”

谷歌花了近一年时间,经过一次重大重组,才推出了可以与OpenAI的GPT-4竞争的模型,而后者早在2023年初就已发布。谷歌在2023年12月开始向开发者提供Gemini模型,虽然在一些流行的对比评估中,其表现接近OpenAI的模型,但OpenAI的先发优势使其在开发者中树立了知名度。

一些谷歌员工认为,今年另一家年轻的AI公司Anthropic也凭借开发者之间的口碑营销快速崛起,许多开发者推荐Claude作为OpenAI模型的替代品,尤其是在编程辅助方面。

2、“Gemini令人困惑”

Gemini似乎未能引起太多关注。开发者表示,Gemini模型在分析长篇文档或代码库时非常有用,因为它们能够一次处理比其他模型更多的信息。然而,开发者也指出,谷歌使得使用这些模型比竞争对手更加复杂,原因在于其提供的选项种类繁多、某些选项需要的步骤较多,以及其开发者系统与OpenAI相比存在的其他差异。

有时,谷歌为使用Gemini提供的不同选项甚至会在搜索结果中相互竞争。据一名知情人士透露,今年春天的一段时间里,谷歌推广给大企业使用Gemini的服务Vertex AI Studio,曾在谷歌AI Studio的广告中作为赞助结果出现,而后者是一个让开发者更容易使用Gemini的简化工具。

“人们在试图弄清楚这些选项时常常会感到困惑,”OpenSea的前首席技术官亚历克斯·阿塔拉说,他在为自己创业公司OpenRouter使用Gemini时遇到了类似的困难,该公司为使用大型语言模型的开发者提供软件服务。

尽管谷歌在去年12月推出了AI Studio服务,旨在让开发者更容易使用Gemini,但开发者在Gemini上发送查询的方式与GPT和Claude不同,而后两者使用的是相似的格式。这一差异让开发者不太愿意转向Gemini,麦克劳克林说。

Gemini在社交媒体,尤其是X(原Twitter)上经常受到批评。本月早些时候,安全初创公司Xbow的AI研究员布伦丹·多兰-加维特发布了一篇关于他通过谷歌另一款AI开发应用Vertex使用Gemini时遇到的繁琐步骤的帖子,迅速走红。其他开发者也纷纷跟帖,表达了相同的感受。

3、“巩固的市场份额”

谷歌正试图改变外界对Gemini的负面看法,包括在X上回应对Gemini的批评。此外,谷歌还在举办开发者活动以推广Gemini,并推出了其他激励措施,例如举办开发者竞赛,要求参赛者开发出最佳的Gemini驱动应用程序,第一名将获得定制的电动版DeLorean跑车,车牌号为“G3M1N1”。(谷歌最近将最终结果推迟到今年晚些时候公布。)

据一位参与开发者产品工作的内部人士透露,谷歌还在考虑合并一些功能重叠的应用程序开发产品,以减少开发者的困惑。

“现实情况是,OpenAI在LLM API的开发者生态中,比谷歌早一点推出了实用的解决方案,”谷歌AI Studio产品负责人洛根·基尔帕特里克表示。他于今年4月加入谷歌,此前在OpenAI负责开发者关系。“我们必须与他们目前在开发者群体中的固有市场份额竞争。”

本周,OpenAI发布了一款名为“o1-preview”的推理模型,能够在一些技术或复杂任务中优于现有的大型语言模型。这可能会给谷歌带来压力,迫使其发布类似技术,否则可能在开发者的评价中进一步落后于OpenAI。

4、“VIP待遇”

与此同时,谷歌正在开发Gemini的下一版本2.0。由于AI竞赛可能会持续较长时间,这给了谷歌机会去寻找突破,追赶或超越OpenAI的技术。

实际上,Gemini已经赢得了一些忠实用户,尤其因为它能够处理比竞争对手更多的信息。Starcycle的创始人杰克琳·修表示,她的公司使用Gemini 1.5 Pro,这是谷歌为开发者提供的最先进的大型语言模型),用于从文档中提取数据。汤森路透也类似地使用Gemini开发了一款法律援助工具,比较冗长的法律文件并查找不一致之处。

对于一些大公司来说,使用谷歌AI的复杂性并不是决定性问题。Wayfair零售平台的首席技术官菲奥娜·谭表示,公司获得了谷歌员工的“白手套”服务,他们正在帮助Wayfair开展一个项目,依靠Gemini将旧数据库转换为更易用的格式。

然而,其他开发者则没有给Gemini机会,因为他们不需要改变已经在使用的解决方案。Martyn Strydom正在开发一款名为Dots的应用程序,该应用根据健身追踪器的数据提供健康建议。他表示,公司使用Claude作为代码助手来开发应用,并使用OpenAI的旧版GPT模型来回应客户。他认为公司没有时间不断测试不同的语言模型。

“现在,基本上所有人都在使用OpenAI、Claude或者Cursor,”他提到Cursor是一个由OpenAI和Anthropic模型驱动的AI代码助手。“如果世界上顶尖的工程师都在使用这些工具,我们怎么能说‘让我们去试试别的东西’呢?”(The Information)

Source

Visited 3 times, 3 visit(s) today
Subscribe
Notify of
guest

This site uses Akismet to reduce spam. Learn how your comment data is processed.

0 Comments
Most Voted
Newest Oldest
Inline Feedbacks
View all comments
0
Would love your thoughts, please comment.x
()
x