开放Gemma而非“开源”，谷歌为何转变大模型竞争策略？

界面新闻记者 | 彭新

界面新闻编辑 | 宋佳楠

美国科技巨头谷歌持续在大语言模型领域向OpenAI和Meta发起进攻。

2月21日晚，谷歌宣布新一代免费可商用大语言模型Gemma在全球开放使用。该模型被谷歌视为自身“最先进的开放模型”。

这是该公司在开放AI大模型领域做出的一大动作。谷歌DeepMind产品管理总监Tris Warkentin称，开放模型对谷歌来说是一个新的机会，让其可以与社区和谷歌之外的人合作，在AI研发方面创造新的机会。

Gemma得名于拉丁语“宝石”，仅用于处理文本信息，其基础技术架构与谷歌最强AI模型Gemini一致，但参数规模较小，仅有20亿参数和70亿参数两个规模版本，且两种参数规模的Gemma模型都会有预训练和指令微调版本。

较小的参数规模有助于Gemma实现更广泛部署。谷歌介绍称，Gemma支持主流AI框架，还可在笔记本电脑、台式机、物联网、移动设备和云端等环境上运行。

1678242024953

该公司公布的测评结果显示，Gemma在数学、编码、推理精通性和知识测试等许多外部基准测试中都优于Llama 2模型。Llama 2是Meta发布的最新一代开源大模型，包含了70亿、130亿和700亿参数的模型。

值得注意的是，谷歌强调Gemma为开放模型，而非“开源”，这意味着谷歌并不会分享Gemma的多项技术细节，包括Gemma的源代码、训练数据等。在应用上，谷歌称其使用条款允许所有组织负责任地进行商用和分发。

开放Gemma或是针对开源大模型领域所受批评的部分回应。此前谷歌和OpenAI因坚持技术封闭而遭到外界抨击，两者在最新、最先进的模型上都选择了闭源，被认为不利于技术进步。

对此，新浪微博新技术研发负责人张俊林评价称，Gemma代表谷歌大模型策略的转变——兼顾开源和闭源，开源主打性能最强大的小规模模型，希望战胜Meta和Mistral（欧洲AI公司，推出了Mistral 7B开源AI模型）；闭源主打规模大的效果最好的大模型，希望尽快追上OpenAI。

在AI社区，目前Meta的Llama 2一直是最强大的开源大模型之一，该模型信息和源代码支持免费商用，因此获得大量AI开发者支持。

谷歌显然希望借助Gemma吸引更多开发者进入谷歌云生态。一方面，Gemma针对谷歌自研云端AI芯片TPU进行了优化，声称可发挥更好的效能。同时，谷歌云新用户还会获得300美元云积分，用来研究Gemma。

此外，Gemma将能够在英伟达芯片上运行，由双方合作进行优化，以加速该模型在云端数据中心、PC端侧的推理性能。如将Gemma用于搭载英伟达GPU的AI PC上，驱动本地聊天机器人软件，并与英伟达的多项AI工具集成。

OpenAI、谷歌、Meta等大型科技公司的大模型之战有愈演愈烈之势。

谷歌在2023年3月推出AI对话机器人Bard，并在去年5月推出最新的闭源大语言模型PaLM2。在上周，该公司官宣“下一代AI大模型” Gemini 1.5，称在诸多方面已经超越OpenAI的GPT-4 Turbo。Meta则热衷模型开源，旗下Llama 2最为知名。

而在近日，OpenAI发布文生视频模型Sora再次引爆AI圈，也进一步拉开了与其他大模型公司的距离。谷歌要最终赶超OpenAI仍将充满诸多不确定性。