1月3日消息,又有旗舰级人工智能模型跳票了。
去年夏天,人工智能公司xAI的创始人兼首席执行官埃隆·马斯克(Elon Musk)宣布,xAI的下一代人工智能模型Grok 3计划于2024年“年底”发布。作为xAI对标OpenAI的GPT-4o和谷歌Gemini的核心产品,Grok具备图像分析和问答功能,同时为社交平台X的多项服务提供技术支持。
马斯克去年7月在X上发文称:“Grok 3将在10万块H100芯片的支持下完成训练,预计年底发布,它会是非常与众不同。”他提到xAI位于孟菲斯的大规模GPU集群。同年12月中旬,马斯克再次发帖表示:“Grok 3将实现一次重大的技术飞跃。”
然而,截至2025年1月2日,Grok 3仍未发布,也没有迹象表明发布临近。
实际上,有人工智能爱好者Tibor Blaho发现,xAI网站上的代码显示,一个过渡模型“Grok 2.5”可能会先行发布。
马斯克一向以设定雄心勃勃的目标著称,但错过截止日期也早已不是第一次。众所周知,他对产品发布时间的预测往往过于乐观。实际上,他本人也曾在去年8月接受播客主持人莱克斯·弗里德曼(Lex Fridman)的采访时提到: “如果运气够好”,Grok 3“或许”能在2024年问世。
Grok 3的发布延迟尤其引人注目,因为它代表了一个日益显现的趋势。
去年,人工智能初创公司Anthropic未能按计划推出其旗舰模型Claude 3 Opus的继任者Claude 3.5 Opus。尽管该公司此前宣布该模型将于2024年底发布,但几个月后,所有与Claude 3.5 Opus相关的内容都被从开发文档中删除。据报道,Anthropic确实在去年某个时间点完成了该模型的训练,但最终认为发布并不具备经济可行性。
与此同时,据报道,谷歌和OpenAI的旗舰模型项目在最近几个月也遭遇了一系列挫折。
这一现象或许揭示了当前人工智能扩展法则的局限性。过去,依靠大规模计算能力和庞大的数据集训练模型,通常可以显著提升性能。但随着模型迭代的深入,每一代模型带来的收益正在逐步缩小,这促使各家公司转向探索新的技术路径。
马斯克本人在接受弗里德曼采访时也谈到了这一点。
“你希望Grok 3能成为最先进的模型吗?”弗里德曼问。
“希望如此,”马斯克回答道。“这是我们的目标,但也可能无法实现。这是我们的愿景。”
至于Grok 3发布推迟的原因,还有其他可能性。例如,xAI的团队规模明显小于竞争对手。然而,这次延迟进一步印证了传统人工智能训练方法可能已经遇到了瓶颈。