首页 资讯 正文

商汤科技发布“日日新5o” 实时多模态流式交互对标GPT-4o

7月5日消息,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴商汤科技今…

7月5日消息,2024世界人工智能大会暨人工智能全球治理高级别会议(WAIC 2024)战略合作伙伴商汤科技今天发布了国内首个所见即所得模型“日日新5o”,交互体验对标GPT-4o,实现全新AI交互模式。

通过整合跨模态信息,基于声音、文本、图像和视频等多种形式,国内首个所见即所得模型“日日新5o”带来一种全新的AI交互模式,即实时的流式多模态交互。

现场可以看到,工作人员和“日日新5o”打招呼,它就自动识别出工作人员脖子佩戴的胸卡带子上的字眼,判断出现场就是世界人工智能大会会场,并表示在这个地方可以“好好学习”。

“日日新5o”还能准确描述玩具小狗的外貌、表情以及重要穿戴,包括翻开一本书的任何一页,“日日新5o”都能自动介绍,不是简单的OCR识别文字,而是识别图文给出好理解的总结。

能听会看更会找话题,就如同真人聊天一般的交流对话,这种交互模式特别适用于实时对话和语音识别等应用,其多任务适应性强,能够在同一模型中自然处理多种任务,且根据不同上下文自适应调整行为和输出,能够实现对标GPT-4o的交互体验正是源于“日日新5.5”基础模型能力的全面提升。

今年4月发布的“日日新5.0”是国内首个对标GPT-4 Turbo的国产大模型,短短两个多月时间,全新“日日新5.5”体系迎来多项升级,综合性能较“日日新5.0”平均提升30%,在数学推理、英文能力和指令跟随等能力明显增强,交互效果和多项核心指标实现对标GPT-4o。

据悉,商汤于近期推出了“大模型0元Go”计划。凡是“日日新”的新注册用户,都可获得涉及调用、迁徙、训练等多项免费服务大礼包。同时,商汤还将免费赠送5000万Tokens包,并且派出专属搬家顾问,帮助OpenAI用户实现零服务成本迁移。