4月23日消息,在”2024年商汤技术交流日“活动上,商汤科技正式宣布发布全新升级的“日日新5.0”大模型。
据悉,该模型采用MoE混合专家架构,基于超过10TB tokens训练,推理上下文窗口200K,知识、推理、数学、代码全面对标GPT-4 Turbo。
商汤科技董事长兼首席执行官徐立介绍称:“日日新5.0大模型体系综合能力全面对标GPT-4,技术领跑加速生成式AI向产业落地的全面跃迁,实现大模型按需所取。”
据了解,商汤“日日新SenseNova”大模型体系提供自然语言生产、文生图、感知模型标注以及模型研发等功能。