字节跳动发布豆包音乐模型和同声传译模型

9月24日消息，字节跳动旗下火山引擎在深圳举办AI创新巡展，一举发布了豆包视频生成-PixelDance、豆包视频生成-Seaweed两款大模型，面向企业市场开启邀测。

火山引擎总裁谭待表示，“视频生成有很多难关亟待突破。豆包两款模型会持续演进，在解决关键问题上探索更多可能性，加速拓展AI视频的创作空间和应用落地。”

此外，豆包大模型不仅新增视频生成模型，还发布了豆包音乐模型和同声传译模型，已全面覆盖语言、语音、图像、视频等全模态，全方位满足不同行业和领域的业务场景需求。

在产品能力日益完善的同时，豆包大模型的使用量也在极速增长。据火山引擎披露，截至9月，豆包语言模型的日均tokens使用量超过1.3万亿，相比5月首次发布时猛增十倍，多模态数据处理量也分别达到每天5000万张图片和85万小时语音。

此前，豆包大模型公布低于行业99%的定价，引领国内大模型开启降价潮。谭待认为，大模型价格已不再是阻碍创新的门槛，随着企业大规模应用，大模型支持更大的并发流量正在成为行业发展的关键因素。

据谭待介绍，业内多家大模型目前最高仅支持300K甚至100K的TPM（每分钟token数），难以承载企业生产环境流量。例如某科研机构的文献翻译场景，TPM峰值为360K，某汽车智能座舱的TPM峰值为420K，某AI教育公司的TPM峰值更是达到630K。为此，豆包大模型默认支持800K的初始TPM，远超行业平均水平，客户还可根据需求灵活扩容。

“在我们努力下，大模型的应用成本已经得到很好解决。大模型要从卷价格走向卷性能，卷更好的模型能力和服务。”谭待表示。

给这篇文章的作者打赏

OpenAI官方X账号被盗用，发布虚假加密货币信息

消息称铠侠取消在10月进行IPO的计划

相关文章

诺基亚与英伟达和T-Mobile合作，共建业内首个AI-RAN创新中心

华为智慧屏领跑高端市场，2万元以上档位的市场份额达第一

消息称铠侠取消在10月进行IPO的计划

OpenAI官方X账号被盗用，发布虚假加密货币信息

华为何刚：今年上半年腕上可穿戴全球出货量第一