首页 资讯 正文

喜马拉雅音频大模型通过国家备案

9月20日消息,近日,在上海网信办发布的最新一批上海市生成式大模型备案通过名单中,喜马拉雅音频大模型与米哈游、…

9月20日消息,近日,在上海网信办发布的最新一批上海市生成式大模型备案通过名单中,喜马拉雅音频大模型与米哈游、阅文集团的筑梦岛等文本大模型共同通过了备案,成为全国首个通过网信办生成式人工智能服务的音频生成类大模型。

据悉,喜马拉雅音频大模型是全球首个第四代多情感演绎、超自然表达的音频生成大模型。

该模型是珠峰AI团队基于自研文本音频联合建模的LLM框架,在同一空间向量表征下实现音频与文本的联合建模训练。这种联合建模的方法充分赋予了音频生成任务以强大的语义信息,并充分利用它们之间的内在联系和互补信息,大幅度提高模型的性能和泛化能力,这也是第四代音频大模型超越上一代的核心技术突破。

值得一提的是,在2024年云栖大会上,喜马拉雅正式推出了其自主研发的“珠峰AI音频多模态大模型”。

本文来自网络,不代表随客网立场,转载请注明出处。
下一篇

已经没有了