6月1日消息,阿里云宣布基于通义大模型的音视频内容AI新品“通义听悟”正式上线,成为国内首个开放公测的大模型应用产品。据介绍,通义听悟接入了通义千问大模型的理解与摘要能力,可帮助用户随时随地高效完成对音视频内容的转写、检索、摘要和整理,比如用大模型自动做笔记、整理访谈、提取PPT等。公测期间,用户可领取100小时以上免费转写时长。
“换一种方式,让音视频可以被轻松阅读、整理和分享。”阿里云CTO周靖人介绍,听悟是一款工作学习AI助手,它瞄准具有高知识附加值的音视频内容场景,比如开会、上课、访谈、培训、面试、直播、看视频、听播客等,能通过大模型等最新AI技术快速提炼和沉淀知识。
据周靖人介绍,听悟融合了十多项AI功能,可以全面提升知识从音视频向图文形态转化的效率。除了“听力好”,能高准确度生成会议记录、区分不同发言人外,还可以一秒给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理关注重点和待办事项。未来,一键提取PPT、针对多个音视频内容向AI提问、概括特定段落等功能也将上线。
据了解,听悟除个人版本外,还有企业应用。此前,听悟企业版已在阿里集团内部被广泛使用