曾经内嵌AI数字人的终端设备遭遇很多诟病,比如答非所问、不能进行多种语言切换、不能对于相近意思展开联想等等,所以很长时间来,它徒有一副好看的“皮囊”。
于是在设备开发上索性选择扬长避短,重“端侧”而轻“云端”,即更加注重硬件的美观度,交互却成了次要的事情。
如今,大模型的出现,终于可以为AI数字人注入有趣而深邃的“灵魂”,开启了自然语言和机器交互的新局面。
AI终端体验全面刷新
随着以大模型为主的生成式AI技术通过智能涌现能力进行加持,AI终端的体验将变得更加人性化,体现在不仅对于自然语言的理解有显著提升,还能够通过对于语音语调的分析,敏感捕捉用户的意图甚至情感需求。
但是,“有形”的感受背后是技术上“无形”的突破。百融云创(百融云-W,6608.HK)相关人士表示,AI大模型和数字人原本是两条不同的技术路线,将二者进行融合的关键技术突破点是TTS技术(文本转语音)。
在百融云创看来,除了要保证质量的精确度,用户与AI数字人的交流还需要有流畅交互体验,要做到对话不卡顿、无限制,唯有这样的终端设备才能与用户建立黏性。
而为了达到这一目标,百融云创将内置TTS、ASR(自动语音识别)、软交换(FreeSWITCH)、NLP(自然语言处理)等技术的Voice GPT进行反复迭代,目前该对话大模型基本能够达到真人级交互体验,实现低于500毫秒级的响应速度。
据悉,Voice GPT是百融云创产业大模型簇BR-LLMs数智矩阵中的核心产品之一。此前该对话大模型在银行、消金、保险、电商等垂直领域得到广泛应用,每日能进行超过亿级规模的自动交互,频次领先业内,并且对于多种语言和方言都能自如识别和切换。此外,它还具有强大的自学习能力,可以根据用户的反馈和行为不断优化其性能和准确度。
可以说,插上了大模型翅膀的AI数字人有了指数级的进步。分析预计,在百行千业降本增效的强需求之下,后续AI数字人的市场规模将持续增长。
根据iiMedia Research(艾媒咨询)报告,2022年中国虚拟人核心市场规模为120.8亿元,同比增长94.2%,该机构预期及至2025年,这一市场规模将增至480.6亿元。
轻量化、场景化部署或成趋势
伴随着技术的长足进步,AI数字产品和服务作为天然链接软硬件的入口级产品,正以更快的速度融入B端,其应用场景更加多元化,在金融、物流、能源和建筑等垂直行业加速落地,扮演主播、代言人、客服和智能助理等角色。
并且在模型压缩、微调、优化等技术的赋能之下,内嵌AI大模型的终端发展趋势将更趋轻量化、专属场景化。
例如,百融云创以大模型BR-LLM为基座开发的应用平台Cybertron,通过与企业内部的数字化系统或者领域知识库相对接,能够做到与目标场景紧密融合,产生与企业业务相配合地专属化服务。
Cybertron平台通过AI员工、客服数字人等各类Agent应用的形式能够轻松集成到企业的IT架构之中,从而让大模型变成企业内部的私有智能工具,企业不需要了解数字人的后台操作即可通过快速更换或升级系统而完成个性化定制。
“由于模型工具调用能力的进步,将Cybertron平台应用在企业级数字人服务方面,可以在一定程度上缩短企业的产业链,提升机构内部的运转效率。”百融云创相关人士表示,集成了决策式AI和生成式AI双重技术的Cybertron平台能够更加高效地处理和分析客户意图、市场趋势等,加强对复杂场景的理解和预测能力。
以AI数字人代理运营模式为例,企业只需要将基本的品牌信息、产品特色等输入给数字人,即可由后者代理品牌营销工作,数字人利用自然语言处理和机器学习技术精准分析消费者行为模式和隐含需求,提供个性化建议。同时,数字人还可以在实时的数据分析基础上,创建并发布品牌运营策划,便利商业机构提高营销效率。
也许在不久的将来,当我们身处异国的机场、商场、酒店等陌生场所,遇到日常难题需要咨询时,人类不再是我们的第一求助对象,没有语言障碍的AI数字人才是我们更好的选择,这便是科技向人类社会投下的文明之光。