华为云“盘古大模型3.0”正式发布:完全面向行业的大模型系列

7月7日消息,在今日举行的华为开发者大会 2023 上,华为云 CEO 张平安宣布,盘古大模型 3.0 正式发…

7月7日消息,在今日举行的华为开发者大会 2023 上,华为云 CEO 张平安宣布,盘古大模型 3.0 正式发布。

 

张平安表示,盘古大模型 3.0 是一个完全面向行业的大模型系列,包括 5+N+X 三层架构。

 

第一层 L0 层是盘古的 5 个基础大模型,包括自然语言大模型、视觉大模型、多模态大模型、预测大模型、科学计算大模型,它们提供满足行业场景的多种技能。

图片源自:华为云官方直播

盘古 3.0 为客户提供 100 亿参数、380 亿参数、710 亿参数和 1000 亿参数的系列化基础大模型,匹配客户不同场景、不同时延、不同响应速度的行业多样化需求。同时提供全新能力集,包括 NLP 大模型的知识问答、文案生成、代码生成,以及多模态大模型的图像生成、图像理解等能力,这些技能都可以供客户和伙伴企业直接调用。无论多大参数规模的大模型,盘古提供一致的能力集。

 

第二层 L1 层是 N 个行业大模型,既可以提供使用行业公开数据训练的行业通用大模型,包括政务,金融,制造,矿山,气象等;也可以基于行业客户的自有数据,在盘古的 L0 和 L1 上,为客户训练自己的专有大模型。

 

第三层 L2 层是为客户提供更多细化场景的模型,它更加专注于某个具体的应用场景或特定业务,为客户提供开箱即用的模型服务。

 

盘古大模型采用完全的分层解耦设计,可以快速适配、快速满足行业的多变需求。客户既可以为自己的大模型加载独立的数据集,也可以单独升级基础模型,也可以单独升级能力集。

图片源自:华为云官方直播

在 L0 和 L1 大模型的基础上,华为云还为客户提供了大模型行业开发套件,通过对客户自有数据的二次训练,客户就可以拥有自己的专属行业大模型。同时,根据客户不同的数据安全与合规诉求,盘古大模型还提供了公用云、大模型云专区、混合云多样化的部署形态。

 

据介绍,盘古可以一己之力做到网络搜索、请教专家、参考案例、查阅书籍等,让每个开发者都拥有一个自己的编程助手,甚至还可以实现一句对话代码生成、一个按键用例测试、一次点击自动注释、一条指令智能部署,极大地简化了开发的流程。

 

在气象领域,盘古气象大模型号称是首个精度超过传统数值预报方法的 AI 预测模型,同时预测速度也有大幅提升。原来预测一个台风未来 10 天的路径,需要在 3000 台服务器的高性能计算机集群上花费 5 小时进行仿真。现在基于预训练的盘古气象大模型,通过 AI 推理的方式,研究者只需单台服务器上单卡配置,10 秒内就可以获得更精确的预测结果。

 

张平安称,盘古大模型 3.0 围绕“行业重塑,技术扎根,开放同飞”三大方向,持续打造自己的核心竞争力。

本文来自网络,不代表随客网立场,转载请注明出处。