4月14日,腾讯云宣布发布面向大模型训练的新一代HCC(High-Performance Computing Cluster)高性能计算集群。
该计算集群的整体性能比过去提升了3倍,堪称国内目前性能最强的大模型计算集群。
据悉,该计算集群搭载NVIDIA H800 Tensor Core GPU,能够提供高性能、高带宽、低延迟的算力支撑。
而针对大模型训练,计算集群有着训练框架AngelPTM,该框架对内支持了腾讯混元大模型的训练,并在去年10的的万亿参数大模型训练中,成功将时间缩短了80%。
此外,腾讯用于AI推理的自研芯片紫霄已经完成量产,它采用自研存算架构与加速模块,能够提供高达3倍的计算加速性能,以及超过45%的整体成本节省。
而腾讯云提供的大模型能力与工具箱,也能够帮助企业根据具体需求和场景精调训练,从而进一步提升效率,实现AI应用的快速部署。
根据腾讯云官方的数据,新的HCC计算集群能够将大模型的训练时间从上一代的11天压缩至4天,有效节省了大量时间。