国家超算天津中心发布天河天元大模型,是国产中文大语言模型

5月22日消息,近日,国家超算天津中心发布了立足国产天河超级算力和智能算力打造的“天河E级智能计算开放创新平台…

5月22日消息,近日,国家超算天津中心发布了立足国产天河超级算力和智能算力打造的“天河E级智能计算开放创新平台”和“天河天元大模型”。

 

据了解,“天河E级智能计算开放创新平台”将带来突破百亿亿次的跨模态的超级计算算力。

 

据介绍,国家超算天津中心搜集整理了网页数据、各种开源训练数据、中文小说数据、古文数据、百科数据、新闻数据以及专业领域的中医、医药、问诊、法律等多种数据集,训练数据集总 token 数达到 350B,训练打造了自己的中文语言大模型——天河天元大模型。

 

同时,天河天元大模型还在持续训练和完善中,并在此基础上启动深度训练面向医疗、工业、法律等领域的专业模型。

 

国家超算天津中心表示,未来大模型将在深度学习平台的支撑下成为产业智能化基座。