vivo蓝心大模型7B正式开源:70亿参数级

11月9日消息,在近日的 2023 vivo 开发者大会上,vivo 宣布率先开源 70 亿参数级的蓝心大模型…

11月9日消息,在近日的 2023 vivo 开发者大会上,vivo 宣布率先开源 70 亿参数级的蓝心大模型 7B 以及对应的微调框架。

 

按照承诺,vivo 现已在 Hugging Face 上正式开源了 BlueLM-7B。

 

BlueLM-7B 开源大模型包括 7B 基础模型和 7B 对话模型,同时 vivo 开源了支持 32K 的长文本基础模型和对话模型。

 

据介绍,BlueLM 采用高质量语料库进行训练,规模达到了 2.6 万亿 的 token 数,该语料库包含中文、英文以及少量日韩数据。其中 BlueLM-7B-Chat 在 C-Eval 和 CMMLU 上均取得领先结果。

 

BlueLM-7B-Base-32K 和 BlueLM-7B-Chat-32K 均支持 32K 长文本,在保持基础能力相当情况下,能够支持更长上下文理解。