元象开源70亿参数通用大模型XVERSE-7B:免费可商用

9月28日消息,近日,元象推出 70 亿参数通用大模型 XVERSE-7B 底座与对话版,这是一款全开源、免费…

9月28日消息,近日,元象推出 70 亿参数通用大模型 XVERSE-7B 底座与对话版,这是一款全开源、免费可商用的模型,并在魔搭社区开源。

 

与 8 月开源的 XVERSE-13B 相比,7B 版本主打“小而美”:它支持在单张消费级显卡部署运行,推理量化后最低只需 6GB 显存,大幅降低开发门槛和推理成本;继续保持高性能,在多个权威基准测评中表现出色,部分能力还“跳级”赶超了13B、16B等更大尺寸模型。

图片源自:魔搭社区

其中,XVERSE-7B 是在 2.6 万亿 tokens 高质量多语言数据上从头训练的底座模型,具有强大的认知、规划、推理和记忆能力。其上下文窗口长度为 8192,支持中、英、俄、法等40多种语言。

 

其中,XVERSE-7B-Chat 是底座模型经 SFT 指令精调后的中英文对话模型,大幅提升了理解和生成内容的准确度,也更符合人类的认知偏好。