1月29日,据百川智能公众号消息,百川智能发布超千亿参数的大语言模型Baichuan 3。
在多个权威通用能力评测如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展现了出色的能力,尤其在中文任务上更是超越了GPT-4。
在数学和代码专项评测如MATH、HumanEval和MBPP中同样表现出色,证明了Baichuan 3在自然语言处理和代码生成领域的强大实力。
此外,在对逻辑推理能力及专业性要求极高的MCMLE、MedExam、CMExam等权威医疗评测上,Baichuan 3的中文效果同样超过了GPT-4,是目前中文医疗任务表现最佳的大模型。