6月25日消息,近日,国内AI大牛清华唐杰及其团队发布了最新成果:WebGLM。
据悉,WebGLM,是一个百亿参数的通用语言模型(GLM),提供一种高效且低成本的网络增强问答系统。它通过将网络搜索和召回功能,集成到预训练的语言模型中,以进行实际应用的部署。
具体应用上,它可以在网络搜索答案,更好回答人类问题。
据介绍,在性能对比测试中,WebGLM的水平已经高于OpenAI 135亿参数的WebGPT,在人类评估中,甚至与1750亿参数的模型不相上下。
此外,唐杰团队此次还提出了一个网络增强问答系统的评估标准,评估对象既包括参考文献,也包括最终回答。前者衡量相关性、信息密度、真实性(无事实错误)、毒性(不含暴力色情等信息)和社会偏见程度这5个维度;后者则衡量流畅度、正确性、引用准确性、客观性和冗余程度。