首页 资讯 正文

王小川:百川智能大模型理念是‘理想上慢一步,落地上快三步’

10月31日消息,今日,2023云栖大会现场,百川智能创始人、首席执行官王小川表示:“百川智能做大模型的理念是…

10月31日消息,今日,2023云栖大会现场,百川智能创始人、首席执行官王小川表示:“百川智能做大模型的理念是‘理想上慢一步,落地上快三步’。”

王小川指出,百川在4月份正式上岗之后,其实两个月的时间就完成了第一款70亿参数大模型的发布,比预期时间节省了三倍。但之后,他去了美国一趟,回来后便决定把公司做大模型理念,定为“理想上慢一步,落地上快三步。”

王小川表示,确实得承认跟美国存在差距。他指出,到今年年底之前国内会有几家公司能达到GPT3.5的水平,到明年也有信心能够达到GPT4.0的水平,但是达到之后,可能很难去超越他们。

日前,百川智能发布Baichuan2-192K大模型,其上下文窗口长度达192K,是目前全球最长的上下文窗口,能够处理约35万个汉字,是目前支持长上下文窗口最优秀大模型Claude2(支持100K上下文窗口,实测约8万字)的 4.4倍,更是 GPT-4(支持32K上下文窗口,实测约 2.5万字)的14倍。