首页 资讯 正文

百度:国内首个大模型数据标注基地落地海口

8月29日消息,近日,百度官方公众号宣布,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动…

8月29日消息,近日,百度官方公众号宣布,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心,未来会为各行各业提供大模型数据服务。

文中表示,当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。对于以ChatGPT、文心一言为代表的生成式AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),可以让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。

为此,百度智能云升级了大模型数据服务能力,建设了国内首个专业大模型数据标注基地。百度智能云方面表示,目前已经在全国与各地政府合作,共建了十多个数据标注基地,累计为当地提供超过1.1万个稳定就业岗位,间接带动5万人就业。

据介绍,海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到100%。

海口基地在未来三到五年,新增就业有望突破5000人规模。

据悉,百度智能云将在9月全面升级大模型服务。8月,百度智能云宣布,千帆大模型平台升级,接入包括文心一言、Llama 2全系列、ChatGLM2-6B等在内的33个国内外最主流的大模型,成为国内拥有大模型最多的平台。