百度:国内首个大模型数据标注基地落地海口

8月29日消息,近日,百度官方公众号宣布,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动…

8月29日消息,近日,百度官方公众号宣布,位于海口市秀英区的百度智能云(海口)人工智能基础数据产业基地正式启动运营,这是百度智能云与海口市政府合作共建的国内首个大模型数据标注中心,未来会为各行各业提供大模型数据服务。

 

据介绍,当前,大模型正处在产业落地前期,高质量的数据,是大模型实现产业化的关键要素。对于以 ChatGPT、文心一言为代表的生成式 AI,海量的数据训练、人工标注、指令微调、基于人类反馈的强化学习(RLHF),可以让大模型与人类价值观、思维方式不断对齐,使大模型更加可用。

 

为此,百度智能云升级了大模型数据服务能力,建设了国内首个专业大模型数据标注基地。百度智能云方面表示,目前已经在全国与各地政府合作,共建了十多个数据标注基地,累计为当地提供超过 1.1 万个稳定就业岗位,间接带动 5 万人就业。

图片源自:百度公众号

百度官方称,为保障数据标注质量,百度智能云还搭建了全流程数据服务人才梯队。海口数据标注基地现拥有数百名专职大模型数据标注师,标注师的本科率达到 100%。

 

“和传统的数据标注师要求不同,大模型标注师都需要本科以上学历,我觉得主要是因为大模型数据涉及的知识面很广,评判标准复杂,非常考验标注师的语言理解能力和逻辑推理能力。在入职的前两个月,公司会对我们进行集体培训和考核,通过考核后才能正式上岗。”百度智能云大模型数据标注师王洁玉说。

 

百度官方表示,海口基地在未来三到五年,新增就业有望突破 5000 人规模。此外,建成海口数据标注基地,只是海口市和百度合作的开端,后续还要共同打造数字经济产业集群,将海口市秀英区的数字经济规模、数字经济层级带来更高的提升。

本文来自网络,不代表随客网立场,转载请注明出处。