7月18日消息,苹果公司通过科技媒体9to5Mac发布声明,就其OpenELM开源AI模型使用争议YouTube资源进行训练事件,表示OpenELM并没有用于其它任何AI或机器学习项目(包括Apple Intelligence在内)。
非营利性新闻工作室ProofNews发布调查报告,表示苹果公司在训练AI模型OpenELM 时,使用了名为YouTube Subtitles的数据集,大小为5.7GB(4.89 亿个单词)。
该数据集由EleutherAI创建,最早发布于2020年,涉及超过48000个频道的173536 个YouTube视频字幕内容,其中还包含12000多个平台已删除视频的字幕内容。
苹果在最新声明中表示,OpenELM模型的目的是为研究社区作贡献,并推动开源大型语言模型发展。
苹果公司的研究人员曾将OpenELM描述为“最先进的开放式语言模型”。
苹果强调OpenELM仅用于研究目的,没有用于任何商业Apple Intelligence功能,该模型以开源方式发布,开发者可以自由获取。
苹果还表示现阶段没有计划构建新版OpenELM模型。