OpenAI在美国被控非法使用图书数据训练AI系统

6月30日消息，据报道，两名作者在美国旧金山联邦法院起诉OpenAI，他们认为OpenAI滥用其作品，用作品训练ChatGPT。

来自美国马萨诸塞州的作家Paul Tremblay和Mona Awad说，ChatGPT未经许可从大量图书中复制提取数据，侵犯了作者的版权。

训练先进的AI系统需要用到大量数据材料，这种使用方式在法律上面临诸多挑战。比如，源代码所有者将矛头指向OpenAI和微软旗下GitHub，视觉艺术家起诉Stability AI、Midjourney和DeviantArt等AI工具。被告则认为，系统合理使用了有著作权的作品。

当用户向ChatGPT给出提示语时，AI会快速回应，虽然这种回应充满争议。ChatGPT仅仅开放两个月，1月时活跃用户便达到了1亿。

ChatGPT及其它生成式AI系统会用海量数据创造内容，很多数据来自互联网。作家Paul Tremblay和Mona Awad认为书本是关键数据材料，因为它们是高质量长文写作的典范。

诉状估计，OpenAI的训练数据包含了至少30万本图书，当中有许多是没有获得许可、非法获取的有版权图书。

两名原告称ChatGPT可以对他们写的书作出非常精准的总结，也就是说他们的书被吸纳进数据库。

中国联通：截至10月，“大联接”用户累计到达数11.18亿户