(资料图片)

一些视觉艺术家已经就使用他们的图像作为文本到图像生成器的训练数据提起诉讼。现在,两位知名小说家对OpenAI提起了他们自己的集体诉讼,指控ChatGPT和Bing Chat背后的公司侵犯了版权,因为该公司涉嫌使用他们的书作为训练数据。这似乎是第一个因使用文本(而不是图像或代码)作为训练数据而提起的诉讼。

在2006年的一个案件中,Blake vs Google,一位作家起诉搜索引擎缓存了他的作品并通过搜索提供缓存版本。然而,美国地区法院驳回了该诉讼,认为谷歌对数据的缓存是合理使用。Robert C. Jones法官写道,将文件保存在缓存中是一种转换性使用(用于确定合理使用的四个因素之一),而且它不会损害作品的潜在市场(另一个因素)。因此,仅仅是在其服务器上以缓存的形式存储受版权保护的数据并不能使谷歌承担责任。

然而,使用受版权保护的创意作品作为训练数据,与为搜索编制索引的内容有相当大的不同。人们可以说,如果法律硕士能够重复书中的关键细节,那就是损害了这些作品的市场,它不是真正的转化。另一方面,如果一个人写了一本书的情节摘要,这一般不会触犯版权法。最终,这些问题将因为像这样的诉讼案而得到决定。

OpenAI并不是唯一一家使用受版权保护的材料进行培训甚至输出的公司。谷歌SGE,该公司的新搜索体验,经常一字不差地剽窃整个句子和段落的版权。

推荐内容