
艺术家和图像所有者现在可以要求OpenAI从DALL-E训练数据中删除他们的图像。
然而,这个过程给创作者带来了巨大的负担,他们要提取自己的作品。
一位艺术家称这个艰难的退出过程“令人愤怒”。
NEW LOOK注册获取今日市场、科技和商业领域最重要新闻的内幕消息——每日提供。阅读预览广告
OpenAI首次允许艺术家从用于DALL-E 3的训练数据中删除他们的作品,DALL-E 3是其最新版本的人工智能图像生成器。选择退出的过程是如此繁琐,几乎就像它被设计成不工作一样。
OpenAI最近发布了一个新表格,图像所有者和创作者可以使用它来请求从DALL-E训练数据中删除拥有或受版权保护的图像。
人工智能模型需要高质量,人类生成的训练数据才能表现良好。这是一场积累信息的竞赛。但这些内容的原创者现在已经意识到,他们作品中的价值和智慧正在被其他人的利益所吸收和处理。这给大型科技公司带来了压力,它们必须为创作者提供途径,要么主动决定参与,要么从这个宏大的人工智能实验中提取他们的数据。
为了让OpenAI的新流程考虑选择退出请求,艺术家,所有者或权利持有人必须提交他们想要从DALL-E的训练数据集中删除的每个图像的单独副本,以及描述。
广告广告
对于大多数艺术家来说,这可能意味着需要一个接一个地提交数百或数千件作品。例如,乔治亚·奥基夫博物馆(Georgia O'Keeffe Museum)作为该艺术家作品的版权持有人,需要为奥基夫的2000多件艺术品中的每一件提交单独的请求,以便考虑将它们从DALL-E的数据集中删除。
OpenAI充满了非常聪明的技术专家。该公司本可以推出一个流程,通过该流程,艺术家或所有者可以提出一个请求,将他们的所有作品从培训数据中删除。但该公司并没有这么做。为什么?可能是因为它需要尽可能多的数据来构建它的人工智能模型。
托比·巴特利特(Toby Bartlett)是一家同名咨询公司的艺术家,他在Threads上写道,OpenAI的DALL-E选择退出过程“令人愤怒”。
他补充说:“现在,艺术家们将不得不用超大比例的水印几乎毁了他们的作品,希望他们的作品不会被使用……如果这能奏效的话!”
广告广告
IT顾问Greg Madhere也在Threads上写道,他最近迷上了摄影,想在网上分享他的照片。考虑到在线内容被收集并用于训练DALL-E和ChatGPT等人工智能模型的程度,他现在有些犹豫。
他问道:“哪里还能安全地在网上发帖呢?”
即使OpenAI同意艺术家或所有者的退出请求,它也只适用于DALL-E的“未来”训练数据。刚刚发布的版本3已经使用了用户要求从其训练数据中删除的艺术作品。或者,正如OpenAI所说,它的模型将“从他们的训练数据中学习”,并能够“保留他们学到的概念”。
换句话说:现在是选择退出的过程,但为时已晚,因为我们已经从你的工作中吸取了大部分价值。
广告广告
围绕人工智能训练使用版权作品的几个问题,目前是美国版权局(US Copyright Office)规则制定过程的一部分,包括选择退出。
OpenAI的一位发言人说:“我们从艺术家和创意内容所有者那里听说,他们并不总是希望自己的内容被用于培训,所以我们为他们提供了选择不让他们的图像参与未来模型培训的能力。”
对于那些有大量工作或“来自特定url的大量图像”的公司,该公司建议通过部署robots.txt来阻止OpenAI的网络爬虫GPTBot。OpenAI上个月表示,它将尊重网站几十年来发出信号的方法,即它们不希望自己的数据被网络爬虫抓取。
问题是,对于艺术家或所有者部署robots.txt,他们不仅需要知道每个托管他们图像的网站,他们还需要访问这些网站的代码库,以添加一个可以阻止GPTBot的robots.txt文件。
广告广告
如果没有这样的访问权限,艺术家或所有者可能根本不可能从DALL-E训练数据中删除他们的作品。
你是一名技术员工还是其他有见解的人?联系Kali Hays: khays@insider.com,在安全消息应用程序Signal上拨打99-280-0267,或通过Twitter DM @hayskali。使用非工作设备进行接触。











