一长串科技公司都急于赋予自己使用人类数据来训练人工智能的权利
2024-10-21 20:15

一长串科技公司都急于赋予自己使用人类数据来训练人工智能的权利

  

  

  越来越多的公司正在悄悄更新隐私政策,以使用收集到的用户数据来训练人工智能模型。

  反式脚本工具Rev是最新一家改变其使用条款以用于人工智能的公司之一。

  其他这样做的公司包括最著名的科技公司,它们都急于加入人工智能热潮。

  广告广告

  任何需要互联网连接而不利于人工智能的活动的时代即将结束。

  在过去的几个月里,Twitter、X、微软、Instacart、meta和Zoom等公司纷纷更新了他们的服务条款和/或隐私政策,允许从人和客户那里收集信息和内容,作为数据来训练生成式人工智能模型。

  推文、网络搜索,甚至是杂货店购物,现在都是企业构建更多预测工具的机会,比如Bard和ChatGPT。ChatGPT属于OpenAI,得到了微软的大力支持。Zoom是唯一一家随后改变其更新后的使用政策,明确表示用户视频不会以这种方式使用的公司。此前,公众对将视频通话输入用于训练人工智能的大型语言模型的想法感到不满。

  这种反对并没有阻止更多的公司决定他们的平台应该成为人工智能的训练基地。Rev是最近改变服务条款的公司之一,这是一项很受欢迎的服务,用于记录对话和电话录音,还可以为视频添加封闭字幕。在最新版本的Rev服务条款中,该公司增加了一个名为“您的内容,包括服务输出”的部分。该部分现在指出,它不仅拥有广泛的许可,可以“公开或私下”使用上传到其平台上的所有内容,而且可以使用这些信息“改进服务,例如,培训和维护Rev的ASR语音到文本模型,以及Rev的其他人工智能模型。”

  广告广告

  根据互联网档案馆找到的一份副本,Rev's Terms似乎在6月的某个时候更新了,加入了这句话。直到9月份,该公司在一封电子邮件中宣布与OpenAI合作,成为“一个新的第三方子处理器”,用户才被提示查看更新后的条款。OpenAI目前正在为“即将到来的新功能”处理来自Rev的数据。Rev没有透露协议条款的具体变化。Rev的一位发言人表示,这些条款是在本月更新的,它的模式是“根据不同的语音数据收集而来的”。

  该发言人表示:“Rev现在永久使用数据,而不仅仅是在成为活跃客户时使用数据,并且这些数据被匿名用于训练Rev的专有人工智能。”这位发言人还声称,Rev的客户可以通过向support@rev.com发送电子邮件,“选择不为培训目的分享他们的数据”。没有专门的表格来满足这样的要求,但发言人说Rev保证这样的要求会得到尊重。

  在Instacart 8月份更新的条款和条件中,这家在线杂货购物平台增加了禁止任何人使用其内容或数据“创建、训练、测试或改进”任何人工智能工具,或支撑它们的大型语言和机器学习模型的条款。

  越来越多的公司一直在尽其所能地阻止他们的数据被抓取和保存,以扩展训练人工智能模型所需的数据集。然而,Instacart也添加了一些语言,让它可以对自己的客户数据进行这样的处理,称其许可证现在允许它“……否则,增强我们的机器学习算法,以实现运营、提供和改进服务的目的。”根据互联网档案馆看到的一个版本,这种语言与以前的术语不同。Instacart也没有在更新中详细说明这些变化。

  广告广告

  Instacart的一位发言人表示,该公司正准备在其平台上部署某种人工智能工具。

  该发言人表示:“我们正在将生成式人工智能体验整合到我们的产品中,以协助客户解决杂货购物问题,并帮助他们做出与食品相关的决定。”“我们更新后的条款明确,生成式人工智能现在是Instacart产品的一部分,但要受到滥用限制和我们条款的其他一般条款的限制,这些功能的标准与我们整个产品的标准保持一致。”

  即使公司在涉及人工智能数据使用的条款协议或隐私政策的更新中披露了他们所做的更改,它们也往往含糊不清。微软更新后的条款强调了将于9月30日生效的变化,并在人工智能服务方面增加了新的五点部分。唯一一份关于用户数据的声明称:“作为提供人工智能服务的一部分,微软将处理和存储你对服务的输入以及服务的输出,目的是监控和防止滥用或有害使用或输出服务。”其他四点涉及微软禁止将其人工智能服务用于其他人工智能工具。

  谷歌还提供了其词条的存档版本,该版本于7月更新。然而,在涉及人工智能时,该公司对如何处理用户数据也同样含糊其辞。它可以使用数据,因为它的许可证允许“操作和改进服务”,包括创建“新特性和功能”。在同样于7月更新的隐私政策中,谷歌一次提到了其巴德生成人工智能工具,称该公司将“利用公开信息帮助训练谷歌的人工智能模型,并构建谷歌翻译、巴德和云人工智能等产品和功能。”

  广告广告

  Twitter现在是埃隆·马斯克(Elon Musk)旗下的X公司,它是更直接地说明如何使用它为人工智能收集的用户数据的平台之一,因为马斯克几个月来一直在构建一个新的人工智能项目。该公司在本月更新的隐私政策中表示:“我们可能会使用我们收集的信息和公开信息来帮助训练我们的机器学习或人工智能模型,以实现本政策中概述的目的。”

  meta(原名Facebook)在6月份更新了其隐私政策。现在,该政策让用户知道,“你在我们的产品和服务上提供的活动和信息”被用来训练它的生成式人工智能模型,就像使用Llama 2或CM3leon等人工智能工具时写的或说的任何东西一样。所以,从状态更新到Instagram照片再到提示,现在都可以成为meta的人工智能训练数据集的一部分。该公司将防止其训练数据吸收个人信息的责任推给了用户,而用户可能不希望被用来教人工智能工具如何更好地回答提示,并表示人们应该“注意”自己在提示中所说的话。

  梅塔建议:“最好不要包括任何个人信息,比如你的家庭住址或电话号码。”8月底,它创建了一个简单的表单,用户可以“请求”选择不使用他们的数据来训练人工智能模型。该公司没有说是否会遵守这样的要求。

  你是一名技术员工还是其他有见解的人?联系Kali Hays: khays@insider.com,安全消息appSignal: 949-280-0267,或通过Twitter DM @hayskali。使用非工作设备进行接触。

本内容为作者翻译自英文材料或转自网络,不代表本站立场,未经允许不得转载
如对本稿件有异议或投诉,请联系本站
想要了解世界的人,都在 九九叭

相关推荐