
OpenAI上周发布了一款名为SearchGPT的新搜索引擎。
几家顶级出版商网站已经屏蔽了OpenAI相关的网络爬虫OAI-SearchBot。
OpenAI表示,这个新机器人不会为人工智能模型训练收集数据。一些出版商可能不相信这一点。
感谢您的报名!转到时事通讯偏好
在OpenAI推出SearchGPT大约一周后,一些顶级新闻出版商明确表示,他们不想与这家初创公司的新搜索引擎有任何关系。
《纽约时报》和至少13个其他新闻网站已经屏蔽了OAI-SearchBot。这是一个索引信息的网络爬虫,因此OpenAI可以检索并向SearchGPT用户显示相关结果。
本文仅对Business Insider订阅者开放。成为业内人士,现在就开始阅读。有账户吗?.
创意。ai追踪这些东西,它发现前1000个网站发布者中有14个屏蔽了OAI-SearchBot。其他上榜的出版物包括《连线》、《纽约客》、《Vogue》、《名利场》和《GQ》。
original .ai首席执行官乔恩?吉勒姆(Jon Gillham)表示,这有点让人挠头。
“我不知道为什么出版商会阻止它,”他告诉《商业内幕》。“这是出版商想要和需要的流量。”
OpenAI上周发布SearchGPT时强调,OAI-SearchBot不会像GPT-5那样通过抓取网络来收集数据来训练其人工智能模型。它还建议网站所有者允许新的机器人“确保你的网站出现在搜索结果中”。
有关的故事
如果没有爬虫访问每个网站,OpenAI的SearchGPT服务可能会比谷歌的搜索引擎更不完整。BI问Gillham是否有大型新闻出版商屏蔽了谷歌的搜索机器人,他说他不知道有。
OpenAI还有另一个网络爬虫,名为GPTbot,它可以为人工智能模型训练收集在线数据。数百家网站已经屏蔽了这一功能。这更有意义:你想从搜索引擎获得流量,但你不想把你的内容交给可能与你竞争的人工智能模型。
然而,OpenAI在未经许可的情况下花费了数年时间收集在线数据。也许出版商只是不相信OpenAI,因为它说它的新搜索机器人不会秘密地吸收它们的内容作为人工智能训练数据?
“我想是的,”吉勒姆说。
另一种理论是:如今的搜索结果并不总是把用户送到那些努力创造原创内容的网站。新的人工智能搜索引擎的部分目标是通过显示摘要来留住用户。如果出版商不再看到来自搜索引擎的巨大流量,为什么还要允许他们的网络爬虫呢?
Gillham还指出,OpenAI今年一直忙于与出版商达成协议,以使用他们的内容档案。(《商业内幕》的母公司阿克塞尔?斯普林格签署了其中一份合约。)
Gillham补充道:“这似乎是OpenAI有意采取的一系列步骤,首先与出版商签署所有这些合作协议,然后宣布SearchGPT。”
出版商中持反对意见的主要是《纽约时报》。它已经起诉了OpenAI和微软,指控这两家科技公司非法使用它的工作成果来制造竞争产品。
“在没有明确的书面协议的情况下,时报不会授权将我们的作品用于生成搜索或人工智能培训目的,无论我们是否阻止或限制任何特定的机器人抓取我们的内容,”《纽约时报》发言人查理·施塔特兰德(Charlie Stadtlander)在一份声明中说。
在对OpenAI和微软的投诉中,《纽约时报》提到了搜索引擎越来越多地由人工智能驱动,并可能从出版商那里抢走流量的问题。
“被告还使用微软的必应(Bing)搜索索引(该索引复制时报的在线内容并对其进行分类)来生成回复,其中包含时报文章的逐字摘录和详细摘要,这些文章比传统搜索引擎返回的文章要长得多,也详细得多,”出版商在诉状中写道。“被告的工具在未经时报许可或授权的情况下提供时报的内容,破坏了时报与读者的关系,剥夺了时报的订阅、许可、广告和附属收入。”
OpenAI没有回应置评请求。
你在OpenAI工作吗?你使用他们的模型吗?你有想要分享的小贴士、长篇大论或观点吗?请通过电话或信号(+1-714-651-1367)或电子邮件(drafieyan@insider.com)与Darius Rafieyan联系











