OpenAI近期推出了其全新的搜索引擎SearchGPT,然而,这一举措并未赢得所有顶尖新闻出版商的青睐。截至目前,包括《纽约时报》在内的至少14家知名新闻网站已经采取了行动,封锁了OpenAI的网络爬虫OAI-SearchBot,以防止其索引网站内容并在SearchGPT中向用户展示相关结果。据人工智能检测工具Originality.ai的追踪数据显示,在监测的1000个网站中,已有上述14家媒体采取了封锁措施,其中还包括《Wired》、《纽约客》、《时尚》、《Vanity Fair》以及《GQ》等权威媒体。
OpenAI遭遇信任危机
尽管OpenAI在推出SearchGPT时明确表示,OAI-SearchBot不会用于收集数据以训练如GPT-5等AI模型,并建议网站所有者允许该爬虫访问,以确保其网站能被搜索引擎收录,但这一声明似乎并未能消除出版商的疑虑。Originality.ai的CEO Jon Gillham对此表达了不解,他指出:“我不明白为什么有出版商会选择封锁它,因为这正是他们渴望获得的流量。”相比之下,谷歌的搜索引擎已经建立了更为庞大的数据库。
出版商的信任缺失与流量担忧
由于OpenAI过去多年曾未经授权地收集线上数据,出版商可能仍然对OAI-SearchBot是否真的不会被用作AI训练数据持怀疑态度。除了OAI-SearchBot外,OpenAI还拥有另一个名为GPTbot的网页爬虫,该爬虫被用于收集在线数据以训练AI模型。然而,由于出版商希望从搜索引擎获得流量,而不愿免费提供内容来训练可能与之竞争的AI模型,因此GPTbot已经被数百个网站封锁。
《纽约时报》成为主要反对力量
在反对的出版商中,《纽约时报》的态度尤为坚决。该报已经对OpenAI和微软提起诉讼,指控这些科技公司非法使用其作品来开发竞争产品。《纽约时报》发言人Charlie Stadtlander表示:“《纽约时报》不会授权使用我们的作品进行生成式搜索或AI训练,除非有明确的书面协议。”在诉状中,《纽约时报》指出,随着搜索引擎日益依赖AI技术,可能会从出版商那里夺取流量,这些技术工具的使用侵犯了《纽约时报》的权益,损害了其与读者的关系,并剥夺了订阅、授权、广告和联盟等收入来源。