创作变成训练AI 资料能提告?从纽约时报提告OpenAI 看生成式内容对原创者的挑战

推荐使用ChatGPT4.0中文网,国内可直接访问:www.chatgp4.com

随着OpenAI在2023年开启“生成式AI元年”,科技巨头如Google和微软纷纷跟进,积极投身于AI应用的开发,期望通过结合各自的服务,进一步拓展产业影响力。然而,在全球对AI带来的便捷性趋之若鹜之际,近期OpenAI与微软却遭到了《纽约时报》的指控,被指未经授权擅自使用该报内容训练AI模型。

生成式AI之所以具备强大的功能,离不开其背后庞大的数据库训练。那么,对于身处台湾的创作者而言,如果自己的作品也在未经告知的情况下被生成式AI企业用作训练资料,又该如何应对呢?

《纽约时报》去年12月底公开宣布,已对OpenAI和微软提起诉讼,原因是这两家科技公司在未付费、未取得授权的情况下,大量使用了《纽约时报》的报道内容来训练AI。通过对比OpenAI生成的内容与《纽约时报》的原创内容,《纽约时报》发现两者存在高度重叠,认为这不仅压缩了其付费订阅服务的空间,而且AI参照其内容给出的建议还出现了错误,严重损害了《纽约时报》的品牌声誉。尽管未公开具体索赔金额,但《纽约时报》已向OpenAI和微软提出了总计“数十亿美元价值”的法定及实际损失索赔,并要求删除包含《纽约时报》内容的AI模型数据。

OpenAI发言人Lindsey Held通过电子邮件回应称,他们尊重创作者和内容所有者的权益,并积极与他们合作,以确保在新的AI模式下获得收益。同时表示,与《纽约时报》的对话正在朝着建设性的方向前进,对于事态的发展感到惊讶和失望。而微软则未对《纽约时报》的指控作出回应。

事实上,早在去年4月,《纽约时报》就开始与OpenAI商讨资源交换方式,并试图达成资料引用的合作,但最终未能达成协议。如今,包括路透社、BBC、CNN等在内的多家媒体,已经设立了爬虫程序,以防止OpenAI抓取其网站上的新闻内容。

那么,当创作者的内容和作品被当作训练AI模型的资料时,究竟能否成功维权呢?从近年来国外创作者向OpenAI和微软提起的类似诉讼来看,胜诉的可能性并不高。以美国著作权局对AI内容生成与再制的解释为例,其认为在“创新性”基准上需要增加“新的东西”来改变原有的形态,且没有改变原著作的用途。这与动画、动漫圈中常提到的“二创”概念有些相似。OpenAI和微软在面对生成式AI创作的作品时,指出使用的是受版权保护的作品作为AI的资料是在“合理范围”内,并满足了创新性的条件,因此认定引用内容或作品再制是符合使用原则的。

那么,台湾法规对于训练生成式AI所使用的资料规范又持何种态度呢?根据台湾资讯智慧财产权协会理事长陈家骏的观点,生成式AI工具服务商或使用者是否构成侵权的难点在于,双方都参与了“AI内容产制”的过程。服务商在主观上没有明确的侵权行为认知,只能作为间接侵权的角色。而使用者仅通过输入指令生成创作,并非侵害重制或衍生著作构成要件的主体。因此,在主观上很难认定服务商和使用者之间存在有意侵害原创作者著作权的行为。然而,由于双方都参与了其中,且服务商提供的服务具有控制、引导使用者的能力,并在生成创作和作品中获得了实质的经济收益,这可能会构成智财法中的“分工侵权”。不过,最终是否构成侵权还需等待法院的进一步裁决。

滚动至顶部