纽约时报起诉OpenAI和微软侵犯版权

《纽约时报》起诉 OpenAI 和微软，指控其使用《时报》的版权材料训练 AI 模型

纽约时报起诉OpenAI和Microsoft侵犯版权

以屡获奖的新闻报道而闻名的备受推崇的报纸《纽约时报》（The New York Times，简称NYT）已对OpenAI及其投资方微软采取法律行动。时报指控这些公司未经同意使用数百万篇NYT文章来训练生成式AI模型，包括OpenAI广受欢迎的ChatGPT和微软的Copilot，违反了版权法。

在提起诉讼之中，Times要求销毁包含未经授权材料的AI模型和训练数据。此外，Times要求对他们有价值的内容的非法使用进行“数十亿美元的法定赔偿和实际损失赔偿”的追偿。

Times强调了独立新闻报道的重要性，并警告说如果新闻机构无法保护他们的作品，将对社会造成重大损失。诉状断言OpenAI和Microsoft的行为破坏了新闻报道，并妨碍了有深度见解的新闻的出版。

OpenAI发言人对诉讼作出回应时表示，他们尊重内容创作者的权利，并与《纽约时报》进行了富有成效的对话。OpenAI希望能找到一种互利的解决方案，就像他们与其他出版商一样。

生成式AI模型通过分析示例并创建新的内容，包括文章、代码、电子邮件和文章来学习。像OpenAI这样的公司从网络上收集大量数据，其中一部分可能受到版权限制。虽然供应商辩称公平使用原则保护他们的网络抓取实践，但包括新闻机构在内的版权持有者并不同意。

供应商和版权持有者之间的这种分歧导致了许多法律纠纷。例如，女演员萨拉·西尔弗曼和一些知名小说家指控OpenAI的母公司Meta未经许可使用了他们的作品。此外，程序员们还对微软、OpenAI和GitHub提起诉讼，声称Copilot是使用他们受保护的代码开发的。

《纽约时报》的诉讼代表了生成式AI供应商和版权持有者之间持续进行的法律纠纷中的一个值得关注的案例。该诉讼揭示了AI模型生成虚假或捏造信息对Times品牌声誉可能造成的潜在危害。诉讼还对这些AI模型通过提供独家信息而无需订阅竞争新闻出版商提出了担忧。这种做法削弱了收入机会，因为AI生成的内容缺乏Times用于产生佣金的引用、货币化和关联链接。

生成式AI模型有时会照搬训练数据，从而实质上以逐字逐句的方式复制内容。在一个案例中，OpenAI无意中使ChatGPT的用户绕过付费墙壁并获取受限制的新闻内容。

《纽约时报》指责OpenAI和Microsoft在未提供任何补偿的情况下利用了他们对新闻报道的投资。诉状提出这些公司正在建立新闻出版商的竞争者，从而夺走了观众，并削弱了《纽约时报》的业务。

这场纷争反映出出版商与谷歌等公司面临的更广泛问题。最近，出版商对谷歌提起了诉讼，声称通过垄断行为，其如Bard聊天机器人和Search Generative Experience等AI实验转移了流量和广告收入，减少了对出版商的点击量。《大西洋月刊》进行的一项研究发现，基于AI的搜索引擎可能会回答用户的查询而无需点击进入出版商的网站，潜在地使流量减少了多达40%。

尽管出版商有合理的担忧，但这些诉讼的结果仍不确定。知识产权专家Heather Meeker将引导生成式AI模型复制内容的行为比作使用文字处理器进行剪切和粘贴。Meeker认为，大多数此类诉讼可能会失败，因为如果用户有意使AI模型复制受保护的内容，那么这最终是用户的责任。

一些新闻机构选择通过达成授权协议与生成式AI供应商合作，而不是进行法律斗争。例如，美联社和Axel Springer已经与OpenAI进行了谈判达成协议。

《纽约时报》曾在4月份试图与微软和OpenAI达成授权协议。不幸的是，谈判没有取得预期的结果，导致了当前的诉讼。

值得注意的是，这场诉讼起到了一个警示作用，强调了在训练AI模型时使用受版权保护内容需要明确的准则和规定。在平衡生成式AI的好处与保护知识产权方面存在重大挑战，需要供应商、创作者和立法者的合作。

问答内容

问：为什么纽约时报特别起诉OpenAI和Microsoft？ 答：纽约时报指控OpenAI和Microsoft未经许可使用数百万篇纽约时报文章来训练他们的生成式AI模型，对纽约时报的品牌和收入可能造成潜在伤害。

问题：生成式AI模型是什么，它们是如何学习的？回答：生成式AI模型通过分析示例和创建新内容来进行学习。这些模型，如OpenAI的ChatGPT和微软的Copilot，可以通过模拟来自多样化训练数据的模式生成文章、代码、电子邮件和文章。

问题：生成式AI模型如何复制训练数据，为什么会引起关注？回答：生成式AI模型有时会产生复制或非常类似于其训练数据的内容，逐字逐句地复制短语或句子。当这种复制导致虚假或不准确信息的传播时，这种复制可能会带来问题。

问题：这起诉讼对新闻订阅业务可能产生什么影响？回答：如果像ChatGPT和Copilot这样的AI模型生成了通常只能通过订阅才能获得的信息，它可能会削弱新闻订阅的价值主张。客户可能会依赖AI生成的内容，潜在地导致订阅和新闻出版商的收入减少。

问题：其他出版商是如何应对未经许可使用AI模型的情况？回答：一些出版商，如美联社和Axel Springer，选择与生成式AI供应商合作，签订许可协议。这种做法可以让出版商保护自己的内容，同时从AI技术中受益。

总而言之，纽约时报对OpenAI和微软提起的诉讼引起了人们对在训练生成式AI模型时使用受版权保护材料的复杂问题的关注。这起案件的结果将对内容创作者和AI供应商产生影响，突显了在这个不断发展的领域中需要更清晰的指导方针和合作的重要性。随着法律战斗的继续，找到促进创新和尊重知识产权之间的平衡至关重要。