AI侵权有免死金牌？Meta盗用书籍训练AI裁定无罪-智城物语-经济通中国站

您现在所在的位置：首页 > 香港脉搏 > 理财／管理 > 智城物语 > AI侵权有免死金牌？Meta盗用书籍训练AI裁定无罪

理财／管理智城物语

打印本文章

字体:小中大

AI侵权有免死金牌？Meta盗用书籍训练AI裁定无罪

作者：方展策

评论：1

点击率：2535

发表时间: 2025-07-04 18:00:03

作者介绍

少年时，曾研习 Geographic Information System，可惜学无所成，侥幸毕业。成年后，误打误撞进入传媒圈子，先后在印刷、电子、网络媒体打滚，略有小成。中年后，修毕信息科技硕士，眼界渐扩，决意投身初创企业，窥探不同科技领域。近年，积极钻研数据分析与数码策略，又涉足 Location Intelligence 开发项目；有时还会抽空执教鞭，既可向他人分享所学，亦可鞭策自己保持终身学习。

生成式AI迅速崛起，正在改变我们创作与使用内容的方式，但随之而来的版权争议也日益加剧。2025年6月底，美国联邦法院就Anthropic与Meta两宗侵权官司作出判定：在特定条件下，将书籍用作AI训练资料可构成“合理使用”。此举让科技界一致叫好，普遍认为这是AI发展的一大胜利。这两宗判决究竟意味着什么？它们是否向AI公司发出侵权免死金牌，抑或仅仅是个别案件的特殊裁定？

Anthropic侵权获判合理使用

2025年6月23日，美国加州北区联邦法院裁定，AI初创公司Anthropic在未经授权的情况下，使用书籍为其大型语言模型进行数据训练，属于“合理使用”（Fair Use）范畴，成为美国首宗针对生成式AI情境下合理使用的案例。

美国作家Andrea Bartz、Charles Graeber、Kirk Wallace Johnson于2024年8月对Anthropic提出诉讼，指控该公司以购买和非法下载方式，盗用数百万本受版权保护的书籍，训练其AI模型。他们进一步主张，Anthropic旗下AI模型Claude能够在短时间内为用户产制大量AI生成作品，远远快于人类作家写书所需时间，威胁他们的生计。

Anthropic向法院辩解，Claude复制书籍的目是研读个中内容，从中萃取非受版权保护的知识，继而运用所学来开发革命性技术。该公司认为，使用这些书籍内容属于合理使用，美国版权法不但容许，更鼓励这种AI模型训练，因这样可以促进人类创造力。最终，法官威廉·阿尔苏普（William Alsup）的判决同意，Anthropic的AI模型训练具有转化性使用（Transformative Use）的说法，即新作品是否赋予原作品新的表达、意义或讯息。

Anthropic旗下大型语言模型Claude主要特色是强调“安全性”、“道德性”与“可控性”，但在训练过程中却涉及不道德的盗版内容下戴。（图片来源：翻摄Anthropic官网）

储存盗版书籍不属于合理使用

法官阿尔苏普认为，AI训练就像一个人阅读大量书本，从中理解写作的技巧与风格，而不是逐字复制原文内容。根据美国版权法的合理使用原则之一，若使用行为改变了原作品的用途，例如用于教学、评论或创作全新的内容，就有机会被视为合理使用，而不构成侵权。

Anthropic对如此判决当然表示很高兴，可是这并非全然对Anthropic有利。法官阿尔苏普指出，该公司透过盗版途径下载逾700万本书籍，然后储存在公司内部的“中央图书馆”，已构成侵害作家版权的行为；就算部分书籍没有用作AI训练，也不构成“合理使用”。

这意味着Anthropic真金白银购买书籍，扫描输入给AI模型进行训练，就没有问题。但以盗版书籍来训练模型，却是另一回事。预计法官阿尔苏普将于2025年12月作出另一裁决，判定Anthropic因使用盗版内容而须付出的赔偿金额。

按照美国版权法的规定，在一般情形下每件作品的法定赔偿金额为750美元至3万美元（约5,850港元至22.7万港元）之间；若属故意侵权（Willful Infringement），法院更可将赔偿金额提高至每件作品最高15万美元（约117万港元），所以Anthropic日后可能要面对总额高达数十亿美元的巨额赔款。由是观之，这次表面上虽然打赢了官司，但实际上可能只是争取到一点缓冲时间，真正的冲击还在后头。

Meta胜诉只因控方错误主张

Anthropic案件宣判的两天后（2025月6月25日），旧金山地方法院裁定Facebook公司Meta使用数百万本书籍训练AI模型，属于“合理使用”。这对AI公司来说可能是又一次胜利。

13名美国作家于2023年联合控告Meta，在未经授权下利用其作品训练Llama模型。与Anthropic侵权案件一样，他们指控Meta通过盗版途径下载大量书籍以供训练模型。同时，控方又提出，以此为训练基础的Llama涉及未经授权的内容重制，并强调Meta行为损害了作者将其作品授权用于AI模型训练的权益。

Meta旗下大型语言模型Llama是一款开源大型语言模型，提供可商用授权、从研究转向实务应用。（图片来源：Meta官网）

法官文斯·查布里亚（Vince Chhabria）认为，控方的两项主张都站不住脚。首先，因为Llama难以从书籍中生成足够长度的文本内容；其次，即使控方拥有书籍版权，惟他们也无权主张或垄断“将作品授权用于AI训练”的市场。换言之，法官认为这类市场本身并不受版权法保障，版权持有人不能因为某项新科技应用出现，就自动取得从中获利的权利。

然而，法官查布里亚却对作家们的处境深感忧虑。他坦言，合理使用缺乏明确界线，必须视个案情况而定。如今所有AI公司都声称其使用具转化性，但问题在于这些业者创造出来的AI产品，不仅可能严重侵蚀原作品的市场价值，还可能削弱人类创作的诱因。在合理使用的护航下，这类行为对版权作品造成的潜在伤害，可能远大于AI公司所声称的正当使用目的。

这两宗判决仅适用于本案情况

此外，查布里亚指出，控方忽略了有一个可能成立的法律主张。Meta透过抄袭原告书籍，开发出一项可能导致类似内容泛滥的产品，造成市场稀释效应，让原作变得不再稀缺，甚至被视为可被取代的内容，进而削弱其市场价值。遗憾的是，控方对此论点仅轻描淡写，未能提出实质证据证明Llama对其作品市场构成稀释影响。

Meta执行长朱克伯格（Mark Zuckerberg）刚完成重组集团的AI业务部署，成立超级智能实验室（Superintelligence Labs），负责统领和加强AI业务发展。Meta侵权官司胜诉，如同打一剂强心针，令AI团队士气大振。（图片来源：Meta官网）

尽管在Anthropic与Meta的侵权官司中，AI公司似乎暂时占了上风，但两位法官皆强调，其判决仅限于本案情况，未来在不同产业或不同案件中，仍有可能出现截然不同的裁决结果。法官查布里亚批评，AI公司宣称“不利于他们的版权裁决会阻碍AI发展”的说法极为荒谬。他指出，若这些业者确实需要依赖受版权保护的作品来训练模型，而AI又能为他们带来数百亿美元的收益，那么他们应主动寻求补偿版权持有人，而不是逃避责任。

查布里亚指出，像新闻产业这类内容密集的市场，更容易受到AI生成内容所带来的间接竞争影响，这意味着若未来有媒体公司提出诉讼，法院的审判态度可能会更加严格。事实上，美国仍有多宗由作家与新闻机构提出的集体诉讼，针对微软（Ｍicrosoft）、OpenAI、Meta等训练AI模型的行为进行起诉，因此往后的审判才是真正的戏肉！

《经济通》所刊的署名及／或不署名文章，相关内容属作者个人意见，并不代表《经济通》立场，《经济通》所扮演的角色是提供一个自由言论平台。