理财/管理智城物语
打印logo打印本文章电邮logo字体:
分享:
AI侵权有免死金牌?Meta盗用书籍训练AI裁定无罪
方展策
作者:方展策评论评论:点击率点击率:

发表时间: 2025-07-04 18:00:03

作者介绍

少年时,曾研习 Geographic Information System,可惜学无所成,侥幸毕业。成年后,误打误撞进入传媒圈子,先后在印刷、电子、网络媒体打滚,略有小成。中年后,修毕信息科技硕士,眼界渐扩,决意投身初创企业,窥探不同科技领域。近年,积极钻研数据分析与数码策略,又涉足 Location Intelligence 开发项目;有时还会抽空执教鞭,既可向他人分享所学,亦可鞭策自己保持终身学习。

   生成式AI迅速崛起,正在改变我们创作与使用内容的方式,但随之而来的版权争议也日益加剧。2025年6月底,美国联邦法院就Anthropic与Meta两宗侵权官司作出判定:在特定条件下,将书籍用作AI训练资料可构成“合理使用”。此举让科技界一致叫好,普遍认为这是AI发展的一大胜利。这两宗判决究竟意味着什么?它们是否向AI公司发出侵权免死金牌,抑或仅仅是个别案件的特殊裁定?


Anthropic侵权获判合理使用


   2025年6月23日,美国加州北区联邦法院裁定,AI初创公司Anthropic在未经授权的情况下,使用书籍为其大型语言模型进行数据训练,属于“合理使用”(Fair Use)范畴,成为美国首宗针对生成式AI情境下合理使用的案例。


   美国作家Andrea Bartz、Charles Graeber、Kirk Wallace Johnson于2024年8月对Anthropic提出诉讼,指控该公司以购买和非法下载方式,盗用数百万本受版权保护的书籍,训练其AI模型。他们进一步主张,Anthropic旗下AI模型Claude能够在短时间内为用户产制大量AI生成作品,远远快于人类作家写书所需时间,威胁他们的生计。


   Anthropic向法院辩解,Claude复制书籍的目是研读个中内容,从中萃取非受版权保护的知识,继而运用所学来开发革命性技术。该公司认为,使用这些书籍内容属于合理使用,美国版权法不但容许,更鼓励这种AI模型训练,因这样可以促进人类创造力。最终,法官威廉·阿尔苏普(William Alsup)的判决同意,Anthropic的AI模型训练具有转化性使用(Transformative Use)的说法,即新作品是否赋予原作品新的表达、意义或讯息。


Anthropic旗下大型语言模型Claude主要特色是强调“安全性”、“道德性”与“可控性”,但在训练过程中却涉及不道德的盗版内容下戴。(图片来源:翻摄Anthropic官网)


储存盗版书籍不属于合理使用


   法官阿尔苏普认为,AI训练就像一个人阅读大量书本,从中理解写作的技巧与风格,而不是逐字复制原文内容。根据美国版权法的合理使用原则之一,若使用行为改变了原作品的用途,例如用于教学、评论或创作全新的内容,就有机会被视为合理使用,而不构成侵权。


   Anthropic对如此判决当然表示很高兴,可是这并非全然对Anthropic有利。法官阿尔苏普指出,该公司透过盗版途径下载逾700万本书籍,然后储存在公司内部的“中央图书馆”,已构成侵害作家版权的行为;就算部分书籍没有用作AI训练,也不构成“合理使用”。


   这意味着Anthropic真金白银购买书籍,扫描输入给AI模型进行训练,就没有问题。但以盗版书籍来训练模型,却是另一回事。预计法官阿尔苏普将于2025年12月作出另一裁决,判定Anthropic因使用盗版内容而须付出的赔偿金额。


   按照美国版权法的规定,在一般情形下每件作品的法定赔偿金额为750美元至3万美元(约5,850港元至22.7万港元)之间;若属故意侵权(Willful Infringement),法院更可将赔偿金额提高至每件作品最高15万美元(约117万港元),所以Anthropic日后可能要面对总额高达数十亿美元的巨额赔款。由是观之,这次表面上虽然打赢了官司,但实际上可能只是争取到一点缓冲时间,真正的冲击还在后头。


Meta胜诉只因控方错误主张


   Anthropic案件宣判的两天后(2025月6月25日),旧金山地方法院裁定Facebook公司Meta使用数百万本书籍训练AI模型,属于“合理使用”。这对AI公司来说可能是又一次胜利。


   13名美国作家于2023年联合控告Meta,在未经授权下利用其作品训练Llama模型。与Anthropic侵权案件一样,他们指控Meta通过盗版途径下载大量书籍以供训练模型。同时,控方又提出,以此为训练基础的Llama涉及未经授权的内容重制,并强调Meta行为损害了作者将其作品授权用于AI模型训练的权益。


Meta旗下大型语言模型Llama是一款开源大型语言模型,提供可商用授权、从研究转向实务应用。(图片来源:Meta官网)


   法官文斯·查布里亚(Vince Chhabria)认为,控方的两项主张都站不住脚。首先,因为Llama难以从书籍中生成足够长度的文本内容;其次,即使控方拥有书籍版权,惟他们也无权主张或垄断“将作品授权用于AI训练”的市场。换言之,法官认为这类市场本身并不受版权法保障,版权持有人不能因为某项新科技应用出现,就自动取得从中获利的权利。


   然而,法官查布里亚却对作家们的处境深感忧虑。他坦言,合理使用缺乏明确界线,必须视个案情况而定。如今所有AI公司都声称其使用具转化性,但问题在于这些业者创造出来的AI产品,不仅可能严重侵蚀原作品的市场价值,还可能削弱人类创作的诱因。在合理使用的护航下,这类行为对版权作品造成的潜在伤害,可能远大于AI公司所声称的正当使用目的。


这两宗判决仅适用于本案情况


   此外,查布里亚指出,控方忽略了有一个可能成立的法律主张。Meta透过抄袭原告书籍,开发出一项可能导致类似内容泛滥的产品,造成市场稀释效应,让原作变得不再稀缺,甚至被视为可被取代的内容,进而削弱其市场价值。遗憾的是,控方对此论点仅轻描淡写,未能提出实质证据证明Llama对其作品市场构成稀释影响。


Meta执行长朱克伯格(Mark Zuckerberg)刚完成重组集团的AI业务部署,成立超级智能实验室(Superintelligence Labs),负责统领和加强AI业务发展。Meta侵权官司胜诉,如同打一剂强心针,令AI团队士气大振。(图片来源:Meta官网)


   尽管在Anthropic与Meta的侵权官司中,AI公司似乎暂时占了上风,但两位法官皆强调,其判决仅限于本案情况,未来在不同产业或不同案件中,仍有可能出现截然不同的裁决结果。法官查布里亚批评,AI公司宣称“不利于他们的版权裁决会阻碍AI发展”的说法极为荒谬。他指出,若这些业者确实需要依赖受版权保护的作品来训练模型,而AI又能为他们带来数百亿美元的收益,那么他们应主动寻求补偿版权持有人,而不是逃避责任。


   查布里亚指出,像新闻产业这类内容密集的市场,更容易受到AI生成内容所带来的间接竞争影响,这意味着若未来有媒体公司提出诉讼,法院的审判态度可能会更加严格。事实上,美国仍有多宗由作家与新闻机构提出的集体诉讼,针对微软(Microsoft)、OpenAI、Meta等训练AI模型的行为进行起诉,因此往后的审判才是真正的戏肉!


   《经济通》所刊的署名及/或不署名文章,相关内容属作者个人意见,并不代表《经济通》立场,《经济通》所扮演的角色是提供一个自由言论平台。


分享:
返回智城物语
上传图片
仅支持JPG、GIF、PNG图片文件,且文件小于5M
 
评论只代表会员个人观点,不代表经济通立场 
登录 后发表评论,立即 注册 加入会员。
 (点击用户名可以查看该用户所有评论)  只看作者评论  查看全部评论:↑顺序 ↓倒序
  • 暂无读者评论!
评论只代表会员个人观点,不代表经济通观点
登录 后回复评论,立即 注册 加入会员。
发表评论 查看全部评论: ↑顺序  ↓倒序
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
  • 财金博客
  • 理财/管理
  • 健康人生

  • 时尚艺术
  • 吃喝玩乐
  • 全部
more on Column 
新  一个月内新增栏目