暂无菜单项

OpenAI给ChatGPT买了一张"合法身份证":和Getty Images的合作,不止是几张图片的事

发布于
1

一张照片的授权费,OpenAI替AI行业交了

上周OpenAI和Getty Images悄无声息地签了一纸协议,内容是:ChatGPT以后在回答问题和搜索结果里,可以直接展示Getty Images的授权图片。这不是一句公关废话,背后是AI公司和版权方长达三年的对峙终于换了一种玩法。

Getty Images不是小角色。它手里握着近6亿张图片的版权,是全球最大的专业图库之一。2023年,Getty以”未经授权使用版权图片训练模型”为由,把Stability AI告上了法庭,索赔金额高达1.8万亿美元。那场官司到现在还没打完,但整个AI行业都看清了一件事:训练数据从哪儿来,以后会越来越是个问题。

ChatGPT与Getty Images合作
OpenAI与Getty Images达成多年授权合作,ChatGPT将展示正版图片|插图

Perplexity先走了一步,OpenAI跟上了

其实在这之前,Getty Images已经和另一家AI公司做过类似的事。今年早些时候,Perplexity宣布在搜索结果里嵌入Getty Images的授权图片,用户搜到的每一张图都是”干净”的,有授权、有来源。当时不少人觉得Perplexity是在借Getty的品牌背书,让自己和那些”随便抓图训练”的AI公司区别开来。

现在OpenAI也跟进了。ChatGPT的搜索功能每天都在和Google、Perplexity抢用户,如果搜出来的图片一半是侵权风险、一半是来历不明,用户迟早会用脚投票。与其等法院判,不如先自己把路铺好。

这次合作的核心逻辑很简单:AI公司付钱买授权,版权方拿到一笔稳定的”AI时代版税”,用户用到的图片有来源可查。三方各退一步,换一个都能接受的局面。

AI训练数据的”原罪”,正在被悄悄洗掉

过去两年,AI公司和版权方的关系基本是”你告我、我继续用”。Stable Diffusion、Midjourney、ChatGPT的图像生成能力,很大程度上建立在”互联网上所有图片我都能用”的假设上。这个假设现在越来越站不住脚了。

欧盟的《AI法案》已经要求AI公司披露训练数据来源。美国法院的判决也在往版权方倾斜。上个月,一名联邦法官裁定AI公司使用版权内容进行训练不一定属于”合理使用”(fair use),这个判决对整个行业都是一记警钟。

OpenAI选择和Getty Images合作,某种程度上是在给整个行业探路。如果这条路走得通,其他AI公司大概率也会跟进——毕竟,没人想成为那个”坚持不付钱然后被告到破产”的典型。

用户感知不强,但影响深远

对普通ChatGPT用户来说,这个变化可能不太明显。以前搜”埃菲尔铁塔”出来的图片是哪儿来的,大多数人不会去点开看。以后这些图片会带上Getty Images的水印或来源标注,仅此而已。

但往大了说,这是AI行业从”野蛮生长”向”合规化”转型的一个缩影。训练数据、生成内容、版权归属——这些问题在过去是可以”先做了再说”的灰色地带,现在正在一个个被摆到台面上来解决。

Getty Images首席执行官Craig Peters在公告里说了一句话,挺值得玩味的:”我们要确保AI的发展不会以牺牲创作者的权益为代价。”这话听起来像公关辞令,但仔细想想,如果创作者真的从AI的每一张生成图片里都拿不到一分钱,谁还愿意往互联网上传原创内容?那样的话,AI训练数据枯竭也不是不可能。


OpenAI和Getty Images的这笔交易,金额没披露,期限说是”多年”。可以预见的是,接下来会有更多类似的授权协议冒出来。AI公司掏钱买安心,版权方拿到新的收入来源,这大概是眼下能想到的、最不坏的一种结局。

0 点赞
0 收藏
分享
0 讨论
反馈
0 讨论
热门最新
总结
暂无总结
0 / 600