英国议会正在审议《数据使用与访问法案》(Data (Use and Access) Bill),该法案旨在规范用户与客户数据的使用权限。这项立法可能对IT产业产生深远影响,尤其是对那些依赖海量人类生成数据训练其聊天机器人系统的 AI 公司而言更是如此。
英国前副首相、前Meta高管尼克·克莱格(Nick Clegg)在一次新书《如何拯救互联网》(How to Save the Internet)的推广活动中表示,人工智能公司在使用受版权保护的数据时,不应每次都需要征求许可。
克莱格警告称,如果强制科技公司遵守版权法,并在使用受保护内容训练 AI 模型时通知权利人,英国的 AI 行业将会“一夜之间垮掉”。他辩称,这些内容已经是公开可获取的,而 AI 系统需要庞大的数据量来提升其推理能力。
克莱格指出,现有的版权法与 AI 技术本身存在根本性不兼容,如果每次训练模型都必须获得授权,整套 AI 技术就无法运行。他表示,艺术家和版权持有者应有明确且简便的方式选择不参与数据抓取,但一一寻求许可并不可行。
“我认为人们应该拥有一种清晰、便捷的方式,说‘不,我不愿意,我要退出’,”这位前Meta副总裁表示,“但我认为如果期待这个行业在训练开始前就逐一征求许可,不论在技术上还是其他方面,都是行不通的。很抱歉,这与技术本身的物理规律相冲突。”
随着英国议会围绕该法案展开辩论,克莱格将重点放在英国的 AI 产业上。由电影导演比班·基德伦(Beeban Kidron)牵头的一群艺术家和作家组成的联盟推动修改该法律,要求 AI 公司必须公开其用于模型训练的数据来源。但该提议遭到了议会否决。
基德伦在《卫报》发表的评论文章中指责政府实质上是在批准“大规模文化盗窃”的计划。她表示,在缺乏透明度的情况下,英国当局实际上是在允许 AI 公司随意使用受版权保护的作品,而公众几乎没有选择“退出”的可能。
她补充说,政府确实可以通过议会多数强行推动该法案的通过,但这种做法将对英国的创意产业造成灾难性打击。不过,这场战斗尚未结束 —— 该法案草案将于 6 月 2 日在上议院再次接受投票审议。
(举报)