首页 > 业界 > 关键词  > 正文

国外多家新闻媒体要求制定 AI 训练数据规则

2023-08-11 10:15 · 稿源:站长之家

本文要点:

1. 欧美多家新闻组织发出公开信,呼吁制定规则来保护用于训练 AI 模型的数据的版权。

2. 公开信要求透明的培训数据集和权利人的同意,以及消除人工智能服务中的偏见和错误信息。

3. 这封信的签署者包括法新社、盖蒂图片社(Getty Images)、美联社等知名新闻机构。

站长之家(ChinaZ.com)8月11日 消息:近日,欧美多家新闻媒体组织发出公开信,要求制定规则来保护用于训练人工智能模型的数据的版权。

他们表示,使用媒体内容训练的 AI 模型没有考虑原始创作者,并且没有为原始创作者提供报酬或归属。

news,新闻,报道,报纸

这不仅违反了版权法,还对媒体行业的商业模式造成了破坏,减少了媒体的多样性和可信度,损害了公司对媒体报道的财务可行性,也减少了公众获取高质量信息的机会。

这封公开信还要求培训数据集透明,并在使用数据进行培训之前征得权利人的同意。他们呼吁允许媒体公司与人工智能模型运营商进行谈判,以识别人工智能生成的内容,并要求人工智能公司消除其服务中的偏见和错误信息。

一些签署方已经与人工智能公司达成协议,允许其使用他们的材料进行培训。但是,还存在争议和法律问题,因为这种使用版权材料进行训练的做法尚未得到法律认可和测试。

一些机构和个人已经对此提起诉讼,指控人工智能公司侵犯了版权。此外,参议院也对此问题进行了听证会。

公开信的签署者包括法新社、盖蒂图片社(Getty Images)、美联社等多家知名新闻机构。他们表示相信生成式人工智能可能为组织和公众带来重要的好处,并要求在尊重媒体公司权益的讨论中参与进来。

举报

  • 相关推荐
  • 智源开源中英文语义向量模型训练数据集MTP

    智源研究院发布面向中英文语义向量模型训练的大规模文本对数据集MTP。这是全球最大的中、英文文本对训练数据集,数据规模达3亿对,希望推动解决中文模型训练数据集缺乏问题。作为中国大模型开源生态圈的代表机构,智源持续进行包括数据在内的大模型全栈技术开源,推动人工智能协同创新。

  • 手机就能运行,1万亿训练数据!StableLM-3B-4E1T来啦

    美东时间10月2日,著名开源平台Stability.ai在官网宣布,推出开源大语言模型StableLM-3B-4E1T。StableLM3B是一款主要面向手机、笔记本等移动设备的基础大语言模型,在保证性能的前提下,极大降低了算力资源的要求。性能完全不输70亿参数的模型,甚至比一些100亿参数的更强。

  • 7.7亿参数,超越5400亿PaLM!UW谷歌提出「分步蒸馏」,只需80%训练数据|ACL 2023

    【新智元导读】LLM不实用,小模型蒸馏才是「现实」的大模型应用路线,全面领先微调技术!土豪请无视。在ANLI上,使用770MT5模型超越了540BPaLM的性能,只使用了完整数据集的80%并且可以观察到,即使使用100%的完整数据集,标准微调也无法赶上PaLM的性能,表明分步蒸馏可以同时减少模型尺寸和训练数据量实现超越LLM的性能。

  • 抵制AI剽窃 各行业艺术家共同制定AI使用策略

    数字版权组织“为未来战”与音乐行业劳工组织“联合音乐家和联合工人”合作,发起了AIdayofaction运动,呼吁国会通过立法,阻止企业获得人工智能音乐及其他艺术作品的版权。这一倡议旨在通过禁止唱片公司等利用AI创作音乐进行版权保护,迫使它们继续让人类参与创作。联手行动可在AI泛滥之前争取创作者应有权益,避免不可挽回的损害。

  • 微软、亚马逊等公司正在制定 AI 辅助招聘政策

    虽然进一步在招聘实践中引入AI可能解决一些问题,但专家表示,不应期望技术能够完全改变公司招聘新员工的方式。根据软件和人才公司Criteria的2023年招聘基准报告,目前仅有12%的招聘专业人员表示他们在招聘或人才管理过程中使用人工智能。Millet表示,公司应该熟悉「玻璃盒算法」,这些算法在得出结论的方式上是透明的,并且可以解决与「黑盒算法」相关的问题,「黑盒算法」是不透明的,可能会削弱信任,或者根本无法建立信任。

  • 一小时 12 元,我在北欧监狱里训练 AI

    芬兰工资水平普遍较高,并且很少有人从事互联网行业。外媒wired实地走访发现,一家名为Metroc的大模型创业公司发现了一种新型劳动力——囚犯。随着Metroc规划扩展到北欧以及芬兰以外的语言,维尔纳拉正在考虑是否将监狱劳动力项目扩展到其他国家,她说“这是我们需要探索的事情”。

  • 超70%新闻机构认为,生成式AI新闻业带来新机遇

    一份由伦敦政治经济学院的JournalismAI计划发布的新报告显示,生成式AI对新闻业带来了新的机遇。这份报告在2023年4月至7月之间对来自46个国家的100多家新闻机构进行了调查。一位来自菲律宾的受访者评论道:“AI技术主要以英语为主要语言开发不是许多亚洲语言...我们必须加倍努力来创建能够使用我们本地语言的AI系统。

  • 戴尔发布生成式AI工具 提供预训练模型

    科技公司戴尔发布了一款名为“DellValidatedDesignforGenerativeAIwithNVIDIAforModelCustomization”的生成式人工智能工具,旨在帮助企业从数据中提取智能。这一工具的特点在于提供了预训练的模型,用户无需从头开始构建模型,即可快速提取数据中的智能信息。生成式AI模型的定制和微调可以帮助企业更好地利用其数据资源,实现更高效的工作流程和更准确的决策。

  • 中兴通讯:将发布支持大模型训练的最新AI服务器

    10月11日,中兴通讯在互动平台上表示,作为国内主流的服务器厂商,其一直在积极应对人工智能领域的应用需求,并适时推出满足各类AI应用场景的服务器产品。采取了以下两个策略:首先,针对中小型模型的训练和推理需求,中兴通讯在今年1月推出了G5系列服务器。中兴通讯计划在今年内发布一款支持大模型训练的最新AI服务器。

  • 丰田训练AI机器人制作早餐,无需编码、通过触觉学习

    丰田研究院近日宣布,他们成功使用生成式人工智能在“机器人幼儿园”中培训机器人执行各种灵巧任务无需进行繁琐的编码工作。这一突破性的技术使得机器人可以通过触觉感知和学习,像人类一样执行各种任务。与丰田研究人员的方法类似,他们的机器人利用他们所获得的经验来推断如何做事。