首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

《卫报》确认已禁止 ChatGPT 所有者 OpenAI 的 GPTBot 爬虫抓取其内容

2023-09-03 08:34 · 稿源:站长之家

站长之家(ChinaZ.com) 9月2日消息:卫报》已经阻止 OpenAI 从其内容中获取数据。该出版商是最新一家阻止人工智能公司使用其内容来创建 ChatGPT 等产品的新闻机构

OpenAI ChatGPT,人工智能,AI

担心 OpenAI 正在使用未经许可的内容来创建其人工智能工具,已导致作家对该公司提起诉讼,并呼吁创意产业采取措施保护知识产权。

《卫报》确认已禁止 OpenAI 部署软件以收集其内容。生成式人工智能技术——指可以从简单的人类提示中生成令人信服的文本、图像和音频等产品——自去年推出 ChatGPT 聊天机器人版本以来就受到公众瞩目。然而,有关虚假信息大规模生产和此类工具建立方式的担忧也随之而来。

ChatGPT 及类似工具背后的技术是通过向其中输入大量来源于开放互联网(包括新闻文章)的数据进行「训练」的,使得这些工具可以预测用户提示后最可能出现哪个单词或句子。

OpenAI 并没有透露帮助构建 ChatGPT 模型背后所用数据,但在 8 月份宣布将允许网站运营者阻止其网络爬虫程序获取他们的内容,尽管此举并不允许从现有的训练数据集中删除材料。目前,一些出版商和网站正在阻止 GPTBot 爬虫程序。

《卫报》及其子公司 Guardian News & Media 的发言人表示:「出于商业目的从卫报网站上窃取知识产权的行为一直以来都违反了我们的服务条款。这一点始终如一。《卫报》商业授权团队与全球开发者之间有着多种互惠互利的商业关系,并期待未来建立更多这样的关系。」

根据 Originality.ai 检测到 AI 生成内容显示,现在阻止 GPTBot 爬虫程序(该程序从网页中提取数据以供其 AI 模型使用)的新闻网站包括 CNN、路透社、华盛顿邮报、彭博社、纽约时报及其体育网站 The Athletic 等。其他已经阻止 GPTBot 爬虫程序的网站还包括 Lonely Planet、亚马逊 (Amazon)、Indeed,、问答平台 Quora 和 dictionary.com。

本周,英国图书出版商敦促其首相 Rishi Sunak 通过在 11 月主持英国安全峰会议程上加入保护创意产业知识产权来保护创意产业知识产权。代表数字和印刷书籍、研究期刊和教育内容的出版商协会的一封信要求首相明确表示,在构建 AI 系统时必须尊重知识产权法。

今年 7 月,埃隆·马斯克对其 Twitter 平台(现已更名为 X)施加了限制,以解决他所声称的人工智能公司构建模型的「极端程度的数据抓取」问题。他在 Twitter 上表示,「几乎每家从事人工智能的公司」都从 Twitter 获取「大量数据」,马斯克表示,这迫使该公司付出一定代价部署更多服务器来满足需求。

然而,马斯克也确认将使用公共推文来训练其新宣布的 AI 初创企业 xAI 开发的模型。

谷歌的隐私政策现在规定,该公司使用网络爬虫帮助用户查找搜索结果,可能会收集公开信息来训练谷歌人工智能产品的模型,其中包括 Bard 聊天机器人。本周,Facebook 和 Instagram 的所有者以及主要人工智能开发商 Meta 推出了一项新政策,允许用户表示是否不希望自己的个人信息用于训练人工智能模型。

举报

  • 相关推荐
  • 大家在看
  • JASCO:音乐生成模型,结合文本和音频条件进行控制。

    JASCO是一个结合了符号和基于音频的条件的文本到音乐生成模型,它能够根据全局文本描述和细粒度的局部控制生成高质量的音乐样本。JASCO基于流匹配建模范式和一种新颖的条件方法,允许音乐生成同时受到局部(例如和弦)和全局(文本描述)的控制。通过信息瓶颈层和时间模糊来提取与特定控制相关的信息,允许在同一个文本到音乐模型中结合符号和基于音频的条件。

  • prism-alignment:探索大型语言模型的偏好和价值观对齐。

    prism-alignment 是一个由 HannahRoseKirk 创建的数据集,专注于研究大型语言模型(LLMs)的偏好和价值观对齐问题。数据集通过调查问卷和与语言模型的多轮对话,收集了来自不同国家和文化背景的参与者对模型回答的评分和反馈。这些数据对于理解和改进人工智能的价值观对齐至关重要。

  • LoRA Studio:探索多样化的AI模型。

    LoRA Studio 是一个在线平台,提供多种AI模型供用户探索和使用。这些模型涵盖了从动漫风格到抽象艺术的不同领域,可以用于生成艺术作品、设计元素等。平台的主要优点包括模型多样性、用户友好的界面以及创意的无限可能性。

  • Unstract:无代码LLM平台,用于结构化非结构化文档。

    Unstract是一个无代码的LLM(大型语言模型)平台,它允许用户通过简单的无代码方法启动APIs和ETL管道来处理非结构化文档。它支持从多种云文件/对象存储系统中读取复杂文档,并将结构化数据写入流行的数据仓库和数据库。Unstract利用大型语言模型的能力,超越了传统的RPA(机器人流程自动化),实现了机器到机器的自动化。

  • Woy AI:2024年顶级AI工具目录

    Woy.ai是一个AI工具目录,提供2024年最新的AI工具列表。它为技术爱好者、开发者和企业提供了一个平台,以发现和利用人工智能的最新进展。

  • Sparkpage:AI驱动的新型网页,重构信息互动。

    Sparkpage 是由 Genspark 推出的革命性网页形式,致力于通过 AI 技术改善用户在线获取信息的方式。它通过内容蒸馏和整合,提供无商业影响和编辑偏见的丰富、可靠信息。内置的 AI 助手能够动态响应用户查询,提供个性化的见解和信息。

  • Helix Free User Persona Generator:生成用户画像,助力市场洞察

    Helix是一个专注于用户画像生成的在线工具,能够帮助企业或个人快速理解目标受众的特征和需求。它通过分析用户数据,生成详细的用户画像,帮助产品或服务更好地定位市场和用户。

  • Promoted:提升市场搜索、推荐和原生广告的排名

    Promoted是一个专注于市场搜索、推荐和原生广告排名的解决方案,通过先进的机器学习技术和大型语言模型搜索相关性AI技术,显著提升转化率和广告质量。它为市场平台提供了统一的搜索、推荐和广告服务,帮助企业实现更好的匹配和更高的收益。

  • Index-1.9B-Pure:轻量级大语言模型,专注于文本生成。

    Index-1.9B-Pure是Index系列模型中的轻量版本,专为文本生成而设计。它在2.8T的中英文语料上进行了预训练,与同等级模型相比,在多个评测基准上表现领先。该模型特别过滤了所有指令相关数据,以验证指令对benchmark的影响,适用于需要高质量文本生成的领域。

  • Index-1.9B-Character:19亿参数规模的角色扮演模型,支持few shots角色定制。

    Index-1.9B-Character是由Index团队自主研发的大型语言模型,专注于角色扮演领域,拥有19亿参数规模。该模型支持用户通过上传角色对话语料实现快速的角色定制,具备较高的角色一致性、对话能力和角色扮演吸引力。在CharacterEval权威benchmark评估中,整体均分排名第九,表现优于同量级模型。

  • Index-1.9B-Chat:基于19亿参数的对话生成模型

    Index-1.9B-Chat是一个基于19亿参数的对话生成模型,它通过SFT和DPO对齐技术,结合RAG实现fewshots角色扮演定制,具有较高的对话趣味性和定制性。该模型在2.8T中英文为主的语料上预训练,并且在多个评测基准上表现领先。

  • Llama3-70B-SteerLM-RM:70亿参数的多方面奖励模型

    Llama3-70B-SteerLM-RM是一个70亿参数的语言模型,用作属性预测模型,一个多方面的奖励模型,它在多个方面对模型响应进行评分,而不是传统奖励模型中的单一分数。该模型使用HelpSteer2数据集训练,并通过NVIDIA NeMo-Aligner进行训练,这是一个可扩展的工具包,用于高效和高效的模型对齐。

  • ComfyUI.org:开源AI工具,推动AI民主化。

    ComfyUI是一个开源AI模型,致力于推动AI工具的民主化和开源化。它由一个团队创建和维护,旨在为AI社区提供易于使用、安全和可靠的工具。ComfyUI支持通过各种工具,如节点管理器、节点注册表、命令行界面、自动化测试和公共文档来支持其生态系统。团队相信开源模型将在长期内胜过封闭模型,并致力于通过社区驱动的方式推动AI工具的发展。

  • Hedra:创造实验室,打造下一代人类叙事产品

    Hedra是一个创新的创造实验室,专注于将基础模型转化为产品,以驱动下一代的人类叙事技术。它提供了一个平台,让用户能够创造具有表达力和可控性的人物角色视频,并构建能够捕捉想象力的虚拟世界。Hedra的使命是通过提供完整的创意控制,让用户想象世界、角色和故事。

  • L4GM:4D重建模型,快速生成动画对象

    L4GM是一个4D大型重建模型,能够从单视图视频输入中快速生成动画对象。它采用了一种新颖的数据集,包含多视图视频,这些视频展示了Objaverse中渲染的动画对象。该数据集包含44K种不同的对象和110K个动画,从48个视角渲染,生成了12M个视频,总共包含300M帧。L4GM基于预训练的3D大型重建模型LGM构建,该模型能够从多视图图像输入中输出3D高斯椭球。L4GM输出每帧的3D高斯Splatting表示,然后将其上采样到更高的帧率以实现时间平滑。此外,L4GM还添加了时间自注意力层,以帮助学习时间上的一致性,并使用每个时间步的多视图渲染损失来训练模型。

  • Grazias:自动化收集和分享客户反馈。

    Grazias是一个免费的在线工具,用于自动化收集客户的推荐信,并集中管理这些推荐信,同时可以方便地在任何地方分享。它提供了一系列功能,包括简单的表单收集、自定义表单、自动跟进邮件以及详细的分析和图表,帮助企业更好地管理和利用客户反馈。

  • Olvy AI:客户反馈的智能管理助手

    Olvy AI是一个先进的客户反馈管理平台,它通过AI技术整合来自不同渠道的客户声音,包括调查、访谈、评论、支持票据和销售电话等,帮助企业快速获取洞察力。它通过自动化和智能化的方式,将客户反馈转化为可操作的见解,帮助企业做出更明智、更快速的决策。Olvy AI的主要优点包括提高团队生产力、节省时间、提供精准的数据驱动见解,以及保持与用户需求的紧密联系。

  • Aware:智能孕期社区应用

    Aware.ai Pregnancy App是一个为孕妇设计的智能社区应用,通过AI技术为孕妇提供个性化的社区推荐和资源。它通过匹配孕妇的背景和孕期目标,帮助她们找到合适的社区和资源,分享孕期故事和经验,并通过一对一连接获得其他孕妇的见解和建议。

  • VidAU:AI驱动的视频和音频生成平台,简化内容创作。

    VidAU AI Video & Audio Creator是一个AI驱动的视频和音频生成平台,它通过简化从构思到制作的整个内容创作过程,使得用户能够轻松创建引人入胜的视频。平台提供多种AI工具,包括视频更换、视频翻译、字幕翻译和去除、AI虚拟形象发言人以及文本转音频等功能,帮助用户提升视频内容的质量和吸引力。VidAU支持120多种语言的视频翻译,覆盖150多个国家,能够节省90%以上的视频制作时间。

  • The Prompt Report:系统性调研生成式AI的提示技术

    The Prompt Report 是一份系统性调研报告,专注于生成式人工智能(GenAI)的提示技术。它通过结合人类和机器的努力,从多个数据库中处理了4797条记录,提取出1565篇相关论文。报告提供了58种基于文本的技术,并补充了多模态和多语言技术的广泛集合。其目标是提供一个易于理解和实施的提示技术目录,并回顾了作为提示扩展的代理,包括评估输出和设计有助于安全性和安全性的提示的方法。此外,报告还应用提示技术在两个案例研究中进行了实践。

今日大家都在搜的词: