首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

《卫报》确认已禁止 ChatGPT 所有者 OpenAI 的 GPTBot 爬虫抓取其内容

2023-09-03 08:34 · 稿源:站长之家

站长之家(ChinaZ.com) 9月2日消息:卫报》已经阻止 OpenAI 从其内容中获取数据。该出版商是最新一家阻止人工智能公司使用其内容来创建 ChatGPT 等产品的新闻机构

OpenAI ChatGPT,人工智能,AI

担心 OpenAI 正在使用未经许可的内容来创建其人工智能工具,已导致作家对该公司提起诉讼,并呼吁创意产业采取措施保护知识产权。

《卫报》确认已禁止 OpenAI 部署软件以收集其内容。生成式人工智能技术——指可以从简单的人类提示中生成令人信服的文本、图像和音频等产品——自去年推出 ChatGPT 聊天机器人版本以来就受到公众瞩目。然而,有关虚假信息大规模生产和此类工具建立方式的担忧也随之而来。

ChatGPT 及类似工具背后的技术是通过向其中输入大量来源于开放互联网(包括新闻文章)的数据进行「训练」的,使得这些工具可以预测用户提示后最可能出现哪个单词或句子。

OpenAI 并没有透露帮助构建 ChatGPT 模型背后所用数据,但在 8 月份宣布将允许网站运营者阻止其网络爬虫程序获取他们的内容,尽管此举并不允许从现有的训练数据集中删除材料。目前,一些出版商和网站正在阻止 GPTBot 爬虫程序。

《卫报》及其子公司 Guardian News & Media 的发言人表示:「出于商业目的从卫报网站上窃取知识产权的行为一直以来都违反了我们的服务条款。这一点始终如一。《卫报》商业授权团队与全球开发者之间有着多种互惠互利的商业关系,并期待未来建立更多这样的关系。」

根据 Originality.ai 检测到 AI 生成内容显示,现在阻止 GPTBot 爬虫程序(该程序从网页中提取数据以供其 AI 模型使用)的新闻网站包括 CNN、路透社、华盛顿邮报、彭博社、纽约时报及其体育网站 The Athletic 等。其他已经阻止 GPTBot 爬虫程序的网站还包括 Lonely Planet、亚马逊 (Amazon)、Indeed,、问答平台 Quora 和 dictionary.com。

本周,英国图书出版商敦促其首相 Rishi Sunak 通过在 11 月主持英国安全峰会议程上加入保护创意产业知识产权来保护创意产业知识产权。代表数字和印刷书籍、研究期刊和教育内容的出版商协会的一封信要求首相明确表示,在构建 AI 系统时必须尊重知识产权法。

今年 7 月,埃隆·马斯克对其 Twitter 平台(现已更名为 X)施加了限制,以解决他所声称的人工智能公司构建模型的「极端程度的数据抓取」问题。他在 Twitter 上表示,「几乎每家从事人工智能的公司」都从 Twitter 获取「大量数据」,马斯克表示,这迫使该公司付出一定代价部署更多服务器来满足需求。

然而,马斯克也确认将使用公共推文来训练其新宣布的 AI 初创企业 xAI 开发的模型。

谷歌的隐私政策现在规定,该公司使用网络爬虫帮助用户查找搜索结果,可能会收集公开信息来训练谷歌人工智能产品的模型,其中包括 Bard 聊天机器人。本周,Facebook 和 Instagram 的所有者以及主要人工智能开发商 Meta 推出了一项新政策,允许用户表示是否不希望自己的个人信息用于训练人工智能模型。

举报

  • 相关推荐
  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 谁能成为中国的ChatGPT?夸克抢先交卷

    在OpenAI上线自己家AI浏览器ChatGPT Atlas的同一周,微软在海外发布了新的AI助手Mico和更AI化的Edge浏览器,夸克则在国内推出了新的「对话助手」功能。 这一系列消息背后,新旧巨头、两个市场产生了两个确定的共识:一个是AI助理与AI浏览器的融合会进一步深化,入口之争就是系统之争;另一个是对话会成为人与AI交互的主要方式,自然语言就是未来的编程语言。 在海外市场,OpenA

  • OpenAI推出AI浏览器ChatGPT Atlas 开启个性化上网新体验

    OpenAI于10月22日推出首款AI驱动浏览器ChatGPT Atlas,以个性化上网体验为核心。用户点击“Ask ChatGPT”即可在侧边栏实时互动,实现网页摘要生成、航班预订、文档编辑等多样化任务。目前仅支持macOS,未来将扩展至Windows和移动端。高级代理功能暂限付费用户使用,其特色包括自动捕捉页面上下文、分屏浏览及记忆用户操作历史,旨在通过自然对话提升网络使用效率。

  • GEO如何改变ChatGPT搜索和Perplexity的游戏规则

    本文对比ChatGPT与Perplexity两大AI搜索平台:ChatGPT作为全能型助手,整合搜索与多任务处理,但存在信息时效性不足;Perplexity专注垂直搜索,强调引用透明与权威来源。针对AI搜索优化(GEO),提出差异化策略:面向ChatGPT需构建结构化知识库、强化品牌实体识别;面向Perplexity需注重权威数据引用和元数据优化。文章还介绍了AIBase的GEO监测工具,通过曝光率等指标量化内容在AI生态中的可见度,并给出可落地的优化行动方案。

  • 如何提升品牌在AI回答中的提及率?GEO优化3招,让ChatGPT主动提及你的品牌

    本文探讨AI搜索时代品牌面临的"隐身危机",指出AI搜索用户年增538.7%,但品牌在AI回答中提及率不足20%。提出三大核心策略:1)构建权威背书矩阵,通过知乎等高权重平台获取自然提及;2)优化AI友好内容,采用对话式标题和结构化数据;3)建立数据监测闭环,通过A/B测试持续迭代。强调需善用监测工具实时追踪品牌在豆包、文心一言等AI模型的曝光表现,避免内容"注水"。最终实现从"被动等待"到主动抢占AI"第一屏"的转变。

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OpenAI和微软的关系没那么糟,跟英伟达也没那么好

    OpenAI的动作比所有人想象的都要快。 上周二,OpenAI完成重组。其中一个重要变化是:彻底取消了与微软的排他性协议,结束了Azure长达六年的云服务独占模式。此前,OpenAI所有模型的训练、推理与部署都必须优先选择Azure,微软还享有优先购买权。 宣布与Azure“分手”后不到一周,OpenAI便火速宣布了与AWS的战略合作——双方达成一项价值380亿美元的云计算协议,OpenAI将全面接入

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • OpenAI 推出浏览器:“让位吧,Chrome”

    ​北京时间10月22日凌晨,没等来传闻中的Gemini3,等来了OpenAI正式发布首款AI浏览器ChatGPT Atlas。 简单来说,这是一个把ChatGPT"塞进"浏览器的产品,你在任何网页上都能随时唤出ChatGPT侧边栏,让AI帮你总结内容、编辑文字、甚至代替你完成购物和预订任务。 听起来有点像Chrome装了个ChatGPT插件?确实如此,但OpenAI的野心远不止于此。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

今日大家都在搜的词: