首页 > 业界 > 关键词  > ChatGPT最新资讯  > 正文

ChatGPT 在意大利恢复上线 但 OpenAI 在欧盟的监管麻烦才刚刚开始

2023-05-08 11:03 · 稿源:站长之家

站长之家(ChinaZ.com) 5月8日消息:OpenAI 此前成功安抚了意大利数据机构,解除了该国对 ChatGPT 的禁令,但其在与欧洲监管机构的斗争仍远未结束。

OpenAI,ChatGPT,人工智能,AI

今年早些时候,OpenAI 备受争议的 ChatGPT 聊天机器人遭遇了一个重大的法律障碍:在意大利被禁止。意大利数据保护机构(GPDP)指控 OpenAI 违反了欧盟的数据保护规定,该公司同意限制在解决问题的同时,限制该服务在意大利的访问。4 月 28 日,ChatGPT 重回该国,OpenAI 轻描淡写地解决了 GPDP 的担忧,而未对其服务进行重大改变,这是一场明显的胜利。

GPDP 表示欢迎 ChatGPT 所做出的变化。然而,该公司的法律问题——以及那些构建类似聊天机器人的公司的问题——可能仅仅是开始。多个国家的监管机构正在调查这些 AI 工具如何收集和生成信息,引用的关注点从公司收集未授权的训练数据到聊天机器人倾向于散布误导信息。在欧盟,他们适用的是《通用数据保护条例》(GDPR),这是全球最强的法律隐私框架之一,其影响可能远远超出欧洲。同时,欧盟的立法者正在制定一项专门针对 AI 的法律,很可能引领 ChatGPT 等系统的新时代法规。

ChatGPT 在误导信息,版权和数据保护方面的各种问题,使其成为了众矢之的。ChatGPT 是生成 AI 的最流行的例子之一,它是一个涵盖根据用户提示生成文本,图像,视频和音频等工具的笼统总称。据报道,在 2022 年 11 月推出后仅两个月内达到每月 1 亿活跃用户,成为历史上增长最快的消费者应用之一(OpenAI 从未确认这些数字)。人们使用它来将文本翻译成不同的语言,写文章和生成代码。但批评者——包括监管机构——已经强调了 ChatGPT 不可靠的输出,令人困惑的版权问题和不透明的数据保护做法。

意大利是第一个采取行动的国家。3 月 31 日,它指出了四种 OpenAI 违反 GDPR 的方式:允许 ChatGPT 提供不准确或误导性信息,未通知用户其数据收集做法,未满足六种可能的个人数据处理法律正当理由,以及未适当地防止 13 岁以下的儿童使用该服务。GPDP 下令 OpenAI 立即停止使用在 ChatGPT 的训练数据中收集的个人信息。

其他国家尚未采取任何行动。但是自 3 月以来,至少有三个欧盟国家(德国,法国和西班牙)对 ChatGPT 发起了自己的调查。与此同时,加拿大正在根据其《个人信息保护和电子文件法案》(PIPEDA)评估隐私问题。欧洲数据保护委员会(EDPB)甚至建立了一个专门的任务组,帮助协调调查。如果这些机构要求 OpenAI 进行更改,它们可能会影响该服务对全球用户的运行。

监管机构的关注点可以被广泛分为两类:ChatGPT 的训练数据来自何处以及 OpenAI 如何向其用户提供信息。

ChatGPT 使用的是 OpenAI 的 GPT-3.5 和 GPT-4 大型语言模型(LLM),这些模型基于大量的人类产生的文本进行训练。OpenAI 对使用的具体训练文本持保密态度,但表示其依靠「各种许可,创造和公开可用的数据来源,其中可能包括公开可用的个人信息。」

这可能会在 GDPR 下带来巨大的问题。该法律于 2018 年颁布,覆盖从欧盟公民那里收集或处理数据的所有服务,无论负责该服务的组织所在何处。GDPR 规定,公司在收集个人数据之前必须取得明确同意,并为收集数据提供法律合理性,并透明地说明如何使用和存储数据。

欧洲监管机构声称,围绕 OpenAI 训练数据的保密性意味着无法确认进入其中的个人信息是否最初是在用户同意的情况下提供的,GPDP 特别指出,OpenAI 一开始就「没有法律依据」收集这些信息。到目前为止,OpenAI 和其他公司几乎没有受到审查,但这一说法给未来的数据抓取工作增加了一个大问题。

此外,GDPR 的「被遗忘权」允许用户要求公司纠正其个人信息或完全删除它。OpenAI 预先更新了其隐私政策以促进这些要求,但在将特定数据分离成这些大型语言模型后,处理它们可能非常复杂,这引发了争议。OpenAI 还直接从用户处收集信息。与任何互联网平台一样,它收集各种标准用户数据(例如姓名,联系信息,银行卡详细信息等)。但是,更重要的是,它记录用户与 ChatGPT 的交互。正如 FAQ 中所述,该数据可以由 OpenAI 的员工进行审核,并用于训练其模型的未来版本。考虑到人们使用 ChatGPT 提问的亲密问题——将机器人当作治疗师或医生使用——这意味着该公司正在收集各种敏感数据。

至少有一些数据可能是从未成年人那里收集的,因为 OpenAI 的政策规定「不会故意从 13 岁以下的儿童那里收集个人信息」,但没有严格的年龄确认门槛。对于不允许从 13 岁以下的人那里收集数据,并且(在某些国家)要求 16 岁以下的未成年人获得父母同意的欧盟规定来说,这并不是好的政策。在担忧 ChatGPT 的未成年人筛选问题方面,GPDP 声称,ChatGPT 缺乏年龄过滤,会暴露未成年人接触「完全不适合其成长和自我意识水平」的回答。OpenAI 在使用这些数据方面拥有广泛的自由度,这让一些监管机构感到担忧,存储数据也存在安全风险。像三星和 JPMorgan 这样的公司已经禁止员工使用生成 AI 工具,因为他们担心员工会上传敏感数据。实际上,在 ChatGPT 遭受严重数据泄露,暴露用户的聊天记录和电子邮件地址后,意大利宣布禁用该应用。

ChatGPT 提供错误信息的倾向也可能会带来问题。GDPR 法规规定所有个人数据必须准确无误,这一点在 GPDP 的声明中得到强调。这可能会对大多数 AI 文本生成器造成困扰,因为它们容易出现「幻觉」:即对问题作出事实不正确或不相关的回答。在其他地方已经看到这种现象带来一些真实的后果,澳大利亚一个地区的市长因 ChatGPT 错误地声称他因贪污入狱而威胁起诉 OpenAI 诽谤他。ChatGPT 的广泛应用和目前在 AI 市场上的主导地位使其成为一个特别有吸引力的目标,但它的竞争对手和合作伙伴,如拥有 Bard 的谷歌或 OpenAI 的 Azure AI,也可能面临审查。在 ChatGPT 之前,意大利还禁止了聊天机器人平台 Replika 收集未成年人信息,至今仍然被禁用。虽然 GDPR 是一套强大的法律,但它并不是为解决 AI 特定问题而制定的。然而,一些可以解决这些问题的规定可能已经在视野范围内。

2021 年,欧盟提交了第一份《人工智能法》(AIA)的草案,这部立法将与 GDPR 一起制定。该法案根据人们对 AI 工具的风险评估对其进行管理,从「最小」(例如垃圾邮件过滤器)到「高」(用于执法或教育的 AI 工具)或「不可接受」,并因此被禁用(如社会信用体系)。在去年出现像 ChatGPT 这样的大型语言模型的激增之后,立法者现在正在赶快增加「基础模型」和「通用人工智能系统(GPAIs)」的规则——这是指包括 LLMs 在内的大规模 AI 系统——并有可能把它们归为「高风险」服务。

AIA 的规定不仅超出了数据保护的范畴。最近提出的一项修正案将强制公司披露用于开发生成 AI 工具的任何版权材料。这可能会暴露曾经的机密数据集,使更多的公司容易受到侵权诉讼的攻击,而这已经打击了一些服务。

专门制定 AI 法规的法律可能要等到 2024 年才会在欧洲生效,但达成该法律可能需要一段时间。欧盟立法者于 4 月 27 日就 AI 法案达成了临时协议。委员会将在 5 月 11 日对草案进行投票,最终提案预计在 6 月中旬公布。然后,欧洲理事会、议会和委员会将不得不解决任何悬而未决的争议,然后才能实施该法律。如果一切顺利,它可能会在 2024 年下半年被采纳。

目前,意大利和 OpenAI 的争议提供了一个早期的案例,展示了监管机构和 AI 公司如何进行谈判。如果 OpenAI 在 9 月 30 日之前无法创建一个更严格的年龄门槛以防止 13 岁以下的未成年人进入,并要求年龄在 13 岁以上的未成年人获得父母的同意,那么它可能会再次被封锁。但这提供了一个示范,说明欧洲认为什么是一个合适的 AI 公司行为——至少在新法规发布之前是这样。

举报

  • 相关推荐
  • 大家在看
  • CharAI:开创性的AI角色创作平台

    CharAI是一个创新的AI角色创作平台,它利用先进的人工智能技术,帮助用户快速创建和定制个性化的虚拟角色。该平台的主要优点在于其高度的灵活性和易用性,用户可以轻松地调整角色的外观、动作和表情,以满足不同的设计需求。CharAI的背景信息显示,它是由一群对AI和角色设计充满热情的专业人士开发的,旨在为用户提供一个简单、高效的创作环境。目前,该平台的价格定位尚未明确,但考虑到其创新性和潜在的市场价值,可能会有一定的收费模式。

  • Neta Art XL V1.0:易于使用的SDXL动漫模型

    Neta Art XL V1.0是一款易于使用的SDXL动漫模型,它在角色视觉叙事中提供了更好的稳定性和解剖学准确性。它支持广泛的CFG范围(5 - 20),并具有很好的正交风格,可以轻松结合创造新风格。此外,该模型在维持稳定性、提示跟随能力和解剖学准确性方面表现出色,即使在具有挑战性的姿势或摄像机角度下也是如此。

  • Instant Refactor:代码重构工具,提升开发效率。

    Instant Refactor 是一款编程辅助工具,旨在帮助开发者提高代码重构的效率。它通过自动化的方式识别代码中的模式,并提供重构建议,从而减少手动重构的时间和精力消耗。该工具支持多种编程语言,具有用户友好的界面,可以帮助开发者更快地进行代码优化和维护。

  • Hyper-SD:高效图像合成的新框架

    Hyper-SD是一个创新的图像合成框架,它通过轨迹分割一致性模型和低步数推理的优势,实现了高效的图像合成。该框架结合了ODE轨迹保留和重构的优势,同时通过人类反馈学习进一步提升了性能,并通过分数蒸馏技术增强了低步数生成能力。Hyper-SD在1到8步推理步骤中实现了SOTA性能,特别适合需要快速且高质量图像生成的应用场景。

  • Unsloth:快速训练和微调大型语言模型

    Unsloth 是一个旨在提高大型语言模型(LLMs)训练和微调速度的平台。它通过手动推导所有计算密集型数学步骤并手写GPU内核,实现了无需硬件更改即可显著加快训练速度。Unsloth 支持多种GPU,包括NVIDIA、AMD和Intel,并提供开源版本供用户在Google Colab或Kaggle Notebooks上免费试用。它还提供了不同级别的定价方案,包括免费版、Pro版和企业版,以满足不同用户的需求。

  • 有言:无需拍摄、剪辑,一键生成 3D 视频

    有言是一站式 AIGC 视频创作平台,提供上千个高质量的 3D 虚拟人角色选择,无需真人出镜。用户无需拍摄、剪辑,一键生成场景、灯光、动画、运镜和镜头,还集成了智能镜头剪辑、高质量视频后期包装。价格分为免费和付费订阅两种模式,定位于帮助用户简单快速地制作高质量视频。

  • 蝉镜:AI 数字人视频创作平台

    蝉镜是一个在线数字人视频创作平台,利用 AI 简化视频创作过程,提供 AI 数字人播报、短视频制作、分身定制等服务。广告营销、跨境电商、短视频口播等领域的用户可以在此提升创作效率、降低成本。

  • SC-GS:用于编辑动态场景的稀疏控制高斯溅射技术

    SC-GS是一种新型表示技术,将动态场景的运动和外观分别用稀疏控制点和密集高斯函数表示。它使用少量控制点学习紧凑的6自由度变换基,这些基可通过插值权重在局部插值,得到3D高斯函数的运动场。它采用变形MLP预测每个控制点的时变6自由度变换,降低学习复杂度,增强学习能力,实现时空连贯的运动模式。同时联合学习3D高斯函数、控制点的规范空间位置和变形MLP,重建3D场景的外观、几何和动态。在训练过程中,控制点的位置和数量会自适应调整以适应不同区域的运动复杂度,并采用尽可能刚性的损失函数强制运动的空间连续性和局部刚性。由于运动表示的显式稀疏性和外观分离,该方法实现了用户控制的运动编辑,同时保留高保真度外观。大量实验表明,该方法在新视图合成和高速渲染方面优于现有方法,并支持新的保留外观的运动编辑应用。

  • XTuner:高效灵活的大规模模型微调工具包

    XTuner是一个为大型模型(如InternLM, Llama, Baichuan, Qwen, ChatGLM)设计的高效、灵活且功能齐全的微调工具包。它支持在几乎所有GPU上进行LLM和VLM的预训练和微调,能够自动调度高性能操作,如FlashAttention和Triton内核,以提高训练吞吐量。XTuner与DeepSpeed兼容,支持多种ZeRO优化技术。它还支持各种LLMs和VLM(如LLaVA),并设计了良好的数据管道,能够适应任何格式的数据集。此外,XTuner支持多种训练算法,包括QLoRA、LoRA和全参数微调,使用户能够选择最适合其需求的解决方案。

  • Neta:AI魔法,创造你的虚拟灵魂伴侣

    Neta是一个结合了AI技术的网站,用户可以自定义虚拟角色的服装,并通过AI技术让角色栩栩如生。用户可以与这些虚拟角色一起踏上冒险旅程,探索奇妙的世界,培养深厚的情感联系。Neta提供了一个充满想象力和创造性的平台,让用户在虚拟世界中体验不同的生活和情感。

  • VideoGigaGAN:视频超分辨率模型,细节丰富

    VideoGigaGAN是一款基于大规模图像上采样器GigaGAN的视频超分辨率(VSR)模型。它能够生成具有高频细节和时间一致性的视频。该模型通过添加时间注意力层和特征传播模块,显著提高了视频的时间一致性,并使用反锯齿块减少锯齿效应。VideoGigaGAN在公共数据集上与最先进的VSR模型进行了比较,并展示了8倍超分辨率的视频结果。

  • Llama3-8B-Chinese-Chat:专为中文优化的聊天模型

    Llama3-8B-Chinese-Chat 是一个专为中文优化的聊天模型,基于 Meta-Llama-3-8B-Instruct 模型并通过 ORPO 进行微调。该模型显著减少了中文问题英文回答以及回答中中英文混合的现象,同时减少了回答中表情符号的使用,使得回答更加正式。

  • SAM:智能视频对象分割技术

    SAM是一个先进的视频对象分割模型,它结合了光学流动和RGB信息,能够发现并分割视频中的移动对象。该模型在单对象和多对象基准测试中均取得了显著的性能提升,同时保持了对象的身份一致性。

  • Picture To Text:在线图片转文字

    Picture to Text是一款在线图片文字识别工具,能够批量提取和复制图片中的文字内容。它免费转换照片为可编辑的文字。

  • HueMan:开发者用户的人像 API

    HueMankey 是一个为开发者提供的用户人像 API。它能够为每个用户分配一个独特的人像头像,支持批量请求和直接存储在平台上。它提供轻量级的图像数据,动态适应用户规模,并具备灵活的订阅计划。

  • Santelmo:在线混音和母带处理服务

    使用我们的专业混音和母带处理服务,将您的音乐推向新的高度。通过AI的力量,将您的音轨转化为令人惊叹的杰作,让它在竞争激烈的音乐行业中脱颖而出。可靠的交付时间,无限修订,保证退款。

  • The best Suno AI Lyrics Generator:免费生成歌曲歌词

    Suno AI是一个专门用于生成歌曲歌词的在线工具。它只需指定一个歌曲主题,就能生成完整的歌词,包括歌词内容、旋律和伴奏。Suno AI可以生成2分钟的完整歌曲,支持各种音乐风格和流派。用户可以免费使用Suno AI网站或Discord频道生成歌曲。同时,Suno AI还提供付费版本,提供更多的生成点数和商业使用权。

  • Ongkanon:提升您每天的对话体验

    Ongkanon是一款智能对话AI助手,提供有意义且上下文相关的对话体验。它能够自然地与您交谈,就像与亲密的朋友聊天一样。Ongkanon会根据您的偏好进行个性化定制,还能记住以前对话的上下文,以便进行更连贯、有意义的交互。

  • X:生成你的AI头像视频!

    X Me是一个AI头像视频生成工具,通过输入文本即可快速生成个性化的AI头像视频。它使用轻量级的AI模型,无需复杂的训练过程,快速生成逼真的数字人物视频。X Me提供多种AI名人头像供用户选择,并支持将用户自己的面部特征和声音克隆到生成的头像视频中。用户可以根据自己的喜好和需求,自由创造个性化的AI头像视频。

  • Portrait Studio:AI生成专业商务头像

    Portrait Studio Pro是一款AI生成的专业商务头像服务。用户只需上传几张照片,我们的AI引擎将生成完美的商务照片,适用于LinkedIn等场景,无需进行实际拍摄。价格实惠,仅需191美元起,支持14天退款保证。

今日大家都在搜的词: