首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 就其 DALL-E 3 人工智能生成图像检测工具发表犹豫立场

2023-10-20 08:54 · 稿源:站长之家

站长之家(ChinaZ.com) 10月20日消息:OpenAI 一直在就何时发布一款工具,用于确定一张图像是否由 DALL-E 3 生成,OpenAI 的生成式人工智能艺术模型,进行了广泛的「讨论和辩论」。但这家初创公司并不打算在短期内做出决定。

OpenAI,ChatGPT,人工智能,AI

这是根据本周在电话采访中与 TechCrunch 交谈的 OpenAI 研究员 Sandhini Agarwal 的说法。她负责安全和政策,她表示,尽管分类器工具的准确性「非常好」——至少根据她的估计——但尚未达到 OpenAI 的质量门槛

Agarwal 表示:「考虑到它做出的决定可能会严重影响照片,比如一件作品是否被视为由艺术家绘制,或者是否不真实且具有误导性,因此推出一个有点不可靠的工具是一个问题。」

OpenAI 对该工具的目标准确性似乎非常高。OpenAI 首席技术官 Mira Murati 在 WSJ 的 Tech Live 会议上表示,这款分类器在确定未经修改的照片是否是由 DALL-E 3 生成的方面是「99%」可靠的也许目标是 100%;Agarwal 没有明确表示。

与 TechCrunch 分享的 OpenAI 博客草稿揭示了一个有趣的细节:

「[分类器] 在图像经历了常见类型的修改,如裁剪、调整大小、JPEG 压缩,或者在生成的图像的小部分上叠加文本或真实图像的剪贴时,仍然保持超过 95% 的准确性。

OpenAI 的犹豫可能与围绕其先前的公共分类器工具的争议有关,该工具旨在检测不仅来自 OpenAI 模型,还来自第三方供应商发布的生成文本。OpenAI 撤回了 AI 编写的文本检测器,因为其「低准确率」受到广泛批评

Agarwal 暗示 OpenAI 还关注人工智能生成图像到底由什么构成的哲学问题。显然,由 DALL-E 3 从头生成的艺术作品是符合条件的。但是,对于经过多轮编辑、与其他图像合并,然后经过几轮后处理滤镜的 DALL-E 3 生成的图像,应该如何划分就不太清楚了。

Agarwal 表示:「在那一点上,这个图像应该被视为 AI 生成的东西还是不是?现在,我们正在尝试解决这个问题,我们真的希望听到那些将受到这种分类器工具重大影响的艺术家和其他人的意见。」

不仅 OpenAI,许多组织正在研究为生成媒体水印和检测技术,因为人工智能深度伪造不断增加。

DeepMind 最近提出了一种规范,SynthID,用于标记以人眼看不见的方式生成的 AI 图像,但可以被专门的检测器发现。法国初创公司 Imatag,于 2020 年推出了一款声称不受调整大小、裁剪、编辑或压缩图像影响的水印工具,类似于 SynthID。另一家公司 Steg.AI 使用 AI 模型应用可以经受调整大小和其他编辑的水印。

问题在于,该行业尚未就单一的水印或检测标准达成共识。即使达成共识,也不能保证水印——以及检测器——不会被打败。

Agarwal 被问及 OpenAI 的图像分类器是否支持检测使用其他非 OpenAI 生成工具创建的图像。她不承诺这一点,但确实说过——这取决于目前存在的图像分类器工具的接受程度——这是 OpenAI 会考虑探索的一条途径。

Agarwal 表示:「目前 [分类器] 仅适用于 DALL-E 3,因为从技术上讲,这是一个更容易解决的问题。」她说:「[通用检测器] 并不是我们目前正在做的事情... 但根据 [分类器工具] 的发展,我不是说我们永远不会这样做。」

举报

  • 相关推荐
  • 视觉中国「灵感拓展」功能完成生成式AI服务上线登记

    视觉中国旗下中华易美视觉科技公司推出的“灵感拓展”功能已通过江苏省网信办生成式人工智能服务上线登记,正式在VCG.com面向用户开放。该功能基于国产大模型,结合丰富内容资源,通过AI技术为创作者提供灵感和方向,提升创意产出效率与质量。用户可在搜索时获得智能拆解的多维度创作建议,帮助精准定位需求,突破创作瓶颈,优化素材匹配效率。该功能是视觉中国在“AI智能+内容数据+应用场景”战略下的重要成果,目前已面向合作客户开放。

  • 微算法科技(NASDAQ: MLGO)融合二次矩阵变换模型,研发基于区块链的可溯源IP版权保护算法

    微算科技(NASDAQ: MLGO)研发基于区块链的可溯源IP版权保护算法,解决现有技术效率低、可追溯性差等痛点。该方案融合二次矩阵变换、分布式随机嵌入与位置映射函数,实现版权从产生到交易流转的全链路精准追踪与安全保护。凭借区块链的不可篡改特性,算法有效抵御重放攻击,确保版权信息稳定可靠,有望拓展至专利、商标等知识产权领域,推动全球版权保护生态健全高效。

  • 让搜索“一步到位”! 快手提出端到端生成式搜索方案OneSearch

    当前电商平台普遍采用“召回、粗排、精排”级联式搜索架构,但存在商品描述混乱、相关性差、冷启动难等痛点。快手提出业界首个工业级端到端生成式搜索框架OneSearch,集成三大创新模块:关键词增强量化编码(KHQE)提升商品特征建模能力,多视角用户行为序列注入策略实现精准偏好捕捉,偏好感知奖励系统(PARS)优化排序多样性。实际部署后,订单量提升3.22%,买家数增长2.4%,在线推理成本降低75.4%,冷启动场景表现尤为突出。该系统标志着生成式模型在大规模工业场景中首次完整替代传统搜索链路,为电商搜索技术发展指明方向。

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • AI日报:接入MJ!夸克发布造点AI;Wan2.5-Preview发布;可灵推最新视频生成模型可灵2.5Turbo

    近日AI领域迎来多项重要更新:阿里夸克发布AI创作平台“造点”,整合通义万相Wan2.5与Midjourney V7,支持音画同步视频生成;Wan2.5-Preview实现多模态输入与电影级视频同步生成,提升视觉创作能力;可灵AI推出视频生成模型2.5Turbo并降价30%,降低使用门槛;阿里通义推出Qwen3-ASR-Toolkit,实现小时级音视频转录;谷歌相册AI编辑功能扩展至安卓用户,支持语音修图;谷歌Mixboard工具助力创意设计,生成情绪板;Qwen发布Qwen3-Max模型,在代码生成与智能体能力表现突出;Figma推出MCP服务器,实现设计到代码的一键转换,提升开发效率。

  • 千亿AI玩具市场:当IP被AI“唤醒”,玩具厂商如何开辟新赛道?

    过去两年AI技术热度飙升,从ChatGPT爆发到谷歌、Meta频发新一代大模型,AI已切实改变生活方式。传统玩具行业正孕育智能化尝试,迪士尼与乐森机器人合作推出Mini Robot智能潮玩,通过“通用底座+可替换IP公仔”平台化设计,结合机器人技术与情感交互,打破单一产品逻辑。该产品支持动作编程、语音定制及UGC内容共享,推动玩具从“产品消费”转向“情绪消费”,成为连接虚拟与现实的新型生命体。

  • 微算法科技(NASDAQ MLGO)创新基于账户加权图与后量子密码学的区块链

    区块链技术凭借去中心化与全网共识机制展现巨大潜力,但单节点性能限制其交易处理能力,且量子计算威胁传统加密体系。微算法科技(MLGO)提出创新方案,通过账户加权图模型动态分片,结合格密码学提升并行处理与量子安全。该技术优化跨片通信,采用后量子签名算法,支持双链架构平滑过渡,在金融、供应链、元宇宙等场景实现高效扩展与隐私保护,为Web3.0奠定安全�

  • AI排名查询工具如何助力GEO优化?生成引擎优化中的关键词竞争力分析

    在AI搜索时代,传统SEO正被生成引擎优化(GEO)重塑。内容能否被AI“理解”并引用成为流量关键,而GEO策略需依赖专门的AI排名查询工具。文章指出,AI助手直接生成摘要而非链接列表,评估维度与SEO完全不同,需关注语义相关性、权威性和结构化程度。AIBase平台的GEO排名查询工具能模拟主流AI提问,检测内容曝光频率与上下文位置,支持竞品对比和中文场景优化。优化建议包�

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 腾讯云大数据TBDS重磅升级,助力金融行业构建Data+AI一体化数智新范式

    腾讯云在腾讯全球数字生态大会上宣布,其大数据平台TBDS面向AI时代完成重磅升级。此次升级聚焦“数据与AI一体化”,旨在为金融机构提供兼具数据工程与数据科学能力的综合平台,打破传统数据处理与智能应用间的壁垒。新TBDS通过多模湖仓平台、WeData数智开发治理平台及DataAgent数据智能即服务构成核心架构,实现数据存储、管理、开发、治理与运维全面智能化。平台支持多模数据统一汇聚、异构计算负载调度,并显著提升数据开发到模型上线的全链路效率。在金融场景中,新TBDS已应用于信贷自动审批等业务,帮助机构提质增效。未来,腾讯云TBDS将持续发挥专业化与智能化优势,助力金融行业加速数字化转型。

今日大家都在搜的词: