首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

OpenAI 正开发新的 AI 图像检测工具 预测照片是否由DALL-E3生成

2024-05-08 09:36 · 稿源:站长之家

划重点:

- OpenAI 新增了用于检测图像是否由其 DALL-E AI 图像生成器生成的工具。

- 新的图像检测分类器可预测照片是否由 DALL-E3生成。

- OpenAI 还加入了不可见水印技术,用于更清晰地标记其生成的内容。

站长之家(ChinaZ.com)5月8日 消息:OpenAI 近日宣布,他们已开始开发新的溯源方法,用于跟踪内容并证明其是否由人工智能生成。其中包括使用人工智能来确定照片是否是由 AI 生成的新的图像检测分类器,以及一种耐篡改的水印技术,可为内容添加不可见信号。

AI写作

这个分类器可以预测照片是否由 DALL-E3生成。OpenAI 声称,即使图像被裁剪、压缩或饱和度发生变化,该分类器也能以约98% 的准确率检测出图像是否由 DALL-E 生成。然而,该工具在确定内容是否来自其他 AI 模型的性能则不佳,只能标记出来自其他图像生成器(如 Midjourney)的照片的5% 至10%。

此前,OpenAI 已经在图像的元数据中加入了 Coalition of Content Provenance and AuthorityC2PA)提供的内容凭证。内容凭证本质上就是水印,包含有关图像所有者和创建方式的信息。OpenAI 与微软、Adobe 等公司一样,是 C2PA 的成员之一。此外,本月,OpenAI 还加入了 CPA 的指导委员会。

除了图像分类器,OpenAI 还开始向其文本到语音平台 Voice Engine 的片段添加水印。这一功能目前处于有限预览阶段。

无论是图像分类器还是音频水印技术,都还在不断完善中。OpenAI 表示需要从用户处获得反馈以测试其有效性。研究人员和非营利新闻机构可以通过 OpenAI 的研究访问平台测试图像检测分类器。

多年来,OpenAI 一直致力于检测由 AI 生成的内容。然而,在2023年,他们不得不终止一项旨在识别 AI 写作文本的计划,因为 AI 文本分类器一直准确率很低。

举报

  • 相关推荐
  • Nano Banana更像是AI图像领域的DeepSeek

    这是《窄播Weekly》的第66期,本期我们关注的商业动态是:Google最新的AI图像生成模型Nano Banana,可能会给AI图像领域带来一场应用大爆炸。 去年这个时候,我想把照片中人物手里拿的玩具火车换成玩具飞机,还需要给玩具火车做出精细标记,找到干净的玩具飞机图片,告诉AI将其替换成另一张图里的飞机。我花费一个小时,多番尝试下来,飞机会变形,人物的手会消失,最后的�

  • 远东股份:ALL IN“电能+算力+AI”,智能驱动未来

    远东股份(600869)凭借“电能+算力+AI”战略,在能源与算力融合领域形成先发优势。公司深耕特高压输电、新能源等关键技术,自主研发高导铝绞线提升输电效率,产品应用于多条国家级特高压线路。同时布局液冷技术研发,为数据中心提供高效散热方案。未来将持续推进“AI+能源”产业生态建设,助力制造业智能化升级和绿色高效算能模式构建。

  • 淘宝直播请call赵露思

    今年的暑假大戏,赵露思直播告一段落。 截至目前,距离她上次公开直播已经过去了十余天,她的社交动态也基本停留在这一刻暂未更新。就在8月19日直播中,赵露思首次表态,表示“现在很愿意做网红”,这一宣言并非偶然,就在前一天,她注销了拥有3119万粉丝的微博账号,彻底切断传统明星的流量锚点。

  • 三星全线产品亮相北京京东MALL 全场景呈现有AI的科技·艺术·家

    9月12日,三星家电以“AI的呵护”为主题在北京京东MALL举办线下体验展,集中展示搭载AI技术的全线产品,包括冰箱、洗衣机、电视及手机等。重点展出了荣获IFA创新奖的AI神·黑钻热泵洗烘旗舰等产品,通过五大主题展区呈现科技与艺术融合的家电新形态。观众可现场体验食材管理、衣物护理等智能功能,感受AI技术带来的生活便利。展览将持续至9月17日,并提供互动礼品。

  • AI日报:腾讯开源图像模型HunyuanImage2.1;​爱诗科技获6000万美元融资;​Freepik上线豆包Seedream4.0图像模型

    本文汇总了AI领域的最新动态:腾讯升级混元生图模型至2.1版,支持2K分辨率与中英文输入;爱诗科技获阿里领投6000万美元融资,聚焦AI视频生成;Freepik上线Seedream 4.0图像模型,提供高分辨率生成选项;阿里千问新模型通过MoE架构提升推理效率10倍;微软在Office 365中集成Anthropic技术,调整AI供应商策略;首款AI Agent浏览器Fellou CE发布,简化工作流程;清华团队开源GUAVA技术,实现

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • AI日报:国产版Nano Banana?即梦图片4.0发布;阿里巴巴发布 Qwen3-Max-Preview;上海重磅发布AI广告扶持政策

    AI日报栏目聚焦人工智能领域最新动态。主要内容包括:即梦图集4.0发布,新增文生图、图像编辑等功能;阿里巴巴推出超万亿参数语言模型Qwen3-Max-Preview;小米AI眼镜上线支付宝“看一看”支付功能;微软开源14B参数模型rStar2-Agent在数学推理领域表现突出;MiniMax启动股权激励计划覆盖核心员工;谷歌明确Gemini使用限制,免费用户每日最多5次提示;上海发布AI广告扶持政策,最高补贴500万元。这些进展展示了AI技术在图像处理、语言模型、智能支付等领域的创新应用。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • OpenAI发布GPT-5-Codex:可完成7小时单次编程任务

    OpenAI宣布推出新一代AI编程模型GPT-5-Codex,其最大亮点是创新的动态时间分配系统。 不同于传统AI追求秒级响应”,该模型可根据任务复杂度灵活调整处理时长,从数秒到7小时不等,以更接近人类专家的决策方式优化代码质量。 GPT-5-Codex产品负责人亚历山大恩比里科斯解释称,传统模型在任务初期即固定计算资源,而GPT-5-Codex能实时评估需求:动态决定加速推进、暂停语法核�

  • 海尔空调自研AI+5G成品检测系统质量创新高

    海尔空调创新融合5G与AI技术,自主研发5G+AI视觉多维智能检测系统,解决传统人工检测效率低、漏检率高、标准不一等行业痛点。该系统检测效率高,8秒完成36项全面检测;误判率降至0.5%以下,具备自适应能力;实现全流程数据可追溯,有效保障产品质量。该技术不仅降低用户购买风险,还推动行业向智能化、高精度转型,为家电质量管控提供新路径。

今日大家都在搜的词: