首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测

2025-04-11 08:42 · 稿源: AIGC开放社区公众号

今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • Agent真的卷疯了,AI办公Agent也来了。

    ​我一直说,每个行业,都一定会有专门优化的垂直领域的Agent。 你看,通用Agent的王座上有Manus,研究类的有DeepResearch,旅游有飞猪问一问,设计类有Lovart。 那现在,办公领域的Agent也来了。 专为办公打造。 这玩意就是昆仑万维的Skywork Super Agents。

  • AI日报:Anthropic推最强编码AI模型Claude4;苹果计划推AI智能眼镜;QQ浏览器上线首个高考Agent

    【AI日报】今日AI领域重要动态:1)Anthropic发布Claude4系列AI模型,编程能力超越竞争对手;2)苹果计划2026年推出集成AI技术的智能眼镜;3)字节跳动与清华合作推出时序多模态大模型ChatTS;4)3DTown框架实现单张照片生成逼真3D场景;5)OpenAI秘密开发无屏幕AI设备;6)商汤科技推出儿童AI下棋机器人;7)微软记事本新增AI写作功能;8)深圳设立70亿元基金支持AI硬件初创企业;9)谷歌发布3D视频通信平台Beam;10)阿联酋推出"星际之门"计划,免费提供ChatGPT服务;11)法国Mistral推出开源模型Devstral;12)Anthropic API新增四大功能;13)美国众议院通过法案限制各州监管AI;14)QQ浏览器推出高考AI助手。

  • OpenAI 推出首款成熟编程 AI 代理 Codex

    Codex 可复制开发环境,单任务耗时最长 30 分钟……

  • 如何用AI Agent让企业效率翻倍?

    2025年5月,红杉资本AI峰会在旧金山落下帷幕。这场汇聚150位全球顶尖AI公司创始人的大会达成重要共识:下一轮AI竞争的核心不再是工具本身,而是为用户创造的实际收益。在此背景下,Agent的重要性被前所未有的推至所有人的视野前沿。 硅谷大厂开启了第一波加速,微软CEO纳德拉在主题演讲中宣布:“我们已经进入了AI Agent时代,正在见证AI系统如何以全新方式帮助我们解决问�

  • 铭瑄 GeForce RTX 50 系列显卡重磅出击COMPUTEX 2025!

    COMPUTEX 2025第三天,铭瑄科技展台热度不减,重点展示了GeForce RTX 50系列显卡新品。该系列基于NVIDIA Blackwell架构,搭载第五代Tensor Core和第四代RT Core,配备16GB GDDR7显存,带宽达960GB/s,性能较上代提升34%。现场展出了RTX 5080 MGG OC16G等多款产品,其中iCraft系列采用全新珍珠白渐变设计,支持ARGB灯效同步,兼具科技美学。同时展出的还有半高尺寸RTX 5060 LP 8G和MGG水冷概念产品,后者�

  • 华擎官宣首款AMD极限超频OCF主板!Computex见

    快科技5月18日消息,华擎宣布将在2025年台北电脑展(Computex)上推出一系列新品,其中就包括了首款基于AMD平台的极限超频OCF主板X870E Taichi OCF。此前,华擎已经推出了基于英特尔Z890平台的OCF系列主板,并在DDR5内存超频记录中取得了不错的成绩,此次推出X870E Taichi OCF主板,将为AMD平台的超频爱好者带来新的选择。X870E Taichi OCF主板将配备两个DDR5内存DIMM插槽,这也算是超频主板�

  • OpenAI 说要“誓死”捍卫数亿 ChatGPT 用户的隐私

    OpenAI 强烈反对法院命令保存所有 ChatGPT 日志,包括已删除的聊天记录……

  • IBM高管详解如何加速企业AI应用:Agent是路径,不是噱头

    IBM在2025 Think大会上提出,企业AI竞争已从实验阶段转向实际应用阶段,关键在于定制化AI解决方案和可量化的业务成果。IBM强调企业级AI Agent需具备"动手能力",能嵌入业务流程、完成任务并监控维护,而非仅是对话助手。其watsonx平台构建了模型、数据、任务执行的完整技术栈,并通过三层架构(交互层、任务分解层、系统连接层)实现闭环运行。IBM还推出"AgentOps"体系,将智能体模块化、服务化,建立能力目录和监控机制,解决企业部署AI Agent时的系统对接、价值评估和管理难题。实践案例显示,制造业设备巡检Agent可节省70%人力成本。IBM认为AI Agent是企业数字化能力的延伸,需与业务流程深度融合,而非追赶技术潮流。

  • 研究发现:暗网上,正在出售“数百亿”个浏览器Cookie

    追踪Cookie几十年来一直是网络商业的基石。连谷歌都未能完全“淘汰”它,更糟的是,Cookie还可能被“武器化”,用于对最终用户实施网络犯罪……