首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

刚刚,OpenAI开源BrowseComp,重塑Agent浏览器评测

2025-04-11 08:42 · 稿源: AIGC开放社区公众号

今天凌晨2点,OpenAI开源了专门用于智能体浏览器功能的测试基准——BrowseComp。这个测试基准非常有难度,连OpenAI自己的GPT-4o、GPT-4.5准确率只有0.6%和0.9%几乎为0,即便使用带浏览器功能的GPT-4o也只有1.9%。但OpenAI最新发布的Agent模型Deep Research准确率高达51.5%,在自主

......

本文由站长之家合作伙伴自媒体作者“AIGC开放社区公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 突发!OpenAI将收购谷歌浏览器Chrome

    OpenAI高管在谷歌反垄断案庭审中作证透露,若谷歌败诉将收购其Chrome浏览器。美国司法部要求拆分Chrome以打破谷歌搜索垄断。ChatGPT产品负责人Turley作证称,OpenAI曾试图与谷歌合作使用其搜索技术但遭拒。邮件显示OpenAI去年7月提出合作请求,8月被谷歌以涉及竞争对手为由拒绝。Turley认为,若法院强制谷歌共享搜索数据将加速ChatGPT改进。目前ChatGPT距离实现80%查询使用自有搜索技

  • AI日报:QQ浏览器升级为AI浏览器OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • 刚刚OpenAI发布GPT-image-1模型,更强吉卜力版本来啦

    OpenAI发布全新图像生成模型GPT-image-1,通过API向全球开发者开放。该模型支持精细控制图像敏感度、生成效率、背景、输出格式等参数,并集成吉卜力模式。Adobe、Figma等企业已将其应用于产品中。API支持批量生成、蒙版编辑、透明度调整等高级功能,图像生成成本从0.02-0.19美元/张不等。CEO Sam Altman表示该模型与ChatGPT版本差异显著,开发者可通过API实现更多创意场景。新模型在�

  • OpenAI继续商业化狂飙:要靠Agent 5年赚1750亿美元

    5 年,靠Agent赚 1750 亿2025 年被称为agent元年,而OpenAI希望在这一年把agent做成自己的摇钱树。今年以来,OpenAI发布了两款基于ChatGPT的AI Agent,一是可以代替用户操作浏览器,自主执行任务的Operator;二是可以辅助做深入研究,生成专业研究报告的Deep Research。开春后,迎合市场主流趋势,OpenAI继续在模型推理和开源两侧发力,以期在竞争白热化的AI领域展现技术实力,但agent已成�

  • 醒醒,只靠MCP和A2A还带不来AI Agent的大繁荣

    文章探讨了AI Agents发展需要类似HTTPS的安全协议保障。回顾互联网发展历程,TCP/IP协议统一了网络通信标准,HTTP协议实现了全球互联,而HTTPS通过SSL加密解决了安全问题。类比互联网发展,当前AI Agents产业面临类似挑战:Anthropic推出的MCP协议解决智能体与工具连接问题,Google的A2A协议实现智能体间协作,但缺乏安全标准。IIFAA联盟正致力于构建AI Agents安全生态,推出ASL中间件保障数据隐私和身份认证。文章指出,正如HTTPS推动电商繁荣,AI Agents的安全标准化将加速商业化进程,蚂蚁集团等企业已开始实践MCP应用。未来AI Agents可能通过统一入口调用工具池,改变现有交互模式。

  • 刚刚OpenAI大更新ChatGPT搜索,周搜索量10亿次

    OpenAI对ChatGPT搜索功能进行重大升级,重点优化网购体验。现在用户可直接搜索商品并查看价格、详情和评价,还能跳转购买链接。该功能面向所有用户开放,支持中英文搜索,搜索结果会匹配提示词语言。过去一周搜索量已超10亿次,成为ChatGPT核心功能之一。新功能让用户能直接在ChatGPT完成商品比价和购买决策,大幅简化网购流程。虽然目前主要通过导流变现,但未来可能拓展更多电商服务。这次升级标志着ChatGPT正从纯聊天工具向多功能平台演进。

  • AI实力排名洗牌:OpenAI、谷歌崛起,Anthropic下滑

    人工智能的格局正以前所未有的速度演变,但超越标准化基准或排行榜平台,了解需求和使用模式 仍然是一个挑战……

  • OpenAI 推出首款成熟编程 AI 代理 Codex

    Codex 可复制开发环境,单任务耗时最长 30 分钟……

  • 接替Manus,字节的Agent王牌能打多久?

    字节跳动旗下智能体平台"扣子空间"推出首款由大厂发布的Agent爆款产品,自4月18日上线后引发用户疯抢邀请码。该产品具备规划、工具调用和记忆等关键能力,支持游戏攻略撰写、市场调研等复杂需求,并首创"探索模式"和"规划模式"双交互设计。虽然底层模型能力较DeepResearch和Manus仍有差距,但凭借产品设计优化和量大价优的优势,成功填补了Manus留下的市场空白。字节同步推出企业版HiAgent解决私有化部署问题,半年内智能体业务订单量增长超330%。当前行业正迎来Agent爆发期,但企业落地仍面临系统接入、数据安全等挑战。

  • 「扣子空间」内测上线,和 Agent 一起开始你的工作

    “摘星空间”平台正式推出,集生产、专业领域支持及双模系统协作能力,通过多类型AI智能体实现高效办公,具备生产提升、专家深度支持、双模协同等四大核心功能,未来将持续扩展Agent能力边界。