首页 > 业界 > 关键词  > 百度智能云最新资讯  > 正文

再夺全球!百度伐谋Agent 2.0登顶MLE-Bench

2026-04-11 10:22 · 稿源: 快科技

4月10日,百度智能云宣布其自动化工程平台“伐谋”2.0版本,在业内知名的机器学习工程基准测试MLE-Bench中取得领先成绩。

据了解,MLE-Bench测试由行业组织设立,包含75项源自实际工程场景的任务,全面评估系统在数据处理、模型构建及实验管理等环节的实践能力。

测试结果显示,在统一评估标准下,该平台在多项高复杂度任务中表现优异,综合评分居于前列。

技术层面,新版本采用了增强的并行探索策略,能够在执行过程中动态调整方案路径。其引入的持续记忆机制,有助于在冗长、复杂的任务流程中维持决策连贯性。

此外,该平台依托底层技术架构,能够加速算法优化进程。用户通过自然语言指令即可进行操作,降低了专业技术门槛,便于获取定制化解决方案。

目前,该平台已在多个行业投入应用。例如,在汽车设计领域,协助阿尔特汽车将风阻分析时长从小时级缩短至分钟级;在金融服务中,帮助中信百信银行提升风险识别模型的区分度;在智慧交通方面,助力鄂尔多斯伊金霍洛旗缩短高峰时段通行时间。

据统计,该平台上线后已有数千家企业采用,服务范围涵盖零售、金融、制造、能源与交通等重要产业。

据官方预告,该平台2.0版本将于5月13日至14日在北京举行的Create2026百度开发者大会上正式亮相。

百度伐谋平台2.0版本在MLE-Bench测试中取得领先

举报

  • 相关推荐
  • 多模态训练提速45% 百度智能云推出开源全模态训练框架

    多模态大模型时代,训练基础设施正面临结构性错位。传统框架基于“数据同质、结构单一、平台固定”设计,难以应对多模态异构数据、模型组件协同及跨平台算力需求。百度百舸开源的全模态训练框架LoongForge,以Megatron为核心引擎,通过统一模型抽象、系统层优化和硬件插件化设计,实现“一套代码多平台运行”。其CCT通算传并行、ChunkPipe流水线并行、自适应FP8等技术,在主流模型上实现15%-45%端到端训练加速,在DeepSeek等前沿架构上实现倍级性能提升,并在5000+卡昆仑P800集群上达到90%+线性扩展效率。

  • 百度智能云联合中国信通院共建AI终端生态 加速大模型落地消费电子

    5月14日,百度智能云联合中国信通院等30余家单位发起“智能终端大模型生态加速社区”倡议,推动消费电子产业在大模型时代实现生态协同、技术共创与标准共建。随着AI技术演进,智能终端正从功能设备向“智能伙伴”转型,但面临互联互通不足、开发门槛高、标准体系不完善等问题。社区将围绕技术攻关、市场研究、标准落地、测试认证、场景孵化、交流联动六大方向建设,通过开放协同机制降低创新门槛,打造开放、兼容、安全、普惠的AI终端生态,促进全产业链协同发展。

  • 再出新证!智能体开发工程师证书正式发布

    2026年AI智能体全面进入产业应用,成为企业数字化转型核心引擎。国家战略推动下,人才争夺战已打响,工工信部教考中心与百度联合推出《智能体开发工程师》培训,被视为行业标准“黄金通行证”。智能体已进化为具备自主规划、闭环执行能力的“数字员工”,市场预计突破1300亿元,人才缺口超500万,供需比达1:10。该证书构建技术、开发、落地三维能力模型,助力个人与企业抢占未来十年核心赛道。

  • Testin云测:软件测试效率低?企业级质量工程解决方案解析

    企业软件测试常跟不上迭代节奏,核心痛点在于传统人工测试无法匹配两周一次的Sprint周期,尤其在金融、医疗等强监管行业,测试需留痕可审计,成本高昂。资源规划难题突出:高峰期人力不足、低谷期闲置,自建团队面临招聘周期长、流失率高,外包则存在知识传递损耗。Testin云测构建了覆盖全生命周期的服务体系,通过众包平台弹性调配数十万认证工程师,提供多端自动化测试、真机云测及AI智能调度,助力企业提升测试效率,实现质量与效率双赢。

  • 百度伐谋2.0发布:与业务专家直接对话,越用越懂企业,实现全局最优决策

    5月13日,百度在2026 Create大会上发布百度伐谋2.0,标志着AI产业落地范式转变。该升级面向业务专家,实现全局最优决策,具备三大垂直能力突破:生产排程通过对话式推理提升效率6.31%,物流规划融合多目标优化,工艺优化实现科学计算模型指导。百度伐谋2.0已获权威验证,在MLE-Bench基准中超越主流模型,覆盖制造、物流、科研等多行业,激活中国产业链"隐形金矿"。

  • 可控可溯不越界,声网智能云会议引擎构建金融级会议安全保障

    政企视频会议存在三大安全漏洞:会议准入不严、重要会议录屏后随意转发、违规使用无保密资质的平台,已导致机密文件被境外窃取。市场要求会议系统支持端到端加密、防录屏和水印溯源。声网智能云会议引擎提出"按会分流、数据不越界、留痕可追责"三件套,通过内网闭环处理涉密会议、公网就近接入日常会议,且不碰用户身份数据,结合混合云方案实现安全可交付,让政企会议从"能用"到"敢用"。

  • 百度一镜升级全场景数字人平台:沙利文认证双料冠军,服务10万+商家

    2026年百度AI开发者大会上,百度宣布数字人品牌“慧播星”升级为“百度一镜”,推出全球首个全场景多智能体数字人平台,涵盖直播、视频和实时互动三大场景,并发布海外版。百度一镜依托文心大模型,实现规模化应用,直播转化率提升29%、成本下降63.3%,视频产量提升95%,实时互动响应时间小于2秒。海外版支持12种语言,覆盖TikTok等平台,助力商家全球化,推动内容生产从“团队作业”走向“一人成团”。

  • 工程师拒绝凌晨加班被开除:把公司告上法庭 法院判了

    近日,广州法院发布2026年劳动争议十大典型案例,其中一案为韦某与信某公司劳动争议案,该案明确劳动者拒绝不合理加班,不构成不服从工作安排。 韦某系信某公司工程师,在已连续多次接受公司安排加班到深夜的情况下,2025年3月18日20时44分、3月20日0时45分,信某公司又通过微信工作群要求韦某继续加班处理技术问题,且韦某次日仍需正常上班,韦某以该加班不具备紧迫

  • 欧时 RS以专业技术支持,解决工程师选型与兼容痛点

    工业维修中常遇原设备连接器老化损坏但型号停产或铭牌磨损的痛点,工程师面临选型困境——尺寸、电流、防护等级稍有偏差即引发安全隐患。专业采购平台需具备技术选型能力,欧时RS以品牌矩阵(如TE、Amphenol、Molex等)与专业团队提供兼容替代方案,自有品牌RS PRO覆盖常用品类并享三年质保。依托全球库存网络实现快速交付,用户提交样品或参数即可获选型建议,解决从供货到技术选型的全链路难题。

  • ChatGPT正式上线广告主平台,AI产品从今天开始走向分裂。

    ​今天凌晨,OpenAI又是一通更新。 包括在ChatGPT上线了全新的非推理模型GPT‑5.5Instant,也是现在ChatGPT的默认模型。 图片 这个模型就不细说了,大概就是聊天的感觉更加偏向GPT-4o一点,幻觉更少,数据准确性更强,回复更简洁。 同时也能更好的利用你的各种记忆。 然后另一个事,是在GPT‑5.5Instant发了之后再官宣的。 OpenAI准备向企业主全量上线广告平台了。 这个非常有�

今日大家都在搜的词: