首页 > 业界 > 关键词  > 正文

百度王海峰:文心大模型4.0推理性能提升50倍

2023-10-30 08:13 · 稿源:站长之家

站长之家(ChinaZ.com)10月30日 消息:在近日的第二十届中国计算机大会上,百度首席技术官王海峰表示,百度在3月16日发布知识增强大语言模型文心一言,目前文心一言的基础模型已迭代到文心大模型4.0版本。知识增强大语言模型从数万亿数据和数千亿知识中融合学习,得到预训练大模型,在此基础上采用有监督精调、人类反馈强化学习、提示等技术,具备知识增强、检索增强和对话增强的技术优势。

百度,搜索 (3)

王海峰表示,基于更强平台、更优数据、更好算法,我们训练出规模更大、效果更好的文心大模型4.0。通过飞桨与文心的协同优化,模型周均训练有效率超过98%,训练算法效率提升3.6倍,推理性能提升50倍。文心4.0的理解、生成、逻辑、记忆四大能力显著提升,其中理解和生成能力的提升幅度相近,而逻辑和记忆能力的提升则更大,逻辑的提升幅度达到理解的近3倍,记忆的提升幅度也达到了理解的2倍多。

公开数据显示,文心一言面向全社会开放一个多月,用户规模达到4500万,开发者5.4万,场景4300个,应用825个,插件超过500个。飞桨和文心生态愈加繁荣,已凝聚800万开发者,服务22万家企事业单位,基于飞桨创建了80万个模型。

举报

  • 相关推荐
  • 百度研发出广告推荐新系统:大模型加持、转化率提升3.6%

    近日,百度团队在arXiv上发表论文,介绍了一种名为COBRA的新算法框架,被应用于提升生成式模型在广告推荐系统中的使用效果。根据论文介绍,工程师将COBRA框架应用于真实环境中的A/B测试,结果显示转化率提升了3.6%,平均每用户收入增加了4.15%。实测效果表明,COBRA框架在利用公开数据集和工业数据集进行离线和在线评估后,均优于目前业内最先进的方法。

  • AI日报:百度大招!发布文心大模型X1Turbo和AI开放计划;OpenAI免费开放轻量版Deep Research;即梦视频3.0内测

    【AI日报】主要报道了AI领域的最新动态:1)百度发布文心大模型X1Turbo和4.5Turbo,性能价格优势显著;2)百度推出AI开放计划,降低开发者门槛;3)OpenAI免费开放轻量版Deep Research研究工具;4)即梦视频3.0内测展示流畅运镜和精准表情捕捉能力;5)百度发布全球首个内容操作系统"沧舟OS";6)百度文库与网盘联合推出GenFlow超能搭子和AI笔记工具;7)Pixverse推出MCP协议简化AI视频创作;8)Tavus发布突破性唇形同步模型Hummingbird-0;9)豆包1.5深度思考模型上线,提供免费额度;10)Adobe整合OpenAI和Google模型升级Firefly创意平台;11)ImageSlider2.0即将加入Gradio核心产品线;12)李彦宏谈DeepSeek现存痛点,强调多模态能力与降本需求。

  • 大规模专家并行推理集群实现性能3跃迁,联通元景开启推理新纪元

    中国联通持续技术攻坚,依托元景大模型MaaS平台成功搭建“大规模专家并行”推理集群,实现DeepSeekMoE大模型在多节点间的超高效集群推理,单卡吞吐提升3倍,解码时延降低50%。这一成果不仅为人工智能技术的创新发展提供了强大助力,也让各行业以更高效率应用AI技术,加速推动千行百业的数字化转型。这一推理创新举措必将助力各行业在复杂多变、竞争激烈的市场环境中抢占先机,以智能化驱动数字化转型,进推动实体经济高质量发展。

  • 英特尔发布第二代AI增强SDV SoC:车企自由更高 AI性能提升10

    快科技4月23日消息,上海车展今日开幕,英特尔在车展上发布第二代英特尔AI增强软件定义汽车(SDV)SoC。该SoC率先在汽车行业推出基于芯粒架构的设计,进一步扩展了英特尔在智能座舱领域的创新产品组合。英特尔希望借助第二代AI增强SDV SoC塑造汽车计算的未来。”英特尔院士、英特尔公司副总裁、汽车事业部总经理Jack Weast说。据介绍,英特尔第二代AI增强 SDV SoC允许汽车厂商根据自身需求定制计算、图形和AI功能,降低开发成本,缩短上市时间。通过为每个功能模块匹配性能出色且合适的芯片。相比上代,生成式和多模态AI性能最高可提升10?

  • 第十二届百度奖学金揭晓:半数攻坚大模型,AI解锁医疗、交通新场景

    4月25日,第十二届百度奖学金颁奖典礼在武汉举行的"Create 2025百度AI开发者大会"上举行。10位来自全球顶尖高校的青年学者获奖,每人获20万元科研资金。获奖者研究方向涵盖大模型、多模态学习、医疗AI等前沿领域,超半数聚焦大模型技术创新应用。百度CTO王海峰勉励青年人才共同奔赴智能时代。该奖学金自2013年设立以来已累计支持116名全球顶尖学子,提供奖金超千万元。除资金支持外,百度还通过实习、项目合作等方式搭建产学研联动平台,持续推动AI技术生态繁荣。

  • 2025年第一季度大模型中标项目盘点:百度中国市场第一

    2025年伊始,全球AI产业迎来关键转折点。国内外领先的大模型技术在多模态理解、深度逻辑推理等核心能力上取得显著突破,推动人工智能应用进入规模化落地新阶段。随着厂商持续突破技术瓶颈,一个以Agent为中枢的AI应用生态加速成型,这不仅将重构千行百业的价值链条,更将为底层算力、云平台等基础设施厂商开辟万亿级增量市场。

  • 文心杯”创业大赛走进第三年:灯塔、沃土和百度的决心

    文章回顾了2011年移动互联网兴起时提出的SoLoMo(社交、本地化、移动)概念,指出字节跳动、美团等成功企业并非简单遵循该模式,而是将其融入产品体系。当前AGI(通用人工智能)时代类似移动互联网初期,极客公园张鹏提出创业者应关注大模型边界能力和数据流动。李彦宏认为原生多模态大模型是迈向AGI的重要一步,2025年可能成为AI智能体爆发元年。百度举办的"文心杯"创业大赛为AGI创业者提供技术、资源和资金支持,参赛项目覆盖多个领域。百度还发布了文心大模型4.5Turbo和X1Turbo,价格大幅下降,并推出无代码编程工具"秒搭"和MCP协议,降低开发门槛。文章强调AGI时代需要创新的"流水线",而"文心杯"类似移动互联网时代的创业灯塔,为开发者提供丰富资源。

  • Create2025百度AI开发者大会举行 文心4.5 Turbo、X1 Turbo发布

    百度在武汉举办Create2025+AI开发者大会,李彦宏强调AI应用创造价值的关键。他指出当前AI模型迭代加速,MCP成为行业标准,但开发者担忧应用快速过时。李彦宏建议开发者选对场景和基础模型,并学习调优方法。百度发布文心大模型4.5 Turbo和X1 Turbo,价格大幅下降80%和50%,性能提升且成本更低,为开发者提供更实惠高效的工具选择。

  • 不要思考过程,推理模型能力能够更强

    UC伯克利和艾伦实验室的最新研究表明,推理模型无需依赖冗长的思考过程也能有效工作。研究人员提出的"无思考(NoThinking)"方法通过简单提示直接生成解决方案,跳过了传统推理模型中的显性思考步骤。实验证明,在低资源(低token数量、少模型参数)或低延迟情况下,NoThinking方法的表现优于传统思考方式,能减少token使用量并提高推理速度。该方法在数学问题解决、编程和形式定理证明等任务中表现优异,尤其在资源受限时优势更明显。研究还发现,结合并行计算扩展后,NoThinking能进一步提升性能,在保持准确性的同时显著降低延迟和计算成本。这一发现挑战了"推理模型必须依赖详细思考过程"的传统认知。

  • 国产六大推理模型激战OpenAI?

    2025年春节前夕,DeepSeek-R1模型发布,标志着中国AI进入推理模型新时代。文章梳理了国产大模型发展历程:从2022年ChatGPT引发国内追赶OpenAI热潮,到2023年"百模大战",再到2024年"AI六小虎"格局形成。重点分析了六大国产推理模型(DeepSeek、百度、阿里、科大讯飞、字节、腾讯)的技术特点与市场表现,指出国产模型在性能上已接近GPT-4水平。特别强调科大讯飞星火X1凭借全国产化技术路线获得政企青睐,以及DeepSeek-R1以560万美元超低成本实现高性能的突破。文章还探讨了英伟达芯片断供危机下,国产全栈技术路径的重要性,认为自主可控将成为对抗国际不确定性的关键。最后指出,随着推理模型成为竞争焦点,国产大模型正从技术追随转向自主创新阶段。