首页 > AI头条  > 正文

华为发布盘古大模型5.5:五大基础模型升级 深度思考模型将上线

2025-06-20 16:51 · 来源: AIbase基地

在今日下午举行的华为开发者大会HDC2025主题演讲中,华为常务董事、华为云计算CEO张平安宣布正式发布盘古大模型5.5,标志着自然语言处理(NLP)、计算机视觉(CV)、多模态、预测、科学计算五大基础模型迎来全面升级。

微信截图_20250620164518.png

盘古自然语言处理NLP大模型方面,全新的718B深度思考模型作为由256个专家组成的MoE大模型,在知识推理、工具调用、数学等领域的能力实现大幅提升,处于行业领先地位。盘古大模型基于昇腾云的全栈软硬件训练而成,彰显了昇腾架构打造世界一流大模型的实力。此外,盘古大模型5.5在高效长序列、低幻觉、快慢思考融合、Agent等特性上进行了升级,通过自适应快慢思考合一技术,使模型能根据问题难易程度自动切换思考模式,整体推理效率提升8倍。盘古深度研究DeepDiver借助长链难题合成、渐进式奖励等技术,在网页搜索、常识性问答等应用上展现出高效执行能力,如5分钟内完成超过10跳的复杂问答、生成万字以上专业调研报告,显著提升了工作效率。

微信截图_20250620164526.png

在盘古预测大模型领域,采用业界首创的triplet transformer统一预训练架构,对不同行业的数据进行统一编码和处理,极大提升了预测精度和跨行业、跨场景的泛化性。

盘古科学计算大模型方面,华为云持续深化其与科学应用领域的结合。深圳气象局基于盘古升级了“智霁”大模型,实现AI集合预报,更直观地反映天气系统演变可能性,减少预报误差。重庆市气象局针对成渝地区降水特点,打造了“天资・12h”气象大模型,提升灾害天气日内预报预警能力。深圳能源则采用盘古进行中短期风光水发电量预测,减少弃电现象,提升能源开发效率。

盘古计算机视觉CV大模型方面,华为云发布了全新MoE架构的300亿参数视觉大模型,这是目前业界最大的视觉模型,全面支持多维度、泛视觉的感知、分析与决策。同时,盘古CV大模型通过跨维度生成模型,构建了工业场景稀缺的泛视觉故障样本库,极大提升了业务场景的可识别种类与精度。

盘古多模态大模型方面,全新发布了基于盘古多模态大模型的世界模型,为智能驾驶、具身智能机器人的训练构建数字物理空间,实现持续优化迭代。在智能驾驶领域,盘古世界模型能生成大量训练数据,无需依赖高成本的路采,为智能驾驶的发展提供了有力支持。

此外,在华为云盘古大模型5.5发布后,其进一步拓展应用场景,推出了五款具备深度思考能力的行业自然语言大模型。这五款大模型分别为盘古医学Thinking大模型、盘古金融Thinking大模型、盘古政务Thinking大模型、盘古工业Thinking大模型以及盘古汽车Thinking大模型,旨在为不同行业提供更专业、更智能的自然语言处理解决方案。据悉,这五款大模型很快将正式上线,届时将为各行业带来更加高效、精准的自然语言处理体验。

  • 相关推荐
  • 华为云发布盘古大模型5.5,宣布新一代昇腾AI云服务上线,成就行业AI先锋

    华为开发者大会2025(HDC2025)在东莞篮球中心开幕,发布多项AI创新成果:1)推出基于CloudMatrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量提升4倍;2)发布盘古大模型5.5,NLP、CV等五大基础模型全面升级,其中718B深度思考模型采用256专家MoE架构;3)推出行业首个统一预测架构Triplet Transformer,覆盖钢铁、水泥等多个工业场景;4)发布300亿参数视觉大模型,支持多维感知分析;5)升级盘古助手Doer,新增6大开发领域专业Agent。华为云宣布开发者突破800万,将构建昇腾、鸿蒙、鲲鹏等技术生态。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 华为云盘古预测大模型首创 Triplet Transformer 统一预训练架构

    6月20日,华为发布盘古大模型5.5,五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构,能跨行业处理表格数据、时间序列数据和图片数据,显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用:海螺水泥实现熟料强度预测,宝武钢铁高炉出铁温度合格率超90%,云南铝业年省电2600万度,天津供热能耗降低10%。模型聚焦工业领域,通过工艺优化和系统寻优,助力企业降本增效,推动行业智能化转型。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 苹果炮轰AI推理模型:全是假思考!所谓思考只是一种假象

    有人总结到:苹果刚刚当了一回马库斯,否定了所有大模型的推理能力。 苹果团队认为,现有评估主要集中在既定的数学和编码基准上,看模型最终答案是否正确,但可能存在模型训练时见过类似题目。 并且,这些评估大都缺乏对思考过程质量”的分析,比如中间步骤是否逻辑一致、是否绕弯路等。 为了更客观测试推理模型的推理能力,他们设计了4类谜题环境:汉诺塔、�

  • AI日报:豆包大模型1.6发布;OpenAI推o3-pro模型、o3价格暴降80%;Figma官方MCP重磅上线

    【AI日报】今日AI领域重要动态:1)火山引擎发布豆包大模型1.6和视频生成模型Seedance1.0pro,性能显著提升;2)OpenAI推出o3-pro模型,专注可靠性但响应较慢;3)Figma推出Dev Mode MCP服务,实现设计到代码一键转换;4)Krea AI发布图像生成模型Krea1,解决传统AI绘图问题;5)火山引擎豆包日调用量突破16.4万亿次;6)法国Mistral发布推理模型Magistral;7)苹果系统整合ChatGPT图像生成功能;8)OpenAI大幅下调o3价格80%并推出o3-pro;9)Hugging Face开源榜单显示中国团队Qwen与DeepSeek进入全球前15;10)阿里开源MaskSearch框架,提升AI解决复杂问题能力。

  • 极速接入!百度千帆大模型平台宣布上线DeepSeek-R1-0528

    日前,DeepSeek R1模型完成小版本升级,目前最新版本为DeepSeek-R1-0528。 更新后的R1模型在复杂逻辑推理、长文本处理稳定性、代码生成质量等多方面能力大幅提升,整体表现已接近o3、Gemini-2.5-Pro等国际顶尖模型。 今晚,百度智能云千帆大模型平台宣布已正式上架DeepSeek-R1-0528大模型,企业用户和开发者登录千帆即可体验。

  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

今日大家都在搜的词: