首页 > 传媒 > 关键词  > 华为开发者大会最新资讯  > 正文

预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

2025-06-23 14:01 · 稿源: 站长之家用户

6月20日-22日,一年一度的华为开发者大会(HDC2025)隆重启幕。大会期间,AI科技创业者、Al畅销书作者、人工智能头部自媒体博主GenJi(李艮基)携手华为博士天团,围绕盘古NLP大模型、盘古世界模型、具身智能,以及预测大模型四大核心内容,展开了一场深度技术对谈,华为AI领域核心研发团队首次集中揭秘,干货满满!

以下是本次直播实录“预测大模型”部分——

 4 合

Genji:刚才提到的“预测大模型”这个词比较新,请简单概述一下。

常博士:现有所有的AI都是利用部分数据训练出的特定场景的模型来解决特定问题。我们希望通过预测大型模型可以在世界上所有可获取的数据知识中进行统一学习,然后将AI部署和应用于无限多的场景中。甚至在一些新出现的场景中,我们也可以迁移模型并加以利用。这就是我们的愿景:无限数据的学习,无限场景的应用。

Genji:我很好奇在盘古预测大模型中,您是基于什么动机和背景去做的?

常博士:企业面对有限数据构建 AI 分析模型时,既需要突破数据量不足的瓶颈,又要解决小样本场景下模型精度优化的技术难题,而现有技术体系尚未形成系统性解决方案。因此,我们对预测大模型的核心期望在于:通过构建具备知识泛化能力的模型架构,使其在完成多源数据学习后,能够无缝迁移至各类新兴业务场景及下游任务。这一需求的底层逻辑源于 To B 业务的现实约束 —— 当面对海量客户需求时,传统定制化解决方案难以规模化落地,而挖掘场景共性并实现批量式问题解决,成为破局的关键路径。

Genji:在这么多数据的技术架构探索中,您有什么发现和洞见可以与我们分享吗?

常博士:在 AI 应用实践中,视觉与语言领域因数据规模庞大,已通过大模型技术实现系统性突破。但更多垂直场景仍面临「定制化建模困境」:传统方案需针对每个场景的数据格式、类型设计专属网络结构,这种「一事一模型」的模式不仅难以覆盖海量场景,更导致不同模型间形成「智能孤岛」—— 各场景的 AI 能力彼此割裂,无法通过知识共享实现协同进化。

追根溯源,该问题的本质在于数据表征的碎片化。所有数据本质上都是对物理世界的离散化建模:

图像数据以二维网格为基本单元(像素阵列),无论是手机拍摄的风景照、天文望远镜捕捉的星系图像,还是显微镜下的微观影像,其数据结构均遵循格子空间规律,这也是卷积神经网络(CNN)通过局部特征扫描实现高效建模的底层逻辑;

文本数据呈现单向序列结构(字符流),与图像的二维空间截然不同,因此 Transformer 通过自注意力机制捕捉序列依赖关系;

工业传感器数据则更为复杂,不同设备的采样频率、空间分布、物理含义差异显著,导致其数据结构缺乏统一范式。

这种数据结构的多样性,使得传统 AI 模型必须针对特定场景设计专属架构。当石油钻井传感器数据(时序 + 空间多维信号)、医疗影像(三维体数据)、物流路径数据(图结构)等并存时,差异化的模型架构导致知识迁移难以实现。因此,突破的关键在于建立「数据原子级表征体系」—— 通过抽象不同数据形态的底层共性,在表征层面构建统一的数学语言,为跨场景智能迁移奠定基础。这一思路既需要解构物理世界的信息编码规律,也需重构 AI 模型的底层表征范式,是打破智能孤岛的核心技术路径。

Genji:在我听起来,我们目前要做的很像是爱因斯坦找寻的大一统理论,所以是这样吗?

常博士:是的。我们致力于构建的大一统 AI,其本质是通过全量数据的统一学习,实现“一次训练、全域迁移“的智能进化。这一目标的核心在于:让 AI 在掌握图像、语言、药物分子、工业数据等全类型数据的底层规律后,能自主适应从未见过的新场景,从而打破传统 AI“一场景区分一模型”的碎片化局限。我可以举个很简单的例子,我们可以把不同的数据嵌入不同的空间,就相当于照片、语言、药物分子、表格等分别在不同空间,我们可以将这些不同的空间想象成分子结构,人类分子的种类有无穷多个,可以合成非常多种类的分子,但是构成分子的原子数量并不是很多,也就是我们所谓的原子级表达,这是我们期望做到的,当有了原子级表达之后,所有的数据看来都是一样的,我就可以进行下一步的学习,通过原子级表征发现数据背后的普适规律。

Genji:在这个过程中有哪些应用的案例?

常博士:在具体应用里面,比如炼钢这个过程,输入层是铁矿石原料配比、燃煤量、氧气 / 空气注入量等实时变化的参数,输出层是铁水温度预测值。在这类复杂工业场景中,传感器数据量远少于视觉数据,仅靠本场景数据难以构建精准模型。而大一统 AI 方案通过跨领域数据学习,将预训练模型迁移至炼钢场景,实现高效适配。国内某大型钢厂应用后,模型预测准确率远超传统方案。此类工业场景在国内数量众多,大一统 AI 突破数据稀缺瓶颈,以知识迁移实现批量价值创造,为制造业数字化提供关键支撑。

Genji:既然已经做了这么多事情,那么您在这一块有遇到哪些攻坚克难的细节可以分享吗?

常博士:在全球及国内大模型聚焦语言、视觉、视频或单一行业(如蛋白质分析)的当下,华为自主研发的预测大模型走出了差异化路径。该模型在研发初期面临多重挑战:由于覆盖场景远超语言 / 视频等单一领域,即便投入大量资源仍难以穷举所有需求;更关键的是,业界缺乏可参考的成熟方案,团队需从零开始探索技术路线的正确性、效果及价值,甚至一度质疑核心问题的定位。我们逐渐意识到,传统的定制化模式无法根治问题,必须从底层实现大一统:统一数据格式、架构设计及模型体系。这一决策的核心逻辑在于:唯有通过标准化整合,才能突破场景碎片化瓶颈。如今团队已明确目标,正基于该思路推进技术落地。

Genji:在这个脉络里,您觉得未来预测大模型有什么发展趋势方向?或者您又有什么感兴趣的研究领域?

常博士:今年我们推出了基于统一编码与架构的首个技术版本。这条技术路径蕴含巨大探索空间,我认为未来学术界会有更多研究者投身于此 —— 唯有锚定「双统一」核心方向,才能推动技术沿着正确轨迹演进。

接下来我们规划了两条优化路线:第一条是延续现有技术路径,通过持续扩充数据规模优化模型性能;第二条聚焦 To B 场景落地难点:许多客户虽持有数据,却缺乏数据建模与分析能力;

预测大模型当前仍依赖“先定义问题再解决问题”的模式,需要与 Agent 智能体协作完成问题构建。这既是预测大模型在 B 端场景的突破方向,也是未来技术迭代的关键着力点。

Genji:您提到AGI,我相信AGI会到来,AGI到来也一定是以解决问题为导向的,那么关于AGI的未来,大模型的明天,您认为有哪些趋势和脉络?

常博士:AGI 的本质在于具备人类般的「通用智能」—— 如同人类从小学到职场的成长历程中解决了100件任务,未来面对第101件与过往完全不同的新任务,也能通过抽象过往经验的本质规律实现平滑解决。这种能力的核心特征是:

1、知识迁移的灵活性:不依赖特定场景的训练数据,而是从机械学习、语言理解、图像识别等跨领域经验中提炼共性逻辑(如因果推断、模式识别);

2、问题本质的洞察力:能识别新问题与历史任务在底层逻辑上的相似性(如将金融风控问题类比为医疗诊断的概率推理模型)。

上述两点构成 AGI 的核心进化闭环:

解决新问题 → 积累新经验 → 丰富知识基底;

发现新问题 → 定义新任务 → 驱动智能边界扩展。

这种模式如同人类科学发现的迭代过程 —— 从牛顿力学解决宏观运动问题,到爱因斯坦相对论主动发现时空本质问题。当 AGI 具备该能力时,其发展将突破人类预设的任务边界,形成自我驱动的“智能奇点”。

Genji:刚才常博士分享的过程中,引入了从小学到初中学习路径。这个世界从来不缺好答案,缺一个好问题。去年全国一卷的语文高考题目,也是这个类型的问题,像人工智能一直在探讨关于问题与答案之间的关联关系,我曾看过一本书叫《第三次教育革命》,在教育里,您刚才提到小学初中这个阶段,我们一般学习的东西,包含了知识、信息和经验,其中经验是最难获取的,知识反而成本没有那么高,因为它都印在书本上,就像您所说,基于理论推演出大一统,再通过大一统泛化,这个依托的就是经验,这也AGI,这其实是一件事情非常的“带劲”事情。

常博士:是的。我本科学习数学时常常做证明题,当时不理解其意义,老师说数学的本质是当你忘记所有具体证明后剩下的逻辑思维能力,这和 AGI 很相似:AGI 不应局限于记忆具体数据,而要从数据中抽象出普适规律,并用这些规律迁移解决全新场景的问题,这是合格 AGI 的标准;若能在此基础上自主发现问题、持续迭代进化,就能迈向强 AGI,其核心在于让智能摆脱具体知识的束缚,成为可自主认知和创造的规律发现系统。

围绕预测大模型的工业化和to B端展开探讨,华为云通过业界首创的triplet transformer统一预训练架构,将多源数据进行统一的三元组编码,并在同一框架内高效处理和预训练,不断强化预测大模型能力,为其跨行业、跨场景的泛化应用提供助力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 华为云盘古预测大模型首创 Triplet Transformer 统一预训练架构

    6月20日,华为发布盘古大模型5.5,五大基础模型全面升级。该模型采用业界首创的Triplet+Transformer统一预训练架构,能跨行业处理表格数据、时间序列数据和图片数据,显著提升预测精度和泛化能力。已在水泥、钢铁、电解铝、供热等多个工业场景落地应用:海螺水泥实现熟料强度预测,宝武钢铁高炉出铁温度合格率超90%,云南铝业年省电2600万度,天津供热能耗降低10%。模型聚焦工业领域,通过工艺优化和系统寻优,助力企业降本增效,推动行业智能化转型。

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

  • 智能体时代,还得看豆包大模型

    火山引擎,又有大动作了。 2025年6月11日,火山引擎Force原动力大会发布豆包大模型1.6、视频生成模型Seedance1.0pro等重磅新模型,以及迭代了一站式AI云原生全栈服务。 对此,字节跳动CEO梁汝波表示:“做好火山引擎对字节跳动成为一家优秀的科技公司、保持技术竞争力很重要。未来,字节跳动会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新�

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

    网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行,在多项数学推理任务中性能超越更大规模的通用模型,高考数学题测试得分达98.5分。其训练成本仅2.6万美元,推理性能是DeepSeek+R1的15倍,服务成本低至每百万token0.15美元,大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI解决方案,推动大模型技术向教育领域加速渗透。网易有道表示,希望该模型能吸引更多开发者共同探索教育领域应用价值。

  • 东风汽车奕派007接入豆包大模型

    东风汽车旗下电动品牌奕派推出2025款奕派007,全面接入豆包大模型,实现三大智能化创新:1)毫秒级响应的全场景语音交互,支持10个高频指令同时处理;2)"情绪管家"模式可主动提供娱乐内容调节驾乘情绪;3)结合AIGC技术实现旅途画面一键艺术化创作分享。该车型通过智能决策能力和个性化服务重构人车关系,定位为Z世代"AI搭子"。未来将与火山引擎合作探索更多智能出行场景,构建差异化竞争力。

  • 思必驰RTOS大模型解决方案丨当玩具遇上AI,陪伴更有温度

    文章介绍了多款AI陪伴机器人产品,如LOVOT、Moflin、FoloToy等,它们通过创新交互方式引领消费新潮流。针对不同场景需求,思必驰推出RTOS大模型解决方案,融合智能对话技术与DFM-2大模型,整合第三方内容资源,赋予产品情感陪伴与寓教于乐功能。该方案具备智能打断、上下文记忆、多轮对话等能力,实现自然流畅的人机交互。在儿童教育领域,AI玩具可成为智慧伙伴,提供个性化学习支持。未来,AI赋能玩具将解锁更多应用场景,持续优化用户体验。

  • 大模型都能冲清北了?首个AI高考总分评测结果出炉

    7家国产大模型参加2025年辽宁高考模拟测试,结果显示:腾讯元宝在文科考试中以667.5分夺冠,接近清北录取线;豆包、讯飞星火分别以655分和652分紧随其后,均达985高校水平。理科方面,豆包以635分领先,元宝和Kimi分别获得632.5分和629分。测试发现大模型在文科表现优于理科,尤其在语文作文和数学解题能力突出,元宝数学获得149分高分。但在理科综合科目存在短板,物理化学的解题过程和知识点推导不够完整,图像符号理解不足。相比去年,今年大模型整体能力显著提升,已从"文科一本、理科二本"水平进步到冲击顶尖高校的水平,展现了国产AI的快速发展。

  • 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆

    6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。