首页 > 传媒 > 关键词  > 华为开发者大会最新资讯  > 正文

预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

2025-06-23 14:01 · 稿源: 站长之家用户

6月20日-22日,一年一度的华为开发者大会(HDC2025)隆重启幕。大会期间,AI科技创业者、Al畅销书作者、人工智能头部自媒体博主GenJi(李艮基)携手华为博士天团,围绕盘古NLP大模型、盘古世界模型、具身智能,以及预测大模型四大核心内容,展开了一场深度技术对谈,华为AI领域核心研发团队首次集中揭秘,干货满满!

以下是本次直播实录“预测大模型”部分——

 4 合

Genji:刚才提到的“预测大模型”这个词比较新,请简单概述一下。

常博士:现有所有的AI都是利用部分数据训练出的特定场景的模型来解决特定问题。我们希望通过预测大型模型可以在世界上所有可获取的数据知识中进行统一学习,然后将AI部署和应用于无限多的场景中。甚至在一些新出现的场景中,我们也可以迁移模型并加以利用。这就是我们的愿景:无限数据的学习,无限场景的应用。

Genji:我很好奇在盘古预测大模型中,您是基于什么动机和背景去做的?

常博士:企业面对有限数据构建 AI 分析模型时,既需要突破数据量不足的瓶颈,又要解决小样本场景下模型精度优化的技术难题,而现有技术体系尚未形成系统性解决方案。因此,我们对预测大模型的核心期望在于:通过构建具备知识泛化能力的模型架构,使其在完成多源数据学习后,能够无缝迁移至各类新兴业务场景及下游任务。这一需求的底层逻辑源于 To B 业务的现实约束 —— 当面对海量客户需求时,传统定制化解决方案难以规模化落地,而挖掘场景共性并实现批量式问题解决,成为破局的关键路径。

Genji:在这么多数据的技术架构探索中,您有什么发现和洞见可以与我们分享吗?

常博士:在 AI 应用实践中,视觉与语言领域因数据规模庞大,已通过大模型技术实现系统性突破。但更多垂直场景仍面临「定制化建模困境」:传统方案需针对每个场景的数据格式、类型设计专属网络结构,这种「一事一模型」的模式不仅难以覆盖海量场景,更导致不同模型间形成「智能孤岛」—— 各场景的 AI 能力彼此割裂,无法通过知识共享实现协同进化。

追根溯源,该问题的本质在于数据表征的碎片化。所有数据本质上都是对物理世界的离散化建模:

图像数据以二维网格为基本单元(像素阵列),无论是手机拍摄的风景照、天文望远镜捕捉的星系图像,还是显微镜下的微观影像,其数据结构均遵循格子空间规律,这也是卷积神经网络(CNN)通过局部特征扫描实现高效建模的底层逻辑;

文本数据呈现单向序列结构(字符流),与图像的二维空间截然不同,因此 Transformer 通过自注意力机制捕捉序列依赖关系;

工业传感器数据则更为复杂,不同设备的采样频率、空间分布、物理含义差异显著,导致其数据结构缺乏统一范式。

这种数据结构的多样性,使得传统 AI 模型必须针对特定场景设计专属架构。当石油钻井传感器数据(时序 + 空间多维信号)、医疗影像(三维体数据)、物流路径数据(图结构)等并存时,差异化的模型架构导致知识迁移难以实现。因此,突破的关键在于建立「数据原子级表征体系」—— 通过抽象不同数据形态的底层共性,在表征层面构建统一的数学语言,为跨场景智能迁移奠定基础。这一思路既需要解构物理世界的信息编码规律,也需重构 AI 模型的底层表征范式,是打破智能孤岛的核心技术路径。

Genji:在我听起来,我们目前要做的很像是爱因斯坦找寻的大一统理论,所以是这样吗?

常博士:是的。我们致力于构建的大一统 AI,其本质是通过全量数据的统一学习,实现“一次训练、全域迁移“的智能进化。这一目标的核心在于:让 AI 在掌握图像、语言、药物分子、工业数据等全类型数据的底层规律后,能自主适应从未见过的新场景,从而打破传统 AI“一场景区分一模型”的碎片化局限。我可以举个很简单的例子,我们可以把不同的数据嵌入不同的空间,就相当于照片、语言、药物分子、表格等分别在不同空间,我们可以将这些不同的空间想象成分子结构,人类分子的种类有无穷多个,可以合成非常多种类的分子,但是构成分子的原子数量并不是很多,也就是我们所谓的原子级表达,这是我们期望做到的,当有了原子级表达之后,所有的数据看来都是一样的,我就可以进行下一步的学习,通过原子级表征发现数据背后的普适规律。

Genji:在这个过程中有哪些应用的案例?

常博士:在具体应用里面,比如炼钢这个过程,输入层是铁矿石原料配比、燃煤量、氧气 / 空气注入量等实时变化的参数,输出层是铁水温度预测值。在这类复杂工业场景中,传感器数据量远少于视觉数据,仅靠本场景数据难以构建精准模型。而大一统 AI 方案通过跨领域数据学习,将预训练模型迁移至炼钢场景,实现高效适配。国内某大型钢厂应用后,模型预测准确率远超传统方案。此类工业场景在国内数量众多,大一统 AI 突破数据稀缺瓶颈,以知识迁移实现批量价值创造,为制造业数字化提供关键支撑。

Genji:既然已经做了这么多事情,那么您在这一块有遇到哪些攻坚克难的细节可以分享吗?

常博士:在全球及国内大模型聚焦语言、视觉、视频或单一行业(如蛋白质分析)的当下,华为自主研发的预测大模型走出了差异化路径。该模型在研发初期面临多重挑战:由于覆盖场景远超语言 / 视频等单一领域,即便投入大量资源仍难以穷举所有需求;更关键的是,业界缺乏可参考的成熟方案,团队需从零开始探索技术路线的正确性、效果及价值,甚至一度质疑核心问题的定位。我们逐渐意识到,传统的定制化模式无法根治问题,必须从底层实现大一统:统一数据格式、架构设计及模型体系。这一决策的核心逻辑在于:唯有通过标准化整合,才能突破场景碎片化瓶颈。如今团队已明确目标,正基于该思路推进技术落地。

Genji:在这个脉络里,您觉得未来预测大模型有什么发展趋势方向?或者您又有什么感兴趣的研究领域?

常博士:今年我们推出了基于统一编码与架构的首个技术版本。这条技术路径蕴含巨大探索空间,我认为未来学术界会有更多研究者投身于此 —— 唯有锚定「双统一」核心方向,才能推动技术沿着正确轨迹演进。

接下来我们规划了两条优化路线:第一条是延续现有技术路径,通过持续扩充数据规模优化模型性能;第二条聚焦 To B 场景落地难点:许多客户虽持有数据,却缺乏数据建模与分析能力;

预测大模型当前仍依赖“先定义问题再解决问题”的模式,需要与 Agent 智能体协作完成问题构建。这既是预测大模型在 B 端场景的突破方向,也是未来技术迭代的关键着力点。

Genji:您提到AGI,我相信AGI会到来,AGI到来也一定是以解决问题为导向的,那么关于AGI的未来,大模型的明天,您认为有哪些趋势和脉络?

常博士:AGI 的本质在于具备人类般的「通用智能」—— 如同人类从小学到职场的成长历程中解决了100件任务,未来面对第101件与过往完全不同的新任务,也能通过抽象过往经验的本质规律实现平滑解决。这种能力的核心特征是:

1、知识迁移的灵活性:不依赖特定场景的训练数据,而是从机械学习、语言理解、图像识别等跨领域经验中提炼共性逻辑(如因果推断、模式识别);

2、问题本质的洞察力:能识别新问题与历史任务在底层逻辑上的相似性(如将金融风控问题类比为医疗诊断的概率推理模型)。

上述两点构成 AGI 的核心进化闭环:

解决新问题 → 积累新经验 → 丰富知识基底;

发现新问题 → 定义新任务 → 驱动智能边界扩展。

这种模式如同人类科学发现的迭代过程 —— 从牛顿力学解决宏观运动问题,到爱因斯坦相对论主动发现时空本质问题。当 AGI 具备该能力时,其发展将突破人类预设的任务边界,形成自我驱动的“智能奇点”。

Genji:刚才常博士分享的过程中,引入了从小学到初中学习路径。这个世界从来不缺好答案,缺一个好问题。去年全国一卷的语文高考题目,也是这个类型的问题,像人工智能一直在探讨关于问题与答案之间的关联关系,我曾看过一本书叫《第三次教育革命》,在教育里,您刚才提到小学初中这个阶段,我们一般学习的东西,包含了知识、信息和经验,其中经验是最难获取的,知识反而成本没有那么高,因为它都印在书本上,就像您所说,基于理论推演出大一统,再通过大一统泛化,这个依托的就是经验,这也AGI,这其实是一件事情非常的“带劲”事情。

常博士:是的。我本科学习数学时常常做证明题,当时不理解其意义,老师说数学的本质是当你忘记所有具体证明后剩下的逻辑思维能力,这和 AGI 很相似:AGI 不应局限于记忆具体数据,而要从数据中抽象出普适规律,并用这些规律迁移解决全新场景的问题,这是合格 AGI 的标准;若能在此基础上自主发现问题、持续迭代进化,就能迈向强 AGI,其核心在于让智能摆脱具体知识的束缚,成为可自主认知和创造的规律发现系统。

围绕预测大模型的工业化和to B端展开探讨,华为云通过业界首创的triplet transformer统一预训练架构,将多源数据进行统一的三元组编码,并在同一框架内高效处理和预训练,不断强化预测大模型能力,为其跨行业、跨场景的泛化应用提供助力。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 小鹏G7 Ultra行业首发本地端VLA+VLM大模型 9月起推送上车

    小鹏G7 Ultra今日上市,行业首发本地端VLA VLM”大模型。 搭载了VLA大模型,也就拥有了主动思考、迅速决策能力。 在VLA大模型的加持下,小鹏G7能够解决多种行驶场景,如遇上拥堵路线不傻等,主动绕行最佳路线;途遇积水路面主动减速,安全涉水礼貌避让。

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • 文生图大模型有哪些?探索AI绘画的核心引擎与选择利器

    本文探讨了当前主流的AI文生图技术及其应用场景。国际阵营中,OpenAI的DALL·E3擅长复杂语义理解,MidJourney以艺术风格见长,Stable Diffusion则以开源生态支持深度定制。中国力量方面,百度文心一格在中文语义和国风创作表现突出,阿里通义万相侧重商业化应用,昆仑万维天工支持长文本生成连贯图像。垂直领域工具如Adobe Firefly深度集成设计流程,Runway ML革新视频创作。文章建议通过聚合平台高效对比模型特性,并指出下一代技术将突破分辨率限制,实现跨模态生成。从精准语义到无限可能,AI文生图正在重塑视觉创作边界。

  • 准确率92%!苹果新模型可通过行为模式预测怀孕

    据媒体报道,苹果公司联合美国心脏协会和哈佛医学院布莱根妇女医院,在健康预测领域取得重大突破,推出基于行为数据的可穿戴模型WBM(Wearable Behavior Model)。 这项研究标志着健康监测从传统生物指标(如心率、血氧)向行为数据分析的拓展,为疾病预测提供了全新视角。 研究团队利用超过25亿小时的可穿戴设备数据训练WBM模型,使其能够从步数、活动能力等高层次行为

  • 自研大模型遥遥无期!苹果Siri考虑用外援:转向OpenAI合作

    据媒体报道,知名爆料人马克古尔曼透露,苹果正重新评估其人工智能发展策略,考虑放弃自研大语言模型(LLM)计划,转而与OpenAI展开合作谈判。 若合作达成,苹果原定于2026年推出的基于自研Apple Foundation Models”的Siri升级计划可能被搁置,这一变动或引发行业广泛关注。 目前,由苹果AI负责人约翰詹南德雷亚(John Giannandrea)主导的LLM Siri”项目仍在进行中,但进展不及预�

  • 2025最新全球AI大模型排名,国内外模型动态洗牌(实时更新平台推荐)

    2025年全球AI大模型竞争进入白热化阶段,OpenAI、Google等国际巨头与中国企业激烈交锋。技术迭代远超预期,仅半年内排名就经历多次洗牌。当前全球AI大模型综合排名Top10显示:1)GPT-4.5综合80.4分领跑;2)Claude3.7编程领域领先;3)Gemini2.0多模态标杆;4)国产DeepSeek R1推理速度提升3倍;5)阿里Qwen2.5数学编程单项第一。中国模型通过开源策略、垂直优化和成本革命实现弯道超车,如DeepSeek R1仅耗资600万美元达到GPT-4水平,字节豆包采用稀疏MoE架构成本大幅降低。中文场景深度优化表现突出,如文心一言4.0方言交互准确率92%。开源生态爆发,通义千问全尺寸开源(7B~110B参数)在Hugging Face排名第一。权威评估需结合标准化测试、人类盲测和场景适配性。