首页 > 传媒 > 关键词  > 正文

「天工2.0」MoE大模型发布

2024-02-06 13:49 · 稿源: 站长之家用户

北京时间2月6日,昆仑万维正式发布新版MoE大语言模型「天工2.0」与新版「天工AI智能助手」APP,这是国内首 个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。用户即日起可在各手机应用市场下载「天工AI智能助手」APP,体验昆仑万维「天工2.0」MoE大模型的卓越性能。

「天工2.0」是昆仑万维自去年4月发布双千亿级大语言模型「天工」以来的最 大规模版本升级,其采用业内顶 尖的MoE专家混合模型架构,应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。

此次更新全面升级了AI搜索、对话、阅读、创作的回答质量与响应速度,搭载强大的多模态能力,支持图文对话、文生图等多模态应用,支持最 高100K的超长上下文窗口(超过15万个汉字),并新增了AI绘画、数据分析、AI伴侣、AI算命、热梗百科等多项新兴玩法,让AI更聪明、更实用、更有趣,成为每个人日常生活中的全能AI小助手。

昆仑万维致力于人工智能模型算法的创新与开拓,不断探索通用人工智能技术前沿。除了双千亿级大语言模型「天工」、MoE专家混合大模型「天工2.0」外,昆仑万维还围绕「天工」系列大模型,推出了百亿级开源大语言模型系列「天工Skywork-13B」、AI Agent开发平台「天工SkyAgents」、多模态大语言模型「天工Skywork-MM」等前沿AI产品,并已逐步构建起AI大模型、AI搜索、AI音乐、AI Story、AI游戏等AI业务矩阵,是国内模型技术与工程能力最 强、布局最全面的人工智能大模型企业之一。

MoE:全球顶 尖的大模型核心技术路径

MoE(Mixture-of-Experts,专家混合模型)是当前大语言模型赛道技术最顶 尖、研发最前沿的底层架构,是全球最领先的大模型核心技术路径之一。

自2023年6月以来,昆仑万维不断针对MoE架构技术最前沿进行研发探索,并成功发布国内首 个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用——「天工AI智能助手」APP。

「天工AI智能助手」以昆仑万维「天工2.0」MoE大模型为核心技术引擎,其技术原理是将复杂的大模型任务拆解为多个更小、更细分的子任务,每个子任务都由垂直领域的专家模型处理,从而使得昆仑万维「天工2.0」不仅大幅提高了模型训练与推理的性能和效率,更能实现多个垂直领域的知识融合,使模型能够更好地理解和处理不同应用场景下的复杂问题,为用户提供更准确、更全面的回答方案。

同时,昆仑万维技术团队更是通过一系列针对性的MoE技术攻关,在投入大量研发训练资源后,最终解决了困扰整个MoE产业的模型不收敛、特定任务泛化效果较差等核心性能问题,使「天工2.0」的模型性能得到显著提升。

模型性能更强、速度更快、架构更灵活

「天工2.0」的技术领先性体现在其核心MoE架构的卓越优势。MoE架构主要由门控模型/路由器(Gating Model/Router)和一组专家模型(Experts Models)构成,当数据输入门控模型/路由器时,系统会根据任务类型将每个token分配给一个或多个专家模型,使得每个专家模型可以专注于处理该部分数据,从而获得模型性能的整体提升。

较之传统大模型架构,「天工2.0」具有以下优势:

1.应对复杂任务能力更强:「天工2.0」MoE模型集成了多个专家模型,每个专家模型都能针对不同的数据分布和构建模式进行搭建,从而显著提升大模型在各个细分领域的专业能力,整体模型通过整合各自专家模型的输出结果,使得「天工2.0」在处理复杂任务、多模态任务时拥有显著性能提升。

2.速度更快、效率更高:由于MoE模型推理计算过程中只有少数特定专家模型被激活,相较于同等参数规模的稠密模型,「天工2.0」MoE模型呈现出极 高的稀疏性,使其拥有更高的推理计算效率,从而让用户获得更快的AI响应速度。

3.灵活、多样、可扩展性更强:一方面,模型稀疏性使得「天工2.0」能够在不增加计算量的前提下显著扩张模型规模,在同等计算资源下获得更强的模型性能;另一方面,通过增加专家模型数量、调整专家模型的权重配比,「天工2.0」能够极大丰富模型的可扩展性,构建更为灵活、多样、可扩展性更强的新时代大模型。

「天工AI智能助手」APP全面升级

「天工AI智能助手」APP基于昆仑万维自研「天工」系列大模型打造,是一款能搜、能聊、能写、能画的AI智能助手,其拥有强大的自然语言处理和智能交互能力,能够实现个性化AI搜索、智能问答、AI绘画、聊天互动、文本生成、编写代码、语言翻译等多种应用场景,并且具有丰富的知识储备。

伴随着「天工2.0」大模型的重磅升级,「天工AI智能助手」也迎来了版本的全面更新。

1.强大的多模态能力:「天工AI智能助手」所采用的多模态大模型基于一体化的开发策略,在底座模型的基础上进行深入开发与优化,引入多分辨率的视觉编码器和强大的语言基座模型,使其能够支持任意尺寸的图片输入和复杂的用户指令。

在强大的多模态大模型能力加持下,新版「天工AI智能助手」具备优秀的视觉理解、推理和指令遵循能力,能够满足图文对话、图文创作、知识问答等多种用户需求。同时,得益于模型杰出的理解能力,新版「天工AI智能助手」生成的图像在内容丰富度、精细度和图像质量上均表现卓越。

与此同时,在强大的多模态能力加持下,「天工AI智能助手」还能生成图文并茂的答案内容,让用户问出“螺蛳粉怎么做?”“怎么用吉他弹《稻香》?”“2024春节放假安排?”这类问题时能够得到图像/视频辅助呈现,使得AI回答的结果更直观,内容更丰富。

2.支持100K超长上下文窗口:「天工AI智能助手」的超长上下文窗口技术基于100K原生文本进行训练,能够支持最 高100K(超过15万汉字)的文本对话,并能够通过扩展技术可以支持200K超长文档理解。在InfiniteBench评测中,「天工」系列大模型多项指标全球第 一,10项指标平均分47.5分,超过Claude2,接近GPT4-128k的52.6分。

在针对超长上下文模型的“大海捞针”测试中,研究人员会在海量的文档集里面插入特定信息,然后对文档集进行提问,期待模型能从“茫茫文海”中找出正确的关键信息,以验证模型的长上下信息提取能力。在“大海捞针”测试中,「天工」模型取得了100 %正确结果。

3.搜得更准、写得更好、读得更快:新版「天工AI智能助手」拥有更强大的关键词与语义分析能力更精准识别用户任务需求,在AI搜索、对话、阅读、创作等不同应用场景中,都能针对用户的不同需求提供更准确、更具体的回答与追问建议。同时,新版「天工AI智能助手」AI搜索质量、安全能力、答案丰富程度都进一步提高。

例如,在「天工AI智能助手」中,用户可使用“AI阅读”功能快速提炼总结文献内容,并针对文献内容细节进行追问,得到快速、准确、具体的答案内容。

4.丰富有趣的AI Agent:新版「天工AI智能助手」新增了如AI绘画、数据分析、AI伴侣、AI算命、热梗百科等多款官方AI Agent,让「天工AI智能助手」在能搜、能聊、能写之余,新增更多有趣而实用新兴玩法,不断探索AIGC技术的应用边界,成为每个人日常生活中必不可少的全能AI小助手。

从2月8日开始,由昆仑万维主办的“巧绘龙年”AI绘画大赛也将在「天工AI智能助手」APP内开启,用户使用APP内“AI绘画”功能绘制图画作品并投稿至活动专区,即可有机会获得最 高10万元人民币的现金大奖。

这是国内首 个面向全体C端用户免费开放、奖金规模达到数十万量级的AI绘画大赛。得益于「天工」系列大模型卓越的多模态技术能力,高水准的文字意图识别确保用户能够尽情发挥创意,绘制出内容丰富、细节精致、审美高 级的个性化AIGC图像。

一直以来,昆仑万维始终秉承着“实现通用人工智能,让每个人更好地塑造和表达自我”的公司使命,不断降低大模型技术在各行各业的应用和学习门槛,携手探索未知世界、共创科技未来。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 登榜LMArena!文心大模型5.0-Preview文本能力国内第一

    11月8日,文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出,超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容;复杂长问题理解适用于学术问答、报告分析等任务;指令遵循能力支持智能助理、代码生成等场景,为多领域内容生产提供高效支撑。

  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

今日大家都在搜的词: