首页 > 传媒 > 关键词  > 大语言模型最新资讯  > 正文

「天工大模型3.0」4月17日正式发布——同步开源4000亿参数MoE模型,性能超Grok1.0

2024-04-01 11:36 · 稿源: 站长之家用户

2023年4月17日,昆仑万维发布自研双千亿级大语言模型「天工1.0」正式奠定了国产大模型崛起之路。

在即将到来的2024年4月17日,在「天工」大模型一周年之际,昆仑万维重磅宣布,「天工3.0」正式开启公测!

「天工3.0」采用4千亿级参数MoE混合专家模型,并将同步选择开源,是全球模型参数最 大、性能最 强MoE模型之一。相较于上一代「天工2.0」MoE大模型,「天工3.0」在模型语义理解、逻辑推理、以及通用性、泛化性、不确定性知识、学习能力等领域拥有惊人的性能提升,其模型技术知识能力提升超过20%,数学/推理/代码/文创能力提升超过30%。

同时,「天工3.0」新增了搜索增强、研究模式、调用代码及绘制图表、多次调用联网搜索等能力,并针对性地训练了模型的Agent能力,使得「天工3.0」能够独立完成规划、调用、组合外部工具及信息,以精准高效地完成产业分析、产品对比等各类复杂需求,带来全新的颠覆式人工智能体验。

同时,「天工3.0」也是全球首 个多模态“超 级模型”(Super Model),其集成了AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力,是大模型时代的“超 级应用”。

其中,「天工3.0」AI音乐生成大模型SkyMusic还将在4月2日(明日)面向社会开启邀测。

四大创新 颠覆升级

MoE混合专家模型是全球技术最领先、性能最 强大的基座模型(Foundation Model)技术路径,相较于其他模型,MoE大模型应对复杂任务能力更强、模型响应速度更快、训练及推理效率更高、可扩展性更强。

在上一代「天工2.0」MoE大模型的领先基础上,「天工3.0」更是实现了全面的性能升级,其采用4000亿级参数MoE混合专家模型架构,是目前全球模型参数最 大、性能最 强的MoE模型之一。

「天工3.0」的模型能力提升体现在以下四大方面:

1.逻辑推理能力更强:更聪明

逻辑推理能力的提升对于大模型解决复杂问题至关重要,「天工3.0」的数学与推理能力均提升超过30%,强大的逻辑推理能力使其能够在实际应用中更加准确和高效地处理信息。例如,在「天工3.0」AI搜索的研究模式中,模型能够围绕用户的某个简单指令进行相关问题的延伸,并实时判断该段落信息是否需要联网搜索,能够实现如对某个行业进行细致的拆解分析,总结相关事件、拆解产业链地图等复杂功能,并以结构化或思维导图的形式进行最终展示,让模型更“聪明”。

2.语义理解能力更强:更懂你

「天工3.0」能够更好地理解和处理用户自然语言Query中的复杂语义信息,包括隐喻、多义词等。例如,在「天工3.0」AI搜索的增强搜索中,模型能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。

3.专项Agent训练,应对复杂需求能力更强:更全能

大模型时代,AI Agent(智能体)已经成为大模型技术的主流落地方向。「天工3.0」针对模型独立规划、调用、组合外部工具及信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求,并成为具备多个领域专业知识和能力的全能专家,以强大的语义理解及逻辑推理能力对用户需求进行深度理解,并把任务拆解成细分环节,发到不同的最 优模型去处理,最 大程度提升模型性能。同时,针对B端用户,「天工3.0」也在知识库能力、任意工具调用能力、复杂角色指令追寻能力等领域进行了全面升级,企业用户可以通过上传知识文档构建专属知识库及Agent,并实现自动调用制定工具、完成复杂指令遵循Agent构建等实用能力。

4.内容创作能力全面升级:多才多艺

内容创作能力一直是「天工」系列大模型的强项,在上一代「天工2.0」大模型的基础上,「天工3.0」更是进行了全面的内容创作能力升级,其不仅能实现AI音乐生成、AI语音、AI对话、AI二次元漫画生成等强大的内容创作能力,更是通过专项Agent训练实现了在对话中结合文本需求实时生成图片、结合文本需求实时内容分析及图表构建等能力,成为真正能搜、能写、能读、能聊、能听、能说、能画、能看、能唱的超 级模型,带来全新的颠覆式AI体验升级。

全球首 个超 级模型”

「天工3.0」是一款集自然语言处理、计算机视觉、多模态、AI搜索、AI智能体等多项尖 端技术于一体的人工智能大模型,更是全球首 款多模态“超 级模型”。

超 级模型”(Super Model)的概念诞生于“超 级应用”(Super App)。互联网时代,超 级应用是一种集成了多种服务的应用程序,用户能够在一个平台上享受通信、支付、购物、社交、出行等多种功能,这些服务能够相互连接、交互,最 大程度地满足用户的综合体验。

超 级模型是大模型时代必然的发展方向,也是昆仑万维天工系列大模型一直以来坚持认定的战略。昆仑万维董事长兼CEO方汉表示,“超 级模型”是大模型时代发展的必然,未来,行业内将出现不止一个“超 级模型”,昆仑万维也将持续朝着这一方向不断努力,持续为用户提供更智能、更高效、更可靠的人工智能服务。

想了解更多「天工3.0」的全新AI功能升级,欢迎持续关注昆仑万维集团公众号,并锁定4月17日下载新版“天工AI助手”App,享受超 级模型的震撼AI体验。

All in AGI与AIGC

自2023年4月17日发布自研双千亿级大语言模型「天工」后,昆仑万维围绕自研「天工」系列大模型,打造了一系列颠覆性的前沿AI产品:

2023年8月,昆仑万维推出国内第 一款AI搜索产品天工AI搜索;9月,昆仑万维推出多模态大模型Skywork-MM,在多模态大语言模型测评MME中综合得分排名第 一;10月,昆仑万维开源百亿级大语言模型天工Skywork-13B系列;12月1日,昆仑万维发布国内领先的AI Agent开发平台天工SkyAgents;2024年2月,天工基座大模型更是迎来了推出以来的最 大版本更新天工2.0,成为国内首 个搭载MoE架构并面向全体C端用户免费开放的千亿级参数大语言模型AI应用。

当前,昆仑万维天工系列大模型在技术、产品、合作、社会认可、奖项荣誉等方面均取得了显著成就,获得了来自社会各界的多方认可。基于天工系列大模型,昆仑万维已构建起AI大模型、AI搜索、AI音乐、AI 社交、AI动漫、AI游戏等AI业务矩阵,是国内模型技术与工程能力最 强、布局最全面的人工智能企业之一。

在2024年4月17日的一周年之际,昆仑万维「天工3.0」的震撼发布,不仅实现了AI技术的重大突破,更将深刻影响AI大模型行业的发展方向,引领AI产业迈向新的里程碑。在 “All in AGI 与 AIGC” 战略的推动下,昆仑万维始终致力于AI技术的创新和开拓,不断降低用户的AI学习使用门槛,持续推动AI业务迈向新高度,提高多款AI产品的用户体验,与广大用户携手探索未知世界、创造美好未来。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • AI日报:智谱AI发布AutoGLM 2.0;腾讯元宝接入腾讯视频;字节发布开源大语言模型 Seed-OSS

    本期AI日报聚焦多项AI技术突破:智谱发布革命性语音代理AutoGLM 2.0,实现全平台语音操控;腾讯元宝接入视频平台提升观影便捷性;字节跳动开源大模型Seed-OSS专注长文本处理;速卖通AI代理助力新品推广效率翻倍;微软测试Copilot智能文件搜索功能;Liquid AI推出低延迟视觉语言模型LFM2-VL;OpenAI月收入首破10亿美元;谷歌Pixel 10系列全面升级AI功能,包括情感识别和实时翻译;Pixel Buds Pro 2引入AI手势控制;ElevenLabs发布支持70+语言的文本转语音API。

  • 昇腾助力中科大团队实现MoE 稀疏大模型并行推理提速超30%

    中国科学技术大学张燕咏团队在昇腾算力支持下,成功研发出基于专家选择分布预测的专家负载均衡和all2all通信均衡框架。该框架通过“三步走”策略,有效解决了MoE稀疏大模型推理中的专家负载不均和通信开销大两大难题,显著提升推理性能。实验显示,该方案在多项指标上较主流方案提升超30%,为昇腾技术优化MoE模型推理提供了宝贵借鉴,将加速其在各领域的落地应用。

  • 如何精准计算AI大模型调用成本?复杂参数太多,预算总超支怎么办?

    文章探讨了AI模型调用成本管理的痛点,包括GPT-4等模型复杂的计费规则(如Token分级、上下文溢价、多模态叠加收费)导致实际成本常超预算40%。提出AIbase计算器三步解决方案:自动匹配场景参数、实时联动报价、明细成本拆解。通过跨境电商客服和高校实验室案例验证工具有效性,强调数据溯源、用量预警和预算缓冲功能,帮助开发者实现精准成本控制,告别手动制表与定�

  • 如何用3分钟精准计算AI大模型成本?避免生成一篇万字文章就超支?

    AI大模型成本控制指南:实测三步预算法+企业级避坑方案。文章揭露行业痛点:1)价格迷雾:各厂商计费规则差异大,长文本/多模态存在隐藏溢价;2)团队实测GPT-4生成20篇行业分析(50万字)实际账单超预算4倍。解决方案:通过AIbase计算器实现精准预测:①场景化选择自动加载计费规则;②输入需求实时生成动态成本矩阵;③智能规避四大隐性成本(长文本衰减补偿/区域差价预警等)。跨境电商案例显示,使用工具后成本降低60%。核心观点:在AI时代,成本控制能力已成为企业核心竞争力。

  • 昆仑万维UniPic 2.0“小钢炮”模型炸场,一个模型搞定理解+生成+编辑

    大模型又迎来新一波的迭代周期。 近日,从Open AI发布GPT-5,到国内的昆仑万维、商汤、百川智能、智谱等都陆续发布了自己的新模型。其中昆仑万维更是一口气开启了技术周,连续5天每天发布一个新模型,而8月13日发布的,正是其本周发布的第三款模型——多模态统一模型UniPic2.0。 UniPic2.0主打的是,在单一模型中深度融合图像理解、文本到图像生成、图像编辑三大核心能力

  • AI大模型计费器如何精准比价?38款模型隐藏费用一键预警,三步告别超支

    文章揭示了AI项目成本失控的三大痛点:1)计费维度分裂,如输入/输出token分开计价;2)参数迷雾,如文心一言4.0增强模式成本是基础版3.2倍;3)汇率陷阱,海外模型美元报价波动导致实际成本偏差超15%。通过AIbase费用计算器可精准测算:支持38个主流API对比,包含隐藏费用提醒,提供四大维度的决策矩阵(百万token成本/长文本溢价/月度总价/性价比评分)。案例显示某团队发现自研模型成本比通义千问高27%后及时调整采购策略。该工具能帮助开发者避免"成本黑箱",实现零成本预算推演。

  • 百川开源最新医疗大模型,中国力量领跑医疗AI赛道

    专注医疗后,百川智能交出第一份答卷! 8月11日,百川智能发布第二款开源医疗增强推理大模型Baichuan-M2,其以32B的参数量,在OpenAI的Healthbench评测集上,超越其刚刚发布5天的开源模型gpt-oss-120b。

  • AI应用太烧钱?我们用一款精准的AI大模型费用计算器做出了清晰预算

    初创团队“智询未来”在开发AI问答应用时面临核心模型选择困境:GPT-4-turbo能力强但价高,Claude-3长文本处理优,Llama-3成本低但性能稍弱。通过AIbase成本计算器精准测算,发现Claude-3-Sonnet性价比最优,每月可省近4000元,还能通过优化提示词进一步降本15%。数据驱动的决策让团队将节省预算投入数据安全和提示词优化,凸显成本测算对初创企业技术选型的重要性。

  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • 如何快速精准计算AI大模型费用?试试这个三步完成的免费工具!

    文章讲述AI项目预算失控的普遍现象:李工团队因手动计算GPT-4等大模型调用成本复杂,最终预算比实际支出少25%。行业调查显示73%团队曾因模型成本失控被迫调整项目。AIbase推出三步极速成本计算器解决痛点:1)集成50+主流大模型参数库;2)用自然语言描述需求即可生成预算;3)10秒输出详细成本对比报告。该工具已帮助电商企业节省40%预算,其优势在于实时追踪官方定价、智能匹配场景规则、自动生成多模型对比报告,让晦涩的token计价变得直观透明。目前已有超12万开发者使用该工具优化AI项目成本。

今日大家都在搜的词: