首页 > 业界 > 关键词  > 天工大模型3.0最新资讯  > 正文

天工大模型3.0即将发布:同步开源4000亿参数MoE模型

2024-04-01 15:30 · 稿源: 快科技

昆仑万维宣布,天工大模型 3.0 将于 4 月 17 日发布,同时开源包含 4000 亿参数的 MoE 模型。

这款模型采用了混合专家架构,是全球参数规模最大的 MoE 模型之一,在多个领域表现突出。

与前代天工 2.0 相比,天工 3.0 在语义理解、推理、泛化性、不确定性知识处理和学习能力等方面显著提升。技术知识能力提升超过 20%,数学、推理、代码和文创能力提升超过 30%。

天工 3.0 引入了新功能,包括搜索增强、研究模式、代码调用、图表绘制和联网搜索。它还针对性地增强了 Agent 能力,使其能够自主完成规划、调用和组合外部信息,高效处理复杂需求,如产业分析和产品对比。

该模型是一项多模态应用,集成了搜索、写作、对话、语音合成、图片生成、漫画创作、识别、音乐生成、代码编写和表格生成等功能。

值得注意的是,天工 3.0 中的 AI 音乐生成模型 SkyMusic 将于 4 月 2 日开放申请,展示其创新和应用潜力。

天工大模型 3.0 的发布和开源将加速人工智能领域的进展,为产业界和学术界带来新的机遇。

举报

  • 相关推荐
  • 刚刚,商汤发布第六代大模型:6000亿参数多模态MoE,中长视频直接可推理

    现在的国产AI应用,一口气看好几分钟的视频,都可以直接做推理和解析了!瞧~只需“喂”上一段柯南片段,AI就摇身一变成“名侦探”做剖析:它会对整个视频的内容先做一个总结,再按照秒级,对视频片段做内容上的推演。商汤科技联合创始人杨帆认为:银河通用合伙人、大模型负责人张直政表示:除此之外,上海交通大学副教授闫维新对这个问题的看法是:总言之,商汤作为国�

  • 男子每天通勤6小时:月交通费4000

    河北张家口的李先生从2023年开始每天坐高铁去北京上班,从家到单位大约需要3个小时。单位在北京西直门,附近房租约5000元/月,每月交通费约4000元左右,现在结婚有孩子了,想多陪陪家人。长时间通勤会降低人们的生活质量和幸福感,单程通勤超60分钟会损害身心健康,但也有网友认为,通勤时间增加可能提高员工的工作效率,倒逼个体提高长期绩效。

  • 1000万上下文!新开源多模态大模型,单个GPU就能运行

    今年2月初,谷歌发布的Gemini2.0Pro支持200万上下文,震惊了整个大模型领域。仅过了2个月,Meta最新开源的Llama4Scout就将上下文扩展至1000万,整整提升了5倍开启千万级时代。根据实验数据显示,Llama4Behemoth在MMLUPro、GPQA、MATH-500等测试的数据比GPT-4.5、ClaudeSonnet3.7、Gemini2.0Pro更好。

  • 于东来称员工到手工资至少4000:做不到超市就可以关了

    胖东来创始人于东来日前与联商网董事长庞小伟对话,谈到了调改”与超市行业现状。于东来认为,超市行业面临困难需要重新梳理,把不好的产品下架,同时要优化员工的体验。胖东来商贸集团2024年销售数据显示,2024年胖东来商贸集团销售额达169.64亿元,各业态中年销售额最高的是超市,许昌达到59.45亿元,新乡为21.48亿元,单品中茶叶销售额为6.19亿元,15个销售场所中时代广场营业额最高,达到44.13亿元。

  • 领峰环球解读3大戏剧性财经事件!疯狂多头看黄金剑指4000

    3月黄金收官战,金市风云变幻,市场好戏连台,一系列戏剧性事件接连上演。难怪有黄金大多头喊出下一目标4000的豪言壮志!13年知名交易平台领峰环球,将以优质服务,托举投资者从容布局,稳稳拿好黄金投资的逆袭剧本。

  • 同程商旅发布白皮书:中国商旅市场规模预计超4000亿美元,东南亚成出海“破浪”核心区

    《2024-2025中国商旅管理白皮书》发布,全球商旅市场迎来全面复苏。2024年全球商旅支出预计恢复至1.48万亿美元,首次超过2019年水平,中国市场贡献近三成。亚太地区领跑全球,拉美增长36.3%,中东非洲因地缘冲突跌幅最深。报告提出"韧性、破浪、重构、AI+、跃迁"五大关键词:供应链韧性成为企业核心关注点;跨境差旅需求占比提升至3.3%,东南亚成战略跳板;Z世代推动"商务+休闲"混合办公模式普及,相关市场规模达6927.3亿美元;AI技术全面渗透差旅全链条,机票智能预订可节省58%成本;商旅管理公司正向生态协同者转型。白皮书指出,未来差旅管理将融合人文、智能与生态协同,成为企业全球化布局的重要战略资源。

  • 国产GPU服务器迎大订单!浙江联通超4000万元预算集采

    快科技4月8日消息,今天,中国联通浙江分公司启动了国产GPU服务器采购项目的招标工作,项目预算4058.24万元。此次招标预估采购32台GPU服务器和8台ROCE交换机,不含税预算为4058.24万元,合同签订上限金额不得超过预算金额。合同有效期为自合同签订之日起12个月,若订单合计金额未达预估金额,合同有效期可延长至订单合计金额达到预估金额时止,但最多延长1年。交付时间要求为在订单下达后,21日内到货,并在到货后1周内完成安装和联调。项目还设置了最高投标限价,折扣率最高投标限价为87.21%,投标人投标报价超过最高投标限价的,将作否?

  • 联发科天玑9400+拿下最强AI手机芯片:端侧推理准确率反超云端大模型

    今日,联发科举办天玑开发者大会2025,正式发布新一代旗舰芯片天玑9400。天玑9400定位旗舰5G智能体AI芯片,综合AI跑分是天玑9400的1.25倍,支持最高8B规模的DeepSeek-R1端测部署,推理准确率反超云端大模型。天玑9400采用台积电第二代3nm工艺,CPU架构延续创新全大核设计,包含1颗主频3.7GHz的Cortex-X925超大核、3颗3.3GHz的Cortex-X4大核与4颗2.4GHz的Cortex-A720大核。

  • 20万级AI智驾轿跑!小鹏P7+上市四个月累计交付突破40000大关

    小鹏汽车董事长何小鹏宣布,小鹏P7自上市以来四个月累计交付量已超过40000台。这款纯电轿车共推出三款车型,售价区间为18.68至21.88万元。动力提供180kW和230kW两种功率选择,最高车速200km/h,纯电续航分别为620km和710km,搭载磷酸铁锂电池组。

  • 火山引擎即将发布深度思考模型

    据悉,字节跳动旗下云服务平台火山引擎即将发布豆包深度思考模型。有消息称,豆包APP和桌面端的“深度思考模式”已进行了多个实验版本的测试,而此次发布后,该模型将正式面向企业提供服务。目前,豆包大模型家族已覆盖全模态、全场景,包括大语言模型、语音大模型,以及图像、视频等视觉大模型,企业可以通过火山引擎使用豆包大模型API服务。IDC最新发布的《中�