首页 > 传媒 > 关键词  > 人工智能最新资讯  > 正文

破局美半导体出口管制:国内首个千亿级MoE架构大模型开源

2024-04-02 11:47 · 稿源: 站长之家用户

人工智能领域,一场由APUS与新旦智能联手掀起的开源革命正在上演。

4月2日,APUS与战略合作伙伴新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型,在GitHub上正式开源。从适配低端算力芯片实现行业普惠,到国内首 个开源的千亿参数MoE架构大模型模型提质增效,APUS-xDAN 大模型4.0(MoE)的应用之风将强势来袭。

相比国内其他大模型公司,此次与APUS联合开源大模型的新旦智能略显年轻,但创始团队阵容却颇为豪华:这是一支由清华、伯克利、腾讯、Meta等顶 尖学术与工程界精英组成的团队,成员包括全球顶 尖的开源AI社区知名开发者、资 深腾讯云架构师等,并已于今年3月初,完成了万级别的天使轮融资,由APUS与AI行业资 深投资人周弘扬联合投资。

此次双方强强联合,集成各方优势,让APUS-xDAN 大模型4.0(MoE)在4090之类的低端算力芯片上,综合性能达到了GPT-4的90%。这一全新突破,将为中国企业应用大模型技术提供更大价值,进一步通过算法优化成功破解“算力卡脖子”的难题。

适配低端算力芯片,开启技术普惠新时代

近日,美国商务部发布公告,对美国2023年10月17日发布的半导体出口管制规则进行修订,除此前限制英伟达等公司向中国出口先进的AI芯片,这次新规再次加码,对向中国出口芯片的限制也适用于包含低端芯片的笔记本电脑,标志着中国将更难获取美国人工智能芯片和芯片制造工具。

面对国内算力资源局限与国际技术封锁,APUS董事长兼CEO李涛谈到:“中国要想跳出由美牵头设计的‘算力陷阱’,一方面就要从算法上进化,能用低端算力来做高端模型;另一方面则是持续推动应用生态的进化,只有坚持双向进化,才有可能实现破局。”

而此次开源的,APUS-xDAN 大模型4.0(MoE)就是集合数据、工程和芯片4090上顺畅运行的千亿参数规模大模型,APUS-xDAN 大模型4.0(MoE)进一步破局美半导体出口管制,成功助力中国AI产业在模型应用上实现普惠。

经实际测试显示,APUS-xDAN 大模型4.0(MoE)从技术指标上来看,模型数学能力的GSM8K达到79分,理解能力的MMLU达到73分,推理能力的BBH达到了66分,综合性能超过GPT3.5,逼近GPT4,在数学能力上更是碾压马斯克开源的Grok。

对政府而言,APUS-xDAN 大模型4.0(MoE)的诞生意味着在有限的国产算力资源下,我国依然能自主构建并运行顶 级超大规模语言模型,大幅提升国家层面的技术自给自足能力与战略安全。

对企业和个人开发者,尤其是资金有限的小创业者,无需斥巨资购置高端GPU,如A100和H100,仅需借助相对经济的4090,即可驾驭这款强大的AI工具,极大地降低了创新门槛,实现AI技术的普及与广泛应用。

国内千亿MoE架构模型开源,重塑效能边界

不难发现,此次开源的APUS-xDAN 大模型4.0率先引入MoE(Mixture of Experts)架构,成为国内首 个开源的千亿参数MoE架构大模型。相较于其他宣称拥有MoE架构但未开源验证的模型,APUS-xDAN 大模型4.0(MoE)真正将MoE架构应用于超大规模模型。

值得一提的是,APUS-xDAN 大模型4.0(MoE)采用GPT4类似的MoE架构,特点是多专家模型组合,同时激活使用只有2个子模块,实际运行效率对比传统Dense同尺寸模型效率提升200%,推理成本下降400%。在实际部署上,通过进一步的高精度微调量化技术,模型尺寸缩小500%,从而拥有了国内首 个可以在消费级显卡运行的千亿MoE中英文大模型。

这些特性赋予APUS-xDAN 大模型4.0(MoE)在处理复杂任务时,拥有很难相比的学习效率与模型容量,为人工智能的边界拓展注入澎湃动力,为中国AI产业开拓了全新破局路线,成为国产大模型创新探索的先行军。

此次,APUS-xDAN 大模型4.0(MoE)以令人瞩目的1360亿参数规模,一举超越当前国内最 大开源模型——阿里的千问72B(720亿参数),综合性能达到主流大模型TOP级。这一历史性突破,不仅见证了我国在超大规模预训练模型研发领域的重大飞跃,更有力彰显了我国人工智能科研实力与技术创新力的国际地位。

构建AI产业应用生态,赋能千行万业

“AI的发展与应用,离不开大模型的支撑。而开源大模型的出现,则让更多的企业和开发者能够利用这些模型,来构建更多人工智能+应用。”李涛表示,此次,APUS-xDAN 大模型4.0(MoE)的开源,一定程度上填补了我国在千亿级别参数模型开源上的空白,也为人工智能技术的发展与应用带来了更多的可能性。

自2014年创立以来,APUS至今已推出200余款应用产品,涵盖工具、内容与服务等多个场景。APUS转型人工智能后,重构自身原生产品矩阵,以工具+AI,内容+AI,服务+AI三层应用为全线产品赋能,探索孵化用户端超 级应用。

在行业应用场景上,从应用在G端网信领域能实现智能辟谣的「APUS智信大模型」,到加持B端医院智能诊疗的「APUS岐黄大模型」、智能电商营销的「APUS少伯大模型」,到C端拥有智能绘画能力的「APUS墨染大模型」、中文创作领域拥有AI写手能力的「APUS云梦大模型」,以及实现文生视频能力的「APUS墨视大模型」……APUS正加速实现大模型普惠,让AI应用更简单。

在APUS AI开放实验室,开发者可通过API接口,快速部署自己的创想应用。如今,该AI开放实验室汇聚了来自全球的顶 尖AI人才,通过APUS的算力支持,共同开源、开放最 新的AI大模型,进而推动AI产业健康发展。

据悉,此次开源的APUS-xDAN 大模型4.0(MoE)也是APUS继与深圳大学国家工程实验室联合开源APUS大模型3.0(伶荔)后,带来的又一个重磅大模型,标志着APUS在AI通用大模型的布局上更进一阶。

未来,面对人工智能产业的发展与挑战,APUS将通过持续的技术研发与社区共建,积极探索解决方案,不断提升开源大模型的稳定性和泛化能力,确保其在各类复杂应用场景中始终保持领先优势,进一步赋能千行万业。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 半导体行业关注度爆表!亚洲半导体与集成电路展重磅来袭

    半导体行业近期热度持续攀升,主要受AI技术革命和国产替代双轮驱动。亚洲半导体展即将开幕,行业龙头如韦尔股份、安集科技等备受关注,机构调研次数突破3000次。AI芯片需求激增,预计2025年市场规模将超1500亿美元,HBM产能年增超50%。国产替代加速,国家大基金三期注资超1600亿元,北方华创等企业在关键领域取得突破。先进封装技术如台积电CoWoS产能翻倍增长,第三代半导体碳化硅、氮化镓在新兴产业实现规模化应用。全球科技盛会亚洲半导体展将于11月在深圳举办,推动产业交流合作。

  • 全球首个女性肿瘤AI大模型 “木兰”正式进入临床应用

    快科技5月14日消息,华中科技大学宣布,全球首个女性肿瘤AI大模型木兰”,正式进入临床应用阶段。目前,公众可通过华中科技大学同济医院”公众号或掌上同济”APP,在互联网医院下的同济木兰AI咨询”栏目中获得免费服务。未来,该模型还将通过更多手机端线上平台、电脑端应用以及各级医疗机构等多种渠道,向公众开放。据介绍,木兰”由华中科技大学同济医学院附属同济医院主导研发,该模型以国内外权威的女性肿瘤医疗指南和高质量专家共识为基础,融合了同济医院近20年来的高质量病例数据。还整合了中国工程院院士、同济医院妇产科学系主任

  • 中文大模型忠实性幻觉评测:豆包大模型幻觉率仅4%,位居全球收之首

    SuperCLUE+最新评测显示,豆包大模型1.5Pro以仅4%的幻觉率和96%的准确率位居全球榜首,超越DeepSeek、Gemini-2.5-pro和GPT-4o等主流模型。该模型在文本摘要、多文本问答等关键任务中表现优异,尤其在中文理解任务上国内领先。基于MoE架构设计,其综合性能超过多款超大规模预训练模型,推理成本显著降低。截至2025年3月,豆包大模型日均调用量达12.7万亿tokens,是一年前的106倍。IDC报告指出火山引擎以46.4%市场份额领跑中国公有云大模型市场。据悉,6月11日将发布豆包大模型最新升级进展。

  • 一场文心大模型的「AI马拉松」

    对于百度而言,既要保持长期主义的战略定力,也要在技术路径上灵活应变,这种「变与不变」的平衡或许正是其在这轮科技革命中的制胜之道。 2025年,模型能力的重要性依然无需多言。 从预训练的角度来看,虽然连 OpenAI 前首席科学家 Ilya Sutskever 都说,预训练数据即将用尽,但海量的图像、视频等多模态数据资源依然有待挖掘。 从后训练的角度来看,强化学习新范式正�

  • 持续霸榜!可灵2.0模型登顶全球视频生成大模型榜单

    快手旗下可灵AI 2.0模型在权威AI评测中表现优异,以1124分超越自研1.6版本,连续三个月蝉联全球图生视频领域冠军。4月15日发布的2.0大师版在视频质量、语义理解和画面美学等核心指标持续领先行业。数据显示,自2023年6月上线以来,可灵AI全球用户突破2200万,月活激增25倍,累计生成视频1.68亿个、图片3.44亿张。商业化方面,其单月流水已超千万元,并与伊利、vivo等头部品牌达成深度合作,展现出AI视频生成技术的广阔商业前景。

  • 高频科技发力半导体二次配领域,护航生产线稳定和产品品质升级

    半导体二次配工程作为产业链关键环节,其技术能力直接影响设备投产效率与产线稳定性。据QYResearch数据,2030年全球半导体二次配市场规模将达22亿美元,年复合增长率8.3%。高频科技旗下上海机电公司依托在泛半导体领域的技术积累,构建了覆盖超纯水系统、气体系统等完整服务体系,其高精度、高效率的二次配解决方案可缩短设备调试周期30%,降低产线运维风险。随着半导体产业向高端化发展,二次配工程的战略价值日益凸显,高频科技将持续深化技术创新,助力行业高质量发展。

  • 大模型时代:内容产业智变新浪潮

    腾讯研究院院长司晓在第15届中国(深圳)国际文化产业博览交易会上发表演讲,指出大模型技术正推动文化内容生产从"专业主导"转向"全民共创"。大模型已从工具赋能升级为生态重构,显著提升内容生产效率和质量,如腾讯混元模型支持实时图像生成与调整。AI技术加速影视、音乐等内容创作,如上海民族乐团与腾讯音乐合作的AI音乐会《零·壹 | 中国色》。同时,大模型在理解与交互能力上取得突破,如GPT-4o能准确识别物体细节。腾讯通过"探元计划"推动科技与文化融合,如"云游敦煌"等项目。未来,AI将实现"智力即服务",大幅提升创作效率和质量,推动文化内容产业进入"千人千面"新时代。

  • 东风汽车奕派007接入豆包大模型

    东风汽车旗下电动品牌奕派推出2025款奕派007,全面接入豆包大模型,实现三大智能化创新:1)毫秒级响应的全场景语音交互,支持10个高频指令同时处理;2)"情绪管家"模式可主动提供娱乐内容调节驾乘情绪;3)结合AIGC技术实现旅途画面一键艺术化创作分享。该车型通过智能决策能力和个性化服务重构人车关系,定位为Z世代"AI搭子"。未来将与火山引擎合作探索更多智能出行场景,构建差异化竞争力。

  • 构建超纯水全生命周期技术体系,高频科技为半导体发展提供可靠水质保障

    本文介绍了超纯水在半导体制造中的关键作用。超纯水是晶圆加工的核心要素,从清洗、光刻到蚀刻等工序都对水质有严苛要求。高频科技作为专业供应商,构建了覆盖制备、储运、回收全流程的技术体系,其超纯水系统可达PPT级别纯度。文章重点阐述了三大核心技术:1)超纯水制备采用多级工艺组合,确保电阻率≥18.24MΩ·cm;2)闭环配送系统实现24小时循环,通过精密控制保持水质稳定;3)废水处理采用分级工艺,回收率高达90%。这些技术解决了半导体产业用水痛点,为14nm等先进制程提供可靠保障,助力产业实现降本增效与可持续发展。

  • 拓扑破局:易能时代98%+转换效率如何改写充电行业规则

    易能时代推出40kW充电模块,采用一级拓扑架构实现98%+转换效率,突破行业瓶颈。该技术通过PFC与DC-DC融合设计,减少能量转换层级,带来体积压缩、发热集中、控制简化等优势。相比传统两级拓扑,新架构在效率提升接近极限时另辟蹊径,以系统级创新实现每度电多赚几分、单站年省数十万的实际效益。文章指出高效率不仅是参数突破,更需融入充电站经济模型。技术路径选择反映企业对市场的前瞻判断,在快充赛道中,方向选择比速度更重要。易能的方案为行业提供了兼顾高效与可持续的新思路。