破局美半导体出口管制：国内首个千亿级MoE架构大模型开源

2024-04-02 11:47 · 稿源：站长之家用户

在人工智能领域，一场由APUS与新旦智能联手掀起的开源革命正在上演。

4月2日，APUS与战略合作伙伴新旦智能联合训练、研发的千亿MoE（Mixture of Experts）架构大模型，在GitHub上正式开源。从适配低端算力芯片实现行业普惠，到国内首个开源的千亿参数 MoE架构大模型模型提质增效，APUS-xDAN 大模型4.0(MoE)的应用之风将强势来袭。

相比国内其他大模型公司，此次与APUS联合开源大模型的新旦智能略显年轻，但创始团队阵容却颇为豪华:这是一支由清华、伯克利、腾讯、Meta等顶尖学术与工程界精英组成的团队，成员包括全球顶尖的开源AI社区知名开发者、资深腾讯云架构师等，并已于今年3月初，完成了万级别的天使轮融资，由APUS与AI行业资深投资人周弘扬联合投资。

此次双方强强联合，集成各方优势，让APUS-xDAN 大模型4.0（MoE）在4090之类的低端算力芯片上，综合性能达到了GPT-4的90%。这一全新突破，将为中国企业应用大模型技术提供更大价值，进一步通过算法优化成功破解“算力卡脖子”的难题。

适配低端算力芯片，开启技术普惠新时代

近日，美国商务部发布公告，对美国2023年10月17日发布的半导体出口管制规则进行修订，除此前限制英伟达等公司向中国出口先进的AI芯片，这次新规再次加码，对向中国出口芯片的限制也适用于包含低端芯片的笔记本电脑，标志着中国将更难获取美国人工智能芯片和芯片制造工具。

面对国内算力资源局限与国际技术封锁，APUS董事长兼CEO李涛谈到:“中国要想跳出由美牵头设计的‘算力陷阱’，一方面就要从算法上进化，能用低端算力来做高端模型;另一方面则是持续推动应用生态的进化，只有坚持双向进化，才有可能实现破局。”

而此次开源的，APUS-xDAN 大模型4.0（MoE）就是集合数据、工程和芯片4090上顺畅运行的千亿参数规模大模型，APUS-xDAN 大模型4.0(MoE)进一步破局美半导体出口管制，成功助力中国AI产业在模型应用上实现普惠。

经实际测试显示，APUS-xDAN 大模型4.0（MoE）从技术指标上来看，模型数学能力的GSM8K达到79分，理解能力的MMLU达到73分，推理能力的BBH达到了66分，综合性能超过GPT3.5，逼近GPT4，在数学能力上更是碾压马斯克开源的Grok。

对政府而言，APUS-xDAN 大模型4.0（MoE）的诞生意味着在有限的国产算力资源下，我国依然能自主构建并运行顶级超大规模语言模型，大幅提升国家层面的技术自给自足能力与战略安全。

对企业和个人开发者，尤其是资金有限的小创业者，无需斥巨资购置高端GPU，如A100和H100，仅需借助相对经济的4090，即可驾驭这款强大的AI工具，极大地降低了创新门槛，实现AI技术的普及与广泛应用。

国内千亿MoE架构模型开源，重塑效能边界

不难发现，此次开源的APUS-xDAN 大模型4.0率先引入MoE（Mixture of Experts）架构，成为国内首个开源的千亿参数MoE架构大模型。相较于其他宣称拥有MoE架构但未开源验证的模型，APUS-xDAN 大模型4.0(MoE)真正将MoE架构应用于超大规模模型。

值得一提的是，APUS-xDAN 大模型4.0（MoE）采用GPT4类似的MoE架构，特点是多专家模型组合，同时激活使用只有2个子模块，实际运行效率对比传统Dense同尺寸模型效率提升200%，推理成本下降400%。在实际部署上，通过进一步的高精度微调量化技术，模型尺寸缩小500%，从而拥有了国内首个可以在消费级显卡运行的千亿MoE中英文大模型。

这些特性赋予APUS-xDAN 大模型4.0（MoE）在处理复杂任务时，拥有很难相比的学习效率与模型容量，为人工智能的边界拓展注入澎湃动力，为中国AI产业开拓了全新破局路线，成为国产大模型创新探索的先行军。

此次，APUS-xDAN 大模型4.0（MoE）以令人瞩目的1360亿参数规模，一举超越当前国内最大开源模型——阿里的千问72B(720亿参数)，综合性能达到主流大模型TOP级。这一历史性突破，不仅见证了我国在超大规模预训练模型研发领域的重大飞跃，更有力彰显了我国人工智能科研实力与技术创新力的国际地位。

构建AI产业应用生态，赋能千行万业

“AI的发展与应用，离不开大模型的支撑。而开源大模型的出现，则让更多的企业和开发者能够利用这些模型，来构建更多人工智能+应用。”李涛表示，此次，APUS-xDAN 大模型4.0（MoE）的开源，一定程度上填补了我国在千亿级别参数模型开源上的空白，也为人工智能技术的发展与应用带来了更多的可能性。

自2014年创立以来，APUS至今已推出200余款应用产品，涵盖工具、内容与服务等多个场景。APUS转型人工智能后，重构自身原生产品矩阵，以工具+AI，内容+AI，服务+AI三层应用为全线产品赋能，探索孵化用户端超级应用。

在行业应用场景上，从应用在G端网信领域能实现智能辟谣的「APUS智信大模型」，到加持B端医院智能诊疗的「APUS岐黄大模型」、智能电商营销的「APUS少伯大模型」，到C端拥有智能绘画能力的「APUS墨染大模型」、中文创作领域拥有AI写手能力的「APUS云梦大模型」，以及实现文生视频能力的「APUS墨视大模型」……APUS正加速实现大模型普惠，让AI应用更简单。

在APUS AI开放实验室，开发者可通过API接口，快速部署自己的创想应用。如今，该AI开放实验室汇聚了来自全球的顶尖AI人才，通过APUS的算力支持，共同开源、开放最新的AI大模型，进而推动AI产业健康发展。

据悉，此次开源的APUS-xDAN 大模型4.0（MoE）也是APUS继与深圳大学国家工程实验室联合开源APUS大模型3.0(伶荔)后，带来的又一个重磅大模型，标志着APUS在AI通用大模型的布局上更进一阶。

未来，面对人工智能产业的发展与挑战，APUS将通过持续的技术研发与社区共建，积极探索解决方案，不断提升开源大模型的稳定性和泛化能力，确保其在各类复杂应用场景中始终保持领先优势，进一步赋能千行万业。

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

跨境支付的未来：人工智能、嵌入式金融和即时结算

本文系统分析了人工智能、嵌入式金融与即时结算三大技术趋势如何重构跨境支付体系。人工智能通过智能填单、动态风控和预测性维护显著提升支付效率与安全性；嵌入式金融将支付功能无缝融入电商平台与供应链，实现“无跳转支付”；即时结算技术将跨境支付时间从数日缩短至秒级，并优化现金流。三大技术深度融合形成协同效应，推动跨境支付向更智能、高效、无缝�

全球支付生态数字化浪潮跨境支付体系
人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

AI应用落地面临“最后一公里”部署难题：传统流程繁琐耗时，从模型开发到上线需数周。英特尔携手戴尔与零克云打造“工作站-AI PC-云端”协同生态，通过本地工作站进行小规模测试验证，降低试错成本与数据泄露风险，再通过“一键部署”快速扩展至云端规模化落地。这种“先本地验证、后云端放大”的路径显著提升开发效率，释放团队创造力，让有价值的AI想法快速照进现实。

AI部署模型上线服务器配置
简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

广州简知科技自主研发的“简智AI大模型”通过国家生成式人工智能服务备案，标志着该模型在安全性、合规性与可靠性方面达到国家级标准。作为兴趣教育领域AI应用的重要里程碑，该模型围绕用户兴趣成长周期设计，提供个性化学习支持：可为未明确兴趣方向的用户智能推荐内容，为入门用户规划学习路径，为基础扎实用户提供进阶训练与智能反馈。其技术能力在旗下“简小知”等品牌中已实现“学—练—评—测”全流程覆盖，并通过社群互动增强学习动力。公司未来将持续优化模型能力，联合行业伙伴构建完整培养体系，推动兴趣教育向个性化、高质量方向发展。

简智AI大模型生成式人工智能兴趣教育
共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

10月28日，AtomGit平台在北京国家会议中心举行升级发布会，正式推出"开源+AI"一体化平台及人工智能开源社区。工信部副部长熊继军出席并致辞，强调建设AI开源社区对汇聚创新资源、把握科技革命机遇的重要意义。平台将整合开源模型、数据集及算力资源，打造开放中立的基础设施，计划于11月21日正式上线。华为、百度等企业代表分享了开源实践，多所高校签署了共建AI生态倡议。此举标志着我国开源生态迈向智能化时代的重要一步。

开源社区人工智能 AtomGit
人工智能巨头OpenAI拟上市估值或高达1万亿美元

OpenAI正积极推进上市计划，据知情人士透露，该公司可能最早于2026年下半年向证券监管机构提交上市申请，目标在2027年正式上市。此次IPO的估值有望达到约1万亿美元，或将跻身全球规模最大的IPO之列。在初步讨论中，OpenAI曾考虑通过上市筹集至少600亿美元资金，实际融资规模可能进一步扩大。

OpenAI IPO 上市计划
厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

10月28日，麒麟信安人工智能孵化器在长沙启动，旨在汇聚AI领域人才、技术与资本，构建开放协同的创新生态。该项目获湖南省多部门支持，已吸引60余个项目入围，组建了首批30余位专家导师团，并与多家顶尖机构共建联合体，通过政策扶持、资本对接等多维度赋能，培育优质AI项目在湘落地发展，助力区域打造人工智能产业创新高地。

人工智能孵化器麒麟信安创新创业
卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

卖家精灵凭借在跨境电商智能化运营与AI大数据应用领域的领先实力，近日正式加入中国人工智能产业发展联盟（AIIA），成为该国家级AI产业生态重要成员。此次加入标志着其AI技术实力获权威认可，未来将携手联盟推动AI技术研发与产业化，助力中国品牌全球化。依托八年积累的海量电商数据与算法体系，卖家精灵已构建覆盖选品决策、市场分析等全链路AI解决方案，服务超百万跨境卖家，显著提升运营效率与决策精准度。

人工智能跨境电商 AI大数据
行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

2025年10月，海尔冰箱成为全球首个通过ISO/IEC42001人工智能管理体系认证的家电企业，标志着其AI技术研发与管理达国际领先水平。该认证覆盖语音交互、视觉识别、健康保鲜等核心功能全流程，确保用户数据安全与隐私保护。目前AI系统已应用于博观、麦浪等高端产品，推动智能冰箱行业规范化发展。未来海尔将持续优化AI技术，为用户提供更安全、智能的健康饮食体验。

冰箱品牌人工智能技术海尔冰箱
人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

科杰科技董事善于洋在2025中国国际数字经济博览会发表演讲，强调高质量数据集是人工智能产业决胜关键。他指出，算力、算法和数据构成AI三大要素，而数据决定模型认知边界与输出可靠性。当前需构建Data&AI一体化平台作为核心基础设施，通过集中管理、分散赋能模式，打通数据采集、治理到AI训练全链路，推动产业智能化升级。该平台已在制造、金融等领域落地，助力企业释放数据要素价值，实现弯道超车。

人工智能数据基础设施数字经济
荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

本期AI日报聚焦多项技术突破：OpenAI推出GPT-5.1，提升对话自然度与响应速度；百度发布原生全模态大模型文心5.0，支持跨文本图像生成；微博开源VibeThinker-1.5B模型，以低成本实现高效推理；可控视频生成模型新增首尾帧控制功能；李飞飞团队推出商用3D世界生成工具Marble；东北大学开源多语言翻译模型支持60种语言；谷歌Gemini语音功能升级实现更自然交互；阿里启动“千问”项目对标ChatGPT，全面布局C端AI应用竞争。

AI视频生成可灵2.5Turbo 首尾帧功能

今日大家都在搜的词：

热文

3 天
7天

破局美半导体出口管制：国内首个千亿级MoE架构大模型开源

跨境支付的未来：人工智能、嵌入式金融和即时结算

人工智能落地“最后一公里”，戴尔工作站助力AI应用提速

简知科技“简智AI大模型”通过国家生成式人工智能服务备案，助力兴趣教育迈向智能化新阶段

共建·共智·共享--新一代AtomGit平台暨人工智能开源社区发布

人工智能巨头OpenAI拟上市估值或高达1万亿美元

厚植AI创新沃土！麒麟信安打造人工智能孵化器，赋能创业梦想

卖家精灵加入中国人工智能产业发展联盟（AIIA），加速AI赋能跨境电商

行业首个！海尔冰箱获ISO/IEC 42001人工智能管理体系认证

人工智能产业决胜与 Data&AI 数据基础设施建设——科杰科技于洋中国国际数字经济博览会主题演讲

荐AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能；微博推出 VibeThinker-1.5B

今日大家都在搜的词：

热文

华为Mate 80系列已在华为商城开启预约

华为Mate 80 Pro Max外观公布：采用双圆环设计

华为Mate 80/Pro/Pro Max/RS开启预约：全系直屏设计

AI日报：阿里千问APP公测；Veo 3.1上线多图参考；超级小爱AI大

荣耀500系列官宣将于11月24日发布

小米超级小爱AI大模型推出随心修图功能

一加Ace 6T官宣将于本月发布：首发骁龙8 Gen5

阿里巴巴回应千问崩了：状态良好欢迎来问

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

华为Mate 80系列已在华为商城开启预约

AI日报：百度发布文心5.0；可灵2.5Turbo模型上线“首尾帧”功能

AI日报：李飞飞Marble 3D世界模型公测；OpenAI首次推出ChatGPT

荣耀500系列开启预约：Pro版外观首次亮相

华为Mate 80 Pro Max外观公布：采用双圆环设计

1899元苹果手机包卖完了！iPhone Pocket在吐槽声中销售火爆

iPhone Pocket正式开售：联名三宅一生售价1299元起

站长商机