有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

2025-06-23 17:34 · 稿源：站长之家用户

6月23日，网易有道宣布正式开源“子曰3”系列大模型的数学模型（英文名称Confucius3-Math）。这是国内首个专注于数学教育，可在单块消费级GPU上高效运行的开源推理模型。其在一系列数学推理任务中取得当前最优性能，超越了许多规模更大的通用模型。该模型的开源，为教育领域提供了低成本、高性能的AI解决方案，推动大模型技术向教育领域加速渗透。

低成本高性能，助力教育公平

据悉，“子曰3数学模型”在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法，推理性能约为DeepSeek R1的15倍。

测试数据显示，在CK12-math（Internal）、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上，14B轻量级的“子曰3数学模型”各项得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中，“子曰3数学模型”的得分高达98.5分。

除了出色的性能，“子曰3数学模型”的成本优势同样显著，其在消费级GPU即可运行，大大降低了教育场景的AI应用门槛。

事实上，中小学教育长期面临教育资源不平等、个性化辅导资源不足、复杂题型讲解成本高等痛点，而教育大模型能有效辅助提升学习效果，但高性能大模型的构建和部署成本却非常高昂，许多低收入地区难以负担。

针对这一问题，“子曰3数学模型”实现了部署性能的极致突破，服务成本每百万token低至0.15美元，远超目前大多数通用大模型的成本效益。这意味着更广泛的普通教育机构和开发者都能以低成本部署专业级的数学AI应用。

“对于行业而言，‘子曰3数学模型’证明了在低成本情况下，在特定领域构建强大推理模型的可行性，为垂类推理大模型的研发与应用提供了重要参考。”网易有道首席科学家段亦涛表示。

“AI+教育”加速进化，子曰释放教育大模型应用价值

自2023年7月推出国内首个教育大模型“子曰”以来，网易有道在“AI+教育”领域加速进化，持续释放大模型在教育行业的应用价值。

从“子曰”大模型在一年内快速推出10余个垂直应用，到今年初发布国内首个输出分步式讲解的推理模型“子曰-o1”，再到如今“子曰3数学模型”正式开源，网易有道充分结合应用场景进行模型迭代和优化，持续推动教育大模型技术创新和应用落地。

此次“子曰3数学模型”发布及开源，标志着“子曰”大模型系列在轻量级模型推理能力上实现了又一重要突破，也使得有道在教育大模型领域长期积累的技术成果能够共享给更多的开发者和从业者，构建起协同发展的行业格局。

段亦涛强调:“AI+教育的终极目标不是替代教师，而是让技术成为教育公平的杠杆。希望‘子曰3数学模型’的开源能够吸引更多开发者加入，共同探索推理模型在教育领域的应用价值。”

（推广）

特别声明：以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布，本平台仅提供信息存储服务，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任，相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提供身份证明、权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述法律文件后，将会依法依规核实信息，沟通删除相关内容或断开相关链接。

相关推荐

关键词：

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0，在多项基准测试中表现优异；阿里通义7款模型登顶Hugging Face榜单，Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限，可自动完成视觉任务；特斯拉推进人形机器人量产，马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密，苹果内部测试聊天机器人Veritas优化Siri，YouTube推出AI音乐主播增强互动，LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。

AI 开源模型高性能思考模型
荐AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Gaga AI发布；vivo蓝心3B端侧大模型发布

本文汇总AI领域最新动态：美图通过组织变革推动AI应用RoboNeo月活破百万；vivo发布蓝心3B端侧大模型，性能超越8B模型；Gaga AI实现静态照片生成60秒电影级视频；ChatGPT周活用户突破8亿；Figma引入Gemini模型提升设计效率；印度试点AI聊天机器人购物；Figure AI推出第三代家用机器人Figure 03；谷歌推出Gemini Enterprise自动化工作流平台。显示AI正从工具向创作者跃升，加速渗透各行业。

AI原生美图RoboNeo MAU破百万
荐没想到，音频大模型开源最彻底的，居然是小红书

不难发现，近几个月，开源频频成为 AI 社区热议的焦点。尤其是对于国内科技公司来说，开源成为主旋律。根据 Hugging Face 中文 AI 模型与资源社区的数据显示，国内厂商在七八月接连开源33款、31款各类型大模型。这些开源成果大多落在了文本、图像、视频、推理、智能体以及世界模型领域，而音频生成占比很小。

开源 AI社区音频生成
GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

随着AI大模型成为用户获取信息的主要入口，AIBase推出GEO排名查询工具，帮助品牌监测在豆包、DeepSeek、文心一言等主流AI平台中的曝光情况。该工具支持多平台检测、关键词追踪、可视化数据展示，可精准分析品牌是否被推荐、出现频次及具体场景，为制定AI大模型排名优化策略提供数据支撑。在GEO时代，抢占AI回答推荐位意味着获得全新流量入口。

AI大模型 GEO排名查询生成引擎优化
可丽尔博士：以科技重塑微笑，用专业守护健康——全面解析民族正畸品牌的全周期解决方案

可丽尔博士秉持“让百姓看得好牙、看得起牙”理念，依托完善的产品体系与智能化技术，为全年龄段用户提供专业高效的正畸服务。其C3系统覆盖儿童及青少年全周期矫治，推出C3Lite、C3Pro等六类产品精准应对不同错颌畸形；C4系统专注成人隐形矫治，兼顾美观与效能，提供青春版、专家版等多类型方案。品牌创新十余种隐形功能装置，并构建AI与大数据的智能诊疗系统，实现

可丽尔博士正畸服务 C3系统
考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

9月28日，在成都举行的“2025天府人工智能产业生态大会”上，考拉悠然宣布其自主研发的“悠然无界大模型BLM-1.0”完成迭代升级并全面开源，同时发布基于该模型的UU Holo Glass O1 AR工业眼镜。此举标志着公司以“技术开源+场景落地”双轮驱动策略，推动空间智能产业生态共建。BLM-1.0突破传统模型局限，具备跨空间、跨任务、跨本体的“三跨”统一能力，在空间理解、推理与执行三大核心能力上刷新行业纪录。配套AR眼镜深度融合空间感知与多模态交互，实现工业运维、安装巡检等场景的全程自动化与智能辅助，显著提升效率并降低成本。

人工智能开源大模型空间智能
Infobip亮相2025云栖大会，发布对话式 AI 解决方案，助力中国企业出海

2025云栖大会于9月24-26日在杭州举办，聚焦超级人工智能（ASI）发展路径，定义智能涌现、自主行动、自我迭代三阶段。大会设三大展馆、110余场论坛，吸引全球超12万人次线下参会及6700万线上观看。全球云通信平台Infobip展示全渠道沟通、AI营销等方案，助力企业实现智能化、个性化客户互动，强调整合消息应用与AI技术以满足多样化需求，推动数字化转型与全球化发展。

云栖大会超级人工智能 AI云技术
天网杯纳米AI视频创作赛圆满落幕，ISC.AI学苑推动“教育AI+”新范式

9月23日，第三届“天网杯”网络安全大赛在天津落幕，吸引全国顶尖战队角逐，同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈骗等网络安全议题，通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持，依托“纳米AI”技术降低创作门槛，推动“安全+AI”人才培养。大赛评选出24个奖项，并联合多所高校深化合作，促进AI技术在教育场景的落

天网杯网络安全大赛纳米AI
云栖大会智舱黑科技：全球首个全模态端侧大模型解决方案，斑马智行首发

9月24日，2025云栖大会在杭州开幕，主题为“云智一体·碳硅共生”，汇聚全球50多国2000余位嘉宾探讨AI、云计算与产业应用趋势。阿里云发布7款通义大模型，其中Qwen3-Omni作为行业首个端到端全模态AI大模型，在36项基准测试中实现22项SOTA，性能全面突破。大会聚焦多模态技术，斑马智行宣布率先接入Qwen3-Omni，并与阿里云、高通联合推出端到端全模态端侧大模型方案Auto+Omni，具备主动智能、断网可用、隐私无忧三大特点，推动汽车智能座舱从指令交互向Always-on主动服务升级。首批搭载方案车型将于2026年量产，标志着汽车智能化迈入“自主行动”新阶段。大会将持续至26日，预计更多创新技术将亮相。

云栖大会通义大模型 AI技术
元萝卜入驻玩具反斗城百店，AI新引擎为儿童素质教育按下加速键

商汤科技旗下家用机器人品牌元萝卜近日与玩具反斗城达成深度合作，其产品自9月底起入驻后者全国百家核心门店。此次合作覆盖渠道打通、门店销售及线下活动，标志着元萝卜从专业教育向智慧玩伴升级，推动AI启蒙教育普及。玩具反斗城成熟的运营模式与元萝卜“寓教于乐”的产品理念高度契合，通过线下场景让更多家庭近距离体验AI教育产品，助力儿童在棋类对弈中培养逻辑思维等核心能力。

商汤科技元萝卜玩具反斗城

今日大家都在搜的词：

热文

3 天
7天

有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

荐AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠榜Hugging Face；Veo3视觉能力升级

荐AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Gaga AI发布；vivo蓝心3B端侧大模型发布

荐没想到，音频大模型开源最彻底的，居然是小红书

GEO排名查询工具推荐:霸屏AI大模型答案的核心方法，做好AI大模型排名优化

可丽尔博士：以科技重塑微笑，用专业守护健康——全面解析民族正畸品牌的全周期解决方案

考拉悠然开源悠然无界大模型BLM-1.0，以空间智能引擎驱动产业变革

Infobip亮相2025云栖大会，发布对话式 AI 解决方案，助力中国企业出海

天网杯纳米AI视频创作赛圆满落幕，ISC.AI学苑推动“教育AI+”新范式

云栖大会智舱黑科技：全球首个全模态端侧大模型解决方案，斑马智行首发

元萝卜入驻玩具反斗城百店，AI新引擎为儿童素质教育按下加速键

今日大家都在搜的词：

热文

AI日报：Veo 3.1可生成1分钟视频；蚂蚁发布万亿参数语言模型 L

京东双11今晚开启：现货开卖官方直降低至一折

iQOO 15官宣：10月20日发布

三星W26折叠屏手机官宣10月11日发布

新款智界R7/S7上市44天大定破38000台

荣耀Magic8系列暨MagicOS10发布会定档10月15日

iQOO 15搭载自研电竞芯片Q3 能效提升40%

影视飓风Tim送罗永浩顶配iPhone17ProMax 后者锐评：越做越难看

真我官宣与理光达成影像战略合作：真我GT8 Pro首发搭载

AI日报：美图RoboNeo上线首月MAU破百万；影视级音画同步模型Ga

微信又更新了撤回消息有大变化：可撤回本次发送的全部消息