首页 > 传媒 > 关键词  > 子曰3最新资讯  > 正文

有道14B低成本轻量模型“子曰3”开源,数学推理性能超越大模型

2025-06-23 17:34 · 稿源: 站长之家用户

6月23日,网易有道宣布正式开源“子曰3”系列大模型的数学模型(英文名称Confucius3-Math)。这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。其在一系列数学推理任务中取得当前最优性能,超越了许多规模更大的通用模型。该模型的开源,为教育领域提供了低成本、高性能的AI解决方案,推动大模型技术向教育领域加速渗透。

低成本高性能,助力教育公平

据悉,“子曰3数学模型”在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,推理性能约为DeepSeek R1的15倍。

测试数据显示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上,14B轻量级的“子曰3数学模型”各项得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰3数学模型”的得分高达98.5分。

除了出色的性能,“子曰3数学模型”的成本优势同样显著,其在消费级GPU即可运行,大大降低了教育场景的AI应用门槛。

事实上,中小学教育长期面临教育资源不平等、个性化辅导资源不足、复杂题型讲解成本高等痛点,而教育大模型能有效辅助提升学习效果,但高性能大模型的构建和部署成本却非常高昂,许多低收入地区难以负担。

针对这一问题,“子曰3数学模型”实现了部署性能的极致突破,服务成本每百万token低至0.15美元,远超目前大多数通用大模型的成本效益。这意味着更广泛的普通教育机构和开发者都能以低成本部署专业级的数学AI应用。

“对于行业而言,‘子曰3数学模型’证明了在低成本情况下,在特定领域构建强大推理模型的可行性,为垂类推理大模型的研发与应用提供了重要参考。”网易有道首席科学家段亦涛表示。

“AI+教育”加速进化,子曰释放教育大模型应用价值

自2023年7月推出国内首个教育大模型“子曰”以来,网易有道在“AI+教育”领域加速进化,持续释放大模型在教育行业的应用价值。

从“子曰”大模型在一年内快速推出10余个垂直应用,到今年初发布国内首个输出分步式讲解的推理模型“子曰-o1”,再到如今“子曰3数学模型”正式开源,网易有道充分结合应用场景进行模型迭代和优化,持续推动教育大模型技术创新和应用落地。

此次“子曰3数学模型”发布及开源,标志着“子曰”大模型系列在轻量级模型推理能力上实现了又一重要突破,也使得有道在教育大模型领域长期积累的技术成果能够共享给更多的开发者和从业者,构建起协同发展的行业格局。

段亦涛强调:“AI+教育的终极目标不是替代教师,而是让技术成为教育公平的杠杆。希望‘子曰3数学模型’的开源能够吸引更多开发者加入,共同探索推理模型在教育领域的应用价值。”

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 告别模型搜寻困境:AIbase模型广场让你高效找到最佳AI模型

    文章探讨了在AI技术快速发展背景下,如何高效发现和评估适合需求的AI模型这一核心挑战。传统方式存在模型分散、评估门槛高、应用场景模糊等问题。AIbase模型广场通过聚合主流平台模型、提供多维度评估(性能指标、用户反馈、易用性等)、强化场景连接(按业务问题分类)和部署辅助信息,构建了完整的模型发现与应用生态。该平台能显著提升效率,帮助开发者快速锁�

  • 模型推理协作正式开启,魔乐社区让模型跑遍“中国芯”

    魔乐社区启动"模型推理适配协作计划",旨在解决国产算力平台与大模型间的适配难题。该计划通过开源协作模式,联合开发者、芯片厂商等生态伙伴,构建从工具链到知识库的全栈支持体系,打造适配成果共享平台。重点支持开源大模型在国产硬件及多样化推理引擎上的高效运行,提供模型转换工具和优化指南,降低开发门槛。目前已有文心大模型4.5等首批适配成果�

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 国内有哪些ai大模型?一文看懂中国核心AI大模型全景

    近两年中国AI大模型发展迅猛,已形成"通用+行业"双轨并进的生态格局。百度文心一言、阿里通义千问等通用大模型在中文理解、多模态生成等方面表现突出;深度求索DeepSeek以1/10参数实现GPT-4级推理能力;月之暗面Kimi以20万汉字上下文窗口领跑长文本处理;智谱AI的GLM-4成为首个支持视频对话的国产千亿模型。医疗、金融等垂直领域涌现出百川智能等专业模型,覆盖超1000家医院。开源生态加速国产芯片适配,15家厂商完成深度优化。行业应用方面,工程文档效率提升60%,24小时拟人化客服等案例凸显价值。未来趋势呈现模型蒸馏、端侧部署和开源生态三大方向,中国AI正从实验室走向产业变革前沿。

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 当空间智能学会思考:飞渡科技“峥嵘大模型”重塑智慧城市新一代“运行内核”

    飞渡科技的"崑仑大模型"通过空间智能技术,构建了城市级数字底座,实现从物理世界到数字空间的映射。该技术已在智慧城市、智慧交通、低空经济、地下管网、灾害监测、文化保护等领域应用,推动城市治理从"被动应对"转向"主动预测"。在智慧交通领域实现毫秒级路网状态识别和动态信号优化;在地下管网实现毫米级泄漏预警;在低空经济构建超低空动态感知网络。该技术还应用于文化遗产数字化保护,通过三维建模留存历史建筑细节。飞渡科技表示,空间智能的价值在于共享,未来将与全球伙伴共建数字中国的空间智能新生态。

  • A日报:B站升级动漫视频生成模型AniSora V3;字节开源4D视频生成框架EX-4D;DeepSWE开源AI Agent系统强势登顶

    AI日报栏目汇总了近期AI领域的重要进展:1)字节跳动开源EX-4D框架,可将单目视频转换为多视角4D视频;2)B站开源动漫视频生成模型AniSora V3,支持多种风格;3)DeepSWE+开源基于Qwen3-32B的AI Agent系统;4)字节开源3亿参数图像编辑模型VINCIE-3B;5)Stability AI推出移动端音频生成模型Stable Audio Open Small;6)谷歌发布免费教育AI工具套件Gemini for Education;7)Topview推出革命性AI数字人带货技术Avatar

  • 最新AI模型哪里看?查找最佳AI模型平台推荐

    文章介绍了AI领域快速迭代背景下,开发者如何高效追踪最新模型动态。主要渠道包括:1)官方渠道(GitHub、公司官网/博客);2)科技媒体和社区(Twitter、Reddit等);3)专业聚合平台(推荐AIbase模型广场)。重点推荐AIbase平台,其优势在于:实时更新全球最新模型、结构化展示关键信息、支持多维筛选排序、直达相关资源链接。建议开发者善用官方渠道获取源头信息,同时�

热文

  • 3 天
  • 7天