零一万物开源 Yi-9B 模型代码数学综合能力全面增强

2024-03-07 09:23 · 稿源：站长之家

站长之家（ChinaZ.com）3月7日消息:零一万物团队发布并开源了 Yi-9B 模型，这是零一万物 Yi 系列模型中的 “理科状元”，在代码和数学能力方面表现最佳，并且具有强大的中文能力。该模型的优势包括:

1. 代码和数学能力出色，综合实力强劲。在综合能力方面，Yi-9B 超越了其他相近尺寸的开源模型，如 DeepSeek-Coder、DeepSeek-Math、Mistral-7B、SOLAR-10.7B 和 Gemma-7B。

2. 消费级显卡可用，使用成本友好。Yi-9B（BF16）和量化版 Yi-9B(Int8)都可以在消费级显卡上轻松部署，成本较低。

3. 模型具有中文和英文能力，且性能良好。Yi-9B 在中文和英文能力方面表现出色，是一款全面综合能力强的模型。

微信截图_20240307092409.png

Yi-9B 模型的训练经历了多阶段增量训练，并且采用了模型深度扩增的方式来提升性能。团队在训练过程中增加了模型大小，并采取了固定学习率和逐步增加 batch size 的策略，以提高模型的训练效果。此外，团队还分析了模型结构和训练过程的趋势，通过量化累积整体模型输入 / 输出 cosine 距离的指标来观察模型性能的变化。

总的来说，Yi-9B 模型在代码、数学和中文能力方面表现出色，是一款全面综合能力强大的模型，可在消费级显卡上部署，并且具有较低的使用成本。

项目地址：https://github.com/01-ai/Yi

（举报）

相关推荐

关键词：

有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

网易有道6月23日开源国内首个专注数学教育的"子诳3"大模型系列数学模型(Confucius3-Math)。该模型在单块消费级GPU上高效运行，在多项数学推理任务中性能超越更大规模的通用模型，高考数学题测试得分达98.5分。其训练成本仅2.6万美元，推理性能是DeepSeek+R1的15倍，服务成本低至每百万token0.15美元，大幅降低教育AI应用门槛。该开源模型为教育公平提供低成本、高性能的AI�

子曰3 开源大模型数学教育
6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

近日，随着高考的圆满结束，一场别开生面的“数学擂台赛”在各大AI大模型间悄然展开。多家知名科技公司的大模型被邀请参与2025年数学新课标Ⅰ卷中的14道客观题测试，以此检验它们在逻辑推理和数学能力上的实力。此次测试题目包含8道单选题、3道多选题以及3道填空题，满分设定为73分，且测试过程严格遵循高考判分原则，确保结果的公正性与准确性。测试成绩揭晓�

高考数学擂台赛 AI大模型
信通院联合三六零发布《大模型应用交付供应商总体能力要求》

中国信通院联合360集团发布《大模型应用交付供应商总体能力要求》技术规范，从基础能力、大模型服务能力、行业实践能力和项目质量管理能力四个方面明确了大模型应用交付供应商的总体要求。该规范由20余家单位及40余位专家共同编制，旨在提升供应商技术、管理和服务能力，为行业提供供应商选择与评估参考。360作为国内大模型头部厂商，自主研发"360智脑"大模�

大模型应用交付技术规范
真学霸！豆包大模型1.6正式发布：高考数学卷获144分全国第一

今日，字节跳动旗下火山引擎举办FORCE原动力大会，正式发布豆包大模型1.6。新系列包括三个大模型，分别是Doubao-Seed-1.6-thinking、Doubao-Seed-1.6、Doubao-Seed-1.6-flash。火山引擎总裁谭待表示，Doubao-Seed-1.6是首个支持256k长上下文的大模型。以thinking模型为例，其思考能力强化，支持多模态，Doubao-Seed-1.6则支持on/off/auto三种思考模式。在高考全国新一卷数学单科测试中，豆包大模�

豆包大模型火山引擎 FORCE原动力大会
难哭了的高考数学题，4家国产大模型表现如何？

2025年高考数学考试引发热议，多家AI大模型参与测试。腾讯元宝和豆包表现最优，分别获得145分和140分（满分150分），仅错1-2道题。文心一言和QWen3稍逊，得分在120分左右。测试显示，AI在选择题和基础解答题表现良好，但在涉及图像理解、向量分析等复杂题目时仍存在困难。特别是一道包含向量图的"杀手题"让所有AI失分。专家指出，国产大模型数学能力已有显著提升�

高考数学语文
余承东：开源鸿蒙代码规模超1.3亿行软硬件产品数量超1200款

今日，华为开发者大会（HDC2025）在广东东莞松山湖盛大举行。华为常务董事、终端BG董事长余承东以“共建共享鸿蒙新世界”为主题发表演讲，介绍了开源鸿蒙的最新发展情况。余承东指出，开源鸿蒙代码规模已超过1.3亿行，社区贡献者接近9000位，软硬件产品数量超1200款，三方发行版达到69款。开源鸿蒙已广泛覆盖政务、交通、金融、电力、水利、建筑等多个行业领域，成�

华为开发者大会鸿蒙操作系统开源技术
趣链科技亮相国际金融科技盛会，全面展示数字出海能力

2025年6月3-5日，全球顶级金融科技盛会Money20/20 Europe在荷兰阿姆斯特丹成功举办。本届大会聚焦嵌入式智能、数字基因、治理2.0和货币未来四大议题，吸引120多个国家的3万余名金融科技从业者参与。浙江省商务厅组织省内数字服务与金融科技企业参展，重点展示区块链、跨境支付等领域创新成果。趣链科技创始人李伟博士发表主题演讲，分享区块链与AI融合如何重塑金融基础设施，并透露将持续拓展国际生态，深化在隐私计算、数据互操作性等领域的技术合作。活动期间同步举办2025浙江服务贸易金融展，推动浙江金融科技品牌走向国际舞台。

金融科技嵌入式智能数字基因
荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

本文汇总了近期AI领域的重要动态：1)通义千问发布Qwen3-Embedding系列模型，在多语言文本处理表现优异；2)字节跳动推出图像编辑模型SeedEdit3.0，提升细节保持能力；3)ElevenLabs发布情感语音合成系统Eleven v3 Alpha；4)Anthropic推出面向国家安全的Claude Gov模型；5)可灵AI月收入连续两月超1亿元；6)Meta公布智能眼镜Aria Gen2技术细节；7)爱诗科技上线AI视频工具"拍我AI"；8)富国银行预测2030年ChatGPT广告收入将达千亿美元。

人工智能深度学习文本处理
高考数学全卷重赛！一道题难倒所有大模型，新选手Gemini夺冠，豆包DeepSeek并列第二

本次AI高考数学测试评估了7个大模型的表现，包括Doubao、DeepSeek、Qwen3等。测试包含14道客观题和5道解答题，总分150分。结果显示：1）客观题各模型差距不大，最大分差仅3分；2）解答题成为主要失分区，仅Gemini2.5Pro获得满分；3）图像识别题（第6题）难倒所有多模态模型，暴露AI图文理解短板。最终Gemini2.5Pro以145分居首，Doubao和DeepSeek R1以144分并列第二。测试表明大模型在数学推理能力上有进步，但在复杂论证和多步骤计算方面仍需提升。

AI挑战高考数学大模型产品
月之暗面放王炸！开源Kimi新模型：超新版DeepSeek R1全球第一

月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平，以仅72B的参数量，超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

开源代码模型软件工程 Kimi-Dev-72B

热文

3 天
7天

零一万物开源 Yi-9B 模型代码数学综合能力全面增强

有道14B低成本轻量模型“子曰3”开源，数学推理性能超越大模型

6个AI大模型大战2025年高考数学新一卷：数学题推理能力均显著提升

信通院联合三六零发布《大模型应用交付供应商总体能力要求》

真学霸！豆包大模型1.6正式发布：高考数学卷获144分全国第一

难哭了的高考数学题，4家国产大模型表现如何？

余承东：开源鸿蒙代码规模超1.3亿行软硬件产品数量超1200款

趣链科技亮相国际金融科技盛会，全面展示数字出海能力

荐AI日报：通义千问开源Qwen3向量模型；字节跳动图像编辑模型SeedEdit 3.0；ElevenLabs推v3语音模型

高考数学全卷重赛！一道题难倒所有大模型，新选手Gemini夺冠，豆包DeepSeek并列第二

月之暗面放王炸！开源Kimi新模型：超新版DeepSeek R1全球第一

热文

华为Mate X5折叠屏降价：8999元起至高优惠4000元

微信：聊天记录备份和迁移已支持外部存储设备可自动备份

罗马仕辟谣倒闭称定将努力解决一切问题

小米汽车回应YU7是否难破窗：无需担心随车赠送破窗锤

特斯拉中国宣布Model 3/Y长续航版续航提升

小鹏G7官宣7月3日发布全球首款L3级算力车型

董明珠说自己尽量少说话让年轻管理团队走向台前

安克修改召回方案充电宝泡盐水处理后可获赔

小米YU7将开启限时改配非准现车锁单用户可参与

华为Mate X5折叠屏降价：8999元起至高优惠4000元

微信：聊天记录备份和迁移已支持外部存储设备可自动备份

罗马仕辟谣倒闭称定将努力解决一切问题

站长商机

零一万物开源 Yi-9B 模型 代码数学综合能力全面增强

热文

站长商机

零一万物开源 Yi-9B 模型代码数学综合能力全面增强