国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%

2025-01-21 08:51 · 来源： AIbase基地

正文:近期，中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1，受到了广泛关注。R1模型的性能表现极其出色，在多项测试中均超越了 OpenAI 的 o1模型，尤其是在数学和编程方面的评估中表现优异。

在最新的美国 AIME2024测试中，R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中，R1获得了97.3分，同样领先于 o1的96.4分。此外，在 SWE-bench Verified 测试中，R1得分为49.2，也超过了 o1的48.9分。虽然在代码测试 Codeforces 中，R1仅比 o1低0.3分，但整体性能与 o1模型相当。

除了性能，R1的成本优势更为引人注目。OpenAI 的 o1模型每100万 tokens 的输入费用高达15美元，而 R1的费用仅为0.14美元，成本降低了90%。在输出方面，o1的费用为60美元每100万 tokens，而 R1仅需2.19美元，降低幅度达到27倍。这一巨大的成本差异，让 R1在开源大模型领域中脱颖而出。

在 DeepSeek 团队宣布 R1开源后，许多国外网友纷纷表达了对这一模型的赞叹，认为 R1在性价比和性能方面都超越了 Meta、Mistral 等老牌开源平台。许多人表示，R1模型的高效推理能力使其在代码编写和数学解释等方面表现优异，甚至有用户称其为 “最像人类内心独白的模型”。同时，苹果公司的机器学习研究员 Awni Hannun 也对 R1进行了测试，发现其在苹果 M2Ultra 上运行迅速且推理效率高。

R1模型的开发经历了多个阶段的训练流程，包括冷启动数据和多阶段训练，以提高其推理能力和可读性。这些技术改进确保了 R1模型在各种任务中的卓越表现。

随着 R1的发布，中国的开源大模型在国际市场上再次引起了极大的关注与讨论，许多技术爱好者对此模型的潜力表示期待。R1的发布标志着中国在大模型技术领域的进一步突破，推动了开源技术的发展。

开源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

划重点:
🌟 R1模型在多项测试中超越 OpenAI 的 o1，显示出卓越的性能表现。
💰 R1的输入和输出成本分别低至0.14美元和2.19美元，成本降低幅度达90%。
🚀 R1开源后受到广泛关注，许多国外专家对其性能表示赞赏，认为其性价比超高。

相关推荐

玄戒O1专属！小米15S Pro上线芯片性能面板：可手动调节频率、电压

据小米社区用户反馈，目前小米15S Pro上线了芯片性能面板的内测，可以手动调节处理的频率、电压。目前只有小米15S Pro手机支持，应该是玄戒O1的专属功能，这也是自研芯片带来的好处之一，可以完全自己控制。其实这个功能早在4月份就被开发者从代码中发现，这个功能可以说是重回初心了，让发烧友们能够有更多玩法。
服务中小微企业，哪家城商行更优？DeepSeek答案是这样的

文章指出中小企业是中国经济的"毛细血管"，贡献了50%以上税收、60%以上GDP、70%以上技术创新和80%以上城镇就业。在融资难题下，城商行是关键一环。宁波银行凭借差异化战略定位、数字化赋能、产品创新和区域深耕，成为服务中小企业的标杆。其通过"四专"模式、智能风控系统和本土化服务，实现普惠小微贷款余额2199亿元，不良率连续18年低于1%。文章认为宁波

中小企业中国经济城商行
荐秘塔AI也终于悄悄上线了DeepResearch。

测试完以后，我觉得这玩意，还是值得我将近通宵写一篇的。深度研究，也就是DeepResearch。我过去写过很多次秘塔AI了，因为我自己的搜索习惯，现在基本就是，大活上ChatGPT用DeepResearch，常识问答直接找豆包，一般的AI搜索就是秘塔AI。当然很多ChatBot产品都有AI搜索，但是我自己这两年，还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了，这可能就是习惯的力量吧。

秘塔AI 深度研究 AI搜索
荐A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

本期AI日报重点报道了多项AI领域突破性进展：1.月之暗面推出万亿参数开源大模型Kimi K2，展现强大智能能力；2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统；3.通义千问发布桌面客户端Qwen Chat；4.IndexTTS2实现影视级语音合成；5.HuggingFace开源机器人Reachy Mini热销；6.Meta推出实时视频生成模型StreamDiT；7.PixVerse新增多关键帧视频生成功能；8.特斯拉推出仅支持AMD处理器的Grok AI助手；9.OpenAI推迟开源大模型发布以加强安全测试；10.Liquid AI开源边缘AI模型LFM2；11.AI"时间穿越"特效在社交媒体走红。

人工智能开源大模型技术趋势
全球优质AI语音大模型盘点：Whisper、Gemini Speech

本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括：OpenAI Whisper（多语言识别与翻译）、Google Gemini（情感化语音生成）、Meta AudioCraft（音乐创作与风格转换）。国内讯飞星火（方言识别）、阿里通义（电商客服）、百度文心（车载场景）表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

AI语音大模型语音交互技术多语言识别
小米回应小折叠未搭载玄戒O1：立项之初总量比较有限

今日，针对网友热议的小米MIX Flip2未采用自研玄戒O1芯片一事，小米官方正式作出回应。公司表示，玄戒O1作为小米首款自研SoC，其核心定位是技术验证平台，立项初期即明确规划为小批量试产，因此无法满足小折叠屏产品大规模量产的供应链需求。
空调三巨头H1:美的海尔份额略有增长，格力微降

2025年上半年中国空调市场呈现"头部稳定、局部差异"特征。美的、格力、海尔三巨头合计占据73.6%零售额和68.2%零售量，保持市场主导地位。海尔市场份额增长0.7%，线上销售额同比增63%；美的净增0.1%，线上增63%；格力份额微降1.4%，线上增41%。三强竞争策略分化：海尔聚焦技术普惠和服务升级，推出"洗空气"等创新功能；美的强化线上线下联动，布局年轻化产品；格力深耕压缩机等核心技术，巩固高端市场。行业进入存量竞争阶段，头部品牌需在巩固优势同时弥补短板，未来市场格局将取决于技术创新与渠道深耕能力。
荐AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

【AI日报】今日AI领域重要动态：1)阿里开源支持链式推理的音频生成模型ThinkSound，实现高保真空间音频生成；2)谷歌Veo3升级，支持静态图片生成生动视频；3)Hugging Face发布30亿参数小模型SmolLM3，性能优于Llama-3.2-3B；4)阿里开源网络智能体WebSailor，展现强大推理和检索能力；5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5；6)Vidu Q1支持最多七张参考图像生成一致性视频；7)苹果�

人工智能音频生成链式推理
荐AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海累计82款大模型通过备案

AI日报栏目聚焦人工智能领域最新动态：1)xAI发布旗舰模型Grok4，在数学推理和代码生成表现突出，同时推出开发者专用Grok4Code；2)微软开源Phi-4-mini模型，推理效率提升10倍，适合边缘设备；3)上海82款大模型完成备案，垂直领域应用取得突破；4)Hugging Face推出开源桌面机器人Reachy Mini，支持Python编程；5)Perplexity发布AI浏览器Comet挑战Chrome；6)OpenAI将首次发布开放权重模型，打破闭源惯例；7)谷歌医疗AI模型MedGemma系列上新，单个GPU即可运行；8)OpenAI以约65亿美元收购AI硬件公司io Products，正式进军硬件市场。
马斯克xAI推出Grok - 4 大模型将至，Meta/微美全息深耕开源AI融合加速

埃隆·马斯克旗下xAI即将发布Grok-4大模型，该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs，加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施，扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型，推动AI产业升级。当前AI赛道竞争激烈，大模型正向通用多模态演进，商业化落地成为关键。

今日大家都在搜的词：

热文

3 天
7天

国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%

玄戒O1专属！小米15S Pro上线芯片性能面板：可手动调节频率、电压

服务中小微企业，哪家城商行更优？DeepSeek答案是这样的

荐秘塔AI也终于悄悄上线了DeepResearch。

荐A日报：月之暗面开源大模型Kimi K2；智源全面开源RoboBrain2.0；通义千问发布Qwen Chat桌面客户端

全球优质AI语音大模型盘点：Whisper、Gemini Speech

小米回应小折叠未搭载玄戒O1：立项之初总量比较有限

空调三巨头H1:美的海尔份额略有增长，格力微降

荐AI日报：阿里通义开源音频生成模型ThinkSound；谷歌Veo3支态图片生成视频；昆仑万维发布 Skywork-R1V 3.0

荐AI日报：xAI 震撼发布Grok4；微软开源全新Phi-4-mini版本；上海累计82款大模型通过备案

马斯克xAI推出Grok - 4 大模型将至，Meta/微美全息深耕开源AI融合加速

今日大家都在搜的词：

热文

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

华为鸿蒙智行：尊界S800上市50天大定破8000台

华为MatePad Pro 12.2开启预约预计7月24日正式发布

小米深圳大厦开园：卢伟冰现场喝小米粥

小米骨传导耳机2发布：699元 7月21日开售

AI日报：美图发布影像AI Agent RoboNeo；1.8bit量化Kimi K2模型

理想小米同一个地方开发布会：理想i8发布会定于首都国际会议中

A日报：Kimi开放平台上线Kimi Playground；OpenAI重磅发布Chat

黄仁勋称想买一辆小米汽车英伟达在多方面与小米开展合作

华为鸿蒙智行：尊界S800上市50天大定破8000台

贾跃亭旗下FF获1.05亿美元融资将加速FX Super One生产交付

抖音：“抖音会议”App是诈骗软件会直接控制用户手机

华为MatePad Pro 12.2开启预约预计7月24日正式发布

理想i8开启预定：7月29日上市预售价35-40万元

小米深圳大厦开园：卢伟冰现场喝小米粥

站长商机

​国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%

今日大家都在搜的词：

热文

站长商机

国产开源大模型 DeepSeek R1 发布，性能超越o1模型、成本降90%