首页 > AI头条  > 正文

​国产开源大模型 DeepSeek R1 发布,性能超越o1模型、成本降90%

2025-01-21 08:51 · 来源: AIbase基地

正文:近期,中国的 DeepSeek 团队重磅推出了其最新开源大模型 R1,受到了广泛关注。R1模型的性能表现极其出色,在多项测试中均超越了 OpenAI 的 o1模型,尤其是在数学和编程方面的评估中表现优异。

image.png

最新的美国 AIME2024测试中,R1以79.8分的成绩超越 o1的79.2分。在 MATH-500测试中,R1获得了97.3分,同样领先于 o1的96.4分。此外,在 SWE-bench Verified 测试中,R1得分为49.2,也超过了 o1的48.9分。虽然在代码测试 Codeforces 中,R1仅比 o1低0.3分,但整体性能与 o1模型相当。

除了性能,R1的成本优势更为引人注目。OpenAI 的 o1模型每100万 tokens 的输入费用高达15美元,而 R1的费用仅为0.14美元,成本降低了90%。在输出方面,o1的费用为60美元每100万 tokens,而 R1仅需2.19美元,降低幅度达到27倍。这一巨大的成本差异,让 R1在开源大模型领域中脱颖而出。

在 DeepSeek 团队宣布 R1开源后,许多国外网友纷纷表达了对这一模型的赞叹,认为 R1在性价比和性能方面都超越了 Meta、Mistral 等老牌开源平台。许多人表示,R1模型的高效推理能力使其在代码编写和数学解释等方面表现优异,甚至有用户称其为 “最像人类内心独白的模型”。同时,苹果公司的机器学习研究员 Awni Hannun 也对 R1进行了测试,发现其在苹果 M2Ultra 上运行迅速且推理效率高。

R1模型的开发经历了多个阶段的训练流程,包括冷启动数据和多阶段训练,以提高其推理能力和可读性。这些技术改进确保了 R1模型在各种任务中的卓越表现。

随着 R1的发布,中国的开源大模型在国际市场上再次引起了极大的关注与讨论,许多技术爱好者对此模型的潜力表示期待。R1的发布标志着中国在大模型技术领域的进一步突破,推动了开源技术的发展。

开源地址:https://huggingface.co/deepseek-ai/R1

API:https://api-docs.deepseek.com/guides/reasoning_model

划重点:

🌟 R1模型在多项测试中超越 OpenAI 的 o1,显示出卓越的性能表现。  

💰 R1的输入和输出成本分别低至0.14美元和2.19美元,成本降低幅度达90%。  

🚀 R1开源后受到广泛关注,许多国外专家对其性能表示赞赏,认为其性价比超高。  

  • 相关推荐
  • 玄戒O1专属!小米15S Pro上线芯片性能面板:可手动调节频率、电压

    据小米社区用户反馈,目前小米15S Pro上线了芯片性能面板的内测,可以手动调节处理的频率、电压。 目前只有小米15S Pro手机支持,应该是玄戒O1的专属功能,这也是自研芯片带来的好处之一,可以完全自己控制。 其实这个功能早在4月份就被开发者从代码中发现,这个功能可以说是重回初心了,让发烧友们能够有更多玩法。

  • 服务中小微企业,哪家城商行更优?DeepSeek答案是这样的

    文章指出中小企业是中国经济的"毛细血管",贡献了50%以上税收、60%以上GDP、70%以上技术创新和80%以上城镇就业。在融资难题下,城商行是关键一环。宁波银行凭借差异化战略定位、数字化赋能、产品创新和区域深耕,成为服务中小企业的标杆。其通过"四专"模式、智能风控系统和本土化服务,实现普惠小微贷款余额2199亿元,不良率连续18年低于1%。文章认为宁波

  • 秘塔AI也终于悄悄上线了DeepResearch。

    测试完以后,我觉得这玩意,还是值得我将近通宵写一篇的。 深度研究,也就是DeepResearch。 我过去写过很多次秘塔AI了,因为我自己的搜索习惯,现在基本就是,大活上ChatGPT用DeepResearch,常识问答直接找豆包,一般的AI搜索就是秘塔AI。 当然很多ChatBot产品都有AI搜索,但是我自己这两年,还是习惯用秘塔AI和Perplexity这样形态的原生AI搜索产品了,这可能就是习惯的力量吧。

  • A日报:月之暗面开源大模型Kimi K2;智源全面开源RoboBrain2.0;通义千问发布Qwen Chat桌面客户端

    本期AI日报重点报道了多项AI领域突破性进展:1.月之暗面推出万亿参数开源大模型Kimi K2,展现强大智能能力;2.智源研究院开源RoboBrain2.0和RoboOS2.0机器人系统;3.通义千问发布桌面客户端Qwen Chat;4.IndexTTS2实现影视级语音合成;5.HuggingFace开源机器人Reachy Mini热销;6.Meta推出实时视频生成模型StreamDiT;7.PixVerse新增多关键帧视频生成功能;8.特斯拉推出仅支持AMD处理器的Grok AI助手;9.OpenAI推迟开源大模型发布以加强安全测试;10.Liquid AI开源边缘AI模型LFM2;11.AI"时间穿越"特效在社交媒体走红。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 小米回应小折叠未搭载玄戒O1:立项之初总量比较有限

    今日,针对网友热议的小米MIX Flip2未采用自研玄戒O1芯片一事,小米官方正式作出回应。公司表示,玄戒O1作为小米首款自研SoC,其核心定位是技术验证平台,立项初期即明确规划为小批量试产,因此无法满足小折叠屏产品大规模量产的供应链需求。

  • 空调三巨头H1:美的海尔份额略有增长,格力微降

    2025年上半年中国空调市场呈现"头部稳定、局部差异"特征。美的、格力、海尔三巨头合计占据73.6%零售额和68.2%零售量,保持市场主导地位。海尔市场份额增长0.7%,线上销售额同比增63%;美的净增0.1%,线上增63%;格力份额微降1.4%,线上增41%。三强竞争策略分化:海尔聚焦技术普惠和服务升级,推出"洗空气"等创新功能;美的强化线上线下联动,布局年轻化产品;格力深耕压缩机等核心技术,巩固高端市场。行业进入存量竞争阶段,头部品牌需在巩固优势同时弥补短板,未来市场格局将取决于技术创新与渠道深耕能力。

  • AI日报:阿里通义开源音频生成模型ThinkSound;谷歌Veo3支态图片生成视频;昆仑万维发布 Skywork-R1V 3.0

    【AI日报】今日AI领域重要动态:1)阿里开源支持链式推理的音频生成模型ThinkSound,实现高保真空间音频生成;2)谷歌Veo3升级,支持静态图片生成生动视频;3)Hugging Face发布30亿参数小模型SmolLM3,性能优于Llama-3.2-3B;4)阿里开源网络智能体WebSailor,展现强大推理和检索能力;5)Moonvalley发布原生1080P视频生成模型Marey Realism v1.5;6)Vidu Q1支持最多七张参考图像生成一致性视频;7)苹果�

  • AI日报:xAI 震撼发布Grok4;微软开源全新Phi-4-mini版本;上海累计82款大模型通过备案

    AI日报栏目聚焦人工智能领域最新动态:1)xAI发布旗舰模型Grok4,在数学推理和代码生成表现突出,同时推出开发者专用Grok4Code;2)微软开源Phi-4-mini模型,推理效率提升10倍,适合边缘设备;3)上海82款大模型完成备案,垂直领域应用取得突破;4)Hugging Face推出开源桌面机器人Reachy Mini,支持Python编程;5)Perplexity发布AI浏览器Comet挑战Chrome;6)OpenAI将首次发布开放权重模型,打破闭源惯例;7)谷歌医疗AI模型MedGemma系列上新,单个GPU即可运行;8)OpenAI以约65亿美元收购AI硬件公司io Products,正式进军硬件市场。

  • 马斯克xAI推出Grok - 4 大模型将至,Meta/微美全息深耕开源AI融合加速

    埃隆·马斯克旗下xAI即将发布Grok-4大模型,该模型将在语言、数学和推理方面超越OpenAI和谷歌最新AI产品。同时苹果低调收购两家AI公司TrueMeeting和WhyLabs,加速布局Vision Pro头显和Apple Intelligence领域。Meta计划投入数百亿美元扩建AI基础设施,扎克伯格亲自招募顶尖AI人才。微美全息聚焦高性能算力与多模态模型,推动AI产业升级。当前AI赛道竞争激烈,大模型正向通用多模态演进,商业化落地成为关键。

今日大家都在搜的词: