DeepSeek推首款推理模型R1-Lite-Preview，性能超越 OpenAI o1

2024-11-21 09:47 · 来源： AIbase基地

中国私募巨头幻方量化旗下的 DeepSeek，近日发布了其最新的推理专注型大型语言模型 R1-Lite-Preview。该模型目前仅通过 DeepSeek Chat 这一网页聊天机器人平台提供给公众使用。

DeepSeek 以其在开源 AI 生态系统中的创新贡献而闻名，这次的新发布旨在为公众带来高水平的推理能力，同时保持对可访问性和透明性的承诺。尽管 R1-Lite-Preview 目前仅在聊天应用中可用，但它已凭借接近甚至超过 OpenAI 近期发布的 o1-preview 模型的性能引起了广泛关注。

R1-Lite-Preview 采用 “链式思维” 推理，能够展示其在响应用户查询时所经历的不同思维过程。

尽管某些思维链可能对人类而言显得无厘头或错误，但整体而言，R1-Lite-Preview 的回答非常准确，甚至能够解决一些传统强大 AI 模型如 GPT-4o 和 Claude 系列遇到的 “陷阱” 问题，例如 “草莓” 这个词里有多少个字母 R?“9.11和9.9哪个大?”

根据 DeepSeek 的说法，该模型在需要逻辑推理、数学思考和实时问题解决的任务中表现出色。其性能在 AIME（美国邀请数学考试）和 MATH 等已建立的基准测试中超越了 OpenAI o1-preview 的水平。

此外，DeepSeek 还发布了模型的扩展数据，展示了在给予模型更多时间或 “思考令牌” 以解决问题时，其准确性稳步提高的趋势。图表强调，随着思维深度的增加，该模型在 AIME 等基准上的得分提升。

目前，R1-Lite-Preview 的发布在关键基准中表现优异，能够处理从复杂数学到逻辑场景的一系列任务，得分与顶级推理模型如 GPQA 和 Codeforces 相当。该模型透明的推理过程让用户能够实时观察其逻辑步骤，增强了系统的责任感和可信度。

值得注意的是，DeepSeek 尚未发布完整的代码供第三方独立分析或基准测试，也未提供 API 接口供独立测试，该公司尚未发布相关的博客文章或技术文档，说明 R1-Lite-Preview 的训练或构，这让其背后的起源依然充满疑问。

R1-Lite-Preview 目前可以通过 DeepSeek Chat（chat.deepseek.com）免费使用，但其高级 “深思” 模式每天限量50条消息，用户可借此体验其强大能力。DeepSeek 计划发布 R1系列模型的开源版本和相关 API，进一步支持开源 AI 社区的发展。

DeepSeek 继续在开源 AI 领域中推动创新，R1-Lite-Preview 的发布为其在推理和可扩展性方面增加了新的维度。随着企业和研究者探索推理密集型 AI 的应用，DeepSeek 的开放承诺将确保其模型成为发展和创新的重要资源。

官方入口:https://www.deepseek.com/

划重点:
🌟 DeepSeek 发布 R1-Lite-Preview 模型，性能接近并超越 OpenAI o1。
📊 模型展示透明的推理过程，用户可以实时观察逻辑步骤。
🔍 深度学习与逻辑推理能力显著，未来将发布开源版本和 API。

相关推荐

AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

本文探讨大模型选型困境与解决方案。2025年全球可调用大模型超300个，但选型面临三大难题：单位混乱、定价波动快、87%团队无法量化模型价值。提出三层漏斗筛选法：1)场景刚需筛选80%选项；2)验证核心性能；3)评估边际效益。以Gemini和DeepSeek为例，前者适合常规FAQ场景年省$16,000，后者适用于金融计算场景可降低15%人工复核。建议建立动态评估体系，将3小时选型会议压缩至18分钟，错误率下降40%。核心观点：选型应从参数争论转向场景验证，通过自动化工具为工程师节省时间，聚焦提示词优化而非参数对比。

文章搜索核心标签模型适配
Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

企业在选择大模型时面临两难：国际大厂的Gemini技术先进，但国内DeepSeek性价比突出。AIbase平台通过真实场景测试数据指出：1）跨境电商客服场景中，Gemini多语言识别准确率提升12%，但需注意API延迟问题；2）金融研报分析场景下，DeepSeek支持128K长文本且成本仅为Gemini的1/3。决策关键：抛开参数迷雾，聚焦成本、响应速度、语言支持和场景匹配四大维度。AIbase提供可视化对比工具，3分钟生成专属选型报告，让技术决策不再玄学。

大模型选型 Gemini对比DeepSeek LLM评测
荐谁在往“DeepSeek们”的回答里塞广告？

AI正在重塑现代职场与当代生活。如果说在过去，人们遇到问题往往会首选“搜一下”，如今，则变为“问问AI”。或许是ChatGPT和DeepSeek，也可能是豆包和元宝…… 从数据来看，头豹研究院数据显示，全球AI搜索的用户量从2024年1月的3.1亿增长至2025年2月份的19.8亿，增长率达538.7%。而当AI在日常工作和生活中越来越成为不可或缺的工具，变化正悄然发生。当DeepSeek的回答里频繁�

AI搜索职场变革现代生活
荐智能体迎来“DeepSeek时刻”，为何主角是纳米AI？

大模型重塑了人工智能的产业格局，但却没有彻底颠覆人类的生产模式。在这背后，并非其技术力量不足，而是当前的应用形态仍停留在“工具赋能”的初级阶段，大模型的潜力被束缚在碎片化场景中，未能转化为重构生产逻辑的核心动能。正如360集团创始人、董事长周鸿祎所言，大模型的能力其实已经相当强大，甚至超越了我们中的许多人。只是其潜力尚未被挖掘。而�

大模型人工智能生产模式
DeepSeek崩了引热议官方深夜回应：网页/API已恢复

8月11日，DeepSeek服务突遭全面宕机，API接口、网页平台以及App均无法访问或响应。许多网友也通过微博话题#DeepSeek崩了#反馈服务异常。

DeepSeek宕机 AI大模型服务恢复
荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

AI日报栏目聚焦人工智能领域最新动态：1)Claude Opus4.1发布，编程能力提升74.5%；2)OpenAI开源GPT-OSS-120B和20B模型；3)谷歌DeepMind推出革命性3D世界模型Genie3；4)谷歌Gemini新增AI故事书生成功能；5)ElevenLabs推出商用AI音乐生成器；6)百度智能云发布首批AI数字员工；7)OpenAI估值或达5000亿美元；8)00后创业者推出云端AI协作开发工具Vinsoo；9)腾讯启动2026校园招聘，重点培养AI人才；10)马斯克宣�

人工智能编程能力数据分析
OpenAI发布2款开源模型：gpt-oss系列能力接近o3和o4-mini

OpenAI发布开源模型系列GPT-OSS，包含120B和20B两个版本。120B旗舰模型适配单H100 GPU架构，20B轻量版适合边缘计算。两款模型均开放完整推理链监控接口，支持动态参数调节和任务微调优化，性能接近闭源的GPT-O3和O4-mini。该系列突破性地支持代理功能，包括网页交互和Python代码执行，在标准化测试中表现优异。开源策略为开发者提供高性能替代方案，重新定义了AI模型的应用边界。

人工智能开源模型 OpenAI
谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

据媒体报道，谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。该模型能够根据用户的文本提示，快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界，更创新性地引入了可提示世界事件” 功能。用户通过简单文本指令，即可实时修改虚拟环境，显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能（AGI）的�

Genie 3 通用世界模型
GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI发布最强AI模型GPT-5，但引发用户强烈不满。新模型上线后反应速度变慢、回答质量下降，且官方突然下架GPT-4o等8个旧模型，导致付费用户抗议。部分用户对旧版产生情感依赖，认为GPT-4o更具人性化温暖。第三方测试显示GPT-5在复杂任务上虽有提升，但交互体验明显退步。CEO承认低估用户对旧版的喜爱，承诺将恢复部分旧模型并提供更多定制服务。专家指出大模型边际效益递减，面临数据质量和算力成本限制。总体而言，GPT-5在技术指标进步的同时，牺牲了情感交互体验。

GPT-5发布 OpenAI AI模型淘汰
OpenAI正式发布GPT-5模型网友：写作像诗人

OpenAI在直播活动中正式推出新一代人工智能模型GPT-5，宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域，实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼（Sam Altman）形容，与GPT-5交互如同与各领域专家对话，其多维度能力突破将重塑人机协作模式。分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送，免费用户与付�

今日大家都在搜的词：

热文

3 天
7天

DeepSeek推首款推理模型R1-Lite-Preview，性能超越 OpenAI o1

AI大模型选型决策指南：10分钟数据对比 Gemini 2.5 Flash-Lite 与 DeepSeek R1

Google Gemini vs Deepseek：谁更适合你的业务场景？AI大模型选型终极对比指南

荐谁在往“DeepSeek们”的回答里塞广告？

荐智能体迎来“DeepSeek时刻”，为何主角是纳米AI？

DeepSeek崩了引热议官方深夜回应：网页/API已恢复

荐AI日报：百度推全球首批AI数字员工；Claude Opus4.1出世；谷歌DeepMind发布世界模型Genie 3

OpenAI发布2款开源模型：gpt-oss系列能力接近o3和o4-mini

谷歌DeepMind发布Genie 3世界模型：支持实时生成交互式3D环境

GPT5上线大翻车！用户强烈呼吁使用旧版 OpenAI重新上线GPT4o

OpenAI正式发布GPT-5模型网友：写作像诗人

今日大家都在搜的词：

热文

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

REDMI Note 15系列定档将于8月21日发布

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

华为余承东官宣：鸿蒙智行首款旅行车享界S9T今日开启预售

转战播客赛道！罗永浩微博改名“罗永浩的十字路口”

REDMI Note 15 Pro+外观公布：配备全等深微曲屏幕与机身

享界S9T开启预售：32.8万起华为鸿蒙智行旗下首款旅行车

真我15系列官宣9月发布号称轻薄影像神器

王腾晒出REDMI Note 15 Pro：云霞紫配色亮相

曝iPhone18标准版推迟到2027年折叠屏与Pro系列率先登场

苹果iOS 18.6.1正式版发布：美版Apple Watch血氧功能上线

60岁李国庆谈再婚：妻子是“白月光” 年轻时2次爱而不得

AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-

REDMI Note 15系列定档将于8月21日发布

AI日报：可灵2.1推出全新首尾帧功能；昆仑万维上线AI音乐模型M

苹果正式入驻小红书 iPhone 17系列下月发布

华为MatePad Air 12英寸2025发布：售价2799元起

AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatch

REDMI Note 15 Pro系列官宣下周发布

华为MatePad Air新款官宣8月15日发布

站长商机

​DeepSeek推首款推理模型R1-Lite-Preview，性能超越 OpenAI o1

今日大家都在搜的词：

热文

站长商机

DeepSeek推首款推理模型R1-Lite-Preview，性能超越 OpenAI o1