首页 > AI头条  > 正文

​DeepSeek推首款推理模型R1-Lite-Preview,性能超越 OpenAI o1

2024-11-21 09:47 · 来源: AIbase基地

中国私募巨头幻方量化旗下的 DeepSeek,近日发布了其最新的推理专注型大型语言模型 R1-Lite-Preview。该模型目前仅通过 DeepSeek Chat 这一网页聊天机器人平台提供给公众使用。  

image.png

DeepSeek 以其在开源 AI 生态系统中的创新贡献而闻名,这次的新发布旨在为公众带来高水平的推理能力,同时保持对可访问性和透明性的承诺。尽管 R1-Lite-Preview 目前仅在聊天应用中可用,但它已凭借接近甚至超过 OpenAI 近期发布的 o1-preview 模型的性能引起了广泛关注。  

R1-Lite-Preview 采用 “链式思维” 推理,能够展示其在响应用户查询时所经历的不同思维过程。

尽管某些思维链可能对人类而言显得无厘头或错误,但整体而言,R1-Lite-Preview 的回答非常准确,甚至能够解决一些传统强大 AI 模型如 GPT-4o 和 Claude 系列遇到的 “陷阱” 问题,例如 “草莓” 这个词里有多少个字母 R?“9.11和9.9哪个大?”  

根据 DeepSeek 的说法,该模型在需要逻辑推理、数学思考和实时问题解决的任务中表现出色。其性能在 AIME(美国邀请数学考试)和 MATH 等已建立的基准测试中超越了 OpenAI o1-preview 的水平。  

image.png

此外,DeepSeek 还发布了模型的扩展数据,展示了在给予模型更多时间或 “思考令牌” 以解决问题时,其准确性稳步提高的趋势。图表强调,随着思维深度的增加,该模型在 AIME 等基准上的得分提升。  

目前,R1-Lite-Preview 的发布在关键基准中表现优异,能够处理从复杂数学到逻辑场景的一系列任务,得分与顶级推理模型如 GPQA 和 Codeforces 相当。该模型透明的推理过程让用户能够实时观察其逻辑步骤,增强了系统的责任感和可信度。  

image.png

值得注意的是,DeepSeek 尚未发布完整的代码供第三方独立分析或基准测试,也未提供 API 接口供独立测试,该公司尚未发布相关的博客文章或技术文档,说明 R1-Lite-Preview 的训练或构,这让其背后的起源依然充满疑问。  

R1-Lite-Preview 目前可以通过 DeepSeek Chat(chat.deepseek.com)免费使用,但其高级 “深思” 模式每天限量50条消息,用户可借此体验其强大能力。DeepSeek 计划发布 R1系列模型的开源版本和相关 API,进一步支持开源 AI 社区的发展。  

DeepSeek 继续在开源 AI 领域中推动创新,R1-Lite-Preview 的发布为其在推理和可扩展性方面增加了新的维度。随着企业和研究者探索推理密集型 AI 的应用,DeepSeek 的开放承诺将确保其模型成为发展和创新的重要资源。

官方入口:https://www.deepseek.com/

划重点:  

🌟 DeepSeek 发布 R1-Lite-Preview 模型,性能接近并超越 OpenAI o1。  

📊 模型展示透明的推理过程,用户可以实时观察逻辑步骤。  

🔍 深度学习与逻辑推理能力显著,未来将发布开源版本和 API。  

  • 相关推荐
  • DeepSeek更新R1推理AI模型,已发布Hugging Face

    更新后的 R1 拥有 6850 亿个参数,体量庞大。由于模型规模极大,普通消费者级别的硬件很可能无法直接运行。

  • MiniMax深夜开源首个推理模型M1,这次是真的卷到DeepSeek了。

    ​不知道还有多少人记得,AI行业的六小虎。 行业内都在说,他们已经寂静好久了。 上一次相关的项目发布,还是前一段时间我写的MiniMax声音模型的更新,Speech-02。 而昨晚凌晨将近12点的时候,又是MiniMax,居然在X上,预告了他们一整周的发布计划。

  • GPTBots 迎来增强版 DeepSeek-R1-0528 模型

    GPTBots.ai平台宣布集成深度求索(DeepSeek)最新开源模型DeepSeek-R1-0528,该模型在推理能力上媲美OpenAI和Google的顶级模型,性能显著提升:数学竞赛准确率从70%提升至87.5%,编程性能从63.5%提升至73.3%。该模型支持JSON输出与函数调用,可无缝嵌入企业工作流,同时推出轻量级版本DeepSeek-R1-0528-Qwen3-8B,仅需16GB GPU内存即可运行。此次集成将强化GPTBots为企业提供金融、医疗、教育等领域的AI解决方案能力,助力企业构建定制化AI应用。平台秉持开源理念,采用MIT许可协议,支持商业使用与定制开发。

  • 华为:让DeepSeek的“专家们”动起来,推理延迟降10%!

    要问最近哪个模型最火,混合专家模型(MoE,Mixture of Experts)绝对是榜上提名的那一个。 它的巧妙之处,就在于把不同的任务分配给擅长处理的专家网络,让整个系统性能得以提升。 但你知道吗? 正是这个关键的专家网络,也是严重影响系统推理性能的因素之一。 因为在大量任务来临之际(尤其是超大规模时),MoE并不是以“雨露均沾”的方式去分配——专家网络们的负�

  • 国际一线水准!理想同学接入DeepSeek-R1-0528模型

    理想同学手机、网页端已正式接入DeepSeekR1-0528最新版,切换DeepSeek模型”并开启深度思考”模式即可体验最新的AI问答、创作能力。 据悉,更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得了当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。 在复杂逻辑推理、长文本处理稳定性、代码生成质量等多方面能力

  • 月之暗面放王炸!开源Kimi新模型:超新版DeepSeek R1全球第一

    月之暗面推出了针对软件工程任务的全新开源代码大模型Kimi-Dev-72B。 该模型在SWE-bench Verified编程基准测试中取得了全球最高开源模型水平,以仅72B的参数量,超越了刚发布不就、参数量达671B的新版DeepSeek-R1。

  • 极速接入!百度千帆大模型平台宣布上线DeepSeek-R1-0528

    日前,DeepSeek R1模型完成小版本升级,目前最新版本为DeepSeek-R1-0528。 更新后的R1模型在复杂逻辑推理、长文本处理稳定性、代码生成质量等多方面能力大幅提升,整体表现已接近o3、Gemini-2.5-Pro等国际顶尖模型。 今晚,百度智能云千帆大模型平台宣布已正式上架DeepSeek-R1-0528大模型,企业用户和开发者登录千帆即可体验。

  • 如何用 DeepSeek 生成备课教案

    本教程介绍如何利用AI工具DeepSeek快速生成七年级中国古代史教案。操作流程包括:1.登录DeepSeek官网;2.进入文本生成界面;3.输入详细指令,包含教学目标、重难点、教学过程等要素;4.等待AI生成教案;5.检查并调整内容。该工具能帮助教师高效完成系统化的教案设计,但生成后仍需根据实际教学需求进行适当修改和完善,最后保存为所需格式使用。

  • 利用贝锐花生壳,轻松实现新版DeepSeek-R1本地部署与远程访问

    本文介绍DeepSeek-R1开源模型的本地部署方法。5月末该模型更新至0528版本,在数学计算和逻辑推理方面表现优异,同时降低了幻觉率。部署过程分为三步:1)使用Ollama一键部署模型;2)通过Docker安装Open WebUI实现图形界面交互;3)借助贝锐花生壳内网穿透技术实现安全远程访问。相比传统云部署方式,该方法更便捷安全,支持HTTPS加密传输、访问密码保护和权限控制等功能,有效防止未授权访问。整个过程简单高效,无需复杂操作或依赖云服务器,即可打造专属AI助手。

  • 一天内完成更新!腾讯元宝、QQ浏览器等接入DeepSeek R1最新版

    日前,DeepSeek R1模型迎来重磅升级,正式发布DeepSeek-R1-0528全新版本。 从模型开源到上线仅用不到1天时间,腾讯即宣布腾讯元宝、ima、搜狗输入法、QQ浏览器等多款产品再次迎来升级,率先接入DeepSeek R1-0528,多项能力全面提升。 腾讯表示,用户打开元宝(电脑版、网页版可抢先体验)、ima(任意版本)、搜狗输入法(Windows版侧边栏)、QQ浏览器(任意版本),选择DeepSeek模型R

今日大家都在搜的词: