首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

华人研究团队揭秘:DeepSeek-R1-Zero或许并不存在「顿悟时刻」

2025-02-07 14:11 · 稿源: 机器之心公众号

自我反思(尤其是肤浅的)有时对模型性能的助益不大。在过去这半个月里,关于 DeepSeek 的一切都会迅速成为焦点。一项非常鼓舞人心的发现是:DeepSeek-R1-Zero 通过纯强化学习(RL)实现了「顿悟」。在那个瞬间,模型学会了自我反思等涌现技能,帮助它进行上下文搜索,从而解决复杂

......

本文由站长之家合作伙伴自媒体作者“机器之心公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 全新开源的DeepSeek-OCR,可能是最近最惊喜的模型。

    ​AI圈虽然天天卷,但是很多的模型,真的越来越无聊了。 每天就是跑分又多了几个点。 直到昨天,DeepSeek久违的发了一个新模型。 DeepSeek-OCR。 这玩意,是真的有点酷。

  • DeepSeek开源3B OCR模型:长文本识别达97%精度

    DeepSeek在GitHub开源新一代OCR模型,采用创新光学二维映射压缩技术,在长文本识别场景实现97%准确率。模型通过动态压缩生成最优视觉特征令牌,较传统方法减少60%计算冗余。实验显示在1:20压缩率下仍保持60%以上准确率,显著优于同类模型。该技术路径为OCR系统小型化提供解决方案,其动态压缩策略对大型语言模型的记忆管理机制具有重要启示。

  • 中国AI算力突围:东方超算Deep X算力盒子超国际竞品82%,重新定义行业标准

    中国公司东方超算发布Deep X G20系列AI工作站,在MLPerf测试中性能超越NVIDIA DGX Spark达82%,价格持平,实现性能与性价比"双超越"。产品搭载Intel Ultra 9285处理器和NVIDIA RTX PRO 5000显卡,AI算力达1824 TOPS,体积仅2.7L。通过三大技术创新实现突破:智能异构计算引擎提升资源利用率40%;统一推理运行时支持多框架;深度硬件优化提升关键算子性能50-200%。该产品打破国际巨头垄断,已在量化金融、医疗影像等领域实现显著投资回报,标志着中国AI硬件实现重要突破。

  • WEEX反诈指南:提升警觉,防范高收益陷阱

    近年来数字资产市场快速发展,但网络诈骗层出不穷,包括仿冒交易平台、高收益投资骗局和假客服等手段。WEEX以安全为本,通过多重加密、冷热钱包分离、多因素身份验证等技术防护,结合反诈教育和实时监控系统保护用户。文章提醒投资者警惕高收益承诺,不点击陌生链接,不泄露验证信息,仅通过官方渠道下载APP,强调安全需平台与用户共同维护。

  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 传承海尔,进化自我:Leader统帅的年轻化新路径

    在家电行业年轻化浪潮中,统帅品牌以独特视角重新定义年轻家电:依托海尔技术底蕴,通过精准功能裁剪与简约美学设计,将领先技术转化为年轻人真正需要的产品。其核心在于实现"技术轻量化表达",剔除冗余功能,保留核心体验,让科技自然融入生活。产品设计强调"无感适配",智能体验注重解决实际问题而非炫技,构建理性精致的消费文化。这种基因传承下的自我进化,使统帅成为年轻人生活中可靠伙伴,重新诠释了高性价比的真正含义——在可靠品质基础上提供恰到好处的体验。

  • 1299元 华为FreeClip 2耳夹耳机预售卖爆:1小时总量突破80000台

    华为FreeClip 2耳夹耳机10月14日开启预售,20日正式开售,售价1299元。预售1小时销量突破8万台。提供丹宁蓝、摩登黑、羽纱白三色,采用玲珑方盒设计。耳机采用亲肤液态材质,柔软度提升25%,单耳仅重5.1克,支持IP57防尘防水。搭载自研超澎湃双引擎单元,响度和低音动力均提升100%,并配备第三代音频芯片及NPU AI处理器,算力提升10倍。支持实时动态降噪、三麦克风通话降噪、高清空间音频及鸿蒙AI助手。单耳续航9小时,整机达38小时。

今日大家都在搜的词: