DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

2025-04-05 09:20 · 稿源：新智元公众号

【新智元导读】DeepSeek新论文来了!在清华研究者共同发布的研究中，他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2，果然近了。最近，DeepSeek和清华的研究者发表的这篇论文，探讨了奖励模型的推理时Scaling方法。论文地址:https://arxiv.org/abs/2504.02495现在，强化学

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

DeepSeek-V3.2-Exp正式发布

DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp，该模型基于V3.1-Terminus升级，引入创新的稀疏注意力机制DSA，首次实现细粒度稀疏注意力，在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面，官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整：输入缓存0.2元、输入未缓存2元、输出3元，开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

DeepSeek-V3.2-Exp 稀疏注意力机制 DSA
强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

2025年9月29日，深度求索公司发布新一代模型架构DeepSeek-V3.2，引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本，在V3.1-Terminus基础上引入稀疏注意力机制，优化长文本训练和推理效率。目前官方应用端已同步更新，API大幅降价。此次模型体积达671GB，下载需8-10小时。业内专家指出，此次快速适配表明双方早有深度技术协�

DeepSeek-V3.2 大模型架构稀疏注意力机制
荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

本期AI日报聚焦多项技术突破：DeepSeek发布V3.2-exp模型，通过稀疏注意力机制降低API成本50%；Anthropic推出Claude Sonnet 4.5，在编码任务表现卓越；ChatGPT新增即时结账功能，实现对话界面直接购物；OpenAI将推出AI版TikTok，所有内容由Sora2模型生成；百度地图升级小度想想2.0，提供智能出行服务；蚂蚁集团开源万亿参数模型Ring-1T-preview；DeepMind提出“帧链”概念，推动视频模型实现全面�

AI DeepSeek 稀疏注意力
华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

华为FreeClip 2耳夹耳机10月20日开售，售价1299元。预售1小时销量破8万台，市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器，算力提升10倍；配备超澎湃双引擎单元，响度与低频动力均翻倍。支持L2HC高清音频编码，音质清晰。新增鸿蒙AI耳边助手，支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构，单耳重5.1克，佩戴舒适且具备IP57防护。续航方面单次使用9小时，配合充电仓总续航达38小时，充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

华为FreeClip2 耳夹耳机 L2HC音频编码
云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

云天励飞近日加入OISA生态，携手产业伙伴共建国产AI芯片互联体系，为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系，旨在打造全向、对等、智能的互联新范式，解决智算集群内存互访难题，为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累，将依托“算力积木”架构的模块化优势，在大规模推理集群中实现高效互联，助力突破万级MoE大模型推理瓶颈，推动国产算力生态发展。

云天励飞 OISA生态 AI芯片互联
荐从方法论到实践：阅文IP工业化，《诡秘之主》再进击

隐隐若现的神秘古宅，塔罗牌、马车、蒸汽机、钟楼、墓园依次闪过，浓郁的维多利亚风情扑面而来;猩红血月穿透浓雾，低音铜管缓缓奏响，心跳节拍不自觉加快，氛围瞬间拉满;魔药、神祗、邪神各股势力粉墨登场，求生本能、思乡之情和“愚者”的使命感在内心暗暗角力…… “开篇就是高能名场面”、“恭迎愚者”、“太还原了，这就是我梦中的世界”——作为“诡秘IP�

诡秘之主维多利亚风情动画第一季
云天励飞携全栈AI推理芯片产品亮相湾芯展，引领“推理时代”新赛道

在2025年湾区半导体产业生态博览会上，云天励飞以“算力积木”为核心理念，全面展示全栈AI推理产品体系。重点推出自研芯片DeepEdge系列及配套模组与加速卡，覆盖从边缘计算到云端推理的不同层级，构建灵活可扩展的算力体系。通过D2D Chiplet等模块化技术，实现8T至256T算力范围，高效支持7B至130B参数的大模型实时推理。目前公司已适配国产鸿蒙系统及主流大模型，参与国家重大专项工程，为航天探测等提供核心算力支撑。未来将持续深化AI芯片研发，携手生态伙伴推动智能计算的普惠化与无处不在。

云天励飞算力积木 AI推理
《伊米尔传奇》10月28日公测预约奖励获取

娱美德研发的《伊米尔传奇》将于2025年10月28日开启国际服公测，现已开放预约。游戏以北欧神话为背景，采用虚幻5引擎打造，凭借次世代画面与特色玩法在韩国上线即登顶Google Play榜单。核心玩法聚焦跨服PVP、赛季玩法与多样化探索任务，强调操作与团队协作。游戏已完成先锋测试，并计划举办全球赛事。玩家可通过预约获取专属奖励并关注预充值活动。

伊米尔传奇国际服公测 GLSail平台
DeepSeek更新至V3.1 Terminus版本：两大升级

9月22日，深度求索宣布DeepSeek V3.1已更新至Terminus版本，官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上，针对用户反馈进行改进：优化语言一致性，缓解中英文混杂、异常字符等问题；提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定，各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

DeepSeek V3.1 Terminus版本
微算法科技（NASDAQ MLGO）研究基于信任场模型的异构物联网区块链分片算法，提高区块链的可扩展性

物联网设备激增带来海量数据，区块链技术虽能保障安全交互，但可扩展性不足。微算法科技提出基于信任场模型的异构物联网区块链分片算法，通过多维度评估设备信任度并聚类分片，实现并行交易处理。该方案提升系统扩展性、安全性和效率，在智能电网、智慧交通、医疗物联网等领域具有应用前景，推动区块链与物联网深度融合。

物联网区块链数据安全

今日大家都在搜的词：

热文

3 天
7天

DeepSeek R2来了？全新推理时Scaling论文联手清华震撼发布！

DeepSeek-V3.2-Exp正式发布

强强联手！深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

荐AI日报：豆包大模型1.6-vision发布；DeepSeek发布V3.2-exp模型；Claude Sonnet4.5发布

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

云天励飞“算力积木”联手OISA，突破万亿级MoE大模型推理集群的Scale up瓶颈

荐从方法论到实践：阅文IP工业化，《诡秘之主》再进击

云天励飞携全栈AI推理芯片产品亮相湾芯展，引领“推理时代”新赛道

《伊米尔传奇》10月28日公测预约奖励获取

DeepSeek更新至V3.1 Terminus版本：两大升级

微算法科技（NASDAQ MLGO）研究基于信任场模型的异构物联网区块链分片算法，提高区块链的可扩展性

今日大家都在搜的词：

热文

华为FreeClip 2耳夹耳机正式开售：售价1299元搭载NPU AI处理器

REDMI K90 Pro Max本周四发布卢伟冰：给4K档一点小小的震撼

火车免费坐？12306今起又上新功能：积分可兑换车票

REDMI K90 Pro Max搭载小米17同款光影猎人950超大底主摄

苹果天猫双11今晚开卖 iPhone17pro天猫官旗首次降价

天猫双11今晚8点开卖品类券每人可领万元

真我GT8官宣搭载Pro同款理光GR影像系统

REDMI K90 Pro Max搭载6.9英寸超级像素屏幕

百度网盘正式适配安卓实况照片：iOS和安卓可跨系统互传

REDMI K90 Pro Max搭载第五代骁龙8至尊版+独显芯片D2

微信回应人去世了朋友圈会消失吗：长时间不使用账号已不再回收

AI日报：阿里发布紧凑型Qwen3-VL模型；科大讯飞AI翻译耳机全球

AI日报：谷歌发布Veo 3.1；通义千问推Qwen Chat Memory功能；S

小米推出短剧App围观短剧：主打无广告免费看

AI日报：谷歌Gemini 3.0 Pro小范围推送；爱诗科技完成1亿元B+轮

REDMI K90 Pro Max外观公布：后置BOSE认证扬声器

王腾首次回应下一步计划：称在考虑些创业项目

卢伟冰官宣REDMI K90系列下周发布：不排斥和小米竞争

苹果华为OPPO将推出eSIM手机 OPPO Find X9系列已确认将支持

微信回应出朋友圈访客功能：可能会让用户产生焦虑重申不会推出

站长商机