首页 > 业界 > 关键词  > DeepSeek最新资讯  > 正文

DeepSeek R2来了?全新推理时Scaling论文联手清华震撼发布!

2025-04-05 09:20 · 稿源: 新智元公众号

【新智元导读】DeepSeek新论文来了!在清华研究者共同发布的研究中,他们发现了奖励模型推理时Scaling的全新方法。DeepSeek R2,果然近了。最近,DeepSeek和清华的研究者发表的这篇论文,探讨了奖励模型的推理时Scaling方法。论文地址:https://arxiv.org/abs/2504.02495现在,强化学

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • DeepSeek-V3.2-Exp正式发布

    DeepSeek于9月30日正式发布实验性模型DeepSeek-V3.2-Exp,该模型基于V3.1-Terminus升级,引入创新的稀疏注意力机制DSA,首次实现细粒度稀疏注意力,在保持模型输出效果的同时显著提升长文本训练和推理效率。测试显示其表现与V3.1-Terminus基本持平。应用层面,官方App、网页端及小程序均已同步更新。同时宣布API价格大幅调整:输入缓存0.2元、输入未缓存2元、输出3元,开发者调用成本降低50%以上。模型已在HuggingFace和魔搭开源平台上线。

  • 强强联手!深度求索、寒武纪同步发布DeepSeek-V3.2模型架构和基于vLLM的模型适配源代码

    2025年9月29日,深度求索公司发布新一代模型架构DeepSeek-V3.2,引发行业关注。寒武纪同步宣布适配该模型并开源vLLM-MLU推理引擎代码。新发布的DeepSeek-V3.2-Exp是实验性版本,在V3.1-Terminus基础上引入稀疏注意力机制,优化长文本训练和推理效率。目前官方应用端已同步更新,API大幅降价。此次模型体积达671GB,下载需8-10小时。业内专家指出,此次快速适配表明双方早有深度技术协�

  • AI日报:豆包大模型1.6-vision发布;DeepSeek发布V3.2-exp模型;Claude Sonnet4.5发布

    本期AI日报聚焦多项技术突破:DeepSeek发布V3.2-exp模型,通过稀疏注意力机制降低API成本50%;Anthropic推出Claude Sonnet 4.5,在编码任务表现卓越;ChatGPT新增即时结账功能,实现对话界面直接购物;OpenAI将推出AI版TikTok,所有内容由Sora2模型生成;百度地图升级小度想想2.0,提供智能出行服务;蚂蚁集团开源万亿参数模型Ring-1T-preview;DeepMind提出“帧链”概念,推动视频模型实现全面�

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

  • 云天励飞“算力积木”联手OISA,突破万亿级MoE大模型推理集群的Scale up瓶颈

    云天励飞近日加入OISA生态,携手产业伙伴共建国产AI芯片互联体系,为中国算力生态注入新动力。OISA是中国移动提出的开放互联标准体系,旨在打造全向、对等、智能的互联新范式,解决智算集群内存互访难题,为大规模并行计算提供技术基石。云天励飞凭借在AI芯片与算力架构的长期积累,将依托“算力积木”架构的模块化优势,在大规模推理集群中实现高效互联,助力突破万级MoE大模型推理瓶颈,推动国产算力生态发展。

  • 从方法论到实践:阅文IP工业化,《诡秘之主》再进击

    隐隐若现的神秘古宅,塔罗牌、马车、蒸汽机、钟楼、墓园依次闪过,浓郁的维多利亚风情扑面而来;猩红血月穿透浓雾,低音铜管缓缓奏响,心跳节拍不自觉加快,氛围瞬间拉满;魔药、神祗、邪神各股势力粉墨登场,求生本能、思乡之情和“愚者”的使命感在内心暗暗角力…… “开篇就是高能名场面”、“恭迎愚者”、“太还原了,这就是我梦中的世界”——作为“诡秘IP�

  • 云天励飞携全栈AI推理芯片产品亮相湾芯展,引领“推理时代”新赛道

    在2025年湾区半导体产业生态博览会上,云天励飞以“算力积木”为核心理念,全面展示全栈AI推理产品体系。重点推出自研芯片DeepEdge系列及配套模组与加速卡,覆盖从边缘计算到云端推理的不同层级,构建灵活可扩展的算力体系。通过D2D Chiplet等模块化技术,实现8T至256T算力范围,高效支持7B至130B参数的大模型实时推理。目前公司已适配国产鸿蒙系统及主流大模型,参与国家重大专项工程,为航天探测等提供核心算力支撑。未来将持续深化AI芯片研发,携手生态伙伴推动智能计算的普惠化与无处不在。

  • 《伊米尔传奇》10月28日公测 预约奖励获取

    娱美德研发的《伊米尔传奇》将于2025年10月28日开启国际服公测,现已开放预约。游戏以北欧神话为背景,采用虚幻5引擎打造,凭借次世代画面与特色玩法在韩国上线即登顶Google Play榜单。核心玩法聚焦跨服PVP、赛季玩法与多样化探索任务,强调操作与团队协作。游戏已完成先锋测试,并计划举办全球赛事。玩家可通过预约获取专属奖励并关注预充值活动。

  • DeepSeek更新至V3.1 Terminus版本:两大升级

    9月22日,深度求索宣布DeepSeek V3.1已更新至Terminus版本,官方App、网页端、小程序与API模型同步升级。本次更新在保持模型原有能力基础上,针对用户反馈进行改进:优化语言一致性,缓解中英文混杂、异常字符等问题;提升Code Agent与Search Agent表现。官方表示新版本输出效果更稳定,各领域评测表现优异。开源版本已在Hugging Face和ModelScope平台发布。

  • 微算法科技(NASDAQ MLGO)研究基于信任场模型的异构物联网区块链分片算法,提高区块链的可扩展性

    物联网设备激增带来海量数据,区块链技术虽能保障安全交互,但可扩展性不足。微算法科技提出基于信任场模型的异构物联网区块链分片算法,通过多维度评估设备信任度并聚类分片,实现并行交易处理。该方案提升系统扩展性、安全性和效率,在智能电网、智慧交通、医疗物联网等领域具有应用前景,推动区块链与物联网深度融合。

今日大家都在搜的词: