o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

2025-02-02 10:12 · 稿源：新智元公众号

关注NLP领域的人们，一定好奇「语言模型能做什么?」「什么是o1?」「为什么思维链有效?」在NeurIPS的Latent Space非官方Industry Track上，Ai2研究科学家Nathan Lambert发表相关演讲，直接回答语言模型能否推理，以及o1和强化微调（RFT） API给大家的启发。演讲内容亮点摘要:20

......

本文由站长之家合作伙伴自媒体作者“新智元公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
脑机接口商业化资本涌动，Neuralink/微美全息强化系统规划谋发展全局

马斯克旗下Neuralink公司展示渐冻症患者通过脑机接口控制机械臂进食，这是其获批临床研究项目的重要进展。脑机接口技术正推动医疗设备从辅助工具升级为神经替代系统，吸引全球上万患者参与试验。该技术绕开传统神经肌肉交互路径，在思维与机器间建立直接通信，不仅应用于医疗康复，还延伸至教育、工业等领域。随着政策支持与技术融合，脑机接口产业加速壮大，预计2028年中国市场规模将达614亿元，未来十年有望迎来爆发式增长。

脑机接口 Neuralink 渐冻症
百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

10月28日，百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测（MTP）技术代码。该技术通过批量生成和集中验证机制，使模型解码吞吐量提升超2倍，突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配，并经过百度内部业务验证，开发者可"开箱即用"获得稳定可靠的推理加速能力。

百度智能云 DeepSeek-V3.2 MTP技术
OPPO Reno15系列官宣11月10日发布

OPPO Reno15系列将于11月10日发布，延续人气偶像宋雨琦代言，新增“星光蝴蝶结”紫色配色与特殊工艺。系列含Reno15和Pro两款：Reno15配备6.32英寸1.5K屏、天玑8450芯片、前置5000万+后置2亿主摄三摄，支持IP68/69防水；Pro版采用6.78英寸1.5K直屏，新增50W无线充电，其他配置基本一致。真机实拍显示其延续冷雕工艺，质感出色。

OPPO Reno15系列宋雨琦代言
寒武纪：构建大模型开发到部署的全流程开放服务能力

华鑫证券研报显示，寒武纪2025年上半年业绩亮眼，营收28.81亿元，同比增长4347.82%；归母净利润10.38亿元，增长295.82%。公司募资39.85亿元，重点投向大模型芯片及软件平台建设，以增强AI算力芯片综合实力。凭借云边端一体、软硬协同等技术优势，其产品已获多领域客户认可，覆盖金融、互联网等行业。未来随着技术迭代与生态完善，业绩有望持续提升。

寒武纪 AI算力芯片大模型芯片
OPPO Reno15系列预热：宋雨琦代言

OPPO Reno产品经理张若星发布Reno15系列预热视频，该视频暗示Reno15系列仍然由宋雨琦代言。据爆料，Reno15系列包含Reno15和Reno15Pro两杯，其中标准版Reno15采用6.32英寸1.5K小屏，配备金属中框，搭载天玑8450芯片，前置5000万像素，后置2亿像素主摄、5000万超广角和5000万潜望长焦，支持IP68IP69满级防水。 OPPO Reno15Pro采用6.78英寸1.5K大直屏，配备

OPPO Reno15 天玑8450
EUDR认证大概需要多少钱？绿舟为您带来费用详解

欧盟《零毁林法案》(EUDR)将于2025年底实施，中国出口企业面临合规挑战。认证成本因企业规模、供应链复杂度而异，中小型企业费用约数万元，大型企业可达数十万元。核心支出包括供应链追溯、风险评估及第三方审核。案例显示认证橡胶原料溢价达200美元/吨，但长期可通过价格溢价抵消部分成本。建议企业提前规划，采用区块链等技术提升追溯效率，并争取将中国列为低风险国家以简化流程。合规虽增加短期成本，却是提升国际竞争力和供应链转型的契机。

EUDR认证欧盟零毁林法案绿色通行证
著名文化学者于丹确认出席全球创始人IP+AI万人高峰论坛

知名文化学者于丹教授将出席2025年11月22-25日在厦门举办的全球创始人IP+AI万人高峰论坛。作为国学传播者，她以通俗解读经典著作推动传统文化普及，作品销量超千万册。本次论坛以"IP+AI"为主题，于丹将分享传统智慧与现代科技融合的见解，为创业者、企业家提供人文视角的思考启发，促进科技与人文的深度对话。
每天刷手机青少年认知能力显著下降：高频互动或致语言记忆下滑

加州大学研究团队在《美国医学会杂志》发表研究，追踪6500名9至13岁青少年社交媒体使用行为。研究发现，社交媒体使用时长增加与认知能力下降存在显著关联，尤其影响语言流畅度、工作记忆等核心功能。研究指出，社交媒体高频互动特性会切割注意力，干扰大脑深度信息处理能力。专家建议家长关注使用模式而非单纯限制时间，结合个体认知特点制定干预策略，引导青少年建立健康媒介使用习惯。

社交媒体认知能力青少年研究
他提前马斯克7年就提出了硅基生命的概念

中国创业者司马华鹏于2017年首次系统提出“硅基生命”概念，比马斯克公开讨论类似理念早七年。他构建了完整理论框架，强调硅基生命与碳基生命的“共生进化”关系，体现东方“天人合一”哲学。相比之下，马斯克2024年提出的概念更侧重“竞争进化”与风险意识。七年来，司马华鹏带领团队专注技术实践，从数字人研发到多模态AI系统，逐步推出拟人化数字生命体。尽管其贡献因语言壁垒和低调作风未被国际广泛认知，但技术积累与东方智慧正日益获得认可。

今日大家都在搜的词：

热文

3 天
7天

o1开启LLM新范式，Ai2科学家解析背后秘籍：推理和强化学习是关键

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

脑机接口商业化资本涌动，Neuralink/微美全息强化系统规划谋发展全局

百度智能云这项开源，让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

OPPO Reno15系列官宣11月10日发布

寒武纪：构建大模型开发到部署的全流程开放服务能力

OPPO Reno15系列预热：宋雨琦代言

EUDR认证大概需要多少钱？绿舟为您带来费用详解

著名文化学者于丹确认出席全球创始人IP+AI万人高峰论坛

每天刷手机青少年认知能力显著下降：高频互动或致语言记忆下滑

他提前马斯克7年就提出了硅基生命的概念

今日大家都在搜的词：

热文

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

OPPO Reno15系列官宣11月10日发布

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

何小鹏回应机器人IRON里是真人质疑：感谢认可

站长商机