首页 > 业界 > 关键词  > 语言模型最新资讯  > 正文

o1开启LLM新范式,Ai2科学家解析背后秘籍:推理和强化学习是关键

2025-02-02 10:12 · 稿源: ​新智元公众号

关注NLP领域的人们,一定好奇「语言模型能做什么?」「什么是o1?」「为什么思维链有效?」在NeurIPS的Latent Space非官方Industry Track上,Ai2研究科学家Nathan Lambert发表相关演讲,直接回答语言模型能否推理,以及o1和强化微调 (RFT) API给大家的启发。演讲内容亮点摘要:20

......

本文由站长之家合作伙伴自媒体作者“​新智元公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 性能超OpenAI、Gemini!月之暗面发布首个自主强化学习Agent

    月之暗面(Moonshot AI)正式推出其首款Agent产品Kimi-Researcher(深度研究),并已启动小范围灰度测试。 该产品基于端到端自主强化学习(end-to-end agentic RL)技术打造,在HLE测试中表现优异,性能超越Claude 4 Opus、Gemini 2.5 Pro及OpenAI Deep Research,并与Gemini-Pro的Deep Research Agent持平。 Kimi-Researcher 是一款高度自主的智能研究助手,能够独立规划任务流程并交付完整结果。与其他Agent不�

  • 神秘物体每44分钟向地球眨1次眼 科学家解释不了

    近期,澳大利亚科廷大学、中国南京大学等研究机构的天文学家在大约16000光年之外,偶然发现一个神秘物体。 该神秘物体与以往任何见过的天体都不同,它每44分钟就会向地球眨眼般地闪光一次,每次持续2分钟。 原本科学家以为,它只是又一个脉冲星的亲戚”。直到最近,美国NASA的钱德拉X射线望远镜捕捉到同一个地方居然也在发出同步的X射线这才让事情变得不寻常起来�

  • “人工智能强化学习可持续发展计划”发布,“教育普惠+标准共建”助力全球人工智能体系构建

    6月11日,第二届"一带一路"科技交流大会人工智能赋能可持续发展论坛在成都举行。腾讯联合多家机构发起"人工智能强化学习可持续发展计划",包含AI教育普惠和强化学习标准共建两大板块。该计划将面向全球高校开放《人工智能通识课》和《人工智能强化学习专业课》教学资源,助力构建高质量AI教学体系。同时,腾讯开悟人工智能全球公开赛颁奖典礼作为"学赛研产"联动的重要环节,吸引了19个国家和地区的近400所高校队伍参赛。2025年赛事将首次联合全国高校计算机能力挑战赛,围绕AI前沿产业真实场景设置赛题。腾讯还通过"青云计划"为全球顶尖AI人才提供就业机会,推动人才与产业高质量发展。北京大学等机构牵头制定了强化学习系统系列技术标准,填补了领域内标准空白。

  • 没想到玄戒O1做得这么好 雷军:定的量不够

    在小米人车家全生态发布会结束后,小米创办人雷军进行了会后分享。 雷军表示,做玄戒O1的时候,小米完全没有想到O1做的这么好,所以整个O1的芯片总量定的不够,规划了4款产品。 雷军还强调,特别感谢朱丹领军的整个芯片团队为小米做出的巨大贡献,我自己用的也是玄戒手机,体验特别好。 他还表示,我们这几款手机和平板备货都很少,我也看到一些说我们卖不动,�

  • AI技术共振,葡萄城技术沙龙引领西南数智转型新范式

    2025年6月13日,由四川省软件行业协会指导、西安葡萄城软件有限公司主办的"AI赋能创新,驱动数字化转型"技术沙龙在成都成功举办。活动汇聚100多位西南地区IT精英,围绕"AI+低代码"主题,探讨前沿技术在行业中的创新应用与发展趋势。葡萄城展示了自研RAG系统及多款产品在AI领域的新功能,并分享了多个行业数字化实践案例。现场还举行了应用示范单位授牌仪式,表彰6家在数字化转型中表现突出的企业。活动将持续在全国多个城市举办,覆盖金融、零售、智能制造等领域,推动AI与低代码技术的深度融合应用。

  • 雷军评价玄戒O1:这是小米在核心技术上的一次重大突破

    今晚7点,小米人车家全生态发布会正式启幕。 在发布会刚开始时,小米创办人雷军提到了玄戒O1,称玄戒O1是小米在核心技术上的一次重大突破。 对于玄戒O1,央视新闻进行了报道,称小米成为中国大陆首家、全球第四家能够自主研发设计3纳米手机芯片的企业,玄戒O1性能表现跻身主流旗舰处理器的第一梯队。 据悉,玄戒O1采用十核心设计,其中超大核是Arm最新的Cortex-X925,

  • 最便宜的玄戒O1产品!小米平板7S Pro关键配置揭晓:12.5英寸屏 120W快充

    今晚,小米集团总裁卢伟冰开启小米人车家全生态新品先导直播,剧透了小米平板7S Pro关键配置信息。 据了解,小米平板7S Pro可选紫色、黑色、寒武岩灰、钛金属色四款配色,机身厚度5.8mm、重量约576g。 平板配备12.5英寸护眼屏幕,分辨率为3.2K、308 PPI,支持144Hz高刷、最高1000尼特亮度,软硬件协同全方位护眼,拥有莱茵三重认证,可选纳米柔光屏,防眩光更护眼。

  • 芯片界“变形金刚”:清微智能超2000万颗出货,重构AI算力新范式

    第七届北京智源大会成功举办,清微智能作为国产可重构芯片架构领导者受邀出席,展示前沿国产算力技术成果。公司首次官宣可重构芯片累计出货量突破2000万颗,成为全球销量领先的可重构芯片厂商。清微依托清华20年技术积淀,坚持高阶国产替代路径,已量产TX8与TX5两大系列十余款芯片,为AI智算中心、大模型等场景提供算力支持。公司还与智源研究院深化合作共建FlagOS生态,并与华为同期加入FlagTree,共同打造统一自主的国产AI芯片软件生态。清微通过"芯片+模型"软硬协同模式重构国内AI生态,成为高阶国产替代赛道的长期主义样本。

  • 最便宜的玄戒O1产品!小米平板7S Pro真机首曝

    小米平板7S Pro已经官宣月底发布,这是第二款搭载3nm玄戒O1的平板。 卢伟冰在最新的预热视频中,已经展示出了小米平板7S Pro真机首曝,采用金属一体化机身,背部设计与小米平板7 Ultra非常相似。 不过从正面和侧面来看,小米平板7S Pro的厚度相比小米平板7 Ultra要厚一些,卢伟冰也透露该机续航非常给力,爆料称其内置10610mAh大电池。 卢伟冰和王腾还现场进行了游戏测试,�

  • 首发玄戒O1!雷军:小米15S Pro体验被大家认可 我非常高兴

    小米创办人雷军表示,搭载玄戒O1芯片的小米15S Pro已经发布了一个月,体验能被大家认可,我非常高兴。 据悉,小米15S Pro于5月22日正式发布,首发起售价是5499元。 该机首发搭载玄戒O1芯片,这是小米史上最强悍的自研芯片,它采用十核心设计,其中超大核是Arm最新的Cortex-X925,主频突破至3.9GHz,大幅提升性能上限,同时兼顾了能效。