首页 > AI头条  > 正文

英伟达推出新型模型 Cosmos-Reason1 ,让 AI 更好理解物理世界

2025-05-21 15:11 · 来源: AIbase基地

近日,英伟达发布了其最新的 Cosmos-Reason1系列模型,旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展,如何将这些能力扩展到物理环境中成为了一大挑战。

image.png

物理 AI(Physical AI)不同于传统的人工智能,它依赖于视频等感官输入,并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等,需要具备常识推理能力和对空间、时间及物理规律的深入理解。

然而,现有的 AI 模型在与物理世界的连接上依然存在弱点,无法直观理解重力或空间关系,这使得其在具身任务中的表现不佳。直接在物理世界中进行训练的成本高昂且风险巨大,这在一定程度上阻碍了物理 AI 的发展。

为了解决这些问题,英伟达的 Cosmos-Reason1模型提出了创新的解决方案。该系列模型包括 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两个版本,采用了物理 AI 监督微调和强化学习两大训练阶段。

研究团队引入了双本体系统,一个分层本体将物理常识分为空间、时间和基础物理三大类,另一个本体则映射人类、机械臂和人形机器人等具身代理的推理能力。

模型架构采用了仅解码器的大型语言模型,结合视觉编码器以处理视频数据,从而实现文本和视觉数据的同步推理。为此,团队构建了针对物理常识的三个基准测试,涵盖604个问题和426个视频,以及针对具身推理的六个基准,包含610个问题和600个视频。

经过训练,Cosmos-Reason1模型在物理常识和具身推理基准测试中表现出色,特别是在强化学习训练后,在预测下一步行动、验证任务完成及评估物理可行性等方面取得了显著进展。

随着 Cosmos-Reason1系列模型的推出,英伟达为物理推理任务提供了新的解决方案,未来在机器人和自动驾驶领域的应用潜力可期。

入口:https://github.com/nvidia-cosmos/cosmos-reason1

划重点:  

🌟  英伟达发布 Cosmos-Reason1系列模型,提升 AI 在物理推理中的能力。  

🤖  该模型采用双本体系统,通过视频和文本数据进行同步推理。  

📈  在基准测试中,Cosmos-Reason1模型在物理常识和具身推理方面表现优异。  

  • 相关推荐
  • 英伟达CEO黄仁勋造访白宫:希望特朗普修改AI芯片出口规则

    快科技5月1日消息,据媒体报道,美国当地时间周三, 英伟达公司首席执行官黄仁勋造访白宫时表示,他希望特朗普政府修改从美国向全球出口人工智能(AI)技术的相关法规,以便美国企业能更好地抓住未来的机遇。我们需要加速美国AI技术在全球的扩散,”黄仁勋在与媒体的简短会面中表示,政府的政策和鼓励措施必须真正支持这一点。”与此同时,黄仁勋还呼吁美国政府放宽人工智能图形处理单元出口规定,但媒体报道特朗普政府计划加强控制。众所周知,英伟达目前主导着用于训练AI模型的尖端AI芯片市场,但其向中国客户销售最先进产品的渠道已被?

  • 三星推出新型微显示技术,加剧 AR 眼镜竞争

    三星目前正在考虑在 2027 年实现 LEDoS 的商业化生产,除了即将推出的 AR 眼镜外,三星还希望向苹果和 Meta 提供他们的 LEDoS 技术……

  • 超越DeepSeek-R1英伟达开源新王登顶,14万H100小时训练细节全曝光

    英伟达发布开源Llama-Nemotron系列模型,性能超越DeepSeek-R1。该系列包含三个版本:8B、49B和253B参数模型,其中253B的Ultra版本在推理吞吐量和内存效率上表现突出。关键技术包括:1)采用神经架构搜索优化模型结构;2)通过知识蒸馏和持续预训练提升性能;3)结合合成数据监督微调;4)在STEM领域进行大规模强化学习训练。Ultra版本在GPQA基准测试中达到开源模型最高水平,单节点8xH100即可高效运行。模型创新性支持"推理开关"功能,通过指令动态切换推理模式。训练流程包含五阶段优化,最终模型在数学推理和通用任务上均表现优异,部分基准超越专有模型。

  • OpenAI 推出首款成熟编程 AI 代理 Codex

    Codex 可复制开发环境,单任务耗时最长 30 分钟……

  • 美国封锁没意义!揭秘华为384颗自研芯片方案 领先英伟达AMD一代

    快科技5月2日消息,美国封锁芯片对华出口,这让英伟达CEO黄仁勋倍感焦虑,因为他深知中国国产算力目前达到了怎样的水平。前段时间华为推出了AI算力集群解决方案CloudMatrix 384,这在外行看来似乎没有什么不同,但如果仔细剖析其影响可谓深远。按照华为的说法,CloudMatrix 384基于384颗昇腾芯片构建,通过全互连拓扑架构实现芯片间高效协同,可提供高达300 PFLOPs的密集BF16算力,接近达到英伟达GB200 NVL72系统的两倍。此外,CM384在内存容量和带宽方面同样占据优势,总内存容量超出英伟达方案3.6倍,内存带宽也达到2.1倍,为大规模AI训

  • 2499元起!英伟达RTX 5060显卡开启预约:5月20日0点开售

    英伟达RTX 5060显卡5月14日开启预约,5月20日正式发售,基础款统一售价2499元。该显卡采用GB206-250 GPU芯片,配备3840个CUDA核心,加速频率2497MHz,搭载8GB GDDR7显存(等效频率28GHz),功耗145W。相比RTX 4060,核心数增加25%,显存带宽提升65%,功耗增加30W。支持DLSS 4技术,可助力游戏实现100FPS流畅体验。华硕、七彩虹、技嘉、微星等品牌双风扇版本已上架电商平台。

  • 苹果开放 AI 模型……计划于下个月在 WWDC 上发布

    尽管“Apple Intelligence”的首次亮相反响平平,但通过向开发者开放模型,苹果希望激发更多创新使用场景,提升平台的吸引力……

  • 彭博社聚焦Coinbase数据泄露,CertiK联创顾荣辉警示私钥风险与物理攻击

    CertiK联合创始人顾荣辉就Coinbase数据泄露事件指出,加密货币交易者因私钥即可转移资产且难以追回,成为犯罪分子的首要目标。区块链安全虽提升,但攻击者转向物理威胁等薄弱环节。钓鱼攻击去年造成10.5亿美元损失,显示攻击方式从技术漏洞转向高回报手段。法国政府已为加密从业者开通应急热线,并建议结合链上防御、数据隐私与物理安防措施应对数字与实体交织的威胁。近期Coinbase数据泄露及法国绑架案凸显加密投资者面临的物理安全风险,部分公司已加强高管安保投入。专家呼吁建立更广泛的安全协作网络应对持续演变的攻防博弈。

  • 从游戏少女到AI女神,她用物理驯服AI,让飓风预测快1000倍

    10岁那年,Rose Yu收到一台改变命运的电脑礼物。25年前电脑在中国还是稀罕物,这份来自叔叔的礼物开启了她开挂般的人生。从中学网页设计获奖到大学计算机专业深造,再到南加州大学读博,她始终专注将物理学原理融入神经网络研究。她创新性地将交通流视为流体,开发出预测精度提升20倍的交通模型,被谷歌地图采用。2018年她转向湍流预测研究,使飓风预报速度提升1000�

  • 苹果手机闹钟调休日不响 ColorOS陈希:不是非常理解

    4月27日,#当苹果闹钟遇上调休#话题登上微博热搜。网友吐槽苹果闹钟无法自动识别调休日,导致很多人可能迟到。安卓厂商多年前就已解决该问题,OPPO高管表示用户反馈后已支持该功能。苹果客服回应称用户需手动设置闹钟周期,但该问题长期未获公司重视。此次事件凸显智能手机在日常管理中的重要性,提醒厂商应更注重用户体验和实际需求,满足不同场景下的使用习惯。

今日大家都在搜的词:

热文

  • 3 天
  • 7天