英伟达推出新型模型 Cosmos-Reason1 ，让 AI 更好理解物理世界

2025-05-21 15:11 · 来源： AIbase基地

近日，英伟达发布了其最新的 Cosmos-Reason1系列模型，旨在提升人工智能在物理常识和具身推理方面的能力。随着人工智能在语言处理、数学及代码生成等领域取得显著进展，如何将这些能力扩展到物理环境中成为了一大挑战。

物理 AI（Physical AI）不同于传统的人工智能，它依赖于视频等感官输入，并结合现实物理法则来生成反应。物理 AI 的应用领域包括机器人和自动驾驶车辆等，需要具备常识推理能力和对空间、时间及物理规律的深入理解。

然而，现有的 AI 模型在与物理世界的连接上依然存在弱点，无法直观理解重力或空间关系，这使得其在具身任务中的表现不佳。直接在物理世界中进行训练的成本高昂且风险巨大，这在一定程度上阻碍了物理 AI 的发展。

为了解决这些问题，英伟达的 Cosmos-Reason1模型提出了创新的解决方案。该系列模型包括 Cosmos-Reason1-7B 和 Cosmos-Reason1-56B 两个版本，采用了物理 AI 监督微调和强化学习两大训练阶段。

研究团队引入了双本体系统，一个分层本体将物理常识分为空间、时间和基础物理三大类，另一个本体则映射人类、机械臂和人形机器人等具身代理的推理能力。

模型架构采用了仅解码器的大型语言模型，结合视觉编码器以处理视频数据，从而实现文本和视觉数据的同步推理。为此，团队构建了针对物理常识的三个基准测试，涵盖604个问题和426个视频，以及针对具身推理的六个基准，包含610个问题和600个视频。

经过训练，Cosmos-Reason1模型在物理常识和具身推理基准测试中表现出色，特别是在强化学习训练后，在预测下一步行动、验证任务完成及评估物理可行性等方面取得了显著进展。

随着 Cosmos-Reason1系列模型的推出，英伟达为物理推理任务提供了新的解决方案，未来在机器人和自动驾驶领域的应用潜力可期。

入口:https://github.com/nvidia-cosmos/cosmos-reason1

划重点:
🌟 英伟达发布 Cosmos-Reason1系列模型，提升 AI 在物理推理中的能力。
🤖 该模型采用双本体系统，通过视频和文本数据进行同步推理。
📈 在基准测试中，Cosmos-Reason1模型在物理常识和具身推理方面表现优异。

相关推荐

英伟达CEO黄仁勋造访白宫：希望特朗普修改AI芯片出口规则

快科技5月1日消息，据媒体报道，美国当地时间周三，英伟达公司首席执行官黄仁勋造访白宫时表示，他希望特朗普政府修改从美国向全球出口人工智能（AI）技术的相关法规，以便美国企业能更好地抓住未来的机遇。我们需要加速美国AI技术在全球的扩散，”黄仁勋在与媒体的简短会面中表示，政府的政策和鼓励措施必须真正支持这一点。”与此同时，黄仁勋还呼吁美国政府放宽人工智能图形处理单元出口规定，但媒体报道特朗普政府计划加强控制。众所周知，英伟达目前主导着用于训练AI模型的尖端AI芯片市场，但其向中国客户销售最先进产品的渠道已被?

英伟达人工智能出口法规
三星推出新型微显示技术，加剧 AR 眼镜竞争

三星目前正在考虑在 2027 年实现 LEDoS 的商业化生产，除了即将推出的 AR 眼镜外，三星还希望向苹果和 Meta 提供他们的 LEDoS 技术……

三星微显示技术 AR眼镜 AR头显
荐超越DeepSeek-R1，英伟达开源新王登顶，14万H100小时训练细节全曝光

英伟达发布开源Llama-Nemotron系列模型，性能超越DeepSeek-R1。该系列包含三个版本：8B、49B和253B参数模型，其中253B的Ultra版本在推理吞吐量和内存效率上表现突出。关键技术包括：1）采用神经架构搜索优化模型结构；2）通过知识蒸馏和持续预训练提升性能；3）结合合成数据监督微调；4）在STEM领域进行大规模强化学习训练。Ultra版本在GPQA基准测试中达到开源模型最高水平，单节点8xH100即可高效运行。模型创新性支持"推理开关"功能，通过指令动态切换推理模式。训练流程包含五阶段优化，最终模型在数学推理和通用任务上均表现优异，部分基准超越专有模型。

英伟达 Llama-Nemotron DeepSeek-R1
OpenAI 推出首款成熟编程 AI 代理 Codex

Codex 可复制开发环境，单任务耗时最长 30 分钟……

Codex OpenAI编程AI AI编程
美国封锁没意义！揭秘华为384颗自研芯片方案领先英伟达AMD一代

快科技5月2日消息，美国封锁芯片对华出口，这让英伟达CEO黄仁勋倍感焦虑，因为他深知中国国产算力目前达到了怎样的水平。前段时间华为推出了AI算力集群解决方案CloudMatrix 384，这在外行看来似乎没有什么不同，但如果仔细剖析其影响可谓深远。按照华为的说法，CloudMatrix 384基于384颗昇腾芯片构建，通过全互连拓扑架构实现芯片间高效协同，可提供高达300 PFLOPs的密集BF16算力，接近达到英伟达GB200 NVL72系统的两倍。此外，CM384在内存容量和带宽方面同样占据优势，总内存容量超出英伟达方案3.6倍，内存带宽也达到2.1倍，为大规模AI训

芯片算力华为
2499元起！英伟达RTX 5060显卡开启预约：5月20日0点开售

英伟达RTX 5060显卡5月14日开启预约，5月20日正式发售，基础款统一售价2499元。该显卡采用GB206-250 GPU芯片，配备3840个CUDA核心，加速频率2497MHz，搭载8GB GDDR7显存（等效频率28GHz），功耗145W。相比RTX 4060，核心数增加25%，显存带宽提升65%，功耗增加30W。支持DLSS 4技术，可助力游戏实现100FPS流畅体验。华硕、七彩虹、技嘉、微星等品牌双风扇版本已上架电商平台。

英伟达 RTX 5060
苹果开放 AI 模型……计划于下个月在 WWDC 上发布

尽管“Apple Intelligence”的首次亮相反响平平，但通过向开发者开放模型，苹果希望激发更多创新使用场景，提升平台的吸引力……

苹果AI 苹果开放AI模型苹果AI模型
彭博社聚焦Coinbase数据泄露，CertiK联创顾荣辉警示私钥风险与物理攻击

CertiK联合创始人顾荣辉就Coinbase数据泄露事件指出，加密货币交易者因私钥即可转移资产且难以追回，成为犯罪分子的首要目标。区块链安全虽提升，但攻击者转向物理威胁等薄弱环节。钓鱼攻击去年造成10.5亿美元损失，显示攻击方式从技术漏洞转向高回报手段。法国政府已为加密从业者开通应急热线，并建议结合链上防御、数据隐私与物理安防措施应对数字与实体交织的威胁。近期Coinbase数据泄露及法国绑架案凸显加密投资者面临的物理安全风险，部分公司已加强高管安保投入。专家呼吁建立更广泛的安全协作网络应对持续演变的攻防博弈。

区块链安全数据泄露加密货币威胁
荐从游戏少女到AI女神，她用物理驯服AI，让飓风预测快1000倍

10岁那年，Rose Yu收到一台改变命运的电脑礼物。25年前电脑在中国还是稀罕物，这份来自叔叔的礼物开启了她开挂般的人生。从中学网页设计获奖到大学计算机专业深造，再到南加州大学读博，她始终专注将物理学原理融入神经网络研究。她创新性地将交通流视为流体，开发出预测精度提升20倍的交通模型，被谷歌地图采用。2018年她转向湍流预测研究，使飓风预报速度提升1000�

电脑影响神经网络创新研究
苹果手机闹钟调休日不响 ColorOS陈希：不是非常理解

4月27日，#当苹果闹钟遇上调休#话题登上微博热搜。网友吐槽苹果闹钟无法自动识别调休日，导致很多人可能迟到。安卓厂商多年前就已解决该问题，OPPO高管表示用户反馈后已支持该功能。苹果客服回应称用户需手动设置闹钟周期，但该问题长期未获公司重视。此次事件凸显智能手机在日常管理中的重要性，提醒厂商应更注重用户体验和实际需求，满足不同场景下的使用习惯。

苹果闹钟调休问题安卓厂商反馈

今日大家都在搜的词：

热文

3 天
7天

英伟达推出新型模型 Cosmos-Reason1 ，让 AI 更好理解物理世界

英伟达CEO黄仁勋造访白宫：希望特朗普修改AI芯片出口规则

三星推出新型微显示技术，加剧 AR 眼镜竞争

荐超越DeepSeek-R1，英伟达开源新王登顶，14万H100小时训练细节全曝光

OpenAI 推出首款成熟编程 AI 代理 Codex

美国封锁没意义！揭秘华为384颗自研芯片方案领先英伟达AMD一代

2499元起！英伟达RTX 5060显卡开启预约：5月20日0点开售

苹果开放 AI 模型……计划于下个月在 WWDC 上发布

彭博社聚焦Coinbase数据泄露，CertiK联创顾荣辉警示私钥风险与物理攻击

荐从游戏少女到AI女神，她用物理驯服AI，让飓风预测快1000倍

苹果手机闹钟调休日不响 ColorOS陈希：不是非常理解

今日大家都在搜的词：

热文

Windows时光倒流：30 年前的系统仍在火车、银行、医院运行着

学生发现教授用ChatGPT生成课件，要求退费 8000 美元

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

OpenAI 推出首款成熟编程 AI 代理 Codex

帝国用脏话反击：AI 达斯・维达“黑化”，满口粗言秽语

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

iOS 19 或将大幅提升你 iPhone 的电池续航能力

AI 驱动高效转型，Klarna 人均收入飙升至近 100 万美元

欧洲准备试行“开放网页索引”，以减少对谷歌、必应的依赖

Windows时光倒流：30 年前的系统仍在火车、银行、医院运行着

42岁程序员因AI被裁，失业一年，现蜗居房车，靠跑腿维生

学生发现教授用ChatGPT生成课件，要求退费 8000 美元

苹果与Epic诉讼战升级，法官施压：要么批准《堡垒之夜》上架，

特朗普签署法案，将“报复性色情”和“露骨AI深度伪造”定为犯

苹果 AI 太落伍？他们需要从对手那里“复制”这三个功能

日产 N7 电动车在中国创下新纪录，18 天订单突破 1 万台

OpenAI 推出首款成熟编程 AI 代理 Codex

帝国用脏话反击：AI 达斯・维达“黑化”，满口粗言秽语

黄仁勋：AI十年变革拉开序幕，“这个赛道没有第二名”

站长商机