首页 > 业界 > 关键词  > UniSim最新资讯  > 正文

DeepMind新机器学习模型UniSim:模拟现实以训练机器人和游戏角色

2023-10-18 09:40 · 稿源:站长之家

划重点:

- Google DeepMind与多所大学合作,研发出一款新的机器学习模型UniSim,用于创建逼真的模拟环境,用于培训各类人工智能系统。

- UniSim的特点是能够模拟现实世界的互动,包括高级指令和低级控制,为其他需要真实世界数据的模型提供训练示例。

- UniSim的应用潜力广泛,包括培训机器人、游戏角色,以及填补模拟和现实世界之间的鸿沟。

站长之家(ChinaZ.com)10月18日 消息:谷歌 DeepMind 的研究人员与加州大学伯克利分校、麻省理工学院和阿尔伯塔大学合作开发了一个名为UniSim的机器学习模型,可以为训练各种人工智能系统创建真实的模拟。

研究人员表示,下一个生成模型的重要里程碑是模拟人类、机器人和其他互动实体采取行动时的逼真体验,而UniSim正是他们希望实现这一目标的工具。UniSim被描述为一个“通用的现实世界互动模拟器”。

尽管UniSim仍处于早期阶段,但它已经展现了实现这一目标的第一步。UniSim可以成为需要复杂真实世界互动数据的领域的宝贵工具,例如机器人技术和自动驾驶汽车。

image.png

UniSim是一种生成模型,可以模仿人类与环境以及其他实体之间的互动。它能够模拟高级指令(如“打开抽屉”)和低级控制(如“移动到x,y坐标”)的视觉效果。这些模拟数据可以用作其他需要真实世界数据的模型的训练示例。

image.png

UniSim的数据源非常广泛,包括互联网文本-图像对、导航、操作、人类活动、机器人数据以及模拟和渲染等。研究人员将这些多样的数据格式整合成一个统一的格式,通过使用Transformer模型和扩散模型进行编码和生成,将观察、行动和结果联系在一起。

UniSim还具有生成逼真视频的能力,包括人物执行各种动作和环境导航。它还能够执行长时间模拟,例如机器人手执行多个动作的序列。

此外,UniSim还能生成“随机环境转换”,例如揭示毛巾下的不同物体,这对于计算机视觉应用中的模拟反事实和不同场景非常有用。

UniSim的真正价值在于与强化学习环境的整合,这使得UniSim可以在机器人等应用中模拟各种结果,无需真实世界训练。这一方法的优势包括无限的环境访问、接近真实世界的观察以及对时间控制频率的灵活性。

UniSim有广泛的应用前景,包括在游戏和电影中创建可控内容,以及在模拟中培训直接用于现实世界的虚拟实体。UniSim还可以为视觉语言模型提供大量的训练数据,这对于需要执行复杂多步任务的模型非常有益。研究人员还指出,UniSim可用于培训高级视觉语言规划器、低级强化学习策略等多种模型。

UniSim还可以模拟罕见事件,这一特性在机器人技术和自动驾驶汽车等领域特别有用,因为数据收集可能既昂贵又有风险。尽管UniSim的培训成本相对较高,但研究人员希望它能够引发广泛的兴趣,以改善机器智能。

举报

  • 相关推荐
  • 微算法科技(NASDAQ MLGO)研发基于AI的动态权重学习模型,开启区块链账户关联分析智能新时代

    微算法科技(NASDAQ MLGO)推出基于AI的动态权重学习模型,解决区块链账户关联分析中传统静态模型难以适应业务快速变化的问题。该模型采用分层架构,结合注意力机制LSTM、联邦学习等技术,实时捕捉交易模式演变,动态调整账户关联权重。在分片效率、风险控制、资源分配等领域应用效果显著,提升交易处理速度与欺诈识别率。未来计划融合多模态数据,探索量子机器�

  • 机器人“全能导航大脑”来了!银河通用发布NavFoM大模型

    银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM,实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用,通过统一“视频流+文本指令→动作轨迹”范式,融合800万条跨任务导航数据,在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施,为规模化商业落地奠定关键基础。

  • 触觉增强世界模型引关注,一目科技IROS首秀定义机器人感知新维度

    在2025年IROS大会上,中国AI企业一目科技凭借触觉感知与具身智能领域的突破成为焦点。公司展示了全球最薄仿生视觉触觉传感器,厚度大幅缩减,实现0.005N三维力分辨率和120fps输出帧率。CEO李智强提出"视觉-触觉-语言-行动"新范式,指出触觉能捕捉物理世界的隐秘维度。通过创新仿真平台和生成式AI技术,突破传统数据收集限制,显著提升机器人操作技能训练效率。现场机械臂成功演示易碎品抓取等复杂任务,验证了触觉感知在精细操控中的核心价值,为"操控即服务"产业愿景提供技术支撑。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • AI日报:昆仑万维SkyReels V3模型上线;月之暗面推Kimi Linear模型;MiniMax Music 2.0 发布

    本期AI日报聚焦多领域创新:昆仑万维推出SkyReels V3模型,整合顶尖视频生成能力;月之暗面Kimi Linear模型处理长文本速度提升2.9倍;MiniMax Music 2.0实现专业级音乐创作;字节跳动启动豆包股权激励计划吸引AI人才;苹果iOS 27将迎AI重大升级,Siri更个性化;Dia浏览器融合Arc设计理念与AI技术;文心魔法漫画工具实现一键生成连载作品;谷歌Gemini Canvas新增PPT自动生成功能,由Gemini 2.5 Pro驱动,提升职场效率。

  • 小鹏机器人会走猫步太像人了!小鹏发布新一代人形机器人IRON

    在第七届小鹏科技日上,小鹏汽车发布全新人形机器人IRON,其拟人化程度领先,拥有仿生脊柱、肌肉及柔性皮肤,配备3D曲面显示与灵巧双手,实现22个自由度。搭载3颗图灵AI芯片,算力达2250TOPS,支持对话、行走等智能交互,并采用全固态电池提升安全性。集成自研物理世界模型与VLT/VLA/VLM能力,实现环境感知与反馈。IRON将优先应用于商业场景,并与宝钢合作探索工业巡检。小鹏宣布开放SDK,邀请全球开发者共建机器人应用生态。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 何小鹏回应机器人IRON里是真人质疑:感谢认可

    在第七届小鹏科技日上,小鹏汽车自主研发的人形机器人IRON首次亮相,其逼真步态引发网友惊叹“100%真人在里面”。面对质疑,董事长何小鹏以“感谢认可”巧妙回应,展现技术自信。IRON采用类人“骨骼-肌肉-皮肤”结构,搭载仿生肌肉驱动系统和22自由度拟态双手,能精准感知环境变化。团队历时7年研发,计划明年4月进入量产阶段。该机器人还融合物理世界模型体系,集成VLT/VLA/VLM三大核心能力,实现实时环境交互。此次展示既体现小鹏技术积累,也引发对科技真实性的思考。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

今日大家都在搜的词: