首页 > 业界 > 关键词  > NVIDIA最新资讯  > 正文

NVIDIA发布GR00T基础模型 对Isaac机器人平台进行更新

2024-03-19 13:46 · 稿源:站长之家

划重点:

NVIDIA推出了GR00T项目,为人形机器人提供了通用基础模型,旨在推动机器人和具象化人工智能领域的突破。

⭐ Isaac机器人平台迎来重大更新,包括新的机器人训练模拟器、Jetson Thor机器人计算机、生成式AI基础模型以及CUDA加速的感知和操作库。

⭐ GR00T将作为机器人的智能之躯,使其能够学习各种技能以解决各种任务。

站长之家(ChinaZ.com)3月19日 消息:NVIDIA在最新的消息中宣布了Project GR00T,这是一项为人形机器人提供通用基础模型的项目。该项目的推出旨在推动机器人和具象化人工智能领域的突破。同时,NVIDIA还宣布对Isaac机器人平台进行了重大更新,包括引入了新的机器人训练模拟器、Jetson Thor机器人计算机、生成式AI基础模型以及CUDA加速的感知和操作库。

image.png

GR00T项目是一项通用的多模态基础模型,旨在为人形机器人提供智能支持,使它们能够学习各种技能以解决各种任务。这意味着人形机器人将能够理解自然语言,并通过观察人类行为来模仿动作,迅速学习协调、灵活性和其他技能,以便在现实世界中进行导航、适应和互动。在Huang先生的GTC主题演讲中,展示了几款由GR00T驱动的机器人完成各种任务的情况。

与此同时,Isaac机器人平台也迎来了重大更新,为开发者提供了新的机器人训练模拟器、Jetson Thor机器人计算机、生成式AI基础模型以及CUDA加速的感知和操作库。Jetson Thor是一款新的计算平台,专为执行复杂任务并与人类和机器自然交互而设计。它具有针对性能、功耗和大小进行优化的模块化架构,包括一款基于NVIDIA Blackwell架构的新一代GPU,具有一个变压器引擎,可提供800万亿次的8位浮点AI性能,用于运行多模态生成式AI模型,如GR00T。

此外,NVIDIA还宣布了Isaac Manipulator和Isaac Perceptor,这是一套机器人预训练模型、库和参考硬件。Isaac Manipulator提供了最先进的灵巧性和模块化人工智能功能,适用于机器人臂,具有一系列强大的基础模型和GPU加速库。它提供了高达80倍的路径规划加速和零射击感知,提高了效率和吞吐量,使开发者能够自动化更多新的机器人任务。

Isaac Perceptor提供了多相机、三维环绕视觉功能,这在制造和物流操作中越来越受欢迎,以提高效率和工人安全性,降低错误率和成本。早期采用者包括ArcBest、BYD和KION Group,他们旨在在材料处理操作中实现新的自主水平。

这些新的Isaac平台功能预计将在下个季度推出。NVIDIA正在为1X Technologies、Agility Robotics、Apptronik、Boston Dynamics等领先的人形机器人公司构建全面的人工智能平台,以支持不断发展的机器人生态系统。

举报

  • 相关推荐
  • 大家在看
  • AI Notebook:构建你的AI驱动的第二大脑。

    AI Notebook是一款AI驱动的笔记应用,旨在通过智能摘要、灵活捕捉以及各种样式来提升用户的生产力和学习效率。它能够无缝地组织文本、图片甚至音频,提供强大的笔记体验。AI Notebook通过AI助手提升生产力和学习,用户可以通过上传音频、文本、照片和YouTube链接来提问或使用AI进行头脑风暴。它还具备高质量的音频录制和实时转录功能,以及AI生成的摘要和模板,以及自动生成的闪卡和测验,帮助用户高效地创建、组织和复习所学内容。

  • AR2R:AI助手,解放人类创造力,提高生产力

    AR2R是一款旨在解放人类从日常琐事中,通过人工智能技术提高生产力和创造力的AI助手。它通过自然语言用户界面、定制训练的AI协调器以及一系列专业AI代理,为用户提供日程管理、决策支持、在线活动组织、任务提醒、详细跟进和流程自动化等功能。由拥有超过50,000名专家信赖的AI平台团队开发,AR2R致力于帮助用户专注于他们热爱的事情,而不是工作。

  • Rupt:防止账户共享,提高用户转化率

    Rupt是一个专注于防止账户共享的服务,它使用先进的AI算法来精确识别共享账户的行为,并将这些共享者转化为付费用户。该服务通过简单的SDK和集成,快速检测账户共享,提供个性化的用户体验,以确保用户在享受服务的同时,不会受到干扰。Rupt还提供了详细的分析和洞察,帮助企业优化产品并增加收入。

  • BypassAI:AI文本人性化工具,转换AI生成文本为人类风格。

    Bypass AI是一个AI到人类文本生成器工具,它创建类似人类的内容,确保看起来像是真人编写的,同时保持高原创性标准。它旨在通过先进的人性化技术避免AI检测并提高可读性。

  • Milvus:开源向量数据库,适用于开发者构建通用AI应用。

    Milvus是一个为开发者设计的开源向量数据库,专门用于大规模高维向量的相似性搜索。它支持pip安装,可以与流行的AI开发工具一起使用,并且能够扩展到数十亿个向量。Milvus以其高效的向量相似性搜索能力,帮助开发者构建强大且可扩展的图像检索系统,无论是管理个人照片库还是开发商业图像搜索应用程序,Milvus都提供了一个强大的基础,帮助开发者发掘图像集合中的潜在价值。

  • InstaDrag:快速高质量的基于拖拽的图像编辑技术

    InstaDrag 是一种快速高质量的基于拖拽的图像编辑技术,利用视频中的信息进行训练,能够在大约 1 秒内实现像素级控制。通过消除梯度导向等耗时操作,提高了编辑速度和准确性。该技术能够广泛应用于图像编辑领域。

  • Scale Leaderboard:AI模型性能评估平台

    Scale Leaderboard是一个专注于AI模型性能评估的平台,提供专家驱动的私有评估数据集,确保评估结果的公正性和无污染。该平台定期更新排行榜,包括新的数据集和模型,营造动态竞争环境。评估由经过严格审查的专家使用特定领域的方法进行,保证评估的高质量和可信度。

  • No-Code Scraper:无需编码即可从任何网站提取数据。

    No-Code Scraper是一个无需编码即可从任何网站提取数据的工具。它利用大型语言模型简化数据提取过程,使每个人都能轻松使用。该平台能够适应任何网站的变化,提供最简单和最快的网络抓取体验。

  • Biofy:一站式社交媒体链接管理平台

    Biofy是一个多功能的社交媒体链接管理平台,它允许用户通过一个链接整合所有社交媒体和在线内容,包括链接到应用商店、YouTube深层链接、URL缩短、QR码生成和分析等。Biofy特别适用于内容创作者、品牌和企业,帮助他们更有效地管理和推广自己的在线存在。

  • AI-Powered Sleep Story Generator:个性化AI助眠故事生成器,助你安然入梦

    AI-Powered Sleep Story Generator是一款创新的AI驱动工具,旨在帮助用户进入深度而宁静的睡眠。用户可以描述自己理想的睡眠场景,AI将利用最新技术制作出舒缓而沉浸式的音频故事,安抚心灵,帮助用户放松进入梦乡。该工具将个性化提升到新水平,根据用户的特定偏好和需求定制每个故事,无论是轻柔的自然声音、舒缓的叙述,还是两者的结合,AI技术都能确保完美适应用户的睡前例程。

  • Tap4 AI:提供免费 AI 工具目录,汇集各类 AI 工具并为用户提供最佳选择。

    Tap4 AI Directory 是一个提供免费 AI 工具目录的工具,旨在收集所有 AI 工具并为用户提供最佳选择。用户可以在 Tap4 AI 目录中找到各类 AI 工具,助力工作效率和创意。

  • Carteisa Sonic:低延迟语音模型,生成逼真语音

    Sonic是由Carteisa团队开发的低延迟语音模型,旨在为各种设备提供逼真的语音生成能力。该模型利用了创新的状态空间模型架构,以实现高分辨率音频和视频的高效、低延迟生成。Sonic模型的延迟仅为135毫秒,是同类模型中最快的。Carteisa团队专注于优化智能的效率,使它更快、更便宜、更易于访问。Sonic模型的发布,标志着实时对话式AI和长期记忆的计算平台的初步进展,预示着未来AI在实时游戏、客户支持等领域的新体验。

  • ViViD:视频虚拟试穿技术

    ViViD是一个利用扩散模型进行视频虚拟试穿的新框架。它通过设计服装编码器提取精细的服装语义特征,并引入轻量级姿态编码器以确保时空一致性,生成逼真的视频试穿效果。ViViD收集了迄今为止规模最大、服装类型最多样化、分辨率最高的视频虚拟试穿数据集。

  • xinsir:深度学习、表示学习、细粒度分类

    xinsir (qi) 是一个关于深度学习、表示学习和细粒度分类的产品。它提供了强大的功能和技术,具有主要优点和背景信息。该产品具有多个模型可供选择。

  • 腾讯元宝:是一个多功能工具,帮助用户轻松工作和享受多彩生活。

    腾讯元宝是一款集成了多种实用工具和服务的生产力工具,旨在提高用户工作效率和生活品质。其背景信息是由腾讯公司推出,定位为全面满足用户工作和生活需求的综合性工具。腾讯元宝提供了丰富的功能和服务,包括日程管理、文件存储、社交聊天、视频会议等,用户可以在一个平台上完成各种任务。

  • GPTResearcher:AI助力的快速洞察和全面研究助手

    GPT Researcher是一个领先的自主研究代理,专为多代理框架设计,提供实时、准确和事实性的结果。它能够简化数据收集,通过一个函数调用提供可信赖、聚合和策划的结果。它支持超过100种不同的大型语言模型(LLMs),并且可以与任何搜索引擎协作,从Google到DuckDuckGo。用户可以轻松搜索本地文档和文件,并生成超过2000字的长篇报告,支持多种格式的导出,如PDF、Word、Markdown、JSON和CSV。

  • DenserRetriever:先进的AI检索器,用于RAG。

    DenserRetriever是一个开源的AI检索模型,专为RAG(Retrieval-Augmented Generation)设计,利用社区协作的力量,采用XGBoost机器学习技术有效结合异构检索器,旨在满足大型企业的需求,并且易于部署,支持docker快速启动。它在MTEB检索基准测试中达到了最先进的准确性,并且Hugging Face排行榜上也有其身影。

  • Groqbook:使用Groq和Llama3快速生成整本书

    Groqbook是一个基于Streamlit的应用程序,它利用Llama3在Groq上从一行提示快速构建书籍。它适用于非小说类书籍的创作,并能在几秒钟内生成每一章节。该应用程序混合使用Llama3-8b和Llama3-70b模型,利用较大的模型生成结构,较小的模型创造内容。目前,模型仅使用章节标题的上下文来生成章节内容。未来,这将扩展到书籍的完整上下文,以允许Groqbook生成高质量的小说书籍。

  • MusePose:虚拟人物生成的图像到视频框架

    MusePose是由腾讯音乐娱乐的Lyra Lab开发的一款图像到视频的生成框架,旨在通过姿势控制信号生成虚拟人物的视频。它是Muse开源系列的最后一个构建块,与MuseV和MuseTalk一起,旨在推动社区向生成具有全身运动和交互能力的虚拟人物的愿景迈进。MusePose基于扩散模型和姿势引导,能够生成参考图像中人物的舞蹈视频,并且结果质量超越了当前几乎所有同一主题的开源模型。

  • Codestral-22B-v0.1:一款支持80+编程语言的AI代码生成模型

    Codestral-22B-v0.1是由Mistral AI Team开发的大型语言模型,它经过了80多种编程语言的训练,包括Python、Java、C、C++、JavaScript和Bash等。该模型能够根据指令生成代码,或对代码片段进行解释、重构等。它还支持Fill in the Middle (FIM)功能,用于预测代码中的中间部分,特别适合软件开发工具的插件使用,如VS Code。该模型目前没有内容审查机制,但开发团队正在寻求社区合作,以实现在需要内容审查的环境中部署。

今日大家都在搜的词: