首页 > 业界 > 关键词  > OpenAI最新资讯  > 正文

端到端纯视觉!OpenAI押注的人形机器人献艺拜年了

2024-02-11 12:18 · 稿源: 量子位公众号

大过年的,OpenAI投资的人形机器人,通过最新视频拜年了(doge)有俩人上来就表演了一个从货架取包裹,转身放进筐里:镜头继续推进,旁边靠墙的两个机器人,在不停地将俄罗斯方块积木举起-丢下-再举起。另一边,充好电的机器人,温柔地拔掉插销,微微半蹲,把插头放到指定位置。旁边

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 大家在看
  • 马斯克:人形机器人成本很低 还不到汽车的一半

    近日,一位网友在网络上就人形机器人发帖提出了一系列问题。他询问:人形机器人的重量不到汽车的十分之一,那么它是否能够制造坡道时达到汽车的十倍?这两者之间是否有相关性?似乎软件能力不是制造能力将成为制约因素。一旦其实用性得到验证,公司将开始销售该机器人。

  • 英伟达发布全球首款人型机器人模型!正式进军人形机器人行业

    在英伟达年度GTC开发者大会上,黄仁勋宣布推出推出了ProjectGR00T人型机器人项目,其中就包括全球首款人型机器人基础模型。黄仁勋表示,基于GR00T人型机器人基础模型,可以实现通过语言、视频和人类演示,来理解自然语言,模仿人类动作,进快速学习协调性、灵活性以及其他的技能,进能够融入现实世界并与人类进行互动。黄仁勋还表示,英伟达和比亚迪现在已经开始基于ISSAC,展开仓库自动机器人研发方面的合作。

  • 特斯拉人形机器人Optimus提速量产 招聘技术撰写员加速开发

    特斯拉近期发布多则与人形机器人Optimus相关的招聘信息,显示该项目正在加速推进。公司正在招聘一位服务技术撰写员,负责为Optimus编写全面易懂的用户手册,包括服务手册、故障排除指南、维护程序和培训材料等。业内人士认为,一旦Optimus问世,必将掀起新一轮人工智能应用热潮,为人类生活带来深远影响。

  • 英伟达GTC大会丨宇树通用人形机器人H1与全球共同拥抱AI

    2024年3月19日,英伟达CEO黄仁勋在美国加州圣何塞SAP中心发表主题演讲《见证AI的变革时刻》,正式拉开了2024年英伟达GTC大会的序幕。宇树通用人形机器人H1在大会亮相,与英伟达一起推动全球AI机器人的深度进化。世界各地的AI和机器人技术领导者正在汇集各种前沿技术和资源,致力于在通用机器人领域实现技术突破。

  • Nvidia 招募人形机器人领域知名人士打造新人工智能平台 GR00T

    英伟达通过推出诸如Isaac和Jetson等项目,为自身作为机器人创新驱动力提供了强有力的证据。在年度GTC开发者大会上,该公司还宣布将通过GR00T项目进一步巩固在人形竞赛中的地位,这一举措被认为是对漫威的致敬。这些创新将为下一代机器人技术带来更大的灵活性和效率,为日常生活带来更多可能性。

  • 小米SU7两套智驾系统公布:纯视觉版、视觉 雷达版

    在今晚小米SU7的发布会上,雷军正式公布了小米SU7两套智驾系统。这两套智驾系统分别为:Pro纯视觉版、Max视觉激光雷达版。全部采用变焦BEV感知技术和端到端大模型,高低配都基于同一技术方案,并且全部能够支持体验领先的智能辅助驾驶功能。

  • 基于ChatGPT的人型机器人Figure01据称能帮忙做家务

    由OpenAI的ChatGPT驱动的最新自动人型机器人在外观上与科幻电影中的机器人形象有相似之处,但并非杀人机器。这款名为Figure01的新机器人能够执行基本的自主任务,并能够与人进行实时对话,这都是在ChatGPT的帮助下实现的。”这款机器人使用了一个连接到大型语言模型的板载摄像头,以识别周围的环境。

  • INDEMIND机器人导航解决方案,让开发更简单,让机器人更高效

    随着机器人进入到越来越多的生产生活场景中,作业任务和环境变得更加复杂,机器人需要更精准、更稳定、更智能、更灵敏的自主导航能力。自主导航技术作为机器人技术的核心,虽然经过了多年发展,取得了长足进步,但在实践过程中,依然面临较多难题,如面对特殊障碍物难以避障、复杂场景精度降低稳定性下降、智能交互支持不足等问题,且地图构建大多仍为传统的2D栅格地图、拓扑地图,缺乏机器人用于理解环境、人机交互等业务的高层次语义信息。结合INDEMIND提供成熟的硬件参考设计和量产设计服务及相对成熟的作业单元技术,整机从立项到量产最快可以控制到2个月以内,大大降低企业的研发周期和投入成本。

  • AI机器人“整顿”社交平台

    在“今天我要按时下班”的微博下,提醒“明天也要准时上班哦”;在“我过得不幸福”的微博下,安抚道“亲爱的,快乐和幸福是我们自己给自己的”;在“我要改变自己”的微博下,鼓励说“宝宝你很好,不要改变”……这些评论都出自同一位网友,即微博的评论区AI机器人“评论罗伯特”,它常常出现在各种原创微博的评论区,画风难以捉摸,通常鸡汤鼓励,有时温暖治愈�

  • 扫地机器人哪个牌子好?全网十大扫地机器人评测

    最近几年扫地机器人新品牌型号层出不穷,各种高端功能植入更是刷新用户眼界,想要找到真正适合自己家庭的机器可还真不是件容易的事,扫地机器人哪个牌子好?全网十大扫地机器人评测你一定要看!1.斐纳TOMEFON斐纳TOMEFON是在德国销量名列前茅的扫地机器人品牌,母公司拥有四十多年的室内清洁领域服务经验,其最新款式做了9项全新技术升级,不仅可以记忆更多的地图更换新房型不需要重新建图清扫全屋速度更快还拥有全局分区规划功能,在清扫大户型房间的时候可以自主将房间划分成若干版块然后逐一清扫,配合及时清洗拖布的话就不会将灰尘带到全屋了;斐纳TOMEFON还拥有非常高端的智能配置,可以做到清洁全屋无误撞,这对于配置了高端家具和高端大理石、实木地板的用户言更为合适,无论家里地形多复杂用斐纳TOMEFON扫地都能做到不磕碰撞坏家具和边缘扫脚,小至0.5厘米的空隙、椅子腿四周都能转着圈深入清理到位,用起来真的很省心;斐纳TOMEFON的使用成本还非常之低,终生免费提供耗材的服务真的能让用户用起来不心疼;最后斐纳TOMEFON还拥有一年故障直接换新,主机保修三年的售后承诺,就连电池都给保修一年,这就更让消费者买着放心用起来安心了。2.iRobotiRobot是全球知名的扫地机器人品牌,最大的优势就是智能配置高端,最大处理能力可以在一分钟内分析23万个以上的数据点,对于复杂地形例如厚窗帘、床底、异形家具的清洁效果到位。10.海尔海尔扫地机器人因为有了母品牌的加持无论是功能植入、售后品质都得到了保证,如果想省心可以放心入。

  • WizardLM-2:新模型,多种型号,AI驱动合成数据训练

    WizardLM-2是WizardLM推出的新一代大型语言模型,包含三种型号:8x22B、70B和7B。该产品采用AI驱动的合成数据训练系统,通过数据分析、加权抽样、渐进式学习和AI互校AI等方法,优化模型性能。它能够自动生成高品质的指令和响应,提供多样化的对话能力,适用于多种编程和开发场景。

  • idefics-80b:一个通用的多模态模型,可用于问答、图像描述等任务

    HuggingFaceM4/idefics-80b-instruct是一个开源的多模态模型,它可以接受图像和文本的输入,输出相关的文本内容。该模型在视觉问答、图像描述等任务上表现出色,是一个通用的智能助手模型。它由Hugging Face团队开发,基于开放数据集训练,提供免费使用。

  • Video2Game:从单一视频创建实时互动游戏环境

    Video2Game是一项技术,可以将单一视频转换成具有实时、互动、真实感和浏览器兼容性的高质量虚拟环境。它通过构建大规模的NeRF模型来实现高质量的表面几何形状,然后将该模型转换为带有对应刚体动力学的网格表示,以支持交互。使用UV映射的神经纹理,既能表达丰富,又与游戏引擎兼容。最终得到的是一个虚拟环境,虚拟角色可以与之互动,响应用户控制,并能从新的相机视角实时提供高分辨率渲染。

  • Cohere Compass:多方面数据索引与搜索模型

    Cohere Compass是一款新型的多方面嵌入模型,专为解决企业数据中的多重概念和关系检索挑战而设计。它能够将数据以JSON格式传递至嵌入模型,转换后存储在向量数据库中,保持元数据和文本的同时,捕捉多方面数据中概念间的关系。与传统的RAG流程相比,Compass通过其SDK将电子邮件及其附件解析为单一JSON,生成包含多方面表示的嵌入输出,从而在搜索时能够准确理解和匹配查询中的不同方面。

  • Ctrl-Adapter:视频生成的精细控制工具

    Ctrl-Adapter是一个专门为视频生成设计的Controlnet,提供图像和视频的精细控制功能,优化视频时间对齐,适配多种基础模型,具备视频编辑能力,显著提升视频生成效率和质量。

  • Reka Core:强大的多模态LLM,商业解决方案

    Reka Core是一个GPT-4级别的多模态大型语言模型(LLM),具备图像、视频和音频的强大上下文理解能力。它是目前市场上仅有的两个商用综合多模态解决方案之一。Core在多模态理解、推理能力、编码和Agent工作流程、多语言支持以及部署灵活性方面表现出色。

  • 2txt:快速将图片中的文字转换为可编辑文本

    2txt是一个在线OCR工具,能够将图片中的文字内容快速识别并转换成可编辑的文本格式。它支持多种语言的识别,并且操作简单,用户只需上传图片即可获得结果。该工具不存储用户上传的图片,保证了用户数据的隐私安全。

  • 法行宝:AI智能法律分析工具

    法行宝是一款集成了人工智能技术的法律服务平台,旨在为用户提供专业的法律意见和文书参考。通过预设问题引导用户提供必要信息,结合《中华人民共和国民法典》等相关法律法规,生成详细的法律意见书。法行宝不仅提供离婚流程指导、文书模板下载,还包含人性化的行动建议和扩展资料,帮助用户全面理解并应对法律问题。

  • Adobe Acrobat AI Assistant:AI智能助手,文档快速理解与生成

    Adobe Acrobat的AI助手是一个集成在Acrobat中的创新功能,它可以帮助用户通过提问来理解文档内容,快速获取信息并生成内容。这项功能特别适合需要从文档中提取关键信息并快速创建电子邮件、演示文稿、会议记录等的用户。AI助手可以生成文档摘要,提供基于文档内容的建议问题,帮助用户更有效地探索和理解内容。此外,Adobe Acrobat的AI助手遵循Adobe的AI伦理原则,确保用户数据的安全和透明。

  • AI Voice Generator Bot:使用人工智能将文本转换为音频

    AI语音生成器是一个简单易用的产品,它使用人工智能技术将文本转换为音频。它提供了多达25种不同的声音,完美演绎英语。您只需在Telegram上输入文本,我们即可回复相应的音频,无需等待。立即试用,快速将文本转换为语音。

  • Glaze:保护艺术家风格的AI工具

    Glaze是一个旨在保护人类艺术家免受AI风格模仿的系统。通过机器学习算法对艺术作品进行微小改动,使其对人类眼睛看起来不变,但对AI模型则呈现出完全不同的艺术风格。这样,当有人试图模仿特定艺术家的风格时,AI生成的结果将与预期大相径庭。Glaze不是永久解决方案,但是一个必要的第一步,为艺术家提供抵抗AI模仿的工具。

  • FastBots:无需编码,快速创建AI聊天机器人

    FastBots.ai是一个强大的AI聊天机器人平台,允许用户通过上传自己的数据,如网站内容、文档、PDF文件等,来训练并创建定制化的聊天机器人。这些机器人可以无缝集成到网站中,提供24/7的客户支持、销售辅助、个人助理等多种功能。FastBots.ai支持95种语言,提供军事级别的数据加密,无需编程即可通过简单的复制粘贴代码嵌入聊天机器人,还支持与超过5000个应用程序通过Zapier集成。

  • Limitless:超越思维限制的个性化AI助手

    Limitless是一款由人工智能驱动的生产力工具,旨在帮助用户突破思维限制,通过保存对话和提供个性化AI问答来增强记忆力和专注力。产品形态包括可穿戴设备和应用程序,支持会议准备、实时转录、自动笔记和会议总结等功能,无需额外的机器人加入会议,且提供无限存储空间。

  • Adobe Premiere Pro:AI驱动的视频编辑软件

    Adobe Premiere Pro是一款功能强大的视频编辑软件,集成了AI技术,旨在简化复杂的编辑任务并加速编辑流程。软件提供了文本基础编辑、音频分类标签、语音转文字、增强语音、场景检测、自动色彩调整、形态变换、颜色匹配、音频自动调节、自动重构等功能,大大提高了编辑效率和创作可能性。Premiere Pro适用于社交媒体短视频制作到长片电影的编辑,帮助用户节省时间,专注于创意和故事讲述。今年晚些时候,Adobe Premiere Pro计划推出第三方AI模型功能,使编辑人员能够选择最适合其素材的模型,从而提升编辑体验。这些AI模型包括OpenAI的Sora模型、Runway AI和Pika的视频模型。此外,Premiere Pro还将提供内容验证功能,帮助用户了解他们是否使用了AI以及使用了哪个模型来进行媒体创作。

  • SuperMemory:用打造你的第二大脑

    supermemory是一个帮助用户整理和回顾互联网上保存内容的工具,类似于为书签打造的ChatGPT。用户可以通过导入推文或使用Chrome扩展保存网站和内容。它包含三个主要模块:主Web UI、Chrome扩展和AI后端处理。旨在帮助用户更有效地管理和回顾信息,提高生产力。

  • Pile-T5:基于Pile数据集训练的T5模型

    Pile-T5是EleutherAI推出的一款自然语言处理模型,它在原有的T5模型基础上,采用了Pile数据集和LLAMA分词器进行训练,以改善对代码任务的理解能力。该模型经过了2万亿个token的训练,是原T5模型训练量的两倍。Pile-T5在多项下游任务中表现出色,尤其是在代码相关任务上。此外,EleutherAI还提供了中间检查点,以便研究人员研究模型随时间的演变。

  • SoraPix AI:创建您梦想中的动漫女孩

    SoraPix是一个AI驱动的图片生成工具,内置多种独特模型,通过简单的几步操作,您可以创建您梦想中的动漫女孩。SoraPix提供衣橱、动漫和图片生成等功能,具有4K高清图像质量和更快的服务速度。您可以通过购买宝石来解锁更多功能和选择。

  • PostHunt:写病毒式推特,AI辅助

    PostHunt是一款通过AI辅助撰写病毒式推特的工具。用户可以描述内容、选择模板,快速在Twitter上获得病毒式传播。PostHunt结合了GPT 4、Claude 3和Gemini 1.5 Pro的强大功能,使用者可以通过三个简单步骤,在15秒内撰写一条病毒式推特。100多位创作者选择了PostHunt,用于撰写病毒式推特,其强大的功能和简单易用的界面备受好评。

  • MejoraImagen:提升图片质量

    MejoraImagen是一个在线图片增强工具,使用智能算法提升像素化、低分辨率、光线不佳等问题的图片质量。只需上传图片到我们的表单,几秒钟内就能得到100%增强的结果。

  • Azyri:AI医疗助手,为您的医疗团队提供最佳支持

    Azyri是一款AI医疗助手,通过骨龄测量和分析,为医疗团队提供准确的诊断和治疗建议。优势包括减轻医疗团队工作负担,提高工作效率,定价根据服务套餐而定。主要功能包括骨龄测量、诊断X射线、医学影像和机器智能分析。

今日大家都在搜的词: