首页 > 业界 > 关键词  > 特斯拉最新资讯  > 正文

特斯拉人形机器人能做瑜伽 马斯克称“进步”

2023-09-26 09:31 · 稿源:站长之家用户

特斯拉Optimus,特斯拉的人形机器人,在最新的视频中展示了惊人的进步,该视频由官方特斯拉Optimus账号发布。视频显示,特斯拉机器人现在运行在与特斯拉汽车相同的端到端神经网络上,该网络可以处理视频输入并生成控制输出。

机器人老师AI教师

图源备注:图片由AI生成,图片授权服务商Midjourney

视频从特斯拉机器人也就是Optimus机器人执行自校准程序开始,这对于适应新环境是必不可少的。然后视频展示了特斯拉机器人如何利用其视觉和关节位置传感器准确地定位其在空间中的肢体位置,而不依赖于任何外部反馈。这使得特斯拉机器人能够与物体进行交互,并以精确和灵巧的方式执行任务。

视频最后呼吁更多的工程师加入特斯拉Optimus团队,因为该项目仍在开发中,需要更多的人才。关于特斯拉机器人何时能够投入生产或商业使用,目前没有任何信息,但视频暗示它正在取得快速的进步,并使用与特斯拉汽车相同的软件。

特斯拉和SpaceX的首席执行官埃隆·马斯克在X上对这篇文章做出了回应,只用了一个词,“进步”。

另一家正在研究人形机器人的公司是Apptronik,总部位于德克萨斯州。Apptronik最近推出了其第一款商用人形机器人,该机器人旨在通过执行人类不想做的重复性任务来协助工业劳动力。该机器人也既经济又友好,使其能够在一些最艰苦的环境中与人类友好地共事。Apptronik的机器人可能是特斯拉Optimus的潜在竞争对手,后者仍在开发中。

举报

  • 相关推荐
  • 大家在看
  • 特斯拉人形机器人再进化!靠视觉分类物品、还能做瑜伽

    在刚刚过去的周末,特斯拉Optimus官方账号上传了一段新视频,展示了旗下人形机器人最新技能。可以看到它不仅能够依靠视觉就能给物品分类能单腿站立做出瑜伽动作,可以说进步明显,马斯克在评论区也直接表示Progress”。”可以看到视频中机器人完成了按照颜色为物体分类的任务能将被故意移开的积木重新定位并放回原处,甚至可以在摆放的过程中纠偏”,这些说明它能够适应变化的环境并随时做出调整非单纯按照设定程序执行。

  • 仅靠视觉自主分类物体、能做瑜伽特斯拉人形机器人再进化

    沉寂了几个月的特斯拉人形机器人擎天柱终于有了新的动态。记得上一次看到它还是在特斯拉股东大会上,当时Optimus展示了自由行走、灵活抓取放下物体等技能。下一次它将如何进化,我们拭目以待。

  • 特斯拉发布人形机器人最新进展:可自主分类物体并完成瑜伽动作

    特斯拉发布了其首款人形机器人“擎天柱”的最新进展。在最近一次更新中,该公司指出,该机器人现在能够自主分类物体,并完成瑜伽动作。这些姿势与任何实际工作负载无关,但展示了该机器人如何控制其身体并保持其稳定性。

  • 伟景智能:人形机器人赛道中的“领跑者“

    人形机器人,大众对他的理解,往往还存在于科幻影片中,无论是《变形金刚》、《终结者》、《机械战警》等汇聚各种材料、各种类型的人形机器人火爆激战场面的电影是《人工智能》、《真实世界》、《铁甲钢拳》等将人形机器人赋予人类情感的影片,人形机器人都是科幻电影的主角,代表着未来各项尖端科技汇聚的最高成果。人形机器人被国际上视作衡量国家科技创新能力、高端制造业水平和产业竞争力的重要标志之一,被誉为“机器人皇冠上的明珠”。伟景智能将紧紧抓住这个跨时代的历史机遇,沉下心来认真打磨技术与产品,为梦想、为世界带来更多的关于人形机器人赛道的“iPhone时刻”!

  • 不为赚钱 只为打击机器人马斯克考虑向所有推特用户收费

    快科技9月19日消息,在一场直播活动中,原推特(X)平台老板马斯克被问及如何防止机器人大军”在X平台上放大仇恨言论,他表示,这是一个超级棘手的问题,为此,该平台将要求用户每月支付少量费用。马斯克表示,目前,X平台提供免费和付费两种层级的服务,在这样的系统下,机器人的运营成本很低,仅为一分钱的一小部分”,如果让某人支付几美元使用该服务,会使�

  • 马斯克将向所有推特用户收费 用以打击机器人账户

    周一当地时间,特斯拉CEO、社交平台X(原推特)的拥有者埃隆马斯克透露了可能向X的所有用户征收订阅费的想法。他认为,社交平台X(原推特)应该每月向用户收取一定的费用,以打击该平台上的机器人和垃圾邮件。目前还不确定这一言论是真心话还是随口说说。 马斯克表示,现在,X平台提供免费和付费两种级别的服务,在这样的系统下,机器人的运行成本很低,“只有一

  • 还得是马斯克特斯拉怒砸7675万打造“赛博食堂”

    特斯拉向有关部门申请了一个许可,将要为德克萨斯州的超级工厂打造一个前所未有的超大食堂。从得克萨斯州许可和监管部门的一份表格显示,该食堂很有可能是受到了Cyberturck的影响,将在现有食堂的基础上进行翻新与改造。特斯拉还暂未公布这所赛博食堂”的具体信息,不过,根据赛博食堂”这一名字来看,全新打造的食堂一定会与众不同。

  • 特斯拉Model 3/Y美国继续降价 马斯克:让更多人买得起电动车

    据特斯拉美国官网显示,该公司在美国继续降低部分车辆价格:将Model3汽车在美国的价格从40240美元降至38990美元,将ModelY长续航版SUV在美国的价格从50490美元降至48490美元。即便经过此次降价,中国国产版的Model3仍是全球最便宜的版本。高盛认为特斯拉汽车未来将进一步降价,高盛分析师MarkDelaney认为,特斯拉可能会在未来进一步降低价格,通过走量盈利”路线,获得更高的销量。

  • 马斯克会玩!特斯拉发布赛博啤酒套装:1095元 宣称贵族啤酒花

    特斯拉除了卖车开了一家杂货铺”,推出各种五花八门的周边产品。特斯拉在美国市场推出CyberBeerCyberStein限量套装,售价150美元,套装包含两瓶特斯拉赛博啤酒和两个酒杯。回顾特斯拉推出的周边产品,说特斯拉是周边大户一点不为过,不仅售卖特斯拉相关的帽子、保温杯、雨伞等推出了特斯拉钥匙带、特斯拉品鉴酒杯、CyberTruck哨子、特斯拉空玻璃酒瓶,甚至是以Cybertruck为灵感的猫窝,售价89元。

  • 报道机器人开始取代人类保安,应对劳动力短缺挑战

    面对劳动力短缺,安保公司正在积极探索使用机器人来替代人类保安,以应对高换岗率等问题。安保行业正在寻求利用机器人来解决其一直以来的高换岗率问题。消费者担心自动化会使餐饮体验更加不人性化担心可能导致人工失业、准确性下降以及隐私和安全问题。

  • AI-Faceless-Video-Generator:利用AI生成视频脚本、语音和会说话的头像

    AI-Faceless-Video-Generator是一个利用人工智能技术,根据话题生成视频脚本、语音和会说话头像的项目。它结合了sadtalker进行面部动画,gTTS生成AI语音和OpenAI语言模型生成脚本,提供了一个端到端的解决方案,用于生成个性化视频。该项目的主要优点包括脚本生成、AI语音生成、面部动画创建以及易于使用的界面。

  • FLUX.1-dev-LoRA-Dark-Fantasy:生成幻想生物和角色的AI模型

    FLUX.1-dev-LoRA-Dark-Fantasy是由Shakker AI的GUIZANG(歸藏)训练的LoRA模型,专注于生成幻想生物和角色。该模型受到Klee、Odilon Redon、Eyvind Earle等艺术家的影响,能够生成具有电影质感、复杂光影效果和精细细节的图像。模型遵循flux-1-dev-non-commercial-license,适用于非商业用途。

  • 通义万相AI视频生成:利用AI技术,将文字和图像转化为创意视频。

    通义万相AI创意作画是一款利用人工智能技术,将用户的文字描述或图像转化为视频内容的产品。它通过先进的AI算法,能够理解用户的创意意图,自动生成具有艺术感的视频。该产品不仅能够提升内容创作的效率,还能激发用户的创造力,适用于广告、教育、娱乐等多个领域。

  • Windows Agent Arena:用于测试和开发AI代理的可扩展开源框架

    Windows Agent Arena (WAA) 是一个专注于Windows操作系统的可扩展、开源框架,用于测试和开发能够使用语言模型在PC上进行推理、规划和行动的AI代理。它通过模拟真实的Windows环境,允许代理自由操作,并使用与人类用户相同的应用程序、工具和网络浏览器来解决任务。WAA通过Azure实现可扩展性和并行化,能够在短短20分钟内完成完整的基准测试评估。

  • VELS by Kaiden AI:AI驱动的模拟训练,提升沟通技能。

    VELS by Kaiden AI是一个基于人工智能的模拟训练平台,提供定制化、反馈丰富的模拟场景,帮助用户准备各种交流互动。该平台通过创建逼真的训练场景和AI虚拟对话伙伴,模拟真实世界的交流环境,让用户在安全的环境中练习和提高沟通技能。VELS通过实时反馈和性能分析,为用户提供个性化的训练体验,帮助他们在各种行业和角色中提升表现。

  • Selfplanr:规划你的高中四年,迈向梦想大学。

    Selfplanr是一个为高中生设计的在线规划工具,旨在帮助学生规划他们的高中生涯,以实现进入理想大学的目标。通过个性化的目标设定、动态的四年规划、每周任务安排、与导师和同伴的协作规划以及动态进度跟踪,Selfplanr帮助学生构建全面而独特的简历,发现学术之外的无数机会,如实习、奖学金、研究和志愿活动。

  • GoMaxAI:一站式AI服务,提供多样化智能解决方案。

    GoMaxAI是一个集成了多种AI功能的平台,旨在为用户提供包括3D视频创建、智能问答、AI绘画、文档分析和思维导图等多种智能服务。它通过先进的AI技术,帮助用户在影视制作、设计、艺术创作、信息处理等领域提高效率和创造力。

  • XVERSE-MoE-A36B:多语言大型语言模型,支持多领域文本生成。

    XVERSE-MoE-A36B是由深圳元象科技自主研发的多语言大型语言模型,采用混合专家模型(MoE)架构,具有2554亿的总参数规模和360亿的激活参数量。该模型支持包括中、英、俄、西等40多种语言,特别在中英双语上表现优异。模型使用8K长度的训练样本,并通过精细化的数据采样比例和动态数据切换策略,保证了模型的高质量和多样性。此外,模型还针对MoE架构进行了定制优化,提升了计算效率和整体吞吐量。

  • Peter Cat:智能答疑机器人解决方案,助力GitHub社区维护者和开发者

    Peter Cat 是一个专为社区维护者和开发者打造的智能答疑机器人解决方案。它通过对话式答疑 Agent,配置系统、自托管部署方案和便捷的一体化应用SDK,让用户能够一键创建智能答疑机器人,并快速集成到各类官网或项目中,为社区提供更高效的技术支持生态。

  • Covers:将您的音乐作品转换为全新风格。

    Covers 是 Suno 推出的一款音乐创作工具,它允许用户将任何声音,从简单语音备忘录到完整制作的音乐,转换成全新风格的音乐作品,同时保留原始的旋律。这一功能特别适合想要尝试不同音乐风格或为纯音乐添加歌词的音乐创作者。Covers 目前处于早期访问测试阶段,向所有 Pro 和 Premier 订阅者提供,用户可以免费试用200次,之后每次生成新 Cover 将消耗10个积分。

  • AgentRE:基于代理的框架,用于在复杂信息环境中进行关系抽取。

    AgentRE是一个基于代理的框架,专门设计用于在复杂信息环境中进行关系抽取。它通过模拟智能代理的行为,能够高效地处理和分析大规模数据集,从而识别和提取实体之间的关系。该技术在自然语言处理和信息检索领域具有重要意义,尤其是在需要处理大量非结构化数据的场景中。AgentRE的主要优点包括其高度的可扩展性、灵活性以及对复杂数据结构的处理能力。该框架是开源的,允许研究人员和开发者自由使用和修改,以适应不同的应用需求。

  • GoMaxAI Pro版 (ChatGPT-Midjourney):个人、团队、企业私有化AIGC应用平台

    GoMaxAI Pro版是一个基于Node.js、Vue3、uniapp开发的AIGC平台,提供ChatGPT、Midjourney绘画、Suno音乐、Pika/Runway/Sora视频服务。它支持私有化部署,适用于个人、团队和企业,强调用户体验和资源集成,具备权限管理和安全审计功能。

  • PresentationGen:利用大语言模型生成PPT文件的SpringBoot Web应用

    PresentationGen是一个基于SpringBoot框架开发的Web应用程序,它通过集成大语言模型(LLM)来自动化生成PPT文件。该技术通过预处理大量单页模板,并在用户使用时根据需求实时组合,实现快速生成PPTX文件。它支持文本替换,使得生成的演示文稿更加个性化和专业。该产品主要面向需要快速制作演示文稿的用户,如商务人士、教育工作者和设计师,帮助他们节省时间并提高工作效率。

  • FLUX.1-dev-Controlnet-Inpainting-Alpha:AI图像修复模型,用于填补图像中的缺失部分。

    FLUX.1-dev-Controlnet-Inpainting-Alpha是由AlimamaCreative Team发布的AI图像修复模型,专门用于修复和填补图像中的缺失或损坏部分。该模型在768x768分辨率下表现最佳,能够实现高质量的图像修复。作为alpha版本,它展示了在图像修复领域的先进技术,并且随着进一步的训练和优化,预计将提供更加卓越的性能。

  • FLUX-Controlnet-Inpainting:基于FLUX.1-dev模型的图像修复工具

    FLUX-Controlnet-Inpainting 是由阿里妈妈创意团队发布的基于FLUX.1-dev模型的图像修复工具。该工具利用深度学习技术对图像进行修复,填补缺失部分,适用于图像编辑和增强。它在768x768分辨率下表现最佳,能够提供高质量的图像修复效果。目前该工具处于alpha测试阶段,未来将推出更新版本。

  • GOT-OCR2.0:通过统一的端到端模型实现OCR-2.0

    GOT-OCR2.0是一个开源的OCR模型,旨在通过一个统一的端到端模型推动光学字符识别技术向OCR-2.0迈进。该模型支持多种OCR任务,包括但不限于普通文本识别、格式化文本识别、细粒度OCR、多裁剪OCR和多页OCR。它基于最新的深度学习技术,能够处理复杂的文本识别场景,并且具有较高的准确率和效率。

  • GameGen-O:生成开放世界视频游戏的扩散变换模型

    GameGen-O 是首个为生成开放世界视频游戏而定制的扩散变换模型。该模型通过模拟游戏引擎的多种特性,如创新角色、动态环境、复杂动作和多样化事件,实现了高质量、开放领域的生成。此外,它还提供了交互式可控性,允许游戏玩法模拟。GameGen-O 的开发涉及从零开始的全面数据收集和处理工作,包括构建首个开放世界视频游戏数据集(OGameData),通过专有的数据管道进行高效的排序、评分、过滤和解耦标题。这个强大且广泛的 OGameData 构成了模型训练过程的基础。

  • UPDF:新一代AI智能PDF编辑器

    UPDF是一款集成了AI技术的PDF编辑器,提供包括PDF编辑、注释、格式转换、OCR识别、压缩、页面管理、表单与签名、发票助手、文档安全、批量处理等多功能于一体的PDF解决方案。它支持跨平台使用,包括Windows、Mac、iOS和Android设备,并且拥有云服务功能,实现多设备云同步。UPDF的界面本地化为11种不同的语言,提供24/7客户服务,确保用户能够高效、便捷地处理PDF文件。

  • Skywork-Reward-Llama-3.1-8B:先进的奖励模型,用于文本分类和偏好判断

    Skywork-Reward-Llama-3.1-8B是一个基于Meta-Llama-3.1-8B-Instruct架构的先进奖励模型,使用Skywork Reward Data Collection进行训练,该数据集包含80K高质量的偏好对。模型在处理复杂场景中的偏好,包括具有挑战性的偏好对方面表现出色,覆盖数学、编程和安全性等多个领域。截至2024年9月,该模型在RewardBench排行榜上位列第三。

  • Skywork-Reward-Gemma-2-27B:基于Gemma-2-27B架构的先进奖励模型

    Skywork-Reward-Gemma-2-27B是一个基于Gemma-2-27B架构的先进奖励模型,专为处理复杂场景中的偏好而设计。该模型使用了80K高质量的偏好对数据进行训练,这些数据来源包括数学、编程和安全等多个领域。Skywork-Reward-Gemma-2-27B在2024年9月的RewardBench排行榜上位居第一,展示了其在偏好处理方面的强大能力。

今日大家都在搜的词:

热文

  • 3 天
  • 7天