首页 > 原创 > 关键词  > Meta公司最新资讯  > 正文

Meta推出新一代智能触觉系统机械手 可实现多模态环境感知

2024-11-01 09:30 · 稿源:站长之家

Meta公司日前宣布与传感器制造商GelSight及韩国机器人企业Wonik Robotics达成战略合作,共同推进新一代触觉传感技术的商业化进程。

这套面向科研领域的创新设备将为科学家提供更精确的物理世界观测与模拟能力。其中,GelSight将推出名为Digit360的新型触觉传感器。该设备配备专业光学系统,能够全方位捕捉指尖表面的形变状况,并通过约18个传感单元实时监测环境变化。

QQ20241101-093233.png

图片来源:Meta

据技术团队介绍,Digit360采用专门研发的光学系统,具备宽视野触觉感知能力。该系统能同时识别物体表面的机械、几何和化学特性,可检测振动、温度变化,甚至气味信息,实现多维度的环境感知。

该设备计划于明年正式发布,目前已开放研究人员提前申请使用权。

QQ20241101-093241.png

图片来源:Meta

在机器人领域,Wonik将推出新一代Allegro Hand机械手,整合Digit360触觉传感技术。这款机械手配备专用控制板,可将触觉数据实时传输至主机系统进行处理,预计同样于明年面市。

这次跨界合作标志着触觉传感技术在科研领域的重要突破,有望为相关领域研究带来新的发展机遇。

举报

  • 相关推荐
  • 首个可保留情感的音频LLM!Meta重磅开源7B-Spirit LM,一网打尽「音频+文本」多模态任务

    【新智元导读】Meta最近开源了一个7B尺寸的SpiritLM的多模态语言模型,能够理解和生成语音及文本,可以非常自然地在两种模式间转换,不仅能处理基本的语音转文本和文本转语音任务能捕捉和再现语音中的情感和风格。在纯文本大模型取得进展的同时,其他模态数据,如语音与文本结合的语言模型也成为了一个热门的研究领域,但现有的模型要么在仅包含语音的数据上进行训练,要么是关注特定任务,如文本转语音、自动语音识别或翻译,在其他模态数据和任务上的泛化能力十分有限。研究人员还直接评估了模型对输入提示的处理能力,结果发现,无论是哪种提示,模型都能得到很高的评分,表明还有很大的空间来进一步提高模型在保持情感表达方面的能力,也意味着,智能体在理解和生成情感丰富的内容方面还有很大的潜力可以挖掘。

  • 不做Sora背后:百度的多模态路线是什么?

    当ChatGPT掀起国内“百模大战”,百度率先交卷文心一言。Sora再掀视频生成风潮,却传出李彦宏内部讲话“Sora无论多么火,百度都不去做”。大量的行业应用所产生的数据,又能为AGI的发展提供丰富的养分,形成良性循环,推动数据飞轮的高速运转,从加快我们迈向AGI的步伐。

  • 摸着Meta过河,百度再战AI眼镜

    因为缺少真正的出圈产品,导致外界对百度仍持有固有印象,认为其在AI硬件赛道正逐渐掉队。“GoogleGlass什么都能干一点,但是什么也没有做好”,十年前,百度智能眼镜BaiduEye产品团队的一名成员坦言,“我们想至少在一点上做好,能把它用起来”。在这场“战役”中,那些跑得快的企业,是成为“领头羊”还是“炮灰”?可能只在一念之间。

  • 北大等发布多模态版o1!首个慢思考VLM将开源,视觉推理超越闭源模型

    北大等出品,首个多模态版o1开源模型来了——代号LLaVA-o1,基于Llama-3.2-Vision模型打造,超越传统思维链提示,实现自主“慢思考”推理。在多模态推理基准测试中,LLaVA-o1超越其基础模型8.9%,并在性能上超越了一众开闭源模型。团队宣布LLaVA-o1的代码、预训练权重、数据集等即将全部开源。

  • 三星XR智能眼镜2025年面世 功能强大或超雷朋Meta

    三星与谷歌合作开发的扩展现实智能眼镜预计将在2025年下半年发布,初期生产50万台。这款眼镜将搭载高通AR1芯片组,与雷朋Meta眼镜使用相同硬件平台,并配备1200万像素摄像头和155毫安时电池。据预测,三星可能会在2025年正式发布前,通过活动进行预热,比如在GalaxyS25发布会上首次展示XR眼镜,以吸引更多关注。

  • 超GPT-4o,1240亿参数!最强开源多模态模型 Pixtral Large!

    法国著名开源大模型平台Mistral.ai,开源了超大多模态模型——PixtralLarge。PixtralLarge有1240亿参数,支持128K上下文,能理解文本、图表、图像等,也是Mistral.ai自家聊天助手leChat目前正在使用的视觉模型。LeChat提供了一个从模型到输出的完全集成平台,用户可以在一个平台上完成所有的多模态任务,无需在多个工具之间切换,简化了工作流程。

  • 亚马逊祭出地表最强全家桶,多模态Nova却败给Claude 3.5!

    【新智元导读】围剿英伟达,数十万颗自研二代芯片超算在建!亚马逊祭出地表最强全家桶,多模态Nova击败GPT-4o。亚马逊推出了号称最强大的多模态模型Nova系列。IDC在2023年12月发布的最新研究报告显示,英伟达当前在AI芯片市场中占据着约95%的主导地位。

  • 邬贺铨:新一代无线短距通信发展正当时

    随着人工智能和万物互联时代的到来,数量庞大、功能各异的各类终端连接上网,对通信网络的时延、容量、同步、功耗、定位等提出新的需求。特别是在终端接入较多、应用需求较大的短距通信场景,相关技术更是面临新的挑战。星闪作为无线通信技术的一支,以创新的技术面向未来需要,当然作为后来者,也需要各方支持形成生态、做强产业。

  • 即构科技发布新一代自研AI音频引擎Purio

    实时语音互动已成为生活日常的一部分。人们可以随时随地与好友语音通话,刷直播并随时连麦,在游戏中和好友开黑互动,或与网友在线K歌合唱、抢麦……然,复杂多变的通话环境、个性化的用户需求以及参差不齐的网络通讯基础设施,都对音质提出了更高的挑战。期望能够与即构,与更多行业伙伴携手努力,持续探索AI与人类世界的共生与边界,共同迈进AGI时代。

  • AI日报:OpenAI重磅上线Sora;智谱AI免费多模态模型GLM-4V-Flash;腾讯云打造AI代码助手

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、OpenAI正式上线Sora,ChatGPTPro用户可无限生成、最长20秒OpenAI在"ship-mas"系列活动中发布了SoraTurbo视频生成AI,支持生成20秒1080p视频,用户可通过文本、图片或视频进行创作,具有多种风格和剪辑功能。See3D已开源,支持多种3D创作应用。