让AI更懂物理世界，人大北邮上海AI Lab等提出多模态分割新方法

2024-08-31 09:31 · 稿源：量子位公众号

让AI像人类一样借助多模态线索定位感兴趣的物体，有新招了!来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS（Refer and Segment Objects in Audio-Visual Scenes，视听场景下的指代分割），让AI能看、会听，更懂真实物理世界。相关论文已入选顶会ECCV2024。举

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

HUAWEI SOUND及音频新品技术沟通会：深度解码「华为悦彰」技术，聆听家庭影院新标杆

2025年11月6日，华为在HUAWEI SOUND音频新技术沟通会上全面展示了悦享声学品牌的技术积累与成果。会议系统解读了技术理念，并通过产品体验展现声学技术如何赋能多场景应用。华为悦享家庭影院作为首款应用该技术的产品亮相，其7.1.4星穹声场、鲸鲨超重低音及3D空间音频算法三大核心技术，结合水平与垂直方向的精准声场定位，为用户提供沉浸式家庭娱乐体验。产品设计极简，四台音箱采用鎏金星光网布包裹，兼具美观与声学优化。该产品已深度融入华为全场景智慧生态，支持与智慧屏、家庭存储等设备联动，实现影音、K歌、游戏等多功能一体，推动家庭影音行业创新发展。

华为悦彰声学音频技术家庭影院
2025视觉中国&500px视觉盛典青岛站开启招募！

本文介绍了多个科技品牌在展会现场推出的互动体验和福利活动：至誉科技提供免费笔记本屏幕校色服务，关注小红书可领取贴纸等礼品；东芝通过问卷赠送手机挂绳；索尼展出新品相机镜头；适马打卡送周边；永诺展示神秘新品镜头；雷克沙关注社媒可领专属礼物；富图宝有识脚架互动游戏；神牛到场即送周边；艺卓体验专业显示器；唯卓仕可参与新品抽奖；斯丹德提供免费抽奖与补光灯体验；明基首次展出未发售的校色显示器。各品牌均通过现场互动吸引用户参与。

展位活动免费校色问卷赢礼
荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

10月15日，荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力，结合火山引擎与豆包大模型技术，支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景，提供图文、语音、视频等多种输入输出形式，实现秒级响应与沉浸式交互体验，成为用户“口袋里的万能管家”。

荣耀Magic8系列 MagicOS10操作系统 YOYO助理
京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

京东在双11期间升级直播技术，推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示，用户无需额外设备即可旋转查看产品细节；JoyAI生成虚拟偶像Aura，与真人明星跨次元互动，提升趣味性。AI工具还简化直播运营，支持智能脚本和选品。这些技术打破传统直播边界，增强沉浸感和互动效率，引领电商直播创新方向。

京东11.11 立影3D技术 JoyAI大模型
从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

AI时代重塑陪伴形式，联想“想帮帮AI服务智能体”以公益之心推出，通过五大功能（智玩、智验、智检、智修、智换）构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统，一键解决电脑卡顿等问题，让用户省时省心。该服务强调责任与长期守护，结合北京领养日公益理念，传递科技向善、服务有爱的智能温度，重新定义AI陪伴的全部意义。

AI陪伴领养代替购买智能服务
技术领航，定义高端电视新标杆：三星双十一全场景电视产品引领消费焕新浪潮

伴随消费趋势向家居场景渗透，电视作为家庭影音娱乐核心载体，其功能诉求已从基础视听向超大尺寸、超清画质、场景融合、智能协同等多维进阶。三星电视以技术迭代驱动产品进化，构建覆盖多元需求的高端产品矩阵。双十一期间，三星商城携全品类明星产品回馈消费者，购机享星钻双倍抵扣、券后至高优惠6000元，全程价保。未来三星将持续深耕显示技术创新，探索科技�

电视功能超大尺寸超清画质
Hugging Face创始人x小红书技术副总裁对谈：开源、AI与技术人的成长

小红书科技与Red++ Academy在1024程序员节举办直播，技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话：AI编程正成为基础能力；开源是技术发展的核心引擎；实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践，强调技术人需提升问题定义与框架性解决能力，并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局，旨在降低技术使用门槛，推动社区共进。

1024程序员节小红书Red Academy
荐优酷用AI解题，为多元营销场景提效

AI浪潮持续奔涌，正以前所未有的速度渗透营销领域的每一处脉络。从创意发想到投放优化，AI技术已从概念探索走向规模化落地，深度融入营销工作的日常场景。在这场深刻的变革中，技术所展现出的最硬核、最毋庸置疑的现实价值便是——提效，而这也精准命中了行业沉积已久的痛点。比如在内容生产环节，过去一条TVC广告从策划到上线往往需要数月;即便是轻量级的信�

AI营销创意发想投放优化
凭借革新技术突破三星电子荣获消费者技术协会赞誉

三星电子在2026年国际消费电子展（CES）斩获多项创新奖项，覆盖移动设备、家庭娱乐、家电及半导体等领域。其最新产品与服务凭借集成性能、设计与智能化的优势，荣获消费者技术协会颁发的CES创新奖。获奖产品包括Galaxy XR头显、Galaxy Z Fold7折叠手机及Galaxy Watch8智能手表等，彰显了三星在AI技术融合、沉浸式显示和智能家居解决方案方面的领先成果。这些创新致力于为用户打造无缝互联、高度个性化的体验，推动消费电子技术边界的发展。

三星 CES创新奖消费电子
三星Micro RGB色彩技术亮相进博，智绘AI家电新视界

三星在第八届进博会上紧扣AI浪潮，展示了显示技术、智能家电、半导体及物联网等领域的前沿成果。重点推出全球首款Micro RGB电视，融合微米级LED创新显示与AI功能，实现精准控光、更高亮度和真实色彩；同时展出144英寸Micro LED及纤薄折叠手机，体现从超大屏到移动显示的技术实力。全线产品集成Vision AI，通过影像增强、自适应音效等技术优化视听体验，并借助Galaxy AI提供个性化服务，强化在移动AI领域的领先地位。

AI智能家电显示技术半导体

今日大家都在搜的词：

热文

3 天
7天

让AI更懂物理世界，人大北邮上海AI Lab等提出多模态分割新方法

HUAWEI SOUND及音频新品技术沟通会：深度解码「华为悦彰」技术，聆听家庭影院新标杆

2025视觉中国&500px视觉盛典青岛站开启招募！

荣耀Magic 8系列上新，火山引擎助力“YOYO助理”多模态升级

京东11.11直播技术全面升级，立影3D技术、JoyAI大模型重构沉浸式购物体验

从识别到修复，联想想帮帮AI服务智能体打造你的AI智能维修管家

技术领航，定义高端电视新标杆：三星双十一全场景电视产品引领消费焕新浪潮

Hugging Face创始人x小红书技术副总裁对谈：开源、AI与技术人的成长

荐优酷用AI解题，为多元营销场景提效

凭借革新技术突破三星电子荣获消费者技术协会赞誉

三星Micro RGB色彩技术亮相进博，智绘AI家电新视界

今日大家都在搜的词：

热文

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

华为Mate 70 Air维修备件价格公布：换主板2499元

OPPO Reno15系列定档11月17日发布

鸿蒙智行：智界R7累计交付量破10万台

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

OPPO Reno15系列官宣11月10日发布

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

华为Mate70 Air官宣今日开启预售

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机