首页 > 业界 > 关键词  > 多模态AI最新资讯  > 正文

让AI更懂物理世界,人大北邮上海AI Lab等提出多模态分割新方法

2024-08-31 09:31 · 稿源: 量子位公众号

让AI像人类一样借助多模态线索定位感兴趣的物体,有新招了!来自人大高瓴GeWu-Lab、北邮、上海AI Lab等机构的研究人员提出Ref-AVS(Refer and Segment Objects in Audio-Visual Scenes,视听场景下的指代分割),让AI能看、会听,更懂真实物理世界。相关论文已入选顶会ECCV2024。举

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • HUAWEI SOUND及音频新品技术沟通会:深度解码「华为悦彰」技术,聆听家庭影院新标杆

    2025年11月6日,华为在HUAWEI SOUND音频新技术沟通会上全面展示了悦享声学品牌的技术积累与成果。会议系统解读了技术理念,并通过产品体验展现声学技术如何赋能多场景应用。华为悦享家庭影院作为首款应用该技术的产品亮相,其7.1.4星穹声场、鲸鲨超重低音及3D空间音频算法三大核心技术,结合水平与垂直方向的精准声场定位,为用户提供沉浸式家庭娱乐体验。产品设计极简,四台音箱采用鎏金星光网布包裹,兼具美观与声学优化。该产品已深度融入华为全场景智慧生态,支持与智慧屏、家庭存储等设备联动,实现影音、K歌、游戏等多功能一体,推动家庭影音行业创新发展。

  • 2025视觉中国&500px视觉盛典青岛站开启招募!

    本文介绍了多个科技品牌在展会现场推出的互动体验和福利活动:至誉科技提供免费笔记本屏幕校色服务,关注小红书可领取贴纸等礼品;东芝通过问卷赠送手机挂绳;索尼展出新品相机镜头;适马打卡送周边;永诺展示神秘新品镜头;雷克沙关注社媒可领专属礼物;富图宝有识脚架互动游戏;神牛到场即送周边;艺卓体验专业显示器;唯卓仕可参与新品抽奖;斯丹德提供免费抽奖与补光灯体验;明基首次展出未发售的校色显示器。各品牌均通过现场互动吸引用户参与。

  • 荣耀Magic 8系列上新,火山引擎助力“YOYO助理”多模态升级

    10月15日,荣耀发布搭载全新MagicOS 10系统的Magic8系列手机、MagicPad3 Pro平板及荣耀手表5 Pro等年度旗舰新品。智能语音助手“YOYO助理”升级多模态交互能力,结合火山引擎与豆包大模型技术,支持联网问答、识图、修图、闲陪伴、口语练习、出行规划等场景,提供图文、语音、视频等多种输入输出形式,实现秒级响应与沉浸式交互体验,成为用户“口袋里的万能管家”。

  • 京东11.11直播技术全面升级,立影3D技术、JoyAI大模型重构沉浸式购物体验

    京东在双11期间升级直播技术,推出“立体3D技术”和“JoyAI大模型”等创新。立体3D技术实现裸眼360度商品展示,用户无需额外设备即可旋转查看产品细节;JoyAI生成虚拟偶像Aura,与真人明星跨次元互动,提升趣味性。AI工具还简化直播运营,支持智能脚本和选品。这些技术打破传统直播边界,增强沉浸感和互动效率,引领电商直播创新方向。

  • 从识别到修复,联想想帮帮AI服务智能体打造你的AI智能维修管家

    AI时代重塑陪伴形式,联想“想帮帮AI服务智能体”以公益之心推出,通过五大功能(智玩、智验、智检、智修、智换)构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统,一键解决电脑卡顿等问题,让用户省时省心。该服务强调责任与长期守护,结合北京领养日公益理念,传递科技向善、服务有爱的智能温度,重新定义AI陪伴的全部意义。

  • 技术领航,定义高端电视新标杆:三星双十一全场景电视产品引领消费焕新浪潮

    伴随消费趋势向家居场景渗透,电视作为家庭影音娱乐核心载体,其功能诉求已从基础视听向超大尺寸、超清画质、场景融合、智能协同等多维进阶。三星电视以技术迭代驱动产品进化,构建覆盖多元需求的高端产品矩阵。双十一期间,三星商城携全品类明星产品回馈消费者,购机享星钻双倍抵扣、券后至高优惠6000元,全程价保。未来三星将持续深耕显示技术创新,探索科技�

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • 优酷用AI解题,为多元营销场景提效

    AI浪潮持续奔涌,正以前所未有的速度渗透营销领域的每一处脉络。从创意发想到投放优化,AI技术已从概念探索走向规模化落地,深度融入营销工作的日常场景。 在这场深刻的变革中,技术所展现出的最硬核、最毋庸置疑的现实价值便是——提效,而这也精准命中了行业沉积已久的痛点。 比如在内容生产环节,过去一条TVC广告从策划到上线往往需要数月;即便是轻量级的信�

  • 凭借革新技术突破 三星电子荣获消费者技术协会赞誉

    三星电子在2026年国际消费电子展(CES)斩获多项创新奖项,覆盖移动设备、家庭娱乐、家电及半导体等领域。其最新产品与服务凭借集成性能、设计与智能化的优势,荣获消费者技术协会颁发的CES创新奖。获奖产品包括Galaxy XR头显、Galaxy Z Fold7折叠手机及Galaxy Watch8智能手表等,彰显了三星在AI技术融合、沉浸式显示和智能家居解决方案方面的领先成果。这些创新致力于为用户打造无缝互联、高度个性化的体验,推动消费电子技术边界的发展。

  • 三星Micro RGB色彩技术亮相进博,智绘AI家电新视界

    三星在第八届进博会上紧扣AI浪潮,展示了显示技术、智能家电、半导体及物联网等领域的前沿成果。重点推出全球首款Micro RGB电视,融合微米级LED创新显示与AI功能,实现精准控光、更高亮度和真实色彩;同时展出144英寸Micro LED及纤薄折叠手机,体现从超大屏到移动显示的技术实力。全线产品集成Vision AI,通过影像增强、自适应音效等技术优化视听体验,并借助Galaxy AI提供个性化服务,强化在移动AI领域的领先地位。

今日大家都在搜的词: