首页 > 业界 > 关键词  > 智能耳机最新资讯  > 正文

语义听觉革新:可让智能耳机在消除环境噪音的同时保持空间感知

2023-11-20 09:50 · 稿源:站长之家

要点:

  • 华盛顿大学和微软的研究人员推出了一项先进的机器学习算法驱动的噪音消除耳机技术,具备语义听觉能力,使用户能够选择他们想听到的声音,同时消除其他听觉干扰。

  • 该技术解决了传统噪音消除耳机的关键问题,强调了这些耳机在实时智能方面的不足,无法从环境中识别和隔离特定声音,从而确保用户听觉和视觉感知的无缝同步。

  • 与传统耳机不同,该创新原型采用分类系统处理传入声音,使用户能够通过选择他们想要听到的声音来个性化他们的听觉体验。利用用户手机上的专门神经网络实现快速声音处理,为用户提供更强大的体验。

站长之家(ChinaZ.com)11月20日 消息:华盛顿大学和微软的研究人员推出了一项引领先进科技的创新,即噪音消除耳机具备语义听觉能力,由先进的机器学习算法驱动。这项技术的核心目标是让佩戴者能够有选择地听到他们想要听到的声音,同时消除其他环境中的干扰声音。文章着重介绍了这一创新的动机,指出传统噪音消除耳机在实时智能方面的不足,无法迅速识别和隔离特定声音,这导致了听觉和视觉感知之间的不同步。

为了解决这一问题,研究团队采用了一种全新的方法,不再仅仅专注于消除特定频率的声音或减弱来自环境的声音,而是通过一种分类系统对传入的声音进行处理。这使用户能够通过选择他们感兴趣的声音来个性化他们的听觉体验。

image.png

项目地址:https://semantichearing.cs.washington.edu/

通过一系列试验,原型展示了在各种环境中的潜在应用,从在吸尘器噪音中进行对话到专注于鸟鸣声,甚至在施工噪音中保持对交通喇叭的警觉。这一创新还在冥想中起到了作用,通过消除环境噪音,除了结束时的警报之外,提供了一种安静的氛围。

为了实现快速声音处理,关键在于利用比耳机内部集成的设备更强大的工具,即用户的智能手机。这种手机上的专门神经网络被设计用于进行双耳声音提取,为整个系统提供更快的响应时间。通过实验证明,基于转换器的网络在连接的智能手机上仅需6.56毫秒就能够处理20种不同的声音类别,并在室内和室外等多种场景中展示了其在提取目标声音同时保留空间线索方面的有效性。

这项噪音消除技术的创新为提升用户在各种环境中的体验打开了新的可能性,使个体能够实时定制其听觉环境,超越了传统耳机的局限。随着团队不断完善这一创新并准备发布代码,个性化音景似乎越来越接近现实。这一创举为未来提供了广阔的前景,让个体能够轻松定制他们的声音体验。

举报

  • 相关推荐
  • 耳机、卡片与麦克风:AI硬件掀起了会议室“风暴”

    当代邪修是怎么开会的? 眼睛看着智能屏、耳朵里塞着AI耳机、鼻梁上挂着AI眼镜、手边放着AI录音卡片、桌子中间摆着全向麦克风,以及内置于这些设备的Gemini、GPT、通义千问、文心一言等大模型支持的ARS、TTS、总结、摘要、归纳、代办、提问、实时搜索等功能。 因为AI硬件给办公室装上“数字耳朵”和“AI大脑”,曾经“一次性消耗品”的会议,变成了知识沉淀和积累的生�

  • 北汽元境智能正式发布 车辆升级“全域智能体”

    10月28日,北汽极狐全新阿尔法T5上市发布会举行,北汽集团正式发布“北汽元境智能”技术架构。该架构覆盖从底层到体验、从真实到仿真世界的技术体系,实现研发到量产落地,展现北汽在智能网联汽车领域的最新成果。其核心为“全域融合”,通过三大层次——舱驾融合、跨生态AI融合、真实与虚拟世界融合,打破技术边界,提升智能驾驶与座舱体验。同时推出元境智驾和元境智舱两大产品,覆盖L2至L4全阶智驾,并强调安全开发理念,累计测试超5000万公里。北汽以开放平台与伙伴合作,推动智能出行技术进化。

  • 智能问数:让数据 “开口”,让 BI 价值 “焕新”

    在数字经济时代,传统BI模式因技术壁垒使数据价值难以释放。智能问数通过自然语言交互,让非技术人员直接对话数据,快速获取洞察,实现从“为报表而生”到“为决策赋能”的转变。其核心架构融合智能问数、数据洞见与动态分析,支持多轮对话优化可视化呈现,并引入数据洞见能力,助力企业看清过去、把握现在、预判未来,重塑数据驱动增长的新范式。

  • 寒武纪:紧抓智能算力机遇 赋能多行业智能化升级

    寒武纪董事长陈天石在2025年半年度业绩说明会上指出,中国作为全球最大集成电路消费国,市场需求持续增长。人工智能算力需求爆发推动智能芯片发展,寒武纪专注AI芯片研发,产品覆盖云服务器、边缘计算及终端设备。公司已实现对DeepSeek-V3.2-Exp等主流开源大模型的适配优化,通过软硬件协同创新显著提升计算效率,降低部署成本,为多行业智能化升级提供核心支持。

  • 腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》,筑牢智能体应用安全基座

    腾讯云与Gartner联合发布《企业级智能体产业落地研究报告》,提出智能体场景罗盘评估模型,覆盖金融、零售等14大行业100+应用场景。报告指出智能体正从辅助工具演进为关键业务引擎,同时企业面临安全、成本等落地挑战。腾讯云安全提供全生命周期技术保障,通过华住集团、绝味食品等案例展示智能体在提升效率、优化服务方面的显著成效,助力企业构建“高可靠、强防护”的智能体体系。

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

  • 君乐宝柳叶包学生奶邯郸投产,智能产线树行业新标杆

    君乐宝乳业集团在深化学生营养健康布局中迈出坚实一步,专为学生群体研发的125毫升柳叶包学生饮用奶生产线于2024年10月正式投产。该生产线每小时产能达2.4万包,采用智能化灌装机器人实现全流程自动化,以严控奶源、先进工艺确保产品富含优质蛋白质、钙和维生素等核心营养。此举通过全产业链可追溯体系,既保障校园食品安全,更为国家"学生饮用奶计划"注入新动能,助力培养青少年健康饮食习惯,彰显民族乳企在推动学生营养改善中的责任担当。

  • 从“智慧景区”到“智能增长”:AI正重塑旅游业底层逻辑

    过去十年旅游科技聚焦“行前”环节,但生成式AI与多模态技术兴起推动行业转向“旅途中”的碎片化即时体验。杭州西湖项目通过实时感知游客位置、天气及偏好,结合地图与相机多模态输入,实现场景化推荐(如高温推送冷饮券、游船激活语音导览)。AI从辅助工具升级为智能运营体,通过“情境感知+权益触发”机制重构景区流量分配与商业结构,并采用RaaS模式与景区按销售分成,推动行业从“系统交付”转向“共同经营”。未来竞争核心在于AI能否基于行为数据重构供给体系,实现从资源驱动到数据驱动的转型。

  • 活字格通过信通院智能体专项测试,以All-in-One能力加速企业AI落地

    葡萄城自主研发的活字格低代码开发平台近日通过中国信息通信研究院“智能体平台”能力专项测试,成为首批完成测试的企业。该平台凭借All-in-One智能体开发架构,覆盖数据管理、模型接入、插件开发等八大能力域,具备强集成、高安全、易扩展特性。测试结果显示其AI开发能力达行业认可水平,可为企业提供低门槛智能体落地解决方案,已在制造、政务、医疗等领域深度应用,助力企业数字化转型。

  • 微电影《记忆奇旅》勾勒未来,九号用“凌波OS” 给出智能出行新答案

    九号品牌科幻微电影《记忆奇旅2》热映,12小时播放量破亿,超越前作纪录,成为爱奇艺科幻榜第二。影片延续“科技×情感”风格,通过“凌波胶囊舱”“概念车”等元素展现未来出行图景。现实中,九号自研凌波OS系统整合底层硬件,解决电动车行业功能碎片化问题,实现“自感知、自协调”能力。未来出行工具将具备自适应学习能力,从被动响应升级为理解用户需求的智慧伙伴,重新定义科技与人性的共生关系。

今日大家都在搜的词: