首页 > 业界 > 关键词  > 目标语最新资讯  > 正文

荣耀声纹新专利公布:戴口罩依旧能让设备“听懂”

2023-01-03 21:24 · 稿源: 快科技

相信不少人都有过这样的经历:戴上口罩之后,智能助手就不认识”自己了。

这是因为用户在佩戴口罩后,口罩会对语音造成一定抑制,导致发出的声音与预录制的声音存在较大区别,这导致设备难以识别用户声音。

针对这一情况,荣耀终端有限公司今日公布了声纹识别方法及电子设备”专利(申请公布号CN115565537A),提出了一种解决方案。

荣耀声纹新专利公布:戴口罩依旧能让设备“听懂”

跟据专利摘要,这一技术包括:

目标语音进行特征提取,生成第一目标语谱图,以及对注册语音进行特征提取,生成第二目标语谱图;

根据第一目标语谱图生成目标掩码,将目标掩码作用到第二目标语谱图上,得到第三目标语谱图;

从第一目标语谱图提取出第一声纹矢量,从第三目标语谱图提取出第二声纹矢量;

如果第一、第二声纹矢量相似度大于或等于预设的相似度阈值,确定目标语音属于注册语音对应的用户。

该助力通过将口罩对于语音的遮蔽作用作为识别时的掩码,从而模拟口罩对实际声音的影响,能够有效提升用户佩戴口罩时,设备的识别成功率。

荣耀声纹新专利公布:戴口罩依旧能让设备“听懂”

举报

  • 相关推荐
  • “骨声纹+同传”,时空壶 W4 AI 同传耳机创新黑科技

    深圳时空壶技术有限公司在跨语言交流领域持续创新,其最新产品W4AI同传耳机凭借“骨声纹”拾音技术实现突破。该技术通过内置传感器捕捉耳骨振动信号,有效避免环境噪音干扰,在高达100dB的嘈杂环境中语音识别准确率仍超98%。W4支持42种语言即时互译,适配商务洽谈、国际会议等多场景,提供精准翻译及自定义热词功能。相比传统麦克风拾音设备,W4从根本上解决了复杂环境下的翻译质量难题,为全球用户带来高效、便捷的跨语言沟通体验,有望引领行业技术革新。

  • 雷军健身打卡第101次:已超越全年目标!

    9月30日雷军宣布已完成2025年健身目标101次,超额完成全年计划。他在2024年跨年直播中分享的三个新年愿望包括:2025年交付30万辆车、多旅行尝美食测汽车、完成100次健身。作为"劳模",雷军假期坚持锻炼,年初一仍在打卡。小米汽车交付量连续两月超3万台,9月有望突破4万,全年目标已从30万台提升至35万台。手机方面,小米17系列上市后火爆,登上《人民日报》整版,具纪念意义。

  • 雷军晒第100次健身打卡 提前3个月完成健身目标

    小米集团CEO雷军于9月28日宣布,已提前3个月完成2025年健身打卡100次的目标,展现出自律精神。他在跨年直播中曾提出三大新年愿望,包括健身、交付30万辆小米汽车及旅行。今年以来,雷军平均每月健身超10次,坚持践行承诺,引发网友热议。此举不仅树立积极榜样,也引发市场对小米拓展健身领域的关注与猜测。

  • 微博CEO称iOS 26微信语音没声音 网友同样中招 以为手机坏了

    微博CEO王高飞反映,iOS 26 Beta 1更新后微信语音通话首次接通无声音,需挂断重拨。多名网友反馈相同问题,甚至怀疑手机故障。微博智搜称,这是Beta系统的兼容性缺陷,已提供临时解决方案。iOS 26.1 Beta新增Apple Intelligence多语言支持及AirPods实时翻译功能,电话应用键盘采用全新液态玻璃设计。

  • 逗哥配音平台:千款AI配音演员覆盖全行业,重新定义语音创作边界

    随着内容创作行业蓬勃发展,高质量、多风格的配音需求日益增长。国内领先的AI语音技术平台——逗哥配音,凭借上千款精选音色和全面的行业适配能力,成为众多专业机构和个人创作者的首选方案。平台拥有超千款声音,覆盖不同年龄、声线和风格,可调参数达数十种,实现“千声千面”的语音多样性。其声音资源具备极强的行业适配性,适用于小说、影视解说、新闻播报、课程培训等多种场景,并针对ASMR、角色对话等专项优化。逗哥配音已整合文案提取、视频去水印等工具,打造一站式创作平台,显著提升内容产出效率。未来计划扩大声音库规模,深化垂直行业适配,并开放自定义音色训练功能,推动AI配音从技术辅助逐步进化为创意产业的核心生产力工具。

  • 雷军晒2025年第99次健身打卡 100次全年目标即将完成

    9月24日早,小米CEO雷军在社交平台晒出健身打卡照,这是他今年第99次健身。预计明天将完成第100次打卡,实现全年健身目标,并在当晚演讲中正式宣布。雷军年初曾立下2025年完成100次健身、交付30万辆汽车、多旅行并测试汽车的新年愿望。近九个半月来,他保持平均每月超10次的健身频率,其坚持锻炼的榜样作用激励众多网友加入健身行列。

  • 目标安卓最强平板!荣耀MagicPad3 Pro全面对标iPad Pro、小米平板Ultra

    荣耀MagicPad3+Pro平板即将发布,将搭载第五代骁龙8至尊版芯片,配备13.3英寸超高刷大屏,首发MagicOS 10系统,支持PC级交互能力。对标iPad Pro和小米平板Ultra,目标成为安卓阵营最强平板。预计售价约5000元,因旗舰芯片成本较高。作为参考,荣耀MagicPad 3售价2999元起。

  • 小米开源首个原生端到端语音大模型 支持音频重建任务和音频转文本任务

    小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio,拥有12亿参数,在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力,通过创新预训练架构和超一亿小时训练数据,成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构,支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本,并在Github开源Tokenizer模型,为研究者和开发者提供完整工具链。

  • 雷军2025年已健身96次 本周有望达成100次全年目标

    今天一早,雷军通过社交平台分享了自己的健身动态。 其配文健身房打卡,2025年第96次,坚持健身!”,引发众多网友关注。 从进度来看,距离100次的全年健身目标仅差4次,以一周剩余时间推算,本周内他大概率能顺利达成这一目标,其长期坚持的健身态度也成为不少人学习的榜样。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

今日大家都在搜的词: