首页 > 业界 > 关键词 > 小鹏最新资讯 > 正文

小鹏P7即将上线全新一代智能AI语音:无限接近人类声音、带情感、会调侃

2021-07-19 18:44 · 稿源:TechWeb.com.cn

【TechWeb】小鹏汽车似乎对产品有近乎偏执要求:要在车内创造出一种能「无限接近人类语气」的声音交互系统。

7月,这套「全新AI声音」的小P系统将在P7部分车型上线。

“去年1024之后,小鹏车机智能化有了很大进步,于是我们花费很多精力在小P的语音表现上,给大家一个更好的信息传递。”小鹏汽车AI产品专家陈思云介绍起全新车载语音。

小鹏产品团队为新声音设立了三大「纲要」:

(1)足够像真人。

(2)角色足够拟人,例如定位成「秘书」、「宠物」或是「女神」。

(3)亲切传达信息,拉进用户距离。

小P全新AI声音是如何做到的呢?为实现这三条,团队就必须往车机联入一个在线的、更大规模的「神经网络模型」从而实现HIFI级别合成语音。

目前,这套神经网络已经为小P带来了2项肉眼可见的提升:

一、MOS评分4.49

经MOS1语音质量评测,该声音得分为4.49,是目前微软MOS语音质量评测得分最高的车载智能语音助手。

当然,MOS评分不能完全完全「神化」。

MOS最早源于电话的语音质量评价。这项评价标准由ITU(InternationalTelecommunicationUnion,国际电信联盟简称国际电联)在1996年,作为囊括在《P.800: Methods for determination of transmission quality》中的一个「子标准」沿用至今,字面意思不难看出,这是个围绕「主观」(subjective)也就是人工听觉、人工打分的一项判定方法。

别看MOS古老(那时TTS还未普及),作为一个成熟、稳定、高度逼近人类听觉体验的评价标准,MOS的制定最初建立在一套有参考信号的评价体系之上的:评价时,同时需要待测信号和参考信号。相较于无参考评价方案,有参考的客观评价方案更容易做得贴近主观评价体系。

“MOS体系本身是一个主观评分,在全球最标准化的大会上参加评分的时候,也会要求需要把两个竞品或两个声音加上真人,加上一个非安慰剂的参照系放在一起横向比较。

我们只能比较这几个主观评价中,用户对它们评价的差值,但绝对分值的比较,因为它是一个主观比较,所以在换样本量,或换不同的场景,都会导致分值上的差异。

需要放在同一测试中这个分数才有比较的意义。”陈思云在回答能否用MOS评分高低作竞品横评时谈到。“即便无法客观的让小P横向对比。但我相信更新后,用户拿小P和Siri对比,还是有很大区别的。”

二、软硬兼施,打出「情感牌」

从刚才的视频来看,全新小P声音饱满程度也有很大提升,再配合P7本身的良好的NVH性能,我预感这波HiFi级高保真音质真的可以在P7上发挥出来,成为量产车中排名数一数二的沉浸交互感。

实际上,全新AI声音采用24K采样技术(现有声音为16k),各种场景下的声音反馈都被精心调教,用户听到的每句话都细腻生动、充满活力。

“新旧声音对比来听,会明显感受到音质的差距。这个声音不是拼接的,完全采用AI训练、生成出来的。”郝超补充道,“业内无论车企还是只能音箱,大家还是在用提前录音的方式,尽可能让语音包更好听,但内容覆盖率不高,所以我们采取这种方式(AI生成),也算一次大的创新。”

除了这些「硬实力」,全新AI语音还有足够「软实力」。

“小P会像Siri一样调侃么?”,笔者问道。

“全新AI声音会有一些情绪上的表达,或者对不同情景、不同语气会有一些彩蛋的埋入,包含像偶尔跟用户进行一些小的调侃,去调剂一下用户整个行程中的娱乐性,这也会有一些小的彩蛋的埋入。”陈思云回答。

而具体有哪些「彩蛋」,还需要P7车主一点点挖掘。

除了语音彩蛋,全新小P语气包括例如「助理、客服、聊天、温和、亲热、抒情、新闻、严肃、不满、生气、害怕、悲伤、冷静」等14种强烈情绪的变换能力,后续版本还会逐步贴合更多场景。

说了这么多优点,但新技术哪有不翻车的。来谈谈笔者对小鹏全新AI语音的担忧吧。

首先就是难以应对离线情形。

车辆行驶在偏远地区,没网,或者信号中断,在「有-无」网络之间来回切换,驾驶者肯定对语音质量的高低变换一定是有反应的。

但小鹏的工程师已经想出了对策:在线追求高品质,离线兜底无时延。

“如果遇到「5公里长的隧道」这类极端网络情况,我们会在本地留一个「小的离线模型」,它的体量不会很大,但保证小P在时效性不变差的情况下一定能把声音发出来,比如说导航或者自动驾驶这些播报,两个模型工作准则是一样的。”

按照郝超的说法,这套自研「端云融合多级缓存」,能让车辆预测当下的网络情况,自动改选「在线神经网络引擎」or「离线引擎进行声音合成」,总之就是在信号不佳的情况下,语音播报依然维持高音质。

“通过这个技术,小P已做到97%超高在线率。”郝超补充道。

最后:

笔者认为,拟人的全新小P能够更好传达信息。

回想下,你有没有经历过,当车内导航声被道路噪音掩盖、碰巧路线显示延迟而错过待转路口?

在认知心理学中有个经常被提及的原理:「鸡尾酒会效应」。指的是人类听觉系统有着极其神奇的「专注能力」,即便在嘈杂环境中,仍能将注意力专注于某种「特定声音」,而「无视」掉背景音。

其实,小鹏语音团队做的便是将这个原理「逆」过来:做出一套更好被人类听觉系统分辨的声音。

人的注意力是有限的,一个好的交互系统在设计时就必定要考虑到极端情况下,如何减少人脑的能量消耗,从而达到最好的信息传递效果。期待小P早日让车主们享受到这一乐趣。

  • 相关推荐
  • 大家在看
  • 小鹏P7全新AI声音获MOS最高得分 采用超大规模在线神经网络引擎

    【TechWeb】07月15日,小鹏汽车宣布,Xmart OS车载智能系统中的智能语音助手小P即将通过OTA获得一款全新AI声音。新声音采用了“全新一代超大规模在线神经网络引擎+小型离线拼接引擎”的技术组合,更好听、更生动,带来更接近真人的车载语音交互,进一步完善全语音车载系统的用户体验。根据国际通用语音质量评测方法MOS评测,在满分5分情况下,小P全新AI声音得分高达4.49分,是目前微软MOS语音质量评测得分最高的车载智能语音助手。

  • 新专利显示苹果VR头显可能利用神经网络监测用户的姿势

    苹果VR或AR头显可以根据监测用户的身体动作来移动用户的虚拟头像,而其电池寿命可以通过一些巧妙的数据传输技术来延长。在美国专利和商标局周二授予的一对专利中,苹果公司认为它可以改进其头显所能提供的东西,涉及到它如何与用户互动,以及它如何与主机设备进行通信。第一项专利名称为"生成身体姿势信息",涵盖了系统跟踪用户运动的能力,然后使用这些数据来执行其他相关动作。苹果估计,一些沉浸式计算机生成的现实体验需要了解

  • W3C发布Web神经网络API工作草案

    W3C最新发布的JavaScript API是Web神经网络API(Web Neural Network API)的公开工作草案。W3C和关联方一直在开发网络神经网络API,作为一种允许神经网络推理从浏览器硬件加速的手段。此前,W3C在今年早些时候成立了一个网络机器学习工作小组。Google和微软是参与该工作组的公司之一,他们希望能够利用专用的机器学习硬件加速器和网络浏览器中的本地指令。WebNN的设计考虑到了诸如人物检测、人脸识别、超级分辨率、图像标题、情感?

  • 消息称微软已同意收购网络安全公司RiskIQ

    消息人士透露,微软公司已同意收购安全软件制造商RiskIQ,这家科技巨头试图在全球网络攻击的浪潮中扩大其安全产品线并更好地保护客户。这笔交易最快将在未来几天内宣布,其中一位人士说,微软将为该公司支付超过5亿美元的现金。总部位于旧金山的RiskIQ公司主要开发检测安全威胁的云计算软件,帮助客户了解他们在企业网络和设备的复杂网络中在何处以及如何受到攻击。根据该公司的网站,其主要客户包括Facebook公司、宝马公司、美国?

  • 欧盟希望成了一个网络单位来应对网络攻击

    根据POLITICO看到的一份计划草案,欧盟希望启动一个新的网络单位来应对网络攻击。根据该草案,欧盟委员会将于周三提交其计划,建立所谓的"联合网络单位",该单位将允许受到网络攻击的国家向其他国家和欧盟寻求帮助,包括通过快速反应小组,实时扑向黑客并与之对抗。目前一连串的网络攻击在欧洲大陆造成了严重的破坏,导致人们担心欧洲无法保护自己或其商业机密不受对手侵害。欧盟的计划旨在通过集中各国政府的网络安全权力,帮助各

  • 微软在社交网络近距离展示Windows 11的设计元素

    Windows 10最引人注目的变化是增加了新的开始菜单,通知中心的设计借鉴了Windows 10X。开始菜单居中,并且普遍实施圆角设计。此外,Windows 11正在获得一种新的“云母”材料,旨在改善应用窗口的外观和感觉,创造一个更柔和、更简洁的环境,使不活动的应用窗口淡出背景,以帮助用户保持专注。在其YouTube频道和Instagram上,微软还让我们近距离观察了应用图标和按钮的新动画。对于这些新的图标和应用程序,微软研究了维度、深度、?

  • 微软曝光部分Netgear路由器存在安全漏洞 攻击者可破坏整个网络

    在调查 Microsoft Defender for Endpoint 中的设备指纹识别功能时,微软安全研究人员意外发现了 Netgear 路由器中存在的一个安全漏洞。为避免被攻击者利用来破坏整个网络,这家总部位于雷德蒙德的软件巨头选择了与 Netgear 团队密切合作,以尽可能快速有效地解决相关问题。(来自:Microsoft Security Blog)据悉,该漏洞是在 DGN-2200v1 路由器的管理端口,试图被不属于 IT 员工的设备访问后被发现的。在被机器学习算法标记为异常

  • 微信治理网络诈骗

    昨日,微信发布了《2021年上半年微信平台网络诈骗治理公示》。微信公布数据称2021年1-6月,在核实用户投诉提交的证据后,共计对超过60万个确认存在欺诈行为的帐号进行了阶梯式处罚,其中:

  • 因不满5G网络质量 韩国500多名用户将电信运营商告上法庭

    据国外媒体报道,韩国是全球率先推出5G商用服务的国家,SK电讯、KT和LG U+这三大韩国电信运营商,在2019年的4月3日就推出了5G商用网络,他们的5G用户也在持续增加,在移动通信用户中所占的比例,已超过了20%。

  • 外媒:微软将以5亿美元收购网络安全公司RiskIQ

    据国外媒体报道,消息人士称,在全球网络攻击事件日益严重之际,微软将以超过5亿美元的现金收购网络安全公司RiskIQ。

  • 微软将以超5亿美元价格收购网络安全公司RiskIQ

    据彭博引述消息人士报道,微软同意以逾5亿美元现金收购网络安全公司 RiskIQ,在全球网络攻击事件日益严重之际,试图扩大产品阵容和保护用户。这项交易最快在近几日宣布。

  • 微软的一次重大胜利:AT&T选择在Azure云平台上运行核心5G网络

    微软和ATT今天发布联合声明,表示该运营商的 5G 无线网络的核心部分将会运行在微软的 Azure 云计算平台上。在 2018 年,ATT 就开始搭建自己的 5G 网络,旨在更多依靠软件和数据中心来路由流量,而不是电信的具体装备。分析师认为,按收入计算,微软是仅次于竞争对手亚马逊网络服务(AMZN.O)的第二大云计算供应商,它一直在建立特定的云计算产品。而本次和 ATT 的合作无疑是微软的一个重大胜利。两家公司还表示,微软将购买 ATT 开发

  • 网络表演经纪机构不得诱导用户消费 不得炒作网络表演者收入

    网络表演经纪机构不得诱导用户消费。据文化和旅游部官网显示,文化和旅游部12日发布关于《网络表演经纪机构管理办法(征求意见稿)》(以下简称《征求意见稿》)公开征求意见的公告。《征求意见稿》规定,网络表演经纪机构不得以虚假消费、带头打赏等方式诱导用户消费,不得以打赏排名、虚假宣传等方式炒作网络表演者收入。

  • 网络机顶盒十大排行,家庭网络机顶盒要怎么选择

    电视行业在这几年不断的在发展,电视变得越来越智能,而要接触到最新的技术和功能,更换电视不太可能,而网络机顶盒则能让我们快速更新电视的配置和系统,带来更好的体验,那么现在有什么好用的网络机顶盒呢,下面来推荐一下。当贝智慧盒子Z1 Pro首先推荐的还是当贝智慧盒子Z1 Pro,目前最推荐的一款电视盒子,他是自带摄像头的电视盒子,装到任何的一个电视上都能让那个电视变成智慧屏,这是他最大的功能,装到电视上后,电视就能玩体感游戏、A

  • 目前什么网络机顶盒好,老电视用网络电视盒子旧貌换新颜

    家里不能看电视了,很多人在想到底是买个新电视好,还是选个好用的网络机顶盒呢?现在的网络机顶盒已经不像从前机顶盒的那样功能单一了,性能大幅度提升,而且功能也更加丰富,除了看电视外,还有教育功能,人机互动更强。并且网络机顶盒价格也不高,一两百元就可以搞定。因此推荐网络机顶盒更好。家里的电视不是智能电视怎么办虽然有电视,但旧电视,液晶电视,不是智能电视。这种类型的电视通常是广播电缆电视,每月支付一些钱,

  • 美英网络安全机构抨击APT28发起大规模网络攻击

    在英美网络安全机构的一份联合声明中,俄罗斯网络犯罪组织 APT28 被指控发起了多次大规模网络攻击。Security Affairs 指出:当局在 2019 年中至 2021 年初这段时间内,发现了针对全球诸多政府组织与企业的网络犯罪活动,涉及能源、智库、以及国防承包商等领域。具体说来是,黑客利用了 Kubernetes 集群开展匿名暴力攻击,并且借助商业虚拟专用网或暗网来进一步隐匿自身的踪迹。美国国家安全局(NSA)在公告中称,该网络犯罪组织正?

  • 告别无聊!飞机上将能体验5G:中国电信已启动5G ATG网络建设

    5G商业落地两年多发展迅猛,两年前还被归属为前沿科技终端的5G手机目前已经大规模普及,并且处于持续增长状态。根据近日全球著名分析公司Canalys发布的2021年智能手机出货量报告预测,2021年全球智能手机市场将增长12%,出货量将达到14亿台,其中5G手机将占全年出货量的43%,6.1亿台。随着5G手机的普及,5G网络覆盖也加快了步伐,飞机上也将能体验到5G网络了。6月26日消息,据媒体报道,目前中国电信已启动5G ATG网络建设,计划今?

  • 信办连续开启多宗网络安全审查 引爆网络安全市场想象空间

    近日,国家网信办连续针对滴滴、运满满、Boss直聘、货车帮等进行网络安全审查,关注焦点都是数据安全方面。而在此前的6月10日,《数据安全法》刚刚获得通过,引发了市场广泛猜测。几乎与此同时, IDC(国际数据公司)6月发布的《中国大数据平台市场研究报告-2020》显示,2020年全球大数据软件市场规模达4813.6亿元人民币;在中国市场,包括硬软服在内的中国大数据市场规模达677.3亿元人民币。这对大数据行业来说,无疑是打了一剂强?

  • BOSS直聘被网络安全审查

    就在刚刚,网络安全审查办公室发布公告称,为防范国家数据安全风险,维护国家安全,保障公共利益,依据《中华人民共和国国家安全法》《中华人民共和国网络安全法》,网络安全审查办公室按照《网络安全审查办法》,对“运满满”“货车帮”“BOSS直聘”实施网络安全审查。

  • 2023年生效:微软要求Windows 11笔记本必须配网络摄像头

    你的设备能升级 Windows 11 系统吗?微软发布了 Windows 11 的最低系统标准,包括 Secure Boot 和 TPM 2.0,目前后者可以绕过。不过,在微软的官方支持文档中还隐藏着一个对网络摄像头的要求。目前前置和后置网络摄像头都是可选的。不过微软补充道所有设备(除了台式电脑之外)都被要求有个向前的网络摄像头。这个隐藏要求将会在 2023 年 1 月 1 日开始生效,应该会迫使设备制造商在笔记本电脑、平板电脑等设备中加入网络摄像头。?

  • 热门标签