首页 > 传媒 > 关键词  > 人机交互优化最新资讯  > 正文

思必驰:语音交互迈入“拟人化”阶段

2023-06-29 10:26 · 稿源: 站长之家用户

消费者在交互过程中并非孤立地依据声音、表情及动作中的单项进行沟通与交流,而是综合视觉、听觉、触觉甚至嗅觉来进行有效的沟通。同理,要使机器做到更加逼真的“拟人化”,就需要通过语音、视觉、文本等信息结合的方式来推动人机交互的优化与升级。

例如,在复杂声学环境尤其是多人同时说话的时候,语音识别性能会显著下降,此时若引入视觉信息对讲话者进行唇语识别,综合语音和视频信息则可以大幅提升说话人跟踪和语音识别准确率;又例如,在人机交互过程中,机器通过采集用户的表情、说话语气,甚至脚步的频率和急缓程度,可以分析用户的情绪状态,以采用不同的方式推进交互,提高人机交互的交互效率与质量。

不难看出,应对人机交互场景化应用不断拓展的市场需求,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。

深耕行业多年,思必驰早年便对多模态交互领域进行布局,已经成功自主研发出多模态对话交互技术。

具体来看,思必驰多模态对话交互技术联合语音、语言、视觉等多个模态的信息,能够在高噪声环境(比如地铁、家居、车载环境),大幅提升语音识别率和对话交互成功率。此外,思必驰研发打造出多模态对话交互软硬件一体的解决方案,包括高噪声环境下的多模态唤醒、说话人跟踪、语音活动检测等技术,增加了语音交互对噪声的鲁棒性,显著提升了用户体验。

目前,思必驰上述方案已应用政务民生场景中的轨道交通、智能自助设备等需要近场语音交互且环境嘈杂的场景和产品。

随着技术的不断进步,多模态交互的应用场景将会越来越广泛。可以预见的是,AI语音的发展在思必驰等技术领先企业的持续推动下,将会为人们带来更加自然、智能的交互体验。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 小米智能家电工厂进入装修阶段!自研自产“空冰洗”

    快科技4月17日消息,据中国光谷公众号介绍,位于武汉光谷的小米智能家电工厂目前正进行厂房内部装饰装修,力争提前交付。据悉,去年8月小米智能家电工厂签约落户光谷,成为小米集团在全国继汽车超级工厂、手机智能工厂后的第三座智能工厂,曾创造签约3个月开工、开工2个月封顶的极速。小米集团有关负责人介绍,厂房加快建设的同时,招聘工作也已启动,生产人员在小米中试工厂完成培训后将第一时间入驻小米智能家电工厂,力拼2026年目标。小米智能家电工厂建成后,将为小米冰空洗”产品全栈自研充实底气。据博主小马甲不小”爆料,小米武汉

  • 理想辟谣泼水节汽车被语音开门:是副驾自己开的门

    一段云南泼水节现场理想SUV被泼成泡水车的视频在网络上迅速传播,引发广泛关注。视频中,一辆理想汽车出现在热闹的泼水节活动现场,车内副驾乘客手持水枪,试图以此抵御外界泼水攻击。然而,令人意想不到的是,一名女士迅速靠近车窗,通过喊话“理想同学,打开车门”这一方式,意外触发车辆解锁机制,车门随即被打开。随�

  • 谷歌A2A智能体交互协议是什么?A2A和MCP有什么关系?

    谷歌正式发布名为Agent2Agent的智能体互操作协议,并与Atlassian、Box、Cohere、Intuit、LangChain、MongoDB、Salesforce、SAP、ServiceNow、UKG、Workday等50余家科技企业达成合作,旨在将A2A打造为智能体交互领域的通用标准。此举被业界视为AI生态竞争的关键布局,其战略意义可追溯至10年前谷歌发布Kubernetes时对容器化技术的定义权争夺。谷歌此举不仅为智能体协作提供基础设施,更试图重新定义AI时代的协作范式。

  • 国产旗舰即将迈入7000mAh时代:iPhone望尘莫及

    博主数码闲聊站暗示,年底的天玑9500、骁龙8Elite2旗舰会配备7000mAh级别的超大电池,最高可以做到7500mAh左右,目前有厂商正在测试7500mAh100W有线闪充方案。中端机型会规划落地8000mAh。值得一提的是,在电池容量和快充方面,相比国产旗舰,iPhone进步缓慢,9月登场的iPhone17Air电池不到4000mAh,预计快充跟国产旗舰也有较大差距。

  • 听脑 AI:重新定义语音处理效率的全能助手

    听脑AI是一款专注于语音/视频转文本的智能助手,具备三大核心功能:1)实时语音转写,支持会议、课堂等多场景录音转文字,自动区分发言人;2)音视频解析,可提取本地文件或平台链接内容生成可编辑文档;3)AI问答辅助,能基于语音内容生成摘要、PPT大纲等二次创作。其优势在于毫秒级响应、125种语言互译、智能降噪,适用于商务会议、教育学习、内容创作等场景,显著提升工作效率。支持多端同步与加密存储,提供20分钟免费试用体验。

  • AI Agent大变天!谷歌开源A2A,一夜改变智能体交互

    谷歌在GoogleCloudNext25大会上,开源了首个标准智能体交互协议——Agent2AgentProtocol。A2A将彻底打破系统孤岛,对智能体的能力、跨平台、执行效率产生质的改变,支持Atlassian、Box、Cohere、Intuit、Langchain、MongoDB、PayPal、Salesforce、SAP、ServiceNow、UKG和Workday等主流企业应用平台。通过A2A协议,MongoDB可以使其数据库服务与智能Agent相结合,实现更高效的数据管理和自动化数据处理。

  • 《王者荣耀》哪吒2语音包上线:你打我噻、收你们来了

    快科技4月17日消息,《王者荣耀》与世界第一动画电影《哪吒之魔童闹海》惊喜联动啦!此次联动可谓亮点满满,最引人注目的便是哪吒、敖丙等四位角色的联动皮肤,它们将于后续择机正式上线。为庆祝此次深度合作,《王者荣耀》特别为大家精心准备了限时语音包,这些语音均来自《哪吒之魔童闹海》中的热门台词,充满力量与个性。具体语音内容如下:-你打我噻-还吃!

  • Siri已可控制小米汽车 还可自定义添加语音控制

    小米汽车正式对外宣布,其车辆现已全面支持通过Siri语音控制,为用户带来更加便捷与智能的用车体验。他们已为车辆预置了一系列实用的语音指令,以满足用户日常用车的多种需求。用户可以通过Siri设置空调的具体温度、开启方向盘加热、调节座椅加热与通风,甚至控制车载冰箱等,让用车生活更加智能化与舒适化。

  • Antropic加入“AI语音助手”赛道,能追上OpenAI、谷歌们吗?

    随着 AI 语音产品的出现,人们对其模仿他人说话风格的担忧也在加剧……

  • Siri已可语音控制小米汽车:解锁车门、开闭后备箱动动嘴就行

    小米汽车今日晚间发文宣布,小米汽车现已可通过Siri语音控制。小米汽车已为车辆预置了一些指令,如果不习惯的话,可以自行重命名”指令,同时支持自定义添加功能。用户还可自定义添加功能,如通过Siri设置空调温度、方向盘加热、座椅加热、座椅通风、冰箱控制等。

热文

  • 3 天
  • 7天