首页 > 传媒 > 关键词  > 人机交互优化最新资讯  > 正文

思必驰:语音交互迈入“拟人化”阶段

2023-06-29 10:26 · 稿源: 站长之家用户

消费者在交互过程中并非孤立地依据声音、表情及动作中的单项进行沟通与交流,而是综合视觉、听觉、触觉甚至嗅觉来进行有效的沟通。同理,要使机器做到更加逼真的“拟人化”,就需要通过语音、视觉、文本等信息结合的方式来推动人机交互的优化与升级。

例如,在复杂声学环境尤其是多人同时说话的时候,语音识别性能会显著下降,此时若引入视觉信息对讲话者进行唇语识别,综合语音和视频信息则可以大幅提升说话人跟踪和语音识别准确率;又例如,在人机交互过程中,机器通过采集用户的表情、说话语气,甚至脚步的频率和急缓程度,可以分析用户的情绪状态,以采用不同的方式推进交互,提高人机交互的交互效率与质量。

不难看出,应对人机交互场景化应用不断拓展的市场需求,多模态、智能化的完整解决方案可以更好地应对不同场景的复杂变化,多模态交互成为行业发展的必然趋势。

深耕行业多年,思必驰早年便对多模态交互领域进行布局,已经成功自主研发出多模态对话交互技术。

具体来看,思必驰多模态对话交互技术联合语音、语言、视觉等多个模态的信息,能够在高噪声环境(比如地铁、家居、车载环境),大幅提升语音识别率和对话交互成功率。此外,思必驰研发打造出多模态对话交互软硬件一体的解决方案,包括高噪声环境下的多模态唤醒、说话人跟踪、语音活动检测等技术,增加了语音交互对噪声的鲁棒性,显著提升了用户体验。

目前,思必驰上述方案已应用政务民生场景中的轨道交通、智能自助设备等需要近场语音交互且环境嘈杂的场景和产品。

随着技术的不断进步,多模态交互的应用场景将会越来越广泛。可以预见的是,AI语音的发展在思必驰等技术领先企业的持续推动下,将会为人们带来更加自然、智能的交互体验。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 索尼ILX-LR1助力无人机实现高效罂粟巡查

    连云港空巡智能科技公司开发出搭载索尼ILX-LR1云台的无人机系统,用于罂粟等毒品原植物识别。该系统采用6100万像素相机,配合自主AI识别模型,能通过叶片形态、花果特征精准识别毒品植株,苗期识别率达90%,花果期达95%以上。ILX-LR1轻量化设计仅重243克,支持3张/秒航拍频率,可适配多旋翼和复合翼无人机,作业效率较传统方式提升8-10倍。该技术已应用于2025年禁种铲毒巡查项目,实现高空广域快速巡查,为禁毒工作提供高效精准的技术支持。

  • 欧菲光:机器人业务稳步推进,技术突破拓展应用场景

    欧菲光在投资者互动平台回应机器人业务布局,表示已形成明确规划,产品主要应用于扫地机器人、服务机器人等场景。公司自2019年切入机器人赛道,聚焦感知层技术创新,初期推出的ToF避障模块凭借高精度测距能力成为扫地机器人标配方案。2024年发布双光源ToF专利架构方案,实现"避障+定位导航"一体化功能,探测距离提升至10米,兼具低功耗、高采样率等优势,显著降低客户集成成本。未来将持续加大研发投入,围绕"性价比"与"高性能"深化技术布局,优化供应链管理降低成本,同时探索多传感器融合方向。凭借光学光电领域积累,公司已与多家品牌建立长期合作,形成"需求-研发-落地"闭环生态。业内分析认为,随着智能化需求增长,服务机器人市场将持续扩容,欧菲光有望凭借技术优势占据重要地位。

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 聚焦WAIC 2025 | 携全双工语音通话大模型亮相,Soul App重塑人机互动新范式

    Soul App在2025世界人工智能大会上展示了AI社交创新方案,重点呈现了全双工语音/视频通话大模型技术。该技术突破传统"轮次对话"模式,赋予AI自主决策对话节奏的能力,实现更自然的人机互动。平台通过"AI社交练习"主题,展示了AI在群聊派对中的主持能力,能有效活跃气氛、鼓励用户参与。同时,Soul还探索了多模态交互,基于全双工语音和实时视频生成技术,构建"数字人格"促进深度社交连接。作为社交平台,Soul持续深化AI与社区融合,通过智能推荐和虚拟人生态,为用户提供即时情感支持和共鸣,推动社交向"情感共生"进化。CTO陶明表示,AI正深入个体关系网络,将拓展"情价比消费"等全新市场机会。

  • 男子不慎坠崖5日获救:救援人员用无人机连人带担架空运

    科技的发展进步带来了方方面面的改变,利用得当,可以很好地造福于民。 据央视新闻报道,近日,河南省新乡市一名男子不慎失足坠崖,被困120多个小时后,最终在多方救援力量的接力协作下,通过无人机定位并吊运脱险。 据悉,由于坠崖地点地势险峻、植被茂密,传统搜救方式难以快速定位,救援人员决定启用无人机进行高空侦察。 经过多次飞行搜索,无人机最终在�

  • 全赛道获奖!聚铭网络闪耀第二届雄安未来之城场景汇网络安全技术应用大赛

    第二届雄安未来之城场景汇网络安全技术应用大赛圆满落幕。聚铭网络凭借深厚技术积累与创新能力,在"网络安全创新创意"、"网络安全解决方案"、"网络安全监测防御产品"三大赛道全部入围并荣获优秀奖,实现全赛道上榜。本届大赛以"汇聚网络安全技术,护航智能城市建设"为主题,聚焦雄安智能城市建设需求。聚铭网络申报的基于AI智慧异构环境的安全运营项目、异构融合技术的智慧安全运营中心解决方案、异构纵深防御技术的下一代智慧安全运营中心平台三大项目表现亮眼,均获分赛道优秀奖。此次"全赛道获奖"不仅是对聚铭网络技术创新能力的权威认可,更彰显了其在网络攻防实战、体系化运营及AI融合创新领域的综合实力。

  • 三星新一代Galaxy Z系列 开启折叠屏主动交互新时代

    三星发布全新折叠屏旗舰Galaxy Z Fold7和Flip7,搭载升级版One UI8系统和多模态AI技术。新机采用更轻薄设计,配备智能分屏、拖放操作等折叠屏专属功能。Galaxy AI深度整合Bixby助手、即时翻译、AI解题等实用功能,提升办公创作效率。同步推出的Galaxy Watch8系列智能手表采用无表耳设计,新增抗氧化指数检测功能。三星通过硬件创新与AI赋能,重新定义移动设备交互体验,引领折叠屏生态发展。

  • 无人机被土拨鼠叼进洞 游客求助客服:后者幽默回应

    近日,四川阿坝州一处草原上发生了一件令人啼笑皆非的趣事:一名游客的大疆Mini 4 Pro无人机在拍摄土拨鼠时,不慎被土拨鼠叼进了洞里,游客无奈之下向大疆客服求助,客服的幽默回应瞬间引爆网络。 事发当天,游客李先生带着心爱的大疆Mini 4 Pro无人机来到草原,打算捕捉土拨鼠的可爱瞬间。在调整拍摄参数时,他将无人机临时放置在了土拨鼠洞口边缘。然而,令人意想�

  • ​京东推出“新品孵化三步法”:AI技术升级引爆新品效率 助力转化率更高

    8月4日,京东新品学习中心在北京举行开学典礼,宣布全新上线"京东新品学习中心",同时升级"京东新品运营中心",推出"方法论+实战平台"组合拳赋能商家。京东创新推出"新品孵化三步法",通过标准化路径和持续升级的营销玩法,为商家提供从预热、上线冷启动到加速推爆的全周期解决方案。京东零售平台营销负责人表示,将基于"百千亿"计划强化精准营销能力,通过AI提效和超2亿搜推流量加速新品成长。新品孵化三步法包括:商家预热阶段通过大数据洞察需求;上线冷启动阶段精准破圈验证潜力;加速推爆阶段投入重磅资源实现爆发。京东同步构建了新品学习与运营双平台,形成"学-练-战"一体化赋能闭环,助力商家高效打造爆款新品。

  • 无人机、婴幼儿护理成热门专业!《2025快手高考季数据报告》揭秘新趋势

    快手发布《2025快手高考数据报告》显示:国防科技大学超越清华成为最受欢迎高校;无人机、婴幼儿托育等新兴专业受关注;平台开展"百城志愿报考"公益活动,开设8942场志愿填报直播,总观看量超6.6亿次;"志愿填报"话题视频播放量73.5亿次,搜索量437.6万次;河北、山西等省份用户最关注志愿填报。报告反映出考生选择呈现多元化趋势,平台通过线上线下联动打破信息壁垒,助力高考志愿填报。

热文

  • 3 天
  • 7天