首页 > 动态 > 关键词  > 搜狗最新资讯  > 正文

搜狗推出“唇语识别”技术 打造多形态的人机交互

2017-12-15 11:41 · 稿源:天极网

从键盘打字到触控屏,再到现在的语音交互和手势交互,人工智能技术的发展,正在促使人机交互方式向更加多元化方向变革。而今天,国内知名互联网公司搜狗又推出了一种人机交互新技术——唇语识别,这也是业内首个公开演示的唇语识别系统,通过机器视觉识别,不用听声音,仅靠识别说

......

111本文由站长之家用户投稿发布于站长之家平台,本平台仅提供信息索引服务。为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 国庆调休iPhone闹钟没响 苹果客服回应:目前无法识别调休日 需手动设置

    苹果闹钟因无法识别调休日再次引发用户吐槽。国庆假期周末调休上班时,闹钟未响导致用户睡过头。苹果客服回应称,闹钟工作日设定为周一至周五,系统暂无法识别调休安排。用户需手动调整或使用第三方软件设置。相比之下,国产安卓手机已支持自动跳过节假日功能。尽管iOS 26升级了闹钟提示时长调节功能,但仍未加入自动识别节假日的优化。网友质疑苹果在基础功能上的滞后,凸显其本土化不足的问题。

  • 搜狗“唇语识别”技术演示视频:歌词、绕口令都能识别

    昨天,搜狗推出新一代人机交互——“唇语识别”,能识别人的唇部动作,动动嘴皮,不发出声音,就能识别你说的什么。今天我们见到了演示视频,从视频中可以看出将面部放入椭圆形区域内,不发声的说出一段话,几乎说完的瞬间,识别的文字就出现在屏幕上,无论是口语、诗词、歌词还是绕口令,都能很好的识别。

  • 即构发布云端实时语音识别服务

    ZEGO云端实时语音识别服务针对直播、语聊、在线课堂和会议等场景,提供低延迟(端到端600ms)、高准确率(提升40%)、低成本(节省50%以上)的解决方案。支持30多种语言及方言,适配多厂商接入,具备降噪和回声消除能力。核心应用包括实时字幕和AI观众互动,显著提升用户体验和业务效率,助力企业全球化布局。

  • 非洲女孩被AI识别出黑眼圈 网友:AI一视同仁

    ​9月10日,在上海外滩大会的热闹现场,一场关于AI测肤质的体验活动吸引了众多目光。其中,一位黑人女孩的体验过程尤为引人注目,她在使用AI测肤质功能后,竟被提示存在黑眼圈问题,需关注眼部皮肤状态及保养,这一结果瞬间引发了现场围观和网友热议。 据现场工作人员介绍,该AI测肤质功能通过先进的技术分析皮肤状况,不受肤色影响。当黑人女孩完成测试后,AI系�

  • 小红书语音评论更新:可识别音色了 支持甜嗓、气泡音、元气音等

    近日,小红书平台上的语音评论功能引发网友热议。据媒体报道及多名网友在社交平台分享,小红书不仅推出了语音评论,还进一步升级,新增了音色识别功能,用户现在可以选择甜嗓、气泡音、元气音等多种音色进行评论。 回溯至7月下旬,小红书的部分用户便惊喜地发现,评论区悄然出现了语音评论的选项。当时,小红书官方明确表示,该功能尚处于内测阶段,并未全量�

  • 华为智驾新专利公布:可识别唇语并报警!

    快科技3月24日消息,据天眼查显示,华为技术有限公司近日公开了一项报警方法、装置以及智能驾驶设备”的新专利,可识别唇语并报警。据显示,该专利申请人为华为技术有限公司,申请号为CN202211115088.2,申请日期为2022-09-14。摘要显示,本申请提供了一种报警方法、装置以及智能驾驶设备。智能驾驶设备中的报警装置根据第一唇部图像信息确定用户的第一唇部特征信息,所述第一唇部图像信息是第一相机获取的。所述报警装置将所述第一唇部特征信息输入到唇语报警模型中,得到第一报警信息。所述报警装置根据所述第一报警信息进行报警。通过?

  • VSP-LLM:可通过观察视频中人的嘴型来识别唇语

    VSP-LLM是一种通过观察视频中人的嘴型来理解和翻译说话内容的技术,也就是识别唇语。该技术能够将视频中的唇动转化为文本,并将这些唇动直接翻译成目标语言的文本。为了进一步提升训练的计算效率,VSP-LLM采用了低秩适配器技术,这种优化训练过程的方法能够减少计算资源的需求。

  • 搜狗发布手语AI合成主播 可达90%以上识别

    在“2021搜狐科技5G&AI峰会”上,搜狗公司CEO王小川发布了手语AI合成主播产品,可以进行独立工作,且不需要语音提取,通过嘴形变化达到60%以上识别;将语音与口型相结合,在语音嘈杂的环境中用视觉也可以达到90%以上的识别能力。王小川表示,“这不止是处理文字、语音或者简单图像的合成,而是在语音图像的合成里面找到核心的技术。”

  • 搜狗硬件今日全线关停:搜狗翻译笔、录音笔等服务下线

    根据搜狗硬件产品维护团队发布的公告,由于业务调整,搜狗硬件产品将于2024年5月30日23点59分正式停止服务。这些搜狗硬件产品包括糖猫手表、糖猫在家、糖猫词典笔、搜狗翻译笔、搜狗录音。因公司业务调整,2022年搜狗地图、搜狗搜索App、搜狗游戏中心、搜狗联盟网盟产品、搜狗科学百科等相继停服或下架。

  • 黑鲨VR装置又出新专利!设备可读取聋哑人唇语

    据南昌黑鲨科技有限公司“一种VR头戴装置及VR虚拟现实设备”专利公布...VR眼镜内设有移动电源、主机、显示单元;当佩戴VR头戴装置时,至少三个唇语识别模块均朝向佩戴者的唇部,读取唇语信息后发送至主机,主机计算唇语信息后生成外放信息,主机控制听说模块播放外放信息,当VR眼镜所处环境有音频时,听说模块识别音频并将音频传递给佩戴者...

今日大家都在搜的词: