搜狗“唇语识别”技术演示视频：歌词、绕口令都能识别

2017-12-15 17:29 · 稿源：快科技

昨天，搜狗推出新一代人机交互——“唇语识别”，能识别人的唇部动作，动动嘴皮，不发出声音，就能识别你说的什么。今天我们见到了演示视频，从视频中可以看出将面部放入椭圆形区域内，不发声的说出一段话，几乎说完的瞬间，识别的文字就出现在屏幕上，无论是口语、诗词、歌词还是

......

本文由站长之家合作伙伴自媒体作者“快科技”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

即构发布云端实时语音识别服务

ZEGO云端实时语音识别服务针对直播、语聊、在线课堂和会议等场景，提供低延迟（端到端600ms）、高准确率（提升40%）、低成本（节省50%以上）的解决方案。支持30多种语言及方言，适配多厂商接入，具备降噪和回声消除能力。核心应用包括实时字幕和AI观众互动，显著提升用户体验和业务效率，助力企业全球化布局。

实时语音识别语音识别服务音视频场景
国庆调休iPhone闹钟没响苹果客服回应：目前无法识别调休日需手动设置

苹果闹钟因无法识别调休日再次引发用户吐槽。国庆假期周末调休上班时，闹钟未响导致用户睡过头。苹果客服回应称，闹钟工作日设定为周一至周五，系统暂无法识别调休安排。用户需手动调整或使用第三方软件设置。相比之下，国产安卓手机已支持自动跳过节假日功能。尽管iOS 26升级了闹钟提示时长调节功能，但仍未加入自动识别节假日的优化。网友质疑苹果在基础功能上的滞后，凸显其本土化不足的问题。

苹果闹钟调休日工作日设定
非洲女孩被AI识别出黑眼圈网友：AI一视同仁

9月10日，在上海外滩大会的热闹现场，一场关于AI测肤质的体验活动吸引了众多目光。其中，一位黑人女孩的体验过程尤为引人注目，她在使用AI测肤质功能后，竟被提示存在黑眼圈问题，需关注眼部皮肤状态及保养，这一结果瞬间引发了现场围观和网友热议。据现场工作人员介绍，该AI测肤质功能通过先进的技术分析皮肤状况，不受肤色影响。当黑人女孩完成测试后，AI系�

AI测肤质黑人女孩黑眼圈
逗哥配音平台：千款AI配音演员覆盖全行业，重新定义语音创作边界

随着内容创作行业蓬勃发展，高质量、多风格的配音需求日益增长。国内领先的AI语音技术平台——逗哥配音，凭借上千款精选音色和全面的行业适配能力，成为众多专业机构和个人创作者的首选方案。平台拥有超千款声音，覆盖不同年龄、声线和风格，可调参数达数十种，实现“千声千面”的语音多样性。其声音资源具备极强的行业适配性，适用于小说、影视解说、新闻播报、课程培训等多种场景，并针对ASMR、角色对话等专项优化。逗哥配音已整合文案提取、视频去水印等工具，打造一站式创作平台，显著提升内容产出效率。未来计划扩大声音库规模，深化垂直行业适配，并开放自定义音色训练功能，推动AI配音从技术辅助逐步进化为创意产业的核心生产力工具。

AI语音技术配音音色行业适配能力
小红书语音评论更新：可识别音色了支持甜嗓、气泡音、元气音等

近日，小红书平台上的语音评论功能引发网友热议。据媒体报道及多名网友在社交平台分享，小红书不仅推出了语音评论，还进一步升级，新增了音色识别功能，用户现在可以选择甜嗓、气泡音、元气音等多种音色进行评论。回溯至7月下旬，小红书的部分用户便惊喜地发现，评论区悄然出现了语音评论的选项。当时，小红书官方明确表示，该功能尚处于内测阶段，并未全量�

小红书语音评论音色识别
小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio，拥有12亿参数，在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力，通过创新预训练架构和超一亿小时训练数据，成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构，支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本，并在Github开源Tokenizer模型，为研究者和开发者提供完整工具链。

AI语音开源模型少样本学习
荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI日报今日聚焦多项技术突破：小米开源首个端到端语音大模型Xiaomi-MiMo-Audio；通义万相推出全新动作生成模型Wan2.2-Animate；Suno即将发布革命性音乐模型v5；生数科技获数亿融资，视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞，谷歌将Gemini集成至Chrome浏览器，Luma AI发布支持16位色的Ray3视频生成模型，法国Mistral推出开源推理模型Magistral Small 1.2，Notion发布AI智能体，腾讯混元3D Studio提升3D创作效率。

AI 语音大模型小米开源
AI火花集｜从“听命令”到“懂人心”，阿里云携手嘉兴声芯拆解智能语音落地路径

未来AI硬件将突破“机械响应”局限，语音交互成为核心入口。行业数据显示语音设备出货量激增，72%用户偏好语音交互。智能硬件面临算力不足、模型难选、成本高等挑战。嘉兴声芯通过端云协同方案，在本地处理隐私数据，云端进行语义理解，实现高效安全的语音交互。该方案已在AI玩具、车载后装等场景落地，推动硬件从工具向智能伴侣转型。

AI硬件语音交互人机交互
搜狗推出“唇语识别”技术打造多形态的人机交互

从键盘打字到触控屏，再到现在的语音交互和手势交互，人工智能技术的发展，正在促使人机交互方式向更加多元化方向变革。而今天，国内知名互联网公司搜狗又推出了一种人机交互新技术——唇语识别，这也是业内首个公开演示的唇语识别系统，通过机器视觉识别，不用听声音，仅靠识别说话人唇部动作，就能解读说话者所说的内容。与语音识别不同，唇语识别是一项基于机器视觉与自然语言处理于一体的技术，因此在研发难度上比语音识别大?

搜狗唇语识别
重磅升级！标贝语音识别3.0版上线，实现更强语音识别能力

经过一年多的算法攻坚，标贝科技研发团队在前端语音信号处理、声学模型、解码方式等各项技术实现全面升级，不仅在准确率及识别速度方面有了明显提升，而且还实现了快速纠错和热词实时更新等功能，进一步满足了行业用户的需求，提升语音识别体验...为满足不同语种的客户群体需求，标贝科技语音识别今年在语种丰富度上持续发力......

标贝ASR3.0 标贝科技语音识别

今日大家都在搜的词：

热文

3 天
7天

搜狗“唇语识别”技术演示视频：歌词、绕口令都能识别

即构发布云端实时语音识别服务

国庆调休iPhone闹钟没响苹果客服回应：目前无法识别调休日需手动设置

非洲女孩被AI识别出黑眼圈网友：AI一视同仁

逗哥配音平台：千款AI配音演员覆盖全行业，重新定义语音创作边界

小红书语音评论更新：可识别音色了支持甜嗓、气泡音、元气音等

小米开源首个原生端到端语音大模型支持音频重建任务和音频转文本任务

荐AI日报：小米开源首个原生端到端语音大模型；通义万相Wan2.2-Animate正式开源；Suno v5即将上线

AI火花集｜从“听命令”到“懂人心”，阿里云携手嘉兴声芯拆解智能语音落地路径

搜狗推出“唇语识别”技术打造多形态的人机交互

重磅升级！标贝语音识别3.0版上线，实现更强语音识别能力

今日大家都在搜的词：

热文

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

AI日报：腾讯重磅发布混元图像3.0；快手发布KAT系列Agentic Co

雷军：小米17 Pro Max很多门店已经缺货

iPhone调休闹钟上热搜苹果客服回应：需手动设置

雷军晒第100次健身打卡提前3个月完成健身目标

京东双11购物节官宣：10月9日晚8点开启

AI日报：蚂蚁开源高性能思考模型Ring-flash-2.0；通义7款模型屠

小米澎湃OS 3穿戴设备适配升级计划公布：10月开启推送

卢伟冰称小米17首销结果很不错并回应小米17为何最初无1TB

微信新功能上线：长按图片“搜一搜” 检索购物转表一键达

小米17破今年国产手机首销纪录卢伟冰：需求远超预期

AI日报：京东物流推出超脑大模型2.0；DeepSeek V3.1终结版发布

理想i6正式上市：首销直减1万限时售价23.98万元

AI日报：生数科技推出Vidu Q2；火山引擎推出炉米Lumi；通义千问

小米17系列开售5分钟破25年国产手机首销纪录

雷军大方推荐友商产品：不买YU7 可以考虑Model Y和理想i6

雷军称没什么好犹豫的：50岁正是闯的年纪

小米非常非常缺人上热搜雷军谈小米成功秘诀

苹果将推出iPhone 17e：搭载A19 芯片支持灵动岛

站长商机