首页 > 热点 > 关键词  > 正文

腾讯云推出语音识别系统ASR 语音识别大模型上线

2024-01-05 08:39 · 稿源:站长之家

站长之家(ChinaZ.com) 1月5日 消息:腾讯云 ASR(Automatic Speech Recognition)是腾讯云推出的语音识别系统。最新升级后,腾讯云 ASR 能够更好地处理方言和噪声,提高识别准确率和理解能力。

在方言方面,腾讯云 ASR 可以识别23种地方言,并且能够应对方言混战的情况。通过自研的多语言混合识别引擎,腾讯云 ASR 可以快速识别并无缝切换不同方言,只需要一个引擎就能搞定。通过蒸馏算法和半监督训练,腾讯云 ASR 可以高效地学习已标注和未标注的数据,甚至可以处理少数民族的小方言。

微信截图_20240105084402.png

在语义识别方面,腾讯云 ASR 使用了大语言模型 LLM,通过上下文语义和大数据提取意图,提升识别准确率。对于读音相似的词,腾讯云 ASR 也能选出正确的词。此外,对于特殊场景或专业术语,AI 也能更准确地识别。

在噪声过滤方面,腾讯云 ASR 通过自主学习和优化算法,训练出抗干扰的能力。它可以自动过滤噪声,提高识别精准度。

腾讯云 ASR 已经在腾讯内部产品和外部不同行业中广泛应用,覆盖了录音质检、会议实时转写、语音输入法等多个场景。产品的单日调用量达到了百亿次,服务的内外部企业客户数达到了数千个。

体验地址:https://cloud.tencent.com/product/asr

新鲜AI产品点击了解https://top.aibase.com/

举报

  • 相关推荐
  • 大模型+反诈+算力三重突破 腾讯云三项成果闪耀金融科技应用场景大赛

    10月30日,2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力,从全国89家机构的280个项目中脱颖而出,双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势,获专家团高度认可。大赛自2021年启动,已成为金融科技领域极具影响力的赛事平台。

  • 海量音色AI赋能,逗哥配音重塑语音创作新体验

    逗哥配音作为领先AI配音平台,以“海量音色+AI赋能”为核心,拥有上千款声音类型,覆盖多语言及商业场景。通过自研大模型韵律技术,实现情感饱满的语音生成,支持影音解说、小说推文等多种需求。平台内置场景化音色模板,新手也能快速制作专业配音,免费功能已满足日常短视频创作。其AI分角功能优化多人角色管理,提升对话内容制作效率。逗哥配音正重塑语音创作边界,成为短视频解说领域首选工具。

  • 中国移动北斗卫星短信业务升级:支持文字+图片+语音

    中国移动宣布北斗短信息服务完成重大升级,新增图片、语音等富媒体功能,文本传输能力显著提升,单条消息可发送40个汉字、接收达10个汉字。Redmi Note 15 Pro+卫星消息版率先支持升级,其他品牌终端也将陆续开启。此次升级在无地面网络信号时仍能通过多种形式传递信息,为户外探险、应急救援等场景提供坚实通信保障,标志着北斗通信正式步入“视听兼具”新时代。

  • 从识别到修复,联想想帮帮AI服务智能体打造你的AI智能维修管家

    AI时代重塑陪伴形式,联想“想帮帮AI服务智能体”以公益之心推出,通过五大功能(智玩、智验、智检、智修、智换)构建全流程闭环服务。它能随时响应、精准诊断、智能优化系统,一键解决电脑卡顿等问题,让用户省时省心。该服务强调责任与长期守护,结合北京领养日公益理念,传递科技向善、服务有爱的智能温度,重新定义AI陪伴的全部意义。

  • MiniMax让AI语音有了新基建

    熟悉MiniMax的人都了解这家公司的调性——不鸣则已,一鸣惊人。 要么选择低调,要么发动技术连招,其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。 十月的最后一周,再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化,基础文本模型M1升级至M2,“专为Agent和代码而生”;视频模型升级至Hailuo2.3,Hailuo Video Agent迭代为“全模态全�

  • 首发3229元起 小米年度旗舰智能门锁M40 Pro开售:AI掌静脉识别 隔空刷掌开锁

    今日,小米智能生态官微宣布,小米年度旗舰智能门锁M40 Pro今晚8点开售。 小米智能门锁M40 Pro建议零售价3799元,首发到手价3229.15元。 据了解,该门锁支持12种开锁方式,除AI掌静脉、AI 3D人脸识别、AI指纹、长期密码、周期/一次性密码、远程开锁、手机蓝牙开锁、应急机械钥匙外,还支持小米手机、手表、手环、NFC门卡(均需加购)开锁。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 腾讯云、腾讯研究院、Gartner联合发布《企业级智能体产业落地研究报告》,筑牢智能体应用安全基座

    腾讯云与Gartner联合发布《企业级智能体产业落地研究报告》,提出智能体场景罗盘评估模型,覆盖金融、零售等14大行业100+应用场景。报告指出智能体正从辅助工具演进为关键业务引擎,同时企业面临安全、成本等落地挑战。腾讯云安全提供全生命周期技术保障,通过华住集团、绝味食品等案例展示智能体在提升效率、优化服务方面的显著成效,助力企业构建“高可靠、强防护”的智能体体系。

  • 专注供应链单据识别 | 运小沓AI单证平台,单据识别提效500%

    供应链数字化进程中,单证处理效率低下是行业痛点。海运/空运托书、报关草单等核心单证格式复杂、人工录入易错,通用识别工具难以适配。运小藄AI单证平台通过自研大模型实现"无需定制、一键识别、精准高效"的智能处理,覆盖全场景单证类型,支持无缝对接业务系统。实际应用显示:托书录入效率提升500%,错误率降至0.1%以下;报关草单制单效率提升300%,有效解决"订舱等不起、报关错不起、定制用不起"三大难题。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

今日大家都在搜的词: