首页 > 热点 > 关键词  > 正文

腾讯云推出语音识别系统ASR 语音识别大模型上线

2024-01-05 08:39 · 稿源:站长之家

站长之家(ChinaZ.com) 1月5日 消息:腾讯云 ASR(Automatic Speech Recognition)是腾讯云推出的语音识别系统。最新升级后,腾讯云 ASR 能够更好地处理方言和噪声,提高识别准确率和理解能力。

在方言方面,腾讯云 ASR 可以识别23种地方言,并且能够应对方言混战的情况。通过自研的多语言混合识别引擎,腾讯云 ASR 可以快速识别并无缝切换不同方言,只需要一个引擎就能搞定。通过蒸馏算法和半监督训练,腾讯云 ASR 可以高效地学习已标注和未标注的数据,甚至可以处理少数民族的小方言。

微信截图_20240105084402.png

在语义识别方面,腾讯云 ASR 使用了大语言模型 LLM,通过上下文语义和大数据提取意图,提升识别准确率。对于读音相似的词,腾讯云 ASR 也能选出正确的词。此外,对于特殊场景或专业术语,AI 也能更准确地识别。

在噪声过滤方面,腾讯云 ASR 通过自主学习和优化算法,训练出抗干扰的能力。它可以自动过滤噪声,提高识别精准度。

腾讯云 ASR 已经在腾讯内部产品和外部不同行业中广泛应用,覆盖了录音质检、会议实时转写、语音输入法等多个场景。产品的单日调用量达到了百亿次,服务的内外部企业客户数达到了数千个。

体验地址:https://cloud.tencent.com/product/asr

新鲜AI产品点击了解https://top.aibase.com/

举报

  • 相关推荐
  • 雷军:小米YU7支持车外小爱语音 需要声纹识别验证

    小米CEO雷军今日通过微博宣布,即将上市的小米YU7将支持车外小爱语音交互。 雷军介绍,小米YU7车外有8个麦克风和1个扬声器,无论在哪个角度,都可以很容易使用语音控车,也可以和小爱同学流畅沟通。 比如,在车外直接让小爱同学打开前备箱。当然,车外唤醒小米同学,需要声纹识别和钥匙的安全验证,避免误操作风险。

  • AI日报:阿里开源长文本深度思考模型QwenLong-L1;GPT-4o语音模式上线唱歌功能;秘塔AI搜索推出全新“极速”模型

    本文汇总了AI领域最新动态:1)中国信通院发布智能体开发标准,推动AI商业化进程;2)阿里推出QwenLong-L1-32B长文本推理模型,性能媲美Claude-3;3)GPT-4o语音模式升级,新增唱歌功能;4)秘塔AI搜索推出极速模型,响应速度达400tokens/秒;5)谷歌发布LMEval评估框架,统一大模型评测标准;6)Chrome浏览器集成Gemini AI助手;7)阿联酋全民免费使用ChatGPT Plus;8)苏州成立60亿元AI产业基金;9)法国Kyutai实验室推出10秒定制语音的Unmute系统;10)UAV-Flow项目实现无人机语音精准控制;11)Claude将升级支持百万字上下文和记忆功能;12)百度心响iOS版上线;13)夸克推出高考深度搜索功能;14)Chrome v137开发者工具升级;15)美团AI业务接近GPT-4o水平;16)Direct3D-S2实现3D生成速度提升10倍;17)OpenAI计划2026年推出首款AI硬件。

  • 再获认可!腾讯云凭借NDR入选Forrester最新研报

    国际权威机构Forrester发布《网络分析与可见性解决方案报告》,腾讯云凭借旗下NDR产品在威胁检测、自动化响应等方面的优势连续第二年入选。报告指出,随着数字化转型深入,企业面临东西向流量攻击、AI驱动攻击等新型威胁,NAV解决方案能提供全网流量实时洞察,快速发现威胁。腾讯云NDR具备检测场景全、响应快、阻断率高等优势,覆盖公有云和线下机房全流量检测,支持2000余项漏洞检测,并采用AI算法提升威胁发现能力。报告建议企业根据规模选择合适的NAV供应商,腾讯云以"云原生接入、全流量检测、全流量可视"三大创新突破,助力企业构建高级威胁防护能力。

  • 华为云发布盘古大模型5.5,宣布新一代昇腾AI云服务上线,成就行业AI先锋

    华为开发者大会2025(HDC2025)在东莞篮球中心开幕,发布多项AI创新成果:1)推出基于CloudMatrix384超节点的新一代昇腾AI云服务,单卡推理吞吐量提升4倍;2)发布盘古大模型5.5,NLP、CV等五大基础模型全面升级,其中718B深度思考模型采用256专家MoE架构;3)推出行业首个统一预测架构Triplet Transformer,覆盖钢铁、水泥等多个工业场景;4)发布300亿参数视觉大模型,支持多维感知分析;5)升级盘古助手Doer,新增6大开发领域专业Agent。华为云宣布开发者突破800万,将构建昇腾、鸿蒙、鲲鹏等技术生态。

  • 腾讯云安全发布云上红蓝对抗防护神器,破解重保盲区与溯源难题

    腾讯云安全发布公有云全流量检测与响应NDR产品,定位为"红蓝攻防对抗防护神器"。该产品具有三大创新:1)云原生一键接入,无需硬件部署;2)全流量检测覆盖南北向、东西向及加密流量;3)全流量可视化分析。产品已通过200+客户实战检验,能快速溯源定位资产异常。相比传统方案,部署成本降低80%,支持180天日志存储,内置2000+漏洞检测规则和AI分析引擎,可精准识别30种协议异常。尤其突破加密流量分析难题,无需客户提供证书即可解密检测。该产品将助力企业构建高级威胁防护能力,应对重保响应、内网防护等核心安全挑战。

  • 预测大模型的工业生存法则,华为博士告诉你什么才是B端最需要的大模型!

    华为开发者大会2025期间,AI专家李良基与华为团队围绕预测大模型展开深度对话。华为提出"数据原子级表征体系"理念,旨在通过统一数据编码解决跨场景迁移难题。预测大模型已在钢铁行业成功应用,温度预测准确率远超传统方案。专家指出,AGI发展的核心在于构建知识迁移能力,未来将聚焦To B场景落地,通过统一架构实现跨领域泛化应用。华为云首创Triplet Transformer

  • 年度攻防演练专题 | 历经挑战赛锤炼,腾讯云安全RASP2.0版本即将上线!

    腾讯云安全RASP2.0版本即将发布,新增33类常见攻击防御能力,支持内存马防护。该技术通过首届RASP众测挑战赛验证,吸引200多位安全专家参与,拦截率高达99.99%。新版本特点包括:原生免疫0day漏洞、精准防御200+热点漏洞、24小时快速响应新漏洞、百万主机验证性能保障(内存占用<40MB,CPU<1%)。6月底正式发布前,开放20个免费体验名额。RASP2.0将与腾讯云主机安全泰石引擎联动,打造更纵深的云安全防护体系。

  • 容联云语音坐席代理:懂业务的Agent,让金融对话更有温度与效率

    容联云推出"大型语音坐席代理"解决方案,通过AI技术革新传统金融客服交互模式。该方案具备五大核心能力:1)智能理解客户意图,准确率达95%;2)强降噪处理嘈杂环境通话;3)拟人化语音交互,支持情绪适配;4)自动生成通话总结与商机洞察;5)人机无缝协作,支持多任务监控。应用场景覆盖客户服务(7*24小时响应)、精准营销(降低30%挂断率)和人性化催收(

  • AI日报:即梦灰测图片3.1模型;ElevenLabs推出AI语音助理11ai;百度发布多智能体协同AI IDE

    本文介绍了AI领域多项最新进展:1)即梦灰测图片3.1模型增强电影感和艺术风格;2)ElevenLabs推出语音助手11ai;3)文心快码发布多模态AI开发工具Comate AI IDE;4)苹果采用"归一化流"技术开发新型AI生图模型;5)Grok将推出整合多类型文件管理功能;6)OmniGen2开源多模态模型重塑AI应用场景;7)ScholAI革新学术研究工具;8)豆包推出可视化AI编程功能;9)饿了么推出骑手AI助手"小饿";10)张雪峰认为AI可替代部分教育工作;11)微软发布3.3亿参数小模型Mu。这些创新展示了AI技术在各领域的快速发展和应用潜力。

  • 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆

    6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。