首页 > 传媒 > 关键词  > 百度技术大会最新资讯  > 正文

百度技术沙龙展示语音新突破:识别率近97%

2015-11-10 16:11 · 稿源: 站长之家用户

随着语音识别技术日臻成熟,我们在日常使用各种智能设备时已经越来越多地可以借助于语音识别技术来简化我们的操作。近日,在语音识别技术领域深耕多年的百度举办以“智能语音技术,简化你我日常生活”为主题的技术沙龙,来自百度开发者中心的语音专家分享了百度在智能语音上的相关成果和进展。目前,借助多种比较新技术的运用,百度语音在通用文本安静环境普通话识别率结果已经提升到接近97%的水准,处于领先地位。

百度语音技术比较新进展:普通话识别率接近97%

据介绍,百度语音团队成立于2010年,到2013年就已经完成从无到有的华丽转变,搜索、地图、输入法、音乐、浏览器等多款产品均已搭载百度语音技术。在服务百度自家产品和应用的同时,百度语音部门还面向开发者开放诸多特殊技术,其中包括最关键的语音识别技术和语音合成技术。

百度语音技术部高档项目经理关勇介绍,百度语音识别技术主要涵盖长文本语音输入、短语热词识别、交互式对话垂直领域识别等场景,开发了基于听觉感知DNN声学建模技术,超大规模语言模型技术,海量数据语言模型动态更新技术和高速动态WFST一遍解码技术等,百度语音的识别功能已经在业界迅速树立领先地位。尤其是基于听觉感知DNN声学建模技术,使其语音识别率显著提高,比较新的LSTM建模和CTC训练在语音建模中的应用,将通用文本安静环境普通话识别率提升到接近97%,远超同类竞争产品。而包括麦克风阵列及信号处理技术、成熟的handfree唤醒技术等比较新进展也已经在车载场景语音交互中(如百度CarLife)上得到运用和体现。

在语音合成技术方面,百度则在海量文本信息处理技术、基于LSTM的韵律建模技术、基于LSTM的声学参数建模技术、弹性拼接单元挑选技术等方面取得了重要突破,完成了业界领先的拼接合成和参数合成系统,并提供美好体验的离在线融合语音合成服务解决方案。在此基础之上,百度语音在2015年10月底还隆重推出了情感语音合成技术,让声音合成摆脱平铺直叙,使用户体会更自然的发音,更丰富的情感和更强大的表现力。目前该技术已经在手机百度小说频道上线,用户可以在wifi环境下体验在线情感男声的小说播报。

开放百度语音平台,重点打造车载、家居方向解决方案

现场,百度语音开放平台首席产品经理穆向禹详细介绍了百度语音技术的应用场景,并重点介绍其在车载、家居两大领域的解决方案。他表示,百度语音平台已经面向开放者开放SDK及自主研发的REST API等多种接入方式,为包括联想、中兴、特斯拉在内的不同行业的企业和个人用户提供优质的语音服务。

在车载领域,百度语音重点优化语音唤醒功能,不但降低了功耗,还提升了稳定性和准确性;在应用端增加多信号处理技术,并针对不同的场景进行深度优化。此外,百度还开放包括图像、大数据、地图以及相关的技术分支,以语音为入口,携手更多的开发者共同完善车载环境。

百度正在打造针对智能家居的MCU和ARM解决方案,开发者可以通过在遥控器上安装自己开发的UI的方式,或者用手机离在线方案来控制一台电视机。今后,百度语音团队不仅要满足人们对洗衣机、冰箱这样的传统家居的智能化需求,还将提供更多的解决方案,建设智能生态圈。

建立生态打破垄断 三种方式为开发者谋利

对于接入百度语音平台的开发者,百度将通过建立生态为开发者提供更多分发和收入。在百度开发者平台高档产品设计师董经纬看来,要建生态,首先需要摆脱“生态=赔本赚吆喝”、“只投入、不产出”、“生态由开发者买单”三大认识误区。参与到百度语音技术生态建设的开发者,除了降低开发成本,还能通过“应用内容前置”、“生态SDK统一”、“前向付费尝试”三种具体执行形式获得超高分发流量和额外收入。

在应用内容前置形式里,百度提供内容对接方案,优先、集中展示对接应用,而开发者则需挖掘应用特色信息,自助完成内容对接,以便获取分发量、特色信息曝光的收益;生态SDK一站接入方式,可以降低开发者接入成本,提高当前覆盖率;前向付费尝试形式则主要引导用户付费,解决开发者的资金链问题。

推广

特别声明:以上内容(如有图片或视频亦包括在内)均为站长传媒平台用户上传并发布,本平台仅提供信息存储服务,对本页面内容所引致的错误、不确或遗漏,概不负任何法律责任,相关信息仅供参考。站长之家将尽力确保所提供信息的准确性及可靠性,但不保证有关资料的准确性及可靠性,读者在使用前请进一步核实,并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时,可及时向站长之家提出书面权利通知或不实情况说明,并提供身份证明、权属证明及详细侵权或不实情况证明(点击查看反馈联系地址)。本网站在收到上述法律文件后,将会依法依规核实信息,沟通删除相关内容或断开相关链接。

  • 相关推荐
  • 问道未有穷期 星海即是归途 | 2025百度商业AI技术创新大赛圆满收官

    2025百度商业AI技术创新大赛圆满落幕,聚焦AI技术与商业实践深度融合。赛事吸引2500多支队伍参与,覆盖广告生成式序列化推荐、视频生成推理优化等三大赛道。高校团队表现亮眼,重庆邮电大学、西安电子科技大学等获一等奖。大赛推动产教融合,展现AI在商业应用的前沿突破,助力青年创新者实现技术思维转变,共同期待AI赋能个性化表达与创意平权未来。

  • 寒武纪:持续研发投入 聚力技术创新

    寒武纪2025年上半年业绩亮眼:总营收28.81亿元,同比增长4347.82%;归母净利润10.38亿元,增长295.82%。业绩增长得益于AI算力需求持续增长,公司凭借AI芯片核心优势,深化与大模型、互联网等领域头部企业技术合作。持续加大研发投入达4.56亿元,研发团队792人占比77.95%,80.18%为硕士及以上学历。新一代智能处理器微架构和指令集正在研发,基础系统软件平台持续优化迭代,训练和推理平台功能增强,支撑大模型预训练和强化学习业务。

  • 百度第一!百度智能云一见领跑视觉大模型赛道

    IDC最新报告显示,百度智能云凭借"文心一言4.5"多模态大模型和"文心X1"深度思考模型,在视觉大模型领域综合实力排名第一。其智能云平台在算法模型、工程化落地、行业覆盖等方面优势显著,已服务餐饮、钢铁、电力等20多个行业,帮助数百家企业实现生产全环节的数字化管理。典型案例包括:为风电集团构建安全管控系统,巡检效率提升6-10倍;与中钢研合作金相分析模型,检测准确率达95%;助力连锁餐饮实现全国1000+门店服务质量量化管理,订单覆盖率从5%提升至95%。通过"云端大模型+边缘小模型"的协同架构,在保障精度的同时大幅降低应用成本,推动专业级视觉AI应用普及。

  • AI云第一,百度智能云凭什么?

    作为国内AI云首倡者,百度智能云又有了大动作。 2025年8月28日,2025百度云智大会在北京如期拉开帷幕,发布了新一见、百舸5.0、千帆4.0等AI全栈产品,迭代了AI全栈能力,包括雅识教育、心影随形、千寻智能等在内的客户也纷纷展示了合作成果,其中“吴彦祖数字口语陪练”被互联网津津乐道。 当下,AI掀起一场“生产力革命”,持续引领智能涌现,而百度智能云是这场革命

  • 百度APP发布AI星河计划,构建AIGC创作者全方位扶持体系

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,活动汇聚众多高质量AIGC作品与优秀创作者。百度发布“AI星河计划”,投入亿级流量和千万现金补贴,通过流量扶持、涨粉加速、分成翻倍、多元变现等手段,构建全方位创作者专属成长扶持体系。该计划根据作者AI技术与内容创作能力区分4档创作者,提供定制化支持套餐,最高可享亿级流量池和3倍分成补贴。百度APP依托月活7.35亿流量池与技术优势,已成为AIGC内容平台市场头部玩家,期待与更多优秀创作者共建未来内容生态。

  • 未来已来,百度APP与创作者携手打造全新AIGC内容生态

    8月29日,百度AIGC未来创作联赛颁奖典礼在京举行,汇聚众多高质量AIGC作品与优秀创作者。百度推出“AI星河计划”,投入亿级流量与千万现金补贴,全方位助力AI创作者成长。赛事覆盖120余所高校,征集1100余条优秀作品,吸引1800+创作者参与,总播放量超8亿。35个作品脱颖而出,获得金银铜等多项殊荣。百度APP作为国内领先的AIGC内容平台,通过生态构建与技术迭代,持续推动AIGC创作生态的繁荣与发展。

  • 寒武纪:聚焦技术创新 持续深耕智能芯片领域

    寒武纪在投资者平台声明,网上传播的公司订单、收入预测、新产品、客户及供应链等信息均为不实,提醒投资者提高信息辨别能力,以官方披露为准。公司专注AI芯片研发,产品覆盖云服务器、边缘计算及终端设备芯片,2024年营收增长65.56%,2025年一季度同比增230.22%,连续两季度盈利。研发投入持续加大,优化芯片架构与软件生态,提升产品竞争力,未来将聚焦技术创新,推动芯片向大模型及垂直领域延伸。

  • 百度正式发布AI搜索APP“梯子AI”:主打无广告智能搜索!

    百度旗下的AI搜索AppTizzy.ai”已完成了前期的测试,并正式更名为梯子AI”上架。 这款应用最初于8月10日发布,当时名称为Tizzy.ai”,更新后版本号从1.0.0直接跳至1.2.0。 据介绍,梯子AI定位为智能搜索助手,依托百度多个大模型能力开发而成,主打无广告智能搜索,整合深度思考、资源检索及影视娱乐功能,致力于为用户提供简单搜索,一触即达”的极致体验。

  • 逗哥配音平台:以AI技术赋能创作,引领“声音百花齐放”时代

    逗哥配音平台凭借多元声音资源与情感化AI技术,助力创作者打造爆款视频,显著提升内容感染力与收益。其核心技术“情感贴合”通过AI深度学习,使合成声音流畅自然且富有表现力,覆盖影音解说、小说推文等多种内容类型。平台还整合文案提取等实用工具,降低创作门槛,推动内容行业效率革新。未来将持续优化技术,探索更多细分领域,赋能数字内容生态。

  • 百度2025第二季度营收327亿元 AI新业务收入超100亿元

    今日,百度正式对外发布2025年第二季度(Q2)财报,多项业务数据表现亮眼,尤其在AI新业务领域呈现出强劲的增长态势。 财报显示,百度在2025年二季度总营收达到327亿元,其中百度核心营收为263亿元。值得关注的是,AI新业务收入超过100亿元,与去年同期相比增长了34%,成为推动百度营收增长的重要力量。

今日大家都在搜的词: