首页 > 业界 > 关键词  > 百度App最新资讯  > 正文

百度执行副总裁沈抖:百度App语音搜索识别准确率已达98%

2021-08-18 11:33 · 稿源:站长之家

站长之家(ChinaZ.com) 8月18日消息:在今天的百度世界大会2021上,百度集团执行副总裁沈抖表示,目前,百度 App 语音搜索识别准确率已经达到98%。

据沈抖介绍,在 AI 技术的加持下,百度 App 的搜索功能有了更多的交互形式,从文字输入到语音、图片、人工问答,搜索的展现形式和应用场景正在不断扩大,能够提供的服务也更加全面和智能。同时能准确识别多轮对话、长句、中英文混杂、生僻字、方言等。

另外,在本次百度世界大会上,百度还发布了Apollo“汽车机器人”。据介绍,汽车机器人车内不设方向盘、踏板,且拥有超大曲面屏、智能控制台、变光玻璃、零重力座椅等智能化配置。百度汽车机器人能够通过三重能力服务于人:首先具备L5级自动驾驶能力,不仅无需人类驾驶,而且比人类驾驶更安全;其次具备语音、人脸识别等多模交互能力,分析用户潜在需求,主动提供服务;此外汽车机器人还具备自我学习和不断升级能力,是服务各种场景的智慧体。

举报

  • 相关推荐
  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

    Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

  • 双11鸿蒙应用持续升级,小艺、应用市场等App让购物更省心

    双十一期间,华为应用市场推出"11.11好物集"专题,提供购物指南与达人穿搭参考,帮助用户高效筛选商品。鸿蒙系统的小艺助手支持商品比价、智能下单及多任务语音操作,简化购物流程。出境游用户可使用天际通流量服务,无需实体卡,按天计费;配合云空间自动释放本地存储,保障旅行照片视频安全同步。通过智慧功能与便捷服务,为用户打造更流畅、安全的消费与出行体验。

  • 饿了么APP更名为淘宝闪购 版本号升级至12.0.2

    饿了么App正式升级为淘宝闪购,版本号12.0.2,打通天猫旗舰店与饿了么货盘资源,推出“电商低至30分钟送达”极速服务,覆盖餐饮、3C数码、美妆等全品类商品。升级后与饿了么携手加大补贴力度,提供免单红包、免单奶茶、大额满减外卖券等超级权益,并加入今年天猫双11活动,88VIP用户可获红包惊喜、折上折等福利,提升消费者购物体验与实惠。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 苹果推出网页版App Store 浏览器即可使用

    苹果公司近日推出网页版App Store,用户无需依赖特定苹果设备,通过任意浏览器访问apps.apple.com即可浏览全平台应用。新版网页设计与原生App Store界面高度相似,功能丰富且交互流畅,取代了原先简单的登录页面。用户可通过左上角下拉菜单快速切换至iPhone、iPad等设备的专属应用页面,实现跨平台浏览。网页版完整移植了原生商店的“今日”标签页内容,包括编辑推荐、热门�

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • Soul App联合上海市青少年研究中心发布《2025 Z世代双十一消费行为报告》:大促参与度再提升,超9成年轻人快乐买买买

    《2025Z世代双十一消费行为报告》显示,双十一已从购物节演变为融合消费、文化与社交的年度盛事。超九成Z世代参与大促,消费信心增强,约四成年轻人增加预算。AI技术重塑购物体验,七成认可AI+电商应用。消费热点转向情绪价值,旅行类消费占比最高(36.9%),文化消费显著(21.4%)。线下渠道受关注,超七成年轻人参与实体活动。国货品牌持续受青睐,消费选择更理性,呈现“热情参与、理性决策”特征。

  • 从搜索排名到AI搜索可见性监控 :品牌可见度的下一场战争,已经打响!

    随着AI搜索逐渐取代传统搜索,品牌在AI模型中的曝光度成为新流量入口。文章指出,品牌AI搜索监控能量化品牌在各大AI平台的提及频率、与竞品对比表现及触发关键词,帮助企业优化内容策略。以徕芬品牌为例,通过AIBase平台监测发现其高频曝光数据,说明AI推荐正成为品牌认知新战场。未来3-5年,品牌需通过持续监控主动提升AI可见度,从"被动曝光"转向"主动可见"。

  • 苹果悄然在iOS 26.1中引入新功能:第三方App可以后台备份照片了!

    苹果在iOS 26.1中引入用户期待已久的后台自动备份照片功能,允许第三方应用在后台自动上传图像。此前,Google相册、OneDrive等应用因系统限制只能在应用活动时上传,导致备份中断、体验糟糕。新功能通过PhotoKit框架支持,引入后台资源上传扩展协议,确保应用未活动或设备锁定时也能持续上传。系统会控制功耗和网络访问以保障备份一致性和电池效率。开发者需完成配置扩展目标、处理上传任务等步骤来集成此功能,部分操作需用户明确同意。

今日大家都在搜的词: