首页 > 见闻 > 关键词  > 百度输入法最新资讯  > 正文

王海峰:百度输入法实现中英混输 语音识别准确率提高2成

2019-07-03 11:05 · 稿源:站长之家

站长之家(ChinaZ.com) 7月3日 消息:百度AI开发者大会还在进行中。继李彦宏宣布百度大脑已向开发者开放 200 多项AI能力之后,百度CTO王海峰带来了全新升级的百度大脑5.0。作为软硬件一体的AI大生产平台,百度大脑5. 0 包括基础层、感知层、认知层、平台层和AI安全五大部分,实现了AI计算、计算架构与应用场景的创新融合。

升级后的百度大脑让语音识别准确率提高了15%-20%。现场,百度语音技术部高级总监高亮展示了百度输入法中英混输技术。他用中英混合的方式说了一段Rap,而这些语句都能被百度输入法准确地识别出来。百度CTO王海峰介绍,这背后是百度大脑流式多级的截断注意力模型,大幅提升语音识别速度。

举报

  • 相关推荐
  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • 百度旗下小度AI眼镜Pro正式开售:售价2299元

    站长之家(ChinaZ.com)11月10日 消息:今日,百度旗下备受瞩目的小度 AI 眼镜 Pro 正式开启发售,售价定为2299元,这一消息迅速吸引了众多科技爱好者和消费者的目光。在外观设计上,小度 AI 眼镜 Pro 提供了波士顿和猫眼两种时尚款式,满足了不同消费者的审美需求。镜片方面,用户既可以选择墨镜款式,也能挑选光致变色镜片,而且支持直接配近视镜片,无需采用夹片设计,为

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • 1024数百场活动致敬鸿蒙开发者,鸿蒙如何与开发者“双向奔赴”

    在1024程序员节之际,华为鸿蒙生态发起"星光不负 码向未来"致敬活动,通过全国超百场开发者交流,展现鸿蒙生态的蓬勃活力。目前HarmonyOS 5终端设备数已突破2300万,上架应用超3万款,鸿蒙游戏超1.2万款,近400款政务应用完成鸿蒙适配。华为每年投入超60亿元激励创新,并启动"鸿蒙天工计划"投入10亿元支持AI生态建设。从HarmonyOS 5到HarmonyOS 6,鸿蒙生态正从"破冰"走向深度融合创新,这离不开千万开发者的智慧与汗水。

  • 百度智能云这项开源,让 DeepSeek-V3.2 推理服务吞吐提升 2 倍

    10月28日,百度智能云联合SGLang社区开源针对DeepSeek-V3.2优化的多token预测(MTP)技术代码。该技术通过批量生成和集中验证机制,使模型解码吞吐量提升超2倍,突破传统自回归解码的序列化瓶颈。此次开源的MTP方案已完成与DeepSeek-V3.2稀疏注意力架构的深度适配,并经过百度内部业务验证,开发者可"开箱即用"获得稳定可靠的推理加速能力。

  • 百度智能云联合昆仑芯、HAMi,落地双模式算力调度方案,提升算力利用率

    百度智能云联合昆仑芯与CNCF开源项目HAMi,推出基于昆仑芯P800的XPU/vXPU双模式算力调度方案。该方案已在金融客户集群落地,支持智能客服、营销辅助等十余类AI业务,兼顾稳定性与灵活性。XPU整卡模式通过拓扑寻优调度保障大规模训练性能,vXPU虚拟化模式以多粒度切分实现单卡多任务,最大化资源利用率。双模式协同让国产算力高效匹配业务需求,同时提供自动化调度与人工调节结合的灵活管理能力。

  • AI日报:美团LongCat-Flash-Omni发布;Qwen3-Max上线深度思考功能;百度“文心”5.0重磅回归

    本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。

  • 百度百科词条总量突破3000万,联合《大学科普》等多机构推出科普专刊

    10月24日,百度百科联合《大学科普》推出“繁星计划”主题专刊,作为该刊2025年第3期面向全国高校发行,助力权威科普传播。同日,繁星计划新增北京林业大学林学院等5家合作机构,扩大行业影响力。该计划自2024年12月启动,已联合10万专家、500家机构共建超100万专业词条,百度百科词条总量突破3000万。通过与权威期刊合作,百度百科旨在为高校学子搭建连接前沿科学与知识普及的桥梁,践行“让知识轻松可及”的使命。

  • AI日报:豆包视频1.0pro fast发布;谷歌Gemini新功能上线;百度推上体体育大模型 2.0

    本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。

  • 开启AI时代品牌可见度新战场:用“GEO指数”赋能你的品牌霸屏!

    在AI搜索时代,品牌曝光不再依赖传统“蓝色链接”,而是取决于能否被AI聊天框(如文心一言、DeepSeek等)直接推荐。文章提出通过AIBase品牌监控服务,运用GEO指数量化品牌在AI大模型中的可见度,帮助品牌从被动等待转为主动抢占推荐位。核心方案包括:建立品牌信息库、监控多平台曝光数据、识别内容缺口,并通过优化官网结构、发布高关联内容、构建知识图谱等行动提升被推荐概率,最终实现从“隐形”到“被AI主动提名”的转型。

今日大家都在搜的词: