首页 > AI头条  > 正文

腾讯混元自主研发ASR语音识别大模型接入ima平台

2025-07-23 08:19 · 来源: AIbase基地

7月22日,腾讯混元宣布其自主研发的ASR(语音识别)大模型正式应用于ima平台,首次在手机App端实现了语音输入功能,为用户带来了“出口成章”的便捷体验。用户现在可以通过语音直接输入问题或记录灵感,无需手动敲击键盘,极大地提升了输入效率。

腾讯混元ASR大模型以其敏锐的听觉和智能的理解能力脱颖而出,在复杂环境下依然能够准确识别语音,每分钟可识别300字,速度比手动输入快4倍,且识别结果更加精准自然。该模型采用业界首个基于双编码器的流式ASR架构,相比传统ASR技术,在语义理解能力上有了显著提升,尤其在中英文混杂等场景中表现更为出色。

微信截图_20250723081854.png

此次ima平台引入的语音输入功能,覆盖了知识库问答、笔记创作等多个应用场景。用户在进行知识库查询或首页问答时,若问题较长,可直接通过语音输入;在撰写笔记时,ima则像一位会听音的笔记小助手,帮助用户进行创作,并能根据旧笔记快捷续写,实现无缝衔接。此外,iOS用户还可以通过添加桌面小组件,实现更快速的提问体验。

腾讯混元团队表示,未来将继续优化ASR大模型,提升方言识别和多语言识别能力,不断扩充支持的语言类型,以满足不同场景下的使用需求。此次语音输入功能的上线,不仅展示了腾讯混元在语音识别领域的技术实力,也为用户带来了更加高效、便捷的输入方式,开启了智能交互的新篇章。

  • 相关推荐
  • 北芯生命坚持自主研发与技术突破,为临床诊疗提供有力技术支撑

    深圳北芯生命科技通过自主研发,在心血管精准诊疗领域取得重大突破。其核心产品包括中国首个自主60MHz高清高速IVUS系统和首个获批的国产FFR系统,填补国内技术空白,改变依赖进口的局面。目前公司已推出11款产品,覆盖五大类别,其FFR系统上市后迅速占据30.6%国内市场份额。北芯构建了完整创新生态,产品广泛应用于国内30个省市的三甲医院,并逐步走向国际市场。未来公司将持续创新,为心血管疾病诊疗提供更智能的解决方案。

  • 既要平台流量,更要自主话语权,外卖大战下半场的突围之道

    2025年外卖平台补贴大战下,餐饮行业面临严峻挑战。商家被迫参与低价竞争,部分茶饮店单笔订单利润不足0.2元,外卖业务月亏损高达45%。平台通过流量分配强制商家参与补贴,同时提高配送费挤压利润空间。历史案例显示过度依赖单一平台将丧失经营自主权,如玩具反斗城因依赖亚马逊最终破产。专家建议商家建立私域流量池和自主配送体系,瑞幸咖啡、麦当劳等通过会员�

  • AI日报:腾讯混元推3D生成大模型Hunyuan3D-PolyGen;钉钉AI表格重磅来袭;阿里推多模态大语言模型HumanOmniV2

    本文介绍了AI领域多项重要进展:1)腾讯推出首个美术3D生成大模型Hunyuan3D-PolyGen,显著提升建模效率;2)阿里发布多模态大模型HumanOmniV2,准确率达69.33%;3)钉钉AI表格实现1小时处理千项任务;4)百度PaddleOCR3.1版本在多语种识别和文档翻译方面升级;5)微软推出Deep Research智能体,自动化研究流程;6)香港理工与OPPO联合开源视频超清框架DLoRAL;7)谷歌开源MCP工具箱简化AI与数据库集成;8)Win11将推出AI动态壁纸功能。这些创新展示了AI在3D生成、多模态理解、办公效率、视觉处理等领域的突破性进展。

  • 全球优质AI语音大模型盘点:Whisper、Gemini Speech

    本文分析了当前主流AI语音大模型的核心优势与应用场景。全球顶尖模型包括:OpenAI Whisper(多语言识别与翻译)、Google Gemini(情感化语音生成)、Meta AudioCraft(音乐创作与风格转换)。国内讯飞星火(方言识别)、阿里通义(电商客服)、百度文心(车载场景)表现突出。技术突破点在于云端协同架构、零样本克隆和情感语音合成。选择模型需考虑语言支持、场景适配、部署

  • 最新AI模型哪里看?查找最佳AI模型平台推荐

    文章介绍了AI领域快速迭代背景下,开发者如何高效追踪最新模型动态。主要渠道包括:1)官方渠道(GitHub、公司官网/博客);2)科技媒体和社区(Twitter、Reddit等);3)专业聚合平台(推荐AIbase模型广场)。重点推荐AIbase平台,其优势在于:实时更新全球最新模型、结构化展示关键信息、支持多维筛选排序、直达相关资源链接。建议开发者善用官方渠道获取源头信息,同时�

  • 九四智能×保险业:大模型联络中心的创新应用与价值体现

    保险业竞争白热化下,传统人工触达模式面临"效率低、成本高、体验差、合规难"四重挑战。九四智能基于领先的大模型语音技术和行业实践,打造"保险业大模型联络中心",通过AI电话、智能短信、APP推送等工具,帮助险企提升客户沟通效率与转化率,降低运营成本和合规风险。该方案已成功应用于大型保险公司,实现客户接听率提升15-20%,续保转化率提升40%以上,新人培训周期缩短60%,同时显著提升合规预警准确率。未来将持续深化AI在核保辅助、理赔勘查等场景的应用,助力保险机构构建智慧化运营体系。

  • “晓妙”产业大模型——AI驱动的产业变革

    7月4日,安徽数智建材研究院在长城工程科技会议上发布"晓秒"产业大模型。该模型由傲林科技投资支持,采用"1+1+N"架构,融合数据、机理和业务模型,实现生产运营全流程实时闭环优化。中国建材集团董事长周育先表示,该模型已在水泥板块试点应用,吨水泥成本降低1%以上,能耗电耗下降2%以上。会议指出,AI落地制造业需突破三大关键:建立数字化体系、夯实数据基础、实现工艺与数据融合。未来将拓展至新能源、钢铁等十余个行业,推动产业智能化升级。

  • TECNO发布全球最薄三折概念机PHANTOM Ultimate G Fold

    TECNO发布PHANTOM Ultimate G Fold概念机,采用创新双屏内折设计,配备9.94英寸柔性大屏,折叠状态下厚度仅11.49mm,展开后最薄处3.49mm,刷新三折手机轻薄纪录。其核心创新在于独特的G型三折结构,通过左右双内折实现屏幕完全内藏保护,并配备外屏保证折叠状态下的常规使用体验。该机采用精密双铰链系统,支持多角度悬停,搭配2000MPa高强度钢铰链和0.3mm超薄钛纤维背板,兼顾强度与轻薄。量产版将搭载高性能芯片、多焦段三摄系统和超5000mAh电池,重新定义旗舰折叠屏体验。

  • 锚定“好用”!诚迈科技重磅发布五大信创产品矩阵,共建自主共赢生态

    7月18日,诚迈科技在南京举办CXC2025信创生态大会,发布五大信创产品矩阵,覆盖党政、企业、教育、医疗等领域。公司联合行业伙伴成立"信创共赢生态联盟",推动产业链协同创新。大会展示了基于鸿蒙操作系统的智能汽车、物联网等解决方案,以及国产化替代方案。多位专家强调自主可控信息技术体系对国家数字经济发展的重要性。诚迈科技表示将持续深耕信创领域,通过"自主可控×高效好用"战略,为各行业提供安全可靠的国产化替代方案。

  • 口令识别码中的“机关”:不当获取好友关系数据是否构成不正当竞争?

    2024-2025年中国互联网平台用户规模持续扩大,用户数据成为核心竞争资源。部分APP通过诱导分享获取第三方平台用户关系链数据,加剧行业竞争。专家指出此类行为涉嫌违反《反不正当竞争法》,通过特殊识别码获取好友关系数据构成不正当竞争。平台用户资源属于营业性资产,受法律保护。诱导分享行为不仅侵犯平台权益,还可能违反个人信息保护法,存在数据收集不透明�

今日大家都在搜的词:

热文

  • 3 天
  • 7天