首页 > 动态 > 关键词  > 小米最新资讯  > 正文

开源工具Kaldi之父将出任小米首席语音科学家

2019-11-18 17:25 · 稿源: 蓝鲸TMT

《开源工具Kaldi之父将出任小米首席语音科学家》文章已经归档,不再展示相关内容,编辑建议你查看最新于此相关的内容:开源工具Kaldi之父将出任小米首席语音科学家小米集团创始人雷军在微博宣布,国际语音识别和AI领域专家、语音识别开源工具Kaldi 之父Daniel Povey将出任小米集团

......

本文由站长之家合作伙伴自媒体作者“蓝鲸TMT”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 即构发布云端实时语音识别服务

    ZEGO云端实时语音识别服务针对直播、语聊、在线课堂和会议等场景,提供低延迟(端到端600ms)、高准确率(提升40%)、低成本(节省50%以上)的解决方案。支持30多种语言及方言,适配多厂商接入,具备降噪和回声消除能力。核心应用包括实时字幕和AI观众互动,显著提升用户体验和业务效率,助力企业全球化布局。

  • 小米开源首个原生端到端语音大模型 支持音频重建任务和音频转文本任务

    小米发布首款开源端到端语音大模型Xiaomi-MiMo-Audio,拥有12亿参数,在智能性、情感表达和交互适配方面接近人类水平。该模型最大技术突破在于少样本学习能力,通过创新预训练架构和超一亿小时训练数据,成功突破传统语音模型依赖大规模标注数据的技术瓶颈。基于Transformer架构,支持音频重建和音频转文本等多任务处理。小米已在Huggingface平台发布预训练和指令微调版本,并在Github开源Tokenizer模型,为研究者和开发者提供完整工具链。

  • AI日报:小米开源首个原生端到端语音大模型;通义万相Wan2.2-Animate正式开源;Suno v5即将上线

    AI日报今日聚焦多项技术突破:小米开源首个端到端语音大模型Xiaomi-MiMo-Audio;通义万相推出全新动作生成模型Wan2.2-Animate;Suno即将发布革命性音乐模型v5;生数科技获数亿融资,视频生成技术商业化加速。同时关注OpenAI修复ChatGPT安全漏洞,谷歌将Gemini集成至Chrome浏览器,Luma AI发布支持16位色的Ray3视频生成模型,法国Mistral推出开源推理模型Magistral Small 1.2,Notion发布AI智能体,腾讯混元3D Studio提升3D创作效率。

  • 中国开源:正以蓬勃之姿强势崛起

    开源软件正重塑全球软件产业格局,打破技术壁垒,降低研发成本。国内企业通过开源社区协作,快速积累技术,加速产品迭代,提升全球竞争力。以麒麟软件为例,其主导的openKylin项目在RISC-V架构操作系统领域取得突破,获CCF科技奖。国产操作系统基于Linux已形成丰富生态,麒麟开发者对Linux内核贡献居全球华人首位。中国开源力量正以更自信姿态参与全球生态,为世界软件发展贡献智慧。

  • 微博CEO称iOS 26微信语音没声音 网友同样中招 以为手机坏了

    微博CEO王高飞反映,iOS 26 Beta 1更新后微信语音通话首次接通无声音,需挂断重拨。多名网友反馈相同问题,甚至怀疑手机故障。微博智搜称,这是Beta系统的兼容性缺陷,已提供临时解决方案。iOS 26.1 Beta新增Apple Intelligence多语言支持及AirPods实时翻译功能,电话应用键盘采用全新液态玻璃设计。

  • 开源鸿蒙技术大会2025圆满举办,凝聚开源力量勾勒万物智联新未来

    2025年9月27日,开源鸿蒙技术大会在长沙国际会议中心召开。大会由开源鸿蒙项目群技术指导委员会主办,华为承办,多家企业及高校协同支持。会议汇聚了行业专家、开发者及生态伙伴,展示了鸿蒙在技术创新、生态建设及人才培养方面的成果,并发布开源鸿蒙6.0版本,提升系统性能与开发效率。大会聚焦智能化发展,探讨操作系统在数字经济的核心价值,推动产业协同与生态共建。长沙市政府表示将依托鸿蒙生态,加速数字经济发展,共同构建万物智联的坚实底座。

  • 同频共振!漫步者携手开源鸿蒙、星闪重塑无线聆听新体验

    2025年9月,国际星闪联盟在上海举办技术盛会,聚焦星闪技术在音频领域的商用落地。深圳漫步者作为音频生态核心伙伴,依托30年声学积淀,与星闪联盟、开源鸿蒙等深化合作,通过星闪技术实现12Mbps高速传输(蓝牙6倍)、250微秒超低时延,显著提升无线音频体验。双方将共同推动“技术+终端”产业联动,结合AI能力实现实时降噪、空间音频等智能交互,为开源鸿蒙生态用户打造“感知即响应”的下一代音频解决方案。

  • 共建鸿蒙新生态,奥思维亮相开源鸿蒙技术大会

    9月27日,开源鸿蒙技术大会2025在长沙召开。大会展示了鸿蒙在技术创新、生态建设等领域的成果,并发布鸿蒙6.0版本,在UI组件、窗口能力等方面实现突破。OSWare受邀分享鸿蒙兼容Linux应用生态方案,提出通过容器技术打通生态壁垒。长沙市政府表示将借助大会契机,推动技术应用与产业协同,共建开源鸿蒙生态红利。华为等代表回顾鸿蒙五年发展成就,终端数量超1700万,应用超3万。基金会强调开源是创新核心引擎,未来将持续助力技术深化与产业落地。

  • 从数字工具到效率员工,AI员工赋能企业营销服务生产力全面提升!多款AI工具口碑推荐,用AI驱动新增长!

    如今,AI赋能业务已非遥不可及,而是切实帮助企业降本增效的新方案。文章以获客、销售、服务、办公四大场景为例,说明AI如何替代重复性工作:营销人员可借助AI工具快速生成高质量素材;销售可将客户跟进、资料更新等琐事交给AI,专注高价值沟通;售后AI能24小时响应基础问题,提升服务效率;办公场景中,AI还能辅助招聘筛选、邮件撰写等日常任务。通过引入具备理解、推理、执行能力的智能工具,企业能以更少人力、更高效率实现业务优化,未来率先布局AI的企业将更具竞争优势。

  • GEO排名查询工具完全指南:AI搜索时代的排名优化实战

    随着ChatGPT等AI搜索引擎崛起,传统SEO正经历革命性变革。GEO应运而生,成为内容创作者必备新技能。AI搜索直接生成答案而非链接列表,这意味着:内容需被AI引用才能获得曝光;排名机制重构,更看重内容权威性和相关性;需同时优化多个AI平台表现。专业GEO工具能批量监控多平台表现,追踪内容在AI中的引用情况,通过历史数据分析排名趋势,帮助制定有效优化策略。

今日大家都在搜的词: