11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
小艺输入法获华为高管余承东高度称赞,支持语音、翻译、拍摄、文本等多种输入方式,识别准确安全。与热门IP联名推出多款高颜值皮肤,提升个性化体验。支持25种方言识别和实时翻译功能,方便跨语言沟通。数据安全严格防护,确保用户隐私。输入高效便捷,兼具实用与趣味性。
AI日报栏目汇总近期AI领域重要进展:腾讯元宝接入DeepSeek V3.1提升智能助手能力;即梦AI推出多帧功能简化视频制作;可灵AI首尾帧功能升级效果提升235%;钉钉与通义实验室联合发布Fun-ASR语音识别大模型;腾讯CodeBuddy IDE国内版公测;Vercel发布AI Gateway简化模型调用;Anthropic整合Claude Code强化企业开发;阿里发布Mobile-Agent-v3突破GUI自动化;Qoder平台革新编程模式;清华团队GUAVA框架实现0.1秒3D化身生成;谷歌搜索新增AI Agent功能;VAST推出Tripo 3.0推动3D内容创作。
7月16日,语音输入创企 Willow Voice 宣布完成420万美元天使融资,由 YC 领投;而就在几天前,6月25日另一家语音输入创企 Wispr Flow 也宣布完成了3000万美元 A 轮融资。 此前,我们一直在观察 AI 语音赛道,但能拿到融资的基本都是做语音合成,也就是“输出”。比如赛道头部的 ElevenLabs,在今年1月份,完成了 C 轮2.5亿美元融资,估值达到30亿美元以上。 但最近的2笔融资,貌似在释�
小米CEO雷军今日通过微博宣布,即将上市的小米YU7将支持车外小爱语音交互。 雷军介绍,小米YU7车外有8个麦克风和1个扬声器,无论在哪个角度,都可以很容易使用语音控车,也可以和小爱同学流畅沟通。 比如,在车外直接让小爱同学打开前备箱。当然,车外唤醒小米同学,需要声纹识别和钥匙的安全验证,避免误操作风险。
岚图汽车宣布,其自主研发的AI语音对话系统计划在2025年上半年发布并应用于新车型。该系统具备快速的车控响应能力,响应时间小于1秒,同时拥有超过98%的唤醒识别率。岚图汽车的座舱AI技术研究目前集中在三个主要方向:深度优化整车智能座舱系统,提供便捷的用户体验;结合deepseek的CoT训练方案,增强系统的思考与分析能力,确保在面对复杂指令时AI能精准响应;基于下一代芯片算力,设计研发新一代离线基于大模型的整体架构,提高系统稳定性,确保在网络不稳定时也能正常工作。
阿里巴巴通义实验室最近开源了一款名为FunClip的视频自动化剪辑工具,专为精准和便捷的视频切片设计。FunClip能够自动识别视频中的中文语音,并允许用户根据语音内容裁剪视频,大大提高了视频编辑的效率。阿里巴巴通过这些开源项目,展示了其在AI技术领域的领导地位和对开放创新的承诺。
AssemblyAI最新研究成果展示了他们的Universal-1模型在多语言环境中的表现,该模型在准确性和鲁棒性方面均取得了行业领先地位。Universal-1比WhisperLarge-v3更准确,比fastWhisper更快,38秒可以处理60分钟音频。值得一提的是,非开源,仅提供API调用。
WhisperKit是一个基于Whisper项目的推理工具包,由Argmax公司推出。它允许在iOS和macOS应用程序中进行语音识别和转录。欲了解更多信息,请访问WhisperKit官方网站。
苹果的iPhone16系列手机将会配备升级版的麦克风。这些改进将显著提高设备对用户声音的敏感度和识别率,从实现更加清晰流畅的语音输入。对于iPhone16系列手机来说,这些改进将带来更好的音频性能和用户体验。
日前,微信输入法iOS、Android双端迎来1.2.2正式版升级,带来春节彩蛋”和多项新功能。升级日志显示,微信输入法iOS1.2.2正式版新增微信发过年好”后可放鞭炮、支持剪贴板和选词粘贴功能、语音输入支持直接说方言。该功能基于互联网,不要求设备在同一个局域网内是比较方便的。