首页 > 业界 > 关键词  > AI语音生成最新资讯  > 正文

超越OpenAI、拿下全球双料,“AI吴彦祖”背后大模型SOTA了!

2025-05-16 13:52 · 稿源: 量子位公众号

超越OpenAI!国产大模型突袭,AI语音生成天花板被重新定义了。MiniMax最新发布Speech-02,同时拿下Artificial Analysis Speech Arena和Hugging Face TTS Arena两项全球权威语音基准测评第一!而且还是榜单前十名中唯一的国产玩家。要知道,这俩榜首长期被OpenAI、ElevenLabs占据,前

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 豆包语音合成模型 2.0 重磅升级,语义理解 + 情感演绎双突破

    10月16日,火山引擎升级豆包语音合成模型2.0与声音复刻模型2.0。新模型基于大语言模型架构,具备深度语义理解能力,实现从文本朗读到情感表达的进化。对话式合成支持多轮交互,声音复刻仅需5秒即可还原音色。针对教育场景优化,复杂公式符号朗读准确率达90%,覆盖数学、化学等全学科。目前模型已在火山引擎语音平台上线,为OPPO、Keep等客户提供多场景语音服务。

  • 华为FreeClip 2耳夹耳机正式开售:售价1299元 搭载NPU AI处理器

    华为FreeClip 2耳夹耳机10月20日开售,售价1299元。预售1小时销量破8万台,市场热度高。性能方面搭载自研低功耗芯片与NPU+AI处理器,算力提升10倍;配备超澎湃双引擎单元,响度与低频动力均翻倍。支持L2HC高清音频编码,音质清晰。新增鸿蒙AI耳边助手,支持智能播报、翻译等功能。设计采用亲肤液态材质与C形桥结构,单耳重5.1克,佩戴舒适且具备IP57防护。续航方面单次使用9小时,配合充电仓总续航达38小时,充电10分钟可用3小时。预计2025年底将升级星闪音频体验。

  • 声网与Oopz达成战略合作 共同打造游戏语音场景AI降噪极致体验

    游戏语音头部平台Oopz与声网达成战略合作,聚焦游戏开黑场景中的噪音问题。双方将结合AI降噪技术,针对复杂多变噪音环境,解决降噪不彻底、过度降噪等痛点,提升玩家沉浸式开黑体验。未来合作将覆盖连麦降噪、环境音消除等方向,优化主播端功能,共同打造更稳定流畅的语音解决方案。

  • AI日报:腾讯发布全新ima2.0;微软发布 Copilot 一系列重磅更新;阿里夸克AI眼镜开启预售

    本文汇总近期AI领域重要动态:月之暗面再获数亿美元融资,显示资本对国产大模型的信心;Anthropic为Claude推出记忆功能,兼顾个性化与隐私保护;中科大与字节发布MoGA长视频生成模型,实现分钟级高质量生成;腾讯ima2.0升级任务模式,可自主拆解复杂流程;阿里夸克AI眼镜开启预售,融合拍摄与智能功能;微软Copilot新增群聊、记忆与Edge AI模式;Opera推出深度研究代理ODRA提升�

  • AI日报:微软发布首款自研图像生成模型 MAI-Image-1;百度世界大会时间公布;AI大牛开源nanochat教学工具

    微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。

  • AI日报:视觉中国与多家大模型公司达成合作;OpenAI紧急暂停Sora生成已故名人;谷歌推出Gemini地图数据集成工具

    视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。

  • 客服回应iPhone通话语音隔离:是“语音突显”功能

    今日,一则关于iPhone通话降噪的讨论登上微博热搜,多位网友实测称开启特定功能后,即便身处嘈杂环境通话,对方也几乎听不到背景噪音。对此,苹果官方客服回应称,该功能实际为iOS15及以上系统内置的“语音突显”模式,需用户手动开启后方可生效。

  • REDMI电视X 2026今晚发布!REDMI首款高阶分区Mini LED电视

    小米10月23日宣布,Redmi电视X 2026系列新品今晚发布,这是Redmi首款高端分区Mini LED电视。相比传统液晶,Mini LED控光更精细,画面明暗对比度高,无烧屏风险,色彩还原更真实。85英寸版本官方定价4799元,补贴后3839.2元,配备640分区、1200nits峰值亮度,支持4K/144Hz及VRR可变刷新率。虽属入门级Mini LED,但相比普通液晶提升显著,适合普通消费者,将推动Mini LED普及。今晚还将发布全新投影仪产品。

  • 1299元 华为FreeClip 2耳夹耳机预售卖爆:1小时总量突破80000台

    华为FreeClip 2耳夹耳机10月14日开启预售,20日正式开售,售价1299元。预售1小时销量突破8万台。提供丹宁蓝、摩登黑、羽纱白三色,采用玲珑方盒设计。耳机采用亲肤液态材质,柔软度提升25%,单耳仅重5.1克,支持IP57防尘防水。搭载自研超澎湃双引擎单元,响度和低音动力均提升100%,并配备第三代音频芯片及NPU AI处理器,算力提升10倍。支持实时动态降噪、三麦克风通话降噪、高清空间音频及鸿蒙AI助手。单耳续航9小时,整机达38小时。

  • VITA平台赋能AI办公,沸蛇AI语音鼠标提升办公效率

    云决科技推出VITA一站式AI办公平台,结合自研AI语音鼠标,通过软硬件协同创新提升企业效率。该平台集成DeepSeek等大模型,用户无需切换工具,语音即可调用文字处理、数据分析、创意设计等多元功能,实现会议纪要生成、PPT自动制作、视频一键合成等操作,节省80%工作时间。针对教育、IT、行政等不同行业提供专属解决方案,整合100多个AI应用场景和200多种模板,持续优化产品功能,致力于成为职场人士提升效率的智能助手。

今日大家都在搜的词: