首页 > 业界 > 关键词  > 语音输入最新资讯  > 正文

AI语音从“输出”到“输入”,资本在用千万美元押注什么?

2025-08-04 14:23 · 稿源: 白鲸出海公众号

7月16日,语音输入创企 Willow Voice 宣布完成420万美元天使融资,由 YC 领投;而就在几天前,6月25日另一家语音输入创企 Wispr Flow 也宣布完成了3000万美元 A 轮融资。此前,我们一直在观察 AI 语音赛道,但能拿到融资的基本都是做语音合成,也就是“输出”。比如赛道头部的 Elev

......

本文由站长之家合作伙伴自媒体作者“白鲸出海公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 海量音色AI赋能,逗哥配音重塑语音创作新体验

    逗哥配音作为领先AI配音平台,以“海量音色+AI赋能”为核心,拥有上千款声音类型,覆盖多语言及商业场景。通过自研大模型韵律技术,实现情感饱满的语音生成,支持影音解说、小说推文等多种需求。平台内置场景化音色模板,新手也能快速制作专业配音,免费功能已满足日常短视频创作。其AI分角功能优化多人角色管理,提升对话内容制作效率。逗哥配音正重塑语音创作边界,成为短视频解说领域首选工具。

  • 中国移动北斗卫星短信业务升级:支持文字+图片+语音

    中国移动宣布北斗短信息服务完成重大升级,新增图片、语音等富媒体功能,文本传输能力显著提升,单条消息可发送40个汉字、接收达10个汉字。Redmi Note 15 Pro+卫星消息版率先支持升级,其他品牌终端也将陆续开启。此次升级在无地面网络信号时仍能通过多种形式传递信息,为户外探险、应急救援等场景提供坚实通信保障,标志着北斗通信正式步入“视听兼具”新时代。

  • MiniMax让AI语音有了新基建

    熟悉MiniMax的人都了解这家公司的调性——不鸣则已,一鸣惊人。 要么选择低调,要么发动技术连招,其发展路径呈现出鲜明的“技术深潜”与“节点式爆发“的双重特征。 十月的最后一周,再次进入MiniMax式技术迭代新周期。MiniMax模型“全家桶”全面向Agent方向进化,基础文本模型M1升级至M2,“专为Agent和代码而生”;视频模型升级至Hailuo2.3,Hailuo Video Agent迭代为“全模态全�

  • 艾语智能完成两轮千万美金融资,开创AI法律服务新模式

    AI法律公司“艾语智能”完成天使轮和Pre-A轮融资,资金将用于“执行×经验”双飞轮技术架构研发与新场景拓展。公司聚焦法律Agent,以结果导向模式服务企业客户,按实际回款收费。首个落地场景为金融小额信贷诉讼,已签约60余家机构,月立案量超万件。团队首创双飞轮框架,结合任务执行与经验沉淀,推动法律流程智能化,未来将布局更复杂法律事务及海外市场。

  • 苹果回应输入法宁死不屈:具备记忆功能与学习机制

    近日苹果自带输入法因体验问题再登热搜,用户集中吐槽其“宁死不屈”的倔强表现:输入部分词汇需反复手动选字,甚至被果粉自嘲“用iPhone后骂人从未赢过”。苹果客服回应称,默认输入法具备记忆功能,用户高频词汇会通过键盘词典实现首字母联想加载。该词典为互联网动态更新,但以常见内容为主,生僻词或诗词可能未被收录。同时补充说明键盘词典会基于用户习惯持续学习优化,初期体验可能不佳,但长期积累后流畅度将显著提升。

  • Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

    Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

  • 脑花科技完成 Pre-A 轮融资,获顶尖资本与产业龙头青睐

    脑花科技(端脑科技)宣布完成数千万元Pre-A+轮融资,由燧融HEROAD领投。公司专注构建分布式AI算力网络,已部署超1万台自研节点设备,覆盖全国多省市。其Cephalon.AI平台任务分发效率提升50%,节点利用率超98%,注册用户达220万,算力交易额突破1500万元。未来将推动“云-边协同”方案,拓展智能医疗、电商等行业应用,并启动全球化布局,致力于让算力如电力般触手可及。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 两大顶级资本罕见联手,光联芯科获光互连赛道最大早期融资

    光联芯科于2025年完成新一轮融资,由两大顶级投资机构领投,成为国内光互连芯片领域规模最大的早期融资之一。该公司专注于芯片间光互连技术,通过光信号替代电信号实现短距互联,有望在传输能耗、带宽密度和延迟等核心指标上实现数量级提升,突破AI算力瓶颈。其独特的深度孵化模式和全链路国产化战略,结合开放生态布局,正推动中国算力底层技术架构的深刻变革。

  • 微信“对方正在输入”说明在干什么:通常意味着对方正在准备回复

    你有没有过这样的经历?发完一条消息,屏幕上突然跳出对方正在输入”。只要你看到跟你聊天的对象出现对方正在输入”,那么恭喜你,证明TA还挺重视你的。 经过实测,如果你跟对方聊天时,对方10秒内打开对

今日大家都在搜的词: