首页 > 业界 > 关键词  > Deepgram最新资讯  > 正文

Deepgram推创新文本转语音模型Aura 支持实时文本转语音

2023-12-11 11:19 · 稿源:站长之家

要点:

  • Deepgram推出Aura,一款创新的文本转语音模型,提供比所有语音AI替代品更快速、更高效的人类般对话质量。

  • Aura致力于为实时语音AI代理提供真实的声音,包括及时的回应、在思考时使用自然的语音填充词汇(如“嗯”和“啊”),以及根据对话背景调节语调和情感。

  • Deepgram期望通过Aura成为实时、对话式语音AI代理的完整平台,为开发者提供构建未来高吞吐量、实时AI代理所需的基本构件。

站长之家(ChinaZ.com)12月11日 消息:深瞳公司推出了一款名为Aura的全新文本转语音模型,旨在满足实时语音AI代理的需求。随着大型语言模型(LLMs)的普及,语音交互成为访问LLMs及其解锁体验的主要手段。Aura的推出旨在解决当前语音AI供应商存在的速度、成本、可靠性和对话质量等方面的问题。相较于当前市场上的主流替代品,Aura在早期版本的盲评试中被评为更贴近人类声音,其开发计划也得到了提前扩展。

image.png

官方地址:https://deepgram.com/learn/aura-text-to-speech-api-waitlist

针对语音AI技术的不同应用,Deepgram区分了两个主要领域:高产出和高吞吐量。高产出关注打造完美声音,用于视频游戏或有声读物等项目,强调声音质量。而高吞吐量则着眼于实时对话,如快餐订餐、预约和了解汽车经销商的最新优惠等任务,注重对话流畅性和效率。Deepgram的目标是通过Aura在高吞吐量领域提供高效的文本转语音转换,以实现用户体验的平滑和可靠。

Aura的独特之处在于赋予AI代理更具人类特征的声音,包括及时的回应、在思考时使用自然的语音填充词汇,以及根据对话背景调整语调和情感。早期版本的Aura在盲评试中被评为比其他替代品更贴近人类声音,甚至在某些音频片段中超过了人类演讲者。

多年来,Deepgram一直致力于推动语音识别和口头语言理解技术的可能性。他们的团队不仅发展了能处理对话音频细微差异的新型转换器架构,还在处理各种语言、口音和方言的同时处理了口语中的不流畅和对话中的变化。通过有限约束构建模型,以优化其速度和效率。Deepgram还拥有内部数据标注和数据运营团队,通过构建定制工作流,记录、存储和传输大量音频,并持续扩充其高质量数据库,用于模型训练。

Aura被设计为速度、质量和效率的全能解决方案,旨在成为高质量选项中最快速、快速选项中最高质量的文本转语音模型。Deepgram强调,Aura的发布仅是一个开始,他们期待在与客户和合作伙伴的合作中继续完善和扩展该模型,共同定义AI代理的未来。计划于明年初正式发布,而开发者可以通过加入Aura的等待列表来获取早期体验并提供直接反馈。

举报

  • 相关推荐
  • 陕西一景区介绍标注作者为DeepSeek 工作人员:有版权问题

    近日,陕西渭南的一处景区引发了网友们的热议,原因竟是景区介绍牌上标注的作者是一个颇为特别的名字——“DeepSeek”。 不少游客在看到这个作者名时,都误以为是个外国人的名字,仔细一瞧才发现,这原来是一款人工智能助手的名字。景区工作人员解释说,这块介绍牌是去年摆放的,上面的内容确实是由DeepSeek生成的,主要是对尧头窑进行一个简单的介绍。

  • DeepSeek V4 Lite悄然更新:2000亿小参数性能逼近美国顶流

    虽然春节档DeepSeek V4没有发布,但DeepSeek在2月11日发了一个新模型,被称为DeepSeek V4 Lite,只有2000亿参数,规模比较小。 DeepSeek V4 Lite主要特色是1M上下文,之前网友测试其表现除了超长上下文之外也没太惊艳的地方,毕竟参数规模跟主流的大模型差很多。 然而DeepSeek V4 Lite发布之后一直在悄悄升级,2月27日已经有网友测试发现其性能越来越强大,昨天又升级了一波,Linux Do社区�

  • 逗哥配音:释放语音生产力,让每一句台词都值钱

    在短视频井喷的今天,声音的力量正被重新定义。广州有码科技公司旗下核心产品“逗哥配音”,致力于打造全国富有影响力的短视频AI创作平台。作为海量版权声音的集合地,它集结了700多位头部创作者的独家版权声音,服务超过1000万用户。平台内置超千款发音人及配音员,细分数十种情绪类型,支持50国语言,助力创作者打造出海项目。逗哥配音不仅是一个“文本转语音”工具,更集智能配音、音色转换、AI创作工具于一体,构建一站式音频解决方案。数据显示,用户通过逗哥配音合成的作品次数高达198亿次,单个抖音视频最高点赞量突破444.3万。选择逗哥配音,意味着选择了一个拥有顶级版权库、前沿AI技术以及海量数据验证的创作平台。

  • AI日报:MiniMax公布上市后首份财报;千问开源Qwen3.5小型模型系列;Claude Code官方语音模式上线

    本期AI日报涵盖多项重要动态:MiniMax发布上市后首份财报,展示其AI平台战略进展;阿里通义千问开源Qwen3.5小型模型系列,支持多模态处理,适用于边缘设备;Google NotebookLM上线信息图自定义样式功能,简化知识可视化流程;Claude Code推出语音模式,提升编程协作效率;疑似GPT-5.4细节泄露,或具备超长上下文和状态化能力;Zopia实现多智能体协作自动化视频制作;QM发布2025年AI应用榜,豆包、DeepSeek、元宝等位列前五;DeepSeek V4 Lite凭借2000亿参数展现顶尖性能,成为国产模型新标杆。整体显示AI技术正快速向多模态、轻量化、场景化方向演进。

  • AI日报:多模态大模型DeepSeek V4即将发布;谷歌即将停用Gemini 3 Pro Preview;微软推出AI软件组合

    本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。

  • AI日报:MiniMax发布Expert 2.0与云端助手MaxClaw;DeepSeek V4 细节曝光;肯德基AI 点餐助手接入通义千问

    本期AI日报聚焦多款AI产品动态:MiniMax发布Expert 2.0与云端助手MaxClaw,降低专业AI Agent开发门槛;DeepSeek V4细节曝光,具备万亿参数与原生多模态能力;肯德基接入通义千问推出AI点餐助手“小K”;华强北AI眼镜在美销量暴涨;Perplexity发布通用AI代理Computer,集成多模型协同工作;三星Galaxy S26系列手机AI功能全面升级;三七互娱“小七大模型”深度落地游戏出海等场景。整体呈现AI

  • 微信推出三大新功能:语音、视频通话弹窗支持忽略

    微信近日推出三项实用新功能:一是语音/视频通话可忽略,点击弹窗左侧按钮即可静默挂断,对方不会收到拒绝提示;二是语音消息新增翻译功能,可将语音内容实时转换为所需语言,方便跨语言交流;三是视频通话新增屏幕锁定功能,点击右上角小锁图标可锁定屏幕,避免误触挂断。这些功能正逐步向用户开放,建议尝试体验。

  • 超越速度与画质边界:微星MPG 341CQR QD-OLED X36流光显示器解读

    微星MPG341CQR QD-OLED X36流光显示器搭载第五代Tandem+QD-OLED面板,刷新率高达360Hz,响应时间0.03ms,通过VESA ClearMR 18000认证,动态清晰度达行业顶尖水平。采用RGB条纹子像素布局,解决了文本彩边问题,并具备99% DCI-P3和98% Adobe RGB色域覆盖,ΔE<2,支持DisplayHDR True Black 500。新增AI视觉增强、多种辅助瞄准功能及独家均匀辉度功能,提升游戏与创作体验。同时配备环境光吸收涂层与OLED Care 3.0智能检测技术,增强耐用性。该34英寸超宽曲面显示器首发价6999元,提供三年质保及烧屏保修服务。

  • 突破PCIe 5.0能效边界:忆联AM6D1以DRAMLess架构重塑性能与成本平衡

    忆联推出行业领先的DRAM-Less PCIe 5.0 SSD——AM6D1,通过创新架构与底层算法优化,兼顾性能与成本。该产品采用无独立缓存设计,支持PCIe 5.0 x4与NVMe 2.0标准,凭借主控算法优化与高速闪存的深度协同,实现媲美有缓存旗舰产品的性能表现。实测显示,AM6D1在CDM、FIO等基准测试中顺序读写速度分别达11500MB/s和10900MB/s,4K随机读取性能出色,并在PCMark 10、3DMark等真实负载测试中表现稳定。其低功耗与低发热特性,为轻薄本等空间受限设备提供了理想的存储升级方案。

  • 杰哥不要啊!经典梗改编《在杰难逃》上架Steam:还有坤坤乱入

    流传十余年的经典互联网梗杰哥不要啊”,如今被改编为第一人称恐怖游戏,由Loser Studio打造的《在杰难逃》已在Steam平台上线。 在游戏中玩家将扮演受邀前往杰哥家作客的青少年,本以为只是单纯的聚会,踏入屋内后才发现陷入了精心设计的陷阱。 在这栋充满了不安暗示的房子里,玩家必须一边搜集线索与关键道具,一边利用柜子或阴影处躲避杰哥的追逐。 为了增加游戏

今日大家都在搜的词: