首页 > 业界 > 关键词  > ElevenLabs最新资讯  > 正文

ElevenLabs发布配音API 允许开发者在产品中添加音频或视频翻译功能

2024-05-15 09:15 · 稿源:站长之家

站长之家(ChinaZ.com)5月15日 消息:ElevenLabs近日发布了配音API,允许开发者在其产品中添加音频或视频翻译功能。利用该API,开发者可以将任意音频或视频翻译成29种语言,并且保留原始发言者声音的独特特征。为帮助开发者快速上手,ElevenLabs提供了Python教程和API参考,让他们可以轻松将API整合到主要编程语言中。

QQ截图20240515091112.png

此前,ElevenLabs还发布了一款名为ElevenLabs Music的文本生成歌曲产品。该产品在音乐的多个方面表现出色,包括节奏感、和声、乐器搭配、情感表达、创意性以及风格的多样性,与领先产品Suno和Udio相媲美。其中,ElevenLabs Music在人声独唱部分表现出优势,其清晰度、拟人化和乐器融合度超过了竞争对手,得益于ElevenLabs在语音克隆领域的专业背景和海量语音数据积累。

ElevenLabs Music还展示了通过文本描述生成的多首音乐,如《伤透我的心》和《我的爱》,展示了其在不同音乐风格上的创作能力。

除了配音API和ElevenLabs Music外,ElevenLabs的主要产品还包括语音克隆、文本转语音和AI配音等解决方案。语音克隆服务允许用户上传样本音频,生成与原声相似的音频;文本转语音支持29种语言、120种不同类型的语音输出;而AI配音则提供了端到端的高保真音频解决方案,针对电影和长音频领域。

此外,ElevenLabs还提供了一个语音库,允许用户分享自己生成的音频或声音,并从中获得报酬。未来,通过ElevenLabs Music生成的音乐也可以通过该平台进行分享,为普通人实现成为“歌手”的梦想提供了新的途径,同时也为专业音乐人提供了创作灵感。

文档:https://elevenlabs.io/docs/api-reference/create-dub

示例:https://github.com/elevenlabs/elevenlabs-examples/tree/main/examples/dubbing/e2e-example

举报

  • 相关推荐
  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 高效触达每一步 三星Galaxy S25系列让AI更懂你

    三星Galaxy S25系列通过深度整合Galaxy AI,重新定义智能手机体验。AI助手Bixby具备多模态交互能力,可理解自然语言指令、调用多应用协同完成导航等复杂任务,并支持图片解析生成摘要。实时简报整合天气、日程等关键信息,AI多截图实现智能翻译与GIF制作。影像创作方面,生成式编辑工具可一键优化构图,音频橡皮擦智能降噪,智绘人像生成艺术风格头像。AI赋能的智能拖放打破应用边界,实现跨应用信息流转。该系列以全场景AI体验提升生活效率与创作自由度。

  • 科普 | 读懂HBM和DRAM,才懂AI算力未来

    在AI算力需求激增的背景下,存储芯片成为决定计算性能的关键。文章重点分析了三大易失性存储技术:SRAM凭借高速读写特性在CPU缓存中不可替代;DRAM作为数字世界的“主内存”,在容量与速度间实现平衡;HBM则通过3D堆叠架构革命性提升带宽,突破AI训练中的“内存墙”瓶颈。当前HBM需求爆发式增长,预计2025年市场规模将达340亿美元。中国企业在DRAM领域逐步突破,并开始布局HBM技术,正通过持续技术积累提升在全球半导体生态中的地位。

  • IBM翟峰:携手乌镇峰会共建AI生态,以开源开放解锁数智生产力

    2025年世界互联网大会乌镇峰会于11月6日至9日在浙江乌镇举行,聚焦“共建开放合作、安全普惠的数智未来”主题,探讨人工智能、数据治理等前沿议题。IBM大中华区技术专家翟峰参与人工智能模型论坛,强调AI是企业竞争关键,开源开放创新受业界青睐。IBM通过企业级AI平台watsonx、开源模型Granite及智能体解决方案,助力企业构建定制化AI能力,推动数字化转型。IBM致力于深耕中国市场,携手合作伙伴共促AI技术发展与产业升级。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

  • AI搜索时代,品牌流量被“隐形”?AIBase让你精准掌控品牌AI搜索监控

    随着用户习惯向豆包、文心一言等AI助手提问,品牌竞争已从传统搜索引擎转向AI生成答案的“主动提及名单”。AI时代品牌面临三大痛点:内容难被AI推荐、品牌定位被AI误读、竞品提及率远超自身。AIBase推出品牌监控服务,通过全平台覆盖、精准解析品牌画像、GEO指数量化三大核心能力,构建“AI认知透视体系”,帮助品牌实现从“添加-分析-优化”的闭环管理,让复杂AI推荐逻辑变得清晰可操作,成为抢占用户心智的关键工具。

  • 三星Galaxy Z Fold7以创新AI体验实现全场景“一步智联”

    三星Galaxy Z Fold7通过Galaxy AI与多模态技术深度融合,重新定义智能手机价值。其极致轻薄折叠设计结合8英寸沉浸屏,搭载升级版Bixby实现语音、文本、视觉的智能交互,支持多任务并行处理。"即圈即搜"简化信息获取,AI助手能转录音频、生成摘要、规划行程,并具备专业影像编辑能力。从办公到生活场景,该设备以直观操作提升效率,成为用户可靠的智慧伴侣。

  • 无万卡,不VLA:元戎启行与阿里云的“想法”和“解法”

    1980年代汉斯·莫拉维克提出人工智能悖论:计算机在逻辑推理等高级智能活动中易超越人类,但实现儿童般的感知与常识认知却极困难。智能驾驶的核心挑战在于让AI理解物理世界并进行因果推理。视觉-语言-行动模型通过融合多模态数据,使系统具备推理驾驶能力,推动行业迈向L5完全自动驾驶。面对VLA模型的数据处理、训练效率和成本挑战,阿里云等超级AI云提供全栈解决方案,从算力基础设施到开源生态,加速技术迭代与商业化落地。

  • 【火柴AI必看】如何利用FB高效找客户:实战攻略全解析

    本文介绍在Facebook高效寻找客户的五大策略:明确目标客户画像,优化账号资料与内容,精准投放广告,积极互动建立关系,提供优质服务促成合作。强调持续优化策略才能在激烈市场中脱颖而出,助力业务拓展。

今日大家都在搜的词: