长音频

人工智能公司ElevenLabs推出了名为Projects的长篇音频生成和编辑平台。该平台汇集了公司在长篇语音合成、音频调教和并行音频生成等领域的研究成果，使创作者、出版商和独立作者能够在几分钟内为整个对话段落、新闻文章甚至有声书生成配音，全部在一个工作流程中完成。该产品简单高效的工作流程和强大的语音生成能力，令ElevenLabs在语音合成领域处于领先地位。...

特别声明：本页面标签名称与页面内容，系网站系统为资讯内容分类自动生成，仅提供资讯内容索引使用，旨在方便用户索引相关资讯报道。如标签名称涉及商标信息，请访问商标品牌官方了解详情，请勿以本站标签页面内容为参考信息，本站与可能出现的商标名称信息不存在任何关联关系，对本页面内容所引致的错误、不确或遗漏，概不负任何法律责任。站长之家将尽力确保所提供信息的准确性及可靠性，但不保证有关资料的准确性及可靠性，读者在使用前请进一步核实，并对任何自主决定的行为负责。任何单位或个人认为本页面内容可能涉嫌侵犯其知识产权或存在不实内容时，可及时向站长之家提出书面权利通知或不实情况说明，并提权属证明及详细侵权或不实情况证明（点击查看反馈联系地址）。本网站在收到上述反馈文件后，将会依法依规核实信息，第一时间沟通删除相关内容或断开相关链接。

搜索引擎对“音频”的分析

语言：

简体中文
制作：

大绿

网友给“音频”贴的标签

产品
文件
媒体
平台
功能
内容
设备
数据
媒介
应用
文件类型
信息
软件
工具
数据类型
载体
接口
内容形式
作品

网络媒体对“长音频”描述

TME持续发力的战略领域

“文学+音频”的新故事

国内“知识+娱乐”的综合体之一

国际主流流媒体重要的战略布局之一

在线漫画的主战场之一

在线音乐的一个主战场

腾讯音乐2020年的战略方向之一

腾讯音乐的下一个战场

用户碎片化时间内的数据化生活载体

腾讯音乐目前乃至未来一项重要的布局

海外流媒体公司

支撑腾讯音乐的核心盈利单元

腾讯音乐未来战略

未来TME持续发力的战略领域

主App中的一个内嵌功能

腾讯音乐娱乐集团

搜索引擎对“长音频”的分析

内容形态：

原创文学内容
月活用户渗透率：

4.6%
类型：

亲子教育
完播率：

20% - 30% 之间

与“长音频”的相关热搜词：

相关“长音频” 的资讯740篇

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
ElevenLabs推出长音频生成平台Projects 可将书籍变成有声读物

人工智能公司ElevenLabs推出了名为Projects的长篇音频生成和编辑平台。该平台汇集了公司在长篇语音合成、音频调教和并行音频生成等领域的研究成果，使创作者、出版商和独立作者能够在几分钟内为整个对话段落、新闻文章甚至有声书生成配音，全部在一个工作流程中完成。该产品简单高效的工作流程和强大的语音生成能力，令ElevenLabs在语音合成领域处于领先地位。

Projects
睡眠人格测试！酷狗长音频X小信心理因人制宜治愈失眠

良好睡眠，健康同行...为了打破当今都市人“晚上睡不好，白天睡不醒”的恶性循环，治愈失眠人群的深夜时间，酷狗长音频联合专业心理品牌小信心理在今年世界睡眠日，特别策划推出睡眠人格测试 —— 设置数十个与睡眠习惯、工作生活密切相关的选择题，通过用户选择分析每个人的睡眠人格，匹配 “白鸽”“蜂鸟”“夜莺”等极具代表性的动物形象，精准又巧妙地说明测试结果......

酷狗世界睡眠日失眠
荐平台在亏，主播哭穷，长音频无人赚钱？

先说一个常识:判断任何生态是否繁荣，是否是个好生态，核心指标一方面在于生态平台本身是否有广阔的空间与健康的循环，另一方面则在于栖息于生态上的“居民”是否富足，能否给生态提供源源不断的活力。

音频电台主播
长音频新物种“懒人畅听”，腾讯音乐的新想象

4月23日，腾讯音乐娱乐集团（TME）举办长音频品牌升级发布会，宣布旗下酷我畅听与懒人听书合并升级为全新品牌“懒人畅听“，在发布会上，TME披露，截至2020年底，其长音频业务月活跃用户数(MAU)已经破1亿。

腾讯音乐音频
荐长音频群雄并立，“耳朵经济”盛世存危

作为国内规模最大的互联网音频分享平台，上线 7 年的喜马拉雅已收获了 6 亿多用户。上个月，喜马拉雅推出了"买 1 得13"的联合会员促销活动，这个月初又推出了扶持纯音乐人的喜乐计划，可谓动作频频。

音频市场长音频喜马拉雅
字节跳动推出“番茄畅听”长音频App

近日，字节跳动推出了一款名为“番茄畅听”的长音频App，其Slogan采用了番茄小说App的“免费好书，尽在番茄”。该产品是将番茄小说中的海量正版小说，以音频的形式播放出来，同时采用了AI真人主播的声音。据企查查显示，“番茄畅听”的开发者为北京臻鼎科技有限公司，疑似实际控制人为字节跳动全球CEO张一鸣。

字节跳动 App 番茄畅听
腾讯音乐娱乐集团推出长音频新产品——“酷我畅听”

腾讯音乐娱乐集团(TME)首次正式发布长音频战略，同时重磅推出长音频新产品——“酷我畅听”。该产品的推出标志着TME长音频布局取得阶段性成果，已进入全音频“声”态发展新阶段。CEO彭迦信表示：长音频将是未来TME持续发力的战略领域。

腾讯音乐酷我畅听
阅文集团与腾讯音乐战略合作，拓展长音频有声作品市场

3月18日消息，阅文集团宣布，公司与腾讯音乐娱乐集团（TME）达成战略合作，将共同开拓长音频领域有声作品市场。合作内容显示，阅文将授权TME把阅文平台上的文学作品制作为长音频有声读物，双方可以在各自平台上向全球发行这些有声作品。

阅文集团腾讯音乐
IP+时代：酷我音乐的“长音频”新想象

来源：丁道师微信公众号即将过去的 2019 年，对于中国在线音乐行业来说是极为特殊的一年。一方面，随着5G、AI、大数据等创新技术不断渗透到音乐行业的各个领域，开始加速赋能产业变革升级，我们的行业迎来了喜人的发展前景;另外一方面，我国在线音乐用户规模增速已经开始放缓，据CNNIC数据显示，截止今年二季度用户达6. 08 亿，较 2018 年底仅增长 3229 万，人口红利已经见顶，行业的高速发展不再，亟需转变到高效发展的阶段。面对

酷我音乐
酷我音乐现象级IP《榜样阅读》创新开辟长音频领域新路径

随着移动互联网高速跃进，在线音频领域也得到迅猛发展。据艾媒数据显示，我国在线音频行业用户规模将达到5.42亿。面对亿级蓝海各个平台也纷纷入局，行业极速发展带来巨大收益的同时，也面临风格、内容同质化的困顿。与此同时，作为在线数字音乐平台先驱的酷我音乐，潜心创作并推出《榜样阅读》，一档以“明星+阅读+公益”的创新节目成功“出圈”，全网20亿播放缔造行业又一现象级IP，为不少行业同仁提供了更加新颖、可行的发展路径

酷我音乐
“百亿声机”计划发布，腾讯音乐娱乐集团加大长音频收益+流量支持

12 月 3 日，腾讯音乐娱乐集团旗下酷我音乐发布“百亿声机”全领域长音频募集计划。该计划面向图文、自媒体、播客、音乐及视频创作者推出，将以百亿资源+资金扶持长音频内容创作，推动优质内容商业化。这一举动标志着腾讯音乐娱乐集团加码长音频，以多元化内容体系、大体量扶持资源，持续释放全领域音频内容的核心价值。提供百亿资源+资金，加大运营扶持力度为吸引创作者入驻、促进新兴创作者的迅速成长，“百亿声机”计划拟投?

腾讯音乐
啪啪引入长音频，刚上线网页版，支持上传不限时长但限文件大小的音频

啪啪今天正式上线了网页版，网页版和移动端一样都能浏览关注对象的图片并收听音频（更正：网页版没有消息流，只能看自己的发布内容）。不同的是移动端的音频录制最多支持 6 分钟，而从网页版可上传不限时长但限文件大小（128M）的音频。

啪啪语音应用
Harmonai：一个开源的生成音频工具让每个人都可以轻松制作音乐

Harmonai，由StabilityAILab支持的开源项目，致力于让音乐制作变得更加容易和有趣。该模型利用先进的AI算法，可以生成定制的无限音乐库，为用户提供高品质、创新性的音乐资源，让用户可以轻松地创作多元化的音乐作品。声音设计:为视频游戏、电影或多媒体项目设计独特的音效。

Harmonai 音乐
耳机品牌水月雨首款手机官宣4月25日发布：3.5mm、4.4mm双音频接口

近日，耳机品牌水月雨公布了旗下首款手机，MIAD01的真机照片和部分配置介绍，并表示该机将于4月25日发布。根据官方介绍，这款手机定位为5GHi-Fi移动音频设备，主打音乐功能，提供有3.5mm和4.4mm双耳机孔，能够当做Hi-Fi播放器，并且更轻薄。该手机于今年1月份通过了3C认证，认证产品名称为5G数字移动电话机”，支持支5V/2A的10W充电，不过水月雨研发总监曾表示充电功率会更高。

水月雨手机 5G音频设备 Hi-Fi播放器
闪耀HKTDC与NAB，maono闪克展现中国音频品牌的实力与魅力

2024年4月，全球电子产业迎来了两大瞩目盛事。为期多日的香港春季电子产品展圆满落幕，作为亚洲最大的电子展之一，它已成功举办了20届，汇聚了全球创新电子科技及产品，为业界带来了前所未有的科技盛宴。maono闪克将不断提升研发实力和市场竞争力，以其创新的精神，为全球用户提供更加优质的音频产品和服务，赢得更多用户的信赖和支持。
多模态语言模型Reka Core：可分析图片、视频、音频评测得分与GPT-4接近

RekaAI近日宣布推出其最新力作——RekaCore，这是一款前沿的多模态语言模型，拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频，评测得分与GPT-4和Gemini-Ultra接近。通过Edge、Flash和Core等系列模型的全面支持，Reka已经准备好迎接更广泛的挑战，展望未来，我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。

RekaCore AI头条
Hand Talk:利用AI自动将文本和音频翻译成手语

在帮助听障人士获取信息方面，HandTalk应用的开发无疑是一项重要的创新。这款应用由人工智能驱动，能够自动将文本和音频翻译成美国手语和巴西手语，为全球约4.66亿聋人和重听人士提供了一个融入社会的新途径。该平台自在巴西推出HandTalk插件以来，已翻译了近20亿个单词，这一数字足以证明其在全球范围内的影响力和重要性。

AI 翻译 AI头条
AI语音识别工具Universal-1：38秒可以处理60分钟音频比fast Whisper更快

AssemblyAI最新研究成果展示了他们的Universal-1模型在多语言环境中的表现，该模型在准确性和鲁棒性方面均取得了行业领先地位。Universal-1比WhisperLarge-v3更准确，比fastWhisper更快，38秒可以处理60分钟音频。值得一提的是，非开源，仅提供API调用。

Universal-1 Whisper AI头条
Stability AI发布音频模型 Stable Audio2.0:支持生成多种类型音乐时长达3分钟

著名开源大模型平台Stability.ai在官网正式发布了音频模型StableAudio2.0。这一版本支持用户通过文本或音频生成多种类型的高质量音乐，时长可达3分钟44.1kHz。随着Stability.ai不断推出新功能和技术，用户可以期待更多高质量、多样化的音乐生成体验。

StableAudio StableAudio2.0 AI头条
Skeleton Fingers官网体验入口 AI音频转录工具在线使用地址

SkeletonFingers是一款基于AI技术的网页音频转录产品。它可以直接在浏览器中将音频链接、上传的音频文件或语音录制转换为文字。SkeletonFingers产品特色音频链接转录本地音频文件转录语音录制转录导出文本想要了解更多关于SkeletonFingers的信息以及开始音频转录之旅，请访问SkeletonFingers官网。

SkeletonFingers
EMAGE官网体验入口 AI手势生成音频手势建模软件下载地址

EMAGE是一种统一的整体共话手势生成模型，通过表情丰富的掩蔽音频手势建模来生成自然的手势动作。它可以从音频输入中捕捉语音和韵律信息，并生成相应的身体姿势和手势动作序列。EMAGE能够生成高度动态和表现力丰富的手势，从而增强虚拟人物的互动体验。点击前往EMAGE官网体验入口谁可以从EMAGE中受益？EMAGE适用于虚拟人物动画、人机交互系统、虚拟助手等领域的用户。�

EMAGE
EMAGE：上传音频就能生成全身动作包括头部、嘴型、身体运动

多所知名大学和研究机构的研究人员共同提出了EMAGE框架，旨在从音频和掩码手势生成全身人类手势。EMAGE技术能实现输入音频生成全身动作，包括头部、嘴型、身体、手部和整体运动，跟之前Meta的audio2photoreal很像。研究团队表示，他们的代码和数据集已经公开提供，供学术和工业界使用。

EMAGE AI头条
Media.io官网体验入口 AI视频音频编辑工具在线使用地址

Media.io是一个在线平台，提供一系列便携式的AI工具，用于视频、音频和图像编辑。它提供了视频卡通化、AI头像生成器、图像增强器和水印去除器等功能。要了解更多关于Media.io的信息，并体验其丰富的编辑功能，请访问Media.io官方网站。

Media.io
AniPortrait官网体验入口腾讯AI音频驱动人脸动画生成工具免费使用地址

AniPortrait是一个根据音频和图像输入生成会说话、唱歌的动态视频的项目。它能够根据音频和静态人脸图片生成逼真的人脸动画，口型保持一致。想要了解更多关于AniPortrait的信息并开始体验音频驱动人脸动画生成工具，请访问AniPortrait官方网站。

AniPortrait
耳机革命！高通发布第三代S3、S5音频平台：AI性能提升超50倍

高通今日推出两款全新的先进音频平台第三代高通S3音频平台和第三代高通S5音频平台。两大平台分别将面向中端和高端层级耳塞、耳机和音箱提升无线音频体验。这将为高端耳塞、耳机和音箱带来更加出色的音频体验。

高通音频平台耳机
宣称超过XTTS！VoiceCraft：一个支持克隆语音及修改原始音频文本的语音模型

一款名为VoiceCraft的语音模型引起了业界的广泛关注。该模型的性能已经超过了XTTS，这无疑为AI音频处理领域带来了新的突破。虽然目前还没有详细的试用报告出炉，但从已经公开的演示效果来看，VoiceCraft的表现确实令人印象深刻，显示出了巨大的潜力。

VoiceCraft 语音克隆 AI头条
价格砍半只要459元！小米MIJIA智能音频眼镜悦享版官宣

今天上午小米正式官宣了全新的智能眼镜MIJIA智能音频眼镜悦享版。新品将于3月27日上午10点开启众筹，价格只要459元，对比之前的899元几乎砍半，这个价格会让更多用户愿意尝试。镜腿双侧设计有30mm触控区，支持盲操。

小米智能眼镜众筹
499元小米蓝牙音箱开售：自研计算音频、澎湃智联

今日上午10:00，小米蓝牙音箱将正式开售，首发到手价499元。ID设计上，小米蓝牙音箱机身采用编制网布，机身底部为减震软胶，保证了户外抗磨耐用，外层包覆疏水涂层，支持IP67防尘防水。小米蓝牙音箱内置4800mAh电池，满电状态支持17小时播放，支持Type-C22.5W快充及反向充电，户外可作为充电宝应急使用。

小米蓝牙音箱户外音箱 IP67防水
阿里推声画同步框架EMO 1张图片加音频即可生成对口型视频

阿里巴巴智能计算研究所提出了一种新的生成式框架EMO，只需输入图片和音频即可生成具有表现力的视频视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配，但也可能成为造假的利器，因此一些名人可能需要警惕了。需要注意的是，该框架目前仅用于学术研究和效果演示有待进一步优化和扩展其应用范围。

EMO AI头条
Pika推出Lip Sync功能支持视频人物嘴部动画和音频同步

创新视频生成工具Pika最近推出了一项名为LipSync的新功能。这项功能旨在帮助用户在生成视频中实现嘴部动画和音频的同步，从提供更加生动和逼真的视频体验。Pika的这些功能，无论是新推出的LipSync是之前的视频画面扩充和风格调整，都极大地增强了用户的视频创作能力，使得他们可以更轻松地制作出生动、有趣、富有创意的视频。

Pika AI头条

热文

3 天
7天

长音频