首页 > 业界 > 关键词  > Spotify最新资讯  > 正文

Spotify CEO称将引入多个AI技术的新功能

2023-07-26 13:49 · 稿源:站长之家

站长之家(ChinaZ.com)7月26日 消息:在第二季度财报电话会议上,Spotify的首席执行官Daniel Ek透露了该流媒体服务可能引入额外的AI功能的几种方式。Ek谈到了AI如何用于创建更个性化的体验,总结播客和生成广告。

Spotify

今年早些时候,该公司推出了一个DJ功能,它可以提供一个精心挑选的音乐选择,以及基于AI的关于你喜欢的歌曲和艺术家的口头评论。Ek表示,消费者可以期待在未来看到类似的基于AI的功能,旨在为Spotify平台上的所有内容提供语境和个性化。

“DJ是一个非常棒的产品,”Ek在会议上说。“这可能是我个人最喜欢的我们在过去几年开发的产品之一,我们也看到了消费者与之非常强烈的互动。这就说明了我们能够为Spotify平台上所有惊人的内容提供语境和个性化的能力。所以我认为你会看到更多这样的功能,我们可以为整个平台上的内容提供语境和个性化,使其更容易获取。”

Spotify可能使用生成式AI的一种方式是利用它来总结播客的内容,因为进入新播客有时会有些困难。Ek说,这样做可以使得为消费者推广新播客变得更容易,从而反过来为创作者带来更高的参与度和更多的增长。

Ek表示,另一种使用AI来使Spotify更高效的方式是通过AI生成音频广告。

“通过使用生成式AI和我们的工具,我认为你会看到我们可以显著降低广告商开发新广告格式所需的成本,”Ek说。“这显然意味着你作为一个广告商,不仅可以拥有一条广告,你还可以想象在Spotify网络上测试数千条广告,这些事情你今天可以很容易地使用文本来做,但你还不能在视频或音频上做。”

Ek的评论是在Spotify寻求为一种基于AI的“文本转语音合成”系统申请专利之际发表的。该专利于7月20日公布,于2月份提交。该技术可以将文本转换为包含情感和意图的类人声音频。该系统可以创建能够传达愤怒、快乐或悲伤等情绪以及讽刺等意图的逼真语音。它还能够以低声或大声的方式,并且具有口音地进行。

该专利表明,Spotify希望超越其DJ功能,该功能只是在歌曲之间说出一些基于AI的句子。文本转语音合成系统有潜力用于诸如使用AI以自然 sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding sounding 的方式讲述有声读物等事情。值得注意的是,苹果公司今年早些时候为苹果书籍上的部分标题推出了基于AI 的音频叙述功能。

专利申请和Ek 的评论是在 Spotify 对 AI 语音技术进行投资之际发表的。去年,流媒体服务收购了 Sonantic ,这是一家总部位于伦敦、已经建立了一种能够从文本创建逼真人声的 AI 引擎 的初创公司 ,收购金额未披露。 Spotify 利用这次收购来支持其 AI DJ 功能。

Spotify 的第二季度财报显示,目前全球有2.2亿人支付 Spotify 订阅费,这一数字同比增长了17%。总体而言,Spotify 现在拥有5.51亿月活跃用户。该公司在最近一个季度报告了近32亿欧元(按照今天的汇率为35亿美元)的收入。收入同比增长了11%。然而,Spotify 还报告了2.47亿欧元(2.74亿美元)的营业亏损。

Spotify 昨天还宣布了其高级计划的价格上调。在美国,个人高级计划的费用将从每月9.99美元上调到10.99美元。双人计划的费用将从每月12.99美元上调到14.99美元,家庭计划的费用将从每月15.99美元上调到16.99美元。

举报

  • 相关推荐
  • 佳能 PowerShotV1:双十一专为新手打造,告别复杂操作,畅享高清创作

    佳能PowerShot V1瞄准Vlog新手痛点,以6000元档位提供“开机即拍”的简易操作。其一体化变焦镜头覆盖17-52mm焦段,智能模式自动优化夜景、美食等场景画质,1.4英寸大底CMOS和5.7K超采样技术确保画质超越手机。相机配备侧翻屏、双重防抖及Vlog套装配件,解决传统相机上手难、配件杂的困扰,帮助新手轻松产出稳定高清内容,实现“开箱即拍”。

  • 别担心相机操作复杂!佳能PowerShotV1重新定义“新手护航”,开机即拍是基本操作

    佳能PowerShot V1专为Vlog新手设计,定位“新手神器”,价格亲民约6000元。搭载一体化超广角变焦镜头,覆盖17-52mm焦段,智能场景识别自动匹配最佳参数,实现“开机即拍”。画质超越手机,支持5.7K超采和4K视频,配备散热系统与五轴防抖。操作界面极简,侧翻屏多角度取景方便。双十一提供丰富配件套餐,性价比突出,是零基础创作者轻松开启高质量Vlog记录的首选。

  • 科灯跨境黑五超值建站季:WordPress/Woo标准版八折 Shopify免费建站

    科灯跨境在双十一期间推出两大建站方案:WordPress/Woo标准版享八折优惠,原价3980元折后3180元;WooCommerce建站版原价5980元活动价4780元,均含域名、SSL证书等基础配置。另针对Shopify用户提供免费建站服务,含账号注册、主题安装等全流程支持及一年免费售后。活动持续至11月30日,旨在降低外贸商家独立站搭建成本,提供一站式出海解决方案。

  • TTi OS行业首发“四图融合”车道级导航

    2025年10月30日,TTi+OS车道级导航正式量产,成为行业首个“四图融合”产品。它基于自研多模态融合引擎,实现高精度导航信息直观呈现与便捷交互,提升出行安全与个性化体验。系统集成SR渲染、环境重构等四大功能,实时识别车道位置,通过直觉式交互引导路径,帮助复杂路况操作。依托高算力平台,可视化呈现动态风险与辅助驾驶信息,增强行车安全。产品融入解压游戏、地标建筑等娱乐化设计,兼具趣味性。目前该导航已搭载于深蓝L06车型,标志量产落地,未来将持续优化AI座舱体验,引领智能汽车科技进化。

  • 双十一 Vlog 相机新手小白选购秘籍:佳能 PowerShotV1 开启创作轻松路

    佳能PowerShot V1专为Vlog新手设计,定位“新手神器”。它配备1.4英寸CMOS传感器与DIGIC X处理器,支持5.7K超采样4K视频,画质清晰细腻。相机操作简单,配备直觉式拨杆和智能场景识别系统,可自动优化参数,新手也能一键拍出高质量画面。其一体化超广角变焦镜头覆盖常用焦段,自带光学防抖,并针对对焦模糊、画面抖动问题提供解决方案。双十一优惠套餐包含补光灯、三脚架等配件,满足新手全程拍摄需求,是入门Vlog创作的理想选择。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 百惠金控:全球 IPO 重现热度 AI 股料再受热捧

    毕马威报告显示,全球IPO市场正逐步回暖,2025年第三季度超400宗IPO,创投市场连续四季稳健增长。AI领域成为主要驱动力,OpenAI等企业筹备上市推动热潮,美股与港股表现活跃。投资者更趋理性,聚焦企业商业模式与盈利潜力。香港凭借国际金融中心地位,吸引中资科创企业上市,需满足财务披露与ESG高标准。机构建议企业尽早寻求专业支持,把握资本窗口期。

  • 双十一Vlog相机怎么选?佳能PowerShot V1专为新手设计,操作简单可“闭眼入”

    佳能PowerShot V1专为Vlog新手设计,解决手机拍摄画质失真、操作复杂等痛点。搭载一体化超广角变焦镜头,无需更换镜头即可满足多场景拍摄;内置14种色彩滤镜和15种创意滤镜,支持智能直出,免除后期调色烦恼。配备模式切换拨杆,可快速在照片与视频模式间转换。实测在旅行、美妆、美食等六大场景中表现专业,画质远超手机。价格低于6000元,提供完整配件套装,实现“开箱即用”,帮助新手轻松开启高质量视频创作。

  • Soul App开源播客语音合成模型SoulX-Podcast,支持流畅自然多轮语音对话

    Soul App近日开源其播客语音合成模型SoulX-Podcast,专为多人多轮对话场景设计。该模型支持中、英、川、粤等多语言及方言,可生成超60分钟流畅自然、角色切换准确、韵律丰富的语音对话。除播客场景外,在通用语音合成及克隆任务中表现优异,能灵活调节节奏与副语言元素(如笑声),提升语音真实感与表现力。此次开源旨在携手开发者探索AI语音在内容创作与社交生态中的更多可能。

今日大家都在搜的词: