首页 > 业界 > 关键词  > 正文

原来每一个风靡的AI配音 背后都有真人原型

2023-09-19 14:41 · 稿源:站长之家

站长之家(ChinaZ.com)9月19日 消息:一位抖音博主“堂堂一个小飞”向他的妻子揭示了一个令人惊讶的事实:emo圈视频中经常听到的AI人声其实是由他创造的。他引用了一句经典的emo圈语录:“我说怎么走散了,原来是起风了,可惜那天没控制住情绪,说了不中听的话,你也没再迁就我,我们也就分道扬镳了。”让妻子惊讶不已。这段视频引发了热烈的讨论,许多人以为这些声音是由电脑合成的,没想到背后有真人的声音。

image.png

另一位博主“胥渡吧小蝶”也因其影视剧明星配音而广受欢迎,她的一句口头禅“家人们谁懂啊?”在网络上广泛传播。然而,她的老公听得太多,现在一听到这句话就会躲开。

娱乐博主“财三喵”将这些声音剪辑后分享在小红书上,获得了大量点赞,网友们都感叹声优们的才华。

这些AI音色其实都不是凭空生成的,而是采用真人声音作为声源,再进行深度学习,合成输出自然的语音。就像“注意看,这个男人叫小帅”的声源来自于声优kinsen,最初以“云希”的名字应用于微软Microsoft Azure(云端服务平台)的文本转语音服务,后来扩展到各个视频平台,成为解说标配旁白。

图片

体验地址:https://azure.microsoft.com/zh-cn/products/cognitive-services/text-to-speech/#features

举报

  • 相关推荐
  • 大家在看
  • 从蔡徐坤到爱豆King,抽象文化为何能全网流行?

    互联网的亚文化Icon,不到两个月的时间遍地开花。由抖音博主“爱豆King”掀起的“我的发”模仿热遍布短视频,更是在海外引起短视频平台引起关注,跨越肤色、语言与性别的“我的发,左眼用来忘记你,右眼用来记住你”这一不成音调的押韵文案,在夸张的非主流造型与燕尾服的组合、舒缓的轻音乐《TrackInTime》的怪异搭配下,也令“爱豆King”在互联网的争相模仿下,愈发

  • 新疆大闸蟹全网首卖:一夜能爬8公里 肉质紧实有雪水味道

    新疆海鲜”最近凭借产区优势走红出圈,其中就有之前大火的新疆三文鱼,现在新疆大闸蟹也全网开售了。正常苏蟹的养殖湖区深度大概是2.5-4米,在阿勒泰,最浅的湖区也有7到9米,深水处很多都在近30米。新疆大闸蟹的预售已经开始,在电商网站搜索新疆大闸蟹”、冰川雪蟹”等都能买到。

  • 国货集结!淘宝上线国货超市:食品、服装等全都有

    最近一段时间,各大国货品牌在网络爆火,甚至还有品牌在直播间摆满其它国货品牌,一起帮着宣传。由于国货品牌太多,网友一时间也买不过来”,就有不少网友期待希望有平台能推出国货专场”,这样自己下单就方便了。过去一年里,淘宝天猫上交易额超过亿的品牌中,国货占了75%,在95后、00后消费者的购物车中有超过8成是国货。

  • 全网热议不断!快手自制节目《冠军观赛团》成亚运热点发酵地

    9月23日杭州亚运会开赛以来,快手倾情打造的亚运自制节目《冠军观赛团》便成为了亚运热门话题的发酵地。由苏炳添&李晨、张国伟、孙杨&张豆豆、奥尼尔&刘畊宏、张伟丽&夏思凝等众多冠军、明星组成的“冠军观赛团”,不仅以专业视角对亚运进行更多报道和解读,更和亚运碰撞出不一样的化学反应,几乎每一期内容均登上多个热搜,引发全网热议。上快手搜索“冠军观赛团”,和亿万老铁一起围观赛事高能瞬间,解锁不一样的亚运体验,参与互动更有机会赢得精彩好礼。

  • 全网最低价成核心KPI:今年天猫双11要放大招了

    快科技10月16日消息,自从2009年淘宝第一次双11大促之后,每年的双11再也不是属于单身狗”的日子了,而是成为了各大电商平台的必争之地。今年的双11同样是一场平台间看不到硝烟的战争,在不久前的天猫双11启动会上,淘天集团把全网最低价”定为了核心目标。包括三大行业发展中心和用户、平台、直播等横向部门,都把全网最低价”定为了核心KPI。经过了十几年的双11、61

  • 豪车当婚车不香了?花1000元租公交车当婚车火遍全网

    一般结婚的新人,普遍会选择豪车当婚礼。随着95、00后更注重个性,传统豪车婚车也没那么香了公交车、自行车、拖拉机这类别样的交通工具,反不断以婚车的装扮出境亮相。新人租公交车当主婚车的情况比较少,多为用于接送亲朋好友,但是现在年轻人开始流行租公交车当主婚车。

  • YY直播自研数字音频工作站“YY调音台” 面向全网免费开放使用

    YY直播宣布自研出一款DAW数字音频工作站——YY调音台。这款调音软件将在直播场景下,更好地管理声卡的输入和输出,并对直播过程中的音频进行多功能、个性化处理。YY直播在实时音视频数字技术领域持续深耕,并一直高度关注前沿新技术的开发与应用,截至目前科研成果丰硕,专利申请已超1000项,发明授权600余项,其中与连麦相关发明专利已超百件。

  • OpenAI招募专家加入“红队”络,加强AI模型安

    OpenAI宣布了一项旨在加强其人工智能模型安全性的重要计划,即启动了“红队”网络。这一计划的目标是邀请来自各个领域的专家,加入他们的“红队”网络,共同评估和对抗其AI模型的潜在风险。这一举措有望为人工智能的未来发展提供更坚实的基础,确保其在各个领域的应用都能够更加可靠和安全。

  • 球流量Top50的“AI站”出炉:C端用户都愿意用AI干什么?

    AI这一波热潮,我们接触到更多的其实是面向B端的应用,例如废料处理、例如医疗、甚至养殖产业,都有创业者做效率的提升。面向C端的应用落地,却始终局限在几个方向上。未来还有没有新的玩家入局,又会用怎样的方式在什么领域切入市场呢?我们会持续关注。

  • 副总裁发起全网挑战!使用人脸照片成功解锁极氪X奖10万:博主实测

    极氪X加装8000元的智享交互科技套装后就能通过位于B柱的摄像头进行人脸识别解锁,不过有网友对它的安全性产生了质疑,有人担心车辆会被不法分子拿着自己的照片解锁后给偷走。极氪智能科技副总裁朱凌博士在直播时就此事在线进行了回应,称发起全网挑战,鼓励大家用自己的照片解锁车辆,第一个成功的个人奖励10万元!究竟是在说大话还是真的信任极氪X的安全性呢?近日,知名博主flypig”就用一台极氪X实际测试了一番。如果你恰好是极氪X的车主,也选装了B柱人脸识别解锁车辆的功能,不妨亲自去测试下,如果真的解锁成功,就有机会获得10万元大奖,买车的钱就回来一半了。

  • Gladia:使用强大的AI语音转文本API,实现智能转录和翻译

    Gladia I Speech-to-Text API 是一款基于先进的Whisper ASR技术的语音转文本API,能够将语音内容转录成文本,并提供翻译和音频智能分析的增值功能。它可用于虚拟会议、工作协作、内容制作和呼叫中心等多个场景。该API具有出色的转录准确性和可靠性,同时提供多语种翻译和音频智能分析功能,帮助用户更高效地处理语音内容。定价灵活透明,支持开发者根据需求选择适合的套餐。Gladia I Speech-to-Text API致力于为开发者提供强大的语音处理能力,助力他们构建创新的语音应用。

  • Simplify:将YouTube视频简化为简明摘要

    Simplify是一个能够将YouTube视频转换为简明易懂摘要的插件。它可以帮助用户快速领会长视频中的关键概念,提高学习效率。同时,避免了无关内容的干扰,节省宝贵时间。此外,摘要使得内容对于那些更喜欢阅读而非观看视频的人,或者有听力障碍的用户更易获取。

  • Renovy:AI 室内设计

    Renovy 是室内设计的未来,将您的个人风格与人工智能相结合,改变您的居住空间。使用 Renovy,只需拍照,即可实现家居革命。

  • ShopMigo:您好,我是。我能为您今天的购物提供什么帮助?

    ShopMigo是一款智能购物助手,能够帮助用户快速找到各类商品,并提供个性化的购物建议。通过语音或文字交互,用户可以寻找礼物、电脑、电子产品、一般商品以及阅读商品评价。ShopMigo由GenAI Tech™开发。

  • StockPhotoAI:AI生成个性化高质量股票图片网站

    StockPhotoAI.net是一个AI生成个性化高质量股票图片的网站。用户只需要用文字描述需要的图片,它就会使用开源的DALL-E模型生成专业的图片。图片可以用于PPT、网站、印刷品等。

  • REWIN.AI:利用AI驱动工具优化视频脚本提高传播力

    Rewin是一个利用AI技术为用户自动生成视频脚本的在线写作工具。它可以分析Youtube和Tiktok等平台上的热门视频,自动转换并优化脚本,帮助用户迅速获取更多创意,大幅提高内容制作效率。主要功能包括一键转换热门视频脚本、自动生成相关推荐、优化脚本传播力等,适用于视频创作者、内容营销人员、自媒体运营者等用户,可以有效降低他们的内容制作成本,提高创作效率。

  • 秘塔写作猫:AI写作,文章自成

    秘塔写作猫是一款集AI写作、多人协作、文本校对、改写润色、自动配图等功能为一体的AI Native内容创作平台。它能够帮助用户高效地进行文章创作,提供多种写作辅助功能,同时支持多人协作,能够自动进行文本校对与改写润色,并提供自动配图功能。秘塔写作猫的定位是为用户提供高效、便捷的AI写作体验。

  • pre:快速项目规划与开发平台

    pre.dev是一个快速项目规划与开发的在线平台。它能够通过AI智能对话快速提取项目需求,生成项目架构图,明确工作组件,方便项目管理。它还提供端到端的工程服务,包括项目开发、部署和后续维护。定价从每月$249到企业级报价。目标用户包括产品经理、自由职业者和创业者。

  • vellum.ai:开发LLM应用的平台

    Vellum是一个用于构建LLM驱动应用的开发平台。它具有提示工程、语义搜索、版本控制、测试和监控等工具,可以帮助开发者将LLM的功能引入生产环境。它与所有主要的LLM提供商兼容,开发者可以选择最适合的模型,也可以随时切换,避免业务过于依赖单一的LLM提供商。

  • BookHero:改变家长讲故事的方式

    BookHero是一个用于帮助孩子提高词汇和拼写能力的产品。用户可以从我们的图书馆中选择超过100本书籍进行阅读,或者仅需几分钟即可创建自己的书籍。我们创作了1000多幅精美插图,帮助孩子扩展词汇和提高拼写能力。我们致力于改变家长讲故事的方式,让阅读变得更加有趣和互动。

  • D-ID Creative Reality:人工智能视频生成APP,支持上传单张图片生成说话视频

    D-ID APP利用人工智能技术,可以通过上传单张图片生成说话的视频。支持上传自己的语音,对上传图片中的人物进行 Lip Sync。视频效果逼真,提供了三种版本:Lite 免费版本,Pro 每月$29,Advanced 每月$195.99。APP 在图像处理和视频生成方面做得很出色。

  • Gorilla Terminal:AI驱动的投资研究工具

    Gorilla Terminal是一款AI驱动的投资研究工具,通过强大的工具和智能洞察力,提供更高效、更愉悦的解决方案。其功能包括分析收益电话、获取宏观经济数据、风险管理、供应链分析、回归分析、风险价值分析、行业概况、终端界面等。该产品定价灵活,定位于为投资者提供快速、准确的投资研究工具。

  • Mail Helper:帮助您更好地撰写电子邮件

    Mail Helper是一款AI电子邮件撰写工具,针对经常需要给外国人写邮件的用户。用户只需告诉它想要表达的内容,它将生成地道生动的当地语言邮件,而不仅仅是简单的翻译。支持20多种语言,适用于日常办公沟通、客户开发和维护等高频场景。用户的隐私将得到严格保护,上传的数据仅用于生成邮件内容,不会存储。

  • Machined:SEO优化文章,自动生成内容集群

    Machined能够自动生成大量关于任何你喜欢的主题的信息性文章;结构化、撰写和相互链接,符合搜索引擎的喜好。Machined完全自动化创建内容集群的整个过程,包括关键词研究、关键词聚类、内容撰写和内部链接。

  • Any Summary:AI快速分析和总结长篇文件

    Any Summary是一款基于人工智能的文件分析和总结工具,能够快速分析和总结长篇文件,包括音频、视频和文档。用户可以自定义总结的格式,也可以让AI根据文件内容自动生成总结。该产品定位于提高工作效率,帮助用户快速获取文件的关键信息和见解。

  • Swifty AI:Swifty是一款以AI为驱动的商务出行助手,可以在几分钟内规划您的商务行程并预订最优机票和酒店。

    Swifty是一款基于AI的商务出行助手APP。它可以在几分钟内为您规划完整的商务行程,通过简单的聊天界面预订航班和酒店。 Swifty的优势在于: 1. 规划行程极为便捷,通过语音或文字与AI助手交流即可 2. 提供行程确认函、发票和收据等商务所需文件 3. 可随时询问行程相关问题,Swifty将为您提供解答 Swifty可定价为免费版和付费增值服务。它主要面向需要频繁商务出差的企业管理人员和白领。通过简化复杂的商务旅行规划,大幅降低行程管理的时间成本。

  • Adola:AI助手电话化,让交流更自然

    Adola是一款将AI助手赋予电话号码和人类化声音的产品。通过Adola,用户可以为其AI助手提供电话号码,使其能够进行真实的语音对话。Adola以无与伦比的速度和易用性,以每月25美元的价格(包括25分钟通话时间)让先进的通讯变得负担得起。用户可以从多种美国电话号码中选择,并且只需输入OpenAI API密钥即可将AI助手与电话线连接。此外,Adola还提供了全面的通话分析、24/7可用性、可扩展的解决方案等功能。产品定位于为用户提供便捷、实惠、安全的AI电话化解决方案。

  • PapermarkAI:Papermark AI是一款AI驱动的文档交互管理工具

    Papermark AI是一个AI驱动的文档管理和分享平台。它可以安全地分享和管理文档,确保机密信息得到保护。它还可以提供文档交互的实时分析,包括投资推介资料和销售材料的详细分析。主要功能包括:安全的文档分享、实时分析、定制链接分享、社区支持以及开源灵活性。

  • Breadcrumb:AI将您的数据转化为个性化的交互式视图。

    Breadcrumb是一款AI数据分析工具,能够将您的数据转化为个性化的交互式视图。其功能包括AI嵌入式交互、实时数据分析、数据转化为故事、可扩展性强等。无需数据技能,只需几分钟即可生成整个仪表板,并能够自定义数据故事。产品定位于为商业用户提供高效的数据分析和可视化工具。

  • Line 21:更好,更快,更多字幕

    Line 21是一款字幕交付软件,帮助机构创建、增强、翻译和交付实时字幕。它集成了广泛的服务,将字幕交付到各种终端,支持100多种语言的字幕、翻译和校对。优势在于快速交付字幕、自动翻译字幕以及提供人工智能校对功能。定价灵活,定位于帮助机构提高实时内容的包容性和可访问性。

今日大家都在搜的词: