首页 > 业界 > 关键词  > Pika最新资讯  > 正文

Pika发布Sound Effects功能 生成的视频可以自动配音效了

2024-03-10 15:19 · 稿源:站长之家

要点:

Pika 发布新功能 Sound Effects,实现视频和音效无缝生成。

Sound Effects 操作简单,用户可以通过 prompt 描述或自动生成音效。

功能目前仅对超级合作者和 Pro 用户开放测试,未来将向所有用户推出。

站长之家(ChinaZ.com) 3月10日 消息:Pika 发布了全新的功能 Sound Effects,实现了视频和音效的无缝生成。用户可以通过简单的操作,通过描述 prompt 或让 AI 自动生成音效,为视频增添更多氛围。该功能目前仅对特定用户开放测试,但 Pika 表示会很快向所有用户推出。这一功能的推出引起了网友的热烈反应,许多人认为这是 Pika 为多模态 AI 创作收集宝贵资源的举措。

image.png

Sound Effects 的操作十分简单,用户只需一个 prompt 或简单的描述就能生成音效,使视频更加生动。通过选择不同的音效,用户可以为视频增添各种声音,从车鸣声到烟花声,音效都与视频画面高度匹配。此外,用户还可以在生成视频后,针对单个视频添加音效,提升视频质量和趣味性。

尽管 Sound Effects 目前仅对特定用户开放测试,但已经有许多网友开始尝试新功能,并对音效的匹配度和增加的氛围感到满意。这项功能的实现可能涉及复杂的模型学习和物理建模,AI 需要识别物体、环境以及互动关系,从而生成准确的音效。通过大量的训练和学习,AI 可以实现视频到音频的精准映射。

对于 Pika 发布的 Sound Effects 功能,用户的反响积极,认为音效与视频画面高度匹配,增加了视频的趣味性和氛围感。虽然背后的技术原理尚未公开,但这一功能的实现可能需要 AI 对视频内容进行复杂的分析和模拟。未来,随着功能的进一步完善和推广,用户可以期待更多有趣的音效和视频应用。

Pika 发布 Sound Effects 功能,让用户可以轻松为视频添加音效,提升观赏性和趣味性。这一功能的简单操作和高度匹配的音效,受到了用户的好评。未来,随着功能向所有用户推出,Pika 将为用户提供更多创作和娱乐的可能性。通过这一功能,Pika 展现了在多模态 AI 创作领域的潜力和创新精神。

举报

  • 相关推荐
  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 东芝电视火箭炮SOUND,70年匠心调音,亿万家庭沉浸式影音体验

    东芝电视"火箭炮"音效技术发展历程:从20世纪末推出首款"火箭炮"电视,到如今升级为"火箭炮SOUND"系统,始终引领行业音质标准。该技术通过8声道独立驱动、杜比认证5.1.2声道音响等配置,实现130W功率输出和12单元Hi-Fi扬声器系统,打造沉浸式家庭影院体验。最新Z700QF系列搭载的"火箭炮SOUND"平台,不仅忠实还原声音本质,更针对游戏场景优化音效表现,满足年轻用户需求。70年来,东芝坚持将音质作为电视核心差异化优势,通过持续技术创新维系用户情感连接,使"火箭炮"成为品牌与消费者之间的情感烙印。

  • 豆包视频生成模型Seedance 1.0 lite发布:“迅速生成影视级的视频

    火山引擎在FORCE LINK AI创新巡展上发布多款AI模型升级产品:1)Seedance 1.0 lite视频生成模型,支持5-10秒480P/720P视频生成,具备影视级画质和生成速度优势,适用于电商广告、影视创作等场景;2)豆包1.5视觉深度思考模型,仅20B参数但具备多模态理解能力,在60项基准测试中38项达SOTA水平;3)升级版豆包音乐模型,新增英文歌曲创作功能,并能根据视频内容自动适配BGM。目前这些模型已在火山方舟平台和豆包APP上线。

  • 从工具到生态:逗哥配音“臻品达人”重构短视频配音内容生产链

    国内头部AI配音平台"逗哥配音"推出创新性板块"臻品达人",通过与全网超百位垂类头部创作者真人声源深度合作,结合自研3D语音合成与声纹复刻技术,为短视频创作者打造兼具真实感与流量加持的配音解决方案。该平台日生成超千万条配音内容,声纹复刻精度达98.7%,用户几乎无法分辨AI生成内容与原始人声的区别。新功能覆盖影视解说、好物带货、小说推文等热门创作领域,其中影视解说可一键生成"电影级"专业解说,带货场景能复刻头部主播的促销话术,小说推文则提供言情、玄幻等细分风格的专属音色,实测可使作品完播率提升40%。平台CTO表示,这项技术突破让每位创作者都能平等享有专业级语音生产力工具,未来计划将AI配音技术延伸至教育课件、品牌广告等多元化场景。

  • 声音革命!逗哥配音以独家达人声库重塑短视频创作新生态

    国内领先的智能配音平台"逗哥配音"推出全新升级的"臻品达人声库",通过动态扩容的独家声音资源和精准的风格适配能力,帮助短视频创作者提升内容吸引力。数据显示,使用该功能的短视频播放量达行业基准值的1.8倍。平台采用"数据优选+专业打磨"模式,精选超10亿播放量验证的顶级解说者资源,每季度新增20+达人声线,覆盖影视解说、游戏、好物推荐等20余个垂直领域。独创的"声效数据库"提供3000余种场景化音效模板,实现一键匹配专业级声场。某品牌营销案例中,创作者使用专属声线将产品视频转化率提升至15.7%。目前平台已覆盖微信小程序、PC端及移动APP全平台,支持80种语言实时转换。

  • AI日报:GPT-4.1正式上线ChatGPT;阿里通义万相Wan2.1-VACE开源;可灵大模型视频生成量约占30%份额

    本文报道了AI领域最新动态:1)阿里通义万相开源视频编辑统一模型VACE;2)OpenAI发布GPT-4.1增强编码能力;3)Stability AI推出超轻量341M文字转语音模型;4)快手可灵视频生成模型占据30%市场份额;5)微软WizardLM团队整体加入腾讯混元大模型研发体系;6)腾讯宣布混元图像2.0将于5月16日发布;7)上海成立人工智能标识生态联盟;8)Lightricks发布13B参数视频生成模型LTX-Video;9)谷歌DeepMind推出AlphaEvolve优化AI训练速度;10)腾讯元宝浏览器插件上线Chrome平台。这些进展展示了AI技术在视频处理、大模型、语音合成等领域的快速发展。

  • 学生发现教授用ChatGPT生成课件,要求退费 8000 美元

    越来越多教师也在使用 AI 来批改作业 —— 有时还用得相当“笨拙”。与此同时,学生利用 AI 作弊的现象正在变得越来越普遍……

  • ChatGPT深度研究新增“PDF导出”功能,格式完整保留

    这项“PDF导出”功能将立即向所有 Plus、Team 和 Pro 订阅用户开放,而企业版和教育版用户也将“很快”获得访问权限……

  • GhibliTattoo发布!AI纹身生成,吉卜力风格专属定制!

    这款工具专为吉卜力粉丝、纹身爱好者与创意设计师打造。通过文本提示或图片上传,即可生成高分辨率、透明背景的吉卜力风格纹身设计……

  • 马斯克推出全新XChat:具备加密、音视频通话、消息自毁功能

    近年来,X一直在努力增加更多隐私保护和加密功能。 有报道曾称,马斯克计划将X这个平台变成一个万能应用”,提供包括收发消息、社交、点对点支付等一系列服务。 报道还称,这一愿景让人想起腾讯的微信,它是中国居民日常生活中无处不在的一部分。” 据悉,马斯克曾对微信等中国手机应用程序大加赞赏,还希望X成为一个功能完备”的约会网站和数字银行。