首页 > 业界 > 关键词  > Pika最新资讯  > 正文

Pika发布Sound Effects功能 生成的视频可以自动配音效了

2024-03-10 15:19 · 稿源:站长之家

要点:

Pika 发布新功能 Sound Effects,实现视频和音效无缝生成。

Sound Effects 操作简单,用户可以通过 prompt 描述或自动生成音效。

功能目前仅对超级合作者和 Pro 用户开放测试,未来将向所有用户推出。

站长之家(ChinaZ.com) 3月10日 消息:Pika 发布了全新的功能 Sound Effects,实现了视频和音效的无缝生成。用户可以通过简单的操作,通过描述 prompt 或让 AI 自动生成音效,为视频增添更多氛围。该功能目前仅对特定用户开放测试,但 Pika 表示会很快向所有用户推出。这一功能的推出引起了网友的热烈反应,许多人认为这是 Pika 为多模态 AI 创作收集宝贵资源的举措。

image.png

Sound Effects 的操作十分简单,用户只需一个 prompt 或简单的描述就能生成音效,使视频更加生动。通过选择不同的音效,用户可以为视频增添各种声音,从车鸣声到烟花声,音效都与视频画面高度匹配。此外,用户还可以在生成视频后,针对单个视频添加音效,提升视频质量和趣味性。

尽管 Sound Effects 目前仅对特定用户开放测试,但已经有许多网友开始尝试新功能,并对音效的匹配度和增加的氛围感到满意。这项功能的实现可能涉及复杂的模型学习和物理建模,AI 需要识别物体、环境以及互动关系,从而生成准确的音效。通过大量的训练和学习,AI 可以实现视频到音频的精准映射。

对于 Pika 发布的 Sound Effects 功能,用户的反响积极,认为音效与视频画面高度匹配,增加了视频的趣味性和氛围感。虽然背后的技术原理尚未公开,但这一功能的实现可能需要 AI 对视频内容进行复杂的分析和模拟。未来,随着功能的进一步完善和推广,用户可以期待更多有趣的音效和视频应用。

Pika 发布 Sound Effects 功能,让用户可以轻松为视频添加音效,提升观赏性和趣味性。这一功能的简单操作和高度匹配的音效,受到了用户的好评。未来,随着功能向所有用户推出,Pika 将为用户提供更多创作和娱乐的可能性。通过这一功能,Pika 展现了在多模态 AI 创作领域的潜力和创新精神。

举报

  • 相关推荐
  • Sora App的AI视频社交,给了百度们新希望

    Sora2发布两周后,百度的蒸汽机AI视频模型,和谷歌Veo3.1撞了档期。 两家公司选择同期发布并非有多默契,而是Sora2带来的压迫感促使它们不得不加快脚步。 奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”,不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃,还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。 这无疑是扔在AI视�

  • OpenAI也来了,巨头为何决战AI浏览器?

    AI浏览器赛道再添一位重量级玩家——ChatGPT Atlas,这是OpenAI推出的首款人工智能驱动的网页浏览器。 这也被外界认为OpenAI要向谷歌宣战,挑战Chrome一直以来的浏览器霸王地位。ChatGPT Atlas发布当天,谷歌母公司Alphabet股价应声下挫,盘中最大跌幅接近5%,足见市场对这一新品的敏感度。 近一年来,AI浏览器的战略价值成为行业共识,从业者更是将其与智能代理(Agent)、搜索引�

  • OPPOFind X9 新机发布, 火山引擎助力打造AI应用新体验

    OPPO Find X9系列以“画质革命”为核心,全面升级移动影像能力,致力于打造手机摄影新标杆。该系列搭载火山引擎,强化AI功能,支持AI写作、播客创作、多模态问答及AI作图,重点优化旅行场景,简化创作流程。同时,作为业界首款支持机密计算AI推理的消费级手机,通过AICC平台保障用户数据全生命周期安全,提供放心、便捷的智能服务体验。

  • 百惠金控:全球 IPO 重现热度 AI 股料再受热捧

    毕马威报告显示,全球IPO市场正逐步回暖,2025年第三季度超400宗IPO,创投市场连续四季稳健增长。AI领域成为主要驱动力,OpenAI等企业筹备上市推动热潮,美股与港股表现活跃。投资者更趋理性,聚焦企业商业模式与盈利潜力。香港凭借国际金融中心地位,吸引中资科创企业上市,需满足财务披露与ESG高标准。机构建议企业尽早寻求专业支持,把握资本窗口期。

  • AI日报:Hailuo 2.3发布;豆包AI编程史诗级升级;马斯克推出AI百科全书Grokipedia

    本期AI日报聚焦多领域突破:海螺AI 2.3实现视频生成技术跃升,支持双模式免费试用;豆包AI编程工具实现零基础可视化开发;马斯克推出AI百科Grokipedia;Mistral发布企业级AI开发平台;Anthropic推出金融版Claude,显著提升分析师效率;Pinterest升级AI购物助手功能;英伟达推出全能模型OmniVinci刷新性能纪录;DeepSeek模型在港大美股交易竞赛中以10.61%年化回报率夺冠。

  • AI浪潮下,项目经理如何破局 | 2025 PMI项目管理大会

    人工智能正重塑项目管理模式,项目经理需超越传统技能,掌握AI赋能下的效率提升、创新促进与决策优化能力。个人应通过组织平台与业务深度绑定,构建不可替代的核心价值。2025PMI项目管理大会将探讨AI前沿应用,助力从业者系统掌握转型路径,实现个体与组织的双向赋能,在AI时代保持竞争力。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • AI日报:可复刻音色的MiniMax Speech 2.6发布;TikTok推AI剪辑新工具“Smart Split”;Cursor 2.0发布

    本期AI日报聚焦多项技术突破:MiniMax发布低延迟语音合成系统Speech 2.6,实现实时交互;蚂蚁数科与宁波银行打造的金融AI方案入选国际标准;智源推出具身操作能力的Emu3.5多模态模型;Cursor 2.0通过自研模型实现多智能体协同编程;xAI升级Grok新增视频生成功能;OpenAI推出可定制安全模型;TikTok推出AI剪辑工具Smart Split;微软发布强化学习框架Agent Lightning提升大模型训练效率。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 算力无界,AI无距!超聚变发布FusionXpark™随身智能体开发平台

    10月24日,超聚变公司发布FusionXpark™智能体开发平台,实现AI算力从云端下沉至桌面设备。该平台搭载GB10架构,提供1PFLOPS本地算力,支持200B参数模型推理,助力开发者在边缘端运行高参数模型。发布会展示了政务、金融、工业等五大行业的30类“超级员工”智能体应用,通过私有化部署保障数据安全。专家指出,这一创新将推动AI普惠化,重塑产业生态。

今日大家都在搜的词: