AI视频进入有声时代！谷歌发布视频生成音频技术，效果丝滑惊艳网友！

2024-06-19 08:52 · 稿源：头号AI玩家公众号

Runway前脚刚发布Gen-3Alpha，Google后脚就跟了个王炸。北京时间6月18日凌晨，Google Deepmind发布了视频生成音频（Video-to-Audio，V2A）技术的进展，可以为视频创建戏剧性的背景音乐，逼真的音效，甚至是人物之间的对话。V2A技术支持为AI生成视频“配乐”，Google还特别强调了官

......

本文由站长之家合作伙伴自媒体作者“头号AI玩家公众号”授权发布于站长之家平台，本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间，为了保证文章信息的及时性，内容观点的准确性，平台将不提供完全的内容展现，本页面内容仅为平台搜索索引使用。需阅读完整内容的用户，请查看原文，获取内容详情。

即将跳转到外部网站

安全性未知，是否继续

继续前往

（举报）

相关推荐

关键词：

荐长视频，要MCN化？

过去十多年，长视频平台习惯用头部综艺与大剧撬动增长:内容够强，自然破圈，声量带动会员与广告。这套“内容中心逻辑”曾行之有效。但短视频重写了注意力分配。用户不再愿意投入整段时间追一个叙事，三十秒的情绪刺激就足以满足娱乐需求。内容生命周期被压缩，哪怕是重金制作，也可能上线当周见顶、难以延展。在这种环境下，平台不得不寻找新的增长方式。�

文章搜索核心标签长视频平台
荐Sora App的AI视频社交，给了百度们新希望

Sora2发布两周后，百度的蒸汽机AI视频模型，和谷歌Veo3.1撞了档期。两家公司选择同期发布并非有多默契，而是Sora2带来的压迫感促使它们不得不加快脚步。奥尔特曼将形容Sora2为“创意领域的ChatGPT3.5时刻”，不仅在物理逻辑、画面连贯性、真实感和音画同步等方面实现了质的飞跃，还把Sora从一个“文本到视频”的工具进化成一个“创意到生态”的平台。这无疑是扔在AI视�

文章搜索核心标签 AI视频模型
新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

苹果因自研大模型项目遇瓶颈，决定引入谷歌Gemini大模型升级Siri，计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数，将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能，支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送，后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

苹果谷歌Gemini Siri升级
荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

本期AI日报聚焦多项技术突破：HeyGen推出精准唇形同步的视频翻译引擎；科大讯飞发布星火X1.5大模型，提升多语言处理能力；QQ浏览器新增AI助手浮窗；科大讯飞推出软硬一体方案，实现高噪声环境精准识别；谷歌Gemini 3 Pro预览版支持百万级上下文窗口；Comfy Cloud让Stable Diffusion实现零门槛创作；谷歌Gemini新增深度研究功能，可整合邮件生成智能报告；上海AgiBot机器人10分钟完成复杂制造任务，重塑生产效率。

AI视频翻译唇形同步跨语言本地化
冷美人退赛后冲上热搜第一：本人1分钟视频报价50元

微博话题冷美人退赛”冲上热搜榜第一名，引发关注。据媒体报道，湖南张家界七星山景区荒野求生挑战赛热门选手冷美人”因体检未通过遗憾退赛。知情人士称，幸好当时旁边有人把她扶住了，然后送往医院，冷美人”醒过来第一句话就是这是哪？要去哪里”，她感到非常遗憾，说着不甘心”，还说给你们添麻烦了”。据悉，冷美人”本名叫杨朝芹，来自云南，在这次�

冷美人退赛荒野求生挑战赛张家界七星山
荐短视频加速跑入AI时代

「现在是西天取经的第996天，刚把师父从妖怪嘴里救出来，师父身上都还是热乎的，我们就马不停蹄开始出发了。」在抖音，都能看到《西游记》里师徒四人的取经vlog了。采访高考完刚出考场的爱因斯坦、孟德尔、门捷列夫;慈溪逛颐和园Vlog、大禹治水现场直播，各种AI生成的视频成为网友「玩梗搞抽象」的核心生产力。尽管在专业影视

文章搜索核心标签 AI生成
荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

本期AI日报聚焦多项技术突破：火山引擎发布豆包视频生成模型1.0pro+fast，速度提升3倍且价格下降72%；百度与上海体育大学推出“上体体育大模型2.0”，拓展AI在运动员训练等场景应用；谷歌Gemini新增一键生成PPT功能；美团发布LongCat-Video模型，支持5分钟连贯视频生成；xAI推出虚拟女友Mika引发热议；MiniMax开源高性能M2编码模型；OpenAI上线企业知识管理功能；另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万，展现年轻创业者的技术影响力。

AI 视频生成火山引擎
荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

本期AI日报聚焦多领域突破：OpenAI视频应用Sora登陆安卓平台并引入付费角色功能；网易云音乐推出AI调音大师实现智能音效适配；字节跳动高薪布局人形机器人赛道；谷歌Gemini平台将升级图像生成技术；llama.cpp实现多模态革命；特斯拉秘密实验室通过行为数据训练机器人；上海首例AI著作权案宣判保护原创；微软推出自研图像生成器MAI-Image-1，在创意效率与质量间取得平衡。

OpenAI Sora Android
剪辑快人一步！索尼ICE-Cloud助力婚礼视频团队高效高质交付

北京二十四格文化有限公司（24Frames）成立于2004年，专注极致纪实影像美学，深耕婚礼电影、商业宣传、纪录片、综艺及艺人合作等领域。团队以真实事件与情感为核心，融合高级审美与技艺，打造富有共情力的影片，助力品牌传递深度价值。面对跨地域协作与高清素材传输等挑战，公司通过索尼与分秒帧联合推出的ICE-Cloud云平台优化流程，实现拍摄至交付的高效协同，显著�

婚礼视频拍摄纪实影像美学商业宣传片
专业创作者之选：佳能R50V在视频、Vlog与直播领域的全能表现

佳能R50V相机专为视频创作者设计，集专业视频制作、Vlog记录与高质量直播于一体。支持6K超采样4K视频录制，配备10-bit 4:2:2色彩与Canon Log3，保障画质细腻且后期空间大。机身仅323克，便携性强，优化自拍与竖拍操作，内置美颜与智能对焦功能。直播时可通过USB直连电脑，实现4K 60P高清输出。它融合专业性能与易用性，是应对多种创作需求的理想选择。

视频制作 Vlog记录高质量直播

今日大家都在搜的词：

热文

3 天
7天

AI视频进入有声时代！谷歌发布视频生成音频技术，效果丝滑惊艳网友！

荐长视频，要MCN化？

荐Sora App的AI视频社交，给了百度们新希望

新Siri或明年春季发布苹果公司或引入谷歌Gemini大模型 AI技术

荐AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏览器推出AI+小窗

冷美人退赛后冲上热搜第一：本人1分钟视频报价50元

荐短视频加速跑入AI时代

荐AI日报：豆包视频1.0pro fast发布；谷歌Gemini新功能上线；百度推上体体育大模型 2.0

荐AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将推Nano Banana2

剪辑快人一步！索尼ICE-Cloud助力婚礼视频团队高效高质交付

专业创作者之选：佳能R50V在视频、Vlog与直播领域的全能表现

今日大家都在搜的词：

热文

iPhone Pocket被吐槽像保温水瓶套网友：韭菜太好割

影视飓风CEO在相亲角被大妈吐槽网友：大妈不识货

腾讯发布2025第三季度财报：营收1928.69亿元同比增长 15%

雷军回应小米双11战绩：谢谢大家支持

小米澎湃OS 3第三批正式版推送：支持小米14、K70系列等

卢伟冰：小米手机双11连续三年国产销量第一

95岁巴菲特每周还上5天班此前计划年底退休

京东发布双11战报：订单总量增长近60% 下单用户同比增长40%

荣耀500系列官宣：超级标准版+超级Pro版

荣耀500系列开启预约：Pro版外观首次亮相

站长商机