首页 > 业界 > 关键词  > AI视频最新资讯  > 正文

AI视频进入有声时代!谷歌发布视频生成音频技术,效果丝滑惊艳网友!

2024-06-19 08:52 · 稿源: ​头号AI玩家公众号

Runway前脚刚发布Gen-3Alpha,Google后脚就跟了个王炸。北京时间6月18日凌晨,Google Deepmind发布了视频生成音频(Video-to-Audio,V2A)技术的进展,可以为视频创建戏剧性的背景音乐,逼真的音效,甚至是人物之间的对话。V2A技术支持为AI生成视频“配乐”,Google还特别强调了官

......

本文由站长之家合作伙伴自媒体作者“​头号AI玩家公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • 对标Sora!谷歌发布AI视频生成器Veo 3:可同时生成视频和音效

    谷歌在I/O开发者大会上发布第三代视频生成模型Veo+3,对标OpenAI的Sora。该模型不仅能基于文本和图像生成高质量视频,还能为人物对话、鸟鸣等场景自动匹配音效,实现更逼真的视听体验。目前Veo+3面向美国Gemini Ultra订阅用户,月费249.99美元,并将纳入企业级Vertex AI平台。谷歌同期还发布了升级版图像模型Imagen 4、电影制作工具Flow等AI产品。值得注意的是,谷歌在AI图像生成领域并非一帆风顺,此前Imagen 3曾因生成含历史错误的图像引发争议。

  • 多模态2025:技术路线“神仙打架”,视频生成冲上云霄

    一场大会,聚集了中国多模态大模型的“半壁江山”。 智源大会2025为期两天的论坛中,汇集了学界、创业公司和大厂等三方的热门选手,关于多模态的集中讨论达到了前所未有的热度。其中,创业公司就有爱诗科技、生数科技、Sand.ai、智象未来、Luma AI、智谱等六家公司创始人、CEO分享心得;隶属大厂队的字节、腾讯、百度的多模态技术负责人,以及学术界的人大和MIT(麻省�

  • 必应引入OpenAI的Sora视频生成器,完全免费使用

    微软表示:“Bing 视频生成器体现了我们让 AI 视频创作变得全民可及的努力。我们相信,创造力应当轻松且人人可用,从而助力你的探索与表达。”

  • Baidu Steamer-I2V推动视频生成技术突破,擎舵平台赋能原生创意营销

    百度推出全球领先的视频生成模型Baidu Steamer-I2V,以89.38%综合评分登顶VBench榜单。该模型通过精准画面控制、高清画质和中文语义优化,能将静态图像转化为连贯动态视频。百度营销平台迎来2周年,已服务超13万家企业,日均生产素材超10万+。在"AI驱动营销全链路升级"主题下,百度与核心代理商共同探讨AIGC技术突破与创意升级,推出"AI创"原生创意大赛。百度商业体系表示将持续巩固传统广告优势,同时突破创意边界,实现营销效果飞跃。未来百度将优化模型性能,拓展应用场景,推动营销行业迈向"一杯咖啡时间完成创意生产"的全智能化时代。

  • AI日报:QQ浏览器升级为AI浏览器;OpenAI全新编程智能体Codex;B站团队推动漫视频生成模型AniSora

    本文介绍了AI领域多项最新进展:1)B站团队推出开源动漫视频生成模型AniSora,支持多种风格创作;2)OpenAI发布编程智能体Codex,提升开发效率;3)Google测试AI问答功能AI Mode;4)ChatGPT将整合MCP协议,支持第三方AI服务对接;5)阿里推出ZeroSearch框架,减少对搜索引擎的依赖;6)Stability AI与Arm合作推出手机端音频生成AI;7)Qwen发布WorldPM系列大模型;8)GPT-5将整合多款产品功能;9)ListenHub上线AI播客生成工具;10)QQ浏览器升级为AI浏览器;11)数学建模AI助手MathModelAgent面世;12)GenSpark推出全球首个智能下载代理;13)谷歌NotebookLM将推出视频摘要功能。这些创新展现了AI技术在各领域的快速发展和广泛应用。

  • “韦神”一条视频吸粉千万!脱落牙齿引关注 网友戏称“学海无牙”

    仅仅凭借一条4秒的短视频,就疯狂吸粉千万,这就是北大韦神”的魅力。 韦神”实名韦东奕,出生于1991年,现任北京大学助理教授、北京大学数学科学学院数学系微分方程教研室研究员。 他之所以能走红,主要得益于形象和实力的反差,被誉为扫地僧”。 此前他接受采访时,提一瓶矿泉水、拿两个馒头,衣着朴素,然而朴素的外表下,竟然是数学界的天才和大才。

  • 告别延迟焦虑,收获丝滑连招,三星AI电视做你的游戏好搭档

    三星AI电视通过Vision+AI技术重新定义家庭游戏体验,搭载新一代AI芯片实现4K画质增强、165Hz可变刷新率等性能升级。OLED系列产品配备动态加速技术和AMD FreeSync Premium Pro,确保高速游戏画面流畅无撕裂。AI音画追踪技术实现立体声场,70W扬声器系统结合Q交响乐技术打造沉浸音效。游戏工具栏提供一键辅助功能,AI游戏推荐精准匹配玩家偏好。通过光画同步技术联动环境灯光,实现全感官沉浸式游戏体验,构建一站式家庭娱乐中心。

  • Meta AI新增生成式AI视频编辑功能:秒换服装、场景

    Meta 宣布,将在Meta AI应用、Meta.AI网站和Edits应用上推出一项生成式AI视频编辑功能。 用户可通过50多种预设AI提示词,一键实现视频中服装、场景、光影等元素的智能变换。 Meta称,全新的AI视频编辑功能直观易用,用户无需任何视频编辑专业知识即可制作高质量的视频。首先,用户可将视频上传到Meta AI应用、Meta.AI网站或

  • 加特兰UWB赛道强势突破 Dubhe芯片引领数字钥匙丝滑体验

    2025年6月6日,加特兰在上海举办"2025加特兰日"活动,发布全球首款符合IEEE 802.15.4ab标准的车规UWB芯片"天枢星"(Dubhe)。该芯片具有四大创新特性:1)支持最新标准,提升测距精度;2)采用MMS技术实现400米超远距离测距;3)业界首创2发4收雷达架构;4)基于22nm工艺实现低功耗优化。Dubhe芯片可应用于数字钥匙、舱内活体检测、脚踢尾门等场景,并拓展至IoT领域。加特兰已组建超百人UWB研发团队,申请60余项专利,其中包含2项标准必要专利。CEO陈嘉澍表示,公司将持续推动UWB技术普及,服务更广泛的应用场景。

  • 快手可灵AI上线2.1系列模型:生成5秒视频不到1分钟

    快手旗下可灵AI发布2.1系列模型,包含720p标准版和1080p高品质版,在性价比、生成速度和质量三大维度实现突破。新模型生成5秒视频仅需20-35灵感值,与上代保持相同成本;1080p视频生成时间不到1分钟,快于行业同级产品2-3倍。模型在动态表现、物理模拟和语义理解方面均有优化,人物动作更真实自然。可灵AI自发布以来发展迅猛,全球用户突破2200万,月活增长25倍,累计生成1.68亿视频和3.44亿图片。商业化进程加速,2025年Q1营收超1.5亿元人民币,展现强劲市场潜力。