首页 > 热点 > 关键词  > 谷歌最新资讯  > 正文

谷歌推出文生视频模型Veo:对标Sora 时长超 1 分钟

2024-05-15 08:45 · 稿源:站长之家

站长之家(ChinaZ.com) 5月15日 消息:在今日举行的谷歌2024I/O开发者大会上,谷歌正式推出了备受瞩目的全新视频生成模型——Veo。这款产品被视为对OpenAI三个月前推出的文本转视频工具Sora的直接挑战,旨在为用户提供更加高质量、多风格的视频生成体验。

Sora劲敌!谷歌视频生成模型Veo发布:支持生成1080P视频

据谷歌官方新闻稿介绍,Veo不仅支持生成时长超过1分钟、分辨率最高达1080P的高质量视频,而且具备对自然语言的先进理解能力,能够精准捕捉“延时摄影”、“航拍风景”等电影术语,并将其转化为生动的视觉表达。

用户可以通过文本、图像或视频提示来指导Veo生成所需的视频内容。谷歌表示,Veo生成的视频将具有更高的连贯性和一致性,人物、动物和物体的动作也将更加逼真。为了更直观地展示Veo的强大功能,谷歌还附上了演示视频供用户参考。

在周一的媒体预览会上,谷歌DeepMind首席执行官德米斯-哈萨比斯(Demis Hassabis)进一步透露,Veo的视频结果可以通过额外的提示进行完善,以满足用户更加精细化的需求。此外,谷歌还在积极探索更多功能,使Veo能够制作故事板和更长的场景,进一步拓展其应用场景和创作空间。

凭借其高质量、多风格的视频生成能力和对自然语言的先进理解能力,Veo将成为视频创作者、广告商、影视制作人员等各行各业人士的重要工具。同时,这也标志着谷歌在人工智能领域的持续创新和突破,为未来的视频创作和应用提供了更加广阔的想象空间。

举报

  • 相关推荐
  • 降低创作门槛!爱诗科技新一代生成式大模型加速AI视频大众化

    爱诗科技8月27日发布新一代AI视频生成模型PixVerse V5,实现秒级高质量视频生成,支持360P至1080P分辨率。新模型在真实度、灵活性及生成速度上显著提升,覆盖人物、二次元、商业广告等多场景创作。同步上线Agent创作助手,降低使用门槛,用户无需专业技巧即可一键生成专业级视频。该技术推动AI视频从专业工具走向大众化应用,加速行业落地。

  • B站为何需要视频播客?

    ​最近,内容平台最大的风莫过于视频播客了。 各大平台纷纷发力,竞相涌入这一新赛道。其中,B站则重磅推出《视频播客出圈计划》,吸引了于谦、鲁豫、蔡明、罗永浩、杨迪等众多名人入驻,各类媒体播客也相继加入战局。 从扶持力度上和势头上看,B站无疑将视频播客视为下一个重点发力领域。那么,B站为何需要视频播客?它又能否成为B站新的品牌IP?

  • 金蝶征信召开高质量普惠研讨会:用“数据+场景”破解优质资产荒

    文章探讨了当前普惠金融背景下银行面临的新增贷款来源与优质客户识别难题。央行数据显示2025年上半年贷款余额增长但新增贷款首次负增长,凸显银行风控压力。金蝶征信通过发票数据等高质量信息补充传统银税互动,结合AI反欺诈技术识别虚假交易,帮助银行精准定位产业链中的优质小微客户。会议达成共识:高质量数据是基础,数据+场景是关键方法,高价值场景是突破口,推动普惠信贷从规模扩张转向质量提升。

  • 茉酸奶创始人坚守品牌全局观,引领品牌高质量发展

    现制饮品行业正从“规模竞速”转向“品质深耕”。茉酸奶创始人以全局视野构建产品创新、体系化管理、行业标准共建的多维战略框架,通过有机升级、B420益生菌植入等持续迭代产品品质,跳出同质化竞争。同时推动行业首个现制酸奶团体标准制定,以体系化管理和生态共建赋能品牌可持续发展,为行业高质量转型注入持久动能。

  • 阿里Wan2.2-S2V正式发布:一张图+一段音频 即可生成人物动态视频

    今晚,阿里云正式发布全新多模态视频生成模型通义万相Wan2.2-S2V,并宣布开源。 Wan2.2-S2V极大地简化了视频制作过程,仅需提供一张静态图片和一段音频,模型便能生成面部表情自然、口型与音频高度一致、肢体动作流畅丝滑的电影级数字人视频。 支持分钟级长视频稳定生成,不止嘴动,手势、表情、姿态都能动。

  • 大厂押注的AI和视频化,能成为播客的好出路吗?

    长期在国内市场不温不火的播客赛道,正在焕发出越来越蓬勃的新机。 8月15日,自带流量和多重话题标签的罗永浩入驻B站,并宣布将开启一档视频播客节目《罗永浩的十字路口》,8月19日,罗永浩发布了第一条视频播客,与理想汽车创始人李想进行了近4小时的深度对话,一度引发热议,在B站内的观看量超230万。 而由罗永浩掀起的这一波流量热潮背后,可以看出B站对于视频

  • 外贸营销进入视频智能时代 宜选网贸易通重构海外获客生态

    在AI与数字化浪潮下,中国外贸企业正从流量竞争转向价值竞争。宜选网贸通依托400多项专利技术,推出全视频独立站整合营销方案,通过视频内容生态、全网流量矩阵与AI智能商机引擎深度耦合,构建从流量获取到订单履约的全链路外贸增长体系。该方案实现用户停留时长4分23秒,远超行业平均水平,询盘量增长35%,助力企业借视频革命链接全球买家。

  • 马斯克母亲发帖支持儿子:演示Grok视频生成功能

    近日,马斯克母亲梅耶-马斯克发帖演示支持马斯克的Grok视频生成功能。 她表示,这次我把手指放在了最近在X上发布的这张照片上,提示是用Grok制作视频”,现在自己的狗摇着尾巴了,自己玩得很开心。 她还特别提示,这个视频由@grok Imagine制作。

  • AI日报:字节视频模型Waver 1.0发布;百度AI搜索APP“梯子AI”发布;谷歌推全新Gemini 2.5 Flash图像编辑模型

    本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。

  • 长视频自己的音乐节:从一个人刷片,到七万人狂欢

    当夕阳余晖洒下,毛不易的歌词「一杯敬月光、一杯敬过往」在巨型竖屏出现,所有台下的合唱观众,感受到了一种强烈的共鸣。 同一刻、在一起,体验同一种情绪,成了用户与腾讯视频之间的「独家记忆」。 这是国内长视频平台首次把音乐节与内容紧密结合,通过一场线下活动,腾讯视频想要回应一个期待:为私密的、个人的线上观影行为,制造一种「共同在场感」。 无�

今日大家都在搜的词: