首页 > AI头条  > 正文

AI视频王者回归!Runway全新Gen3模型又让网友惊艳了一把

2024-06-18 09:56 · 来源: AIbase基地

站长之家(ChinaZ.com) 6月18日 消息:Runway最近推出了新一代视频生成模型Gen-3Alpha,这一模型在保真度、一致性和动作表现方面都有重大改进,为构建通用世界模型迈出了重要一步。Gen-3Alpha具备多项显著的功能和特点,使其成为创意产业中的新星。

视频来自Runway

以下是 Gen3模型的一些关键特点:

  • 重大改进:Gen-3Alpha 是 Runway 在为大规模多模态训练构建的新基础设施上训练的一系列模型中的第一个。与 Gen-2相比,它在保真度、一致性和动作方面有了显著提升。

  • 联合训练:Gen-3Alpha 经过视频和图像的联合训练,将为 Runway 的文本转视频、图像转视频和文本转图像工具提供动力。

  • 控制模式:现有的控制模式包括 Motion Brush、高级摄像头控制、导演模式,以及即将推出的工具,用于更精细地控制结构、风格和动作。

  • 极度稳定的光影:Gen3模型能够生成具有丰富变化且极其稳定的光影效果,即便在高速移动的场景中也能保持高质量输出。

  • 快速生成:Gen3模型的生成速度非常快,5秒视频的生成时间为45秒,10秒视频的生成时间为90秒,这在当前市场上的 AI 视频生成速度中具有明显优势。

  • 审美强:Runway 以其一贯的审美优势,提供了配色和风格上令人满意的视频内容,与一些其他 AI 视频产品相比,其视觉效果更加吸引。

  • 想象力:Gen3模型在处理幻想、玄幻、科幻、魔幻等场景时,展现出了强大的想象力和创作潜力。

  • 物理规律:Gen3在物理规律的表现上达到了行业领先水平,能够生成符合现实物理规律的视频内容。

Gen-3Alpha在一个全新的大规模多模态训练基础设施上进行训练,能够处理和融合文本、图像和视频等不同类型的数据,生成高质量的多模态输出。这种联合训练方法提高了模型在生成动态和静态内容的表现能力。

视频来自Runway

Gen-3Alpha支持多种生成工具,包括从文本到视频(Text to Video)、从图像到视频(Image to Video)、从文本到图像(Text to Image)的转换工具。这些工具为创作者提供了丰富的创作选择,以满足不同的创作需求。

视频来自Runway

在时间控制方面,Gen-3Alpha通过使用时间密集型的字幕进行训练,增强了模型对场景细节和时间变化的理解。这使得它能够生成具有创意过渡和精确关键帧控制的视频内容,实现对生成内容的精确关键帧设置和场景过渡。

视频来自Runway

Prompt:在日本城市以超高速移动的火车窗户上,一个女人的微妙倒影。

从上面这个视频可以看到,Gen-3Alpha在光影上的表现可圈可点,在高速火车上极速变换的夜景灯光效果十分稳定,可以说是相当惊艳了。

Gen-3Alpha还能够生成表达丰富、逼真的人类角色,提供广泛的动作、手势和情绪,为叙事创作提供了新的机会。这一点在提高视频质量和叙事机会方面尤为重要。

高级控制模式的支持也是Gen-3Alpha的一大亮点。它支持运动画笔(Motion Brush)、先进摄像头控制(Advanced Camera Controls)和导演模式(Director Mode),为创作者提供了更大的创作自由和控制力度。

视频来自Runway

在性能方面,Gen-3Alpha采用分布式计算和高效存储架构,确保处理大规模数据时的性能和速度,支持快速训练和生成,满足高效创作的需求。

Runway还引入了新的安全措施,以确保生成内容的安全和可靠性,并与多家顶级娱乐和媒体公司合作进行定制开发。这标志着视频生成技术的又一大步,为创意产业带来了新的可能性。

官网地址:https://top.aibase.com/tool/gen-3-alpha

  • 相关推荐
  • AI日报:阿里新模型Qwen3即将来袭;GitHub开源MCP服务器;Runway发布Gen-4 Turbo

    欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://top.aibase.com/1、Qwen3即将来袭:阿里云新模型相关支持已正式合并至vLLM代码库阿里云的Qwen3模型即将发布,标志着其在AI领域的又一重要进展。新推出的AI听歌报告能够精准识别用户音乐偏好,场景

  • 可灵AI发布全新2.0模型:上线多模态视频编辑功能

    快科技4月16日消息,据报道,可灵AI在北京举行灵感成真”2.0模型发布会,正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍,可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先;可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日,全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单,快手可灵1.6pro(高品质模

  • 能理解海豚声音!谷歌开发全新AI模型DolphinGemma

    快科技4月15日消息,谷歌公布了一款名为DolphinGemma”的大型语言模型,旨在帮助科学家理解海豚的声音,并生成类似海豚的声音序列。研究人员预计在未来几个月内测试DolphinGemma及其配套的Cetacean Hearing Augmentation Telemetry(CHAT)发声系统,以探索是否能够翻译并模仿海豚的声音,进而实现与海豚的某种对话”。海豚是地球上最聪明且最善于沟通的动物之一,其社交互动极其复杂�

  • AI日报:苹果AI国行版或随iOS 18.6月底上线;Suno v4.5正式上线;Runway发布图像一致性参考功能

    本文汇总了AI领域最新动态:1)英伟达开源语音识别模型Parakeet-TDT-0.6B-V2,提升转写效率;2)Suno音乐平台v4.5版本支持8分钟歌曲生成;3)Runway推出图像一致性参考功能Gen-4 References;4)Midjourney V7新增"Omni-Reference"图像控制功能;5)Claude将引入MCP协议提升集成能力;6)iOS18.6或为中国用户启用AI功能;7)OpenAI宣布回归非营利模式;8)Freepik发布版权安全的F-Lite图像模型;9)OpenAI以30亿美

  • 多模态和Agent成为大厂AI赛 点

    这是《窄播Weekly》的第52期,本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景,多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心,就是让大模型的能力越来越接近人。沿着这个主旋律,可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现,需要给到大模型多

  • 多模态和Agent成为大厂AI赛点

    本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势,重点分析了多模态能力和代理执行两大发展方向。文章指出,大模型落地的核心在于让人机交互更自然,具体表现为:1)通过多模态技术降低用户使用门槛,如阿里夸克新推出的"拍照问夸克"功能;2)通过代理执行提升复杂任务处理能力,如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显:国�

  • 5月发布!荣耀400系列获认证:骁龙7 Gen4+骁龙8 Gen3双机型

    荣耀400系列两款新机DNP-AN00和DNN-AN00已通过无线认证,预计5月发布。标准版搭载骁龙7+ Gen4芯片,采用4nm工艺,1+3+4架构,性能较上代提升23%,配备6.55英寸1.5K直屏;Pro版搭载骁龙8 Gen3,配备6.69英寸1.5K四曲屏。全系标配新一代青海湖电池,容量达7000mAh,兼顾轻薄与续航。外观采用三角排列+圆角矩形底座设计,辨识度高。Pro版将搭载2亿像素主摄。

  • 自猎智聘招聘求职Agent发布,全新的智能化、自主化、轻量化交互体验

    4月28日,自猎科技发布"自猎智聘"AI招聘求职应用。该平台基于大模型和深度学习算法,打造L4级全流程自动化智能招聘系统,覆盖企业和求职者两端。企业端可智能执行全流程招聘,降本增效;求职端提供公平客观的求职体验。系统具备高精度人岗匹配、AI数字人智能面试、一键背景调查等功能,实现从筛选到入职的全流程自动化。自猎智聘突破传统招聘工具局限,通过多模态认知架构构建动态企业画像,实现从"功能模块化堆砌"到"目标牵引式自主决策"的范式跃迁。该产品标志着招聘领域正式进入"自主决策"的智能体时代。

  • 王者回归,国内首款面部肤质改善适应症的Ⅲ类械水光「润百颜·玻玻」获批

    华熙生物自主研发的"润百颜·玻玻"水光产品于2025年4月25日正式获批Ⅲ类医疗器械认证,成为国内首个明确"面部肤质改善适应症"的合规水光产品。该产品采用独家Hyature®超纯透明质酸原料,创新融合15mg/mL透明质酸与0.3%利多卡因的科学配方,实现"细胞级"补水,单次注射即可显著提升皮肤含水量,临床数据显示治疗有效率高达94%。此次获批不仅彰显了华熙生物在医美领域的技术实力,更标志着水光市场从野蛮生长向规范化发展的转型。随着监管趋严,Ⅲ类械证产品将加速行业洗牌,推动医美行业向更安全、长效的方向发展。

  • 荣耀400 Pro跑分出炉:预计搭载降频版骁龙8 Gen3平台

    快科技5月2日消息,近日,荣耀 400 系列新机备受关注,荣耀400 Pro现身Geekbench在线数据库,部分规格随之曝光。从数据库信息来看,荣耀400 Pro搭载骁龙 8 Gen3处理器,参与跑分的原型机配备12GB运行内存,其运行安卓15系统,CPU具备8核心,基础频率2.04GHz,不同集群核心频率有所差异,最高达 3.05GHz,配备 Adreno 750 GPU。从芯片的参数规格来看,隶属降频版本的骁龙8 Gen3移动平台。结合此前爆料,荣耀400 Pro亮点颇多。影像方面,后置200MP主摄、50MP长焦镜头,前置50MP自拍镜头,拍照能力值得期待。屏幕为6.7英寸1.5K OLED屏,120Hz

今日大家都在搜的词: