首页 > AI头条  > 正文

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

2025-05-06 11:10 · 来源: AIbase基地

Runway于近日正式推出Gen-4References功能,为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像,提取人物、场景或风格特征,并在生成内容中保持高度一致性,支持多张图像混合生成,为AI视频创作带来了前所未有的控制力与创意自由。

image.png

核心功能解析:多图像融合与一致性控制

Gen-4References的核心在于其强大的图像参考与风格嵌入能力。用户可上传1至3张参考图像,包括照片、生成图像、3D模型或自拍等,指定人物、场景或风格元素,生成内容将严格遵循这些特征。例如,创作者可通过一张角色肖像确保其在不同场景、角度或光线条件下的外观一致,或通过多张图像组合,创造复杂的统一场景,如将特定角色置于指定背景中。社交媒体反馈显示,该功能在生成连续性人物造型和场景风格方面表现优异,显著提升了叙事视频的质量。

广泛应用场景,赋能创意工作流

Gen-4References支持多种创作场景,从电影制作到广告设计,再到数字艺术,均能受益于其一致性控制能力。例如,创作者可利用参考图像生成不同角度的镜头,保持角色或物体的视觉连贯性,适用于长篇叙事内容或产品展示视频。此外,该功能支持将生成的图像作为视频首帧,进一步扩展到动态内容创作,为视觉特效(GVFX)工作流提供了便捷 худ2⁊ Runway还展示了Gen-4References在时尚设计中的应用,允许用户上传服装图像,生成相同风格的新设计,极大地简化了设计流程。AIbase编辑团队认为,这一功能将大幅降低AI视频创作的门槛,让更多创作者能够将复杂想法转化为高质量视频内容。

技术优势与行业影响

Gen-4References依托Runway Gen-4模型的先进技术,无需繁琐的微调或额外训练,即可实现高保真度生成。Runway表示,未来还将进一步增强风格支持和物体类型兼容性,为创作者提供更强大的工具。行业专家指出,Gen-4References解决了AI视频生成中长期存在的角色与场景一致性难题,与OpenAI的Sora等竞品相比,Runway在专业创意工具领域的专注使其更贴合影视制作和广告行业的需求。Runway与Lionsgate等行业巨头的合作也表明,Gen-4References有望推动AI在主流电影制作中的应用。

AI视频创作的新篇章

Runway Gen-4References的发布标志着AI视频生成技术迈向成熟,特别是在一致性和可控性方面的突破。AIbase编辑团队预计,随着该功能的全面推广和社区反馈的持续优化,Gen-4References将成为影视、广告及内容创作领域的标杆工具。Runway还计划在未来几周内向更多付费用户开放此功能,届时将进一步激发全球创作者的想象力。AIbase将持续跟踪Runway Gen-4及其生态的最新进展,为读者带来前沿报道。

  • 相关推荐
  • AI日报:腾讯混元开源Hunyuan-GameCraft;最强图像编辑器nano-banana发布;字节开源Agent专用模型 M3-Agent-Control

    本文介绍了AI领域最新动态:1)腾讯开源Hunyuan-GameCraft框架,可快速生成高质量游戏视频;2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext;3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型;4)Kimi将推出PPT生成功能;5)阿里1688将上线"诚信通AI版"会员服务;6)苹果智能家居中心推迟至2026年发布;7)万兴科技接入GPT-5;8)全球AI独角兽达498家,总估值2.7万亿美元;9)谷歌为Slides和

  • 微软发布AI截图工具,截图一键转PPT

    微软电脑管家推出全新“智能圈选”功能,通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域,即可一键完成文字提取、多语言翻译及PPT转换等操作,大幅提升办公和学习效率。该功能支持100多种语言,保留原始格式,并能智能修复遮挡内容,彻底改变了传统截图处理方式。

  • 微算法科技(NASDAQ: MLGO)研发区块链可逆图像隐藏算法,提高信息隐藏完整性

    数字时代的信息安全需求催生了图像隐藏技术的持续演进。传统算法在密钥管理、抗攻击能力和认证机制方面存在固有缺陷,难以满足医疗、金融等领域的严苛安全要求。区块链技术的分布式账本特性与智能合约机制,为构建可信认证体系提供了新路径。微算法科技(NASDAQ: MLGO)研发区块链可逆图像隐藏算法(Blockchain-based Reversible Image Steganography Algorithm,BRISA),通过融合混沌加�

  • 400亿美图,靠AI重生了

    今年以来股价暴涨超255%,市值重回400多亿,美图(1357.HK)这家老牌影像工具公司,在被资本市场遗忘多年后,正以一种极为凶猛的姿态重返牌桌。 在AIGC(生成式人工智能)千帆竞发、百模大战仍在烧钱换未来的混沌格局中,美图是将滚烫的AI概念,真正熬成了一碗利润浓汤的企业。半年净赚近4个亿、付费用户突破1500万的业绩,无疑证明它饮到了这波AI应用大爆发的“头啖汤

  • 399元!小米智能摄像机4变焦版开启众筹:支持9倍混合变焦

    小米智能摄像机4变焦版今天正式开启众筹,众筹价399元,建议零售价469元。 这是小米首款室内变焦相机,配备800万像素超广角和500万像素超长焦镜头,支持9倍混合变焦(3倍光学变焦),看得远、细节清。 支持4K超清画质,搭配ISP图像传感器与超微光全彩技术,昏暗环境也能保持彩色画面,夜间无光则启用10颗940nm红外补光灯,10米夜视距离且无红曝,不干扰睡眠。

  • 智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

    智谱今天,终于发了AutoGLM2.0。 想一想,AutoGLM1.0的版本,距离我第一次首发写他们,已经过去快10个月了。 那个时候,他们掀起了一波Agent热潮,甚至连A股都出现了智谱概念股,他们也开启了Agent的另一条支线,用视觉的方式来操控原有设备。 当时,我对着我的手机说:我29号要去一趟深圳,你帮我定个罗湖地铁站附近的酒店,预算600元以内,大床房。 然后,我的手机,就像

  • 华为首款鸿蒙MateTV发布 支持灵犀触控交互等功能

    ​华为在深圳以“大Mate大不同”为主题举办智慧屏新品技术发布会,正式推出旗舰新品——华为智慧屏 MateTV。这款搭载HarmonyOS5系统的智慧屏,首次配备鸿鹄Vivid独立画质芯片,并创新引入灵犀悬浮触控技术,支持双指悬浮多指操控,传输延迟低至8ms,重新定义了电视交互体验。 设计方面,华为智慧屏 MateTV采用超薄机身设计,厚度仅36.9mm,配合99%屏占比实现“零贴墙”安装效

  • AI日报:腾讯推音效生成工具AudioGenie;阿里推智能体WebWatcher;我国首个法律垂直大模型“小包公”发布

    本文介绍了AI领域最新动态:1)腾讯推出电影级音频生成工具AudioGenie,展现中国AI技术实力;2)阿里开源多模态智能体WebWatcher,突破现有系统局限;3)港大等高校联合推出3D建模技术OmniPart,实现模型组件独立性和清晰度;4)Meta发布无需标注数据的通用图像处理模型DINOv3;5)国内首个法律大模型"小包公"发布;6)ChatGPT移动端收入突破20亿美元;7)安卓厂商借鉴灵动岛设计,新芯片推动AI功能普及;8)欧洲AI公司推出仅94MB的超小模型;9)Claude Code新增编程教学模式;10)AI技术被滥用于电商恶意退款;11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

  • 都是做AI应用,为什么「美图」能持续让用户付费

    这是《窄播Weekly》的第65期,本期我们关注的商业动态是:美图抓住AI带来的战略机遇,让付费订阅收入实现了连续增长,超过广告业务成为主要营收支柱。 美团在8月18日发布的最新一份财报显示,其2025年上半年总收入为18亿元,经调整归母净利润为4.7亿元,同比增长71.3%。其中,以付费订阅为主的影像与设计产品业务收入达到13.5亿元,同比增长45.2%,占总收入的74%。 这背后是

  • Agentic AI落地加速:迈富时企业级智能体中台2.0,让 AI Agent成为企业 “数字员工”

    Gartner将代理型AI列为2025年十大战略趋势之首,预测到2028年15%的日常工作决策将由自主智能代理完成。迈富时发布的AI-Agentforce2.0企业级智能体中台,通过"技术赋能+场景落地"双轮驱动,构建了从模型能力到业务价值的闭环。该平台具有三大核心优势:1)"模型-应用-开发平台"三位一体架构;2)ChatBox+工作流双开发模式,支持快速部署;3)企业级安全保障,满足金融等敏感行业需求。已在保险、零售、供应链等领域实现规模化应用,最高提升37%销售转化率。该方案让企业能低成本打造专属数字员工团队,真正释放代理型AI的战略价值。

今日大家都在搜的词: