Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

2025-05-06 11:10 · 来源： AIbase基地

Runway于近日正式推出Gen-4References功能，为其AI视频生成模型Gen-4新增了图像一致性参考能力。这一功能允许用户通过上传参考图像，提取人物、场景或风格特征，并在生成内容中保持高度一致性，支持多张图像混合生成，为AI视频创作带来了前所未有的控制力与创意自由。

核心功能解析:多图像融合与一致性控制

Gen-4References的核心在于其强大的图像参考与风格嵌入能力。用户可上传1至3张参考图像，包括照片、生成图像、3D模型或自拍等，指定人物、场景或风格元素，生成内容将严格遵循这些特征。例如，创作者可通过一张角色肖像确保其在不同场景、角度或光线条件下的外观一致，或通过多张图像组合，创造复杂的统一场景，如将特定角色置于指定背景中。社交媒体反馈显示，该功能在生成连续性人物造型和场景风格方面表现优异，显著提升了叙事视频的质量。

广泛应用场景，赋能创意工作流

Gen-4References支持多种创作场景，从电影制作到广告设计，再到数字艺术，均能受益于其一致性控制能力。例如，创作者可利用参考图像生成不同角度的镜头，保持角色或物体的视觉连贯性，适用于长篇叙事内容或产品展示视频。此外，该功能支持将生成的图像作为视频首帧，进一步扩展到动态内容创作，为视觉特效（GVFX）工作流提供了便捷 худ2⁊ Runway还展示了Gen-4References在时尚设计中的应用，允许用户上传服装图像，生成相同风格的新设计，极大地简化了设计流程。AIbase编辑团队认为，这一功能将大幅降低AI视频创作的门槛，让更多创作者能够将复杂想法转化为高质量视频内容。

技术优势与行业影响

Gen-4References依托Runway Gen-4模型的先进技术，无需繁琐的微调或额外训练，即可实现高保真度生成。Runway表示，未来还将进一步增强风格支持和物体类型兼容性，为创作者提供更强大的工具。行业专家指出，Gen-4References解决了AI视频生成中长期存在的角色与场景一致性难题，与OpenAI的Sora等竞品相比，Runway在专业创意工具领域的专注使其更贴合影视制作和广告行业的需求。Runway与Lionsgate等行业巨头的合作也表明，Gen-4References有望推动AI在主流电影制作中的应用。

AI视频创作的新篇章

Runway Gen-4References的发布标志着AI视频生成技术迈向成熟，特别是在一致性和可控性方面的突破。AIbase编辑团队预计，随着该功能的全面推广和社区反馈的持续优化，Gen-4References将成为影视、广告及内容创作领域的标杆工具。Runway还计划在未来几周内向更多付费用户开放此功能，届时将进一步激发全球创作者的想象力。AIbase将持续跟踪Runway Gen-4及其生态的最新进展，为读者带来前沿报道。

相关推荐

荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

本文介绍了AI领域最新动态：1)腾讯开源Hunyuan-GameCraft框架，可快速生成高质量游戏视频；2)Nano-Banana模型在图像编辑领域超越FLUX+Kontext；3)字节开源基于Qwen 3 32B的328亿参数M3-Agent-Control模型；4)Kimi将推出PPT生成功能；5)阿里1688将上线"诚信通AI版"会员服务；6)苹果智能家居中心推迟至2026年发布；7)万兴科技接入GPT-5；8)全球AI独角兽达498家，总估值2.7万亿美元；9)谷歌为Slides和

AI 游戏视频生成腾讯混元
微软发布AI截图工具，截图一键转PPT

微软电脑管家推出全新“智能圈选”功能，通过AI技术实现截图内容的智能识别与重构。用户只需圈选截图区域，即可一键完成文字提取、多语言翻译及PPT转换等操作，大幅提升办公和学习效率。该功能支持100多种语言，保留原始格式，并能智能修复遮挡内容，彻底改变了传统截图处理方式。

微软电脑管家智能圈选截图处理
微算法科技（NASDAQ: MLGO）研发区块链可逆图像隐藏算法，提高信息隐藏完整性

数字时代的信息安全需求催生了图像隐藏技术的持续演进。传统算法在密钥管理、抗攻击能力和认证机制方面存在固有缺陷，难以满足医疗、金融等领域的严苛安全要求。区块链技术的分布式账本特性与智能合约机制，为构建可信认证体系提供了新路径。微算法科技（NASDAQ: MLGO）研发区块链可逆图像隐藏算法(Blockchain-based Reversible Image Steganography Algorithm，BRISA)，通过融合混沌加�

图像隐藏技术区块链技术信息安全
荐400亿美图，靠AI重生了

今年以来股价暴涨超255%，市值重回400多亿，美图（1357.HK）这家老牌影像工具公司，在被资本市场遗忘多年后，正以一种极为凶猛的姿态重返牌桌。在AIGC（生成式人工智能）千帆竞发、百模大战仍在烧钱换未来的混沌格局中，美图是将滚烫的AI概念，真正熬成了一碗利润浓汤的企业。半年净赚近4个亿、付费用户突破1500万的业绩，无疑证明它饮到了这波AI应用大爆发的“头啖汤

AIGC 生成式人工智能美图股价
399元！小米智能摄像机4变焦版开启众筹：支持9倍混合变焦

小米智能摄像机4变焦版今天正式开启众筹，众筹价399元，建议零售价469元。这是小米首款室内变焦相机，配备800万像素超广角和500万像素超长焦镜头，支持9倍混合变焦（3倍光学变焦），看得远、细节清。支持4K超清画质，搭配ISP图像传感器与超微光全彩技术，昏暗环境也能保持彩色画面，夜间无光则启用10颗940nm红外补光灯，10米夜视距离且无红曝，不干扰睡眠。

小米智能摄像机 4K超清画质变焦相机
智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

智谱今天，终于发了AutoGLM2.0。想一想，AutoGLM1.0的版本，距离我第一次首发写他们，已经过去快10个月了。那个时候，他们掀起了一波Agent热潮，甚至连A股都出现了智谱概念股，他们也开启了Agent的另一条支线，用视觉的方式来操控原有设备。当时，我对着我的手机说:我29号要去一趟深圳，你帮我定个罗湖地铁站附近的酒店，预算600元以内，大床房。然后，我的手机，就像

文章搜索核心标签 AutoGLM2.0
华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

华为在深圳以“大Mate大不同”为主题举办智慧屏新品技术发布会，正式推出旗舰新品——华为智慧屏 MateTV。这款搭载HarmonyOS5系统的智慧屏，首次配备鸿鹄Vivid独立画质芯片，并创新引入灵犀悬浮触控技术，支持双指悬浮多指操控，传输延迟低至8ms，重新定义了电视交互体验。设计方面，华为智慧屏 MateTV采用超薄机身设计，厚度仅36.9mm，配合99%屏占比实现“零贴墙”安装效

华为智慧屏 HarmonyOS5 鸿鹄Vivid芯片
荐AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatcher；我国首个法律垂直大模型“小包公”发布

本文介绍了AI领域最新动态：1)腾讯推出电影级音频生成工具AudioGenie，展现中国AI技术实力；2)阿里开源多模态智能体WebWatcher，突破现有系统局限；3)港大等高校联合推出3D建模技术OmniPart，实现模型组件独立性和清晰度；4)Meta发布无需标注数据的通用图像处理模型DINOv3；5)国内首个法律大模型"小包公"发布；6)ChatGPT移动端收入突破20亿美元；7)安卓厂商借鉴灵动岛设计，新芯片推动AI功能普及；8)欧洲AI公司推出仅94MB的超小模型；9)Claude Code新增编程教学模式；10)AI技术被滥用于电商恶意退款；11)IDC报告显示2024年中国AI公有云服务市场将快速增长。

AI 腾讯AudioGenie 电影级音效
都是做AI应用，为什么「美图」能持续让用户付费

这是《窄播Weekly》的第65期，本期我们关注的商业动态是:美图抓住AI带来的战略机遇，让付费订阅收入实现了连续增长，超过广告业务成为主要营收支柱。美团在8月18日发布的最新一份财报显示，其2025年上半年总收入为18亿元，经调整归母净利润为4.7亿元，同比增长71.3%。其中，以付费订阅为主的影像与设计产品业务收入达到13.5亿元，同比增长45.2%，占总收入的74%。这背后是

AI战略机遇付费订阅收入美图财报
Agentic AI落地加速：迈富时企业级智能体中台2.0，让 AI Agent成为企业 “数字员工”

Gartner将代理型AI列为2025年十大战略趋势之首，预测到2028年15%的日常工作决策将由自主智能代理完成。迈富时发布的AI-Agentforce2.0企业级智能体中台，通过"技术赋能+场景落地"双轮驱动，构建了从模型能力到业务价值的闭环。该平台具有三大核心优势：1）"模型-应用-开发平台"三位一体架构；2）ChatBox+工作流双开发模式，支持快速部署；3）企业级安全保障，满足金融等敏感行业需求。已在保险、零售、供应链等领域实现规模化应用，最高提升37%销售转化率。该方案让企业能低成本打造专属数字员工团队，真正释放代理型AI的战略价值。

今日大家都在搜的词：

热文

3 天
7天

Runway发布图像一致性参考功能 Gen-4 References 支持提取人物、场景或风格特征及多图混合

荐AI日报：腾讯混元开源Hunyuan-GameCraft；最强图像编辑器nano-banana发布；字节开源Agent专用模型 M3-Agent-Control

微软发布AI截图工具，截图一键转PPT

微算法科技（NASDAQ: MLGO）研发区块链可逆图像隐藏算法，提高信息隐藏完整性

荐400亿美图，靠AI重生了

399元！小米智能摄像机4变焦版开启众筹：支持9倍混合变焦

智谱AI发布AutoGLM 2.0 - 首个为手机而生的通用Agent。

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

荐AI日报：腾讯推音效生成工具AudioGenie；阿里推智能体WebWatcher；我国首个法律垂直大模型“小包公”发布

都是做AI应用，为什么「美图」能持续让用户付费

Agentic AI落地加速：迈富时企业级智能体中台2.0，让 AI Agent成为企业 “数字员工”

今日大家都在搜的词：

热文

AI日报：钉钉十周年发布8.0版本；微信悄悄上线AI播客；阿里开源

20周年版iPhone或成苹果首款曲面机：一体环绕玻璃+曲面机身

iPhone17Pro爆料汇总：橙色版本成最大亮点或迎12项升级

vivo Y500定档9月1日发布配备8200mAh巨无霸电池

24. 98 万起标配华为ADS 4！鸿蒙智行智界 R7 车型上市

美团回应网友质疑退款未到账：已修复信息滞后每笔退款可追溯

字节跳动回应即将发布AI眼镜：早期探索阶段没有发布计划

华为鸿蒙智行新款智界 S7 车型上市：：售价22.98万起

华为首款鸿蒙MateTV发布支持灵犀触控交互等功能

罗永浩官宣明日将公布TBT项目号称九年磨一面

《黑神话:钟馗》先导预告公布游戏科学宣布《黑神话:钟馗》官网

REDMI Note 15 Pro+首搭自研澎湃T1S芯片

AI日报：DeepSeek V3.1正式发布；企业微信5.0推出全新AI能力；

罗永浩泡面1小时销售额超280万 2小时售罄：一桶近10元

黑神话官号更名系列游戏将开启宏大篇章

AI日报：智谱AI发布AutoGLM 2.0；腾讯元宝接入腾讯视频；字节发

AI日报：即梦上线智能多帧功能；可灵2.1首尾帧升级；钉钉推语音

华为nova 14系列宣布限时降价至高优惠500元

站长商机