首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta发布Emu Video和Emu Edit 将颠覆文本到视频生成和图像编辑领域

2023-11-17 09:57 · 稿源:站长之家

**划重点:**

1. 🎨 **Emu Edit**:革新图像编辑,通过文本指令实现精细控制,类似Adobe Photoshop的"生成填充"功能,支持局部和全局编辑、背景添加或移除、颜色和几何变换、物体检测和分割。

2. 🎥 **Emu Video**:简化文本到视频生成,基于扩散模型,能够通过文本、图像或两者的输入生成视频,为社交媒体平台用户提供创造动画贴纸和GIFs的可能性。

3. 🌐 **影响力**:这些AI工具将影响用户在社交媒体平台上与图像和视频互动的方式,潜在应用包括创作自己的动态贴纸和编辑照片,拓展了艺术性可能性。然而,工具仍在开发中,尚无发布时间表。

站长之家(ChinaZ.com)11月17日 消息:Facebook和Instagram的母公司Meta宣布在人工智能内容创作和编辑工具领域取得了重大进展,推出两项创新性工具:Emu Edit用于图像编辑,Emu Video用于视频生成。

Emu Edit:提升图像编辑标准

image.png

Emu Edit的首次突破旨在为用户提供对图像编辑的精细控制。它采用一种独特的图像处理方式,用户通过文本指令进行图像修改,类似于Adobe Photoshop目前提供的“生成填充”功能。

该工具能够执行多种编辑任务,包括局部和全局编辑、添加或删除背景、颜色和几何变换、物体检测以及分割。Emu Edit的目标是仅修改与编辑请求相关的区域,确保不影响无关的像素。

image.png

Meta的研究人员在最新公告中强调:“主要目标不应只是生成一个可信的图像,而应专注于精确地修改仅与编辑请求相关的像素。”

Emu Edit是通过一个包含1000万合成样本的庞大数据集进行训练的,使其能够在指令忠实度和图像质量方面提供高质量的结果。例如,用户可以输入文本“Aloha!”以添加到棒球帽的图像中,而Emu Edit会在不修改帽子本身的情况下完成此任务。

体验网址:https://top.aibase.com/tool/emu-video

Emu Video:简化文本到视频生成

image.png

除了图像编辑,Meta的AI团队还在改进视频生成。基于扩散模型的Emu Video工具为文本到视频生成提供了简便方法。它对各种输入做出响应,包括仅文本、仅图像或两者兼而有之。

视频生成过程包括创建一个由文本提示条件化的图像,然后根据该图像和另一个文本提示创建视频。如果您有兴趣尝试新的Emu Video编辑工具,您可以立即尝试在线演示。体验网址:https://top.aibase.com/tool/emu-edit

image.png

对内容创作的深远影响

这些创新将改变用户在社交媒体平台上与图像和视频互动的方式。例如,用户可以创建自己的动画贴纸和GIF,或编辑照片而无需依赖诸如Photoshop之类的复杂工具。然而,值得注意的是,这些工具仍在开发中,尚未正式宣布在Facebook和Instagram等平台上的发布时间。

对于Meta来说,Emu提供的工具代表着生成式AI领域不断增长的动力,与Make-A-Video和AI图像生成器DALL-E等现有项目相辅相成。作为公司在辅助AI方面不断挑战极限的一部分,它旨在提供直观的功能,为普通用户拓展艺术可能性。

Emu Video和Emu Edit的发布也是Meta推动其应用程序家族中用户参与的战略的一部分。通过平台内编辑和创作,Meta将用户更深入地锁定在其社交生态系统中。

尽管这些新工具承诺更多创造力,但围绕AI伦理和内容监管仍然存在问题。与其他生成模型一样,Emu将需要监管以防止潜在的滥用。Meta表示,在快速发展的生成式AI进程中,安全措施仍然是首要任务。

目前,Emu Video和Emu Edit仍在开发中,尚无公开发布时间表。但Meta公司积极进行的生成式AI研究表明,更具变革性的社交媒体体验可能在不久的将来实现。随着AI合成的成熟,用户或许有朝一日可以像发送短信一样直观地产生专业级别的内容。

项目网址:

https://emu-video.metademolab.com/

https://emu-edit.metademolab.com/

举报

  • 相关推荐
  • 见证巅峰对决,掠夺者携旗舰装备亮相IEM成都赛场

    2025年IEM成都站总决赛在金融城演艺中心举行,宏碁掠夺者作为全球独家PC合作伙伴,为赛事提供高性能比赛设备,其全新IP多多DODO亮相见证。掠夺者通过顶尖硬件支持职业选手稳定发挥,并构建完整电竞生态:既赞助顶级职业赛事IEM,又举办大众赛事掠夺者联赛及女子电竞赛PL Girls,覆盖从职业到草根玩家。双十一期间推出战斧9、战斧Neo S、刀锋8三款主力设备,助力玩家征战赛场。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 文远知行斩获美国以外首张城市级L4 Robotaxi商运牌照,中东规模化布局提速

    11月10日,文远知行获阿联酋政府批准,取得全球首张城市级L4自动驾驶商业化运营牌照,可在阿布扎比开展无安全员的Robotaxi服务。这标志着其在中东实现纯无人运营落地。服务将通过Uber等平台上线,计划2026年车队扩至千台,2030年达数万台。凭借近百万公里数据与政府支持,公司将在阿布扎比实现单车盈亏平衡,并以此为起点推动全球智慧交通发展。

  • 被AI引用才是真的流量:写出让GPT、Gemini主动引用的AI搜索友好型内容(实操清单 + 工具推荐)

    本文系统介绍生成式引擎优化(GEO)的核心方法,帮助内容从“给人看”升级为“AI友好型”。关键策略包括:1.采用结构化写作框架,在开头设置可直接回答问题的“黄金段落”;2.运用分步清单、数据标注、FAQ等模块提升内容引用率;3.通过多平台同步分发增加曝光;4.使用AIBase等工具量化监测内容被AI引用的频率与场景,并给出5天落地执行表。

  • 国内首个!火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

    火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系,同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点,确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度,通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制,为数字化转型深水区企业提供选型优化依据,推动产业智能化进入精准量化新阶段。

今日大家都在搜的词: