首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta 宣布推出用于视频生成和图像编辑的 Emu Video 和 Emu Edit 两款人工智能模型

2023-11-17 08:40 · 稿源:站长之家

站长之家(ChinaZ.com) 11 月 17 日 消息:社交媒体巨头 Meta 公司于 11 月 16 日在其博客文章中宣布推出最新的人工智能(AI)模型,用于内容编辑和生成

Meta,元宇宙,Facebook

这两款 AI 驱动的生成模型,分别为 Emu Video 和 Emu Edit,代表了行业的一大进步。Emu Video 利用 Meta 之前的 Emu 模型,能够基于文本和图像输入生成视频剪辑。而 Emu Edit 则专注于图像处理,承诺在图像编辑方面提供更高的精确度。

这些模型目前仍处于研究阶段,但 Meta 表示,初步结果显示出对创作者、艺术家和动画师等的潜在应用价值。

据 Meta 博客文章所述,Emu Video 采用了「分解式」训练方法,将训练过程分为两步,使模型能够对不同输入做出响应:「我们将过程分成两步:首先根据文本提示生成图像,然后根据文本和生成的图像生成视频。这种『分解式』或分步的视频生成方法让我们能够高效地训练视频生成模型。」该模型还可以基于文本提示「动画化」图像。Meta 称,Emu Video 不依赖于「深层级模型串联」,仅使用两个扩散模型就能以 16 帧每秒的速度生成 512x512 像素、四秒长的视频。

专注于图像处理的 Emu Edit,将使用户能夠进行去除或添加图像背景、执行色彩和几何变换,以及对图像进行局部和全局编辑。

Meta 在其声明中指出:「我们认为,主要目标不应仅仅是产生一个『可信』的图像。相反,模型应专注于精确地改变与编辑请求相关的像素。」该公司声称其模型能够精确地遵循指令:「例如,在棒球帽上添加『Aloha!』文字时,帽子本身应保持不变。」

Meta 使用计算机视觉任务训练了 Emu Edit,数据集包括 1000 万张合成图像,每张图像都有输入图像、任务描述以及目标输出图像。「我们相信这是迄今为止同类中最大的数据集,」公司表示。

Meta 最新发布的 Emu 模型是用 11 亿条数据训练的,包括 Facebook 和 Instagram 用户分享的照片和标题,Meta 首席执行官马克·扎克伯格在 9 月的 Meta Connect 活动中透露。

监管机构正在密切关注 Meta 基于 AI 的工具,导致这家科技公司采取了谨慎的部署方式。Meta 最近透露,它不允许政治活动和广告商使用其 AI 工具在 Facebook 和 Instagram 上创建广告。然而,该平台的一般广告规则并未特别涉及 AI。

举报

  • 相关推荐
  • 见证巅峰对决,掠夺者携旗舰装备亮相IEM成都赛场

    2025年IEM成都站总决赛在金融城演艺中心举行,宏碁掠夺者作为全球独家PC合作伙伴,为赛事提供高性能比赛设备,其全新IP多多DODO亮相见证。掠夺者通过顶尖硬件支持职业选手稳定发挥,并构建完整电竞生态:既赞助顶级职业赛事IEM,又举办大众赛事掠夺者联赛及女子电竞赛PL Girls,覆盖从职业到草根玩家。双十一期间推出战斧9、战斧Neo S、刀锋8三款主力设备,助力玩家征战赛场。

  • 软件定义汽车的质量革命:AI Agent如何终结座舱OTA的“路测噩梦”

    在“软件定义汽车”浪潮下,智能汽车竞争核心转向座舱体验、ADAS功能及OTA迭代质量。然而,传统软件测试模式成本高、耗时长,难以覆盖复杂场景,易导致漏洞。AI驱动的“无人测试”通过大模型与智能体技术实现三大突破:需求自主解析与测试规划、GUI自主探索与自愈维护、智能诊断与根因分析。这将催生“人机协同”新范式,测试工程师角色转向质量策略师。到2027年,超80%企业将集成AI测试工具,汽车行业2025年成为转型关键节点。

  • 颠覆Diffusion局限!Utopai双模型耦合架构,攻克AI影视长叙事核心难题

    Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • 新Siri或明年春季发布 苹果公司或引入谷歌Gemini大模型 AI技术

    苹果因自研大模型项目遇瓶颈,决定引入谷歌Gemini大模型升级Siri,计划每年支付约10亿美元获取定制化Gemini 2.5 Pro使用权。该模型拥有1.2万亿参数,将全面负责Siri的信息摘要、任务规划及复杂指令执行等核心功能,支持多模态交互和超长文本处理。升级版Siri预计2026年春季随iOS 26.4推送,后续将在WWDC大会展示进一步整合。苹果选择谷歌主要因成本优势、长期合作基础及Gemini领先性能。

  • 菁彩Vivid搭载车量超百万,携手车企迎来车载应用新里程碑!

    2025年11月5日,世界超高清视频产业联盟在深圳举办UWA+峰会,宣布中国自主三维音频标准“菁彩声”(Audio Vivid)车载应用装机量突破100万台。该标准基于AI技术,支持7阶HOA渲染与128轨实时处理,解码延迟低于80ms,实现三维空间精准定位与“黄金听音位”个性化体验。已覆盖鸿蒙智行、奇瑞等十余家车企29款车型,获IEC国际标准认证,与Dolby AC-4等并列全球四大三维音频标准。通过构建“标准-内容-终端”生态,推动中国音频产业从技术领先迈向市场引领。

  • 品牌AI搜索监控实战手册:你的企业在ChatGPT眼中是什么样子?

    某互联网大厂品牌总监分享:投入200万SEO使"企业级CRM"关键词在Google排名第一,但用户用ChatGPT询问"推荐适合中国企业的CRM系统"时,AI回答中根本没有该品牌。更值得警惕的是,竞品不仅被提及,还被AI用"性价比高""用户体验好"等正面词汇描述。这揭示2025年品牌营销最大盲区:企业不知道AI如何"看待"自身品牌。 数据显示超40%年轻用户开始使用AI搜索作为主要信息渠道,而绝大多数企业对自己在AI平台的"形象"一无所知。文章提出GEO品牌监控概念,通过覆盖度、推荐强度、信息质量三个维度量化品牌在AI搜索中的影响力,并给出五步实施流程:建立监控基线、竞品对标分析、设置持续机制、深度洞察挖掘、数据驱动优化。通过真实案例说明,系统化GEO优化能在3个月内提升品牌提及率33个百分点,证明AI搜索时代的品牌竞争已从"被看见"升级为"被AI信任"。

  • 文远知行斩获美国以外首张城市级L4 Robotaxi商运牌照,中东规模化布局提速

    11月10日,文远知行获阿联酋政府批准,取得全球首张城市级L4自动驾驶商业化运营牌照,可在阿布扎比开展无安全员的Robotaxi服务。这标志着其在中东实现纯无人运营落地。服务将通过Uber等平台上线,计划2026年车队扩至千台,2030年达数万台。凭借近百万公里数据与政府支持,公司将在阿布扎比实现单车盈亏平衡,并以此为起点推动全球智慧交通发展。

  • 国内首个!火山引擎推出融合国家级智库理论与大规模实战验证的 Data Agent 评测体系

    火山引擎推出国内首个融合国家智库理论框架与大规模实战验证的数据智能体评测体系,同步发布《2025数据智能体实践指南》。该体系直面传统评测重技术轻业务、预设答案难适配动态场景、局部能力检验不足三大痛点,确立业务关联性、可操作性与前瞻性设计原则。覆盖分析洞察、可视化呈现、鲁棒性三大核心维度,通过151道测试题量化智能体能力并划分达标/工业可用/专业研究三级标准。采用标准化闭环流程与自动化评分机制,为数字化转型深水区企业提供选型优化依据,推动产业智能化进入精准量化新阶段。

  • 信锐助力TCL获 “2025中国IDC未来企业大奖联接领军者”优秀奖!

    10月17日,TCL空调办公网络智能连接与体验升级项目在IDC中国CIO峰会获“2025未来企业连接领军者”优秀奖。该项目依托信锐“AI+网络自动驾驶”理念,通过全网智能2.0与小信GPT方案重构企业网络管理模式,实现从感知、分析到决策的智能闭环,助力TCL实现20+维度数据采集、7*24小时AI调优及自然语言交互运维,推动企业数字化转型升级。

今日大家都在搜的词: