Meta 宣布推出用于视频生成和图像编辑的 Emu Video 和 Emu Edit 两款人工智能模型

2023-11-17 08:40 · 稿源：站长之家

站长之家(ChinaZ.com) 11 月 17 日消息:社交媒体巨头 Meta 公司于 11 月 16 日在其博客文章中宣布推出最新的人工智能（AI）模型，用于内容编辑和生成。

Meta，元宇宙，Facebook

这两款 AI 驱动的生成模型，分别为 Emu Video 和 Emu Edit，代表了行业的一大进步。Emu Video 利用 Meta 之前的 Emu 模型，能够基于文本和图像输入生成视频剪辑。而 Emu Edit 则专注于图像处理，承诺在图像编辑方面提供更高的精确度。

这些模型目前仍处于研究阶段，但 Meta 表示，初步结果显示出对创作者、艺术家和动画师等的潜在应用价值。

据 Meta 博客文章所述，Emu Video 采用了「分解式」训练方法，将训练过程分为两步，使模型能够对不同输入做出响应：「我们将过程分成两步：首先根据文本提示生成图像，然后根据文本和生成的图像生成视频。这种『分解式』或分步的视频生成方法让我们能够高效地训练视频生成模型。」该模型还可以基于文本提示「动画化」图像。Meta 称，Emu Video 不依赖于「深层级模型串联」，仅使用两个扩散模型就能以 16 帧每秒的速度生成 512x512 像素、四秒长的视频。

专注于图像处理的 Emu Edit，将使用户能夠进行去除或添加图像背景、执行色彩和几何变换，以及对图像进行局部和全局编辑。

Meta 在其声明中指出：「我们认为，主要目标不应仅仅是产生一个『可信』的图像。相反，模型应专注于精确地改变与编辑请求相关的像素。」该公司声称其模型能够精确地遵循指令：「例如，在棒球帽上添加『Aloha!』文字时，帽子本身应保持不变。」

Meta 使用计算机视觉任务训练了 Emu Edit，数据集包括 1000 万张合成图像，每张图像都有输入图像、任务描述以及目标输出图像。「我们相信这是迄今为止同类中最大的数据集，」公司表示。

Meta 最新发布的 Emu 模型是用 11 亿条数据训练的，包括 Facebook 和 Instagram 用户分享的照片和标题，Meta 首席执行官马克·扎克伯格在 9 月的 Meta Connect 活动中透露。

监管机构正在密切关注 Meta 基于 AI 的工具，导致这家科技公司采取了谨慎的部署方式。Meta 最近透露，它不允许政治活动和广告商使用其 AI 工具在 Facebook 和 Instagram 上创建广告。然而，该平台的一般广告规则并未特别涉及 AI。

（举报）

相关推荐

关键词：

Meta雷朋第三代智能眼镜亮相在即，三星/微美全息领航消费级XR助推行业增长！

Meta与雷朋合作的第三代智能眼镜渲染图曝光，预计今年发布，定价300-500美元。新一代眼镜强调AI功能升级，支持实时物体识别与场景理解。Meta还将在9月Connect大会推出首款带显示屏的智能眼镜Hypernova，售价约800美元，并配套手势控制腕带。与此同时，三星确认将于9月推出XR头显Project Infinite，售价约1800-2900美元。智能眼镜市场正迎来爆发期，2025年Q1全球出货量激增82.3%，中国增长116.1%。微美全息等企业加速布局，行业期待未来2-3年迎来真正拐点。

Meta 智能眼镜雷朋联名
知名互联网meme原型狗柴犬PON去世表情包你用过吗

日前，网络热门表情包不可以色色”的原型柴犬Pon”被其主人在Instagram上宣布离世，享年17岁。其主人在ins上用Pon的口吻表示：大家好！非常感谢你们给我的爱，明天11点我将穿过彩虹桥，虽然有点难过，但我的心里充满了幸福，我会带着大家笑容的记忆，踏上全新的旅程你们的邻里偶像PON。” 据了解，PON是一只出生于2008年1月6日的日本埼玉北部柴犬。

柴犬Pon 不可以色色网络表情包
Lamett乐迈石晶产品硬核测评：零醛、防水、防霉三大指标重新定义健康家

北京楼市新政落地，市场活力提升，新房装修需求升温。文章重点指出选购健康安全建材的关键指标：甲醛释放量少、防水防潮性强、防霉防蛀能力过硬。通过高温甲醛实验、防水实验和防霉防蛀实验，对比测试了乐迈石晶板等主流建材，结果显示其具有零甲醛释放、滴水不侵、无惧虫霉的优异性能，重新定义了健康建材的标准。

北京楼市新政新房装修需求家装建材选择
Lamett乐迈石晶快装秘籍！让武汉20年老宅“一键焕新”

武汉黄先生一家140平米老宅经《梦想改造家》节目改造后焕然一新。设计师采用零甲醛添加的Lamett乐迈石晶地板，解决潮湿问题，提升防滑耐磨性能。空间重构实现客卧对调、主卧休闲办公一体化，厨房岛台增进家人互动。全屋原木色调营造温馨氛围，兼顾健康与美学，为五口之家打造安全舒适的生活环境。

老宅改造空间规划梦想改造家
别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

开发者分享模型选择心路历程：从盲目试错到数据驱动。曾因追求低价模型导致成本飙升，后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3，基于价格、上下文长度和代码能力等数据，最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型，只有“最适合”的模型，建议开发者善用专业工具进行数据驱动决策，避免隐性成本。
Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

面对琳琅满目的大模型API，开发团队常陷入选择困境。文章指出，2024年既是机遇也是挑战的时代，闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例，前者综合能力强适合多语言场景，后者在代码生成和成本控制上优势明显。建议开发者明确需求，通过实际测试验证模型表现，理性选择最适合的方案。

大模型API 模型选型 AI开发
荐AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects功能；Kimi K2-0905 上线 Discord

本文汇总了AI领域最新动态：苹果与谷歌合作，计划在Siri中引入Gemini AI技术；OpenAI向免费用户开放Projects功能，提升任务管理效率；谷歌推出免费Gemini CLI工具，集成GitHub提升开发效率；OpenAI估值飙升至5000亿美元，二级股票售出103亿美元；苹果自研AI搜索引擎“世界知识问答”计划2026年上线；月之暗面发布Kimi K2-0905模型，提升编程与创意写作能力；Raycast推出Cursor Agent插件优化代码编辑；谷歌发布nano banana官方Prompt模板，助力创意设计。

AI Siri Gemini
荐AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台 Statsig；ElevenLabs 音效模型更新

抖音打击AI技术滥用行为，对违规商家和达人采取下架、清退等措施。ElevenLabs音效模型升级至版本2，支持长音频和无缝循环。OpenAI收购数据分析平台Statsig，增强产品迭代能力。亚马逊推出Lens Live AI功能，实时扫描购物。谷歌AI推出Stax工具，帮助开发者评估大语言模型。WordPress推出AI工具Telex简化网站构建。Liquid AI发布LFM2-VL模型，提升手机视觉语言处理。苹果开源FastVLM与MobileCLIP2模型，优化边缘设备AI应用。MetaGPT推出自动化测试工具RealDevWorld，精准率达92%。瑞士发布开源大模型Apertus，提供多语言处理能力。

AI技术滥用抖音公告虚假商品展示
检出率超95%，支持透明液体识别！INDEMIND脏污识别：更快、更准、更智能

扫地机器人技术正从“盲目清扫”向“智能识别”进化。INDEMIND推出立体视觉污染识别方案，能精准识别固态、液态、粉末及混合四类污渍，检出率超95%。该技术结合智能决策引擎，实现自主调整清洁参数，避免二次污染。同时提供单目、双目及三目模块矩阵，支持快速适配升级，推动行业迈向精准化智能清洁新阶段。

脏污识别技术扫地机器人进化清洁逻辑定义
当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

某跨境电商CTO复盘会上展示：GPT-5 Standard处理百万级商品描述时，费用比Gemini 2.5 Flash-Lite高35%，响应速度慢0.8秒。大模型选型面临参数迷雾、场景错配、隐藏成本三重困境。AIbase选型对比平台通过真实数据测试，提供透明价格拆解和性能雷达图，帮助规避预算陷阱。实测显示GPT-5在合同逻辑分析准确率高3.2%，而Gemini表格解析速度快40%、月总成本低26%。工具可动态追踪官方调价，生成定制化决策报告，用数据替代经验主义，提升技术选型效率。

大模型选型参数迷雾场景错配

今日大家都在搜的词：

热文

3 天
7天

Meta 宣布推出用于视频生成和图像编辑的 Emu Video 和 Emu Edit 两款人工智能模型

Meta雷朋第三代智能眼镜亮相在即，三星/微美全息领航消费级XR助推行业增长！

知名互联网meme原型狗柴犬PON去世表情包你用过吗

Lamett乐迈石晶产品硬核测评：零醛、防水、防霉三大指标重新定义健康家

Lamett乐迈石晶快装秘籍！让武汉20年老宅“一键焕新”

别再猜了！手把手教你用数据选择AI模型，我的Gemini 2.5 Flash-Lite vs DeepSeek选型心得

Gemini 2.5 Flash-Lite与 DeepSeek-V3 深度对比：谁在性价比上更胜一筹？

荐AI日报：苹果明年推出SiriAI搜索；OpenAI放开ChatGPT Projects功能；Kimi K2-0905 上线 Discord

荐AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台 Statsig；ElevenLabs 音效模型更新

检出率超95%，支持透明液体识别！INDEMIND脏污识别：更快、更准、更智能

当GPT-5遇上Gemini 2.5，谁更适合你的业务？这份对比报告说了算

今日大家都在搜的词：

热文

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

《亮剑》开播20周年：今日全弹幕重返B站

华为发布首款MateTV：超薄设计搭载旗舰性能 8999元起预售

AI日报：抖音打击AI技术滥用行为；OpenAI 收购开发数据分析平台

三大运营商回应是否支持eSIM版iPhone：需等待通知

蜜雪冰城上半年净赚27亿：全球门店破5.3万家加速全球化布局

雷军凌晨3点就奔赴阅兵观礼台佩戴小米AI眼镜前往

首发iPhone 17系列！苹果Apple Store官方旗舰店入驻抖音商城

AI日报：腾讯开源3D世界模型HunyuanWorld-Voyager；即梦AI系列

华为MatePad Mini外观公布支持蜂窝网络通话功能

小米澎湃OS 3首批Beta版更新“3.0.0.24”发布

AI日报：AI内容新规正式生效；美团推出开源大模型LongCat；阶跃

人去世了朋友圈会消失？微信客服回应：建议保持账号活跃

腾讯回应被米哈游起诉：没正式程序不能违规提供QQ用户资料

苹果新增三款过时产品 iPhone 8 Plus被列为复古产品

抖音升级AI内容标识功能上线两项核心功能

站长商机