EPFL联合苹果开源人工智能框架4M

2023-12-18 14:41 · 稿源：站长之家

要点:
瑞士洛桑联邦理工学院（EPFL）与苹果的研究人员共同开源了名为4M的人工智能框架，旨在训练跨足多个模态和任务的多模态基础模型。
为了提高视觉领域的可伸缩性和多样性，研究团队采用了一种策略，通过训练单一集成的Transformer编码器-解码器，实现了大规模多模态遮蔽建模目标。
4M框架通过使用模态特定的分词器，能够将各种格式的输入，包括文本、边界框、图片或神经网络特征等，转换成离散标记的集合或序列，从而实现了单一Transformer对各种模态的训练，提高了兼容性、可伸缩性和参数共享。

站长之家（ChinaZ.com）12月18日消息:瑞士联邦理工学院（EPFL）与苹果的研究人员合作开发的4M框架在人工智能领域引起了广泛关注。该框架的核心目标是训练多模态基础模型，能够跨足多个模态和任务，以提高视觉处理的可伸缩性和多样性。在自然语言处理领域，大型语言模型(LLMs)的训练已经变得流行，但在视觉领域，仍然需要创建同样灵活和可扩展的模型。为了克服这些障碍，研究团队提出了一种训练单一Transformer编码器-解码器的策略，该策略使用了一种名为“Massively Multimodal Masked Modeling”(4M)的方法。

项目地址:https://4m.epfl.ch/

该方法通过结合遮蔽建模和多模态学习的优点，实现了强大的跨模态预测编码能力和共享场景表示。4M通过使用模态特定的分词器，能够将不同格式的输入转换成集合或序列的标记，从而使单一Transformer可以用于文本、边界框、图片或神经网络特征等各种模态的训练。这种标记化的方法不仅提高了模型的兼容性和可伸缩性，还避免了使用任务特定的编码器和头部，使得Transformer能够在任何模态下保持完全参数共享。

值得注意的是，4M框架在训练效率方面也取得了成功。它通过利用输入和目标遮蔽，即从所有模态中随机选择少量标记作为模型输入和另一组作为目标，实现了对大量模态的高效训练目标。这种策略在防止计算成本随模态数量增加而急剧增加的同时，还允许在不同和大规模数据集上进行训练，而无需多模态/多任务注释。

总的来说，4M框架通过使用多模态遮蔽建模目标，实现了可控生成模型的训练，这使得模型能够根据任何模态进行条件化。这为用户意图的多样表达和各种多模态编辑任务提供了可能。通过对4M框架性能的深入分析，研究团队展示了其在许多视觉任务和未来发展中的巨大潜力。这一研究不仅对于提高视觉处理模型的灵活性和性能至关重要，也为人工智能领域的未来发展提供了有益的启示。

（举报）

相关推荐
大家在看

关键词：

人工智能

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
日本岸田首相将宣布国际框架，规范生成式人工智能

日本首相岸田文雄将在即将于5月初举行的经济合作与发展组织会议上宣布一个用于规范和使用生成式人工智能的国际框架。预计将有40多个国家参与，日本旨在在创建国际人工智能规则方面取得领先地位。视频中将介绍OP作为一种有用的技术，用于识别虚假信息。

生成式人工智能
美英宣布合作，共同关注人工智能安全与测试

美国和英国于周一宣布了一项新的合作伙伴关系，共同关注人工智能安全科学，针对即将到来的下一代版本引发的日益关注的问题。美国商务部长吉娜・雷蒙多和英国科技部长米歇尔・多纳兰在华盛顿签署了一项谅解备忘录，共同开发先进的AI模型测试，这是继去年11月在布莱切利公园举办的AI安全峰会上宣布承诺后的进展。“那些后果可能是灾难性的，因此我们对某些模型被用于这种能力必须有零容忍。

人工智能
部分品牌开始禁止广告公司使用人工智能

近日一份新报告显示，越来越多的公司开始担心广告商将生成式人工智能融入其工作流程。在这场人类艺术家与生成式人工智能之间的“冷战”中，企业们成为了意想不到的盟友。更新后的指南现在建议企业在与广告公司的协议中包含关于人工智能和同意的条款，公司似乎开始遵循这一建议。

人工智能
为什么大家都选择“第五届深圳国际人工智能展”?

作为展示人工智能最新成果和前沿技术的重要窗口，第五届深圳国际人工智能展（简称“GAIE”）将于2024年5月29—31日在深圳会展中心（福田）举办。本届展会以“智创未来•价值链接”为主题，将为公众和业界人士呈现一场科技与智慧交织的专业化盛宴。政府指导引领提升展会权威自2020年成功举办以来，深圳国际人工智能展历届受到了国家与省市各级政府相关职能部门的重�
秀域：人工智能助力按摩理疗，打造健康新选择

颈椎病、肩周问题、腰椎间盘突出症、腰肌劳损、膝关节问题等多发于老年群体，属于典型的“老年病”，但随着现代人们生活习惯与工作方式的改变，这些“老年病”开始向年轻化发展，不少正值壮年的职场精英也开始出现颈椎、腰椎问题。大家可以回想一下，自己周围有没有颈、肩、腰、腿不舒服的亲戚朋友呢?答案是一定有。这一创新为健康理疗行业的发展开辟了广阔的可能性，激发了业界对未来的无限遐想。

颈椎病肩周问题腰椎间盘突出症
人工智能是把“双刃剑” 审慎应对科技潜在危害

2023年11月1日，全球首届人工智能（AI）安全峰会在英国开幕，马斯克在峰会上提出:应该建立“第三方裁判”来监督开发人工智能的公司，这个裁判将观察领先的AI公司在做什么，并在必要时发出警报。马斯克表示，政府在制定监管规则之前需要深入了解AI的发展。他把人工智能称为一把“双刃剑”，认为它对人类有益，但同时也存在危险。英国最近发表的一份声明，由28个国家�

人工智能安全 AI监督人类机器合作
研究：人工智能在提供情感支持方面优于人类

在快节奏的现代生活中，真正感到被倾听和理解是一件罕见的事情。许多人并没有从周围的人那里得到他们需要的情感支持、共鸣和认可。这种分辨出正确类型的回应的能力很可能促成了其积极影响。

人工智能 AI头条
马斯克预测人工智能将在明年超越人类智能

站长之家（ChinaZ.com）4月9日消息:亿万富翁企业家埃隆・马斯克表示，只要供应电力和硬件能够满足日益强大的技术需求，新的人工智能模型的能力将在明年底超越人类智能。他在与挪威国家银行投资管理首席执行官尼古拉・塔根进行的一次访谈中预测称:“我猜测，我们将会在明年底左右拥有比任何一个人类更聪明的人工智能。” 马斯克在 Tesla、X 和 SpaceX 等公司担任首席执行

马斯克人工智能 AI头条
OpenAI CEO 寻求阿联酋迪拜加入全球人工智能计划

OpenAICEOSamAltman最近前往阿联酋，提出了建立一个全球性政府和私人利益相关方联盟来资助、支持和供应人工智能产业的构想。Altman在本周会见了几位阿联酋官员和投资者，讨论了他们以及其他人如何共同努力以抵消人工智能基础设施所带来的巨额成本。即使英伟达预计仅今年就将三倍以上生产其H100和H200加速器，分析师警告称，需求可能会持续超过供应。

OpenAI AI头条
苹果开发出能看懂屏幕上下文的人工智能技术ReALM

苹果开发出了一项能够实时理解和识别用户屏幕上显示内容的人工智能技术无需依赖屏幕截图或图像数据输入。这项技术被称为ReALM，它使得在与用户交流的过程中，智能助手能够看到用户所看到的一切内容，并理解用户当前正在进行的活动，从随时提供帮助。当结合其他最近的苹果研究论文，允许“一次性”响应——即AI可以从单个提示中获得答案——这表明苹果仍在大力投资于AI助手领域不仅仅依赖外部模型。

苹果 ReALM AI头条

今日大家都在搜的词：

热文

3 天
7天

EPFL联合苹果开源人工智能框架4M

今日大家都在搜的词：

热文

站长商机