中国 AI 研究提出全新多模态学习框架Meta-Transformer

2023-07-24 11:53 · 稿源：站长之家

站长之家（ChinaZ.com）7月24日消息:传统的深度学习模型在处理不同数据形式时存在巨大的模态差异，需要进行大量的工作来构建一个能够处理各种输入形式的统一网络。不同数据模态之间存在显著差异，通常使用不同的网络拓扑来独立编码每种数据模态。然而，这需要耗费时间和精力。

为了解决这个问题，中国香港中文大学和上海 AI 实验室的研究人员提出了一种全新的多模态学习框架，称为 Meta-Transformer。Meta-Transformer 使用相同的参数集同时对十二种不同的模态进行编码，实现了更加集成的多模态学习方法。

Meta-Transformer 的框架包括三个组件:数据到序列标记的模态专家、跨模态提取表示的模态共享编码器，以及用于下游任务的任务特定头部。通过这种简单而有效的方法，Meta-Transformer 可以高效地训练任务特定和模态通用的表示。

研究人员在多个标准数据集上进行了大量的研究，结果表明 Meta-Transformer 在处理多模态数据方面表现出色，仅使用来自 LAION-2B 数据集的图片进行预训练就能在各种多模态学习任务中超越现有技术。

总之，Meta-Transformer 是一个独特的多模态学习框架，通过使用相同的参数集同时提取多个模态的表示，开辟了统一多模态学习的新方向。这一研究为统一各种模态的框架的发展提供了新的可能性。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
荐Transformer要变Kansformer？用了几十年的MLP迎来挑战者KAN

多层感知器，也被称为全连接前馈神经网络，是当今深度学习模型的基础构建块。MLP的重要性无论怎样强调都不为过，因为它们是机器学习中用于逼近非线性函数的默认方法。

Transformer MLP 人工智能
Mamba 模型在视频理解任务中展现出强劲潜力打败Transformer

来自南京大学、上海人工智能实验室、复旦大学、浙江大学的研究队发布了一项关于视频理解的开创性工作。该研究全面审视了Mamba模型在建模中的多重角色，提出了针对14种模型/模块的VideoMambaSuite，并对其在12项视频理解任务中进行了深估。综合实验结果显示，Mamba模型在视频理解领域具潜在的优势和多样化的角色，为未来视频理解研究提供了有力的推动和参考价值。

Mamba AI头条
Meta 发布新多token预测技术，使AI模型速度提升3倍

Meta、EcoledesPontsParisTech和UniversitéParis-Saclay的研究人员在一项研究中提出了一种改进AI大型语言模型准确性和速度的方法，即通过同时预测多个token。这与自回归语言模型的经典结构相悖，后者旨在一次预测一个token。它保留了大部分LLM架构，可以与Transformer块的其他优化技术兼容。

AI模型 Meta
Meta 推出新的 AI 工具，帮助品牌提升广告效果

Meta近期推出了一系列新的生成式AI工具，旨在帮助广告商自动化和扩大广告意的多样性，这是其在Instagram和Facebook等平台上实现广告活动成功的关键。该公司还宣布将通过新的分层定价模式，扩大其MetaVerified订阅计划覆盖的国家范围。”公司在一篇博客文章中承诺扩大覆盖范围。

Meta AI工具
扎克伯格称 Meta 需要数年才能从生成式 AI 赚钱

在Meta的首季度财报电话会议上，CEO马克・扎克伯格向投资者表示，生成式AI的热潮已经到来，但不要指望它能很快带来利润。Meta公司净利润在上个季度已经达到120亿美元，营收为365亿美元，但未来其营收增长有望放缓，同时在AI和元宇宙方面的支出也创下历史新高。但现在似乎很明显，时尚AI眼镜也有一个有意义的市场无需显示屏。

Meta 生成式AI AI头条
荐「代理人战争」！微软、OpenAI 、谷歌、Meta用AI Agent疯狂搞钱

【新智元导读】为了搞钱，微软、OpenAI、谷歌和Meta纷纷瞄准Agent这片蓝海，各顶尖高校也紧随其后。Agent才是商业学术两开花的未来!大模型发展至今早已火成了一个「概念」。这种结构允许直观地将复杂的行为拼凑在一起，从增强了用户可访问性和系统灵活性。

OpenAI AI Meta
Meta AI官网体验入口 AI助手全功能使用指南方法教程介绍

MetaAI是一款功能强大的AI助理，利用Meta的先进AI技术为用户提供各种生产力工具。它能够帮助您完成各种任务，如创建备忘单、润色电子邮件写作、回答问题等，并具有图像生成功能，根据您的文字描述生成相应的图像。要了解更多详细信息并开始您的智能助手之旅，请访问MetaAI官方网站。

MetaAI
Meta 在 WhatsApp 中加入实时AI图像生成功能

当用户在与MetaAI的聊天中开始输入文本到图像的提示时，将看到随着添加更多关于想创建的内容的细节，图像如何变化。在Meta分享的示例中，一个用户输入了提示:“想象一场在火星上进行的足球比赛。这一新功能是Meta在其所有应用程序中推出AI功能的一部分，包括WhatsApp、Instagram、Facebook和Messenger。

WhatsApp Meta AI图像生成
写真视频击败Sora？人大自研全新多模态大模型Awaker 1.0震撼登场

在人工智能领域，人大系初创公司智子引擎近日发布了一款名为Awaker1.0的全新多模态大模型，标志着向通用人工智能迈出了重要一步。该模型在写真视频效果上超越了Sora，展现了其在视觉生成方面的卓越能力。Awaker1.0在理解侧和生成侧都实现了效果突破，有望加速多模态大模型行业的发展，最终让人类实现AGI。

Awaker1.0 AI头条 Sora
Meta AI 首席科学家：未来 10 年智能手机将过时

据MetaAI的首席人工智能科学家YannLeCun透露，未来10至15年内，智能手机将被增强现实眼镜和手环所取代。LeCun表示:“我们最后可能需要的是智能虚拟助手，帮助我们在日常生活中。他们期待着将其普及程度提高到与智能手机一样普遍，进一步开拓医学和技术进步的新局面。

Meta 智能手机 AI头条

今日大家都在搜的词：

热文

3 天
7天

中国 AI 研究提出全新多模态学习框架Meta-Transformer

今日大家都在搜的词：

热文

站长商机