Facebook介绍可对图像和视频进行细分的自我监督学习AI

2021-05-01 16:24 · 稿源： cnbeta

Facebook 今日宣布了与 Inria 合作开发的 DINO 算法，特点是无需对数据进行标记，就能够对 transformers 机器学习模型进行训练。具体说来是，作为计算机视觉领域中最困难的挑战之一，其需要人工智能对图像中的内容进行理解。但 Facebook 介绍的这个新模型，能够在不指定特定目标的情况下，发现和分割图像 / 视频中的对象。

FB DINO 系统能够以无监督的方式细分图像

传统上的细分（Segmentation）操作是在监督学习的情况下执行的，且需要投喂标注了大量注释的示例数据。

在有监督的学习中，算法会在为特定输出注释的输入数据上开展训练，直到它们可以检测到输入和输出结果之间的潜在关系为止。

但在可自我监督学习（DINO）的方案下，系统能够主动对未标记的数据进行分类和处理。

Transformers 使得 AI 模型能够选择性地专注于其输入的一部分，从而使它们能够更有效地进行推理。

而在应用于语音和自然语言处理之前，转换器就已经被用于解决计算机视觉问题、以及图像的分类和检测。

自我专注层（Self-Attention Layers）是所谓的 Vision Transformers 的核心部分，每个空间位置都通过参考其他位置来表示。

这样当查看其它距离可能较远的图像时，转换器就能对整个场景建立起丰富而高级的理解。

通过在相同图像的不同视图上匹配模型输出，DINO 能够有效地发现目标对象和跨图像的共享特征。此外 DINO 可基于视觉属性来连接各种类型，以类似于生物分类的结构，来清楚地分辨不同动物物种。

Facebook 声称，即使不以此为目的而进行设计，DINO 也是识别图像副本的最佳工具之一。展望将来，基于 DINO 的模型，还可用于识别错误信息或版权侵犯行为。

Facebook 在博客中写道：通过在转换器上进行自我监督学习，DINO 为打造创造性的机器学习应用而提供了一个机遇，使得机器能够更深入地理解图像和视频。

目前需要人工标注的数据，已经成为了计算机视觉系统发展的一个主要瓶颈。但通过 DINO 方案，注释的效率可以更高，并将模型用于更大的任务集，且有可能扩展其可识别的概念的数量。

最后，Facebook 今天还详细介绍了一种被称作 PAWS 的新机器学习方案。与此前的半监督方案和新技术相比，该公司的半监督方法具有更好的分类准确度。

值得一提的是，其所需的训练也少了一个数量级（ 1/ 4~12），意味着 PAWS 可能也适合于没有太多标记的图像领域（比如医学分析）。

（举报）

相关推荐
大家在看

关键词：

【腾讯云】11.11云上盛惠！云服务器首年1.8折起，买1年送3个月！

11.11云上盛惠！海量产品 · 轻松上云！云服务器首年1.8折起，买1年送3个月！超值优惠，性能稳定，让您的云端之旅更加畅享。快来腾讯云选购吧！

Docker容器镜像
去看看

Docker容器镜像 60元/15天

爆款产品组合购
去看看

爆款产品组合购低至1元

腾讯云x NVIDIA加速计划
去看看

腾讯云x NVIDIA加速计划最高获赠10万元扶持基金

2核2G云服务器
去看看

2核2G云服务器 112元/1年

查看更多相关信息>>

腾讯云 12-20

广告
Meta将在Facebook和Instagram上标记AI生成的内容

站长之家（ChinaZ.com）4月9日消息:Meta 近日宣布，将在其旗下社交媒体平台 Facebook 和 Instagram 上标记 AI 生成的内容，以提高内容透明度。这一变化将从五月开始实施。据悉，AI 生成的用户内容将带有“Made with AI”（由 AI 生成）的标签，以为其他用户提供更多的背景信息。此举旨在改善用户对内容的理解，并增加透明度。根据 Meta 的声明，AI 修改的内容将通过“检测行业共享的 A

Meta AI头条
AI图像编辑工具Facet AI 实时图像生成，可精确控制图像元素

Facet AI是一款创新的图像编辑工具，它以其独特的功能和用户友好的操作界面，为广告制作和产品图像设计领域带来了革命性的变化。这款工具的核心优势在于其精确控制图像元素的能力，使得用户可以轻松地对图像进行实时编辑和调整。官网地址：https://facet.ai/Facet AI的直观画布操作是其一大亮点。用户可以通过简单的拖拽和调整，实现对图像

Facet AI头条
FACET官网体验入口 AI图像生成和编辑器在线使用地址

FACET 是一款协作式AI图像生成和编辑器，专为专业图像合成提供支持。它提供个性化、私密的AI生成，可根据您的审美进行微调。只需几张样本图片和文本标签，便可以训练一个能理解特定风格的定制AI模型。点击前往FACET官网体验入口谁可以从FACET中受益？FACET适用于艺术家、设计师等创意人士，帮助他们生成个性化艺术品、进行图像编辑和修饰，以及训练定制的AI模型。FACET的�

FACET
MeMenteeBot ：能听懂人话并通过观察自我学习的机器人

MeMenteeBot是一款具有革命性功能的机器人，它能理解人类口头指令，并通过视觉模仿进行自我学习。这款机器人的先进之处在于其端到端的任务执行能力，它可以接收口头命令，并完成复杂的任务。它的出现标志着机器人技术迈向了一个新的阶段，为未来的机器人应用开辟了无限可能。

MeMenteeBot 机器人 AI头条
Adobe图像生成AI “Firefly” 训练集中约有5%为AI图像

Adobe的图像生成AI“Firefly”以其训练集来源自AdobeStock中的图片和视频闻名。美国经济报纸彭博社报道称，Firefly的数据集实际上包含由Midjourney等公司生成的图像。”然，Tushnett教授指出，Firefly学习自Midjourney生成的图像的事实与其声称与其他图像生成AI不同的说法相矛盾。

Firefly Adobe AI头条
facet ai怎么用？AI图片编辑修图工具Facet AI详细使用教程（附产品入口）

产品简介：FacetAI是一款创新的图像编辑工具，以实时图像生成和精确控制图像元素为核心优势，为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制，提高工作效率。侧边栏第二个按钮还支持对生成的图片进行风格，色调，光线的调整，这里就不一一赘述，大家可以根据自己的喜好来调整。

facet AI修图
AI图片编辑工具Facet怎么用？Facet AI详细使用教程（附产品入口）

产品简介：FacetAI是一款创新的图像编辑工具，以实时图像生成和精确控制图像元素为核心优势，为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制，提高工作效率。侧边栏第二个按钮还支持对生成的图片进行风格，色调，光线的调整，这里就不一一赘述，大家可以根据自己的喜好来调整。

Facet
IPAdapter FaceID Plus下载地址 AI图像生成编辑工具使用入口

ComfyUI-IPAdapter-Plus是一个强大的图像生成和编辑工具，专门用于基于一个或多个参考图像进行图像到图像的条件生成。通过文本提示、控制网络和掩码，您可以轻松生成增强图像的各种变体。获取更多详细信息并开始体验图像生成的乐趣，请访问ComfyUI-IPAdapter-Plus官方网站。

IPAdapterFaceIDPlus
ELLA官网体验入口腾讯AI文本到图像语义对齐工具使用介绍

ELLA是一种轻量级方法，可将现有的基于CLIP的扩散模型配备强大的LLM。ELLA提高了模型的提示跟随能力，使文本到图像模型能够理解长文本。ELLA的产品特色通过LLM增强扩散模型的文本对齐能力无需训练U-Net和LLM即可提高模型的提示跟随能力设计了时间感知语义连接器，提取LLM中的时间步相关条件提供了DensePromptGraphBenchmark基准测试，评估文本对图像模型的密集提示跟随能力能够与社区模型和下游工具无缝整合，提高其文本-图像对齐能力为了获取更多关于ELLA的信息和体验该工具，请访问ELLA官网。

ELLA
Stability AI发布CosXL模型图像处理能力更精细

StabilityAI最近推出了CosXL模型，这是一项包括基础版CoXL和增强版EditCosXL的创新技术。这些模型的发布，标志着图像生成和编辑技术的新里程碑，为用户提供了更加强大和精细的图像处理能力。特别是ComfyUI，它还为用户提供了详细的工作流程和指导，帮助用户更加高效和便捷地使用CosXL模型。

CosXL AI头条

Convert Logistics:使用准确可靠的邮政编码检测功能，为用户提供基于其邮编的预计产品交货日期，增强客户体验。

Convert Logistics提供预计产品交货日期的功能，使用先进的机器学习和预测AI技术来确定用户准确的邮政编码，从而提供可靠的产品交货日期预计。通过结合准确的定位和预测的交货日期，您可以增加购物车添加率，并改善用户体验。

物流定位交货日期

Darbee:是一个强大的电子商务工具，利用人工智能为您的Etsy列表生成标题、描述和标签。

Darbee是一个强大的电子商务工具，利用人工智能为您的Etsy列表生成标题、描述和标签。它具有自动化生成列表内容的功能，大大节省了您的时间和精力。Darbee还提供了多种语言选项，方便您在不同的市场中推广您的产品。

电子商务人工智能 Etsy

Assisty.ai:为Shopify商家提供一站式分析平台，跟踪销售、库存和客户行为，改善产品性能，推动业务增长。

Assisty是一种商业智能工具，专为Magento零售商打造。它提供即时洞察力和数据驱动的报告，帮助您做出更明智的决策，提升收入。

商业智能数据分析零售

Naratix:智能自动化AI解决方案，提升电子商务店铺表现

Naratix是一款帮助电子商务公司实现快速扩展的智能自动化AI解决方案。它提供产品描述、产品推荐、数据增强和用户参与增强等功能，帮助用户提升店铺表现。Naratix已帮助1000多家增长最快的电子商务公司取得成功。

电子商务智能自动化 AI解决方案

DuckDuckGo AI Chat:私密人工智能驱动型聊天服务，保护用户隐私。

DuckDuckGo AI Chat 是一种私密聊天服务，它利用先进的人工智能技术提供对话式的交互体验。该服务特别强调用户隐私的保护，不会保存用户的对话内容，也不会利用对话内容进行AI训练。它支持OpenAI的GPT-3.5和Anthropic的Claude聊天模型，为用户提供多样化的回复选项。此外，该服务还通过与模型提供商的协议进一步保护用户隐私，限制了他们对匿名请求数据的使用，并要求在30天内删除所有接收到的信息。

隐私保护人工智能聊天服务

outfitanyone:超高质量的虚拟试穿，适用于任何服装和任何人。

Outfit Anyone 是一个客户端程序，调用接口进行虚拟试穿。该模型不开源，固定且不能上传或修改，仅支持用户上传自己的服装。

虚拟试穿图像处理人工智能

SunoApi:一个非官方的Suno AI客户端，支持音乐生成和获取音乐信息。

Suno API是一个基于Python和Streamlit的非官方Suno AI客户端，目前支持音乐生成和获取音乐信息等功能。它具有内置的维护和激活功能，无需担心令牌过期问题。用户可以设置多个账户信息以供保存和使用。此外，它还支持多语言，如中文、英文、韩语、日语等。

suno-ai suno suno-ai-api

DeepLearing-Interview-Awesome-2024:深度学习算法与大模型面试指南，持续更新的面试题目集合。

DeepLearing-Interview-Awesome-2024 是一个开源的面试题目集合项目，专注于深度学习算法和大模型领域的面试准备。该项目由社区成员共同维护，旨在提供最新的面试题目和答案解析，帮助求职者和研究人员深入理解深度学习领域的前沿技术和应用。它包含了丰富的面试题目，覆盖了大语言模型、视觉模型、通用问题等多个方面，是准备深度学习相关职位的宝贵资源。

深度学习算法面试大模型

PaddleBoat:销售准备平台，帮助销售代表提高冷电话成功率。

PaddleBoat是一个销售准备平台，它通过提供人工智能角色扮演来帮助销售代表提高他们的销售技巧。该平台可以定制角色扮演以匹配买家人物画像，消除拨打电话时的焦虑，同时不浪费潜在客户。它还提供自动电话反馈，包括对异议处理、最佳呼叫实践和每次角色扮演中改进领域的洞察。此外，PaddleBoat能够加速销售卓越，通过实时洞察发现团队的优势和弱点，实施最佳实践，并培养更强的团队呼叫文化。它还最小化了销售代表的上手时间，轻松地将剧本转换为引人入胜的培训程序，创建课程、维基和互动视频，确保代表们准备好赢得交易。

Facebook介绍可对图像和视频进行细分的自我监督学习AI

今日大家都在搜的词：

热文

站长商机