首页 > 业界 > 关键词  > facebook最新资讯  > 正文

Facebook介绍可对图像和视频进行细分的自我监督学习AI

2021-05-01 16:24 · 稿源: cnbeta

Facebook 今日宣布了与 Inria 合作开发的 DINO 算法,特点是无需对数据进行标记,就能够对 transformers 机器学习模型进行训练。具体说来是,作为计算机视觉领域中最困难的挑战之一,其需要人工智能对图像中的内容进行理解。但 Facebook 介绍的这个新模型,能够在不指定特定目标的情况下,发现和分割图像 / 视频中的对象。

FB DINO 系统能够以无监督的方式细分图像

传统上的细分(Segmentation)操作是在监督学习的情况下执行的,且需要投喂标注了大量注释的示例数据。

在有监督的学习中,算法会在为特定输出注释的输入数据上开展训练,直到它们可以检测到输入和输出结果之间的潜在关系为止。

但在可自我监督学习(DINO)的方案下,系统能够主动对未标记的数据进行分类和处理。

Transformers 使得 AI 模型能够选择性地专注于其输入的一部分,从而使它们能够更有效地进行推理。

而在应用于语音和自然语言处理之前,转换器就已经被用于解决计算机视觉问题、以及图像的分类和检测。

自我专注层(Self-Attention Layers)是所谓的 Vision Transformers 的核心部分,每个空间位置都通过参考其他位置来表示。

这样当查看其它距离可能较远的图像时,转换器就能对整个场景建立起丰富而高级的理解。

通过在相同图像的不同视图上匹配模型输出,DINO 能够有效地发现目标对象和跨图像的共享特征。此外 DINO 可基于视觉属性来连接各种类型,以类似于生物分类的结构,来清楚地分辨不同动物物种。

Facebook 声称,即使不以此为目的而进行设计,DINO 也是识别图像副本的最佳工具之一。展望将来,基于 DINO 的模型,还可用于识别错误信息或版权侵犯行为。

Facebook 在博客中写道:通过在转换器上进行自我监督学习,DINO 为打造创造性的机器学习应用而提供了一个机遇,使得机器能够更深入地理解图像和视频。

目前需要人工标注的数据,已经成为了计算机视觉系统发展的一个主要瓶颈。但通过 DINO 方案,注释的效率可以更高,并将模型用于更大的任务集,且有可能扩展其可识别的概念的数量。

最后,Facebook 今天还详细介绍了一种被称作 PAWS 的新机器学习方案。与此前的半监督方案和新技术相比,该公司的半监督方法具有更好的分类准确度。

值得一提的是,其所需的训练也少了一个数量级( 1/ 4~12),意味着 PAWS 可能也适合于没有太多标记的图像领域(比如医学分析)。

举报

  • 相关推荐
  • Mini LED时代即将终结!MacBook Pro将升级为OLED屏

    苹果爆料人Mark Gurman透露,MacBook Pro会率先升级OLED,时间是明年下半年,然后MacBook Air再跟进OLED,时间是2028年,届时MacBook Pro和MacBook Air都将全面迈入OLED时代。 Mark Gurman指出,苹果旗下的iPad系列、MacBook机型全部都将启用OLED屏幕,包括iPad mini、MacBook Pro、iPad Air和MacBook Air,且大概率会按此顺序推进。PS:入门款iPad暂无搭载OLED的计划。 值得注意的是,MacBo

  • 微算法科技(NASDAQ MLGO):以隐私计算区块链筑牢多方安全计算(MPC)安全防线

    微算科技开发的隐私计算区块链将区块链技术融入多方安全计算(MPC),构建安全可信的分布式计算平台。通过区块链共识机制、加密算法和智能合约,对MPC参与方身份验证、数据加密存储、任务执行及结果验证等环节进行保护,确保数据“可用不可见”。该技术显著提升数据隐私保护和计算可靠性,在金融、医疗、政务等领域实现跨主体数据安全协作,释放数据价值。

  • 未来iPad mini/iPad Air/MacBook都将升级OLED屏:LCD退场

    苹果正在研发搭载OLED显示屏的iPad mini、iPad Air、MacBook Pro和MacBook Air机型,苹果已在iPad Pro中采用OLED屏,并计划在未来数月及数年内将OLED推广到更多设备上,从而淘汰LCD屏幕。 具体来看,iPad mini最快会在2026年配备OLED屏,同时会提升防水性能,新款iPad mini也因此涨价100美元。 至于iPad Air,其商用OLED的时间要晚于iPad mini,爆料称2026年春季亮相的iPad Air将继续使用LCD屏幕,但后续

  • 双11买MacBook最优选出炉 网友发现京东价低天猫近千元

    双11期间,京东和天猫推出iPhone17系列优惠。京东提供300元以旧换新补贴、12期免息,256G版可叠加500元国家补贴,覆盖地区比天猫多5个。iPhone17 Pro系列在京东可享700元以旧换新补贴,优惠超千元。MacBook方面,京东MacBook Air M4直降1600元并叠加10%政府补贴,优惠超2000元;MacBook Pro M5享1000元直降,天猫无此优惠。京东还备有百万现货,配送更快。建议果粉打开京东APP搜索"苹果惊喜券"参与活动。

  • 性价比最高的MacBook来了!苹果把iPhone处理器塞进笔记本里

    本月苹果推出了全新MacBook Pro、iPad Pro及Vision Pro,这些设备均搭载新一代M5芯片。除了上述新品,苹果还有一款MacBook已在路上,许多人期待能在节前看到。 行业分析师郭明錤透露,苹果正研发一款更具性价比的13英寸笔记本电脑,这款产品旨在对标Chromebook,提升MacBook的整体销量,新MacBook将搭载A18 Pro芯片,这颗芯片去年在iPhone 16 Pro上首发搭载。 在Mac产品中使用iPhone芯片,从�

  • 苹果藏了一手!M5 MacBook Pro隐形升级:SSD速度提升211%

    苹果在前不久正式推出了新款M5 MacBook Pro,不过在外观上缺乏明显变化,可能给人留下了苹果只是升级了M5芯片就完事”的印象。 然而最新的测试显示,其固态硬盘速度也有着大幅提升,对比M4 MacBook Pro,读写速度最高竟提升了211%。 根据Max Tech的对比测试,M5和M4 MacBook Pro在内部布局、单风扇和单热管散热方案上保持一致,都采用了两颗NAND闪存芯片以最大化SSD性能。 不过,在

  • Hugging Face创始人x小红书技术副总裁对谈:开源、AI与技术人的成长

    小红书科技与Red++ Academy在1024程序员节举办直播,技术副总裁凯奇、语音模型负责人风龙与Hugging Face联合创始人Thomas Wolf围绕三大核心观点展开AMA对话:AI编程正成为基础能力;开源是技术发展的核心引擎;实现有"人味"的AGI路径清晰但仍需攻克创造力、复杂环境感知等难题。讨论覆盖开源价值、AGI发展瓶颈、AI人味化实践,强调技术人需提升问题定义与框架性解决能力,并分享了AI编码提效、学习新技术的方法。直播展现小红书从文本模型到语音模型的开源布局,旨在降低技术使用门槛,推动社区共进。

  • 00后担大梁交大本科生在计算机安全顶级会议上实现突破,打造大模型全方位安全分析底座

    上海交大本科生徐菲悦为第一作者的论文《大型语言模型鲁棒性与对齐的多维评估框架》被IEEE S&P 2026录用。该研究提出“安全魔方”评估体系,构建覆盖攻击、防御与判定三大维度的多指标框架,系统化刻画LLM安全性,新增攻击稳定性、跨模型迁移性等关键度量,弥补传统单一指标不足,为研究比较、安全基线制定及监管审查提供可操作的通用量表。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 宝藏新品登场!WIKO Hi MateBook 14锐龙版预售:颜艺双全,福利拉满

    WIKO Hi MateBook 14锐龙版于10月24日开启预售,起售价4999元。配备14英寸2.8K OLED触控屏,支持120Hz刷新率、100% sRGB色域及专业级色准,搭载AMD锐龙7 H255处理器与Radeon 780M显卡,性能强劲。设计上采用波点艺术键盘与1.32kg轻薄机身,支持AI智慧功能及跨设备协同,内置70Wh电池满足全天移动办公需求,兼顾高颜值与实用性,适合职场人士与创作者。

今日大家都在搜的词: