首页 > 业界 > 关键词  > Meta最新资讯  > 正文

Meta发布新AI模型Segment Anything 可检测图像中物体

2023-04-06 10:18 · 稿源:站长之家

站长之家(ChinaZ.com)4月6日 消息:Meta在人工智能方面有很大的野心,但却一直追不上OpenAI、微软甚至是谷歌的步伐。现在,这家公司发布了最新AI模型,可从图像中识别单个物体。

当地时间周三,Meta发布了其新的基于 AI 的 Segment Anything Model (SAM) ,该模型具有识别和分离图像和视频中的特定对象的功能。

目前,市面上已经有不少工具具备从图像中删除不需要的物体的功能,并且使用人工智能模型来查找和替换照片中的物体。从Segment Anything Model演示的测试中,Meta的产品更进了一步。比如,通过使用SAM,用户可以通过点击物体或输入文字提示选中编辑的物体。在测试演示中,输入“猫”这个词后,该工具在一张照片中的几只猫周围绘制了方框。

image.png

image.png

更让人意外的是,Meta开源了SAM模型,并进一步提供了其10亿掩码数据集的完整细节,该公司声称这是“有史以来最大的分段数据集”。这个SA-1B是一个语义分割数据集,它对图像中的每个像素进行分类,从而更容易对照片进行风格化或删除对象。根据Meta的说法,该系统本身在1100万张图像上进行训练,平均每张图像有100个掩码。

根据Meta关于SAM的研究论文指出,数据集使用了“来自与摄影师直接合作的提供商”的图像,但并没有具体说明是哪个提供商。系统训练的一些图像包括人脸和车牌等等。

SAM可以用于AR或VR功能,通过用户的注视来识别物体,这对Meta的AR耳机和眼镜的发展来说非常重要。

据了解,Meta已经在内部使用与SAM类似的技术,用于标记照片、审核违禁内容以及确定向Facebook和Instagram用户推荐哪些帖子等。公司表示,SAM的发布将扩大对这类技术的应用。

Segment Anything Model 网址:https://segment-anything.com/

举报

  • 相关推荐
  • Meta新品发布,技术路线与影目INMO“撞车”,中国智造先行优势凸显

    三星Galaxy S25系列专为学生群体打造,融合AI生产力、影像创作与性能释放。通过Galaxy AI实现智能笔记、实时翻译等功能提升学习效率;搭载多摄系统与AI影像引擎,支持复杂场景拍摄;配备骁龙8芯片和优化散热系统,兼顾游戏娱乐与续航表现。轻薄设计搭配多款配色,满足个性化需求,现可通过教育优惠活动实惠入手。

  • 苹果首款智能眼镜曝光:无显示屏 类似Meta、小米

    虽然苹果开发了配置非常强劲全面的Vision Pro,但苹果也没打算放弃更轻便的智能眼镜。 据名记马克古尔曼(Mark Gurman)最新报告,苹果将在未来12至16个月内推出智能眼镜。 这款产品没有显示屏,定位与Meta、小米等产品类似,配备摄像头、收音和播放,需要连接iPhone实现数据处理。 功能应该跟此前产品都类似,可以实现拍照、录像、听音乐等常规操作。 预计还能通过新版S

  • 亚马逊入局竞逐AR眼镜行业,Meta/谷歌/微美全息以“硬件+生态”双赛道策略领先

    亚马逊正加速布局AR眼镜市场,开发两款产品:面向物流司机的"Amelia"和面向消费者的"Jayhawk"。科技巨头纷纷入局,Meta、谷歌、苹果等均在研发相关产品。中国消费级AR眼镜市场2025年上半年增长显著,销量达26.2万台,同比增长73%。行业预计未来三年规模有望达千亿级别,AR眼镜正从"小众玩具"迈向"大众智能终端"。

  • 双雄联袂登场 世纪华通旗下Century Games确认参展2025东京电玩展

    世纪华通旗下Century Games将携《Whiteout Survival》与《Kingshot》两款游戏亮相东京电玩展2025。展台位于Hall5-C04,面积达300平方米,设有裸眼3D巨屏展示、主题展区及丰富互动活动。两款游戏市场表现强劲:《Whiteout Survival》连续15个月位居中国手游出海收入榜首,《Kingshot》上线后收入快速增长,7月两款游戏包揽中国手游出海收入榜冠亚军。此次参展旨在向全球玩家展示中国游戏的创新实力,拓展国际合作。

  • 腾讯云大数据升级Data+AI能力体系,构建AI-Ready的数据智能平台

    9月17日,腾讯云在数字生态大会上宣布升级大数据产品矩阵Data+AI能力体系,覆盖底层架构、数据平台、数据应用全流程,助力企业应对数据治理、多模态融合与智能化应用等挑战。通过云原生架构、Data+AI一体化和Agent增强,推出TCLake智能数据湖、流湖引擎和企业级搜索ES,提升数据处理效率与智能化水平。WeData平台升级为端到端一体化Data+AI平台,打通数据接入、治理、建模、训练到推理全链路。引入AI+Agent能力,通过Data Agent和ChatBI等创新实践,将智能能力融入数据使用各环节,助力企业释放数据价值,形成差异化AI竞争力。

  • Meta雷朋第三代智能眼镜亮相在即,三星/微美全息领航消费级XR助推行业增长!

    Meta与雷朋合作的第三代智能眼镜渲染图曝光,预计今年发布,定价300-500美元。新一代眼镜强调AI功能升级,支持实时物体识别与场景理解。Meta还将在9月Connect大会推出首款带显示屏的智能眼镜Hypernova,售价约800美元,并配套手势控制腕带。与此同时,三星确认将于9月推出XR头显Project Infinite,售价约1800-2900美元。智能眼镜市场正迎来爆发期,2025年Q1全球出货量激增82.3%,中国增长116.1%。微美全息等企业加速布局,行业期待未来2-3年迎来真正拐点。

  • 魅族发布Flyme Auto 2车载系统:全新小窗模式 支持AI读心术

    今日下午,魅族召开发布会,正式推出Flyme Auto 2车载系统,全面升级AI交互体验。 据介绍,Flyme Auto 2车载系统设计美学再度升级,新增实况桌面3D质感、全场景一镜到底、Alive壁纸、自定义桌面插件等等视觉与交互功能。 该系统强化Aicy大卡片、全新小窗模式,提供了更轻量更高效的交互方式。

  • AI日报:可灵AI发布数字人新功能;腾讯混元新技术给大模型 “去油”;抖音上线AI求真功能

    AI日报今日聚焦多项技术突破:可灵AI推出图片转视频功能,腾讯混元SRPO技术提升图像真实感,IBM开源文档处理模型Granite-Docling-258M。Meta发布带屏AI眼镜Ray-Ban,DeepSeek论文登《Nature》封面。OpenAI新增GPT-5思考时长调节功能,抖音上线“AI求真”辟谣工具,通用DeepResearch开源模型性能超越国际知名模型。

  • 魅族StarV Snap AI拍照眼镜发布:售价1999 元起

    今日下午魅族22新品发布会上,一款名为StarV Snap的AI拍摄眼镜成为全场焦点。这款突破传统智能眼镜形态的产品以39克超轻人因工学设计惊艳亮相,通过50项人体工程学优化实现重量均匀分散,彻底解决"丑、重、硌"的行业痛点,鼻梁、耳部无压迫感的设计支持全天候舒适佩戴。 外观采用经典框型设计,磨砂质感镜框不仅时尚百搭适配多种脸型,更具备防指纹沾染特性,

  • 购机选Intel还是AMD?终结选择困难!不同场景对比避坑攻略

    文章对比了英特尔酷睿Ultra 5 225H与AMD锐龙AI 9 H365处理器在大学生学习场景中的表现。测试显示,英特尔在续航和AI创作效率方面优势明显:图书馆场景下续航多50%,视频剪辑等AI任务处理速度快40%,且价格更低。结论指出,酷睿Ultra平台更适合需要长续航、高效AI应用且注重性价比的学生群体,是大学四年的明智选择。

今日大家都在搜的词: