首页 > 业界 > 关键词  > Segment最新资讯  > 正文

经典卡尔曼滤波器改进视频版「分割一切」,网友:好优雅的方法

2024-11-25 09:00 · 稿源: 量子位公众号

Meta的视频版分割一切——Segment Anything Model2(SAM2),又火了一把。因为这一次,一个全华人团队,仅仅是用了个经典方法,就把它的能力拔到了一个新高度——任你移动再快,AI跟丢不了一点点!例如在电影《1917》这段画面里,主角穿梭在众多士兵之中,原先的SAM2表现是这样的:嗯

......

本文由站长之家合作伙伴自媒体作者“量子位公众号”授权发布于站长之家平台,本平台仅提供信息索引服务。由于内容发布时间超过平台更新维护时间,为了保证文章信息的及时性,内容观点的准确性,平台将不提供完全的内容展现,本页面内容仅为平台搜索索引使用。需阅读完整内容的用户,请查看原文,获取内容详情。

举报

  • 相关推荐
  • AI日报:百度发布文心5.0;可灵2.5Turbo模型上线“首尾帧”功能;微博推出 VibeThinker-1.5B

    本期AI日报聚焦多项技术突破:OpenAI推出GPT-5.1,提升对话自然度与响应速度;百度发布原生全模态大模型文心5.0,支持跨文本图像生成;微博开源VibeThinker-1.5B模型,以低成本实现高效推理;可控视频生成模型新增首尾帧控制功能;李飞飞团队推出商用3D世界生成工具Marble;东北大学开源多语言翻译模型支持60种语言;谷歌Gemini语音功能升级实现更自然交互;阿里启动“千问”项目对标ChatGPT,全面布局C端AI应用竞争。

  • 特斯拉Model Y L上线外放电功能 最高可输出2200瓦功率

    特斯拉Model Y L车型正式开放外放电功能,用户通过OTA升级至2025.32.300及以上版本并更新Tesla APP至4.50.5及以上即可激活。该功能最高输出2200瓦功率,可同时为电饭煲、热水壶、电火锅等多种电器供电,满足户外露营、自驾旅行和工作等多种用电需求,彻底解决户外用电难题,堪称“移动大电源”。

  • AI日报:上海首例涉AI提示词著作权案宣判;Kimi K2 Thinking发布;中文图像编辑新王UniWorld-V2发布

    今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。

  • 50人团队、1亿美元ARR,AI PPT还在续写“神话”?

    AI 生成 PPT 可以说是去年的热门赛道,尤记得关于这类产品是否具有真正竞争力的热烈讨论,而2025年9月份的数据显示,赛道头部的明星创企 Gamma 却已经默默接近3000万的访问量。并且,今天官宣了由 a16z 领投的6800万美元 B 轮融资,融资后估值达到21亿美元。 而不仅 Gamma,根据 AI 产品榜数据,9月份,AIPPT 赛道的 Top3产品流量平均涨幅30%+,更有一款

  • 从“实现需求”到“共创价值”:AI Native时代需要什么样的工程师团队?

    在1024程序员节,小红书技术副总裁风笛出席CCF工程师文化日五周年庆典,分享AI时代技术团队转型方向。他指出传统开发模式下工程师仅1/3时间编码,其余被会议沟通挤占,导致技术成长受阻、创新力下降。提出AI Native时代需重构协作模式:通过任务导向的扁平化组织,让工程师从需求执行者转变为价值创造者。以48小时上线翻译功能为例,展示新型协作效能。强调AI不会取代工程师,而是将其角色提升至系统定义和复杂性管理的新高度。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • 陈天桥在AIAS上首提“发现式智能”,宣告AI研究新范式

    2025年10月27-28日,AI驱动科学研讨会(AIAS 2025)在美国旧金山举行。陈天桥发表主题演讲,首次提出“发现式智能”概念,指出这是真正的通用人工智能,强调AI应帮助人类发现未知而非替代人类。他提出实现路径需结合规模路径与结构路径,并分析大脑时间结构包含神经动力学、长期记忆、因果推理、世界模型和元认知五大能力。会议宣布投入超十亿美元建设算力集群,支持年轻科学家探索智能本质。

  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 智检加速:AI云测试如何为香港企业 IT 项目减负40%人力成本

    香港企业在App研发中面临高昂人力成本与复杂技术栈挑战,导致测试效率低、交付缓慢。Testin云测通过AI驱动的自动化测试方案,整合云端资源与专业服务,实现降本增效:硬件投入优化50%,人力成本降低40%;AI脚本生成技术提升测试效率60%,支持跨平台复用;精准OCR识别助力迭代周期缩短50%。聚焦金融、政企、交通等重点行业,提供符合国际标准的安全测试保障,助力企业从人力密集型向技术密集型转型,以更高质量、更快速度赢得市场竞争。

  • 百度发布小度AI眼镜Pro:集成四大核心AI能力 售价2299元

    11月13日,2025百度世界大会在京开幕。百度集团副总裁、小度科技CEO李莹发布全新智能穿戴设备——小度AI眼镜Pro,售价2299元,已在电商平台开售。产品集成四大AI核心能力:AI识物可快速识别物体信息;AI翻译支持36种语言实时互译,针对医疗、金融领域优化术语库;AI备忘通过语音即时记录信息;AI会议纪要能自动提炼要点并生成待办清单。设备主打轻便舒适,整机重39克,提供两种时尚款式,支持定制镜片,具备IP54防护等级。硬件搭载第一代骁龙AR1平台,配备2GB+32GB存储,采用索尼1200万像素镜头,支持4K拍照与1440p视频录制。内置173mAh电池,配合智能眼镜盒可实现68小时综合续航。

今日大家都在搜的词: