首页 > 业界 > 关键词  > T-Rex2最新资讯  > 正文

T-Rex2:文字来描述、框选就能识别图片中的目标物体

2024-03-26 14:20 · 稿源:站长之家

>

划重点:

T-Rex2是一种通用目标检测技术,通过视觉和文本提示协同作用,实现对各种对象的识别。没有开源,有API可以使用。

⭐ T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器,实现了最先进的性能。

⭐ T-Rex2除了通过文字来描述要检测的物体,还支持直接在图里框出一个样例,系统自动识别出剩余的目标。

站长之家(ChinaZ.com) 3月26日 消息:DeepDataSpace 推出了 T-Rex2,一种革新性的目标检测技术,旨在解决传统目标检测模型的封闭集问题。传统模型局限于事先确定的类别集,需要针对特定任务进行调整和大量训练数据。相比之下,T-Rex2不仅能够识别日常物体,还能识别更为奇特的物体,无需特定任务的调整或大量训练数据。该模型通过结合文本和视觉提示的优势,实现了对各种场景中的物体的理解和检测。

image.png

T-Rex2整合了图像编码器、视觉提示编码器、文本提示编码器和框解码器四个组件,遵循 DETR 的设计原则,实现了端到端的目标检测模型。

在四个学术基准测试中,包括 COCO、LVIS、ODinW 和 Roboflow100,T-Rex2在零样本设置下实现了最先进的性能。除了学术领域,T-Rex2还适用于各种实际应用场景,包括农业、工业、生物学、医学、零售、物流等领域。其灵活性和适应性使其成为研究人员、开发者和组织的宝贵工具,推动物体检测技术的发展。

image.png

作为一种通用目标检测技术,T-Rex2还可用于开放集视频目标检测和视频目标跟踪,,为视频处理领域带来了新的可能性。结合 ByteTrack 算法,T-Rex2可以准确跟踪视频中的任何对象。

未来,DeepDataSpace 将开放 T-Rex2的免费 API 访问,为教育工作者、学生和研究人员提供支持。通过 Demo 和 API,用户可以体验 T-Rex2的能力,并探索其在各领域的潜在应用。

产品入口:https://top.aibase.com/tool/t-rex2

试玩地址:https://deepdataspace.com/playground/ivp

举报

  • 相关推荐
  • Billus AI高交会全球首发多模态大模型 以AI Agent重构创意产业文明进化路径

    2025年11月15日,Billus AI在高交会首发多模态大模型Billus0.57EDIT及“超级员工智能体”初阶版,依托自研生存式大模型与AI Agent技术,打破创意领域垂直局限,构建覆盖文创、时尚、艺术等全场景智能创作生态。该模型通过自然语言指令直达创意成果,实现从平面图到施工图的全流程高效生成。同时,Billus AI同步打造“创意设计超级员工+产业链智能体”体系,探索生成式创意与供应链智能推荐的新商业路径,助力行业从“经验驱动”向“数据智能”跃迁。

  • 智检加速:AI云测试如何为香港企业 IT 项目减负40%人力成本

    香港企业在App研发中面临高昂人力成本与复杂技术栈挑战,导致测试效率低、交付缓慢。Testin云测通过AI驱动的自动化测试方案,整合云端资源与专业服务,实现降本增效:硬件投入优化50%,人力成本降低40%;AI脚本生成技术提升测试效率60%,支持跨平台复用;精准OCR识别助力迭代周期缩短50%。聚焦金融、政企、交通等重点行业,提供符合国际标准的安全测试保障,助力企业从人力密集型向技术密集型转型,以更高质量、更快速度赢得市场竞争。

  • AI日报:Lovart AI上线“元素拆分”功能;Xcode 26.1.1发布;阿里云通义模型首次大规模赋能双11

    本期AI日报涵盖八大热点:Lovart AI推出"元素拆分"功能,实现海报智能分层编辑;苹果Xcode 26.1.1优化AI编码性能;阿里云通义模型双11单日翻译调用量突破14亿次;Gemini 3在历史手稿破译中展现专家级能力;德国法院裁定OpenAI使用歌词训练构成侵权;开源语音模型Maya1实现富有表现力的实时文本转语音;Meta首席AI科学家LeCun计划离职创办世界模型公司;AI专家罗福莉加入小米,将致力于构建物理世界智能。

  • AI搜索优化工具推荐:如何免费检测品牌在AI回答中的可见度?

    随着AI搜索崛起,71%美国用户通过AI研究购买决策,ChatGPT日查询超10亿次。传统SEO面临挑战:58.5%谷歌搜索已成"零点击",用户看完AI摘要即离开。品牌若未进入AI推荐列表,将失去新流量入口。建议使用AIBase等工具监控国内五大AI平台曝光数据,重点关注高价值问题下的推荐质量,通过可视化数据优化内容策略,建立GEO(生成引擎优化)闭环。

  • 免费!AI对话式搜索词挖掘工具,一键检测品牌在AI搜索中的可见度

    本文探讨在AI搜索时代如何提升品牌、产品或内容的AI推荐可见度。关键在于挖掘AI对话式搜索词并优化内容,避免因未被AI抓取或排名靠后导致流量损失。推荐使用AIBase平台的GEO排名查询工具,免费检测品牌在主流AI搜索中的曝光度、排名及竞品对比,并提供优化建议,帮助抢占AI流量高地。该工具覆盖多平台,操作简单,适合企业、内容创作者及电商使用。

  • 字节旗下AI编程工具TRAE SOLO发布 面向所有用户开放

    字节跳动AI编程工具TRAE SOLO正式版发布,面向国际用户开放。该工具提供IDE和SOLO两种开发模式:IDE模式在保留原有流程基础上增强智能问答、代码补全等AI能力;SOLO模式以AI为主导,能理解开发目标、调度工具并独立完成从需求分析到代码实现的全流程。这标志着AI编程从工具增强迈入流程重构新阶段,实现覆盖软件开发全流程的高度自动化。

  • 银泰百货AI数智化升级案例入选“AI100应用标杆榜”

    11月16日,银泰百货AI数智化升级案例入选“AI100应用标杆榜”。该案例深度融合AI技术与零售场景,将运营对象从楼层、品类细化至单品,提升供应链管理效率,实现线上线下经营闭环。AI驱动销售额已占总销售额17%且持续增长。银泰强调企业数智化需聚焦“如何升级”,核心是数字基建与数据治理,通过“模拟与数字世界联动”体系为顾客创造价值。该榜单旨在发掘行业标杆案例,推动AI技术落地与产业生态发展。

  • 百度发布小度AI眼镜Pro:集成四大核心AI能力 售价2299元

    11月13日,2025百度世界大会在京开幕。百度集团副总裁、小度科技CEO李莹发布全新智能穿戴设备——小度AI眼镜Pro,售价2299元,已在电商平台开售。产品集成四大AI核心能力:AI识物可快速识别物体信息;AI翻译支持36种语言实时互译,针对医疗、金融领域优化术语库;AI备忘通过语音即时记录信息;AI会议纪要能自动提炼要点并生成待办清单。设备主打轻便舒适,整机重39克,提供两种时尚款式,支持定制镜片,具备IP54防护等级。硬件搭载第一代骁龙AR1平台,配备2GB+32GB存储,采用索尼1200万像素镜头,支持4K拍照与1440p视频录制。内置173mAh电池,配合智能眼镜盒可实现68小时综合续航。

  • TabTab 登顶模力工场 AI 应用榜榜首, 把 AI 数据分析师装进口袋,关键结论更快抵达!

    TabTab是一款全链路AI数据分析助手,核心功能包括多源数据连接(支持文档、数据库、电商平台等)、自动化采集清洗、内置分析模型及可视化呈现。其优势在于通过多智能体系统实现自然语言交互,降低分析门槛,让非技术人员也能快速完成客户洞察、销售业绩等分析,显著提升效率。产品定位中立,致力于构建多元化AI效率提升生态。

  • AI赋能文化新生态 世纪华通确认参展2025长三角文博会

    第六届长三角国际文化产业博览会将于2025年11月20-22日在上海国家会展中心举办。世纪华通(002602.SZ)将参展并呈现AI与文化产业融合成果,包括首届"数龙杯"全球AI游戏大赛获奖作品、互动娱乐产品及文创周边。公司通过AI技术赋能文化创作与传播,推动数字经济发展,展现"十五五"规划下文化产业与科技深度融合的新趋势。

今日大家都在搜的词: