首页 > AI头条  > 正文

谷歌发布 SpeciesNet AI 模型 助力野生动物识别

2025-03-04 09:29 · 来源: AIbase基地

近日,谷歌宣布开源一款名为 SpeciesNet 的人工智能模型,该模型旨在通过分析相机捕捉到的照片来识别动物种类。随着科研工作者在全球范围内使用相机陷阱(连接红外传感器的数字相机)进行野生动物研究,这些设备虽然提供了宝贵的数据,但同时也会产生大量数据,处理这些数据往往需要耗费数天到数周的时间。

猴子 动物园 (1)

为了解决这一问题,谷歌在六年前启动了 “野生动物洞察” 项目,属于其谷歌地球外展慈善计划的一部分。这个平台让研究人员能够在线共享、识别和分析野生动物图像,从而加快相机捕捉数据的处理速度。

SpeciesNet 模型是这一平台的核心,谷歌表示,该模型的训练数据来源于6500万张公开可用的图像,以及来自史密森学会保护生物学研究所、野生动物保护协会、北卡罗来纳自然科学博物馆和伦敦动物学会等组织的图像。SpeciesNet 可以将图像分类为2000多种标签,涵盖动物种类、像 “哺乳动物” 或 “猫科动物” 的分类以及非动物物体(例如 “车辆”)。

谷歌在其博客中指出,SpeciesNet 的发布将使开发者、学术界人士和与生物多样性相关的初创企业能够更好地监测自然区域的生物多样性。SpeciesNet 现已在 GitHub 上以 Apache2.0许可证开源,意味着它可以在商业上使用且大部分没有限制。

需要注意的是,谷歌并非唯一一家为自动化相机陷阱图像分析提供开源工具的公司。微软的 “AI for Good Lab” 也维护着一个名为 PyTorch Wildlife 的人工智能框架,提供经过微调的预训练模型,专注于动物检测和分类。

项目:https://github.com/google/cameratrapai

划重点:

🐾 谷歌开源 SpeciesNet AI 模型,帮助识别野生动物,提升数据处理效率。

🌍 SpeciesNet 模型经过6500万张图像训练,能识别2000多种动物及物体标签。

🛠️ 该模型在 GitHub 上开源,允许商业使用,促进生物多样性监测。

  • 相关推荐
  • AI日报:百度推全球首批AI数字员工;Claude Opus4.1出世;谷歌DeepMind发布世界模型Genie 3

    AI日报栏目聚焦人工智能领域最新动态:1)Claude Opus4.1发布,编程能力提升74.5%;2)OpenAI开源GPT-OSS-120B和20B模型;3)谷歌DeepMind推出革命性3D世界模型Genie3;4)谷歌Gemini新增AI故事书生成功能;5)ElevenLabs推出商用AI音乐生成器;6)百度智能云发布首批AI数字员工;7)OpenAI估值或达5000亿美元;8)00后创业者推出云端AI协作开发工具Vinsoo;9)腾讯启动2026校园招聘,重点培养AI人才;10)马斯克宣�

  • 女子在景区摸马肚子被狠咬一口 专家提醒:慎触陌生动物

    ​8月6日,贵州毕节一景区内发生了一起意外事件。当事人李女士在该景区的大草原区域游玩时,看到周围散布着牛、羊和马等动物,心生亲近之意,便靠近一匹马并伸手轻抚其腹部,欲拍摄视频留念。不料,这匹马突然反应激烈,转身咬向李女士,导致其后背被刮破皮。 据李女士事后讲述,她意识到是自己主动触摸马匹才引发了这一意外,因此并未寻找马主人理论或索赔

  • 谷歌DeepMind发布Genie 3世界模型:支持实时生成交互式3D环境

    据媒体报道,谷歌DeepMind正式发布了其新一代通用世界模型Genie 3。 该模型能够根据用户的文本提示,快速生成丰富多样的交互式虚拟环境。Genie 3不仅能够以每秒24帧的速度生成720p分辨率的高清交互式3D世界,更创新性地引入了 可提示世界事件” 功能。用户通过简单文本指令,即可实时修改虚拟环境,显著提升了沉浸感与创造力。 DeepMind视Genie 3为迈向通用人工智能(AGI) 的�

  • 迄今最先进的AI模型!ChatGPT-5具备博士级别的认知能力

    ChatGPT-5在多个领域表现出色,包括编程、数学、写作、健康和视觉感知等。 它具备增强的推理能力,能够根据对话类型选择最佳模型,并通过深度推理模型解决更具挑战性的问题。 OpenAI 表示,ChatGPT-5在知识工作方面表现卓越,其知识水平在40多种职业中均达到或超过专家水平,涵盖法律、物流、销售和工程等领域。 在基准测试中,ChatGPT-5 展现了出色的认知能力。 例如,�

  • OpenAI正式发布GPT-5模型 网友:写作像诗人

    OpenAI在直播活动中正式推出新一代人工智能模型GPT-5,宣称其覆盖编程、数学、写作、健康咨询、视觉感知等核心领域,实现"公司迄今为止最重大的模型升级"。OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)形容,与GPT-5交互如同与各领域专家对话,其多维度能力突破将重塑人机协作模式。 分层开放策略满足多元需求 GPT-5将于本周四启动全球用户分批推送,免费用户与付�

  • GPT-5和Claude 4 Opus谁更强?用这个AI大模型对比工具一眼明了

    OpenAI正式发布GPT-5,与Claude4Opus和Gemini2.5Pro进行对比测试。GPT-5在编程能力(SWE-bench测试74.9%)和数学推理(AIME2025测试94.6%)表现突出;Claude4Opus编程优异(72.5%)但数学较弱(33.9%);Gemini2.5Pro擅长长文本处理(100万token窗口)和多模态应用。价格方面,GPT-5和Gemini2.5Pro定价相近($1.25-$10),Claude4Opus较高($15-$75)。建议根据需求选择:GPT-5适合综合应用,Claude4Opus适合专业编程,Gemini2.5Pro适合长文档�

  • AI 大模型选型指导:一文实测 Kimi‑K2‑Turbo‑Preview 与 Qwen3‑Coder‑Flash

    本文对比分析了Kimi-K2-Turbo-Preview和Qwen3-Coder-Flash两款AI大模型在开发者选型中的表现。K2-Turbo采用MoE架构,激活参数32B,支持128K上下文,在代码调试和自动化流程方面表现突出;Qwen3-Coder为480B参数的MoE模型,原生支持256K上下文,擅长大规模代码库理解和API集成。二者在中级任务表现接近,但K2在复杂可视化任务更优,Qwen3在多轮Agent调用更稳定。建议根据需求选择:注重调试自动化选K2,需要长上下文支持选Qwen3。推荐使用AIbase模型广场进行高效选型对比。

  • AI日报:通义开源AI编程大模型Qwen3-Coder;​360将推智能眼镜和AI录音笔;谷歌发布Gemini 2.5 Flash-Lite 稳定版

    本文介绍了AI领域多项重要进展:1)谷歌发布Gemini 2.5 Flash-Lite稳定版,平衡速度与成本;2)腾讯混元ASR语音大模型接入ima平台;3)阿里开源Qwen3-Coder编程大模型;4)360将推智能眼镜和AI录音笔;5)夸克健康大模型通过医师评测;6)零一万物发布企业级大模型平台;7)Hedra推出低成本AI视频代理;8)Gemini2.5革新图像理解能力;9)Meta推出创新文本处理模型AU-Nets;10)苹果AI团队或寻求第三方合

  • AI日报:阿里新发布Qwen3-4B模型;小红书发布开源模型dots.vlm1;MiniMax Speech 2.5语音生成模型上线

    AI日报栏目聚焦人工智能领域最新动态:1)阿里发布Qwen3-4B轻量级模型,手机端可运行;2)小红书开源多模态大模型dots.vlm1,在图表推理方面表现突出;3)MiniMax推出语音生成模型Speech2.5,多语种表现提升;4)Midjourney推出HD视频模式,提升专业影像质量;5)Cursor1.4版本增强异步任务处理能力;6)谷歌否认AI搜索影响网站流量,但数据显示用户行为改变;7)MiniCPM-V4.0开源发布,号称"手机上的GPT-4V";8)AMD与高通宣布支持OpenAI的gpt-oss系列模型;9)腾讯开源WeKnora文档智能解析工具;11)疑似GPT-5信息在GitHub泄露;12)FlowSpeech实现书面语转口语的TTS技术突破。

  • AI日报:混元推四款小尺寸开源模型;昆仑万维发布新推理大模型MindLink;谷歌Gemini 2.5 Deep Think发布

    【AI日报】汇总了最新AI领域动态:1)腾讯开源混元系列小尺寸模型,适用于消费级显卡;2)昆仑万维发布推理大模型MindLink,提升回答透明度;3)B站推出AI原声翻译功能,保留UP主音色;4)谷歌Gemini 2.5在数学奥赛夺金,展现强大推理能力;5)OpenAI展示GPT-5网络信息整合特性;6)苹果组建AI团队挑战ChatGPT;7)高德地图推出全球首个AI原生地图应用;8)Adobe推出AI图像合成工具Harmonize;9)NVIDIA发布革命性视频渲染技术;10)谷歌推出Android Studio免费AI编程助手;11)开源结构化信息提取工具LangExtract;12)Figma开发者模式升级提升设计转代码效率。

今日大家都在搜的词: