首页 > 业界 > 关键词  > 野朋友计划最新资讯  > 正文

你的手机镜头可变身“自然翻译器” 腾讯“野朋友计划”联合腾讯混元上线物种识别AI

2025-05-22 13:42 · 稿源: 站长之家用户

当你拍到一片神秘树叶或一只模糊掠影,不仅能召唤AI“物种侦探” 24 小时在线破案,还能和这位知识渊博的“自然导师”唠嗑:“这片叶子为啥长斑?”“小刺猬冬天住哪儿?”更酷的是,你的随手一拍可能正为雪豹绘制生存地图,帮科学家拯救濒危生灵。

5 月 22 日,在国际生物多样性日到来之际,腾讯可持续社会价值事业部(SSV)技术公益团队宣布,其发起的生物多样性保护项目“野朋友计划”正式上线AI物种识别与智能体问答交互新功能。该功能基于腾讯混元大模型首次将AI 应用于普通公众参与生态保护的场景,让普通公众通过手机即可参与物种识别、知识探索与科学保护行动,致力于让公众每按一次快门都成为守护自然的力量,这也标志着腾讯技术公益在“AI+生态保护”领域迈出重要一步。

从精准识别到认知交互,构建生态保护AI双引擎

“野朋友计划”自上线以来,已联合多家生物多样性保护机构,联合打磨“物种之眼”AI。然而,生态保护机构联合公众参与领域存在两大痛点:第一,专业机构可通过“物种之眼”辅助处理和识别数据,但缺乏公众互动和识别的终端能力;第二,在城市生态保护上,用户虽有求知需求却难以获取相对专业的知识。此次新功能的上线,正是为了解决这一矛盾。

腾讯 SSV 技术生态负责人李哲表示介绍,此次合作中,“物种之眼”使用的腾讯自研YOLO-World技术架构与野朋友小程序使用的混元大模型形成了能力互补的“双引擎”。混元大模型依托多模态理解和文本生成能力,首次在生态保护场景中实现“识别+交互”的闭环。

相较于传统图像识别模型,混元大模型在两个维度实现突破。第一,实现对复杂场景的理解,野朋友小程序上线的 AI可解析用户上传的拍摄图片,推断物种特征;第二,输出知识,为用户提供通俗易懂的百科内容,通过自然语言交互解答用户问题,例如“植物叶片发黄如何救治”“该物种对生态链的影响”等。

【野朋友小程序AI 入口操作页面】

这一功能的上线,让生态保护从“专业工具”延伸至“公众科普”。例如,当用户拍摄城市公园中的鸟类时,不仅能获得物种名称,还可以通过对话了解其迁徙规律、食性特点,甚至参与栖息地保护建议。

打通生态保护机构和用户参与链条,致力于全民参与

生态保护机构和用户是互不分开的,生态机构倡导公众参与的需求,而野朋友小程序上新的AI功能中,用户互动获取的知识内容来自权威的生态保护机构,他们收集并处理海量物种数据,也能够反哺AI模型训练。李哲介绍了推进野朋友上线 AI 识别相关功能的初衷:“我们会通过野朋友小程序、‘野朋友生物多样性数据协作平台’,持续连接公众和机构,形成数据的正向循环,进一步打通技术-机构-用户的生态保护链条。”

针对专业保护机构,沿用“物种之眼”的YOLO-World技术与“野朋友生物多样性数据协作平台”,对野外红外相机、监测设备拍摄的图片进行批量处理,服务于种群调查、栖息地评估等科研和保护场景。

面向普通公众,用户可将拍摄的物种图片上传至野朋友小程序中的AI,通过对话获取深度信息。例如,发现城市中的昆虫时,可询问其生态价值,系统将结合地域生态数据生成科普答案。值得注意的是,腾讯正在积极沟通科研机构构建“公众可读的物种百科库”,将专业术语转化为生活化表达,并通过AI交互设计降低知识获取门槛。例如,雪豹的科研监测数据将被转化为“这只雪豹出现意味着本地岩羊种群健康”等直观描述。

【提交物种识别和发现记录,并追问获得更多知识】

用技术连接人与自然,构建城市生态地图

在即将到来的北京、深圳线下活动中,“野朋友计划”邀约了一批“野朋友生态探客”,一起体验AI功能如何助力城市生态探索。例如,参与者使用小程序识别城市绿地中的昆虫、鸟类后,体验AI 识别和互动,与生态向导一起了解更多城市生态物种,并提交生态探索的结果,未来这些结果将和其他公众参与的项目一起,构建城市生态地图,通过聚合公众上传的物种数据,生成可视化图谱,帮助城市管理者评估当地生态系统健康度,让公众直观感受自己所在地的生态环境的变化以及保护行动的价值。

5 月 22 日,“深圳·生物多样性拼图”公众参与活动启动,在深圳市生态环境局指导下,依托“野朋友”小程序及数据协作平台,深圳市民可参与物种观察与记录,共同构建深圳生物多样性地图,为城市生态保护提供依据。

李哲呼吁:“用技术连接人与自然,让生态保护成为全民行动,希望更多人加入‘野朋友计划’无论是记录窗台的昆虫、识别路边的野花,每一次按下快门、每一次使用AI,都在为守护地球生命共同体贡献力量。”

举报

  • 相关推荐
  • 最强AI大模型Fable 5、Mythos 5发布:人类智力优势还能撑多久

    Anthropic发布基于Mythos Preview的Claude Fable 5和Mythos 5两款AI模型,自称最强,在多项测试中达SOTA水平。Fable 5面向公众开放,保留安全运制;Mythos 5无运制但仅限审核机构使用。两者性能卓越,尤其在编程方面提升明显,但存在定价昂贵(1M输入/输出分别需10/50美元)、安全运制敏感(触发即降级至Opus 4.8)及强制30天安全审计等问题,影响商业用户使用。

  • 腾讯混元翻译模型Hy-MT2开源:可在手机本地部署 没网也能用

    腾讯混元正式开源新一代多语言翻译模型Hy-MT2,同步上线腾讯Hy翻译小程序,iOS与安卓APP即将推出,支持端侧本地推理。 Hy-MT2包含1.8B、7B、30B-A3B三种规格,均支持33种语言互译及5种民族语言/方言互译,在通用翻译、专业领域、真实场景与指令遵循能力上全面提升。

  • 8GB内存成硬伤!iPhone 17无缘苹果最强端侧AI大模型

    根据苹果官方硬件适配细则,iPhone 17标准版和满血版因仅配备8GB内存,无法达到12GB门槛,无缘端侧AI大模型。目前仅iPhone Air、iPhone 17 Pro及Pro Max三款机型可完整体验。博主透露,苹果后续可能调整策略,下一代iPhone 18系列或全系标配12GB内存,以从根源满足端侧大模型需求,避免基础款用户被核心功能割裂。12GB内存将大幅强化本地AI推理速度,支持更复杂多模态任务,并降低对云端的依赖,提升数据隐私保护。

  • 小米大模型推理速度全球最快!1000 tokens/s是啥概念:官方科普

    日前,小米正式上线Xiaomi MiMo-V2.5-Pro-UltraSpeed模式。 据介绍,这是全球首个在通用GPU上突破1000 tokens/s的万亿参数模型,刷新了旗舰模型的全球最快推理速度。 今日,小米技术”公众号发文科普了什么是1000 tokens/s,以及这一速度到底有多快。 小米表示,token即词元,是大模型中的计量单位,类似日常买菜时使用的斤”两”。 1000 tokens/s也就是1000 Tokens Per Second,简称1000 TPS,意

  • 美团Tabbit AI浏览器正式版上线:核心功能永久免费!整合主流国内大模型

    美团正式发布Tabbit AI浏览器1.0标准版,结束100天公测,全面开放下载,支持安卓、鸿蒙、苹果系统。该产品打破传统浏览器局限,通过整合DeepSeek、Kimi等多款国内主流大模型,实现AI全流程自动化任务处理,如搜索、筛选、执行等。新增记忆功能提升交互连贯性,内置300余种实用技能,覆盖学习、办公、生活等场景,并启动“妙招大赛”鼓励用户分享原创技能。

  • 谷歌推出Gemini Go:2GB内存手机也能跑大模型

    谷歌为Android Go系统推出全新Gemini Go AI助手,专为内存超2GB的低配设备设计。该精简版大模型取代Google Assistant Go,用户无需下载独立应用,长按Home键或电源键即可唤醒。它支持拨打电话、发短信、查询地图、搜索餐厅、设置闹钟等日常功能,还能上传文档和照片以提供更自然的对话体验。目前,Gemini Go已开始分阶段向符合条件的设备推送。

  • 从“能对话”到“能干活”:腾讯云发布AI Agent技术栈,多家企业验证规模化落地

    6月5日,腾讯云发布AI Agent技术栈,从底层运行时到上层接口全面开放,助力企业级Agent落地。该技术栈基于“Agent=Model+Harness”公式,由五大模块构成:底层Agent Runtime提供毫秒级弹性沙箱,中层ClawPro解决多租户管理与Token管控,上层Cloud Agent提供PaaS接口。目前已在SaaS、电商、社交等场景落地,如财税SaaS平台慧算账将ClawPro嵌入企业微信,单个会计服务能力从200-300家提升至400-500家。EC等5家企业分享实战经验,EC半年内单月Token消耗突破100亿,花椒直播实现全员Agent与业务Skill化,群核科技以3D空间大模型构建视频Agent,APUS推出企业级Agent平台,自如聚焦C端找房复杂语义识别。企业关注焦点从“模型有多强”转向“运行有多稳”。

  • 苹果满血AI大模型仅支持iPhone 17 Pro/Air:iPhone 17用户无缘

    苹果今天凌晨在WWDC2026开发者大会上正式发布了全新的Siri AI,这是一套完全由Apple Intelligence驱动的智能助理,相当于把过去几代的Siri完成了彻底重构。 据悉,Siri AI搭载了个人情境深度理解能力、覆盖海量信息的广泛世界知识库,还有实时屏幕感知能力,能随时协助用户找到自己需要的所有内容,不管是解答各类问题,还是从用户短信、电子邮件、照片等不同应用里精准提取�

  • AI日报:MiniMax发布M3 大模型;英伟达物理大模型Cosmos3发布;小红书已治理超120万个AI托管账号

    今日AI领域动态丰富:MiniMax发布M3+大模型,首创MSA架构并支持1M上下文,全面开源对标海外旗舰;英伟达联合行业巨头发布全球首款全开源全模态物理AI大模型Cosmos3,成立宇宙联盟;千问APP六一期间礼品选购咨询量增长260%,展现AI购物潜力;小红书治理超120万AI托管账号,处置18万篇AI造假笔记;抖音4月新增AI短剧超4.4万部,但爆款率仅0.6%;胡彦斌上线粉丝社区应用“彦火”,展示Vibe Coding潜力;LobsterAI推出图片视频大模型矩阵,整合四大主流模型;OpenAI重启机器人业务,奥特曼公开招募工程师,拓展具身智能布局。

  • 小米超高端手机下半年发布:玄戒芯片+OS+AI大模型大会师!全自研

    小米将于下半年发布一款超高端新品,属于MIX系列,可能命名为MIX Fold 5,搭载自研玄戒O3旗舰SoC(3nm制程、超大核4.05Ghz等)、澎湃OS 4系统(底层重构提升流畅度)和自研MiMo大模型(MiMo-V2.5系列全球领先)。该产品并非小米17S Pro,而是新一代大折叠屏手机,此外MIX系列还规划了一款直板机,带模块化磁吸镜头量产方案,两款机型预计Q3发布,最快7月亮相。

今日大家都在搜的词: