首页 > 业界 > 关键词  > 野朋友计划最新资讯  > 正文

你的手机镜头可变身“自然翻译器” 腾讯“野朋友计划”联合腾讯混元上线物种识别AI

2025-05-22 13:42 · 稿源: 站长之家用户

当你拍到一片神秘树叶或一只模糊掠影,不仅能召唤AI“物种侦探” 24 小时在线破案,还能和这位知识渊博的“自然导师”唠嗑:“这片叶子为啥长斑?”“小刺猬冬天住哪儿?”更酷的是,你的随手一拍可能正为雪豹绘制生存地图,帮科学家拯救濒危生灵。

5 月 22 日,在国际生物多样性日到来之际,腾讯可持续社会价值事业部(SSV)技术公益团队宣布,其发起的生物多样性保护项目“野朋友计划”正式上线AI物种识别与智能体问答交互新功能。该功能基于腾讯混元大模型,初次将AI 应用于普通公众参与生态保护的场景,让普通公众通过手机即可参与物种识别、知识探索与科学保护行动,致力于让公众每按一次快门都成为守护自然的力量,这也标志着腾讯技术公益在“AI+生态保护”领域迈出重要一步。

从准确识别到认知交互,构建生态保护AI双引擎

“野朋友计划”自上线以来,已联合多家生物多样性保护机构,联合打磨“物种之眼”AI。然而,生态保护机构联合公众参与领域存在两大痛点:首先,专业机构可通过“物种之眼”辅助处理和识别数据,但缺乏公众互动和识别的终端能力;第二,在城市生态保护上,用户虽有求知需求却难以获取相对专业的知识。此次新功能的上线,正是为了解决这一矛盾。

腾讯 SSV 技术生态负责人李哲表示介绍,此次合作中,“物种之眼”使用的腾讯自研YOLO-World技术架构与野朋友小程序使用的混元大模型形成了能力互补的“双引擎”。混元大模型依托多模态理解和文本生成能力,初次在生态保护场景中实现“识别+交互”的闭环。

相较于传统图像识别模型,混元大模型在两个维度实现突破。首先,实现对复杂场景的理解,野朋友小程序上线的 AI可解析用户上传的拍摄图片,推断物种特征;第二,输出知识,为用户提供通俗易懂的百科内容,通过自然语言交互解答用户问题,例如“植物叶片发黄如何救治”“该物种对生态链的影响”等。

【野朋友小程序AI 入口操作页面】

这一功能的上线,让生态保护从“专业工具”延伸至“公众科普”。例如,当用户拍摄城市公园中的鸟类时,不仅能获得物种名称,还可以通过对话了解其迁徙规律、食性特点,甚至参与栖息地保护建议。

打通生态保护机构和用户参与链条,致力于全民参与

生态保护机构和用户是互不分开的,生态机构倡导公众参与的需求,而野朋友小程序上新的AI功能中,用户互动获取的知识内容来自保障的生态保护机构,他们收集并处理海量物种数据,也能够反哺AI模型训练。李哲介绍了推进野朋友上线 AI 识别相关功能的初衷:“我们会通过野朋友小程序、‘野朋友生物多样性数据协作平台’,持续连接公众和机构,形成数据的正向循环,进一步打通技术-机构-用户的生态保护链条。”

针对专业保护机构,沿用“物种之眼”的YOLO-World技术与“野朋友生物多样性数据协作平台”,对野外红外相机、监测设备拍摄的图片进行批量处理,服务于种群调查、栖息地评估等科研和保护场景。

面向普通公众,用户可将拍摄的物种图片上传至野朋友小程序中的AI,通过对话获取深度信息。例如,发现城市中的昆虫时,可询问其生态价值,系统将结合地域生态数据生成科普答案。值得注意的是,腾讯正在积极沟通科研机构构建“公众可读的物种百科库”,将专业术语转化为生活化表达,并通过AI交互设计降低知识获取门槛。例如,雪豹的科研监测数据将被转化为“这只雪豹出现意味着本地岩羊种群健康”等直观描述。

【提交物种识别和发现记录,并追问获得更多知识】

用技术连接人与自然,构建城市生态地图

在即将到来的北京、深圳线下活动中,“野朋友计划”邀约了一批“野朋友生态探客”,一起体验AI功能如何助力城市生态探索。例如,参与者使用小程序识别城市绿地中的昆虫、鸟类后,体验AI 识别和互动,与生态向导一起了解更多城市生态物种,并提交生态探索的结果,未来这些结果将和其他公众参与的项目一起,构建城市生态地图,通过聚合公众上传的物种数据,生成可视化图谱,帮助城市管理者评估当地生态系统健康度,让公众直观感受自己所在地的生态环境的变化以及保护行动的价值。

5 月 22 日,“深圳·生物多样性拼图”公众参与活动启动,在深圳市生态环境局指导下,依托“野朋友”小程序及数据协作平台,深圳市民可参与物种观察与记录,共同构建深圳生物多样性地图,为城市生态保护提供依据。

李哲呼吁:“用技术连接人与自然,让生态保护成为全民行动,希望更多人加入‘野朋友计划’无论是记录窗台的昆虫、识别路边的野花,每一次按下快门、每一次使用AI,都在为守护地球生命共同体贡献力量。”

举报

  • 相关推荐
  • 腾讯混元上线“游戏工业级”视觉生成平台:效率最高提升数十倍!

    腾讯5月20日发布混元游戏视觉生成平台,该平台基于混元大模型打造,专为游戏行业内容生产设计。平台能快速生成高质量游戏素材和概念草图,支持多种主流游戏风格,实现创作闭环。通过AI技术,可将整套流程压缩至一个工作页面,用户只需输入提示词即可获得灵感参考图,并直接绘制草图和生成标准三视图及360度旋转演示视频,效率最高提升数十倍。平台还具备角色多视图自动生成能力,上传一张正面图即可自动生成标准三视图和360度展示视频,角色一致性最高达99%。腾讯表示,该平台将显著改善灵感迟滞、多视图缺失等常见问题。

  • AI日报:美团AI编程工具NoCode将上线;火山引擎发布MCP Servers;腾讯混元上线游戏视觉生成平台

    本文汇总了近期AI领域的重要动态:1)美团将推出对话式编程工具"NoCode";2)火山引擎发布大模型生态平台MCP Servers;3)B站开源动画视频生成模型Index-AniSora;4)字节跳动升级AI耳机Ola Friend的英语学习功能;5)GitHub推出AI编程助手自动修复代码漏洞;6)腾讯混元上线游戏视觉生成平台;7)微软将VS Code转型为开源AI编辑器;8)Windows 11原生支持MCP协议;9)Anthropic发布AI代理开发指南;10)谷歌推出编程AI代理Jules;11)NotebookLM推出iOS版;12)Genspark创3600万美元ARR纪录;13)Bright Data发布开源MCP服务器;14)马斯克宣布Grok模型将登陆Azure平台。这些进展展示了AI技术在编程、内容生成、操作系统等领域的快速发展和应用创新。

  • 腾讯混元视频生成工具全新开源:人物不会“变脸” 物体不会“漂移”

    腾讯混元5月9日宣布推出开源的多模态定制化视频生成工具HunyuanCustom。该工具基于混元视频生成大模型打造,支持文本、图像、音频等多模态输入,能生成高质量定制视频。主要功能包括:单/多主体视频生成、视频配音、局部编辑等,在保持主体一致性的同时可灵活调整场景和动作。适用于广告、电商、影视等场景,如快速更换商品背景、制作数字人视频等。目前单主体生成功能已开源,其他功能将于5月陆续开放。用户只需上传图片和文字描述即可生成连贯自然的视频内容。

  • 腾讯混元T1-Vision上线元宝:一张图片就能分析出产品研发成本

    除此之外,腾讯还介绍了元宝目前可以识别花的品种;可以提示在围棋赛局中下一步如何走;同时,给它一张定期存款利率表,还会帮你出谋划策。

  • 10倍精度升级!腾讯混元3D模型v2.5版本发布

    腾讯混元3D模型升级至v2.5版本,建模精度和贴图真实度显著提升。新版本参数体量从1B增至10B,有效面片数增加超10倍,支持1024几何分辨率。纹理系统支持4K高清贴图和凹凸细节,率先支持多视图生成PBR模型。针对动画场景优化骨骼蒙皮系统,支持非标准姿态自动绑定。新增文生/图生3D减面模型、多视图建模模板等专业工作流。混元3D v2.5已全面更新至腾讯AI创作引擎,免费生成额度提升至每日20次,并正式上线腾讯云API面向企业开放。GitHub开源版本累计Star超1.2万。

  • AI日报:谷歌推最强AI全家桶Google AI Ultra;腾讯混元宣布模型矩阵全面升级;豆包·语音播客模型发布

    本文汇总了近期AI领域的重要动态:1)谷歌推出249.99美元/月的AI Ultra订阅计划,提供最强AI模型和高级功能;2)腾讯混元模型升级,新增视觉推理T1-Vision和语音对话模型;3)美图获阿里2.5亿美元投资,将在电商和AI领域合作;4)豆包推出语音播客模型,实现文本快速转音频;5)百度文心X1 Turbo获信通院最高评级;6)谷歌发布Flow AI剪辑工具,集成Veo3等三大模型;7)谷歌Veo3支持4K视频生成;8)Imagen4图像模型发布;9)Gemini2.5 Pro新增并行推理功能;10)谷歌推出虚拟试衣工具;11)公测AI编程助手Jules;12)苹果计划在iOS19开放AI模型;13)京东云推五大免费AI营销工具;14)字节开源多模态模型BAGEL;15)英伟达发布物理推理模型Cosmos-Reason1。

  • AI日报:腾讯混元3D生成模型2.5版本发布;海螺推出图像人物参考功能;百度上线移动端超级智能体心响App

    本文介绍了多款AI领域的新产品和技术进展:1)Kortix-AI推出开源通用AI智能体平台Suna;2)腾讯混元3D生成模型升级至2.5版本;3)海螺AI推出基于单张图像生成多角度角色图像功能;4)百度发布"心响"App整合多智能体协作;5)Nari Labs开源媲美真人的对话语音模型Dia;6)Grok新增视觉处理和多语言支持;7)Genspark推出AI幻灯片工具;8)Character.AI发布让静态图片"说话"的AvatarFX模型;9)pad.ws结合白板和代码编辑器;10)OpenBMB开源社区推出长文本生成模型"卷姬";11)腾讯推出AI阅读助手"企鹅读伴";12)OpenAI有意收购Chrome浏览器;13)字节跳动调整AI产品线布局。这些创新展现了AI技术在自动化、3D生成、语音交互、内容创作等领域的快速发展。

  • AI日报:扣子空间开放测试;腾讯混元开源视频生成工具HunyuanCustom;阿里开源大模型搜索引擎ZeroSearch

    本文汇总了近期AI领域多项重要进展:1)扣子空间开放测试,无需邀请码即可体验AI协作平台;2)腾讯推出HunyuanCustom视频生成工具,实现音视频同步编辑;3)阿里巴巴ZeroSearch技术降低AI训练成本88%;4)OpenAI新增GitHub连接器,强化代码分析功能;5)联想发布天禧个人超级智能体,具备感知交互能力;6)OpenAI在亚洲推出数据驻留计划;7)Multiverse发布全球首款AI生成多人游戏;8)秘塔AI上线"讲题"功能辅助家长辅导;9)Genspark推出智能电子表格工具AI Sheets;10)Google Gemini API新增缓存功能可节省75%成本;11)PixVerse v4视频生成速度质量双提升;12)快手推出内容净化器KuaiMod;13)英伟达开源新一代OCR代码推理模型。这些创新覆盖AI应用、开发工具、成本优化等多个维度,展现了AI技术的快速发展和广泛应用。

  • AI日报:腾讯混元图像2.0毫秒级生图;Windsurf重磅发布SWE-1系列;MiniMax Speech-02登顶全球TTS榜首

    本期AI日报重点报道了多项AI领域最新进展:1)腾讯发布混元图像2.0模型,实现毫秒级图像生成;2)Windsurf推出全流程软件工程AI模型SWE-1系列;3)DeepSeek发布V3模型论文,揭示低成本训练大模型方法;4)Manus推出图像生成Agent,支持多工具协同完成任务;5)ElevenLabs发布可定制音效控制面板工具;6)MiniMax语音模型Speech-02超越OpenAI和ElevenLabs;7)DeepL升级翻译服务并推出写作助手;8)OpenAI占据AI工具市场80%份额;9)Llamafile 0.9.3支持Qwen3模型;10)Hugging Face推出WebGPU驱动的实时摄像头AI SmolVLM;11)Hugging Face上线免费MCP教程;12)复旦与腾讯联合推出视频生成工具DICE-Talk。

  • CCIA警告:你的手机可能正在泄密!我们该如何预防?

    封闭系统早不是智能终端的安全保障了,现在得靠零信任架构和实时监控,还得加密存储和传输,这样才能确保数据不被窃取。