消息称通义视觉负责人薄列峰离职或加入某大厂新组建多模态团队

2025-05-07 14:28 · 来源： AIbase基地

据多方信源透露，阿里巴巴通义实验室应用视觉团队负责人薄列峰（职级P10）已于2024年4月30日正式离职，并低调加盟某头部互联网公司，出任新设立的多模态模型部副总经理一职。

尽管该互联网公司具体名称尚未公开，坊间普遍猜测其去向可能是字节跳动或腾讯，但目前相关公司及本人均未作出回应，尚无法证实具体归属。

AI机器人写论文

图源备注:图片由AI生成，图片授权服务商Midjourney

此次人事变动引发业界关注的另一焦点在于“竞业限制”。爆料称，薄列峰目前常驻美国西雅图，因而不会受到中国大陆地区竞业协议的约束，为其快速跳槽到竞争对手平台扫清法律障碍。

资料显示，薄列峰2007年博士毕业于西安电子科技大学，随后在芝加哥大学丰田研究院及华盛顿大学进行博士后研究，方向涵盖机器学习、计算机视觉与机器人等。2013年，他加入亚马逊西雅图总部，任首席科学家，主导Amazon Go无人零售技术的核心算法研发。2017年10月，他回国加盟京东数科，出任AI实验室首席科学家。2022年9月，薄列峰加入阿里，接替谭平出任达摩院XR实验室负责人，后转岗至通义实验室，成为通义大模型在图像及多模态方向的技术带头人。

相关推荐

荐多模态和Agent成为大厂AI的新赛点

这是《窄播Weekly》的第52期，本期我们关注的商业动态是:当大厂的AI竞争策略开始倾斜向应用场景，多模态能力和代理执行成为两个焦点。大模型落地C端场景的核心，就是让大模型的能力越来越接近人。沿着这个主旋律，可以划分出两个进化方向:一个是持续降低用户与大模型进行有效沟通的难度;另一个则是让大模型具备执行更复杂任务的能力。前者的实现，需要给到大模型多

AI竞争策略多模态能力大模型应用
荐多模态和Agent成为大厂AI的新赛点

本期《窄播Weekly》聚焦AI大厂竞争策略向应用场景倾斜的趋势，重点分析了多模态能力和代理执行两大发展方向。文章指出，大模型落地的核心在于让人机交互更自然，具体表现为：1）通过多模态技术降低用户使用门槛，如阿里夸克新推出的"拍照问夸克"功能；2）通过代理执行提升复杂任务处理能力，如字节、百度等推出的通用Agent产品。国内外厂商路径差异明显：国�

AI应用场景多模态能力代理执行
曝联想自研芯片团队负责人已离职！此前曾在华为超5年

快科技4月22日消息，据媒体报道，联想集团全资子公司鼎道智芯（上海）半导体有限公司的总经理史公正已经离职，该公司经营范围包括集成电路设计，被外界视为联想自研芯片的团队。史公正曾在华为工作超过5年，还曾在OPPO和大唐电信旗下联芯科技任职，曾担任OPPO自研芯片子公司哲库的首席SoC架构师。2021年初加入联想，后来成为联想自研芯片团队负责人，2022年1月，鼎道智芯成立，史公正担任总经理。联想官方暂未公开回应这一消息，但企查查上的人员变动信息，一定程度上说明网传消息并非空穴来风。根据企查查信息，鼎道智芯在4月10日发生了?

联想自研芯片鼎道智芯
可灵AI发布全新2.0模型：上线多模态视频编辑功能

快科技4月16日消息，据报道，可灵AI在北京举行灵感成真”2.0模型发布会，正式发布可灵2.0视频生成模型及可图2.0图像生成模型。据介绍，可灵2.0模型在动态质量、语义响应、画面美学等维度保持领先；可图2.0模型在指令遵循、电影质感及艺术风格表现等方面显著提升。3月27日，全球AI基准测试机构Artificial Analysis发布了最新的全球视频生成大模型榜单，快手可灵1.6pro（高品质模

可灵AI 视频生成模型图像生成模型
马斯克又痛失大将！特斯拉电池架构负责人将离职：已奉献17年

快科技5月1日消息，据媒体报道，特斯拉电池架构主管Vineet Mehta即将离职。这是继去年4月电池与动力总成负责人离职后，特斯拉电池团队又一次高层变动。知情人士透露，Mehta已于周二向团队成员广泛通报了这一决定，但目前尚不清楚他的离职具体时间以及未来的职业规划。据了解，Mehta自2007年加入特斯拉以来，专注于电池技术创新长达17年，为公司电动车电池的研发贡献了重要力量。值得关注的是，在去年四月中旬，特斯拉动力总成及能源业务高级副总裁德鲁巴格利诺（Drew Baglino）曾在社交媒体平台 X 上发文宣布，自己已决定离开特斯拉。据了

特斯拉电池架构管理变动
胖都来楼下超市叫叶波大润发负责人回应：是独立运营

针对争议，叶波大润发超市负责人回应称，该店为独立运营的连锁加盟超市，于半年前开业，与大润发品牌无关联。天眼查数据显示，叶波大润发（淮安）超市管理有限公司成立于 2020 年，法定代表人叶波，注册资本 5000 万元，参保员工 8 人。

胖都来大卖场叶波大润发河南零售品牌
紫东太初多模态RAG全新发布：端到端问答准确率提升33%

在产业智能化进程中，如何高效融合企业专有知识资产，构建领域专属认知引擎，是企业迈向智能决策与高效运营的关键。然而，传统检索增强生成(RAG)技术受限于语言单模态处理能力，仅能实现文本知识库与文本查询之间的浅层理解，难以满足复杂业务场景的需求，在实际应用中暴露出两大缺陷:信息表征缺失:忽略知识库中多模态富文档的视觉语义信息，如版面结构、图表关�

产业智能化企业知识资产多模态检索
荐UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成

复旦大学与美团研究者提出UniToken框架，首次在统一模型中实现图文理解与生成任务的"双优表现"。该方案融合连续和离散视觉编码，有效解决了传统多模态建模中的"任务干扰"和"表示割裂"问题。通过三阶段训练策略（视觉语义对齐、多任务联合训练、指令强化微调），UniToken在多个基准测试中性能超越专用模型。其创新性体现在：1）统一的双边视觉编码

UniToken 多模态建模视觉编码
业界唯一！百度网盘上线多模态AI笔记效率提升10倍

快科技5月2日消息，过往，用户在通过视频学习并记录笔记时，总免不了要不停切换平台软件，暂停、截屏、记录、插图、批注、切换返回视频过程繁琐而低效。为了应对这种情况，百度网盘和百度文库联合研发上线了AI笔记”，支持全自动学习、半自动学习、辅助学习三种模式。如今只要在网盘里面任意打开一个学习视频，在右侧就能看到AI笔记”功能，用户可以自主输入内容，也可以让其直接生成图文并茂、结构清晰的笔记。而且每个重要知识点旁会有时间戳，点击时间戳即可跳转到视频中对应位置，实现视频和笔记内容的顺滑关联。此外AI笔记”还可以帮

百度网盘 AI笔记视频学习
开源即支持！基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

多模态理解领域当前已成了各家AI大模型公司“军备竞赛”的关键点之一，国内外知名AI大模型公司都争相通过发布最先进的多模态大语言模型展现其在多模态理解领域的前沿能力。近期，上海AI实验室推出了其最新的多模态大语言模型InternVL3 系列，相比上一代InternVL2. 5 模型，该模型展现出卓越的多模态感知和推理能力，同时进一步扩展了其工具使用、GUI代理、工业图像分析等

多模态理解 AI大模型 InternVL3

今日大家都在搜的词：

热文

3 天
7天

消息称通义视觉负责人薄列峰离职或加入某大厂新组建多模态团队

荐多模态和Agent成为大厂AI的新赛点

荐多模态和Agent成为大厂AI的新赛点

曝联想自研芯片团队负责人已离职！此前曾在华为超5年

可灵AI发布全新2.0模型：上线多模态视频编辑功能

马斯克又痛失大将！特斯拉电池架构负责人将离职：已奉献17年

胖都来楼下超市叫叶波大润发负责人回应：是独立运营

紫东太初多模态RAG全新发布：端到端问答准确率提升33%

荐UniToken：多模态AI的“全能选手”，一次编码搞定图文理解与图像生成

业界唯一！百度网盘上线多模态AI笔记效率提升10倍

开源即支持！基于昇腾MindSpeed MM玩转InternVL3多模态理解最新模型

今日大家都在搜的词：

热文

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

马斯克称地球会被太阳焚化，网友：有科学依据，但…

20周年纪念版iPhone迎来重大变革，全屏设计+屏下摄像头

不顾特朗普的阻挠，Uber继续全球扩张…携手土耳其及中国企

今年第二次，亚马逊的 Zoox 召回 270 辆无人驾驶出租车

全网最大的“AI色情网站”MrDeepfakes宣布永久关闭

马斯克称地球会被太阳焚化，网友：有科学依据，但…

20周年纪念版iPhone迎来重大变革，全屏设计+屏下摄像头

不顾特朗普的阻挠，Uber继续全球扩张…携手土耳其及中国企

今年第二次，亚马逊的 Zoox 召回 270 辆无人驾驶出租车

站长商机

消息称通义视觉负责人薄列峰离职 或加入某大厂新组建多模态团队

今日大家都在搜的词：

热文

站长商机

消息称通义视觉负责人薄列峰离职或加入某大厂新组建多模态团队