AI日报：千问Qwen3-VL双子星开源；腾讯内测“上头蛙”AI互动故事小程序；小鹏祭出“物理世界大模型”

2026-01-09 16:31 · 稿源：站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南，每天我们为你呈现AI领域的热点内容，聚焦开发者，助你洞悉技术趋势、了解创新AI产品应用。

1、通义千问再下一城：Qwen3-VL双子星开源，多模态检索迎来新范式

阿里通义实验室开源了Qwen3-VL-Embedding与Qwen3-VL-Reranker模型，标志着多模态信息检索进入语义对齐的新纪元。这两款模型通过高效的双塔架构和单塔交叉注意力机制，实现了跨模态内容的精准匹配与高效检索。

【AiBase提要:】

🚀 Qwen3-VL-Embedding采用双塔架构，实现文本、图像、视频等异构内容的统一向量表示。

🔍 Qwen3-VL-Reranker通过交叉注意力机制，提升检索结果的准确率与相关性。

🌐 支持超过30种语言，提供灵活的向量维度选择与高性能量化版本，降低开发者集成门槛。

详情链接:https://github.com/QwenLM/Qwen3-VL-Embedding

2、腾讯试水Z世代娱乐新赛道：“上头蛙”AI互动故事小程序内测，用生成式AI撬动年轻创作欲

文章探讨了腾讯推出的AI互动故事小程序“上头蛙”，其核心在于通过AI技术实现用户参与和共创内容，满足Z世代对互动性和社交性的需求，同时为腾讯在AIGC领域的应用提供新思路。

【AiBase提要:】

🎮 AI驱动的互动故事体验，让用户成为剧情的主导者。

👥 通过社交化设计，打造用户共创的内容社区。

🚀 腾讯尝试在生成式AI领域探索新的娱乐形态。

3、小鹏祭出“物理世界大模型”：第二代VLA剑指L4，无导航智驾时代开启

小鹏汽车在2026年全球新品发布会上发布了第二代VLA大模型，标志着智能驾驶系统向更高级别的L4初阶能力迈进。该模型具备理解、推演和生成动作的能力，能够主动模拟交通动态并预判潜在冲突，同时支持无导航自动辅助驾驶，极大拓展了高阶辅助驾驶的覆盖范围。

【AiBase提要:】

🧠 第二代VLA大模型实现从“感知-决策”到“理解-推演-生成”的范式跃迁。

🚗 支持无导航自动辅助驾驶，覆盖城市复杂支路和无标线道路等盲区。

🚀 跨域驱动能力可迁移至SUV、轿跑及未来飞行汽车，构建统一智能移动生态。

4、首日暴涨42%!MiniMax 登陆港交所创最快 IPO 纪录，引爆 AI 投资狂欢

MiniMax作为国产大模型领先企业，在港交所主板成功上市，首日股价暴涨42.67%，展现了资本市场对其的高度认可。其IPO过程创下港股新股市场纪录，成为全球从成立到IPO历时最短的AI公司，标志着中国大模型企业正式迈入二级市场的新时代。

【AiBase提要:】

🚀 MiniMax 在港交所上市，首日股价暴涨42.67%

💼 成为全球从成立到IPO历时最短的AI公司

📈 2026年开启中国大模型企业集体进入二级市场的新纪元

5、高德FantasyWorld一经发布就登顶世界模型榜首，阿里空间智能再下一城！

高德地图推出的自研世界模型FantasyWorld在国际权威基准WorldScore Leaderboard上夺得综合得分第一，展现了其在3D世界构建领域的技术实力。该模型通过创新的联合建模方法，显著提升了生成视频的视觉真实感和多视角一致性，同时支持下游任务无需额外优化。FantasyWorld已应用于高德地图的“飞行街景”功能，为商家提供高保真3D虚拟漫游街景，降低专业3D建模门槛，并推动了具身智能和自动驾驶领域的发展。

【AiBase提要:】

✨ FantasyWorld凭借创新的联合建模方法，在WorldScore Leaderboard上夺得综合得分第一

🚀 该模型显著提升生成视频的视觉真实感和多视角一致性，支持下游任务无需额外优化。

🧭 高德地图将FantasyWorld应用于“飞行街景”功能，助力商家提供高保真3D虚拟漫游街景。

6、1家抵8家!阿里千问下载量断层领跑，单月击败 Meta、OpenAI 等全球巨头总和

阿里千问大模型以断层优势领跑全球开源生态，下载量突破7亿次，单月击败Meta、OpenAI等全球巨头总和，全栈开源策略使其在多项性能指标上与顶级闭源模型抗衡，标志着国产开源大模型在国际开发者社区中的地位达到历史性顶峰。

【AiBase提要:】

🚀 千问系列模型下载量突破7亿次，成为全球开发者采用率最高开源模型

🔥 单月下载量超过Meta、OpenAI等全球巨头总和，展现爆发式增长态势。

🌟 全栈开源策略覆盖多模态领域，性能可与GPT-5-high等顶级闭源模型抗衡。

7、谷歌 Gmail 迎来重磅更新:AI 专属收件箱与自然语言搜索正式登场

谷歌 Gmail 迎来重磅更新，引入 AI 专属收件箱与自然语言搜索功能，提升用户邮件处理效率。

【AiBase提要:】

📧 AI 收件箱：自动梳理待办事项并总结重要更新

🔍 自然语言搜索：通过直接提问寻找邮件细节

🎁 多项功能全员免费：降低 AI 工具的使用门槛

8、马斯克 xAI 进军“Vibe Coding” ，新产品 Grok Build 曝光

马斯克的xAI公司正在推出一款名为Grok Build的新产品，其核心理念是“氛围式编程”，旨在通过自然语言让AI自动规划并构建代码。该产品将包含网页版和本地代理版本，并支持全流程自动化开发任务。马斯克确认Grok Code将进入密集更新期，这预示着AI编程工具市场将迎来更激烈的竞争。

【AiBase提要:】

💻 编程新范式: xAI 推出“氛围式编程”解决方案 Grok Build ，旨在通过自然语言让 AI 自动规划并构建代码。

🛠️ 多形态部署: 产品将包含网页版交互界面及配备 CLI 的本地代理版本，支持全流程自动化开发任务。

🚀 战略持续升级: 马斯克确认 Grok Code 将进入密集更新期，预示着 AI 编程工具市场将迎来更激烈的竞争。

