首页 > 原创 > 关键词  > AI最新资讯  > 正文

AI日报:千问Qwen3-VL双子星开源;腾讯内测“上头蛙”AI互动故事小程序;小鹏祭出“物理世界大模型”

2026-01-09 16:31 · 稿源:站长之家

欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。

新鲜AI产品点击了解https://app.aibase.com/zh

1、通义千问再下一城:Qwen3-VL双子星开源,多模态检索迎来新范式

阿里通义实验室开源了Qwen3-VL-Embedding与Qwen3-VL-Reranker模型,标志着多模态信息检索进入语义对齐的新纪元。这两款模型通过高效的双塔架构和单塔交叉注意力机制,实现了跨模态内容的精准匹配与高效检索。

image.png

【AiBase提要:】

🚀 Qwen3-VL-Embedding采用双塔架构,实现文本、图像、视频等异构内容的统一向量表示。

🔍 Qwen3-VL-Reranker通过交叉注意力机制,提升检索结果的准确率与相关性。

🌐 支持超过30种语言,提供灵活的向量维度选择与高性能量化版本,降低开发者集成门槛。

详情链接:https://github.com/QwenLM/Qwen3-VL-Embedding

2、腾讯试水Z世代娱乐新赛道:“上头蛙”AI互动故事小程序内测,用生成式AI撬动年轻创作欲

文章探讨了腾讯推出的AI互动故事小程序“上头蛙”,其核心在于通过AI技术实现用户参与和共创内容,满足Z世代对互动性和社交性的需求,同时为腾讯在AIGC领域的应用提供新思路。

【AiBase提要:】

🎮 AI驱动的互动故事体验,让用户成为剧情的主导者。

👥 通过社交化设计,打造用户共创的内容社区。

🚀 腾讯尝试在生成式AI领域探索新的娱乐形态。

3、小鹏祭出“物理世界大模型”:第二代VLA剑指L4,无导航智驾时代开启

小鹏汽车在2026年全球新品发布会上发布了第二代VLA大模型,标志着智能驾驶系统向更高级别的L4初阶能力迈进。该模型具备理解、推演和生成动作的能力,能够主动模拟交通动态并预判潜在冲突,同时支持无导航自动辅助驾驶,极大拓展了高阶辅助驾驶的覆盖范围。

【AiBase提要:】

🧠 第二代VLA大模型实现从“感知-决策”到“理解-推演-生成”的范式跃迁。

🚗 支持无导航自动辅助驾驶,覆盖城市复杂支路和无标线道路等盲区。

🚀 跨域驱动能力可迁移至SUV、轿跑及未来飞行汽车,构建统一智能移动生态。

4、首日暴涨42%!MiniMax 登陆港交所创最快 IPO 纪录,引爆 AI 投资狂欢

MiniMax作为国产大模型领先企业,在港交所主板成功上市,首日股价暴涨42.67%,展现了资本市场对其的高度认可。其IPO过程创下港股新股市场纪录,成为全球从成立到IPO历时最短的AI公司,标志着中国大模型企业正式迈入二级市场的新时代。

image.png

【AiBase提要:】

🚀 MiniMax 在港交所上市,首日股价暴涨42.67%

💼 成为全球从成立到IPO历时最短的AI公司

📈 2026年开启中国大模型企业集体进入二级市场的新纪元

5、高德FantasyWorld一经发布就登顶世界模型榜首,阿里空间智能再下一城!

高德地图推出的自研世界模型FantasyWorld在国际权威基准WorldScore Leaderboard上夺得综合得分第一,展现了其在3D世界构建领域的技术实力。该模型通过创新的联合建模方法,显著提升了生成视频的视觉真实感和多视角一致性,同时支持下游任务无需额外优化。FantasyWorld已应用于高德地图的“飞行街景”功能,为商家提供高保真3D虚拟漫游街景,降低专业3D建模门槛,并推动了具身智能和自动驾驶领域的发展。

image.png

【AiBase提要:】

✨ FantasyWorld凭借创新的联合建模方法,在WorldScore Leaderboard上夺得综合得分第一

🚀 该模型显著提升生成视频的视觉真实感和多视角一致性,支持下游任务无需额外优化。

🧭 高德地图将FantasyWorld应用于“飞行街景”功能,助力商家提供高保真3D虚拟漫游街景。

6、1家抵8家!阿里千问下载量断层领跑,单月击败 Meta、OpenAI 等全球巨头总和

阿里千问大模型以断层优势领跑全球开源生态,下载量突破7亿次,单月击败Meta、OpenAI等全球巨头总和,全栈开源策略使其在多项性能指标上与顶级闭源模型抗衡,标志着国产开源大模型在国际开发者社区中的地位达到历史性顶峰。

image.png

【AiBase提要:】

🚀 千问系列模型下载量突破7亿次,成为全球开发者采用率最高开源模型

🔥 单月下载量超过Meta、OpenAI等全球巨头总和,展现爆发式增长态势。

🌟 全栈开源策略覆盖多模态领域,性能可与GPT-5-high等顶级闭源模型抗衡。

7、谷歌 Gmail 迎来重磅更新:AI 专属收件箱与自然语言搜索正式登场

谷歌 Gmail 迎来重磅更新,引入 AI 专属收件箱与自然语言搜索功能,提升用户邮件处理效率。

【AiBase提要:】

📧 AI 收件箱:自动梳理待办事项并总结重要更新

🔍 自然语言搜索:通过直接提问寻找邮件细节

🎁 多项功能全员免费:降低 AI 工具的使用门槛

8、马斯克 xAI 进军“Vibe Coding” ,新产品 Grok Build 曝光

马斯克的xAI公司正在推出一款名为Grok Build的新产品,其核心理念是“氛围式编程”,旨在通过自然语言让AI自动规划并构建代码。该产品将包含网页版和本地代理版本,并支持全流程自动化开发任务。马斯克确认Grok Code将进入密集更新期,这预示着AI编程工具市场将迎来更激烈的竞争。

image.png

【AiBase提要:】

💻 编程新范式: xAI 推出“氛围式编程”解决方案 Grok Build ,旨在通过自然语言让 AI 自动规划并构建代码。

🛠️ 多形态部署: 产品将包含网页版交互界面及配备 CLI 的本地代理版本,支持全流程自动化开发任务。

🚀 战略持续升级: 马斯克确认 Grok Code 将进入密集更新期,预示着 AI 编程工具市场将迎来更激烈的竞争。

举报

  • 相关推荐
  • 品牌AI搜索监控怎么做?GEO Base工具帮你追踪ChatGPT、通义千问等平台提及

    随着AI助手逐步取代传统搜索引擎,品牌曝光逻辑发生根本转变。过去SEO聚焦关键词排名,如今数字营销需应对更复杂挑战:当用户向AI提问时,品牌能否出现在答案中?这催生了全新优化范式——GEO(生成引擎优化),其核心在于管理品牌在AI生成答案中的表现。AIBase推出的GEO品牌监控工具,通过每日监测超千万次AI对话,提供品牌可见性指数、情感分析、竞品对比及引用溯源

  • Kimi即将推出新一代万亿大模型:开源王者刷新 去年已超GPT5

    国产开源大模型即将迎来新一波升级,除了万众期待的DeepSeek V4之外,月之暗面的Kimi也开始招募测试人员了,意味着很快也会上线。 根据Kimi的公告,他们即将开启Kimi新模型API内测计划,已完成「企业认证」的 Kimi 开放平台用户,均可申请。 前不久智谱、Minimax发布新一代模型之前都有招募测试的操作,而且内测没多久就开放了大模型的公开访问及API,随后又进一步开源给社�

  • 小米MiMo开源大模型充值功能上线:即将开启付费模式!

    小米MiMo开源大模型1月20日宣布开启付费模式,但为新老用户准备了专属免费额度,用户可登录后前往账户余额页面查收。计费系统近期将正式上线,此前API调用继续免费开放。MiMo-V2-Flash模型定价公布,国内用户需完成个人实名认证后充值,海外用户无需实名可直接充值。该模型在推理、代码和智能体场景表现突出,综合表现跻身当前开源大模型第一梯队,此前不少网友体验后表示其响应速度相比豆包、DeepSeek等模型更快。

  • AI日报:字节推StoryMem系统;月之暗面再推多模态新模型;AI眼镜Pickle 1发布

    本期AI日报聚焦多项AI领域进展:字节跳动推出StoryMem系统,提升AI生成视频角色一致性28.7%;月之暗面计划2026年推出多模态模型K2.1/K2.5;智能眼镜Pickle 1实现“无限记忆”与主动交互;清华与OpenBMB开源音频模型评测框架UltraEval-Audio;OpenAI押注语音交互,整合团队重构音频系统;开源工具Antigravity支持多账号切换,突破AI使用限制;元象开源面向泛娱乐场景的大模型XVERSE-Ent;苹果回应“国行版AI功能阉割”传闻,提醒用户勿通过第三方强行激活。

  • 百度发布文心大模型5.0正式版:2.4万亿参数 原生全模态建模

    今日,百度文心Moment”大会在上海召开。 大会现场,百度正式发布了文心大模型5.0正式版。 据介绍,该模型基于原生全模态建模,拥有2.4万亿参数,支持文本、图像、音频、视频等多种信息理解输出。 目前,文心5.0正式版可在百度千帆平台调用,文心一言官网、百度慧播星及文心助手等其他百度AI产品也已接入。 此前,文心5.0以1460分位列LMArena文本榜国内第一、全球第八�

  • AI日报:阿里云推多模态交互开发套件;智谱AI港股首日上市;混元发布 HY-Motion1.0开源3D 角色动画生成模型

    阿里云发布多模态交互开发套件,集成通义千问、万相、百聆三大模型,赋能智能硬件。腾讯混元推出开源3D角色动画生成模型HY-Motion 1.0,助力游戏与动画制作。智谱AI在港上市,募资43亿港元,加速商业化落地。抖音在深圳南山设立第二总部,聚焦AI与泛视频研发。OpenAI推出ChatGPT Health,强化健康数据管理与隐私保护。法拉第未来宣布进军具身智能机器人领域,推动汽车与机器人业务协同。蚂蚁阿福月活超3000万,AI健康赛道进入中美竞速新阶段。MiroThinker 1.5以300亿参数实现媲美万亿模型的性能,显著降低推理成本。

  • 什么是GEO品牌监控?怎么看自己的品牌在通义千问里有没有被推荐?

    本文探讨了在AI搜索时代,品牌如何监测在通义千问等国产AI模型中的曝光情况。文章介绍了GEO品牌监控的概念,即追踪品牌在AI回答中的提及率、排名及平台分布。推荐使用GEObase工具,它能监控五大国产AI平台,提供曝光率、竞品对比等数据。若发现提及率低,建议在知乎、微信公众号等中文平台多发内容,并针对常见问题撰写答案。品牌监控需定期进行,以适应AI模型更新和竞争变化,确保品牌在AI时代不“失踪”。

  • AI日报:天猫上线AI假图识别模型;百川发布医学模型Baichuan-M3 Plus;Remotion Skills开启一句话做大片时代

    本期AI日报聚焦多领域AI新进展:淘宝天猫上线AI假图识别模型,打击恶意售后;Inworld推出低延迟多语言TTS-1.5,革新游戏对话体验;百川智能发布医疗大模型Baichuan-M3+Plus,医学幻觉率降至2.6%;Remotion Skills实现自然语言生成专业视频动画;苹果内部AI工具Enchanté和Enterprise Assistant曝光,提升办公效率;YouTube计划推出“AI个人形象”功能,变革短视频创作;微软为Windows 11记事本与画图注入AI新能力;苹果拟将Siri重塑为类ChatGPT聊天机器人,代号“Campos”。

  • 开源向实 产业筑基:RT-Thread睿赛德的二十年跨越之路

    2026年1月17日,“开源向实·生产力进化启示录”全球峰会暨RT-Thread睿赛德二十周年开发者大会在沪举行。大会汇聚政府领导、院士、企业代表、全球开发者及技术管理者,共话开源如何重构生产关系,促进生产力发展变革。RT-Thread创始人熊谱翔回顾了系统二十年从实时内核起步到形成完整生态闭环的关键演进,累计装机量超25亿台,社区开发者规模突破30万。大会通过四大分论坛探讨“芯片+生态”“汽车+AI”等核心场景,并举行多项签约仪式。与会者一致认为,基础软件正被多行业同步认可与采用,逐步沉淀为产业级通用能力,开源已成为推动产业升级与自主可控建设的重要支撑力量。

  • 实时生成开放世界:新AI模型贴脸开大,游戏研发慌不慌?

    这两天,又有一款全新的AI模型出现了。 虽说如今AI改变各行各业的事情早就屡见不鲜,在游戏业,很多岗位也或多或少已经用上了AI技术,但最近发布的这款AI模型,它真不一样。 这款AI模型名叫PixVerse R1,按官方说法,PixVerse R1是全球首个真正意义上的「实时生成世界模型(Real-time World Model)」。

今日大家都在搜的词: