11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多领域进展:阿里开源Qwen3-VL多模态检索模型,腾讯推出AI互动故事小程序“上头蛙”,小鹏发布第二代VLA模型剑指L4智驾。MiniMax港股上市首日暴涨42%,高德世界模型登顶国际榜单。阿里千问下载量突破7亿,单月击败Meta、OpenAI总和。谷歌Gmail引入AI专属收件箱与自然语言搜索,马斯克xAI进军“氛围编程”推Grok Build。
本期AI日报涵盖多项重要进展:阿里通义千问发布分层图像编辑模型Qwen-Image-Layered,实现类似Photoshop的图层操作;Claude Chrome插件全面开放,提升AI与网页交互体验;快手Kling 2.6通过语音与动作控制提升视频生成质量;MiniMax通过港交所上市聆讯,展现AI领域实力;三星与谷歌合作推出全球首款搭载Gemini的AI冰箱,实现食材识别与红酒管理;北京人形机器人推出国内首个符合国标的VLA大模型XR-1,具备复杂操作能力;谷歌推出A2UI开放标准,让AI代理即时创建图形界面;以及开源提示词工具PromptFill上线,降低AI绘画门槛。
阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。 千问新模型采用自研创新架构,可将图片拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。 Qwen-Image-Layered打破了主流视觉大模型的扁平式思维”,模型通过分层�
本文介绍了近期AI领域多项重要进展:阿里发布Qwen3-TTS语音合成模型,支持49种音色和10种语言;推出全模态大模型Qwen3-Omni-Flash,支持实时流式交互。谷歌上线Gemini TTS 2.5,具备情绪化表达和多语言支持。商汤科技推出Seko 2.0,可一句话生成百集连贯动画。此外,DeepSeek入选年度汉字候选,Adobe与ChatGPT合作推出图像与PDF编辑功能,腾讯元宝AI推出QQ群消息总结功能,以及ChatGPT登顶美国苹果应用商店免费榜。这些进展展示了AI技术在语音、多模态、内容生成及日常应用方面的快速发展与普及。
本期AI日报涵盖多项AI领域进展:OpenAI正对两款新图像生成模型进行盲测,性能显著提升;阿里通义千问推出Qwen-Image-i2L技术,可将单张图片快速转为可微调的LoRA模型,降低个性化风格迁移门槛;智谱AI开源GLM-ASR语音识别模型并推出桌面端输入法,提升语音交互体验;通用AI助手“灵光”上线科普动画生成功能,帮助可视化复杂科学原理;麦当劳AI生成圣诞广告因争议被撤;马斯克的xAI推出Halftime工具,可将AI广告实时植入影视内容,引发艺术完整性讨论;阿里巴巴成立“千问C端事业群”,整合夸克、UC等资源,旨在打造AI时代的超级APP;微软网页版Excel推出“智能体模式”,AI可深度参与复杂数据处理任务。
本期AI日报汇总了多项AI领域新进展:可灵AI推出“主体库”解决视频角色变脸问题;阿里Qwen3-TTS支持多语言多音色;腾讯混元2.0大模型开启内测;美团开源图像生成模型LongCat-Image;京东云支持千卡训练推动具身智能;英伟达小模型NVARC成本优势显著;微博CEO回应AI手机自主发博功能;微软推出轻量级实时TTS模型VibeVoice。
11月24日,阿里旗下AI助手“千问”启用新域名qianwen.com,网页端与App端体验一致,用户可直接体验其强大能力。网页端面向专业用户开放更多Qwen3系列模型选择,并新增代码、深度研究及对话分组功能。千问基于全球性能第一的开源模型Qwen3,免费使用,结合各类生活场景生态,与ChatGPT全面竞争。自11月17日公测以来,千问App下载量一周突破1000万次,增长速度超越ChatGPT、Sora及DeepSeek同期表现,刷新行业纪录,成为史上增长最快的AI应用。
Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�
本期AI日报聚焦多领域技术突破:美团发布全模态交互模型LongCat-Flash-Omni;阿里通义千问Qwen3-Max上线深度思考功能;百度文心5.0升级多模态生成能力;谷歌确认Gemini3年内发布并整合至苹果Siri;OpenAI向多国开放Sora2视频工具;云存储与AI开发工具持续优化,展现行业加速迭代态势。
近期AI炒币大赛Alpha Arena引发关注,六款主流大模型用1万美元本金在币圈实战。戏剧性的是,被寄予厚望的GPT-5和Gemini因高杠杆操作亏损惨重,而中国开源模型表现亮眼——通义千问Qwen以53%回报率逆袭登顶,DeepSeek紧随其后。硅谷巨头Airbnb CEO公开表态依赖Qwen,投资人Chamath也承认将业务转向中国模型。市场用真金白银投票:预测平台押注Qwen胜率高达36%,远超OpenAI的3%。这场竞赛�