11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多领域AI进展:Kling 2.6发布,支持音频同步生成,AI视频进入有声时代;千问APP推出学习大模型,提升拍照答疑与作业批改能力;阿里通义实验室开源图像生成模型,实现精准控制;豆包手机助手遭遇微信登录异常,凸显生态兼容挑战;米哈游推出带猫语特色的AI聊天模型AnuNeko;亚马逊云科技发布三款新型AI智能体,其中Kiro可自主编程数日;IDC报告预测具身智能�
Black Forest Labs推出全新FLUX.2图像生成模型系列,支持FP8量化技术,显著降低40%显存占用同时提升40%性能。该模型具备多参考图像生成功能,可批量生成数十张相似图像,支持直接姿态控制与400万像素高分辨率输出,文字渲染清晰锐利。通过与NVIDIA及ComfyUI合作优化,用户现可直接在升级版ComfyUI中使用该模型,无需额外安装。模型需搭配RTX GPU运行,建议更新软件后通过官方渠道获取模板。
今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。 SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。
Anthropic于11月25日正式发布旗舰AI模型Claude Opus 4.5并投入商用。该模型在编程、智能代理等领域表现卓越,尤其在处理复杂研究任务及电子表格、PPT制作等办公场景显著优于同类产品。专业测试显示其编程能力超越谷歌Gemini 3 Pro与OpenAI GPT-5.1,在软件工程师闭卷测试中甚至超过所有历史人类考生。同步更新的多款配套工具(如浏览器扩展、Excel增强功能)进一步强化技术生态。目前该模型已全面接入企业级服务,标志着Anthropic在AI商业化进程中的关键突破。
OpenAI将停止GPT-4o模型API访问,开发者需尽快迁移至GPT-5.1系列。小米开源跨域具身大模型MiMo-Embodied,在29项基准测试中全面领先。清华提出“能力密度”评估体系,强调模型应注重高密度、轻规模。月之暗面即将融资40亿美元,计划明年启动IPO。灵光AI助手上线6天突破200万下载,展现强大市场潜力。谷歌在安卓版Chrome浏览器增加AI图像生成功能。Udio取消用户下载AI音乐作品权利,引发创作者不满。育碧推出首款可玩生成式AI项目“Teammates”,通过实时语音指令提升游戏体验。
Qwen模型逆袭GPT的策略,阿里准备再用一次。 2018年,OpenAI发布了自己的第一个模型GPT1,占据了技术先机,随后变得越来越封闭。在大洋彼岸,阿里几乎同一时间着手大模型研究,到2023年推出“通义千问”时,则选择了一条完全不同的路径:直接开源模型,允许开发者免费使用、改进和集成。 这个策略让Qwen逐步积累起规模,做到了如今全球开发者基于它发布了17万个衍生模型�
本期AI日报聚焦多项技术突破:World Labs推出Marble 3D模型,实现多模态生成可交互虚拟世界;OpenAI在韩新试点ChatGPT群聊功能,支持多人协作互动;苹果更新隐私政策,要求第三方AI调用需明示授权;百度发布多模态助手“超能小度”,支持空间感知与设备免费升级;LinkedIn推出AI人脉搜索,通过自然语言精准匹配专业人士;Cursor完成23亿美元融资,估值达293亿;Character AI与耶鲁合作实现音画同步技术Ovi;Google NotebookLM上线深度研究工具,支持多格式文件分析与知识库构建。
OpenAI正式推出GPT-5.1模型,以“智商与情商深度融合”为核心亮点。新模型优化推理能力,强化情绪价值与个性化交互,包含Instant与Thinking两大核心版本:Instant首次引入自适应推理功能,针对复杂任务延长思考时间,简单问题保持极速响应;Thinking版本智能分配思考时长,提升回答透彻度与通俗性。新增Auto功能自动匹配最佳模型,支持六种官方预设风格及精准微调。安全评估首次纳入心理健康与情感依赖维度,防范拟人化风险。付费用户可保留旧版三个月过渡期。
本期AI日报聚焦多项技术突破:月之暗面开源AI代理框架Kosong,支持异步编排与插件化设计;Replit推出AI集成功能,可一键调用300+模型;商汤发布空间智能模型SenseNova-SI,性能超越GPT-5;百度推出多模态模型ERNIE-4.5-VL,新增图像思考能力;谷歌地图全面AI化,集成Gemini实现智能交互;ChatTutor上线可视化教学系统,覆盖多学科实时推演;新版Google Finance引入AI深度搜索与财报追踪;OpenAI低调上线Polaris Alpha模型,支持256K上下文并更新知识库至2024年10月。
Utopai Studios推出专为影视制作设计的AI模型与工作流,区别于主流视频生成模型,其核心能力在于理解剧本、规划镜头及生成场景,通过自回归模型负责叙事规划与一致性约束,扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题,提升制作效率与作品品质。目前工作流仅用于公司自有项目,强调AI作为创作者协作者的角色,并遵循行业道德与版权规范。