11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
欢迎来到【AI日报】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。新鲜AI产品点击了解:https://app.aibase.com/zh1、爆改漫画师?OpenAI 发布 ChatGPT Images 2.0,单次可生成8张连贯图像OpenAI 推出 ChatGPT Images 2.0,引入推理规划功能,使图像生成更加符合逻辑;支持单次生成8张连贯图像,适用于漫
本文汇总了AI领域的最新动态:Chrome为Gemini新增“技能库”功能,简化提示词复用;小红书开源大模型训练引擎Relax,提升多模态训练效率;Midjourney V8.1发布,优化渲染速度与成本;阿里千问AI眼镜全球首店开业,加速硬件生态布局;美团推出AI家庭健康管理产品;李飞飞公司发布集成Three.js的3D渲染器Spark2.0;Claude Code推出自动化流程功能Routines;天猫发布新规规范AI软件及商品发布。
本期AI日报聚焦行业动态:谷歌将停用Gemini 3 Pro Preview,开发者需迁移至3.1版本;DeepSeek V4发布,支持多模态生成并与华为、寒武纪合作优化硬件;微软计划推出AI软件组合,月费或高达99美元;爱奇艺财报显示利润下滑,将押注AI电影制作与去中心化转型;壁仞智能完成数亿元融资,深化端侧AI布局;英伟达将发布集成Groq技术的推理处理器,巩固市场地位;联想展示模块化AI PC概念,提升用户体验;我国发布首个国家级人形机器人标准体系,推动产业高质量发展。
本期AI日报汇总了人工智能领域的最新动态。谷歌发布Gemini 3.1 Pro,推理能力显著提升,多项基准测试超越GPT-4o。Anthropic为Claude Code推出“远程控制”功能,实现移动设备无缝管理电脑编码任务。OpenAI发布深度融合推理能力的编程模型GPT-5.3-Codex。通义千问Qwen3.5开源家族新增多款模型并上线托管服务。Meta开源GPU集群监控工具GCM,精准定位硬件故障。Anthropic发布企业级插件,将Claude深度集成至Office全家桶。谷歌AI虚拟形象支持24种语言,提升跨语言沟通效率。阿里云Coding Plan推出低价订阅服务,降低开发者使用成本。
今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�
12月17日,Google 正式发布 Gemini3Flash。一个定价只有 Claude1/5、GPT1/4的“轻量模型”,在编码上超过 Claude Sonnet4.5,在推理和多模态上全面碾压,和 GPT-5.2也互有胜负。
本期AI日报聚焦多领域进展:谷歌发布轻量级Gemini 3 Flash模型,响应速度提升三倍,性能超越Pro版。火山引擎推出豆包大模型1.8及视频生成模型Seedance 1.5 Pro,并启动“AI节省计划”。苹果开源SHARP模型,可将2D照片快速转为3D场景。Meta发布全球首个支持“点击分离声音”的多模态音频模型SAM Audio。MiniMax拟通过港交所上市,或成国产大模型“第一股”。OpenAI开放ChatGPT应用提交权限,向AI原生应用平台演进。千问App接入高德地图,增强现实世界理解能力。微软开源高效图像转3D模型工具TRELLIS.2。xAI推出最快语音代理API,支持中文实时搜索与情绪控制。豆包AI眼镜预计2025年初上市,定价2000元以内,融合大模型与硬件。
Google正式发布新一代轻量模型Gemini 3 Flash,其响应速度达到前代的三倍,几近实现零延迟”交互。 更夸张的是,此次Flash版本在多项关键测试中表现卓越,甚至超越了同家族的旗舰模型。在SWE-bench上,Gemini 3 Flash以78%的得分小幅领先于Gemini 3 Pro的76.2%,这也是Flash系列首次在同期对比中超越Pro型号。
今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。 SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。
谷歌发布Gemini 3大模型及Antigravity AI开发平台,支持参数灵活调整;Cloudflare因配置异常致全球服务中断6小时;微软测试AI文件连接器,允许Claude直接读取本地文件;百度Q3 AI收入96亿元,萝卜快跑订单激增;小米AI眼镜新增直播与语音控制功能;TikTok推出AI内容推荐调节选项;微软将Copilot全面集成至Office应用;谷歌推出实时生成交互界面的Generative UI技术;Manus发布Browser Operator,将浏览器升级为全功能AI代理。