11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
今日AI领域动态:豆包推出月费68-500元三档付费订阅,推进商业化;OpenAI发布GPT-5.5 Instant,取代5.3成为ChatGPT默认模型;苹果iOS 27或支持第三方AI模型,打破封闭生态;淘宝“答题免单”上线,首次加入AI试穿玩法;魔形智能完成数亿元Pre-A轮融资,布局Token基础设施;谷歌神秘项目“Remy”曝光,打造24小时AI助教;谷歌推出Gemini Ultra Lite新订阅服务,填补中高端市场空白;ChatGPT上线广告主平台,AI商业化迎来分水岭。
本期AI日报聚焦行业动态:OpenAI紧急上线GPT-5.3 Instant,重点解决“爹味说教”问题;Anthropic推出Claude Code语音编程模式,提升开发效率。马云带领阿里与蚂蚁核心层访问云谷学校,探讨AI浪潮下的教育变革。AReaL v1.0框架发布,降低智能体强化学习开发门槛。阶跃星辰开源Step3.5Flash模型,参数达1960亿。阿里通义千问负责人林俊旸离职,反映大模型人才高频流动趋势。谷歌发布Gemini
本期AI日报聚焦行业动态与产品更新。Meta以数十亿美元收购AI初创公司Manus,强化通用AI代理技术。腾讯混元发布1.5版开源翻译模型,端侧部署性能提升。上海16部门联合发文推动“AI+消费”,将发放算力券、模型券等支持工具。微软Copilot全线升级GPT-5.2,免费开启“专家级”工作流。Zara利用AI技术数字化编辑模特照片以削减成本,引发行业讨论。Plaud Note Pro AI录音笔凭借超薄离线和隐私保护设计,成为专业用户首选。OpenAI更新手机版ChatGPT,用户可调节AI思考深度。Claude Code可视化工作流编辑器发布,通过拖拽节点即可构建AI自动化流程。
荣耀亲选iotapk AI通话耳机将于1月5日发布。该产品支持插入SIM卡独立通话,摆脱手机束缚。其充电舱配备屏幕与摄像头,搭载安卓系统,形态新颖。主打全网通视频通话、全能AI学习助手和独立即时通讯软件三大功能。内置电话、短信等基础应用,支持安装微信、QQ等第三方App,适合低龄用户满足基础通讯与社交需求,同时避免过早使用手机可能带来的问题。
本期AI日报汇总了多项AI领域重要进展:Google Gemini应用新增视频AI生成检测功能;GPT-5.2-Codex发布,在代码重构与安全方面表现卓越;美团推出SOTA级虚拟人视频生成模型LongCat-Video-Avatar;苹果发布多模态AI模型UniGen 1.5,集成图像理解、生成与编辑;ElevenLabs的AI语音助手集成至WhatsApp,提升客服效率;字节跳动与硬件厂商合作推出AI手机方案;Claude AI上线新“任务模式”,增强复杂任务处理能力;Luma发布Ray3 Modify,实现高保真视频AI编辑;QQ音乐推出本地化AI作曲功能,保障隐私;微信元宝AI助手新增一句话设置提醒及多内容解析能力。
OpenAI今天正式推出GPT-5.2-Codex,官方直言这是迄今最先进的智能体编程模型,在长程任务处理、大规模代码重构、Windows环境适配等方面全面升级。 付费ChatGPT用户今日起可在Codex CLI、IDE扩展等场景体验,API访问将在未来几周开放。 GPT-5.2-Codex主要有四大亮点: 长程任务更能打:新增原生上下文压缩技术,处理大型代码仓库跨周期协作时不丢失进度,比如持续数周的项目重构,�
本期AI日报聚焦多领域AI新进展:OpenAI推出图像生成模型GPT Image 1.5,性能显著提升;腾讯发布混元世界模型1.5,开启实时交互虚拟世界;小米开源3090亿参数大模型MiMo-V2-Flash,推理速度领先;字节跳动发布Seedance 1.5 Pro,实现视听同步创作;Apple Music将与ChatGPT集成,简化歌单创建;Gemini预测市场全美上线,支持事件预测交易;Adobe Firefly视频功能升级,支持精准提示编辑;谷歌实验室推出AI助手CC,集成Gemini技术管理日程。
本期AI日报聚焦多款AI产品更新:Medeo AI新版视频Agent支持自然语言一键改剧本,降低创作门槛;钉钉8.1.10将AI融入职场沟通,提升效率;OpenAI低调上线GPT-5.2,延迟显著降低,逻辑一致性提升,并推出支持私有化部署的成人模式;迪士尼投资100亿美元与OpenAI合作,推动IP在生成式AI中的创新应用;谷歌Gemini Deep Research开放API,供开发者构建研究应用;Cohere推出Rerank 4,上下文窗口扩展至32K,提升企业搜索精度;拓竹科技推出3D手办生成器“印你”,依托腾讯混元3D模型,简化3D建模流程;谷歌NotebookLM升级,为Ultra会员提供更高权限,优化智能笔记体验。
OpenAI于12月12日正式推出新一代大模型GPT-5.2,付费用户端及API同步开放。该模型首次采用“三版本细分”策略,针对不同需求精准匹配:Instant版主打低延迟、高响应,适合日常交互;Thinking版聚焦复杂任务,如编程、长文档分析,担当企业“智能助手”;Pro版面向高难度专业场景,强调极致准确性与可靠性。技术性能上,GPT-5.2在编程、数学计算、事实准确性及多模态处理等方面均有突破,能直接生成表格、制作PPT、编写多语言代码,显著提升职场效率。据预测,重度用户每周可减少10小时以上重复性工作。此外,OpenAI计划于2026年第一季度上线成人模式,并将所有版本的知识库更新至2025年8月,确保信息贴近现实。此次发布标志着AI开始深入专业场景,成为推动行业变革的核心力量。
今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。 SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。