11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦多项AI技术突破:Kling AI Avatar 2.0上线,实现数字人表情动作智能生成;谷歌推出Gemini 3 Deep Think模式,显著提升AI推理能力;微软发布轻量级实时语音模型VibeVoice 0.5B;OpenAI最强编码模型GPT-5.1-CodexMax全面接入API;阿里云“析言 XiYan-SQL”在SQL诊断评测中夺冠。此外,豆包助手调整AI操作能力,谷歌将展示Android XR平台更新。
就在上周,OpenAI前首席科学家、现SSI CEO Ilya Sutskever在最新播客访谈中抛出一个重磅观点,过去五年的“age of scaling”正在走到头,预训练数据是有限的,单纯用更多GPU堆更大模型,哪怕再放大100倍,也未必能带来质变。所以我们又回到了以研究为核心的时代,只不过这次有了巨大的算力”,这一表态被视作对Scaling Law撞墙论的强力佐证。 然而仅过了几天,12月1日,DeepSeek用V3
今日,空间推理基准测试SpatialBench更新了最新一期榜单,阿里千问的视觉理解模型Qwen3-VL、Qwen2.5-VL位列头两名,超越Gemini 3、GPT-5.1、Claude Sonnet4.5等国际顶尖模型。 SpatialBench榜单显示,Qwen3-VL-235B和Qwen2.5-VL-72B分别斩获13.5和12.9分,领先于Gemini 3.0 Pro Preview(9.6) 、GPT-5.1(7.5)、Claude Sonnet 4.5等海外顶尖模型。
根据官方预约界面显示,vivo S50系列确定将在12月发布,近期官方也已经陆续开启预热。 刚刚,vivo产品经理韩伯啸发文确认系列保留了Pro mini机型,并且官宣该机将首批搭载第五代骁龙8。
谷歌发布Gemini 3大模型及Antigravity AI开发平台,支持参数灵活调整;Cloudflare因配置异常致全球服务中断6小时;微软测试AI文件连接器,允许Claude直接读取本地文件;百度Q3 AI收入96亿元,萝卜快跑订单激增;小米AI眼镜新增直播与语音控制功能;TikTok推出AI内容推荐调节选项;微软将Copilot全面集成至Office应用;谷歌推出实时生成交互界面的Generative UI技术;Manus发布Browser Operator,将浏览器升级为全功能AI代理。
经过238天等待,Gemini 3 Pro正式上线。在多项基准测试中表现惊人:Humanity's Last Exam测试达45.8%,Math Arena Apex获23.4分,ScreenSpot-Pro界面识别达72.7%。其前端代码能力尤为突出,仅用几十秒就能生成完整网页音乐播放器、像素画板,甚至成功复刻出可运行的Web OS系统。目前该模型在各大竞技场排行榜均位列第一,堪称2025年最具突破性的大模型。
本期AI日报聚焦多项技术突破:火山引擎发布豆包视频生成模型1.0pro+fast,速度提升3倍且价格下降72%;百度与上海体育大学推出“上体体育大模型2.0”,拓展AI在运动员训练等场景应用;谷歌Gemini新增一键生成PPT功能;美团发布LongCat-Video模型,支持5分钟连贯视频生成;xAI推出虚拟女友Mika引发热议;MiniMax开源高性能M2编码模型;OpenAI上线企业知识管理功能;另报道20岁辍学生开发的AI笔记工具Turbo AI半年用户破500万,展现年轻创业者的技术影响力。
谷歌Gemini 3.0 Pro开始小范围推送,强化推理与多模态能力;百度发布全球领先文档解析模型PaddleOCR-VL,重塑OCR技术格局;爱诗科技完成亿元B+轮融资,ARR突破4000万美元;Anthropic推出Claude“skills”功能,提升AI工作效率;Pinterest推出AI内容限制工具,用户可自定义减少生成式图像;开源多模态模型LLaVA-OneVision-1.5超越Qwen2.5-VL;OpenAI视频生成模型Sora 2上线微软Azure平台,进入公共预览阶段;旅行搜索引擎Kayak推出“AI模式”,简化旅行规划与预订流程。
快手开源72B代码模型KAT-Dev在SWE-Bench测试中准确率达74.6%,创国产AI编程里程碑;杭州云深处推出全球首款IP66防护全候作业机器人DR02;谷歌Chrome将集成Gemini引发隐私担忧;学者指控苹果使用盗版书籍训练AI,版权争议再起;Liquid AI发布高效稀疏激活模型LFM2-8B-A1B;苹果拟收购Prompt AI布局智能家居视觉技术;AI伴侣应用泄露4300万条用户隐私对话;西湖大学DeepScientist显著提升科研效率。
面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。