11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
12月17日,Google 正式发布 Gemini3Flash。一个定价只有 Claude1/5、GPT1/4的“轻量模型”,在编码上超过 Claude Sonnet4.5,在推理和多模态上全面碾压,和 GPT-5.2也互有胜负。
本期AI日报聚焦多领域进展:谷歌发布轻量级Gemini 3 Flash模型,响应速度提升三倍,性能超越Pro版。火山引擎推出豆包大模型1.8及视频生成模型Seedance 1.5 Pro,并启动“AI节省计划”。苹果开源SHARP模型,可将2D照片快速转为3D场景。Meta发布全球首个支持“点击分离声音”的多模态音频模型SAM Audio。MiniMax拟通过港交所上市,或成国产大模型“第一股”。OpenAI开放ChatGPT应用提交权限,向AI原生应用平台演进。千问App接入高德地图,增强现实世界理解能力。微软开源高效图像转3D模型工具TRELLIS.2。xAI推出最快语音代理API,支持中文实时搜索与情绪控制。豆包AI眼镜预计2025年初上市,定价2000元以内,融合大模型与硬件。
Google正式发布新一代轻量模型Gemini 3 Flash,其响应速度达到前代的三倍,几近实现零延迟”交互。 更夸张的是,此次Flash版本在多项关键测试中表现卓越,甚至超越了同家族的旗舰模型。在SWE-bench上,Gemini 3 Flash以78%的得分小幅领先于Gemini 3 Pro的76.2%,这也是Flash系列首次在同期对比中超越Pro型号。
本期AI日报聚焦多领域AI新进展:OpenAI推出图像生成模型GPT Image 1.5,性能显著提升;腾讯发布混元世界模型1.5,开启实时交互虚拟世界;小米开源3090亿参数大模型MiMo-V2-Flash,推理速度领先;字节跳动发布Seedance 1.5 Pro,实现视听同步创作;Apple Music将与ChatGPT集成,简化歌单创建;Gemini预测市场全美上线,支持事件预测交易;Adobe Firefly视频功能升级,支持精准提示编辑;谷歌实验室推出AI助手CC,集成Gemini技术管理日程。
今日,小米举办2025小米人车家全生态合作伙伴大会,小米集团总裁卢伟冰发表《一路同行,澎湃未来》主题演讲。 卢伟冰宣布,小米自研AI大模型Xiaomi MiMo-V2-Flash已正式开源上线,他将其称为迈向Agent时代的全新语言基座。 根据卢伟冰公布的小米自研MiMo系列的时间表,目前小米已经推出推理大模型MiMo-7B、视觉推理大模型MiMo-VL、原生端到端音频生成模型MiMo-Audio、端侧视觉语�
小米于12月17日正式发布并开源全新大模型MiMo-V2-Flash。该模型专为智能体AI设计,拥有3090亿总参数量与150亿激活参数量,在推理速度、代码生成及智能体场景应用中展现出超高性能,成为日常任务处理的通用型助手。据官方披露,MiMo-V2-Flash在多项综合基准测试中表现优异,核心指标已达到行业领先的DeepSeek-V3.2同等水平。该模型通过预训练与后训练阶段的数据算法创新,实现了推理能力的显著提升,尤其在智能体交互场景中展现出更高效的响应速度。目前用户可通过小米AI开放平台体验模型功能。小米AI实验室负责人罗福莉将在12月17日举行的“人车家全生态合作伙伴大会”上首次公开亮相,预计将披露更多技术细节与生态合作规划。
蚂蚁百灵团队开源高性能思考模型Ring-flash-2.0,在多项基准测试中表现优异;阿里通义7款模型登顶Hugging Face榜单,Qwen3-Omni凭借多模态能力全球第一。谷歌Veo3突破视频生成局限,可自动完成视觉任务;特斯拉推进人形机器人量产,马斯克称其为最重要产品。马斯克第六次起诉OpenAI窃取商业机密,苹果内部测试聊天机器人Veritas优化Siri,YouTube推出AI音乐主播增强互动,LiquidAI发布轻量级模型Liquid Nanos优化边缘计算。
本文汇总了AI领域最新动态:谷歌推出Gemini 2.5 Flash图像编辑模型,字节发布Waver 1.0视频生成工具;百度“梯子AI”提供无广告搜索;文心快码新增终端编码功能;腾讯游戏VISVISE工具集提升动画制作效率;自动驾驶配送机器人RM5进军外卖行业;DeepSeek V3.1出现字符Bug已修复;谷歌翻译升级实时同传和AI陪练;全球首现AI勒索软件PromptLock威胁网络安全;Anthropic推出Chrome浏览器AI助手Claude。
开发者分享模型选择心路历程:从盲目试错到数据驱动。曾因追求低价模型导致成本飙升,后通过AIbase平台对比Gemini 2.5 Flash-Lite和DeepSeek-V3,基于价格、上下文长度和代码能力等数据,最终选择更适合代码生成任务的DeepSeek-V3。强调没有“最好”的模型,只有“最适合”的模型,建议开发者善用专业工具进行数据驱动决策,避免隐性成本。
面对琳琅满目的大模型API,开发团队常陷入选择困境。文章指出,2024年既是机遇也是挑战的时代,闭源模型选择丰富但性能与成本平衡复杂。通过AIbase等数据驱动平台进行客观对比至关重要。以Gemini 2.5 Flash-Lite和DeepSeek-V3为例,前者综合能力强适合多语言场景,后者在代码生成和成本控制上优势明显。建议开发者明确需求,通过实际测试验证模型表现,理性选择最适合的方案。