11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
近日,谷歌官方披露其旗舰AI模型Gemini正遭遇商业化驱动的大规模蒸馏攻击通过重复提问诱导聊天机器人泄露内部机制。攻击者通过系统地、反复地向模型发送精心设计的提示词,试图逆向工程Gemini的内部推理逻辑与决策机制,以实现模型克隆或强化自身AI系统的目的。此类蒸馏攻击属于知识产权盗窃,尽管各大厂商已部署能够识别与阻断蒸馏攻击的机制,但由于主流大模型服务面向所有人开放,所以其本质上仍易受攻击。
今日,蚂蚁集团开源发布全模态大模型 Ming-Flash-Omni 2.0。 在多项公开基准测试中,该模型在视觉语言理解、语音可控生成、图像生成与编辑等关键能力表现突出,部分指标超越 Gemini 2.5 Pro,成为开源全模态大模型性能新标杆。 Ming-Flash-Omni 2.0 也是业界首个全场景音频统一生成模型,可在同一条音轨中同时生成语音、环境音效与音乐。 用户只需用自然语言下指令,即可对音色�
本期AI日报聚焦多项AI技术突破:MiniMax Music 2.5发布,提升AI音乐可控性与真实度;蚂蚁灵波开源世界模型LingBot-World,为具身智能等提供高保真数字环境;谷歌Gemini 3.5泄露,单次提示可生成三千行代码;Kimi K2.5 Agent升级,高效处理Excel、Word等办公文档;蘑菇物联“灵知”垂直大模型通过备案,专注工业辅助与能源领域;昆仑万维SkyReels-V3开源,实现多模态视频生成;昆仑天工发布音乐大模型Mureka V8,推动AI音乐迈向“可发布”级别;三星宣布下一代AR眼镜将于2026年发布,主打多模态AI体验。
苹果公司宣布将与谷歌展开深度合作,借助谷歌的人工智能技术为今年晚些时候推出的产品功能,尤其是Siri,提供强大的AI支持。 根据合作内容,谷歌将通过其先进的Gemini模型和成熟的云技术,为苹果未来的基础模型注入核心动力。苹果在官方声明中明确表示,经过审慎评估,谷歌的技术为苹果基础模型奠定了最为坚实的基础,公司对即将为用户带来的创新体验充满期待。
苹果将与谷歌合作,为今年晚些时候推出的产品功能(如Siri)提供人工智能支持。 谷歌将通过Gemini模型和云技术,为苹果未来的基础模型提供动力。 苹果在声明中表示:经过仔细评估,我们认为谷歌的技术为苹果基础模型提供了最强大的基础,我们对它将为用户带来的创新体验感到兴奋。” 据悉,苹果拟每年支付谷歌约10亿美元,获取定制化Gemini模型使用权,核心版本为1.
三星电子宣布,将在下月于拉斯维加斯举办的国际消费电子展(CES)前,通过抢先看”活动在美国首次亮相一款全新的Bespoke AI冰箱。 该产品搭载谷歌人工智能模型Gemini,成为首款应用该技术的家用电器,冰箱内置摄像头,可识别冰箱内存储的食品。 三星表示,与此前仅能识别几十种食品的旧
12月17日,Google 正式发布 Gemini3Flash。一个定价只有 Claude1/5、GPT1/4的“轻量模型”,在编码上超过 Claude Sonnet4.5,在推理和多模态上全面碾压,和 GPT-5.2也互有胜负。
本期AI日报聚焦多领域进展:谷歌发布轻量级Gemini 3 Flash模型,响应速度提升三倍,性能超越Pro版。火山引擎推出豆包大模型1.8及视频生成模型Seedance 1.5 Pro,并启动“AI节省计划”。苹果开源SHARP模型,可将2D照片快速转为3D场景。Meta发布全球首个支持“点击分离声音”的多模态音频模型SAM Audio。MiniMax拟通过港交所上市,或成国产大模型“第一股”。OpenAI开放ChatGPT应用提交权限,向AI原生应用平台演进。千问App接入高德地图,增强现实世界理解能力。微软开源高效图像转3D模型工具TRELLIS.2。xAI推出最快语音代理API,支持中文实时搜索与情绪控制。豆包AI眼镜预计2025年初上市,定价2000元以内,融合大模型与硬件。
Google正式发布新一代轻量模型Gemini 3 Flash,其响应速度达到前代的三倍,几近实现零延迟”交互。 更夸张的是,此次Flash版本在多项关键测试中表现卓越,甚至超越了同家族的旗舰模型。在SWE-bench上,Gemini 3 Flash以78%的得分小幅领先于Gemini 3 Pro的76.2%,这也是Flash系列首次在同期对比中超越Pro型号。
TechCrunch报道,谷歌推出一项测试版功能,让用户通过耳机实时收听翻译内容。 与此同时,公司还将Gemini高级模型集成至谷歌翻译,并进一步扩展了应用内的语言学习工具。 全新的实时耳机翻译功能能完整保留说话者的语气、重音和语调,帮助用户在对话中更好地把握节奏、区分不同讲话者。该功能本质上可将任何耳机变为实时单向翻译设备。