11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。
今日,阿里Z-Image登顶开源图像生成模型榜单。 全球权威AI基准测试平台ArtificialAnalysis公布最新的图像模型榜单,阿里6B参数Z-Image Turbo超越32B的FLUX.2,成为最强开源图像生成模型。 目前,该模型已在阿里云百炼上线,生成1千张图片仅需5美元。 Z-Image Turbo的ELO分数达到1152,也刷新了榜单纪录。 业内人士认为,这是业界性能最好、生成速度最快、价格最便宜的图像生成模型之�
本期AI日报涵盖多项重要进展:阿里通义千问发布分层图像编辑模型Qwen-Image-Layered,实现类似Photoshop的图层操作;Claude Chrome插件全面开放,提升AI与网页交互体验;快手Kling 2.6通过语音与动作控制提升视频生成质量;MiniMax通过港交所上市聆讯,展现AI领域实力;三星与谷歌合作推出全球首款搭载Gemini的AI冰箱,实现食材识别与红酒管理;北京人形机器人推出国内首个符合国标的VLA大模型XR-1,具备复杂操作能力;谷歌推出A2UI开放标准,让AI代理即时创建图形界面;以及开源提示词工具PromptFill上线,降低AI绘画门槛。
阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。 千问新模型采用自研创新架构,可将图片拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。 Qwen-Image-Layered打破了主流视觉大模型的扁平式思维”,模型通过分层�
OpenAI于12月17日正式发布全新图像生成模型GPT Image 1.5,并向免费ChatGPT用户开放使用。相比上一代,该模型带来四大核心升级:指令执行更准确、编辑更精确、细节保留更完整、生成速度提升4倍。用户可并行生成多张图像,无需等待上一张完成,创作效率显著提升。同时,模型在遵循复杂、细致提示词方面表现更出色,能保持画面中元素间的预设关系。此外,ChatGPT网页端新增Images入口,内置多种预设风格、热门提示词和滤镜,便于用户轻松上手。成本方面,GPT Image 1.5的图像输入和输出价格降低20%,性价比进一步提升。
本期AI日报聚焦多项AI领域新动态:OpenAI利用GPT-5.1-Codex高效开发Sora安卓版,85%代码由AI生成;蚂蚁集团升级AI健康应用“蚂蚁阿福”,新增健康陪伴等功能;Figma推出AI图像编辑工具,提升设计效率;深圳地铁上线全球首款AI导盲犬“小蒜”,服务视障人士;Adobe将Photoshop等工具集成至ChatGPT界面,方便用户编辑;OpenAI十周年推出Sora收藏卡等周边产品;谷歌Gemini新增NotebookLM功能,聊天可直接附加笔记;OpenAI计划推出ChatGPT“成人模式”,预计2026年前上线。
本期AI日报聚焦多项技术突破:阿里巴巴开源轻量图像模型Z-Image,以6B参数实现高效生成;夸克AI眼镜通过硬件升级优化体验;Opera Neon浏览器集成Gemini3,支持文档自动化编辑;清华大学发布AI教育应用指导原则,规范学术使用;DeepMind推出Gemini 3 Pro系统指令,提升任务可靠性;Adobe推出Project Graph重塑创意流程;Trae SOLO中国版新增多任务编程功能;巨人网络联合高校发布多模态生�
Black Forest Labs推出全新FLUX.2图像生成模型系列,支持FP8量化技术,显著降低40%显存占用同时提升40%性能。该模型具备多参考图像生成功能,可批量生成数十张相似图像,支持直接姿态控制与400万像素高分辨率输出,文字渲染清晰锐利。通过与NVIDIA及ComfyUI合作优化,用户现可直接在升级版ComfyUI中使用该模型,无需额外安装。模型需搭配RTX GPU运行,建议更新软件后通过官方渠道获取模板。
今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。
微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。