11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
今日,阿里Z-Image登顶开源图像生成模型榜单。 全球权威AI基准测试平台ArtificialAnalysis公布最新的图像模型榜单,阿里6B参数Z-Image Turbo超越32B的FLUX.2,成为最强开源图像生成模型。 目前,该模型已在阿里云百炼上线,生成1千张图片仅需5美元。 Z-Image Turbo的ELO分数达到1152,也刷新了榜单纪录。 业内人士认为,这是业界性能最好、生成速度最快、价格最便宜的图像生成模型之�
本期AI日报涵盖多项重要进展:阿里通义千问发布分层图像编辑模型Qwen-Image-Layered,实现类似Photoshop的图层操作;Claude Chrome插件全面开放,提升AI与网页交互体验;快手Kling 2.6通过语音与动作控制提升视频生成质量;MiniMax通过港交所上市聆讯,展现AI领域实力;三星与谷歌合作推出全球首款搭载Gemini的AI冰箱,实现食材识别与红酒管理;北京人形机器人推出国内首个符合国标的VLA大模型XR-1,具备复杂操作能力;谷歌推出A2UI开放标准,让AI代理即时创建图形界面;以及开源提示词工具PromptFill上线,降低AI绘画门槛。
OpenAI于12月17日正式发布全新图像生成模型GPT Image 1.5,并向免费ChatGPT用户开放使用。相比上一代,该模型带来四大核心升级:指令执行更准确、编辑更精确、细节保留更完整、生成速度提升4倍。用户可并行生成多张图像,无需等待上一张完成,创作效率显著提升。同时,模型在遵循复杂、细致提示词方面表现更出色,能保持画面中元素间的预设关系。此外,ChatGPT网页端新增Images入口,内置多种预设风格、热门提示词和滤镜,便于用户轻松上手。成本方面,GPT Image 1.5的图像输入和输出价格降低20%,性价比进一步提升。
本期AI日报聚焦多项AI领域新动态:OpenAI利用GPT-5.1-Codex高效开发Sora安卓版,85%代码由AI生成;蚂蚁集团升级AI健康应用“蚂蚁阿福”,新增健康陪伴等功能;Figma推出AI图像编辑工具,提升设计效率;深圳地铁上线全球首款AI导盲犬“小蒜”,服务视障人士;Adobe将Photoshop等工具集成至ChatGPT界面,方便用户编辑;OpenAI十周年推出Sora收藏卡等周边产品;谷歌Gemini新增NotebookLM功能,聊天可直接附加笔记;OpenAI计划推出ChatGPT“成人模式”,预计2026年前上线。
本期AI日报聚焦多项技术突破:阿里巴巴开源轻量图像模型Z-Image,以6B参数实现高效生成;夸克AI眼镜通过硬件升级优化体验;Opera Neon浏览器集成Gemini3,支持文档自动化编辑;清华大学发布AI教育应用指导原则,规范学术使用;DeepMind推出Gemini 3 Pro系统指令,提升任务可靠性;Adobe推出Project Graph重塑创意流程;Trae SOLO中国版新增多任务编程功能;巨人网络联合高校发布多模态生�
Black Forest Labs推出全新FLUX.2图像生成模型系列,支持FP8量化技术,显著降低40%显存占用同时提升40%性能。该模型具备多参考图像生成功能,可批量生成数十张相似图像,支持直接姿态控制与400万像素高分辨率输出,文字渲染清晰锐利。通过与NVIDIA及ComfyUI合作优化,用户现可直接在升级版ComfyUI中使用该模型,无需额外安装。模型需搭配RTX GPU运行,建议更新软件后通过官方渠道获取模板。
近日,一则关于AI生成模特试穿视频的争议事件在网络上引发关注。有网友在社交平台发帖称,自己在网购时发现,某女装店商品详情页使用了AI生成的模特试穿视频。视频里的模特乍一看十分真实,然而当模特做转身动作时,头和脖子的衔接处却出现了明显的断层,该网友由此推断这是一段AI生成的视频。 客服人员解释称,详情页内的图片
今日AI领域动态:上海首例AI提示词著作权案宣判,法院认定提示词不具独创性;月之暗面发布Kimi K2思考模型,实现自主多轮工具调用;UniWorld-V2图像编辑模型支持中文框选即改,性能超越GPT-Image;谷歌推出AI文件检测工具Magika 1.0,支持超200种格式;Sora安卓版首日下载量达47万次;我国发布全球首个AI海洋大模型“瞰海”,可精准预测10天内海洋变化;宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控;谷歌Gemini API推出文件搜索工具,简化私有RAG系统集成。
视觉中国与多家AI公司合作开发可商用视觉大模型,已获阿里、微软等订单。OpenAI因不当内容暂停Sora生成马丁·路德·金形象视频,引发AI伦理讨论。DeepSeek在加密货币交易实验中表现领先。WhatsApp将禁止第三方通用AI聊天机器人,仅保留Meta AI。宇树科技推出仿人机器人Unitree H2,具备拟人化设计。谷歌为Gemini集成地图数据工具,可访问25亿地点实时信息。Opera推出集成三款AI助手的Neon浏览器,但用户体验存在困惑。Facebook在美加推出AI照片编辑建议功能,可分析手机未分享照片。
微软发布首款自研图像生成模型MAI-Image-1,跻身LMArena前十,注重实用性与光影效果;百度世界2025大会将聚焦大模型与AI全球化战略;Meta新技术使RAG推理速度提升30倍;开源项目nanochat实现低成本构建聊天AI;谷歌NotebookLM新增动漫视频生成功能;中国农大发布神农大模型3.0助力智慧农业;腾讯启动"青云奖学金"培养AI人才;苹果FS-DFM模型长文本生成效率提升128倍;谷歌Lens整合AI图像编辑功能;港大与美团提出CodePlot-CoT方法,通过代码绘图解决数学难题,性能提升21%。