11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
京东探索研究院近日开源了自研的JoyAI-Image-Edit图像模型,其核心突破在于能理解图像的三维空间结构,解决了传统AI修图空间逻辑混乱的问题。该模型具备三大空间编辑能力:视角变换、空间漫游和物体空间关系操控,并兼容15类通用编辑功能。应用场景广泛,尤其在具身智能领域,可为机器人理解世界提供关键底层能力。京东近期在AI领域动作频频,持续推动AI与产业深度融合。
本期AI日报聚焦多项技术突破:Luma AI发布Uni-1图像模型,支持文本与像素同步生成;美团开源数学定理证明模型LongCat-Flash-Prover;阿里玄铁C950处理器刷新RISC-V性能纪录;iPhone 17 Pro成功本地运行4000亿参数大模型;Claude助手升级,可控制用户电脑;西湖大学发布全球首个机器人“通用小脑”泰坦o1;OpenAI申请将ChatGPT纳入安卓默认搜索引擎选项;国家数据局正式将“Token”定名为“词元”,规范大模型术语标准。
本期AI日报聚焦多项AI领域新动态:腾讯内测QClaw一键启动包,降低开源智能体使用门槛;火山引擎发布ArkClaw云平台,优化AI Agent应用痛点;小红书开源FireRed-Image-Edit v1.1图像编辑模型,性能显著提升;AI技能qiaomu-mondo-poster-design可一键生成大师级海报;阿里达摩院发布MAOSS模型,利用AI筛查脂肪肝,检出率翻倍;OpenClaw发布重大更新,全面支持GPT-5.4;OpenAI再次推迟“成人模式”上线,优先提升AI智能水平;OpenClaw“小龙虾”能力排行榜出炉,展示各大模型真实编码战力。
今日,谷歌正式发布新一代图像生成模型Nano Banana 2,主打更快、更便宜、更易用的高质量图像生成能力。 据了解,Nano Banana 2将陆续接入Gemini、Google搜索、AI Studio、Flow、付费API以及Google Ads等平台,并逐步全面替代旧版模型。 官方介绍称,该模型基于Gemini 3.1 Flash Image构建,融合了Nano Banana Pro级别的图像生成质量、推理能力与世界知识,同时继承Flash系列模型的高速生成优势,
本期AI日报聚焦多领域AI新动态:腾讯发布混元图像3.0,实现语义驱动的精准修图;开源AI助手Clawdbot单日获9000星,具备物理级执行力;京东购物智能体JoyGlance登陆Rokid眼镜,简化购物流程;苹果Siri将整合谷歌Gemini核心,预计2月发布;腾讯“元宝派”开启内测,探索AI深度融入社交场景;百度文心助手推出5亿现金红包活动,结合春节习俗;中国团队SeaArt用户破5000万,实现创意到变现闭环;上海交大发布光学垂直大模型Optics GPT,重塑光学研发模式。
腾讯混元图像3.0图生图模型正式发布,支持图片编辑与多图融合功能,已在元宝同步上线。该模型基于混元图像3.0原生多模态架构,采用混合专家(MoE)架构,总参数量达800亿。通过指令微调和后训练,模型能深度理解并处理用户输入的图像和编辑指令,生成图片一致性强、真实感佳、情绪表现力好,且速度显著提升。功能上支持增删改、风格变换、老照片修复、人物与文字修改等多种编辑能力,并能实现多图融合,适用于表情包制作、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制及创意图片制作等多样化操作。
本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。
今日,阿里Z-Image登顶开源图像生成模型榜单。 全球权威AI基准测试平台ArtificialAnalysis公布最新的图像模型榜单,阿里6B参数Z-Image Turbo超越32B的FLUX.2,成为最强开源图像生成模型。 目前,该模型已在阿里云百炼上线,生成1千张图片仅需5美元。 Z-Image Turbo的ELO分数达到1152,也刷新了榜单纪录。 业内人士认为,这是业界性能最好、生成速度最快、价格最便宜的图像生成模型之�
本期AI日报涵盖多项重要进展:阿里通义千问发布分层图像编辑模型Qwen-Image-Layered,实现类似Photoshop的图层操作;Claude Chrome插件全面开放,提升AI与网页交互体验;快手Kling 2.6通过语音与动作控制提升视频生成质量;MiniMax通过港交所上市聆讯,展现AI领域实力;三星与谷歌合作推出全球首款搭载Gemini的AI冰箱,实现食材识别与红酒管理;北京人形机器人推出国内首个符合国标的VLA大模型XR-1,具备复杂操作能力;谷歌推出A2UI开放标准,让AI代理即时创建图形界面;以及开源提示词工具PromptFill上线,降低AI绘画门槛。
阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。 千问新模型采用自研创新架构,可将图片拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。 Qwen-Image-Layered打破了主流视觉大模型的扁平式思维”,模型通过分层�