11.11云上盛惠!海量产品 · 轻松上云!云服务器首年1.8折起,买1年送3个月!超值优惠,性能稳定,让您的云端之旅更加畅享。快来腾讯云选购吧!
腾讯云
12-20
京东探索研究院近日开源了自研的JoyAI-Image-Edit图像模型,其核心突破在于能理解图像的三维空间结构,解决了传统AI修图空间逻辑混乱的问题。该模型具备三大空间编辑能力:视角变换、空间漫游和物体空间关系操控,并兼容15类通用编辑功能。应用场景广泛,尤其在具身智能领域,可为机器人理解世界提供关键底层能力。京东近期在AI领域动作频频,持续推动AI与产业深度融合。
阿里巴巴今日正式发布图像生成与编辑统一模型Wan2.7-Image,直击当前 AI 生图领域标准脸”审美疲劳和色彩盲盒”等痛点。 该模型可实现千人千面”,捏出活人感”,全新的调色盘”功能可精准控制色彩。 即日起,用户可在https://tongyi.aliyun.com/wan/、wan.video网站和阿里云百炼体验Wan2.7-Image,千问App也即将接入。 据介绍,Wan2.7-Image具备文生图、图生组图、图像指令编辑和交互式�
本期AI日报聚焦多领域进展:谷歌发布Veo 3.1 Lite视频生成模型,成本降超50%;阿里推出Wan2.7-Image大模型,支持像素级“捏脸”与个性化创作;ClawHub上线中国镜像站,加速AI Agent开发;字节跳动启动Seed 2027校园招聘,培养大模型人才;高德开源机器人基座模型ABot-M0,推动具身智能发展;OpenAI适配苹果CarPlay,支持语音交互;Anthropic因疏忽致Claude Code源码泄露,引发安全关注。
本期AI日报聚焦行业动态:腾讯推出首个产业级2Bit端侧模型,实现小体积高性能,适用于手机等隐私敏感场景;蚂蚁阿福成为央视健康生活合作伙伴,单日健康咨询达千万次;ChatGPT免费版将引入广告,OpenAI明确隐私保护规则;字节Seedance2.0因肖像争议暂停真人参考功能;华为发布全球首个虚实融合视频模型,实现毫秒级实时交互;Cursor发布Composer1.5,性能提升显著;阿里云推出Qwen-Image-2.0,图像生成与编辑能力合一;亚马逊入局内容授权市场,微软争夺高质量数据资源。
今日,阿里巴巴正式发布新一代图像生成及编辑模型Qwen-Image-2.0。 作为千问大模型的图像生成模型底座,Qwen-Image-2.0集生图和编辑于一体,在AI Arena文生图评测中斩获1029分,超过Seedream4.5、Flux2-Max等模型,仅次于谷歌Nano Banana Pro和GPT Image1.5。 Qwen-Image-2.0支持1K token的超长文字输入和2K高分辨率,可准确渲染复杂指令,轻松生成专业的PPT及信息图,质感媲美专业级摄影师;同时,�
今日,阿里Z-Image登顶开源图像生成模型榜单。 全球权威AI基准测试平台ArtificialAnalysis公布最新的图像模型榜单,阿里6B参数Z-Image Turbo超越32B的FLUX.2,成为最强开源图像生成模型。 目前,该模型已在阿里云百炼上线,生成1千张图片仅需5美元。 Z-Image Turbo的ELO分数达到1152,也刷新了榜单纪录。 业内人士认为,这是业界性能最好、生成速度最快、价格最便宜的图像生成模型之�
本期AI日报涵盖多项重要进展:阿里通义千问发布分层图像编辑模型Qwen-Image-Layered,实现类似Photoshop的图层操作;Claude Chrome插件全面开放,提升AI与网页交互体验;快手Kling 2.6通过语音与动作控制提升视频生成质量;MiniMax通过港交所上市聆讯,展现AI领域实力;三星与谷歌合作推出全球首款搭载Gemini的AI冰箱,实现食材识别与红酒管理;北京人形机器人推出国内首个符合国标的VLA大模型XR-1,具备复杂操作能力;谷歌推出A2UI开放标准,让AI代理即时创建图形界面;以及开源提示词工具PromptFill上线,降低AI绘画门槛。
阿里开源全新图像生成模型Qwen-Image-Layered,首次在模型内实现PS级的图层理解与图像生成。 千问新模型采用自研创新架构,可将图片拆解”成多个图层,就像个专业设计师用Photoshop分层作图修图,可实现几乎零漂移”的AI图像精准编辑,彻底解决AI生图的一致性难题,加速大模型在专业设计领域的现实落地。 Qwen-Image-Layered打破了主流视觉大模型的扁平式思维”,模型通过分层�
本期AI日报聚焦多领域AI新进展:OpenAI推出图像生成模型GPT Image 1.5,性能显著提升;腾讯发布混元世界模型1.5,开启实时交互虚拟世界;小米开源3090亿参数大模型MiMo-V2-Flash,推理速度领先;字节跳动发布Seedance 1.5 Pro,实现视听同步创作;Apple Music将与ChatGPT集成,简化歌单创建;Gemini预测市场全美上线,支持事件预测交易;Adobe Firefly视频功能升级,支持精准提示编辑;谷歌实验室推出AI助手CC,集成Gemini技术管理日程。
本期AI日报涵盖多项AI领域进展:OpenAI正对两款新图像生成模型进行盲测,性能显著提升;阿里通义千问推出Qwen-Image-i2L技术,可将单张图片快速转为可微调的LoRA模型,降低个性化风格迁移门槛;智谱AI开源GLM-ASR语音识别模型并推出桌面端输入法,提升语音交互体验;通用AI助手“灵光”上线科普动画生成功能,帮助可视化复杂科学原理;麦当劳AI生成圣诞广告因争议被撤;马斯克的xAI推出Halftime工具,可将AI广告实时植入影视内容,引发艺术完整性讨论;阿里巴巴成立“千问C端事业群”,整合夸克、UC等资源,旨在打造AI时代的超级APP;微软网页版Excel推出“智能体模式”,AI可深度参与复杂数据处理任务。