首页 > 热点 > 关键词  > 腾讯混元最新资讯  > 正文

腾讯混元图像3.0图生图模型发布 已在元宝同步上线

2026-01-26 13:52 · 稿源:站长之家

站长之家(ChinaZ.com)1月26日 消息:今日,腾讯混元正式宣布,混元图像3.0图生图(HunyuanImage3.0- Instruct)模型闪亮登场,该模型支持图片编辑与多图融合功能,为用户带来全新的图像创作体验。

目前,此模型已在元宝同步上线,基于它,用户能够直接开展表情包制作、虚拟人物合拍、社交分享、电商海报设计、游戏角色定制以及创意图片制作等多样化操作。

混元图像3.0图生图模型具备强大的技术实力。其总参数量达80亿(激活参数约13亿),采用混合专家(MoE)架构,以混元图像3.0的原生多模态架构基础模型为依托,引入图生图的多任务数据。通过指令微调和后训练,该模型能够深度理解并处理用户输入的图像和编辑指令。

腾讯混元图像3. 0 图生图模型发布:自研算法 一句话就能P图

在指令遵循效果方面,混元图像3.0图生图表现稳定。它生成的图片一致性高、真实感强、情绪表现力佳,而且生成速度显著提升。当模型收到用户输入的图片和提示词后,会先理解图像内容,再依据提示词进行推理,精准确定需要编辑的区域、详细编辑步骤以及要保留的图像区域,进而形成更详细的编辑指令,确保输出效果良好。

在功能支持上,混元图像3.0图生图十分丰富多样。它支持增、删、改、风格变换、老照片修复、人物与文字修改等多种图片编辑能力,还能把多张照片中的人物或元素提取出来合成合照、生成新图片,实现多图融合。

举报

  • 相关推荐
  • 技嘉与趋境科技联合部署AMaaS平台 推动本地大模型应用加速落地

    技嘉推出AI TOP ATOM桌面级本地AI计算平台,搭载NVIDIA GB10芯片,具备强大算力与统一内存,支持模型训练、推理与部署。该平台与趋境科技自研模型管理平台AMaaS联合部署,简化大模型本地化应用流程,降低部署门槛与运维负担,实现开箱即用。双方合作旨在推动大模型应用低成本、高效率落地,助力个人与企业用户快速构建本地AI应用。未来,技嘉将持续关注AI行业趋势,深化本地化部署与软硬协同方案。

  • 谷歌Nano Banana 2图像模型正式发布:4K生图 速度更快 成本砍半

    今日,谷歌正式发布新一代图像生成模型Nano Banana 2,主打更快、更便宜、更易用的高质量图像生成能力。 据了解,Nano Banana 2将陆续接入Gemini、Google搜索、AI Studio、Flow、付费API以及Google Ads等平台,并逐步全面替代旧版模型。 官方介绍称,该模型基于Gemini 3.1 Flash Image构建,融合了Nano Banana Pro级别的图像生成质量、推理能力与世界知识,同时继承Flash系列模型的高速生成优势,

  • AI日报:腾讯内测QClaw一键启动包;小红书新款AI编辑模型开源;OpenClaw正式支持 GPT-5.4

    本期AI日报聚焦多项AI领域新动态:腾讯内测QClaw一键启动包,降低开源智能体使用门槛;火山引擎发布ArkClaw云平台,优化AI Agent应用痛点;小红书开源FireRed-Image-Edit v1.1图像编辑模型,性能显著提升;AI技能qiaomu-mondo-poster-design可一键生成大师级海报;阿里达摩院发布MAOSS模型,利用AI筛查脂肪肝,检出率翻倍;OpenClaw发布重大更新,全面支持GPT-5.4;OpenAI再次推迟“成人模式”上线,优先提升AI智能水平;OpenClaw“小龙虾”能力排行榜出炉,展示各大模型真实编码战力。

  • 字节聚力GEO技术解读:如何让AI大模型主动推荐你的品牌

    文章介绍了字节聚力公司提出的GEO(生成式引擎优化)技术,旨在帮助品牌在AI大模型时代获得优先推荐。GEO通过四大核心系统实现:构建企业知识图谱,使AI能“理解”品牌价值;训练专属智能体(GEO-Agent)进行策略决策;针对不同AI平台优化内容分发;并通过用户意图监测平台实现动态优化。该技术标志着从传统SEO到适应AI认知逻辑的转变,帮助品牌成为大模型眼中的“可信答案”。

  • AI日报:谷歌Nano Banana 2正式上线;可灵3.0全球视频模型第一;周鸿祎直言AI眼镜难做

    本期AI日报聚焦多领域进展:谷歌Gemini App更新,图像生成模型Nano Banana 2上线,支持2K分辨率与文字渲染;快手可灵3.0在视频生成基准测试中表现优异,彰显中国AI技术领先地位;周鸿祎指出AI眼镜硬件门槛高,未来应聚焦智能体技术;阿里巴巴推出千问AI眼镜,整合生态提供智能生活体验;xAI联合创始人离职引发核心团队变动关注;豆包手机助手回应安全争议,称未收到漏洞报�

  • 广西山洞内景把“桃花源记”具象化 网友:远拍还以为是微缩模型

    近日,广西河池一名游客在爬山时,意外发现了一个令人惊叹的奇景——马王洞。当游客爬至高处,不经意间向洞内一瞥,差点以为自己出现了幻觉。远看,洞内的小房子宛如精致的微缩模型,但随着镜头拉近,才发现那竟是真实存在的房屋,里面还有人居住,生活气息扑面而来。 马王洞位于三门海景区附近,洞口垂直高度竟达94米,相当于三十层楼那么高,阳光从洞口倾泻�

  • 阿里已批准林俊旸离职 将成立基础模型支持小组

    今天上午,阿里巴巴内部流传出一封CEO吴泳铭的邮件,该邮件针对林俊旸离职一事作出回应。 3月4日(周三)凌晨,阿里Qwen(千问)团队技术负责人林俊旸在社交媒体上发布状态“me stepping down.bye my beloved qwen.”(我辞职了,再见了我爱的Qwen),这一动态引发了内部关注。

  • 2026大模型时代的电销变革:五大主流AI外呼平台核心能力横向对比

    本文分析了2024-2025年AI外呼行业因大语言模型渗透而发生的范式转变,市场规模已突破百亿。文章从语义理解深度、多轮对话能力、部署灵活性、行业适配度及性价比五个维度,横向对比了市场上五家代表性AI外呼平台(Avavox、中关村科金·得助智能、合力亿捷、沃丰科技Udesk、百应科技),为不同规模与行业的企业提供选型参考。核心结论是:企业应回归自身业务场景的核心需求进行匹配,初创和中小企业可关注低门槛、快部署、按需付费的轻量化平台;对合规与专业度要求高的大型企业,深耕行业的定制化方案更为合适;而需嵌入现有全渠道系统的大型集团,老牌厂商是更稳妥的选择。趋势上,行业正从“工具思维”转向“数字员工思维”,平台的大模型能力深度、角色配置灵活性及与企业现有系统的集成能力将成为长期价值的关键。

  • 老板电器发布全球首款AI烹饪眼镜!搭载自研大模型食神 新手秒变大厨

    3月12日,2026中国家电及消费电子博览会在上海开幕。老板电器正式发布全球首款AI烹饪眼镜,搭载自研“食神”大模型,通过镜头识别食材、感知灶具火力变化,实时提供烹饪步骤提醒。该产品可联动AI数字厨电生态,实现油烟机、燃气灶等设备协同工作,完成从备菜到出锅的完整流程。AI大模型与智能硬件的深度融合,标志着厨房正迈向智能烹饪助手时代。

  • 百度智能云发布零部署服务DuClaw:无需自行配置大模型

    百度智能云推出了一项名为DuClaw的零部署服务,将此前已大幅简化的一键部署”模式进一步升级为零部署”。 用户无需自行选择OpenClaw镜像部署云端服务器,也无需配置大模型推理服务的API Key,真正做到了零门槛养虾”。 目前,用户已可通过网页端直接使用该服务,后续还将陆续支持企业微信、钉钉、飞书等主流通讯应用,让AI助理随时随地触手可及。 据介绍,通过DuClaw,

今日大家都在搜的词: