腾讯混元发布开源文生图大模型混元DiT加速库生图时间缩短75%

2024-06-06 13:44 · 稿源：站长之家

站长之家(ChinaZ.com) 6月6日消息:腾讯混元发布了针对开源文生图大模型混元 DiT 的加速库，可将推理时间缩短75%，生图时间大幅缩短。

混元 DiT 模型也已部署至 Hugging Face Diffusers 通用模型库，用户可通过三行代码调用模型，无需下载原始代码。

通过知识蒸馏和 TensorRT 高性能推理框架，实现了 DiT 模型的采样步数压缩与高效推理部署，推理时间缩短75%。

微信截图_20240606134441.png

用户可基于 ComfyUI 的图形化界面使用腾讯混元文生图模型，大幅降低使用门槛。Hugging Face Diffusers 是主流文生图大模型的通用库，用户无需下载原始代码，可方便调用混元 DiT 模型。

腾讯混元表示将继续优化混元 DiT 的开源生态，共建视觉生成开源生态，推动大模型行业发展。

官网

https://dit.hunyuan.tencent.com/

代码

https://github.com/Tencent/HunyuanDiT

模型

https://huggingface.co/Tencent-Hunyuan/HunyuanDiT

论文

https://tencent.github.io/HunyuanDiT/asset/Hunyuan_DiT_Tech_Report_05140553.pdf

（举报）

相关推荐

关键词：

易鑫正式发布汽车金融行业首个Agentic大模型

易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿，响应延迟低于200毫秒，支持语音实时交互，单卡吞吐达370 tokens/秒，可提升获客、风控与运营效率，解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台，研发投入超20亿元，率先实现AI全场景应用，将持续推动智能汽车金融生态建设。

汽车金融大模型易鑫
进博会“全勤生”三星的AI全景图：AI Home中国首秀

三星在进博会上首次展出AI+Home智能家庭解决方案，通过Bespoke AI、Vision AI和Galaxy AI三大模块，实现全场景智慧生活。AI正从"会语言"向"会行动"演进，软硬件协同成为核心竞争力。三星凭借从芯片到终端的全产业链优势，打破端侧AI的性能、算力与存储"不可能三角"，构建起覆盖手机、电视、家电的生态闭环。未来，AI将全面接管生活，让科技真正服务于人。

端侧AI AI Home
大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

10月30日，2025金融街论坛年会金融科技大会公布“金融科技应用场景大赛”终评结果。腾讯云“金融反电诈治理方案”与“基于TCS的AI异构算力管理平台”凭借技术创新性与场景落地能力，从全国89家机构的280个项目中脱颖而出，双双荣获“十佳应用奖”。腾讯混元大模型信贷助手方案获“探索实践奖”。三大方案在金融风控、算力基座及大模型应用三个关键领域展现突出优势，获专家团高度认可。大赛自2021年启动，已成为金融科技领域极具影响力的赛事平台。

金融科技应用场景大赛腾讯云
颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

Utopai Studios推出专为影视制作设计的AI模型与工作流，区别于主流视频生成模型，其核心能力在于理解剧本、规划镜头及生成场景，通过自回归模型负责叙事规划与一致性约束，扩散模型专注高质量画面渲染。该系统能解决跨镜头元素漂移难题，提升制作效率与作品品质。目前工作流仅用于公司自有项目，强调AI作为创作者协作者的角色，并遵循行业道德与版权规范。

AI影视制作 Utopai Studios
机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

银河通用发布全球首个跨本体全域环视导航基座大模型NavFoM，实现机器人从“学会完成导航任务”到“真正理解移动”的跨越。该模型支持全场景、多任务、跨本体应用，通过统一“视频流+文本指令→动作轨迹”范式，融合800万条跨任务导航数据，在真实机器人上实现零样本自主避障、路径规划等复杂任务。其技术突破将推动具身智能从单一功能进化为基础设施，为规模化商业落地奠定关键基础。

机器狗导航大模型 TrackVLA
TTi OS行业首发“四图融合”车道级导航

2025年10月30日，TTi+OS车道级导航正式量产，成为行业首个“四图融合”产品。它基于自研多模态融合引擎，实现高精度导航信息直观呈现与便捷交互，提升出行安全与个性化体验。系统集成SR渲染、环境重构等四大功能，实时识别车道位置，通过直觉式交互引导路径，帮助复杂路况操作。依托高算力平台，可视化呈现动态风险与辅助驾驶信息，增强行车安全。产品融入解压游戏、地标建筑等娱乐化设计，兼具趣味性。目前该导航已搭载于深蓝L06车型，标志量产落地，未来将持续优化AI座舱体验，引领智能汽车科技进化。

车道级导航四图融合 TTi
登榜LMArena！文心大模型5.0-Preview文本能力国内第一

11月8日，文心全新模型ERNIE-5.0-Preview-1022在LMArena大模型竞技场排名中位列全球第二、中国第一。该模型在创意写作、复杂长问题理解和指令遵循方面表现突出，超越多款国内外主流模型。创意写作可高效生成文章、营销文案等内容；复杂长问题理解适用于学术问答、报告分析等任务；指令遵循能力支持智能助理、代码生成等场景，为多领域内容生产提供高效支撑。

文心模型 ERNIE-5.0 创意写作
何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

小鹏汽车在2025科技日发布第二代VLA大模型，颠覆传统“视觉-语言-动作”架构，实现端到端直接输出动作指令，开创物理模型新范式。该模型具备动作生成与物理世界理解能力，参数规模达数十亿级，训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载，推动智驾技术显著进化，同步发布“小径NGP”功能，复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示，大模型将成为物理AI世界的操作系统，并宣布与大众汽车达成战略合作，共同推进智能出行发展。

小鹏汽车 VLA大模型智能出行
荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

今日AI领域动态：上海首例AI提示词著作权案宣判，法院认定提示词不具独创性；月之暗面发布Kimi K2思考模型，实现自主多轮工具调用；UniWorld-V2图像编辑模型支持中文框选即改，性能超越GPT-Image；谷歌推出AI文件检测工具Magika 1.0，支持超200种格式；Sora安卓版首日下载量达47万次；我国发布全球首个AI海洋大模型“瞰海”，可精准预测10天内海洋变化；宇树科技“Embodied Avatar”系统实现低延迟远程机器人操控；谷歌Gemini API推出文件搜索工具，简化私有RAG系统集成。

AI 著作权提示词
河南阿姨卖炒面 3元一份还加鸡蛋：只图问心无愧

在商丘睢县，有一位胡姓阿姨在路边摆摊售卖炒面，她以一份份实惠与温暖，成为了当地人心中的一抹亮色。胡阿姨的炒面售价仅为3元一份，且每份都包含鸡蛋，更令人感动的是，她还免费为学生群体赠送豆浆和烤肠。在物价普遍上涨的当下，其他地区的炒面价格多在6至10元之间，而胡阿姨却坚持十几年不涨价，近期更是主动将价格从原本就亲民的10元降至3元，用实际行动�

商丘睢县胡阿姨炒面 3元炒面

今日大家都在搜的词：

热文

3 天
7天

腾讯混元发布开源文生图大模型混元DiT加速库生图时间缩短75%

易鑫正式发布汽车金融行业首个Agentic大模型

进博会“全勤生”三星的AI全景图：AI Home中国首秀

大模型+反诈+算力三重突破腾讯云三项成果闪耀金融科技应用场景大赛

颠覆Diffusion局限！Utopai双模型耦合架构，攻克AI影视长叙事核心难题

机器人“全能导航大脑”来了！银河通用发布NavFoM大模型

TTi OS行业首发“四图融合”车道级导航

登榜LMArena！文心大模型5.0-Preview文本能力国内第一

何小鹏首次披露物理AI巨大进展发布第二代VLA大模型

荐AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发布；中文图像编辑新王UniWorld-V2发布

河南阿姨卖炒面 3元一份还加鸡蛋：只图问心无愧

今日大家都在搜的词：

热文

特斯拉磁悬浮Cybertruck车模上架中国官网售价999元

华为Mate 70 Air维修备件价格公布：换主板2499元

OPPO Reno15系列定档11月17日发布

特斯拉Model Y L上线外放电功能最高可输出2200瓦功率

真我GT8 Pro阿斯顿马丁F1限量版正式开售售价5499元

鸿蒙智行：智界R7累计交付量破10万台

小鹏机器人会走猫步太像人了！小鹏发布新一代人形机器人IRON

女性人形机器人里藏真人？何小鹏回应：并亲自证清白

iPhone 18 Pro或缩小灵动岛苹果正测试特殊挖孔方案

AI日报：Sora正式登陆Android；网易云音乐推AI调音大师；谷歌将

小米YU7全网首拆上热搜雷军回应：欢迎同行和专家指点

OPPO Reno15系列官宣11月10日发布

AI日报：HeyGen发布AI视频翻译引擎；科大讯飞推星火 X1.5；QQ浏

华为Mate70 Air官宣今日开启预售

AI日报：上海首例涉AI提示词著作权案宣判；Kimi K2 Thinking发

华为路由X3 Pro今日开启预售：售价1299元起

站长商机

腾讯混元发布开源文生图大模型混元DiT加速库 生图时间缩短75%

今日大家都在搜的词：

热文

站长商机

腾讯混元发布开源文生图大模型混元DiT加速库生图时间缩短75%