首页 > 业界 > 关键词  > Hyper最新资讯  > 正文

字节跳动发布图像模型蒸馏算法Hyper-SD 推理速度更快更完美

2024-04-23 15:01 · 稿源:站长之家

站长之家(ChinaZ.com)4月23日 消息:字节跳动的Lightning团队发布的新图像模型蒸馏算法Hyper-SD,是一项在图像处理和机器学习领域的重要进展。这项技术通过创新的方法提升了模型在不同推理步骤下的性能,同时保持了模型大小的精简。

image.png

Hyper-SD算法的核心特点:

  • 分段轨迹一致性蒸馏:该技术通过在预设的时间段内进行蒸馏,确保了原始ODE(常微分方程)轨迹的完整性得到保持。

  • 人类反馈学习机制:引入了人类反馈学习机制,目的是在较少推理步骤的情况下提升模型的表现,同时减少蒸馏过程中的性能损失。

  • 分数蒸馏技术:增强了模型在低步推理下的生成能力,通过分数蒸馏进一步提升了模型的性能。

  • 统一的LoRA机制:首次尝试使用统一的LoRA(Low-Rank Adaptation)机制来支持全过程的推理,这可能意味着模型在不同阶段的推理中能够更加灵活和高效。

实验和用户研究结果:

Hyper-SD在1步到8步的推理中,为SDXL(可能是某种大型模型)和SD1.5模型带来了最优的性能表现。

在使用一步推理的情况下,Hyper-SDXL在CLIP得分上比SDXL-Lightning高出0.68分,在Aes得分上也高出了0.51分,这表明了Hyper-SD在性能上的显著提升。

意义和影响:

Hyper-SD算法的发布,不仅展示了字节跳动在图像模型蒸馏技术方面的领先地位,也为整个人工智能社区提供了一种新的工具,可以用于提升模型的推理效率和性能。特别地,对于需要在资源受限的环境下部署高效AI模型的应用场景,Hyper-SD提供了一种有效的解决方案。

此外,通过减少推理步骤同时保持性能,Hyper-SD有助于降低计算成本和提高响应速度,这对于实时应用和大规模部署尤为重要。随着进一步的研究和开发,Hyper-SD及其衍生技术有望在多个领域内推动AI技术的发展和应用。

项目地址:https://top.aibase.com/tool/hyper-sd

试玩地址:https://huggingface.co/spaces/ByteDance/Hyper-SD15-Scribble

举报

  • 相关推荐
  • 聚焦科技运动融合!北京apm AI运动会引领沉浸商业体验升级

    北京APM于9月20日至21日举办“AI运动会”,集结多元智能机器人阵容,打造融合科技竞技与深度互动的沉浸式活动。活动以运动为核心,通过足球、拳击、马拉松等特色机器人项目,结合每日4场舞台表演和100个机器人领舞,直观呈现科技与运动的融合之美。现场设置AI互动环节,观众可体验机器人对抗赛、AI棋局对弈及机械臂操控,实现“科技可触、未来可感”。此次活动不仅是一场竞技盛宴,更以科技体验激发情感共鸣,通过沉浸式内容驱动消费新活力,突破传统商业增长极限,为城市商业生态注入创新动能。

  • AI日报:快手推出AI视频制作助手Kwali;字节跳动推出USO模型;OpenAI推出ChatGPT开发者模式

    本文介绍了AI日报栏目,聚焦AI领域最新动态。快手推出Kwali视频助手,简化视频制作流程;字节跳动发布USO模型,解决图像生成中风格与主题的矛盾;微软推出Copilot Audio音频模式,提供个性化语音交互;Stability AI升级Stable Audio 2.5,支持高质量音频生成;阿联酋推出开源大模型K2 Think,拥有320亿参数;微信上线智能回复功能,提升公众号运营效率;OpenAI推出ChatGPT开发者模式,支持AI控制外部工具;字节跳动Seed团队发布AgentGym-RL框架,提升语言模型决策能力;月之暗面开源Checkpoint Engine中间件,优化LLM推理效率;B站开源IndexTTS-2.0文本转语音系统,支持情感与时长控制;Replit推出Agent 3编程助手,自主性提升10倍。

  • 天网杯纳米AI视频创作赛圆满落幕,ISC.AI学苑推动“教育AI+”新范式

    9月23日,第三届“天网杯”网络安全大赛在天津落幕,吸引全国顶尖战队角逐,同期举办纳米AI视频创作赛。赛事聚焦个人信息保护、防诈 骗等网络安全议题,通过“以赛促学”模式提升学生防护意识与AI应用能力。ISC.AI学苑作为平台支持,依托“纳米AI”技术降低创作门槛,推动“安全+AI”人才培养。大赛评选出24个奖项,并联合多所高校深化合作,促进AI技术在教育场景的落

  • 周鸿祎称不用AI的员工有理由裁掉 “对不起 不是我裁掉你 是AI时代裁掉你”

    360创始人周鸿祎在访谈中表示,公司正推动AI与工作结合,要求员工坚持使用AI,即使效果不佳也要持续尝试。他强调,拒绝使用AI的员工可能面临裁员,并称“不是公司淘汰你,而是AI时代淘汰你”。周鸿祎认为,与其担忧哪些岗位被替代,不如思考如何利用AI提升能力。他还透露将亲自挑战完成一场新产品发布会,测试6月11日发布的纳米AI超级搜索智能体。此前他曾提出裁撤市场部以节省成本,此次言论进一步凸显其对AI应用的强硬态度。

  • 基于通义万相 美图多款APP上线全新动漫特效、AI变身等视频生成功能

    今日,美图公司旗下美图秀秀、RoboNeo、Wink和开拍等多款产品,推出全新动漫特效、AI变身等视频生成功能。 据悉,新功能基于通义万相系列模型进行深度开发与训练,为美图的全球用户提供全新的创作体验。 近年来,美图加速布局生产力场景,不仅推出面向企业的AI算法服务和解决方案,旗下消费级产品也在快速集成大模型。 去年6月,美图就开始和阿里展开大模型合作。

  • iPhone 17“大冒险”:史上最薄、AI缺席,果粉买单吗?

    北京时间9月10日凌晨,苹果发布会亮相8大新品,其中包括四款新机:iPhone17、iPhone17Pro、iPhone17Pro Max,以及iPhone  Air。 你可能会问:又是一年一度的苹果发布会,这次能有什么不一样?手机新品确实有些不同。 最大的变化是苹果推出了全新的Air系列,同时砍掉了Plus。Air系列主打一个“薄”,厚度只有5.6毫米,光看数字可能没有概念,想象一下,相当于把你现在用的手机砍掉40%

  • AI投资,走到哪了?

    AI赛道,从不缺少追梦人。 多年来,创业者的名单持续刷新。从“AI四小龙”时代的汤晓鸥、印奇、朱珑、周曦,到大模型爆发后的王慧文、李开复、王小川、杨植麟、闫俊杰、唐杰,再到眼下炙手可热的90后王兴兴、彭志辉、肖弘、郭文景.....众多或熟悉或陌生的名字,纷纷涌入这场AI的浪潮。 推动这股浪潮加速前进的,还有另一股力量——资本。红杉、高瓴、英诺天使、毅

  • AI日报:MiniMax Music 1.5上线;腾讯会议上线AI托管;蚂蚁外滩大会发布AI眼镜可信连接技术框架gPass

    本文介绍了AI领域的最新动态:MiniMax推出Music 1.5模型,支持4分钟高质量音乐生成;腾讯会议AI托管功能提供会议分身服务;蚂蚁集团发布AI眼镜连接框架gPass;Anthropic为Claude新增自动记忆聊天功能;苹果AI功能在欧盟受限;AI首次担任职业球队教练获胜;谷歌推出离线AI应用Edge Gallery;企业应用AI成熟度模型发布;Claude新增网页与PDF抓取功能;FTC启动对AI聊天机器人安全性的调查。

  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • “老登”应用,霸榜AI

    AI应用的争夺战,打到哪儿了? 如果把整个AI行业想象成一座金矿:基础设施层(芯片、算力)相当于“卖铲子”,提供挖矿的基础工具;模型层(大模型研发)好比“卖地图”,告诉大家哪里有金子;而应用层是直接“下场淘金”,把金子变现。 近两年AI应用的使用者越来越多,QuestMobile数据显示,截止到2025年8月,移动端AI应用用户规模达6.45亿,PC端达2.04亿。其中原生APP亿级应用的

今日大家都在搜的词: