首页 > 业界 > 关键词  > Lora最新资讯  > 正文

微软研究!无需训练即可融合多个Lora且保留了效果

2024-02-27 16:38 · 稿源:站长之家

站长之家(ChinaZ.com)2月27日 消息:微软的最新研究成果在图像生成领域引起了广泛关注。他们提出了一种全新的文本至图像生成方法,这种方法采用了多重低秩适应(Low-Rank Adaptations, LoRAs)技术,能够创造出高度个性化且细节丰富的图像。

该项目的特色在于其免训练方法。LoRA开关和LoRA组合支持动态精确地整合多个LoRA,无需进行微调。这种方法不同于那些融合LoRA权重的做法,而是专注于解码过程,并保持所有LoRA权重不变。这种创新的方法使得在生成复杂图像组合的场景中,该方法的性能显著优于现有的LoRA合并技术。

image.png

项目地址:https://maszhongming.github.io/Multi-LoRA-Composition/

此外,微软还推出了一个全新的综合性测试平台——ComposLoRA。该平台包含480套组合和22个在六大类别中预训练好的LoRA,专为评估基于LoRA的可组合图像生成任务而设计,支持定量评估。

微软还提出了采用GPT-4V作为评估工具,用以判定组合效果及图像质量。该评估工具已证实在与人类评价的相关性上有更好的表现。无论是自动化还是人类评价,微软的方法都显著优于现有的LoRA合并技术。

微软对每种方法在不同场景下的优势进行了深入的分析,并探讨了采用GPT-4V作为评估工具可能存在的偏差。这种详尽的分析为图像生成领域的研究提供了重要的参考。

总的来说,微软的这项研究成果在图像生成领域具有重要意义。他们的免训练方法、全新的测试平台以及基于GPT-4V的评估工具,都为图像生成技术的发展提供了新的思路和工具。

举报

  • 相关推荐
  • ​OPPO Pad5官宣10月16日发布 首发ColorOS 16

    OPPO Pad5将于10月16日发布,搭载全新ColorOS 16系统,主打流畅体验。系统升级三大核心技术引擎,实现无缝动画效果,并首次将原生级流畅能力开放给第三方应用。硬件方面配备12.1英寸3K高刷屏和联发科天玑9400处理器,支持67W快充,兼顾高性能与长续航。针对海外用户优化虚拟键盘操作,提升切换效率。产品定位“丝滑板王”,旨在引领安卓平板体验新高度。

  • ColorOS 16将于10月15日发布 Find X9系列全球首发搭载

    OPPO将于10月15日举办ColorOS 16发布会暨开发者大会。新系统底层升级至安卓16,重点优化动画渲染与资源分配,实现丝滑流畅体验。新增潮汐引擎与极光引擎,提升系统稳定性和流畅度。目前尝鲜活动已开启,覆盖一加13、Find X8系列等多款机型。10月发布的Find X9系列将首发搭载ColorOS 16,成为全球首款该系统的旗舰机型。

  • Reviews.ai 依托 DigitalOcean 高效实现 AI 业务扩展

    Reviews.ai是一个消费者反馈聚合平台,帮助品牌将客户评论转化为可执行的洞察。该平台专注于评论分析,通过AI驱动功能(如按需报告、主题分类和智能代理)提升产品与服务。近期从Review Monitor更名后,团队迁移至DigitalOcean云平台,解决了原有专用服务器架构的扩展瓶颈。迁移过程在合作伙伴Aquazeel支持下高效完成,仅用数周,成本降低近30%。新架构采用Droplets、托管数据库和负载均衡器,支持灵活扩展。未来计划利用GPU Droplets增强AI能力,进一步优化大型语言模型处理效率。

  • 专业级、电影感还是随手拍?佳能、富士、大疆三款热门Vlog视频机怎么选?

    文章介绍了三款适合Vlog拍摄的热门设备:佳能R50V、富士X-S20和大疆Pocket 3。佳能R50V以轻巧机身(约323克)和6K超采4K视频为核心优势,支持全像素双核自动对焦、专业视频格式及竖屏直播优化,适合日常记录到专业创作。富士X-S20搭载2610万像素APS-C传感器,提供胶片模拟色彩和6.2K视频录制,兼顾画质与便携性。大疆Pocket 3主打稳定拍摄,配备1英寸传感器和三轴云台,支持4K/120fps视频,适合旅行快速出片。三款设备各具特色,满足不同Vlog创作者的需求。

  • 小米17 Pro系列攻克手机逆光摄影难题:搭载第三代高动态技术LOFIC

    小米14 Pro系列搭载第三代LOFIC技术,通过横向溢出积分电容解决逆光拍摄难题。该技术让单帧影像实现高动态HDR,有效保留高光细节,避免过曝,动态范围达16.5EV。配备光影猎人950传感器与光学镀膜,显著改善鬼影、发雾等问题。样张显示逆光照片纯净,高光不过曝,暗部细节清晰,告别传统逆光“黑脸”照。

  • 腾讯云马文霜:Cloud Mate:助力企业高效管云、用云,让云上业务坚如磐石

    9月17日,腾讯云在2025全球数字生态大会上宣布智算全面升级,推出面向Agent的AI基础设施解决方案。腾讯云副总裁李力强调“同源同构”为核心原则,通过统一技术架构支撑自研业务与外部客户,实现产品标准化与全球化服务一致性。升级方案包括Agent Runtime云沙箱、Cloud Mate智能运维体及全链路安全能力,旨在提升模型推理效率、工具集成灵活性和系统稳定性,助力企业降低AI应用门槛。李力指出,未来两年AI+Agent部署将大幅增长,腾讯云已服务国内90%的大模型厂商,并为多行业提供高效智算支持。

  • 美团发布高效推理模型LongCat-Flash-Thinking:部分性能接近GPT5

    9月23日,美团LongCat团队发布全新高效推理模型LongCat-Flash-Thinking。该模型在保持极致速度的同时,性能更强大、更专业,在逻辑、数学、代码、智能体等多个领域的推理任务中达到全球开源模型最先进水平(SOTA),部分任务性能接近闭源模型GPT5-Thinking。它增强了智能体自主调用工具能力,扩展了形式化定理证明能力,成为国内首个结合深度思考、工具调用与非形式化、形式化推理的大语言模型。在数学、代码、智能体等高复杂度任务上表现尤为突出,多项基准测试成绩领先开源及闭源顶尖模型,已在HuggingFace、Github全面开源。

  • 为什么手机迷恋上灵动岛 ColorOS陈希解释原因

    微博话题为什么手机迷恋上岛”引发热议,在苹果推出灵动岛之后,机圈纷纷上岛”。 ColorOS设计总监陈希表示,在对抗信息过载的信息海洋里,通知的优先级需要被再次分层,通过设计让重要的信息更加重要,灵动岛初心虽出自遮丑,但也具备了高实用性,是一个不错的设计实践,经过几年的发展,灵动岛的生态也越来越完善。 事实也证明大部分用户已经接纳并喜欢这个全

  • 华为云CloudRobo构筑云上机器人工厂,助力机器人开发应用成本全面降低

    华为在2025全联接大会上发布CloudRobo具身智能平台,通过云端赋能打破机器人硬件限制,实现轻量化、智能化和场景泛化。该平台整合数据生产、训练及运行管理,支持多领域落地应用,并联合行业伙伴共建R2C协议,推动具身智能产业规模化发展。

  • AI日报:美团发布推理大模型LongCat-Flash-Thinking;阿里Wan-Animate开源;字节推豆包翻译大模型

    AI日报栏目聚焦人工智能领域最新动态。美团推出高性能推理大模型LongCat-Flash-Thinking;阿里开源Wan-Animate模型革新AI视频生成;字节跳动发布豆包翻译模型,支持28种语言互译;华为与浙大联合推出安全大模型DeepSeek-R1-Safe;阿里云即将发布跨模态模型Qwen3-Omni;xAI推出计算成本降低98%的Grok4Fast模型;YouTube发布多项AI创作辅助功能;IBM推出轻量级文档处理模型Granite-Docling-258M;中科院发布类脑大模型SpikingBrain实现百倍速度突破;OpenAI将推出仅限Pro用户的计算密集型新功能。

今日大家都在搜的词: