首页 > 热点 > 关键词  > 正文

智源研究院推出新一代多模态小模型Bunny-3B

2024-02-23 09:38 · 稿源:站长之家

站长之家(ChinaZ.com)2月23日 消息:智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。

具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。

微信截图_20240223094001.png

Bunny 模型采用经典的 Encoder+Projector+LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。

总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

  • 项目地址:https://github.com/BAAI-DCAI/Bunny

  • 模型下载地址:https://huggingface.co/BAAI/bunny-phi-2-siglip-lora

  • 在线Demo:https://bunny.dataoptim.org

举报

  • 相关推荐
  • 大家在看

今日大家都在搜的词:

热文

  • 3 天
  • 7天