首页 > 热点 > 关键词  > 正文

智源研究院推出新一代多模态小模型Bunny-3B

2024-02-23 09:38 · 稿源:站长之家

站长之家(ChinaZ.com)2月23日 消息:智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。

具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。

微信截图_20240223094001.png

Bunny 模型采用经典的 Encoder+Projector+LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。

总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

  • 项目地址:https://github.com/BAAI-DCAI/Bunny

  • 模型下载地址:https://huggingface.co/BAAI/bunny-phi-2-siglip-lora

  • 在线Demo:https://bunny.dataoptim.org

举报

  • 相关推荐
  • 对话智源研究院王仲远:做具身智能的“安卓系统”,而非专用的“iOS”

    大模型的发展正在遭遇瓶颈。随着互联网文本数据被大规模消耗,基于数字世界训练的AI模型性能提升速度明显放缓。与此同时,物理世界中蕴藏着数字世界数百倍甚至千倍的多模态数据,这些数据远未被有效利用,成为AI发展的下一个重要方向。 在2025北京智源大会上,智源研究院发布了“悟界”系列大模型,试图推动AI从数字世界迈向物理世界,实现所谓的物理AGI。这一系�

  • 主流AI多模态大模型有哪些?超全的多模态大模型指南分享

    2024年多模态大模型成为AI领域最具前景的技术方向之一。文章全面分析了主流多模态大模型的特点、应用场景和发展趋势。多模态大模型能同时处理文本、图像、音频、视频等多种数据,实现更智能的人机交互。重点介绍了GPT-4V、Claude3.5、Gemini、通义千问等代表性模型,对比了它们在视觉理解、编程能力、中文处理等方面的优势。应用场景涵盖智能客服、内容创作、教育医疗等领域。未来发展趋势包括模型规模扩大、支持更多模态、实时交互能力提升等。选择模型需考虑应用需求、语言支持、性能成本等因素。

  • 不靠“大哥”靠女粉,团播能捧出新一代偶像吗?

    一段时间不看,团播已经Next Level了。 炫酷的舞美。 丝滑的运镜。 俊男美女的歌舞表演、综艺互动。 以及国风、嘻哈、二次元等多种风格的表演。 让人忍不住怀疑,这还是团播吗? 所谓团播,是一种介于秀场直播和偶像综艺之间的新物种。相比秀场直播,团播人数更多,内容更丰富;相比偶像综艺,团播有着极强的互动性,还通过引入月赛、季赛等竞争机制,极大拉进了�

  • 算力赋能营销革新,东信云与华为云签约共建多模态大模型应用标杆

    6月21日,东信云与华为云在HDC2025大会上签署合作协议,双方将基于昇腾AI云服务深化合作,重点布局多模态大模型应用与数字人技术。合作内容包括:1)构建智能营销系统,整合文本、图像、视频等多元数据,提升市场分析和消费者行为预测能力;2)通过大模型实现营销内容自动化生成,包括新闻稿、社交媒体帖子和广告文案;3)优化大模型架构,提升训练和推理效率。东信云6月发布的"数字人智能引擎"已实现分钟级生成逼真数字人,显著提升推荐转化率。双方还将联合行业伙伴共建营销大模型生态系统,推动营销行业智能化升级。

  • LABUBU一代出租一天价格30元 网友:成新晋打工娃

    近期,潮玩Labubu凭借独特魅力爆火走红,不少敏锐的用户从中发现了新的商业契机,纷纷在闲鱼平台出租Labubu系列公仔。 在闲鱼上以“Labubu出租”“拉布布出租”为关键词进行搜索,能发现众多卖家正在提供实体公仔的出租服务。这些公仔的宣传用途主要集中在登记结婚、领证、婚宴、场景布置以及道具拍摄等场景,满足不同用户在特殊时刻的需求。 从价格方面来看,Labubu�

  • OpenAI 提升o3多模态模型推理实力,微美全息(WIMI.US)加速引领产业新变革征程

    OpenAI推出突破性的o3推理模型,首次实现图像直接融入推理过程,在多模态基准测试V* Bench上准确率达95.7%。DeepSeek完成R1模型升级,上下文窗口从12K扩展至23K,幻觉率降低45%-50%。行业呈现开源趋势,DeepSeek开源策略促使多家企业跟进,OpenAI也考虑开源。微美全息加速布局多模态大模型,计划提供实时多模态AI体验。专家指出AI发展重心正从大模型向智能体演进,开源技术显著降低训练门槛,提升泛化能力,为多模态智能探索开辟新路径。企业需紧跟趋势把握机遇,在大模型驱动的新时代找准定位。

  • 粉丝送Labubu却被水果姐打飞 演唱会大喊“No Labubu”

    近日,一段关于水果姐(Katy Perry)在演唱会上将粉丝递上的Labubu玩偶打飞”的视频在社交媒体上引发热议。 事件发生在水果姐凯蒂佩里(Katy Perry)近期在澳大利亚珀斯演唱会(PERTH NIGHT 1)的粉丝互动环节中,一名台下观众向舞台递出潮玩品牌泡泡玛特旗下IP Labubu玩偶。 水果姐直接用话筒将其打飞,并高喊No Labubu!”耐人寻味的是,Labubu玩偶被打飞至舞台角落,当事粉丝事后

  • 清华毕业礼上副校长给LABUBU拨穗:全世界学历最高的labubu来了

    近日,一则“全世界学历最高的Labubu”话题在社交媒体持续发酵,其源头可追溯至2025年清华大学毕业典礼上的一场趣味互动。 典礼现场,一名毕业生在拨穗环节中,将潮流玩偶Labubu带上台,校长或导师配合为其完成“拨穗”仪式,这一充满创意的场景被现场记录并上传至网络,迅速引发全网关注与讨论。 Labubu是泡泡玛特旗下标志性潮玩IP,凭借“丑萌”造型和限量营销策略�

  • 代拆火爆、价格翻十倍,被捧成全球顶流的LABUBU还能火多久?

    ​“到底是谁在抢LABUBU!” 似乎是一夜之间,这个露着九颗尖牙的丑萌精灵被抢爆了。 LABUBU到底有多火,看看现场抢购的抓马盛况便能窥见一二。今年4月,LABUBU第三代“前方高能”系列发售后,全世界的LABUBU爱好者和黄牛都吻了上来。 为了能买到一只LABUBU,有人不惜通宵到泡泡玛特门店前排队,甚至因抢不到货在街头大打出手,激烈程度堪比大爷大妈们抢超市的特价鸡蛋。

  • 「6月30日AI日报」百度开源文心大模型4.5系列;通义千问发布多模态生成模型Qwen VLo

    AI日报精选:1)百度开源文心大模型4.5系列,含10款新模型,性能优异;2)通义千问发布多模态模型Qwen-VL,支持图文交互;3)阿里开源3亿参数多模态模型Ovis-U1;4)华为开源盘古7B稠密和72B混合专家模型;5)美图MOKI推出AI创意广告功能,一键生成专业视频;6)谷歌Gemini 2.5 Pro API重新免费开放;7)豆瓣上线"深入研究"AI功能;8)小米"AI百宝箱"结束内测;9)北京智研院开源多模态系统OmniGen2;10)知乎升级"直答"知识库功能。