首页 > 热点 > 关键词  > 正文

智源研究院推出新一代多模态小模型Bunny-3B

2024-02-23 09:38 · 稿源:站长之家

站长之家(ChinaZ.com)2月23日 消息:智源研究院近期提出了一项新技术,通过数据浓缩技术获得高质量训练数据,从而提升多模态小模型的性能。

具体来说,他们将 LAION-2B 压缩成2M 核心集,得到更丰富的预训练数据,同时精选数据集进行指令微调,训练出性能强劲的小模型。这一技术路线带来了新一代多模态小模型 Bunny 系列,其中 Bunny-3B 表现出色,在多个基准上超越了其他近期热门模型,与大模型相媲美。

微信截图_20240223094001.png

Bunny 模型采用经典的 Encoder+Projector+LLM 架构,支持多种 Vision Encoders 和 LLM Backbone,提供可扩展的组合框架。在各类多模态模型评估中,Bunny 表现优异,甚至在一些指标上超越了13B 大模型。该技术的关键在于数据驱动的多模态模型研究,为多模态大模型轻量化提供了新思路和工具。

总的来说,通过数据浓缩技术获得高质量训练数据,Bunny 系列小模型在多模态任务上表现优异,将促进大模型技术的发展和普及。

  • 项目地址:https://github.com/BAAI-DCAI/Bunny

  • 模型下载地址:https://huggingface.co/BAAI/bunny-phi-2-siglip-lora

  • 在线Demo:https://bunny.dataoptim.org

举报

  • 相关推荐
  • AI日报:阿里推多模态模型Qwen3-Omni;谷歌推出AP2协议;百度推出Qianfan-VL 模型

    本期AI日报聚焦多领域技术突破:阿里云推出全球首个全模态AI模型Qwen3-Omni,支持文本、图像、音频和视频统一处理;百度发布多尺寸视觉理解模型Qianfan-VL,优化企业级应用。苹果扩展Image Playground平台,引入ChatGPT等第三方模型。谷歌与PayPal合作推出AP2协议,推动AI支付安全创新。钉钉上线AI表格助手,支持自然语言生成表格。DeepSeek开源V3.1-Terminus模型,性能显著提升。Kimi推出Agent会员服务,智元机器人开源全球首个通用具身智能模型GO-1,降低技术门槛促进行业创新。

  • 小度发布多模态智能摄像机,AI大模型重塑家庭看护体验

    小度科技推出首款多模态智能摄像机C800,搭载800万像素4K超清摄像头,支持AI大模型技术。该产品不仅能实现高清监控,还具备智能行为识别、语音交互等功能,可自定义看护提醒。结合视觉与语音交互,支持复杂语义查询和家庭设备联动,扩展智能家居应用场景。目前产品已全网发售,年底还将推出三摄版本,持续探索AI硬件创新。

  • 共建行业认知 共探增长路径—装库科技亮相空白研究院“同心计划·装修代卖”专题峰会

    9月22-23日,空白研究院在北京举办“装修代卖”专题课程,聚焦存量房市场趋势、模式创新及中介服务转型。课程邀请行业专家分享战略洞察与实操方法,探讨如何通过产品组合、组织优化和利润升级打造新增长点。强调“好房子”标准应涵盖户型、风格、科技与可持续性,推动中介从撮合交易转向综合服务。实地考察展示了售前美化对成交效率的提升,助力行业迈向标准化与体系化发展。

  • 科研抗老新突破!HBN推出新品双A醇晚霜3.0

    HBN品牌六周年之际在上海举办“循迹·求真之旅”护肤讲堂,发布新品“双A醇晚霜3.0”。活动汇聚学界、医界权威,探讨抗老科研前沿与功效护肤趋势。刘玲玲教授分享皮肤衰老临床干预策略,刘玮教授解析系统性衰老生物标志物研究进展。新品基于扎实科研,联合重庆大学、浙大医学院研究A醇抗衰新机制,成果发表于高分期刊。双A醇晚霜3.0创新提出三维“细胞生态网”理念,整合三大自研原料:补骨脂阿魏酸酯实现高效温和,乙基三肽-30瓜氨酸提升皮肤弹性,昆仑雪菊提取物舒缓抗氧。产品质地轻薄易吸收,从根源改善松弛、下垂、皱纹问题,开启系统性抗老新时代。

  • 既能读懂情绪,还能多模态交互!INDEMIND用空间智能重新定义陪伴机器人

    TCL与INDEMIND合作推出的陪伴机器人“Ai Me”通过空间智能技术实现突破,从传统2D感知升级为3D语义感知,赋予机器人动态语义建图、实时环境适应及多模态交互能力。该平台借助立体视觉与多传感器融合,让机器人精准构建三维地图,识别家居属性,实现主动避障与个性化服务。同时,结合低算力混合模型与情感交互功能,机器人可感知用户情绪、提供安全防护,并支持宠物看护等场景拓展,从“工具”升级为有温度的“家庭伙伴”,真正满足复杂家庭需求。

  • 奇点智能研究院出席 GOSIM 杭州 2025:以 AI 开源推动治理创新,共建可信智能未来

    奇点智能研究院出席GOSIM杭州2025全球开源创新大会,发布AI与开源融合领域研究成果,展现中国科技智库专业力量。团队围绕AI产业变革、开源治理等议题发表演讲,发布《2025全球开源发展报告》及AI大模型开源开放分级评估规范,推动AI开源从理念走向制度化实践。致力于构建透明、可信、普惠的全球开源AI生态,促进技术向善与可持续发展。

  • 新一代AI存储大幅提升训练效率,断点恢复速度提升

    AI训练频繁中断是行业难题。华为OceanStor A系列存储通过TB级集群带宽和高速读写能力,显著优化断点续训性能。AI大模型集群部署该方案后,恢复时间从15分钟缩短至1分钟,保障GPU/NPU算力资源充分利用。华为强调,高性能存储正成为以“存”强“算”的关键基础架构。

  • 声启未来新章 BANG & OLUFSEN 铂傲 推出全新Beo grace耳机

    Bang & Olufsen推出全新无线耳机Beo Grace,融合纤薄铝制机身与卓越音质,体现品牌对声学创新与永恒设计的追求。耳机灵感源自高级珠宝,采用标志性抛光铝材打造,支持杜比全景声与自适应主动降噪技术,降噪效果较前代提升四倍。配备12毫米钛金属驱动单元,续航达4.5小时(搭配充电盒可达17小时),具备IP57防水防尘。通过NearTap™手势操控与定制电池管理系统,兼顾便捷使用与长效耐用,开启可佩戴声学新纪元。

  • 锁定30万级家用SUV销冠!全新一代问界M7上市:27.98万起

    全新问界M7于9月23日上市,推出增程和纯电两种动力共6款车型,售价27.98-37.98万元。新车采用家族化鲲鹏展翼设计,轴距增至3030mm,空间表现更优。内饰升级16.1英寸3K中控屏、副驾娱乐屏及HUD抬头显示,配备零重力座椅和舒云座椅,支持一键放平。智能化方面搭载华为乾崑ADS 4.0辅助驾驶,配备激光雷达和34个传感器,支持全场景智能驾驶。安全上通过超标准碰撞测试,动力提供增程版综合续航1625公里,纯电版续航710公里,支持超快充。

  • 音质升级 焕新登场 三星Galaxy Buds3 FE正式上市

    三星Galaxy智能新品于9月19日正式开售,包括Tab S11 Ultra、Tab S11、Tab S10 Lite平板及Buds3 FE耳机。新品搭载AI功能,支持多设备互联,提供大屏交互、专业音频体验。Tab S11 Ultra起售价8999元,Tab S11起售5999元,Tab S10 Lite起售2599元,Buds3 FE售价949元。即日起消费者可通过线上线下渠道购买,享受购机好礼。

今日大家都在搜的词: