首页 > 业界 > 关键词  > 图文数据集最新资讯  > 正文

中国团队开源大规模高质量图文数据集ShareGPT4V

2023-11-29 14:46 · 稿源:站长之家

要点:

  • 中国团队开源大规模高质量图文数据集ShareGPT4V,基于GPT4-Vision构建,训练了一个7B模型,在多模态性能上超越同级模型。

  • ShareGPT4V数据集包含120万条图像-文本描述数据,涵盖世界知识、对象属性、空间关系、艺术评价等多方面,超越现有数据集在多样性和信息涵盖度方面。

  • 使用ShareGPT4V数据集进行实验,研究者展示了其在多种架构和参数规模的多模态模型中的有效性,最终得到了在多模态基准测试上表现优异的ShareGPT4V-7B模型。

站长之家(ChinaZ.com)11月29日 消息:中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。

该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、空间关系、艺术评价等多个方面,在多样性和信息涵盖度上明显优于现有数据集。

image.png

论文地址:https://arxiv.org/abs/2311.12793

Demo演示:https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B

项目地址:https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V

多模态模型的性能在很大程度上受制于模态对齐的效果,而现有工作中缺乏大规模高质量的图像-文本数据。为了解决这一问题,中科大和上海AI Lab的研究者们推出了ShareGPT4V,这是一个开创性的大型图文数据集。

通过对GPT4-Vision模型产生的10万条图像-文本描述数据进行深入研究,他们成功构建了这一高质量的数据集,涉及的内容丰富多样,包括世界知识、艺术评价等。

这一数据集的推出为多模态研究和应用奠定了新的基石。在实验中,研究者们展示了ShareGPT4V数据集在多种架构和参数规模的多模态模型中的有效性。通过等量替换实验,他们成功提升了多种模型的性能。

最终,通过在预训练和有监督微调阶段同时使用ShareGPT4V数据集,他们得到了ShareGPT4V-7B模型,在多模态基准测试中取得了优异的成绩。

这一研究为未来的多模态研究和应用提供了有力支持,也促使多模态开源社区关注高质量图像描述的开发,预示着更强大、智能的多模态模型的出现。这一成果对于推动人工智能领域的发展具有积极的意义。

举报

  • 相关推荐
  • 以器乐叩响千年文明回音 东芝电视赋能《中国器乐大会》成焦点

    《金声玉振·中国器乐大会》在CCTV-15热播,通过东芝电视搭载的火箭炮SOUND音质技术平台,精准还原千年国乐魅力。节目呈现多首跨越古今的经典国乐,以独立音质芯片BRα优化高频细节,配合Mini LED精准控光,实现声画同步沉浸体验。技术革新让家庭客厅秒变“国乐现场”,既保留乐器细腻层次,又传递文化底蕴,展现科技承载传统文化的理念。

  • 阅文加码、红果入场:200亿市场的“漫剧”会是下一个风口吗?

    ​天是越来越冷了,但2025年的短剧江湖依旧热得发烫。 年初的《好一个乖乖女》,上线一周抖音主话题播放量破6亿,一个月后,红果总观看量破10亿,男一号柯淳全平台涨粉超百万;上月热播的《盛夏芬德拉》播放量破30亿,它不仅构建了一个爱情乌托邦,还凭借电影级视听和细腻喜剧,让人在观剧过程中获得极大的心理慰藉与情感释放。 与此同时,短剧一哥红果月活再次飙

  • GEO指数突然爆红!你的品牌被AI“搜”到了吗?一文看懂+免费监控工具

    本文介绍GEO指数(生成式引擎优化热度值)正取代传统SEO,成为衡量品牌在AI搜索中曝光度的新指标。文章解析GEO指数本质(AI提及次数与好评度综合评分)、与SEO的核心差异(网页排名vs.AI直接推荐),并指出其重要性:AI搜索日均超10亿次,直接影响消费决策。提供三大提升技巧:内容转QA格式投喂AI、用口语化用户评价埋点、每周监控排名。最后推荐AIBase工具实现一键监控,强调品牌需主动布局AI可见性,抢占流量红利。

  • 你的品牌被 AI 搜到了吗?一文看懂 “GEO 指数” 打赢下一波流量红利

    本文介绍AI搜索时代的新指标GEO指数(生成式引擎优化),指出品牌需从传统SEO转向关注AI问答中的被提及、引用和推荐频次。文章解析GEO的核心价值:抢占AI推荐首位、传递信任信号、重塑竞争壁垒,并提供实操四步法——构建问答内容体系、优化提及信号、监测数据、整合传统SEO。最后推荐使用AIBase工具进行品牌监控,帮助企业在AI搜索红利期抢占流量先机。

  • 从GEO指数看品牌成长曲线:数据化洞察的力量

    去年11月某创业公司CEO宣布其AI搜索曝光率突破50%,并强调数据驱动品牌运营的重要性。文章指出,AI搜索平均仅引用2-7个域名,曝光机会稀缺。通过某B2B软件公司的三阶段优化案例:从初始8%曝光率,经竞品分析、内容优化后,三个月提升至50%,验证了GEO指数(生成式引擎优化)的可追踪性。该指数能反映品牌在AI生态中的真实位置,指导内容策略调整,且行业数据显示其ROI达1:3.71,转化率比传统SEO高4.4倍。结论:AI时代品牌成长需依靠数据监测,避免“盲飞”。

  • 如何用免费工具做好 AI 搜索排名+品牌监控?一文掌握「GEO 品牌监控」策略

    随着AI搜索和大型语言模型的普及,传统SEO不再是唯一流量来源。文章提出生成式引擎优化(GEO)新策略,强调品牌需在AI回答中被引用和信任。核心要点包括:定义GEO与品牌监控概念;分析必须立即部署AI搜索排名策略的四大趋势;提供四步实操方案(设定监控维度、搭建工具流程、优化内容结构、建立反馈机制);推荐免费工具AIBase帮助中文用户快速上手。建议品牌从传统SEO转向GEO+品牌监控双轨制,通过系统化监控抢占AI搜索时代先机。

  • 格创东智以数据驱动工业能碳管理革新,斩获国家级赛事奖项

    2025年“数据要素×”大赛全国总决赛中,格创东智凭借“能碳大脑平台”项目获“发展潜力奖”。该平台通过采集、存储、管理、应用全流程数据治理,覆盖工业现场多维能耗数据,实现TB级能碳数据高效处理,预测准确率超95%,助力企业降本增效。已应用于半导体、新能源等领域百余家工厂,年降能耗15%-20%,管理效率提升50%,减少碳排放超35万吨,展现显著经济社会效益。

  • 云数据安全态势感知全新上线,筑牢内外网数据安全防线

    本文系统分析了云上数据安全的核心问题与解决方案。主要挑战包括:数据资产分散难管理、访问溯源成本高、风险定位困难、权限滞留易泄露。解决路径需构建统一安全运营视图,通过资产自动发现、AI敏感数据识别、访问关系可视化实现全面监测,结合多维动态分析提供精准管控建议。最终达成“看得见、管得住、防得准”的安全目标,并满足合规审计要求。

  • 12岁小孩做一张AI图吓坏整个小区:称出于好奇和恶作剧心理

    ​近日,广州番禺一大型小区内发生了一场由12岁孩童引发的“虚惊”。一名12岁的孩子利用AI技术制作了一张流浪汉试图闯入家门的图片,并在小区业主群中发布,瞬间引发了住户们的恐慌与热议。 据发布图片的业主称,当时自己12岁的孩子独自在家,声称遭遇了流浪汉的闯入,并附上了这张由AI生成的“现场”图片。图片中,流浪汉的形象栩栩如生,场景逼真,令不少住户�

  • 澳门建筑机械工程商会会长萧东文一行到访itc保伦股份,共话湾区合作新篇章

    10月27日,澳门建筑机械工程商会会长萧东文率团27人考察广东保伦电子(ITC股份)。代表团参观了ITC智慧展厅、AI智慧体育等智能化场景,深入了解其发展历程、产品特色及企业规划。ITC营销总经理林哲鑫介绍了公司在自主研发、全场景解决方案及技术投入方面的成果。双方就区域产业合作、资源共享等议题深入交流,期待未来在技术研发、市场拓展等方面深化合作,共同推动音视频行业高质量发展。此次考察为两地企业搭建了沟通平台,标志着合作新篇章的开启。

今日大家都在搜的词: