首页 > 业界 > 关键词  > 图文数据集最新资讯  > 正文

中国团队开源大规模高质量图文数据集ShareGPT4V

2023-11-29 14:46 · 稿源:站长之家

要点:

  • 中国团队开源大规模高质量图文数据集ShareGPT4V,基于GPT4-Vision构建,训练了一个7B模型,在多模态性能上超越同级模型。

  • ShareGPT4V数据集包含120万条图像-文本描述数据,涵盖世界知识、对象属性、空间关系、艺术评价等多方面,超越现有数据集在多样性和信息涵盖度方面。

  • 使用ShareGPT4V数据集进行实验,研究者展示了其在多种架构和参数规模的多模态模型中的有效性,最终得到了在多模态基准测试上表现优异的ShareGPT4V-7B模型。

站长之家(ChinaZ.com)11月29日 消息:中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。

该数据集包含了120万条图像-文本描述数据,涵盖了世界知识、对象属性、空间关系、艺术评价等多个方面,在多样性和信息涵盖度上明显优于现有数据集。

image.png

论文地址:https://arxiv.org/abs/2311.12793

Demo演示:https://huggingface.co/spaces/Lin-Chen/ShareGPT4V-7B

项目地址:https://github.com/InternLM/InternLM-XComposer/tree/main/projects/ShareGPT4V

多模态模型的性能在很大程度上受制于模态对齐的效果,而现有工作中缺乏大规模高质量的图像-文本数据。为了解决这一问题,中科大和上海AI Lab的研究者们推出了ShareGPT4V,这是一个开创性的大型图文数据集。

通过对GPT4-Vision模型产生的10万条图像-文本描述数据进行深入研究,他们成功构建了这一高质量的数据集,涉及的内容丰富多样,包括世界知识、艺术评价等。

这一数据集的推出为多模态研究和应用奠定了新的基石。在实验中,研究者们展示了ShareGPT4V数据集在多种架构和参数规模的多模态模型中的有效性。通过等量替换实验,他们成功提升了多种模型的性能。

最终,通过在预训练和有监督微调阶段同时使用ShareGPT4V数据集,他们得到了ShareGPT4V-7B模型,在多模态基准测试中取得了优异的成绩。

这一研究为未来的多模态研究和应用提供了有力支持,也促使多模态开源社区关注高质量图像描述的开发,预示着更强大、智能的多模态模型的出现。这一成果对于推动人工智能领域的发展具有积极的意义。

举报

  • 相关推荐
  • DeepSeek + Kimi一键生成高质量PPT

    文章介绍如何用两个免费AI工具快速制作PPT:先用微信版DeepSeek生成大纲,再用Kimi智能助手一键生成PPT。操作步骤包括:1)在微信搜索DeepSeek,输入需求生成结构化大纲;2)访问Kimi网页版,将大纲粘贴至PPT助手功能;3)选择模板样式,一键生成PPT。该方法适用于教师备课、学生汇报、职场报告等多种场景,能自动完成从构思到排版的全部流程,高效且效果惊艳。

  • AI简历教程!用 deepseek 一键生成高质量简历

    本文介绍如何利用AI工具Deepseek快速制作专业简历。传统简历制作依赖WPS模板或作图软件,过程繁琐。现在通过Deepseek平台,只需输入自然语言指令(如工作经验、技能等关键信息),系统即可自动生成排版精美的HTML版简历,还能转换为PDF格式。操作流程分三步:1.访问官网输入需求指令;2.查看并运行生成的HTML代码;3.保存文件或转为PDF。该工具特别适合求职者快速制作突出个人优势的专业简历,大幅提升求职效率。

  • 唐煦数畅以全链路数据服务赋能数字经济高质量发展

    在数字经济成为国家战略核心的背景下,数据要素作为新型生产要素的价值日益凸显。国内领先的数据服务商唐照数畅发布"数据要素全链路服务解决方案",覆盖数据采集、治理、流通、应用全生命周期服务,助力政企客户释放数据价值。公司依托自主技术构建数据要素全链路服务生态,为金融、政务、医疗等领域提供数据支撑。方案包含五大核心服务:数据托管与治理、数据产品开发、数据确权交易、数据资产金融服务及数据安全存储。唐照数畅坚持"技术+合规"双轮驱动,通过隐私计算等技术保障数据安全流通,已服务2000余家政企客户,促成数据资产交易超20亿元。未来将持续完善数据要素服务生态,推动数字经济高质量发展。

  • 杭州铭师堂携手全国名校,共研假期高质量育人体系教育创新

    5月10日,全国70余位名校校长、教研组长齐聚河北衡水中学,参加"破局·赋能·共生——假期育人创新与五育融合实践研讨会"。会议围绕"五育融合"实践、初升高衔接痛点、数智化教学管理等议题展开研讨。衡水中学党委书记郗会锁作主题报告,强调教师是精神育人的核心载体。升学派产品负责人方珠明提出数智技术赋能假期育人的解决方案。会议设置教学管理圆桌会议和九大学科平行分会场,专家与一线教师共同探讨新高考背景下的学科教学创新。杭州铭师堂教育研究院院长徐浩强指出,数字技术是破解假期育人资源均衡配置难题的关键。会议旨在构建高质量假期育人体系,通过技术赋能与教育创新,让假期成为学生全面发展的"第三学期"。

  • 荣膺四项殊荣!安凯客车以创新实力引领商用车高质量发展

    安凯客车在"运输新生态高质量发展论坛暨2025中国商用车品牌营销盛典"上斩获四项行业殊荣,包括"重大赛事交通服务突出贡献单位"和"服务金口碑称号"两项服务类奖项,以及旗下N12豪华公路客车获"公路热销车型"、E12S双层观光巴士获"旅游金口碑称号"产品类奖项。N12凭借卓越品质批量交付新疆、山东等地高端旅游市场,并出口沙特;E12S创新文旅融合模式,已在北京、上海等城市及欧美多国投入运营。安凯以"精准响应、高效处理"服务理念构建全国服务网络,连续五届获服务品牌殊荣,并圆满完成北京奥运会等重大国事交通保障任务。未来将持续以"绿智赋能"为驱动,推动中国客车全球化发展。

  • 埃克塞尔集团携手孝南区共绘算力经济新蓝——“数智创新 算力未来”主题活动助推区域高质量发展

    2025年5月21日,中国智能计算产业联盟等单位在孝南区举办"数智创新+算力未来"专家座谈会。会议围绕算力经济发展展开讨论,重点包括:1)孝南区正加速布局3D专用超算中心,推动算力向"水电化"方向发展;2)专家建议构建分布式算力网络应对国际竞争,探索"东数西算"本地化路径;3)孝南区依托纸卫品、食品等"2+2"主导产业优势,计划建设适配型智算中心;4)埃克塞尔集团表示将推动算力技术与本地光电子等产业深度融合。会议达成多项合作共识,将共同推进智算产业园区规划建设,助力湖北算力经济高质量发展。

  • 小赢卡贷:以科技为桥,推动产学研融合助力实体经济高质量发展

    文章介绍了小赢卡贷在金融科技领域的创新发展。作为深耕金融科技的平台,小赢卡贷坚持"科技+金融"战略,积极响应国家政策,持续探索金融服务实体经济的新路径。平台立足科技优势,提升金融服务可获得性与便利性,为小微企业和个体工商户提供多元化金融支持。通过成立研究院,搭建开放创新的行业研究平台,聚焦金融科技、普惠金融等关键领域。在科技创新方面,加大研发投入,强化人工智能、大数据等技术应用,优化服务流程与风控能力。未来将继续深化科技赋能战略,拓展产融结合应用场景,构建更高效、安全的金融服务体系,助力实体经济发展。

  • GPT4o生成的烂自拍,反而比我们更真实。

    文章探讨了GPT-4o通过简单Prompt生成的"不完美"照片引发热潮的现象。这些刻意追求平凡、模糊、构图混乱的照片,反而因其"不完美"带来了前所未有的真实感。作者指出,在社交媒体充斥精修照片的时代,这种未经修饰的"生活切片"恰恰捕捉了人类最熟悉的真实瞬间。通过分析911事件经典照片《坠落的人》,文章进一步论证了真实往往存在于未经表演的偶�

  • 小赢卡贷:以科技赋能金融创新,助力中小微企业高质量发展

    深圳小赢科技凭借金融科技创新能力入选第五届"NIFD-DCITS金融科技创新案例"20强,其自主研发的WinSAFE智赢体系以AI技术为核心,构建覆盖金融业务全流程的数字化解决方案,包含智能获客、风控管理、智能服务三大模块,有效赋能中小微企业。同时打造WinPROT赢护安全体系,通过AI实时监测、数据加密等技术构建360度安全防护屏障。该案例展现了金融科技服务实体经济的创新实践,为行业数字化转型提供标杆示范。未来小赢将持续深化科技研发,以更智能、安全的金融服务助力中小微企业发展。

  • 两个月新增100万台!九号电动驶入高质量增长快车道

    九号公司智能两轮电动车在中国市场累计出货量突破700万台,仅用两个月就实现百万级增长,展现强劲发展势头。2025年第一季度销量达100.38万台,同比增长141%,收入28.62亿元,增长140%。公司以技术创新为核心,建成7800家门店覆盖全国,连续三年全球销量第一,高端市场占有率领先。董事长高禄峰表示将持续进化,目标冲击千万台。公司启动"绿洲战役",计划2027年成为行业环保标杆。凭借智能制造和用户口碑,九号正加速迈向智能出行新时代。