首页 > 业界 > 关键词  > 正文

上海AI实验室开源工具箱XTuner 8GB显卡就可训练大模型

2023-09-20 09:56 · 稿源:站长之家

站长之家(ChinaZ.com)9月20日 消息:近日,上海人工智能实验室发布了一款面向大模型训练的开源工具箱XTuner,通过支持多种硬件适配,大幅降低了企业进行大模型训练的门槛,尤其是对中小企业具有重要意义。

图片

XTuner为各类开源模型提供了多样的微调框架

XTuner支持与多款开源大模型的无缝衔接,可执行增量预训练、指令微调等任务类型。开发者仅需使用8GB消费级显卡,就可以训练出适用于具体业务场景的“专属大模型”。这极大地降低了进行大模型训练的“真金白银”成本。

XTuner还具备支持多种数据集格式适配、结合社区主流开源训练框架、一键式标准化训练流程等功能。这些“黑科技”令开发者可以更专注于数据本身,而其余训练流程可完全交给XTuner自动化完成。

通过XTuner,开发者可以轻松为大模型添加新功能,例如赋予颜色识别、搜索引擎等能力。这有助于根据具体业务需求,对通用预训练模型进行快速定制优化。

XTuner的发布再次巩固了上海AI实验室在大模型研发与应用领域的全链条开源布局。该实验室此前已开源发布多项大模型工具,并提供免费商用。业内人士表示,这将推动我国在人工智能核心领域的技术进步。

开源链接:

https://github.com/InternLM/xtuner

举报

  • 相关推荐
  • 海尔8家实验室获评“年度能力验证优秀实验室”行业最多

    随着消费理念的持续升级,消费者在选购家电时对产品质量与智慧体验提出了更高要求。与此同时,海尔智慧家庭战略的全球落地,也对企业在全球范围内的质量管控与检测能力形成现实考验。12月26日,中国家用电器研究院评选2025年能力验证优秀实验室。其中,海尔8家实验室获此认可,获评数量行业最多。据悉,2025年能力验证优秀实验室评选主要围绕能力验证项目满意率、�

  • 20+大模型与70+智能体调度!李未可AI眼镜定义群体智能新范式

    文章以丹尼尔·卡尼曼的“快与慢”思维系统理论为引,介绍了李未可AI智能眼镜如何将AI融入人类最自然的“看、听、说”交互中。该产品通过“超能李未可”系统,结合自研大模型与多智能体协同的“群体智能”模式,实现了从快速直觉响应到深度理性思考的无缝衔接。它能高效处理实时翻译、信息查询等日常任务,并在需要时启动多专家智能体进行复杂规划与创意生成,致力于成为用户随身、随思、随需的“第二大脑”,让技术回归增强人类感知与创造能力的本质。

  • 9家省级质量标准实验室批准筹建,山东首批!

    山东省市场监管局批准首批9家省级质量标准实验室筹建,涵盖内燃机、智能家居、量子信息等九大重点领域。这些实验室致力于解决行业共性质量问题,突破关键技术瓶颈,研发智能化高端装备,制定重点产业标准及认证方法,推动与国际先进水平接轨。此举旨在将质量工作深度融入产业链与供应链,提升产业核心竞争力。

  • 海尔获批筹建“山东省首批质量标准实验室”

    山东省市场监管局公布首批省级质量标准实验室筹建名单,海尔牵头筹建的智能家居质量标准实验室入选,成为唯一牵头筹建的家电企业。该实验室将聚焦智能家居前沿技术,增强原始创新能力,培养专业质量创新人才,产出高质量创新成果。海尔长期坚持用户为中心,持续升级实验室质量管理体系,确保产品符合高品质标准。未来,海尔将以此次实验室筹建为契机,深耕智能家居质量标准领域,整合产学研多方资源,推进创新研究与标准落地,为全球用户带来更优质、可靠的智慧生活体验。

  • AI日报:千问Qwen3-VL双子星开源;腾讯内测“上头蛙”AI互动故事小程序;小鹏祭出“物理世界大模型”

    本期AI日报聚焦多领域进展:阿里开源Qwen3-VL多模态检索模型,腾讯推出AI互动故事小程序“上头蛙”,小鹏发布第二代VLA模型剑指L4智驾。MiniMax港股上市首日暴涨42%,高德世界模型登顶国际榜单。阿里千问下载量突破7亿,单月击败Meta、OpenAI总和。谷歌Gmail引入AI专属收件箱与自然语言搜索,马斯克xAI进军“氛围编程”推Grok Build。

  • 从“看家”到“懂家”:海雀大模型摄像头,重塑家庭主动智能新范式

    1月8日至11日,海雀科技在阿里云通义千问智能硬件展上发布搭载AI大模型的海雀摄像头。该产品不仅是家用智能摄像头首次在设备端直接使用大模型,更标志着摄像头从被动记录工具向主动服务的AI伙伴转变。海雀摄像头能看、会听、会思考、会执行指令,深入家庭场景,为育儿家庭提供“全能陪聊搭子”与“安心守护者”,为有老人的家庭提供“可对话的养生助手”,并成为所有家庭的“智能管家”。通过千万用户数据,海雀精准切入需求,以“主动智能”引领行业,为AI硬件赛道提供了从技术堆砌到场景融合的参考范本。

  • AI日报:电信开源MoE大模型TeleChat3;微信推出AI小程序成长计划;谷歌测试Nano Banana2Flash 图像模型

    本期AI日报聚焦行业动态与产品更新。微信推出AI小程序成长计划,提供免费资源助力开发者。中国电信开源千亿参数MoE大模型TeleChat-3,实现国产算力训练。谷歌测试新图像模型Nano Banana2Flash,主打高性价比。马斯克宣布Grok新版上线,全球用户突破3000万。ChatGPT全面接入主流App,可一键订酒店、点外卖等。此外,高德打车上线“AI服务卫士”提升安全,AI助手“ima”新增PPT生成功能,Plaud推出AI录音笔,智元与MiniMax合作定制个性化机器人语音。

  • 花3000元让AI改口,大模型的尽头是广告?

    大模型界的翘楚OpenAI,面对每年数十亿美元的研发成本,正迎来一个艰难的决定:其员工正在琢磨如何让 ChatGPT 在用户提出相关问题时,优先显示赞助内容。 也就是说,当用户让大模型推荐一家眼镜店、一款工业传感器、一家民宿时,很可能大模型给出的是企业的软广。但大模型本身可能并不知道答案被“精心设计”过,它依然兢兢业业,会根据各个指标筛选出你想要的产品�

  • 腾讯混元开源翻译模型1.5:1GB内存就能流畅运行

    腾讯混元宣布开源其翻译模型1.5版本,包含1.8B和7B两个模型。该版本支持33种语言互译,涵盖5种方言,包括多种小语种,应用范围广泛。1.8B模型针对移动设备优化,仅需1GB内存即可流畅运行,端侧部署实现离线实时翻译,性能超越多数商用API。7B模型为WMT25比赛冠军模型的升级版,翻译准确率显著提升,实用性增强。两模型可协同部署,提升效果一致性与稳定性。目前模型已在官网及GitHub、Huggingface等平台上线,为开发者提供便利。

  • 抖音与杜比实验室达成合作:iPhone用户可刷、可剪、可发杜比视界视频

    抖音与杜比实验室今日宣布达成合作,将面向抖音用户开放杜比视界体。 iPhone用户现可通过抖音App分享和观看杜比视界视频。 用户还可使用抖音内置编辑工具或剪映等软件,来创作杜比视界内容。 杜比视界可通过动态元数据对每一帧画面的色彩、亮度与对比度进行精准优化。 抖音相关负责人表示,目前抖音已逐步实现对杜比视界的支持。

今日大家都在搜的词: