首页 > 业界 > 关键词  > 正文

上海AI实验室开源工具箱XTuner 8GB显卡就可训练大模型

2023-09-20 09:56 · 稿源:站长之家

站长之家(ChinaZ.com)9月20日 消息:近日,上海人工智能实验室发布了一款面向大模型训练的开源工具箱XTuner,通过支持多种硬件适配,大幅降低了企业进行大模型训练的门槛,尤其是对中小企业具有重要意义。

图片

XTuner为各类开源模型提供了多样的微调框架

XTuner支持与多款开源大模型的无缝衔接,可执行增量预训练、指令微调等任务类型。开发者仅需使用8GB消费级显卡,就可以训练出适用于具体业务场景的“专属大模型”。这极大地降低了进行大模型训练的“真金白银”成本。

XTuner还具备支持多种数据集格式适配、结合社区主流开源训练框架、一键式标准化训练流程等功能。这些“黑科技”令开发者可以更专注于数据本身,而其余训练流程可完全交给XTuner自动化完成。

通过XTuner,开发者可以轻松为大模型添加新功能,例如赋予颜色识别、搜索引擎等能力。这有助于根据具体业务需求,对通用预训练模型进行快速定制优化。

XTuner的发布再次巩固了上海AI实验室在大模型研发与应用领域的全链条开源布局。该实验室此前已开源发布多项大模型工具,并提供免费商用。业内人士表示,这将推动我国在人工智能核心领域的技术进步。

开源链接:

https://github.com/InternLM/xtuner

举报

  • 相关推荐
  • 爱康国宾所属集团再获「ISO15189」医学实验室认可

    爱康集团重庆区中央实验室近日获得CNAS颁发的ISO15189医学实验室认可证书,成为重庆首家获此认证的专业体检机构。该认证表明其检验质量、管理与技术能力已达国际标准。ISO15189是医学实验室行业"金标准",由国际标准化组织发布,获认可实验室的检验报告可在全球100多个国家地区互认,避免重复检验,节省时间与经济成本。爱康重庆实验室配备高端进口设备,日检测能力超3万项,致力于为客户提供精准、安全的健康管理服务。

  • 国内首个!海尔智家获评TÜV认可智能家电检测免目击实验室

    海尔全球检测中心近日通过TÜV莱茵2025年度认证评审,升级为免目击实验室。这是国内首个在智能家电检测领域获此资质的企业,标志着其检测实力获国际权威认可。该资质可大幅缩短认证周期,提升产品上市效率,助力企业抢占市场先机。海尔还拥有CNAS、UL等多项国际认证,实现检测数据互认,未来将持续创新检测技术,为全球用户提供更优质产品体验。

  • 如何检查你的网站是否被大模型引用?AI排名查询工具推荐

    本文探讨AI搜索时代网站流量获取新逻辑:传统SEO因Google搜索"零点击"现象失效,而71%用户通过AI工具研究购买决策。文章指出被大语言模型引用成为新流量入口,并推荐使用AIBase等GEO工具监测网站在豆包、DeepSeek等国内主流AI平台的曝光情况。提出三步操作法和三个优化建议:建立监控基线、定期检查变化、聚焦高转化场景。强调在AI搜索时代,内容被LLM引用已成为新的流量生命线。

  • 告别8GB时代!iPhone 18将升级为12GB内存:苹果已提前采购

    今年9月苹果发布的四款iPhone中,有三款均搭载12GB内存,仅iPhone 17标准版配备8GB内存。 韩国最新一份报告指出,iPhone 18标准版内存将提升至12GB,不过消费者需等到2027年上半年才能入手这款手机。 据媒体报道,苹果已开始从三星采购LPDDR5X内存,此举旨在保障iPhone 18系列的内存供应,避免人工智能企业的需求压力影响到苹果,消息称苹果已向三星预购1300万套LPDDR5X内存。 苹果�

  • 易鑫正式发布汽车金融行业首个Agentic大模型

    易鑫在2025世界互联网大会乌镇峰会上发布汽车金融行业首个Agentic大模型XinMM-AM1。该模型参数量约300亿,响应延迟低于200毫秒,支持语音实时交互,单卡吞吐达370 tokens/秒,可提升获客、风控与运营效率,解决行业周期长、交互多、决策复杂等难题。易鑫作为AI驱动的金融科技平台,研发投入超20亿元,率先实现AI全场景应用,将持续推动智能汽车金融生态建设。

  • 【AI 智惠季】全模态大模型齐发优惠,GPU新客包月2.8折起

    阿里云启动双十一“AI智慧季”大型优惠活动,聚焦企业多元AI场景落地需求,推出7000万tokens大模型免费体验、GPU新客特惠等政策,助力企业降低开发成本。同时提供标准化AI产品与解决方案,覆盖内容创作、智能客服等高频应用场景,并举办系列技术分享活动,携手企业拥抱AI新时代。

  • 国内大模型GEO优化全攻略:免费工具教你监测品牌在文心一言、通义千问等AI平台的可见度

    AI搜索时代,品牌若未出现在AI回答中就等于"不存在"。GEO(生成引擎优化)成为新战场,核心是让AI在回答用户问题时优先引用企业内容。文章详解国内主流AI模型特点:文心一言整合百度生态、通义千问依托阿里电商数据、小众模型在垂直领域更易被引用。提出三大优化策略:内容结构化呈现、建立行业权威背书、布局高权重平台。推荐使用AIBase免费工具实时监测品牌在各大AI平台的曝光情况,通过数据驱动优化策略。

  • AI日报:广电整治AI动画乱象;360发布大模型安全白皮书;百度推出小度AI眼镜Pro

    国家广电总局宣布自2026年3月起全面整治AI生成内容,要求AIGC作品纳入分类分层审核体系。360发布《大模型安全白皮书》,提出全链路AI安全防线应对新型威胁。百度推出2299元小度AI眼镜Pro,集成智能翻译等多项功能。StepFun开源音频编辑模型Step-Audio-EditX,实现文本化语音编辑。Grok新增纯文本生成视频功能,17秒可生成带特效视频片段。研究发现谷歌Veo-3模型能生成逼真手术视频但缺乏医学逻辑。阿里Qwen3-Max-Thinking在全球数学竞赛夺冠,并在加密货币交易中取得显著回报。OpenAI推出轻量化GPT-5 Codex Mini模型,优化开发者体验。

  • Soul App开源模型SoulX-Podcast登顶Hugging Face TTS趋势榜,AI语音对话再升级

    SoulX-Podcast语音生成模型在开源社区Hugging Face发布次日登顶TTS趋势榜。该模型由Soul AI Lab联合高校团队开发,专为多轮对话场景设计,支持中英川粤等多语言/方言与副语言风格,能生成超60分钟流畅自然、角色切换准确、韵律丰富的语音。它解决了传统语音系统在多轮对话中上下文衔接不自然、缺乏副语言控制能力等痛点,在播客、语音合成等场景表现突出,获开发者广泛关注。Hugging Face CEO也转发相关内容,团队未来将持续优化语音对话、拟人化表达等核心交互能力,深化开源生态建设。

  • 何小鹏首次披露物理AI巨大进展 发布第二代VLA大模型

    小鹏汽车在2025科技日发布第二代VLA大模型,颠覆传统“视觉-语言-动作”架构,实现端到端直接输出动作指令,开创物理模型新范式。该模型具备动作生成与物理世界理解能力,参数规模达数十亿级,训练数据近1亿clips。基于2250TOPS算力的Ultra车型成功搭载,推动智驾技术显著进化,同步发布“小径NGP”功能,复杂小路接管里程提升13倍。行业首发的无导航辅助驾驶Super+LCC实现全球覆盖。何小鹏表示,大模型将成为物理AI世界的操作系统,并宣布与大众汽车达成战略合作,共同推进智能出行发展。

今日大家都在搜的词: