首页 > 业界 > 关键词  > phi-3最新资讯  > 正文

phi-3安装指南:如何在 MacBook Pro 上微调 phi-3

2024-04-25 11:58 · 稿源:站长之家

站长之家(ChinaZ.com) 4月25日 消息:博主Abhishek Thakur在博客中向大家展示了如何在 MacBook Pro 上训练/微调 Microsoft 的最新 phi-3模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。

要安装 AutoTrain Advanced,您可以执行以下操作:

$pipinstallautotrain-advanced

注意:autotrain不安装pytorch、torchvision等,所以需要自己安装。您可以创建 conda 环境并安装这些依赖项:

$condacreate-nautotrainpython=3.10

完成后,您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!

AutoTrain 不仅提供 LLM 微调,还提供许多其他任务,例如文本分类、图像分类、dreambooth lora 等。但在这篇博文中,我们正在研究 LLM 微调。

您可以通过执行以下操作来查看可以调整 llm 微调的所有参数

$autotrainllm--help

下一步是抓取数据。在这篇博客中,我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整(DPO 的大而小的兄弟)进行训练。

  • 对于 SFT 训练,我们需要一个具有单个文本列的数据集。我们可以使用timdettmers/openassistant-guanaco或 alpaca 之类的数据集。注意:这些数据集已经格式化为带有系统提示、用户指令和辅助消息的文本。如果它们的格式如下:
[{"content":"Definition:Inthistask,youneedtocountthenumberofvowels(letters'a','e','i','o','u')/consonants(alllettersotherthanvowels)inthegivensentence.\nInput:Sentence:'abaseballplayerisinhishittingstanceasafewpeoplewatch'.Countthenumberofconsonantsinthegivensentence.\nOutput:","role":"user"},{"content":"32","role":"assistant"}]

您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它,但用于 ORPO 培训。因此,我们将介绍使用预格式化数据集进行 SFT 训练,并使用聊天模板进行 ORPO 训练。

  • 对于 ORPO 训练,您可以使用argilla/distilabel-capybara-dpo-7k-binarized等数据集。该数据集有很多列,但我们只对chosen&列感兴趣rejected。

使用 AutoTrain,仅创建或查找数据集将是最耗时的部分。现在,当我们拥有数据集时,我们可以使用以下方法进行 SFT 训练:

autotrainllm\

其中 $HF_TOKEN 是您的拥抱面部写入令牌,以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。

请注意,我们使用的是 lora,这就是我们有--peft参数的原因。另外,如果text您的数据集中未调用文本列,您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集,您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:

autotrainllm\

接下来,我们来进行orpo培训。对于 orpo 训练,我们更改--trainer sft为--trainer orpo.

autotrainllm\

以上有4处变化。只有列映射发生了变化,训练器,当然还有数据集。另一项主要变化是--chat-template设置为 的参数的使用chatml。对于--chat-template,选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据,则不会使用任何内容。

现在,如果 CLI 对您来说太难了,您还可以使用 UI!这更容易,并且还允许您上传文件。

要使用用户界面:

$exportHF_TOKEN=your_huggingface_write_token

然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:

image.png

如果您无法在模型下拉列表中找到 phi3,您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;)

SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。

详细文档点此查看:https://huggingface.co/docs/autotrain/index

举报

  • 相关推荐
  • 苹果确认:重点在印生产iPhone,MacBook、iPad暂无计划!

    目前,苹果在印度的生产制造战略主要是围绕着 iPhone 展开。而让苹果现阶段在印度投资建立专门的 MacBook 和 iPad 生产线,显然是不太现实的……

  • REDMI Turbo 4 Pro给iPhone 16 Pro Max充电:能触发22W快充

    Redmi Turbo 4 Pro将于4月24日发布,主打22.5W反向快充功能,可给手表、耳机等设备供电,配备7550mAh大电池。实测可为iPhone 16 Pro Max提供22W快充,接近苹果原装充电器速度。该机全球首发骁龙8s Gen4处理器,安兔兔跑分240万,采用台积电4nm工艺,CPU性能提升31%,GPU提升49%。配备6.83英寸1.5K纯直屏、金属中框和冰封散热系统,质感媲美旗舰机型。

  • 苹果加紧生产iPhone 17、Mac等关键产品!美版靠印度和越南了

    快科技4月14日消息,据媒体报道,苹果利用美国关税的90天宽限期,正加紧在印度和越南生产其包括iPhone 17、MacBook和iPad在内的关键产品。知情人士透露,苹果今年早些时候已要求主要供应商加大在印度的iPhone生产力度,然而由于印度当地工厂产能已达极限,进一步增加产能面临困难。为此,苹果已协助供应商采购设备,预计此举将使印度的iPhone产量增加数百万部。苹果计划今�

  • REDMI Turbo 4 Pro定制1.5K大屏:1.5mm超窄黑边 媲美iPhone 16 Pro

    Redmi Turbo 4 Pro即将发布,屏幕升级为6.83英寸大曲率,边框仅1.5mm,材质采用M9发光材料,质感更强、更耐用,抗压能力高达70kg。核心配置上首发搭载第四代骁龙8S芯片,配备1.5K OLED直屏,内置7550mAh超大电池,支持90W快充,并推出三款独特配色。

  • 曝iPhone 18 Pro首发屏下Face ID:苹果消灭药丸屏

    从最新爆料来看,iPhone 18 Pro系列将会升级到全新的单挖孔屏,这是目前安卓阵营的主流屏幕形态。区别在于安卓阵营普遍都是以屏幕指纹为主,而iPhone 18 Pro系列仍然是3D人脸识别。

  • 荣耀MagicBook Pro 16 2025定档4月30日:首发搭载RTX 5070显卡

    荣耀4月23日发布GT系列新品,包括GT Pro手机和GT平板两款旗舰产品。同时宣布2025款MagicBook Pro 16 HUNTER将于4月30日发布,首发搭载NVIDIA GeForce RTX 5070显卡,采用全新Blackwell架构,配备8GB GDDR7显存,支持光线追踪和DLSS 4.0技术。该笔记本在HONOR Turbo X调校下,性能最高可达150W,并升级静音高性能2.0模式。新品还搭载自研AI游戏管家功能,提供一键备战、AI攻略库等功能,并升级空间音频2.0版本。荣耀表示这是去年MagicBook Pro 16的全新迭代升级款,主打轻薄游戏本市场。

  • 苹果史上最大!曝iPhone 17 Air配备12GB内存:看齐大哥Pro Max

    分析师郭明錤爆料,iPhone 17系列将迎来重大升级。三款机型均配备12GB内存,创苹果手机内存新高。其中iPhone 17 Air将采用灵动岛屏幕,支持ProMotion自适应刷新率,搭载基于台积电3nm工艺的A19芯片。由于AI时代需求,8GB内存已显不足,苹果不得不提升配置以保障用户体验。不过台积电2nm工艺因成本高、产能有限,苹果将推迟至2026年商用。相比安卓旗舰16GB/24GB内存配置,苹果在硬件升级上仍显保守。

  • 曝iPhone 18 Pro内测屏下3D人脸识别:苹果迈入单挖孔屏时代

    这意味着iPhone 18 Pro系列正式迈入单挖孔屏时代,向安卓主流屏幕形态看齐。需要注意的是,安卓阵营普遍采用单挖孔 屏幕指纹识别方案,而iPhone则是采用屏下3D人脸识别方案,不支持屏幕指纹。

  • 谷歌在Pixel 9 Pro广告中,嘲讽iPhone 17:抄袭、老旧!

    谷歌在Pixel 9 Pro广告中暗讽苹果iPhone 17 Pro设计抄袭。广告展示了两款手机后置摄像头模块高度相似,并指出iPhone近年采用的夜间模式、照片整理等功能最初都源自Pixel手机。谷歌还对比了两款手机的语音助手,暗示Siri声音不够自然。这并非谷歌首次嘲讽iPhone,此前就曾批评iPhone 15改用USB-C接口。广告暗示苹果在设计和功能上跟随谷歌的创新步伐。

  • REDMI Turbo 4 Pro官宣下周发布:同档无敌

    快科技4月18日消息,王腾刚刚正式宣布,REDMI Turbo4Pro将于下周发布。他还介绍,K80系列全面升档以后,产品力横扫同档,而Turbo4Pro是全面进阶的产品,预计将替代原本K80的位置。王腾强调,Pro,代表着更高规格、更高标准、更强体验,我们的目标就是打造一款同档无敌的全面Pro”准旗舰。REDMI Turbo4Pro将实现性能、质感、续航大幅跃升。性能方面,REDMI Turbo4Pro将行业首发搭载高�