首页 > 业界 > 关键词  > phi-3最新资讯  > 正文

phi-3安装指南:如何在 MacBook Pro 上微调 phi-3

2024-04-25 11:58 · 稿源:站长之家

站长之家(ChinaZ.com) 4月25日 消息:博主Abhishek Thakur在博客中向大家展示了如何在 MacBook Pro 上训练/微调 Microsoft 的最新 phi-3模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。

要安装 AutoTrain Advanced,您可以执行以下操作:

$pipinstallautotrain-advanced

注意:autotrain不安装pytorch、torchvision等,所以需要自己安装。您可以创建 conda 环境并安装这些依赖项:

$condacreate-nautotrainpython=3.10

完成后,您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!

AutoTrain 不仅提供 LLM 微调,还提供许多其他任务,例如文本分类、图像分类、dreambooth lora 等。但在这篇博文中,我们正在研究 LLM 微调。

您可以通过执行以下操作来查看可以调整 llm 微调的所有参数

$autotrainllm--help

下一步是抓取数据。在这篇博客中,我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整(DPO 的大而小的兄弟)进行训练。

  • 对于 SFT 训练,我们需要一个具有单个文本列的数据集。我们可以使用timdettmers/openassistant-guanaco或 alpaca 之类的数据集。注意:这些数据集已经格式化为带有系统提示、用户指令和辅助消息的文本。如果它们的格式如下:
[{"content":"Definition:Inthistask,youneedtocountthenumberofvowels(letters'a','e','i','o','u')/consonants(alllettersotherthanvowels)inthegivensentence.\nInput:Sentence:'abaseballplayerisinhishittingstanceasafewpeoplewatch'.Countthenumberofconsonantsinthegivensentence.\nOutput:","role":"user"},{"content":"32","role":"assistant"}]

您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它,但用于 ORPO 培训。因此,我们将介绍使用预格式化数据集进行 SFT 训练,并使用聊天模板进行 ORPO 训练。

  • 对于 ORPO 训练,您可以使用argilla/distilabel-capybara-dpo-7k-binarized等数据集。该数据集有很多列,但我们只对chosen&列感兴趣rejected。

使用 AutoTrain,仅创建或查找数据集将是最耗时的部分。现在,当我们拥有数据集时,我们可以使用以下方法进行 SFT 训练:

autotrainllm\

其中 $HF_TOKEN 是您的拥抱面部写入令牌,以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。

请注意,我们使用的是 lora,这就是我们有--peft参数的原因。另外,如果text您的数据集中未调用文本列,您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集,您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:

autotrainllm\

接下来,我们来进行orpo培训。对于 orpo 训练,我们更改--trainer sft为--trainer orpo.

autotrainllm\

以上有4处变化。只有列映射发生了变化,训练器,当然还有数据集。另一项主要变化是--chat-template设置为 的参数的使用chatml。对于--chat-template,选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据,则不会使用任何内容。

现在,如果 CLI 对您来说太难了,您还可以使用 UI!这更容易,并且还允许您上传文件。

要使用用户界面:

$exportHF_TOKEN=your_huggingface_write_token

然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:

image.png

如果您无法在模型下拉列表中找到 phi3,您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;)

SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。

详细文档点此查看:https://huggingface.co/docs/autotrain/index

举报

  • 相关推荐
  • M4 MacBook Air首次跑分:仅比MacBook Pro低了5%

    疑似新款M4MacBookAir首次在Geekbench中现身,Metal跑分仅比M4MacBookPro低了5%。此次曝光的M4MacBookAir型号为Mac16,12”,运行macOS15.2系统,配备十核M4芯片和24GB统一内存,主频达到4.41GHz,这也是目前记录到的M4芯片的最高频率。M4MacBookAir预计将在2025年3月发布,提供13英寸和15英寸两种尺寸选择,它还将配备新的摄像头系统。

  • 价格更低性能相当!M4 MacBook Air跑分与MacBook Pro相差不大

    苹果推出了最新的M4MacBookAir,根据最新的GeekbenchMetal基准测试结果,M4MacBookAir的表现与M4MacBookPro几乎相当。在GeekbenchMetal测试中,M4MacBookAir获得了54846分10核M4MacBookPro的得分则为57788分,两者之间的差距仅为2942分,这表明M4MacBookAir在GPU性能上几乎与M4MacBookPro持平,尽管MacBookAir的散热设计可能不如MacBookPro,但在纸面上,其性能已经能够与后者相媲美。但考虑到价格因素,M4MacBookAir的性价比依然极具吸引力,其基本机型也配备了16GB内存,这使得它在性能与价格之间达到了一个理想的平衡。

  • 苹果CEO库克:M4 MacBook Air预计本周发布

    苹果公司首席执行官蒂姆·库克近日透露,苹果将在本周推出全新产品,并特别提到了关键词“Air”。这一消息迅速引发了科技爱好者和消费者的广泛关注。顶配版将配备高达32GB的内存标配版则起步为16GB内存,这一配置无疑将使其成为苹果史上性能最强劲的Air系列笔记本。

  • 苹果CEO库克官宣新品:M4 MacBook Air本周发布

    苹果CEO库克在社交平台上预告,苹果将在本周推出新品,预告片中的关键词是Air”。这次苹果可能不会举办发布会是以新闻稿的形式公布新品配置,并同步上架苹果官网开售。除了升级M4芯片,新款MacBookAir顶配版预计会配备32GB内存,标配是16GB内存起步,这将是苹果史上最强悍的Air笔记本。

  • 苹果M4版MacBook Air或将下月发布:性能显著提升

    知名苹果分析师MarkGurman近日透露,苹果公司正紧锣密鼓地筹备在3月份推出两款全新MacBookAir笔记本,分别是13英寸和15英寸版本,这两款产品将搭载最新的M4芯片。苹果的内部营销、销售及零售团队已全面进入备战状态,为新品上市做好充分准备。这款性能接近MacBookPro、同时保持轻薄便携特性的笔记本,无疑将成为市场上的一大亮点。

  • 续航超12小时比肩MacBook!荣耀MagicBook Pro 14搭载全球首款92Wh巨量电池

    在今天的新品发布会上,荣耀宣布2025年首款笔记本产品MagicBookPro14搭载了全球首款92Wh巨量电池。在HONORTurboX全新底层调校技术加持下,笔记本日常办公综合测试续航达12小时3分,做到了X86平台轻薄本续航首次比肩MacBookPro14,成为Windows轻薄本的续航新巅峰。此外在长续航同时,这款笔记本还搭载了英特尔酷睿Ultra9285H旗舰处理器,并在HONORTurboX技术的加持下,实现了80W的满血性能释放。

  • 联想ThinkPad X9官宣:比MacBook Air还轻 D盖可拆卸

    今晚联想ThinkPad官微正式宣布,ThinkPadX914/15AuraAI元启版,将于2月18日预售,2月26日正式开售。这款高端商务本曾在今年初举办的CES2025上亮相,ThinkPadX914和15Aura重量分别为1.21公斤和1.45公斤。作为一款专为现代混合办公模式打造的智能设备,ThinkPadX9系列深度整合了联想AINow和Aura智能工具,为用户提供快速搜索、文本摘要、跨设备知识检索等功能。

  • 苹果最强Air笔记本!M4 MacBook Air发布:7999元起

    今天,M4版MacBookAir正式上架苹果官网,起售价是7999元。M4版MacBookAir提供13和15英寸两种尺寸,两款都是16GB内存起步,其中13英寸版本16256G售价7999元,16512G售价9499元,24G512G售价10999元;15英寸版本16256G售价9999元,16512G售价11499元,24G512G售价12999元。新品将于3月7日上午9点开启预购,3月12日正式发售。

  • 荣耀MagicBook Pro 14全面接入DeepSeek:程序员开外挂

    日前,荣耀发布了一张主题为有AI代码,快人一步”的海报,正式宣布即将推出的荣耀MagicBookPro14笔记本电脑将集成DeepSeek大模型,这一举措在科技圈内引发了广泛关注。荣耀MagicBookPro14不仅搭载了先进的荣耀HONORTurboX系统通过DeepSeek技术深度赋能YOYO智能助手,为程序员和开发者提供了一个强大的灵感外挂”。让我们期待2月26日,看看听劝的手机厂商如何做笔记本的吧。

  • 笔记本六边形战士来了!荣耀MagicBook Pro 14首发HONOR Turbo X

    今天下午,荣耀MagicBookPro14发布会正式举办,在本次发布会上,荣耀宣布荣耀笔电调校技术从OSTurbo全面进化为HONORTurboX。从2022年开始,荣耀就不断迭代OSTurbo技术,从最初的有限调校,到2.0版本的对标手机调校框架,再到平台级AI使能的3.0版本,续航已经从6小时提升至8.5小时。作为听劝的厂商”,荣耀完美展示了一家听劝的手机厂商如何做笔记本的,通过将手机领域的技术积累引入PC行业,重塑了PC产品的用户体验。

热文

  • 3 天
  • 7天