phi-3安装指南：如何在 MacBook Pro 上微调 phi-3

原标题：phi-3安装指南：如何在 MacBook Pro 上微调 phi-3

导读：

月日网易游戏蛋仔派对知名地图创作者仟中酒发声称其原创地图因蓝在腾讯游戏元梦之星中遭抄袭已起诉将在月开庭近期两大游戏玩家之间的口水仗月日消息博主在博客中向大家展示了如何在上训练微...

3月28日，网易游戏《蛋仔派对》知名UGC地图创作者仟中酒发声称，其原创地图《因蓝》在腾讯游戏《元梦之星》中遭抄袭，已起诉，将在5月开庭。近期，两大游戏玩家之间的口水仗

4月25日消息:博主Abhishek Thakur在博客中向大家展示了如何在 Pro 上训练/微调 Microsoft 的最新模型!用户需要使用 M1或 M2mac 来执行此操作。之后将使用 AutoTrain Advanced来微调 phi-3。

要安装 AutoTrain Advanced，您可以执行以下操作:

注意:autotrain不安装pytorch、torchvision等，所以需要自己安装。您可以创建 conda 环境并安装这些依赖项:

完成后，您可以在 Mac 计算机上使用 AutoTrain CLI 或 UI!我们将看看两者!

AutoTrain 不仅提供 LLM 微调，还提供许多其他任务，例如文本分类、图像分类、dreambooth lora 等。但在这篇博文中，我们正在研究 LLM 微调。

您可以通过执行以下操作来查看可以调整 llm 微调的所有参数

下一步是抓取数据。在这篇博客中，我将向您展示如何在 MacBook 上通过 SFT 训练和 ORPO 调整（DPO 的大而小的兄弟）进行训练。

您可以使用 AutoTrain 的 chat-template 参数。我们将在本文后面看到它，但用于 ORPO 培训。因此，我们将介绍使用预格式化数据集进行 SFT 训练，并使用聊天模板进行 ORPO 训练。

使用 AutoTrain，仅创建或查找数据集将是最耗时的部分。现在，当我们拥有数据集时，我们可以使用以下方法进行 SFT 训练:

其中 $HF_TOKEN 是您的拥抱面部写入令牌，以防您希望将经过训练的模型推送到拥抱面部中心以方便部署和共享。您可以在这里找到您的代币。

请注意，我们使用的是 lora，这就是我们有--peft参数的原因。另外，如果text您的数据集中未调用文本列，您可以添加另一个参数--text-column your_datasets_text_column。如果您想使用自己的 CSV/JSON 文件而不是拥抱面部中心数据集，您可以将其命名为 train.csv / train.jsonl 并将其放置在本地文件夹中。训练命令将略有变化:

接下来，我们来进行orpo培训。对于 orpo 训练，我们更改--trainer sft为--trainer orpo.

以上有4处变化。只有列映射发生了变化，训练器，当然还有数据集。另一项主要变化是--chat-template设置为的参数的使用chatml。对于--chat-template，选项有:zephyr、chatml或tokenizer无。如果您已经像我们在 SFT 训练中那样自行正确格式化了数据，则不会使用任何内容。

现在，如果 CLI 对您来说太难了，您还可以使用 UI!这更容易，并且还允许您上传文件。

要使用用户界面:

然后在浏览器中访问https://127.0.0.1:10000并享受AutoTrain UI! 🚀 与上面 ORPO 训练具有相同参数的屏幕截图如下所示:

如果您无法在模型下拉列表中找到 phi3，您可以使用以下 URL:https://127.0.0.1:7860/?custom_models=microsoft/Phi-3-mini-4k-instruct。注意:我已添加 phi-3作为自定义模型。您可以对 Hub 中的任何其他兼容型号执行相同的操作。 ;）

SFT 和 ORPO 训练均在 M2Max MacBook Pro 上成功进行了测试。

详细文档点此查看：https://huggingface.co/docs/autotrain/index