Unsloth Studio 发布：无需代码，小白也能在本地训练大模型！

粘人豆包

Unsloth (unsloth.ai) 是目前大语言模型（LLM）微调领域最受欢迎的开源框架之一，以极高的训练速度和极低的内存消耗著称。

核心功能与亮点总结：

1. 核心定位

Unsloth 是一个专门用于极速微调大语言模型（LLM）的库。它重新编写了 PyTorch 的底层内核（使用 OpenAI 的 Triton 语言），在不损失任何精度的前提下，大幅提升了训练速度并降低了显存占用。

2. 仓库核心优势

训练速度提升： 相比标准的 Hugging Face + PyTorch，微调速度通常快 2 到 5 倍。
显存（VRAM）节省： 能够减少高达 70% 的显存消耗。例如，你可以在显存较小的消费级显卡（如 RTX 3060/4090）上微调 7B 甚至更大的模型。
广泛的模型支持： 深度适配 Llama 3.x, Mistral, Gemma 1-3, Phi-4, Qwen 2.5/3, 以及 DeepSeek 等模型。
强化学习优化： 针对 GRPO (DeepSeek-R1 使用的算法) 和 RLHF 进行了极致优化，比传统方法节省约 80% 的显存。

3. 最新重大更新：Unsloth Studio

仓库最近推出了 Unsloth Studio (Beta)，这是一个本地 Web UI 工具：

跨平台： 支持 Windows, Linux 和 macOS (MLX)。
免代码： 支持通过拖拽 PDF、CSV、DOCX 等文件自动创建数据集并开始微调。
可视化监控： 提供训练过程的实时无损观察（Loss 曲线、GPU 使用率等）。

4. 主要功能特性

导出灵活： 支持将训练好的模型一键导出为 GGUF（用于 llama.cpp）、16-bit Safetensors 或 LoRA 适配器。
长文本支持： 优化了 RoPE 和 MLP 内核，支持在 80GB GPU 上训练超过 500K 上下文的模型。
支持视觉与语音： 除了纯文本，还扩展到了视觉模型（Vision）和语音模型（TTS，如 Orpheus-TTS）的微调。

5. 许可证 (License)

该项目采用双重许可证模式：

Unsloth Core (核心库)： 采用 Apache 2.0 协议，对商业和个人开发者非常友好。
Unsloth Studio (UI 部分)： 采用 AGPL-3.0 协议。

6. 快速开始

仓库 README 中提供了大量的 Google Colab 免费笔记本。对于初学者，只需点击对应的“Start for free”链接，就可以在云端几分钟内体验微调 Llama 或 Qwen 模型的过程，无需自己配置复杂的本地环境。

GitHub 地址： [链接登录后可见] Star 数： 目前已超过 58k（增长极其迅速），是 AI 开发者的必备工具。

此内容登录或注册后可见