O narzędziu
Unsloth — open-source fine-tuning framework (Apache 2.0). 500+ modeli, 2x szybciej, 70% mniej VRAM, no accuracy loss. MoE LLMs 12x szybciej z 35% mniej VRAM (DeepSeek, GLM, Qwen, gpt-oss). Pro $9.99/mies. — faster kernels, longer context, priority support. Unsloth Studio: web UI dla training i running modeli (Gemma 4, Qwen 3.6, DeepSeek, gpt-oss). Wsparcie: full FT, RL, pretraining, 4-bit/16-bit/FP8.
Zastosowanie
- •Fine-tuning Llama 4, Gemma 4, Qwen 3.5, DeepSeek na consumer GPU.
- •MoE training 12x szybciej (DeepSeek, GLM).
- •RLHF z DPO/ORPO.
- •Local training i inference (Unsloth Studio).
- •Production fine-tuning z low VRAM (RTX 4090).
Funkcje główne
- •2x szybszy fine-tuning, 70% mniej VRAM (no accuracy loss).
- •500+ modeli supported.
- •MoE LLMs 12x szybciej + 35% mniej VRAM (DeepSeek, GLM, Qwen, gpt-oss).
- •Unsloth Studio — web UI (no-code) do training/running modeli lokalnie.
Funkcje dodatkowe
▶2x szybszy + 70% mniej VRAM
Optymalizowane CUDA kernels — fine-tuning 2x szybciej i 70% mniej VRAM bez utraty dokladnosci. Pozwala trenowac 70B modele na consumer GPU (RTX 4090), wczesniej wymagajacych H100.
▶500+ modeli (text/vision/audio)
Wsparcie dla 500+ modeli — text (Llama 4, Gemma 4, Qwen 3.5, DeepSeek), vision (LLaVA, Pixtral), audio, embeddings. Najszerszy katalog w open-source fine-tuning frameworks.
▶Unsloth Studio
Web UI (no-code) do training i runowania modeli 100% offline na Mac i Windows. Eliminuje koniecznosc terminal/Python dla non-technical users — idealna onboarding do fine-tuningu.
▶Model Arena (NEW)
Side-by-side comparison dwoch modeli — np. base model vs fine-tuned version. Pozwala wizualnie ocenic, czy fine-tuning przyniosl pozadana poprawe w konkretnym scenariuszu.
▶Data Recipes (NEW)
Automatyczne transformowanie dokumentow (PDF, CSV, JSON) w gotowe datasety do trenowania. Eliminuje zmudna prace data preparation, ktora jest najczestsza bariera wejscia do fine-tuningu.
▶Training Methods (LoRA/QLoRA/DPO/ORPO/RLHF)
Pelne spektrum nowoczesnych technik: Full fine-tuning, LoRA (default), QLoRA z 4-bit, DPO, ORPO, RLHF, SFT, Pretraining, RL. Wszystkie techniki frontier AI labs w jednym narzedziu.
▶Quantization (4-bit/16-bit/FP8)
Najnowsze techniki memory-efficient — 4-bit, 16-bit, FP8 training. Optimized kernels dla NVIDIA GPUs (RTX, A100, H100, H200) z aktualnymi optimizations dla Blackwell.
▶Model Export (GGUF/Safetensors)
Eksport wytrenowanych modeli do GGUF (dla Ollama, llama.cpp) lub Safetensors (HF Hub). One-click deploy do production inference engines bez konwersji formats.
▶MoE LLMs 12x szybciej
Mixture-of-Experts (MoE) trenowanie 12x szybciej + 35% mniej VRAM dla DeepSeek, GLM, Qwen, gpt-oss. Pierwszy framework optymalizujacy MoE training na consumer hardware.
▶OpenAI-compatible API
Inference przez OpenAI-compatible endpoints z tool-calling, web search i multi-file support. Drop-in replacement dla OpenAI clients po fine-tuningu modelu.
✓ Zalety
Cennik
- •Open-source: Apache 2.0 (free, unlimited).
- •Pro: $9.99/mies.
- •(faster kernels, longer context, priority support).
API i integracje
- •Python library (pip install unsloth).
- •Native transformers/PEFT integration.
- •Hugging Face Hub support.
- •Unsloth Studio (web UI).
Training methods
- •Full fine-tuning.
- •LoRA (default).
- •QLoRA z 4-bit quantization.
- •DPO (Direct Preference Optimization).
- •ORPO.
- •RLHF.
- •Supervised fine-tuning (SFT).
- •Pretraining.
- •RL (Reinforcement Learning).
Quantization
- •4-bit, 16-bit, FP8 training.
- •Najnowsze techniki memory-efficient.
- •Optimized kernels dla NVIDIA GPUs.
