[Description] : unsloth-buddy est une compétence de fine-tuning LLM sans friction pour Claude Code, Gemini CLI et tout agent ACP. Unsloth sur NVIDIA · TRL+MPS/MLX sur Apple Silicon. Automatise la configuration de l'environnement, l'entraînement LoRA (SFT, DPO, GRPO, vision), le diagnostic des logs GRPO a posteriori, l'évaluation et l'exportation de bout en bout. Fait partie de la plateforme Gaslamp AI.
[Readme] :
🎯 Aperçu
unsloth-buddy est une compétence de fine-tuning LLM sans friction pour Claude Code, Gemini CLI et tout agent ACP. Unsloth sur NVIDIA · TRL+MPS/MLX sur Apple Silicon. Automatise la configuration de l'environnement, l'entraînement LoRA (SFT, DPO, GRPO, vision), le diagnostic des logs GRPO a posteriori, l'évaluation et l'exportation de bout en bout. Fait partie de la plateforme Gaslamp AI.
⚙️ Capacités principales
- APPLE-SILICON : Fournit des abstractions dédiées pour les architectures apple-silicon.
- CLAUDE-CODE : Optimisé pour les pipelines d'exécution basés sur claude-code.
- DPO : Prend en charge nativement les intégrations dpo dès le départ.
- FINE-TUNING : Exploite les paradigmes de fine-tuning pour des performances supérieures.
- Prêt pour la production : Testé de manière approfondie pour prévenir les défaillances aux cas limites.
⚡ Implémentation technique
Construire avec unsloth-buddy signifie abstraire le code passe-partout de bas niveau. En implémentant cet utilitaire, vous évitez les goulots d'étranglement courants lors de l'exécution.
💡 Pourquoi les développeurs choisissent unsloth-buddy
Il se distingue en offrant une intégration sans friction et des outils complets pour le développement moderne. Il est maintenu régulièrement et s'adapte rapidement aux nouvelles normes de l'industrie.