unsloth-buddy

検証済み

unsloth-buddy は、Claude Code、Gemini CLI、および任意の ACP エージェント向けの、摩擦のない LLM ファインチューニングスキルです。NVIDIA 上では Unsloth、Apple Silicon 上では TRL+MPS/MLX を使用します。環境セットアップ、LoRA トレーニング(SFT、DPO、GRPO、ビジョン)、事後的な GRPO ログ診断、評価、エクスポートをエンドツーエンドで自動化します。Gaslamp AI プラットフォームの一部です。

GitHubで見る

⚙️設定

mcp.json
// Skill automatically processed by the Engine
📖

ドキュメント

🎯 概要

unsloth-buddy は、Claude Code、Gemini CLI、および任意の ACP エージェント向けの、摩擦のない LLM ファインチューニングスキルです。NVIDIA 上では Unsloth、Apple Silicon 上では TRL+MPS/MLX を使用します。環境セットアップ、LoRA トレーニング(SFT、DPO、GRPO、ビジョン)、事後的な GRPO ログ診断、評価、エクスポートをエンドツーエンドで自動化します。Gaslamp AI プラットフォームの一部です。

⚙️ 中核機能

  • APPLE-SILICON: Apple Silicon アーキテクチャ向けの専用抽象化を提供します。
  • CLAUDE-CODE: claude-code ベースの実行パイプライン向けに最適化されています。
  • DPO: DPO 統合を標準でネイティブサポートします。
  • FINE-TUNING: ファインチューニングパラダイムを活用し、優れたパフォーマンスを実現します。
  • 本番環境対応: エッジケースの障害を防ぐために徹底的にテストされています。

⚡ 技術実装

unsloth-buddy を使用することで、低レベルのボイラープレートコードを抽象化できます。このユーティリティを実装することで、ランタイム実行中の一般的なボトルネックを防止できます。

💡 開発者が unsloth-buddy を選ぶ理由

摩擦のないオンボーディングと、最新の開発に対応した包括的なツールを提供することで際立っています。継続的にメンテナンスされ、新しい業界標準に迅速に適応します。