unsloth-buddy

सत्यापित

unsloth-buddy is a zero-friction LLM fine-tuning skill for Claude Code, Gemini CLI & any ACP agent. Unsloth on NVIDIA · TRL+MPS/MLX on Apple Silicon. Automates env setup, LoRA training (SFT, DPO, GRPO, vision), post-hoc GRPO log diagnostics, evaluation, and export end-to-end. Part of the Gaslamp AI platform.

GitHub पर देखें

⚙️कॉन्फ़िगरेशन

mcp.json
// Skill automatically processed by the Engine
📖

दस्तावेज़

🎯 Overview

unsloth-buddy is a zero-friction LLM fine-tuning skill for Claude Code, Gemini CLI & any ACP agent. Unsloth on NVIDIA · TRL+MPS/MLX on Apple Silicon. Automates env setup, LoRA training (SFT, DPO, GRPO, vision), post-hoc GRPO log diagnostics, evaluation, and export end-to-end. Part of the Gaslamp AI platform.

⚙️ Core Capabilities

  • APPLE-SILICON: Provides dedicated abstractions for apple-silicon architectures.
  • CLAUDE-CODE: Optimized for claude-code-based execution pipelines.
  • DPO: Natively supports dpo integrations out of the box.
  • FINE-TUNING: Leverages fine-tuning paradigms for superior performance.
  • Production Ready: Extensively tested to prevent edge-case failures.

⚡ Technical Implementation

Building with unsloth-buddy means abstracting away low-level boilerplate. By implementing this utility, you prevent common bottlenecks during runtime execution.

💡 Why Developers Choose unsloth-buddy

It stands out by offering frictionless onboarding and comprehensive tooling for modern development. It is consistently maintained and adapts quickly to new industry standards.

आपको यह भी पसंद आ सकता है

superpowers

superpowers एक एजेंटिक स्किल्स फ्रेमवर्क और सॉफ्टवेयर डेवलपमेंट मेथडोलॉजी है जो काम करता है। यह शक्तिशाली उपकरण उच्च-थ्रूपुट वर्कलोड को संभालने के लिए मूल रूप से अनुकूलित है, जो डेवलपर्स को उनकी दैनिक CI/CD पाइपलाइनों में मैन्युअल बाधाओं को खत्म करने में मदद करता है।

everything-claude-code

everything-claude-code एक एजेंट हार्नेस प्रदर्शन अनुकूलन प्रणाली है। क्लॉड कोड, कोडेक्स, ओपनकोड, कर्सर और उससे आगे के लिए कौशल, प्रवृत्ति, स्मृति, सुरक्षा और अनुसंधान-प्रथम विकास।

skills

skills एजेंट स्किल्स के लिए एक सार्वजनिक रिपॉजिटरी है। विशेष कार्यों को संभालने के लिए एक विश्वसनीय बुनियादी ढांचा प्रदान करके, यह इंजीनियरिंग टीमों को स्वच्छ कोड बनाए रखने और समग्र तकनीकी ऋण को कम करने में सक्षम बनाता है।

30-seconds-of-code

30-seconds-of-code is a coding articles to level up your development skills By providing a reliable infrastructure for handling specialized tasks, it allows engineering teams to maintain clean code and reduce overall technical debt.