llm-evaluation.mdПубличный

llm-evaluation

Оценка качества LLM-приложений и агентов

О скиле

Учит Claude оценивать качество LLM-приложений — как проверить что ваш AI-агент или чат-бот отвечает правильно и стабильно. Скил охватывает бенчмарки для LLM, метрики RAGAS (для оценки RAG-систем), обнаружение галлюцинаций (когда AI выдумывает факты), скоринг качества ответов и построение evaluation pipeline. Также A/B тестирование промптов. Если вы строите AI-продукт — получите объективные метрики вместо ощущений кажется работает. Если ML-инженер — внедрите автоматическую проверку регрессий в AI-поведении. Работает с Claude Code.

Как установить

  1. Открой папку скилов Claude Code: open ~/.claude/skills/

  2. Склонируй репозиторий: git clone https://github.com/rmyndharis/antigravity-skills ~/.claude/skills/llm-evaluation

  3. Перезагрузи Claude Code — скил подхватится автоматически.

  4. Активируй в чате: Use llm-evaluation skill.

Установка

// продолжай по той же профессии или категории

Частые вопросы

Что такое скил «llm-evaluation»?
«llm-evaluation» — готовый Agent Skill для Claude Code и Cursor. Это .md-файл с системным промптом, который подключается одним файлом и расширяет возможности AI-редактора в задачах vibe-coding. Скил можно скачать и использовать сразу — без настройки.
Как установить скил «llm-evaluation» в Claude Code?
Скачайте .md-файл на этой странице и положите его в папку ~/.claude/skills/ вашего проекта. Перезапустите Claude Code — скил подхватится автоматически. Для Cursor и Windsurf скопируйте содержимое .md-файла в системный промпт проекта (Settings → Rules).
Бесплатен ли скил «llm-evaluation»?
Да, скил «llm-evaluation» доступен бесплатно для всех пользователей без регистрации. Скачайте .md-файл прямо на этой странице.

Больше вопросов про Agent Skills — общий FAQ маркетплейса