eval-harness.mdПубличный
eval-harness
Фреймворк оценки качества Claude-сессий
О скиле
Формальный фреймворк для оценки качества сессий Claude Code на принципах EDD (Eval-Driven Development — разработка, управляемая оценками). Измеряет качество вывода агента, риски регрессий и точность выбора модели по конкретным задачам. Помогает понять: этот промпт стал лучше или хуже после изменений? Какая модель справляется точнее с вашими задачами? Если вы серьёзно работаете с AI-агентами, это инструмент для перехода от «чувствую что работает» к «измеряю что работает». Из ECC, 215k stars. Подключается к Claude Code.
Как установить
Установка
Похожие скилы
// продолжай по той же профессии или категорииЧастые вопросы
- Что такое скил «eval-harness»?
- Как установить скил «eval-harness» в Claude Code?
- Бесплатен ли скил «eval-harness»?
Больше вопросов про Agent Skills — общий FAQ маркетплейса