У модели есть режим, в котором она думает дольше перед ответом — и заметно лучше решает трудные задачи. Разберём, что такое extended thinking, как включать через /effort, think и ultrathink, и когда это лишнее.
Иногда Claude отвечает мгновенно, а иногда — после паузы, во время которой в терминале бежит серый курсив с его рассуждениями. Эта пауза и есть расширенное мышление: модель не выпаливает первый ответ, а сначала разбирает задачу по шагам. На простой правке это не нужно, а на сложной — разница между рабочим решением и мусором. Управлять этим можно, и в этом гайде разберём как.
Что узнаешь из гайда
/effort, ключевые слова think и ultrathinklow до max — и что выбратьЧасть 1 · Понятие
Главное
Расширенное мышление — это видимое пошаговое рассуждение модели перед ответом. В терминале оно идёт серым курсивом. Дороже и дольше обычного ответа, но на сложных задачах заметно точнее.
Расшифруем. По-английски это extended thinking — «расширенное (углублённое) размышление». Обычно модель отвечает сразу: прочитала запрос — выдала результат. В режиме мышления она вставляет между запросом и ответом фазу рассуждения: разбивает задачу, проверяет варианты, отлавливает противоречия. Эти мысли видно прямо в терминале — серым курсивом, перед самим ответом.
Зачем это нужно. Чем труднее задача, тем выше шанс, что «ответ с ходу» окажется поверхностным или просто неверным. Пауза на рассуждение даёт модели разложить проблему и прийти к решению, до которого она бы не дошла мгновенным ответом. Цена — время и токены: за мысли платят так же, как за обычный вывод. Поэтому мышление — это инструмент под сложное, а не режим «всегда включено».
Важно
Не путай мышление с план-режимом. Мышление — это внутреннее рассуждение модели перед любым ответом. План-режим — отдельный режим, где агент строит план и не трогает файлы, пока ты не утвердишь. Их можно сочетать. Про второе — отдельный гайд про план-режим.
Часть 2 · Включение
Главное
Два способа. Точный — команда /effort с уровнем. Быстрый — ключевые слова прямо в задаче: think просит подумать глубже, ultrathink — рассуждать по максимуму.
Самый надёжный способ управлять глубиной — команда /effort. Она задаёт уровень усилия на рассуждение и действует на всю сессию, пока ты его не сменишь:
# Задать уровень мышления на сессию (рекомендуют xhigh для кодинга)
/effort xhigh
# Без аргумента — откроется слайдер для выбора уровня
/effortВторой способ — ключевые слова прямо в тексте задачи. Они работают как подсказка модели «здесь стоит подумать подольше». Слово think просит рассуждения чуть глубже обычного, а ultrathink — по максимуму:
# Лёгкий толчок к рассуждению
> think: как лучше разбить этот модуль на части?
# Максимальная глубина для трудной задачи
> ultrathink: спроектируй схему БД под мультиарендность,
> учти изоляцию данных и миграцииРазница между способами простая. /effort — это «настройка на сессию», она держится, пока не сменишь. Ключевые слова — «разовый толчок» под конкретную задачу. На практике удобно поставить рабочий уровень через /effort, а ultrathink доставать точечно, когда попалась особенно зубодробительная задача.
Часть 3 · Уровни
Главное
Уровней несколько — от low (минимум мыслей, быстрые ответы) до max (максимум усилия). Для агентного кодинга в Claude Code обычно советуют xhigh как рабочую середину-плюс.
Каждый уровень — это компромисс «глубина против скорости и денег». Вот ориентир, под что какой уместен:
| Уровень | Глубина | Под что |
|---|---|---|
low | Минимум, быстро | Простые правки, поиск файла |
medium | Умеренная | Обычные задачи кодинга |
high | Глубокая | Сложная логика, отладка |
xhigh | Расширенная | Кодинг и агентные задачи |
max | Максимум | Самое трудное, не жалко токенов |
Универсального ответа «какой уровень всегда» нет, но есть разумный дефолт: поставить xhigh для рабочих задач по коду и снижать до low-medium, когда гоняешь рутину и важнее скорость. Слово ultrathink грубо соответствует верхней планке — это разовый способ сказать «здесь думай по полной».
Глубина мышления — это ручка громкости, а не выключатель.
Часть 4 · Применение
Главное
Высокая глубина — под сложное и многошаговое: архитектура, неочевидный баг, выбор подхода. На простых правках мышление лишнее — жжёт токены и тормозит ответ.
Чтобы не гадать каждый раз, держи в голове два коротких списка. Глубина окупается, когда:
А вот когда мышление только мешает:
Пример из практики
Агент третий раз подряд предлагает кривое решение бага? Это сигнал поднять глубину — добавь ultrathink к формулировке и опиши симптомы подробнее. Часто именно нехватка рассуждения, а не модели, мешает найти корневую причину. Как правильно описывать баг — в гайде про отладку с Claude Code.
Часть 5 · Деньги
Главное
Мышление биллится как выходные токены и на сложном запросе может съесть десятки тысяч. Контроль — уровень пониже через /effort, отключение в /config или потолок через MAX_THINKING_TOKENS.
Главное про деньги: токены на размышление считаются так же, как токены ответа. На простой задаче с высокой глубиной ты платишь за рассуждение, которое не было нужно. Поэтому контроль расхода — это не про «отключить мышление совсем», а про «давать ровно столько, сколько требует задача».
# Снизить глубину на сессию
/effort low
# Задать жёсткий потолок бюджета мышления (переменная окружения)
export MAX_THINKING_TOKENS=8000
# Полностью настроить поведение мышления
/configПрактичная стратегия: рабочий уровень xhigh на задачи по коду, ultrathink точечно под самое трудное, и low на пачку мелких правок, когда важнее скорость. Если упёрся в лимиты — снижение глубины даёт ощутимую экономию без потери качества на простом.
Когда мышление не нужно
Не держи max по умолчанию «чтобы наверняка». На рутине это просто слив токенов и лишние секунды ожидания. Высокая глубина — под трудную задачу; как только пошла рутина, опускай уровень. Постоянный максимум быстрее съест лимиты, чем поднимет качество.
Коротко
/effort (уровень) или слова think / ultrathink.Вопросы
Расширенное мышление (extended thinking) — это видимое пошаговое рассуждение, которое модель проводит перед ответом. В терминале оно отображается серым курсивом и помогает на сложных задачах: архитектура, поиск неочевидного бага, разбор запутанной логики. За мышление платят токенами как за вывод, поэтому на простых задачах его держат минимальным, а на сложных — повышают.
Самый прямой способ задать глубину рассуждения — команда /effort с уровнем: low, medium, high, xhigh или max. Также в формулировке задачи работают ключевые слова-подсказки: think просит подумать чуть глубже, а ultrathink — рассуждать по максимуму. Для агентного кодинга обычно рекомендуют уровень xhigh. Чем выше уровень — тем дольше и дороже ответ, поэтому поднимай его осознанно.
Расширенное мышление окупается на сложных и многошаговых задачах: проектирование архитектуры, отладка неочевидной ошибки, рефакторинг запутанного кода, выбор между несколькими подходами. На простых правках — переименовать переменную, поправить текст, добавить лог — оно лишнее: только жжёт токены и замедляет ответ. Правило простое: высокая глубина под трудную задачу, низкая под рутину.
Мышление биллится как выходные токены и на сложных запросах может съедать десятки тысяч токенов за раз. Снизить расход можно командой /effort с уровнем пониже, отключением мышления через /config или переменной MAX_THINKING_TOKENS, которая задаёт потолок бюджета на размышление. Подробнее про экономию — в гайде про лимиты Claude Code.
Читать дальше
Прикладной материал, разборы и рабочие приёмы — то, чем пользуюсь сам, без воды. Залетай, там самое полезное.
Зайти в Telegram