Открытый гайд · ИИ-офис

Расширенное мышлениев Claude Code

У модели есть режим, в котором она думает дольше перед ответом — и заметно лучше решает трудные задачи. Разберём, что такое extended thinking, как включать через /effort, think и ultrathink, и когда это лишнее.

@kir.player
~11 минут
июнь 2026

Иногда Claude отвечает мгновенно, а иногда — после паузы, во время которой в терминале бежит серый курсив с его рассуждениями. Эта пауза и есть расширенное мышление: модель не выпаливает первый ответ, а сначала разбирает задачу по шагам. На простой правке это не нужно, а на сложной — разница между рабочим решением и мусором. Управлять этим можно, и в этом гайде разберём как.

Что узнаешь из гайда

  • Что такое расширенное мышление и зачем оно нужно
  • Как включать: /effort, ключевые слова think и ultrathink
  • Уровни глубины — от low до max — и что выбрать
  • Когда мышление окупается, а когда жжёт токены впустую
  • Как контролировать расход: бюджет токенов и отключение

Часть 1 · Понятие

Что такое расширенное мышление

Главное

Расширенное мышление — это видимое пошаговое рассуждение модели перед ответом. В терминале оно идёт серым курсивом. Дороже и дольше обычного ответа, но на сложных задачах заметно точнее.

Расшифруем. По-английски это extended thinking — «расширенное (углублённое) размышление». Обычно модель отвечает сразу: прочитала запрос — выдала результат. В режиме мышления она вставляет между запросом и ответом фазу рассуждения: разбивает задачу, проверяет варианты, отлавливает противоречия. Эти мысли видно прямо в терминале — серым курсивом, перед самим ответом.

Зачем это нужно. Чем труднее задача, тем выше шанс, что «ответ с ходу» окажется поверхностным или просто неверным. Пауза на рассуждение даёт модели разложить проблему и прийти к решению, до которого она бы не дошла мгновенным ответом. Цена — время и токены: за мысли платят так же, как за обычный вывод. Поэтому мышление — это инструмент под сложное, а не режим «всегда включено».

Важно

Не путай мышление с план-режимом. Мышление — это внутреннее рассуждение модели перед любым ответом. План-режим — отдельный режим, где агент строит план и не трогает файлы, пока ты не утвердишь. Их можно сочетать. Про второе — отдельный гайд про план-режим.


Часть 2 · Включение

Как включить: /effort, think, ultrathink

Главное

Два способа. Точный — команда /effort с уровнем. Быстрый — ключевые слова прямо в задаче: think просит подумать глубже, ultrathink — рассуждать по максимуму.

Самый надёжный способ управлять глубиной — команда /effort. Она задаёт уровень усилия на рассуждение и действует на всю сессию, пока ты его не сменишь:

чат Claude Code · уровень мышления
# Задать уровень мышления на сессию (рекомендуют xhigh для кодинга)
/effort xhigh

# Без аргумента — откроется слайдер для выбора уровня
/effort

Второй способ — ключевые слова прямо в тексте задачи. Они работают как подсказка модели «здесь стоит подумать подольше». Слово think просит рассуждения чуть глубже обычного, а ultrathink — по максимуму:

чат Claude Code · ключевые слова
# Лёгкий толчок к рассуждению
> think: как лучше разбить этот модуль на части?

# Максимальная глубина для трудной задачи
> ultrathink: спроектируй схему БД под мультиарендность,
> учти изоляцию данных и миграции

Разница между способами простая. /effort — это «настройка на сессию», она держится, пока не сменишь. Ключевые слова — «разовый толчок» под конкретную задачу. На практике удобно поставить рабочий уровень через /effort, а ultrathink доставать точечно, когда попалась особенно зубодробительная задача.


Часть 3 · Уровни

Уровни глубины: от low до max

Главное

Уровней несколько — от low (минимум мыслей, быстрые ответы) до max (максимум усилия). Для агентного кодинга в Claude Code обычно советуют xhigh как рабочую середину-плюс.

Каждый уровень — это компромисс «глубина против скорости и денег». Вот ориентир, под что какой уместен:

УровеньГлубинаПод что
lowМинимум, быстроПростые правки, поиск файла
mediumУмереннаяОбычные задачи кодинга
highГлубокаяСложная логика, отладка
xhighРасширеннаяКодинг и агентные задачи
maxМаксимумСамое трудное, не жалко токенов

Универсального ответа «какой уровень всегда» нет, но есть разумный дефолт: поставить xhigh для рабочих задач по коду и снижать до low-medium, когда гоняешь рутину и важнее скорость. Слово ultrathink грубо соответствует верхней планке — это разовый способ сказать «здесь думай по полной».

Глубина мышления — это ручка громкости, а не выключатель.


Часть 4 · Применение

Когда включать, а когда не стоит

Главное

Высокая глубина — под сложное и многошаговое: архитектура, неочевидный баг, выбор подхода. На простых правках мышление лишнее — жжёт токены и тормозит ответ.

Чтобы не гадать каждый раз, держи в голове два коротких списка. Глубина окупается, когда:

  • проектируешь архитектуру или схему данных с нуля;
  • ищешь неочевидную причину бага, который воспроизводится не сразу;
  • рефакторишь запутанный код, где легко сломать соседнее;
  • выбираешь между несколькими подходами и нужны аргументы за и против.

А вот когда мышление только мешает:

  • переименовать переменную или поправить опечатку;
  • добавить лог, импорт, простую строчку;
  • повторить однотипное действие, которое агент уже делал;
  • любая задача, где ответ очевиден и проверяется глазами за секунду.

Пример из практики

Агент третий раз подряд предлагает кривое решение бага? Это сигнал поднять глубину — добавь ultrathink к формулировке и опиши симптомы подробнее. Часто именно нехватка рассуждения, а не модели, мешает найти корневую причину. Как правильно описывать баг — в гайде про отладку с Claude Code.


Часть 5 · Деньги

Цена мышления и как её контролировать

Главное

Мышление биллится как выходные токены и на сложном запросе может съесть десятки тысяч. Контроль — уровень пониже через /effort, отключение в /config или потолок через MAX_THINKING_TOKENS.

Главное про деньги: токены на размышление считаются так же, как токены ответа. На простой задаче с высокой глубиной ты платишь за рассуждение, которое не было нужно. Поэтому контроль расхода — это не про «отключить мышление совсем», а про «давать ровно столько, сколько требует задача».

терминал / чат · ограничение мышления
# Снизить глубину на сессию
/effort low

# Задать жёсткий потолок бюджета мышления (переменная окружения)
export MAX_THINKING_TOKENS=8000

# Полностью настроить поведение мышления
/config

Практичная стратегия: рабочий уровень xhigh на задачи по коду, ultrathink точечно под самое трудное, и low на пачку мелких правок, когда важнее скорость. Если упёрся в лимиты — снижение глубины даёт ощутимую экономию без потери качества на простом.

Когда мышление не нужно

Не держи max по умолчанию «чтобы наверняка». На рутине это просто слив токенов и лишние секунды ожидания. Высокая глубина — под трудную задачу; как только пошла рутина, опускай уровень. Постоянный максимум быстрее съест лимиты, чем поднимет качество.

Коротко

  • Мышление — видимое рассуждение перед ответом, серый курсив в терминале.
  • Включать через /effort (уровень) или слова think / ultrathink.
  • Высокая глубина — под сложное; на рутине снижай уровень, токены не бесплатны.

Вопросы

Частые вопросы

Что такое расширенное мышление в Claude Code?

Расширенное мышление (extended thinking) — это видимое пошаговое рассуждение, которое модель проводит перед ответом. В терминале оно отображается серым курсивом и помогает на сложных задачах: архитектура, поиск неочевидного бага, разбор запутанной логики. За мышление платят токенами как за вывод, поэтому на простых задачах его держат минимальным, а на сложных — повышают.

Как включить think и ultrathink в Claude Code?

Самый прямой способ задать глубину рассуждения — команда /effort с уровнем: low, medium, high, xhigh или max. Также в формулировке задачи работают ключевые слова-подсказки: think просит подумать чуть глубже, а ultrathink — рассуждать по максимуму. Для агентного кодинга обычно рекомендуют уровень xhigh. Чем выше уровень — тем дольше и дороже ответ, поэтому поднимай его осознанно.

Когда стоит включать расширенное мышление?

Расширенное мышление окупается на сложных и многошаговых задачах: проектирование архитектуры, отладка неочевидной ошибки, рефакторинг запутанного кода, выбор между несколькими подходами. На простых правках — переименовать переменную, поправить текст, добавить лог — оно лишнее: только жжёт токены и замедляет ответ. Правило простое: высокая глубина под трудную задачу, низкая под рутину.

Сколько токенов тратит расширенное мышление и как ограничить?

Мышление биллится как выходные токены и на сложных запросах может съедать десятки тысяч токенов за раз. Снизить расход можно командой /effort с уровнем пониже, отключением мышления через /config или переменной MAX_THINKING_TOKENS, которая задаёт потолок бюджета на размышление. Подробнее про экономию — в гайде про лимиты Claude Code.

Читать дальше

Соседние гайды

Telegram про вайбкодинг и ИИ

Прикладной материал, разборы и рабочие приёмы — то, чем пользуюсь сам, без воды. Залетай, там самое полезное.

Зайти в Telegram