Открытый гайд · ИИ-офис

Как не сжечь лимитыClaude Code: экономия токенов

Лимиты упираются не в число сообщений, а в размер контекста. Разберём, почему он раздувается, и соберём конкретные правила экономии — те, что реально работают, без инфоцыганства.

@kir.player
~11 минут
июнь 2026

Знакомая боль: поработал час с Claude Code, и тут — «лимит почти исчерпан». Кажется, что ты ничего такого не делал, пара десятков сообщений. На самом деле дело не в количестве сообщений, а в том, сколько контекста ты таскаешь за собой в каждом запросе. Хорошая новость: расходом можно управлять, и это не магия, а несколько простых привычек.

Что узнаешь из гайда

  • Почему токены жгутся не от сообщений, а от размера контекста
  • Как чистить окно: /clear, /compact, /context
  • Почему узкий контекст экономит больше всего
  • Как подобрать модель под задачу и не переплачивать
  • Что НЕ стоит экономить — честная граница

База · Механика

Почему вообще жгутся токены

Главное

Модель на каждом шаге читает весь контекст целиком: историю чата, прочитанные файлы, вывод команд. Расход растёт от размера этого окна, а не от числа твоих вопросов.

Токен — это кусочек текста (примерно слово или его часть), которым оперирует модель. «Контекст» — это всё, что Claude держит перед глазами: твои сообщения, его ответы, содержимое файлов, которые он прочитал, и вывод команд, которые запустил. Ключевой момент: при каждом новом запросе модель заново «перечитывает» весь накопленный контекст. Поэтому десятое сообщение в длинном чате стоит дороже первого — за ним тянется вся история.

Отсюда главные пожиратели окна: длинная история диалога, чтение больших файлов целиком, вывод многословных команд (логи, дампы), и забытый старый контекст, который уже не нужен, но всё ещё в окне. Когда окно подходит к пределу, Claude Code сам начинает его подчищать — сначала выкидывает старый вывод команд, потом сжимает историю. Но полагаться только на авто-режим — значит терять контроль.

Факт

Команда /context прямо показывает, что занимает твоё окно: сколько съела история, сколько — прочитанные файлы, сколько — CLAUDE.md. Это первое, что стоит набрать, когда расход кажется странным. Чистить вслепую — мимо.


Правило 1 · Главное

Чистить контекст: /clear и /compact

Главное

Самая большая экономия — не таскать лишнее. Новая задача → /clear. Та же задача, но чат раздулся → /compact.

/clear полностью сбрасывает контекст и начинает с чистого листа. Используй его всякий раз, когда переключаешься на задачу, не связанную с предыдущей. Дописал фичу, идёшь чинить баг в другом модуле — /clear. Иначе вся история по фиче поедет с тобой и будет стоить токенов на каждом шаге, не принося пользы.

чат Claude Code
# Закончил одну задачу, переходишь к другой, не связанной —
# полностью сбрасываешь окно:
/clear

# Задача та же, но чат раздулся — сжимаешь историю в summary,
# сохраняя суть (можно с уточнением, что именно беречь):
/compact оставь решения по архитектуре и пути к изменённым файлам

/compact не удаляет историю, а ужимает её в краткий пересказ: модель сама пишет summary того, что было, и продолжает уже с него. Так ты освобождаешь место, но не теряешь нить. Можно подсказать, что беречь при сжатии — прямо в команде или заранее в файле CLAUDE.md отдельным блоком «что сохранять при компакте».

Важно

Не жди, пока упрёшься в лимит. Авто-компакт срабатывает у предела и может выкинуть что-то нужное. Привычка набирать /clear между задачами экономит больше, чем любые ухищрения внутри одного чата. Полный разбор этих и других команд — в гайде про команды Claude Code.

Самый дешёвый токен — это тот, который ты не отправил. Чисти окно между задачами.


Правило 2 · Точность

Давай узкий контекст

Главное

Не вываливай весь репозиторий. Дай Claude конкретные файлы и конкретную задачу — он и ответит точнее, и токенов уйдёт меньше.

Соблазн большой: «прочитай весь проект и пойми, что не так». Но чем больше ты загружаешь в окно, тем дороже каждый шаг и тем больше шума, в котором модель путается. Гораздо эффективнее показать пальцем: «открой вот этот файл и вот этот, проблема в функции X».

  • Указывай файлы явно. «Посмотри src/auth.ts», а не «разберись с авторизацией по всему коду».
  • Дроби большие задачи. Одна задача — один заход — и /clear. Меньше история — дешевле шаги.
  • Не проси читать то, что не нужно. Логи, дампы, гигантские JSON — обрезай до сути перед тем как скормить.
  • Держи проектные правила в CLAUDE.md. Они грузятся один раз и компактно, вместо того чтобы повторять их в каждом сообщении.

Пример

Вместо «почини баг, вот весь проект» — «баг в checkout.ts: при пустой корзине падает на строке 40, вот ошибка». Второй вариант и контекста в разы меньше, и ответ точнее с первого раза, а значит без дорогих повторных заходов.


Правило 3 · Выбор

Модель под задачу

Главное

Не гоняй самую тяжёлую модель на простых задачах. Дефолт — средняя; на сложное рассуждение переключайся осознанно, командой /model.

У Claude несколько моделей: самая мощная (умное рассуждение, разбор архитектуры, но жёстче лимиты и медленнее), средняя-дефолтная (90% задач: обычный код, тексты, разбор) и быстрая-лёгкая (короткие операции, автоматизации). Логика простая: начинай со средней, и только если она не вытягивает — переключайся на тяжёлую и повторяй. Не наоборот.

чат Claude Code
# Посмотреть текущую модель и переключить:
/model

# Дальше выбираешь в списке. Дефолт — средняя модель.
# Тяжёлую включай под конкретную сложную задачу, потом возвращайся.
ЗадачаМодель
Обычный код, тексты, разборСредняя (дефолт)
Сложная архитектура, многошаговая логикаТяжёлая, осознанно
Короткие правки, массовые операцииЛёгкая / быстрая

Когда НЕ экономить

Не пытайся вытянуть сложную задачу лёгкой моделью ради экономии — получишь кривой результат и потратишь больше токенов на переделки. Экономия не в том, чтобы всегда брать слабее, а в том, чтобы брать под задачу. Дешёвый неверный ответ дороже дорогого верного.


Правило 4 · Плотность

Английский, скилы и CLAUDE.md

Главное

Служебный текст (инструкции, описания скилов, доку) держи на английском — он токенизируется плотнее. С тобой Claude всё равно говорит по-русски.

Английский текст бьётся на меньшее число токенов, чем тот же смысл на русском: кириллица «дороже» латиницы при токенизации. На сами ответы это не влияет — экономия идёт на служебном тексте, который грузится в каждую сессию. Поэтому документацию, системные инструкции и поле description в скилах выгоднее писать на английском.

  • Описания скилов — на английском. Как устроен SKILL.md, разбираем в гайде про скилы.
  • CLAUDE.md — короткий и по делу. Он грузится в каждую сессию, так что каждая лишняя строка — налог на весь день работы.
  • Доку и большие справочники — не вставляй в чат, а подключай через MCP. Тогда модель тянет только нужный кусок. Про это — в гайде про MCP-серверы.

Проверяй расход осознанно: /usage в конце сессии (его псевдонимы — /cost и /stats) показывает, на что ушли токены, а /context — что прямо сейчас занимает окно. Сначала смотришь, потом чистишь — а не наугад.

Коротко

  • Токены жгутся от размера контекста, не от числа сообщений.
  • Главное правило: /clear между задачами, /compact когда чат раздулся.
  • Узкий контекст, модель под задачу, служебный текст на английском — складываются в заметную экономию.
  • Смотри /context и /usage, прежде чем чистить.

Вопросы

Частые вопросы

Почему в Claude Code так быстро кончаются лимиты?

Лимиты считаются по токенам контекста, и платишь ты не за один вопрос, а за всё окно целиком на каждом шаге. Длинный чат, прочитанные большие файлы, вывод команд и история диалога раздувают контекст, и каждый следующий запрос пересылает модели всё это заново. Поэтому расход растёт не от числа сообщений, а от размера накопленного контекста.

Что реально экономит токены в Claude Code?

Сильнее всего экономит управление контекстом: /clear между несвязанными задачами и /compact, когда чат раздулся. Дальше — узкий контекст (давать модели только нужные файлы, а не весь репозиторий), правильная модель под задачу и инструкции на английском. Команда /context показывает, что именно занимает окно, чтобы чистить осознанно.

Правда ли, что инструкции на английском экономят токены?

Да, английский текст токенизируется плотнее русского — на тот же смысл уходит меньше токенов. Кириллица часто бьётся на больше токенов, чем латиница, поэтому документацию, описания скилов и системные инструкции выгоднее держать на английском. На сами ответы это не влияет: с тобой Claude может говорить по-русски, экономия идёт на служебном тексте.

Когда использовать /clear, а когда /compact?

/clear полностью сбрасывает контекст — это для перехода к новой, не связанной с предыдущей задаче. /compact сжимает историю в краткое summary, сохраняя суть — когда задача та же, но чат раздулся. Если сомневаешься и задачи разные — /clear, он дешевле по контексту.

Читать дальше

Соседние гайды

ИИ-офис · сообщество
Разбирайся с Claude Code не в одиночку

В Telegram-канале ИИ-офиса разбираем рабочие связки, экономию лимитов и живые кейсы вайбкодеров. Спросил утром — к вечеру получил рабочее решение, а не теорию из обзоров.

Зайти в Telegram ИИ-офиса

А готовые навыки для Claude Code — в маркетплейсе скилов.