Лимиты упираются не в число сообщений, а в размер контекста. Разберём, почему он раздувается, и соберём конкретные правила экономии — те, что реально работают, без инфоцыганства.
Знакомая боль: поработал час с Claude Code, и тут — «лимит почти исчерпан». Кажется, что ты ничего такого не делал, пара десятков сообщений. На самом деле дело не в количестве сообщений, а в том, сколько контекста ты таскаешь за собой в каждом запросе. Хорошая новость: расходом можно управлять, и это не магия, а несколько простых привычек.
Что узнаешь из гайда
/clear, /compact, /contextБаза · Механика
Главное
Модель на каждом шаге читает весь контекст целиком: историю чата, прочитанные файлы, вывод команд. Расход растёт от размера этого окна, а не от числа твоих вопросов.
Токен — это кусочек текста (примерно слово или его часть), которым оперирует модель. «Контекст» — это всё, что Claude держит перед глазами: твои сообщения, его ответы, содержимое файлов, которые он прочитал, и вывод команд, которые запустил. Ключевой момент: при каждом новом запросе модель заново «перечитывает» весь накопленный контекст. Поэтому десятое сообщение в длинном чате стоит дороже первого — за ним тянется вся история.
Отсюда главные пожиратели окна: длинная история диалога, чтение больших файлов целиком, вывод многословных команд (логи, дампы), и забытый старый контекст, который уже не нужен, но всё ещё в окне. Когда окно подходит к пределу, Claude Code сам начинает его подчищать — сначала выкидывает старый вывод команд, потом сжимает историю. Но полагаться только на авто-режим — значит терять контроль.
Факт
Команда /context прямо показывает, что занимает твоё окно: сколько съела история, сколько — прочитанные файлы, сколько — CLAUDE.md. Это первое, что стоит набрать, когда расход кажется странным. Чистить вслепую — мимо.
Правило 1 · Главное
Главное
Самая большая экономия — не таскать лишнее. Новая задача → /clear. Та же задача, но чат раздулся → /compact.
/clear полностью сбрасывает контекст и начинает с чистого листа. Используй его всякий раз, когда переключаешься на задачу, не связанную с предыдущей. Дописал фичу, идёшь чинить баг в другом модуле — /clear. Иначе вся история по фиче поедет с тобой и будет стоить токенов на каждом шаге, не принося пользы.
# Закончил одну задачу, переходишь к другой, не связанной —
# полностью сбрасываешь окно:
/clear
# Задача та же, но чат раздулся — сжимаешь историю в summary,
# сохраняя суть (можно с уточнением, что именно беречь):
/compact оставь решения по архитектуре и пути к изменённым файлам/compact не удаляет историю, а ужимает её в краткий пересказ: модель сама пишет summary того, что было, и продолжает уже с него. Так ты освобождаешь место, но не теряешь нить. Можно подсказать, что беречь при сжатии — прямо в команде или заранее в файле CLAUDE.md отдельным блоком «что сохранять при компакте».
Важно
Не жди, пока упрёшься в лимит. Авто-компакт срабатывает у предела и может выкинуть что-то нужное. Привычка набирать /clear между задачами экономит больше, чем любые ухищрения внутри одного чата. Полный разбор этих и других команд — в гайде про команды Claude Code.
Самый дешёвый токен — это тот, который ты не отправил. Чисти окно между задачами.
Правило 2 · Точность
Главное
Не вываливай весь репозиторий. Дай Claude конкретные файлы и конкретную задачу — он и ответит точнее, и токенов уйдёт меньше.
Соблазн большой: «прочитай весь проект и пойми, что не так». Но чем больше ты загружаешь в окно, тем дороже каждый шаг и тем больше шума, в котором модель путается. Гораздо эффективнее показать пальцем: «открой вот этот файл и вот этот, проблема в функции X».
src/auth.ts», а не «разберись с авторизацией по всему коду»./clear. Меньше история — дешевле шаги.Пример
Вместо «почини баг, вот весь проект» — «баг в checkout.ts: при пустой корзине падает на строке 40, вот ошибка». Второй вариант и контекста в разы меньше, и ответ точнее с первого раза, а значит без дорогих повторных заходов.
Правило 3 · Выбор
Главное
Не гоняй самую тяжёлую модель на простых задачах. Дефолт — средняя; на сложное рассуждение переключайся осознанно, командой /model.
У Claude несколько моделей: самая мощная (умное рассуждение, разбор архитектуры, но жёстче лимиты и медленнее), средняя-дефолтная (90% задач: обычный код, тексты, разбор) и быстрая-лёгкая (короткие операции, автоматизации). Логика простая: начинай со средней, и только если она не вытягивает — переключайся на тяжёлую и повторяй. Не наоборот.
# Посмотреть текущую модель и переключить:
/model
# Дальше выбираешь в списке. Дефолт — средняя модель.
# Тяжёлую включай под конкретную сложную задачу, потом возвращайся.| Задача | Модель |
|---|---|
| Обычный код, тексты, разбор | Средняя (дефолт) |
| Сложная архитектура, многошаговая логика | Тяжёлая, осознанно |
| Короткие правки, массовые операции | Лёгкая / быстрая |
Когда НЕ экономить
Не пытайся вытянуть сложную задачу лёгкой моделью ради экономии — получишь кривой результат и потратишь больше токенов на переделки. Экономия не в том, чтобы всегда брать слабее, а в том, чтобы брать под задачу. Дешёвый неверный ответ дороже дорогого верного.
Правило 4 · Плотность
Главное
Служебный текст (инструкции, описания скилов, доку) держи на английском — он токенизируется плотнее. С тобой Claude всё равно говорит по-русски.
Английский текст бьётся на меньшее число токенов, чем тот же смысл на русском: кириллица «дороже» латиницы при токенизации. На сами ответы это не влияет — экономия идёт на служебном тексте, который грузится в каждую сессию. Поэтому документацию, системные инструкции и поле description в скилах выгоднее писать на английском.
SKILL.md, разбираем в гайде про скилы.Проверяй расход осознанно: /usage в конце сессии (его псевдонимы — /cost и /stats) показывает, на что ушли токены, а /context — что прямо сейчас занимает окно. Сначала смотришь, потом чистишь — а не наугад.
Коротко
/clear между задачами, /compact когда чат раздулся./context и /usage, прежде чем чистить.Вопросы
Лимиты считаются по токенам контекста, и платишь ты не за один вопрос, а за всё окно целиком на каждом шаге. Длинный чат, прочитанные большие файлы, вывод команд и история диалога раздувают контекст, и каждый следующий запрос пересылает модели всё это заново. Поэтому расход растёт не от числа сообщений, а от размера накопленного контекста.
Сильнее всего экономит управление контекстом: /clear между несвязанными задачами и /compact, когда чат раздулся. Дальше — узкий контекст (давать модели только нужные файлы, а не весь репозиторий), правильная модель под задачу и инструкции на английском. Команда /context показывает, что именно занимает окно, чтобы чистить осознанно.
Да, английский текст токенизируется плотнее русского — на тот же смысл уходит меньше токенов. Кириллица часто бьётся на больше токенов, чем латиница, поэтому документацию, описания скилов и системные инструкции выгоднее держать на английском. На сами ответы это не влияет: с тобой Claude может говорить по-русски, экономия идёт на служебном тексте.
/clear полностью сбрасывает контекст — это для перехода к новой, не связанной с предыдущей задаче. /compact сжимает историю в краткое summary, сохраняя суть — когда задача та же, но чат раздулся. Если сомневаешься и задачи разные — /clear, он дешевле по контексту.
Читать дальше
В Telegram-канале ИИ-офиса разбираем рабочие связки, экономию лимитов и живые кейсы вайбкодеров. Спросил утром — к вечеру получил рабочее решение, а не теорию из обзоров.
Зайти в Telegram ИИ-офисаА готовые навыки для Claude Code — в маркетплейсе скилов.