Как сэкономить токены в Claude Code: 4 проверенные стратегии
Четыре стратегии от простых привычек до специализированных инструментов. Комбинируйте их под задачу и сокращайте расход токенов на 70–87%.
Ключевые цифры
Почему экономия токенов — это не просто скупость
В Claude Code вы платите за каждый токен — входящий и исходящий. Обычно основной выигрыш ищут в промптах: сделаем инструкцию короче, сбережём токены. Но видео показывает другое: основной выигрыш дают не промпты, а специальные инструменты.
Почему это важно? Потому что контекстное окно имеет физический размер. Чем дольше вы работаете в Claude Code, тем больше растёт история диалога. История — это входящие токены для КАЖДОГО следующего запроса. При плохой оптимизации история раздувается, и вы попадаете в ловушку: каждый новый запрос становится дороже предыдущего.
Четыре стратегии работают на разных уровнях:
- Code Graph — сокращает обращения к файлам (меньше сканирования, меньше токенов на чтение)
- RTK — сжимает вывод команд (меньше данных за одно обращение)
- Cavman — сокращает ответы Claude (меньше раздувания истории)
- Встроенные инструменты — чистят контекст явно и переключают модели под задачу
Комбинируя эти четыре, вы можете сократить расход на 70–87% в зависимости от проекта.
Стратегия 1: Code Graph — индексирование как оружие против поиска
Представьте себе проект с 10 000 файлов TypeScript. Когда Claude Code не знает, где искать, он запускает цепочку команд: grep, glob, read — по разным местам кода. Каждая команда — это вывод, который попадает в токены. Для поиска одного символа может потребоваться отправить десятки килобайт текста.
Как работает Code Graph:
Вместо поиска по файлам инструмент создаёт заранее индекс — локальную базу данных символов, вызовов функций, импортов. Это как индекс в конце книги: вместо прочтения всех 500 страниц вы смотрите одну строку в индексе и сразу прыгаете на нужную страницу.
Результаты на реальных проектах:
- TypeScript (10 000 файлов): 70% сокращение входящих токенов, 33% экономия стоимости
- Python (3 000 файлов): 70% сокращение, 23% экономия стоимости
- В среднем: 57% входящих токенов, 25% общей стоимости
Нюансы и компромиссы:
- График нужно обновлять вручную командой
snпри каждом значительном изменении в коде. Забыли обновить — получили устаревший индекс. - Code Graph может пропускать контекст из соседних
claude.mdфайлов, которые важны для понимания архитектуры. - Есть альтернативы с автоматической синхронизацией, но они требуют более сложной настройки.
Когда использовать: Большие проекты (1000+ файлов), долгие сессии, когда поиск по коду занимает половину токенов.
Стратегия 2: RTK Token Killer — сжимайте вывод команд
RTK — это инструмент, который встраивается между вашей bash-командой и Claude Code. Он ловит вывод (output) команды, применяет фильтры и отправляет сжатую версию обратно.
Как работает на практике:
Вы вводите grep -r "error" . в большом проекте. Обычно это выдаёт 16 000 токенов (сотни совпадений, каждое на своей строке). RTK перехватывает этот вывод, группирует строки, убирает повторения, обрезает лишние детали — и отправляет Claude только существенное: 3 200 токенов.
Реальная экономия:
grep/rg: 80% сокращение (16k → 3.2k токенов)cat: 70% сокращение (40k → 12k токенов)- За 30 минут сессии: 80% экономии в целом (с 11k до 2.4k входящих за запрос)
Компромисс — потеря данных:
При сжатии информация теряется. Для отладки, где важен каждый лог-файл, тонкий формат вывода, каждое сообщение об ошибке, RTK может быть помехой. Инструмент имеет режимы: можно его отключить на время отладки и снова включить после.
Когда использовать: Навигация по коду, быстрые изменения, когда полный вывод не критичен. Отключайте при серьёзной отладке.
Стратегия 3: Cavman — сокращайте ответы Claude
Это самая неочевидная стратегия. Каждый ответ, который Claude Code даёт вам, попадает в историю диалога. А история потом отправляется обратно в модель для следующего запроса. Значит, с каждым ответом вы платите дважды: один раз когда Claude отвечает, второй раз — когда его ответ становится входящим токеном для следующего запроса.
Cavman заставляет Claude говорить короче без потери смысла.
Пример из видео:
- Обычный ответ: «Проблема в том, что вы создаёте новую ссылку при каждом рендере компонента. React видит новую ссылку и считает, что props изменился. Оберните её в useMemo, чтобы ссылка оставалась одной и той же между рендерами.» — 69 токенов.
- С Cavman: «Новая ссылка при каждом рендере → оберни в useMemo» — 19 токенов.
Режимы сжатия:
light— убирает лишние слова, сохраняет структуруultra— телеграфный стиль, почти как заголовки (рекомендуется для рутинных задач)- Есть локализованные режимы для классического и китайского языков
Результаты на реальных задачах:
- Отладка бага в React: 87% сокращение ответов
- Фикс авторизации: 83% сокращение
- В среднем: 65% сокращения исходящих токенов
Компромисс — потеря контекста:
Меньше слов = меньше объяснений. Для сложного планирования, архитектурных решений, где нужны подробные обоснования, Cavman не подойдёт. Используйте его для рутинных фиксов, баг-фиксов, простых навигаций по коду.
Стратегия 4: Встроенные инструменты Claude Code
Четвёртая стратегия не требует установки дополнительных программ. Это встроенные возможности Claude Code, которые просто не используют.
1. Команда context — аудит того, что занимает место
Выведите context и увидите разбор по категориям: какие файлы, какие MCP-серверы, какие claude.md занимают токены. Часто находят неиспользуемые большие файлы конфигурации, древние MCP-серверы, которые подключены, но не работают. Удалите лишнее — мгновенно освободите сотни или тысячи токенов.
2. Команда clear — очищайте контекст между задачами
Не тащите историю от одной задачи в новую сессию. После завершения проекта введите clear — контекст начнётся с чистого листа. Это сокращает раздувание истории на 40–60% для долгих сессий.
3. Переключение моделей под задачу
Используйте правильную модель для правильной работы:
haiku— дешёвая модель для навигации и простых изменений (чтение файла, маленький баг-фикс)sonnet— «золотой стандарт» для средних задач (архитектурные обсуждения, больших баг-фиксы)opus— только для сложного планирования и архитектуры (не экономьте на opus для действительно сложных задач — он стоит дороже, но даёт решение за один проход вместо трёх)
4. Режим планирования для больших задач
Нажмите Shift перед вводом большой задачи. Claude автоматически составит план дешёвой моделью (haiku), а дорогие модели потом просто выполнят его. План — это дешевле, чем повторные сканирования кода.
Как комбинировать стратегии: матрица для разных задач
Каждая стратегия имеет компромисс. Для максимальной экономии нужно комбинировать их, но не все вместе и не всегда.
Для быстрого баг-фикса (15–30 минут):
- Используйте
haiku - Включите RTK
- Включите Cavman на режиме
light - Code Graph необязателен (если только не большой проект)
Для архитектурного планирования больших изменений:
- Используйте Shift + план (режим планирования)
- Переключитесь на
sonnetдля выполнения - Отключите Cavman (нужны подробные объяснения)
- RTK на режиме
light - Code Graph обязателен, если проект 1000+ файлов
Для долгой сессии 4+ часа (исследование архитектуры, рефакторинг):
- Запустите Code Graph в начале
- RTK включите везде
- Cavman на
ultra - После 2 часов используйте
clear, чтобы очистить историю - Переключайтесь между моделями:
haikuдля поиска,sonnetдля написания
Главный принцип: управляемый расход = осознанный выбор. Вы знаете, какие инструменты включены и почему. Хаотичная архитектура проекта, плохая структура папок, огромные файлы конфигурации — это заставляет Claude ходить по кругу и тратить токены впустую. Чистая структура экономит не только токены, но и время разработки.
Вопросы и ответы
Нет, но вручную. После значительных изменений архитектуры введите команду `sn` для обновления индекса. Если забыли — граф станет устаревшим и может пропустить новые функции. Есть альтернативы с автоматической синхронизацией, но они сложнее в настройке.
Для рутинных задач (простые фиксы, навигация) ultra отлично работает. Но для сложной отладки, где нужны логи целиком и подробные объяснения, переключитесь на режим light или отключите Cavman. Это выбор между скоростью и полнотой информации.
Не всегда хорошо. RTK + Cavman на ultra + Code Graph дадут минимум токенов, но потеряете контекст и точность. Комбинируйте в зависимости от задачи. Для быстрых фиксов — максимум оптимизации. Для сложного планирования — отключайте RTK и Cavman, используйте только Code Graph и переключение моделей.
Нет, скорее всего, не нужен. Code Graph эффективен на больших проектах (1000+ файлов), где поиск занимает основной расход. На 500 файлах поиск и так быстрый. Начните с RTK и Cavman, попробуйте Code Graph позже, если поиск замедлится.
Главное
Основной выигрыш в экономии токенов дают не промпты, а специализированные инструменты и встроенные команды. Комбинируя Code Graph (индексирование), RTK (сжатие вывода), Cavman (короткие ответы) и встроенные инструменты (context, clear, переключение моделей), можно сокращать расход на 70–87%. Главное — не применять все одновременно, а выбирать под конкретную задачу.