Вайб-кодинг

Как сэкономить токены в Claude Code: 4 проверенные стратегии

Четыре стратегии от простых привычек до специализированных инструментов. Комбинируйте их под задачу и сокращайте расход токенов на 70–87%.

4 стратегии экономии токенов в Claude Code

Ключевые цифры

📉

70%

сокращение токенов Code Graph (TypeScript 10k)

💰

33%

снижение стоимости с индексированием

⚡

80%

экономия RTK на команде grep (16k → 3.2k)

✂️

87%

сжатие ответов Cavman на отладке React

Почему экономия токенов — это не просто скупость

В Claude Code вы платите за каждый токен — входящий и исходящий. Обычно основной выигрыш ищут в промптах: сделаем инструкцию короче, сбережём токены. Но видео показывает другое: основной выигрыш дают не промпты, а специальные инструменты.

Почему это важно? Потому что контекстное окно имеет физический размер. Чем дольше вы работаете в Claude Code, тем больше растёт история диалога. История — это входящие токены для КАЖДОГО следующего запроса. При плохой оптимизации история раздувается, и вы попадаете в ловушку: каждый новый запрос становится дороже предыдущего.

Четыре стратегии работают на разных уровнях:

Code Graph — сокращает обращения к файлам (меньше сканирования, меньше токенов на чтение)
RTK — сжимает вывод команд (меньше данных за одно обращение)
Cavman — сокращает ответы Claude (меньше раздувания истории)
Встроенные инструменты — чистят контекст явно и переключают модели под задачу

Комбинируя эти четыре, вы можете сократить расход на 70–87% в зависимости от проекта.

Стратегия 1: Code Graph — индексирование как оружие против поиска

Представьте себе проект с 10 000 файлов TypeScript. Когда Claude Code не знает, где искать, он запускает цепочку команд: grep, glob, read — по разным местам кода. Каждая команда — это вывод, который попадает в токены. Для поиска одного символа может потребоваться отправить десятки килобайт текста.

Как работает Code Graph:

Вместо поиска по файлам инструмент создаёт заранее индекс — локальную базу данных символов, вызовов функций, импортов. Это как индекс в конце книги: вместо прочтения всех 500 страниц вы смотрите одну строку в индексе и сразу прыгаете на нужную страницу.

Результаты на реальных проектах:

TypeScript (10 000 файлов): 70% сокращение входящих токенов, 33% экономия стоимости
Python (3 000 файлов): 70% сокращение, 23% экономия стоимости
В среднем: 57% входящих токенов, 25% общей стоимости

Нюансы и компромиссы:

График нужно обновлять вручную командой sn при каждом значительном изменении в коде. Забыли обновить — получили устаревший индекс.
Code Graph может пропускать контекст из соседних claude.md файлов, которые важны для понимания архитектуры.
Есть альтернативы с автоматической синхронизацией, но они требуют более сложной настройки.

Когда использовать: Большие проекты (1000+ файлов), долгие сессии, когда поиск по коду занимает половину токенов.

Стратегия 2: RTK Token Killer — сжимайте вывод команд

RTK — это инструмент, который встраивается между вашей bash-командой и Claude Code. Он ловит вывод (output) команды, применяет фильтры и отправляет сжатую версию обратно.

Как работает на практике:

Вы вводите grep -r "error" . в большом проекте. Обычно это выдаёт 16 000 токенов (сотни совпадений, каждое на своей строке). RTK перехватывает этот вывод, группирует строки, убирает повторения, обрезает лишние детали — и отправляет Claude только существенное: 3 200 токенов.

Реальная экономия:

grep/rg: 80% сокращение (16k → 3.2k токенов)
cat: 70% сокращение (40k → 12k токенов)
За 30 минут сессии: 80% экономии в целом (с 11k до 2.4k входящих за запрос)

Компромисс — потеря данных:

При сжатии информация теряется. Для отладки, где важен каждый лог-файл, тонкий формат вывода, каждое сообщение об ошибке, RTK может быть помехой. Инструмент имеет режимы: можно его отключить на время отладки и снова включить после.

Когда использовать: Навигация по коду, быстрые изменения, когда полный вывод не критичен. Отключайте при серьёзной отладке.

Стратегия 3: Cavman — сокращайте ответы Claude

Это самая неочевидная стратегия. Каждый ответ, который Claude Code даёт вам, попадает в историю диалога. А история потом отправляется обратно в модель для следующего запроса. Значит, с каждым ответом вы платите дважды: один раз когда Claude отвечает, второй раз — когда его ответ становится входящим токеном для следующего запроса.

Cavman заставляет Claude говорить короче без потери смысла.

Пример из видео:

Обычный ответ: «Проблема в том, что вы создаёте новую ссылку при каждом рендере компонента. React видит новую ссылку и считает, что props изменился. Оберните её в useMemo, чтобы ссылка оставалась одной и той же между рендерами.» — 69 токенов.
С Cavman: «Новая ссылка при каждом рендере → оберни в useMemo» — 19 токенов.

Режимы сжатия:

light — убирает лишние слова, сохраняет структуру
ultra — телеграфный стиль, почти как заголовки (рекомендуется для рутинных задач)
Есть локализованные режимы для классического и китайского языков

Результаты на реальных задачах:

Отладка бага в React: 87% сокращение ответов
Фикс авторизации: 83% сокращение
В среднем: 65% сокращения исходящих токенов

Компромисс — потеря контекста:

Меньше слов = меньше объяснений. Для сложного планирования, архитектурных решений, где нужны подробные обоснования, Cavman не подойдёт. Используйте его для рутинных фиксов, баг-фиксов, простых навигаций по коду.

Стратегия 4: Встроенные инструменты Claude Code

Четвёртая стратегия не требует установки дополнительных программ. Это встроенные возможности Claude Code, которые просто не используют.

1. Команда context — аудит того, что занимает место

Выведите context и увидите разбор по категориям: какие файлы, какие MCP-серверы, какие claude.md занимают токены. Часто находят неиспользуемые большие файлы конфигурации, древние MCP-серверы, которые подключены, но не работают. Удалите лишнее — мгновенно освободите сотни или тысячи токенов.

2. Команда clear — очищайте контекст между задачами

Не тащите историю от одной задачи в новую сессию. После завершения проекта введите clear — контекст начнётся с чистого листа. Это сокращает раздувание истории на 40–60% для долгих сессий.

3. Переключение моделей под задачу

Используйте правильную модель для правильной работы:

haiku — дешёвая модель для навигации и простых изменений (чтение файла, маленький баг-фикс)
sonnet — «золотой стандарт» для средних задач (архитектурные обсуждения, больших баг-фиксы)
opus — только для сложного планирования и архитектуры (не экономьте на opus для действительно сложных задач — он стоит дороже, но даёт решение за один проход вместо трёх)

4. Режим планирования для больших задач

Нажмите Shift перед вводом большой задачи. Claude автоматически составит план дешёвой моделью (haiku), а дорогие модели потом просто выполнят его. План — это дешевле, чем повторные сканирования кода.

Как комбинировать стратегии: матрица для разных задач

Каждая стратегия имеет компромисс. Для максимальной экономии нужно комбинировать их, но не все вместе и не всегда.

Для быстрого баг-фикса (15–30 минут):

Используйте haiku
Включите RTK
Включите Cavman на режиме light
Code Graph необязателен (если только не большой проект)

Для архитектурного планирования больших изменений:

Используйте Shift + план (режим планирования)
Переключитесь на sonnet для выполнения
Отключите Cavman (нужны подробные объяснения)
RTK на режиме light
Code Graph обязателен, если проект 1000+ файлов

Для долгой сессии 4+ часа (исследование архитектуры, рефакторинг):

Запустите Code Graph в начале
RTK включите везде
Cavman на ultra
После 2 часов используйте clear, чтобы очистить историю
Переключайтесь между моделями: haiku для поиска, sonnet для написания

Главный принцип: управляемый расход = осознанный выбор. Вы знаете, какие инструменты включены и почему. Хаотичная архитектура проекта, плохая структура папок, огромные файлы конфигурации — это заставляет Claude ходить по кругу и тратить токены впустую. Чистая структура экономит не только токены, но и время разработки.

Вопросы и ответы

Code Graph нужен обновлять каждый раз при правке кода?

Нет, но вручную. После значительных изменений архитектуры введите команду `sn` для обновления индекса. Если забыли — граф станет устаревшим и может пропустить новые функции. Есть альтернативы с автоматической синхронизацией, но они сложнее в настройке.

Cavman в режиме ultra — не потеряю ли я важные детали при отладке?

Для рутинных задач (простые фиксы, навигация) ultra отлично работает. Но для сложной отладки, где нужны логи целиком и подробные объяснения, переключитесь на режим light или отключите Cavman. Это выбор между скоростью и полнотой информации.

Что будет, если включить все четыре стратегии сразу?

Не всегда хорошо. RTK + Cavman на ultra + Code Graph дадут минимум токенов, но потеряете контекст и точность. Комбинируйте в зависимости от задачи. Для быстрых фиксов — максимум оптимизации. Для сложного планирования — отключайте RTK и Cavman, используйте только Code Graph и переключение моделей.

Я работаю в маленьком проекте (500 файлов). Code Graph нужен?

Нет, скорее всего, не нужен. Code Graph эффективен на больших проектах (1000+ файлов), где поиск занимает основной расход. На 500 файлах поиск и так быстрый. Начните с RTK и Cavman, попробуйте Code Graph позже, если поиск замедлится.

Главное

✨ Ключевая идея

Основной выигрыш в экономии токенов дают не промпты, а специализированные инструменты и встроенные команды. Комбинируя Code Graph (индексирование), RTK (сжатие вывода), Cavman (короткие ответы) и встроенные инструменты (context, clear, переключение моделей), можно сокращать расход на 70–87%. Главное — не применять все одновременно, а выбирать под конкретную задачу.