ИИ-гайды

Harness: почему обвязка важнее самой AI-модели

Разбор от редакции «ИИ для чайников» · Обновлено 17 июня 2026

💡 О чём гайд
Harness — это набор правил, инструментов, памяти, проверок и циклов, оборачивающих AI-модель и превращающих её из текстового процессора в автономного агента. Одна и та же модель в разных харнесах показывает разницу в результативности в десятки раз: с 6,7% до 68% решённых задач. Инженерия харнесов (Harness Engineering) стала новой парадигмой в 2025 году, вытеснив промт-инжиниринг и контекст-инжиниринг.

📢 Больше разборов — в канале «ИИ для чайников»

📄 Скачать гайд (PDF) 📢 Канал ИИ для чайников

Одна модель в разных харнесах: 6,7% → 68% качества (разница 10x)

Смена харнеса без смены модели: +7,7 п.п. качества, −4x токены (Stanford, март 2026)

Улучшение промта: <3% прироста; изменение харнеса: десятки процентов

Claude Code: 60% кода — логика модели, 40% — логика харнеса

Стоимость Anthropic: соло-агент $9/20 мин vs полный харнес (3 агента) $200/6ч

👀 Как это выглядит

Скриншот по теме «Harness: почему обвязка важнее» — 1

Что такое Harness и почему он важен?

Harness (англ. «упряжь») — это метафора для всей инфраструктуры, которая направляет и усиливает AI-модель. Модель (Claude, GPT, Gemini) — это мощная, но безвольная «лошадь». Сама по себе она лишь генерирует текст.

Harness — это «упряжка», которая включает:

Цикл агента (агент принимает решение → харнес выполняет → возвращает результат)
Инструменты (Tools) — доступ к терминалу, файлам, Git, веб-поиску
Субагенты — параллельные помощники с отдельными контекстами
Правила, проверки, долгую память, интеграции (MCP)
Песочницу и разрешения

Без харнеса модель бесполезна для сложных задач. С ним — это автономный работник.

Пример: В Claude AI и Claude Code — одна и та же модель, но разный харнес. В чате она пишет текст, а в Code — правит код, запускает тесты и читает логи.

Эволюция подходов к работе с AI

Развитие технологий взаимодействия с AI-моделями прошло через три ключевые парадигмы:

Парадигма промт-инжиниринга (2023–2024): Основной инструмент — тщательное составление запросов (промтов) для моделей с ограниченным контекстом (~4K токенов). Успех зависел от качества формулировки.
Парадигма контекст-инжиниринга (2024–2025): С ростом контекстного окна (до 1M токенов) появились новые методы: RAG (Retrieval-Augmented Generation), MCP (Model Context Protocol), вызовы инструментов. Проблема: «гниение контекста» (context rot) — чем больше информации загружено в окно, тем ниже качество ответов модели, увеличивается вероятность ошибок и противоречивых выводов.
Парадигма инженерии харнесов (Harness Engineering, с 2025): Фокус сместился на архитектуру инфраструктуры вокруг модели. Вместо наращивания контекста — свежие данные на каждом шаге, чёткие правила обработки, внешние проверки, система инструментов. Этот подход решает проблемы предыдущих парадигм и обеспечивает масштабируемость.

Цифры, доказывающие силу Harness

Эксперимент (февраль 2026): Одна модель (Grok Coder Fast) с разными форматами харнеса показала результат 6,7% против 68% решённых задач
Исследование Stanford (март 2026): Смена харнеса (без смены модели) дала +7,7 п.п. качества, в 4 раза меньше токенов и +4,7 п.п. точности на сложных задачах
Промт vs. Harness: В реальных проектах улучшение промта даёт <3% прироста, а изменение харнеса — десятки процентов
Пропорции в Claude Code: 60% кода — логика модели, 40% — логика харнеса
Компромисс Anthropic: Соло-агент: 20 мин / $9. Полный харнес (3 агента): 6 часов / $200. Дороже в 20 раз, но качество лучше на порядок

Вывод аналитика Акаша Гупты (январь 2026): «Модель — это товар (commodity), как пшеница или нефть. А Harness — это ров вокруг крепости (moat), ваше конкурентное преимущество».

Топ-7 готовых Harness на рынке (2026)

1. Claude Code & Claude Agent SDK (Anthropic)

Где: Терминал, десктоп-приложение, VS Code, веб-версия.
Суть: Готовый, отполированный харнес «из коробки» вокруг моделей Anthropic (и любых через API).
Что внутри: Цикл агента, инструменты (bash, поиск), субагенты, хуки (автопроверки), файл.claude.md (долгая память), MCP-серверы, система разрешений.
Фишка (май 2026): Dynamic Workflows — Claude сам пишет JavaScript-оркестрацию для задачи, запуская сотни субагентов параллельно.
Кому: Разработчикам и всем, кто хочет, чтобы AI писал код. Самый отшлифованный вариант.

2. OpenAI Codex

Где: Терминал, VS Code, веб, macOS, iOS. Единый Codex App Server.
Суть: Альтернатива Claude Code от OpenAI для своей экосистемы.
Рост: С 82 тыс. скачиваний (апрель 2025) до 14,5 млн (март 2026).
Особенность: Модели OpenAI обучены на patch-формате (стиль git diff), Anthropic — на string replace. Нельзя переключать модели в середине задачи (падение качества).
Кому: Тем, кто уже в стеке OpenAI и хочет один счёт/интерфейс.

3. Cursor (Anycode)

Где: Собственная IDE (на базе VS Code) + Cursor Agent CLI.
Суть: Harness, вшитый в ядро редактора. Не подключается к вашей среде — вы меняете среду на него.
Что внутри: Индексация всего репозитория, Cloud Agents (работают в облаке), параллельные сессии, Slack/GitHub-интеграции.
Фишки: Собственные модели (Composer 2.5 для многофайловых правок, Cursor Tab — предсказание действий в редакторе, Backbot — AI-ревьюер PR).
Кому: Разработчикам, которые предпочитают работать в IDE, а не в терминале. Доверяют >50% компаний из Fortune 500.

4. Devin (Cognition)

Где: Полностью облачный автономный агент + десктопная IDE (Windsurf).
Суть: Harness для полного делегирования. Даёте задачу — уходите — получаете готовый PR. Рассчитан на работу без вашего вмешательства.
Что внутри: Автономный цикл, песочница под каждую задачу, встроенный браузер, планировщик, ICU (единица работы для биллинга).
Цена: Дорого (сотни $ в месяц при активной работе).
Кому: Менеджерам, техлидам, стартапам для делегирования больших, чётких задач (миграции, написание тестов). Не для точечного кодинга.

5. Google Antigravity & Agent Development Kit (ADK)

Где: Google Cloud + Gemini-модели.
Суть: Antigravity — готовый агентский IDE (аналог Cursor). ADK — open-source фреймворк для сборки своих агентов.
Что внутри (Antigravity 2.0): Мультиагентная оркестрация (Planner, Executor, Verifier), встроенный браузер (Chromium), динамические субагенты, фоновые задачи, глубокая интеграция с Google Cloud.
Кому: Крупному корпоративному бизнесу, уже сидящему на Google Cloud (банки, ритейл, телеком).

6. LangGraph

Где: Ваш сервер, ваш код.
Суть: Конструктор для сборки своего харнеса, а не готовый продукт. Часть экосистемы LangChain.
Модель: Графовая (ноды — шаги, рёбра — условия). Python-based.
Что можно собрать: Сложные циклы, ветвления, параллельное выполнение, чекпоинты состояния, human-in-the-loop.
Кому: Разработчикам, которые строят кастомных агентов под специфичные бизнес-задачи (боты, интеграции с CRM), когда готовые решения не подходят.

7. CrewAI / Autogen / AI2

Где: Ваш сервер.
Суть: Мультиагентные фреймворки, где агенты с ролями (PM, инженер, дизайнер) общаются между собой.
Проблема: Компаундинг ошибок. Если каждый агент надёжен на 95%, то цепочка из 5 агентов будет надёжна лишь на ~77%. Точность падает с ростом цепочки.
Кому: В основном исследователям и экспериментаторам. Для 90% бизнес-задач один хорошо настроенный агент с инструментами работает лучше.

Будущее: Динамические харнесы 2027

В 2027 году ожидается переход к динамическим харнесам, которые агенты будут создавать под конкретную задачу на лету. Вместо статичной конфигурации харнеса система будет адаптивно строить нужную «упряжку» в зависимости от характера работы.

В 2026 году модель — это товар (commodity), как пшеница или нефть. Конкурентное преимущество — это харнес вокруг модели, его архитектура, инструменты и правила. Инженерия харнесов (Harness Engineering) вытеснила промт-инжиниринг, и это тренд на годы вперёд.

Часто задаваемые вопросы

В чем суть гайда?

Гайд объясняет, что Harness (инфраструктура вокруг AI-модели) важнее самой модели. Одна и та же модель в разных харнесах показывает разницу в результативности в десятки раз, а смена харнеса без смены модели даёт +7,7 п.п. качества. Инженерия харнесов стала новой парадигмой в 2025–2026 году.

Как это применить?

Применение зависит от вашей роли. Разработчикам: используйте Claude Code, Cursor или Devin для автоматизации кода. Техлидам: делегируйте задачи через Devin или LangGraph, чтобы агент работал независимо. Аналитикам: собирайте кастомных агентов на LangGraph под специфичные процессы (CRM, интеграции). Итог: выберите готовый харнес (если он подходит) или соберите свой под задачу.

Какой результат?

Результат: одна модель в разных харнесах — 6,7% → 68% решённых задач (10× улучшение). Смена харнеса (без смены модели) — +7,7 п.п. качества, −4× токены, +4,7 п.п. точности. Улучшение промта даёт <3% прироста, изменение харнеса — десятки процентов.