ИИ-гайды

Prompting Playbook: Отладка и создание промптов

Разбор от редакции «ИИ для чайников» · Обновлено 22 мая 2026

💡 О чём гайд
Промптинг — критический навык для создания эффективных AI-систем. Основные сценарии: поддержка/миграция существующего промпта и создание нового агента с нуля.

📢 Больше разборов — в канале «ИИ для чайников»

📄 Скачать гайд (PDF) 📢 Канал ИИ для чайников

Типа тест-кейсов

Сценария в гайде

Инструмент

Для математики/поиска

Компромиссы

Давать полную картину

Этапов Generate-Evaluate-Repair

Эвалюции

Основа всего

Фундамент: Эвалюации (Evaluations)

Перед любыми изменениями нужна система оценки. Эвал-сьют должен включать три типа тест-кейсов для объективного измерения влияния изменений.

Три типа тест-кейсов:

Контрольный случай: Простой, однозначный запрос, который должен всегда проходить.
Пограничные случаи (Edge cases): Ситуации, где модель ранее ошибалась.
Проверка границ возможностей: Понимает ли модель, когда нужно передать задачу человеку или отказаться?

Пример из кейса поддержки телеком-компании:

Контрольный: «Каков лимит данных в базовом тарифе?»
Пограничный: Расчёт пропорционального счёта при смене тарифа.
Проверка эскалации: Перевод к специалисту при ошибке в биллинге.
Проверка утаивания: Не скрывает ли модель информацию, к которой имеет доступ.

Правило: Эвалюация должна быть настолько строгой, что любое улучшение гарантирует реальный прогресс.

Сценарий 1: Поддержка и миграция промпта

Цель: Улучшить работающий промпт, который начал давать сбои (например, после миграции на новую модель).

Шаг 1: Общая очистка и гигиена

Перед точечными исправлениями приведите промпт в порядок:

Уберите ложные утверждения (например, «ты — человек»).
Удалите лишнюю информацию, скопированную с сайтов (упоминания картинок, cookies).
Добавьте чёткую структуру с использованием XML-тегов для разделения роли, политик, гайдлайнов и тона.

Правило: Если вы не можете отличить гайдлайны от политик и данных, то, скорее всего, и модель не может.

Результат: Часто уже эта очистка даёт заметный прирост качества на эвалюациях.

Шаг 2: Чёткий контракт на вывод (Output Contract)

Для сложных форматов вывода (JSON, XML) явно укажите ожидаемую структуру.

Шаг 3: Целевое исправление ошибок (Failure Modes)

Исправляйте проблемы по одной, проверяя результат через эвалюации.

Проблема 1: Модель утаивает доступную информацию

Симптом: Вместо того чтобы сказать, что у клиента 5 ГБ hotspot-данных (это есть в контексте), модель отсылает его проверять данные в личном кабинете.
Причина: В промпте был «заплаточный» пункт для старой модели: «Никогда не давай клиенту неверные данные. Вместо этого направляй по URL». Новая модель следует слишком буквально.
Решение: Сбалансируйте инструкцию. Укажите, что данные в контексте клиента — это источник истины, и их можно сообщать.

Проблема 2: Модель не может выполнить точный расчёт

Симптом: Модель рассуждает о пропорциональном платеже, но даёт размытый ответ без суммы.
Причина: Инструкция «Критически важно всегда правильно рассчитывать» не даёт модели способности делать точные вычисления.
Решение: Дайте модели инструмент (tool). Опишите в промпте и API схему инструмента calculate_proration и реализуйте его логику.

Ключевой вывод: Инструкции не добавляют возможности. Для сложных задач (математика, поиск, проверка) давайте инструменты.

Проблема 3: Модель не эскалирует к человеку

Симптом: При биллинговой ошибке модель пытается сама диагностировать, а не передаёт специалисту.
Причина: Перекос: «Избегай эскалации, стоит $8». Модель оптимизировала цель минимизации затрат.
Решение: Дайте обе стороны trade-off: «Эскалация стоит $8, но ошибка приведёт к возврату и потере доверия».

Урок: Умные модели лучше справляются с компромиссами, если им дают полную картину.

Сценарий 2: Создание нового агента с нуля

Кейс: Агент для составления недельного графика работы сотрудников с учётом ограничений.

Подход: Экспериментировать по трём направлениям

Модель (Sonnet vs Opus)
Промпт (простой vs улучшенный)
Архитектура (одношаговый vs агентский цикл)

Сравнение подходов:

Базовая модель (Sonnet) + простой промпт: Все тесты провалены. Много токенов, плохие результаты.
Opus + тот же промпт: Нарушений меньше, но тесты ещё провалены.
Opus + Adaptive Thinking: Все тесты пройдены, но высокая стоимость (×3 больше токенов) и высокая латентность.
Sonnet + улучшенный промпт: Лучше, но нестабильно. Упирается в лимит токенов.
Агентский цикл (Generate-Evaluate-Repair): Все тесты пройдены. Оптимальный баланс токенов и латентности.

Агентский цикл: Generate-Evaluate-Repair

Три этапа:

Генератор: Создаёт черновик графика.
Оценщик (LLM-судья): Проверяет черновик на нарушения правил, формирует отчёт об ошибках.
Исправитель: Вносит целевые правки на основе отчёта оценщика.

Преимущества этого подхода:

Гибкость: Позволяет добавлять «мягкие» ограничения (например, «Гарри не любит работать с Салли») прямо в промпт оценщика на лету, без изменения кода.
Разделение ответственности: Каждый этап решает свою чёткую задачу, упрощает отладку и улучшение.
Контролируемость: Вы видите, на каких правилах падают тесты, и исправляете точно.
Стоимость-оптимальность: Дешевле, чем использование Opus с Adaptive Thinking, но надёжнее.

Итог:

Агентский подход эффективнее и гибче, чем один монолитный промпт. Разделение на этапы (генерация, оценка, исправление) позволяет масштабировать систему.

Ключевые выводы

Эвалюации — основа. Это база для объективной оценки любых изменений в промпте или модели.
Начинайте с гигиены. Структурирование и очистка промпта часто дают быстрый прирост качества без изменения логики.
Избегайте длинных запретительных списков. Однобокие инструкции запутывают модель. Давайте сбалансированные указания с компромиссами.
Инструкции ≠ возможности. Для сложных задач (расчёты, поиск, проверка) предоставляйте модели инструменты (tools).
Для сложных use-case рассмотрите архитектуру. Агентский подход (Generate-Evaluate-Repair) может быть эффективнее и гибче одного промпта.
Используйте контроль версий. Отслеживайте, зачем были добавлены защитные инструкции — это поможет при миграции на новые модели.

Промптинг — это критический навык, который требует систематического подхода: эвалюации, гигиена, целевые исправления, инструменты и архитектура. Начните с простого, измеряйте объективно, и вы достигнете стабильных результатов.

Часто задаваемые вопросы

С чего начать, если промпт перестал работать?

Начните с эвалюаций: создайте 3 типа тест-кейсов (контрольный, пограничные, проверка границ). Потом очистите промпт (гигиена): убери лишнее, добавь XML-теги для структуры. Часто уже это даёт результат.

Инструкции или инструменты?

Инструкции помогают модели понять контекст и принципы. Но для выполнения сложных задач (точная математика, поиск, проверка) нужны инструменты (tools). Инструкции не добавляют возможности, а только указывают на них.

Какой подход выбрать: один промпт или агент?

Для простых задач — один хороший промпт достаточно. Для сложных (графики, оптимизация, множество правил) — агентский цикл (Generate-Evaluate-Repair) часто эффективнее, дешевле и гибче.

Как избежать того, что модель утаивает информацию?

Явно укажите в промпте, что данные в контексте — это источник истины. Если была инструкция вроде «Никогда не говори неверные данные», сбалансируйте её: «Если у нас есть верные данные в контексте, говори их. Только если данных нет, попроси уточнения».