ИИ-гайды

Битва AI-агентов в Minecraft: добыча алмазов

Разбор от редакции «ИИ для чайников» · Обновлено 23 мая 2026

💡 О чём гайд
Гайд описывает структуру воркшопа по созданию AI-агентов, которые конкурируют в Minecraft на добычу алмазов за 45 минут. Вы узнаете, как развернуть управляемого агента на инфраструктуре Anthropic, настроить его параметры (модель, системный промт, навыки, MCP-серверы) и применить метод восхождения по холму (hill climbing) на основе оценок (evals) для итеративного улучшения поведения агента. Практический опыт показывает, как тонкая настройка системного промта и эффективное использование токенов определяют успех конкуренции.

📢 Больше разборов — в канале «ИИ для чайников»

📄 Скачать гайд (PDF) 📢 Канал ИИ для чайников

Таймер конкуренции: 35 минут на эксперименты и 5 минут на добычу алмазов

Критерий победы: максимальное количество добытых алмазов; при ничьей учитывается соотношение алмазы/токены

Управление агентом через MCP-инструменты: mine_block, jump, go_near и другие команды

Итеративный процесс: быстрые eval-тесты (~1 минута) для проверки идей и оптимизации

Конфигурируемые параметры: модель, системный промт, навыки, MCP-серверы

Участники достигли лучшего результата в 19 добытых алмазов

Правила битвы

Понимание правил конкуренции — основа успеха в воркшопе:

Таймер: 35 минут на эксперименты и итерацию
Длительность запуска: 5 минут на добычу алмазов (можно прервать раньше)
Учёт попыток: засчитывается только лучший запуск от каждого участника
Критерий победы: максимальное количество добытых алмазов
Разрешение ничьи: при равенстве алмазов побеждает участник с лучшим соотношением алмазы/токены (выше эффективность модели)

Техническая настройка и инструменты

Среда состоит из клона Minecraft, подключённого к боту Mind Flare, управление осуществляется через MCP-инструменты.

Основные инструменты управления:

mine_block — добыча блока
jump — прыжок
go_near — движение к цели

Конфигурационный файл: my_agent.py в репозитории (доступ через /agent_battle).

Настраиваемые параметры агента:

Модель (model string) — выбор LLM для агента
Системный промт (system prompt) — изначально пустой, но именно здесь закладывается стратегия
Навык (skill) — можно использовать готовый от Anthropic или создать свой
MCP-сервер — опционально для расширения возможностей управления и сенсорики

Стартовые условия: у всех участников одинаковый сид (seed) мира для честного сравнения.

Результаты конкуренции

Воркшоп показал реальный потенциал управляемых агентов Anthropic:

Участники достигли результата в 19 добытых алмазов
Победитель определился в последние минуты, что подчёркивает важность итеративной оптимизации
Призёры (первые пять мест) были приглашены для награждения

Воркшоп демонстрирует, что успех AI-агента определяется не только выбором модели, но и способностью к быстрой итеративной оптимизации конфигурации. Метод hill climbing на основе evals позволяет достичь баланса между эффективностью и результативностью в практических задачах.

Часто задаваемые вопросы

Чем отличается Managed Agent от обычного?

Managed Agent — это агент на инфраструктуре Anthropic с полным набором инструментов (модель, системный промпт, skills, MCP-серверы) и возможностью оптимизации. Вы можете менять конфигурацию и запускать быстрые эвалы для проверки идей. Обычный агент требует собственной инфраструктуры.

Как работает hill climbing с evals?

Hill climbing — это цикл: запустите eval (~1 минута), проанализируйте результаты, измените конфигурацию (промпт, модель, инструменты), перезапустите eval. Повторяйте, пока не достигнете целевого результата. Быстрые итерации критичны для успеха.

Почему эффективность токенов важна при ничьей?

Потому что в production соотношение результат/затраты определяет экономику системы. При равенстве результатов побеждает тот, кто достигает цели с меньшим использованием ресурсов. Это отражает реальность — оптимальные системы эффективны как по качеству, так и по цене.

Можно ли использовать свой MCP-сервер?

Да, MCP-сервер опционален. Вы можете создать свой для расширения возможностей агента или использовать готовые инструменты от Anthropic. Главное — правильно интегрировать его в конфигурацию агента и протестировать через эвалы.