Методология эксперимента
Задача: проверить, способны ли китайские модели создать готовый к деплою код для AI-продавца в новой нише (мебельный салон) на основе продвинутого стартер-кита.
Инструменты
- Стартер-кит: Продакшен-код AI-продавца (7600 строк, 47 файлов, тесты, админ-панель, защита от инъекций)
- Open CMD: Open-source инструмент для анализа кода
- Open Router: Агрегатор моделей с оплатой за использование
Испытуемые модели
- DeepSeek-V4 Pro: 600B параметров, контекст 1M токенов
- Kimi 2.6 (Moonshot AI): Триллион параметров, нативная агентная модель
- Qwen 3.6 (Alibaba): 27B параметров, открытая лицензия Apache 2.0
- GLM 5.1: 754B параметров, может автономно работать над задачей до 8 часов
Процесс: одинаковый промпт без подсказок → генерация кода → функциональное тестирование (виджет, админка, защита) → самооценка модели → перекрёстный код-ревью от GPT-4o и Claude 3.5 Sonnet.