Частые вопросы
Что такое ложные срабатывания в модерации?
Когда ИИ блокирует легитимный контент по ошибке. Пример: текст «Как я потерял деньги на криптовалютах» может быть заблокирован как спам о крипто. Ложные срабатывания бьют по юзерам: они теряют доверие.
Какой язык выбрать для обучения модели модерации?
Для русскоязычного контента нужны модели с поддержкой русского (multilingual BERT, RuGPT) или специальные русские (ruBERT, Llama-2-Russian). Английские BERT плохо работают на русском: падает точность на 15–25%.
Можно ли использовать ChatGPT для модерации вместо специальной модели?
Да, можно через Prompt Engineering: пошли текст в GPT-4 с инструкцией классифицировать. Но дорого (~$0,03 за 1000 токенов), медленно (~500 мс/запрос). Для высоконагруженных сервисов (1000+ сообщений в минуту) специальная модель с GPU дешевле в 100+ раз.
Нужны ли разные модели для текста и картинок?
Да, архитектуры разные. Для текста — BERT, LSTM, RoBERTa. Для картинок — свёрточные сети (ResNet, EfficientNet, Vision Transformer). Но можно объединить оба в мультимодальную модель (CLIP), которая работает с текстом и фото одновременно.
Как часто переучивать модель, чтобы не отставать от новых способов спама?
Начни с раз в неделю, потом перейди на раз в две недели, если точность стабильна. Если precision падает на 5+ процентов, переучи срочно. Используй online learning: обновляй модель на новых примерах без полного переобучения.