Частые вопросы
Может ли few-shot заменить fine-tuning?
Для большинства задач — нет. Few-shot даёт 70–85% точности, fine-tuning достигает 85–95%, если данных достаточно (сотни примеров). Few-shot выигрывает скоростью и гибкостью, fine-tuning — точностью. На практике используют оба: сначала few-shot для прототипа, потом fine-tuning, если нужна масштабируемость.
Как few-shot работает в ChatGPT и Claude?
Одинаково: примеры передаются в один промпт наравне с инструкциями и задачей. ChatGPT/Claude видят паттерн и применяют его. Различие в том, что Claude лучше следует формату, ChatGPT иногда выдумывает. Для критичных задач проверяй оба.
Помогают ли few-shot примеры с дорогими API?
Да, помогают экономить. Если вместо инструкции на 1000 токенов дать 200 токенов примеров — промпт дешевле на 80%. А если few-shot даёт точнее и не требует переделок — экономия ещё больше. Но тестируй на конкретной задаче: иногда развёрнутая инструкция дешевле переделок после неточного few-shot.
Может ли плохой пример испортить результат?
Да, часто испортит. Если пример содержит ошибку или не репрезентативен (например, одна из категорий представлена только плохими случаями), модель их усвоит. Проверяй примеры перед использованием. Если видишь странный результат — зачастую виноват именно неудачный пример.
Есть ли разница между few-shot и chain-of-thought?
Это разные техники. Few-shot — примеры задачи. Chain-of-thought — просьба показать рассуждение перед ответом («Думай пошагово»). Можно комбинировать: примеры с пошаговым разбором внутри + просьба применить то же для новой задачи. На сложных задачах комбинация работает мощнее, чем каждая отдельно.