Few Shot Prompting

Суть

Модель «подхватывает» паттерн прямо из контекста запроса: показав 2–3 примера «вход → выход», вы конкретизируете задачу лучше, чем длинным текстовым описанием.

Зачем это нужно

Дешёвый способ поднять качество без дообучения (см. LLM Training Stages): примеры задают формат вывода и уточняют намерение. Особенно помогает на классификации, разметке, специфичных форматах. Оговорка из лекции: «улучшает не всегда и не везде», но на многих задачах/моделях — заметно.

Как работает

Zero-shot: только описание задачи («переведи с английского на французский: …»).
One-shot: описание + 1 пример решения.
Few-shot: описание + несколько примеров.
Это называют in-context learning: модель «учится» по примерам в контексте, без обновления градиентов (есть и техники few-shot с обновлением градиентов — это уже другое).
Способность к emergent few-shot проявилась с ростом моделей (GPT-3).
«Запекание» примеров в системный промпт (Anthropic): примеры — главный способ «раздвинуть границы» приложения. Организуй feedback loop: где модель ошиблась — добавляй этот кейс в example set, чтобы в следующий раз она ссылалась на него. Сильнее всего помогает на пограничных/сложных случаях.

Пример

Задача: классифицируй запрос → [навигационный | информационный | транзакционный]
Пример: "сайт сбербанка" → навигационный
Пример: "как испечь хлеб"  → информационный
Пример: "купить iphone 15" → транзакционный
Запрос: "погода в москве" →

Связано с

Prompt Engineering — few-shot как техника внутри «контракта»
Chain of Thought — часто комбинируют: примеры + рассуждения
LLM Training Stages — in-context vs реальное дообучение

Открытые вопросы

сколько примеров оптимально (и как они едят контекст/бюджет)
как подбирать репрезентативные примеры, чтобы не сместить модель