Few Shot Prompting

Добавление в промпт нескольких примеров решённой задачи, чтобы модель поняла ожидаемый формат и суть. Градации: zero-shot (только описание задачи), one-shot (1 пример), few-shot (несколько). Это in-context learning — веса модели НЕ меняются.

Суть

Модель «подхватывает» паттерн прямо из контекста запроса: показав 2–3 примера «вход → выход», вы конкретизируете задачу лучше, чем длинным текстовым описанием.

Зачем это нужно

Дешёвый способ поднять качество без дообучения (см. LLM Training Stages): примеры задают формат вывода и уточняют намерение. Особенно помогает на классификации, разметке, специфичных форматах. Оговорка из лекции: «улучшает не всегда и не везде», но на многих задачах/моделях — заметно.

Как работает

  • Zero-shot: только описание задачи («переведи с английского на французский: …»).
  • One-shot: описание + 1 пример решения.
  • Few-shot: описание + несколько примеров.
  • Это называют in-context learning: модель «учится» по примерам в контексте, без обновления градиентов (есть и техники few-shot с обновлением градиентов — это уже другое).
  • Способность к emergent few-shot проявилась с ростом моделей (GPT-3).
  • «Запекание» примеров в системный промпт (Anthropic): примеры — главный способ «раздвинуть границы» приложения. Организуй feedback loop: где модель ошиблась — добавляй этот кейс в example set, чтобы в следующий раз она ссылалась на него. Сильнее всего помогает на пограничных/сложных случаях.

Пример

Задача: классифицируй запрос → [навигационный | информационный | транзакционный]
Пример: "сайт сбербанка" → навигационный
Пример: "как испечь хлеб"  → информационный
Пример: "купить iphone 15" → транзакционный
Запрос: "погода в москве" →

Связано с

  • Prompt Engineering — few-shot как техника внутри «контракта»
  • Chain of Thought — часто комбинируют: примеры + рассуждения
  • LLM Training Stages — in-context vs реальное дообучение

Открытые вопросы

  • сколько примеров оптимально (и как они едят контекст/бюджет)
  • как подбирать репрезентативные примеры, чтобы не сместить модель