Суть
Модель «подхватывает» паттерн прямо из контекста запроса: показав 2–3 примера «вход → выход», вы конкретизируете задачу лучше, чем длинным текстовым описанием.
Зачем это нужно
Дешёвый способ поднять качество без дообучения (см. LLM Training Stages): примеры задают формат вывода и уточняют намерение. Особенно помогает на классификации, разметке, специфичных форматах. Оговорка из лекции: «улучшает не всегда и не везде», но на многих задачах/моделях — заметно.
Как работает
- Zero-shot: только описание задачи («переведи с английского на французский: …»).
- One-shot: описание + 1 пример решения.
- Few-shot: описание + несколько примеров.
- Это называют in-context learning: модель «учится» по примерам в контексте, без обновления градиентов (есть и техники few-shot с обновлением градиентов — это уже другое).
- Способность к emergent few-shot проявилась с ростом моделей (GPT-3).
- «Запекание» примеров в системный промпт (Anthropic): примеры — главный способ «раздвинуть границы» приложения. Организуй feedback loop: где модель ошиблась — добавляй этот кейс в example set, чтобы в следующий раз она ссылалась на него. Сильнее всего помогает на пограничных/сложных случаях.
Пример
Задача: классифицируй запрос → [навигационный | информационный | транзакционный]
Пример: "сайт сбербанка" → навигационный
Пример: "как испечь хлеб" → информационный
Пример: "купить iphone 15" → транзакционный
Запрос: "погода в москве" →
Связано с
- Prompt Engineering — few-shot как техника внутри «контракта»
- Chain of Thought — часто комбинируют: примеры + рассуждения
- LLM Training Stages — in-context vs реальное дообучение
Открытые вопросы
- сколько примеров оптимально (и как они едят контекст/бюджет)
- как подбирать репрезентативные примеры, чтобы не сместить модель