Агенты

Как устроены автономные агенты на базе LLM: из чего они собраны, по каким паттернам действуют и на чём их строят.

Карта раздела: заметки сгруппированы по темам с короткими аннотациями — читайте по порядку как путеводитель или переходите сразу к нужной теме.

1. Базовые понятия

  • AI Agent — что такое агент: LLM + цель + инструменты + цикл.
  • Agent vs Workflow — ключевое различие: кто решает следующий шаг — модель или код.
  • Agent Anatomy — из чего собран агент: модель, инструменты, память, оркестрация.
  • Agent Architecture — типовые архитектуры и как они комбинируются.
  • Agent Use Cases — где агенты оправданы, а где избыточны.

2. Агентные паттерны

  • ReAct — базовый цикл reasoning + acting.
  • Plan and Execute — отделение планирования от исполнения для длинных задач.
  • Generator Evaluator — пара «генератор + критик» для самопроверки.
  • Tool Calling — как агент вызывает инструменты, основа любого действия.
  • Structured Output — гарантированный формат ответа под программную обработку.
  • Schema Guided Reasoning — схема как каркас рассуждения, а не только выхода.
  • Validation Loops — повтор до прохождения валидации (Pydantic AI-style).
  • Guardrails — ограничители на вход/выход и действия агента.
  • Human in the Loop — точки, где требуется подтверждение человека.
  • Agent Routing — маршрутизация запроса к нужному агенту/инструменту/модели.
  • Agent Roles — разделение ролей в multi-agent системах.

3. Память, контекст и knowledge access

Четыре разных способа дать агенту знания, которые часто путают: memory — состояние между шагами/сессиями (Agent Memory); context — что физически влезает в окно сейчас (Context Window); retrieval — подтягивание внешних знаний по запросу (RAG); cache — переиспользование уже обработанного для скорости/цены (KV Cache, Prompt Caching); agentic retrieval — агент сам решает, что и когда искать (Agentic RAG).

  • Agent Memory — short-term / long-term память агента.
  • Context Window — физический лимит, в котором живёт вся работа агента.
  • KV Cache — кэш внимания, основа стоимости длинного контекста.
  • Prompt Caching — переиспользование префикса промпта для экономии.
  • RAG — retrieval-augmented generation как knowledge layer.
  • CAG — cache-augmented generation: знания в контексте вместо поиска.
  • RAG vs CAG vs Agentic RAG — decision matrix выбора подхода.
  • Agentic RAG — retrieval под управлением самого агента.

4. Frameworks и runtime

Здесь — не паттерны, а конкретный runtime, который их исполняет. LangGraph — про граф состояний и контроль потока; PydanticAI — про типобезопасность и валидацию; MCP — про стандарт подключения инструментов/данных. Атомарные заметки LangGraph ниже — это его отличительные runtime-фичи, а внутреннюю механику смотри из hub.

  • LangGraph — hub: граф состояний как модель агента.
  • LangGraph Checkpointers — персистентность состояния между шагами.
  • LangGraph HITL — встроенные точки human-in-the-loop.
  • LangGraph Intent Router — маршрутизация по намерению как узел графа.
  • LangGraph MCP as Node — подключение MCP-инструментов как узла.
  • LangGraph Observability — трейсинг исполнения графа.
  • LangGraph Reliability — повторы, лимиты, обработка сбоев.
  • LangGraph Time Travel — откат и переигрывание состояний.
  • PydanticAI — hub: типобезопасный агентный фреймворк.
  • Agent Deps — внедрение зависимостей/секретов в агента.
  • MCP — Model Context Protocol: стандарт подключения инструментов и данных.

5. Observability, evals, cost control

  • Agent Evals — как оценивать качество агента, а не отдельного ответа.
  • Benchmarks Agents — агентные бенчмарки и их нестабильность.
  • Agent CostControl — контроль расходов в проде.
  • Reasoning Effort — управление глубиной рассуждения под цену/качество.
  • Model Selection — выбор модели под задачу и бюджет.
  • RAG Metrics — метрики качества retrieval-слоя.
  • RAG Observability — трейсинг online-retrieval в агенте.

6. Safety и production constraints

Линза «что ломается в проде»; содержание заметок раскрыто в разделах 2 и 5, здесь — только safety-роль.

  • Guardrails — основной safety layer.
  • Human in the Loop — контроль необратимых действий.
  • Computer Use — высокий риск из-за действий в UI.
  • Agent Deps — изоляция секретов/прав.
  • Agent CostControl — production guardrail по расходам.

7. Практические маршруты изучения

A. Понять агента с нуля AI AgentAgent vs WorkflowAgent AnatomyReActTool CallingAgent Memory

B. Собрать production-ish агента Agent ArchitectureLangGraphLangGraph CheckpointersHuman in the LoopGuardrailsAgent Evals

C. Knowledge layer для агента Context WindowRAGCAGRAG vs CAG vs Agentic RAGAgentic RAGRAG Metrics

Связано с

  • AI Agent — корневая концепция темы
  • Agent vs Workflow — граница агентности
  • Agent Architecture — как собираются агенты
  • LangGraph — основной runtime в vault'е
  • RAG — knowledge layer для агентов