Агенты

Карта раздела: заметки сгруппированы по темам с короткими аннотациями — читайте по порядку как путеводитель или переходите сразу к нужной теме.

1. Базовые понятия

AI Agent — что такое агент: LLM + цель + инструменты + цикл.
Agent vs Workflow — ключевое различие: кто решает следующий шаг — модель или код.
Agent Anatomy — из чего собран агент: модель, инструменты, память, оркестрация.
Agent Architecture — типовые архитектуры и как они комбинируются.
Agent Use Cases — где агенты оправданы, а где избыточны.

2. Агентные паттерны

ReAct — базовый цикл reasoning + acting.
Plan and Execute — отделение планирования от исполнения для длинных задач.
Generator Evaluator — пара «генератор + критик» для самопроверки.
Tool Calling — как агент вызывает инструменты, основа любого действия.
Structured Output — гарантированный формат ответа под программную обработку.
Schema Guided Reasoning — схема как каркас рассуждения, а не только выхода.
Validation Loops — повтор до прохождения валидации (Pydantic AI-style).
Guardrails — ограничители на вход/выход и действия агента.
Human in the Loop — точки, где требуется подтверждение человека.
Agent Routing — маршрутизация запроса к нужному агенту/инструменту/модели.
Agent Roles — разделение ролей в multi-agent системах.

Мультиагентные системы (multiagent/):

Multi Agent Systems — когда команда агентов нужна, а когда нет (правило 80%); топологии.
MAS Frameworks — CrewAI vs AutoGen vs LangGraph vs Mastra.
CrewAI — ролевой фреймворк «команда, а не граф».
Multi Agent Patterns — параллелизм (fan-out/map-reduce/pipeline) + критик/ревьюер.
Agent2Agent Protocol — A2A: стандарт общения агентов между собой (дополняет MCP).
Mem0 — слой памяти агентов (факты vs RAG, координация команды).

3. Память, контекст и knowledge access

Четыре разных способа дать агенту знания, которые часто путают: memory — состояние между шагами/сессиями (Agent Memory); context — что физически влезает в окно сейчас (Context Window); retrieval — подтягивание внешних знаний по запросу (RAG); cache — переиспользование уже обработанного для скорости/цены (KV Cache, Prompt Caching); agentic retrieval — агент сам решает, что и когда искать (Agentic RAG).

Agent Memory — short-term / long-term память агента.
Context Window — физический лимит, в котором живёт вся работа агента.
KV Cache — кэш внимания, основа стоимости длинного контекста.
Prompt Caching — переиспользование префикса промпта для экономии.
RAG — retrieval-augmented generation как knowledge layer.
CAG — cache-augmented generation: знания в контексте вместо поиска.
RAG vs CAG vs Agentic RAG — decision matrix выбора подхода.
Agentic RAG — retrieval под управлением самого агента.

4. Frameworks и runtime

Здесь — не паттерны, а конкретный runtime, который их исполняет. LangGraph — про граф состояний и контроль потока; PydanticAI — про типобезопасность и валидацию; MCP — про стандарт подключения инструментов/данных. Атомарные заметки LangGraph ниже — это его отличительные runtime-фичи, а внутреннюю механику смотри из hub.

LangGraph — hub: граф состояний как модель агента.
LangGraph Checkpointers — персистентность состояния между шагами.
LangGraph HITL — встроенные точки human-in-the-loop.
LangGraph Intent Router — маршрутизация по намерению как узел графа.
LangGraph MCP as Node — подключение MCP-инструментов как узла.
LangGraph Observability — трейсинг исполнения графа.
LangGraph Reliability — повторы, лимиты, обработка сбоев.
LangGraph Time Travel — откат и переигрывание состояний.
PydanticAI — hub: типобезопасный агентный фреймворк.
Agent Deps — внедрение зависимостей/секретов в агента.
MCP — Model Context Protocol: стандарт подключения инструментов и данных.

5. Observability, evals, cost control

AgentOps — зонтичная дисциплина эксплуатации: HADI-цикл, триада observability/evals/cost.
Agent Observability — трейсинг каждого шага; почему классический мониторинг слеп к агенту.
LangSmith vs Langfuse — выбор инструмента observability (+ Langfuse MCP/CLI для агентов).
Agent Evals — как оценивать качество агента, а не отдельного ответа.
LLM as Judge — оценка ответов моделью-судьёй (reference-free) + семьи метрик.
DeepEval Agentic Metrics — Task/Tool/Argument Correctness, MCP-метрики.
Benchmarks Agents — агентные бенчмарки и их нестабильность.
Agent CostControl — контроль расходов в проде.
Reasoning Effort — управление глубиной рассуждения под цену/качество.
Model Selection — выбор модели под задачу и бюджет.
RAG Metrics — метрики качества retrieval-слоя.
RAG Observability — трейсинг online-retrieval в агенте.

6. Safety и production constraints

Линза «что ломается в проде»; содержание заметок раскрыто в разделах 2 и 5, здесь — только safety-роль.

Guardrails — основной safety layer.
Human in the Loop — контроль необратимых действий.
Computer Use — высокий риск из-за действий в UI.
Agent Deps — изоляция секретов/прав.
Agent CostControl — production guardrail по расходам.

Безопасность агентов (security/):

Agent Security — хаб: threat model, OWASP LLM Top-10, пассивный→активный риск.
Атаки: Prompt Injection (прямая/косвенная/leaking) · Jailbreak Attacks (DAN/Base64/leetspeak) · Tool Hijacking (Excessive Agency) · RAG Poisoning (отравление индекса).
Защита: Injection Detection (F1, бинарный сигнал) · Dual LLM CaMeL (архитектурное разделение) · Agent Sandboxing (Firecracker microVM) · DLP for LLM + PII Anonymization (Presidio, ФЗ-152).
Управление: Agent Governance — 4 уровня автономии, пропорциональная governance.
Оптимизация (смежно): Prompt Tuning — soft prompts между PE и fine-tuning.

7. Практические маршруты изучения

A. Понять агента с нуля AI Agent → Agent vs Workflow → Agent Anatomy → ReAct → Tool Calling → Agent Memory

B. Собрать production-ish агента Agent Architecture → LangGraph → LangGraph Checkpointers → Human in the Loop → Guardrails → Agent Evals

C. Knowledge layer для агента Context Window → RAG → CAG → RAG vs CAG vs Agentic RAG → Agentic RAG → RAG Metrics

Связано с

AI Agent — корневая концепция темы
Agent vs Workflow — граница агентности
Agent Architecture — как собираются агенты
LangGraph — основной runtime в vault'е
RAG — knowledge layer для агентов