Карта раздела: заметки сгруппированы по темам с короткими аннотациями — читайте по порядку как путеводитель или переходите сразу к нужной теме.
1. Базовые понятия
- AI Agent — что такое агент: LLM + цель + инструменты + цикл.
- Agent vs Workflow — ключевое различие: кто решает следующий шаг — модель или код.
- Agent Anatomy — из чего собран агент: модель, инструменты, память, оркестрация.
- Agent Architecture — типовые архитектуры и как они комбинируются.
- Agent Use Cases — где агенты оправданы, а где избыточны.
2. Агентные паттерны
- ReAct — базовый цикл reasoning + acting.
- Plan and Execute — отделение планирования от исполнения для длинных задач.
- Generator Evaluator — пара «генератор + критик» для самопроверки.
- Tool Calling — как агент вызывает инструменты, основа любого действия.
- Structured Output — гарантированный формат ответа под программную обработку.
- Schema Guided Reasoning — схема как каркас рассуждения, а не только выхода.
- Validation Loops — повтор до прохождения валидации (Pydantic AI-style).
- Guardrails — ограничители на вход/выход и действия агента.
- Human in the Loop — точки, где требуется подтверждение человека.
- Agent Routing — маршрутизация запроса к нужному агенту/инструменту/модели.
- Agent Roles — разделение ролей в multi-agent системах.
3. Память, контекст и knowledge access
Четыре разных способа дать агенту знания, которые часто путают: memory — состояние между шагами/сессиями (Agent Memory); context — что физически влезает в окно сейчас (Context Window); retrieval — подтягивание внешних знаний по запросу (RAG); cache — переиспользование уже обработанного для скорости/цены (KV Cache, Prompt Caching); agentic retrieval — агент сам решает, что и когда искать (Agentic RAG).
- Agent Memory — short-term / long-term память агента.
- Context Window — физический лимит, в котором живёт вся работа агента.
- KV Cache — кэш внимания, основа стоимости длинного контекста.
- Prompt Caching — переиспользование префикса промпта для экономии.
- RAG — retrieval-augmented generation как knowledge layer.
- CAG — cache-augmented generation: знания в контексте вместо поиска.
- RAG vs CAG vs Agentic RAG — decision matrix выбора подхода.
- Agentic RAG — retrieval под управлением самого агента.
4. Frameworks и runtime
Здесь — не паттерны, а конкретный runtime, который их исполняет. LangGraph — про граф состояний и контроль потока; PydanticAI — про типобезопасность и валидацию; MCP — про стандарт подключения инструментов/данных. Атомарные заметки LangGraph ниже — это его отличительные runtime-фичи, а внутреннюю механику смотри из hub.
- LangGraph — hub: граф состояний как модель агента.
- LangGraph Checkpointers — персистентность состояния между шагами.
- LangGraph HITL — встроенные точки human-in-the-loop.
- LangGraph Intent Router — маршрутизация по намерению как узел графа.
- LangGraph MCP as Node — подключение MCP-инструментов как узла.
- LangGraph Observability — трейсинг исполнения графа.
- LangGraph Reliability — повторы, лимиты, обработка сбоев.
- LangGraph Time Travel — откат и переигрывание состояний.
- PydanticAI — hub: типобезопасный агентный фреймворк.
- Agent Deps — внедрение зависимостей/секретов в агента.
- MCP — Model Context Protocol: стандарт подключения инструментов и данных.
5. Observability, evals, cost control
- Agent Evals — как оценивать качество агента, а не отдельного ответа.
- Benchmarks Agents — агентные бенчмарки и их нестабильность.
- Agent CostControl — контроль расходов в проде.
- Reasoning Effort — управление глубиной рассуждения под цену/качество.
- Model Selection — выбор модели под задачу и бюджет.
- RAG Metrics — метрики качества retrieval-слоя.
- RAG Observability — трейсинг online-retrieval в агенте.
6. Safety и production constraints
Линза «что ломается в проде»; содержание заметок раскрыто в разделах 2 и 5, здесь — только safety-роль.
- Guardrails — основной safety layer.
- Human in the Loop — контроль необратимых действий.
- Computer Use — высокий риск из-за действий в UI.
- Agent Deps — изоляция секретов/прав.
- Agent CostControl — production guardrail по расходам.
7. Практические маршруты изучения
A. Понять агента с нуля AI Agent → Agent vs Workflow → Agent Anatomy → ReAct → Tool Calling → Agent Memory
B. Собрать production-ish агента Agent Architecture → LangGraph → LangGraph Checkpointers → Human in the Loop → Guardrails → Agent Evals
C. Knowledge layer для агента Context Window → RAG → CAG → RAG vs CAG vs Agentic RAG → Agentic RAG → RAG Metrics
Связано с
- AI Agent — корневая концепция темы
- Agent vs Workflow — граница агентности
- Agent Architecture — как собираются агенты
- LangGraph — основной runtime в vault'е
- RAG — knowledge layer для агентов