Agent Anatomy

Суть

Мозг — LLM: reasoning + planning, решает «что делать дальше».
Инструменты — function calling: «руки» агента — API, shell, браузер, запросы к БД, вычисления.
Память: краткосрочная (контекст сессии) + долгосрочная (vector DB, файлы, прошлые траектории).
База знаний — RAG: справочники, документация, данные компании; защита от галлюцинаций.

Зачем это нужно

Главная причина провала агентов (по AgentBench) — слабые long-term reasoning и decision-making у мозга-LLM, а не нехватка инструментов. Поэтому компоненты проектируют осознанно, а не по принципу «дай агенту 50 инструментов».

Как работает

Мозг — критичные способности: instruction following, long-term reasoning (держать цель 30+ шагов), tool calling accuracy, error recovery.
Инструменты: модель возвращает JSON с именем функции и аргументами (спецификация через JSON Schema: name / description / parameters). Хороший description инструмента решает больше, чем выбор модели. Анти-паттерн: 50+ инструментов в одном агенте → падает точность, дробите на subagents (см. Tool Calling).
Память — 4 вида: context window (что в промпте сейчас), conversation history (прошлые ходы сессии), long-term (vector DB: Qdrant / Pinecone / pgvector), episodic (логи прошлых успехов и провалов).
База знаний: RAG = запрос → поиск в БД → inject в контекст → генерация (см. RAG). Tools + knowledge base под единым интерфейсом = MCP.

Пример

agent = Agent(
  brain     = LLM("gpt-5-mini"),     # 1. мозг
  tools     = [search_web, query_db], # 2. руки (JSON Schema)
  memory    = VectorStore("qdrant"),  # 3. долгосрочная память
  knowledge = RAG(company_docs),      # 4. база знаний
)

Альтернативный взгляд: «агент = 90% классическая инженерия»

Лекция по сборке агентного цикла смещает фокус с «из чего агент состоит» на «как его собрать надёжно». Тезис: агенты на ~90% — это классическая инженерия, а не «магия LLM» и не фреймворк. Вместо 4 компонентов-организма агент раскладывается на ~10 инженерных слоёв (Thinking Channel, Best-of-N, SQLite-DAG, Self-Healing Master Loop, Tool Grounding, Definition of Done, Architect/Editor, Prompt Caching, Bi-temporal Memory, MCP). Главное в надёжности — не «мозг», а устойчивость (персистентный Task DAG, переживающий рестарт) и внешняя верификация, а не доверие модели самой себе. Подробнее — Agent Architecture.

Альтернативный взгляд

Те же компоненты, но через метафору «организма»: Модель (Brain) — рассуждения, Инструменты (Hands) — действия, Оркестрация (Nervous System) — управление жизненным циклом, Инфраструктура (Environment) — среда обитания (логи, надёжность, память). Модель здесь — лишь «двигатель», который сам по себе бесполезен: ценность создаёт обвязка. Это смещает фокус с «какую LLM взять» на «как спроектированы оркестрация (Plan and Execute) и инфраструктура». Полезное правило отсюда: инструмент должен быть детерминированным, а из agentic-loop выходим в т.ч. по условию No Progress.

Связано с

AI Agent — что такое агент в целом
ReAct — цикл, использующий эти компоненты
Tool Calling — подробнее про «руки» агента
RAG — база знаний агента
Agent Architecture — «как собрать» цикл (слои, персистентность, верификация)

Открытые вопросы

когда хватает context window, а когда нужна vector DB
как мерить tool calling accuracy на своём домене