Суть
- Мозг — LLM: reasoning + planning, решает «что делать дальше».
- Инструменты — function calling: «руки» агента — API, shell, браузер, запросы к БД, вычисления.
- Память: краткосрочная (контекст сессии) + долгосрочная (vector DB, файлы, прошлые траектории).
- База знаний — RAG: справочники, документация, данные компании; защита от галлюцинаций.
Зачем это нужно
Главная причина провала агентов (по AgentBench) — слабые long-term reasoning и decision-making у мозга-LLM, а не нехватка инструментов. Поэтому компоненты проектируют осознанно, а не по принципу «дай агенту 50 инструментов».
Как работает
- Мозг — критичные способности: instruction following, long-term reasoning (держать цель 30+ шагов), tool calling accuracy, error recovery.
- Инструменты: модель возвращает JSON с именем функции и аргументами (спецификация через JSON Schema: name / description / parameters). Хороший
descriptionинструмента решает больше, чем выбор модели. Анти-паттерн: 50+ инструментов в одном агенте → падает точность, дробите на subagents (см. Tool Calling). - Память — 4 вида: context window (что в промпте сейчас), conversation history (прошлые ходы сессии), long-term (vector DB: Qdrant / Pinecone / pgvector), episodic (логи прошлых успехов и провалов).
- База знаний: RAG =
запрос → поиск в БД → inject в контекст → генерация(см. RAG). Tools + knowledge base под единым интерфейсом = MCP.
Пример
agent = Agent(
brain = LLM("gpt-5-mini"), # 1. мозг
tools = [search_web, query_db], # 2. руки (JSON Schema)
memory = VectorStore("qdrant"), # 3. долгосрочная память
knowledge = RAG(company_docs), # 4. база знаний
)
Альтернативный взгляд: «агент = 90% классическая инженерия»
Лекция по сборке агентного цикла смещает фокус с «из чего агент состоит» на «как его собрать надёжно». Тезис: агенты на ~90% — это классическая инженерия, а не «магия LLM» и не фреймворк. Вместо 4 компонентов-организма агент раскладывается на ~10 инженерных слоёв (Thinking Channel, Best-of-N, SQLite-DAG, Self-Healing Master Loop, Tool Grounding, Definition of Done, Architect/Editor, Prompt Caching, Bi-temporal Memory, MCP). Главное в надёжности — не «мозг», а устойчивость (персистентный Task DAG, переживающий рестарт) и внешняя верификация, а не доверие модели самой себе. Подробнее — Agent Architecture.
Альтернативный взгляд
Те же компоненты, но через метафору «организма»: Модель (Brain) — рассуждения, Инструменты (Hands) — действия, Оркестрация (Nervous System) — управление жизненным циклом, Инфраструктура (Environment) — среда обитания (логи, надёжность, память). Модель здесь — лишь «двигатель», который сам по себе бесполезен: ценность создаёт обвязка. Это смещает фокус с «какую LLM взять» на «как спроектированы оркестрация (Plan and Execute) и инфраструктура». Полезное правило отсюда: инструмент должен быть детерминированным, а из agentic-loop выходим в т.ч. по условию No Progress.
Связано с
- AI Agent — что такое агент в целом
- ReAct — цикл, использующий эти компоненты
- Tool Calling — подробнее про «руки» агента
- RAG — база знаний агента
- Agent Architecture — «как собрать» цикл (слои, персистентность, верификация)
Открытые вопросы
- когда хватает context window, а когда нужна vector DB
- как мерить tool calling accuracy на своём домене