Agent Sandboxing

status/volatile «Стандарт 2026», список технологий (Firecracker, E2B, Docker Sandboxes) и тайминги (~150 мс) быстро устаревают. Ревизия раз в квартал.

Суть

Любая защита на уровне промпта пробиваема, поэтому последний барьер — аппаратная граница. Если агенту дали инструменты execute_code / bash, изоляция исполнения обязательна: даже при успешном Tool Hijacking ущерб ограничен изолированной машиной.

Зачем это нужно

Это «ограничение последствий» — то, на что упирается даже «сорвавшаяся» после Jailbreak Attacks модель. Для computer-use агентов (Computer Use) изоляция — часть базовой защиты (никогда не на хосте, не маунтить docker.sock).

Как работает (спектр изоляции)

Технология	Изоляция	Старт	Когда
Docker-контейнеры	Слабая — все делят одно ядро ОС хоста	Медленнее VM-микро	Обычный веб-сервис (Next.js)
VM	Сильная	Секунды, большой overhead	Когда нужна полная изоляция, скорость неважна
E2B / Firecracker microVM	Сильная (своё ядро через KVM)	~150 мс	Агент с `execute_code` / bash — золотой стандарт

Firecracker (от AWS, та же технология, что AWS Lambda):

Каждый microVM получает изолированное ядро через KVM (аппаратная виртуализация) — выйти за периметр невозможно.
Написан на Rust — исключает целые классы уязвимостей (buffer overflow, memory safety).
Минималистичная модель устройств; изоляция процесса через cgroups, namespaces, seccomp BPF; сам процесс заперт через утилиту Jailer.
microVM даёт полноценную среду (включая Docker внутри) без доступа к хосту.
Scoped permissions — каждый microVM получает только нужные для задачи права.

Тренд 2026: в апреле 2026 Docker выпустил Sandboxes — каждый агент в microVM с приватным Docker внутри (Docker признал, что собственной изоляции контейнеров для агентных нагрузок недостаточно).

Спорный/устаревающий тезис Ранее Docker считался достаточной основой деплоя агента. Для агентов с доступом к коду это устаревает: «докер-контейнеры — это медленно… их изоляции недостаточно для агентных нагрузок». Для обычного веб-сервиса Docker по-прежнему ок.

Связано с

Tool Hijacking — что именно ограничивает sandbox
Jailbreak Attacks — «ограничение последствий» сорвавшейся модели
Guardrails — sandbox как Action-слой защиты
Computer Use — Firecracker/gVisor для агента, управляющего экраном
Agent Security — место изоляции в модели угроз

Открытые вопросы

E2B (managed) vs self-hosted Firecracker — где граница по стоимости/контролю?