How are autonomous agents verified at ISSLAB?

We use SMT Verification to ensure that autonomous agents adhere to predefined institutional constraints.

Прототипы

Действующий прототип автономного агента в непрерывной эксплуатации. Императивная реализация архитектурных принципов, формализуемых программой института через SMT-верификацию.

Контекст

Институт поддерживает действующий прототип автономного агента, развёрнутый в непрерывной эксплуатации с 24 апреля 2026 года. Прототип функционирует в режиме 24/7 и выступает в качестве операционной базы для исследовательской программы института.

Прототип реализует архитектурные принципы программы — детерминированное принуждение к политике, дисциплину провенанса, структурную верификацию критических действий — на императивном уровне. Программа института формализует эти же принципы через SMT-верификатор и аксиоматику на логике первого порядка, обеспечивая математическую гарантию корректности и применимость к регулируемым профессиональным средам.

Функциональное назначение

Прототип обслуживает фидуциарные задачи оператора в закрытом периметре: работу с почтовыми очередями нескольких почтовых ящиков, управление календарём, сопровождение юридических дел, ведение рабочих заметок, обработку голосового ввода. Взаимодействие с оператором осуществляется через защищённый Telegram-канал. Все критические действия требуют явного подтверждения оператора через inline-интерфейс и не исполняются без подтверждения.

Четырёхслойная архитектура верификации действий

Прототип реализует четыре независимых слоя верификации. Каждый слой фиксируется в архитектурных решениях института (ADR) и прослеживается в исходном коде.

Слой первый. Эпистемическая триажная классификация. Каждая единица входящей информации проходит обязательную классификацию на три эпистемические категории: установленный факт, гипотеза, информационный шум. Классификатор построен по схеме приоритетного rule-based ядра с резервным запросом к языковой модели. Эпистемический тег сохраняется как неотъемлемый атрибут записи и сопровождает её на всех последующих этапах обработки.

Слой второй. Теговая архитектура подтверждения критических действий. Пять классов критических операций — создание, удаление и обновление событий календаря, фиксация обучающих правил, обновление сущностей юридического дела — маркируются структурными тегами в ответе языковой модели. Теги парсятся и транслируются в inline-интерфейс оператора. Без явного callback-подтверждения действие архитектурно не исполняется. Пропуск этого слоя невозможен без изменения исходного кода.

Слой третий. Многобоксовое согласование. Для критических классов действий запускается независимая верификация вторым поставщиком языковой модели. Несогласие боксов фиксируется в журнале и доводится до сведения оператора.

Слой четвёртый. Жёсткое бюджетное ограничение. Финансовый страж отслеживает совокупные расходы на вызовы языковых моделей в рамках одной задачи. При достижении жёсткого порога вызов блокируется через исключение уровня времени исполнения. Пропуск этого слоя невозможен.

Дисциплина провенанса и памяти

Прототип ведёт многослойную память с фиксацией источников на уровне каждой записи.

Постоянное хранилище реализовано на векторной базе ChromaDB и включает пять коллекций: почтовый корпус, индекс рабочих заметок, индекс документов, журнал достижений, манифестный регистр. Каждая запись сопровождается метаданными источника, хешем содержимого и временными метками индексации. Почтовые записи дополнительно маркируются приоритетной категорией и эпистемическим тегом.

Рабочая оперативная память реализована на SQLite и хранит диалоговые ходы с ограниченным сроком удержания. Структурированные стабильные знания ведутся в каталоге Markdown-файлов — сессионные журналы, одобренные оператором эвристики, журнал обучающих правил.

Консолидационный цикл работает по расписанию в ночной режим и формирует производные обобщения из накопленного дневного опыта.

Инженерная база

Прототип построен на открытом технологическом стеке без привязки к платформенному оператору: Python 3.12, асинхронный Telegram-фреймворк, ChromaDB, sentence-transformers. Системная служба развёрнута на сервере через systemd. Тестовая база насчитывает свыше ста сорока модульных тестов и диагностические процедуры retrieval-контура.

Методологическая документация ведётся в формате архитектурных решений (ADR) и пронумерованной дорожной карты научно-исследовательских и опытно-конструкторских работ. Наиболее значимые решения, зафиксированные на момент публикации — классификатор эпистемической триажной обработки (ADR-014) и многобоксовое согласование критических действий (ADR-0005). В дорожной карте выделена позиция по интеграции SMT-верификации критических исправлений (NIOKR-N8); её активация предусмотрена в рамках Фазы I программы института.

Отношение к программе института

Прототип реализует архитектурные принципы программы института на императивном уровне — через обязательный approve-flow критических действий, жёсткие бюджетные ограничения, структурную эпистемическую классификацию и независимую многобоксовую верификацию. Этот уровень реализации обеспечивает операционную устойчивость в рамках закрытого периметра одного оператора, но не предоставляет математической гарантии корректности, необходимой для регулируемых профессиональных сред.

Программа института формализует эти же принципы через SMT-верификатор Z3 и аксиоматику на логике первого порядка. Формализация переводит архитектурную дисциплину из области инженерной практики в область доказуемых свойств, что делает её применимой к требованиям 187-ФЗ, 117-ФСТЭК, ГОСТ Р 57580 и аналогичных регуляторных контуров.

Прототип сохраняется в качестве эталонной среды для отработки переноса принципов из императивной реализации в формализованную и выступает операционной площадкой на всех фазах программы.

Публикация и верификация

Описанная архитектура подтверждается публикацией исходного кода в открытом репозитории института. Ссылки на архитектурные решения, дорожную карту и тестовую базу раскрываются по мере стабилизации соответствующих компонентов и согласования с требованиями грантовых и партнёрских соглашений.

Статус: в эксплуатации с 24 апреля 2026. Режим работы — непрерывный. Ответственные компоненты архитектуры фиксируются в ADR-регистре института.