Новые роли, возникающие благодаря ИИ

Кто будет востребован для создания ИИ-агентных систем

Рубрика: статья

Автор: Артем Пичугин

Время чтения: 10 мин

Степень использования AI в создании этого материала: текст написан в значительной степени человеком, некоторые отрывки — перевод исходной статьи при помощи AI, текст отредактирован при помощи AI и человека.

Мы считаем важным открыто информировать о том, в какой степени ИИ использовался в написании материала, поскольку только такой подход способен создавать доверие между нами и читателем.

Эта статья написана по мотивам поста на платформе Medium под названием Agentic AI Engineering: The Blueprint for Production-Grade AI Agents. Его автором является Yi Zhou, Award-Winning CTO & CIO, AI Thought Leader, LinkedIn Top Voice, Voting Member of MITA AI Committee. Также он написал книгу “Agentic AI Engineering: The Definitive Field Guide to Building Production-Grade Cognitive Systems”.

В своем тексте он рассуждает о задачах и областях знаний, необходимых для внедрения ИИ-агентов на уровне промышленной эксплуатации. Мы же попробовали сделать шаг дальше — и представить, какие профессии могут появиться и стать востребованными в ближайшем будущем.

5 элементов

Автор, исходя из своего опыта, выделил 5 ключевых направлений-элементов, необходимых для создания зрелого агента в корпоративном ландшафте.

Источник: Agentic AI Engineering: The Blueprint for Production-Grade AI Agents

Context Engineering. Ключевая задача — подавать на вход модели правильную информацию в правильное время.
Workflow Engineering. Основной фокус на том, чтобы структурировать поведение агента в многоступенчатый декомпозированный процесс.
Model Engineering. В рамках этого этапа важно выбрать правильную модель и дотюнить ее под задачу.
AgenticOps. Сюда входит: тестирование, мониторинг, безопасность и оптимизация агентов под продакшен.
AgenticUX. Здесь важным является создание интерфейсов, которые сделают действия агентов прозрачным, контролируемыми и вызывающими доверие.

Во многих организациях всеми этими направлениями может заниматься один-два человека. На уровне подготовки прототипа, вероятно, их компетенций может быть достаточно. Однако, далее проект может буксовать, если в эту проектную команду не добавить людей, имеющих требуемые навыки. Пройдемся по этим ролям.

1. Context Engineer

Эту роль мы частично затрагивали в материале про создание RAG в корпоративном ландшафте. Там мы говорили о неком «архивариусе», который следит за качеством исходной базы документов и поддерживает его. Здесь же роль этого специалиста шире и в этот самый контекст, которым он управляет, входит:

Cистемный промпт: из какой роли агент выполняет задачу, каков образ результата и каких правил нужно придерживаться при ее выполнении.
Текущий запрос пользователя: то, что он написал прямо сейчас.
Краткосрочная память: последние шаги, история этого диалога, предпринятые действия.
Долгосрочная память: важные факты, предпочтения, результаты прошлых задач.
Извлеченные знания: релевантные документы из внешних источников.
Инструменты: API, MCP, калькуляторы, функции и другие агенты.

Задача контекст-инженера в том, чтобы быть куратором этого контекста для достижения релевантности, ясности и полноты информации. Правило “garbage in — garbage out” по-прежнему применимо и важно: если на вход даже самой продвинутой модели подать нерелевантную или чрезмерно избыточную информацию, то она вряд ли сможет дать качественный ответ.

Контекст-инжиниринг — это не только про то, чтобы добавить информацию в контекст, но и про то, чтобы из него что-то убрать.

Причем это может зависеть и от этапа задачи, на которой находится агент: какие-то данные могут быть лишними в начале, но абсолютно необходимыми в конце.

В своем посте автор делится кейсом, как они смогли снизить «галлюцинации» их ИИ-агента в сфере здравоохранения:

Суммаризировали длинные истории болезни пациентов вместо вставки сырых данных из электронной медицинской книжки.
Использовали структурированные результаты работы инструментов в виде таблиц, а не свободного текста.
Выделяли только самые релевантные найденные клинические рекомендации.

2. Workflow Engineer

Еще одна из ключевых ролей. По большому счету именно этот человек отвечает за бизнес-результат, которого достигнет AI-агент. В его задачи входит:

Описать и продумать весь процесс продвижения к результату и передать эти знания в качестве серии промптов в LLM.
Продумать общую агентную архитектуру: из каких блоков, каких источников данных, каких промежуточных чекпоинтов должен состоять этот процесс, а также где здесь будет задействован человек.

В качестве примера автор приводит следующий кейс в финансовой сфере. Первым подходом к снаряду было просто сказать LLM: «проанализируй эти 200 счетов и найди любые переплаты». LLM не смогла дать качественного ответа. В следующей итерации был разработан полноценный воркфлоу:

Фильтрация: отмечаем подозрительные счета с помощью эвристик.
Группировка: объединяем по поставщику, сумме и дате.
Анализ: подключаем LLM для поиска дублирующихся начислений в каждой группе.
Объяснение: генерируем причину («возможный дубликат от 14.02 с наценкой 15%»).
Рекомендация: предлагаем дальнейшие действия — ручная проверка или автоматизация.

Несмотря на то что ИИ-агенты становятся все умнее, и у них под капотом находятся рассуждающие LLM, они далеко не всегда могут телепатически понять, что конкретно в вашей организации или в вашем отделе понимается под тем или иным термином.

Что есть такое «переплата»? Каждый из шагов выше имел свой контекст, образ результата и метрику качества.

В другом кейсе автор приводит снова пример ИИ-агента из сферы здравоохранения: пока агенту явным образом не было сказано перепроверять интерпретацию лабораторных анализов до вынесения заключения, агент этого не делал, и приходил зачастую к неверным выводам.

3. AI-model Engineer

Человек в этой роли — тот самый эксперт, который разбирается в огромном многообразии моделей и может подобрать правильные модели под разрабатываемый воркфлоу. Казалось бы, можно просто взять самую умную и продвинутую модель на рынке, но выбор модели — это всегда trade-off между производительностью, затратами, скоростью работы и данными, с которыми она лучше всего работает.

На данный момент верхнеуровнево выбор может касаться следующих типов моделей:

Крупные универсальные LLM, такие как GPT-5 или Claude Opus — мощные инструменты для сложных рассуждений, синтеза информации и работы с длинным контекстом.
Более компактные и быстрые модели, например Claude Sonnet или Mistral — отлично подходят для простых логических операций, структурированных задач или когда важна минимальная задержка.
Open-source модели, такие как LLaMA или Gemma — оптимальны, когда критичны приватность, кастомизация или контроль над затратами.
Мультимодальные модели, например Gemini или GPT-5 — незаменимы для агентов, которым нужно «видеть», «читать», «слушать» или генерировать контент в разных форматах (текст, изображение, аудио).

В реальных кейсах часто это бывает ансамбль из разных моделей. Большая модель может быть планировщиком, компактная модель — исполнителем простых задач, локальные модели могут работать с конфиденциальной информацией, мультимодальные могут анализировать разнородный контекст. При этом есть еще отдельные модели под работу с изображениями, видео, звуком, распознаванием и генерацией речи и мн. др. Соответственно, этот человек должен хорошо разбираться во всех нюансах этих моделей, держать руку на пульсе, чтобы под необходимые бизнес-требования и под проектируемый воркфлоу подобрать оптимальные модели под каждый из этапов.

Полезность такого подхода опять же подкрепляется кейсом автора поста, касающегося финансовой сферы. В рамках него они использовали Claude Opus только для сложных задач и задач с размытыми формулировками, а небольшие open-source модели для конкретной задачи — классификации счетов. Такой баланс увеличил скорость работы воркфлоу на 40% и снизил издержки на 60%, при этом нисколько не потеряв в качестве.

Хорошо работающий AI-агент — этот тот, который думает ровно столько, сколько необходимо, дает ответ ровно тогда, когда необходимо, и ровно в том виде, как это необходимо.

Под его капотом при этом лежит не одна лучшая модель, а лучшая система разных моделей, которая работает как команда.

4. AgenticOps

AgenticOps — это в некотором смысле объединение MLOps и DevOps. Здесь скорее всего нужен будет даже не один специалист, а несколько. Так или иначе, основная задача этой части построения агентной системы заключается в том, чтобы ИИ-агент работал в продакшн-среде предсказуемо, контролируемо и прозрачно. Эта сфера деятельности включает в себя:

Оценку (evals): измерение качества, поведения и точности работы агента.
Наблюдаемость: логирование каждого решения, вызова инструмента и ответа модели.
Защитные механизмы: обеспечение соответствия политике, нормативам и этическим стандартам.
Безопасность: предотвращение атак через инъекции, злоупотреблений или утечек данных.
Оптимизацию: устранение задержек, улучшение пропускной способности и снижение стоимости на этапе исполнения.
Управление жизненным циклом: версионирование, откаты к предыдущим версиям, CI/CD и мониторинг «дрейфа» агента.

ИИ-агент ровно так же нуждается в тестировании, как и классическое программное обеспечение. Отличие заключается лишь в том, что ИИ-агент обладает стохастической природой, а это в свою очередь означает, что теперь необходимо покрыть каждый сценарий большим количеством запусков агента, чтобы убедиться в том, что его результат соответствует ожидаемому.

Это требует следующих подходов к тестированию:

Сценарные тесты: симулируют реальные задачи и оценивают работу агента в десятках или сотнях вариантов.
Регрессионные тесты: выявляют, ухудшилось ли поведение после обновлений моделей (и да, это случается неожиданно часто).
Поведенческие тесты: проверяют на соответствие этическим, юридическим и брендовым стандартам.
Тесты интеграции с инструментами: убеждаются, что агент стабильно парсит, вызывает и обрабатывает результаты инструментов.

Если этого не сделать, то тестированием будут заниматься конечные пользователи со всеми вытекающими репутационными и операционными рисками.

Безопасность также является важной задачей для этой сферы деятельности. Здесь среди инструментов могут быть контент-фильтры поверх выдачи LLM-модели, ограничение доступов к инструментами и методам, работа в изолированном окружении и др. Каждое действие агента должно логироваться, чтобы затем иметь возможность разобраться, на каком этапе агент поступил неверно. Также необходимо продумать инструменты, которые обезопасят агента от промпт-инъекций и чрезмерного расхода токенов.

Автор поста приводит пример из практики, как промпт-инъекция видоизменяла исходный промпт агента, что меняло стилистику email-письма с дружелюбного на агрессивный. В результате им пришлось создать двухуровневую систему модерации контента, чтобы предотвращать это.

Оптимизация работы AI-агента является еще одним фокусом внимания в этой сфере деятельности. Например, популярным методом оптимизации является кэширование результатов некоторых этапов работы агента, которые могут быть затем переиспользованы в следующих запусках. В примере автора за счет этого удалось уменьшить среднее время работы LLM-модели на 2 секунды за счет кэширования результата этапа рассуждения, используемого в 40% запросов к этому агенту.

5. AgenticUX Engineer

Представим на секунду, что к текущему моменту, успешно пройдя все предыдущие стадии, мы построили лучшего ИИ-агента: безошибочно рассуждает, использует по назначению инструменты, придерживается необходимых политик, работает быстро и прозрачно.

Однако, люди могут по-прежнему не использовать его, поскольку он неудобен, ему не доверяют, он требует слишком много дополнительных действий и проще в итоге сделать самому.

В данном случае речь идет об user experience (UX). Пользовательский опыт взаимодействия с агентом может отличаться, а может быть и чем-то похож на классическое ПО. Человек хочет понимать:

Что прямо сейчас делает ИИ-агент.
Почему агент сделал это действие.
Что он планирует сделать дальше и может ли он это изменить.
Может ли он доверять результату.
Может ли он отменить или улучшить результат.

У агента должны быть пользовательские настройки для управления результатом и процессом, возможность править черновики, возможность давать разрешение на действие, перезапускать процесс, дать обратную связь на результат. Даже тон и характер того, как ИИ-агент пишет и разговаривает — это тоже часть UX. ИИ-агент, выполняющий юридические задачи, может быть сухим и кратким, а агент, отвечающий за рекламный креатив, может быть более живым и использовать жаргонизмы. И это тоже отдельная область знаний и сфера деятельности.

Заключение

Понимая масштаб задач, необходимых для внедрения ИИ-агента в компании, мы можем очертить пул новых ролей. Как когда-то мы начали выделять такие специальности как data scientist, data engineer, ML engineer, data analyst и др., так и сейчас мы можем наблюдать формирование спроса на отдельные профессии, связанные с AI.

Эти роли не абсолютно новые — их корни в DS и классической разработке ПО. Но теперь к ним добавляется специфика: глубокое понимание ИИ и его применения в корпоративном ландшафте. Чтобы получить комплексное образовательное решение в вашей компании, вы можете обратиться к нам, выбрав соответствующую программу.

Другие материалы нашего блога