Новые роли, возникающие благодаря ИИ

Кто будет востребован для создания ИИ-агентных систем

Рубрика: статья

Автор: Артем Пичугин

Время чтения: 10 мин


Степень использования AI в создании этого материала: текст написан в значительной степени человеком, некоторые отрывки — перевод исходной статьи при помощи AI, текст отредактирован при помощи AI и человека.

Мы считаем важным открыто информировать о том, в какой степени ИИ использовался в написании материала, поскольку только такой подход способен создавать доверие между нами и читателем.
Эта статья написана по мотивам поста на платформе Medium под названием Agentic AI Engineering: The Blueprint for Production-Grade AI Agents. Его автором является Yi Zhou, Award-Winning CTO & CIO, AI Thought Leader, LinkedIn Top Voice, Voting Member of MITA AI Committee. Также он написал книгу “Agentic AI Engineering: The Definitive Field Guide to Building Production-Grade Cognitive Systems”.
В своем тексте он рассуждает о задачах и областях знаний, необходимых для внедрения ИИ-агентов на уровне промышленной эксплуатации. Мы же попробовали сделать шаг дальше — и представить, какие профессии могут появиться и стать востребованными в ближайшем будущем.
5 элементов
Автор, исходя из своего опыта, выделил 5 ключевых направлений-элементов, необходимых для создания зрелого агента в корпоративном ландшафте.
  1. Context Engineering. Ключевая задача — подавать на вход модели правильную информацию в правильное время.
  2. Workflow Engineering. Основной фокус на том, чтобы структурировать поведение агента в многоступенчатый декомпозированный процесс.
  3. Model Engineering. В рамках этого этапа важно выбрать правильную модель и дотюнить ее под задачу.
  4. AgenticOps. Сюда входит: тестирование, мониторинг, безопасность и оптимизация агентов под продакшен.
  5. AgenticUX. Здесь важным является создание интерфейсов, которые сделают действия агентов прозрачным, контролируемыми и вызывающими доверие.
Во многих организациях всеми этими направлениями может заниматься один-два человека. На уровне подготовки прототипа, вероятно, их компетенций может быть достаточно. Однако, далее проект может буксовать, если в эту проектную команду не добавить людей, имеющих требуемые навыки. Пройдемся по этим ролям.
1. Context Engineer
Эту роль мы частично затрагивали в материале про создание RAG в корпоративном ландшафте. Там мы говорили о неком «архивариусе», который следит за качеством исходной базы документов и поддерживает его. Здесь же роль этого специалиста шире и в этот самый контекст, которым он управляет, входит:
  • Cистемный промпт: из какой роли агент выполняет задачу, каков образ результата и каких правил нужно придерживаться при ее выполнении.
  • Текущий запрос пользователя: то, что он написал прямо сейчас.
  • Краткосрочная память: последние шаги, история этого диалога, предпринятые действия.
  • Долгосрочная память: важные факты, предпочтения, результаты прошлых задач.
  • Извлеченные знания: релевантные документы из внешних источников.
  • Инструменты: API, MCP, калькуляторы, функции и другие агенты.
Задача контекст-инженера в том, чтобы быть куратором этого контекста для достижения релевантности, ясности и полноты информации. Правило “garbage in — garbage out” по-прежнему применимо и важно: если на вход даже самой продвинутой модели подать нерелевантную или чрезмерно избыточную информацию, то она вряд ли сможет дать качественный ответ.
Контекст-инжиниринг — это не только про то, чтобы добавить информацию в контекст, но и про то, чтобы из него что-то убрать.
Причем это может зависеть и от этапа задачи, на которой находится агент: какие-то данные могут быть лишними в начале, но абсолютно необходимыми в конце.
В своем посте автор делится кейсом, как они смогли снизить «галлюцинации» их ИИ-агента в сфере здравоохранения:
  • Суммаризировали длинные истории болезни пациентов вместо вставки сырых данных из электронной медицинской книжки.
  • Использовали структурированные результаты работы инструментов в виде таблиц, а не свободного текста.
  • Выделяли только самые релевантные найденные клинические рекомендации.
2. Workflow Engineer
Еще одна из ключевых ролей. По большому счету именно этот человек отвечает за бизнес-результат, которого достигнет AI-агент. В его задачи входит:
  • Описать и продумать весь процесс продвижения к результату и передать эти знания в качестве серии промптов в LLM.
  • Продумать общую агентную архитектуру: из каких блоков, каких источников данных, каких промежуточных чекпоинтов должен состоять этот процесс, а также где здесь будет задействован человек.
В качестве примера автор приводит следующий кейс в финансовой сфере. Первым подходом к снаряду было просто сказать LLM: «проанализируй эти 200 счетов и найди любые переплаты». LLM не смогла дать качественного ответа. В следующей итерации был разработан полноценный воркфлоу:
  1. Фильтрация: отмечаем подозрительные счета с помощью эвристик.
  2. Группировка: объединяем по поставщику, сумме и дате.
  3. Анализ: подключаем LLM для поиска дублирующихся начислений в каждой группе.
  4. Объяснение: генерируем причину («возможный дубликат от 14.02 с наценкой 15%»).
  5. Рекомендация: предлагаем дальнейшие действия — ручная проверка или автоматизация.
Несмотря на то что ИИ-агенты становятся все умнее, и у них под капотом находятся рассуждающие LLM, они далеко не всегда могут телепатически понять, что конкретно в вашей организации или в вашем отделе понимается под тем или иным термином.
Что есть такое «переплата»? Каждый из шагов выше имел свой контекст, образ результата и метрику качества.
В другом кейсе автор приводит снова пример ИИ-агента из сферы здравоохранения: пока агенту явным образом не было сказано перепроверять интерпретацию лабораторных анализов до вынесения заключения, агент этого не делал, и приходил зачастую к неверным выводам.
3. AI-model Engineer
Человек в этой роли — тот самый эксперт, который разбирается в огромном многообразии моделей и может подобрать правильные модели под разрабатываемый воркфлоу. Казалось бы, можно просто взять самую умную и продвинутую модель на рынке, но выбор модели — это всегда trade-off между производительностью, затратами, скоростью работы и данными, с которыми она лучше всего работает.
На данный момент верхнеуровнево выбор может касаться следующих типов моделей:
  • Крупные универсальные LLM, такие как GPT-5 или Claude Opus — мощные инструменты для сложных рассуждений, синтеза информации и работы с длинным контекстом.
  • Более компактные и быстрые модели, например Claude Sonnet или Mistral — отлично подходят для простых логических операций, структурированных задач или когда важна минимальная задержка.
  • Open-source модели, такие как LLaMA или Gemma — оптимальны, когда критичны приватность, кастомизация или контроль над затратами.
  • Мультимодальные модели, например Gemini или GPT-5 — незаменимы для агентов, которым нужно «видеть», «читать», «слушать» или генерировать контент в разных форматах (текст, изображение, аудио).
В реальных кейсах часто это бывает ансамбль из разных моделей. Большая модель может быть планировщиком, компактная модель — исполнителем простых задач, локальные модели могут работать с конфиденциальной информацией, мультимодальные могут анализировать разнородный контекст. При этом есть еще отдельные модели под работу с изображениями, видео, звуком, распознаванием и генерацией речи и мн. др. Соответственно, этот человек должен хорошо разбираться во всех нюансах этих моделей, держать руку на пульсе, чтобы под необходимые бизнес-требования и под проектируемый воркфлоу подобрать оптимальные модели под каждый из этапов.
Полезность такого подхода опять же подкрепляется кейсом автора поста, касающегося финансовой сферы. В рамках него они использовали Claude Opus только для сложных задач и задач с размытыми формулировками, а небольшие open-source модели для конкретной задачи — классификации счетов. Такой баланс увеличил скорость работы воркфлоу на 40% и снизил издержки на 60%, при этом нисколько не потеряв в качестве.
Хорошо работающий AI-агент — этот тот, который думает ровно столько, сколько необходимо, дает ответ ровно тогда, когда необходимо, и ровно в том виде, как это необходимо.
Под его капотом при этом лежит не одна лучшая модель, а лучшая система разных моделей, которая работает как команда.
4. AgenticOps
AgenticOps — это в некотором смысле объединение MLOps и DevOps. Здесь скорее всего нужен будет даже не один специалист, а несколько. Так или иначе, основная задача этой части построения агентной системы заключается в том, чтобы ИИ-агент работал в продакшн-среде предсказуемо, контролируемо и прозрачно. Эта сфера деятельности включает в себя:
  • Оценку (evals): измерение качества, поведения и точности работы агента.
  • Наблюдаемость: логирование каждого решения, вызова инструмента и ответа модели.
  • Защитные механизмы: обеспечение соответствия политике, нормативам и этическим стандартам.
  • Безопасность: предотвращение атак через инъекции, злоупотреблений или утечек данных.
  • Оптимизацию: устранение задержек, улучшение пропускной способности и снижение стоимости на этапе исполнения.
  • Управление жизненным циклом: версионирование, откаты к предыдущим версиям, CI/CD и мониторинг «дрейфа» агента.
ИИ-агент ровно так же нуждается в тестировании, как и классическое программное обеспечение. Отличие заключается лишь в том, что ИИ-агент обладает стохастической природой, а это в свою очередь означает, что теперь необходимо покрыть каждый сценарий большим количеством запусков агента, чтобы убедиться в том, что его результат соответствует ожидаемому.
Это требует следующих подходов к тестированию:
  • Сценарные тесты: симулируют реальные задачи и оценивают работу агента в десятках или сотнях вариантов.
  • Регрессионные тесты: выявляют, ухудшилось ли поведение после обновлений моделей (и да, это случается неожиданно часто).
  • Поведенческие тесты: проверяют на соответствие этическим, юридическим и брендовым стандартам.
  • Тесты интеграции с инструментами: убеждаются, что агент стабильно парсит, вызывает и обрабатывает результаты инструментов.
Если этого не сделать, то тестированием будут заниматься конечные пользователи со всеми вытекающими репутационными и операционными рисками.
Безопасность также является важной задачей для этой сферы деятельности. Здесь среди инструментов могут быть контент-фильтры поверх выдачи LLM-модели, ограничение доступов к инструментами и методам, работа в изолированном окружении и др. Каждое действие агента должно логироваться, чтобы затем иметь возможность разобраться, на каком этапе агент поступил неверно. Также необходимо продумать инструменты, которые обезопасят агента от промпт-инъекций и чрезмерного расхода токенов.
Автор поста приводит пример из практики, как промпт-инъекция видоизменяла исходный промпт агента, что меняло стилистику email-письма с дружелюбного на агрессивный. В результате им пришлось создать двухуровневую систему модерации контента, чтобы предотвращать это.
Оптимизация работы AI-агента является еще одним фокусом внимания в этой сфере деятельности. Например, популярным методом оптимизации является кэширование результатов некоторых этапов работы агента, которые могут быть затем переиспользованы в следующих запусках. В примере автора за счет этого удалось уменьшить среднее время работы LLM-модели на 2 секунды за счет кэширования результата этапа рассуждения, используемого в 40% запросов к этому агенту.
5. AgenticUX Engineer
Представим на секунду, что к текущему моменту, успешно пройдя все предыдущие стадии, мы построили лучшего ИИ-агента: безошибочно рассуждает, использует по назначению инструменты, придерживается необходимых политик, работает быстро и прозрачно.
Однако, люди могут по-прежнему не использовать его, поскольку он неудобен, ему не доверяют, он требует слишком много дополнительных действий и проще в итоге сделать самому.
В данном случае речь идет об user experience (UX). Пользовательский опыт взаимодействия с агентом может отличаться, а может быть и чем-то похож на классическое ПО. Человек хочет понимать:
  • Что прямо сейчас делает ИИ-агент.
  • Почему агент сделал это действие.
  • Что он планирует сделать дальше и может ли он это изменить.
  • Может ли он доверять результату.
  • Может ли он отменить или улучшить результат.
У агента должны быть пользовательские настройки для управления результатом и процессом, возможность править черновики, возможность давать разрешение на действие, перезапускать процесс, дать обратную связь на результат. Даже тон и характер того, как ИИ-агент пишет и разговаривает — это тоже часть UX. ИИ-агент, выполняющий юридические задачи, может быть сухим и кратким, а агент, отвечающий за рекламный креатив, может быть более живым и использовать жаргонизмы. И это тоже отдельная область знаний и сфера деятельности.
Заключение
Понимая масштаб задач, необходимых для внедрения ИИ-агента в компании, мы можем очертить пул новых ролей. Как когда-то мы начали выделять такие специальности как data scientist, data engineer, ML engineer, data analyst и др., так и сейчас мы можем наблюдать формирование спроса на отдельные профессии, связанные с AI.
Эти роли не абсолютно новые — их корни в DS и классической разработке ПО. Но теперь к ним добавляется специфика: глубокое понимание ИИ и его применения в корпоративном ландшафте. Чтобы получить комплексное образовательное решение в вашей компании, вы можете обратиться к нам, выбрав соответствующую программу.
Другие материалы нашего блога