CDO больше не про данные?

Как руководитель данных трансформируется в эпоху искусственного интеллекта

Интервью с Александром Шевкуновым

Рубрика: интервью

Автор: Елена Третьякова

Время чтения: 10 мин


Степень использования AI в создании этого материала: составление лонг-листа вопросов, расшифровка беседы, генерация вступительной части.

Мы считаем важным открыто информировать о том, в какой степени ИИ использовался в написании материала, поскольку только такой подход способен создавать доверие между нами и читателем.
Фото из личного архива Александра Шевкунова
Недавно мы пообщались с Александром Шевкуновым, экс-CDO билайна. Александр больше 15 лет занимается большими данными и ИИ. Среди компаний, в которых он успел поработать помимо билайна были: «Сбер», «Яндекс», Райффайзенбанк, Альфа-банк. Сам он себя называет «CDO с богатым опытом создания возможностей по монетизации данных».

В ходе нашей беседы Александр не только раскрыл эволюцию роли CDO и ключевые вызовы современного мира данных, но и поделился своим видением стратегий работы с большими данными и ИИ-трансформации. Мы подробно обсудили, с какими главными проблемами сталкиваются компании при работе с данными и как их эффективно преодолевают. Особое внимание уделили этическому аспекту применения ИИ и развеяли популярный страх «нас заменит ИИ, мы останемся без работы». Кроме того, Александр подробно рассказал о недавнем проекте внедрения GenAI, который наглядно демонстрирует потенциал технологии.
– Александр, расскажите, какие сейчас вызовы стоят перед CDO и его командой?

– Есть классическое понимание роли CDO и его команды в компании – инфраструктурное, методологическое и процессное управление данными, когда мы относимся к данным как к активу, из которого можно извлекать ценность. И с этой точки зрения главный вызов — экспоненциальный рост данных, которые компания может собирать или собирает. В этих реалиях подход, когда мы, глядя на данные в каком-то из доменов внутри компании, начинаем их описывать скоро зайдет в тупик: данные будут расти быстрее, чем наши возможности их описывать.

Я убежден, что эффективный подход по управлению данными — превентивный.
Мы должны встраивать подходы и инструменты Data Governance в производственные процессы разработки IT-продуктов, чтобы минимизировать проблемы с данными в самом зародыше. Впервые с такой концепцией мы начали работать в билайне и сделали это основой стратегии Data Governance.
– А как на горизонте 3-5 лет, на ваш взгляд, будет меняться роль CDO в связи с использованием ИИ в компаниях? Какие нужны будут знания и навыки?

– Я считаю, что роль CDO трансформируется и от управления данными она будет идти в сторону управления AI-стратегией. Мой опыт работы за последние годы говорит о том, что просто так заниматься данными корпорациям становится всё менее и менее интересно. Всё больше возникает обсуждений вокруг смыслов и вопросов: зачем собирать данные, что мы от них можем получить, почему в это инвестируют конкуренты? И с такими вопросами менеджмент приходит именно к CDO. Не всегда CDO является катализатором изменений в компании, но он точно участвует в обсуждениях такого рода. Мне кажется, что роль CDO станет ключевым звеном в интеграции искусственного интеллекта в бизнес-процессы.

В целом, новая трактовка роли предъявит и новые требования к CDO. В первую очередь понимание того, что такое ИИ в широком и узком смысле, что такое классический ML, рекомендательные системы, GenAI и так далее.
Полагаю, что в дополнение к уже классической дисциплине — Data Governance — скоро появится новая сущность — AI Governance: подходы по контролю и регулированию именно моделей. А то, что сейчас во многих крупных компаниях называется управлением модельным риском, перерастет в отдельную большую дисциплину.
Второе — навык бизнес-ориентированности и понимания того, что происходит в компании. В этом нет ничего нового — и раньше CDO должны были знать и понимать различные домены внутри организации, какие данные и где рождаются, какие у них есть свойства и т.д. Но мне кажется, в дальнейшем значимость этих навыков будет усиливаться, поскольку помимо задачи сбора, хранения и обработки данных, у CDO возникнут задачи по их использованию.

Третье, безусловно — знание регуляторной составляющей. Я за этой сферой наблюдаю с очень большим интересом. Надо отметить, что у нас зарегулированность гораздо меньше, чем в Европе и то, в какую сторону дальше пойдут регуляторы с точки зрения стимулирования и ограничений, может очень сильно изменить работу с данными.
– С какими главными проблемами с данными вы сталкивались в компаниях, где работали, и как их решали?

– Это самый-самый больной вопрос для всех CDO. Первая и главная проблема, исходя из моего опыта работы в телекоме, в банках и в интернет-компаниях — разобщенность и разрозненность данных. Компании не всегда сопоставляют вещи, которые в целом есть возможность сопоставлять; часто не используется потенциал синергии разных данных. Классическая беда в банках — финансовые и риск-данные, которые очень тесно связаны между собой и в первую очередь нуждаются в унификации. В этой проблеме набор рецептов очень широкий: от внедрения подходов единых хранилищ и создания института владения данными до развития доменных моделей в концепции Data Mesh.

Вторая проблема, которая приводит к невозможности использовать данные — их низкое качество: данные неполные, не пришли вовремя, недоступны в какой-то момент и т.д. Конечно, CDO — этот тот человек, который должен думать про это и адресовать себе вопрос: как выстроить систему управления данными в компании так, чтобы таких проблем не возникало?

И третьей я бы назвал отсутствие структурированных метаданных, которые были бы легко доступны тем, кому они нужны. Если открыть любой групповой чат сотрудников, которые работают с данными, то самые частые вопросы, который вы там прочитаете: где какие данные находятся, чем данные из одной системы отличаются от данных из другой и т.д. Набор инструментов, который даст возможность аналитикам, дата-сайнтистам и дата-инженерам быстро сориентироваться в многообразии данных существенно снижает время на этапе исследований. В целом, инструментария и подходов в этой части уже довольно много: каталоги данных, глоссарии, дата-контракты.

Однако это продолжает оставаться одной из главных проблем в больших компаниях. Здесь кроме хорошо работающего института владения данными, я лично очень верю в дата-контракты. Через этот подход мы можем не просто формально договориться об условиях поставки и использования данных, но и выстроить контроль. А со стратегической точки зрения заключение дата-контрактов поможет выявить, какие существуют разрывы между поставщиками данных (я могу дать данные с такими свойствами) и потребителями (мне нужны данные с такими свойствами). Нахождение таких разрывов и их сокращение в наиболее критичных областях – одна из главных задач CDO.
– Александр, как, на ваш взгляд, должна выглядеть хорошая стратегия по работе с данными?

– В первую очередь компания должна ответить себе на вопрос: зачем она занимается данными. Тезис о том, что данные надо накапливать, это дешево и надо их пока складировать, а как их использовать, мы потом разберемся — ошибочен, это ошибочная стратегия. Накапливать данные — дорого, в одной компании, где я работал, хранение данных обходилось в десятки миллионов рублей в месяц и это только инфраструктурная часть, я не говорю про команду, которая занимается обслуживанием. И если у компании нет уверенного ответа, зачем она накапливает данные, то имеет смысл потратить усилия на поиск этого ответа. И уверенный ответ не должен быть в духе «мы собираемся внедрять ИИ, а данных нет, поэтому давайте данные накапливать». Это тоже плохой ответ. Компании должен быть понятен в первую очередь бизнес-эффект.

Если мы ответили на вопрос «зачем», дальше возникает вопрос «как», это уже вопрос подходов и инструментов. Плюс надо учитывать проблемы с данными, про которые мы поговорили в предыдущем вопросе.

А третьим обязательным компонентом успешной стратегии я бы назвал поступательное движение, которое формирует культуру по работе с данными внутри компании.
– Не могу не спросить про стратегию по ИИ-трансформации. Чем она отличается от дата-стратегии?

– В стратегию по искусственному интеллекту я бы точно добавил ещё несколько разделов, поскольку, в отличие от управления данными, это чуть менее зрелая область. Здесь существенно меньше «работающих из коробки» решений, которые приносят результат, и это приводит к тому, что компании берутся за некоторые AI-задачи впервые. Хорошо, если у них есть деньги, чтобы купить экспертизу внутрь компании или нанять внешних опытных подрядчиков, а если нет, то приходится изобретать велосипед. Что плохого в изобретении велосипеда? Часто не получается.
Поэтому важный пункт при разработке стратегии — подумать, как быстро и не очень дорого проверять возникающие AI-гипотезы и идеи, релевантные для нашей компании.
Второй важный — управление рисками и неопределенностью, которые возникают в AI-проектах. Это касается очень широкого круга вопросов: от выбора технологий и информационной безопасности до механизмов принятия решений по спорным вопросам. Например, один из самых обсуждаемых вопросов: кто несет ответственность за тот результат, который выдает искусственный интеллект? Или другой вопрос: на основании чего AI дает такую рекомендацию? Это вопросы, на которые часто сложно ответить однозначно. И чтобы споры потом не стали бесконечными, лучше сразу в стратегии по AI зафиксировать принципы и подходы по таким дилеммам.
Фото из личного архива Александра Шевкунова
– Мы плавно подошли к следующей теме: этическому аспектом использования ИИ.

– Этика, наверное — один из самых главных вызовов, которые сейчас есть наряду с синтетически сгенерированными данными. Специалистам в области AI нужно будет предпринять большие усилия, чтобы построить этические рамки. Мне кажется, что это одна из задач, которую на себя должны взять различного рода профессиональные объединения и сообщества. И здесь просветительская роль, привитие хороших паттернов потребления и взаимодействия с AI очень важны. У широких масс очень много опасений относительно AI.
– Александр, давайте поговорим про страхи вокруг ИИ, раз уже упомянули. Какие опасения вы наблюдаете у своих коллег или, может, у себя?

– Самый главный страх: искусственный интеллект заберет мою работу. С этим приходится бороться ежедневно, я сейчас совершенно не утрирую. Мой ответ на этот вопрос: «нет, не заберет».
– Почему нет? Что вы говорите коллегам?

– Потому что искусственный интеллект — инструмент. Им можно научиться пользоваться, чтобы повысить свою производительность, упростить свою работу и жизнь. А можно игнорировать и, условно, продолжить вести бухгалтерские записи на бумаге.
Да, бесспорно, один человек, вооруженный AI, может заменить в работе нескольких без навыков работы с AI. Именно это и должно быть стимулом и драйвером для освоения данного инструмента.
Второй страх, к которому я иногда тоже присоединяюсь, когда задумываюсь об угрозах — модель черного ящика. Мы не всегда понимаем, как эта штука работает внутри. Несмотря на то, что мы с вами не до конца понимаем, как у нас формируются мысли в голове и как работает наш мозг, мы с недоверием относимся к какой-то штуковине, которая нам что-то советует, подсказывает или предсказывает. Мы ей не очень-то доверяем. И в чувствительных сферах, таких как медицина или инвестиционная деятельность, этот страх был и остается большим ограничением.
– Хотела уточнить про первый страх. Если сотрудники все же не захотят осваивать ИИ и использовать его в своей работе, то они в итоге ведь останутся за бортом? Их опасения не напрасны, получается?

– Конкурировать будет все сложнее и сложнее, это однозначно. Вот, например, маркетолог, который знает SQL или Python, для компании кардинальным образом отличается от маркетолога, который этими инструментами не владеет. Рядом с одним из них нужен аналитик, который может помочь найти, структурировать, интерпретировать данные. Для компании это дольше и дороже. Когда я работал в рекламной вертикали «Яндекса», мы довольно много времени потратили на то, чтобы устранить такого рода пробелы у профессионалов далёких от IT: менеджеры по работе с клиентами, маркетологи, клиентская поддержка. Это были инвестиции в то, чтобы люди стали эффективнее. Наверняка на рынке остается много профессионалов, которые не умеют работать с данными, но им всё сложнее и сложнее со временем будет конкурировать с теми, кто умеет.
Абсолютно то же самое с AI: кто освоит, тот будет более конкурентоспособным.
– Давайте поговорим об ИИ-проектах, которые с вашим участием уже изменили или улучшили бизнес-процессы компании, жизнь клиентов и т.д. Уверена, в вашей профессиональной жизни их было очень много. Может, пару затронем.

– Да, их действительно было много, но давайте я расскажу об одной задаче, в которой я увидел и осознал весь потенциал, скрывающийся за направлением GenAI.

Предыстория: когда вам звонит незнакомый номер, и оператор мобильной связи уверен, что это мошенник, он переводит звонок на робота, который начинает с этим мошенником разговаривать. Операторы, в отличие от абонентов, платят друг другу за входящие, и чем больше времени мошенник проведёт на линии, тем больше мобильный оператор мошенника заплатит мобильному оператору абонента. Были взяты две нейронки с разными целевыми функциями: «нейро-мошеннику» надо как можно быстрее распознать, что она общается не с человеком, и бросить трубку; а у модели, которая принимает вызов («нейро-абонент»), задача как можно дольше разговаривать с мошенником. В эту модель добавили еще одного агента «нейро-судью», который смотрит за предыдущими двумя и отвечает на вопрос, насколько хорошо или плохо они выполнили свою задачу в рамках конкретного диалога, и выставляет им оценки, подкрепляя правильное поведение. Я специально очень сильно упрощаю, чтобы не нарушить никаких тайн, однако, такой подход релевантен в любых мультиагентных задачах. Так вот, когда мне коллеги показали, как прототип такой системы начинает самообучаться, я понял что за «прекрасный новый мир» перед нами открывается. Потенциал огромен.
– Как понять, когда ИИ-проект действительно полезен бизнесу, а когда — просто хайп? Какие метрики используете для оценки эффективности проектов?

– Когда мы знаем, пусть даже примерно, как это поможет бизнесу — проект полезен. Почему «примерно»? Потому что не всегда можно дать точную оценку целевому эффекту. Не всё может быть выражено в деньгах или может быть выражено, но через первую или вторую производные. Каждая компания сама для себя принимает решение, на что она хочет ориентироваться, но хотя бы на интуитивном уровне должно быть понятно, что именно мы улучшаем: увеличиваем выручку, сокращаем расходы, увеличиваем лояльность клиентов, улучшаем восприятие кандидатами нас как работодателя и т.п. Если отвечать на вопрос про метрики, то, в первую очередь, конечно, возврат на сделанные инвестиции (ROI), работа с ИИ и большими данными — это по-прежнему дорого.
– Как выстроить доверие к ИИ-решениям внутри компании?

– Методом проб и ошибок. Когда мы десять лет назад в Райффайзенбанке делали первые модели склонности клиента к покупке, результаты были не самые удовлетворительными. И каждый опытный менеджер по продажам говорил: «Это все ерунда, вы тратите ресурсы непонятно на что, я со своим опытом и экспертизой сделаю прогноз лучше вашей модели». Спустя год-полтора таких людей стало сильно меньше. Модель может учитывать сотни тысяч факторов и зависимостей, тогда как человек мог интерпретировать всего 10-15.
Только такие успешные внедрения убеждают скептиков, что направление перспективное, и в него нужно инвестировать. Далее вопрос к менеджменту: чтобы первые ростки взошли, и их не вытоптали, нужен определенного рода «шаг веры», что за этими подходами и инструментами большое будущее.
– А какой проект у вас был самым неудачным и не оправдавшим надежды? На чем чаще всего сыпятся проекты?

– Я бы выделил несколько причин, почему проекты заканчиваются неудачей.
Первая — ожидание быстрых и лёгких побед. Работа с данными и AI — это работа вдолгую, и первые поражения, неудачи, несоответствие ожиданиям могут заставить менеджмент поставить крест не просто на конкретной инициативе, а в целом на технологии или подходе. Что с этим делать? Управлять ожиданиями. Я пока других рецептов не нашел.

Вторая причина — переоценка своих сил. Людям свойственно замахиваться на проекты, которые пока не по плечу. Предварительно обязательно нужно оценить, насколько компания готова к проекту внедрения с точки зрения данных, компетенций, технологий, инвестиций.

Что касается моего неудачного опыта: это те проекты, что мы делали на заре, примерно 10 лет назад. Экспертиза была ограничена, было много скептиков, т.к. аппетит к этим технологиям только приходил, и сделать что-то достойное с первого раза было непросто. Но к чести менеджмента я должен сказать, что у них хватило мудрости продолжать инвестировать в такие проекты.

Вообще настрой и уверенность топ-менеджмента очень важны. Например, мне очень нравится подход в Сбере к внедрению AI, он носит массовый характер. Один из KPI менеджмента — проникновение AI в бизнес-процессы компании. Причём что это за бизнес-процесс, совершенно неважно. Многие удивляются, но я полностью понимаю, зачем это делается: компания хочет, чтобы каждый менеджер, вне зависимости от того, чем он занимается, задумался над этими технологиями и прикоснулся к ним. В целом с этой точки зрения Сбер очень много полезного сделал для рынка AI в России.

– И последнее, Александр: какие технологии или тренды вы считаете наиболее перспективными? Кто из индустрии вас вдохновляет, за кем следите, кого читаете?

– Есть две вещи, за которыми, на мой взгляд, будущее: первая — AI-агенты, у них невероятный потенциал. Вторая — уже давно не тренд, а мейнстрим — это развитие open-source технологий, которое очень сильно меняет мир IT. Я очень-очень верю, что этот тренд принесёт нам много интересного, в том числе, и в GenAI.

Что касается людей из индустрии, здесь я не буду оригинален. Я стараюсь следить, что говорят Марк Цукерберг, Сэм Альтман и их R&D команды. На это имеет смысл ориентироваться, чтобы понимать, какие технологии будут мейнстримом через 2-3 года.
Другие материалы нашего блога