— Насколько технологии машинного обучения распространены в России?
— Международная исследовательская компания Gartner прогнозировала, что в 2020 году 85% предприятий будут иметь хотя бы пилотные проекты в области искусственного интеллекта (AI) и машинного обучения (ML). Эти прогнозы в целом сбываются. Большинство наших клиентов активно используют или пилотируют ML-решения. Пока в основном это крупный финансовый бизнес и промышленность: наряду с подразделениями банковских рисков машинное обучение используется в цифровом маркетинге, транзакционном антифроде, информбезопасности, а также в IIoT на транспорте и в промышленности. Но благодаря развитию Open Source инструментов технологии ML становятся доступными и для более широкого круга компаний.
— Как меняется спрос на технологии ML?
— Использование ML является основным источником получения дополнительной прибыли и расширения бизнеса в жесткой конкурентной среде. Растет спрос на услуги по построению инфраструктуры и автоматизации процессов жизненного цикла ML. Сегодня бизнесу важно уметь управлять десятками и сотнями моделей одновременно, иметь удобную среду разработки, быстро доставлять модели в среду эксплуатации. Все эти задачи решаются с помощью подхода MLOps — набора практик и технологий развертывания и поддержки моделей ML, которые позволяют выстроить взаимодействие между дата-сайентистами и специалистами эксплуатации.
— Расскажите о проектах, реализованных с помощью этого подхода.
— MLOps — достаточно универсальный подход. Хочу отметить один из значимых для нас проектов в банке «Открытие». Используя нашу экспертизу в MLOps, мы разработали технологическую ML-платформу, которая обеспечивает непрерывность процесса разработки и эксплуатации моделей машинного обучения с последующей их интеграцией в бизнес-процессы. Развернутая в банке архитектура автоматизирует управление моделями: работа с ними ведется в отдельном безопасном тестовом окружении, при этом перенос в промышленную среду осуществляется автоматически.
Важно, что разработанная ML-платформа позволяет быстро подключать новых дата-сайентистов. У них есть возможность отслеживать все эксперименты по обучению модели, сохранять связанные артефакты и проводить сравнение метрик экспериментов между собой с использованием пользовательского интерфейса. Оркестратор Kubernetes позволяет гибко управлять вычислительными ресурсами для каждой отдельной задачи. Например, дата-сайентист может использовать под различные задачи разные языки программирования и библиотеки ML. А среда эксплуатации обеспечивает отказоустойчивое и масштабируемое исполнение разработанных моделей.
Платформа позволит банку ускорить время разработки и запуск моделей в эксплуатацию, а также снизить возможные операционные риски при внедрении моделей.
— Как ML влияет на клиентский сервис банков?
— С помощью моделей ML, на основе данных корпоративных хранилищ, сотовых операторов, интернет-провайдеров, бюро кредитных историй банки создают таргетированные предложения для клиентов, индивидуально подбирая продукт, способ и даже время коммуникации. Это повышает ценность предложения для клиента, вероятность его отклика, позволяет уйти от «ковровых бомбардировок» через СМС и телефонное оповещение.
— Какие еще задачи приходится решать для реализации ML-проектов?
— Спрос на дата-сайентистов превышает предложение. Сложно найти специалистов в этой области. Поэтому совместно с Саратовским исследовательским государственным университетом имени Н.Г. Чернышевского мы открыли Data Science Laboratory для подготовки квалифицированных кадров.
MLOps требует от дата-сайентистов соблюдения определенных процессов и стандартов разработки, поэтому мы проводим для них обучающие воркшопы, показываем преимущества нашего подхода.