Как Data Science помогает бизнесу
Развитие бизнеса требует проверки сотен гипотез и взаимосвязанных факторов. Data Science – наука о данных, которая помогает анализировать большие объемы информации, извлекать из них полезные знания и на их основе предпринимать действия для улучшения бизнеса.
Data Science использует инструменты машинного обучения (Machine Learning, ML) и Big Data – комплекс технологий сбора, хранения, обработки, анализа данных. Специалиста в этой области называют data scientist, а массивы данных, с которыми он работает – это Data Set.
Можно сказать, что Data Science – это наука на стыке математики, программирования, аналитики и даже лингвистики.
Как это работает
Специалист по машинному обучению, – data scientist – разрабатывает алгоритм, который на основе данных прогнозирует и моделирует тенденции, поведение, закономерности. Параметры алгоритма определяются автоматически на основе данных.
Если объяснить простыми словами, алгоритм – это вычисление значения по заранее известной формуле, например, у=5х+2.
В Data Science формула не известна заранее, а выводится на основе полученных данных. Например, алгоритм может показывать, как меняется продуктивность человека в течение рабочего дня и от каких факторов это зависит.
Data – это данные и факты
Допустим, у нас есть задача: составить график работы операторов колл-центра, который работает 24 часа в сутки.
Понятно, что ночью входящих звонков в разы меньше, чем днем, поэтому на смену нужно поставить меньше сотрудников. Однако это не единственный фактор, который требуется учесть. Что еще нужно будет ввести в систему:
-
Среднее количество входящих звонков в каждый из дней недели, месяцев, времен года (летом, например, их будет меньше из-за поры отпусков).
-
Распределение звонков в течение суток.
-
Количество операторов, график их отпусков, положенные по закону 2 выходных в неделю.
-
Географию расположения клиентов данной службы техподдержки (например, когда в Москве ночь, во Владивостоке – день)
-
Прочие данные, например, заработная плата сотрудников.
Самообучаемые системы позволяют не просто механически строить график, но учитывать все изменения данных и регулярно его оптимизировать.
Science – это анализ и обработка данных
Как это может помочь в бизнесе
Напрямую, причем с пользой как для продавца, так и для покупателя. Самый простой и яркий пример – таргетированная реклама в поисковых машинах. Google основывается не только на запросах в поисковой строке, но и на перемещениях пользователя (например, видя, что человек часто заходит в Starbucks, начнет показывать рекламу кофе и кофеен), его общению в сети, активности в социальных сетях и т.д.
Многие компании успешно используют Data Science в своей деятельности.
Netflix на основе анализа поведения своих подписчиков рекомендует им индивидуальную подборку потенциально интересных фильмов и сериалов, причем «обложка» контента создается для каждого зрителя персонально.
YouTube также ежедневно обрабатывает миллиарды единиц данных по миллионам параметров и создает персонализированные рекомендации для пользователей.
Target – сеть американских супермаркетов присылает покупателям персонализированные скидочные купоны, основываясь на истории их покупок и анализе поведения.
Даже на государственном уровне уже есть предложения использовать нейросеть в политике и социальных проектах.
Data Science и мифы
Если высокие технологии и машинное обучение настолько перспективны, почему еще не все предприниматели ими пользуются? Потому что верят вредным мифам:
Миф №1:
Искусственный интеллект (ИИ) непредсказуем, ему нельзя доверять.
На самом деле:
Программы действуют в заданных рамках, они лишь предлагают решения, а анализируют и применяют их живые люди. При этом факторы, которые влияют на решение, обычно можно определить и интерпретировать. Таким образом, решение ИИ предсказуемо, ему можно доверять
Миф №2:
Алгоритмы ничего не могут дать бизнесу.
На самом деле:
Конечно, могут, и выше мы это показали на конкретных кейсах.
Миф №3:
Машинный подход и Data Science – это дорого.
На самом деле:
Не дороже, чем оплата работы штата профессиональных аналитиков. При этом алгоритмы будут работать 24/7, а не 8 часов в день.
Миф №4:
Если всю работу будет выполнять ИИ, люди станут не нужны.
На самом деле:
Да, некоторые профессии могут полностью исчезнуть (например, оператор техподдержки). Но появятся новые, связанные с созданием, обработкой и улучшением алгоритмов, а также масса сопутствующих профессий.
Миф №5:
Для работы искусственного интеллекта нужны данные (datum), а их неоткуда взять.
На самом деле:
Качественная CRM предоставляет все необходимые данные, особенно, если ее вести хотя бы 2-3 года.
Биг Дата и бизнес
Приведенные выше примеры показывают: самое простое, что может дать применение Data Science – это, как минимум, создание персонализированных рекомендаций. Даже эта малость ведет к увеличению прибыли, ведь:
-
Клиент получает полезную информацию, а не раздражающую рекламу, у него повышается мотивация и уровень лояльности.
-
При этом повышаются шансы, что покупатель воспользуется рекомендациями.
-
Компания может эффективнее управлять складом, контролировать остатки и планировать закупки.
И это только верхушка айсберга.
Пример
В SimbirSoft мы разрабатываем решения на основе Big Data для разных сфер бизнеса. Один из последних кейсов – разработка системы, рассчитывающей вероятность и частоту обращения за медицинской помощью клиента страховой компании.
Мы принимали в расчет возраст и пол пациента, а также поставленные ему ранее диагнозы, назначенные процедуры и историю обращений. Кроме этих статистических данных нам требовался также перечень эпизодов, возникающих для каждого отдельного клиента, с указанием времени, типа услуги, вида лечения и т.д. То есть мы подошли к проблеме сразу с двух сторон, чтобы получить точный прогноз. При этом важно понимать, что некоторые эпизоды происходили раньше, чем пациент стал клиентом страховой, часть информации не попала в базу, поскольку человек не обращался к врачу (обращался в частном порядке или в государственную поликлинику). Это нужно учитывать при цензурировании данных.
Для работы с таким массивом подходит метод «анализа выживаемости», созданный специально для обработки цензурированных данных. С его помощью мы смогли точнее прогнозировать для каждого пациента наступление следующего эпизода, с определением его типа и времени.
Подводя итоги
Внедрение искусственного интеллекта и работы с Big Data во всех отраслях бизнеса – это только вопрос времени. Крупные компании уже занимаются обработкой данных и созданием алгоритмов. Например, банкам и страховым организациям жизненно важно адекватно оценивать риски и прогнозировать события, не говоря уже о самом простом использовании Data Science – создании персонализированных рекомендательных систем и повышении лояльности клиентов.
Познакомьтесь с нашими решениями Data Science и другими кейсами в портфолио.