Анализ процессов крупной производственной компании
Мы провели масштабный анализ процессов крупной производственной компании и с помощью инструментов data-аналитики выявили узкие места и разработали программы улучшений. По результатам заказчик смог оптимизировать производство.
Клиент
Производственная компания с числом сотрудников более 2 тысяч и оборотом в несколько миллиардов рублей ежемесячно.
Задача
Разработать мероприятия, шаги или процессы, которые помогут повысить эффективность предприятия или производства. В частности:
- предотвратить остановки производства из-за выхода из строя оборудования
- оптимизировать расход компонентов при технологическом производстве
- сократить расходы на транспортную логистику
- снизить затраты на электроэнергию путем распределения производственных мощностей
Решение
На первом этапе предполагалась обработка данных из используемых на предприятии IT-систем путем выгрузки и обработки датасетов из хранилищ внедренной MES (manufacturing execution system — система управления производственными процессами) с последующей визуализацией по требуемым параметрам, включая даты, события и критические значения проводимых процессов.
На втором (промежуточном) этапе потребовалась обработка неавтоматизированных процессов с данными, которые хранились только на физических носителях или электронных, но вне контура MES-системы.
Для решения задачи выгрузили датасет в формате csv за несколько лет. Полученный файл занимал более 100 тысяч строк записей и 50+ столбцов. Дальнейшую обработку данных проводили с помощью Python Jupyter Notebook и подключенных библиотек (прежде всего — NumPy, Pandas, SciPy). Для визуализации также использовали штатные расширения основного пакета (Matplotlib, Seaborn).
Выбор стека осуществлялся по следующим причинам:
- простота создания при множестве зависимых друг от друга исследуемых параметров;
- удобство визуализации для последующего анализа;
- возможность переиспользования данных и алгоритмов при минимальных затратах.
С какими трудностями столкнулись и как их решили
На деле все было не так стандартно, как нам казалось. Команде пришлось столкнуться с трудностями при работе с данными, в частности:
- разнообразные наименования произошедших событий, повлиявших на прерывание и остановку производственного процесса, т.е. что произошло
- разнообразные описания причин, т.е. почему произошла остановка
Чтобы оценить масштаб работы, необходимой к реализации, представьте, что у вас есть 100 единиц одинаковой марки и модели оборудования, но описания причин поломок за несколько лет разные. Причем обслуживают это оборудование и регистрируют записи практически одни и те же люди.
Кроме того, в процессе исследования и проведения интервью с сотрудниками цехов выяснилось, что не все инциденты, происшествия и выходы за рамки стандартизированного технологического процесса фиксируют в центральной MES-системе. У некоторых из них есть свои журналы, которые заводились давно согласно требованиям ГОСТ и внутрипроизводственной нормативной документации. Ведутся они в другом софте, что-то в Excel, а что-то и вовсе на бумаге.
По этой причине возникла еще одна проблема — невозможность быстро объединить все данные, поскольку образовалось огромное количество несовпадений по наименованию, типам и категориям оборудования, наименованию цехов, событий, описаний и других классификаций.
Нашим коллегам пришлось собрать в единое упорядоченное хранилище огромное количество данных, создать новые категории, классификации, а также поработать с дублями как в общей системе, так и в каждом отдельном софте.
Результат
- Достоверно (на основании реальных цифр и измеряемой погрешностью) определили, какое оборудование чаще всего останавливает производственные процессы в разрезе каждого цеха, подразделения – с учетом конкретной смены и времени суток.
- Дата-аналитика показала, как именно (в каких объемах выпуска продукции) влияют остановки того или иного оборудования в ходе производственного процесса.
- Полученные данные позволили инициировать поиск причин поломок самого оборудования – таких как нарушения при монтаже, в ходе самого производства или повышенной нагрузки.
- Полученная визуализация позволила определить качество проводимого технического обслуживания с учетом времени его выполнения, частоты и конкретного исполнителя – что позволило выявить недостаточную квалификацию работников, избыточную нагрузку на них и необходимость дополнительного обучения.
- Обобщенные численные данные по выходу из строя оборудования позволили отсортировать характер поломок и выявить точку роста – последующую цифровизацию оборудования датчиками Интернета вещей с последующим созданием автоматизированной системы планирования и поддержания оптимальной производительности оборудования и межсервисных интервалов.
Технологии
Дата-аналитика: Python Jupyter Notebook, библиотеки: NumPy, Pandas, SciPy, визуализация: Matplotlib, Seaborn