Компьютерное зрение в медицине: как бизнесу применять технологию. Кейсы
Развитие в области применения компьютерного зрения не стоит на месте. Сообщество специалистов постоянно совершенствует инструменты, что позволяет охватывать всё больше задач в различных сферах (медицине, сельском хозяйстве, промышленности и других). Как результат, всё больше компаний в настоящее время разрабатывают продукты на базе Data Science и Machine Learning. И это неудивительно, ведь компьютерное зрение в медицине — мощный инструмент, который позволяет эффективно решать поставленные задачи.
Но так как технология только набирает популярность, не все знакомы с возможностями, которые она открывает бизнесу. В этой статье расскажем о компьютерном зрении, специфике работы и возможностях данной технологии в области медицины и диагностике заболеваний.
Что такое компьютерное зрение?
Компьютерное зрение (англ. computer vision, CV) — это современная технология, которая представляет собой область искусственного интеллекта (далее — ИИ), связанная с анализом и обработкой изображений и видео.
Задача специалистов в этой области — научить компьютер воспринимать эти данные, также, как человек, и на основе анализа предлагать те или иные действия медицинскому работнику. Цель внедрения инструмента — улучшить качество жизни людей.
Методология работы с проектом, связанным с данными
Алгоритм работы над проектом, связанным с компьютерным зрением может строиться по методологии CRISP-DM.
CRISP-DM — это один из распространенных стандартов работы с проектом, связанным с исследованием данных.
CRISP-DM или кросс-индустриальный стандартный процесс получение знаний, является одним из проверенных инструментом для работы с проектами, связанными с данными.
Какие задачи можно решить с помощью компьютерного зрения в медицине?
Компьютерное зрение в современном мире — один из лучших помощников для медицинских работников. По данным опроса Европейского общества рентгенорадиологии, многие врачи используют ИИ для скрининга и диагностики онкологических и сердечно-сосудистых заболеваний.
Этот подход итеративный, что означает возможность возврата к предыдущим этапам в случае неудовлетворительных результатов. На каждом этапе специалисты могут вернуться на предыдущий, что делает работу более гибкой и устойчивой.
Давайте подробнее расскажем про задачи, которые позволяет решить компьютерное зрение.
Анализ рентгеновских снимков
Одна из популярных задач — анализ и обнаружение аномалий на рентгеновских снимках, МРТ, УЗИ, КТ. Способность точно различать нормальные и аномальные рентгеновские снимки важна как для врачей, так и для пациентов. Это улучшает диагностический процесс и повышает шанс на успешный исход различных болезней.
Внедрение искусственного интеллекта в процесс анализа рентгеновских снимках позволяет улучшить этот процесс и сократить количество ошибок из-за человеческого фактора.
В процессе работы специалисты стараются минимизировать ошибки первого рода – ситуации, когда отвергается нулевая гипотеза (H0 = аномалии присутствую), при ее достоверности (аномалии на самом деле есть). Это означает, что во время анализа медицинских снимков будет лучше, если модель найдет на снимке аномалию, даже если ее там нет. Чем врач поставит диагноз «здоров» больному человеку.
В настоящее время использование компьютерного зрения — не замена врача в процессе постановки диагноза. Это связано с тем, что для принятия решения на основе результатов CV, необходимо учитывать факторы, которые модель компьютерного зрения (либо любая другая) могла не увидеть. Однако отказываться от прогнозов ИИ не стоит.
Системы с ИИ работают ВМЕСТЕ с врачами, а не ВМЕСТО них.
Уход за больными
Машинное зрение помогает во время ухода за больными пациентами, а также сокращает количество рисковых для здоровья пациента ситуаций.
Компьютерное зрение поможет:
- обнаружить падение или физическое недомогание пациентов;
- автоматически оповестить персонал, когда пациентам нужна помощь;
- уменьшить риск совершения ошибок из-за человеческого фактора;
- собрать информацию о поведении пациента во время болезни для записи в медицинскую карточку.
Медперсоналу необходимо ежедневно заполнять карточки пациентов, на это уходит много времени. Система, которая автоматически идентифицирует каждого пациента и проводит анализ его действий в течение дня, сократит заполнение документов до считанных минут, тем самым окажет помощь врачу.
Фармацевтическая промышленность
Применение компьютерного зрения в области фармацевтики:
-
Контроль дефектов. Компьютерное зрение собирает данные и анализирует их. Например, систему с ИИ используют для визуального осмотра этикеток и таблеток на наличие дефектов, что позволит автоматически отбраковывать такой товар и поставлять только качественную продукцию.
-
Автоматизация подсчета упаковок. Компьютерное зрение позволяет автоматизировать процесс сбора статистики по количеству произведенной продукции.
Внедрение компьютерного зрения в медицине: этапы работы
Разработка проектов на базе искусственного интеллекта включает в себя несколько этапов. Пропуск любого из них может не привести к желаемому результату.
Этап 1. Определение цели проекта
В первую очередь надо понять цель проекта, определить метрики для оценки результатов и рассчитать риски проекта. Проработка этого этапа создает отправную точку для начала работы и правильности проектирования ML-системы (ML System Design)
Предположим, что клиника хочет улучшить процесс исследования и постановки диагноза по рентгеновским снимкам. В данном случае цель – уменьшить количество случаев, когда врач ставит неверный диагноз пациенту. На этом этапе можно узнать, какие и в каком количестве размеченные данные (медицинские изображения) есть у клиники, что потом потребуется для работы команды. Это позволит точнее рассчитать количество времени, которое займет выполнение проекта, а также понять, необходимы ли дополнительные специалисты по разметке данных. В случае с рентгеновскими снимками для разметки требуется помощь медицинских работников, которые имеют опыт в работе с ними. Подробнее о технологии читайте в статье
Этап 2. Анализ данных
На этом этапе происходит сбор и первичный анализ данных, который включает в себя:
- сбор статистики;
- оценку качества данных и формулирование первых гипотез для решения задачи.
В частности, можно исследовать данные и выявить нерелевантные примеры. Например, если проект связан с выявлением аномалий на коже женщин, а среди данных есть медицинские изображения кожи детей, то это может быть неприменимо. Данный этап важен тем, что помогает выявить проблемы в данных на ранних стадиях работы.
Медицинские данные специфичны: два разных врача имеют разный опыт работы, соответственно, различные снимки могут быть размечены по-разному. Ниже приведен пример.
Для таких случаев одним из способов повышения качества данных и результатов исследования будет «кросс-разметка».
Например, можно выдать три одинаковых набора данных трём врачам, которые его размечают. Методом голосования (в случае спорной ситуации) выбирается наиболее вероятная разметка. Данный метод улучшает качество данных, но увеличивает его стоимость примерно в три раза (по сравнению с обычной разметкой, когда этим занимается 1 человек).
Этап 3. Подготовка данных
После анализа имеющихся данных происходит этап их подготовки. Необходимо с высокой точностью отобрать данные для решения задачи, и очистить их от ненужных элементов, как в примере выше, либо разместить свои.
Для разметки картинок или видео могут использоваться следующие популярные бесплатные инструменты для разметки:
- Label Studio
- CVAT
- LabelImg
Данный этап очень важен и обычно занимает большую часть времени (около 80%) специалиста по Computer Vision во время работы над проектом. Потому что именно от данных в большинстве случаев зависит качество работы моделей. Возвращаясь к теме медицины, важно всегда следить за качеством работы медработников, потому что каждый может это делать правильно, но по-разному.
Во время работы с асессорами (разметчиками) используется способ проверки качества их работы, посредством подмешивания заранее размеченных данных в неразмеченный датасет. Достаточно будет 10-15% от всех изображений. Данный способ поможет на ранней стадии выявить плохих асессоров и сократить бесполезную трату средств на их работу.
Этап 4. Моделирование
После получения данных происходит этап выбора и обучения различных моделей искусственного интеллекта, которые лучше подходят для конкретной задачи. Отбираются лучшие архитектуры и параметры модели, которые дадут наиболее близкие показатели к тем, которые установленные на первом этапе работы.
Приведем пример архитектур нейронных сетей, которые можно использовать для решения задачи CV в медицине:
- U-Net
- ResNet
- VGG
- YOLO и т.д.
Опытный специалист может снизить круг поиска моделей и архитектур, но точные метрики получите только после обучения и проведения экспериментов в выбранных вариантов. Одна модель может показывать высокую точность, но быть очень медленной, либо наоборот. Отбор моделей по нужным для бизнеса критериям, которые были установлены на первом этапе, происходит только методом проб.
Для обучения моделей потребуется соответствующее аппаратное обеспечение. Это зависит от выбранной модели и количества имеющихся изображений. Например, в случае обучения YOLOv8 nano на 100 фотографиях может хватить бесплатных облачных решений на Google Colab или Kaggle. Но если вдруг изображений не 100, а 100000, и вы выбираете модель с большим числом параметров (например, YOLOv8X), то для обучения потребуются видеокарты, в которых имеется технология CUDA (от NVIDIA). Либо же придется приобретать платные версии облачных решений. Это необходимо учитывать и во время проектирования дизайна системы.
Этап 5. Оценка
После моделирования происходит оценка полученных результатов. Ее необходимо провести не только с точки зрения метрик качества моделей, но бизнес-метрик. К примеру, важно определить, работает ли модель достаточно быстро для оперативного внедрения в работу.
Тестовая выборка — часть данных, которую не используют в обучения. Она служит проверкой для модели, которая училась на оставшейся обучающей части данных.
Помимо этого, оценивается время работы моделей, например, сколько времени занимает обработка одного изображения. На данном этапе, если модель не удовлетворяет исходным критериям, можно вернуться на предыдущие этапы и скорректировать данные, чтобы получить приемлемый результат.
Этап 6. Внедрение
Здесь происходит планирование и внедрение решения, полученного в процессе работы. Внедрение модели включает в себя процесс построения мониторинга за её работой. Это позволит в короткие сроки выявить аномалии в работе в режиме реального времени.
Для оценки качества работы модели с изображениями можно использовать тестовую выбору.
Какие могут возникнуть проблемы?
При внедрении ИИ в существующую систему или разработки с нуля, могут возникнуть проблемы, которые негативно скажутся на результатах работы. В частности:
- Внедрение неподходящего программное обеспечения с технологиями искусственного интеллекта
Некоторые готовые решения не отвечают потребностям компаний или не учитывают специфику их деятельности. Кроме того, сама компания должна быть готова к внедрению новой системы в инфраструктуру предприятия. Это включает в себя не только подготовку оборудования, но и готовность коллектива работать в системе, перестройку бизнес-процессов и планирование дополнительных ресурсов на внедрение ИИ. Оптимальным решением в таком случае нередко помогает привлечение внешних специалистов в области ИИ, что позволит более экономично и быстрее найти необходимые кадры для решения задачи.
- Нехватка данных для искусственного интеллекта
Медицина — особая сфера для внедрения в неё технологий компьютерного зрения. Одна из проблем для развития в этой области — это нехватка научных данных для обучения моделей. Подготовка и разметка медицинских данных требует вовлечения высококвалифицированных врачей и медицинских сотрудников, то несет дополнительные затраты для компании. Это стоит учитывать в бюджете проекта, особенно на начальных стадиях работы.
Одним из решений будет сотрудничество с другими учреждениями, которые также заинтересованы в проекте, и готовы поделиться своими данными.
- Сохранение и конфиденциальность персональных данных
При работе с персональными данными есть риск их утечки или потери конфиденциальности. Высокий уровень такого риска будет, если не уделить этого вопросу достаточного внимания. Таким образом, перед началом работы надо тщательно продумать сохранность используемых медицинских данных, а также их обезличивание.
Финальное решение и ответственность всегда должны быть за врачом. В последние годы технологии значительно улучшили диагностику и лечение, но только квалифицированный специалист может на основе всех данных принять окончательное решение и обеспечить безопасность пациента.
Вывод по использованию CV в медицине
Компании всё чаще внедряют в свои бизнес-процессы технологии искусственного интеллекта (машинное обучение, компьютерное зрение, нейронные сети и другие) не только ради престижа, но и для повышения эффективности и точности обработки данных, и для развития бизнеса. Это дает значительное конкурентное преимущество на рынке.
График сравнения автоматизации бизнес-процессов в различных сферах:
Источник: опрос общественного мнения, проведенный IBM в 2021 г.
Если у вас остались вопросы или хотите разработать IT-проект, обращайтесь по телефону 8-800-200-99-24, по [email protected] или в telegram.