Патологическая анатомия и нейросети: врачи Сеченовского Университета делают глубокую разметку гистологических сканов для обучения искусственного интеллекта
Патологическая анатомия и нейросети: врачи Сеченовского Университета делают глубокую разметку гистологических сканов для обучения искусственного интеллекта

Ученые Института клинической морфологии и цифровой патологии размечают гистологические сканы: это необходимо, чтобы нейросеть научилась распознавать на них различные элементы, в том числе отличать опухолевую ткань от здоровой. Через руки патологоанатомов уже прошли тысячи образцов. Именно от качества этой трудоемкой работы зависит, как быстро искусственный интеллект научится выявлять патологические участки и сможет помогать врачам ставить диагноз и определять прогноз и тактику лечения.

В Институте клинической морфологии и цифровой патологии Сеченовского Университета Минздрава России создают лабораторию цифровой микроскопии. Ее сотрудники будут заниматься глубокой разметкой гистологических препаратов для обучения нейросетей. Уже набрана первая команда, куда входят врачи-патологоанатомы, молодые ученые и студенты, а также специалисты по Data Science. 

Они изучают гистологические препараты, отбирают самые репрезентативные, сканируют их, далее отмечают на них все необходимые структуры: их должен научиться узнавать и отличать искусственный интеллект, чтобы в будущем помогать врачу ставить диагноз. 

По словам специалистов, это трудоемкая и кропотливая работа: им предстоит разметить тысячи гистологических сканов. О ценности разметки рассказала Екатерина Руденко — врач, доцент, заместитель директора по научной работе Института клинической морфологии и цифровой патологии. 

«Нейросеть учится по размеченным участкам. Мы ей показываем, что вот этот кружочек — это сосуд, вот эта палочка — это базальная мембрана, а вот это — опухолевая ткань. И она на большом количестве размеченных препаратов учится это узнавать. Мы даем ей тысячу раз посмотреть, как это выглядит в разметке, и на тысячу первый она уже сама все может определить по неразмеченному препарату. Поэтому создание нейросети невозможно без большого объема качественно размеченных гистосканов», — отметила Екатерина Руденко.

Специально для разметки гистосканов был подготовлен современный мощный компьютер с широкоформатным экраном и сервер для облачного хранилища. Оборудование было закуплено в рамках программы стратегического академического лидерства «Приоритет 2030». Благодаря этому команда может за короткое время создавать большие датасеты под конкретные цифровые задачи. 

«Например, к нам обращается индустриальный партнер и говорит, что ему нужна система поддержки принятия врачебных решений (СППВР) для дифференцировки различных типов рака печени. Заказчик сообщает, какие морфологические паттерны нужно отметить на сканах для обучения нейросети, мы подбираем архивный  материал, сканируем, размечаем датасеты и отдаем в работу. Мы можем делать и свои датасеты, а также можем валидировать, то есть экспертно оценивать разметку, которую делают в других местах», — подчеркнула Екатерина Руденко. Сейчас команда работает с тремя индустриальными партнерами.

«Мы берем гистологический препарат и сканируем его с помощью гистосканера, переводя его в цифровой формат. Затем врач-эксперт открывает изображение в специальной программе и обводит опухолевую или лимфоидную ткань, метастазы или раковые клетки, чтобы потом «скормить» его нейросети. Это достаточно длительная работа. Затем это полностью размеченное изображение врач передает IT-специалисту, который делит его на патчи или квадратики размером 256 × 256 пикселей. И вот эти квадратики являются единицей обучения нейросети. Чтобы научиться отличать опухолевую ткань, ей нужно до миллиона таких квадратиков», — поясняет врач-патологоанатом централизованного патологоанатомического отделения Сеченовского Университета, младший научный сотрудник Центра «Цифровой биодизайн и персонализированное здравоохранение» Наталья Кретова.

Специалисты Института клинической морфологии вместе с командой лаборатории поддержки принятия врачебных решений на базе технологий искусственного интеллекта (заведующий Александр Бирюков) уже обучили одну нейросеть: врачи разметили около 100 гистосканов, на которых было порядка 300 лимфоузлов. Таким образом, система научилась с высокой точностью выявлять метастазы колоректального рака в лимфатических узлах. 

Ученые отмечают, что искусственный интеллект не может самостоятельно сформулировать диагноз, однако его применение позволяет сократить время патологоанатома на выполнение рутинной работы. По словам Натальи Кретовой, искусственный интеллект снижает возможность ошибки и повышает точность диагноза: если врач по невнимательности или усталости может пропустить признаки заболевания, то нейросеть — нет. «Искусственный интеллект никогда не заменит врача, но врач, использующий искусственный интеллект, обязательно заменит того, кто его не использует», — подчеркнула патологоанатом.  

На сегодня в базе данных Института клинической морфологии и цифровой патологии уже тысячи гистосканов, и она постоянно пополняется. По мере того, как база будет расти, качество обучения нейросети будет возрастать и диагностика будет становиться все более и более точной. 

«Искусственный интеллект должен обучаться на качественном морфологическом материале. Я имею в виду сами гистологические препараты и их сканы, а также грамотно оцененные морфологические изменения в этом материале. Поэтому прежде всего в основе точной диагностики и успешного лечения пациентов лежит профессионализм патологоанатомов. У нас в институте работает профессиональный коллектив специалистов и мы имеем уже двухлетний опыт работы по разметке гистосканов, благодаря чему успешно создаем морфологические датасеты, — отмечает директор Института клинической морфологии и цифровой патологии Татьяна Демура. — Эта работа является ключевой для создания системы поддержки принятия врачебных решений (СППВР), потому что правильная экспертная разметка позволяет грамотно обучить нейросети, которые далее уже будут помогать врачу ставить диагноз. Это можно применять в разных патологиях, но в первую очередь в онкологии».

Ранее научные сотрудники Института клинической морфологии и цифровой патологии Сеченовского Университета создали и выложили на платформу Минздрава для обучения искусственного интеллекта свой первый датасет. На нем ученые и IT-специалисты смогут обучать нейросети в области стоматологии, ревматологии и патологической анатомии.