Российские исследователи создали систему автоматического кодирования диагнозов по МКБ

Российские исследователи из Института AIRI совместно со специалистами Центра практического искусственного интеллекта Сбера и Центра индустрии здоровья Сбербанка разработали систему автоматического присвоения диагнозам кодов по Международной классификации болезней.

Российские исследователи создали систему автоматического кодирования диагнозов по МКБ

МКБ-коды служат единым стандартом для регистрации, анализа и обмена медицинскими данными, упрощают документооборот и являются основой для научных исследований.

В России врачи обычно присваивают эти коды вручную, что требует дополнительного времени и может приводить к ошибкам. Например, возможны неточности при выборе кодов из памяти — когда вместо точного кода указывается близкий, но не полностью соответствующий диагнозу. Новая система призвана автоматизировать эту рутинную задачу и повысить точность кодирования.

Сначала был создан тщательно размеченный датасет: 15 врачей разной квалификации разделили диагнозы на отдельные медицинские сущности и присвоили каждой соответствующий код МКБ. Затем ученые сравнили различные подходы к автоматическому кодированию и выбрали наиболее эффективный. На третьем этапе обучили специализированную медицинскую модель на двух типах данных — кодах, выставленных врачами, и кодах, подобранных алгоритмом. Тестирование показало, что модель, обученная на автоматически размеченных кодах, справляется с диагностическими задачами значительно лучше.

Система не заменяет врачебную экспертизу и не ставит диагнозы, а лишь преобразует уже сформулированный диагноз в корректный код МКБ. Это позволяет снизить административную нагрузку на медиков, улучшить качество медицинской статистики и способствовать развитию информационных систем в здравоохранении. Разработанный датасет опубликован в открытом доступе, а инструменты могут быть интегрированы в электронные медицинские системы.

«Выставление МКБ-кодов, по сути, административная работа, заниматься которой врач не обязан. Мы показали, что алгоритмы на корректном датасете легко справляются с этой задачей, соответственно, снимают избыточную нагрузку с медиков и могут стать точкой роста для информатизации и объективизации отечественной медицины».

Александр Нестеров, к.м.н., старший научный сотрудник группы «Мультимодальные архитектуры ИИ» лаборатории «Сильный ИИ в медицине» Института AIRI

Елена Тутубалина, доктор технических наук, руководитель группы «Прикладное NLP», добавила, что легковесная модель с несколькими сотнями миллионов параметров не только конкурирует с большими языковыми моделями, но и превосходит их, что важно для эффективного внедрения в реальные системы.

Что будем искать? Например,ChatGPT

Мы в социальных сетях