Аналитика, Исследования | Олег Брагинский, Максим Мухтаров
Основатель «Школы траблшутеров» Олег Брагинский и ученик Максим Мухтаров рассказывают, как маркировали клиентов страховых компаний для скорейшего прохождения профилактических осмотров с целью снижения вероятности инфарктов и инсультов.

Крупная частная медицинская сеть решила распространить опыт передового кардиологического отделения в выявлении пациентов с высоким сердечно-сосудистым риском на всю организацию, через согласование расширенных профилактических обследований, имеющим полис ДМС.
Процесс проектировали следующим образом:
- Аналитическое подразделение ежемесячно предоставляет выгрузку на проверку.
- Выделенные врачи верифицируют распределение по категориям риска.
- Отдел согласований направляет список в страховую компанию.
- Контрагент рассматривает и присылает гарантийные письма.
- Подтверждённый застрахованный приходит в клинику.
Предстояло определить:
- Сроки: выгрузки, проверки, передачи, рассмотрения, отправки, записи.
- Форматы: файлов, списков, результатов, гарантийных писем.
- Ответственных: за рассмотрение и передачу данных.
- Порядок информирования и направления пациентов.
В зону ответственности попал первый этап. Опросили медиков, формализовали подход, изучили базу данных, составили запросы, извлекли структурированные данные, обработали текстовые поля ЭМК пациентов, сформировали файлы со ссылками на протоколы и подсветкой ключевых строк.
Доктора заложили в основу медицинских критериев клинические рекомендации, разработанные с участием Национального общества по изучению атеросклероза. Рекомендовали семь параметров оценки: чем сумма баллов у пациента больше, тем выше риск сердечно-сосудистых осложнений.
Получили следующие медицинские критерии и соответствующие баллы:
- перенесённые ранее неблагоприятные события: инфаркт или инсульт – 8
- отягчённый семейный анамнез по родственникам первой линии – 5
- наличие периферийного атеросклероза по результатам УЗИ – 5
- нарушенный липидный обмен по данным анализов – 4
- ксантомы, ксантелазмы, липоидная дуга роговицы – 4
- гипертоническая болезнь или сахарный диабет – 3
- повышенный гликированный гемоглобин – 1.
Техническую формализацию усложняло отсутствие: а) готовых атрибутов, б) данных в структурированных полях при наличии значений в текстовых, в) информации в целевых разделах при заполненности второстепенных, г) унифицированных формулировок о клинической картине.
Построили таблицу соответствий между медицинским параметром и разделом протокола. Для текстовых полей подобрали ключевые слова́. Для справочников – диагнозов, услуг УЗИ, названий лабораторных тестов – зафиксировали перечни значений. Анализам задали пороговые уровни.
Зафиксировали 11 технических критериев:
- липидный обмен оценивали через хотя бы один результат: а) липопротеинов низкой плотности ³ 1,8 ммоль/л, б) липопротеина (а) ³ 30 мг/дл, в) триглицеридов ³ 2,5 ммоль/л
- инфаркты, инсульты, гипертоническую болезнь, сахарный диабет выявляли по соответствующим кодам МКБ-10 и ключевым словам в комментарии к диагнозу.
- атеросклероз сосудов устанавливали через заключения протоколов дуплексного сканирования брахиоцефальных артерий и нижних конечностей
- отложения холестерина искали в общем осмотре и комментарии к диагнозу
- семейный анамнез брали из одноимённого поля протокола приёма
- повышенным считали гликированный гемоглобин ³ 6%.
Выбрали страховщика и месяц посещений для тестирования. Составили SQL-скрипты, собирающие данные на глубину ретроспективного года от последнего визита отобранных пациентов. По избранным случаям сравнивали параметры с интерфейсом системы Медиалог.
Значения отобранных записей протоколов обработали через python. Макросами оформили Excel на проверку. Главный лист назвали «Меню», куда поместили уникальный список пациентов с баллами по каждому критерию. Кликнув на номер ЭМК, врач попадал на вкладку с подробностями:
Расшифровку сработавших критериев представили двумя способами: а) для структурированных данных – прямым значением, б) для текстовой информации – раскраской ключевых слов в исходном поле. Гиперссылка по идентификатору протокола открывала PDF-файл на сетевом диске.
Сознательно не ограничивали поиск приёмами кардиологов: нужная информация могла находиться везде. Но первые версии ключевых слов приводили к выборке нецелевых пациентов – с эндокринологическими, урологическими и даже офтальмологическими проблемами.
Поиск сокращений инфаркта миокарда (ИМ) выдавал индекс массы тела (ИМТ), вместо стентирования коронарных артерий всплывала аналогичная операция над мочеточниками, гипертензия относилась не к общему артериальному давлению, а к глазному.
После калибровки алгоритмов финальную выборку в 3’355 человек разбили на группы риска по баллам: а) очень высокий – от 17 до 26, б) высокий – от 12 до 16, в) умеренный – от 7 до 11, г) низкий – от 1 до 5. Границы расставляли по точкам пересечения с экспоненциальным трендом.
Дополнительно оценили вклад и распространённость критериев для сопоставления статистических выводов с интуицией экспертов: первый рассчитывали как сумму баллов по параметру, делённую на общую; вторую – как относительную к итоговой частоту фактора риска.
С уменьшением категории риска вклад пережитых инфарктов и инсультов, диагностированного атеросклероза сосудов, отклонений от нормы в анализах убывал, а значение семейного анамнеза, гипертонической болезни и сахарного диабета возрастало. Косвенные признаки сменяли прямые.
Частотные доли менялись логично: чем выше была категория риска, тем значимее оказывалась распространённость факторов. Единственное подозрение вызвали малые цифры по наружным отложениям холестерина – врачи успокоили: встречаемость редка по известным исследованиям.
Подробное выборочное изучение показало, что присвоение низкой категории связано как с отсутствием факторов риска, так и с малым количеством посещений – в большинстве случаев застрахованные не проходили необходимые диагностические исследования: анализы или УЗИ.
При полном обследовании пациенту могли бы присвоить больший риск, но фокус на работу с данной категорией вынесли на стадии проекта после запуска первой версии процесса. Ценность такой группы была важна для внутренних KPI по охвату услугами и мониторинга маршрутизации.
Заключительным этапом стал расчёт по всей базе пациентов в системе Медиалог с выбранной даты и автоматизация маркировки – вывод в дэшборд с помесячной динамикой. По категориям риска выделили процент проходящих лечение в центре компетенций по липидологии.