Научный архив: статьи

Разработка и валидация моделей машинного обучения, прогнозирующих госпитализации пациентов с артериальной гипертензией в течение 12 месяцев (2025)

Цель. Разработать с использованием алгоритмов машинного обучения модели прогнозирования госпитализаций пациентов с артериальной гипертензией (АГ) в течение 12 мес. и провести их валидацию на данных реальной клинической практики.

Материал и методы. По сведениям из деперсонифицированных электронных медицинских карт, полученных из платформы Webiomed, отобрано 1165770 записей 151492 пациентов с АГ. В качестве предикторов, после первоначальной селекции, были использованы анамнестические, конституциональные, клинические, инструментальные и лабораторные данные, широко применяемые в рутинной врачебной практике, всего 43 признака. Для создания моделей применялись инструменты автоматического машинного обучения. Рассматривался широкий набор алгоритмов, включая логистическую регрессию, методы, основанные на деревьях решений c использованием градиентного бустинга и бэггинга, дискриминантный анализ, алгоритм на основе нейронных сетей и наивный байесовский классификатор. Для внешней валидации использованы данные отдельного региона.

Результаты. Наилучшие результаты показала модель XGBoost, достигнув AUROC (площадь под характеристической кривой) 0,849 (95% доверительный интервал: 0,825-0,873) при внутреннем тестировании и 0,815 (95% доверительный интервал 0,797-0,835) при внешней валидации.

Заключение. В результате исследования разработана новая высокоточная модель прогнозирования госпитализации пациентов с АГ по данным реальной клинической практики. Результаты внешней валидации предложенного прогностического инструмента показали относительную устойчивость к новым данным из другого региона, что в совокупности с показателями качества отражает возможность ее апробации в реальной клинической практике.

Издание: КАРДИОВАСКУЛЯРНАЯ ТЕРАПИЯ И ПРОФИЛАКТИКА
Выпуск: № 1, Том 24 (2025)
Автор(ы): Андрейченко Анна Евгеньевна, Ермак Андрей Дмитриевич, Гаврилов Денис Владимирович, Новицкий Роман Эдвардович, Драпкина Оксана Михайловна, Гусев Александр Владимирович
Сохранить в закладках
РАЗРАБОТКА И ВАЛИДАЦИЯ МОДЕЛЕЙ МАШИННОГО ОБУЧЕНИЯ, ПРОГНОЗИРУЮЩИХ РИСК ГОСПИТАЛИЗАЦИИ ПАЦИЕНТОВ С САХАРНЫМ ДИАБЕТОМ В ТЕЧЕНИЕ ПОСЛЕДУЮЩИХ 12 МЕСЯЦЕВ (2024)

Заболеваемость сахарным диабетом (СД) как в Российской Федерации, так и во всем мире неуклонно растет последние десятилетия. Стабильный популяционный рост и современные эпидемиологические характеристики СД приводят к колоссальным экономическим расходам и значительному социальному ущербу во всем мире. Заболевание зачастую приобретает прогрессирующее течение с развитием характерных осложнений, при этом значительно повышая вероятность госпитализации. Создание и внедрение модели прогнозирования госпитализаций пациентов с СД в круглосуточный стационар позволит персонифицировать оказание медицинской помощи и оптимизировать нагрузку на всю систему здравоохранения.
ЦЕЛЬ. Разработка и валидация моделей прогнозирования госпитализаций пациентов с СД по поводу самого заболевания и его осложнений с использованием алгоритмов машинного обучения и данных реальной клинической практики.
МАТЕРИАЛЫ И МЕТОДЫ. По сведениям из деперсонифицированных электронных медицинских карт, полученных из платформы Webiomed, была проанализирована 170 141 запись 23 742 пациентов с СД. В качестве потенциальных факторов прогноза отобраны анамнестические, конституциональные, клинические, инструментальные и лабораторные данные, широко используемые в рутинной врачебной практике — всего 33 признака. Для создания моделей применялась логистическая регрессия (LR), методы градиентного бустинга (LightGBM, XGBoost, CatBoost), методы, основанные на деревьях решений (RandomForest и ExtraTrees), а также алгоритм на основе нейронных сетей (Multi-layer Perceptron).
РЕЗУЛЬТАТЫ. Наилучшие результаты и устойчивость к внешним данным показала модель LightGBM со значением целевой метрики AUC 0.818 (95% ДИ 0,802–0,834) при внутреннем тестировании и 0,802 (95% ДИ 0,773–0,832) при внешней валидации.
ЗАКЛЮЧЕНИЕ. Метрики полученной итоговой модели превосходили опубликованные ранее аналоги. Результаты внешней валидации показали относительную устойчивость модели к новым данным из другого региона, что в совокупности с показателями качества отражает возможность ее использования в реальной клинической практике

Издание: САХАРНЫЙ ДИАБЕТ
Выпуск: № 2, Том 27 (2024)
Автор(ы): Ермак Андрей Дмитриевич, Андрейченко Анна Евгеньевна, Гаврилов Денис Владимирович, Новицкий Роман Эдвардович, Гусев Александр Владимирович
Сохранить в закладках