+7 (499) 463-00-00 (доб. 1233)
Подать статью
О нас
  • Цели и задачи
  • Редакция
Журнал
  • Номера журнала
  • Статьи
  • Авторы
Авторам
  • Правила для авторов
  • Оформление библиографии
  • Отправка статей
  • Рецензирование
  • Этика научных публикаций
  • Авторские права
  • Конфиденциальность
  • Политика свободного доступа
Контакты
ru
en
ru
О нас
  • Цели и задачи
  • Редакция
Журнал
  • Номера журнала
  • Статьи
  • Авторы
Авторам
  • Правила для авторов
  • Оформление библиографии
  • Отправка статей
  • Рецензирование
  • Этика научных публикаций
  • Авторские права
  • Конфиденциальность
  • Политика свободного доступа
Контакты
    ru
    en
    Подать статью
    • О нас
      • О нас
      • Цели и задачи
      • Редакция
    • Журнал
      • Журнал
      • Номера журнала
      • Статьи
      • Авторы
    • Авторам
      • Авторам
      • Правила для авторов
      • Оформление библиографии
      • Отправка статей
      • Рецензирование
      • Этика научных публикаций
      • Авторские права
      • Конфиденциальность
      • Политика свободного доступа
    • Контакты
    Подать статью
    • ru
      • Язык
      • ru
      • en
    • 105203, г. Москва, ул. Нижняя Первомайская, д. 65
    • vit-j@pirogov-center.ru
    Главная
    —
    Номера
    —
    Статьи
    —
    ВиИТ №3 2022

    Выбор предикторов для моделей классификации и прогноза в медицине

    Практический опыт
    DOI: 10.25881/18110193_2022_3_54

    Процессы создания максимально простой и одновременно эффективной прогностической модели в медицине должны быть сбалансированы. Факторы, включенные в модель, являются основой ее качества и практической значимости, однако их выбор — не всегда простая задача. Цель исследования — сравнение разных методов селекции предикторов для создания медицинских прогностических моделей.
    Материалы и методы. Для выбора предикторов использовали такие методы, как корреляция, фильтрация признаков на основе базовой статистики, однофакторный анализ Хосмера-Лемешоу, так и сложные, которые часто используются в машинном обучении: рекурсивное исключение признаков, регрессия «LASSO» и деревья классификации. Прогностические модели построили с использованием метода бинарной множественной логистической регрессии. Статистический анализ проводился с использованием языка программирования R (версия 3.4.2).
    Результаты. Наборы предикторов, полученные при помощи методов «LASSO» и случайного леса, а также методом пошаговой регрессии, позволили построить наиболее точные прогностические модели (минимальное значение AIC). Базовые методы статистического анализа и однофакторный регрессионный анализ по методу Хосмера-Лемешоу оказались наименее эффективными.
    Заключение. Применение методов селекции предикторов часто существенно сокращает их количество, отсеивая неинформативные, что улучшает качество будущей модели прогноза.

    Литература
    1. Altman DG, Vergouwe Y, Royston P, Moons KGM. Prognosis and prognostic research: validating a prognostic model. BMJ (Clinical research ed.). 2009; 338: b605. doi: 10.1136/bmj.b605.
    2. van Beek PE, Andriessen P, Onland W, Schuit E. Prognostic Models Predicting Mortality in Preterm Infants: Systematic Review and Meta-analysis. Pediatrics. 2021; 147(5): e2020020461. doi: 10.1542/peds.2020-020461.
    3. Van Calster B, Wynants L, Timmerman D, Steyerberg EW, Collins GS. Predictive analytics in health care: how can we know it works? Journal of the American Medical Informatics Association: JAMIA. 2019; 26(12): 1651-1654. doi: 10.1093/jamia/ocz130.
    4. Andrade C. Sample Size and its Importance in Research. Indian Journal of Psychological Medicine. 2020; 42(1): 102-103. doi: 10.4103/IJPSYM.IJPSYM_504_19.
    5. Pourhoseingholi MA, Vahedi M, Rahimzadeh M. Sample size calculation in medical studies. Gastroenterology and Hepatology from Bed to Bench. 2013; 6(1): 14-17.
    6. Chowdhury MZI, Turin TC. Variable selection strategies and its importance in clinical prediction modelling. Family Medicine and Community Health. 2020; 8(1): e000262. doi: 10.1136/fmch-2019-000262.
    7. Chen R-C, Dewi C, Huang S-W, Caraka RE. Selecting critical features for data classification based on machine learning methods. Journal of Big Data. 2020; 7(1): 52. doi: 10.1186/s40537-020-00327-4.
    8. Staartjes VE, Kernbach JM, Stumpo V, van Niftrik CHB, Serra C, Regli L. Foundations of Feature Selection in Clinical Prediction Modeling. Acta Neurochirurgica. Supplement. 2022; 134: 51-57. doi: 10.1007/978-3-030-85292-4_7.
    9. Li L. Dimension reduction for high-dimensional data. Methods in Molecular Biology (Clifton, N.J.). 2010; 620: 417-434. doi: 10.1007/978-1-60761-580-4_14.
    10. Ameringer S, Serlin RC, Ward S. Simpson’s Paradox and Experimental Research. Nursing research. 2009; 58(2): 123-127. doi: 10.1097/NNR.0b013e318199b517.
    11. Kim JH. Multicollinearity and misleading statistical results. Korean Journal of Anesthesiology. 2019; 72(6): 558-569. doi: 10.4097/kja.19087.
    12. Zhang Z. Variable selection with stepwise and best subset approaches. Annals of Translational Medicine. 2016; 4(7): 136. doi: 10.21037/atm.2016.03.35.
    13. Tibshirani R. The lasso method for variable selection in the Cox model. Statistics in Medicine. 1997; 16(4): 385–395. doi: 10.1002/(sici)1097-0258(19970228)16:4<385::aid-sim380>3.0.co;2-3.
    14. Rigatti SJ. Random Forest. Journal of Insurance Medicine (New York, N.Y.). 2017; 47(1): 31-39. doi: 10.17849/insm-47-01-31-39.1.
    15. Degenhardt F, Seifert S, Szymczak S. Evaluation of variable selection methods for random forests and omics data sets. Briefings in Bioinformatics. 2019; 20(2): 492-503. doi: 10.1093/bib/bbx124.
    16. Sun GW, Shook TL, Kay GL. Inappropriate use of bivariable analysis to screen risk factors for use in multivariable analysis. Journal of Clinical Epidemiology. 1996; 49(8): 907-916. doi: 10.1016/0895-4356(96)00025-x.
    17. Dziak JJ, Coffman DL, Lanza ST, Li R, Jermiin LS. Sensitivity and specificity of information criteria. Briefings in Bioinformatics. 2020; 21(2): 553-565. doi: 10.1093/bib/bbz016.
    18. Thompson HW, Mera R, Prasad C. The Analysis of Variance (ANOVA). Nutritional Neuroscience. 1999; 2(1): 43-55. doi: 10.1080/1028415X.1999.11747262.
    Для цитирования
    Лучинин А.С., Лянгузов А.В. Выбор предикторов для моделей классификации и прогноза в медицине. Врач и информационные технологии. 2022; 3: 54-67. doi: 10.25881/18110193_2022_3_54.
    Авторы
    • Лучинин А.С. ?
    • Лянгузов А.В. ?
    Документы
    06
    1,7 Мб
    Ключевые слова
    прогноз прогностические модели селекция предикторов
    Назад к списку
    Авторы
    • Лучинин А.С. ?
      ФГБУН КНИИГиПК ФМБА России, г. Киров, Россия
    • Лянгузов А.В. ?
      ФГБУН КНИИГиПК ФМБА России, г. Киров, Россия
    О нас
    Журнал
    Авторам
    Контакты
    +7 (499) 463-00-00 (доб. 1233)
    vit-j@pirogov-center.ru
    105203, г. Москва, ул. Нижняя Первомайская, д. 65
    © 2023 ФГБУ «НМХЦ им. Н.И. Пирогова» Минздрава России
    Политика конфиденциальности