Актуальность. Диагностика ранней стадии хронической болезни почек (ХБП) является глобальной проблемой, поскольку чаще диагностируются поздние стадии заболевания. Разработка методов моделирования для принятия управленческих решений, направленных на повышение эффективности ранней диагностики ХБП, является важной научно-практической задачей, в решении которой большую поддержку может оказать использование алгоритмов машинного обучения (MLA).
Цель. Повышение точности диагностики ХБП с использованием данных анамнеза, клинико-инструментального, генетического обследования и MLА.
Материал и методы. Данные были получены из одноцентрового ретроспективного катамнестического когортного исследования (2011–2022 гг.) детей с ХБП 1-4 стадии в возрасте от 1 до 17 лет. В основную группу включены 128 детей с хроническими заболеваниями почек, в группу сравнения – 30 детей без патологии почек. Дети двух групп статистически значимо не различались по полу и возрасту. Для построения модели диагностики ХБП использованы данные анамнеза, клинико-инструментального и генетического обследования. Модель построена с применением MLA многофакторная логистическая регрессия (MLR). В модели использовано три переменных: СОЭ (β = 0,392; p<0,001); эритроциты в моче (β = 1,225; p<0,001); астеническое телосложение (β = 5,792; p<0,001).
Результаты. Получена диагностическая модель, позволяющая на тестовой выборке выявлять ХБП с точностью 90,3% [80,6; 96,8]%, чувствительностью 92,0% [81,5; 100,0]%, специфичностью 83,3% [50,0; 100,0]%, ROC-AUC = 90,0% [77,2; 100,0]%. Полученная модель отличного качества (>90%), т.к. ROC-AUC составляет на тестовой выборке 0,90. Значение точки отсечения вероятности ХБП равно 0,25.
Выводы. Разработана и протестирована модель, которая с высокой точностью диагностирует на ранней стадии ХБП у детей.
Цель. Повышение точности диагностики ХБП с использованием данных анамнеза, клинико-инструментального, генетического обследования и MLА.
Материал и методы. Данные были получены из одноцентрового ретроспективного катамнестического когортного исследования (2011–2022 гг.) детей с ХБП 1-4 стадии в возрасте от 1 до 17 лет. В основную группу включены 128 детей с хроническими заболеваниями почек, в группу сравнения – 30 детей без патологии почек. Дети двух групп статистически значимо не различались по полу и возрасту. Для построения модели диагностики ХБП использованы данные анамнеза, клинико-инструментального и генетического обследования. Модель построена с применением MLA многофакторная логистическая регрессия (MLR). В модели использовано три переменных: СОЭ (β = 0,392; p<0,001); эритроциты в моче (β = 1,225; p<0,001); астеническое телосложение (β = 5,792; p<0,001).
Результаты. Получена диагностическая модель, позволяющая на тестовой выборке выявлять ХБП с точностью 90,3% [80,6; 96,8]%, чувствительностью 92,0% [81,5; 100,0]%, специфичностью 83,3% [50,0; 100,0]%, ROC-AUC = 90,0% [77,2; 100,0]%. Полученная модель отличного качества (>90%), т.к. ROC-AUC составляет на тестовой выборке 0,90. Значение точки отсечения вероятности ХБП равно 0,25.
Выводы. Разработана и протестирована модель, которая с высокой точностью диагностирует на ранней стадии ХБП у детей.
Литература
1. Бодрин К.А., Красноперова А.А. Использование технологий машинного обучения в медицине // Теория и практика современной науки. – 2018. – №10(40). – С.52-56.
2. Schena FP, Magistroni R, Narducci F, et al. Artificial intelligence in glomerular diseases. Pediatr Nephrol. 2022; 37(11): 2533-2545. doi: 10.1007/s00467-021-05419-8.
3. Sanmarchi F, Fanconi C, Golinelli D, et al. Predict, diagnose, and treat chronic kidney disease with machine learning: a systematic literature review. J Nephrol. 2023; 36(4): 1101-1117. doi: 10.1007/s40620-023-01573-4.
4. Chen F, Kantagowit P, Nopsopon T, et al. Prediction and diagnosis of chronic kidney disease development and progression using machine-learning: Protocol for a systematic review and meta-analysis of reporting standards and model performance. PLoS One. 2023; 18(2): e0278729. doi: 10.1371/journal.pone.0278729.
5. Scikit-learn. Decision tree, regressor. [cited 2023 Oct 10]. Available from: https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeRegressor.html#sklearn.tree.DecisionTreeRegressor.
6. Scikit-learn. Common errors in the interpretation of linear model coefficients. [cited 2023 Oct 10]. Available from: https://scikit- learn.org/stable/auto_examples/inspection/plot_linear_model_coefficient_interpretation.html#sphx-glr-auto-examples-inspection-plot-linear-model-coefficient-interpretation-py.
7. Scikit-learn. Robust scaling. [cited 2023 Oct 10]. Available from:https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing. RobustScaler.html.
8. Scikit-learn. Lasso regression. [cited 2023 Oct 10]. Available at: scikit-learn.org/stable/modules/generated/sklearn.linear model.Lasso.html. Scikit-learn. Cross-validation. Available from: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html.
9. Носова Г.С., Абдуллин А.Х. Машинное обучение на основе непараметрического и нелинейного алгоритма Random Forest (RF) // Инновации. Наука. Образование. – 2021. – №35. – С.33-39.
10. Scikit-learn. Random forest, regressor. [cited 2023 Oct 10] Available from: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble. Random Forest Regressor. html.
11. GBD Chronic Kidney Disease Collaboration. Global, regional, and national burden of chronic kidney disease, 1990-2017: a systematic analysis for the Global Burden of Disease Study 2017. Lancet. 2020; 395(10225): 709-733. doi: 10.1016/S0140-6736(20)30045-3.
12. Rees L, Mak RH. Nutrition and growth in children with chronic kidney disease. Nat Rev Nephrol. 2011; 7(11): 615–23. doi: 10.1038/nrneph.2011.137.
13. Dima A, Opris D, Jurcut C, et al. Is there still a place for erythrocyte sedimentation rate and C-reactive protein in systemic lupus erythematosus? Lupus. 2016; 25(11): 1173–1179. doi: 10.1177/0961203316651742.
14. Steyerberg EW, Harrell FE, Borsboom GJ, Eijkemans MJ, Vergouwe Y, Habbema JD. Internal validation of predictive models: efficiency of some procedures for logistic regression analysis. J Clin Epidemiol. 2001; 54(8): 774-81.
15. Nogueira PCK, Konstantyner T, Carvalho MFC, et al. Development of a risk score for earlier diagnosis of chronic kidney disease in children. PLoS One. 2019; 14(4): e0215100. doi: 10.1371/journal.pone.0215100.
2. Schena FP, Magistroni R, Narducci F, et al. Artificial intelligence in glomerular diseases. Pediatr Nephrol. 2022; 37(11): 2533-2545. doi: 10.1007/s00467-021-05419-8.
3. Sanmarchi F, Fanconi C, Golinelli D, et al. Predict, diagnose, and treat chronic kidney disease with machine learning: a systematic literature review. J Nephrol. 2023; 36(4): 1101-1117. doi: 10.1007/s40620-023-01573-4.
4. Chen F, Kantagowit P, Nopsopon T, et al. Prediction and diagnosis of chronic kidney disease development and progression using machine-learning: Protocol for a systematic review and meta-analysis of reporting standards and model performance. PLoS One. 2023; 18(2): e0278729. doi: 10.1371/journal.pone.0278729.
5. Scikit-learn. Decision tree, regressor. [cited 2023 Oct 10]. Available from: https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeRegressor.html#sklearn.tree.DecisionTreeRegressor.
6. Scikit-learn. Common errors in the interpretation of linear model coefficients. [cited 2023 Oct 10]. Available from: https://scikit- learn.org/stable/auto_examples/inspection/plot_linear_model_coefficient_interpretation.html#sphx-glr-auto-examples-inspection-plot-linear-model-coefficient-interpretation-py.
7. Scikit-learn. Robust scaling. [cited 2023 Oct 10]. Available from:https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing. RobustScaler.html.
8. Scikit-learn. Lasso regression. [cited 2023 Oct 10]. Available at: scikit-learn.org/stable/modules/generated/sklearn.linear model.Lasso.html. Scikit-learn. Cross-validation. Available from: https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html.
9. Носова Г.С., Абдуллин А.Х. Машинное обучение на основе непараметрического и нелинейного алгоритма Random Forest (RF) // Инновации. Наука. Образование. – 2021. – №35. – С.33-39.
10. Scikit-learn. Random forest, regressor. [cited 2023 Oct 10] Available from: https://scikit-learn.org/stable/modules/generated/sklearn.ensemble. Random Forest Regressor. html.
11. GBD Chronic Kidney Disease Collaboration. Global, regional, and national burden of chronic kidney disease, 1990-2017: a systematic analysis for the Global Burden of Disease Study 2017. Lancet. 2020; 395(10225): 709-733. doi: 10.1016/S0140-6736(20)30045-3.
12. Rees L, Mak RH. Nutrition and growth in children with chronic kidney disease. Nat Rev Nephrol. 2011; 7(11): 615–23. doi: 10.1038/nrneph.2011.137.
13. Dima A, Opris D, Jurcut C, et al. Is there still a place for erythrocyte sedimentation rate and C-reactive protein in systemic lupus erythematosus? Lupus. 2016; 25(11): 1173–1179. doi: 10.1177/0961203316651742.
14. Steyerberg EW, Harrell FE, Borsboom GJ, Eijkemans MJ, Vergouwe Y, Habbema JD. Internal validation of predictive models: efficiency of some procedures for logistic regression analysis. J Clin Epidemiol. 2001; 54(8): 774-81.
15. Nogueira PCK, Konstantyner T, Carvalho MFC, et al. Development of a risk score for earlier diagnosis of chronic kidney disease in children. PLoS One. 2019; 14(4): e0215100. doi: 10.1371/journal.pone.0215100.
Для цитирования
Седашкина О.А., Колсанов А.В. Ранняя диагностика хронической болезни почек у детей с помощью алгоритмов машинного обучения. Врач и информационные технологии. 2024; 3: 72-85. doi: 10.25881/18110193_2024_3_72.
Документы
Ключевые слова