Реализованные в 2011–2021 гг. государственные программы в сфере информатизации здравоохранения привели к тому, что свыше 91% государственных и муниципальных медицинских организаций внедрили различные медицинские информационные системы. Это позволило начать переход на ведение электронных медицинских карт (ЭМК). Извлечение данных реальной клинической практики (ДРКП) из накопленных ЭМК и последующий анализ этих данных открывает новые и перспективные возможности для развития отечественного здравоохранения.
Целью работы стал анализ ДРКП, извлеченных из обезличенных ЭМК.
Материалами работы стала база данных платформы прогнозной аналитики Webiomed, в которой на момент исследования были накоплены обезличенные ЭМК свыше 29 млн пациентов, включая 229 млн различных медицинских документов. Поставщиками данных для платформы стали 856 медицинских организаций из 28 субъектов РФ. Функциональные возможности платформы Webiomed позволяют обрабатывать неструктурированные медицинские документы, извлекать с помощью технологий искусственного интеллекта из них данные, пригодные для анализа.
Результаты. В настоящей работе представлены: анализ медицинских организаций как поставщиков данных для платформы Webiomed, анализ структуры и состава ЭМК, анализ популяции пациентов. Анализ проведен на момент выгрузки данных 16.10.2023. Из накопленных обезличенных ЭМК удалось извлечь и систематизировать по разным видам более 4 млрд 558 млн структурированных признаков. Платформа содержит 147 886 190 случаев заболеваний, классифицированных по справочнику МКБ-10. 8 393 403 пациента (28,71% от общего числа) имеют в ЭМК медицинскую информацию. Доля «пустых» ЭМК (которые не содержали ни одной медицинской записи) составила 71,29%. Однако ЭМК 3 448 797 пациентов имеют более чем 10 медицинских документов. В структуре ЭМК преобладают протоколы врачебных осмотров, протоколы лабораторных исследований, электронные рецепты, инструментальные исследования. 4 456 263 пациентов имеют глубину сбора данных свыше 3х лет.
Заключение. Полученные результаты свидетельствуют, что извлечение и обработка ДРКП из обезличенных ЭМК действительно позволяют создавать большие наборы структурированных данных. В настоящее время, по нашим сведениям, платформа Webiomed содержит самую крупную в России базу ДРКП, извлеченных из ЭМК. Представленный в данной статье материал – это первый анализ ЭМК и извлеченных из них признаков, осуществленный и опубликованный в России. Обеспечение качества работы с ДРКП на всех этапах, начиная от разработки структуры ЭМК и ввода данных до формирования цифровых двойников, является важнейшим условием их применения для решения различных задач в системе здравоохранения и фармацевтической индустрии.
Целью работы стал анализ ДРКП, извлеченных из обезличенных ЭМК.
Материалами работы стала база данных платформы прогнозной аналитики Webiomed, в которой на момент исследования были накоплены обезличенные ЭМК свыше 29 млн пациентов, включая 229 млн различных медицинских документов. Поставщиками данных для платформы стали 856 медицинских организаций из 28 субъектов РФ. Функциональные возможности платформы Webiomed позволяют обрабатывать неструктурированные медицинские документы, извлекать с помощью технологий искусственного интеллекта из них данные, пригодные для анализа.
Результаты. В настоящей работе представлены: анализ медицинских организаций как поставщиков данных для платформы Webiomed, анализ структуры и состава ЭМК, анализ популяции пациентов. Анализ проведен на момент выгрузки данных 16.10.2023. Из накопленных обезличенных ЭМК удалось извлечь и систематизировать по разным видам более 4 млрд 558 млн структурированных признаков. Платформа содержит 147 886 190 случаев заболеваний, классифицированных по справочнику МКБ-10. 8 393 403 пациента (28,71% от общего числа) имеют в ЭМК медицинскую информацию. Доля «пустых» ЭМК (которые не содержали ни одной медицинской записи) составила 71,29%. Однако ЭМК 3 448 797 пациентов имеют более чем 10 медицинских документов. В структуре ЭМК преобладают протоколы врачебных осмотров, протоколы лабораторных исследований, электронные рецепты, инструментальные исследования. 4 456 263 пациентов имеют глубину сбора данных свыше 3х лет.
Заключение. Полученные результаты свидетельствуют, что извлечение и обработка ДРКП из обезличенных ЭМК действительно позволяют создавать большие наборы структурированных данных. В настоящее время, по нашим сведениям, платформа Webiomed содержит самую крупную в России базу ДРКП, извлеченных из ЭМК. Представленный в данной статье материал – это первый анализ ЭМК и извлеченных из них признаков, осуществленный и опубликованный в России. Обеспечение качества работы с ДРКП на всех этапах, начиная от разработки структуры ЭМК и ввода данных до формирования цифровых двойников, является важнейшим условием их применения для решения различных задач в системе здравоохранения и фармацевтической индустрии.
Литература
1. Гольдина Т.А., Бурмистров В.А., Ефименко И.В., Хорошевский В.Ф. Искусственный интеллект в здравоохранении: Real World Data и Patient Voice – готовы ли мы к новым реалиям? // Медицинские технологии. Оценка и выбор. – 2021. – №2(43). – С.22-31. doi: 10.17116/medtech20214302122.
2. Гусев А.В., Владзимирский А.В., Голубев Н.А., Зарубина Т.В. Информатизация здравоохранения Российской Федерации: история и результаты развития // Национальное здравоохранение. – 2021. – Т.2/ – №3. – С.5-17. doi: 10.47093/2713-069X.2021.2.3.5-17.
3. Колбин А.С., Белоусов Д.Ю., Зырянов С.К. и др. Исследования реальной клинической практики. – М.: Буки Веди, 2020. – 208 с.: ил.
4. Гусев А.В., Зингерман Б.В., Тюфилин Д.С., Зинченко В.В. Электронные медицинские карты как источник данных реальной клинической практики // Реальная клиническая практика: данные и доказательства. – 2022. – Т.2. – №2. – С.8-20. doi: 10.37489/2782-3784-myrwd-13.
5. Гольдина Т.А. Исследования рутинной клинической практики: от получения данных к оценке медицинских технологий и принятию решений в здравоохранении // Медицинские технологии. Оценка и выбор. – 2018. – №1(31). – С.21-29.
6. Yamamoto K, Sumi E, Yamazaki T, et al. A pragmatic method for electronic medical record-based observational studies: developing an electronic medical records retrieval system for clinical research. BMJ Open. 2012; 2: e001622. doi: 10.1136/bmjopen-2012-001622.
7. Хомицкая Ю.В., Осина Г.С., Новодережкина Е.А., Гольдина Т.А. Исследования рутинной практики: как разработать и внедрить новое направление. Системный подход в обеспечении качества результатов // Медицинские технологии. Оценка и выбор. – 2021. – №4(43). – С.16-27. doi: 10.17116/medtech20214304116.
8. Гольдина Т.А., Колбин А.С., Белоусов Д.Ю., Боровская В.Г. Обзор исследований реальной клинической практики // Качественная клиническая практика. – 2021. – №1. – С.56-63. doi: 10.37489/2588-0519-2021-1-56-63.
9. Fu S, Chen D, He H, et al. Clinical concept extraction: A methodology review. J Biomed Inform. 2020; 109: 103526. doi: 10.1016/j.jbi.2020.103526.
10. Zhao Y, Weroh SJ, Goode EL, et al. Generating real-world evidence from unstructured clinical notes to examine clinical utility of genetic tests: use case in BRCAness. BMC Med Inform Decis Mak. 2021; 21: 3. doi: 10.1186/s12911-020-01364-y.
11. van Laar S, Gombert-Handoko K, Groenwold R, et al. Real-World Metastatic Renal Cell Carcinoma Treatment Patterns and Clinical Outcomes in The Netherlands. Front. Pharmacol. 2022; 13: 803935. doi: 10.3389/fphar.2022.803935.
12. Webiomed.Connect. https://webiomed.ru/products/integratsionnyi-shliuz-webiomedconnect.
13. Кобякова О.С. Технологии искусственного интеллекта в здравоохранении в глобальной патентной экосистеме: 2000-2023 гг. // Врач и информационные технологии. – 2024. – №1. – С.44-59. doi: 10.25881/18110193_2024_1_44.
14. Гусев А.В., Токарев С.А., Гаврилов Д.В., Кузнецова Т.Ю. Применение автоматизированной системы поддержки принятия врачебных решений при диспансеризации взрослого населения для контроля правильности оценки уровня сердечно-сосудистого риска // Менеджмент качества в медицине. – 2022. – №1. – С.72-79.
15. Курдюмов Д.А., Кашин А.В., Рябов Н.Ю. и др. Опыт применения технологий искусственного интеллекта для развития профилактического здравоохранения на примере Кировской области // Менеджер здравоохранения. – 2023. – №6. – С.62-69. doi: 10.21045/1811-0185-2023-6-62-69.
16. Белорус О.В., Токарев С.А., Захарова М.Г., Гусев А.В. Результаты пилотного внедрения технологий искусственного интеллекта в систему здравоохранения Ямало-Ненецкого автономного округа // Менеджмент качества в медицине. – 2023. – №3. – С.39-47.
17. Гиляревский С.Р., Гаврилов Д.В., Гусев А.В. Результаты ретроспективного анализа записей электронных амбулаторных медицинских карт пациентов с хронической сердечной недостаточностью: первый российский опыт // Российский кардиологический журнал. – 2021. – Т.26. – №5. – С.147-155. doi: 10.15829/1560-4071-2021-4502.
18. Батюшин М.М., Касимова И.С., Гаврилов Д.В. и др. Распространенность хронической болезни почек по данным ретроспективного когортного исследования «эпидемиология ХБП» (город Киров) // Нефрология и диализ. – 2021. – Т.23. – №2. – С.192-202. doi: 10.28996/2618-9801-2021-2-192-202.
19. Дружилов М.А., Кузнецова Т.Ю., Дружилова О.Ю. и др. Фибрилляция предсердий и хроническая болезнь почек: основные клинические характеристики пациентов в отдельных субъектах Российской Федерации // Кардиоваскулярная терапия и профилактика. – 2023. – Т.22. – №4. – С.57-67. doi: 10.15829/1728-8800-2023-3544.
20. Дружилов М.А., Кузнецова Т.Ю., Дружилова О.Ю. и др. Результаты ретроспективного анализа частоты ишемического инсульта и назначения антикоагулянтной терапии пациентам с фибрилляцией предсердий в зависимости от индекса массы тела // Российский кардиологический журнал. – 2023. – Т.28. – №5. – С.46-54. doi: 10.15829/1560-4071-2023-5359.
21. Korneva V, Druzhilov M, Kuznetsova T, Gavrilov D, Gusev A. Obesity and the risk of ischemic stroke in patients with atrial fibrillation: Findings from a big data analysis. Atherosclerosis. 2023; 379: 88. doi: 10.1016/j.atherosclerosis.2023.06.327.
22. Дружилов М.А., Кузнецова Т.Ю., Гаврилов Д.В., Гусев А.В. Верификация субклинического каротидного атеросклероза в рамках риск-стратификации при избыточном весе и ожирении: роль методов машинного обучения в формировании диагностического алгоритма // Кардиоваскулярная терапия и профилактика. – 2022. – Т.21. – №7. – С.79-87. doi: 10.15829/1728-8800-2022-3222.
23. Гаврилов Д.В., Кузнецова Т.Ю., Дружилов М.А. и др. Прогнозирование наличия субклинического каротидного атеросклероза у пациентов с избыточным весом и ожирением при помощи модели машинного обучения // Российский кардиологический журнал. – 2022. – Т.27. – №4. – С.40-47. doi: 10.15829/1560-4071-2022-4871.
24. Gavrilov D, Kuznetsova T, Gusev A, Korsakov I, Novitskiy R. Application of a clinical decision support system to assess the severity of the new coronavirus infection COVID-19, European Heart Journal. 2021; 42(1): ehab724.3054. doi: 10.1093/eurheartj/ehab724.3054.
25. Андрейченко А.Е., Лучинин А.С., Ившин А.А. и др. Разработка и валидация моделей прогнозирования общего риска преэклампсии и риска ранней преэклампсии с использованием алгоритмов машинного обучения в первом триместре беременности // Акушерство и гинекология. – 2023. – №10. – С.94-107. doi: 10.18565/aig.2023.101.
26. Ivshin АA, Boldina JS, Gusev AV, et al. Artificial
2. Гусев А.В., Владзимирский А.В., Голубев Н.А., Зарубина Т.В. Информатизация здравоохранения Российской Федерации: история и результаты развития // Национальное здравоохранение. – 2021. – Т.2/ – №3. – С.5-17. doi: 10.47093/2713-069X.2021.2.3.5-17.
3. Колбин А.С., Белоусов Д.Ю., Зырянов С.К. и др. Исследования реальной клинической практики. – М.: Буки Веди, 2020. – 208 с.: ил.
4. Гусев А.В., Зингерман Б.В., Тюфилин Д.С., Зинченко В.В. Электронные медицинские карты как источник данных реальной клинической практики // Реальная клиническая практика: данные и доказательства. – 2022. – Т.2. – №2. – С.8-20. doi: 10.37489/2782-3784-myrwd-13.
5. Гольдина Т.А. Исследования рутинной клинической практики: от получения данных к оценке медицинских технологий и принятию решений в здравоохранении // Медицинские технологии. Оценка и выбор. – 2018. – №1(31). – С.21-29.
6. Yamamoto K, Sumi E, Yamazaki T, et al. A pragmatic method for electronic medical record-based observational studies: developing an electronic medical records retrieval system for clinical research. BMJ Open. 2012; 2: e001622. doi: 10.1136/bmjopen-2012-001622.
7. Хомицкая Ю.В., Осина Г.С., Новодережкина Е.А., Гольдина Т.А. Исследования рутинной практики: как разработать и внедрить новое направление. Системный подход в обеспечении качества результатов // Медицинские технологии. Оценка и выбор. – 2021. – №4(43). – С.16-27. doi: 10.17116/medtech20214304116.
8. Гольдина Т.А., Колбин А.С., Белоусов Д.Ю., Боровская В.Г. Обзор исследований реальной клинической практики // Качественная клиническая практика. – 2021. – №1. – С.56-63. doi: 10.37489/2588-0519-2021-1-56-63.
9. Fu S, Chen D, He H, et al. Clinical concept extraction: A methodology review. J Biomed Inform. 2020; 109: 103526. doi: 10.1016/j.jbi.2020.103526.
10. Zhao Y, Weroh SJ, Goode EL, et al. Generating real-world evidence from unstructured clinical notes to examine clinical utility of genetic tests: use case in BRCAness. BMC Med Inform Decis Mak. 2021; 21: 3. doi: 10.1186/s12911-020-01364-y.
11. van Laar S, Gombert-Handoko K, Groenwold R, et al. Real-World Metastatic Renal Cell Carcinoma Treatment Patterns and Clinical Outcomes in The Netherlands. Front. Pharmacol. 2022; 13: 803935. doi: 10.3389/fphar.2022.803935.
12. Webiomed.Connect. https://webiomed.ru/products/integratsionnyi-shliuz-webiomedconnect.
13. Кобякова О.С. Технологии искусственного интеллекта в здравоохранении в глобальной патентной экосистеме: 2000-2023 гг. // Врач и информационные технологии. – 2024. – №1. – С.44-59. doi: 10.25881/18110193_2024_1_44.
14. Гусев А.В., Токарев С.А., Гаврилов Д.В., Кузнецова Т.Ю. Применение автоматизированной системы поддержки принятия врачебных решений при диспансеризации взрослого населения для контроля правильности оценки уровня сердечно-сосудистого риска // Менеджмент качества в медицине. – 2022. – №1. – С.72-79.
15. Курдюмов Д.А., Кашин А.В., Рябов Н.Ю. и др. Опыт применения технологий искусственного интеллекта для развития профилактического здравоохранения на примере Кировской области // Менеджер здравоохранения. – 2023. – №6. – С.62-69. doi: 10.21045/1811-0185-2023-6-62-69.
16. Белорус О.В., Токарев С.А., Захарова М.Г., Гусев А.В. Результаты пилотного внедрения технологий искусственного интеллекта в систему здравоохранения Ямало-Ненецкого автономного округа // Менеджмент качества в медицине. – 2023. – №3. – С.39-47.
17. Гиляревский С.Р., Гаврилов Д.В., Гусев А.В. Результаты ретроспективного анализа записей электронных амбулаторных медицинских карт пациентов с хронической сердечной недостаточностью: первый российский опыт // Российский кардиологический журнал. – 2021. – Т.26. – №5. – С.147-155. doi: 10.15829/1560-4071-2021-4502.
18. Батюшин М.М., Касимова И.С., Гаврилов Д.В. и др. Распространенность хронической болезни почек по данным ретроспективного когортного исследования «эпидемиология ХБП» (город Киров) // Нефрология и диализ. – 2021. – Т.23. – №2. – С.192-202. doi: 10.28996/2618-9801-2021-2-192-202.
19. Дружилов М.А., Кузнецова Т.Ю., Дружилова О.Ю. и др. Фибрилляция предсердий и хроническая болезнь почек: основные клинические характеристики пациентов в отдельных субъектах Российской Федерации // Кардиоваскулярная терапия и профилактика. – 2023. – Т.22. – №4. – С.57-67. doi: 10.15829/1728-8800-2023-3544.
20. Дружилов М.А., Кузнецова Т.Ю., Дружилова О.Ю. и др. Результаты ретроспективного анализа частоты ишемического инсульта и назначения антикоагулянтной терапии пациентам с фибрилляцией предсердий в зависимости от индекса массы тела // Российский кардиологический журнал. – 2023. – Т.28. – №5. – С.46-54. doi: 10.15829/1560-4071-2023-5359.
21. Korneva V, Druzhilov M, Kuznetsova T, Gavrilov D, Gusev A. Obesity and the risk of ischemic stroke in patients with atrial fibrillation: Findings from a big data analysis. Atherosclerosis. 2023; 379: 88. doi: 10.1016/j.atherosclerosis.2023.06.327.
22. Дружилов М.А., Кузнецова Т.Ю., Гаврилов Д.В., Гусев А.В. Верификация субклинического каротидного атеросклероза в рамках риск-стратификации при избыточном весе и ожирении: роль методов машинного обучения в формировании диагностического алгоритма // Кардиоваскулярная терапия и профилактика. – 2022. – Т.21. – №7. – С.79-87. doi: 10.15829/1728-8800-2022-3222.
23. Гаврилов Д.В., Кузнецова Т.Ю., Дружилов М.А. и др. Прогнозирование наличия субклинического каротидного атеросклероза у пациентов с избыточным весом и ожирением при помощи модели машинного обучения // Российский кардиологический журнал. – 2022. – Т.27. – №4. – С.40-47. doi: 10.15829/1560-4071-2022-4871.
24. Gavrilov D, Kuznetsova T, Gusev A, Korsakov I, Novitskiy R. Application of a clinical decision support system to assess the severity of the new coronavirus infection COVID-19, European Heart Journal. 2021; 42(1): ehab724.3054. doi: 10.1093/eurheartj/ehab724.3054.
25. Андрейченко А.Е., Лучинин А.С., Ившин А.А. и др. Разработка и валидация моделей прогнозирования общего риска преэклампсии и риска ранней преэклампсии с использованием алгоритмов машинного обучения в первом триместре беременности // Акушерство и гинекология. – 2023. – №10. – С.94-107. doi: 10.18565/aig.2023.101.
26. Ivshin АA, Boldina JS, Gusev AV, et al. Artificial
Для цитирования
Гусев А.В., Гольдина Т.А. Анализ данных реальной клинической практики, извлеченных из электронных медицинских карт в платформе Webiomed. Врач и информационные технологии. 2024; 3: 44-61. doi: 10.25881/18110193_2024_3_44.
Документы
Ключевые слова