Рост контингента пациентов со злокачественными новообразованиями в целом по России значительно увеличивает нагрузку на специализированную сеть онкологических учреждений и врачей онкологов. Наиболее вероятно, что данная тенденция сохранится в ближайшие годы. Одним из направлений повышения эффективности врачебной деятельности является извлечение современными методами анализа данных знаний из больших массивов медицинских данных путем кластеризации больных, заключающейся в выделении групп однородных (схожих) больных по совокупности клинических показателей. Целью исследования является разработка алгоритма поиска клинически однородных пациентов по слабоструктурированным и неструктурированным данным электронной медицинской карты онкологического диспансера, с последующей возможностью встраивания его в системы поддержки принятия врачебных решений (СППВР). Применение таких СППВР в практической медицине и в сфере медицинского образования позволит анализировать массивы информации неограниченного размера, что потребует дальнейшего внедрения и совершенствования информационных систем на всех уровнях оказания медицинской помощи. Однородность больных в работе определяли методом машинного обучения посредством косинусного расстояния в пространстве векторных представлений электронных медицинских карт. Эксперимент на 20 случайно выбранных электронных медицинских картах больных ГБУЗ «Клинический онкологический диспансер № 1» Министерства здравоохранения Краснодарского края показал высокую эффективность алгоритма в создании кластеров клинически схожих пациентов.
2. Кузнецова А. В., Сенько О. В., Кузнецова Ю. О. Преодоление проблемы «черного ящика» при использовании методов машинного обучения в медицине // Врач и информационные технологии. – 2018. – Специальный выпуск Труды Международного конгресса «Информационные технологии в медицине 2018» 11–12 октября, 2018 г. С. 74–80.
3. Мурашко Р. А., Тесленко Л. Г., Цокур И. В., Степанова Л. Л., Белокрылова А. П., Попкова А. Г., Майковская А. Г. Злокачественные новообразования в Краснодарском крае. Состояние онкологической помощи населению // Под ред. доцента кафедры онкологии с курсом торакальной хирургии ФПК и ППС ФГБОУ ВО КубГМУ Минздрава России, кандидата медицинских наук Р. А. Мурашко. – Краснодар, 2019.
4. Собченко К. В., Коваленко А. В., Кошкаров А. А., Мурашко Р. А., Шаров С. В. Разработка алгоритма автоматизированного вейвлет-анализа данных о работе регистратуры клинического онкологического диспансера на региональном уровне // Врач и информационные технологии. – 2018. – Специальный выпуск Труды Международного конгресса «Информационные технологии в медицине 2018» 11–12 октября, 2018 г. С. 66–73.
5. Халафян А. А., Карахалис Л. Ю., Папова Н. С., Акиньшина В. А., Кошкаров А. А. Прогнозирование стадии распространения заболевания у пациентов, страдающих аденомиозом, нейронными сетями // Врач и информационные технологии. – 2018. – № 4. С. 64–74.
6. Joulin A., Grave E., Bojanowski P., Mikolov T. Bag of Tricks for Efficient Text Classification.
7. Frederic Morin, Yoshua Bengio. Hierarchical Probabilistic Neural Network Language Model.
8. Grave Edouard, Bojanowski Piotr, Gupta Prakhar, Joulin Armand, Mikolov Tomas. Learning Word Vectors for 157 Languages.
9. Bojanowski P., Grave E., Joulin A., Mikolov T. Enriching Word Vectors with Subword Information.
10. Mikolov Tomáš, Chen Kai, Corrado Greg D., Dean Jeffrey. Efficient estimation of word representations in vector space //arXiv preprint, 2013a arXiv:1301.3781.