Сравнительная оценка логистической регрессии и дерева решений в прогнозировании рецидива у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью возбудителя
https://doi.org/10.31549/2542-1174-2022-6-4-99-111
Аннотация
Введение. Частота рецидивов туберкулеза (ТБ) органов дыхания является одним из показателей, характеризующих эффективность проводимых противотуберкулезных мероприятий. Своевременное выявление больных с рецидивами является одним из приоритетных подходов в решении этой проблемы. В настоящее время с внедрением технологий обработки больших массивов данных, а именно искусственного интеллекта, применяют различные классификаторы, учитывающие совокупность выявляемых у пациентов признаков. Алгоритм «дерево решений» достаточно хорошо зарекомендовал себя в медицинской аналитике. С его помощью можно классифицировать состояние здоровья обследуемых и выявлять первые признаки рецидива туберкулезного процесса.
Цель исследования. Разработать и провести сравнительную оценку моделей прогнозирования рецидива у больных туберкулезом легких с множественной лекарственной устойчивостью возбудителя (МЛУ-ТБ) с
применением математических технологий – логистической регрессии и дерева решений.
Материалы и методы. В исследование включены клинико-эпидемиологические, возрастно-половые, социальные, медико-биологические данные 346 пациентов МЛУ-ТБ, которые эффективно завершили курс химиотерапии. Были сформированы две группы наблюдения в зависимости от наступления у пациентов рецидива заболевания в течение как минимум пятилетнего срока наблюдения – основная (35 чел., рецидив ТБ) и контрольная (311 чел., без рецидива) соответственно. Статистическая обработка данных для модели логистической регрессии проводилась в программе IBM SPSS Statistics 23.0; для классификатора на основе дерева решений – в библиотеке Scikit-learn 0.24.2 в интерактивной облачной среде с программным кодом Google Colaboratory с использованием К-блочной стратифицированной проверки. Количественная интерпретация результатов прогнозирования
проводилась по ROC-кривым с оценкой показателя AUC и статистических показателей диагностического теста – чувствительности и специфичности.
Результаты. Чувствительность и специфичность модели логистической регрессии и классификатора на основе дерева решений для прогнозирования рецидива туберкулеза составили 98.7 %, 88.6 % и 74.0 %, 97.0 % соответственно.
Заключение. Созданные модели могут стать инструментом прогнозирования рецидива у излеченных больных МЛУ-ТБ.
Ключевые слова
Об авторах
А. С. АллилуевРоссия
Александр Сергеевич Аллилуев, канд. мед. наук, заместитель главного врача по организационно-методической работе
634009
ул. Розы Люксембург, 17
Томск
О. В. Филинюк
Россия
Ольга Владимировна Филинюк, д-р мед. наук, профессор, заведующий кафедрой
ФГБОУ ВО «Сибирский государственный медицинский университет»
кафедра фтизиатрии и пульмонологии
Томск
С. В. Аксенов
Россия
Сергей Владимирович Аксенов, канд. техн. наук, доцент, доцент кафедры
ФГБОУ ВО «Сибирский государственный медицинский университет»
кафедра медицинской и биологической кибернетики
Инженерная школа информационных технологий и робототехники
отделение информационных технологий
кафедра теоретических основ информатики
Томск
Е. Е. Шнайдер
Россия
Екатерина Евгеньевна Шнайдер, врач-статистик
организационно-методический отдел
Томск
Д. Е. Филинюк
Россия
Даниил Евгеньевич Филинюк, студент
Инженерная школа информационных технологий и робототехники
Томск
Ю. А. Логинова
Россия
Юлия Александровна Логинова, ординатор
ФГБОУ ВО «Сибирский государственный медицинский университет»
кафедра фтизиатрии и пульмонологии
Томск
Список литературы
1. Global tuberculosis report 2021. Geneva: World Health Organization, 2021. Licence: CC BY-NC-SA 3.0 IGO.
2. Ресурсы и деятельность противотуберкулезных организаций Российской Федерации в 2019–2020 гг. (статистические материалы) / О. Б. Нечаева [и др.] – М.: РИО ЦНИИОИЗ, 2021. – 112 с.
3. Пьянзова Т. В. Клиническая характеристика рецидивов туберкулезного процесса в Кемеровской области / Т. В. Пьянзова [и др.] // Туберкулез и болезни легких. – 2013. – 9: 25-28.
4. Рукосуева О. В. Особенности течения и диагностики рецидивов туберкулеза легких / О. В. Рукосуева [и др.] // Туберкулез и болезни легких. – 2011. – 7: 138-139.
5. Сагалбаева Т. Ж. Причины формирования и структура клинических форм туберкулеза ранних и поздних рецидивов заболевания / Т. Ж. Сагалбаева [и др.] // Туберкулез и болезни легких. – 2015. – 5: 163-164.
6. Шарашова Е. Е. Применение множественного логистического регрессионного анализа в здравоохранении с использованием пакета статистических программ SPSS Е. Е. Шарашова [и др.] // Наука и здравоохранение. – 2017. – 4: 5-26.
7. Наркевич А. Н. Интеллектуальные методы анализа данных в биомедицинских исследованиях: деревья классификации / А. Н. Наркевич, К. А. Виноградов, А. М. Гржибовский // Экология человека. – 2021. –3: 54-64.
8. Mello F. C. d. Q., Bastos L. G. d. V., Soares S. L. M. et al. Predicting smear negative pulmonary tuberculosis with classifi cation trees and logistic regression: a cross-sectional study // BMC Public Health. 2006;6:43. DOI: 10.1186/1471-2458-6-43.
9. Aguiar F. S., Almeida L. L., Ruffi no-Netto A. et al. Classification and regression tree (CART) model to predict pulmonary tuberculosis in hospitalized patients // BMC Pulm Med. 2012; 12: 40. DOI: 10.1186/1471-2466-12-40.
10. Kalhori S. R. N., Zeng X. J. Evaluation and comparison of diff erent machine learning methods to predict outcome of tuberculosis treatment course // J. Intell. Learn. Syst. Appl. 2013; 5: 10.
11. Tan D., Wang B., Li X. et al. Identification of risk factors of multidrug-resistant tuberculosis by using classification tree method // Am. J. Trop. Med. Hyg. 2017; 97 (6): 1720-1725. DOI: 10.4269/ajtmh.17-0029.
12. Kulkarni V., Queiroz A. T. L., Sangle S. et al. A two-gene signature for tuberculosis diagnosis in persons with advanced HIV // Front. Immunol. 2021; 12: 631165. DOI: 10.3389/fimmu.2021.631165.
Рецензия
Для цитирования:
Аллилуев А.С., Филинюк О.В., Аксенов С.В., Шнайдер Е.Е., Филинюк Д.Е., Логинова Ю.А. Сравнительная оценка логистической регрессии и дерева решений в прогнозировании рецидива у больных туберкулезом органов дыхания с множественной лекарственной устойчивостью возбудителя. Journal of Siberian Medical Sciences. 2022;(4):99-111. https://doi.org/10.31549/2542-1174-2022-6-4-99-111
For citation:
Alliluev A.S., Filinyuk O.V., Аksenov S.V., Shnayder E.E., Filinyuk D.E., Loginova Yu.A. Comparative evaluation of logistic regression and decision tree in predicting multidrug-resistant tuberculosis recurrence. Journal of Siberian Medical Sciences. 2022;(4):99-111. https://doi.org/10.31549/2542-1174-2022-6-4-99-111