Evaluación automatizada de CO-RADS y puntajes de gravedad de TC de tórax en pacientes con sospecha de COVID-19 mediante inteligencia artificial

Evaluación automatizada de CO-RADS y puntajes de gravedad de TC de tórax en pacientes con sospecha de COVID-19 mediante inteligencia artificial

Entrega resultados NUBIX

Durante la pandemia por COVID-19, la tomografía computarizada de pecho (TC) resultó ser muy útil como apoyo para el diagnóstico y seguimiento de la enfermedad en pacientes positivos o con posible infección. Los sistemas de puntuación de TC como los CO-RADS han mejorado la comunicación entre los radiólogos y otros proveedores de servicios de salud mediante la traducción de los hallazgos radiológicos en sistemas estandarizados de puntuación. El sistema de puntuación va de 1 a 5 aumentando con el nivel de sospecha de COVID-19, basado en las características observadas en la TC de tórax.

La inteligencia artificial (IA) a través del “Deep Learning” ha logrado automatizar la lectura de las imagines de TC para el diagnóstico de COVID-19. A pesar de que la IA tiene un gran potencial aún se duda de su funcionalidad y eficacia. Es cuestionable que estos algoritmos representen un beneficio adicional en contraste con la lectura manual de las imágenes. Además los algoritmos que siguen el sistema de puntuación estandarizado necesitan validación para asegurar que asignan una puntuación similar a la que asignan los radiólogos para identificar la infección con un desempeño similar o incluso mejor.

El artículo de Lessman N. publicado en Radiology (2020) tenía como objetivo desarrollar y validar un algoritmo de IA (CO-RADS AI) que sea capaz de evaluar automáticamente imágenes de TC de tórax de pacientes con posible infección por COVID-19.

Métodos y materiales

Para dicho estudio se obtuvo la aprobación del comité ético médico. Se incluyeron pacientes consecutivos que se presentaron en salas de emergencia de un centro académico y un gran hospital universitario en los países bajos en marzo y abril de 2020, a los cuales se les realizó una tomografía computarizada de tórax por sospecha clínica de COVID-19 de moderado a grave. Los criterios para la TC fueron síntomas de infección del tracto respiratorio inferior (tos, disnea) que requirieron ingreso hospitalario y fiebre con anosmia. Además las tomografías debían estar evaluadas con puntajes de gravedad.

Los datos de 476 pacientes del centro académico fueron utilizados para el desarrollo del modelo, 520 imágenes de TC en total. Los puntajes CO-RADS fueron extraídos de los reportes radiológicos. Los datos de otros 105 pacientes del centro académico fueron reservados para  para verificar el rendimiento del modelo IA. Siete radiólogos de tórax y un residente de radiología puntuaron de forma independiente la primera exploración disponible de cada paciente siguiendo la clasificación CO-RADS. Los especialistas asignaron CO-RADS 1-5 en función de su sospecha de afectación pulmonar de COVID-19.

Las TC se calificaron de forma totalmente automática utilizando tres algoritmos de Deep learning aplicados sucesivamente. (1) segmentación y etiquetado del lóbulo pulmonar (2) segmentación de la lesión y predicción de la puntuación de gravedad de la TC y (3) predicción de la puntuación de la TC.

Este sistema identificó a los pacientes con COVID-19 con un alto rendimiento diagnóstico, logrando un AUC de 0,95 en el conjunto de prueba con una sensibilidad y especificidad similares a las de los ocho observadores, y de 0,88 en el conjunto de prueba externo.

Discusión

El estudio demostró que un sistema de IA puede identificar a los pacientes positivos para COVID-19 basándose en imágenes de TC de tórax sin contraste con un rendimiento de diagnóstico comparable al de los observadores radiológicos. Es de destacar que el algoritmo fue entrenado para adherirse a las categorías CO-RADS y, por lo tanto, los radiólogos pueden interpretarlo directamente. Los creadores del algoritmo consideran que el sistema de IA puede ser útil para apoyar a los radiólogos en los informes de TC estandarizados durante los períodos de mayor actividad. Las puntuaciones de gravedad de la TC evaluadas automáticamente por lóbulo pueden tener información de pronóstico y podrían usarse para cuantificar el daño pulmonar, también durante el seguimiento del paciente.

A pesar de que existen múltiples algoritmos de IA, creados por diferentes autores,  para el diagnóstico y seguimiento de COVID-19 a través de diferentes métodos de obtención de imágenes, aún queda mucho por hacer para obtener una mayor sensibilidad y especifidad y así asegurar resultados confiables, recordemos que de esto podría depender la vida del paciente.

Lessmann, N. Sánchez, C. et al (2020) Automated Assessment of CO-RADS and Chest CT Severity Scores in Patients with Suspected COVID-19 Using Artificial Intelligence. Radiology. https://www.ncbi.nlm.nih.gov/pmc/articles/PMC7393955/