Anotación automática de cuadros delimitadores de datos de rayos x de tórax para la localización de anomalías

Anotación automática de cuadros delimitadores de datos de rayos x de tórax para la localización de anomalías

Introducción

La radiografía de tórax es uno de los exámenes más demandados. En la actualidad se han realizado algunos grupos de datos públicos que incluyen etiquetas de hallazgos provenientes de informes clínicos. Esto ha permitido la incorporación de algoritmos de IA          para realizar una distribución y detección con carácter global. No obstante, son pocos los subgrupos de imágenes que cuentan con marcadores adicionales para ubicar dichos hallazgos.  

Para lograr una estandarización interpretativa automática de lecturas de radiografías de tórax, se presenta el desarrollo de una línea de etiquetado automatizado de cuadros delimitadores desde la base de informes de texto de RX.

Métodos

Para las RX frontales, se consideraron las 6 zonas pulmonares no superpuestas, comúnmente referenciadas por radiólogos para describir anomalías pulmonares. Para estas divisiones se hizo uso de un modelo UNet entrenado con segmentaciones manuales normales y sin hallazgos. Dicho modelo predecía de forma independiente las máscaras de división de los pulmones. La caja torácica delimitó los bordes laterales de las cajas delimitadoras considerando un cuadro delimitador rectangular que usó ITK-Snap.

Debido a un fallo arrojado al detectar opacidad pulmonar o anomalías considerables, se usaron heurísticos adicionales para perfeccionar y extraer los seis recuadros delimitadores estandarizados. Se calcularon las relaciones de altura media de las zonas pulmonares superiores, medias e inferiores para hacer una segmentación del pulmón en tres regiones estandarizadas de forma vertical.

El conjunto de datos de prueba de cuadros delimitadores de opacidad pulmonar contuvo un total de 13746 imágenes de radiografías de tórax, con 31633 cuadros marcados como positivos y 50842 como negativos. Finalmente, se utilizó la RetinaNet para entrenarla con esos conjuntos.

Experimentos

Del conjunto de imágenes utilizadas, el 70% se usó para la etapa de formación, 10% para validación y 20% para prueba. Para medir el rendimiento del modelo se hizo una evaluación de del conjunto de pruebas, presentando las clasificaciones a nivel de imagen y los resultados de ubicación de hallazgos.

En cuanto a la precisión de la clasificación, se adjudicaron marcadores de opacidad para cada imagen con un cuadro delimitador como mínimo. En caso de que no se pronosticara un cuadro delimitador, se marcaba como negativa. Con ello, se obtuvo una precisión de clasificación de opacidad de 0,89, un reconocimiento de 0,57, una especificidad de 0,94 y exactitud de 0,77. Por último, el IOU medio fue de 0,29.

Conclusiones

La ubicación de forma automática de hallazgos en la RX puede ser un proceso complejo. Con esta propuesta se busca generalizar a otros hallazgos en la RX, consolidar el rendimiento de la línea de producción para todo tipo específico de opacidades pulmonares y extender este método a otras anomalías de tórax.

Traducido y adaptado de: J. Wu et al., «Automatic Bounding Box Annotation of Chest X-Ray Data for Localization of Abnormalities,» 2020 IEEE 17th International Symposium on Biomedical Imaging (ISBI), 2020, pp. 799-803, doi: 10.1109/ISBI45749.2020.9098482