Extracción automática de las principales fracturas osteoporóticas de informes radiológicos mediante el procesamiento del lenguaje natural

Extracción automática de las principales fracturas osteoporóticas de informes radiológicos mediante el procesamiento del lenguaje natural

Empresas segunda opinión NUBIX

Introducción

Las personas con osteoporosis, especialmente las personas de la tercera edad, suelen estar expuestas a un nivel alto de presentar fracturas. La mayor cantidad de información acerca de estas se encuentran en reportes de radiología derivados del sistema de Historia Clínica Electrónica. La adquisición automática de las fracturas obtenida de datos explicativos, puede ser útil para generar una diversidad de estudios y disminuir el gasto de asistencia.

Por ende, en esta investigación se creó un algoritmo NPL (natural language processing). Este se basaría en ciertos criterios de adquisición automática en informes radiológicos, específicamente de seis tipos de fracturas que se presentan en la osteoporosis: fractura de mano, pélvica, fémur y húmero proximal, tibia y columna vertebral.

Métodos

A partir de un grupo de datos de informes radiológicos de la Clínica de Mayo, se tomaron estudios de fractura de 6,033 pacientes y otros 2,000 de pacientes que no habían presentado fractura. Para el algoritmo, se usó de forma aleatoria el 70% de los casos con fractura para entrenarlo. El otro 30% se utilizó para evaluarlo.

El algoritmo NPL se entrenó con Medtagger. Para ello, en primer lugar se crearon criterios para reconocer los tipos de fractura. En segundo lugar, dichos criterios se perfeccionaron con la correspondiente validación de los doctores.

Resultados

Probado el algoritmo, se obtuvo una micro-puntuación media de F1 de 0,874. Esto indica que la efectividad de extracción de las posibles fracturas de tipo osteoporótico en base a informes radiológicos, fue válida.

El micropromedio del VPP fue de 0,972, mientras que la especificidad fue de 0,978, evidenciando la capacidad del algoritmo de extraer positivos y negativos. Por otro lado, la sensibilidad medida fue de 0,796, catalogada como moderada. Con ello, se observó que los criterios del algoritmo NPL pudieron no ser lo suficientemente precisos para distinguir diversas referencias a fracturas en los informes.

La puntuación F1 para las fracturas de pelvis, fémur y húmero proximal, y columna vertebral, fueron mayores a 0,9. La más baja corresponde a la fractura de mano con 0,821.

Traducido y adaptado de: Y. Wang, S. Mehrabi, S. Sohn, E. Atkinson, S. Amin and H. Liu, «Automatic Extraction of Major Osteoporotic Fractures from Radiology Reports using Natural Language Processing,» 2018 IEEE International Conference on Healthcare Informatics Workshop (ICHI-W), 2018, pp. 64-65, doi: 10.1109/ICHI-W.2018.00021