Pasos que seguir para la preparación de datos en un algoritmo de Inteligencia Artificial, junto con algunas de sus herramientas.

Pasos que seguir para la preparación de datos en un algoritmo de Inteligencia Artificial, junto con algunas de sus herramientas.

edificios nubix

Previamente en varias revisiones literarias, se ha abordado las ventajas que conlleva implementar una Inteligencia Artificial para la detección de anomalías, ya sea para detectar la gravedad del COVID-19 mediante la radiología del tórax, entre otras diversas aplicaciones.

Sin embargo, a pesar de no haber profundizado en cada uno de los algoritmos necesarios para su entrenamiento (Machine Learning). En esta ocasión se abordarán los pasos previos a seguir para preparar los datos antes de utilizarlos en algún algoritmo de Inteligencia Artificial. Al igual que algunas de sus herramientas disponibles para cada uno.

Figura 1. Esquema de Pasos para seguir previo al desarrollo o implementación de una Inteligencia Artificial (Diaz, y otros, 2021).

¿Cuáles son estos pasos?

Como se muestra en la Figura 1, una vez se haya adquirido las imágenes a evaluar, ya sea de manera propia, o mediante el uso de una base de datos. Siempre es necesario eliminar la información privada (DE-IDENTIFICACIÓN), la cual pueda permitir el reconocimiento del paciente. Para ello se recomienda eliminar la meta data de la cabecera de las imágenes DICOM. Algunas de las herramientas a utilizar para la eliminación de datos privados del paciente son: DICOM cleaner, Posda Tools, DICOM anonymizer etc.

De igual modo si se implementa una Definición de Objeto de Información en imágenes DICOM; esta podría permitir el reconocimiento facial del sujeto. Pudiendo así permitir su identificación para deconstruir su rostro facial. Algunas de las herramientas que se pueden utilizar son: Free Surfer MRI_Deface, Pydeface, Mripydeface, siendo estas 2 últimas de Python.

Una vez el sujeto se haya hecho “anónimo”, al de-identificarlo, es necesario proceder a la CURACIÓN de datos. Proceso en el cual consiste en la gestión activa de los datos (estandarización, normalización, modificación, extracción, etc) mientras estos sean de interés. Entre las herramientas a emplear durante esta fase se encuentran: Posda Tools, Dicom3tools, DCM4che, etc.

Para el ALMACENAMIENTO de las imágenes, se ha estandarizado el sistema de almacenamiento PACS. El cual permite tener una fácil accesibilidad al utilizar el protocolo DICOM. Es por esto por lo que se recomienda hacer siempre un respaldo, por si se llega a perder la información. Entre las herramientas a utilizar en esta etapa se encuentran: XANT, Dicoogle, JVS Dicoom, entre otras.

Durante la etapa de entrenamiento y validación de la Inteligencia Artificial es necesario realizar una serie de ANOTACIONES para obtener una mayor certeza. Por lo cual, para esta etapa el especialista puede realizar dichas anotaciones al observar detalladamente la imagen física, o mediante el uso de herramientas o software especializado. La ventaja de estos últimos con respecto a una imagen física es que su visualización será más detallada, pudiendo permitir en algunos casos dependiendo el archivo, visualizarla en forma tridimensional. Algunas de las herramientas para esta etapa son: 3D Slicer, Seg3D, MedSeg, etc.

Así pues durante el entrenamiento de la inteligencia artificial, es necesario guardar los cambios y realizar un respaldo de los archivos, si es que llega a haber algún percance durante su desarrollo. De igual modo, para obtener una retroalimentación activa es necesario que el personal del sector salud, realice las anotaciones pertinentes, tal como se muestra en la Figura 1.

Diaz, O., et al. (2021). Data preparation for artificial intelligence in medical imaging: A comprehensive guide to open-access platforms and tools. Physica Medica, 83, 25-37. doi:https://doi.org/10.1016/j.ejmp.2021.02.007