Introducción a las Redes Neuronales Convolucionales para su aplicación en Radiología.
Anteriormente nos hemos centrado primordialmente en la aplicación de Machine Learning e Inteligencia Artificial y sus posibles aplicaciones en el mundo de la radiología. Sin embargo, se ha percibido que existe un algoritmo predominante al momento de analizar artículos referentes a la IA con respecto a la radiología; siendo este las Redes Neuronales Convolucionales,
Por lo tanto, se tratará de dar explicación a este algoritmo de una manera general, concluyendo en algunas de sus aplicaciones referentes a este tema. Primeramente, para introducirnos a este complejo algoritmo, vamos a explicar el término de Redes Neuronales en el Machine Learning.
Este término viene dado por la similitud que se quiere proporcionar a estas “Neuronas” con respecto a las biológicas, esto debido a que al recibir una información, estás realizarán un complejo algoritmo. El cual el resultado, será la entrada de la siguiente capa de esta Red.
La entrada de tamaño N que entra a la red, es procesada por una primera capa y, dicha salida será el parámetro de entrada de la siguiente capa. Como tal el número estándar de capas ocultas a tomar en consideración, dependerá del enfoque que cada uno le quiera dar. Cabe aclarar que, para el caso de una imagen estática de blanco y negro; el número de neuronas en la entrada será igual al área de la imagen. Y si llega a ser RGB, se multiplicaría el área por 3, esto por el espectro RGB.
Ahora bien el término Convolucionales se refiere a que, uno de los algoritmos a utilizar para la entrada de esta red, es la convolución. La cual consiste en realizar el producto punto de un kernel de tamaño n, en un segmento de la imagen, y cuya matriz resultante se sumará hasta dar un escalar, siendo así el nuevo pixel. Esto se puede apreciar en la figura 1.
Después de realizar la convolución, es necesario realizar la extracción de las características importantes de dicha operación. Para ello mediante una función de activación lineal o no lineal, tal como una sigmoide o una unidad lineal rectificada se puede observar los futuros más importantes.
Debido a que, para una imagen el número de neuronas a la entrada será muy grande debido a que será 3 veces el área de esta. Es necesario realizar un muestreo para poder garantizar la eficacia del algoritmo, una de las técnicas más utilizadas es el Pooling.
Como se muestra en la figura 2, de los futuros extraídos se realiza un ventaneado de tamaño n*n. Que, para el caso del Max Pooling al ser de tamaño 2*2, observará el píxel de mayor valor, y guardará su valor resultante en un pixel de la nueva imagen. Para el caso del min pooling se observará el valor menor de la matriz 2*2, al recorrer la ventana.
Este proceso puede realizarse en las capas ocultas de la Red Neuronal, por lo que para permitir su aprendizaje supervisado, es necesario ajustar el tamaño de los kernel al momento de la convolución. Además, observar cual función de activación se utilizará, y por último la técnica de reducción a emplear.
Para el caso de la radiología, este algoritmo puede utilizarse para la clasificación de nódulos largos en las Tomografías Computarizadas. Igualmente puede utilizarse para la segmentación de las lesiones de interés en el caso de las imágenes, primera aproximación para evaluar la gravedad del Covid-19 entre otras.
Yamashita, R., Nishio, M., Do, R. K. G., & Togashi, K. (2018). Convolutional neural networks: an overview and application in radiology. Insights into Imaging, 9(4), 611–629. https://doi-org.udlap.idm.oclc.org/10.1007/s13244-018-0639-9