Guía práctica, para entender los conceptos, en artículos sobre Machine Learning e Inteligencia Artificial en Radiología.
Si bien el mundo del Machine Learning e Inteligencia Artificial puede llegar a fascinar por el hecho de entrenar a la computadora, para que esta pueda realizar “predicciones”. Después de haber sido entrenada previamente por nosotros, la comprensión de los algoritmos puede resultar un poco dificil de entender para el lector.
Ahora bien, para la comunidad de radiología puede resultar dificil de comprender todos los conceptos presentes en los artículos referentes al Machine Learning o Inteligencia Articial en Radiología. Por esta razón, Kockal, et al (2021). proponen una metodología simple para poder comprender de mejor manera este tipo de artículos.
Primero es necesario comprender la metodología simple en la cual consiste el Machine Learning siendo esta:
- Diseño: ¿Cómo se va a adquirir la imagen?
- Manejo de datos: Consiste en el procesamiento tal como, selección de datos, extracción de características más importantes de estos, y la reducción de estas.
- Modelado: Referente a la clasificación de las características, validación y comparación.
- Reporte: Compartiendo el conocimiento previo.
Conceptos clave para entender la etapa de Diseño
Tamaño de la base de datos
Si bien no hay un estándar sobre el tamaño de la base de datos a elegir, recomiendan que la base de datos, al momento de realizar cálculos de potencia estadística, esto podría generar miles de instancias, por lo que para fines de investigación se recomienda trabajar primeramente en 50, así mismo recomiendan que la base de datos a elegir sea por lo menos 10 veces más grande con respecto a los futuros que se van a extraer.
Robustez
Este concepto se refiere primordialmente a la capacidad de los datos, para no verse afectados por la variación en la metodología a emplear. Es decir, si los datos son susceptibles a cambiar dependiendo el diseño de la metodología, se deberá diseñar un estado de precaución o control al momento del modelado.
Conceptos clave para entender la etapa de Manejo de Datos
Escalamiento de características
Al momento del preprocesamiento, es necesario estandarizar las características independientes en un rango fijo. En cambio, el algoritmo podrá considerar valores muy altos o demasiado bajos, independientemente de la unidad a la cual hayan sido asignados.
Alta dimensionalidad
Una vez reconocidas las características a evaluar, puede suscitarse el caso de que el número de características a entrar en la clasificación requiera un mayor número de cálculos computacionales. Entre las técnicas más comunes que se utilizan para esta tarea se encuentran: Análisis de Componentes Principales (PCA), Análisis de Componentes Independientes (ICA), Clustering, entre otras.
Conceptos clave para entender la etapa de Modelado
Balance de Clases
Si es que hay un desbalance de clases, es posible que el algoritmo tienda a irse a la clase mayoritaria, para ello se recomienda tener un control del submuestreo o la sensibilidad del clasificador, durante la etapa de entrenamiento. Normalmente esta etapa es implementada en el entrenamiento.
El entrenamiento en un algoritmo de Machine Learning consiste en realizar un modelado previo para mejorarlo con una base de datos propia, mientras que la etapa de prueba es implementar dicho algoritmo entrenado. En otra base de datos denominada “Test database”, para que el algoritmo pueda utilizarse en otras bases de datos del tema en cuestión.
Evaluación de Métricas
Para determinar la efectividad del modelado, es necesaria su evaluación. “Entre los parámetros a tener en cuenta en esta etapa son: los valores predictivos (positivo y negativo),la especificidad, la matriz de confusión… deberían ser los parámetros mínimos a utilizar en el ámbito medico” (B., Kus, & O., 2021).
Utilidad Clínica
Si bien en algunas investigaciones este apartado puede pasar desapercibidamente en el diseño, B. Kus et al (2021), afirman que la utilidad clínica es necesaria en el diseño, ya que sin esta, en la etapa de clasificación los resultados pueden resultar inciertos y débiles. Entre los métodos más utilizados en esta fase son:
- Estadística de Calibración: Permite evaluar la cercanía de los resultados pronosticados mediante la probabilidad con respecto a los reales.
- Análisis de la curva de decisión: Es una herramienta complementaria en el mundo clínico debido a que toma en consideración el rendimiento predictivo discriminatorio, al igual que la calibración de los modelos.
B., K., Kus, E. A., & O., K. (Abril de 2021). How to read and review papers on machine learning and artificial intelligence in radiology: a survival guide to key methodological concepts. European Radiology, 31(4), 1189-1830. doi:10.1007/s00330-020-07324-4.