Aprendizaje no supervisado en radiología utilizando nuevos modelos de variables latentes

Aprendizaje no supervisado en radiología utilizando nuevos modelos de variables latentes

Resumen

La variedad de modelos probabilísticos no supervisados se utilizan para representar un conjunto de datos que constan de información textual y de imágenes. En este artículo se comparan una variedad de modelos no supervisados. Asimismo, se muestran aquellos modelos basados en la asignación latente de Dirichlet (LDA).

Metodología

El conjunto de datos se toma dentro de la radiologí, teniendo una combinación de imágenes medicas e informes de consultores. Por lo tanto, la tarea es aprender a clasificar tejidos individuales o tipos de enfermedades que requieran datos etiquetados a mano por expertos. Por ello, los autores aplicaron una selección de modelos probabilísticos a los datos, haciendo dos suposiciones en todos sus modelos. La primera es que las características estadísticas de la imagen se pueden representar mediante alguna combinación. La segunda es que la distribución de palabras formaría un multinomial.

Resultados

Al momento de la comparación de los modelos tuvieron que realizar una validación cruzada de retención. Eso se realizó teniendo un subconjunto de datos, ejecutando las ecuaciones de actualización en los datos restantes hasta convergencia y calculando la probabilidad logarítmica de la muestra retenida promedio. Para la eliminación de algún problema de dependencia entre los datos, las muestras retenidas se fueron eligiendo para ser las de un paciente individual. Para cada modelo y número de procesos hubo una validación cruzada de 24 veces.

Conclusiones

Los autores identifican subtipos de enfermedad pulmonar, manteniendo una correspondencia entre estos y las clases establecidas. Esto da indicaciones más claras de las clases a utilizar para el diagnostico automatizado de enfermedades. El algoritmo solo converge a mínimos locales en función del límite, por lo que los autores no tuvieron una medida de la optimización universal de su solución.

Traducido y adaptado de: L. Carrivick, S. Prabhu, P. Goddard and J. Rossiter, «Unsupervised learning in radiology using novel latent variable models,» 2005 IEEE Computer Society Conference on Computer Vision and Pattern Recognition (CVPR’05), 2005, pp. 854-859 vol. 2, doi: 10.1109/CVPR.2005.357.