Multiview Deep Learning para la evaluación de BI-RADS y densidad de mamografías.
Algoritmos avanzados de aprendizaje profundo o deep learning (DL) en inglés, podrían predecir el riesgo de un paciente de desarrollar cáncer de mama basándose en el sistema de informes y datos de imágenes mamarias o BI-RADS (Breast Imaging Reporting and Data System)y los estándares de densidad. Estudios recientes sugieren que la combinación de un análisis de múltiples vistas o multiview mejoró el rendimiento general de la clasificación de exámenes de mama.
En el estudio realizado por Nguyen H.T.X, Tran S.B. et al. (2021)
un nuevo enfoque de aprendizaje profundo de múltiples vistas (multiview DL) para la evaluación de BI-RADS y densidad de mamografías. El enfoque propuesto utiliza redes convolucionales para la extracción de características en cada vista, posteriormente las características extraídas se introducen en un clasificador Light Gradient Boosting Machine (LightGBM) para predecir los puntajes BI-RADS y de densidad. Se llevaron a cabo varios experimentos con el conjunto de datos de mamografía interna y la base de datos pública Digital Database for Screening Mammography (DDSM). Los resultados experimentales demostraron que el enfoque propuesto supera la clasificación de vista única.
El cáncer de mama se ha vuelto el tipo de cáncer diagnosticado con mayor frecuencia, según la Agencia Internacional de Investigación sobre el Cáncer (2020); se estima que 2.3 millones de mujeres fueron diagnosticadas con este padecimiento y 685,000 muertes fueron causadas por el mismo alrededor del mundo. Los síntomas de esta enfermedad suelen aparecer en etapas tardías por lo que los tratamientos podrían no funcionar. Es por esto que, el chequeo periódico de mama juega un papel crucial para la detección temprana de tumores. La mamografía es un tipo de radiografía para la examinación de las mamas que se utiliza en los sistemas de diagnóstico asistido por computadora (CADx) para mejorar la eficiencia de los radiólogos.
Una mamografía típica consta de cuatro vistas:
R-CC (craneocaudal derecha), L-CC (craneocaudal izquierda), R-MLO (oblicua medio lateral derecha) y L-MLO (oblicua medio lateral izquierda). En la práctica clínica, los médicos suelen utilizar estas vistas para evaluación del riesgo de cáncer de mama. En particular, la puntuación BI-RADS se utiliza como una herramienta de evaluación de riesgos y garantía de calidad que proporciona un léxico ampliamente aceptado y un esquema de informes para la obtención de imágenes de la mama. Esta norma contiene siete categorías de evaluación: BI-RADS 0 (incompleto), BI-RADS 1 (negativo); BI-RADS 2 (benigno), BI-RADS 3 (probablemente benigno), BI-RADS 4 (sospechoso de malignidad), BI-RADS 5 (altamente sugestivo de malignidad); y BI-RADS 6 (conocido malignidad comprobada por biopsia).
Además, la densidad mamaria se refiere a la cantidad de tejido fibroglandular en un seno en relación con la grasa; sus cuatro descriptores incluyen A (pecho casi completamente graso), B (áreas dispersas de densidad fibroglandular), C (mama heterogéneamente densa) y D (mama extremadamente densa).
Anteriormente,
Diferentes enfoques de aprendizaje automático (machine learning) han sido sugeridos para clasificar y detectar cáncer de mama usando información adquirida de vistas únicas (singleview). Recientemente, estudios han demostrado que un enfoque de múltiples vistas puede mejorar el diagnóstico. La técnica consiste en crear un modelo end-to-end de aprendizaje profundo para clasificar la patología de las mamografías (benigno/maligno). Primeramente, se extraen características de cada vista independientemente para después combinar las cuatro vistas y hacer predicciones. El sistema desarrollado, a diferencia de otros, es capaz de proporcionar una salida multietiqueta que incluye las 5 categorías BI-RADS y las cuatro clases de densidad mamaria. Los experimentos realizados demostraron que el acercamiento multivista supera al acercamiento de vista único tanto en la base de datos interna como en la externa.
Las dos principales contribuciones de este trabajo son, primero, el desarrollo de un sistema multietiqueta de aprendizaje profundo capaz de clasificar automáticamente la densidad y BI-RADS de mamografías. En segundo lugar, el enfoque propuesto se basa en un clasificador de dos etapas multivista. Durante la primera etapa se extraen las características de cada vista. En la segunda, las características aprendidas se fusionan y luego se entrenan mediante un clasificador LightGBM para predecir BI-RADS y puntajes de densidad.
Los resultados experimentales mostraron que el enfoque de vista múltiple superó al modelo de vista única hasta en un 5% en términos de Puntuación F1. La evaluación externa sobre el conjunto de datos DDSM también demostró la eficacia del enfoque propuesto con un aumento del 10% en la clasificación de la patología en comparación con el enfoque de vista única.
Para concluir,
esta novedosa estrategia multivista para clasificar la densidad mamaria y estimar las puntuaciones BI-RADS a partir de exámenes de mamografía, ha demostrado en ambos conjuntos de datos DDSM privados y públicos que la combinación de la información de las vistas MLO y CC mejora la precisión del diagnóstico en comparación con un enfoque de vista única. Esto abre un nuevo enfoque prometedor para construir y desarrollar un modelo efectivo en la detección temprana del cáncer de mama. Este proyecto, continua en desarrollo, se busca encontrar nuevas estrategias de combinación de características para generar características más discriminatorias para BI-RADS y tareas de clasificación de densidad.
Leer más en Nguyen H.T.X, Tran S.B. et al. (2021) A novel multi-view deep learning approach for BI-RADS and density assessment of mammograms. https://arxiv.org/pdf/2112.04490.pdf