¿El gran problema en la imagen médica si usa las técnicas de detracción de CNN?

Gracias a A2A.

Uno de los mayores problemas en mi opinión es la heterogeneidad de los datos que introducirán factores de confusión.

Por ejemplo, las personas sanas tienen cosas más importantes que hacer en lugar de ir a los hospitales y escanear sus pulmones o cerebro. Como resultado, los datos recopilados suelen ser algunas imágenes médicas de pulmón enfermo, además de algunas imágenes de escaneo de pulmón sanas descargadas en otros lugares. Es muy probable que estos datos se recopilen de diferentes poblaciones, con diferentes dispositivos. Por lo tanto, cuando se aplica un método ML, nunca sabremos si el método ML está aprendiendo algo relacionado con la enfermedad o simplemente relacionado con el dispositivo.

Los problemas reales parecen ser más severos que el ejemplo anterior. Por ejemplo, hemos observado que, al eliminar los factores relacionados con la edad de las exploraciones por TC en el pulmón humano, podríamos aumentar la precisión de la predicción. En otras palabras, además de los simples factores de confusión, como los dispositivos de escaneo, podría haber muchos otros factores de confusión. Estamos redactando el manuscrito en esta etapa, por lo que no puedo compartir más información allí.

Nuestro nuevo manuscrito antes mencionado se basa en mi documento anterior Select-Additive Learning, que resuelve los problemas similares en el área de análisis de sentimientos, pero los métodos deben estar directamente relacionados con el área de la imagen médica.