¿Cuál es el mayor problema cuando uso una CNN para detectar una enfermedad cerebral?

  1. Los métodos de aprendizaje profundo son, en general, cuadros negros; hacen predicciones y estas pueden ser útiles, pero no tenemos idea, como investigador, de por qué ocurre esto. No podemos aprender de este modelo, ni podemos discutirlo con los médicos. Posteriormente, debe estar seguro de que existe una comprensión sustancial de la enfermedad que está modelando. De lo contrario, podría estar alimentando imágenes de barrido de salvado en el algoritmo con factores sin sentido que simplemente covarian con la enfermedad. Y, dada una población más grande, encontramos que su modelo entrenado no es del todo útil, ya que ha aprendido que estos predominan en la clase de la enfermedad. Pero estos están presentes en muchas otras enfermedades. ¿Qué, entonces, estamos prediciendo? Quizás, síntomas.
  2. Validación. Del mismo modo, podemos tener correlaciones falsas en nuestro conjunto de entrenamiento solo. Los métodos de aprendizaje profundo requieren una gran cantidad de datos para comenzar. La obtención de imágenes biomédicas es costosa. Puede ser difícil desarrollar entrenamientos y conjuntos de pruebas que resulten factibles, lo que lleva a un sobreaprendizaje de las características no representativas del uso de nuestro pequeño conjunto de entrenamiento.

La regla general aquí es asegurarse de que la enfermedad que está modelando tenga características claras y discernibles en un examen cerebral dado (como tumores cerebrales, que pueden eludir los ojos humanos desde el principio). Muchas enfermedades neurodegenerativas no. Por lo tanto, debe observar la genética, las pruebas neurológicas y otros factores. En cierto punto, parece preferible utilizar una regresión logística simple, binaria (tiene enfermedad / no tiene la enfermedad, tiene gen / no tiene gen) y ver si eso no supera un enfoque más complejo. En general, según mi experiencia, para bien o para mal, si puede generar una ecuación comprensible (esbozando las mejores características para predecir el resultado), está haciendo una contribución más significativa a un campo.