No estoy trabajando en el campo de la atención médica, pero conocí a varias personas que trabajan en la intersección entre el aprendizaje automático y el cuidado de la salud. Por ejemplo, el laboratorio de Mias en nuestro departamento (
G. Mias Lab) se centra en la recopilación e integración de datos ómicos de varias bases de datos y recursos en línea para predecir los factores de riesgo de ciertas enfermedades. Y Samantha Kleinberg, autora de “Why”, está realizando una notable investigación, aplicando y desarrollando diversas técnicas de modelado estadístico relacionadas con la asistencia sanitaria Samantha Kleinberg
Mirando la literatura biomédica, creo que el enfoque clásico para caracterizar la función de una proteína o gen en particular es observarlo de forma aislada (anularlo o sobreexpresarlo) para vincularlo con un cierto fenotipo. Este enfoque ascendente es ciertamente necesario para identificar a los actores clave relacionados con la salud. Sin embargo, un gen o proteína es, por naturaleza, solo una pequeña parte de un sistema más grande y más complejo, y creo que juntar la información de diferentes fuentes de experimentos y dispositivos podría proporcionarnos características potencialmente útiles para comprender este panorama general, para hacer avances en el cuidado de la salud. En particular, estoy pensando en monitorear diferentes factores de riesgo a lo largo del tiempo. Si podemos hacerlo de manera eficiente, creo que los beneficios relacionados con la atención médica pueden ser enormes.
Diría que uno de nuestros objetivos es detectar los problemas relacionados con la salud de manera temprana, antes de que se conviertan en problemas reales, por ejemplo, el seguimiento de los factores de riesgo relacionados con la diabetes antes de que una persona realmente desarrolle diabetes. Desarrollar mejores tratamientos para las personas que tienen diabetes es realmente importante, pero si comprendemos mejor qué combinación de circunstancias aumenta el riesgo de diabetes, potencialmente podemos ayudar a una gran proporción de personas a desarrollar esta enfermedad. Sin haber realizado ninguna investigación en este campo, diría que la integración de información, como los antecedentes familiares, los niveles de expresión génica, la edad, el comportamiento de compra, los regímenes de ejercicio, etc., pueden ayudar a detectar los riesgos altos de manera temprana.
Estamos recopilando más y más datos, que en parte están disponibles para la investigación en forma anónima, y parece que conectarlos a los algoritmos de aprendizaje automático para construir modelos predictivos debería ser pan comido. Sin embargo, uno de los principales desafíos es que estos datos son muy heterogéneos, y limpiar y combinar datos de diferentes bases de datos es probablemente el cuello de botella. Además, existe, por supuesto, la preocupación por la privacidad: los datos se anonimizan de una manera que dificulta el enlace de las características de diferentes conjuntos de datos. Sin embargo, creo que compañías como Apple están trabajando en soluciones para rastrear datos anónimamente en dispositivos electrónicos como teléfonos inteligentes.
Ahora, creo que trabajar en una buena solución para poner todos estos datos personales a disposición de los investigadores de forma útil pero anónima es el primer paso para crear mejores sistemas de detección de problemas de salud. Creo que una vez que se resuelva este problema, podría allanar el camino a los sistemas de alerta personales, que podrían combinar datos como el comportamiento de compra, el ejercicio diario y la información de la dieta, quizás genomas personales y análisis de sangre ocasionales.