¿Cuál es el próximo gran enfoque metodológico para estudiar la genética de la enfermedad dadas las deficiencias de GWAS (Genome-Wide Association Study)?

Es una muy buena pregunta, una que creo que todavía no tiene respuesta; algunos investigadores piensan que a medida que secuenciamos más genomas, GWAS será más poderoso y nos dará más respuestas, ya que podremos centrarnos en variantes raras que serán descubiertas por un gran número de genomas completos secuenciados.

Otros piensan que hemos estado ladrando el árbol equivocado, y debemos enfocarnos exclusivamente en enfoques específicos, lo que significa observar variantes genéticas en genes que tienen un sentido “funcional” porque están relacionados con la enfermedad de forma mecánica.

Creo que ambos enfoques son válidos, y creo que la secuenciación de más genomas es una buena idea, especialmente teniendo en cuenta que el precio de la secuenciación se ha reducido y que el tiempo de secuenciación se ha reducido con nuevos instrumentos y actualizaciones de instrumentos.

Va a tomar un gran esfuerzo bioinformático, eso es seguro.

Creo que los estudios de asociación de genoma completo (GWAS) han sido presa del mismo tipo de ciclo de bombo que afecta a la mayoría de las nuevas tecnologías en la investigación de las ciencias de la vida (y sin duda también en otros lugares). Una nueva tecnología atrapa la imaginación de científicos no expertos y periodistas no científicos, y ambos campamentos funcionan con ella de maneras en gran medida inapropiadas. Los científicos subestiman las dificultades asociadas con la tecnología y venden en exceso sus aplicaciones e impacto; los periodistas (impulsados ​​en parte por el exceso de ventas de científicos no expertos) intercambian precisión para los ojos. Esto lleva al público a sentirse inevitablemente decepcionado cuando la nueva tecnología cumple o incluso excede las expectativas de los expertos originales, que es la fase en la que nos encontramos actualmente con GWAS.

GWAS nunca iba a ser el fin-todo-todo-el-entendimiento de la base genética de la enfermedad, eso simplemente no está dentro del alcance de lo que pueden hacer. Son increíblemente poderosos para reducir el conjunto de hipótesis que necesitas probar (esencialmente estás yendo de todo el genoma a cientos de sitios potenciales) cuando intentas entender la genética de la enfermedad, y creo que aquí es donde las ganancias reales aún mentira. El lado experimental de laboratorio húmedo necesita ponerse al día, y la edición del genoma (especialmente los sistemas Cas9 de segunda generación – ¡los efectos objetivo por fin están empezando a abordarse!) Van a permitir una aceleración significativa en la determinación de los efectos variaciones en un sistema experimental.

Una vez que podamos modificar de forma rutinaria, robusta y precisa los modelos de enfermedades humanas, creo que podemos comenzar a actuar de manera más eficiente en las predicciones de GWAS. Los propios modelos de enfermedad están empezando a ser cada vez más sofisticados (creo que ahora estamos en el punto en que los organoides se pueden cultivar a partir de células individuales y se pueden unir diferentes organoides para funcionar como un sistema protohumano ), así que espero el trabajo experimental para realmente comenzar a ponerse al día en los próximos cinco a diez años más o menos.

Definitivamente estoy en el campo que piensa que GWAS se volverá exponencialmente más poderoso a medida que recolectamos más datos (genomas y ontologías rasgo) y creo que proyectos como el Proyecto Personal Genome ( http://www.personalgenomes.org/ ) van a ir. ser instrumental en impulsar esto hacia adelante.

A pesar de que no son perfectos, no creo que GWAS vaya a ninguna parte, en el corto plazo.

En muchos sentidos, GWAS está realmente bien, solo necesita un diseño experimental mejorado, modelos, tamaños de muestra más grandes y una mayor densidad de marcadores. A pesar de los grandes conjuntos de datos y la cobertura del genoma, para rasgos complejos, necesitamos más. Mucho trabajo en otras especies modelo (especialmente ganado lechero) proporciona excelentes pautas sobre cómo se puede mejorar el impacto de estos estudios. Transcriptómica (secuenciación del exoma) también ofrece posibilidades interesantes.

Además de algunos de los inconvenientes que respondí sobre esta cuestión aquí ¿Cuáles son los inconvenientes de GWAS (Genome-Wide Association Study) ?, todo el enfoque de GWAS fue problemático para empezar. Centrarse en la identificación de genes asociados a la enfermedad es una forma pobre de reducir la enfermedad . El objetivo debe ser producir una prueba de diagnóstico informativa . GWAS sigue siendo una buena forma de detectar genes causales para rasgos simples y cuantitativos. Sin embargo, muchos rasgos son complejos y el foco debe estar en predecir el rasgo (útil para la investigación aplicada), no detectar genes (útiles para la investigación básica). Para quienes estén familiarizados con el modelado estadístico, es la diferencia entre predecir una respuesta y hacer inferencias sobre las variables. Diferentes objetivos deben usar diferentes modelos.

La detección de genes individuales puede no ser realmente realista. Creo que la mayoría de los investigadores siempre esperaban que los rasgos cuantitativos tuvieran una compleja red de genes, pero probablemente no sabíamos cuánto. En un extenso estudio de tres características en Drosophila , los modelos estándar de GWAS detectaron variantes de genes completamente diferentes entre dos poblaciones. Sin embargo, agregando epistasis (interacciones genéticas) en el modelo, y los resultados comenzaron a tener más sentido, con los mismos genes que aparecen en ambas poblaciones. Epistasis domina la arquitectura genética de los rasgos cuantitativos de Drosophila

Modelado mejorado
Pero volvamos a la predicción. El problema básico con el enfoque histórico de GWAS ha sido que solo se ajusta a los genes más significativos (básicamente, “obvios”). Sin embargo, muchos rasgos tienen muchos genes con efectos muy pequeños: los estudios tradicionales no los incluyen en los modelos. Por el contrario, los modelos de predicción incluyen muchos más genes (a menudo todos ellos, de hecho), que mejoran en gran medida la predicción real. Daré lo que ciertamente se convertirá en una comparación clásica. En un GWAS tradicional para la estatura humana, los investigadores identificaron 180 loci. Cientos de variantes agrupadas en loci genómicos y vías biológicas afectan la altura humana. Sin embargo, estos loci solo representaron el 10% de la variación fenotípica (~ 20% de heredabilidad). En un estudio diferente (en una población más pequeña), otro grupo de investigadores (liderado por los ganaderos capacitados a los que aludí) tomó un enfoque diferente, básicamente manteniendo toda la información genética en el modelo, pero usando algunas técnicas estadísticas para permitir esto. (modelado mixto). No se enfocaron en identificar genes , ¿el resultado? Se explicó el 45% de la variación fenotípica. Partición del genoma de la variación genética para rasgos complejos usando SNP comunes También se analizaron otros rasgos, mejorando drásticamente los resultados anteriores: para BMMI, vWF y QTi, los modelos anteriores podrían explicar el 1,5%, 13% y 7% de la variación fenotípica; este grupo podría use datos similares para obtener 17%, 25% y 21%. Si miramos esto competitivamente, el segundo grupo fumó el primero por millas.

Más individuos
Los rasgos complejos también necesitan grandes tamaños de muestra y más cobertura de marcadores. La razón de esto se debe a varios factores subyacentes, pero se reduce a la diversidad de la población humana (tamaño efectivo de la población): se estima que se requieren de 145,000 a 210,000 registros. Pocos estudios existentes tienen números tan altos.

Más densidad de marcadores
Finalmente, es probable que se necesite capturar más datos genéticos, pero tener más individuos generalmente es más útil. La mayoría de los estudios realizados hasta la fecha se han basado en SNP comunes. Probablemente faltan SNP y polimorfismos no SNP que son informativos y causales que no son capturados por los métodos actuales. La secuenciación del exoma también puede proporcionar una ruta interesante, porque la información cuantitativa sobre los genes puede ser mucho más útil que simplemente tener información de secuencia.