En muchos sentidos, GWAS está realmente bien, solo necesita un diseño experimental mejorado, modelos, tamaños de muestra más grandes y una mayor densidad de marcadores. A pesar de los grandes conjuntos de datos y la cobertura del genoma, para rasgos complejos, necesitamos más. Mucho trabajo en otras especies modelo (especialmente ganado lechero) proporciona excelentes pautas sobre cómo se puede mejorar el impacto de estos estudios. Transcriptómica (secuenciación del exoma) también ofrece posibilidades interesantes.
Además de algunos de los inconvenientes que respondí sobre esta cuestión aquí ¿Cuáles son los inconvenientes de GWAS (Genome-Wide Association Study) ?, todo el enfoque de GWAS fue problemático para empezar. Centrarse en la identificación de genes asociados a la enfermedad es una forma pobre de reducir la enfermedad . El objetivo debe ser producir una prueba de diagnóstico informativa . GWAS sigue siendo una buena forma de detectar genes causales para rasgos simples y cuantitativos. Sin embargo, muchos rasgos son complejos y el foco debe estar en predecir el rasgo (útil para la investigación aplicada), no detectar genes (útiles para la investigación básica). Para quienes estén familiarizados con el modelado estadístico, es la diferencia entre predecir una respuesta y hacer inferencias sobre las variables. Diferentes objetivos deben usar diferentes modelos.
La detección de genes individuales puede no ser realmente realista. Creo que la mayoría de los investigadores siempre esperaban que los rasgos cuantitativos tuvieran una compleja red de genes, pero probablemente no sabíamos cuánto. En un extenso estudio de tres características en Drosophila , los modelos estándar de GWAS detectaron variantes de genes completamente diferentes entre dos poblaciones. Sin embargo, agregando epistasis (interacciones genéticas) en el modelo, y los resultados comenzaron a tener más sentido, con los mismos genes que aparecen en ambas poblaciones. Epistasis domina la arquitectura genética de los rasgos cuantitativos de Drosophila
Modelado mejorado
Pero volvamos a la predicción. El problema básico con el enfoque histórico de GWAS ha sido que solo se ajusta a los genes más significativos (básicamente, “obvios”). Sin embargo, muchos rasgos tienen muchos genes con efectos muy pequeños: los estudios tradicionales no los incluyen en los modelos. Por el contrario, los modelos de predicción incluyen muchos más genes (a menudo todos ellos, de hecho), que mejoran en gran medida la predicción real. Daré lo que ciertamente se convertirá en una comparación clásica. En un GWAS tradicional para la estatura humana, los investigadores identificaron 180 loci. Cientos de variantes agrupadas en loci genómicos y vías biológicas afectan la altura humana. Sin embargo, estos loci solo representaron el 10% de la variación fenotípica (~ 20% de heredabilidad). En un estudio diferente (en una población más pequeña), otro grupo de investigadores (liderado por los ganaderos capacitados a los que aludí) tomó un enfoque diferente, básicamente manteniendo toda la información genética en el modelo, pero usando algunas técnicas estadísticas para permitir esto. (modelado mixto). No se enfocaron en identificar genes , ¿el resultado? Se explicó el 45% de la variación fenotípica. Partición del genoma de la variación genética para rasgos complejos usando SNP comunes También se analizaron otros rasgos, mejorando drásticamente los resultados anteriores: para BMMI, vWF y QTi, los modelos anteriores podrían explicar el 1,5%, 13% y 7% de la variación fenotípica; este grupo podría use datos similares para obtener 17%, 25% y 21%. Si miramos esto competitivamente, el segundo grupo fumó el primero por millas.
Más individuos
Los rasgos complejos también necesitan grandes tamaños de muestra y más cobertura de marcadores. La razón de esto se debe a varios factores subyacentes, pero se reduce a la diversidad de la población humana (tamaño efectivo de la población): se estima que se requieren de 145,000 a 210,000 registros. Pocos estudios existentes tienen números tan altos.
Más densidad de marcadores
Finalmente, es probable que se necesite capturar más datos genéticos, pero tener más individuos generalmente es más útil. La mayoría de los estudios realizados hasta la fecha se han basado en SNP comunes. Probablemente faltan SNP y polimorfismos no SNP que son informativos y causales que no son capturados por los métodos actuales. La secuenciación del exoma también puede proporcionar una ruta interesante, porque la información cuantitativa sobre los genes puede ser mucho más útil que simplemente tener información de secuencia.