¿Cuál es el valor de tener una base de datos relativamente grande de genotipos humanos o secuencias genómicas?

Ya se han construido grandes bases de datos de secuencias genómicas y genotipos, principalmente en el contexto de asociaciones de enfermedades. En mi humilde opinión, a menos que el esfuerzo de secuenciamiento esté investigando una vía inexplorada de pensamiento o enfermedad , el lanzamiento de proyectos de secuenciación para simplemente encontrar más o confirmar asociaciones de enfermedades no es valioso .

Dicho esto, hay muchos enfoques diferentes en los que la secuenciación del genoma y el genotipado podrían ser muy valiosos, pero la clave es el pensamiento innovador . Por ejemplo, la Red de Registros Médicos Electrónicos y Genómica (eMERGE) es un gran proyecto de colaboración que está trabajando en la recopilación e integración del historial médico del paciente con datos genotípicos; esta base de datos de genotipado es invaluable porque el diseño permite la investigación de interacciones entre enfermedades y genotipos y su reutilización en estudios retrospectivos.

En el ámbito de la investigación biomédica, sería muy informativo contar con grandes bases de datos de información del genoma completo, especialmente si también podemos combinar esto con la información clínica, es decir, si los individuos padecen o no una enfermedad.

Hay una variedad de enfermedades complejas (epilepsia, Alzheimer, Parkinson, autismo, etc.) donde las causas genéticas son desconocidas, pero sabemos por otros estudios que son extremadamente hereditarias. Con el fin de encontrar las mutaciones causales, los científicos comparan las variaciones genéticas entre las personas que tienen la enfermedad y las que no, llamada GWAS (estudio de asociación del genoma completo).

Estos estudios pueden requerir genomas de miles de individuos, especialmente cuando las mutaciones causales son raras. Por ejemplo, si tiene solo 100 genomas (50 enfermedades, 50 sanos) y la mutación causal tiene una frecuencia del 1% en la población general, necesitará ver la mutación mucho más a menudo que el 1% en la población de la enfermedad. Pero si el tamaño total de la muestra es de solo 100, la mutación genética podría incluso no detectarse entre los pacientes con la enfermedad. Por lo tanto, necesitamos grandes bases de datos de secuencias de genoma, seguro.

Una gran base de datos de genotipos y secuencias de genoma sin otra información no es muy valiosa. Por otro lado, son muy valiosos si tiene datos de rasgo asociados.

Para los rasgos genéticos complejos, se requieren conjuntos de datos extremadamente grandes para la predicción: algunos investigadores han estimado de 145,000 a 210,000.
Comprender y predecir rasgos complejos: conocimiento del ganado

Por lo tanto, tengo que (condicionalmente) estar en desacuerdo con Austin Quach, una razón por la cual muchas asociaciones de enfermedades no han tenido éxito; el tamaño de las muestras ha sido demasiado pequeño para proporcionar una precisión adecuada. En cierto punto, hay rendimientos decrecientes, pero todavía no estamos allí para muchas enfermedades.