¿Cómo se procesa el ADN en una computadora?

Lo que las computadoras son buenas son los patrones de detección. Esta capacidad puede aprovecharse para permitir que una computadora analice el ADN. La parte difícil es lograr que la computadora vea la secuencia del ADN, que supongo que es el centro de esta pregunta. La forma más común de hacer que una computadora secuencie el ADN es usar un microarreglo de ADN.

Básicamente, este es un chip con un montón de “sondas” de ADN en él. Estas sondas son secuencias conocidas que complementan las secuencias que estás buscando. El ADN que estás tratando de secuenciar se divide en pequeñas piezas y se trata con moléculas radiactivas o fluorescentes. Si una de las sondas de ADN en la matriz contiene la secuencia complementaria al ADN de su muestra, la sonda se unirá a esa secuencia y se iluminará o irradiará de manera que la computadora pueda detectar.

Cuando obtiene sus genes secuenciados en un sitio como 23andme, esto es lo que están haciendo. Tienen un chip que tiene sondas que se complementan con los bits de cada uno de los alelos que prueban, específicamente los bits donde se sabe que ocurre la variación. Si su ADN se une a una de las sondas, eso es una indicación de que su ADN contiene la variante que esa sonda está diseñada para detectar. La unión del ADN etiquetado radiactivamente a la sonda hace que esa parte de la matriz brille y la computadora lo detecte y lo interprete como un resultado positivo para esa variante.

Nota: Este proceso puede realizarse con la misma facilidad fragmentando el ADN de la muestra, colocándolo en la matriz y luego agregando sondas radiactivas, que creo que es probablemente la forma en que 23andme realmente lo hace, pero usando un ejemplo con sondas fijas una forma más fácil de explicar el proceso. En realidad, hay muchas variantes del tema de microarreglos, así como métodos de secuenciación asistida por computadora que no usan microarreglos en absoluto, pero este es el método más comúnmente utilizado en pruebas genéticas populares, así como el que tiene que estoy más familiarizado, así que es en el que elegí centrarme en mi respuesta.

Al secuenciar la proteína, puede decir el orden de los aminoácidos que componen la proteína. Dado que cada aminoácido está codificado en el ADN por un conjunto definido de tres bases de ácido nucleico, esto en gran parte te dice la secuencia del gen.

Sin embargo, la secuencia no es completa o completamente precisa, ya que algunos aminoácidos están codificados por tener más de un conjunto de bases de ADN, y las regiones de ADN que no se traducen en proteínas no se conocen (estas secuencias de ADN comprometen la mayoría de ADN) Además, las proteínas se modifican después de su creación, por lo que no se sabe qué bases de ADN codifican para los aminoácidos que faltan. Para obtener la secuencia de ADN completa, es mucho mejor (y más fácil dados los avances en la secuenciación del ADN desde el Proyecto Genoma Humano) secuenciar el gen que le interesa para determinar el orden de las bases en el gen, como en la imagen anterior . Espero que esto ayude.

La teoría detrás de esta pregunta sienta las bases de uno de los procesos más fundamentales y esenciales para la existencia de la vida, dado que la vida es una química compleja de biomoléculas.

El ADN es el anteproyecto de una célula viviente. Transcribe ARN que a su vez se traduce en proteína. El ADN es una estructura bicatenaria formada por una combinación de 4 bases, llamadas adenina (A), guanina (G), timina (T) y citidina (C). La imagen de arriba muestra la secuencia de bases del ADN que puede tener varios miles de bases de longitud. Las proteínas se unen al ADN y generan un código de ARN que es complementario a la secuencia de ADN (A a T y G a C, también en lugar de T, se usa uracilo (U). El ARN se dirige a una máquina molecular llamada ribosoma donde se traduce a proteína. Existe un código de 3 letras para cada aminoácido que se lee en el ribosoma y el aminoácido correspondiente se agrega a la proteína.

Hay más que esta breve descripción, pero un libro de bioquímica como Fundamentals of biochemistry por Lehninger puede explicar en detalle.

El ADN esencialmente codifica el ARN, que codifica la proteína a través de un proceso llamado traducción. Las proteínas son cadenas largas, o polipéptidos, de aminoácidos, que son como los bloques de construcción para todas las proteínas, que suman un total de 20. Al secuenciar los aminoácidos que componen una proteína. Cada gen en su ADN tiene 3 nucleótidos, que constituyen un codón, que corresponden a tres aminoácidos por codón.

Al verificar qué aminoácidos hay, podemos distinguir qué nucleótidos están presentes, lo que nos permite descubrir qué codones hay. El ADN está formado por los pares correspondientes, por lo que si descubrimos que el codón es para Guanine, o G en su ADN, podemos discernir que el par complementario es C. Repitiendo este proceso es cómo podemos mapear un genoma en una computadora.

Recuerde que hay alrededor de 20,000 genes en una celda, y esta es la razón por la cual, hasta ahora, este proceso era largo y tedioso. Es por eso que solo hemos terminado de mapear el genoma humano muy recientemente.

Hay un proceso llamado electroforesis en el que el ADN cortado es arrastrado por un campo eléctrico a través de gel de agar. Los bits más pesados ​​se arrastran más lentamente que el encendedor. Las líneas de arrastre son más fáciles de ver que las piezas de ADN. Lea sobre esto aquí para una explicación mucho mejor. Electroforesis – Wikipedia