¿Cuál es la relación entre la secuencia de bases en el ADN y la secuencia de aminoácidos en las proteínas?

Además de los mecanismos de corte y empalme del codón descritos en otras respuestas, varios procesos afectan la secuencia final de una proteína.

Algunos ARNm se someten a una edición de ARN, en la cual las bases en el ARN se cambian enzimáticamente. El alcance de esto es un tema controvertido, pero un ejemplo bien estudiado es la apolipoproteína B, un componente de LDL (“colesterol malo”). ApoB existe en dos empresas, ApoB48 y ApoB100; el número es el peso molecular en kilodaltons. El genoma codifica ApoB100; para hacer que ApoB48 sea un codón de parada se edita en el ARNm.

Otra desviación es la inserción de selenocisteína, que se produce en aproximadamente el 0,25% de las proteínas humanas. El ARNt de SelCys requiere que se inserten claves contextuales.

Las modificaciones postraduccionales también provocan que las proteínas maduras difieran de las codificadas en el genoma. Algunas modificaciones son irreversibles: la insulina es el resultado de cortar una sección media del precursor y muchas proteínas se procesan para eliminar uno o más aminoácidos N-terminales tales como la metionina inicial o los péptidos señal de las proteínas secretadas.

Las modificaciones postraduccionales también pueden alterar los aminoácidos individuales de forma irreversible o reversible. La hidroxiprolina es una modificación irreversible de la prolina, mientras que la fosfotirosina, la fosfoserina y la fosfotreonina se pueden convertir a la forma original.

Si bien creo que no se conocen genes humanos normales que lo usen, algunos virus como el VIH se basan en el cambio radical ribosómico, en el que el ribosoma se mueve por un incremento de más de +3 cuando se encuentra en un contexto específico.

La molécula de ADN tiene regiones que reclutan ARN polimerasas que transcriben (forman una molécula de ARN con la secuencia de una región de ADN). En organismos eucariotas, esa molécula de ARN puede tener piezas (intrones) cortadas para producir un ARN mensajero (ARNm) que se traduce por un ribosoma. En el ribosoma, el ARNm avanza 3 bases a la vez y se combina con un ARN de transferencia (ARNt) que tiene un asa complementaria del tallo en un lado y un aminoácido en el otro. Los aminoácidos están vinculados uno a la vez.

El resultado práctico es que un gen es una región de ADN que es una plantilla para un ARN correspondiente que se lee en unidades de 3 nucleótidos (un codón) que codifica un aminoácido ding correspondiente en la cadena. Hay 64 patrones posibles de 3 basados ​​y 20 aminoácidos posibles. Hay 3 patrones no utilizados (codones de parada) que indican al ribosoma que deje de traducirse, por lo que, en promedio, hay 3 codones diferentes que codifican el mismo nucleótido.

también significa que, dada la secuencia del gen, podemos decir cuál será la secuencia de la molécula de proteína.

No todas las bases en la secuencia de ADN se convierten en la secuencia de aminoácidos en las proteínas. El dogma central de la biología molecular describe el proceso en dos etapas de la formación, transcripción y traducción de proteínas, mediante el cual la información de los genes codificados por las bases de ADN fluye al ARN y luego a la proteína. El ADN generalmente consiste en una región promotora que ayuda a unirse a la maquinaria de transcripción, un codón de inicio desde donde comienza la transcripción y detiene el codón donde termina la transcripción. Por lo tanto, el ADN se transcribe en ARN solo entre el codón de inicio y parada. Si vemos la estructura del ARN transcrito, eso todavía tiene alguna región de codificación (exón) interespaciada entre la región no codificadora (intrón). Aquí la región de codificación significa las bases que se traducirán en la secuencia de aminoácidos. Por lo tanto, los procesos celulares precursor de ARNm en ARNm maduro mediante la eliminación de la región no codificante (intrón). Ahora, esta secuencia madura de ARNm se convierte en una secuencia de aminoácidos para una proteína. Cada 3 bases del ARNm (codón) se traducen en 1 aminoácido y la combinación de 3 bases para cada aminoácido es muy única entre sí. Entonces, durante la traducción, la maquinaria de traducción asigna aminoácidos dependiendo de cada combinación consecutiva de 3 bases.

Por lo tanto, las bases de ADN tienen información sobre la secuencia de aminoácidos de la proteína a formar, pero no todas las bases se convierten en la secuencia de aminoácidos.

Las Bases sirven como “instrucciones” o como una plantilla que aporta la información requerida para construir la proteína a partir de Aminoácidos. Dado su tamaño diminuto y estructura conservadora, las bases se convierten en un método extremadamente eficiente para conservar y transmitir una gran cantidad de información en un mínimo de espacio usando energía mínima en tiempo máximo.