¿Hay alguna hipótesis sobre por qué hay solo 22 aminoácidos y no 64?

tl; dr – No. Por el contrario, la mayoría de la evidencia apoya que el código genético evolucionó de una versión anterior que contenía menos de 20 aminoácidos [1], y es poco probable que el código actual incorpore más que unos pocos aminoácidos más ácidos sin reorganización drástica.

Versión larga:

Esta es una excelente pregunta ya que la evolución del código genético ha sido un tema muy debatido entre los expertos en el campo. No es de ninguna manera una pregunta fácil de responder, y aquí resumiré lo que generalmente está de acuerdo con los científicos, y lo que aún debe ser dilucidado.

Contrariamente a la suposición hecha en la pregunta, generalmente se acepta que el código genético actual evolucionó a partir de una forma anterior que utilizaba menos de 20 aminoácidos (AA), en lugar de más de lo que podría haberse eliminado. También se cree que este código estaba presente en el último ancestro común universal (LUCA), junto con una forma minimalista de la maquinaria de traducción.

Entonces, ¿cómo evolucionó el código genético?

Tres teorías principales se han propuesto hacia los orígenes de la estructura del código [2]:

  1. La teoría estereoquímica afirma que las asignaciones de codones para los aminoácidos se determinaron inicialmente por una afinidad fisicoquímica directa que existe entre los AA y sus respectivos codones / anticodones, antes de la evolución de los ARNt. Si bien esta es una hipótesis atractiva, las afinidades de unión entre pares de AA / codón se encontraron demasiado bajas para ser estadísticamente probables.
  2. La teoría adaptativa sugiere que el código se formó en condiciones selectivas para minimizar los efectos de los errores sobre la estructura y las funciones de las proteínas, es decir, hacer que sea lo más robusto posible. Esto es respaldado por la observación de que los aminoácidos con propiedades químicas similares se asignan a codones similares.
  3. La teoría de la coevolución postula que la estructura del código coevolucionó con las rutas biosintéticas de los aminoácidos. Esta teoría supone que el número de aminoácidos prebióticos fue pequeño (~ 10) y que los otros AA se derivaron de los prebióticos a través de procesos biosintéticos.

Las tres de estas hipótesis tienen sus ventajas y desventajas, y no es difícil especular que la verdad puede residir dentro de un compuesto de estas tres teorías. Por ejemplo, es posible que los primeros AAs sintetizados abiógenamente capturaran codones debido a sus respectivas afinidades estereoquímicas, seguidos por la coevolución de la expansión del código y las rutas biosintéticas, concluyendo en los ajustes del codón para minimizar los efectos de mutaciones puntuales y errores de traducción. Sin embargo, claramente es difícil probar y verificar dicha teoría.

¿Por qué solo 20 aminoácidos?

Es muy probable que las rutas bioquímicas primitivas existieran en la “sopa primordial” antes de un sistema basado en la genética. Conocida colectivamente como la vía bioquímica central (CBP), se ha propuesto que la aparición de aminoácidos genéticamente codificados se correlaciona con el número de reacciones químicas de la CBP que se requieren para generar cada aminoácido (pasos evolutivos 1-14, véase figuras a continuación). Este modelo está respaldado por el hecho de que las proteínas “antiguas” altamente conservadas estaban sobrerrepresentadas en los denominados aminoácidos “tempranos” o posiblemente prebióticos.


Figura 1. Rutas biosintéticas para aminoácidos: los aminoácidos ácidos (Glu y Asp) están cerca de la CBP, seguidos por los aminoácidos polares no cargados e hidrófobos; la mayoría de estos se consideran parte de la mezcla prebiótica (Fase 1 AA). Los aminoácidos básicos y aromáticos, que requieren más pasos para la síntesis (Fase 2 AA), probablemente se derivaron de los AA “tempranos”. Imagen de [4].


Figura 2.

La expansión del código estándar de acuerdo con la teoría de coevolución. Los aminoácidos de la Fase 1 son anaranjados, y los aminoácidos de la Fase 2 son verdes. Los números muestran el orden de aparición de aminoácidos en el código. Las flechas definen 13 pares de aminoácidos precursores-producto, su color define las familias biosintéticas de Glu (azul), Asp (verde oscuro), Phe (magenta), Ser (rojo) y Val (verde claro).

Imagen de [2].

Hasta ahora, tenemos varias pistas que predicen que el código genético se expandió de ~ 10 aminoácidos a ~ 20 en su estado final. La aparición de codones alternativos para la selenocisteína y la pirrolisina en algunos organismos sugiere que el código genético todavía está evolucionando y expandiéndose.
Figura 3:

Diagrama que muestra las alteraciones del código genético descubiertas hasta el momento. Hasta la fecha se han descubierto 19 alteraciones del código genético en las mitocondrias (color verde), en bacterias y en varios eucariotas unicelulares (color azul). Las alteraciones del código genético bacteriano y eucariótico son un subconjunto de las mitocondriales.

Imagen de [5].

A continuación, surge la pregunta:

¿Hay un límite superior para la cantidad de aminoácidos que se pueden codificar?

Resulta, . Un análisis del código genético basado en la teoría de la información sugirió que se originó como resultado de la interacción de tres fuerzas evolutivas en conflicto: las necesidades de diversos aminoácidos, tolerancia a errores y un costo mínimo de recursos [6]. Teniendo en cuenta la hipótesis del par de bases de oscilación para garantizar la solidez del código, se predijo que el número de aminoácidos diversos que pueden codificarse con éxito está limitado a 25. Por lo tanto, se puede decir que el código genético casi se optimiza al máximo su estado actual [2].


Referencias y notas al pie:

[1] No compro el paradigma “22/23 aminoácidos”, ya que la selenocisteína, la pirrolisina y la N-formilmetionina son aminoácidos especiales que solo están codificados en ciertos organismos o en determinadas condiciones. Por lo tanto, para los fines de esta respuesta, me he referido solo a los 20 aminoácidos que se encuentran universalmente en todos los organismos.

[2] Origen y evolución del código genético: el enigma universal
[3] Evolución molecular antes del origen de las especies
[4] Evolución celular y el problema de la topología de membrana
[5] Desarrollo del código genético: información de una reasignación de un codón fúngico
[6] Un origen colorido para el código genético: la teoría de la información, la mecánica estadística y la aparición de códigos moleculares

En primer lugar, es interesante mencionar 22 aminoácidos (aa), ya que hay 20 comunes y 2 bastante raros. “En general, el código genético especifica 20 aminoácidos estándar, sin embargo, en ciertos organismos el código genético puede incluir selenocisteína y -en ciertas arqueopirrolinas” de wikipedia.
Lo segundo es mencionar que 22 son los aa que captan las proteínas que poseen todos los organismos, desde unicelulares hasta multicelulares, sin embargo, los aa son mucho más: “se conocen unos 500 aminoácidos”.

Finalmente, para responder a su pregunta, es muy poco probable que en la historia evolutiva haya especies con proteínas que contengan más de 22 aa diferentes y lo digo porque el código genético que traduce los codones en aa está altamente conservado en toda la especie. Si hubiera una especie con más de 22 aa diferentes, entonces la información habría pasado a otros durante el historial de evolución y se habría conservado. Sin embargo, parece que hay 22 transportRNAs diferentes para 22 aa diferentes. La naturaleza de alguna manera (a través de la evolución) encontró una forma de hacer que las proteínas sean funcionales con estos 22 aa y no creo que haya un tiempo en que las proteínas tengan más aa. No hay razón para muchas cosas y ningún objetivo para la perfección en la evolución. Si algo funciona, entonces es muy posible que se mantenga, sin importar si el mismo trabajo se pudo haber hecho de otras maneras de manera más eficiente. ¡Siempre hablo hipotéticamente porque hay muchas, muchas cosas más que aprender sobre la naturaleza!

Es importante recordar en cualquier discusión que, si bien hay más de 20 aminoácidos incorporados por traslación en las proteínas, hay muchos más aminoácidos que se encuentran comúnmente en las células y, por lo tanto, son candidatos plausibles para que se hayan agregado otros aminoácidos a las proteínas. el código genético

La biosíntesis y catabolismo de muchos aminoácidos incorporados traduccionalmente pasa a través de otros aminoácidos. Por ejemplo, la ornitina se encuentra en la ruta biosintética de la arginina. El ácido pipecólico, un iminoácido de seis carbonos (creo que la prolina es un metileno más grande) se encuentra en la ruta de degradación de muchas especies (¡incluida nosotros!) Para la arginina.

Ciertamente, hay muchos intermedios metabólicos que pueden argumentarse como demasiado inestables. Pero muchísimo es estable, entonces, ¿por qué no se usaron? Por el contrario, ¿por qué el código genético molesta con leucina e isoleucina, que son muy similares.

Y no me inicie en el mundo salvaje y alocado de los aminoácidos en metabolitos secundarios …

Teóricamente hay un número infinito de aminoácidos, los veinte que componen la vida son los que la termodinámica dicta que son los más fáciles de formar en las condiciones químicas y térmicas que existían en el momento de la formación del sistema solar, la Tierra y la Tierra. comienzo de la vida.
Evolution produjo lo que pudo con las materias primas disponibles.