Cómo usar una alineación de secuencia de proteínas para identificar residuos de aminoácidos que pueden probarse para funciones funcionales importantes

Lo primero que debe hacer es buscar residuos conservados en la secuencia de alineación. La conservación de la secuencia es necesaria, pero no es suficiente para decir si un residuo tiene un papel funcional importante. Es necesario porque la función proteica tiende a conservarse durante la evolución; las mutaciones en un punto vital pueden causar que el organismo muera o sufra una pérdida de capacidad física de otras maneras. Pero la conservación de la secuencia no es suficiente para inferir la función porque:

  1. La señal filogenética. Las secuencias relacionadas evolutivamente tenderán a parecerse entre sí ya que solo tienen un tiempo finito para divergir. Por lo tanto, si utiliza la conservación de secuencias como una métrica, muchos residuos que parecen ser esenciales para la función de la proteína se conservan en realidad porque se originan a partir de proteínas relacionadas.
  2. Los residuos esenciales no necesariamente tienen un papel funcional. Muchos residuos fuertemente conservados también se conservan simplemente porque son el único residuo que cabe dentro de ese punto en la estructura de la proteína. Estos residuos, si bien son importantes para el plegamiento de proteínas, no son directamente importantes para la función y pueden ubicarse lejos del sitio activo.

La señal filogenética se puede suprimir mediante el análisis de acoplamiento directo, que busca pares de residuos que evolucionan en sincronización. [1] Si un residuo desarrolla una mutación compensadora cuando otro residuo muta, existe una buena posibilidad de que el segundo residuo desempeñe un papel funcional.

La separación de residuos estructuralmente importantes de funcionalmente importantes es difícil sin una estructura. Los residuos estructuralmente importantes casi siempre están en el interior de la proteína, por lo que si puede identificar los residuos conservados expuestos al solvente en la secuencia mediante el aprendizaje automático [2], por lo general se ubicarán dentro del sitio activo. Más allá de eso, la estructura central de aproximadamente el 70% de las proteínas puede predecirse dentro de los 3,5 Å de la estructura real a partir de la secuencia sola. [3] [4] [5] Este nivel de precisión suele ser suficiente para adivinar tanto la función como el sitio activo. La precisión de la detección del sitio de unión es de alrededor del 54% con este método. [6]

Finalmente, los restos que están implicados en la unión del ligando son frecuentemente obvios en un espectro de RMN, aunque al menos los restos de la cadena principal en el espectro normalmente necesitan asignarse. Se están desarrollando nuevas técnicas para automatizar y acelerar este proceso. [7]

Notas a pie de página

[1] http://www.nature.com/nrg/journa…

[2] Un enfoque basado en la evolución para el diseño de proteínas de novo y estudio de caso sobre Mycobacterium tuberculosis

[3] http: //zhanglab.ccmb.med.umich.e…

[4] http: //zhanglab.ccmb.med.umich.e…

[5] http: //zhanglab.ccmb.med.umich.e…

[6] http: //zhanglab.ccmb.med.umich.e…

[7] Asignación de resonancia rápida y precisa de proteínas pequeñas a grandes combinando enfoques automáticos y manuales