¿Qué software y métodos usan las personas para crear representaciones de estructuras de proteínas?

Sí, existen estándares para este tipo de visualizaciones y sí, cada uno tiene un significado químico o biológico. Antes de llegar a eso, necesito proporcionar algunos antecedentes básicos sobre la estructura de la proteína y las herramientas de software utilizadas para presentarla.

Uno de los programas más populares, gratuitos y fáciles de usar para la visualización molecular es PyMOL . Otros programas populares que he visto en uso incluyen Coot , VMD , SwissPDB Viewer y Chimera . Se puede encontrar una lista más extensa aquí: (http://www.pdb.org/pdb/101/stati…).

La mayoría de las revistas requieren que las estructuras se carguen en el Protein Data Bank (www.pdb.org) dentro de un corto período de tiempo después de la publicación, lo que lo convierte en un gran sitio para encontrar casi cualquier estructura de proteína conocida. El formato de archivo típico leído por PyMOL y otras herramientas de visualización molecular es un archivo .pdb, que es esencialmente una lista de las coordenadas x, y y z de cada átomo en la estructura junto con algunas otras estadísticas y algunas variaciones dependiendo de la técnica utilizado para crear la estructura (es decir, cristalografía de rayos X / RMN / Cryo-EM). A cada estructura en la base de datos se le asigna una ID alfanumérica de cuatro caracteres (una ID de PDB) para una fácil recuperación.

Además de las coordenadas atómicas, el archivo PDB para una proteína también puede especificar su estructura secundaria, que ayuda a clasificar la columna vertebral de una proteína como hélice, lámina o bucle. Los elementos estructurales secundarios representan una vista simplificada de los patrones de enlaces de hidrógeno encontrados entre los átomos en la cadena principal de la proteína y, en consecuencia, los ángulos de enlace entre los átomos a lo largo de la cadena principal de la cadena de aminoácidos. Helices (típicamente hélices alfa diestras) se forman por enlaces de hidrógeno entre los grupos amino y carbonilo en la cadena principal a cuatro residuos separados. Las láminas beta se forman mediante enlaces de hidrógeno entre los grupos amino y carbonilo adyacentes espacialmente (pero no siempre de forma secuencial) en la cadena principal mediante patrones de unión paralelos o antiparalelos. Los bucles (también llamados giros) completan los elementos estructurales de proteínas secundarias y a menudo sirven como las “articulaciones” entre los otros dos elementos estructurales. Sus columnas vertebrales tienen diferentes patrones de enlaces de hidrógeno, si es que tienen alguno. Clasificar los tramos de una cadena de proteínas como uno de estos tres es normalmente fácil porque las estructuras secundarias generalmente se pueden inferir de los ángulos diedros (los ángulos de enlace entre los átomos de la cadena de aminoácidos) y de la proximidad entre átomos en el 3D. coordenadas

En PyMOL (así como en otros programas de visualización), hay una variedad de estilos y combinaciones de colores comunes que se pueden mezclar y combinar para crear una amplia variedad de efectos. PyMOL también renderiza grandes imágenes con luces, niebla y efectos de sombras (usando el comando “ray”). Los guiaré a través de cuatro ejemplos de visualización de proteínas que logré hacer con PyMOL en solo unos minutos. Cada uno usa las mismas coordenadas para la proteína Ribonuclease A (PDB ID: 5RSA) y la orientación de la molécula se mantiene igual.

Un modelo de caricatura (también llamado modelo de cinta) de una proteína, como el que se utiliza para mostrar la estructura de la ricina vinculada en la pregunta, oculta los átomos por simplicidad y muestra los tres tipos de elementos estructurales secundarios de la columna vertebral. Las espirales son hélices alfa (rojas), las tiras con flechas muestran láminas beta (amarillas) apuntando hacia el extremo C de la cadena de aminoácidos, y las cadenas finas muestran los ciclos / giros restantes (verde).
Un modelo de palo muestra una imagen muy detallada que representa los átomos y los enlaces como palos. A distancia a menudo es demasiado ruidoso como para ser útil, pero cuando te acercas a una pequeña región de la proteína o se queda pegado solo por unos pocos aminoácidos clave, es muy útil para resaltar átomos específicos e interacciones químicas. En el círculo hay una vista ampliada de un enlace disulfuro en la proteína.

Un modelo de cinta (también llamado cadena principal) muestra los enlaces covalentes de la cadena principal (coloreados por cadenas de color azul en el extremo N y rojo en el extremo C) como una cinta delgada. En la imagen a continuación, se han agregado los enlaces de hidrógeno no covalentes entre los átomos de la cadena principal (líneas negras punteadas). Observe el patrón distinto de enlace de hidrógeno para hélices alfa y hojas beta.

Un modelo de superficie aproxima el área de superficie accesible al solvente (http://en.wikipedia.org/wiki/Con…) usando el radio de van der Waals de cada átomo. El esquema de colores utilizado a continuación predice la carga de una región de la superficie de la proteína (desde rojo brillante para negativo a azul profundo para positivo) en función de las cadenas laterales de aminoácidos presentes en la superficie.

PyMOL (http://pymol.org/) hace mucho más que esto. Además de una plétora de otros ajustes de visualización y varias formas de mezclar y combinar diferentes, también puede rotar y ampliar, mutar residuos, hacer películas, recopilar estadísticas y mucho más. PyMOL tiene su propia wiki que sirve como un excelente manual para todos sus usos (http://www.pymolwiki.org/).