Estoy trabajando con archivos PDB para analizar las estructuras de proteínas. ¿Qué es una buena herramienta o un conjunto de programas para determinar si un archivo PDB está compuesto de homodímeros o heterodímeros?

La respuesta de Akshari Gupta es correcta, sin embargo, si tienes 10s de archivos PDB, no es exactamente el método ideal. Recortar datos de RCSB y escribir un guión Perl / Python funcionaría mejor.

  • Obtener datos de RCSB: puede usar Wget si tiene todos los códigos de acceso en un archivo de texto [Acceso rápido a la línea de comandos de PDB / ¿Se puede usar el comando Wget para descargar Pdbs?], De lo contrario, puede descargar todos los archivos no cadenas redundantes del sitio web [RCSB PDB Newsletter]. La mejor manera es obtener todas las secuencias de proteínas en formato FASTA, en lugar de tratar con el formato PDB.
  • Aquí hay un ejemplo de un homodimer en formato FASTA.


Usaría personalmente hashmap, asignaría cada número de cadena a un valor y coincidiría (tenga en cuenta que las entradas ya están separadas por “>”). Aquí hay un código de muestra en Perl:

#! / usr / bin / perl
usar estricto;
usa advertencias;
mi% fastaid2seq = ();
my $ fastaid = ”;
my $ file = ‘seq.txt’; #sequence file, debe ser una variable
abrir (F, $ archivo) o morir (“No se pudo abrir el archivo.”);
while () {
chomp;
if ($ _ = ~ / ^> (. +) /) {
$ fastaid = $ 1;
}más{
$ fastaid2seq {$ fastaid}. = $ _;
}
}
cerrar F;

Iteramos el hash, comparamos valores e imprimimos un archivo con la ID y el número correspondiente o la cantidad de oligómeros homo / hetero o la información que necesites. Estoy seguro de que hay formas más inteligentes de hacerlo, pero esto tiene que ser lo más fácil.

Lo analicé y toda la información que necesita ya está presente en la versión de texto del archivo PDB, por lo que no debería ser demasiado difícil extraerla y cotejarla.

Usando 4O9U como un ejemplo representativo para un heterooligómero, la información que necesita es la siguiente:


Esto indica que esta estructura particular es un 6-mer con 2 cada uno de 3 péptidos diferentes.

A menos que quieras ver las simetrías biológicas. En ese caso, también se indican las simetrías predichas por el autor. Por ejemplo, para la estructura de la cápside en 3M8L:


Las transformaciones de simetría para este van hasta 60, es decir, esta cápside particular es un 60-mer hecho de unidades homotriméricas (también dadas en el archivo).

Hazme saber si esto funciona.