FASTA proporciona los detalles de la secuencia básica de una proteína específica. En la primera línea (siempre precedida por un símbolo ‘>’) hay detalles sobre la proteína, como el organismo, identificador único, detalles clave sobre la función de la proteína, cepas específicas, etc.
Luego está la secuencia primaria de la proteína, que es la secuencia de todos los aminoácidos en formato de letra única. En esta sección, siempre hay 60 letras (aminoácidos) por línea.
p.ej
> sp | P0CG48 | UBC_HUMANPolyubiquitin-C OS = H. sapiens GN PE = 1SV = 3
MQIFVKTLTGKTITLE etc.
(para la versión completa, haga clic aquí: página en uniprot.org)
Un PDB contiene información sobre la estructura tridimensional de una proteína, y se produce después de un análisis computacional o experimental (como el modelado de homología, la cristalografía de rayos X o la espectroscopía de RMN).
Bioquímica: ¿Cómo se transporta la toxina botulínica a la célula?
¿Cuál es la historia evolutiva de las proteínas de histonas?
¿Los veganos a menudo pierden el consumo de aminoácidos?
¿Por qué algunos amiloides no se descomponen durante la proteólisis?
El archivo será mucho, mucho más grande que un FASTA, ya que necesita contener información sobre cada átomo de la proteína, más la masa de átomos y la posición en el espacio tridimensional. Además, puede contener detalles experimentales para ayudar al lector a comprender los posibles defectos del modelo.
Entonces, para una proteína con ~ 300 aminoácidos, un archivo FASTA contendrá 6 líneas (una línea de introducción y 5 * 60 aminoácidos), mientras que un archivo PDB puede contener ~ 3000 líneas individuales de átomos, más información adicional en la parte superior.