Al alinear secuencias de proteínas, a menudo es evidente que ciertas regiones o aminoácidos específicos están más conservados que otros. Dichas regiones conservadas a menudo se conservan porque codifican una parte de la proteína que es funcionalmente importante.
El término motivo se usa para referirse a una parte de una secuencia de proteína que está asociada con una función biológica particular.
La presencia de un motivo particular dentro de una secuencia de proteína puede usarse para sugerir funciones para proteínas no caracterizadas.
Se han construido varias bases de datos que intentan describir motivos proteicos particulares en términos de patrones y perfiles. Le permiten buscar patrones o perfiles que son indicativos de motivos funcionales particulares dentro de una proteína de consulta.
Vamos a discutir sobre ellos: –
- ExPASy – PROSITE – una colección de patrones y perfiles
- Pfam: Página de inicio – Una colección de perfiles generados utilizando modelos ocultos de Markov
Profundizando, prepárate con largos párrafos, aquí vamos:
¿Cuál es el principal obstáculo para nosotros para lograr la fotosíntesis artificial?
Biología de sistemas: ¿cómo se pueden llenar los vacíos que existen en las redes metabólicas?
ExPASy – PROSITE es una colección anotada de descriptores de motivos dedicados a la identificación de familias y dominios de proteínas. Los descriptores de motivos utilizados en PROSITE son patrones o perfiles que se derivan de múltiples alineamientos de secuencias homólogas.
En la mayoría de los casos, las reglas se basan en perfiles PROSITE ya que son más específicas que los patrones, pero ocasionalmente las reglas hacen uso de patrones. En estos casos, las reglas no funcionarán de manera independiente, pero serán llamadas por otra regla, que será activada por un perfil.
Además de estas reglas correspondientes a un motivo único PROSITE, también hay reglas activadas por una combinación específica de motivos PROSITE llamados meta motivos. Meta Motifs permite la definición de arreglos de dominios separados por espaciadores de tamaño variable, así como el anclaje a los extremos N y / o C y la exclusión de un motivo PROSITE.
Tomemos un ejemplo:
Ahora obtendrás un resultado, que se ve así,
Donde como Pfam: es una base de datos completa de proteínas conservadas y proporciona herramientas para buscar secuencias de consulta para estos motivos. Estas herramientas se basan en modelos ocultos de perfil de Markov (HMMER3).
Pfam también genera agrupaciones de nivel superior de entradas relacionadas, conocidas como clanes . Un clan es una colección de entradas de Pfam que están relacionadas por similitud de secuencia, estructura o perfil-HMM.
Los datos presentados para cada entrada se basan en los Proteomas UniProt Reference, pero la información sobre las secuencias individuales de UniProtKB aún se puede encontrar ingresando la accesión a la proteína.
Tomemos el ejemplo de Pfam:
Espero que esto te ayude. Todo lo mejor