La respuesta corta es que cada una de estas bases de datos de PPI (interacción proteína-proteína) tiene diferentes métodos y fuentes para los PPI. Los métodos utilizados pueden variar de experimentales a computacionales a algún tipo de combinación de los dos. También hay una gama de métodos experimentales y computacionales utilizados. Además, la fuente de los datos también se puede mezclar, algunas de las bases de datos PPI se adhieren a una sola especie o un escenario, como un tipo de enfermedad, y otros no. Así que tenga cuidado de qué bases de datos se utilizan y para qué aplicación lo usa .
Un ejemplo de combinación es integrar datos experimentales, utilizando un método computacional para agregar automáticamente interacciones adicionales, luego corregir manualmente todas las entradas en función de algún protocolo.
Los detalles de cada base de datos generalmente se encuentran en la página “Acerca de XXX” donde debe prestar atención a cómo recopilaron sus datos, con qué frecuencia actualizan sus datos y cómo concatenan sus datos, lo que significa que la mayoría de las bases de datos se integran de varias fuentes Entonces, ¿qué hacen cuando hay un desacuerdo entre las bases de datos?
También es común que las bases de datos se usen entre sí.
Por ejemplo:
Biogrid = “BioGRID actualmente tiene más de 1,400,000 interacciones curadas de conjuntos de datos de alto rendimiento y estudios individuales enfocados, como se deriva de más de 57,000 publicaciones en la literatura primaria. Se mantiene una cobertura completa de la bibliografía completa para la levadura en ciernes (S. cerevisiae), la levadura de fisión (S. pombe) y el thale berro (A. thaliana), y se están realizando esfuerzos para expandir la curación en múltiples especies de metazoos “.
¿Pueden las bacterias u hongos en realidad comer residuos nucleares, reduciendo así su vida media?
¿Cómo afectan las modificaciones postraduccionales al plegamiento de proteínas?
DIP = “La base de datos DIP (Base de datos de proteínas que interactúan) enumera los pares de proteínas que se sabe que interactúan entre sí. Por interacción queremos decir que dos cadenas de aminoácidos se identificaron experimentalmente para unirse entre sí. La base de datos enumera dichos pares para ayudar a aquellos que estudian una interacción proteína-proteína particular, pero también aquellos que investigan vías reguladoras y de señalización completas, así como aquellos que estudian la organización y complejidad de la red de interacción de proteínas a nivel celular “.
IntAct = “IntAct proporciona un sistema de base de datos de código abierto de libre acceso y herramientas de análisis para datos de interacción molecular. Todas las interacciones se derivan de la curaduría de la literatura o de los envíos directos de los usuarios y están disponibles de forma gratuita “.
mint = “MINT se centra en las interacciones proteína-proteína verificadas experimentalmente extraídas de la literatura científica por expertos curadores. A partir de septiembre de 2013, MINT utiliza la infraestructura de la base de datos de IntAct para limitar la duplicación de esfuerzos y optimizar el futuro desarrollo de software “.
HPRD = “Human Proteinpedia es un portal comunitario para compartir e integrar datos de proteínas humanas. Permite a los laboratorios de investigación contribuir y mantener anotaciones de proteínas. La base de datos de referencia de proteínas humanas (HPRD) integra datos, que se depositan en Human Proteinpedia junto con la información curada de literatura existente en el contexto de una proteína individual. Todos los datos públicos aportados a Human Proteinpedia pueden consultarse, visualizarse y descargarse “.
Para enumerar las diferencias de las fuentes que citó.