¿Cómo se realiza la secuenciación del proteoma de alto rendimiento?

El método experimental más común para identificar proteínas en mezclas complejas incluye estos pasos:

  1. Extracción de proteínas de muestras
  2. Reducción de enlaces disulfuro y desnaturalización de la estructura proteica
  3. Digestión de proteínas a péptidos usando la enzima tripsina
  4. Fraccionamiento de la mezcla de péptidos por una de varias técnicas (como bRPLC o SCX)
  5. Separación de péptidos por hidrofobicidad en una columna “C18” en cromatografía líquida de fase inversa (RPLC) en ruta a nanoelectropulverización
  6. Análisis de masas para determinar qué iones peptídicos están actualmente disponibles para el interrogatorio (a medida que avanza el RPLC) dentro de un espectrómetro de masas
  7. Espectrometría de masas en tándem para medir los fragmentos de iones producidos por los iones de un péptido particular que se rompen en la disociación inducida por colisión

Estos pasos son lo que sucede en los experimentos de banco. Los pasos 5-7 están sucediendo simultáneamente en la mayoría de los flujos de trabajo. Luego tenemos los pasos que llevamos a cabo después en bioinformática:

  1. Selección de una base de datos de secuencias de proteínas para determinar el “espacio de búsqueda” para la identificación
  2. Especificación de la enzima utilizada para la digestión
  3. Definición de los límites de precisión de masa para péptidos intactos y fragmentos de péptidos
  4. Enumeración de las modificaciones postraduccionales que deberían buscarse en el conjunto de datos LC-MS / MS
  5. Algoritmo de búsqueda de base de datos (los primeros cuatro son entradas para este paso relativamente lento) como Sequest, Mascot o MS-GF +
  6. Filtrado de coincidencias de espectro de péptidos con una tasa de falso descubrimiento especificada por el usuario
  7. Inferencia y parsimonia de proteínas

Una muestra con 100 o menos proteínas (como una co-inmunoprecipitación) se puede analizar en una única separación de RPLC que dura una hora y puede omitir el fraccionamiento (# 4 en el protocolo “banco”). Una muestra compleja puede requerir un día o más de tiempo de espectrómetro de masas, ya que doce o incluso veinticuatro fracciones se analizan cada una mediante una separación separada de RPLC.

En la actualidad, los principales laboratorios pueden identificar más de 10.000 proteínas de una muestra que presenta dicha complejidad (como un xenoinjerto de cáncer humano cultivado en un ratón). Trabajar desde biofluidos como plasma o suero es mucho más limitante debido al alto rango dinámico de las proteínas en estas muestras.

@by LC-MS / MS Cuanto más larga sea la carrera, mayor será la salida. 😉