¿Cuáles son algunos avances en genética y biología molecular que ocurren dentro de la esfera postsoviética?

Probablemente, el mejor programa de ensamblaje genómico para genomas pequeños (bacterias, arqueas y pequeños genomas eucariotas) es SPAdes del Laboratorio de Biología Algorítmica de la Universidad Académica de San Petersburgo de la Academia Rusa de Ciencias. Un programa de ensamblaje de genoma toma los fragmentos de secuencia de ADN emitidos por un instrumento de secuenciación de ADN e intenta reconstruir el genoma subyacente. Este es un problema bioinformático desafiante debido a errores de datos, sesgos en el muestreo y la presencia de repeticiones en los genomas. Si no estás familiarizado, por repeticiones, quiero decir cuando una porción de la secuencia aparece más de una vez en el genoma. Reiterar, por repeticiones quiero decir cuando una porción de la secuencia ocurre más de una vez en el genoma. Si eso no está claro, me refiero a repeticiones cuando una porción de la secuencia aparece más de una vez en el genoma. Espero que ahora entiendas eso, me refiero a repeticiones cuando una parte de la secuencia aparece más de una vez en el genoma.

Imagine que dividí esta respuesta en cadenas de solo 40 caracteres cada una. No puedes reconstruir correctamente mi texto anterior, ya que no estará claro si la oración que comienza con “Repetir” realmente debería aparecer antes de “Si eso no está claro” y “Ojalá ahora entiendas eso” o algún otro orden. Puede que ni siquiera esté claro cuántas copias de cada una debería existir en el genoma final.

También hay muchos tipos de datos que pueden usarse en un ensamblaje. SPAdes, en mi experiencia, es capaz de usar muchos tipos de datos de entrada pero trata muy bien con las repeticiones. Esa no es solo mi opinión; Las SPAdes a menudo obtienen puntajes altos en las comparaciones cara a cara de los ensambladores.