¿Cuál es la probabilidad de que dos secuencias de 100 aminoácidos compartan el 80% de su secuencia por azar?

Hay 4 aminoácidos en una secuencia de ADN, ACTG, 4 elementos diferentes en cada punto.

Piense en esto como un mazo de 100 cartas con 4 palos (ACTG), y usted está preguntando cuáles son las probabilidades. 2 mazos por 100 tienen el mismo AA en la misma ubicación que el otro.

Comencemos fácil con una baraja de 1 AA y acumulación.

La primera baraja, primero AA, es uno de 4 elementos, y la probabilidad de que la otra baraja tenga el mismo elemento es 4/16 o 1/4 posibilidad de que sea exactamente la misma.

Ahora un mazo de dos AA. Cada ubicación tiene las mismas probabilidades de ser el mismo, y dado que estamos midiendo eventos independientes, las probabilidades de cada ubicación se multiplican juntas. Entonces 2 AA, lo mismo es 1/4 * 1/4 o 1/16.

así que vamos a probar el mazo de 100 AA y determinar cuáles son las probabilidades de que 80 de ellos sean iguales. La respuesta depende de que exactamente 80 de ellos sean iguales y los otros diferentes, frente a al menos 80 de ellos, pero posiblemente más sean lo mismo.

Para exactamente 80, se pregunta cuáles son las probabilidades 80 AA son iguales, y 20 son diferentes. Eso es 1/4 ** 80 * 3/4 ​​** 20 * 80C100 (Fórmula de combinación) o aproximadamente 1.15 * 10 ** – 30

Cuáles son las probabilidades de que al menos 80 sean iguales equivale a preguntar cuáles son las probabilidades de que no más de 20 sean diferentes. luego 1 – esa respuesta es el resultado. Aunque no haré esas matemáticas.