¿Cuál es el contenido teórico máximo posible de G / C para un genoma donde hay suficientes codones únicos para codificar los 20 aminoácidos proteinogénicos?

Si desea codificar todos los aminoácidos, necesita una proteína con todos los aminoácidos. Acabo de hacer esta secuencia mirando una tabla de codones (incluidos stop y start) y eligiendo los codones que tienen el mayor porcentaje de C / G. Hay 44 Cs o Gs de 72 posibles, que es un porcentaje del 61%. Nota: las paradas y arranques no están en las posiciones correctas.
UUCUUGUCCUACUAGUGCUGGCGGCAGCACCCCCUGAUCAUGACGAACAAGAGCAGGGGGGACGAGGCGGUG

Sin embargo, el contenido de GC siempre puede ser mayor en los genomas reales porque no tienen una distribución igual de aminoácidos, por lo que pueden obtener porcentajes más altos al permitir que los aminoácidos sean más ricos en GC. Además, los genomas reales no tienen genes posicionados uno tras otro. Existen otras regiones del genoma para promotores, características estructurales, etc. que no tienen codones y, por lo tanto, pueden ser cualquier cantidad de nucleótidos.

El porcentaje de GC máximo teórico más alto en las regiones de codificación es del 75,7%. El contenido de GC de los genomas bacterianos

No creo que sea fácil decir cuál sería el máximo para las regiones que no codifican porque no hay presión de selección en la mayoría de ellas.

El contenido de GC observado más alto es, creo, en Streptomyces coelicolor al 72.1%. Streptomyces coelicolor (ID 1057)