¿Cuáles son algunos tipos de “características” (para ML) que pueden usarse para clasificar proteínas?

Biofísica, estadística, informativa …
Biofísica puede incluir: tamaño, peso molecular, hidrofobicidad, carga neta, PI, longitud, aromaticidad, alifatismo …
por ejemplo: ExPASy – documentación de ProtParam

Estadística: n-grams, frecuencia de aminoácidos, propensiones de AA (secuencia como señal de tiempo) …
Informativo: autocorrelación, entropía, análisis de señal, etc. ‘

Tengo una buena descripción de los métodos que usamos en los artículos ML para proteínas en los artículos mismos (y también puedes ver el código fuente) – NeuroPID y ProFET

Artículo de ProFET: ProFET: la ingeniería de funciones captura funciones de proteínas de alto nivel.
Código fuente de ProFET: https: // github .com / ddofer / ProFET

NeuroPID (Artículo):
Dan Ofer y Michal Linial NeuroPID: un predictor para identificar precursores neuropéptidos de proteomas metazoarios. Bioinformática (2013) doi: 10.1093 / bioinformática / btt725
NeuroPID: un predictor para identificar precursores de neuropéptidos a partir de proteomas metazoarios.

NeuroPID NAR: NeuroPID: un clasificador de precursores de neuropéptidos

¿Las células procariotas tienen ribosomas?

¿Es mejor comenzar con bioquímica que con farmacología en pregrado?

¿Explicarás la estructura de L-galactosa y D-galactosa?

Cómo ponerse al día en el campo de la bioquímica

¿Cuáles son algunas pequeñas moléculas sintéticas que son seguras para los humanos pero que no tienen efectos fisiológicos importantes?

Supreme Content

¿Cuáles son algunas de las técnicas novedosas que un estudiante de doctorado en biología / bioquímica debería aprender hoy en día?

¿Qué determina si un medicamento es metabolizado por el citocromo p450 o no?

¿Cómo es estudiar bioquímica?

¿Cuál es más difícil, con especialización en Física o Bioquímica?

¿Cuál es la razón por la que la adenina no se puede emparejar con la guanina?