Cuando se aplica una agrupación jerárquica al ARN de las células dif del mismo tipo de célula, ¿cuánta consistencia existe en los genes agrupados por el mismo grupo?

Tuve la oportunidad de trabajar con células de Dna de levadura y predecir sus resultados cuando se sometieron a varios antígenos. Antes de desarrollar los modelos de predicción, utilicé el agrupamiento jerárquico supervisado aglomerativo y divisivo, y comparé con K el agrupamiento para crear conjuntos de datos uniformes. , (luego siga la rutina de mezclarlos, dividirlos en conjuntos de datos, entrenarlos y ver qué tan bien está el modelo de predicción)

La célula de ADN de levadura tiene el mismo tipo genético y cambió un poco después de haber sido expuesto a antígenos. Para una forma pura de ADN, la consistencia era realmente buena y podíamos ver grupos perfectos, aunque parecidos a los perfectos, a diferencia del ADN. después de que fue expuesto.

Rna por otro lado es básicamente de 3 tipos mRna, tRna y rRna. Si vas a utilizar una muestra pura basada en mis observaciones, definitivamente tendrás una buena consistencia en los clusters que hagas. Sin embargo, una agrupación Divisiva debería proporcionar una mejor consistencia de clusters que aglomeración, ya que se tomará mRna como cabeza, ya que tiene el mayor número de nucleótidos sobre tRna que tiene más nucleótidos que rRna, por lo que según la probabilidad cada mRna ya tendrá una parte de tRna y rRna, pero no al revés. Por lo tanto, el clúster Divisivo generará clusters que están más relacionados o, en otras palabras, tienen más consistencia.

  • Nunca lo he intentado prácticamente en un conjunto de datos de Rna, pero por lo que he entendido, la composición genética de diferentes rna te dará mejores grupos si puedes descomponerlos.
  • Por favor, siéntanse libres de probarlos con cualquier conjunto de datos de rna y también pueden notificarme si cometí un error en mis observaciones

Espero que esto ayude