No, la dispersión de los residuos no proporciona información acerca de cuán cerca están los valores predichos de los valores observados. Piensa en lo que significa ” difundir” . ¿De qué se extiende? Estás confundiendo spread con ” ubicación “.
Dicho esto, la razón por la que desea ver los residuos es por la suposición que hace cuando modela la regresión lineal. Los errores deben seguir una distribución normal y la varianza de los errores debe ser igual. Estos son asunción de normalidad y asunción de homoscedasticidad, respectivamente.
Los errores no son lo mismo que los residuos, pero los residuos son la realización de errores. Por lo tanto, debe ver los residuos si desea verificar si las suposiciones aún se mantienen. La extensión es para verificar la varianza.
En algunos análisis, la variabilidad es buena, ya que significa que podemos reducirla al incorporar más información. Pero al mismo tiempo, queremos que esté bajo control. En los modelos lineales, si no hay varianza, significa que el ajuste es perfecto. Esto puede parecer agradable, pero no es porque pueda indicar un ajuste excesivo. Los datos que se han recopilado pueden ajustarse perfectamente al modelo, pero a medida que obtenga más datos, es posible que no. Siempre debemos tener en cuenta que la regresión lineal no intenta dibujar una línea que pase todos los puntos. Piensa en por qué y te darás cuenta de que es porque el ajuste excesivo no es realmente deseable. En tal sentido, la variabilidad abre el espacio para que lleguen más datos.