¿Qué se entiende cuando una encuesta o estudio de investigación “controla” ciertos factores?

Hay dos formas de control, experimental y estadística.

El control experimental es el estándar de oro para establecer la causalidad. Para este tipo de control, utilizamos la asignación aleatoria, colocamos a las personas en dos o más grupos y luego manipulamos nuestra variable si interesa y vemos si tiene algún efecto.

Sin embargo, en muchos casos, el control experimental está fuera de nuestro alcance. Obviamente, no podemos asignar a las personas a ser intolerantes o tolerantes y luego ver el resultado. Esto apesta porque hay muchas variables de confusión que podrían estar causando esta correlación observada (el estado socioeconómico es un sospechoso obvio).

Como suplente, los estudios observacionales utilizarán el “control estadístico” para tratar de descartar algunas posibles explicaciones alternativas para el efecto observado. Por ejemplo, para controlar el efecto de la pobreza, entraría en mis datos, encontraría la asociación entre la pobreza y la esperanza de vida, y luego eliminaría esta varianza utilizando algo así como la regresión lineal. Después de eliminar el efecto de la pobreza, si la intolerancia aún influye en la esperanza de vida, puedo estar más seguro de que esta confusión particular no estaba jugando un papel.

Sin embargo, ¡ten cuidado! El control estadístico se basa en muchas suposiciones que pueden no ser ciertas. ¿Qué pasa si los autores utilizan una medida de pobreza inexacta o sesgada? ¿Qué pasa si la relación entre la pobreza y la esperanza de vida es cuadrática en lugar de lineal? ¿Qué otros factores relacionados no se incluyeron en su modelo ?: contaminación, médicos per cápita, afiliación religiosa, género …

Teniendo en cuenta la afirmación un tanto extraña (¡el fanatismo mata!), Estos investigadores realmente tienen que hacer sus deberes para demostrar que no hay que culpar a ninguna otra explicación más plausible.

La gran mayoría de las personas consume información de la encuesta a través de un informe “topline” univariante o una tabla cruzada bivariada. Estos no “controlan” otros factores.

Los investigadores de la encuesta tienen dos técnicas principales para introducir el control estadístico en sus análisis.

La primera técnica es el control experimental aleatorio. Al comparar grupos aleatorizados que varían solo en un aspecto, las comparaciones en ese aspecto del control de la diferencia para otros factores (aún se requieren suposiciones).

La segunda técnica es el modelado multivariante, generalmente regresión. Para una explicación demasiado simplificada de esta técnica, mira este video.

¿Qué determina qué factores se “controlan”?

La práctica estándar para determinar qué factores se controlan requiere preguntar, “¿qué factores podrían estar relacionados con la variable dependiente de interés y la variable independiente de interés?” Una forma de pensar sobre esto es la vieja historia sobre el tamaño del calzado y la capacidad matemática. La capacidad matemática se correlaciona con el tamaño del calzado, pero tenemos pocas razones para pensar que un pie más grande cause un mejor rendimiento matemático. Sin embargo, la edad está relacionada tanto con la capacidad matemática como con el tamaño del calzado. Esto crea una relación de confusión que lleva a un investigador a introducir la edad como una “variable de control” en un modelo multivariado.

el objetivo de la investigación es importante.

Si desea conocer el ingreso promedio de cierta categoría impositiva, por supuesto, omita a las personas que son más bajas o más altas.

Si desea saber la cantidad de paternidad (no) planificada, envió la encuesta a personas con hijos.

Otra forma de agregar factores de control es mediante la adición de preguntas como “si Y omita la pregunta X y Z” o “en caso de respuesta Y solo la pregunta X”

al elegir cuidadosamente su grupo de encuesta y su objetivo, puede obtener la respuesta máxima sin descartar a las personas temprano, puede hacerlo más adelante mediante preguntas como mencioné anteriormente. Recuerde, las preguntas siempre coinciden entre sí y solo las más importantes son selectivas en quién las responde.

También existe el tipo de preguntas de control que todos completan, pero crean grupos cuando todo se analiza.