¿Cuántos participantes y cuánta diferencia se necesita en la investigación médica para alcanzar un nivel de significación estadística?

La respuesta a su pregunta es proporcionada por el análisis de poder estadístico . El análisis de potencia proporciona una respuesta a la pregunta: dado el tamaño del efecto, ¿qué tamaño mínimo de muestra se necesita para tener al menos un 80% de probabilidad de rechazar el nulo? o, dado el tamaño de mi muestra, ¿cuál es el tamaño de efecto mínimo para el que tengo un 80% de probabilidad de rechazar el nulo?

El análisis de poder estadístico se puede hacer como una tabla de búsqueda. Si puede estimar el tamaño del efecto (como d), puede buscar el tamaño de muestra que, en teoría, le da un 80% de probabilidad (es decir, potencia de 0,80) de obtener un resultado estadísticamente significativo en libros tales como el Análisis de Poder Estadístico de Jacob Cohen para las Ciencias de la Conducta .

La mayoría de los investigadores usan programas como el Software de tamaño de muestra | Software de análisis de potencia | PASE | NCSS.com para hacer análisis estadísticos de potencia. Normalmente, las entradas de usuario:

  1. el tipo de prueba estadística que se usará,
  2. el nivel alfa, y si se usará una o dos pruebas de cola (si corresponde),
  3. el nivel deseado de poder estadístico (posibilidad de rechazar la hipótesis nula) que se prefiere, a menudo establecido arbitrariamente en 80% o, a veces, más alto
  4. y luego, ya sea el tamaño del efecto anticipado o el tamaño de muestra planificado.

Si se ingresa el tamaño del efecto, se genera un tamaño mínimo de muestra sugerido.

Si se ingresa el tamaño de muestra, se genera el tamaño mínimo del efecto que tendría un 80% de probabilidad de ser detectado usando esa muestra de tamaño.

Los valores numéricos para el tamaño de efecto mínimo / tamaño mínimo de muestra pueden obtenerse del análisis estadístico de potencia. Sin embargo, la precisión implícita suele ser falsa, porque generalmente no hay suficiente información para hacer una suposición bien informada sobre el tamaño del efecto antes de que se realice el estudio.

El análisis del poder estadístico ahora se requiere como parte de las propuestas de investigación presentadas a muchas agencias de financiación.

La discusión restante proporciona una demostración (no una prueba) de que el tamaño de muestra y el tamaño del efecto se combinan para influir en el tamaño de las estadísticas de prueba.

Utilizo la prueba t de muestras independientes como ejemplo. Los conceptos se generalizan a otros análisis.

Para anticipar la conclusión: el valor probable de t es grande cuando el tamaño de muestra (df) o el tamaño del efecto (d) son grandes, o cuando ambos son grandes.

Primero veremos el concepto básico (de manera descuidada y orientada a los ejemplos) y luego veremos brevemente el enfoque más preciso que se usa en la práctica (análisis de poder estadístico).

Supongamos que está interesado en la diferencia de altura (Y) para los hombres frente a las mujeres.

La forma más sencilla de abordar esto es calcular la media y la desviación estándar de la altura para muestras de hombres y mujeres y establecerlas en la prueba.

Aquí hay una versión de una fórmula para la prueba t de muestras independientes, donde M1 y M2 son los medios del grupo, n1 y n2 son los tamaños de muestra, ys es el conjunto o promediado dentro de la desviación estándar del grupo.

El álgebra simple se puede usar para convertir la fórmula computacional para la razón en lo siguiente.

En esta fórmula para t, df = n1 + n2 -2

En esta fórmula para t, la d de Cohen es una medida del tamaño del efecto, es decir, la magnitud de la diferencia sexual en la altura media expresada como la diferencia entre los promedios divididos por el conjunto dentro de la desviación estándar del grupo:

donde M1 = altura media masculina, M2 = altura media femenina, y sp = agrupada o promediada dentro de la desviación estándar del grupo para la altura dentro de los grupos de sexo.

Si d = .1, es decir, la altura media del macho es solo una décima parte de una desviación estándar por encima de la altura media de la hembra, esa es una diferencia relativamente pequeña. Si d = 2, es decir, si la altura media del macho fuera 2 desviaciones estándar por encima de la altura media de la hembra, esa diferencia sería tan grande que la mujer más alta sería más baja que casi todos los hombres.

Si usa alfa = .05 dos colas, rechazaría la hipótesis nula de que la altura media del macho es igual a la altura media femenina para valores de t mayores que los valores críticos de t para la df apropiada. Si simplificamos suponiendo que df es al menos 100, podemos decir que rechazamos el valor nulo para los valores de t que son mayores que 1.96 en valor absoluto.

Así que aquí está la fórmula para t en términos de d y df nuevamente:

Si sustituye esta fórmula por un valor específico de Cohen’s d (por ejemplo, una suposición de que el tamaño del efecto podría ser d = .30) puede resolver para encontrar el rango de valores de df (tamaño de muestra) que haría que t sea menor que -1.96 o> 1.96.

O bien, si sustituye en un valor de df (tamaño de muestra), puede resolver el valor de d (tamaño del efecto) que se necesitaría para hacer que t sea mayor que 1.96 en valor absoluto.

Si piensas en este ejercicio, te dice que:

  1. Si tanto d como df son “muy pequeños”, la t obtenida también será muy pequeña (quizás demasiado pequeña para rechazar la hipótesis nula).
  2. Si tanto d como df son “muy grandes”, la t obtenida probablemente también sea bastante grande (y tal vez lo suficientemente grande como para rechazar la hipótesis nula.
  3. Cuando un término (como d) es pequeño y el otro (como df es grande), es más difícil predecir un rango de valores de t. Hay una compensación; para obtener un “valor suficientemente grande de t”, a medida que d se hace más pequeño, necesitamos un tamaño de muestra más grande o df; en consecuencia, a medida que df se hace más pequeño, necesitamos un mayor valor de d para el tamaño del efecto.

Las ecuaciones se verían diferentes para otros análisis ampliamente utilizados, tales como odds ratios o correlaciones; pero la idea básica seguiría siendo la misma.

Si otros factores son iguales, un investigador puede intentar obtener una estadística de prueba más grande ya sea por

Intentando hacer que el tamaño del efecto sea más grande

o

Aumento del tamaño de muestra

o

Ambos

Como se mencionó al principio al planificar el tamaño de muestra para un estudio, en la práctica, las personas no resuelven la ecuación para t como en el ejemplo anterior. El ejemplo ignora el error de muestreo. Para tener en cuenta el error de muestreo, los estadísticos utilizan el enfoque más formal presentado brevemente antes: análisis de poder estadístico.

Para obtener más información, consulte el capítulo 5 en Warner, Estadísticas aplicadas: de las técnicas bivariadas a multivariadas. Thousand Oaks, CA: Sage.

Puede calcular el número de sujetos necesarios para un estudio determinado, pero se necesitan muchos factores antes de poder realizar el cálculo. Depende de si le preocupa informar un hallazgo de los resultados de la encuesta con un cierto grado de confianza. ¿O está haciendo un “análisis de poder”, en el que necesita saber la ‘n’ necesaria para poder encontrar el efecto que está buscando, si es que existe?

También depende de si el resultado de una encuesta es categórico o continuo, cuál es la desviación estándar o la proporción esperada y, por supuesto, si se realizará la estratificación, lo que requerirá una representación excesiva o insuficiente. ¿Necesita tener la precisión de 5% o 1%?

En resumen, no hay una manera simple de dar una respuesta a la pregunta. Se deben decidir muchos factores, y luego se pueden hacer los cálculos.

Lamentablemente, no sé casi nada sobre estadísticas, como Desviación estándar y Desviación de la media … para mí, ¿son todos comportamientos desviados?

Espero que un estadístico pueda responder a esto sin desviarse demasiado … 🙂