¿Cómo debo lidiar con 500 obs. de datos clínicos? ¿Debo volver a muestrearlo para poder aprender y predecir si un paciente responde al medicamento o de alguna otra manera sugerida?

No sé qué tipo de experimento ha realizado, pero una vez que tiene los datos, los ejecuta a través de SPSS (o lo calcula a mano, si es un maníaco completo) para ver si respalda su hipótesis o no. Compara sus sujetos de prueba con sus sujetos de control y ejecuta cualquier prueba de estadística que le proporcione la información que desea. ¿Estás buscando causalidad? ¿Correlación? ¿Una cola o dos colas? Si nada de eso tiene sentido para usted, haga que alguien más ejecute sus datos, luego informe los resultados. Primero configuraste a Alpha, ¿verdad? 0.05? Si lo cambió, debe justificar por qué.

Luego, informa si los resultados son estadísticamente significativos y cuáles son las implicaciones de ser así. Y enviar para publicación. Asegúrese de cumplir con la guía de estilo adecuada para su informe. APA es súper molesto y quisquilloso, pero si eso es lo que se requiere y lo arruinas, tu papel será rechazado incluso si tus resultados son sorprendentes. ¡Buena suerte!

Su asesor o profesor debería poder ayudarlo. Si se está enviando a un gran periódico, estará bajo su nombre. Si solo es tarea para una clase, obtenga ayuda de su TA.

A2A. Después de restregar un poco para asegurar que su conjunto de datos sea bueno, comenzaría haciendo algunos gráficos básicos de las características de interés para ver si hay patrones que insinúen alguna idea.

Supongo que sabes esto, pero para otros lectores; su objetivo de predicción de ejemplo supone que tiene datos de resultado directos. Si sus datos provienen de una prueba controlada, esto debe ser claro. Si sus datos provienen de episodios de pacientes, deberá asegurarse de que los datos de observación sean consistentes.

El análisis se vuelve mucho más complejo si tiene múltiples medicamentos, resultados continuos u otras sutilezas situacionales incrustadas en sus datos que deben tenerse en cuenta. Se vuelve casi imposible si las observaciones no usan medidas consistentes. Puede haber formas de resolver esto, pero es desafiante e incierto.

Si tiene la suerte de tener DataRobot o H2O, simplemente páselo por el conjunto de datos y trabaje a través de las características de interés y vea cómo funciona.

Es difícil de decir ya que no tengo idea de qué tipo de observaciones, de qué tipo de datos está hablando. ¿Los datos son simplemente una colección de notas, o están claramente etiquetados y ordenados y pueden recuperarse en, por ejemplo, una base de datos electrónica con capacidad de búsqueda? Una colección de notas escritas necesita muchos esfuerzos, sin idea de cómo manejar esto, aparte de examinarlo pieza por pieza al ingresar los datos relevantes en una base de datos ordenada electrónicamente. De lo contrario, defina lo que busca, consulte su base de datos y vea lo que sale. Necesitará a alguien con experiencia estadística para ayudarlo a manejar las estadísticas.

Depende del tipo de datos que tenga (número de predictores, resultado de interés …). Muchos modelos de aprendizaje automático pueden manejar datos pequeños, incluso si hay muchos predictores. Adjunto un PPT con muchas opciones de aprendizaje supervisado con implementaciones de R / Python: https://www.slideshare.net/Colle

La respuesta de la Sra. Alexander me parece lo mejor: invitar a alguien que entiende y utiliza el análisis estadístico con regularidad. Tanto Excel como Access tienen herramientas estadísticas que pueden hacer lo que usted necesita, pero debe comprender cómo usarlas. Y el comentario sobre el estilo de APA está absolutamente en el blanco. Tanto molesto como exigente, pero frecuentemente requerido por publicaciones e incluso por profesores.