¿Cómo calculo estas estadísticas?

https://stackoverflow.com/questions/1679

08-06-2019
|

Pregunta

Estoy escribiendo una aplicación para ayudar a facilitar algunas investigaciones y parte de esto implica hacer algunos cálculos estadísticos.En este momento, los investigadores están utilizando un programa llamado SPSS.Parte del resultado que les interesa se ve así:

[Part of the SPSS output

En realidad sólo les preocupa el F y Sig. valores.Mi problema es que no tengo experiencia en estadística y no puedo entender cómo se llaman las pruebas ni cómo calcularlas.

Pensé que F El valor puede ser el resultado de la prueba F, pero después de seguir los pasos dados en Wikipedia, obtuve un resultado diferente al que SPSS da.

Solución

Este sitio web Quizás te ayude un poco más.También Éste.

Estoy trabajando con un recuerdo bastante oxidado de un curso de estadística, pero aquí no pasa nada:

Cuando realiza un análisis de varianza (ANOVA), en realidad calcula el estadístico F como la relación entre las varianzas cuadráticas medias "entre los grupos" y las varianzas cuadráticas medias "dentro de los grupos".El segundo enlace de arriba parece bastante bueno para este cálculo.

Esto hace que el estadístico F mida exactamente qué tan poderoso es su modelo, porque la varianza "entre los grupos" es poder explicativo y la varianza "dentro de los grupos" es un error aleatorio.Alto F implica un modelo altamente significativo.

Como en muchas operaciones estadísticas, se retrodetermina Sig.utilizando el estadístico F.Aquí es donde la información de Wikipedia resulta algo útil.Lo que quiere hacer es, utilizando los grados de libertad que le proporciona SPSS, encontrar el valor P adecuado en el que mesa F le dará la estadística F que calculó.El valor P donde esto sucede [F(tabla) = F(calculado)] es la significancia.

Conceptualmente, un valor de significancia más bajo muestra una capacidad muy fuerte para rechazar la hipótesis nula (lo que para estos propósitos significa determinar que su modelo tiene poder explicativo).

Lo siento por los matemáticos si algo de esto está mal.¡¡¡Volveré a consultar para hacer modificaciones!!!

Buena suerte para ti.Las estadísticas son divertidas, pero tal vez no sea esta parte.=)

Otros consejos

Por su pregunta, supongo que sus colegas de investigación quieren automatizar el proceso mediante el cual se realizan ciertos análisis estadísticos (es decir, quieren procesar conjuntos de datos por lotes).Tienes dos opciones:

1) SPSS ahora se puede programar mediante Python (a partir de la versión 15): vaya a spss.com y busque Python.Puede escribir scripts de Python para automatizar análisis de datos y extraer valores clave de tablas dinámicas y luego procesar las respuestas como desee.Esto tiene la virtud de permitir una comparación exacta entre los resultados de su script en Python y los esfuerzos calculados manualmente en SPSS de sus colaboradores.Por lo tanto, no necesitará conocer ninguna estadística para realizar este trabajo (lo cual es una ventaja clave).

2) Podrías hacer esto en R, un entorno de estadísticas gratuito, que probablemente podría estar programado.Esto tiene la desventaja de que tendrás que aprender estadística para asegurarte de que lo estás haciendo correctamente.

Las estadísticas son difíciles :-).Después de un año de leer y releer libros y artículos, sólo puedo decir con confianza que entiendo los conceptos básicos.

Es posible que desees investigar bibliotecas ya preparadas para cualquier lenguaje de programación que estés utilizando, porque hay muchos problemas en matemáticas en general y estadística en particular (los errores de redondeo son un ejemplo obvio).

Como ejemplo, podrías echar un vistazo a el proyecto r, que es a la vez un entorno interactivo y una biblioteca que puede usar desde su código C++, distribuido bajo GPL (es decir, si lo usa solo internamente y publica solo los resultados, no necesita abrir su código).

En breve:No haga esto a mano, vincule/use software existente.Y la respuesta de sain_grocen es incorrecta.:(

Todas estas son pruebas de significancia de estimaciones de parámetros que normalmente se utilizan en regresiones múltiples de respuesta multivariada.Estas no serían cosas sencillas de hacer fuera de un entorno de programación estadística.Sugeriría obtener el resultado de un programa estadístico preexistente o usar uno al que pueda vincularse y usar ese código.

Me temo que la primera respuesta (la de sain_grocen) te llevará por el camino equivocado.Es probable que su explicación se refiera a un caso especial de lo que realmente está enfrentando.El anova explicado en sus enlaces es para una única respuesta variable, en un diseño equilibrado.Estas no son las estadísticas F que estás viendo.Los nombres en su salida (Pillai's Trace, Hotelling's Trace,...) son algunas de las versiones multivariadas disponibles.Tienen distribuciones F bajo ciertos supuestos.No puedo explicar un libro de texto de material aquí, le aconsejaría que comience al ver "Análisis estadístico multivariado aplicado" de Johnson y Wichern

¿Puede explicar más por qué el propio SPSS no es una buena solución al problema?¿Es que genera tablas dinámicas como resultado que son difíciles de manipular?¿Es el costo del programa?

Las estadísticas F pueden surgir de cualquier número de pruebas particulares.La F es solo una distribución (en términos generales:una descripción de las "frecuencias" de grupos de valores), como Normal (Gaussiano) o Uniforme.En general surgen de ratios de varianzas.Opinión:Muchos estadísticos (incluido yo mismo) consideran que las pruebas basadas en F son inestables (jerga:no-robusto).

Las estadísticas de salida particulares (traza de Pillai, etc.) sugieren que el análisis original es un ejemplo de MANOVA, que, como describen otros autores, es un procedimiento complicado y difícil de conseguir.

Supongo también que, basado en MANOVA y el uso de SPSS, este es un proyecto de psicología o sociología...si no, por favor iluminen.Podría ser que otros modelos más simples en realidad sean más fáciles de entender y más repetibles.Consulte al grupo de consultoría estadística de su universidad local, si tiene uno.

¡Buena suerte!

Aquí hay una explicación de la salida de MANOVA, de un muy buen sitio sobre estadísticas y SPSS:

Salida con explicación:http://faculty.chass.ncsu.edu/garson/PA765/manospss.htm

Cómo y por qué hacer MANOVA o GLM multivariado:(la misma ruta que la anterior, pero termina en '/manova.htm')

Escribir software desde cero para calcular estos resultados sería largo y difícil;hay muchos problemas numéricos e inversiones de matrices por resolver.

Como dijo Henry, use scripts de Python o R.Sugeriría trabajar con alguien que conozca SPSS si se trata de scripts.Además, el propio SPSS es capaz de exportar las tablas de salida a archivos utilizando algo llamado OMS.Un script dentro de SPSS puede hacer esto.

Descubra quién en su grupo de investigación conoce SPSS y trabaje con ellos.

Licenciado bajo: CC-BY-SA con atribución

No afiliado a StackOverflow