Sie sind auf Seite 1von 5

PRUEBA SHAPIRO WILK

En estadstica, el Test de ShapiroWilk, se usa para contrastar la normalidad de un conjunto de datos. Se plantea como hiptesis nula que una muestra x1xn proviene de una poblacin normalmente distribuida. Fue publicado en 1965 por Samuel Shapiro y Martin Wilk. Se considera uno de los test ms potentes para el contraste de normalidad, sobre todo para muestras pequeas. El estadstico del test es:

Donde

x(i) (con el subndice i entre parntesis) es el nmero que ocupa la i-sima posicin en la muestra; = (x1 + ... + xn) / n es la media muestral; las constantes ai se calculan2

Donde

Siendo m1...mn son los valores medios del estadstico ordenado, de variables aleatorias independientes e idnticamente distribuidas, muestreadas de distribuciones normales. V es la matriz de covarianzas de ese estadstico de orden. La hiptesis nula se rechazar si W es demasiado pequeo. Es un contraste de ajuste que se utiliza para comprobar si unos datos determinados (X1, X2,, Xn) han sido extrados de una poblacin normal. Los parmetros de la distribucin no tienen porqu ser conocidos y est adecuado para muestras pequeas (n<50).Un contraste de ajuste tiene como objetivo comprobar si con base en la informacin suministrada por una muestra se puede aceptar que la poblacin de origen sigue una determinada distribucin de probabilidad, en nuestro caso, la distribucin normal. Mide el ajuste de la muestra a una recta, al dibujarla en papel probabilstico normal. Este tipo de representacin tambin lo proporcionan algunos programas de estadstica, de tal manera que nos permite adems apreciar el ajuste o desajuste de forma visual:

En escala probabilstica normal se representa en el eje horizontal, para cada valor observado en nuestros datos, la funcin de distribucin o probabilidad acumulada observada, y en el eje vertical la prevista por el modelo de distribucin normal. Si el ajuste es bueno, los puntos se deben distribuir aproximadamente segn una recta a 45. En la imagen vemos que en este ejemplo existe cierta discrepancia. En cualquier caso siempre es adecuado efectuar una representacin grfica de tipo histograma de los datos, y comparar el valor de la media y la mediana, as como evaluar el coeficiente de asimetra y apuntamiento, adems de llevar a cabo una representacin en escala probabilstica de la distribucin de probabilidad esperada versus observada, como la de la figura.

Das könnte Ihnen auch gefallen