Beruflich Dokumente
Kultur Dokumente
ESCUELA DE INGENIERA
INDUSTRIAL
SEMINARIO: METODOLOGA DE LA
INVESTIGACIN
TEMA:
ESTADSTICA NO PARAMTRICA
REALIZADO POR:
ESTADSTICA NO PARAMTRICA
1. Introduccin:
Los mtodos de estadstica inferencial que hemos estudiado a durante el curso, son llamados
mtodos paramtricos porque ellos son basados en muestreos de una poblacin con
parmetros especficos, como la media (), la desviacin estndar () o la proporcin (p).
Estos mtodos paramtricos usualmente tienen que ajustarse a algunas condiciones
completamente estrictas, as como el requisito de que los datos de la muestra provengan de
una poblacin normalmente distribuidas. Esta seccin presenta los mtodos no paramtricos,
los cuales no tienen tales estrictos requisitos.
La mayor parte de las tcnicas estudiadas hacen suposiciones sobre la composicin de los
datos de la poblacin. Las suposiciones comunes son que la poblacin sigue una distribucin
normal, que varias poblaciones tienen varianzas iguales y que los datos se miden en una
escala de intervalos o en una escala de razn. Este tema presentar un grupo de tcnicas
llamadas no paramtricas que son tiles cuando estas suposiciones no se cumplen.
2. ESTADSTICA NO PARAMTRICA:
La estadstica no paramtrica es una rama de la estadstica que estudia las pruebas y modelos
estadsticos cuya distribucin subyacente no se ajusta a los llamados criterios paramtricos.
Su distribucin no puede ser definida a priori, pues son los datos observados los que la
determinan. La utilizacin de estos mtodos se hace recomendable cuando no se puede
asumir que los datos se ajusten a una distribucin conocida, cuando el nivel de medida
empleado no sea, como mnimo, de intervalo.
Las principales pruebas no paramtricas son las siguientes:
Prueba de Pearson
Prueba binomial
Prueba de Anderson-Darling
Prueba de Cochran
Prueba de Fisher
Prueba de Friedman
Prueba de Kendall
Prueba de Kolmogrov-Smirnov
Prueba de Kruskal-Wallis
Prueba de Kuiper
Prueba de McNemar
Prueba de la mediana
Prueba de Siegel-Tukey
Tablas de contingencia
Prueba de Wald-Wolfowitz
3. PRUEBAS NO PARAMTRICAS:
Definicin:
Se denominan pruebas no paramtricas aquellas que no presuponen una distribucin de
probabilidad para los datos, por ello se conocen tambin como de distribucin libre
(distribution free). En la mayor parte de ellas los resultados estadsticos se derivan
nicamente a partir de procedimientos de ordenacin y recuento, por lo que su base lgica es
de fcil comprensin. Cuando trabajamos con muestras pequeas (n < 10) en las que se
desconoce si es vlido suponer la normalidad de los datos, conviene utilizar pruebas no
paramtricas, al menos para corroborar los resultados obtenidos a partir de la utilizacin de la
teora basada en la normal.
En estos casos se emplea como parmetro de centralizacin la mediana, que es aquel punto
para el que el valor de X est el 50% de las veces por debajo y el 50% por encima.
Aunque el trmino no paramtrico sugiere que la prueba no est basada en un parmetro, hay
algunas pruebas no paramtricas que dependen de un parmetro tal como la media. Las
pruebas no paramtricas.
Eleccin de la prueba no paramtricas:
fuerte (as como una muestra ms grande o mayores diferencias) antes de rechazar
una hiptesis nula.
3. Cuando los requisitos de la distribucin de una poblacin son satisfechos, las pruebas
no paramtricas son generalmente menos eficientes que sus contrapartes paramtricas,
pero la reduccin de eficiencia puede ser compensada por un aumento en el tamao de
la muestra.
5. PRUEBA DE FRIEDMAN
5.1.
DEFINICION
En estadstica la prueba de Friedman es una prueba no paramtrica desarrollado por el
economista Milton Friedman. Equivalente a la prueba ANOVA para dos factores en la
versin no paramtrica, el mtodo consiste en ordenar los datos por filas o bloques,
reemplazndolos por su respectivo orden. Al ordenarlos, debemos considerar la existencia de
datos idnticos.
5.2.
Comparacin de varios clasificadores
Los mtodos anteriores no fueron diseados para la media de varias variables.
Cuando se hacen muchos test, parte de la hiptesis nula se rechaza debido a la
aleatoriedad (Salzberg97).
Dos posibles alternativas:
ANOVA
Prueba de Friedman
ANOVA
Friedman test
Condiciones:
ANOVA.
Distribucin normal.
Requiere que las variables aleatorias Davenport (1980) al ser un mejor estadstico
tengan igual varianza.
(menos conservativo).
ANOVA?
5.3.
Esta prueba puede utilizarse en aquellas situaciones en las que se seleccionan n grupos de k
elementos de forma que los elementos de cada grupo sean lo ms parecidos posible entre s, y
a cada uno de los elementos del grupo se le aplica uno de entre k ''tratamientos'', o bien
cuando a cada uno de los elementos de una muestra de tamao n se le aplican los k
''tratamientos''.
La hiptesis nula que se contrasta es que las respuestas asociadas a cada uno de los
''tratamientos'' tienen la misma distribucin de probabilidad o distribuciones con la misma
mediana, frente a la hiptesis alternativa de que por lo menos la distribucin de una de las
respuestas difiere de las dems. Para poder utilizar esta prueba las respuestas deben ser
variables continuas y estar medidas por lo menos en una escala ordinal. Hiptesis:
Hiptesis nula (H0): No existen diferencias entre los grupos.
Hiptesis alternativa (H1): Hay diferencias entre los grupos.
Los datos se disponen en una tabla en la que en cada fila se recogen las respuestas de los k
elementos de cada grupo a los k tratamientos:
Grupo\
Tratamiento
...
...
x11
x12
...
x1j
...
x1k
...
....
....
...
....
...
....
xi1
xi2
...
xij
...
xik
...
...
...
...
...
...
...
xn1
xn2
...
xnj
...
xnk
A las observaciones de cada fila se les asignan rangos de menor a mayor desde 1 hasta k; a
continuacin se suman los rangos correspondientes a cada columna, siendo RJ la suma
correspondiente a la columna j-sima. Si la hiptesis nula es cierta, la distribucin de los
rangos en cada fila se debe al azar, y es de esperar que la suma de los rangos correspondientes
a cada columna sea aproximadamente igual a n (k + 1)/2. La prueba de Friedman determina si
las RJ observadas difieren significativamente del valor esperado bajo la hiptesis nula.
El estadstico de prueba es:
12
2
x=
( R j ) 3 n ( k +1 )
n. k ( k + 1 ) j=1
2
r
k =Numero de columnas
2
x 2r
fijado.
5.4.
CARACTERSTICAS
> 9.
Asignar al azar a los sujetos a cada condicin.
Muestras igualadas (igual nmero de sujetos en cada condicin).
Se asignan rangos por condicin.
Se trabaja con tablas de doble entrada.
Pasos:
Tema B
2
2
1
3
2
2
Tema C
1
1
2
1
1
1
SOLUCIN.
Dado que el nmero de sujetos es pequeo, deberemos utilizar una prueba no paramtrica, y
puesto que los casos se hayan relacionados, la prueba ms idnea es el anlisis de la varianza
de dos clasificaciones por rangos de Friedman. En primer lugar, plantearemos las hiptesis:
H0: No existen diferencias entre en la atraccin a los tres temas.
H1: Existen diferencias significativas entre en la atraccin a los tres temas.
El estadstico de contraste que emplearemos ser:
x 2r =
12
2
( R j ) 3 n ( k +1 )
n. k ( k + 1 ) j=1
Tema B
2
2
1
3
2
2
Tema C
1
1
2
1
1
1
RA = 17, RB = 12 y RC = 7. Sustituyendo:
x 2r =
12
( 172+ 122+7 2 )36 ( 3+1 )=8.33
63 ( 3+1 )
Comparamos el valor observado con el que nos ofrece la tabla, teniendo en cuenta que X2
sigue una distribucin de chi cuadrado con k-1 grados de libertad. Por tanto, el valor crtico
ser
0.9522 = 5.991
Puesto que el valor observado es mayor que el crtico, aqul entra en la regin de rechazo,
por lo que podemos rechazar con una confianza del 95% que existen diferencias
significativas en cuanto a la atraccin a los distintos temas.
2. Un investigador desea comparar los niveles de memoria en nios de 4, 6, 8, 10 y 12
aos despus de 3 diferentes tratamientos.
Eleccin de la prueba estadstica.
El modelo experimental tiene tres o ms muestras dependientes.
SOLUCION
Planteamiento de la hiptesis.
Hiptesis alterna (Ha). Hay diferencia significativa en nios de 4, 6, 8, 10 y 12 aos, despus
de aplicar 3 diferentes tipos de tratamiento.
Hiptesis nula (Ho). No hay diferencia significativa en nios de 4, 6, 8, 10 y 12 aos, despus
de aplicar 3 diferentes tipos de tratamiento.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Escala = 0 - 20
Interpretacin.
Aceptada Ha, se acepta que entre los tres tratamientos existen distintos grados de memoria
adquirida. Se distingue notoriamente que el tratamiento A es menos eficaz, con respecto a los
otros dos tratamientos. Por otro lado, el tratamiento B ofrece mayores ventajas para la
adquisicin de memoria
VARIAS MUESTRAS INDEPENDIENTES: PRUEBA DE KRAUSKAL-WALLIS
Esta prueba estadstica de anlisis de varianza de entrada simple de Kruskal-Wallis es una
extensin de la prueba de U Mann-Whitney, en razn de que se usan rangos para su
aplicacin; por otra parte, este procedimiento se emplea cuando el modelo experimental
contiene ms de dos muestras independientes.
tamao
total
de
la
muestra.
Muestras pequeas.
Ordenar las observaciones en rangos de todos los grupos, del ms pequeo al mayor.
2.
3.
Detectar las ligas o empates entre los rangos de cada grupo y aplicar la ecuacin (L)
para obtener el ajuste.
4.
5.
6.
7.
Ejemplo:
Un investigador estudia el efecto benfico de cuatro sustancias anticonvulsionantes
(fenobarbital, difenilhidantoinato -DFH-, diacepam y clonacepam), para proteger contra la
muerte producida por un convulsionante, la tiosemicarbazida, la cual se manifiesta despus
de crisis clnica y tnica, respectivamente. El investigador elige al azar a 24 ratones de la
misma edad y peso y les inyecta anticonvulsionante previamente a la tiosemicarbazida. A
partir de este momento, inicia la cuenta en tiempo, hasta que mueren los ratones; adems
mide las observaciones en horas de tiempo transcurrido.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha
Tiempo
en
horas
que
tarda
el
frmaco
en
causar
la
muerte
en
ratones.
De acuerdo con los pasos, se inicia con el ordenamiento de todas las observaciones a partir
del valor ms pequeo hasta el mayor y la deteccin de las ligas o empates. Arreglo de los
datos
para
asignar
rangos
detectar
las
ligas
empates.
Una vez efectuado el ordenamiento en rangos de las observaciones, se hacen las sumatorias
de los rangos. Para facilitar esta tarea, elabrese una tabla en la que sustituyan los datos.
Sustitucin por rangos. Observaciones de la primera tabla.
Decisin.
Como el valor estadstico H tiene una probabilidad menor que 0.01 y ste es menor que el
nivel de significancia, se acepta Ha y se rechaza Ho.
Interpretacin.
Entre las drogas anticonvulsionantes, existe diferencia significativa en cuanto a la proteccin
5.6.
BIBLIOGRAFA
Sprent P. Applied nonparametric statistical methods. 2nd Ed., Chapman-Hall, London,
1993:1-3.
Glantz SA. Primer of Biostatistics, 3th ed., McGraw Hill, New Yor, 1992
www.monografias.com/ED800Estadisticas_no_parametricas.