Sie sind auf Seite 1von 74

Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

ESPECIALIZACIÓN EN ESTADÍSTICA
APLICADA.
CURSO: ANALISIS DE REGRESIÓN Y
ESTADÍSTICA NO PARAMÉTRICA

Prof.: Julio S. Moreno R.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

AGENDA:

Estadística No- Paramétrica.


➢ Tablas de Contingencia uso de la distribución Chi-
cuadrado, valores esperados menores a 5.
➢ Test de Homogeneidad.
➢ Test de Kruskal Wallis.
➢ Test de Friedman
➢ Test de Homogeneidad de Varianzas
➢ Coefecientes de Correlación, Pearson y Spearman.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

TABLAS DE CONTINGENCIA:
- Implica siempre a variables cualitativas, categóricas o nominales,
u ordinales con pocos valores: nominal*nominal,
ordinal*ordinal; nominal*ordinal.

- También puede implicar a una variable nominal y otra de


intervalo: nominal*intervalo

- Los datos se organizan en tablas de doble entrada, distribuidos


según un criterio de clasificación (variable nominal/variable
ordinal). Resultado: frecuencias y porcentajes Observar
asociación o relación entre las categorías o valores de las
variables implicadas.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Hipótesis Estadísticas: En Estadística Inferencial es


habitual la aplicación de pruebas de significación
estadística, que permiten determinar la existencia de
diferencias entre grupos, la dependencia entre variables:

• Hipótesis nula (H0): La diferencia entre los grupos es


estadísticamente nula, o más bien que son
independientes “que no depende uno del otro”.

• Hipótesis alterna (H1) Las diferencias observadas no


se deben al azar; son estadísticamente significativas
entre los grupos; esto es, que son dependientes “que
depende uno del otro.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

CONTRASTE DE HIPÓTESIS Y PRUEBAS DE


ASOCIACIÓN

- No basta con observar las diferencias entre porcentajes.


-Se debe utilizar alguna medida de asociación acompañada
de su correspondiente prueba de significación para
determinar si dos variables
se encuentran relacionadas (asociadas) de forma
estadísticamente significativa a un nivel crítico α, y el grado
de relación entre ambas variables.
- Mayor interés: obtener un índice que describa la fuerza, la
dirección y la naturaleza de la asociación (no interpretable
en términos de relación causa-efecto) entre las variables.
Éste es el objetivo de las MEDIDAS DE ASOCIACIÓN.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Es una prueba estadística para evaluar hipótesis acerca de


la relación entre dos variables categóricas.
Símbolo: X2
Hipótesis a probar: Independencia y homogeneidad

Variables involucradas: Dos variables (la prueba Chi-cuadrada no considera


relaciones causales).
Nivel de medición de las Nominal u ordinal (o intervalos o razón reducidas a
variables ordinales)
Procedimiento La Chi-cuadrada se calcula por medio de una tabla de
contingencia o tabulación cruzada, que es una tabla
de dos dimensiones y cada dimensión contiene una
variable. A su vez, cada variable se subdivide en dos o
más categorías.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

CARACTERÍSTICAS
1. La Distribución X2 se lee con grados de libertad G.L =
(Nº de filas - 1)(Nº de columnas - 1).
2. No tiene valores negativos. El valor mínimo es 0.
3. Todas las curvas son asimétricas
4. Cuando aumentan los grados de libertad las curvas son
menos elevadas y más extendidas a la derecha.
5. Se utiliza para variables medidas en escala nominal u
ordinal.
6. Las fórmulas son:

Total de Fila x Total de Columna


F. Esperada=
Total General
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejemplo 2. Estudio de Tabla de contingencia 3x2:


Se estudia a 1040 estudiantes de los niveles de educación
primaria y secundaria y a los cuales se aplica un instrumento
que mide el aprendizaje de la matemática, en las dimensiones
de aprendizaje conceptual, procedimental y actitudinal.
Variables:
APRENDIZAJE categorías: Conceptual, Procedimental, Actitudinal.
NIVEL DE EDUCACIÓN categorías: Primaria, Secundaria.

TABLA DE CONTINGENCIA
NIVEL DE EDUCACIÓN

Primaria Secundaria

Conceptual 180 100


APRENDIZAJE
Procedimental 190 280
Actitudinal 170 120

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Tabla de frecuencias observadas (O):

NIVEL DE EDUCACIÓN TOTAL


Primaria Secundaria
Conceptual 180 100 280
APRENDIZAJE Procedimental
190 280 470
Actitudinal
170 120 290

TOTAL 540 500 1040

La Chi-cuadrada es una comparación entre las tablas


de frecuencias observadas y la denominada tabla de
frecuencias esperadas (la tabla que esperaríamos
encontrar si las variables fueran estadísticamente
independientes o no estuvieran relacionadas).
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática
Tabla de frecuencias esperadas (E):

La frecuencia esperada de cada celda, casilla o recuadro, se


calcula mediante la siguiente fórmula aplicada a la tabla de
frecuencias observadas:
N = es el número total de frecuencias observadas.
E = (marginal del reglón)(marginal de columna) / N.

NIVEL DE EDUCACIÓN

Primaria Secundaria Marginal


de filas

Conceptual (280)(540)/1040 (280)(500)/1040 280


APRENDIZAJE Procedimental (470)(540)/1040 (470)( 500)/1040 470

Actitudinal (290)(540)/1040 (290)(500)/1040 290

marginal de columnas
540 500 1040

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Para el ejemplo: Nº de filas = 3 y Nº de columnas = 2; entonces


G.L. = (3-1)(2-1) = 2.

Luego, acudimos a la “tabla de distribución de Chi-


cuadrado”, eligiendo nuestro nivel de confianza ( = 0,05 ó
 = 0,01).

Si el valor obtenido de X2 es igual o superior al valor de la


“tabla”, decimos que las variables están relacionadas o no
son independientes.

Aplicación:
Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla
es 5,9915 (ver tabla).
X2Obtenido = 47,24
X2Crítico = 5,9915
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Para el nivel de confianza de =0,05 y g.l. = 2, el X2 de tabla


es 5,9915 (ver tabla de Chi-cuadrada).
X2Obtenido = 47,24
X2Crítico = 5,9915

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

EJEMPLO N°01
En un ensayo biológico se buscaba comprobar la eficacia de
un tratamiento combinado de Vitamina y Piracetam que, al
actuar sobre el metabolismo de la neurona, interfiere
favorablemente en el tratamiento de distintos procesos
psicoorgánicos. Se dividió al azar en dos grupos a cuarenta
pacientes, administrando el tratamiento a uno de ellos y
placebo al otro, teniéndose:

RESULTADO
GRUPO Muy bueno Bueno Regular Malo
Tratamiento 3 8 4 5
Placebo 0 1 5 14

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

HIPOTESIS LA PRUEBA DE CHI-CUADRADA

H0: Los tratamientos que actúan sobre el metabolismo de


la neurona no interfiere favorablemente en el tratamiento
de distintos procesos psicoorgánicos.

Ha: Los tratamientos que actúan sobre el metabolismo de


la neurona, si interfiere favorablemente en el tratamiento
de distintos procesos psicoorgánicos.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

RESULTADO
GRUPO Muy
Bueno Regular Malo
bueno
Tratamiento 3 8 4 5
Placebo 0 1 5 14

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Opción: Estadísticos Opción: Casillas

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

RESULTADO
GRUPO Muy bueno Bueno Regular Malo
Tratamiento 3 8 4 5
Placebo 0 1 5 14

RESULTADO
GRUPO Positivo Malo Total
Tratamiento 15 5 20
Placebo 6 14 20
21 19 40

Nota: Para obtener una prueba de contingencia exacta los


valores esperados no deben ser menores a 5, en ese caso se
procederá agrupar con la categoría más cercana, transformar
a una tabla de 2x2.
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

El nivel de significación α:0.05 o 5%, es mayor al p-value=0,010, existe


suficiente evidencia estadística para rechazar la H0.
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

EJEMPLO N°02

En un estudio, los investigadores entrevistaron a 2784


individuos, de las 257 de los cuales se hospitalizaron y
determinaron si cada individuo padecía alguna
enfermedad del sistema circulatorio, una enfermedad
respiratoria o ambas. Los resultados se muestran a
continuación. Realice la prueba de Chi-Cuadrado.
Enfermedad
Respiratoria
Enfermedad Si No Total
circulatoria
Si 7 29 36
No 13 208 221
20 237 257

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

El nivel de significación α:0.05 o 5%, es mayor al p-value=0,012, existe


suficiente evidencia estadística para rechazar la H0.
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

CONTRASTE DE HIPÓTESIS Y PRUEBAS DE


HOMOGENEIDAD CON CHI-CUADRADO

- El método de prueba de independencia se aplica


también a la prueba de homogeneidad (Prueba para
varias proporciones poblacionales).

- Con la prueba de homogeneidad se busca determinar si


dos muestras independientes provienen de la misma
población o de poblaciones diferentes.

- Como el método anterior, para esta prueba los datos


muestrales se registran en filas y columnas celdas de
una tabla de contingencia rxc. Donde “r” es el número y
“c” es número de columnas.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejercicio N°1:
Se efectuó un estudio en tres
universidades de Lima: La Católica, San Marcos, UNI, para
determinar las preferencias de los alumnos por tres tipos
de deportes: Futbol, baloncesto y tenis. Una muestra
aleatoria de 500 alumnos ha dado los resultados de la tabla
que sigue. A partir de estos datos determinar si las tres
universidades son homogéneas con respecto a sus
preferencias en los tres deportes, utilice nivel de
significación: 0.05.
Universidades
Deportes Total
Catolica San Marcos UNI
Futbol 80 70 100 250
Baloncesto 90 60 30 180
Tennis 30 20 20 70
Total 200 150 150 500

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

HIPOTESIS LA PRUEBA DE CHI-CUADRADA

- H0: Para cada deporte las proporciones de preferencias


en las tres universidades son las mismas. (Las tres
universidades son homogéneas).

H0: P1i= P2i=…….= Pki

- Ha: Para cuando menos un deporte, las proporciones de


preferencias en las tres universidades no son las
mismas.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejercicio N°2: El gerente de ventas de una firma desea


determinar si las ventas de cuatro productos es
homogénea entre las clases de clientes clasificados en
cuatro grupos, una muestra aleatoria de las ventas
suministra la siguiente información, utilice nivel de
significación: 0.05.

Grupos de Producto
Total
Clientes 1 2 3 4
Profesionales 30 35 55 40 160
Comerciantes 155 50 125 80 410
Obreros 130 30 105 50 315
Amas de casa 35 15 20 45 115
Total 350 130 305 215 1000

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

HIPOTESIS LA PRUEBA DE CHI-CUADRADA

- Ho: Para cada grupo de clientes las proporciones de


ventas son homogéneas entre los cuatro productos.

- Ha: Para cuando menos un grupo de cliente, las


proporciones de ventas en los cuatro productos no son
las mismas.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

ESTADÍSTICA PARÁMETRICA Y NO
PARAMÉTRICA:

Además, las "pruebas paramétricas" que hemos visto


(sobre la media o sobre la varianza) requerían que la
variable se midiera (como mínimo) en escalas de intervalo -
-recuerda que precisaban el cálculo de medias o varianzas.
Ello hace que no sea posible efectuarlas cuando la escala
sea ordinal.
Por su parte, las pruebas no paramétricas pueden ser
efectuadas cuando el nivel de medida sea ordinal, así como
las condiciones de los supuestos estadísticos (v.g.,
homogeneidad de varianzas, normalidad de las
puntuaciones) son menos estrictas.
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

ESTADÍSTICA PARÁMETRICA Y NO
PARAMÉTRICA:
Hipótesis Paramétrica:

H0: µ1 ≈ µ2 ≈…≈ µk,


Ha: al menos una media difiere de las
demás

Hipótesis No Paramétrica:

H0: Me1 ≈ Me2 ≈…≈ Mek,


Ha: al menos una mediana difiere de las
demás

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

ESTADÍSTICA NO PARAMÉTRICA GRUPOS


INDEPENDIENTES:

Veremos CUATRO pruebas no paramétricas, que en buena


medida son paralelas a las vistas en temas anteriores (pero
en versión no paramétrica):

Caso de dos grupos independientes


Prueba de Mann-Whitney-----(paralela a la t de grupos
independientes)

Casi de "a" grupos independientes


Prueba de Kruskal-Wallis-----(paralela a DCA, unifactorial
entre-sujetos)
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

PRUEBA DE U. DE MANN-WHITNEY:

QUE ES : CUANDO SE USA? :

➢ Las observaciones de ambos grupos


➢ Prueba no paramétrica de
son independientes.
comparación de dos muestras
independientes.
➢ Las observaciones son variables
ordinales o continuas.
➢ Equivalente no paramétrico de la
prueba t de Student.
➢ Recomendable pero no
imprescindible que las poblaciones
comparadas tengan el mismo
tamaño.

➢ Se utiliza para comparar dos


grupos de rangos (medianas) y
determinar que la diferencia no se
deba al azar.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

PRUEBA DE KRUSKAL WALLIS:

Es una prueba no paramétrica de comparación de tres o


más grupos independientes, debe cumplir las siguientes
características:

•Es libre de curva, no necesita una distribución específica.

•Se utiliza para comparar más de dos grupos de


rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadísticamente
significativa).
Juárez

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejemplo. Un nuevo gerente de Avon debe comparar el tiempo


que les toma a tres clientes pagar los envíos del nuevo producto
New-Face Cream, ofrecido por la empresa. Se seleccionan
aleatoriamente varias compras de cada cliente, junto con el
número de días que cada uno se tomó en liquidar su cuenta. Los
resultados aparecen en la siguiente Tabla.
Compra Cliente 1 Cliente 2 Cliente 3
1 28 26 37
2 19 20 28
3 13 11 26
4 28 14 35
5 29 22 31
6 22 21
7 21

H0: Todas las Me´s poblaciones son similares.


H1: Al menos una Me poblacional es diferente.
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

12  Ri2 
Estadístico Kruskal- Wallis: K =    − 3( n + 1 )
n( n + 1 )  ni 
donde ni es el número de observaciones en la i-ésima muestra
n es el número total de observaciones en todas las muestras.
Ri es la suma de los rangos de la i-ésima muestra.
Rangos en la prueba de Kruskall-Wallis son los siguientes:

Días Rango Días Rango Días Rango


11 1
13 2
14 3
19 4
20 5
21 6.5 21 6.5
22 8.5 22 8.5
26 10.5 26 10.5
28 13
28 13 28 13
29 15
31 16
35 17
37 18
ƩR1=62 ƩR2=34.5 ƩR3=74.5

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

 (62)2 (34.5 )2 (74.5 )2 


 − 3(18 + 1) = 8.18
12
K=  + +
18( 18 + 1 )  7 6 5 

Enseguida comparamos K con un valor crítico. La distribución de K es


aproximada por una distribución chi-cuadrada con k – 1 grados de
libertad. Si K excede el valor crítico de chi-cuadrada, se rechaza la
hipótesis nula. Con alfa de 5% en la prueba de Avon, el valor crítico de
chi-cuadrado dados 3-1 = 2 grados de libertad es

.
 2
0.05 , 2 = 5.99 Regla de decisión: No rechazar si k< 5.99. rechazar si k > 5.99

Como k = 8.18 > 5.99, se rechaza la hipótesis nula de que no hay


diferencia en el tiempo que toma a tres clientes pagar sus cuentas con
Avon.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

En el caso de que se rechace la hipótesis nula, el siguiente paso lógico


es determinar cuáles diferencias son estadísticamente significativas y
cuales se deben a un error de muestreo. Esto involucra una comparación
de todos los pares posibles. Los pasos
para la comparación son los siguientes:

1.Calcular el rango promedio para cada muestra.


62
R1 = = 8.86
7
34.5
R2 = = 5.75
6
74.5
R3 = = 14.9
5
2. Calcular diferencias absolutas
| R1 − R2 |=| 8.86 − 5.75 |= 3.11
| R1 − R3 |=| 8.86 − 14.9 |= 6.04
| R2 − R3 |=| 5.75 − 14.9 |= 9.15
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

 n(n − 1)   1 1
C k =  2 ,k − 1   + 
 12   ni n j 

 (18 )(19)   1 1 
= 5.99    +  = 7.27 Comparacion del cliente 1 con el 2
 12  7 6 
 (18 )(19)   1 1 
C k = 5.99    +  = 7.65 Comparacion del cliente 1 con el 3
 12  7 5 
 (18 )(19)   1 1 
C k = 5.99    6 + 5  = 7.91 Comparacion del cliente 2 con el 3
 12  

4. Comparación de las diferencias contra los valores críticos

| R1 − R2 |=| 8.86 − 5.75 |= 3.11  7.27 Por tanto 1 y 2 no difieren


| R1 − R3 |=| 8.86 − 14.9 |= 6.04  7.65 Por tanto 1 y 3 no difieren
| R2 − R3 |=| 5.75 − 14.9 |= 9.15  7.91 y entre 2 y 3 si existe diferencia

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

El nivel de significación α:0.05 o 5%, es mayor al p-value=0,016,


existe suficiente evidencia estadística para rechazar la H0, por lo
tanto las medianas poblaciones no son similares.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

PRUEBA DE HOMOGENEIDAD DE VARIANZA


TEST DE LEVENE
En estadística, la prueba de Levene es una prueba
estadística inferencial utilizada para evaluar la igualdad de
las varianzas para una variable calculada para dos o más
grupos. Algunos procedimientos estadísticos comunes
asumen que las varianzas de las poblaciones de las que se
extraen diferentes muestras son iguales. La prueba de
Levene evalúa este supuesto. Se pone a prueba la
hipótesis nula de que las varianzas poblacionales son
iguales (llamado homogeneidad de varianza
ú homocedasticidad).

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Compra Cliente 1 Cliente 2 Cliente 3


1 28 26 37
2 19 20 28
3 13 11 26
4 28 14 35
5 29 22 31
6 22 21
7 21

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Conclusión: Con un valor de p-value 0.873 > 0.05 (nivel de


significación) se acepta la hipótesis nula, por lo tanto existe
homogeneidad de varianzas .

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejercicio N°3: Realice la test de normalidad y la prueba de


Kruskal Wallis. Con Los resultados (incremento de peso)
aparecen en la siguiente Tabla.
Mezcla 1 Mezcla 2 Mezcla 3 Mezcla 4
3 3 10 8
6 4 8 10
9 8 9 11
5 9 8 8
6 7 7 8

H0: Todas las Me´s de incrementos en el peso son similares


Ha: No todas las Me´s de incrementos en el peso son similares

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

H0: Me1 ≈ Me2 ≈ Me3 ≈ Me4, las medianas poblacionales son


similares
Ha: Al menos una Mei poblacional es diferente a las demás

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Conclusión: Con un valor de p-value 0.042 < 0.05 (nivel


de significación) se rechaza la hipótesis nula, por lo tanto
en la mezcla 4 los datos no se distribuyen de modo
normal, podemos usar una test no paramétrica.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Conclusión: Con un valor de p-value 0.540 > 0.05 (nivel de


significación) se acepta la hipótesis nula, por lo tanto la
variabilidad en las cuatro mezcla son homogéneas .

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Conclusión: Con un valor de p-value 0.080 > 0.05 (nivel de


significación) se acepta la hipótesis nula, por lo tanto las
cuatro medianas poblacionales son homogéneas .

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

ESTADÍSTICA NO PARAMÉTRICA GRUPOS


RELACIONADOS:

Veremos CUATRO pruebas no paramétricas, que en buena


medida son paralelas a las vistas en temas anteriores (pero
en versión no paramétrica):

Caso de dos grupos relacionados


Prueba de Wilcoxon-----(paralela a la t de grupos
relacionados)

Caso de "a" grupos relacionados


Prueba de Friedman----(paralela a la F unifactorial intra-
sujetos)

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

PRUEBA DE WILCOXON
El contraste de Wilcoxon es la técnica no paramétrica
paralela a la T de Student para muestras relacionadas.
Al Igual que en esa prueba, disponemos de n parejas de
valores que podemos considerar como una variable
medida en cada sujeto en dos momentos diferentes
(Antes y Después) o cada sujeto califique a dos marcas.

Se presentará a continuación el proceso de contraste


para muestras por aproximación normal.

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

PRUEBA DE FRIEDMAN

Es una prueba no paramétrica de comparación de tres o


más grupos o muestras relacionadas, debe cumplir las
siguientes características:

•Es libre de curva, no necesita una distribución específica.

•Se utiliza para comparar más de dos grupos de


rangos (medianas) y determinar que la diferencia no se
deba al azar (que la diferencia sea estadísticamente
significativa).
Juárez

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

PRUEBA DE FRIEDMAN

Campus Virtual campusvirtual@inei.gob.pe


Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejemplo: Un microbiólogo está interesado en conocer el efecto de


cuatro tipos de medicamentos sobre VIH, contando con 4 sujetos
voluntarios con dicha enfermedad. Se les aplicó los cuatro tipos de
medicamentos. Cada medicamento se administró por 5 días,
posterior a cada administración, se realizó el conteo de las células
CD4. El microbiólogo, después de cada conteo, dejo de administrar el
medicamento para que los sujetos regresaran al estado inicial, y así
poder aplicar el siguiente medicamento.
Medicamento Medicamento Medicamento Medicamento
A B C D
Sujeto A 244 300 400 550
Sujeto B 250 350 450 560
Sujeto C 255 325 468 600
Sujeto D 260 299 450 650

Ho: Los cuatro medicamentos no producen efectos diferenciales


sobre VIH.
Hp: Los cuatro medicamentos producen efectos diferenciales sobre el
VIH.
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Conclusión: Con un valor de p-


value 0.007 < 0.05 (nivel de
significación) se rechaza la
hipótesis nula, entonces los cuatro
medicamentos producen efectos
diferenciales .
54
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

CORRELACIÓN ENTRE VARIABLES

El análisis de correlación es un grupo de técnicas


estadísticas que permiten medir la intensidad de la relación
que puede existir entre dos variables.

Ejemplos:
• Relación entre los datos de peso y talla de estudiantes
de educación secundaria.

• Relación entre el tiempo de estudio y calidad de


profesional.

55
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

CORRELACIÓN ENTRE VARIABLES

La correlación puede ser:

• De al menos dos variables (dependiente-independiente).

• o de una variable dependiente y dos o más variables


independientes
( correlación múltiple).

56
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN
• El coeficiente de correlación es un valor cuantitativo
de la relación entre dos o más variables.
• El coeficiente de correlación puede variar desde -1
hasta 1.
• La correlación de proporcionalidad directa o positiva
se establece con los valores +1 y de proporcionalidad
inversa o negativa con -1.
• No existe relación entre las variables cuando el
coeficiente es cero (0).

-1 Relación negativa 0 Relación positiva 1


No existe relación

57
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN DE PEARSON

58
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

¿Existe relación entre la Masa corporal y la fuerza en los


alumnos universitarios?. Si existe, ¿Qué tipo de
correlación?

Alumno Masa Corporal(Kg) Fuerza(Kp)


Carmen 60 100
Pedro 65 105
Juan 70 102
Luís 75 135
Ana 80 95
Carlos 85 125
Elena 90 140
Rosa 95 130
Luís 100 148 59
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

FÓRMULA DE COEFIENTE DE CORRELACIÓN DE PEARSON


Masa Corporal (Kg) Fuerza (Kp)

60
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

UNA VARIABLE INDEPENDIENTE Y DOS DEPENDIENTES

Relación positiva

Relación negativa

61
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN = ρ-PEARSON

62
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática
COEFICIENTE DE CORRELACIÓN = ρ

63
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN = ρ

Conclusión: Con un valor de p-value 0.015 < 0.05


(nivel de significación) existe suficiente evidencia
estadística para rechazar la hipótesis nula,
entonces el coeficiente de correlación es diferente
de cero.
64
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejemplo: Estime el coeficiente de correlación de Pearson entre


las dos variables Ingreso y Consumo. Considere un nivel de
significación de 0.05.

Ingreso Consumo
97 55
58 63
69 54
47 37
58 45
38 38
91 71
67 52
68 53
47 37
48 37

65
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ingreso Consumo

Conclusión: Con un valor de p-value 0.004


< 0.05 (nivel de significación) existe
suficiente evidencia estadística para
rechazar la hipótesis nula, entonces el
coeficiente de correlación es diferente de
cero. 66
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Ejemplo: Estime el coeficiente de correlación de Pearson entre


las dos variables Tiempo de estudio y la calificación del
profesional. Considere un nivel de significación de 0.05.

Tiempo Nota
21 67
18 58
15 59
17 54
18 58
25 80
18 14
4 15
6 19
5 21

67
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Nota Tiempo

Conclusión: Con un valor de p-value 0.005


< 0.05 (nivel de significación) existe
suficiente evidencia estadística para
rechazar la hipótesis nula, entonces el
coeficiente de correlación es diferente de
cero. 68
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN DE ρ -SPEARMAN


El coeficiente de correlación de Pearson es muy sensible a
los valores atípicos. Por lo que es preciso determinar una
medida de asociación más firme. Una forma de hacerlo
consiste en ordenar los dos conjuntos de resultados X y Y
por separado y calcular el coeficiente de correlación por
rangos de Spearman. Puede clasificarse entre los métodos
no paramétricos.

Ejemplos:
• Relación entre los datos de peso y talla de estudiantes
de educación secundaria.

• Relación entre el tiempo de estudio y calificación del


profesional. 69
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN DE ρ -SPEARMAN

70
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

COEFICIENTE DE CORRELACIÓN DE ρ -SPEARMAN

71
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática
EJEMPLO N°01
País Porcentaje de Tasa de
En la tabla se encuentran ordenadas, niños mortalidad
inmunizados (%)
porcentajes de niños de 20 países Etiopía 13 208
inmunizados contra DTT (la vacuna triple Camboya 32 184
bacteriana, contiene los toxoides diftéricos Senegal 47 145
Grecia 54 9
“contra la Difteria” y tetánico “contra el
Brasil 69 65
tétanos”, además se tiene sus respectivas Federación Rusa 73 32
tasas de mortalidad, halle el coeficiente de Turquía 76 87
correlación de spearman. α=0,05 Bolivia 77 118
Canadá 85 8
Japón 87 6
India 89 124
Egipto 89 55
Reino Unido 90 9
México 91 33
China 94 43
Francia 95 9
Finlandia 95 7
Italia 95 10
Polonia 98 16
República Checa 99 12

72
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

Porcentaje de Inmunizaciones Tasa de Mortalidad

Conclusión: Con un valor de p-


value 0.013 < 0.05 se rechaza la
hipótesis nula, por lo tanto el
coeficiente de correlación es
diferente de cero.
73
Campus Virtual campusvirtual@inei.gob.pe
Instituto Nacional de Estadística e Informática - Escuela Nacional de Estadística e Informática

GRACIAS!!
PROF: JULIO S. MORENO RUIZ
E-MAIL: julio.moreno@inei.gob.pe, magne978@gmail.com
INSTITUTO NACIONAL DE ESTADISTICA E INFORMÁTICA

Campus Virtual campusvirtual@inei.gob.pe

Das könnte Ihnen auch gefallen