Sie sind auf Seite 1von 20

Estadística no paramétrica

Las pruebas paramétricas tienen requisitos acerca de la naturaleza o forma de


las poblaciones implicadas; Las pruebas no paramétricas no requieren que las
muestras provengan de poblaciones con distribuciones normales o cualquier
otro tipo particular, en consecuencia, las pruebas de hipótesis no paramétricas
suelen llamarse pruebas de distribución libre.
Entre los numerosos métodos no paramétricos sobresalen:

1. Pruebas de 𝜒 2
2. Prueba de signo; Donde solo se toman los signos positivos y negativos
de las diferencias en las observaciones apareadas.
3. Método de correlación por Rangos, cuando los datos o información
obtenidas mediante muestras se clasifican de acuerdo al rango
obtenido.
4. Prueba de T de Wilcoxon, Requiere que los datos estén dados en escala
ordinal y que las dos muestras se relacionen por pares o parejas
5. Prueba de U de Mann-Whitney, usada para determinar si dos muestras
han sido extraídas de una misma población, Utilizando la suma de
rangos
6. Prueba de H de Kruskal-Wallis, Utilizada para probar si tres o más
muestras independientes han sido extraídas de poblaciones con la
misma distribución

𝟏. 𝑷𝒓𝒖𝒆𝒃𝒂𝒔 𝒅𝒆 𝝌𝟐
Es la suma de las fracciones que tienen por numerador el cuadrado de
las diferencias entre las frecuencias reales u observadas y las pruebas
esperadas o teóricas y por denominador la frecuencia esperada.

2
(𝑛𝑖 − 𝑛𝑖∗ )2 (𝐹𝑖 − 𝐹𝑖∗ )2
𝜒 =∑ =∑
𝑛𝑖∗ 𝐹𝑖∗
𝐹𝑜 = 𝑛𝑖 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑎 (𝑟𝑒𝑎𝑙)
𝐹𝑒 = 𝑛𝑖∗ 𝑓𝑟𝑒𝑐𝑢𝑒𝑛𝑐𝑖𝑎 𝑒𝑠𝑝𝑒𝑟𝑎𝑑𝑎 (𝑡𝑒𝑜𝑟𝑖𝑐𝑎)
Ejemplo 1. Supongamos que lanzamos un dado 60 veces, sabemos que
las frecuencias de este proceso son: 10 veces cada cara y la frecuencia
reales son los resultados del lanzamiento, con base de un nivel de
significancia del 5% Permite suponer que el dado no es perfecto
(Ni-
Caras Ni Ni* (Ni-Ni*) (Ni-Ni*)^2 Ni*)^2/Ni*
1 7 10 -3 9 0.9
2 14 10 4 16 1.6
3 8 10 -2 4 0.4
4 5 10 -5 25 2.5
5 16 10 6 36 3.6
6 10 10 0 0 0
El valor (de chi) observado es: 9

1. Planteamiento:
𝐻0: 𝑛𝑖 = 𝑛𝑖∗
𝐻1: 𝑛𝑖 ≠ 𝑛𝑖2
2. 𝛼 = 0.05
2
(𝑛𝑖 −𝑛𝑖∗ )
3. 𝜒 2 = ∑ =9
𝑛𝑖∗
4. 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝑔𝑙 = 𝑛 − 1
𝑔𝑙 = 5
2
𝜒0.05 = 11.07
2
𝜒 2 < 𝜒0.05
9 < 11.07
𝜒 2 ∈ 𝑅𝐴; 𝑆𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 𝑛𝑜 ℎ𝑎𝑦 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑛𝑐𝑖𝑎

Tablas de contingencia:
El grado de libertad:
𝑣 = (𝑘 − 1)(𝑗 − 1)
𝑘 → 𝐶𝑜𝑙𝑢𝑚𝑛𝑎𝑠 | 𝑗 → 𝐹𝑖𝑙𝑎𝑠
Ejemplo. Dos grupos A y B. Cada uno de 100 individuos padecen
una enfermedad de insomnio se administra un suero solo al grupo
A; con un nivel de significancia de 5%

𝑵𝒊 𝑵𝒊∗ (𝑵𝒊 − 𝑵𝒊∗ ) (𝑵𝒊 − 𝑵𝒊∗ )^𝟐 (𝑵𝒊 − 𝑵𝒊∗ )^𝟐/𝑵𝒊∗


75 70 5 25 0.35714286
65 70 -5 25 0.35714286
25 30 -5 25 0.83333333
35 30 5 25 0.83333333
El valor (de chi) observado es: 2.38095238
1. Planteamiento:
𝐻0: 𝐿𝑎 𝑟𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖ó𝑛 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒𝑙 𝑒𝑚𝑝𝑙𝑒𝑜 𝑑𝑒𝑙 𝑠𝑢𝑒𝑟𝑜
𝐻1: 𝐿𝑎 𝑟𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛 𝑦 𝑒𝑙 𝑒𝑚𝑝𝑙𝑒𝑜 𝑑𝑒𝑙 𝑠𝑢𝑒𝑟𝑜 𝑒𝑠𝑡á𝑛 𝑟𝑒𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑑𝑜𝑠
2. 𝛼 = 0.05
2
2 (𝑛𝑖 −𝑛𝑖∗ )
3. 𝜒 = ∑ = 2.3809
𝑛𝑖∗
4. 𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑
𝑔𝑙 = (𝑘 − 1)(𝑗 − 1) = (2 − 1)(2 − 1)
𝑔𝑙 = 1
2
𝜒0.05 = 3.8415
2 2
𝜒 < 𝜒0.05
2.3809 < 3.8415
𝜒 2 ∈ 𝑅𝐴; 𝑆𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎, 𝑒𝑠 𝑑𝑒𝑐𝑖𝑟 𝑙𝑎 𝑟𝑒𝑐𝑢𝑝𝑒𝑟𝑎𝑐𝑖𝑜𝑛 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑑𝑒𝑙 𝑠𝑢𝑒𝑟𝑜

Pruebas de homogeneidad y de independencia

La prueba de homogeneidad se utiliza para determinar si dos o más muestras aleatorias


provienen de la misma población o de poblaciones diferentes, en cambio en la prueba de
independencia es aplicada para establecer si hay alguna relación en cuanto a los criterios de
clasificación de la información.

El cálculo de 𝜒 2 es igual para las dos pruebas y se diferencia en cuanto a la manera de cómo se
recolectan los datos y se interpretan los resultados

En la homogeneidad la hipótesis nula se dice que son iguales (todos los datos son homogéneos)
En la independencia la hipótesis nula dice que son distintas (no están relacionadas)

Ejemplo. Un estudio de accidentes automovilísticos seleccionados al azar y conductores que


usan el teléfono celular mientras conducen son dados a continuación. Con el nivel del 5% de
significancia pruebe la afirmación de que la ocurrencia de accidentes es independiente del uso
de teléfonos celulares con base a estos resultados ¿Cree usted que el uso de teléfonos celulares
afecte a la seguridad al conducir?

Tabla de contingencia
Accidente Sin accidente Total
Usa celular 23 286 309
Sin celular 46 407 453
Total 69 693 762
2
(𝑛𝑖 − 𝑛𝑖∗ )2
𝜒 =∑
𝑛𝑖∗
(𝑇𝑂𝑇𝐴𝐿 𝐶𝑂𝐿𝑈𝑀𝑁𝐴)(𝑇𝑂𝑇𝐴𝐿 𝐹𝐼𝐿𝐴)
𝑛𝑖∗ =
(𝑇𝑂𝑇𝐴𝐿)


69 ∗ 309
𝑛1,1 = = 28
762

693 ∗ 309
𝑛1,2 = = 281
762


453 ∗ 69
𝑛2,1 = = 41
762


693 ∗ 453
𝑛2,2 = = 412
762
Tabla de contingencia
Accidente Sin accidente
Usa celular 28 281
Sin celular 41 412

1. Planteamiento
𝐻0 : 𝐸𝑙 𝑢𝑠𝑜 𝑑𝑒 𝑡𝑒𝑙𝑒𝑓𝑜𝑛𝑜𝑠 𝑐𝑒𝑙𝑢𝑙𝑎𝑟𝑒𝑠 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 𝑎 𝑙𝑎 𝑠𝑒𝑔𝑢𝑟𝑖𝑑𝑎𝑑 𝑎𝑙 𝑐𝑜𝑛𝑑𝑢𝑐𝑖𝑟
𝐻1 : 𝐸𝑙 𝑢𝑠𝑜 𝑑𝑒 𝑡𝑒𝑙𝑒𝑓𝑜𝑛𝑜𝑠 𝑐𝑒𝑙𝑢𝑙𝑎𝑟𝑒𝑠 𝑒𝑠 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 𝑎 𝑙𝑎 𝑠𝑒𝑔𝑢𝑟𝑖𝑑𝑎𝑑 𝑎𝑙 𝑐𝑜𝑛𝑑𝑢𝑐𝑖𝑟
2. 𝛼 = 0.05
2
(𝑛𝑖 −𝑛𝑖∗ ) (23−28)2 (286−281)2 (46−41)2 (407−412)2
3. 𝜒 2 = ∑ 𝑛𝑖∗
= 28
+ 281
+ 41
+ 412
= 1.65 𝜒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
4. Región crítica
𝑉 = (2 − 1)(2 − 1) = 1
𝜒 2 0.05 = 3.841
𝜒 20.05 ∈ 𝑅𝐴 → 𝐴𝑐𝑝𝑒𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻0, 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑑𝑒𝑐𝑖𝑟 𝑞𝑢𝑒 𝑒𝑙 𝑢𝑠𝑜 𝑑𝑒 𝑐𝑒𝑙𝑢𝑙𝑎𝑟 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑎𝑙 𝑢𝑠𝑜 𝑑𝑒 𝑐𝑒𝑙𝑢𝑙𝑎𝑟.
Ejemplo 2. Una muestra aleatoria de 200 hombres, todos jubilados, se clasifican de acuerdo
con la educación y el número de hijos. Probar la hipótesis con un nivel de significación del 5%
de que el tamaño familiar es independiente del nivel de educación del padre.

0-1 2-3 más de 3 Total


Elemental 14 37 32 83
Secundaria 19 42 17 78
Universitaria 12 17 10 39
Total 45 96 59 200

Tabla de contingencia:

0-1 2-3 más de 3


Elemental 19 40 24
Secundaria 18 37 23
Universitaria 9 19 12

Calculo de chi observado


1.31578947 0.225 2.66666667
0.05555556 0.67567568 1.56521739
1 0.21052632 0.33333333
Chi observado 8.047764412

1. Planteamiento
𝐻0 : 𝐿𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑒𝑠 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 𝑎 𝑙𝑎 𝑒𝑑𝑢𝑐𝑎𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑝𝑎𝑑𝑟𝑒
𝐻1 : 𝐿𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑒𝑠 𝑑𝑒𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒𝑠 𝑎 𝑙𝑎 𝑒𝑑𝑢𝑐𝑎𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑝𝑎𝑑𝑟𝑒
2. 𝛼 = 0.05
2
(𝑛𝑖 −𝑛𝑖∗ )
3. 𝜒 2 = ∑ 𝑛𝑖∗
= 8.04776 ≅ 8.05 𝜒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
4. Región crítica
𝑉 = (3 − 1)(3 − 1) = 4
𝜒 2 0.05 = 9.4877
𝜒 2 0.05 ∈ 𝑅𝐴 → 𝐴𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎,
𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑑𝑒𝑐𝑖𝑟 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑞𝑢𝑒 𝑙𝑎 𝑐𝑎𝑛𝑡𝑖𝑑𝑎𝑑 𝑑𝑒 ℎ𝑖𝑗𝑜𝑠 𝑒𝑠 𝑖𝑛𝑑𝑝𝑒𝑛𝑑𝑖𝑒𝑛𝑡𝑒 𝑎 𝑙𝑎 𝑒𝑑𝑢𝑐𝑎𝑐𝑖𝑜𝑛 𝑑𝑒𝑙 𝑝𝑙𝑎𝑑𝑟𝑒

Ejemplo 3. Con referencia a los datos de la tabla dada a continuación, pruebe la hipótesis de que las
opiniones con respecto a la ley del aborto propuesta son las mismas dentro de cada afiliación política.

Ley de
aborto Demócratas Republicanos Independientes Total
A favor 82 70 62 214
En contra 93 62 67 222
Indeciso 25 18 21 64
Total 200 150 150 500

Tabla de contingencia

Ley de
aborto Demócratas Republicanos Independientes
A favor 86 64 64
En contra 89 67 67
Indeciso 26 19 19
Calculo de chi observado
0.18604651 0.5625 0.0625
0.17977528 0.37313433 0
0.03846154 0.05263158 0.21052632
Chi observado 1.665575554
1. Planteamiento
𝐻0 : 𝐿𝑎𝑠 𝑜𝑝𝑛𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑝𝑎𝑟𝑡𝑖𝑑𝑜 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑜 𝑒𝑠 𝑙𝑎 𝑚𝑖𝑠𝑚𝑎
𝐻1 : 𝐿𝑎𝑠 𝑜𝑝𝑛𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑐𝑎𝑑𝑎 𝑝𝑎𝑟𝑡𝑖𝑑𝑜 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑜 𝑛𝑜 𝑒𝑠 𝑙𝑎 𝑚𝑖𝑠𝑚𝑎
2. 𝛼 = 0.05
2
(𝑛𝑖 −𝑛𝑖∗ )
3. 𝜒 2 = ∑ 𝑛𝑖∗
= 1.6665 ≅ 1.67 𝜒 𝑜𝑏𝑠𝑒𝑟𝑣𝑎𝑑𝑜
4. Región crítica
𝑉 = (3 − 1)(3 − 1) = 4
𝜒 2 0.05 = 9.4877
𝜒 2 0.05 ∈ 𝑅𝐴 → 𝐴𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 𝐻𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎,
𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑑𝑒𝑐𝑖𝑟 𝑒𝑛𝑡𝑜𝑛𝑐𝑒𝑠 𝑞𝑢𝑒 𝑙𝑎𝑠 𝑑𝑒𝑠𝑖𝑐𝑖𝑜𝑛𝑒𝑠 𝑑𝑒𝑛𝑡𝑟𝑜 𝑑𝑒 𝑢𝑛 𝑝𝑎𝑟𝑡𝑖𝑑𝑜 𝑝𝑜𝑙𝑖𝑡𝑖𝑐𝑜 𝑠𝑜𝑛 𝑙𝑎𝑠 𝑚𝑖𝑠𝑚𝑎𝑠

Análisis de varianza

Definición 1: El análisis de varianza (ANOVA) es un método de prueba de igualdad de tres o más media
poblacionales por medio del análisis de las varianzas iguales.
Definición 2: Un tratamiento (o factor) es una propiedad o característica que nos permite distinguir entre
si a las distintas poblaciones.

El análisis de varianza para un diseño completamente aleatorizado: Supongamos que se desea comparar
′𝑘 ′ medias poblacionales 𝜇1 , 𝜇2 , … , 𝜇𝑘 con base en muestras aleatorias independientes de tamaño
𝑛1 , 𝑛2 , … , 𝑛𝑘 de poblaciones normales con una varianza común

División de la varianza total en un experimento: La variación total del experimento, que es medida por
una cantidad llamada suma total de cuadrados (SCTotal)
2
2 2
(∑ 𝑥𝑖𝑗 )
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑(𝑥𝑖,𝑗 − 𝑥̅ ) = ∑ 𝑥𝑖𝑗 −
𝑛
2
𝑥𝑖𝑗 (∑ 𝑥𝑖𝑗 )
Donde , es i-esima medición. 𝑥̅ es la media de la muestra y 𝐶𝑀 = es la corrección de la media
𝑥 𝑛

Suma de cuadrados para tratamientos (SCTratamiento) mide la variación entre las ′𝑘′ medias muestrales
𝑇𝑖2
𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = ∑ 𝑛𝑖 (𝑥̅𝑖 − 𝑥̅ )2 = ∑ − 𝐶𝑀
𝑛𝑖
Donde 𝑇𝑖 es el total de observaciones para tratamiento 𝑖

Suma de cuadrados para el error (SCE) se usa para medir la variación agrupada dentro de las ′𝑘′ muestras
𝑆𝐶𝐸 = (𝑛1 − 1)𝑆12 + (𝑛2 − 1)𝑆22 + ⋯ + (𝑛𝑘 − 1)𝑆𝑘2

𝑺𝑪𝑻𝒐𝒕𝒂𝒍 = 𝑺𝑪𝑻𝒓𝒂𝒕𝒂𝒎𝒊𝒆𝒏𝒕𝒐 + 𝑺𝑪𝑬

Respecto a los grados de libertad:


𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 𝐺𝐿𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 𝑛 − 1
𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = 𝐺𝐿𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = 𝑘 − 1
𝑆𝐶𝐸 = 𝐺𝐿𝑆𝐶𝐸 = (𝑛1 − 1) + (𝑛2 − 1) + ⋯ + (𝑛𝑘 − 1) = 𝑛 − 𝑘
𝐺𝐿(𝑇𝑜𝑡𝑎𝑙) = 𝐺𝐿(𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜) + 𝐺𝐿(𝐸𝑟𝑟𝑜𝑟)

𝐾 = 𝑁𝑈𝑀𝐸𝑅𝑂 𝐷𝐸 𝑀𝑈𝐸𝑆𝑇𝑅𝐴𝑆
Fuente GL SC CM 𝑭𝒐𝒃𝒔 𝑭𝜶,𝒌−𝟏,𝒏−𝒌
𝐶𝑀𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
𝑆𝐶𝑇𝑟
Tratamiento 𝑘−1 SCTratamiento =
𝑘−1
𝑆𝐶𝐸 𝐶𝑀𝑇 Usar tablas de
Error 𝑛−𝑘 SCError 𝐶𝑀𝐸 = 𝐹𝑎𝑏𝑠 =
𝑛−𝑘 𝐶𝑀𝐸 distribución
Total 𝑛−1 SCTotal fisher

𝑆𝐶: 𝑆𝑢𝑚𝑎 𝑑𝑒 𝑐𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠


𝐶𝑀: 𝐶𝑢𝑎𝑑𝑟𝑎𝑑𝑜𝑠 𝑚𝑒𝑑𝑖𝑎𝑠

Prueba 𝑭 para comparar 𝑲 medias poblacionales


1. Planteamiento:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : 𝑈𝑛𝑜 𝑜 𝑚á𝑠 𝑝𝑎𝑟𝑒𝑠 𝑑𝑒 𝑚𝑒𝑑𝑖𝑎𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑑𝑖𝑓𝑖𝑒𝑟𝑒𝑛
2. Estadístico de prueba
𝐶𝑀𝑇𝑟
𝐹𝑜𝑏𝑠 =
𝐶𝑀𝐸
3. Región de rechazo
Rechazar si 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹𝛼

Ejemplo 1. Es un experimento para determinar el efecto de la nutrición en intervalos de atención de


estudiantes de escuelas elementales, un grupo de 15 estudiantes se asignaron al azar, a cada uno de los
tres platos de comida: No desayuno, desayuno ligero, desayuno completo. Sus intervalos de atención (En
minutos) se registran dentro de un periodo de lectura por la mañana y se muestran en la tabla. Construya
el análisis de tabla de varianza para este experimento.

No Desayuno Desayuno
desayuna ligero completo
8 14 10
7 16 12
9 12 16
13 17 15
10 11 12
Suma total 47 70 65

𝑆𝑢𝑚𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑠𝑢𝑚𝑎𝑠 = 182

2
2
(∑ 𝑥𝑖𝑗 ) 1822
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑥𝑖𝑗 − = 2338 − = 129.73
𝑛 15
2
𝑇𝑖 472 + 702 + 652 1822
𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = ∑ − 𝐶𝑀 = − = 58.53
𝑛𝑖 5 15

𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 + 𝑆𝐶𝐸𝑟𝑟𝑜𝑟


𝑆𝐶𝐸𝑟𝑟𝑜𝑟 = 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 − 𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
𝑆𝐶𝐸𝑟𝑟𝑜𝑟 = 71.2
Fuente GL SC CM 𝑭𝒐𝒃𝒔 𝑭𝜶,𝒌−𝟏,𝒏−𝒌
𝑆𝐶𝑇𝑟 58.53
Tratamiento 𝑘−1=3−1=2 58.53 𝐶𝑀𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = = = 29.265
𝑘−1 2 Usar tablas
𝑆𝐶𝐸 71.2 𝐶𝑀𝑇 de
Error 𝑛 − 𝑘 = 15 − 3 = 12 71.2 𝐶𝑀𝐸 = = = 5.47 𝐹𝑎𝑏𝑠 = = 4.93
𝑛−𝑘 13 𝐶𝑀𝐸 distribución
Total 𝑛−1 SCTotal fisher

Ejemplo 2. Del ejemplo anterior dan suficiente evidencia para indicar una diferencia en el promedio de
intervalos de atención, dependiendo del tipo de desayuno que tomado por los estudiantes. Usar 𝛼 = 0.01

1. Planteamiento:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : 𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜 𝑑𝑒 𝑎𝑡𝑒𝑛𝑐𝑖ó𝑛 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒 𝑝𝑎𝑟𝑎 𝑎𝑙 𝑚𝑒𝑛𝑜𝑠 𝑢𝑛𝑜 𝑑𝑒 𝑙𝑜𝑠 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
2. Estadístico de prueba
𝐶𝑀𝑇𝑟
𝐹𝑜𝑏𝑠 = = 4.93
𝐶𝑀𝐸
3. Región de rechazo
𝐹0.01,2,12 = 6.93
Rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹𝛼
4.93 (𝐹𝑜𝑏𝑠 ) < 6.93(𝐹𝛼 )
𝐴𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.
𝐸𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑑𝑒𝑐𝑖𝑟 𝑞𝑢𝑒 𝑛𝑜 ℎ𝑎𝑦 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑐𝑖𝑎 𝑑𝑒 𝑙𝑜𝑠 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑜𝑠 𝑠𝑒𝑔ú𝑛 𝑒𝑙 𝑑𝑒𝑠𝑎𝑦𝑢𝑛𝑜.
Ejercicio. Se someten a estudio tres marcas de bateras se prueba
cinco bateras de cada marca con los resultados siguientes:
Semanas de vida:

a) Elabore una tabla ANOVA y verifique si la vida media de estas tres marcas de baterías es diferente.
Con 𝛼 = 0.05
b) Toshiba Toyocar Yihuasa
100 76 108
96 80 100
92 75 96
92 84 98
96 82 100
Suma total 476 397 502 1375
2
2
(∑ 𝑥𝑖𝑗 )
𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = ∑ 𝑥𝑖𝑗 − = 1383.33
𝑛
2
𝑇𝑖
𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = ∑ − 𝐶𝑀 = 1196.13
𝑛𝑖

𝑆𝐶𝑇𝑜𝑡𝑎𝑙 = 𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 + 𝑆𝐶𝐸𝑟𝑟𝑜𝑟


𝑆𝐶𝐸𝑟𝑟𝑜𝑟 = 𝑆𝐶𝑇𝑜𝑡𝑎𝑙 − 𝑆𝐶𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
𝑆𝐶𝐸𝑟𝑟𝑜𝑟 = 187.2

Fuente GL SC CM 𝑭𝒐𝒃𝒔 𝑭𝟎.𝟎𝟓,𝟐,𝟏𝟐


𝑆𝐶𝑇𝑟
Tratamiento 𝑘 − 1 = 2 1196.13 𝐶𝑀𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = = 598.065
𝑘−1
𝑆𝐶𝐸 𝐶𝑀𝑇
Error 𝑛 − 𝑘 = 12 187.2 𝐶𝑀𝐸 = = 15.6 𝐹𝑎𝑏𝑠 = = 38.3375
𝑛−𝑘 𝐶𝑀𝐸
Total 𝑛−1 SCTotal 𝑭𝟎.𝟎𝟓,𝟐,𝟏𝟐 = 𝟑. 𝟖𝟗

1. Planteamiento:
𝐻0 : 𝜇1 = 𝜇2 = ⋯ = 𝜇𝑘
𝐻1 : 𝐸𝑙 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜 𝑑𝑒𝑙 𝑡𝑖𝑒𝑚𝑝𝑜 𝑑𝑒 𝑏𝑎𝑡𝑒𝑟í𝑎𝑠 𝑒𝑠 𝑑𝑖𝑓𝑒𝑟𝑒𝑛𝑡𝑒
2. Estadístico de prueba
𝐶𝑀𝑇𝑟
𝐹𝑜𝑏𝑠 = = 38.3375
𝐶𝑀𝐸
3. Región de rechazo
𝐹0.05,2,12 = 3.89
Rechazar 𝐻0 si 𝐹𝑜𝑏𝑠 > 𝐹𝛼
38.3375 (𝐹𝑜𝑏𝑠 ) > 3.89(𝐹𝛼,𝑘−1,𝑛−𝑘 )
𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑚𝑜𝑠 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎.
𝐸𝑛𝑡𝑜𝑛𝑐𝑒𝑠, 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑑𝑒𝑐𝑖𝑟 𝑞𝑢𝑒 𝑙𝑜𝑠 𝑡𝑖𝑒𝑚𝑝𝑜𝑠 𝑑𝑒 𝑣𝑖𝑑𝑎 𝑑𝑒 𝑙𝑎𝑠 𝑏𝑎𝑡𝑒𝑟𝑖𝑎𝑠 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠.
c) Verificar si la marca Toyobar es mejor que la marca Yihuasa 𝛼 = 0.05

Toyobar (x) Yihuasa (y)


76 108
80 100
75 96
84 98
82 100

Toyobar Yihuasa
Promedio 79.40 100.40
Varianza 14.80 20.80
Desviación 3.85 4.56

Planteamiento

1. 𝐻0 : 𝜇𝑥 = 𝜇𝑦
𝐻1 : 𝜇𝑥 − 𝜇𝑦 > 0
2. 𝛼 = 0.05
3. Estadístico de prueba (𝑛 + 𝑚 < 30 − 𝑡 𝑑𝑒 𝑠𝑡𝑢𝑑𝑒𝑛𝑡)
4.

(𝑥̅ − 𝑦̅) − (𝜇𝑥 − 𝜇𝑦 ) 𝑛 ∗ 𝑚(𝑛 + 𝑚 − 2)


𝑡= ∗√
√(𝑛 − 1)𝑆𝑥2 + (𝑚 − 1)𝑆𝑦2 𝑛+𝑚

(79.4 − 100.4) 102 (8)


𝑡= ∗√ = −2.219
√4 ∗ 14.8 + 4 ∗ 20.8 10
5. Región crítica
𝑡 > 𝑡𝛼
𝐺𝐿 = 𝑛 + 𝑚 − 2 = 8
𝑃[𝑡 > 𝑡𝛼 ] = 0.05
𝑡𝛼 = 1.8595
𝑅𝐶[1.85; 𝑖𝑛𝑓]
6. Conclusión
𝑐𝑜𝑚𝑜 𝑡 < 𝑡𝛼 𝑎𝑐𝑒𝑝𝑡𝑎𝑚𝑜𝑠 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎, 𝑟𝑒𝑐ℎ𝑎𝑧𝑎𝑚𝑜𝑠 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑎𝑙𝑡𝑒𝑟𝑛𝑎𝑡𝑖𝑣𝑎

Podemos decir que las baterias Toyobar si son mejores con un nivel de significancia del
5%
d) Verificar que si los tiempos de dispersión de los tiempos de vida de la marca Toyobar es igual a 100
semanas.

𝐻0 : 𝜎 2 = 100
𝐻1 : 𝜎 2 ≠ 100
1) 𝛼 = 0.05
𝛼
2) 2 = 0.025
𝜒 2 > 𝜒 2 𝛼 = 11.1433
2
𝜒 2 > 𝜒 21−𝛼 = 0.4844
2
𝐺𝐿 = 𝑛 − 1 = 4

Región crítica: [0.4844 ; 11.1433]

3) Calculo de 𝜒 2
(𝑛 − 1)𝑆 2 4 ∗ 11.2
𝜒2 = = = 0.448
𝜎𝑜2 100

4) Conclusión
𝜒 2 ∈ 𝑅𝑅 → 𝑆𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎,

No hay evidencia suficiente para determinar que la dispersión de los


tiempos de la marca toyobar es igual a 100 semanas.

Métodos de muestreo aleatorio


1. Muestreo aleatorio simple (M.A.S)
Cálculo del tamaño de la muestra cuando no se conoce la varianza poblacional
𝑛𝑜 𝑍2 𝑆 2
𝑛= 𝑛 𝑜 ; 𝑛𝑜 = 𝐸 2
1+
𝑁
𝑁: 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎
𝑆 2 : 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝐸: 𝐸𝑟𝑟𝑜𝑟
𝑧: 𝑉𝑎𝑙𝑜𝑟 𝑎 𝑝𝑎𝑟𝑡𝑖𝑟 𝑑𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑍
1+𝛾
𝑃[𝑍 < 𝑍] =
2

A partir de la siguiente información obtenida de una población 𝑛 = 355 familias mediante


la muestra preliminar, determinar el tamaño óptimo de la muestra si se considera el error
del muestreo del 5% para las variables (Ingreso y consumo) y 8% para el atributo
(Propiedad de la vivienda) La confianza en los tres casos será del 95,5% (Z=2)
Consumo
Vivienda diario de
N de orden Ingreso propia carne
1 242 si 760
2 106 si 765
3 286 no 592
4 232 no 520
5 112 si 610
6 250 si 636
7 193 si 650
8 102 si 605
9 196 si 642
10 111 si 520
11 97 no 508
12 179 no 767
13 225 no 842
14 175 no 684

a) 𝐼𝑛𝑔𝑟𝑒𝑠𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜: 179


𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 4075.38
𝐸𝑟𝑟𝑜𝑟 = 5% ∗ (𝑥̅ ) = 0.05 ∗ 179 = 8.95
𝑍 2 𝑆 2 22 (4075.38)
𝑛𝑜 = 2 = = 203.51
𝐸 8.952
𝑛𝑜 203.51
𝑛= 𝑛𝑜 = = 129.35
1+ 203.51
𝑁 1 + 355
𝑛 ≅ 129
b) 𝐶𝑜𝑛𝑠𝑢𝑚𝑜 𝑝𝑟𝑜𝑚𝑒𝑑𝑖𝑜: 650.07
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎: 10634.38
𝐸𝑟𝑟𝑜𝑟 = 5% ∗ (𝑥̅ ) = 0.05 ∗ 650.07 = 32.5
𝑍 2 𝑆 2 22 (10634.38)
𝑛𝑜 = 2 = = 40.27
𝐸 32.52
𝑛𝑜 40.27
𝑛= 𝑛𝑜 = = 36.17
1+ 40.27
𝑁 1 + 355
𝑛 ≅ 36

c) Proporción de familias con vivienda propia


PROPORCIONES
∑ 𝒂𝒊
𝒑=
𝒏
𝒔𝟐 = 𝒑 ∗ 𝒒

8 6
𝑝= ; 𝑞=
14 14
2
8 6
𝑠 = ∗ = 0.24489
14 14
𝐸 = 8% = 0.08

𝑍 2 𝑆 2 22 (0.24489)
𝑛𝑜 = = = 153.06
𝐸2 0.082
𝑛𝑜 153.06
𝑛= 𝑛𝑜 = = 106.949
1+ 153.06
𝑁 1 + 355
𝑛 ≅ 107

Estimación de promedio y totales


𝑠 𝑠 𝑁−𝑛
𝑥̂ = 𝑥̅ ± 𝑡 √1 −𝑓 ó 𝑥̂ = 𝑥̅ ± 𝑡 √
√𝑛 √ 𝑛 𝑁−1

𝑛
Solo usaremos el factor de corrección sí 𝑓 = 𝑁 > 5%

14
En el caso del problema anterior como 𝑓 = 355 = 0.04 𝑒𝑠 𝑚𝑒𝑛𝑜𝑟 𝑎𝑙 5%(0.05)
entonces no es necesario usar el factor de corrección

1+𝛾
𝑃[𝑇 < 𝑡] =
2

La estimación puntual o promedio del ejemplo anterior para el ingreso promedio es de


179, la estimación con intervalos de un 95% será:
1+𝛾
𝑃[𝑇 < 𝑡] = = 0.975
2
1 − 𝑃[𝑇 ≥ 𝑡] = 1 − 0.975 = 0.025
𝑐𝑜𝑛 𝑛 − 1 𝑔𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 = 13 𝐺𝐿
𝑡 = 2.16
𝑠 2.16∗63.84
𝑥̂ = 𝑥̅ ± 𝑡 = 179 ±
√𝑛 √14
𝑥̂1 = 215.85
𝑥̂2 = 142.15

Estimación total de ingresos para 355 familias


𝑠
𝑥̂ = 𝑁𝑥̅ ± 𝑁𝑡 √1 − 𝑓
√𝑛

Estimación de proporciones y totales


𝑝𝑞
𝑝̂ = 𝑝 ± 𝑡√ √1 − 𝑓 (𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑝𝑢𝑛𝑡𝑢𝑎𝑙)
𝑛

Proporción puntual de 57%

8 6
𝑝= ; 𝑞=
14 14
8 6
𝑝𝑞 8 √14 ∗ 14
𝑝̂ = 𝑝 ± 𝑡√ = ± 2.16
𝑛 14 14
𝑝̂1 = 0.8571
𝑝2 = 0.2857
Muestreo aleatorio estatificadoh
Simbología: Para la población
𝑁: 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑞𝑢𝑒 𝑐𝑜𝑛𝑠𝑡𝑖𝑡𝑢𝑦𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 𝑜𝑏𝑗𝑒𝑡𝑖𝑣𝑜
𝑁ℎ : 𝑇𝑜𝑡𝑎𝑙 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛
ℎ: 𝐼𝑑𝑒𝑛𝑡𝑖𝑓𝑖𝑐𝑎 𝑒𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑜, 𝑑𝑜𝑛𝑑𝑒 ′ℎ′ 𝑡𝑜𝑚𝑎 𝑣𝑎𝑙𝑜𝑟𝑒𝑠 𝑑𝑒 1,2,3, … ℎ𝑎𝑠𝑡𝑎 ′𝑀′ 𝑒𝑠𝑡𝑟𝑎𝑡𝑜𝑠
𝑁1 , 𝑁2 , … : 𝑆𝑒𝑟á𝑛 𝑙𝑜𝑠 𝑡𝑎𝑚𝑎ñ𝑜𝑠 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙𝑒𝑠 𝑒𝑛 𝑙𝑜𝑠 𝑒𝑠𝑡𝑟𝑎𝑡𝑜𝑠 1,2,3, …

∑ 𝑁𝑛 = 𝑁1 + 𝑁2 + ⋯ + 𝑁𝑚 = 𝑁

𝑦̅ℎ : 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑝𝑎𝑟𝑎 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜


∑ 𝑦ℎ𝑗
𝑦̅ℎ =
𝑁ℎ
𝑦̅𝑠𝑡 : 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑡𝑖𝑚𝑒𝑡𝑖𝑐𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑎 𝑝𝑜𝑛𝑑𝑒𝑟𝑎𝑑𝑎
∑ 𝑦ℎ 𝑁 ℎ
𝑦̅𝑠𝑡 = ó 𝑦̅𝑠𝑡 = ∑ 𝑦ℎ 𝑤ℎ
𝑁

𝑊ℎ : 𝑃𝑟𝑜𝑝𝑜𝑟𝑐𝑖ó𝑛 𝑑𝑒 𝑒𝑙𝑒𝑚𝑒𝑛𝑡𝑜𝑠 𝑒𝑛 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜


𝑁ℎ
𝑊ℎ =
𝑁
𝑆ℎ2 : 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑝𝑜𝑏𝑙𝑎𝑐𝑖𝑜𝑛𝑎𝑙 𝑒𝑛 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜
∑ 𝑦ℎ𝑗 − 𝑁ℎ 𝑦̅ℎ2
𝑆ℎ2 =
𝑁ℎ − 1
𝑛: 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑟𝑎 𝑡𝑜𝑡𝑎𝑙
𝑛ℎ : 𝑁𝑢𝑚𝑒𝑟𝑜 𝑑𝑒 𝑢𝑛𝑖𝑑𝑎𝑑𝑒𝑠 𝑞𝑢𝑒 𝑐𝑜𝑛𝑡𝑖𝑒𝑛𝑒 𝑙𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑛 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙
𝑦̅ℎ : 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑝𝑎𝑟𝑎 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜
∑ 𝑦ℎ𝑗
𝑦̅ℎ =
𝑛ℎ
𝑦̅𝑠𝑡 : 𝑀𝑒𝑑𝑖𝑎 𝑎𝑟𝑖𝑡𝑚𝑒𝑡𝑖𝑐𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑒𝑠𝑡𝑟𝑎𝑡𝑖𝑓𝑖𝑐𝑎𝑑𝑎
∑ 𝑁ℎ 𝑦̅ℎ
𝑦̅𝑠𝑡 = = ∑ 𝑦̅ℎ 𝑊ℎ
𝑁
𝑆ℎ2 : 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑙 𝑒𝑛 𝑐𝑎𝑑𝑎 𝑒𝑠𝑡𝑟𝑎𝑡𝑜
2
∑ 𝑦ℎ𝑗 − 𝑁ℎ 𝑦̅ℎ2
𝑆ℎ2 =
𝑛ℎ − 1
Ejemplo. Dada la siguiente población estratificada:

Estrato 1 Estrato 2 Estrato 3


N# de orden Y1 N# de orden Y2 N# de orden Y3
1 5 1 9 1 13
2 7 2 8 2 15
3 3 3 10 3 16
4 2 4 8 4 12
5 1 5 18
6 4

a) Extraer una muestra de tamaño 9 (Tamaño de la muestra preliminar)


aplicando la afijación igual y calcular el tamaño de la muestra, trabajando
con un error del 6% y una confianza del 95%
𝑛𝑜
𝑛= 𝑛
1 + 𝑁𝑜
∑ 𝑊ℎ 𝑆𝑛2
𝑛𝑜 =
𝐸 2
(𝑍 )
𝐸 = %(𝑦̅𝑠𝑡 )

𝑦̅1 = 3.667 𝑦̅2 = 8.667 𝑦̅2 = 14.33


𝑠12 = 2.333 𝑠22 = 1.333 𝑠32 = 10.33
𝑁1 6
𝑊1 = = = 0.4
𝑁 15
𝑁2 4
𝑊2 = = = 0.27
𝑁 15
𝑁3 5
𝑊3 = = = 0.33
𝑁 15

𝑦̅𝑠𝑡 = ∑ 𝑦ℎ 𝑊ℎ = 3.67 ∗ 0.4 + 8.67 ∗ 0.27 + 14.33 ∗ 0.33 = 8.5378

𝐸 = 0.06 ∗ 8.53 = 0.5123


𝐶𝑎𝑙𝑐𝑢𝑙𝑜 𝑑𝑒 ′𝑍 ′
1+𝛾
𝑃[𝑍 < 𝑧] =
2
1 + 𝛾 1 + 0.95
= = 0.975
2 2
𝑧 = 1.96
∑ 𝑊ℎ 𝑆𝑛2
Calculamos: ∑ 𝑊ℎ 𝑆ℎ2 = 4.7 para 𝑛𝑜 = 𝐸 2
( )
𝑍
4.7
𝑛𝑜 = = 69.42
0.51 2
(1.96)
69.42
𝑛= = 12.33
69.42
1+
15
𝑛 ≅ 12
Problemas para el final
A partir de los siguientes datos realizar una prueba de normalidad usando el test de
Shapiro-Wilks

Empleado 1 2 3 4 5 6 7 8 9 10 11 12
Antigüedad
(Años) 5 3 8 7 8 9 14 15 3 12 6 5

𝑥̅ = 7.92
𝑛 = 12
Planteamiento:

 𝐻0 : La muestra aleatoria tiene una distribución normal


 𝐻1 : La muestra no tiene una distribución normal

𝐻0 : 𝑥 → 𝑁𝑜𝑟𝑚𝑎𝑙
𝐻1 : 𝑥 ~𝑁𝑜𝑟𝑚𝑎𝑙

1. Ordenar los datos de manera creciente

Empleado 2 9 1 12 11 4 3 5 6 10 7 8
Antigüedad
(Años) 3 3 5 5 6 7 8 8 9 12 14 15
2. Calcular
𝑛

𝑆 2 = ∑(𝑦𝑖 − 𝑦̅)2 = 15.901


𝑖=1
3. Como 𝑛 𝑒𝑠 𝑝𝑎𝑟 entonces:

𝑛 = 2𝑘 = 12
𝑛
𝑘= =6
2
𝑘

𝑏 = ∑ 𝑎𝑛−𝑖+1 ( 𝑦𝑛−𝑖+1 − 𝑦𝑖 ) = 12.7195


𝑖=1

𝑏 2 = 161.7857
146
𝑊𝑐 = = 0.9249
15.901
4. 𝑊𝑇 = 0.859
𝑆𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎:
𝐷𝑎𝑑𝑜 𝑞𝑢𝑒 𝑊𝑐 > 𝑊𝑇 𝑝𝑜𝑑𝑒𝑚𝑜𝑠 𝑑𝑒𝑐𝑖𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙
Ejemplo 1. Se extrae una muestra de tamaño 10 de una variable
aleatoria x, cuyos resultados son los siguientes:
xi zi fs(x) s(x) |fs(x)-s(x)|
1 0.76 1.58 0.94 0.10 0.84
2 0.65 1.08 0.86 0.20 0.66
3 0.62 0.94 0.83 0.30 0.53
4 0.55 0.62 0.73 0.40 0.33
5 0.38 -0.15 0.44 0.50 -0.06
6 0.36 -0.25 0.40 0.60 -0.20
7 0.26 -0.70 0.24 0.70 -0.46
8 0.24 -0.79 0.21 0.80 -0.59
9 0.23 -0.84 0.20 0.90 -0.70
10 0.09 -1.48 0.07 1.00 -0.93

Se quiere contrastar la hipótesis de que la muestra provine de una


distribución normal, utilizando el contraste de Kolmogorov-Smirnov
con 𝛼 = 0.01
1) 𝐻0 : La prueba aleatoria tiene una distribución normal
𝐻1 : La distribución no tiene una distribución normal
2) 𝐷 = 𝑀á𝑥𝑖𝑚𝑜|𝐹𝑠 (𝑥) − 𝑆(𝑥)|
𝐷 = 0.16158
Conclusión:

𝐷 < 𝐷𝛼 → 𝐴𝑐𝑒𝑝𝑡𝑎𝑟 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎


𝐷 > 𝐷𝛼 → 𝑅𝑒𝑐ℎ𝑎𝑧𝑎𝑟 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎
𝐷𝛼,𝑛 = 𝐷0.01,10 = 0.489

0.1658 < 0.489


𝑆𝑒 𝑎𝑐𝑒𝑝𝑡𝑎 𝑙𝑎 ℎ𝑖𝑝𝑜𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎,
𝐻𝑎𝑦 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑠𝑢𝑓𝑖𝑐𝑖𝑒𝑛𝑡𝑒 𝑝𝑎𝑟𝑎 𝑑𝑒𝑐𝑖𝑟 𝑞𝑢𝑒 𝑙𝑎 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖𝑜𝑛 𝑒𝑠 𝑛𝑜𝑟𝑚𝑎𝑙

Das könnte Ihnen auch gefallen