Beruflich Dokumente
Kultur Dokumente
RANGO
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
El rango es la diferencia entre la observacin mayor y la menor en una serie de datos. Esto es, Rango = X mayor X menor En el caso que sea para datos no agrupados Rango = Lmax-Lmin Lmax: limite mayor Lmin: Limite menor
El rango mide la dispersin total en una serie de datos. La debilidad del rango es que no toma en cuenta la forma en que los datos se distribuyen realmente entre el valor menor y el mayor.
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
39 44
29 40
43 31
52 44
39 35
SOLUCIN
RANGO-RANGO INTERCUARTIL
Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de menor a mayor
VARIANZA-DESVIACIN ESTANDAR
29
COEF. VARIACIN -VALORES Z
31
35
39
39
40
43
44
44
52
Rango
CHEBYSHEV-REGLA EMPRICA
52
29
23
RANGO INTERCUARTIL
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
El rango intercuartil de un conjunto de datos es la diferencia entre el tercer cuartil y el primer cuartil. Es el rango donde se encuentra el 50% central de los datos. Elimina la sensibilidad de los valores de datos extremos. Este no varia como el rango. Formula: RQ = Q3 - Q1
CHEBYSHEV-REGLA EMPRICA
Para calcular el rango intercuartil del tiempo necesario para arreglarse antes de salir al trabajo se siguen los siguientes pasos: (1) Ordenar de menor a mayor la muestra (2) Calcular el cuartil 1 y el 3 (3) Utilizamos la formula Muestra de tamao 10 ya ordenada
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
29
DETECCIN DE VALORES ATIPICOS
31
35
39
39
40
43
44
44
52
29
31
35
39
39
40
43
44
44
52
RANGO-RANGO INTERCUARTIL
Posicin 3
VARIANZA-DESVIACIN ESTANDAR
Posicin 8
CHEBYSHEV-REGLA EMPRICA
DIAGRAMA DE CAJAS
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
Construir el diagrama de cajas de la siguiente tabla de datos, que corresponde a la renta de apartamentos.
425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
Resumen de cinco datos Valor mnimo = 425 Primer cuartil (Q1) = 450 Mediana (Q2) = 475 Tercer cuartil (Q3) = 525 Valor mximo = 615
425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Diagrama de caja
Limite menor: Q1 - 1.5(IQR) = 450 - 1.5(75) = 337.5 Limite mayor: Q3 + 1.5(IQR) = 525 + 1.5(75) = 637.5
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
VARIANZA
VARIANZA POBLACIONAL
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
VARIANZA MUESTRAL
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
PROPIEDADES DE LA VARIANZA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Es sensible a los valores extremos Si a todos los valores de la variable se les suma un nmero, la varianza no vara Si todos los valores de la variable se multiplican por un nmero, la varianza queda multiplicada por el cuadrado de dicho nmero No existe otro parmetro que no sean la media que haga que la sumatoria de las desviaciones respecto al parmetro sea mnima.
DESVIACIN ESTNDAR
La desviacin estndar, tambin llamada desviacin tpica, es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores concretos del promedio en una distribucin
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Para el ejemplo de los ingresos de los 12 egresados tendremos que la desviacin estndar muestral es:
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
COEFICIENTE DE VARIACIN
Resulta imposible una comparacin directa de dos o ms medidas de dispersin por ejemplo: se puede decir que la desviacin estndar de $1 200, de la distribucin del ingreso es mayor que la desviacin estndar de 4.5 das de la distribucin de faltas de asistencias? Obviamente no es as porque no podemos comparar directamente dlares y das de inasistencia en el trabajo. A fin de realizar una comparacin significativa de la distribucin de ingresos y las faltas, se necesita convertir cada una de esas medidas a un valor relativo, es decir, a un porcentaje.
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
COEFICIENTE DE VARIACIN
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Karl Pearson (1857- 1936) contribuyo de manera importante a la ciencia estadstica, y desarrollo una medida relativa denominada coeficiente de variacin (CV). El coeficiente de variacin permite comparar la dispersin entre dos poblaciones distintas e incluso, comparar la variacin producto de dos variables diferentes (que pueden provenir de una misma poblacin).
CHEBYSHEV-REGLA EMPRICA
El coeficiente de variacin elimina la dimensionalidad de las variables y tiene en cuenta la proporcin existente entre una medida de tendencia y la desviacin tpica o estndar.
COEFICIENTE DE VARIACIN
Se calcula:
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Este ndice solo se debe calcular para variables con todo los valores positivos, para dar seguridad de un o mayores a cero (un coeficiente de variacin positivo).
EJEMPLO
En una cierta empresa se hizo un estudio de las notas obtenidas en un curso de capacitacin y los aos de servicio de los mismos empleados que tomaron el curso de capacitacin. La calificacin media de los empleados fue de 14 puntos y la desviacin estndar de 2 puntos. Y la media de los aos de servicio fue de 18 aos y la desviacin estndar fue de 3 aos.
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Podemos ver que hay menor dispersin relativa con respecto a la media en la distribucin de aos de servicio (14.29% < 16.67%).
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Donde: Z = valor estadstico de la curva normal de frecuencias. X = cualquier valor de una muestra estadstica. = promedio o media aritmtica obtenido de la muestra estadstica, valor representativo. = desviacin estndar.
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
Un mdico que labora en una poblacin acostumbra efectuar mediciones de peso a sus pacientes, de los cuales dos tienen pesos que difieren particularmente del promedio. El mdico est interesado en saber si los pesos de sus dos pacientes corresponden a esa poblacin y qu tanto difiere de la representacin de su grupo de asistencia mdica y de estudio. Los pesos corporales de la poblacin estudiada se encuentran listados del ms bajo al ms alto en la tabla siguiente, y el mdico ha marcado los puntos donde se localizan la media aritmtica, la mediana y la moda. Los pesos de sus pacientes problema son de 54 y 80 kg.
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Aplicacin de la prueba estadstica. Tomando en cuenta los pasos, se calcula el promedio o media aritmtica. De acuerdo con la siguiente frmula:
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
En la tabla de probabilidades asociadas en valores extremos como los de 2 en la distribucin normal, se busca la localizacin de los valores Z1 y Z2 calculados, a fin de obtener la probabilidad de su magnitud de discrepancia con respecto a la media aritmtica.
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
El primer valor de Z1 es 1.69, de modo que se localiza el 1.6 y en la interseccin de la columna 0.09, correspondiente a las centsimas, se observa el valor 0.4545. Esta es la probabilidad de que el valor 54 kg pertenezca a la poblacin de pesos corporales, donde el promedio es 73.2 kg y la desviacin estndar 11.39 kg. El segundo valor de Z2 es 0.6, de manera que en la tabla se observa esa cifra y en la interseccin de la columna 0.00 se halla el valor 0.2257.
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
Interpretacin. La siguiente figura contiene tanto el polgono de frecuencias en funcin de una serie de clases elaboradas con las observaciones de 150 pesos corporales, como los lmites de las desviaciones estndar con respecto al promedio. Los valores Z de los dos pesos problema se dibujan con dos flechas, de acuerdo con los valores de peso que corresponden. La Z1 se encuentra muy por fuera de -1 desviacin estndar y muy cercana a -2 desviaciones estndar. Para ser ms precisos, tiene 1.69 desviaciones estndar, igual al valor Z; en cambio, el valor Z2 tiene 0.6 desviaciones estndar y an se encuentra dentro del lmite de +1 desviacin estndar.
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
z 0.0 RANGO-RANGO INTERCUARTIL 0.1 0.2 0.3 VARIANZA-DESVIACIN ESTANDAR 0.4 0.5 0.6 0.7
0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2793 0.2823 0.2652 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3364 0.3389
0.8 0.9
1.0 1.1
0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545
CHEBYSHEV-REGLA EMPRICA
1.5 1.6
TEOREMA DE CHEBYSHEV
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Para cualquier conjunto de datos con media x y desviacin estndar muestral s, la proporcin de los datos comprendidos en el intervalo [x-ks, x+ks] es mayor o igual a [1-(1/k)], donde k es una constante mayor o igual que uno
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
La media de los pesos de las bolsas de maca de la pirinaca es igual a 15.1333kg y la desviacin estndar es 2.8952kg.
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
REGLA EMPRICA
Dada una distribucin de un conjunto de observaciones de tamao n suficientemente grande, que es simtrica y forma aproximadamente acampanada. Entonces:
Entre x-S y x+S se encuentra el 68.27% de las observaciones
COEF. VARIACIN -VALORES Z
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Entre x-2S y x+2S se encuentra el 95.45% de las observaciones Entre x-3S y x+3S se encuentra el 99.73% de las observaciones
CHEBYSHEV-REGLA EMPRICA
REGLA EMPRICA
La distribucin simtrica acampanada se conoce como la distribucin normal
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
Para una distribucin de salarios, que sigue aproximadamente una distribucin de frecuencias simtrica de campana, la media se calcula que es S/.5000 y la desviacin estndar es S/.500. Utilizando la regla emprica oAproximar Entre cules cantidades est el 68% de los salarios? oAproximar Entre cules cantidades est el 95% de los salarios? oAproximar Entre cules cantidades estn casi todos los salarios?
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
SOLUCIN
Entonces aprox. el 68% esta entre:
RANGO-RANGO INTERCUARTIL
S/.4500 Y S/.5500
4500=5000-1*500 5500=5000+1*500
S/.4000 Y S/.6000
4000=5000-2*500 6000=5000+2*500
3500=5000-3*500 6500=5000+3*500
S/.3500 Y S/.6500
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
Los valores atpicos son aquellos que son mucho mayores o mucho menores que los dems. Existen criterios paramtricos basados en los percentiles para definir los valores atpicos.
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
RANGO-RANGO INTERCUARTIL
Los pesos de los nios se consideran muy bajos si estn por debajo del percentil 3 de una poblacin de caractersticas similares, y muy altos si estn por encima del percentil 97.
VARIANZA-DESVIACIN ESTANDAR
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Se consideran valores atpicos por defecto a aquellos que son menores que el primer cuartil menos 1,5 veces el recorrido intercuartilico. Si los valores son menores que la diferencia entre el primer cuartil menos 3 veces el recorrido intercuartilico se denominan valores atpicos de segundo grado por defecto.
CHEBYSHEV-REGLA EMPRICA
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Se consideran valores atpicos por exceso a aquellos que son mayores que el tercer cuartil mas 1,5 veces el recorrido intercuartilico. Si los valores son mayores que la suma del tercer cuartil mas 3 veces el recorrido intercuartilico se denomina valores atpicos de segundo grado por exceso.
CHEBYSHEV-REGLA EMPRICA
EJEMPLO
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Los cuartiles primero y tercero de un conjunto de datos son 80 y 90, respectivamente. Calcular los valores a partir de los cuales serian considerados valores atpicos de primero y segundo grado, por exceso y por defecto. El recorrido intercuartilico es: RIC = 90 80 = 10.
CHEBYSHEV-REGLA EMPRICA
SOLUCIN A
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Los valores atpicos por exceso son aquellos que son mayores que el tercer cuartil, 90, mas 1,5 veces el RIC, 15, es decir, los mayores de 105. Los valores mayores de 105, pero inferiores a la suma del tercer cuartil, 90, mas 3 veces el recorrido intercuartilico, 30, es decir, menores de 120, son valores atpicos de primer grado por exceso; los valores mayores de 120 son valores atpicos de segundo grado por exceso.
CHEBYSHEV-REGLA EMPRICA
SOLUCIN B
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Los valores atpicos por defecto son aquellos que son menores que el primer cuartil, 80, menos 1,5 veces el RIC, 15, es decir, los menores de 65. Los valores menores de 65, pero mayores que la diferencia entre el primer cuartil y 3 veces el recorrido intercuartilico, 30, es decir, mayores de 50, son valores atpicos de primer grado por defecto; los valores menores de 50 son valores atpicos de segundo grado por defecto.
CHEBYSHEV-REGLA EMPRICA
CONCLUSIN
RANGO-RANGO INTERCUARTIL
VARIANZA-DESVIACIN ESTANDAR
Esta manera de definir los valores atpicos tiene una serie de ventajas, no siempre hay valores atpicos, puede haberlos o no. En ocasiones se consideran valores atpicos aquellos que exceden un determinado percentil
CHEBYSHEV-REGLA EMPRICA
FIN
Creaciones Jrm