Sie sind auf Seite 1von 50

ESTADISTICA Y PROBABILIDADES

RANGO

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

El rango es la diferencia entre la observacin mayor y la menor en una serie de datos. Esto es, Rango = X mayor X menor En el caso que sea para datos no agrupados Rango = Lmax-Lmin Lmax: limite mayor Lmin: Limite menor
El rango mide la dispersin total en una serie de datos. La debilidad del rango es que no toma en cuenta la forma en que los datos se distribuyen realmente entre el valor menor y el mayor.

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

39 44

29 40

43 31

52 44

39 35

DETECCIN DE VALORES ATIPICOS

SOLUCIN

RANGO-RANGO INTERCUARTIL

Para determinar el rango de los tiempos necesario para arreglarse, los datos se ordenan de menor a mayor

VARIANZA-DESVIACIN ESTANDAR

29
COEF. VARIACIN -VALORES Z

31

35

39

39

40

43

44

44

52

Rango
CHEBYSHEV-REGLA EMPRICA

52

29

23

DETECCIN DE VALORES ATIPICOS

RANGO INTERCUARTIL

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

El rango intercuartil de un conjunto de datos es la diferencia entre el tercer cuartil y el primer cuartil. Es el rango donde se encuentra el 50% central de los datos. Elimina la sensibilidad de los valores de datos extremos. Este no varia como el rango. Formula: RQ = Q3 - Q1

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

PASOS PARA HALLAR EL RANGO INTERCUARTIL


RANGO-RANGO INTERCUARTIL

Para calcular el rango intercuartil del tiempo necesario para arreglarse antes de salir al trabajo se siguen los siguientes pasos: (1) Ordenar de menor a mayor la muestra (2) Calcular el cuartil 1 y el 3 (3) Utilizamos la formula Muestra de tamao 10 ya ordenada

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

29
DETECCIN DE VALORES ATIPICOS

31

35

39

39

40

43

44

44

52

29

31

35

39

39

40

43

44

44

52

RANGO-RANGO INTERCUARTIL

Posicin 3
VARIANZA-DESVIACIN ESTANDAR

Posicin 8

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

El rango intercuartil consta de 9 numerales


DETECCIN DE VALORES ATIPICOS

DIAGRAMA DE CAJAS

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO
Construir el diagrama de cajas de la siguiente tabla de datos, que corresponde a la renta de apartamentos.
425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO: APARTAMENTOS EN RENTA

RANGO-RANGO INTERCUARTIL

Resumen de cinco datos Valor mnimo = 425 Primer cuartil (Q1) = 450 Mediana (Q2) = 475 Tercer cuartil (Q3) = 525 Valor mximo = 615
425 440 450 465 480 510 575 430 440 450 470 485 515 575 430 440 450 470 490 525 580 435 445 450 472 490 525 590 435 445 450 475 490 525 600 435 445 460 475 500 535 600 435 445 460 475 500 549 600 435 445 460 480 500 550 600 440 450 465 480 500 570 615 440 450 465 480 510 570 615

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO: APARTAMENTOS EN RENTA

Diagrama de caja
Limite menor: Q1 - 1.5(IQR) = 450 - 1.5(75) = 337.5 Limite mayor: Q3 + 1.5(IQR) = 525 + 1.5(75) = 637.5

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

No hay valores atpicos.


COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

VARIANZA

VARIANZA POBLACIONAL

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

VARIANZA MUESTRAL

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

Datos recogidos de los sueldos de 12 recin egresados de la carrera de Ingeniera Industrial.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

Resumen de clculos para hallar la varianza

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

Luego empleando la formula para hallar la varianza tenemos.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

PROPIEDADES DE LA VARIANZA

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

Es sensible a los valores extremos Si a todos los valores de la variable se les suma un nmero, la varianza no vara Si todos los valores de la variable se multiplican por un nmero, la varianza queda multiplicada por el cuadrado de dicho nmero No existe otro parmetro que no sean la media que haga que la sumatoria de las desviaciones respecto al parmetro sea mnima.

DETECCIN DE VALORES ATIPICOS

DESVIACIN ESTNDAR
La desviacin estndar, tambin llamada desviacin tpica, es una medida de dispersin usada en estadstica que nos dice cunto tienden a alejarse los valores concretos del promedio en una distribucin

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

DESVIAVIN ESTNDAR POBLACIONAL

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DESVIACIN ESTNDAR MUESTRAL

DETECCIN DE VALORES ATIPICOS

Para el ejemplo de los ingresos de los 12 egresados tendremos que la desviacin estndar muestral es:

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

COEFICIENTE DE VARIACIN
Resulta imposible una comparacin directa de dos o ms medidas de dispersin por ejemplo: se puede decir que la desviacin estndar de $1 200, de la distribucin del ingreso es mayor que la desviacin estndar de 4.5 das de la distribucin de faltas de asistencias? Obviamente no es as porque no podemos comparar directamente dlares y das de inasistencia en el trabajo. A fin de realizar una comparacin significativa de la distribucin de ingresos y las faltas, se necesita convertir cada una de esas medidas a un valor relativo, es decir, a un porcentaje.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

COEFICIENTE DE VARIACIN

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Karl Pearson (1857- 1936) contribuyo de manera importante a la ciencia estadstica, y desarrollo una medida relativa denominada coeficiente de variacin (CV). El coeficiente de variacin permite comparar la dispersin entre dos poblaciones distintas e incluso, comparar la variacin producto de dos variables diferentes (que pueden provenir de una misma poblacin).

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

El coeficiente de variacin elimina la dimensionalidad de las variables y tiene en cuenta la proporcin existente entre una medida de tendencia y la desviacin tpica o estndar.

COEFICIENTE DE VARIACIN

Se calcula:

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Donde es la desviacin tpica. Se puede dar en tanto por ciento calculando:

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

Este ndice solo se debe calcular para variables con todo los valores positivos, para dar seguridad de un o mayores a cero (un coeficiente de variacin positivo).

DETECCIN DE VALORES ATIPICOS

EJEMPLO
En una cierta empresa se hizo un estudio de las notas obtenidas en un curso de capacitacin y los aos de servicio de los mismos empleados que tomaron el curso de capacitacin. La calificacin media de los empleados fue de 14 puntos y la desviacin estndar de 2 puntos. Y la media de los aos de servicio fue de 18 aos y la desviacin estndar fue de 3 aos.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

Podemos ver que hay menor dispersin relativa con respecto a la media en la distribucin de aos de servicio (14.29% < 16.67%).

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

VALOR Z DE LA DISTRIBUCIN NORMAL


Como sabemos, la curva normal de frecuencias tiene la forma de campana, en cuyo centro se ubican tres medidas de tendencia central (promedio [media aritmtica], mediana y moda).
En particular, el promedio o media aritmtica es la medida representativa de un universo muestral, mientras que a los lados de este valor se encuentran valores ms altos y ms bajos, aproximadamente la mitad para cada lado, los cuales se dispersan segn una medida denominada desviacin estndar.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

VALOR Z DE LA DISTRIBUCIN NORMAL


Primero se convierte, o se estandariza, la distribucin que se tiene, en la distribucin normal estndar utilizando un valor z (tambin denominado puntuacin z, valor estadstico, desviacin normal estndar, o simplemente desviacin normal). El valor Z se define matemticamente con la frmula:

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

Donde: Z = valor estadstico de la curva normal de frecuencias. X = cualquier valor de una muestra estadstica. = promedio o media aritmtica obtenido de la muestra estadstica, valor representativo. = desviacin estndar.

DETECCIN DE VALORES ATIPICOS

VALOR Z DE LA DISTRIBUCIN NORMAL


Pasos: Calcular el promedio y la desviacin estndar de las observaciones de la muestra en estudio. Del valor del cual se desea obtener una inferencia estadstica, calcular la diferencia que existe con respecto al promedio: X - X. Dividir la diferencia calculada entre la desviacin estndar obtenida de la muestra en estudio, que corresponde al valor Z. Localizar el valor Z calculado, en la tabla de probabilidades asociadas con valores tan extremos como los valores observados de Z en la distribucin normal y obtener la probabilidad de que exista una magnitud de discrepancia entre los valores X y X .

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO
Un mdico que labora en una poblacin acostumbra efectuar mediciones de peso a sus pacientes, de los cuales dos tienen pesos que difieren particularmente del promedio. El mdico est interesado en saber si los pesos de sus dos pacientes corresponden a esa poblacin y qu tanto difiere de la representacin de su grupo de asistencia mdica y de estudio. Los pesos corporales de la poblacin estudiada se encuentran listados del ms bajo al ms alto en la tabla siguiente, y el mdico ha marcado los puntos donde se localizan la media aritmtica, la mediana y la moda. Los pesos de sus pacientes problema son de 54 y 80 kg.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

Aplicacin de la prueba estadstica. Tomando en cuenta los pasos, se calcula el promedio o media aritmtica. De acuerdo con la siguiente frmula:
RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

La desviacin estndar se calcula con la ecuacin siguiente:

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

Una vez calculados el promedio y la desviacin estndar, se calcula el valor Z.

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

En la tabla de probabilidades asociadas en valores extremos como los de 2 en la distribucin normal, se busca la localizacin de los valores Z1 y Z2 calculados, a fin de obtener la probabilidad de su magnitud de discrepancia con respecto a la media aritmtica.

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

El primer valor de Z1 es 1.69, de modo que se localiza el 1.6 y en la interseccin de la columna 0.09, correspondiente a las centsimas, se observa el valor 0.4545. Esta es la probabilidad de que el valor 54 kg pertenezca a la poblacin de pesos corporales, donde el promedio es 73.2 kg y la desviacin estndar 11.39 kg. El segundo valor de Z2 es 0.6, de manera que en la tabla se observa esa cifra y en la interseccin de la columna 0.00 se halla el valor 0.2257.

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

Interpretacin. La siguiente figura contiene tanto el polgono de frecuencias en funcin de una serie de clases elaboradas con las observaciones de 150 pesos corporales, como los lmites de las desviaciones estndar con respecto al promedio. Los valores Z de los dos pesos problema se dibujan con dos flechas, de acuerdo con los valores de peso que corresponden. La Z1 se encuentra muy por fuera de -1 desviacin estndar y muy cercana a -2 desviaciones estndar. Para ser ms precisos, tiene 1.69 desviaciones estndar, igual al valor Z; en cambio, el valor Z2 tiene 0.6 desviaciones estndar y an se encuentra dentro del lmite de +1 desviacin estndar.

DETECCIN DE VALORES ATIPICOS

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

reas bajo la curva normal tipificada de 0 a z

z 0.0 RANGO-RANGO INTERCUARTIL 0.1 0.2 0.3 VARIANZA-DESVIACIN ESTANDAR 0.4 0.5 0.6 0.7

0.0000 0.0040 0.0080 0.0120 0.0160 0.0199 0.0239 0.0279 0.0319 0.0359 0.0398 0.0438 0.0478 0.0517 0.0557 0.0596 0.0636 0.0675 0.0714 0.0753 0.0793 0.0832 0.0871 0.0910 0.0948 0.0987 0.1026 0.1064 0.1103 0.1141 0.1179 0.1217 0.1255 0.1293 0.1331 0.1368 0.1406 0.1443 0.1480 0.1517 0.1554 0.1591 0.1628 0.1664 0.1700 0.1736 0.1772 0.1808 0.1844 0.1879 0.1915 0.1950 0.1985 0.2019 0.2054 0.2088 0.2123 0.2157 0.2190 0.2224 0.2257 0.2291 0.2324 0.2357 0.2389 0.2422 0.2454 0.2486 0.2517 0.2549 0.2580 0.2611 0.2642 0.2673 0.2703 0.2734 0.2764 0.2793 0.2823 0.2652 0.2881 0.2910 0.2939 0.2967 0.2995 0.3023 0.3051 0.3078 0.3106 0.3133 0.3159 0.3186 0.3212 0.3238 0.3264 0.3289 0.3315 0.3340 0.3364 0.3389

COEF. VARIACIN -VALORES Z

0.8 0.9

1.0 1.1

0.3413 0.3438 0.3461 0.3485 0.3508 0.3531 0.3554 0.3577 0.3599 0.3621 0.3643 0.3665 0.3686 0.3708 0.3729 0.3749 0.3770 0.3790 0.3810 0.3830
0.3849 0.3869 0.3888 0.3907 0.3925 0.3944 0.3962 0.3980 0.3997 0.4015 0.4032 0.4049 0.4066 0.4082 0.4099 0.4115 0.4131 0.4147 0.4162 0.4177 0.4192 0.4207 0.4222 0.4236 0.4251 0.4265 0.4279 0.4292 0.4306 0.4319 0.4332 0.4345 0.4357 0.4370 0.4382 0.4394 0.4406 0.4418 0.4429 0.4441 0.4452 0.4463 0.4474 0.4485 0.4495 0.4505 0.4515 0.4525 0.4535 0.4545

CHEBYSHEV-REGLA EMPRICA

1.2 1.3 1.4

DETECCIN DE VALORES ATIPICOS

1.5 1.6

TEOREMA DE CHEBYSHEV

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Para cualquier conjunto de datos con media x y desviacin estndar muestral s, la proporcin de los datos comprendidos en el intervalo [x-ks, x+ks] es mayor o igual a [1-(1/k)], donde k es una constante mayor o igual que uno

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO
La media de los pesos de las bolsas de maca de la pirinaca es igual a 15.1333kg y la desviacin estndar es 2.8952kg.

RANGO-RANGO INTERCUARTIL

Aproximar Entre cuales cantidades est el 75% de los salarios?


En el intervalo [9.3429-20.9237], que tiene la media como centro y dos desviaciones estndares muestrales como radio, existe segn chebyshev, por lo menos 75% (1-(1/2)) de los datos

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

REGLA EMPRICA
Dada una distribucin de un conjunto de observaciones de tamao n suficientemente grande, que es simtrica y forma aproximadamente acampanada. Entonces:
Entre x-S y x+S se encuentra el 68.27% de las observaciones
COEF. VARIACIN -VALORES Z

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Entre x-2S y x+2S se encuentra el 95.45% de las observaciones Entre x-3S y x+3S se encuentra el 99.73% de las observaciones

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

REGLA EMPRICA
La distribucin simtrica acampanada se conoce como la distribucin normal
RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO
Para una distribucin de salarios, que sigue aproximadamente una distribucin de frecuencias simtrica de campana, la media se calcula que es S/.5000 y la desviacin estndar es S/.500. Utilizando la regla emprica oAproximar Entre cules cantidades est el 68% de los salarios? oAproximar Entre cules cantidades est el 95% de los salarios? oAproximar Entre cules cantidades estn casi todos los salarios?

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

SOLUCIN
Entonces aprox. el 68% esta entre:
RANGO-RANGO INTERCUARTIL

S/.4500 Y S/.5500

4500=5000-1*500 5500=5000+1*500

Entonces aprox. el 95% esta entre:


VARIANZA-DESVIACIN ESTANDAR

S/.4000 Y S/.6000

4000=5000-2*500 6000=5000+2*500
3500=5000-3*500 6500=5000+3*500

Entonces aprox. casi todos los datos estn entre:

S/.3500 Y S/.6500

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

DETECCIN DE VALORES ATPICOS


DEFINICIN

RANGO-RANGO INTERCUARTIL

Los valores atpicos son aquellos que son mucho mayores o mucho menores que los dems. Existen criterios paramtricos basados en los percentiles para definir los valores atpicos.

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO

RANGO-RANGO INTERCUARTIL

Los pesos de los nios se consideran muy bajos si estn por debajo del percentil 3 de una poblacin de caractersticas similares, y muy altos si estn por encima del percentil 97.

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

VALORES ATPICOS POR DEFECTO

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

Se consideran valores atpicos por defecto a aquellos que son menores que el primer cuartil menos 1,5 veces el recorrido intercuartilico. Si los valores son menores que la diferencia entre el primer cuartil menos 3 veces el recorrido intercuartilico se denominan valores atpicos de segundo grado por defecto.

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

VALORES ATPICOS POR EXCESO

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Se consideran valores atpicos por exceso a aquellos que son mayores que el tercer cuartil mas 1,5 veces el recorrido intercuartilico. Si los valores son mayores que la suma del tercer cuartil mas 3 veces el recorrido intercuartilico se denomina valores atpicos de segundo grado por exceso.

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

EJEMPLO

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Los cuartiles primero y tercero de un conjunto de datos son 80 y 90, respectivamente. Calcular los valores a partir de los cuales serian considerados valores atpicos de primero y segundo grado, por exceso y por defecto. El recorrido intercuartilico es: RIC = 90 80 = 10.

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

SOLUCIN A

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

Los valores atpicos por exceso son aquellos que son mayores que el tercer cuartil, 90, mas 1,5 veces el RIC, 15, es decir, los mayores de 105. Los valores mayores de 105, pero inferiores a la suma del tercer cuartil, 90, mas 3 veces el recorrido intercuartilico, 30, es decir, menores de 120, son valores atpicos de primer grado por exceso; los valores mayores de 120 son valores atpicos de segundo grado por exceso.

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

SOLUCIN B

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

COEF. VARIACIN -VALORES Z

Los valores atpicos por defecto son aquellos que son menores que el primer cuartil, 80, menos 1,5 veces el RIC, 15, es decir, los menores de 65. Los valores menores de 65, pero mayores que la diferencia entre el primer cuartil y 3 veces el recorrido intercuartilico, 30, es decir, mayores de 50, son valores atpicos de primer grado por defecto; los valores menores de 50 son valores atpicos de segundo grado por defecto.

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

CONCLUSIN

RANGO-RANGO INTERCUARTIL

VARIANZA-DESVIACIN ESTANDAR

Esta manera de definir los valores atpicos tiene una serie de ventajas, no siempre hay valores atpicos, puede haberlos o no. En ocasiones se consideran valores atpicos aquellos que exceden un determinado percentil

COEF. VARIACIN -VALORES Z

CHEBYSHEV-REGLA EMPRICA

DETECCIN DE VALORES ATIPICOS

FIN

Creaciones Jrm

Das könnte Ihnen auch gefallen