Beruflich Dokumente
Kultur Dokumente
A. MEDIDAS DE TENDENCIA CENTRAL B. MEDIDAS DE VARIABILIDAD C. MEDIDAS DE FORMA RESUMEN: A. MEDIDAS DE TENDENCIA CENTRAL
Son estadgrafos de posicin que son interpretados como valores que permiten resumir a un conjunto de datos dispersos, podra asumirse que estas medidas equivalen a un centro de gravedad que adoptan un valor representativo para todo un conjunto de datos predeterminados. Estas medidas son: 1. Promedio Aritmtico (Media o simplemente promedio) 2. Mediana 3. Moda 4. Promedio Geomtrico 5. Promedio Ponderado 6. Promedio Total 7. Media Armnica Otras medidas de posicin son: Cuartiles, Deciles y Percentiles B. MEDIDAS DE VARIABILIADAD
Son estadgrafos de dispersin que permiten evaluar el grado de homogeneidad, dispersin o variabilidad de un conjunto de datos. Estas medidas son: 1. Amplitud o Rango 2. Variancia 3. Desviacin Estndar 4. Coeficiente de Variabilidad C. MEDIDAS DE FORMA
Evala la forma que adopta la distribucin de frecuencias respecto al grado de distorsin (inclinacin) que registra respecto a valor promedio tomado como centro de gravedad, el grado de apuntamiento (elevamiento) de la distribucin de frecuencias. A mayor elevamiento de la distribucin de frecuencia significar mayor concentracin de los datos en torno al promedio, por tanto, una menor dispersin de los datos. Estas medidas son: 1. Asimetra o Sesgo 2. Curtosis Los Grficos de Cajas como indicadores de forma
Arturo Rubio
xi x=
i=1
x 1 + x 2 + x 3 + .... + x n n
Ejemplo: Durante los ltimos 32 das el valor de las compras en peridicos fue:
{ 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.2, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 }
El promedio aritmtico del valor de las compras de peridicos es:
n
250.2 = 7.82 32
fi X i x=
Donde:
i=1
Ejemplo: Para los gastos diarios en peridicos del hotel agrupados en una tabla de frecuencia:
Intervalo 5.2 - 6.1 6.1 - 7.0 7.0 - 7.9 7.9 - 8.8 8.8 - 9.7 9.7 - 10.6 TOTAL
Xi
5.65 6.55 7.45 8.35 9.25 10.15
fi
3 5 9 7 5 3 32
hi
0.094 0.156 0.281 0.219 0.156 0.094 1.000
Fi
3 8 17 24 29 32
Hi
0.094 0.250 0.531 0.750 0.906 1.000
7.87
fi X i x=
i=1
Durante los 32 das el hotel tuvo un gasto promedio en peridicos de 7.87 soles
Arturo Rubio
2. LA MEDIANA Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores. Para Datos No agrupados. (n + 1) La ubicacin de la mediana de n datos ordenados se determina por : . Ejemplos: 2 En los 7datos ordenados: {4, 5, 5, 6, 7, 8, 9 } (7 + 1) La ubicacin de la mediana es: = 4 Luego el valor de la mediana es: Me=6 2 En los 8 datos ordenados: {3, 4, 5, 5, 6, 7, 8, 9} (8 + 1) 5+6 = 5.5 La mediana se ubica en el lugar = 4.5 Luego el valor de la mediana es M e = 2 2 Para Datos Agrupados.
c Me = Li +
Donde: Li Fi-1 fi Hi-1 hi c
= Lmite Inferior del intervalo que contiene a la Mediana = Frecuencia Acumulada en la clase anterior i-sima = Frecuencia en la clase que contiene a la mediana = Frecuencia Relativa Acumulada en la clase anterior i-sima = Frecuencia Relativa en la clase que contiene a la mediana =Tamao del intervalo de clase.
Ejemplo: Para los gastos diarios en peridicos del hotel en una tabla de frecuencia:
Intervalo 5.2 - 6.1 6.1 - 7.0 7.0 - 7.9 7.9 - 8.8 8.8 - 9.7 9.7 - 10.6 TOTAL
Xi
5.65 6.55 7.45 8.35 9.25 10.15
fi
3 5 9 7 5 3 32
hi
0.094 0.156 0.281 0.219 0.156 0.094 1.000
Fi
3 8 17 24 29 32
Hi
0.094 0.250 0.531 0.750 0.906 1.000
Me=7.8
0.9
La Mediana es:
32 9
Me = 7.0 +
8 2
= 7.0+
El 50% de los das el hotel gast menos de 7.8 soles en la compra de peridicos
0.50
0.50
7.8
Arturo Rubio
3. LA MODA Es el valor, clase o categora que ocurre con mayor frecuencia y sus caractersticas son: - Puede no existir o existir ms de una moda - Su valor no se ve afectado por los valores extremos en los datos - Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa - Es una medida inestable cuando en nmero de datos es reducido. Para Datos No Agrupados.
Por ejemplo, durante los ltimos 32 das el valor de las compras en peridicos fue: { 5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 } Moda = Mo = 7.1; Para Datos Agrupados. Es el valor ms frecuente, ocurre 3 veces.
M o = Li + c
Donde:
d1 d1 + d 2
d1=(fi - fi-1)
d1=(fi - fi+1)
Ejemplo: El gasto diario en peridicos del hotel AAA agrupados en una tabla de frecuencia:
Intervalo 5.2 - 6.1 6.1 - 7.0 7.0 - 7.9 7.9 - 8.8 8.8 - 9.7 9.7 - 10.6 TOTAL
Xi
5.65 6.55 7.45 8.35 9.25 10.15
fi
3 5 9 7 5 3 32
hi
0.094 0.156 0.281 0.219 0.156 0.094 1.000
Fi
3 8 17 24 29 32
Hi
0.094 0.250 0.531 0.750 0.906 1.000
Mo=7.6
d1= 9-5 = 4 d2= 9-7 = 2 c= 0.9 = Tamao de Intervalo de Clase La moda estimada utilizando estos datos agrupados es:
M o = 7.0 + (0.9)
M o = 7.0 + (0.9)
Arturo Rubio
4. MEDIA GEOMTRICA Corresponde al valor representativo central de observaciones secuenciales y estrechamente relacionadas entre s tales como tasas de: inters, inflacin, devaluacin, variacin, crecimiento, disminucin. El promedio geomtrico de los valores: (Xi X2 .... Xf ) es:
XG =t
Xf Xi
Ejemplo: La tasa de inters mensual que se pag por un prstamo recibido por 3 meses fue cambiando mes a mes; en el primer mes se pag un inters de 15%, en el segundo mes 10% y en el tercer mes 16%.La tasa de inters promedio mensual que se pag es: Mes Tasa Factor 1 0.15 1.15 2 0.10 1.10 3 0.16 1.16 (13.6% mensual)
Ejemplo: El Producto Bruto Interno de un pas durante los ltimos cinco aos tuvo la evolucin siguiente: Ao1: +5%. Ao 2: 0% Ao3: - 1% Ao 4: +2% y Ao5: + 4%. La tasa de crecimiento anual promedio del PBI sera: X G = 5 (1.05)(1.00)(0.99)(1.02)(1.04) = 1.0197 (1.97% anual) Ejemplo: Se recibi un prstamo de 1000 soles por 3 meses y al final del perodo se pag un total 1467.40 soles; Cul fue la tasa promedio de inters mensual que se pag?
Mes Saldo
0 1000
Mes 1
Mes 2
Mes 3 1467.40
XG =3
(13.6%)mensual
5. PROMEDIO PONDERADO Cuando se desea encontrar el promedio de valores (X1 X2 ... Xk ) que ocurren con frecuencias (f 1 f2 ... fk ) diferentes se debern ponderar los valores observados con pesos diferentes:
K
x=
i =1
Wi X i
Donde los valores Wi=fi/n se denominan ponderaciones o pesos Ejemplo: En una agencia de viajes se han vendido 200 pasajes a los precios siguientes: Nmero de pasajes Ponderacin Precio de Venta (soles) Xi fi Wi 12 60 0.30 14 100 0.50 16 40 0.20 Total 200 1.00 El precio promedio de venta de los 200 pasajes: x=0.30( 12 ) + 0.50( 14 ) + 0.20( 16 ) = 13.8
Arturo Rubio
6. PROMEDIO TOTAL Corresponde al valor promedio representativo de grupos de observaciones separadas o diferentes y que podran estar consolidadas en tablas de frecuencia independientes, por tanto:
XT =
ni:
n 1X 1 + n 2 X 2 + ...nk X k n1 + n 2 + .... + n k
xA =
xB =
fi 25 40 65
Promedio Total
Xi
12.7 10.0
A B Totla
xT =
7. MEDIA ARMNICA El promedio armnico de los valores: (X1 X2 ..... X n ) donde ninguno toma el valor cero es: X H= n 1 1 1 1 + + ........ + x1 x 2 x 3 xn
Este promedio se utiliza para que los valores extremos no afecten al valor del promedio. Los valores extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico. Ejemplo: Calcular el rendimiento promedio para el caso de tres automviles que recorrieron 500 kilmetros y cada auto tuvo el rendimiento siguiente: Auto Rendimiento (Km/galn) A 50 B 62.4 C 77.6
X H=
XH=
Arturo Rubio
PERCENTILES, CUARTILES Y DECILES Para Datos Agrupados Son 99 valores que dividen a un conjunto de datos en 100 partes iguales
Percentiles:
c Pk = Li +
Li Fi-1 fi c k
kn
F 100 i-1 fi
= Lmite Inferior del intervalo que contiene al Percentil = Frecuencia Acumulada en la clase anterior k-sima = Frecuencia en la clase que contiene al Percentil =Tamao del intervalo de clase. = 1%, 2%, 3%, ... , 97%, 98%, 99% Percentiles Marca de Clase Xi 5.65 6.55 7.45 8.35 9.25 10.15 Frecuencia Absoluta fi 3 5 9 7 5 3 32 Frecuencia Relativa hi 0.094 0.156 0.281 0.219 0.156 0.094 1.000 Frec.Acum. Absoluta Fi 3 8 17 24 29 32 Frec. Acum. Relativa Hi 0.094 0.250 0.531 0.750 0.906 1.000
Intervalo De Clase 5.2 - 6.1 6.1 - 7.0 7.0 - 7.9 7.9 - 8.8 8.8 - 9.7 9.7 - 10.6 TOTAL
P80% = Li +
El 80% de los datos analizados sern menores a 9.088 y el 20% restante sern superiores Cuartiles: Son 3 valores Q1; Q2 y Q3 que dividen a los datos en 4 partes iguales
P75% = Li +
0.9( 24 17 ) = 8.8 7
75% de los datos sern menores a 8.8 y el 25% de los datos restantes sern superiores Deciles: Son 9 valores D1, D2; D3; D4; D5; D6; D7; D8 y D9 que dividen a un conjunto de datos en 10 partes iguales. El Decil 7(Percentil 70%) se ubicar en el cuarto intervalo
P70% = Li +
70% de los datos sern menores a 8.594 y el 30% restante sern superiores a 8.594.
0.70 8.594
Arturo Rubio
El lugar o posicin donde se encuentran los cuartiles para n datos ordenados es: Cuartel Posicin Q1 =P25% 25( n + 1) 100 Q2 =P50% 50( n + 1) 100 Q3 =P75% 75( n + 1) 100
Ejemplo: Para la representacin tallo hoja de los gastos en peridicos del hotel: Tallo Hojas 237 5 24568 6 001125788 7 2233456 8 01246 9 10 1 2 2
3 8 (9) 15 8 3
Determine los 3 cuartiles correspondientes a los 32 datos ordenados: Cuartil Q1=P25% Q2=P50% Q3=P75% Posicin Valor Q1=6.8+(7.0-6.8)0.25= 6.85 Q2=7.8+(7.8-7.8)0.50= 7.80 Q3=8.6+(9.0-8.6)0.75= 8.90
Entre qu valores est el 80% central de los gastos diarios en peridicos? Percentil P10 P90 Posicin Valor P10%=5.7+(6.2-5.7)0.3=5.85 P90%=9.6+(10.1-9.6)0.7=9.95
El 80% de los gastos diarios en peridicos est definido entre los 5.85 y 9.95 soles
0.10
0.80
0.10
5.85
9.95
Arturo Rubio
B. MEDIDAS DE VARIABILIDAD 1. AMPLITUD O RANGO Sean los valores: (x1 x2 x3 ... xn ). La amplitud o rango de estos dato es A=(Xmax-Xmin) 2. VARIANCIA Para Datos No Agrupados
X i2 nX 2 S2 =
i =1
n 1
Xi x=
i =1
n
n
=
i 2
3 + 4 + 6 + 7 20 = =5 4 4
2 2 2 2 2 2
X nX S =
2 i =1
n 1
3 + 4 + 6 + 7 4(5) 10 = = 3.333 4 1 3
La variancia de los valores: (x1 x2 ... xk ) que ocurren con las frecuencias (f1 f2 ... fk ) es:
n
f i X i2 nX 2 S2 =
i =1
n 1
Ejemplo: Los gastos diarios en peridicos del hotel agrupados en la tabla de frecuencia: Los clculos necesarios para determinar la variancia de los gastos diarios son: Intervalo Xi fi fiXi fiXi 3 16.95 95.7675 5.2 - 6.1 5.65 n 5 32.75 214.5125 6.1 - 7.0 6.55 f i X i2 nX 2 2034 .74 32(7.8719 ) 2 9 67.05 499.5225 7.0 - 7.9 7.45 S 2 = i =1 = = 1.671 n 1 32 1 7 58.45 488.0575 7.9 - 8.8 8.35 5 46.25 427.8125 8.8 - 9.7 9.25 3 30.45 309.0675 9.7 - 10.6 10.15 TOTAL 32 251.9 2034.74 3. DESVIACIN ESTNDAR Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este indicador tiene la misma unidad de medida en la que se expresa el promedio. S = S 2 = 1.671 = 1.293 soles S=1.293
Arturo Rubio
4. COEFICIENTE DE VARIABILIDAD Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara la desviacin estndar con el respectivo valor del promedio de los datos: S x100 x Grado de variabilidad de los datos Coeficiente de variabilidad Con variabilidad baja Menos de 10% Con variabilidad moderada De 10% a 30% Con alta variabilidad Ms de 30% 1.293 En el ejemplo anterior el coeficiente de variabilidad es: x100 = 16.4% C.V . = 7.87 C. MEDIDA DE FORMA: ASIMETRIA O SESGO C.V . = Evala el grado de distorsin o inclinacin que adopta la distribucin de los datos respecto a su valor promedio tomado como centro de gravedad. El coeficiente de asimetra de Pearson es:
AK =
Grado de Asimetra Simetra Perfecta Sesgo Positivo Sesgo Negativo
3( X M e ) S
Valor del Sesgo Cero. El promedio es igual a la mediana Positivo. Promedio mayor que la mediana Negativo. Promedio menor que mediana
Simtrica Promedio=Mediana
En el ejemplo sobre los gastos diarios en peridicos el Promedio es 7.87 le Mediana es 7.80 y la desviacin estndar 1.293, por tanto el sesgo es ligeramente positivo +0.16 D. MEDIDA DE FORMA: CURTOSIS Evala el grado de apuntamiento de la distribucin, el coeficiente es: K U = Grado de Apuntamiento Mesocurtica (Distribucin normal) Leptocrtica (Elevada) Platicrtica (Aplanada)
Valor de la Curtosis 0.263 Mayor a 0.263 se aproxima a 0.5 Menor a 0.263 se aproxima a 0
Ku=0.263
Ku>0.263
Ku<0.263
Mesocrtica Leptocrtica Platicrtica En el ejemplo de los gastos diarios en peridicos como Q3=8.8; Q2=7.0; P90=9.7 y P10=6.1 la curtosis de la distribucin es 0.25; por tanto, la distribucin es ligeramente platicrtica.
Arturo Rubio
10 10
GRFICOS DE CAJAS Tercer Cuartil: Segundo Cuartil: Primer Cuartil: Rango Intercuatlico: Lmite inferior: Lmite Superior:
Q3= 8.8 Q2= 7.8 Q1= 7.0 IQR= Q3-Q1=8.8 -7.0=1.8 Q1-1.5(IQR)= 7.0-1.5(1.8)=4.3 Q3+1.5(IQR)= 8.8+1.5(1.8)=11.5
4.3
7.0
7.8
8.8
11.5
La mitad (50%) de los datos son menores a 7.8 La mitad (50%) de los datos toman valores entre 7.0 y 8.8 La cuarta parte (25%) de los datos son menores a 7.0 (Antes de Primer Cuartil) La cuarta parte (25%) de los datos toman valores entre a 7.0 y 7.8 La cuarta parte (25%) de los datos toman valores entre a 7.8 y 8.8 La cuarta parte (25%) de los datos son mayores a 8.8 (Despus del Tercer Cuartil) Los datos tienen mayor variabilidad entre 7.8 y 8.8. Los datos superiores a 11.5 y los datos inferiores a 4.3 se denominan ATPICOS
( 68% )
7.87
6.577 5.284 3.991 9.163
( 95% ) ( 99.7% )
10.456 11.749
Si el Promedio es 7.87 y Desviacin estndar 1.293 podremos afirmar que: 68% (22 datos) estn entre: [7.87+1(1.293)]=9.163 y entre [7.87-1(1.293)]=6.577 95% (30 datos) estn entre: [7.87+2(1.293)]=10.456 y entre [7.87-2(1.293)]=5.284 99.7% (32 datos) estn entre: [7.87+3(1.293)]=11.749 y entre [7.87-3(1.293)]=3.991
Arturo Rubio
11 11
TRANSFORMACIONES LINEALES DE VARIABLES Si la variable Xi tiene promedio X y variancia S El promedio de la variables Yi es : La variancia de la variables Yi es: La desviacin estndar de la variables Yi es:
2 x
Yi=aX i+b
Y = aX i + b S2Y=a2S2X SY=a SX
Ejemplo: Las calificaciones de un examen de estadstica son: Nota 0-4 4-8 8-12 12-16 16-20 Total Xi 2 6 10 14 18 fi 3 10 39 38 7 97 Fi 3 13 52 90 97 f i Xi 6 60 390 532 126 1114 f iX i 12 360 3900 7448 2268 13988
2
Promedio = 11.4845 Mediana = 11.641 Moda = 11.867 Variancia = 12.44 Desviacin estndar = 3.53 Si el profesor decide transformar las calificaciones en la forma: Yi=0.8Xi+2 El promedio de la notas modificadas Yi es : La mediana de la notas modificadas Yi es : La moda de la notas modificadas Yi es : La variancia de la variables Yi es: La desviacin estndar de la variables Yi es:
Y = 0.8(11.4845) + 2 = 11.1876
Me =0.8(11.641)+2=11.313 Mo =0.8(11.867)+2=11.493
Verificacin: Utilizando la tabla de frecuencia transformada donde c=3.2: Nota 2-5.2 5.2-8.4 8.4-11.6 11.6-14.8 14.8-18.0 Total Yi 3.6 6.8 10.0 13.2 16.4 fi 3 10 39 38 7 97 Fi 3 13 52 90 97 fiYi 10.8 68.0 390.0 501.6 114.8 1085.2 fi Y i 38.88 462.40 3900.00 6621.12 1882.72 12905.12
2
Promedio = 11.1876 Mediana = 11.313 Moda = 11.493 Variancia = 7.96 Desviacin estndar = 2.82
Arturo Rubio
12 12