Sie sind auf Seite 1von 14

1.5.

Medidas de tendencia central


Las medidas de tendencia central se refieren al valor que representa a los datos de una
determinada variable.

Moda
La moda de un conjunto de datos observados de una variable es el valor que se presenta con
mayor frecuencia.

Caractersticas de la moda
La moda se puede calcular para datos medidos en cualquier escala de medicin.
El valor de la moda no se ve afectado por valores extremos.
La moda no siempre es un valor nico. Una serie de datos puede tener dos modas (bimodal) o
ms modas (multimodal).

Moda de datos no agrupados


Agrupe los datos de acuerdo con sus frecuencias, el dato con mayor frecuencia es la moda.
Ejemplo 1
Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos
comprados por 14 clientes de cierto supermercado.
2

Calcule e interprete la moda de los siguientes datos, que representa el nmero de artculos
comprados por 14 clientes de cierto supermercado.
2

80

80

19

Ejemplo 2
En la empresa A, se midi el nmero de errores por da que cometieron 158 obreros al ensamblar
un determinado producto. Calcule e interprete la moda del nmero de errores por obrero.
Empresa A. Nmero de errores al ensamblar el producto
Nmero de errores Nmero de obreros
0

25

45

60

28

Fuente: Gerencia de Produccin. Empresa A

Mediana
Es el percentil 50, tambin llamado segundo cuartil.

Caractersticas de la mediana
Se puede calcular para variables medidas en escala de ordinal, intervalo o razn.
La mediana es un estadstico que no se ve afectado por valores extremos. Por eso se le utiliza
cuando hay datos inusuales o el polgono de frecuencias no es muy simtrico.

Ejemplo 3
El tiempo, en horas, que se tarda un grupo de obreros, capacitados y no capacitados, en realizar
una tarea se muestra en la siguiente tabla.
Capacitados

4,5

4,3

2,7

8,2

8,3

6,4

5,4

No capacitados

8,3

7,4

8,5

8,5

9,0

8,4

18

3,4

2,7

5,6

Calcule e interprete la mediana del tiempo para cada grupo. Compare los valores hallados y
comente.

20

Ejemplo 4
En la empresa A se tom una muestra aleatoria de trabajadores y se les pregunt por sus ingresos
mensuales, en dlares, obtenindose los siguientes resultados.
Distribucin de trabajadores por sus ingresos mensuales (en dlares)
Ingresos (en dlares)
[

Marca de clase
]

Nmero de trabajadores
30

175

225

200

45

225

275

250

190

275

325

300

140

275

325

325

2600

130
2500

25

Fuente: Gerencia de Recursos Humanos. Empresa A

Complete la tabla de distribucin de frecuencias y calcule la mediana del ingreso. Interprete.

Media Aritmtica
La media aritmtica es el valor que se obtiene al dividir la suma total de los datos entre el nmero
de datos.

Caractersticas de la media
Se puede calcular para datos medidos en escala de intervalo o razn.
El clculo de la media es sencillo y es la medida de tendencia central ms conocida.
El valor de la media depende de todos los datos, por lo que la presencia de valores muy
grandes o muy pequeos con respecto a los dems pueden cambiar drsticamente su valor.

Si cada uno de los n valores xi es transformado en: yi = a xi + b, siendo a y b constantes,


entonces, la media de los n valores yi es:

y = ax + b
n

= nx

i =1

21

(x

x) = 0

i =1

Dados n datos x1, x2,, xn, sea S (c ) =

(x

2
c ) , entonces S (c ) tiene mnimo absoluto

i =1

cuando c es igual a la media del conjunto de datos x .

Media aritmtica para datos no agrupados


n

i =1

x=

Ejemplo 5
Calcule e interprete la media de los siguientes datos que representan el nmero de papeletas
pendientes de pago de cada uno de 11 choferes de vehculos de transporte pblico seleccionados
al azar.
12

13

25

20

17

19

15

14

28

Ejemplo 6
En la empresa A, se midi el nmero de errores que cometieron 158 obreros al ensamblar un
determinado producto. Calcule e interprete la media del nmero de errores por obrero.
Empresa A. Nmero de errores al ensamblar un producto
Nmero de errores Nmero de obreros
0

25

45

60

28

Fuente: Gerencia de Recursos Humanos. Empresa A

Media aritmtica para datos en una distribucin de frecuencias por intervalos


Dados n datos cuantitativos organizados en una distribucin de frecuencias con k intervalos, con
marcas de clase mi, frecuencias absolutas ni y tales que
= , entonces, el valor
aproximado de la media aritmtica es:
k

m n

i i

x=

i =1

m f

i i

i =1

22

Ejemplo 7
En el distrito A se tom una muestra aleatoria de jvenes y se les pregunt por su estatura, en
centmetros, obtenindose los siguientes resultados.
Distrito A. Estaturas de una muestra de 800 jvenes
Marca de
clase

Estatura (en centmetros)


[

150

Nmero de
jvenes

Porcentaje
de jvenes

Nmero
acumulado
de jvenes

166

Porcentaje
acumulado
de jvenes
0,48

32%
0,95
800

Fuente: Gerencia de Desarrollo Humano. Municipalidad del distrito A

Complete la tabla de distribucin de frecuencias. Calcule e interprete la estatura media y la


estatura mediana. Compare los valores hallados.

Media aritmtica ponderada


Dados n datos x1, x2,, xn con pesos w1, w2,, wn la media aritmtica ponderada de los datos es:
n

xp =

w x
i =i
n

w
i =1

Si todos los pesos son iguales, entonces x p = x


Ejemplo 8
Calcule la nota final de un alumno del curso de Estadstica de Estudios Generales Ciencias que
tiene las siguientes notas: prctica calificada 1 = 18, prctica calificada 2 = 10, prctica calificada 3
= 12, prctica calificada 4 = 15, examen parcial = 14 y examen final = 9. Los pesos del promedio de
prcticas, examen parcial y examen final son 3, 3 y 4, respectivamente. La prctica con menor nota
se anula.

23

1.6. Medidas de dispersin


Con las medidas de tendencia central es posible determinar el valor que representa a los datos
de un conjunto, pero no indica qu tan cercanos o lejanos estn los datos de dicho valor
central.
Las medidas de variabilidad indican cun alejados estn los datos del valor que los representa.
Ejemplo 9
Calcule la media, mediana y moda de los siguientes grupos de datos:
Grupo 1
1

-20

30

Grupo 2

Grupo 3

Qu conclusin deduce de los clculos?

Rango
El rango (alcance, amplitud o recorrido) de un conjunto de datos observados se define como:
R = valor mximo valor mnimo

Caractersticas del rango


Se puede calcular en variables medidas en escala de intervalo y de razn.
Se ve afectado por valores extremos.
Solo depende del valor mximo y mnimo de los datos e ignora cmo estn distribuidos los
dems.
El rango es la longitud del intervalo de variacin de los datos.

24

Rango intercuartil
Es la diferencia entre el tercer y primer cuartil.
Rango intercuartil = RIC = Q3 Q1= P75 P25

Caractersticas del rango intercuartil


Se puede calcular en variables medidas en escala de intervalo y de razn.
No se ve afectado por valores extremos.

Diagrama de cajas
Es una grfica que describe la distribucin de un conjunto de datos tomando como referencia los
valores de los cuartiles como medidas de posicin, la mediana como medida de tendencia central
y el valor del rango intercuartil como medida de dispersin. Adems, permite apreciar la forma de
la distribucin de los datos (simtrica o asimtrica).

Dato atpico
Es un dato inusualmente grande o pequeo con respecto a los otros datos. Se considera dato
atpico a cualquier valor que est:
o a ms de 1,5(RIC) por arriba (o a la derecha) del tercer cuartil
o a ms de 1,5(RIC) por debajo (o a la izquierda) del primer cuartil

Pasos para trazar un diagrama de cajas


o
o
o

o
o
o

Sobre un eje horizontal, se traza un rectngulo con los extremos en el primer cuartil (Q1) y
tercer cuartil (Q3).
En la caja rectangular se traza un segmento vertical en el lugar de la mediana.
Se determinan los lmites para deteccin de datos atpicos:
- el lmite superior est a 1,5(RIC) a la derecha de Q3
- el lmite inferior est a 1,5(RIC) a la izquierda de Q1
Se detectan los datos atpicos.
Se trazan los bigotes desde los extremos de la caja hasta los datos mnimo y mximo dentro de
los lmites inferior y superior.
Se marcan con un asterisco (*) las localizaciones de los datos atpicos (datos fuera de los
lmites superior e inferior).
25

La siguiente figura presenta un diagrama de cajas con datos hipotticos.

Ejemplo 10
Se seleccion una muestra de 45 viviendas y se registr el monto cobrado por la empresa
proveedora por consumo de luz en el ltimo mes. Obtenga un diagrama de cajas para mostrar la
distribucin de los montos cobrados.
10,7 45,0 59,8 65,7 87,4 97,1 98,1 98,8 99,2 99,5 99,6 99,7 102,4 106,3 107,3
108,2 108,7 109,2 109,3 109,9 111,4 112,1 112,6 112,9 115,0 115,4 116,4 116,5 119,1 119,2
119,6 120,4 120,6 121,5 122,1 122,7 124,0 124,5 124,9 125,1 125,2 127,1 128,1 129,0 200,8

Diagramas de caja comparativos


Una ventaja de los diagramas de cajas es que se pueden presentar varios juntos, ello permite la
fcil comparacin visual de las caractersticas de varios conjuntos de datos.
Los diagramas de caja permiten comparar las distribuciones de los valores de una variable
cuantitativa en los diferentes niveles de otra variable cualitativa.

26

Ejemplo 11
Se desea comparar el resultado de la primera prctica de tres horarios de Estadstica de EEGGCC,
para lo cual, se tienen los siguientes resultados.
H
1
H
2
H
3

0
1
1

2
1
2

3
1
2

4
1
2

1
1
1
3

1
1
1
3

1
2
1
4

1
2
1
4
1
0

1
2
1
4
1
1

1
2
1
4
1
1

1
2
1
4
1
2

1
2
1
4
1
2

1
2
1
5
1
3

1
3
1
5
1
3

1
3
1
6
1
3

1
3
1
6
1
4

1
4
1
6
1
5

1
4
1
6
1
5

1
5
1
6
1
6

1
5
1
7
1
6

1
5
1
7
1
6

1
5
1
8
1
7

1
5
1
8
1
7

1
5
1
8
1
7

2
0
1
8

2
0

Construya un diagrama de cajas que permita comparar las notas en los tres horarios.

Desviacin absoluta
Dados n datos x1, x2,, xn la desviacin absoluta de los datos se define como:
n

D. A. =

x x
i

i =1

La desviacin absoluta es la media de los valores absolutos de las desviaciones a la media.


Se calcula para datos medidos en escala de intervalo o de razn.

Desviacin estndar
Dados n datos x1, x2,, xn la desviacin estndar de los datos se define como:
n

sd x =

(x
i =1

x)

La desviacin estndar de los datos es la media cuadrtica de las desviaciones a la media.


Es siempre mayor o igual a cero.
Se calcula para datos medidos en escala de intervalo o de razn.
Ejemplo 12
Las notas de cuatro alumnos son x1 = 6, x2 = 11, x3 = 15, x4 = 16.
6 + 11 + 15 + 16
= 12.
4
Las diferencias de cada valor con la media son d1 = 6 12 = -6, d2 = 11 - 12 = -1, d3 = 15 - 12 = 3, d4
= 16 - 12 = 4.

Luego la media aritmtica de las notas es x =

Luego, la desviacin estndar es sd x =

( 6) 2 + ( 1) 2 + 32 + 4 2
= 3.937
4

27

Ejemplo 13
Calcule e interprete la media y la desviacin estndar de los siguientes datos que representan el
nmero de personas atendidas por da en la caseta de informacin de un proyecto inmobiliario, en
una muestra de 15 das.
18

10

11

Ejemplo 14
Calcule la desviacin estndar de los siguientes datos.
xi

ni

20

85

48

120

26

150

45

Desviacin estndar de datos organizados en una distribucin de


frecuencias por intervalos
k

n (m x )

sd x =

i =1

f (m x )

i =1

Ejemplo 15
Calcule la media y la desviacin estndar de los siguientes datos.
Intervalos
[2,5

Marca de clase
12,0]

ni
9
75
56

8
4

28

Varianza
Dados n datos x1, x2,, xn la varianza de los datos se define como sd x2 = (sd x )

Se cumple que sd =
2
x

(x
i =1

x)

n
x
xi

i =1
=
i =1
n
n

2
i

Propiedades de la varianza y la desviacin estndar


La varianza y la desviacin estndar son nmeros no negativos.
Son sensibles a la existencia de valores atpicos.
La varianza est expresada en unidades cuadrticas a las de los datos, mientras que las de la
desviacin estndar son las mismas. Por ejemplo, si los datos estn expresado en kilos, la
varianza estar expresada en kilos2 y la desviacin estndar en kilos.
Si cada uno de los n valores xi es transformado en yi = a xi + b, siendo a y b constantes,
entonces, la varianza de los n valores yi es

sd y2 = a 2 sd x2 , de donde sd y = a sd x
Ejemplo 16
En una ciudad, se ha registrado el precio, en varias tiendas, de varillas de acero de 12 mm,
encontrndose un precio medio de 19,80 nuevos soles y una desviacin estndar de 0,85 nuevos
soles. Si los precios se redujeran en un 5% en todas las tiendas, calcule el nuevo precio medio y la
nueva desviacin estndar de los precios.

Coeficiente de variacin
El coeficiente de variacin (CV) de un conjunto de datos indica qu proporcin de la media es la
desviacin estndar.
La frmula para el coeficiente de variacin para una muestra es

CV =

sd x
x

Es til al comparar la variabilidad de dos o ms series de datos que se miden en distintas o


iguales unidades, pero difieren a tal punto que una comparacin directa de las respectivas
desviaciones estndar no es muy til, por ejemplo, cuando las medias estn muy distantes.
Ejemplo 17
En una tienda, el precio medio y la desviacin estndar del precio de los jeans es de 74 y 15,4
nuevos soles, respectivamente. Si se rebaja 10 nuevos soles a todos los precios, calcule e
interprete el nuevo coeficiente de variacin de los precios.
29

Ejemplo 18
El coeficiente de variacin de los salarios un grupo de trabajadores es 0,12. Si se aprueba un
aumento del 20% ms una bonificacin especial de S/.115, el nuevo coeficiente de variacin ser
igual a 0,06. Determine el valor de la media y la varianza de los salarios de los obreros, antes y
despus del aumento.
Ejemplo 19
El siguiente cuadro muestra la distribucin de sueldos mensuales de los empleados de dos
empresas A y B en el mes de julio del 2011.
Empresas A y B. Sueldos mensuales en diciembre del 2011
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[2 500 3 500]

14

]3 500 4 500]

25

25

]4 500 5 500]

35

83

]5 500 6 500]

15

Fuente: Gerencias de Recursos Humanos Empresa A y B.

a. Cul de los grupos presenta mayor variabilidad de sueldos?


b. Si en la empresa A se aprueba un aumento de sueldo del 25%, mientras que en la B se da una
bonificacin de 320 nuevos soles, cul de los grupos presenta mayor variabilidad de sueldos,
luego de los cambios?

Puntuacin estandarizada Z
Indica a cuntas desviaciones estndar, por arriba o por debajo de la media, se encuentra un valor.
Permite comparar los resultados de un individuo en distintas pruebas en las que las
distribuciones de los resultados de los otros miembros de la poblacin sean distintas.
Si los datos son xi, i = 1, 2,, n, entonces los datos estandarizados son:
zi =

xi x
sd x

i = 1, 2,, n

Se tiene que z = 0 y que sd z = 1


Ejemplo 20
Un conjunto de alumnos rindi dos exmenes. En el primer examen, la nota media fue 13,4 y la
desviacin estndar de 2,3, mientras que en el segundo examen la nota media fue 15,4 y la
desviacin estndar 4,3. Una persona obtuvo 14 en el primer examen y 16 en el segundo examen.
En trminos de los resultados de los exmenes, en cul de ellos tuvo un mejor resultado?

30

1.7. Indicadores de asimetra


Mide si los datos aparecen ubicados simtricamente o no respecto a una medida de tendencia
central.

Distribucin de frecuencias simtrica


Una distribucin de frecuencias de k clases es simtrica, si se cumple que
f 2 = f k 1 , f 3 = f k 2 , ...

f1 = f k ,

Coeficiente de asimetra de Pearson para datos agrupados o no agrupados


El coeficiente de asimetra para datos simples o agrupados se calcula con la siguiente frmula:

x Q2
As = 3
sd x

Si el coeficiente de asimetra (As) es


igual a cero, la distribucin es simtrica alrededor de la media.
positivo, indica sesgo a la derecha (cola derecha).
negativo, indica sesgo a la izquierda (cola izquierda).

Ejemplo 21
El salario, en cientos de nuevos soles, de los trabajadores una empresa se presenta a continuacin:
25

14

19

14

15

16

15

15

18

15

52

24

36

15

15

23

24

Calcule e interprete el coeficiente de asimetra de Pearson.

31

Ejemplo 22
El siguiente cuadro muestra la distribucin del sueldo mensual de los empleados de dos empresas
A y B en julio del 2011.
Empresas A y B. Sueldos mensuales en julio del 2012
Sueldos (en nuevos soles) Empleados de la empresa A Empleados de la empresa B
[1 500 2 500]

]2 500 3 500]

40

]3 500 4 500]

12

25

]4 500 5 500]

]5 500 6 500]

Fuente: Gerencias de Recursos Humanos Empresas A y B.

Compare las distribuciones de los sueldos en A y B usando medidas de tendencia central,


dispersin y asimetra. Use un grfico adecuado para comparar estas distribuciones.

32

Das könnte Ihnen auch gefallen