Sie sind auf Seite 1von 39

Estadstica Descriptiva

PARTE 1

Dr. Vctor Pastor Talledo

FUNDAMENTOS DE ESTADSTICA

CAPITULO I
CONCEPTOS BSICOS
1.1. Qu es la Estadstica?
Es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos
para ayudar en una toma de decisiones ms efectiva.
Para realizar esto, la Estadstica toma en cuenta las siguientes acciones:
Coleccin y recoleccin de datos
Ordenamiento de datos
Clasificacin de datos
Presentacin numrica
Presentacin grfica
Clculo de estadgrafos
Relacin entre dos o ms variables
Proyeccin de datos
Anlisis e interpretacin de datos
1.2 Definicin de trminos estadsticos
1. Estadgrafo. Es cualquier funcin de datos empricos que se usa con fines
descriptivos o analticos; son MEDIDAS DE RESUMEN
ESTADSTICO de un conjunto de datos. Por ejemplo: la media
aritmtica, la mediana, la varianza, el coeficiente de correlacin,
etc.
2. Parmetro. Es el valor obtenido para describir en forma resumida las
caractersticas pertinentes o ms importantes acerca de la
poblacin. Una poblacin puede tener muchas caractersticas y
por lo tanto muchos parmetros
Los parmetros son las MEDIDAS RESUMEN DE UNA
POBLACIN, en tanto que las medidas de una muestra se
llaman estadgrafos.
3.Poblacin.

Conjunto finito o infinito de elementos o datos que presentan


una caracterstica particular a ser analizada o estudiada. La
poblacin se presenta con la letra N. Ejemplos:
La poblacin formada por todos los alumnos del instituto
(poblacin finita o numerables)
Todas las veces que aparece un tres (3) al tirar un dado.

4. Muestra.

PARTE REPRESENTATIVA que se toma de una poblacin con el


fin de investigar sus caractersticas.
La muestra se representa con la letra n.

5. Variable.

Es toda la caracterstica sujeta a medida, cuenta o calificacin.

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

DATO QUE SUFRE VARIACIN dentro de una escala o


recorrido.
Las variables pueden ser cuantitativas o cualitativas.

a. Variable Cuantitativa.-

Se DESCRIBE MEDIANTE NMEROS. Los valores que pueden


ser ordenados y medidos. Esta variable a su vez se clasifica en:
DISCRETA:
Cuando toma VALORES ENTEROS, o es susceptible de
contar.
Generalmente se representa con X.
CONTINUA:
Toma VALORES FRACCIONADOS o es susceptible de
medir generalmente se representa con X.

b. Variable Cualitativa

Se expresa MEDIANTE PALABRAS o expresados de acuerdo


por su nombre.
Se clasifica en
ORDINAL
Son susceptibles de ordenamiento en forma implcita
NOMINAL
Se expresan mediante sus propias denominaciones
1.3 Clases de Estadstica
1. Estadstica Descriptiva
Aquella cuya finalidad es solamente la de DESCRIBIR EN FORMA
GENERAL un conjunto de datos, para posteriormente interpretarlos y
PREPARAR CONCLUSIONES GENERALES.
2. Estadstica Inferencial
Aquella que realiza un ESTUDIO DETALLADO de los elementos de una
determinada muestra para posteriormente poder PROYECTARLOS o
GENERALIZARLOS a la poblacin.

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

1.4 Etapas de la Investigacin Estadstica


La investigacin estadstica es fundamentalmente de TIPO DESCRIPTIVO,
se preocupa de la confiabilidad, validez y significacin de los datos, de las
muestras, as como de los mtodos y tcnicas de recoleccin y anlisis estadstico.
En este proceso se distinguen las siguientes fases:
1ra. Recoleccin de datos. Se refiere a los MECANISMOS DE OBTENCIN DE
LA INFORMACIN; stos son diversos y dependen de las posibilidades de
acceso o contacto con los elementos investigados, del tamao de la
poblacin y de la oportunidad de obtener datos.
2da. Organizacin de datos. Despus de la recoleccin de datos se realiza una
evaluacin, correccin y ajuste de datos. Luego se precede a la clasificacin
para la AGRUPACIN DE DATOS.
3ra. Presentacin de datos. Son los procedimientos de elaboracin de la
informacin para ser presentados de acuerdo a un plan de TABULACIN que
puede ser en TABLAS ESTADSTICAS, CUADRO RESUMEN o GRFICOS.
4ta. Anlisis e Interpretacin de datos. A travs de mtodos estadsticos, se
calculan INDICADORES y MEDIDAS DE RESUMEN, se establecen
relaciones entre dos o ms variables, se estiman valores, se ejecutan
pruebas estadsticas: como elementos de referencia para la descripcin,
anlisis e interpretacin del comportamiento de os datos, HACER
INFERENCIAS VALIDAS y OBTENER INFORMACIN DE LOS ELEMENTOS
o UNIDADES ESTUDIADAS.

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

CAPITULO II
DISTRIBUCIN DE FRECUENCIAS
2.1. Tipos de Presentacin de Datos Estadsticos
La presentacin de datos estadsticos se realiza en dos formas:
a. Presentacin Numrica: a travs de los CUADROS ESTADSTICOS y
TABLAS DE FRECUENCIAS.
b. Presentacin Grfica: a travs de una variedad de GRFICOS
ESTADSTICOS.
2.2 Presentacin Numrica
2.2.1 CUADROS ESTADSTICOS
El cuadro estadstico es el arreglo ORDENADO de columnas y filas de datos
estadsticos, con el objeto de ofrecer informacin estadstica de fcil lectura,
comparacin e interpretacin.
Partes Principales: En general un cuadro estadstico puede tener 8 partes:
1) Nmero del Cuadro: Cdigo o elemento de identificacin que permite ubicar
el cuadro en el interior de un documento.
2) Ttulo del Cuadro: Descripcin resumida del contenido del cuadro. Debe ser
breve, claro y completo. Un ttulo debe indicar:
a. QUE hay en el cuadro (caracterstica principal)
b. DONDE corresponde la informacin, se refiere al lugar geomtrico o
institucin
c. COMO estn ordenados o clasificados los datos
d. CUANDO que momento o perodo de tiempo est referida la informacin
3) Concepto o encabezamiento: Son las descripciones de las filas y columnas
del cuadro. El encabezamiento se ubica en la parte superior del cuadro.
Indica las variables y sus categoras o valores.
4) Cuerpo del cuadro: Contenido numrico del cuadro. Presenta la distribucin
de los elementos segn la clasificacin en categoras de las variables.
5) Notas del Pie o llamada: Usada para aclarar trminos o siglas.
6) Fuente: Indicacin al pie del cuadro, sirve para nombrar la publicacin,
entidad, estudio o fuente de donde se obtuvieron los datos.
7) Nota de Unidad de Medida: Se escribe debajo del ttulo original, usada
cuando se abrevia la escritura de las cifras y para indicar en que unidades
est expresada la variable.
8) Elaboracin: Menciona al responsable de la elaboracin del cuadro
estadstico final.

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

2.2.2 TABLA DE DISTRIBUCIN DE FRECUENCIA


Es el resumen que se realiza en funcin de la totalidad de elementos de una
poblacin con respecto a una caracterstica o variable de estudio.
Elementos de una tabla de distribucin de frecuencias
1) Variable ( Xi) Valor asociado a una determinada caracterstica que toma
diferentes valores
2) Frecuencia Absoluta (f i) Nmero de veces que se repite un dato, como valor de la
variable. La suma de las frecuencias absolutas debe corresponder al nmero de
datos (n), es decir:
f = n
3) Frecuencia Relativa (h i) Es el cociente de cada frecuencia absoluta entre el
nmero total de datos (n). Indica que porcentaje del total corresponde a cada
dato. Se calcula mediante:
fi
hi = -------n
La suma de las frecuencias relativas debe ser uno (100%)
4) Frecuencia Absoluta Acumulada (F i) Es la acumulacin de cada frecuencia
absoluta. Para determinar la frecuencia acumulativa, se suma la frecuencia
acumulada anterior a la frecuencia absoluta, se decir:
F 1 = f1
F 2 = f1 + f2
= F 1 + f2
F3 = f1 + f2 +f3
= F 2 + f3
lo que significa que la ltima frecuencia absoluta acumulada debe ser igual al
nmero de datos.
5) Frecuencia Relativa Acumulada (H i) Es la acumulacin de cada frecuencia
relativa. Se obtiene de forma similar a la frecuencia absoluta acumulada
lo que significa que la ltima frecuencia relativa acumulada debe ser igual a 1
Tambin:
Fi
Hi = -------n
6) Clases o Intervalos (m) Es el nmero de partes en que se divide a los elementos
de una poblacin. Cuando no est determinada, se calcula por la formula de
Sturges: m = 1 + 3.3 Log (n)
7) Amplitud (Ci) Es la diferencia entre el lmite superior e inferior de cada intervalo.
Es el tamao de cada clase. Indica el nmero de elementos que existe en cada
intervalo. Se calcula mediante:
Ci = L s - L i
donde: Ls : lmite superior
Li : Lmite inferior
8) Marca de clase (Yi) Es el punto medio de cada intervalo. Se calcula por:
Yi = (Ls + Li ) / 2
Ejemplo:

Estadstica Descriptiva

Intervalos

Dr. Vctor Pastor Talledo

Yi

fi

hi

Fi

Hi

sumas
2.3 Construccin de Tablas de frecuencias para Variables Cuantitativas
A. Para datos no agrupados
Por ser la informacin bastante pequea, no existen las tablas de frecuencias, y
nicamente los datos se presentan ordenados, en filas o columnas.
Ejemplo: En una encuesta se obtuvo la siguiente informacin referente a la edad
de 10 personas:
19
31
22
30
25
27
42
33
50
21
Ordenado los datos y presentndolos en columna se tiene:
Edades (Xi)
i
Xi
1
2
3
4
5
6
7
8
9
10

B. Para datos agrupados sin intervalos


Se procede de la siguiente manera:

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

1) Identificar la variable en estudio (Xi)


2) Ordenar los datos en forma creciente (o decreciente)
3) Efectuar la respectiva tabulacin de los datos
4) Calcular los elementos de la tabla de frecuencias
Ejemplo: En una encuesta de presupuestos familiares, se pregunt por el nmero de
hijos que tena cada familia. Se entrevistaron 20 familias obtenindose lo
siguiente:
1
2
4
3
6
3
3
8
2
4
6
4
1
0
3
2
2
1
2
2
Se pide completar la tabla de frecuencias:
i

Xi

Marca de
conteo

fi

1
2
3
4
5
6
7
sumas
Interpretando la tercera fila ( i = 3)
f3 =
h3 =
F3 =
H3 =

CAPITULO III
DISTRIBUCIN DE FRECUENCIAS (Continuacin)

hi

Fi

Hi

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

C. Para Datos Agrupados en Intervalos


Se procede de la siguiente manera:
1) Identificar la variable en estudio (X i)
2) Calcular el rango (R ) de los datos, mediante:
R = dato mayor - dato menor
3) Determinar el nmero de intervalos (m), en caso de que se desconozca
Regla de Sturges>>>>> m = 1+3.3 log(n)
4) Calcular la amplitud (C) para cada intervalo, mediante
C=R/m
5) Construir los intervalos, empezando por el dato menor, al cual se suma la
amplitud del intervalo.
6) Efectuar la tabulacin respectiva
7) Calcular cada uno de los elementos de la tabla de distribucin de frecuencias
Ejemplo: Las ventas mensuales de 50 restaurantes se dan a continuacin en
miles de soles
35
42
27
25
55
22
52
38
22
60
47
15
25
48
63
36
39
37
54
29
29
15
22
27
37
11
45
33
66
35
46
29
11
27
35
17
40
34
35
37
42
18
39
23
38
51
12
36
27
63
Se pide:
i) Clasificar los datos en una tabla de distribucin de frecuencias
ii) Interpretar ciertos elementos de dicha tabla
iii) Porcentaje de restaurante que tienen ventas mensuales menores de 35 mil
iv) Nmero de restaurante que tienen una venta mensual mayor o igual a 27 mil
Solucin (i)
1) Variable

Xi =

2) Rango

R=

3) Intervalos

m=

4) Amplitud

C=

Estadstica Descriptiva
ii) Tabla de frecuencias
i
Intervalos
Conteo
1

Dr. Vctor Pastor Talledo

Yi

fi

Fi

6
7

sumas

ii) Interpretar la tabla para i = 4


f4 =
h4 =
F4 =
H4 =
iii) Porcentaje de restaurantes que venden menos de 35 mil soles
iv) Nmero de restaurantes que venden ms o igual a 27 mil soles

hi

Hi

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

CAPITULO IV
GRFICOS ESTADSTICOS
4.1 Presentacin grfica de datos estadsticos
Un Grfico es una representacin pictrica con el objeto de ilustrar los cambios
de una variable, para comparar visualmente dos o ms variables similares o
relacionadas.
En estadstica se emplea una diversidad de grficos, cuya forma depender de
la naturaleza de los datos y del objetivo. Los grficos de una variable sirven
para comparar cantidades absolutas, tasas, variaciones, etc. y pueden tener
forma de columnas, barras, puntos o lneas. Los grficos de dos variables se
construyen en el plano cartesiano, teniendo en el eje X (abcisa) el registro de la
variable independiente; y en el eje Y (ordenada) se colocan los valores de la
variable dependiente.
Partes de un Grfico
En todo grfico se debe considerar el ttulo, leyenda, escala, fuente y
elaboracin; aunque dependiendo de la complejidad del grfico, los elementos
pueden variar
A. Ttulo: es una descripcin del contenido del grfico, explica el contenido
se coloca en la parte superior o inferior del grfico
B. Diagrama: es el propio dibujo del grfico, donde se encuentran ubicados los
datos.
C. Escala: es la unidad de medida que se considera en los ejes
D. Fuente: indica el origen de los datos, se ubica en la parte inferior del grfico
E. Leyenda. Hace referencia al diagrama.
Gastos por Categoras
(soles)
45
40
35
30
25
20
15
10
5
0
Comidas

Transporte

Ene

Feb

Mar

10

Abr

Alojamiento

May

Jun

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

4.2 Clasificacin de Grficos


A. Lineales
1. En coordenadas rectangulares
Diagramas de frecuencias
Polgonos de frecuencias
Histograma de frecuencias
Series cronolgicas
Nube de puntos, etc.
2. En coordenadas polares
Diagrama de telaraa
B. De Superficie, en este grupo se tiene:
Grficos de barras verticales, simples, compuestas
Grficos de barras horizontales, simples, compuestas
Coronas circulares
Pirmides
Cilindros, conos, etc.
C. Grficos de dimensiones
De rea, cuando se consideran dos dimensiones
De Volumen, cuando se consideran tres dimensiones
D. Mapas estadsticos o cartogramas
E. Pictogramas
4.3 Grfica de las Distribuciones de Frecuencias
3.3.1 Grfica de Variable Discreta
Este grfico se denomina grfico de bastones, donde en el eje X se
registran los valores de la variable (X i) y en el eje Y se indican las
frecuencias
Ejemplo: Graficar los siguientes datos, referidos a las edades de un grupo
de turistas
i

Xi

16

17

18

19

20

fi

Fi

hi
0.10

6
0.25
4

0.20

total

11

Hi

Estadstica Descriptiva

16

17

Dr. Vctor Pastor Talledo

18

19

20

16

17

18

4.3.2 Grfica de Variable Continua


Las representaciones grficas de las distribuciones de frecuencias para
una variable continua se conocen como: histogramas y polgonos de
frecuencias
A. HISTOGRAMA
Un histograma o Histograma de Frecuencias est formado por una
serie de rectngulos que tienen sus bases sobre un eje horizontal (eje X)
e iguales a la amplitud o tamao de cada clase (C i). Su altura es igual a
la frecuencia de clase
B. POLGONO
Es un grfico de lneas trazado sobre los puntos medio de cada clase
(en el caso de las frecuencias simple)
Se obtiene uniendo los puntos medios de los extremos superiores de
cada rectngulo del histograma. Se acostumbra prolongar el polgono
hasta los puntos medios inferior y superior de las clases inmediatas
asumidas con frecuencia cero.
Para el caso de las frecuencias acumuladas, el polgono tambin se
denomina OJIVA, el cual se obtiene uniendo los lmites superiores de
cada intervalo a la altura indicada por la respectiva frecuencia; para el
primer intervalo se empieza desde el lmite inferior.
Ejemplo: Construir un histograma y un polgono de frecuencias para la
distribucin de frecuencias de 400 tubos (en horas) e intervalos
constantes
Hrs

300-400

500-600

12

700-800 800-900

19

Estadstica Descriptiva

Tubos
14
Intervalos

Dr. Vctor Pastor Talledo


36

58

82

Yi

fi

sumas

90

80

70

60

50

40

30

20

10

13

hi

62

38
Fi

22
Hi

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

300

400

500

600

700

800

900

1000

1100

300

400

500

600

700

800

900

1000

1100

400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25

90
80
70
60
50
40
30
20
10

14

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

300

400

500

600

700

800

900

1000

1100

300

400

500

600

700

800

900

1000

1100

400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25

15

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

CAPITULO V
GRFICOS ESTADSTICOS (Continuacin)
5.3.3 Grfica de Variable Cualitativa
Una distribucin de frecuencias de variables cualitativas, pueden ser
presentadas grficamente MEDIANTE UN DIAGRAMA DE BARRAS, en la cual
la longitud de cada barra es proporcional a la frecuencia del atributo que
representa.
Las barras deben ser de igual ancho, pudiendo ser stas horizontales o
verticales.
Tambin se puede utilizar GRFICAS CIRCULARES donde los sectores se
obtienen convirtiendo los porcentajes en ngulos sexagesimales, para lo cual
debe multiplicarse la frecuencia relativa (hi) por 360.
Ejemplo: La siguiente tabla muestra la superficie en millones de millas
cuadradas de los ocanos del mundo.
Ocano
Antrtico
rtico
Atlntico
Indico
Pacfico
Superficie
7.6
4.8
41.2
28.5
70.8
Representar los datos utilizando:
a. Diagramas de barras
b. Diagrama circular
Solucin
Ocano
Sector
fi
hi
Antrtico
7.6
rtico
4.8
Atlntico
41.2
Indico
28.5
Pacfico
70.8
Suma

Antrtico

rtico

Atlntico

Indico

Pacfico
0

10

20

30

40

16

50

60

70

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Superficie

Antrtico
Artico
5% 3%

Atlntico
27%

Pacfico
46%

Indico
19%
5.3.4 Otros Tipos de Grficos Estadsticos
1. Columnas Dobles
Sirven para comparar dos series de datos referidos a datos estadsticos
Si se desea puede incluirse los rtulos de datos en las cabeceras de las
columnas, con lo cual puede omitirse la escala
2. Columnas Apiladas o Superpuestas
Permiten comparar los elementos con respecto al total
3. Diagrama de Lneas o Grfico Poligonal
Se utiliza para representar series de tiempo (cronolgicas) o cuando se requiere
presentar varias series de datos en el mismo grfico.
4. Pictogramas
Son diagramas de figuras, donde las barras son reemplazadas por figuras que
representan la variable. Por ejemplo, la importacin de automviles podra
graficarse con la figura de un automvil en la escala

17

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Ejemplo:
La tabla estadstica corresponde a la produccin de naranja de un grupo de
valles correspondiente al II Semestre del ao anterior expresado en miles de kg.
_________________________________________________________________
Produccin de
Nmero de Valles______________________
naranja en
Naranja
Naranja
Naranja
__miles de Kg.
Francia
Hualcar
Huando
____
40 - 70
6
12
10
70 -100
10
5
16
__
100-130
14
10
8________
130-160
8
19
12
160-190
20
22
40
__
190-220
16
25
12_______
220-250
30
15
6
250-280
7
13
17
__
280-310
8
6
9________
a. Graficar la produccin de naranja Hualcar con barras verticales

18

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

b. Graficar la produccin de naranja Francia y Hualcar con barras compuestas

c. Graficar la produccin total de naranja con un grfico circular


Produccin. Valles
40 - 70

hi

sector

70 -100
100-130

________________

130-160
160-190
190-220

________________

220-250
250-280
280-310

_____________________

Total

19

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

d. Graficar la produccin de naranja mediante barras verticales incrementadas o


apiladas

e. Graficar la produccin de naranja Huando mediante barras horizontales


310
280
250
220
190
160
130
100
70
40
5

10

15

20

20

25

30

35

40

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

f. Grfico Poligonal
Ventas mensuales en soles, de una empresa comercial (datos en miles de soles)
Mes
Ventas

Ene Feb Mar


18.9 21.7 18.9

Abr
9.9

May Jun Jul Ago Sep Oct Nov Dic


15.5 17.6 25.3 12.2 14.2 21.2 15.6 17.1

30
25
20
15
10
5
E

21

Estadstica Descriptiva

PARTE 2

Dr. Vctor Pastor Talledo

MEDIDAS DE POSICIN

CAPITULO VI
ESTADIGRAFOS DE TENDENCIA CENTRAL
6.1 Definicin
Son estadgrafos que describen la posicin que ocupan los datos alrededor de
un valor central. Se les conoce como PROMEDIOS, y permiten el anlisis de
una distribucin y la comparacin entre distribuciones.
Los estadgrafos de tendencia central ms importantes son: media aritmtica,
media aritmtica ponderada, media armnica, media geomtrica, moda,
mediana y los cuantiles.
6.2 La Media Aritmtica
Es el cociente que resulta de dividir la suma de todos los datos entre el nmero
de observaciones.
Se le conoce como media o promedio y determina el punto medio de la
distribucin. Se simboliza por X M[Xi
Los tipos de media aritmtica son: media aritmtica simple, ponderada y de
datos agrupados.
6.2.1 Media Aritmtica Simple
Se suman todas las observaciones, y el total se divide entre el nmero de
datos.
_
X1 + X2 + X3 + ... + Xi
X = ---------------------------------donde:

Xi : variable o datos
n : nmero de datos
Ejemplo 1: Hallar la media aritmtica de las siguientes edades:
9,
15,
12,
19,
17,
22
Ejemplo 2: Calcular el promedio de los precios:
5.7, 9.2, 6.4, 11.8, 13.7
Ejemplo 3: Si una alumna obtiene en la asignatura de Estadstica las
siguientes notas: 16, 15, 14, 13 y 10; calcular el promedio

Ejemplo 4: Si los dimetros en pulgadas de una muestra de aros


metlicos es la siguiente: 0.211, 0.294, 0.465, 0.325, 0.373, 0.389, 0.256.
Hallar la media de los dimetros.

22

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

6.2.2 Media Aritmtica Ponderada


En este caso la variable o dato es multiplicada por un peso o
ponderacin. Para determinar el promedio la suma de estos productos se
divide entre la suma de los pesos
_
x1.w1 + x2.w2 + x3.w3 + ... + xi.wi
X = -----------------------------------------------------w1 + w2 + w3 + ... + wi
donde:
xi : variable o dato
wi: ponderacin
Ejemplo: La siguiente distribucin corresponde al nmero de mens vendidos por ciertos
restaurantes en forma diaria. Hallar la media aritmtica
Nro
14
28
45
58
64
70
Mens
Nro
3
8
7
20
12
10
Restauran

Solucin
Nro. Mens (X)

Restauran (w)

Total:

Ejemplo 2: Se ha clasificado a los turistas en 3 grupos de acuerdo a sus


patrones de gasto que constituyen el 60%, 30% y 10%. Si el promedio de
gasto de cada grupo es de 300, 420 y 650 dlares respectivamente;
hallar el gasto promedio total.
Solucin

23

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

6.2.2 Media Aritmtica de Datos Agrupados


En este caso los datos se encuentran agrupados en clases, para calcular
la media aritmtica se utiliza la marca de clase (Y i) que corresponde a
cada frecuencia de clase, de decir:
_
YI.fI
X = --------------

Ejemplo: Hallar la media aritmtica de la distribucin de sueldos de una


empresa (en soles)
Sueldos

500-600

600-700

700-800

800-900

900-1000

10001200

12001800

10

16

15

10

Empleado
s

Solucin
Sueldos (Xi)

Yi

Total:

24

fi

Yi.fi

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

6.2.3 Propiedades de la media aritmtica


La media aritmtica es el centro de gravedad de la distribucin
Es la medida de tendencia central ms estable
Para un conjunto de observaciones la media es nica.
Si un valor se modifica, entonces la media cambia de valor
Si la media sustituye a cada observacin, la suma total no cambia
La suma de las desviaciones de las observaciones con respecto al
promedio es igual a cero..
Si a cada observacin se le suma algebraicamente una constante,
la media queda sumada algebraicamente en esa constante.
Si a cada observacin se le multiplica por una constante la media
queda multiplicada por la constante
Si W j = aXj + b entonces Media(w) = a media(x) + b
6.2.4 La Media armnica
La media armnica (H) de una serie de n nmeros x 1, x2, x3, ... xn es
la reciproca de la media aritmtica de los recprocos de los nmeros
_
X = n/ ( 1/xj )
Ejemplo : Si un auto recorre los primeros 10 Km a razn de 30 Km/h y los
10 Km siguientes a razn de 60 Km/h. Determine la velocidad media
durante todo el trayecto.
_
XA = 2/( 1/30+1/60 ) = 40 Km/h
6.3 La Media Geomtrica
La Media Geomtrica (G) de una serie de n nmeros X 1, X2, X3 ... Xn es la
raz ensima del producto de los nmeros. Este promedio se utiliza para
calcular nmeros ndices y tasas promedio de variacin
n-----------------------G = X1 . X2. X3......Xn
Ejemplo 1 : Calcular la media geomtrica de los nmeros 2, 4 y 8
Para datos agrupados se considera la marca de clase (Y)
n------------------------------f

G = X1 1 X2

f2

X3 3.....Xn

Aplicando logaritmos

fn

(fi .LogXi)
Log G = ------------------------

25

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Ejemplo 1: Determinar la media geomtrica de la distribucin de


remuneraciones de un grupo de trabajadores de la Empresa Delta
Sueldos (Xi)
420 - 490
490 - 560
560 - 630
630 - 700
700 - 770
770 - 840
840 - 910
910 - 980
980 - 1050

fi

Yi

LogYi

fi .LogYi

6
10
7
11
18
15
13
9
3

Total:

Total:

Ejemplo 2: Suponga que la poblacin de una ciudad aumento de a


12600 en el periodo de 1995 a 1999, como se indica a continuacin.
Halle la tasa de crecimiento.

Ao

Poblacin

Tasa de cambio
( ao base: 1995 )

1995
1996
1997
1998
1999

10000
10500
11200
12000
12600

26

--1.050

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

4.3.2 Otras aplicaciones


La media geomtrica es util para encontrar el promedio de porcentajes,
razones, tasas de crecimiento.
Ejemplo 1 Suponga que recibe un aumento de 5% en su sueldo del ao
pasado y recibir uno de 15% este ao. El aumento porcentual promedio
es:
Respuesta: 9.89%
Ejemplo 2: Las ganancias obtenidas por la empresa constructora Alfa en
4 proyectos recientes fueron de 3%, 2%, 4%, y 6%. Cual es la media
geomtrica de las ganancias?
Respuesta: 3.46%
Ejemplo 3: Suponga que el nmero de alojamientos tursticos en cierta
ciudad eran 2 en 1992 y para el 2002 era 22 Cual es la tasa de
incremento porcentual anual promedio para el periodo?
Respuesta: 27.1%
6.5 La Mediana
La Mediana de una coleccin de datos ordenados por su magnitud,
corresponde al valor de la variable que divide al nmero de frecuencias en 2
partes iguales. Esto significa que a uno y otro lado de este valor medio se
encuentra no ms del 50% de los datos.
Se simboliza por Me
6.5.1 Mediana de una Distribucin Simple
Para calcular la Mediana, los datos se ordenan en forma ascendente o
descendente, y luego se observa:
a. Si el nmero de datos es impar la Mediana es igual al valor central
b. Si el nmero de datos es par la Mediana es igual al promedio de los
dos valores centrales.
Ejemplo 1. Hallar la mediana de las siguientes notas:
15, 10, 12, 14, 8
Ejemplo 2. Hallar la mediana del nmero de empleados:
12, 10, 18, 13, 11, 21
Ejemplo 3. Hallar la mediana de los siguientes costos unitarios de
produccin de componentes:
0.24, 0.31, 0.52, 0.27, 0.38, 0.42, 0.62, 0.46

6.5.2 Mediana de una Distribucin Agrupada


27

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

La Mediana determina el punto medio de la distribucin, dividindola en


dos partes iguales.
(n+1/100)x50 es entero (E) me = X(E)
Me = X (n+1/100)x50 , SI
(n+1/100)x50 es decimal (E.d) me =X(E) + 0.d x (X(E+1)- X(E) )
Ejemplo 1 Los siguientes datos corresponden a los pesos, en Kg de 10
personas: 50, 52, 53, 63, 64, 75, 76, 77, 80. Calcule la mediana.
Solucin: 63.5 Kg.
Ejemplo 2. Sea la variable Z = nmero de hijos por familia y fi = nmero de
familias calcular la mediana:
Z)

fi

0
1
2
3

35
15
18
22

Total:

N=80

Solucin: me = 1.5 hijos por familia


Ejemplo 3. Hallar la mediana de la siguiente distribucin correspondiente a las
edades de los turistas que visitaron cierta atraccin turstica

fi

Edad (Xi)
18 - 22
22 - 26
26 - 30
30 - 34
34 - 38
38 - 42
42 - 46
46 - 50
Total:

20
24
28
32
36
40
44
48

6
9
18
14
27
20
12
8
n=114

n _ Fj-1

28

6
15
33
47
74
94
106
114

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Me = Li + Cj ----------------Fj - Fj-1
donde
Me
n/2

:
:

Mediana
forma de ubicar la clase mediana

Fj-1

Frecuencia absoluta acumulada continua


inferior con respecto a la clase mediana

Fj

Li

Lmite inferior de la clase mediana

Cj

Amplitud del intervalo mediano

Frecuencia absoluta acumulada de la clase


mediana

N = 114
Fj-1 = 47
Fj = 74
Li = 34
Cj = 4
Solucion : 35.48
4.5.3 Importancia de la Mediana
* No es afectada por los valores extremos
* Aplicable a distribuciones con extremos indeterminados
* Su desventaja radica en no considerar todos los datos
6.6 La Moda
Es el valor ms frecuente de una variable, es decir es el valor ms comn
Se simboliza por Mo
6.6.1 Moda de una Distribucin Simple
Es el dato estadstico que se repite el mayor nmero de veces
Puede ser unimodal, bimodal o multimodal
Ejemplo 1. Hallar la moda de las siguientes notas:
10, 13, 14, 12, 14, 11, 14, 12, 14

Ejemplo 2. Hallar la moda de los siguientes precios


3.8, 4.2, 5.3, 7.2, 3.9, 5.3, 4.2, 4.1, 4,5

6.6.2 Moda de una Distribucin Agrupada


Determina el punto medio de la distribucin

29

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Para hallar la moda se ubica la mayor frecuencia absoluta y su clase se


le denomina clase modal. Luego se ubican las frecuencias absolutas que
son inferior y superior respecto a la clase modal.
d1
Mo = Li + Cj ----------------d 1 + d2
donde
Mo

Moda

d1
d2

:
:

fj - fj-1
fj - fj+1

Li

Lmite inferior del intervalo modal

Cj

Amplitud del intervalo modal

diferencia premodal
diferencia postmodal

6.6.3 Importancia de la Moda


* Aplicable a datos cualitativos
* No es afectada por valores altos o bajos de la distribucin
* Clculo rpido
* Tiene como desventaja el perder validez cuando es multimodal
Ejemplo 1. Hallar la moda para la siguiente distribucin correspondiente al
nmero de trabajadores en empresa hoteleras, donde n = 200
Trabajadores
(Xi)
06 - 10
10 -14

Empresas

18 - 22
22 - 26
Total:

60
20

fi

20
30

Ejemplo 2. Hallar la moda para la siguiente distribucin de un grupo de


empresas de transportes, donde la utilidad se expresa en miles de dlares
Utilidades
(Xi)

Empresas
fi
30

Estadstica Descriptiva
50 - 60
60 - 70

110 - 120
Total:

Dr. Vctor Pastor Talledo


8
10
16
14
10
5
2

31

Estadstica Descriptiva

PARTE 3

Dr. Vctor Pastor Talledo

MEDIDAS DE DISPERSIN

CAPITULO VII
ESTADIGRAFOS DE DISPERSIN
7.1 Definicin
Los estadgrafos de dispersin son medidas que nos dan la mayor o menor
concentracin de observaciones o datos con respecto a un valor central.
Miden el grado de dispersin o concentracin de los datos o valores, alrededor
de algunas de las medidas de tendencia central.
Los estadgrafos de dispersin son los siguientes:
A. Medidas de Dispersin Absoluta
* Rango o Recorrido
* Varianza
* Desviacin Estndar
B. Medidas de Dispersin Relativa
* Coeficiente de Variacin
* Coeficiente de Asimetra
* Coeficiente de Curtosis
7.2 El Recorrido o Rango
Est definido por la diferencia existente entre el mayor valor y el menor valor de
una variable estadstica.
R = XM - Xm
donde:
XM
: Mayor valor de la variable
Xm
: menor valor de la variable
Cuando mayor es el rango, mayor es la dispersin de los datos alrededor de la
medida de tendencia central; aunque debe considerarse que el rango depende
de la distancia que existe entre sus dos valores extremos con relacin a los
dems valores.
Ejemplo 1. Determinar el rango para las siguientes notas:
12,
13,
15,
18,
10,
05,
04
Ejemplo 2. Determinar el rango en la siguiente distribucin (miles $)

Inversin (Xi)

empresas fi

80-85
85-90
90-95
95-100
100-105

10
15
20
25
7

7.3 La Varianza
32

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Es el promedio del cuadrado de las desviaciones de la variable respecto a la


media aritmtica
Se representa por V(x) S2
Proporciona informacin sobre el grado de dispersin de los valores de una
serie con respecto a su media aritmtica; mientras mayor sea el valor de la
varianza, mayor es la dispersin. Lo anterior implica que cuanto ms pequea
sea la varianza, mayor es la concentracin de los datos alrededor de la media
aritmtica.
7.4 La Desviacin Estndar o Tpica
Mide el grado de normalidad de la distribucin de datos de la muestra alrededor
de la media aritmtica dentro de sus valores extremos; es decir mide la
dispersin alrededor de la media.
La desviacin estndar se define como la raz cuadrada (positiva) de la
varianza y se representa por S

___

S = + S2

7.5 Clculo de la Varianza y la Desviacin Estndar


7.5.1 Distribucin Simple
_
(Xi - X ) 2
S2 = ------------------n

S2

X2
= ------ n

donde:
S2 : Varianza
n : Nro datos
Xi : Variable
X : Promedio

X 2
----n

Ejemplo. Determinar la desviacin estndar de los resultados en la evaluacin


de 7 alumnos: 7,
5,
10,
11,
13,
15,
16
Xi

Xi2

Xi - X

(Xi - X)2

7.5.2 Distribucin Agrupada


_

33

Estadstica Descriptiva

(Yi - X ) 2 fi
= ------------------n

S2

Y2 fi
Yi fi 2
= -------- - ------n
n

Dr. Vctor Pastor Talledo


donde:
S2 : Varianza
n : Nro datos
Yi : Marca clase
X : Promedio
fi : Frecuencia

Ejemplo 1. Determinar la desviacin estndar para la siguiente distribucin


sobre lesiones promedio por cada 1000 horas-hombre de una industria
lesiones

fi

1.5 - 1.8
1.8 - 2.1
2.1 - 2.4
2.4 - 2.7
2.7 - 3.0
3.0 - 3.3

3
12
14
9
7
5

Total

Ejemplo 2. Determinar la desviacin estndar de la distribucin de ingresos


quincenales (en dlares) de los empleados de Beta S.A.C. durante la ltima
quincena del mes pasado
Ingresos

fi

85 - 93

93 - 101

101 - 109

109 - 117

117 - 125

125 - 133

Total

34

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

7.6 MEDIDAS DE DISPERSIN RELATIVA


Caractersticas
* Medidas expresadas en porcentaje
* Generan informacin de alta o baja dispersin por s solos
* Mayor porcentaje implica mayor dispersin
7.6.1 COEFICIENTE DE VARIACIN
Es til para realizar comparaciones cuando se usan diferentes unidades
de medida de la variable
Se emplea tambin cuando se comparan dos distribuciones con diferente
nmero de observaciones
S
CV = ----------100
|X|
donde
CV
:
Coeficiente de Variacin (%)
S
:
Desviacin Estndar
X
:
Media Aritmtica
Se interpreta como el porcentaje de variabilidad de los datos con
respecto a la media aritmtica
Por convencin, si el coeficiente de variacin es mayor a 15% la
dispersin es alta
Ejemplo. Con los siguientes datos, calcular el coeficiente de variacin:
0.32 0.44 0.51 0.72 0.77 0.91
Xi

Xi2

(Xi - X)2

Xi - X

35

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

7.6.2 MEDIDAS DE ASIMETRA


El grado de oblicuidad de una distribucin puede ser medido mediante
los coeficientes de asimetra o deformacin
Las medidas de dispersin solamente indican la magnitud de las
variaciones, pero no proveen informacin acerca de la direccin hacia
donde tienden a ocurrir las variaciones
Por tanto, las medidas de asimetra no slo indican la falta de simetra en
la distribucin sino tambin la direccin hacia donde se inclina la
distribucin
Si una distribucin es simtrica, no tiene sesgo, es decir, su asimetra
es nula.
Si una o ms observaciones son sumamente grandes, la media de la
distribucin se vuelve mayor que la mediana o moda. En tales casos se
dice que la distribucin tiene asimetra positiva o sesgo positivo. Por el
contrario, si hay una o ms observaciones muy pequeas, la media es la
menor de las tres medidas de tendencia central, y se dice que la
distribucin tiene asimetra negativa o sesgo negativo.

1. Coeficiente de Asimetra de Pearson (A1)


Se define por la siguiente relacin entre media aritmtica, mediana,
moda y desviacin estndar
_
_
3 (X - Me)
X - Mo
A1 = -----------------A1 = -------------S
S
donde:_
X
:
Media Aritmtica
Me
:
Mediana
Mo
:
Moda
Se presentan los siguientes resultados:
A1 > 0 la media aritmtica se inclina a valores extremos altos y por
tanto existe asimetra positiva
A1 = 0 la distribucin es simtrica
A1 < 0 la media aritmtica se inclina a valores extremos bajos y por
tanto existe asimetra negativa
Ejemplo. Graficar el histograma y calcular el coeficiente de asimetra de la produccin de una
mquina durante 23 das

36

Estadstica Descriptiva
produccin

Dr. Vctor Pastor Talledo


0-5
3

Das

Adems X=12.5
Solucin

5-10
5
S=3.30

10-15

15-20

20-25

7
Mo=12.5

10

15

20

25

2. Coeficiente de Asimetra de Fisher (A2)


Se define por la siguiente frmula
_
(X - X) 3
1
A2 = ---------------. -----n
S3
donde:_
X
:
Media Aritmtica
S
:
Desviacin Estndar
Se presentan los siguientes resultados:
A2 > 0 asimetra positiva
A2 = 0 la distribucin es simtrica
A2 < 0 asimetra negativa
3. Coeficiente de Asimetra de Bacley (A3)
Emplea los cuartiles en su frmula
Q3 - 2 Q 2 + Q 1
A3 = -----------------------Q3 - Q1
Se presentan los siguientes resultados:
A3 > 0 asimetra positiva
A3 = 0 la distribucin es simtrica
A3 < 0 asimetra negativa
Ejemplo. Determinar la asimetra de la distribucin de salarios
quincenales de los obreros de la Constructora Delta (datos en
dlares)

37

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

Salarios
($)
85 - 94

obreros

94 - 103

103 - 112

112 - 121

121 - 130

130 - 139

yi fi

yi

yi2 fi

yi2

Total

Grfica
10

85

94

103

112

CAPITULO VIII
ESTADIGRAFOS DE APUNTAMIENTO

38

121

130

139

Estadstica Descriptiva

Dr. Vctor Pastor Talledo

8.1 MEDIDAS DE APUNTAMIENTO: CURTOSIS


Miden el grado de agudeza o apuntamiento de una distribucin.
El trmino KURTOSIS significa el grado de achatamiento que exhibe una
distribucin de frecuencias.
Se analiza comparando la distribucin con la forma de la curva normal, as se
tiene 3 casos:
Platikurtica
Mesokurtica
Leptokurtica
8.2 Coeficiente de Kurtosis. Metodo de Cuartiles
Se determina por la siguiente formula:
Q3 Q1
Ki = ---------------2(P90-P10)
Kurtosis
Platikurtica
Mesokurtica
Leptokurtica

Limites
0< Ki < 0.263
K1 = 0.263
0.263< Ki < 0.5

39

Das könnte Ihnen auch gefallen