Beruflich Dokumente
Kultur Dokumente
PARTE 1
FUNDAMENTOS DE ESTADSTICA
CAPITULO I
CONCEPTOS BSICOS
1.1. Qu es la Estadstica?
Es la ciencia de recolectar, organizar, presentar, analizar e interpretar datos
para ayudar en una toma de decisiones ms efectiva.
Para realizar esto, la Estadstica toma en cuenta las siguientes acciones:
Coleccin y recoleccin de datos
Ordenamiento de datos
Clasificacin de datos
Presentacin numrica
Presentacin grfica
Clculo de estadgrafos
Relacin entre dos o ms variables
Proyeccin de datos
Anlisis e interpretacin de datos
1.2 Definicin de trminos estadsticos
1. Estadgrafo. Es cualquier funcin de datos empricos que se usa con fines
descriptivos o analticos; son MEDIDAS DE RESUMEN
ESTADSTICO de un conjunto de datos. Por ejemplo: la media
aritmtica, la mediana, la varianza, el coeficiente de correlacin,
etc.
2. Parmetro. Es el valor obtenido para describir en forma resumida las
caractersticas pertinentes o ms importantes acerca de la
poblacin. Una poblacin puede tener muchas caractersticas y
por lo tanto muchos parmetros
Los parmetros son las MEDIDAS RESUMEN DE UNA
POBLACIN, en tanto que las medidas de una muestra se
llaman estadgrafos.
3.Poblacin.
4. Muestra.
5. Variable.
Estadstica Descriptiva
a. Variable Cuantitativa.-
b. Variable Cualitativa
Estadstica Descriptiva
Estadstica Descriptiva
CAPITULO II
DISTRIBUCIN DE FRECUENCIAS
2.1. Tipos de Presentacin de Datos Estadsticos
La presentacin de datos estadsticos se realiza en dos formas:
a. Presentacin Numrica: a travs de los CUADROS ESTADSTICOS y
TABLAS DE FRECUENCIAS.
b. Presentacin Grfica: a travs de una variedad de GRFICOS
ESTADSTICOS.
2.2 Presentacin Numrica
2.2.1 CUADROS ESTADSTICOS
El cuadro estadstico es el arreglo ORDENADO de columnas y filas de datos
estadsticos, con el objeto de ofrecer informacin estadstica de fcil lectura,
comparacin e interpretacin.
Partes Principales: En general un cuadro estadstico puede tener 8 partes:
1) Nmero del Cuadro: Cdigo o elemento de identificacin que permite ubicar
el cuadro en el interior de un documento.
2) Ttulo del Cuadro: Descripcin resumida del contenido del cuadro. Debe ser
breve, claro y completo. Un ttulo debe indicar:
a. QUE hay en el cuadro (caracterstica principal)
b. DONDE corresponde la informacin, se refiere al lugar geomtrico o
institucin
c. COMO estn ordenados o clasificados los datos
d. CUANDO que momento o perodo de tiempo est referida la informacin
3) Concepto o encabezamiento: Son las descripciones de las filas y columnas
del cuadro. El encabezamiento se ubica en la parte superior del cuadro.
Indica las variables y sus categoras o valores.
4) Cuerpo del cuadro: Contenido numrico del cuadro. Presenta la distribucin
de los elementos segn la clasificacin en categoras de las variables.
5) Notas del Pie o llamada: Usada para aclarar trminos o siglas.
6) Fuente: Indicacin al pie del cuadro, sirve para nombrar la publicacin,
entidad, estudio o fuente de donde se obtuvieron los datos.
7) Nota de Unidad de Medida: Se escribe debajo del ttulo original, usada
cuando se abrevia la escritura de las cifras y para indicar en que unidades
est expresada la variable.
8) Elaboracin: Menciona al responsable de la elaboracin del cuadro
estadstico final.
Estadstica Descriptiva
Estadstica Descriptiva
Intervalos
Yi
fi
hi
Fi
Hi
sumas
2.3 Construccin de Tablas de frecuencias para Variables Cuantitativas
A. Para datos no agrupados
Por ser la informacin bastante pequea, no existen las tablas de frecuencias, y
nicamente los datos se presentan ordenados, en filas o columnas.
Ejemplo: En una encuesta se obtuvo la siguiente informacin referente a la edad
de 10 personas:
19
31
22
30
25
27
42
33
50
21
Ordenado los datos y presentndolos en columna se tiene:
Edades (Xi)
i
Xi
1
2
3
4
5
6
7
8
9
10
Estadstica Descriptiva
Xi
Marca de
conteo
fi
1
2
3
4
5
6
7
sumas
Interpretando la tercera fila ( i = 3)
f3 =
h3 =
F3 =
H3 =
CAPITULO III
DISTRIBUCIN DE FRECUENCIAS (Continuacin)
hi
Fi
Hi
Estadstica Descriptiva
Xi =
2) Rango
R=
3) Intervalos
m=
4) Amplitud
C=
Estadstica Descriptiva
ii) Tabla de frecuencias
i
Intervalos
Conteo
1
Yi
fi
Fi
6
7
sumas
hi
Hi
Estadstica Descriptiva
CAPITULO IV
GRFICOS ESTADSTICOS
4.1 Presentacin grfica de datos estadsticos
Un Grfico es una representacin pictrica con el objeto de ilustrar los cambios
de una variable, para comparar visualmente dos o ms variables similares o
relacionadas.
En estadstica se emplea una diversidad de grficos, cuya forma depender de
la naturaleza de los datos y del objetivo. Los grficos de una variable sirven
para comparar cantidades absolutas, tasas, variaciones, etc. y pueden tener
forma de columnas, barras, puntos o lneas. Los grficos de dos variables se
construyen en el plano cartesiano, teniendo en el eje X (abcisa) el registro de la
variable independiente; y en el eje Y (ordenada) se colocan los valores de la
variable dependiente.
Partes de un Grfico
En todo grfico se debe considerar el ttulo, leyenda, escala, fuente y
elaboracin; aunque dependiendo de la complejidad del grfico, los elementos
pueden variar
A. Ttulo: es una descripcin del contenido del grfico, explica el contenido
se coloca en la parte superior o inferior del grfico
B. Diagrama: es el propio dibujo del grfico, donde se encuentran ubicados los
datos.
C. Escala: es la unidad de medida que se considera en los ejes
D. Fuente: indica el origen de los datos, se ubica en la parte inferior del grfico
E. Leyenda. Hace referencia al diagrama.
Gastos por Categoras
(soles)
45
40
35
30
25
20
15
10
5
0
Comidas
Transporte
Ene
Feb
Mar
10
Abr
Alojamiento
May
Jun
Estadstica Descriptiva
Xi
16
17
18
19
20
fi
Fi
hi
0.10
6
0.25
4
0.20
total
11
Hi
Estadstica Descriptiva
16
17
18
19
20
16
17
18
300-400
500-600
12
700-800 800-900
19
Estadstica Descriptiva
Tubos
14
Intervalos
58
82
Yi
fi
sumas
90
80
70
60
50
40
30
20
10
13
hi
62
38
Fi
22
Hi
Estadstica Descriptiva
300
400
500
600
700
800
900
1000
1100
300
400
500
600
700
800
900
1000
1100
400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
90
80
70
60
50
40
30
20
10
14
Estadstica Descriptiva
300
400
500
600
700
800
900
1000
1100
300
400
500
600
700
800
900
1000
1100
400
375
350
325
300
275
250
225
200
175
150
125
100
75
50
25
15
Estadstica Descriptiva
CAPITULO V
GRFICOS ESTADSTICOS (Continuacin)
5.3.3 Grfica de Variable Cualitativa
Una distribucin de frecuencias de variables cualitativas, pueden ser
presentadas grficamente MEDIANTE UN DIAGRAMA DE BARRAS, en la cual
la longitud de cada barra es proporcional a la frecuencia del atributo que
representa.
Las barras deben ser de igual ancho, pudiendo ser stas horizontales o
verticales.
Tambin se puede utilizar GRFICAS CIRCULARES donde los sectores se
obtienen convirtiendo los porcentajes en ngulos sexagesimales, para lo cual
debe multiplicarse la frecuencia relativa (hi) por 360.
Ejemplo: La siguiente tabla muestra la superficie en millones de millas
cuadradas de los ocanos del mundo.
Ocano
Antrtico
rtico
Atlntico
Indico
Pacfico
Superficie
7.6
4.8
41.2
28.5
70.8
Representar los datos utilizando:
a. Diagramas de barras
b. Diagrama circular
Solucin
Ocano
Sector
fi
hi
Antrtico
7.6
rtico
4.8
Atlntico
41.2
Indico
28.5
Pacfico
70.8
Suma
Antrtico
rtico
Atlntico
Indico
Pacfico
0
10
20
30
40
16
50
60
70
Estadstica Descriptiva
Superficie
Antrtico
Artico
5% 3%
Atlntico
27%
Pacfico
46%
Indico
19%
5.3.4 Otros Tipos de Grficos Estadsticos
1. Columnas Dobles
Sirven para comparar dos series de datos referidos a datos estadsticos
Si se desea puede incluirse los rtulos de datos en las cabeceras de las
columnas, con lo cual puede omitirse la escala
2. Columnas Apiladas o Superpuestas
Permiten comparar los elementos con respecto al total
3. Diagrama de Lneas o Grfico Poligonal
Se utiliza para representar series de tiempo (cronolgicas) o cuando se requiere
presentar varias series de datos en el mismo grfico.
4. Pictogramas
Son diagramas de figuras, donde las barras son reemplazadas por figuras que
representan la variable. Por ejemplo, la importacin de automviles podra
graficarse con la figura de un automvil en la escala
17
Estadstica Descriptiva
Ejemplo:
La tabla estadstica corresponde a la produccin de naranja de un grupo de
valles correspondiente al II Semestre del ao anterior expresado en miles de kg.
_________________________________________________________________
Produccin de
Nmero de Valles______________________
naranja en
Naranja
Naranja
Naranja
__miles de Kg.
Francia
Hualcar
Huando
____
40 - 70
6
12
10
70 -100
10
5
16
__
100-130
14
10
8________
130-160
8
19
12
160-190
20
22
40
__
190-220
16
25
12_______
220-250
30
15
6
250-280
7
13
17
__
280-310
8
6
9________
a. Graficar la produccin de naranja Hualcar con barras verticales
18
Estadstica Descriptiva
hi
sector
70 -100
100-130
________________
130-160
160-190
190-220
________________
220-250
250-280
280-310
_____________________
Total
19
Estadstica Descriptiva
10
15
20
20
25
30
35
40
Estadstica Descriptiva
f. Grfico Poligonal
Ventas mensuales en soles, de una empresa comercial (datos en miles de soles)
Mes
Ventas
Abr
9.9
30
25
20
15
10
5
E
21
Estadstica Descriptiva
PARTE 2
MEDIDAS DE POSICIN
CAPITULO VI
ESTADIGRAFOS DE TENDENCIA CENTRAL
6.1 Definicin
Son estadgrafos que describen la posicin que ocupan los datos alrededor de
un valor central. Se les conoce como PROMEDIOS, y permiten el anlisis de
una distribucin y la comparacin entre distribuciones.
Los estadgrafos de tendencia central ms importantes son: media aritmtica,
media aritmtica ponderada, media armnica, media geomtrica, moda,
mediana y los cuantiles.
6.2 La Media Aritmtica
Es el cociente que resulta de dividir la suma de todos los datos entre el nmero
de observaciones.
Se le conoce como media o promedio y determina el punto medio de la
distribucin. Se simboliza por X M[Xi
Los tipos de media aritmtica son: media aritmtica simple, ponderada y de
datos agrupados.
6.2.1 Media Aritmtica Simple
Se suman todas las observaciones, y el total se divide entre el nmero de
datos.
_
X1 + X2 + X3 + ... + Xi
X = ---------------------------------donde:
Xi : variable o datos
n : nmero de datos
Ejemplo 1: Hallar la media aritmtica de las siguientes edades:
9,
15,
12,
19,
17,
22
Ejemplo 2: Calcular el promedio de los precios:
5.7, 9.2, 6.4, 11.8, 13.7
Ejemplo 3: Si una alumna obtiene en la asignatura de Estadstica las
siguientes notas: 16, 15, 14, 13 y 10; calcular el promedio
22
Estadstica Descriptiva
Solucin
Nro. Mens (X)
Restauran (w)
Total:
23
Estadstica Descriptiva
500-600
600-700
700-800
800-900
900-1000
10001200
12001800
10
16
15
10
Empleado
s
Solucin
Sueldos (Xi)
Yi
Total:
24
fi
Yi.fi
Estadstica Descriptiva
G = X1 1 X2
f2
X3 3.....Xn
Aplicando logaritmos
fn
(fi .LogXi)
Log G = ------------------------
25
Estadstica Descriptiva
fi
Yi
LogYi
fi .LogYi
6
10
7
11
18
15
13
9
3
Total:
Total:
Ao
Poblacin
Tasa de cambio
( ao base: 1995 )
1995
1996
1997
1998
1999
10000
10500
11200
12000
12600
26
--1.050
Estadstica Descriptiva
Estadstica Descriptiva
fi
0
1
2
3
35
15
18
22
Total:
N=80
fi
Edad (Xi)
18 - 22
22 - 26
26 - 30
30 - 34
34 - 38
38 - 42
42 - 46
46 - 50
Total:
20
24
28
32
36
40
44
48
6
9
18
14
27
20
12
8
n=114
n _ Fj-1
28
6
15
33
47
74
94
106
114
Estadstica Descriptiva
Me = Li + Cj ----------------Fj - Fj-1
donde
Me
n/2
:
:
Mediana
forma de ubicar la clase mediana
Fj-1
Fj
Li
Cj
N = 114
Fj-1 = 47
Fj = 74
Li = 34
Cj = 4
Solucion : 35.48
4.5.3 Importancia de la Mediana
* No es afectada por los valores extremos
* Aplicable a distribuciones con extremos indeterminados
* Su desventaja radica en no considerar todos los datos
6.6 La Moda
Es el valor ms frecuente de una variable, es decir es el valor ms comn
Se simboliza por Mo
6.6.1 Moda de una Distribucin Simple
Es el dato estadstico que se repite el mayor nmero de veces
Puede ser unimodal, bimodal o multimodal
Ejemplo 1. Hallar la moda de las siguientes notas:
10, 13, 14, 12, 14, 11, 14, 12, 14
29
Estadstica Descriptiva
Moda
d1
d2
:
:
fj - fj-1
fj - fj+1
Li
Cj
diferencia premodal
diferencia postmodal
Empresas
18 - 22
22 - 26
Total:
60
20
fi
20
30
Empresas
fi
30
Estadstica Descriptiva
50 - 60
60 - 70
110 - 120
Total:
31
Estadstica Descriptiva
PARTE 3
MEDIDAS DE DISPERSIN
CAPITULO VII
ESTADIGRAFOS DE DISPERSIN
7.1 Definicin
Los estadgrafos de dispersin son medidas que nos dan la mayor o menor
concentracin de observaciones o datos con respecto a un valor central.
Miden el grado de dispersin o concentracin de los datos o valores, alrededor
de algunas de las medidas de tendencia central.
Los estadgrafos de dispersin son los siguientes:
A. Medidas de Dispersin Absoluta
* Rango o Recorrido
* Varianza
* Desviacin Estndar
B. Medidas de Dispersin Relativa
* Coeficiente de Variacin
* Coeficiente de Asimetra
* Coeficiente de Curtosis
7.2 El Recorrido o Rango
Est definido por la diferencia existente entre el mayor valor y el menor valor de
una variable estadstica.
R = XM - Xm
donde:
XM
: Mayor valor de la variable
Xm
: menor valor de la variable
Cuando mayor es el rango, mayor es la dispersin de los datos alrededor de la
medida de tendencia central; aunque debe considerarse que el rango depende
de la distancia que existe entre sus dos valores extremos con relacin a los
dems valores.
Ejemplo 1. Determinar el rango para las siguientes notas:
12,
13,
15,
18,
10,
05,
04
Ejemplo 2. Determinar el rango en la siguiente distribucin (miles $)
Inversin (Xi)
empresas fi
80-85
85-90
90-95
95-100
100-105
10
15
20
25
7
7.3 La Varianza
32
Estadstica Descriptiva
___
S = + S2
S2
X2
= ------ n
donde:
S2 : Varianza
n : Nro datos
Xi : Variable
X : Promedio
X 2
----n
Xi2
Xi - X
(Xi - X)2
33
Estadstica Descriptiva
(Yi - X ) 2 fi
= ------------------n
S2
Y2 fi
Yi fi 2
= -------- - ------n
n
fi
1.5 - 1.8
1.8 - 2.1
2.1 - 2.4
2.4 - 2.7
2.7 - 3.0
3.0 - 3.3
3
12
14
9
7
5
Total
fi
85 - 93
93 - 101
101 - 109
109 - 117
117 - 125
125 - 133
Total
34
Estadstica Descriptiva
Xi2
(Xi - X)2
Xi - X
35
Estadstica Descriptiva
36
Estadstica Descriptiva
produccin
Das
Adems X=12.5
Solucin
5-10
5
S=3.30
10-15
15-20
20-25
7
Mo=12.5
10
15
20
25
37
Estadstica Descriptiva
Salarios
($)
85 - 94
obreros
94 - 103
103 - 112
112 - 121
121 - 130
130 - 139
yi fi
yi
yi2 fi
yi2
Total
Grfica
10
85
94
103
112
CAPITULO VIII
ESTADIGRAFOS DE APUNTAMIENTO
38
121
130
139
Estadstica Descriptiva
Limites
0< Ki < 0.263
K1 = 0.263
0.263< Ki < 0.5
39