Beruflich Dokumente
Kultur Dokumente
Estadstica Descriptiva
Introduccin
Comparativos grficos
Medidas de tendencia
central
Medidas de dispersin
1
Haz escuchado el trmino de
estadstica?
2
Importancia de la Estadstica
La estadstica es una herramienta muy til
que nos ayuda a tomar decisiones en un
ambiente de incertidumbre, es decir, dnde
esta presente la variabilidad.
Ejemplos:
En Planeacin de la produccin, saber cunto
voy a comprar de materiales de acuerdo a lo
que se espera sean las ventas (pronstico
estadstico).
En la naturaleza hay variabilidad. Un animador
digital es capaz de imitar la variabilidad de
la naturaleza en sus diseos.
3
Poblacin y Muestra
Poblacin Muestra
4
Qu tienen en comn estos objetivos?
El valor de la caracterstica de inters cambia de individuo a
individuo (la inflacin, el nmero de glbulos rojos, la puntuacin
en matemticas, la evaluacin a los profesores de cursos en el
rea de las matemticas, el clima organizacional, el nivel de
desempeo laboral).
A estas caractersticas les llamaremos variables. Se
representan con letras maysculas, y los valores que toma
con letras minsculas
X = Nmero de estudiantes que llegan tarde x=0, 1, 2,, 15
El individuo puede ser una persona, un pas, un producto de la
lnea de produccin, etc.
Dato: Es el valor de la variable observado en un individuo
5
Ramas de la Estadstica
6
Estadstica Descriptiva
Estadstica
Descriptiva
Diagrama Diagrama
de pastel de barras
7
Cul es la finalidad de un
grfico?
9
Qu informacin brinda una tabla de frecuencias?
Para qu tipos de variables, cualitativas cuantitativas, se puede usar una
tabla de frecuencias?
Qu es frecuencia absoluta?, Qu es frecuencia relativa? Qu es frecuencia
Acumulada?
Para la siguiente tabla, distingue qu tipo de variable es el nivel educativo.
Qu proporcin de individuos tiene al menos estudios de preparatoria?
Nivel Educativo Nmero de casos Frecuencia Nmero Frecuencia
(frecuencia Relativa ACUMULADO de Relativa
absoluta) casos (frecuencia ACUMULADA
ACUMULADA)
Primaria o
menos
12 0.12 12 0.12
Secundaria
26 0.26 38 0.38
Preparatori
a
45 0.45 83 0.83
Profesional
o postgrado
17 0.17 100 1.00
Total 100 1.00
10
Histograma
El objetivo de un
histograma es resumir la
informacin de una
variable cuantitativa.
Pasos:
Se secciona la
informacin en clases
intervalos
Se cuenta el nmero de
datos en cada clase. Esta
se llama frecuencia
Se puede calcular la
frecuencia relativa
Se grafica un
histograma, teniendo
como eje x las clases,
como eje y las Sesgo a la derecha
frecuencias frecuencias
relativas. En cada clase
se dibuja un rectngulo
que tiene como altura su
frecuencia frecuencia 11
relativa.
Cmo construir un
histograma?
1. Ordenar los datos
2. Obtener el Rango: Max-Min
3. Definer el nmero de clases.
n.clases n
12
Distribucin de Frecuencias
Hemoglobina
Dato (gr/cm3)
1 18.5
2 8.2
3 10.6
4
5
16.7
6.2
Paso 1. Determine la cantidad
6
7
16.9
13
de datos (n)
8 10.1
9 9.1
10 11.9
11 14.1 n=20
12 15.8
13 14.4
14 10.7
15 11.6
16 11.9
17 9.3
18 12.1
19 15
20 14.7
Distribucin de Frecuencias
Hemoglobina Hemoglobina
Dato (gr/cm3) (ordenados)
1 18.5 6.2
2 8.2 8.2 Paso 2. Ordene los datos de
3
4
10.6
16.7
9.1
9.3
menor a mayor
5 6.2 10.1
6 16.9 10.6
7 13 10.7
8 10.1 11.6
9 9.1 11.9
10 11.9 11.9
11 14.1 12.1
12 15.8 13
13 14.4 14.1
14 10.7 14.4
15 11.6 14.7
16 11.9 15
17 9.3 15.8
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Hemoglobina Hemoglobina
Dato (gr/cm3) (ordenados)
1 18.5 6.2
2 8.2 8.2
3 10.6 9.1
4 16.7 9.3
5 6.2 10.1 Paso 3. Identifique el Valor
6 16.9 10.6
7 13 10.7 Mayor (VM) y el Valor menor
8 10.1 11.6
9 9.1 11.9 (Vm)
10 11.9 11.9
11 14.1 12.1 VM =18.5
12 15.8 13
13
14
14.4
10.7
14.1
14.4
Vm = 6.2
15 11.6 14.7
16 11.9 15
17 9.3 15.8
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Representacin Grfica
Se establecen los lmites entre los que se
encuentran todos los datos de la muestra.
R= VM Vm
R= 18.5 - 6.2
R= 12.3
Distribucin de Frecuencias
Dato
Hemoglobina
(gr/cm3)
Hemoglobina
(ordenados) Paso 5. Obtenga el nmero
1 18.5 6.2
2 8.2 8.2 aproximado de intervalos (k)
3 10.6 9.1
4
5
16.7
6.2
9.3
10.1
k = sqrt(n)
6 16.9 10.6
7
8
13
10.1
10.7
11.6
Tenemos que n=20 por lo tanto
9 9.1 11.9
10
11
11.9
14.1
11.9
12.1
k = sqrt(20)
12 15.8 13
13
14
14.4
10.7
14.1
14.4
k = 4.47
15 11.6 14.7
16
17
11.9
9.3
15
15.8
Redondeando
k5
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Representacin Grfica
1 2 3 4 5
6.2 18.5
R = 12.3
Distribucin de Frecuencias
Dato
1
Hemoglobina
6.2
Paso 5. Obtenga la longitud
2
3
8.2
9.1
de cada intervalo (W)
4 9.3
5 10.1
R
6 10.6
W
7
8
10.7
11.6
k
9 11.9
10 11.9 Dado que R = 12.3 y k 5
11 12.1
12 13
13 14.1
12.3
W 2.46
14 14.4
15 14.7
16
17
15
15.8
5
18 16.7
19 16.9
20 18.5
Distribucin de Frecuencias
Representacin Grfica
1 2 3 4 5
6.2 18.5
R=12.3
Distribucin de Frecuencias
Dato
1
Hemoglobina
6.2
Paso 6. Construya los 5
2
3
8.2
9.1
intervalos con una longitud
4
5
9.3
10.1
de 2.46.
6 10.6
Corchetes [ ]: Se
7 10.7
8 11.6
[6.2,8.66) incluye el valor
9 11.9
10 11.9 [8.66,11.12) en el Intervalo
11 12.1
12 13
[11.12,13.58) Parntesis (): No
13 14.1
14 14.4 se Incluye el
15 14.7 [13.58,16.04)
16 15 valor en el
17 15.8
18 16.7 [16.04,18.5] Intervalo
19 16.9
20 18.5
Distribucin de Frecuencias
Representacin Grfica
R=12.3
Distribucin de Frecuencias
Dato
1
Hemoglobina
6.2
Paso 7. Identifique y cuente
2
3
8.2
9.1
los datos que caen dentro de
4
5
9.3
10.1
cada Intervalo.
6 10.6
7 10.7
Intervalo Datos fi
8 11.6
9 11.9 [6.2,8.66) 6.2,8.2 2
10 11.9
11
12
12.1
13
[8.66,11.12) 9.1,9.3,10.1,10.6,10.7 5
13 14.1
14 14.4 [11.12,13.58) 11.6,11.9,11.9,12.9,13 5
15 14.7
16 15
[13.58,16.04) 14.1,14.4,14.7,15,15.8 5
17 15.8
18 16.7
19 16.9 [16.04,18.5] 16.7,16.9,18.5 3
20 18.5
fi : Frecuencia Absoluta
Distribucin de Frecuencias
De esta manera se obtiene la distribucin de
Frecuencia Absolutas
Intervalo fi
[6.2,8.66) 2
[8.66,11.12) 5
[11.12,13.58) 5
[13.58,16.04) 5
[16.04,18.5] 3
Total 20
fi : Frecuencia Absoluta
Distribucin de Frecuencias
Representacin Grfica
7
Frecuencia
6
5
4
3
2
1
6.2 8.66 11.12 13.58 16.04 18.5
Niveles de Hemoglobina en la Sangre (gr/cm3)
Distribucin de Frecuencias
Para obtener las frecuencia relativas (hi )
divida cada frecuencia absoluta entre el Total
Intervalo fi hi
Total 20 20/20 1
fi : Frecuencia Absoluta
Distribucin de Frecuencias
Representacin Grfica
Cuando se grafican las frecuencias relativas
se conoce como histograma de frecuencias
relativas y se representan en porcentajes.
35
Relativa (%)
Frecuencia
30
25
20
15
10
5
6.2 8.66 11.12 13.58 16.04 18.5
Niveles de Hemoglobina en la Sangre (gr/cm3)
Distribucin de Frecuencias
La frecuencia absoluta acumulada (fai) y la
frecuencia relativa acumulada (hai ) es la
suma de las frecuencias anteriores
Intervalo fi fai hi hai
[6.2,8.66) 2 2 0.1 0.1
[8.66,11.12) 5 7 0.25 0.35
[11.12,13.58) 5 12 0.25 0.6
[13.58,16.04) 5 17 0.25 0.85
[16.04,18.5] 3 20 0.15 1
Total 20 1
Distribucin de Frecuencias
Representacin Grfica
20
Cuando se 19
frecuencia
frecuencia frecuencia
frecuencia relativa
acumulada relativa
acumulada
0 - 6 aos 36 10.7%
7 - 9 aos 38.5%
10 - 12 aos 72.5%
13 - 17 aos 97.0%
18 - 22 aos 100.0%
Total 335 -- 100% --
32
Solucin:
frecuencia
frecuencia frecuencia
frecuencia relativa
acumulada relativa
acumulada
33
Medidas de
centralizacin
Asociadas a ideas como:
valor esperado,
representante de los datos,
punto de equilibrio.
Media aritmtica
Moda
Tambin llamadas
medidas de localizacin.
Mediana
Media aritmtica
Se representa por x y se calcula sumando todos los datos y
dividindolos entre el total de ellos.
x
x
para muestra x o Media aritmtica
n
n o N nmero de datos
x
para poblacin x dato
N
suma
Ejemplo,
2,2, 3, 3, 4, 5, 5, 7 su media es 31/8 = 3.875
El Vaticano tiene un
promedio de dos
Papas por kilmetro
cuadrado.
Mediana
Valor de los datos que ocupa la posicin central cuando los
datos se ordenan segn su tamao.
Ejemplos,
2,2, 3, 3, 4, 5, 5, 7 su mediana es 3 4, o bien 3.5 si tiene sentido, segn el
tipo de datos.
A, A, A, A, B, B, B, C, C, C, C, D, D, D, F Su mediana es C
7 datos 7 datos
Mediana
Mediana Muestral: se obtiene al ordenar
primeramente las n observaciones de menor a mayor,
(incluyendo valores repetidos). Entonces:
Si n es impar = (n + 1)/2 valor ordenado
Si n es par = promedio de (n/2)simo y (n/2 + 1)simo
valores ordenados
Ejemplo salarios en dolares
30.70 34.1 33.8 32.50 32.90 34.5 36.0
Moda: Es el valor que ms se
repite en conjunto de datos
Moda
Ejemplo,
2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 7 en este caso es bimodal
(hay dos modas) y son 3 y 5.
A, A, A, A, A, B, B, B, C, C, C, C, D, D, D, F
La moda es A
Qu es una distribucin simtrica?
La mediana divide a un conjunto de datos en dos. Pero en este caso, el 50% de los
datos menores a la mediana estn ms concentrados y el 50% de los datos mayor
a ella, estn ms alejados entre s.
Cmo es una distribucin sesgada hacia la izquierda con sesgo
negativo?
La mediana divide a un conjunto de datos en dos. Pero en este caso, el 50% de los
datos menores a la mediana estn ms alejados entre s y el 50% de los datos
mayor a ella, estn ms concentrados.
Medidas de
dispersin
Asociadas a ideas como:
variacin, dispersin entre los
datos, distancia de los datos
respecto a una medida de
centralizacin,
Rango
Varianza
Desviacin estndar
Medidas de Dispersin
Cul es la diferencia? 1:
Qu se puede hacer
para describir mejor cada 2:
muestra?
3:
0 1 2 3 4 5 6 7 8 9 10 11
Rango
muestra Poblacin
2
(x x) 2 ( x ) 2
s 2
n 1 N
s2 = varianza 2
= varianza
x = dato x = dato
muestra Poblacin
(x x) 2 ( x ) 2
s
n 1 N
s = desv. Estndar = desv. estndar
x = dato x = dato
= media aritmtica de la muestra = media aritmtica de la
x
n = tamao de la muestra
poblacin
n = tamao de la poblacin
Ejercicio:
48
Indica si las siguientes expresiones son siempre verdaderas (V) o no
necesariamente verdaderas (F):
49
Indica si las siguientes expresiones son siempre verdaderas (V) o no
necesariamente verdaderas (F):
50