Sie sind auf Seite 1von 50

TEMA 1

Estadstica Descriptiva

Introduccin
Comparativos grficos
Medidas de tendencia
central
Medidas de dispersin

1
Haz escuchado el trmino de
estadstica?

A diario recibimos muchos datos informacin en


conversaciones, libros y televisin, acerca de
estadsticas.
Casi cualquier estudio cientfico usa la estadstica
como herramienta para reportar resultados.

2
Importancia de la Estadstica
La estadstica es una herramienta muy til
que nos ayuda a tomar decisiones en un
ambiente de incertidumbre, es decir, dnde
esta presente la variabilidad.
Ejemplos:
En Planeacin de la produccin, saber cunto
voy a comprar de materiales de acuerdo a lo
que se espera sean las ventas (pronstico
estadstico).
En la naturaleza hay variabilidad. Un animador
digital es capaz de imitar la variabilidad de
la naturaleza en sus diseos.
3
Poblacin y Muestra

Poblacin Muestra

4
Qu tienen en comn estos objetivos?
El valor de la caracterstica de inters cambia de individuo a
individuo (la inflacin, el nmero de glbulos rojos, la puntuacin
en matemticas, la evaluacin a los profesores de cursos en el
rea de las matemticas, el clima organizacional, el nivel de
desempeo laboral).
A estas caractersticas les llamaremos variables. Se
representan con letras maysculas, y los valores que toma
con letras minsculas
X = Nmero de estudiantes que llegan tarde x=0, 1, 2,, 15
El individuo puede ser una persona, un pas, un producto de la
lnea de produccin, etc.
Dato: Es el valor de la variable observado en un individuo

Ejemplo de variable: temperatura en Monterrey en un da de


Enero
0C, 17C representan dos datos diferentes.

5
Ramas de la Estadstica

La estadstica es la rama de la Estadstica


investigacin cientfica que proporciona descriptiva
mtodos para organizar y resumir
informacin
y usar sta para obtener diversas
conclusiones
Estadstica
inferencial
(se apoya en la
probabilidad)

6
Estadstica Descriptiva

Estadstica
Descriptiva

Distribuciones Representaciones Medidas


de frecuencias grficas descriptivas
(tabulacin de
datos) Tendencia central
Histograma
Dispersin

Diagrama Diagrama
de pastel de barras

7
Cul es la finalidad de un
grfico?

Por medio de un grfico se puede visualizar el comportamiento de un conjunto


de datos. Un grfico habla ms que mil palabras.
Dependiendo si la variable es cualitativa cuantitativa, se selecciona el tipo de
grfico. 8
Resmenes grficos
Reflexin

Observa la escala en cada grfica.

9
Qu informacin brinda una tabla de frecuencias?
Para qu tipos de variables, cualitativas cuantitativas, se puede usar una
tabla de frecuencias?
Qu es frecuencia absoluta?, Qu es frecuencia relativa? Qu es frecuencia
Acumulada?
Para la siguiente tabla, distingue qu tipo de variable es el nivel educativo.
Qu proporcin de individuos tiene al menos estudios de preparatoria?
Nivel Educativo Nmero de casos Frecuencia Nmero Frecuencia
(frecuencia Relativa ACUMULADO de Relativa
absoluta) casos (frecuencia ACUMULADA
ACUMULADA)

Primaria o
menos
12 0.12 12 0.12
Secundaria
26 0.26 38 0.38
Preparatori
a
45 0.45 83 0.83
Profesional
o postgrado
17 0.17 100 1.00
Total 100 1.00
10
Histograma
El objetivo de un
histograma es resumir la
informacin de una
variable cuantitativa.
Pasos:
Se secciona la
informacin en clases
intervalos
Se cuenta el nmero de
datos en cada clase. Esta
se llama frecuencia
Se puede calcular la
frecuencia relativa
Se grafica un
histograma, teniendo
como eje x las clases,
como eje y las Sesgo a la derecha
frecuencias frecuencias
relativas. En cada clase
se dibuja un rectngulo
que tiene como altura su
frecuencia frecuencia 11

relativa.
Cmo construir un
histograma?
1. Ordenar los datos
2. Obtener el Rango: Max-Min
3. Definer el nmero de clases.
n.clases n

3. Definir la amplitud de clase


Max Min
Amplitud
n
4. Generar la tabla de Frecuencia
5. Dibujar el histograma

12
Distribucin de Frecuencias
Hemoglobina
Dato (gr/cm3)
1 18.5
2 8.2
3 10.6
4
5
16.7
6.2
Paso 1. Determine la cantidad
6
7
16.9
13
de datos (n)
8 10.1
9 9.1
10 11.9
11 14.1 n=20
12 15.8
13 14.4
14 10.7
15 11.6
16 11.9
17 9.3
18 12.1
19 15
20 14.7
Distribucin de Frecuencias
Hemoglobina Hemoglobina
Dato (gr/cm3) (ordenados)
1 18.5 6.2
2 8.2 8.2 Paso 2. Ordene los datos de
3
4
10.6
16.7
9.1
9.3
menor a mayor
5 6.2 10.1
6 16.9 10.6
7 13 10.7
8 10.1 11.6
9 9.1 11.9
10 11.9 11.9
11 14.1 12.1
12 15.8 13
13 14.4 14.1
14 10.7 14.4
15 11.6 14.7
16 11.9 15
17 9.3 15.8
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Hemoglobina Hemoglobina
Dato (gr/cm3) (ordenados)
1 18.5 6.2
2 8.2 8.2
3 10.6 9.1
4 16.7 9.3
5 6.2 10.1 Paso 3. Identifique el Valor
6 16.9 10.6
7 13 10.7 Mayor (VM) y el Valor menor
8 10.1 11.6
9 9.1 11.9 (Vm)
10 11.9 11.9
11 14.1 12.1 VM =18.5
12 15.8 13
13
14
14.4
10.7
14.1
14.4
Vm = 6.2
15 11.6 14.7
16 11.9 15
17 9.3 15.8
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Representacin Grfica
Se establecen los lmites entre los que se
encuentran todos los datos de la muestra.

Vm= 6.2 VM=18.5


Distribucin de Frecuencias
Hemoglobina Hemoglobina
Dato (gr/cm3) (ordenados)
1 18.5 6.2
2 8.2 8.2
3 10.6 9.1
4 16.7 9.3
5
6
6.2
16.9
10.1
10.6
Paso 4. Obtenga el Rango (R)
7 13 10.7
8 10.1 11.6
9 9.1 11.9
10 11.9 11.9 R = V M - Vm
11 14.1 12.1
12
13
15.8
14.4
13
14.1
R = 18.5 - 6.2
14
15
10.7
11.6
14.4
14.7
R = 12.3
16 11.9 15
17 9.3 15.8
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Representacin Grfica
Se obtiene la distancia que hay entre el
lmite inferior y el lmite superior.

Vm= 6.2 VM=18.5

R= VM Vm
R= 18.5 - 6.2
R= 12.3
Distribucin de Frecuencias
Dato
Hemoglobina
(gr/cm3)
Hemoglobina
(ordenados) Paso 5. Obtenga el nmero
1 18.5 6.2
2 8.2 8.2 aproximado de intervalos (k)
3 10.6 9.1
4
5
16.7
6.2
9.3
10.1
k = sqrt(n)
6 16.9 10.6
7
8
13
10.1
10.7
11.6
Tenemos que n=20 por lo tanto
9 9.1 11.9
10
11
11.9
14.1
11.9
12.1
k = sqrt(20)
12 15.8 13
13
14
14.4
10.7
14.1
14.4
k = 4.47
15 11.6 14.7
16
17
11.9
9.3
15
15.8
Redondeando
k5
18 12.1 16.7
19 15 16.9
20 14.7 18.5
Distribucin de Frecuencias
Representacin Grfica

Se divide la seccin que tenemos entre el


nmero de grupos (clases) que se obtuvo
con la frmula (5 grupos)

1 2 3 4 5

6.2 18.5

R = 12.3
Distribucin de Frecuencias
Dato
1
Hemoglobina
6.2
Paso 5. Obtenga la longitud
2
3
8.2
9.1
de cada intervalo (W)
4 9.3
5 10.1
R
6 10.6
W
7
8
10.7
11.6
k
9 11.9
10 11.9 Dado que R = 12.3 y k 5
11 12.1
12 13
13 14.1

12.3
W 2.46
14 14.4
15 14.7
16
17
15
15.8
5
18 16.7
19 16.9
20 18.5
Distribucin de Frecuencias
Representacin Grfica

Se calcula el ancho que debe tener cada


grupo (clase).

2.46 2.46 2.46 2.46 2.46

1 2 3 4 5

6.2 18.5

R=12.3
Distribucin de Frecuencias
Dato
1
Hemoglobina
6.2
Paso 6. Construya los 5
2
3
8.2
9.1
intervalos con una longitud
4
5
9.3
10.1
de 2.46.
6 10.6
Corchetes [ ]: Se
7 10.7
8 11.6
[6.2,8.66) incluye el valor
9 11.9
10 11.9 [8.66,11.12) en el Intervalo
11 12.1
12 13
[11.12,13.58) Parntesis (): No
13 14.1
14 14.4 se Incluye el
15 14.7 [13.58,16.04)
16 15 valor en el
17 15.8
18 16.7 [16.04,18.5] Intervalo
19 16.9
20 18.5
Distribucin de Frecuencias
Representacin Grfica

Se establecen los valores que separan


un grupo (clase) de otro.

2.46 2.46 2.46 2.46 2.46

6.2 8.66 11.12 13.58 16.04 18.5

R=12.3
Distribucin de Frecuencias
Dato
1
Hemoglobina
6.2
Paso 7. Identifique y cuente
2
3
8.2
9.1
los datos que caen dentro de
4
5
9.3
10.1
cada Intervalo.
6 10.6
7 10.7
Intervalo Datos fi
8 11.6
9 11.9 [6.2,8.66) 6.2,8.2 2
10 11.9
11
12
12.1
13
[8.66,11.12) 9.1,9.3,10.1,10.6,10.7 5
13 14.1
14 14.4 [11.12,13.58) 11.6,11.9,11.9,12.9,13 5
15 14.7
16 15
[13.58,16.04) 14.1,14.4,14.7,15,15.8 5
17 15.8
18 16.7
19 16.9 [16.04,18.5] 16.7,16.9,18.5 3
20 18.5

fi : Frecuencia Absoluta
Distribucin de Frecuencias
De esta manera se obtiene la distribucin de
Frecuencia Absolutas
Intervalo fi
[6.2,8.66) 2
[8.66,11.12) 5
[11.12,13.58) 5
[13.58,16.04) 5
[16.04,18.5] 3
Total 20

fi : Frecuencia Absoluta
Distribucin de Frecuencias
Representacin Grfica

A esta grfica se le conoce como histograma


de frecuencias absolutas.

7
Frecuencia

6
5
4
3
2
1
6.2 8.66 11.12 13.58 16.04 18.5
Niveles de Hemoglobina en la Sangre (gr/cm3)
Distribucin de Frecuencias
Para obtener las frecuencia relativas (hi )
divida cada frecuencia absoluta entre el Total
Intervalo fi hi

[6.2,8.66) 2 2/20 0.1

[8.66,11.12) 5 5/20 0.25

[11.12,13.58) 5 5/20 0.25

[13.58,16.04) 5 5/20 0.25

[16.04,18.5] 3 3/20 0.15

Total 20 20/20 1

fi : Frecuencia Absoluta
Distribucin de Frecuencias
Representacin Grfica
Cuando se grafican las frecuencias relativas
se conoce como histograma de frecuencias
relativas y se representan en porcentajes.

35
Relativa (%)
Frecuencia

30
25
20
15
10
5
6.2 8.66 11.12 13.58 16.04 18.5
Niveles de Hemoglobina en la Sangre (gr/cm3)
Distribucin de Frecuencias
La frecuencia absoluta acumulada (fai) y la
frecuencia relativa acumulada (hai ) es la
suma de las frecuencias anteriores
Intervalo fi fai hi hai
[6.2,8.66) 2 2 0.1 0.1
[8.66,11.12) 5 7 0.25 0.35
[11.12,13.58) 5 12 0.25 0.6
[13.58,16.04) 5 17 0.25 0.85
[16.04,18.5] 3 20 0.15 1
Total 20 1
Distribucin de Frecuencias
Representacin Grfica
20
Cuando se 19

Frecuencia Absoluta Acumulada


18
grafican las 17
16
frecuencias 15
14
absolutas 13
12
acumuladas se 11
conoce como 10
9
histograma de 8
7
frecuencias 6
5
absolutas 4
3
acumuladas 2
1
6.2 8.66 11.12 13.58 16.04 18.5
Niveles de Hemoglobina en la Sangre (gr/cm
Completa los espacios en blanco en la siguiente tabla de frecuencias.
La variable de estudios son los aos de escolaridad de los adultos de
cierta colonia.

frecuencia
frecuencia frecuencia
frecuencia relativa
acumulada relativa
acumulada

0 - 6 aos 36 10.7%
7 - 9 aos 38.5%
10 - 12 aos 72.5%
13 - 17 aos 97.0%
18 - 22 aos 100.0%
Total 335 -- 100% --

32
Solucin:

frecuencia
frecuencia frecuencia
frecuencia relativa
acumulada relativa
acumulada

0 - 6 aos 36 36 10.7% 10.7%


7 - 9 aos 93 129 27.8% 38.5%
10 - 12 aos 114 243 34.0% 72.5%
13 - 17 aos 82 325 24.5% 97.0%
18 - 22 aos 10 335 3.0% 100.0%
Total 335 -- 100% --

33
Medidas de
centralizacin
Asociadas a ideas como:
valor esperado,
representante de los datos,
punto de equilibrio.

Media aritmtica

Moda
Tambin llamadas
medidas de localizacin.
Mediana
Media aritmtica
Se representa por x y se calcula sumando todos los datos y
dividindolos entre el total de ellos.

x
x
para muestra x o Media aritmtica
n
n o N nmero de datos
x
para poblacin x dato
N
suma
Ejemplo,
2,2, 3, 3, 4, 5, 5, 7 su media es 31/8 = 3.875
El Vaticano tiene un
promedio de dos
Papas por kilmetro
cuadrado.
Mediana
Valor de los datos que ocupa la posicin central cuando los
datos se ordenan segn su tamao.

Ejemplos,
2,2, 3, 3, 4, 5, 5, 7 su mediana es 3 4, o bien 3.5 si tiene sentido, segn el
tipo de datos.
A, A, A, A, B, B, B, C, C, C, C, D, D, D, F Su mediana es C

7 datos 7 datos
Mediana
Mediana Muestral: se obtiene al ordenar
primeramente las n observaciones de menor a mayor,
(incluyendo valores repetidos). Entonces:
Si n es impar = (n + 1)/2 valor ordenado
Si n es par = promedio de (n/2)simo y (n/2 + 1)simo
valores ordenados
Ejemplo salarios en dolares
30.70 34.1 33.8 32.50 32.90 34.5 36.0
Moda: Es el valor que ms se
repite en conjunto de datos
Moda

Ejemplo,
2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 7 en este caso es bimodal
(hay dos modas) y son 3 y 5.

A, A, A, A, A, B, B, B, C, C, C, C, D, D, D, F
La moda es A
Qu es una distribucin simtrica?

Una distribucin simtrica es la que se puede dividir en dos


partes iguales. En estas distribuciones el valor de la media,
mediana y moda son iguales.
Distribucin Normal
Caractersticas:
Simetra alrededor
de
Forma de
campana
La mayora de los
datos se
encuentran a una
distancia de tres
desviaciones
estndar de la
media.
Cmo es una distribucin sesgada hacia la derecha con
sesgo positivo?

En este caso, la media es mayor que la mediana.

La mediana divide a un conjunto de datos en dos. Pero en este caso, el 50% de los
datos menores a la mediana estn ms concentrados y el 50% de los datos mayor
a ella, estn ms alejados entre s.
Cmo es una distribucin sesgada hacia la izquierda con sesgo
negativo?

En este caso, la media es menor que la mediana.

La mediana divide a un conjunto de datos en dos. Pero en este caso, el 50% de los
datos menores a la mediana estn ms alejados entre s y el 50% de los datos
mayor a ella, estn ms concentrados.
Medidas de
dispersin
Asociadas a ideas como:
variacin, dispersin entre los
datos, distancia de los datos
respecto a una medida de
centralizacin,

Rango

Varianza

Desviacin estndar
Medidas de Dispersin

Tambin se conocen como medidas de variabilidad.


Las medidas de tendencia central pueden no ser suficientes para
describir totalmente un conjunto de datos.

Estas 3 muestras son idnticas en su media y su mediana,

Cul es la diferencia? 1:
Qu se puede hacer
para describir mejor cada 2:
muestra?
3:

0 1 2 3 4 5 6 7 8 9 10 11
Rango

Es la diferencia entre el mayor y el menor de los datos.


Rango R = Max Min
Ejemplo
De los datos 2, 2, 2, 3, 3, 3, 3, 3, 4, 5, 5, 5, 5, 5, 7
El rango es R=7 2 = 5
Varianza

muestra Poblacin

2
(x x) 2 ( x ) 2

s 2

n 1 N
s2 = varianza 2
= varianza

x = dato x = dato

= media aritmtica de la muestra = media aritmtica de la


poblacin
nx = tamao de la muestra
n = tamao de la poblacin
Desviacin estndar

muestra Poblacin


(x x) 2 ( x ) 2

s
n 1 N
s = desv. Estndar = desv. estndar
x = dato x = dato
= media aritmtica de la muestra = media aritmtica de la
x
n = tamao de la muestra
poblacin
n = tamao de la poblacin
Ejercicio:

1. Determina el rango, la varianza y la desviacin estndar para los


siguientes datos:
2 4 3 5 2 2 0 1

R = Rango 5; Varianza 2.5536 y Desviacin Estndar 1.5980

2. Determina el rango, la varianza y la desviacin estndar para los


siguientes datos:
-2 -4 -3 -5 -2 -2 0 -1
R = Rango 5; Varianza 2.5536 y Desviacin Estndar 1.5980

3. Determina el rango, la varianza y la desviacin estndar para los


siguientes datos:
6 12 9 15 6 6 0 3
R = Rango 15; Varianza 22.9821 y Desviacin Estndar 4.7940

48
Indica si las siguientes expresiones son siempre verdaderas (V) o no
necesariamente verdaderas (F):

1. La mitad de los datos estn por debajo de la media.


2. Cuando hay dos valores que se repiten ms que los dems se dice que la
moda no existe.
3. La mediana es el dato que se presenta en un 50% de las veces.
4. Al comparar dos grupos de datos del mismo tipo de medicin, el grupo que
tiene menor varianza es el que tiene una mayor concentracin de datos
cerca de su media.
5. En un tabla de frecuencias, la suma de las frecuencias relativas es 1.0.
6. La media y la mediana son medidas de tendencia central e indican la
ubicacin (locacin) central de los datos.

49
Indica si las siguientes expresiones son siempre verdaderas (V) o no
necesariamente verdaderas (F):

7. Si la media aritmtica de un grupo de n datos es positiva, entonces los


n datos son no-negativos.
8. La varianza de cualquier base de datos debe ser no negativa.
9. La desviacin estndar entre los datos: 8, 8, 8, 8, 8, 8, 8, es mayor a
cero. (Sin realizar clculos).
10. El rango no puede tomar valores negativos.

50

Das könnte Ihnen auch gefallen