Sie sind auf Seite 1von 34

ESTADSTICA APLICADA

Fundamentos de estadstica descriptiva


POCO DESPUS de que se cerraron la urnas el da de las elecciones, un
comentarista de televisin informo al teleauditorio, que se pronostic, por anlisis
matemtico, que uno de los candidatos obtendra una victoria aplastante, el
pronostico se llev a cabo despus de tabular solamente el 2% de los votos.
La oficina meteorolgica nos informa que hay un 30% de probabilidad de que
llueva el das de hoy.
El gobierno informa que el ingreso medio de una familia de cuatro miembros es
superior en un 5% al del ao pasado.
Un profesor explica a su clase que la calificacin promedio de mitad del trimestre
fue 70.

Estas son algunas de las formas como se emplea la estadstica.


QU ES LA ESTADSTICA?
Cuando algunas personas escuchan la palabra estadstica ,
inmediatamente se imaginan cosas como: promedios de bateo, ndices de
accidentes, tasa de mortalidad, yardas ganadas por carrera de (en futbol
americano) etc. Esta rama de la estadstica, que utiliza nmeros para escribir
hechos, recibe el nombre, con bastante propiedad, de estadstica
descriptiva, la cual consiste en organizar , resumir y simplificar, en trminos
generales, informacin que a menudo es bastante compleja. El objeto es
hacer que las cosas se comprendan ms fcilmente, que sea ms sencillo
referirse a ellas y analizarlas, y mantenerse informado acerca de las mismas,
El promedio industrial Dow-Jones , el ndice de desempleo, el costo de la
vida, la precipitacin pluvial, el rendimiento medio de un auto en kilmetros
por litro y los promedios de calificacin, quedan todos en esta categora.
ETAPAS DE ESTADSTICA DESCRIPTIVA

RECOPILACIN CLASIFICACIN PRESENTACIN DESCRIPCIN

Se realiza a Se utilizan los Se representan Medidas de tendencia


travs criterios mediante central

Encuestas Alcance Diagramas barras, Media


Cuestionarios Rango circular Mediana
Censo Intervalo Histogramas Moda
Muestreo Polgono de
frecuencia
Conceptos bsicos
Poblacin: es el conjunto universal o marco referencial
Muestra: subconjunto de la poblacin
Individuo: Elemento que aporte informacin

Ejemplo:
Conjunto de alumnos de un colegio = poblacin
Conjunto de alumnos de primer ao = muestra
Cada alumno del colegio = individuo
TIPOS DE
VARIABLE

Variable Variable
Cualitativa Cuantitativa
(cualidad) (cantidad)
Discreta:
Ejemplos: Solo pueden tomar
Profesin valor finito, de
Color de ojos nmeros enteros
Sexo masculino o femenino * Nmero de hijos
Continua: *Cantidad de
trabajadores
Pueden tomar
cualquier valor real
infinito dentro de un
Intervalo
* Velocidad
* Estatura
** Temperatura de un
gas
RECOPILACIN DE DATOS
ENCUESTAS Y CUESTIONARIOS

POBLACIN CENSO

MUESTRA MUESTREO
CLASIFICACIN
Edades de un grupo de personas.
2,3,5,6,10,12,12,14,16,16,16,18,21,22,23,24,25,27,29,32

Tamao de la muestra (n) n= 20


Alcance (A) A=[2,32]
Rango o recorrido (R) R= 32-2= 30
Nmero de intervalos de clase (k) K=1+3.3 log (n)= 1+3.3 log
(20)= 5.29 k= 5
Intervalo de clase (Ii)
Ancho de clase o amplitud
(w) w=R/K = 30/5= 6
Tabla de distribucin de frecuencias

NMERO DE Ii fi
INTERVALOS
K= 5
[2,8> 4
[8,14> 3
ANCHOS DE [14,20> 5
CLASE W= 6
[20,26> 5
[26,32> 3
Presentacin
Presentacin Tabular
Concepto clave:
Marca de clase (Xi)
+
=
2
Frecuencia absoluta simple (fi) = =1 =

Frecuencia absoluta acumulada (Fi) = n


Frecuencia relativa simple(hi) hi=
1

Frecuencia relativa acumulada (Hi) Hi=




Tabla de distribucin de frecuencias

[2,8> 2+8/2= 5 4 4 4/20= 0.20 0.20
[8,14> 11 3 7 3/20=0.15 0.35
[14,20> 17 5 12 0.25 0.60
[20,26> 23 5 17 0.25 0.85
[26,32> 29 3 20 0.15 1

n=20
Representacin grfica
Diagrama de barras
se utiliza solo en variables cuantitativas discretas
Ejemplo: calificaciones de un grupo de 20 alumnos:
0,0,1,1,1,2,3,3,4,5,6,6,6,7,7,8,8,8,8,9
4.5
4
3.5
3
Nmero de 2.5
Alumnos 2

(frecuencia fi) 1.5


1
0.5
0
0 1 2 3 4 5 6 7 8 9

Calificaciones de alumnos (variables Xi)


4.5 Polgono de frecuencias
4

3.5

2.5
Nmero de
Alumnos 2
(frecuencia fi)
1.5

0.5

0
0 1 2 3 4 5 6 7 8 9

Calificaciones de alumnos (variables Xi)


Diagrama de sectores
36

4.5
4
3.5
3
Nmero de 2.5
Alumnos 2

(frecuencia 1.5
1
fi)
0.5
0
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7 8 9

Calificaciones de alumnos (variables Xi)

2
= (360) = 360 = 36
20
Histogramas

4
Frecuencia
2,8
Absoluta 3
8,14
simple (Ii).
14,20
2 20,26
26,32
1

0
Intervalos
Polgonos de frecuencia

2,8
3
8,14

14,2
2 0
20,2
6
1

0
Intervalos
Diagrama escalonado (Histograma de
frecuencias acumulada Fi)
25
F a
r c
e u 20

c m
u u
15
e l 2,8
n a 8,14
10
c d 14,20

i a 20,26
26,32
a 5
(

F
i 0
)

Intervalos
Ojiva:
25
F a
r c
e u 20

c m
u u
15
e l 2,8
n a 8,14
10
c d 14,20

i a 20,26
26,32
a 5
(

F
i 0
)

Intervalos
Descripcin
(Medidas de tendencia central)

Media= promedio aritmtico


Mediana= dato que ocupa la posicin central
Moda= el dato que mas veces se repite
Para datos no agrupados
Media
Ejemplo: 1,2,2,3,3,3,4,6

Promedio aritmtico

1+2+2+3+3+3+4+6 24
= =
8 8
Mediana
Dato que ocupa la posicin central.
Ejemplo: 1,2,2,3,3,3,4,6
Cuando n es par
1,2,2,3,3,3,4,6
Sumamos los dos nmeros y dividimos por dos
3+3 6
= =3
2 2
Cuando n es impar
1,2,2,5,6
Mediana = 2
Moda
Es el dato que mas veces se repite.

Ejemplo: 1,2,2,3,3,3,4,6
Moda= 3

Ejemplo: 1,2,2,2,3,3,3,4,6

Moda= 2,3= bimodal


Para datos agrupados

Media () = =1

Ii Xi fi Xifi
[2,8> 5 4 (5)(4)= 20 20+33+85+115+87
[8,14> 11 3 33 () =
20
[14,20> 17 5 85 340
[20,26> 23 5 115 () =
[26,32> 29 3 87 20
N=20 () = 17
Mediana

2
1
Media= liminf + (
)

Liminf = lmite inferior de la clase mediana


W= Ancho de clase
F(me-1)= Frecuencia absoluta acumulada de la clase anterior a la mediana
fme= frecuencia absoluta simple de la clase mediana

Ii Xi fi Fi
[2,8> 5 4
F(me-1)
4 F(me-1) Localizacin.
[8,14> 11 3
fme
7 fme
20
n=20 = = 10
W= 6 [14,20> 17 5 12 2 2
[20,26> 23 5 17
[26,32> 29 3 20
107
liminf
Mediana= 14 + 6 = .
5
liminf
Moda

1
M = + ( )
1 + 2
Liminf= lmite inferior de la clase modal
W= Ancho de clase
1 = fmo f(mo-1)
2 = fmo f(mo+1)
fmo= frecuencia absoluta modal
1
M = + ( )
Intervalo Xi fi
1 + 2
[5.2,6.1> 5.65 3
f(mo-1) Liminf= 7
[6.1,7> 6.55 5
fmo W= 0.9
[7,7> 7.45 9
1 = fmo f(mo-1)= 9-5= 4
[7.9,8.8> 8.35 7 f(mo+1)
2 = fmo f(mo+1)= 9-7 =2
[8.8,9.7> 9.25 5
fmo= frecuencia absoluta modal
[9.7,10.6> 10.15 3
4
n=32
M = 7 + 0.9 = 7.6
4+2
liminf

W =10.6 9.7= 0.9


Ejercicios No 1.
Sea la siguiente tabla una distribucin de valores de glucosa
sangunea mg/dL de 60 personas, calcular media, mediana y moda

( Linf Lisup) fi
[40 60> 3
[60 80> 8
[80 100> 30
[100 120> 10
[120 140> 6
[140 160] 3
total 60
Varianza y desviacin estndar
Desviacin estndar

La desviacin estndar () mide cunto se separan los datos.


La frmula es fcil: es la raz cuadrada de la varianza. As que, "qu es la varianza?"

Varianza
La varianza (que es el cuadrado de la desviacin estndar: 2) se define as:
Es la media de las diferencias con la media elevadas al cuadrado.

Cmo la calculamos?

1. Calcula la media (el promedio de los nmeros)


2. Ahora, por cada nmero resta la media y eleva el resultado al cuadrado (la diferencia elevada al
cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.
Ejemplo:
Se miden (en mm) diferentes razas de perros como se muestra en la imagen.

Las alturas (de los hombros) son: 600mm, 470mm, 170mm, 430mm y 300mm.
Calcula la media, la varianza y la desviacin estndar
Respuesta
600 + 470 + 170 + 430 + 300 1970
= = = 394
5 5

As que la altura media es 394 mm. Vamos a dibujar esto en el


grfico:
Ahora calculamos la diferencia de cada altura con la media:

Para calcular la varianza, toma cada diferencia, elvala al cuadrado, y haz la media:

206 2 + 762 + (224)2 +362 + (94)2 108520


: 2 = = = 21704
5 5

As que la varianza es 21,704.


Y la desviacin estndar es la raz de la varianza, as que:
Desviacin estndar: = 21,704 = 147
y lo bueno de la desviacin estndar es que es til: ahora veremos qu alturas
estn a distancia menos de la desviacin estndar (147mm) de la media:

As que usando la desviacin estndar tenemos una manera "estndar" de saber


qu es normal, o extra grande o extra pequeo.
Nota: por qu al cuadrado?
Elevar cada diferencia al cuadrado hace que todos los nmeros sean positivos (para evitar que los
nmeros negativos reduzcan la varianza)
Y tambin hacen que las diferencias grandes se destaquen. Por ejemplo 1002=10,000 es mucho ms
grande que 502=2,500.
Pero elevarlas al cuadrado hace que la respuesta sea muy grande, as que lo deshacemos (con la raz
cuadrada) y as la desviacin estndar es mucho ms til.

Das könnte Ihnen auch gefallen