Beruflich Dokumente
Kultur Dokumente
UNIDAD I: ESTADSTICA
DESCRIPTIVA
La Estadstica hoy
La Estadstica es una ciencia la cual aporta habilidades bsicas para que un ciudadano
pueda desenvolverse en la era de la informacin. Es una poderosa herramienta de apoyo
en la toma de decisiones, a travs de la recoleccin, organizacin, resumen y anlisis de
datos.
Individuo o elemento: Personas u objetos que tienen informacin que se desea estudiar.
Variable: Propiedades, rasgos o cualidades con respecto a la cual difieren los elementos
de la poblacin.
Poblacin: Conjunto de elementos en los que se observa alguna caracterstica comn. Se
denota como .
Muestra: Subconjunto de la poblacin, la cual se recolecta y analiza con el objetivo de
hacer inferencias. Se denota como .
Parmetro: Caracterstica numrica que describe y resume la variable aleatoria observada
en la poblacin.
Estadstico: Caracterstica numrica que describe y resume la variable aleatoria observada
en la muestra.
1|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Una vez definida la variable de inters es necesario clasificar y ordenar los elementos de la
poblacin o muestra. As, una tabla de distribucin de frecuencias lista valores de datos u
observaciones, ya sea de manera individual o por grupos.
Se cumple que:
n n
ni
ni = n fi = 100% fi = 100%
n
i=1 i=1
Para variables cualitativas, los valores que toma la variable x corresponden a cada una
de las categoras de dicha variable.
Para datos individuales, la variable asociada es del tipo cuantitativa y se utiliza cuando el
nmero de datos distintos entre s es pequeo. Aqu los valores que toma la variable indica
la frecuencia con que aparecen los datos, desde el menor de ellos hasta el mayor de ese
conjunto.
23 22 21 24 25 23 22 21 23 21
22 23 25 21 22 22 21 23 24 22
2|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Para datos agrupados en intervalos, se debe tener presente en las variables cuantitativas
que si el nmero de datos poblacionales distintos entre s es grande podemos obtener un
gran nmero de clases con frecuencia absoluta igual a 1 que estadsticamente no resulta
relevante. En tal situacin podemos agrupar las clases en intervalos. Se recomienda entre
5 y 20 intervalos de clase o utilizar la regla de Sturger.
Los pasos que conforman la elaboracin de la distribucin de frecuencias por intervalos son
los siguientes:
El primer lmite inferior (Linf) de la tabla de frecuencia por intervalo corresponder al valor
mnimo que toman los datos (xmin), luego para encontrar el primer lmite superior (Lsup), al
valor del lmite inferior se le sumar la amplitud (a). Los restantes lmites inferiores
coincidirn con los lmites superiores de las clases anteriores.
Una vez definidas las clases de la tabla de frecuencia por intervalo, se procede a calcular
las restantes frecuencias de la tabla, agregando la siguiente informacin:
Obs.: Como criterio para facilitar la interpretacin, la amplitud debe presentarse con la
misma cantidad de decimales que los datos originales.
Ejemplo 3. Los datos que se presentan a continuacin son las edades de un grupo de
mujeres diabticas, que concurren a controles peridicos en un centro especializado:
66 74 75 69 65 63 60 62 64 73
67 63 74 73 69 68 75 71 70 67
3|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Histograma
5
4
3
2
1
0
[1-2[ [2-3[ [3-4[ [4-5[ [5-6[ [6-7[
4|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Ojiva
20
15
10
0
1,5 2,5 3,5 4,5 5,5 6,5
360 ni
xi =
N
5|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Grfico circular
20%
30%
A
B
C
10% D
40%
21 25 24 23 30 27 22 23 22 23
6|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Calificacin N alumnos
2 3
4 6
5 5
6 3
8 1
10 2
Total 20
Edad mi ni
[0 - 10[ 5 3
[10 - 20[ 15 6
[20 - 30[ 25 7
[30 - 40[ 35 12
[40 - 50[ 45 3
Total - 31
cx
= cx
x c = x c
7|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Mediana: La media aritmtica no resulta ser adecuado cuando existe una concentracin de
valores en algunos de los extremos. En este caso es preferible utilizar la mediana como
estadgrafo de posicin, este valor divide a la distribucin de frecuencia en dos partes
iguales cada una conteniendo el 50% de los datos. Se denota por Me.
n
Ni1
Me = FIi + (2 )A
ni
Donde:
8|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
Moda: Valor ms frecuente de todo el conjunto de datos. Es posible que una poblacin
tenga dos o ms modas. En esos casos se suelen llamar distribuciones bimodales o
multimodales. Se denota por Mo.
Mo = xi asociado al ni ms alto
ni+1
Mo = FIi + ( )A
ni1 + ni+1
Donde:
Las medidas de tendencia central nos proporcionan una idea de la forma de la distribucin.
Una distribucin de datos est sesgada si no es simtrica y se extiende ms hacia un lado
que hacia el otro. Una distribucin de datos es simtrica si la mitad izquierda de su
histograma es aproximadamente una imagen en espejo de su mitad derecha.
9|Pgina
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
S(x) = V(x)
10 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
S(x)
CV = 100%
x
Las medidas de posicin dividen todo el conjunto de datos en grupos con el mismo nmero
de individuos y son los siguientes:
Qi: Punto tal que el 25i% de las observaciones son a este valor. i = 1,2, 3.
in
Q i = xi asociado al Ni que supera por primera vez
4
11 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
in
Ni1
Q i = FIi + ( 4 )A
ni
Donde:
Di: Punto tal que el 10i% de las observaciones son a este valor. i = 1 a 9.
in
Di = xi asociado al Ni que supera por primera vez
10
12 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
in
Ni1
Di = FIi + ( 10 )A
ni
Donde:
Pi: Punto tal que el i% de las observaciones son a este valor. i = 1 a 99.
in
Pi = xi asociado al Ni que supera por primera vez
100
13 | P g i n a
ESTADISTICA PARA CIENCIAS DE LA SALUD 2017-1 JOHANNA DAZ MIRANDA
in
100 Ni1
Pi = FIi + ( )A
ni
Donde:
Tallo Hoja
0 45
1 23455
2 223456
3 23457
4 1234678
5 1256
6 2467
7 135
Grfico de caja y bigotes (Box Plot): Un grfico de cajas con patillas muestra las
posiciones relativas de los cuartiles, porcin central y valores extremos de una distribucin
de frecuencias. Esta grfica encierra el rango intercuartil Q3-Q1 de los datos en una caja
que tiene la mediana dibujada dentro. Adems, podemos identificar el tipo de asimetra de
la distribucin de frecuencias. Ser simtrica si la posicin de la mediana se encuentra en
la mitad de la caja y las antenas tienen la misma distribucin.
14 | P g i n a