Beruflich Dokumente
Kultur Dokumente
Estadstica Descriptiva
Facultad de Ciencias Administrativas
Escuela de Administracin Pblica
ESTADSTICA DESCRIPTIVA
Objetivo:
Informar sobre los propsitos generales de la Estadstica y de la
Investigacin destacando su importancia en la generacin de
conocimiento y tecnologa.
La Estadstica es la Ciencia de la
a
Sistematizacin, recogida, ordenacin y
ipt iv presentacin de los datos referentes a un
e s cr fenmeno que presenta variabilidad o
D incertidumbre para su estudio metdico, con
objeto de
ad
i lid
b
o ba deducir las leyes que rigen esos fenmenos,
Pr
i a
nc
re
nfe
I
y poder de esa forma hacer previsiones sobre
los mismos, tomar decisiones u obtener
conclusiones.
Parmetros y estadsticos
La descripcin es la etapa inicial del estudio. La explicacin consiste en encontrar las leyes
naturales que rigen el fenmeno. Finalmente, la prediccin se logra mediante el uso adecuado
de las leyes naturales; en este ltimo proceso las leyes naturales juegan un papel fundamental.
Aunque con variaciones importantes, los cientficos siguen de modo aproximado una
metodologa comn. El llamado mtodo cientfico es el camino ms adecuado para la bsqueda
de leyes naturales. Es necesario entender bien el mtodo cientfico para conocer las
caractersticas de su producto: "Las leyes naturales o conocimiento objetivo de la realidad".
En
Una variable es una caracterstica observable que cambia entre
los individuos de la poblacin
los diferentes individuos de una poblacin. La informacin que
ecuatoriana, de uno a otro es
disponemos de cada individuo es resumida en variables.
variable:
El grupo sanguneo
{A, B, AB, O} Var. Cualitativa
Su nivel de felicidad
declarado
{Deprimido, Ni fu ni fa, Muy Feliz} Var.
Ordinal
El nmero de hijos
{0,1,2,3,...} Var. Numrica discreta
La altura
{162 ; 174; ...} Var. Numrica
continua
17
Tipos de variables
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente
a un nmero (no se pueden hacer operaciones algebraicas con
ellos)
Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones
algebraicas con ellos)
Nominal,
Ordinal,
De intervalo constante sin
cero real; y,
De intervalo constante con
cero real.
ESCALA NOMINAL
Cuantitativos; o,
Cualitativos
DATOS CUANTITATIVOS
Datos existentes
Fuentes primarias (encuesta,
censo)
Fuentes secundarias (literatura)
Datos no existentes
Entrevista (personal, telefnica,
por correo)
Observacin directa
Ensayos
Caractersticas de un
instrumento de medicin
Validez:
Confiabilidad:
Observaci
n
Observacin no participante:
Es cuando se perturba la accin o situacin que se esta investigando.
Observacin participante:
Implica conciencia en el
evaluado.
Entrevista
La evaluacin que se realiza al
individuo no debe pasar inadvertido
El instrumento es el evaluador la
reaccin la provoca directamente el
evaluador
Estructurada: si No estructurada:
cuenta con una Cuando buscan explorar
gua caractersticas del
evaluado
Encuesta
Busca conocer la respuesta
de un grupo; Puede
corresponder a una muestra
o una poblacin
Sujeto u observador
El ente observado
Los medios de observacin
Las circunstancias de la observacin
Clasifica:
1.SEGN LA RELACIN DEL OBSERVADOR Y EL
ENTE OBSERVADO.
PARTICIPANTES:
NO PARTICIPANTES:
El investigador se
incluye en el grupo , Es la observacin del
hecho observado con contexto del grupo
la finalidad de social sin intervenir
conseguir informacin en el fenmeno
desde adentro observado.
El investigador no
perturba la accin o
Natural : si el observador pertenece al grupo situacin del hecho
Artificial: si la integracin del observador es a observado.
propsito Aqu se encuentran
todas las magnitudes
de las variables
objetivas : talla el
peso
2. Segn los medios de
observacin
ASISTEMATICA
SISTEMATICA
No es segmentada ya que se
Por ser selectiva necesita la realiza sin la ayuda de
ayuda de elementos bsicos elementos tcnicos.
tales como: registros , escalas Tcnica simple o libre
de apreciacin etc. No permite la medicin por
que es subjetiva.
Permite una verdadera
medicin.
3. Segn las circunstancias de la
observacin.
Campo
No controlada
Observacin
descriptiva
Se la realiza en
el lugar de los
hechos
Laboratorio
Controlada
El ente observado
no se encuentra en su
estado natural
requiere de procesos
para controlar su
ambiente
Mediciones de mayor
estabilidad
Entrevista de investigacin
Entrevista a profundidad
Es netamente cualitativa, busca explorar y descubrir
caractersticas en el evaluado, no sigue reglas.
No clasifica no tiene inters de tabular datos, pero orienta
posibles hiptesis.
Entrevista enfocada
Se concentra en uno o varios puntos.
El entrevistador conoce directa e indirectamente esta situacin
Cuenta con una lista de temas abarca a fin de no omitir aspectos
importantes.
Modificando el investigador la forma y orden dependiendo de las
circunstancias.
Formula hiptesis
Obtiene una conclusin
Entrevista estructurada
Se encuentra con una gua de
encuesta
El objeto de estudio ya se
encuentra caracterizado y
consiste en proporcionar un
numero fijo de preguntas.
El investigador debe formular
preguntas que ampli la
informacin proporcionada
Es una tcnica y no un arte
Permite uniformizar las
respuestas, es
semicuantitativa.
Permite hace comparaciones.
Pone a prueba la hiptesis.
Qu es un muestreo?
Es la tcnica pararecoger una muestra
a partir de una poblacin o un subgrupo
de esta el, objetivo es estimar
parmetros por ejemplo, medidas,
prevalecas etc. Permite inferir sobre la
poblacin basndose en la informacin
de la muestra.
La muestra se deriva
de:
Formulacin Determinacin Los posibles
Definicin Definicin del universo y de
de problema de de riesgos de la
la poblacin a
objetivos variables partir de los investigacin
objetivos
Muestra
TIPO DE MUESTREO
Se clasifican en :
Muestreo probabilstico.
Muestreo no-
probabilstico.
MUESTREO
PROBABILSTICOS.
Se clasifican en :
por Cuotas
opintico o intencional
casual o incidental
de Bola de Nieve
Cuando Aplicar Muestreo No Probabilstico
Cuando se pretende estudiar una poblacin
rara o marginal
k: es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la
probabilidad de que los resultados de nuestra investigacin sean ciertos: un 95,5 % de confianza es lo mismo
que decir que nos podemos equivocar con una probabilidad del 4,5%. Los valores de k se obtienen de la tabla
de la distribucin normal estndar N (0,1).
Los valores de k ms utilizados y sus niveles de confianza son:
Valor de k 1,15 1,28 1,44 1,65 1,96 2,24 2,58
(Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la frmula k=1,96)
n=
e: es el error muestral deseado, en tanto por uno. El error muestral es la diferencia que
puede haber entre el resultado que obtenemos preguntando a una muestra de la
poblacin y el que obtendramos si preguntramos al total de ella.
Altos niveles de confianza y bajo margen de error no significan que la encuesta sea de
mayor confianza o est ms libre de error necesariamente; antes es preciso minimizar la
principal fuente de error que tiene lugar en la recogida de datos.
Ejemplo 1: si los resultados de una encuesta dicen que 100 personas
compraran un producto y tenemos un error muestral del 5%
comprarn entre 95 y 105 personas.
REPETICIONES
CUANTITATIVA FRECUENCIA
CUALITATIVA
PRENDAS DE VESTIR n N
CORBATA 10 10
n= 20 CASUAL 5 15
INFORMALMENT
E 5 20
ABSOLUTA n
FRECUENCI
A
ABSOLUTA
ACUMULADA N
CONTEO DE DATOS
N= 20
Se reportan los datos Xi ni Ni
correspondientes a la edad de
20 estudiantes, en el curso de 16 1 1
Estadstica 17 3 4
19 17 18 20 17 18 7 11
20 21 18 18 19 19 4 15
18 20 19 18 18
19 18 16 17 20 20 4 19
21 1 20
Se presentan los gneros musicales N= 15
preferidos por 15 habitantes de una
misma cuadra Xi ni Ni
Rock 5 5
Rock Jazz Clsica Latina Latina Jazz 3 8
Jazz Clsica Clsica Rock Rock Clsica 4 12
Clsica Latina Rock Jazz Rock Latina 3 15
FRECUENCIA RELATIVA Y FRECUENCIA RELATIVA
ACUMULADA
FRECUENCIA
ABSOLUTA RELATIVA
fi= ni/N
(ni) (%) (fi)
ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
(Ni) (Fi)=100%
Fi=Ni/N
(%)
CONSTRUCCION DE UNA TABLA DE
FRECUENCIAS
Se presentan los gneros musicales N= 15
preferidos por 15 habitantes de una
misma cuadra Xi ni Ni
Jazz 3 8
Jazz Clsica Clsica Rock Rock
Clsica 4 12
Clsica Latina Rock Jazz Rock
Latina 3 15
Xi ni Ni fi Fi
Rock 5 5 33% 33%
Jazz 3 8 20% 53%
Clsica 4 12 27% 80%
Latina 3 15 20% 100%
CONSTRUCCION DE UNA TABLA DE
FRECUENCIAS
Xi ni Ni fi Fi
Se reportan los datos correspondientes a la 16 1 1 5% 5%
edad de 20 estudiantes, en el curso de 17 3 4 15% 20%
Estadstica
18 7 11 35% 55%
19 17 18 20 17 19 4 15 20% 75%
20 21 18 18 19 20 4 19 20% 95%
18 20 19 18 18
19 18 16 17 20 21 1 20 5% 100%
CATEGORIAS DE
Xi DATOS
DATOS AGRUPADOS
SERIES DE DATOS
Construccin
Categoras Mltiples tabla de
cercanas repeticiones frecuencias con
dificultad
DATOS AGRUPADOS
CLASE
LONGITU
ni
D
20 Marcas de clase
18
16
14
12
puntaje 10
8
6
4
2
MEDIA 0
1 2 3 4 5 6
NA
clases
DATOS AGRUPADOS
k: numero de clases
n: tamao muestral
Criterio del
evaluador
Se presenta las calificaciones para un grupo de 25
estudiantes ,en un curso de geografa.
SE REPORTA LA ESTATURA DE 16
JOVENES PERTENECIENTES A UN CLUB
DE NATACION.
1. 50 1.731.701.52
1,651.731.621.66
1.621.711.581.71
1.801.561.791.65
Ejercicio de datos agrupados mtodo Sturges y Raz n
SE REPORTA LA ESTATURA DE 16
JOVENES PERTENECIENTES A UN
CLUB DE NATACION.
1. 50 1.731.701.52
1,651.731.621.66
1.621.711.581.71
1.801.561.791.65
ercicio de datos agrupados mtodo Sturges y Raz n
xi ni NI fi FI
SE REPORTA LA ESTATURA DE 16 [1.50,1.56] 3 3 18.75 18.75
JOVENES PERTENECIENTES A UN
CLUB DE NATACION. [1.50,1.575] 3 3 18.75 18.75
[1.56,1.62] 3 6 18.75 37.5
1. 50 1.731.701.52
[1.575,1.65] 5 8 31.25 50
1,651.731.621.66
1.621.711.581.71 [1.62,1.68] 4 10 25 62.5
1.801.561.791.65 [1.65,1.725] 5 13 31.25 81.25
[1.68,1.74] 4 14 25 87.5
[1.725,1.80] 3 16 18.75 100
[1.74,1.80] 2 16 12.5 100
Ejercicio de datos agrupados mtodo Sturges y Raz n
Xi ni Ni fi Fi
[1.50-1.56] 3 3 18.75% 18.75%
Definir el lmite inferior (Li) y el lmite superior (Ls) de cada
intervalo. El lmite inferior de la primera clase es el dato de menor
valor, el resto de los lmites de clase se obtienen mediante la suma
sucesiva de la amplitud a partir del primer valor.
Debe tenerse en cuenta que el dato mayor no es necesariamente el
lmite superior de la ltima clase, pero debe estar incluido dentro de
sta.
El lmite superior es el mismo valor del lmite inferior de cada una de
las clases siguientes, pero se recomienda que ninguna observacin
particular coincida con los valores de los lmites y para esto pueden
usarse varias estrategias que se indican ms adelante.
Asignar las frecuencias de cada categora. Para ello se deben
tener en cuenta las siguientes definiciones:
La frecuencia absoluta es el nmero de veces que aparece un
determinado valor, perteneciente a una poblacin o muestra
analizada, entre los lmites de cada clase.
La frecuencia relativa es el porcentaje de cada frecuencia absoluta
con respecto al total de datos de la poblacin o muestra analizada.
La frecuencia absoluta acumulada es la suma de todas las
frecuencias absolutas anteriores al lmite superior de una clase dada.
La frecuencia absoluta acumulada correspondiente a la ltima
categora coincide con el nmero total de observaciones.
La frecuencia relativa acumulada es la suma de todas las
frecuencias relativas anteriores al lmite superior de una clase dada.
Ejemplo 2.1.1: Solarte y Garca (2001) recolectaron varias muestras
aleatorias constituidas por 50 cuyes (Cavia porcellus) machos, en la
granja Botana, con el fin de analizar la variable peso al destete. Al
pesar cada individuo se encontraron los siguientes resultados,
expresados en gramos:
218, 258, 188, 177, 205, 225, 230, 231, 230, 143, 205, 189, 305,
285, 277, 288, 186, 258, 308, 310, 148, 258, 258, 139, 209, 285,
304, 289, 218, 289, 257, 129, 309, 258, 278, 289, 297, 303, 285,
308, 287, 258, 258, 209, 187, 209, 157, 208, 258, 128.
Con los anteriores datos correspondientes a una de las muestras, se
construy una tabla de distribucin de frecuencias cuyo
procedimiento se detalla a continuacin.
Peso al destete de cuyes machos (cavia porcellus) en la granja Botana de la Universidad
de Nario, Pasto, Colombia, 1995
Intervalos
Frecuencia Frecuencia
de clase Frecuencia Frecuencia
absoluta relativa
Clase Peso al absoluta relativa (%)
acumulada acumulada
destete (g)
1 128-159 6 12 6 12
2 159-190 5 10 11 22
3 190-221 8 16 19 38
4 221-252 4 8 23 46
5 252-283 11 22 34 68
6 283-314 16 32 50 100
Total 50 100
Para disear tablas de este tipo, adems de las
consideraciones de procedimiento descritas anteriormente,
deben tenerse en cuenta los siguientes aspectos:
El titulo de la tabla debe ser claro y completo de tal manera
que responda a las preguntas Qu es?, Dnde? Y
Cundo? (Carvajal, et al, 1993).
En la primera columna se indica la categora, en la segunda
la variable con su unidad de medida y el intervalo
correspondiente, en el resto de columnas las respectivas
frecuencias.
GRFICOS ESTADSTICOS
60
50
40
Frecuencia absoluta 30
20
10
0
128-159 160-191 192-223 224-255 256-287 288-319
Intervalos de Clase
Figura : Peso al destete de cuyes machos (cavia porcellus) en la granja Botana de la Universidad de
Nario, Pasto, 1995, representado en un histograma
Representacin grfica de datos estadsticos
S = Observacin mnima
Q1 = Primer cuartil
Q2 = Mediana
Q3 = Tercer cuartil
L = Observacin mxima
Los lados inferior y superior de la
caja van del primer al tercer cuartil.
Por tanto, la altura de la caja es la
amplitud del 50% de los datos
centrales.
El segmento del interior de la caja
indica la mediana. Los extremos de
los segmentos perpendiculares a los
lados superior e inferior indican,
respectivamente, los valores
mximo y mnimo de la distribucin
de datos.
Polgono de frecuencias.
60
50
40
Frecuencia absoluta 30
20
10
0
128-159 160-191 192-223 224-255 256-287 288-319
Intervalos de Clase
Figura 2.2.2 Peso al destete de cuyes machos (cavia porcellus) en la granja Botana de la
Universidad de Nario, Pasto, 1995, representado en un polgono de frecuencia
DIAGRAMA CIRCULAR.
4% 8%
35% 13%
16%
24%
Gramos caf
cereza/planta
El segundo cuartil de una distribucin es su mediana.
10=tama
o muestral
Muestra:
MHHMMHMMMH
equivale a
HHHH MMMMMM
Gnero Frec.
Hombre 4
Mujer 6
Pictogramas
Fciles de entender.
El rea de cada modalidad debe ser
proporcional a la frecuencia. De los dos, cul
es incorrecto?.
Grficos diferenciales para variables numricas
419
400 375
255
215
127
54
absolutas o relativas.
24 23 17
0 1 2 3 4 5 6 7 Ocho o ms
discretas
Se deja un hueco entre barras para
250
150
Posicin
Dividen un conjunto ordenado de datos en grupos
con la misma cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles, ...
Centralizacin
Indican valores con respecto a los que los datos
parecen agruparse.
Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los
datos con respecto a las medidas de
centralizacin.
Desviacin tpica, coeficiente de variacin, rango,
varianza
Forma
Asimetra
Apuntamiento o curtosis
DESCRIPCIN DE UNA VARIABLE CUANTITATIVA
Xi Mxima = 80
Xi Mnima = 54
Media simple = (80 +
54)/2 = 67
Media aritmtica
x = 1942/31 = 62.6
Clculo de la media a partir de datos
agrupados
A partir de datos agrupados en clases, se puede calcular la
frmula siguiente:
media con la
Media = M.F/n
Md = 60
Moda
Mod = 60
MEDIDAS DE DISPERSIN
DISPERSI TENDENCIA
N
Diferencias de
comportamiento
Amplitud : rango
Desviacin : media
varianza
estndar
MEDIDAS DE DISPERSIN
Rango o amplitud
Varianza
Desviacin estndar
Error estndar
Intervalo de confianza
Variabilidad relativa
Coeficiente de variacin de
la muestra.
Rango o Amplitud
El rango o amplitud (Rn) es la diferencia de
valores extremos de una serie de datos. Es
una medida que permite definir cuanto se
alejan los puntos extremos con respecto a la
media de una muestra.
Rn = Xi Mxima Xi Mnima
X2 X4 X6 XH XF
XI X3 X5 X7 XM
MEDIDAS DE DISPERSIN
DESVIACIN
MEDIA (DM)
MEDIA ARITMTICA
MEDIDAS DE DISPERSIN
DESVIACI
ON
ESTANDAR
Varianza
La varianza es una medida de dispersin que permite
conocer la variabilidad de un carcter o rasgo de objetos
de una muestra o poblacin, expresada en unidades
cuadrticas.
Se reporta la cantidad de Xi ni Ni fi FI
libros ledos en un mes, por
un grupo de 21 personas 0 3 3 14,29 % 14,29 %
0 3 0 1 0 1 1 9 12 42,86 % 57,15 %
4 2 3 3 2
3 4 21 19,04% 100,00
2 1 1 2 1 %
RANGO(R)
R=3-0
R=3
DESVIACIN MEDIA (DM)
COEFICIENTE DE
VARIACIN
COEFICIENTE: valor numrico a/b , b0
COEFIENTE
DE
VARIACIN
COEFICIENTE DE
VARIACIN
Xi ni Ni fi FI
0 4 4 20 % 20 %
1 7 11 35 % 55 %
2 5 16 25 % 80 %
3 3 19 15 % 95 %
4 1 20 5% 100 %
Desviacin
La desviacin estndar se expresa en las
estndar
mismas unidades en que fueron medidas
las variables (kilos, libras, gramos, metros,
centmetros, etc.) y se define como la raz
cuadrada de la varianza. Matemticamente
es la distancia sobre el eje de abscisas
desde la media hasta el punto de inflexin
de una curva normal
Ejercicio: A partir de la varianza del
ejercicio anterior, calcular
la desviacin estndar.
= 0.05
Z = 1.96 2.0
Ejercicio: Con los datos del Error estndar y media del ejercicio
anterior, calcular la variabilidad relativa.
ASIMETRIA EN DISTRIBUCIN DE DATOS
ni
X
i
ASIMETRIA DE DISTRIBUCIN DE DATOS
No de Habilidades
Mo de cada Obrero
Distribuciones asimtricas
8
X Me
6 Mo<X<Me positiva
Axis Title 4
2
0
1 2 3 4 5
Axis Title
0
1 2 3 4 5
OBREROS
Estadsticos de posicin
Se define el cuantil de orden como un valor de la variable por
debajo del cual se encuentra una frecuencia acumulada
15
10
5
0
1 2 3 4 5
15
10
5
0
50 55 60 65 70 75 80 85
10
5
0
10
5
0
0.08
Resumen con 5 nmeros:
0.06
Mnimo, cuartiles y
densidad
0.04
mximo.
Suelen dar una buena Mn. P25 P50 P75 Mx.
0.02
idea de la distribucin.
0.00
La zona central, caja, 40 45 50 55 60 65
de las observaciones.
Su tamao se llama
rango intercuartlico Diagrama de cajas de Tukey: Resumen en 5 nmeros
(R.I.)
0.04
Es costumbre que los
bigotes, no lleguen hasta
0.03
los extremos, sino hasta densidad
ms de 1,5 R.I.
0.00
n
Datos organizados en tabla
si est en intervalos usar como xi las marcas
de clase. Si no ignorar la columna de
intervalos.
x
i
xn i i
Media n
Variable fr. fr. ac.
L0 L 1 x1 n1 N1
L1 L 2 x2 n2 N2 Cuantil de orden
... i es el menor intervalo que tiene
frecuencia acumulada superior a n n
N i 1
Lk-1 Lk xk nk Nk
=0,5 es mediana C Li 1 ( Li Li 1 )
n
n i
0,75 58 N i 1 43,5 36
P75 C0, 75 Li 1 ( Li Li 1 ) 70 (80 70) 76,8
ni 11
0.05
Mn. P25 P50 P75 Mx.
0.04
Diferencia entre observacines extremas.
2,1,4,3,8,4. El rango es 8-1=7
0.03
Es muy sensible a los valores extremos. 25% 25% 25% 25%
0.02
Rango intercuartlico
0.01
Rango intercuartlico (interquartile range): Rango
Es la distancia entre primer y tercer cuartil.
0.00
Rango intercuartlico = P75 - P25
150 160 170 180 190
Parecida al rango, pero eliminando las observaciones ms
extremas inferiores y superiores.
n i
Es sensible a valores extremos (alejados de la media).
0.05
0.04
0.04
0.03
0.03
0.02
0.02
0.01
0.01
xs x 2s
68.5 % 95 %
0.00
0.00
150 160 170 180 190 150 160 170 180 190
0.3
densidad
densidad
0.2
0.2
xs
0.1
x 2s
0.1
x s x 2s
66 % 95 % 71 % 94 %
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
0.4
0.3
0.3
densidad
densidad
0.2
0.2
0.1
x s x 2s
0.1
xs x 2s
68 % 94 % 70 % 94 %
0.0
0.0
-3 -2 -1 0 1 2 3 -3 -2 -1 0 1 2 3
La asimetra es positiva o
negativa en funcin de a qu
lado se encuentra la cola de la
distribucin.
0.20
0.5
0.20
0.4
0.15
0.15
0.3
0.10
0.10
0.2
0.05
0.05
0.1
xs xs
xs
66 % 78 %
78 %
0.00
0.00
0.0
8 10 12 14 16 18 20 -2 -1 0 1 2 3 0 2 4 6 8 10 12 14
Bioestadstica. U. Mlaga. Tema 2: Estadsticos 204
x x x
Apuntamiento o curtosis
0.8
0.3
1.5
0.6
0.2
1.0
0.4
0.1
0.5
0.2
x s
xs x s
68 %
57 % 82 %
0.0
0.0
0.0
28%
Descriptivos para Nmero de hijos n=419
25%
Intervalo de Lmite
1,81 17%
confianza para la inferior
20%
media al 95% Lmite n=255 14%
superior 1,99 n=215
15%
Media recortada al 5% 8%
1,75 10%
n=127
4%
Mediana 2,00 n=54 2% 2% 1%
5%
Varianza 3,114 n=24 n=23 n=17
Desv. tp. 1,765
Mnimo 0
0 1 2 3 4 5 6 7 Ocho o ms
Mximo 8
Nmero de hijos
Rango 8
Amplitud intercuartil
3,00 Est sombreado lo que sabemos interpretar hasta
ahora. Verifica que comprendes todo. Qu unidades
tiene cada estadstico? Variabilidad relativa?
Asimetra 1,034 ,063
Curtosis 1,060 ,126 Calcula los estadsticos que puedas basndote slo
en el grfico de barras.
Bioestadstica. U. Mlaga. Tema 2: Estadsticos 206
ASIMETRIA EN DISTRIBUCIONES
DE DATOS
FORMA CURTOSIS
Asimetra: Coeficiente de Pearson
Coeficiente
asimtrico de
Pearson (Ap.)
Ap 0
Positiva
Ap 0
Negativo
ASIMETRIA COEFICIENTE DE PEARSON
0 4 4 20% 20%
1 6 10 30% 50%
2 3 13 15% 65%
3 4 17 20% 85%
4 2 19 10% 95%
5 1 20 5% 100%
ASIMETRA: COEFICIENTE DE BOWLEY
X X1 X2 X3 X4 X5
Tablas de datos pares ordenados
Y Y1 Y2 Y3 Y4 Y5
25
20
15
10
5 Diagrama de dispersin
0 CORRELACIN
0 1 2 3 4 5 6 7
COVARIADA
Covarianza relacin
lineal
X- Y
Datos Bivariados
Correlacin
Fuerza
Correlacin
Sentido
Forma
Calificaciones (sobre 100 puntos)
En simulacro y prueba de seleccin,
Para 12 aspirantes
76 81 90
80 86 80
93 95 70
60
51 53 SIMULACRO
50
62 60 40
70 75 30
73 73 20
82 86 10
86 88 0
40 50 60 70 80 90 100
78 77 PRUEBA
60 63
X : 73 y : 75.5
REGRESIN LINEAL
Regresin lineal por mnimos cuadrados
y= ax+b
REGRESIN LINEAL
Calificaciones (sobre 100 puntos) en simulacro y prueba de seleccin, para 12
aspirantes.
xi=876 (Xi) 2=767376
yi=906
(Xi)2=65528 y=ax+b
XiYi=67764
a= (12*67764)-(876*906)=1,029
(12*65528)-767376
b= (876*67764)-(906*65528)= 0,375
767376-(12*65528)
DEFINICIN DE PROBABILIDAD
Evento situacin , proceso.
Destino (voluntad
divina)
Ocurrencia
Azar
Manipulacin circunstancias
Incertidumbre
DEFINICIN DE
PROBABILIDAD
Probabilidad = (P)
6 caras x 2= 12
6 caras 2 DADOS
6 nmeros
6#x2
100
P (E)= Ocurrencia pesos 2
Cara eventos
Eventos dispo. Sello
Eventos
P =
1 = 0,5 P (s)= 1 = 0,5
2 2 (50%)
(50%)
DEFINICIN DE PROBABILIDAD
Juego de 50 cartas
25 rojas / 25
verdes. Determine
36 numricas. P( roja)
12 letras. P( nmero)
4 grupos letras (A- P( letra D)
P ( comodn)
D).
Nmeros 1-9
2 comodines
DEFINICIN DE PROBABILIDAD
Juego de 50 cartas
25 rojas / 25 verdes.
P (R) = # total de cartas R
36 numricas. # total de cartas
12 letras.
P (R) = 25/50 = 1/2
4 grupos letras (A-D). = 50 %
Nmeros 1-9
P(#) = # Cartas n / # Cartas
2 comodines
t
= 36/50 = 18/25
DEFINICIN DE PROBABILIDAD
Juego de 50 cartas
25 rojas/ 25
verdes
36 numricas
12 letras
4 grupos letras
Nmeros 1-9
2 comodines
DEFINICIN DE PROBABILIDAD
Juego de 50 cartas
25 rojas/ 25
verdes
36 numricas
12 letras
4 grupos letras
Nmeros 1-9
2 comodines
PROBABILIDAD: PROPIEDADES
m= # ocurrencias
n= # eventos
PROBABILIDAD : PROPIEDADES
U: universo E1,E2,E3,Ei U
E: evento
m: ocurrencias
n: # eventos
P (D) = 0 m1 + m2 + m3 + .. + mi = n
P( E1 + E2 +E3 + . Ei
)=1
P( E1) + P( E2) +.. + P(Ei) = 1
PROBABILIDAD : PROPIEDADES
P (E o F ) = P ( E ) + P
(F) = 1
1 0
0 1
P (c) =
1
0,5
P (c) = 0,5
PROBABILIDAD : PROPIEDADES
Eventos simultneos A y B
P (A)
P (A / B ) = P (A) P(B)
1
P (B)
= 1 =1
PROBABILIDAD : PROPIEDADES
P(A o V o R o B )
5 azules
P( A / B )
8 verdes
5 rojas P( V / R)
2 blancas P(A/V/R)
P( A/R/B)
------ Una balota
------ Dos balotas
------ Tres balotas
PROBABILIDAD : PROPIEDADES
5 azules
8 verdes
5 rojas
2 blancas
5 P( A) + P ( V ) + P ( R ) + P
azules
(B)
8 verdes 0,25 + 0,40 + 0,25 +
5 rojas 0,10
2 blancas
5 azules =0.25*0.25*0.1
8 verdes
5 rojas =0.00625
2 blancas (0.6%)
una balota
dos balotas
tres balotas
PROBABILIDAD: PROPIEDADES
LANZAMIENTO DE
DADOS
- P(Par)
- UN DADO
- P(1-3)
- DOS DADOS
- P(5)
- TRES DADOS
- P(Dardo en el
Blanco )
PROBABILIDAD:
PROPIEDADES
*P(par)
*P(1-3)
*P(5)
*P(Dardo en
el blanco)
PROBABILIDAD :PROPIEDADES
P(par)
P(1-3)
P(5)
P (dardo
en blanco
PROBABILIDAD :PROPIEDADES
P(par)
(5)
P(1-3)
P(5)
P(dardo en
blanco)
PROBABILIDAD :PROPIEDADES
P(par)
P(1-3)
P(dardo)=0
P(5)
P(dardo en
blanco)
PROBABILIDAD:
PROPIEDADES
OCURRENCIA
ADSCRITOS AL
EVENTOS UNIVERSO
NO OCURRENCIA
PROBABILIDAD: PROPIEDADES
PROBABILIDAD: PROPIEDADES
PROBABILIDAD PROPIEDADES
T = 180
PROBABILIDAD PROPIEDADES
Exmenes a un grupo
d 20 estudiantes
Matemtica (M): 9
Lenguaje (L): 12
Geografa (G): 14
M y L: 2
M y G: 5
L y G: 6
M y L y G: 1
PROBABILIDAD PROPIEDADES
Exmenes a un grupo
d 20 estudiantes
Matemtica (M): 9
Lenguaje (L): 12
Geografa (G): 14
M y L: 2
M y G: 5
L y G: 6
M y L y G: 1
PROBABILIDAD PROPIEDADES
Exmenes a un grupo
d 20 estudiantes
Matemtica (M): 9
Lenguaje (L): 12
Geografa (G): 14
M y L: 2
M y G: 5
L y G: 6
M y L y G: 1
PROBABILIDAD CONDICIONADA
P(A)
P(B
)
PROBABILIDAD CONDICIONADA
Probabilidad condicionada
P(G)=?
PROBABILIDAD CONDICIONADA
TEOREMA DE BAYES
P (A|B)
ERROR : P(A|B) =P(B|A)
DE BAYES
M L Total: 60
6 6 30
18
TEOREMA DE BAYES
Independencia
P(L|M) (P(L)
dependencia
1,0 0,50
P(M|L) P(M)
0,20 0,10
TABLAS DE CONTIGENCIA
Variables probabilidad
representacin
Cualitativas + condicionada = matricial
conteo de
datos
ocurrencia y no
Ocurrencia de DOBLE ENTRADA
Eventos (datos bi-
variados)
TABLAS DE CONTIGENCIA
Sean dos evento, A y B: comportamiento relacionado P(A), P(B).
B B
A P(A)
P()
P(B) P(B) 1
TABLAS DE CONTINGENCIA
C A D C A D
70 80 67 83 300
TABLA DE CONTINGENCIA
Se estudia la relacin entre At Aj Na Ci
las regiones de procedencia
(costa, montaa, interior, C 0,0333 0,017 0,133 0,050 0,233
llanos) con las preferencias
deportivas (atletismo,
ajedrez, natacin, ciclismo) M 0,100 0,100 0,067 0,167 0,433
de 300 estudiantes.