Sie sind auf Seite 1von 44

Escuela Superior Politcnica del Litoral

M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Escuela Superior Politcnica del Litoral
Curso de: Estadstica y Probabilidades
Profesor: Marcos Mendoza
04/05/2012 Profesor: Marcos Mendoza 1
Clase 1: Estadstica Descriptiva

Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Para qu sirve la estadstica?
La Ciencia se ocupa en general de fenmenos
observables
La Ciencia se desarrolla observando hechos,
formulando leyes que los explican y realizando
experimentos para validar o rechazar dichas leyes
Los modelos que crea la ciencia son de tipo
determinsticos o aleatorio (estocstico)
La Estadstica se utiliza como tecnologa al servicio de
las ciencias donde la variabilidad y la incertidumbre
forman parte de su naturaleza
04/05/2012 Profesor: Marcos Mendoza 2
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Definicin
La Estadstica es la Ciencia de la
Sistematizacin, recogida, ordenacin y
presentacin de los datos referentes a un fenmeno
que presenta variabilidad o incertidumbre para su
estudio metdico, con objeto de

deducir las leyes que rigen esos fenmenos,


y poder de esa forma hacer previsiones sobre los
mismos, tomar decisiones u obtener
conclusiones.


04/05/2012 Profesor: Marcos Mendoza 3
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Algunos conceptos
Poblacin Objetivo: Conjunto bien definido de
elementos que son sujeto de alguna medicin [1]
Unidades de investigacin: Elementos de la
poblacin Objetivo a los que se les efecta alguna
medicin [1]
Muestra: Subconjunto de n unidades de investigacin
tomadas de la poblacin objetivo [1]
Observacin: Cada uno de los valores incluidos en la
muestra [1]


[1] Probabilidad y Estadstica, Fundamentos y Aplicaciones, Zurita Gaudencio
04/05/2012 Profesor: Marcos Mendoza 4
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Parmetros y Estimadores
Parmetro: Es una cantidad numrica calculada a
partir de los elementos de una poblacin
La altura media de los individuos de un pas
La idea es resumir toda la informacin que hay
en la poblacin en unos pocos nmeros
(parmetros).

Estimador o Estadstico: Es una cantidad numrica
calculada a partir de los elementos de una muestra
La altura media de los que estamos en este aula.
Somos una muestra (representativa?) de la
poblacin.
Si un estadstico se usa para aproximar un
parmetro tambin se le suele llamar estimador.
Profesor: Marcos Mendoza 5 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Tipos de variables
Cualitativas
Si sus valores (modalidades) no se pueden asociar naturalmente a un
nmero (no se pueden hacer operaciones algebraicas con ellos)
Nominales: Si sus valores no se pueden ordenar
Gnero, Grupo Sanguneo, Religin, Nacionalidad.

Ordinales: Si sus valores se pueden ordenar
Mejora a un tratamiento, Grado de satisfaccin.

Cuantitativas o Numricas
Si sus valores son numricos (tiene sentido hacer operaciones
algebraicas con ellos)
Discretas: Si toman valores puntuales
Nmero de hijos, Nmero de mquinas con problemas, nmero de veces que falla el
suministro de energa por mes.

Continuas: Si entre dos valores, son posibles infinitos valores intermedios.
Tiempo que tarda el dar mantenimiento a una mquina, Edad, tiempo de vida de un
equipo
04/05/2012 Profesor: Marcos Mendoza 6
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Tabla de Frecuencias
Para tabular datos cuantitativos se requiere conocer los
siguientes trminos: Clase, marca de clase, frecuencia
absoluta, frecuencia relativa, frecuencia acumulada,
frecuencias relativa acumulada .
Clase: Intervalos de igual longitud, que son
exhaustivos y mutuamente excluyentes.
Marca de clase: El punto medio de cada una de las
clases
Frecuencia absoluta: Nmero de observaciones que
se pueden clasificar en la clase.

04/05/2012 Profesor: Marcos Mendoza 7
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

( viene) Tabla de Frecuencias
Frecuencia Relativa: Se la obtiene dividiendo la
frecuencia de la clase i para el total de observaciones.
Frecuencia Acumulada: Resulta de sumar la
frecuencia acumulada de la clase i-1 con la frecuencia
de la clase i.
Frecuencia Relativa acumulada: Se la obtiene
dividiendo la frecuencia acumulada de la clase i para el
total de observaciones.

04/05/2012 Profesor: Marcos Mendoza 8
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

( viene) Tabla de Frecuencias
04/05/2012 Profesor: Marcos Mendoza 9
Ordinal Clase Marca de
clase
Frecuencia
Absoluta
Frecuencia
Acumulada
Frecuencia
relativa
Frecuencia
relativa
acumulada
1 [a
1
,a
2
) (a
1
+a
2
)/2 f
1
f
1
f
1
/n f
1
/n
2 [a
2
,a
3
) (a
2
+a
3
)/2 f
2
f
1
+f
2
f
2
/n (f
1
+f
2
)/n

k [a
k
,a
k+1
) (a
k
+a
k+1
)/2 f
k
n f
k
/n 1
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Tabla I
Tabla de Frecuencias
Tiempo (en meses) de vida del componente elctrico X
04/05/2012 Profesor: Marcos Mendoza 10
Ordinal Clase Marca de
clase
Frecuencia
Absoluta
Frecuencia
Acumulada
Frecuencia
relativa
Frecuencia
relativa
acumulada
1 [0-6) 3 2 2 0,04 0,04
2 [6-12) 9 6 8 0,12 0,16
3 [12-18) 15 8 16 0,16 0,32
4 [18-24) 21 16 32 0,32 0,64
5 [24-30) 27 10 42 0,20 0,84
6 [30-36) 33 7 49 0,14 0,98
7 [36-42) 39 1 50 0,02 1
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Histograma de frecuencia relativa
El histograma en un grfico bidimensional en cuyo eje
de las x se encuentran las clases y en el eje de la y las
frecuencias relativas.
04/05/2012 Profesor: Marcos Mendoza 11
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Grfico I
Histograma de Frecuencias Relativas
Tiempo (en meses) de vida del componente elctrico X
04/05/2012 Profesor: Marcos Mendoza 12
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
[0-6) [6-12) [12-18) [18-24) [24-30) [30-36) [36-42)
F
r
e
c
u
e
n
c
i
a

R
e
l
a
t
i
v
a

Tiempo (en meses)
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Algunas preguntas
Dnde se concentran mayormente los tiempo de vida
de las componentes?
Qu porcentaje de componentes tiene un tiempo de
vida entre 6 y 12 meses?
Qu porcentaje de componentes tiene un tiempo de
vida entre 24 y 30 meses?

04/05/2012 Profesor: Marcos Mendoza 13
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

( viene) Algunas preguntas
Qu porcentaje de componentes tiene un tiempo de
vida inferior a 6 meses?
Qu porcentaje de componentes tiene un tiempo de
vida inferior a 12 meses?
Qu porcentaje de componentes tiene un tiempo de
vida inferior a 30 meses?
Qu porcentaje de componentes tiene un tiempo de
vida superior a 24 meses?

04/05/2012 Profesor: Marcos Mendoza 14
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Polgono de frecuencia relativa
El Polgono en un grfico bidimensional en cuyo eje de
las x se encuentran las marcas de clase y en el eje de la
y las frecuencias relativas.
04/05/2012 Profesor: Marcos Mendoza 15
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Grfico II
Polgono de Frecuencias Relativas
Tiempo (en meses) de vida del componente elctrico X
04/05/2012 Profesor: Marcos Mendoza 16
0
0.05
0.1
0.15
0.2
0.25
0.3
0.35
0 3 9 15 21 27 44 39 45
F
r
e
c
u
e
n
c
i
a

R
e
l
a
t
i
v
a

Tiempo (en meses)
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Ojiva
Es un grfico que presenta en el eje horizontal la
caracterstica cuantitativa que se est investigando y en
el eje vertical la frecuencia relativa acumulada
04/05/2012 Profesor: Marcos Mendoza 17
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Grfico III
Ojiva
Tiempo (en meses) de vida del componente elctrico X
04/05/2012 Profesor: Marcos Mendoza 18
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 10 20 30 40
F
r
e
c
u
e
n
c
i
a

R
e
l
a
t
i
v
a

A
c
u
m
u
l
a
d
a

Tiempo (en meses)
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Algunas preguntas
Qu porcentaje de componentes tiene un tiempo de
vida menor a 14 meses?
Qu porcentaje de componentes tiene un tiempo de
vida superior a 21 meses?
Qu porcentaje de componentes tiene un tiempo de
vida entre 21 meses y 32 menes?
Cul es el tiempo de vida de las componentes de tal
forma que la mitad dure menos de ese valor?
Cul es el tiempo de vida de las componentes de tal
forma que el 25% dure menos de ese valor?

04/05/2012 Profesor: Marcos Mendoza 19
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Grfico III
Ojiva
Tiempo (en meses) de vida del componente elctrico X
04/05/2012 Profesor: Marcos Mendoza 20
0
0.1
0.2
0.3
0.4
0.5
0.6
0.7
0.8
0.9
1
0 5 10 15 20 25 30 35 40
F
r
e
c
u
e
n
c
i
a

R
e
l
a
t
i
v
a

A
c
u
m
u
l
a
d
a

Tiempo (en meses)
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Diferencias entre grficos
La diferencia est en si las variables a
graficar son continuas, discretas o
cualitativas
Diagramas barras para v. discretas o
caracterstica cualitativas
Se deja una separacin entre barras para
indicar los valores que no son posibles

Histogramas para variables continuas

0 1 2 3 4 5 6 7 Ocho o ms
Nmero de hijos
100
200
300
400
R
e
c
u
e
n
t
o
419
255
375
215
127
54
24 23
17
20 40 60 80
Edad del encuestado
50
100
150
200
250
R
e
c
u
e
n
t
o
Profesor: Marcos Mendoza 21 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Estimadores
Posicin
Dividen un conjunto ordenado de datos en grupos con la misma
cantidad de individuos.
Cuantiles, percentiles, cuartiles, deciles,...
Centralizacin
Indican valores con respecto a los que los datos parecen
agruparse.
Media, mediana y moda
Dispersin
Indican la mayor o menor concentracin de los datos con
respecto a las medidas de centralizacin.
Desviacin tpica, coeficiente de variacin, rango, varianza
Forma
Asimetra
Apuntamiento o curtosis
Profesor: Marcos Mendoza 22 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Profesor: Marcos Mendoza 23 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Simbologa
n: tamao de la muestra
X
i
: i-sima observacin
X
(i)
: i-sima observacin tal que
X
(1)
s X
(2)
s X
(3)
s s X
(n)


Por ejemplo si se tienen las siguientes observaciones
3 4 5 8 7 4 1
X
1
=3 X
2
=4 X
3
=5 X
4
=8 X
5
=7 X
6
=4 X
7
=1
X
(1)
=1 X
(2)
=3 X
(3)
=4 X
(4)
=4 X
(5)
=5 X
(6)
=7 X
(7)
=8
04/05/2012 Profesor: Marcos Mendoza 24
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Estadsticos de posicin



Se define el cuantil de orden o como un valor de la variable por debajo
del cual se encuentra una frecuencia acumulada o.
Casos particulares son los percentiles, cuartiles, deciles
04/05/2012 Profesor: Marcos Mendoza 25
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

( viene) Estadsticos de posicin



Percentil de orden i = cuantil de orden i/100
El i% de los elementos de la muestra toman valores menores o
iguales a P
i
, denominado percentil i; i=1,2, , 99
Cuartiles: Divide los elementos de la muestra en 4
grupos con frecuencias similares.
Q1=Primer cuartil = Percentil 25 = Cuantil 0,25
Q2=Segundo cuartil = Percentil 50 = Cuantil 0,5 = mediana
Q3=Tercer cuartil = Percentil 75 = cuantil 0,75
Deciles: Divide los elementos de la muestra en 10
grupos con frecuencias similares.
Di: i-simo decil
04/05/2012 Profesor: Marcos Mendoza 26
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Clculo de los estadsticos de
posicin
Definamos:
Para i=1,2,,n-1
Entonces el i-simo percentil es:
Para i=1,2,,n-1

04/05/2012 Profesor: Marcos Mendoza 27
) ( . 0 ) ( ) 1 ( ) ( ) . ( i i i a i X X a X X + = +
( )
|
.
|

\
| +
=
100
1 i n i
X P
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Diagramas de Cajas
Resumen con 5 nmeros:
Mnimo, cuartiles y
mximo.
Suelen dar una buena idea
de la distribucin.

La zona central, caja,
contiene al 50% central de
las observaciones.
El largo de la caja se llama
rango intercuartlico (R.I.)

Es costumbre que los
bigotes, no lleguen hasta los
extremos, sino hasta las
observaciones que se
separan de la caja en no ms
de 1,5 R.I.
Ms all de esa distancia se
consideran atpica o
anmalas, y as se marcan.
Diagrama de cajas de Tukey: Resumen en 5 nmeros
Velocidad (Km/h) de 200 vehculos en ciudad
d
e
n
s
i
d
a
d
40 45 50 55 60 65
0
.
0
0
0
.
0
2
0
.
0
4
0
.
0
6
0
.
0
8
40 45 50 55 60 65
Mn.
P
25
P
50
P
75 Mx.
Diagrama de cajas de Tukey: Resumen en 5 nmeros
Velocidad (Km/h) de 200 vehculos en autova
d
e
n
s
i
d
a
d
80 90 100 110 120 130 140
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
80 90 100 110 120 130 140
Mn. P
25
P
50
P
75 Mx.
Profesor: Marcos Mendoza 28 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Medidas de tendencia Central
Media (mean) Es la media aritmtica (promedio) de
los datos contenidos en la muestra. Se la obtiene
sumando todas las observaciones y dividiendo para el
tamao de la muestra.



Mediana (median) Es un valor que divide a las
observaciones ordenadas en forma ascendente en dos
grupos con el mismo nmero de individuos (percentil
50, segundo cuartil).



Moda (mode) Es el/los valor/es donde la distribucin
de frecuencia alcanza un mximo.
Profesor: Marcos Mendoza 29 04/05/2012
n
X
x
n
i
i
=
=
1
|
|
.
|

\
| +
=
2
1
~
n
X x
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Profesor: Marcos Mendoza 30 04/05/2012
Altura mediana
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Ejemplo 1
Para el siguiente conjunto de observaciones determine
los cuartiles, P
73
, D
3
y D
7
, la media, la mediana y la
moda
8 3 5 6 4 7 8 1 4 4
04/05/2012 Profesor: Marcos Mendoza 31
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Datos agrupados
Datos organizados en tabla
Denotemos por Xi a la marca de clase, entonces:

Media

Cuantil de orden
i es el menor intervalo que tiene frecuencia
acumulada superior a n
=0,5 es mediana

Variable fr. fr.
ac.
L
0
L
1
x
1
f
1
F
1
L
1
L
2
x
2
f
2
F
2

...
L
k-1
L
k
x
k
f
k
F
k

n
Profesor: Marcos Mendoza 32 04/05/2012
) (
1
1
1



+ =
i i
i
i
i
L L
f
F n
L C
o
o
n
f x
x
k
i
i i
=
=
1
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Ejemplo con variable en intervalos
Peso M.
Clase
frec Fr.
acum
.
40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100
130
115 3 58
04/05/2012 Profesor: Marcos Mendoza 33
En el histograma se identifica unidad de rea
con individuo.

Para calcular la media es necesario elegir un
punto representante del intervalo: La marca de
clase.

La media se desplaza hacia los valores
extremos. No coincide con la mediana. Es un
punto donde el histograma estara en equilibrio
si tuviese masa.
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Ejemplo (continuacin)
Peso M. Clase Fr. Fr. ac.
40 50 45 5 5
50 60 55 10 15
60 70 65 21 36
70 - 80 75 11 47
80 - 90 85 5 52
90 - 100 95 3 55
100 130 115 3 58
58
8 , 76 ) 70 80 (
11
36 5 , 43
70 ) (
58 75 , 0
1
1
1 75 , 0 75
=

+ =

+ = =

i i
i
i
i
L L
f
F
L C P
Moda = marca de clase de (60,70] = 65
Profesor: Marcos Mendoza 34 04/05/2012
3 , 69
58
3 115 10 55 5 45
=
+ + +
= =

n
f x
x
i
i i
6 , 66 ) 60 70 (
21
15 58 5 , 0
60
) (
58 5 , 0
~
1
1
1
50

=

+ =


+ = =

i i
i
i
i
L L
f
F
L P X
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Medidas de dispersin
Amplitud o Rango (range):
Diferencia entre el valor mximo X
(n)
y el
mnimo X
(1)
.
Rango= X
(n)
- X
(1)

2,1,4,3,8,4. El rango es 8-1=7
Es muy sensible a los valores extremos.


Rango intercuartlico (interquartile range):
Es la distancia entre primer y tercer cuartil.
RI=Rango intercuartlico = Q
3
Q
1

Parecida al rango, pero eliminando las observaciones ms extremas
inferiores y superiores.
No es tan sensible a valores extremos.

150 160 170 180 190
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
0
.
0
5
150 160 170 180 190
25% 25% 25% 25%
Mn. P
25
P
50
P
75
Mx.
Rango intercuartlico
Rango
Profesor: Marcos Mendoza 35 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Varianza S
2
(Variance): Mide el promedio de las desviaciones (al cuadrado)
de las observaciones con respecto a la media.





Sus unidades son el cuadrado de las de la variable. De interpretacin un poco
compleja para un principiante.

Desviacin tpica (standard deviation) Es la raz cuadrada de la varianza

=
i
i
x x
n
S
2 2
) (
1
1
Profesor: Marcos Mendoza 36 04/05/2012
2
S S =
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Dispersin en distribuciones normales
150 160 170 180 190
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
0
.
0
5
x s
68.5 %
150 160 170 180 190
0
.
0
0
0
.
0
1
0
.
0
2
0
.
0
3
0
.
0
4
0
.
0
5
x 2s
95 %
Centrado en la media y a una desv. tpica de distancia hay
aproximadamente el 68% de las observaciones.

A dos desviaciones tpicas tenemos el 95% (aprox.)
Profesor: Marcos Mendoza 37 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Datos casi normales.
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
d
e
n
s
i
d
a
d
-3 -2 -1 0 1 2 3
x s
66 %
x 2s
95 %
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
d
e
n
s
i
d
a
d
-3 -2 -1 0 1 2 3
x s
71 %
x 2s
94 %
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
d
e
n
s
i
d
a
d
-3 -2 -1 0 1 2 3
x s
68 %
x 2s
94 %
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
d
e
n
s
i
d
a
d
-3 -2 -1 0 1 2 3
x s
70 %
x 2s
94 %
Profesor: Marcos Mendoza 38 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Coeficiente de variacin
Es la razn entre la desviacin tpica y la media.
Mide la desviacin tpica en forma de
qu tamao tiene con respecto a la media

Tambin se la denomina variabilidad relativa.

Es frecuente mostrarla en porcentajes
Si la media es 80 y la desviacin tpica 20 entonces CV=20/80=0,25=25% (variabilidad
relativa)

Es una cantidad adimensional. Interesante para comparar la variabilidad de
diferentes variables.
Si el peso tiene CV=30% y la altura tiene CV=10%, los individuos presentan ms
dispersin en peso que en altura.

Los ingenieros electrnicos hablan de la razn seal/ruido (su inverso).
x
S
CV =
Profesor: Marcos Mendoza 39 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Ejemplo 2
Para el conjunto de observaciones del Ejemplo 1,
determine el rango, la varianza, la desviacin estndar
y el coeficiente de variacin
8 3 5 6 4 7 8 1 4 4
04/05/2012 Profesor: Marcos Mendoza 40
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Asimetra o Sesgo
Una distribucin es simtrica si la
mitad izquierda de su distribucin
es la imagen especular de su mitad
derecha.

En las distribuciones simtricas
media y mediana coinciden. Si slo
hay una moda tambin coincide

La asimetra es positiva o negativa
en funcin de a qu lado se
encuentra la cola de la distribucin.

La media tiende a desplazarse hacia
las valores extremos (colas).

Las discrepancias entre las medidas
de centralizacin son indicacin de
asimetra.


Profesor: Marcos Mendoza 41 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Estadsticos para detectar asimetra
Hay diferentes estadsticos que sirven para detectar asimetra.
Basado en diferencia entre estadsticos de tendencia central.
Basado en la diferencia entre el 1 y 2 cuartiles y 2 y 3.
Basados en desviaciones con signo al cubo con respecto a la media.
En funcin del signo del estadstico diremos que la asimetra es
positiva o negativa.
Distribucin simtrica asimetra nula.
x
8 10 12 14 16 18 20
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
8 10 12 14 16 18 20
x s
78 %
x
-2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
0
.
4
0
.
5
-2 -1 0 1 2 3
x s
66 %
x
0 2 4 6 8 10 12 14
0
.
0
0
0
.
0
5
0
.
1
0
0
.
1
5
0
.
2
0
0 2 4 6 8 10 12 14
x s
78 %
Profesor: Marcos Mendoza 42 04/05/2012
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Apuntamiento o curtosis
La curtosis nos indica el grado de apuntamiento (aplastamiento) de una
distribucin con respecto a la distribucin normal o gaussiana. Es
adimensional.
Platicrtica (aplanada): curtosis < 0

Mesocrtica (como la normal): curtosis = 0

Leptocrtica (apuntada): curtosis > 0
Apuntada como la normal
-3 -2 -1 0 1 2 3
0
.
0
0
.
1
0
.
2
0
.
3
-3 -2 -1 0 1 2 3
x s
68 %
Aplanada
0.0 0.2 0.4 0.6 0.8 1.0
0
.
0
0
.
5
1
.
0
1
.
5
2
.
0
0.0 0.2 0.4 0.6 0.8 1.0
x s
57 %
Apuntada
-2 -1 0 1 2
0
.
0
0
.
2
0
.
4
0
.
6
0
.
8
-2 -1 0 1 2
x s
82 %
Profesor: Marcos Mendoza 43 04/05/2012
En el curso sern de especial
inters las mesocrticas y
simtricas (parecidas a la
normal).
Escuela Superior Politcnica del Litoral
M
a
e
s
t
r

a

e
n

S
i
s
t
e
m
a
s

E
l

c
t
r
i
c
o
s

d
e

P
o
t
e
n
c
i
a

Bibliografa
Zurita, G. (2008) Probabilidad y Estadstica:
Fundamentos y Aplicaciones; Edicin Escuela Superior
Politcnica del Litoral, Instituto de Ciencias
Matemticas, Guayaquil-Ecuador
Barn, F., Tllez, F. (2004) Apuntes de Bioestadstica;
Universidad de Mlaga
04/05/2012 Profesor: Marcos Mendoza 44

Das könnte Ihnen auch gefallen