Beruflich Dokumente
Kultur Dokumente
Universidad de Malaga
Curso 2011-2012
Cualitativa nominal:
Pas={Francia, Espana,...}
Color={Rojo, Verde, Amarillo, . . . }
Cualitativa ordinal: (Comun en escalas jerarquicas)
{Todo, Mucho, Regular, Poco, Nada}
{Muy alto, Alto, Regular, Bajo, Muy Bajo}
Cuantitativa discreta:
Numero de hijos={0, 1, . . . };
Numero de smbolos en un mensaje={2, 3, . . . }
Cuantitativa continua:
Altura en cm.
Peso en Kg.
Ruido en decibelios (dB).
Definicion
La frecuencia relativa (fi ) de la modalidad xi es el cociente entre
la frecuencia absoluta y el numero total de individuos
ni
fi =
N
Ejemplo
Los precios (en euros) de los menus servidos durante un da en un
restaurante determinado son: 6, 8, 6, 8, 6, 8, 12, 6, 8, 8, 6, 8, 8, 8, 12,
12, 8, 8, 12, 6, 8, 6, 6, 8, 12, 6, 6, 6, 6, 6.
Ejemplo
Los precios (en euros) de los menus servidos durante un da en un
restaurante determinado son: 6, 8, 6, 8, 6, 8, 12, 6, 8, 8, 6, 8, 8, 8, 12,
12, 8, 8, 12, 6, 8, 6, 6, 8, 12, 6, 6, 6, 6, 6.
Definicion
La frecuencia absoluta acumulada (Ni ) de una modalidad xi de
la variable X es la suma de las frecuencias de los valores que son
inferiores o iguales a el.
Definicion
La frecuencia relativa acumulada (Fi ) de una modalidad xi de X
es el cociente entre la frecuencia absoluta acumulada y el numero
total de individuos:
Ni
Fi =
N
Ejemplo
Si consideramos los valores numericos 7, 11, 11, 8, 12, 7, 6, 6
La media aritmetica simple viene dada por
7 + 11 + 11 + 8 + 12 + 7 + 6 + 6
x = = 8.5
8
Cuando la variable es continua y los valores estan agrupados por
intervalos, consideraremos las marcas de clase como los valores de
la variable y la frecuencia absoluta al numero de datos contenidos
en el intervalo.
Ejemplo
Calcular la media aritmetica en el ejemplo de las temperaturas.
Ejemplo: Dados los datos 5.3; 4.7; 5.2; 4.9; 49 la media aritmetica
es x = 13.82 que no representa nada.
Por otra parte, el ultimo dato 49 puede ser erroneo y ser, en
realidad, 4.9. La media sera entonces x = 5.
Depende demasiado de algun dato erroneo. Se dice que es
poco robusta.
y = ax + b
xi ni
13.725 7
13.975 14
14.225 18
14.725 6
Definicion
La media ponderada de los datos xi por los pesos wi se define
como: P
xi wi
xw = Pi
i wi
Ejemplo
Las calificaciones de un alumno son 2.6; 3.7; 5.1, 4.9 y 6.4. Las 3
primeras corresponden a controles con ponderacion 1, la cuarta es
la nota de practicas con ponderacion 2 y la ultima es el examen
final con ponderacion 3. Cual es la nota media?
Definicion
La media armonica (H) de los datos xi se define mediante:
n
H=P 1
i xi
Ejemplo
Tenemos 10 condensadores, 5 de 1F , 3 de 2F y los otros 2 de
5F conectados en serie. Queremos usar un unico tipo de
condensador (los 10 iguales). Cual debe ser su capacidad?
1 5 3 2 10 10
= + + = CH = 5 3 2
= 1.44927536
C 1 2 5 CH 1 + 2 + 5
Ejemplo
Se quiere comparar la duracion del establecimiento de conexion
entre dos protocolos. El protocolo A produce los valores (en ms.):
{10.8; 5.3; ; 12.4; 8.5; 7.7; 7.9; 4.4}, mientras que el protocolo B
produce: {6.6; ; 4.6; 2.3; 1.3; 3.3; 4.9; ; 2.8; 2.2; 3.5; 1.7; 2.1;
3.9; 3.4; 3.8; 4.0}
17
HB = 1 1 1 1 1 1
= 3.20419429
6.6 + + 4.6 + 2.3 + ... + 3.8 + 4
As pues, parece mejor el B, a pesar de que no establece la llamada
en el 11.76 % de los casos estudiados.
Departamento Matematica Aplicada Tema 1: Estadstica Descriptiva 1 variable Pag. 27
Media cuadratica o Valor cuadratico medio (RMS)
Definicion
La media cuadratica de los datos xi se obtiene mediante la
expresion:
s s
P 2 P 2
i xi i ni xi
xC = , o bien para datos agrupados: xC =
n n
Ejemplo
Al contabilizar durante una semana el numero de llamadas
recibidas en un servicio tecnico debido a algun tipo de avera, se
obtuvieron los valores: 2, 3, 1, 0, 4, 3. Hallar la media cuadratica.
r
39
r
22 + 3 2 + 1 2 + 0 2 + 4 2 + 3 2
xC = = = 6.5 2.54951
6 6
Definicion
La moda (Mo) de un conjunto de datos es el valor de la variable
que presenta mayor frecuencia. Puede no ser unica o puede que no
exista si todos los valores tienen la misma frecuencia
Ejemplo
Si consideramos el conjunto de datos A = {7, 11, 11, 8, 12, 7, 6, 6},
tenemos dos modas que corresponden a los valores 6 y 11
En B = {7, 11, 11, 8, 12, 12, 12, 7, 6, 6} la moda es el 12
En C = {7, 11, 8, 12, 9, 6} no hay moda.
Es una medida central mas robusta frente a los datos que la media.
Definicion
La mediana (Me) es aquel valor que divide a la poblacion en dos
partes de igual tamano. Si n es impar la mediana coincidira con un
termino de la poblacion, si n es par, se toman los dos valores
centrales y se calcula su media.
Ejemplo
Consideremos las listas de numeros ordenados
ListA = {11, 11, 16, 17, 25} y ListB = {1, 4, 8, 8, 10, 16, 16, 19}; la
mediana de la primera lista es 16 y la de la segunda lista es
8+10
2 = 9.
Definicion
Cuartiles. Son tres valores con las siguientes caractersticas:
Q1 = X (0.25): Valor que deja por debajo 1/4 de la poblacion.
Q2 = X (0.5) = Me: Deja por debajo la mitad de la poblacion.
Q3 = X (0.75): Deja por debajo 3/4 de la poblacion.
Definicion
Deciles Hay 9 deciles que dividen a la poblacion en 10 partes
k
iguales. Dk = X ( 10 ).
Definicion
Percentiles Hay 99 percentiles que dividen a la poblacion en 100
k
partes iguales. Se denotan por Pk = X ( 100 ) que sera el valor que
divide a la poblacion dejando por debajo el k % de los valores y por
encima el (100 k) %.
cN Ni1
X(c) = Li1 + ai
ni
donde:
Li1 : Limite inferior del intervalo.
Ni1 : Frecuencia absoluta acumulada correspondiente al
intervalo anterior.
ai : Amplitud del intervalo.
ni : Frecuencia absoluta del intervalo.
Departamento Matematica Aplicada Tema 1: Estadstica Descriptiva 1 variable Pag. 34
Ejemplo
Ejemplo
Calcular los cuartiles y los percentiles: P37 y P68 para los siguientes
valores numericos: 2, 5, 3, 4, 7, 0, 11, 2, 3, 8
10 20 35 44 55 64 75 81 87 99
11 22 36 48 56 68 76 82 89 101
13 23 38 49 57 69 76 83 90 102
15 23 41 50 60 70 78 83 94 105
18 30 44 50 63 73 80 85 96 107
Calcular P5 , P95 , Q1 , Me y Q3 .
5
P5 : v = 50 100 = 2.5 busco el 3o , por lo que P5 = 13
95
P95 : v = 50 100 = 47.5 busco el 48o , por lo que P95 = 102
1
Q1 : v = 50 4 = 12.5 busco el 13o , por lo que Q1 = 38
Me : v = 50 12 = 25 saco la media entre el 25o y 26o , por lo
que Me = 63+64
2 = 63.5
Q3 : v = 50 34 = 37.5 busco el 38o , por lo que P5 = 83
Definicion
Llamamos error cuadratico medio
P a la media 2de las desviaciones
ni (xi p)
al cuadrado: ECM = i
N
Ejemplo: Dados los valores {5, 2, 3, 3, 3, 5, 7} hallar la desviacion
media y error cuadratico medio respecto a la media y la mediana.
Respecto a la media: x = 5+2+3+3+3+5+7 7 = 4, las desviaciones
~
absolutas son: |di | = {1, 2, 1, 1, 1, 1, 3}, luego
5(1)2 +1(2)2 +1(3)2
DM = 5(1)+1(2)+1(3)
7 = 10
7 y ECM = 7 = 18
7 .
~
Respecto a la mediana: Me = 3, |di | = {2, 1, 0, 0, 0, 2, 4}, luego
2 2 2 +1(4)2
DM = 3(0)+1(1)+2(2)+1(4)
7 = 97 , ECM = 3(0) +1(1) +2(2) 7 = 25
7
NOTA: La mediana es el valor que hace mnimo la desviacion
media, mientras la media hace mnimo el error cuadratico medio.
Ejemplo
Dada la tabla de valores:
Cual es su entropa?
14 23 12 11
N = 14+ 23 + 12 + 1123= 60 23fi = {1260 , 60 , 60 ,60 }. Entonces:
H = 60 log4 60 + 60 log4 60 + 60 log4 12
14 14 11
60 + 60 log4 60
11
H 0.96662703
logb (x)
NOTA: Podemos usar: logK (x) = log , pero MATLAB contiene
b (K )
las funciones log, log2 y log10 que calculan el de base e, 2 y 10.
El de base 4 se obtiene mediante: log4 (x) = log(x)/ log(4).
Definicion
Se define el momento ordinario de orden r respecto al punto c
como:
k Pk
X ni (xi c)r
mr (c) = (xi c)r fi = i
N
i=1
Definicion
Se define el momento ordinario de orden r como la media
aritmetica de las potencias de orden r de los datos de la variable:
k Pk
X ni xir
mr = xir fi = i
N
i=1
Se verifica que:
El momento ordinario de orden 0 vale 1, m0 = 1.
El momento ordinario de orden 1 es la media aritmetica:
m1 = x
Propiedades:
Los momentos centrales 0 = 1 y 1 = 0.
El momento central de orden 2 es la varianza:
2 = V = 2 = m2 x2
3 = m3 3m2 x + 2x3
4 = m4 4m3 x + 6m2 x2 3x4
Departamento Matematica Aplicada Tema 1: Estadstica Descriptiva 1 variable Pag. 51
Medidas de forma: simetra y apuntamiento
Otras medidas que nos permiten clasificar la forma de una
distribucion son las medidas de asimetra (o sesgo) y las medidas
de apuntamiento (o curtosis).
Medidas de asimetra Una distribucion de frecuencias es
simetrica cuando los valores de la variable que equidistan de un
valor central tienen las mismas frecuencias.
Las distribuciones simetricas verifican: x = Me, y usualmente
x = Me = Mo.
Distribucion asimetrica Distribucion Distribucion asimetrica
negativa o a la izquierda simetrica positiva o a la derecha
Media
a
ia
a
a
ia
ian
od
od
ian
ed
ed
Mediana
ed
M
M
ed
M
M
Moda
M
Sesgo negativo Simetrica Sesgo positivo
Ejemplo
Los valores previstos (xi ), reales (xi ) y frecuencia absoluta (ni )
vienen dados en la tabla. Hallar la media cuadratica (MC) y la
desviacion media (DM).
xi 0 0 0 1 1 1 3 3 3
xi 0 1 3 0 1 3 0 1 3
ni 6 3 2 3 5 1 1 3 7
Ejemplo
La duracion en horas de una tipo de lampara incandescente viene
reflejado en la tabla adjunta. Calcular:
a) Dibujar el histograma. b) Porcentaje que duran menos
de 950 h.
c) Q1 , Q3 , D1 = P10 y D9 = P90 . d) Media, moda y mediana.
e) Varianza y desviacion tpica. f) Sesgo y curtosis.
g) Medias armonica y cuadratica. h) Desviacion media.
i) Error cuadratico medio (ECM) respecto media. j) ECM respecto a la mediana.
Int (200 600] (600 800] (800 1000] (1000 1200] (1200 1400] (1400 1700]
ni 4 31 136 165 67 14
Int. ni ai hi = nai
i
200 600 4 400 0.01
600 800 31 200 0.155
800 1000 136 200 0.68
1000 1200 165 200 0.825
1200 1400 67 200 0.335
1400 1700 14 300 0.0467
417
Int. ni ai hi Ni
200 600 4 400 0.01 4
600 800 31 200 0.155 35
800 1000 136 200 0.68 171
1000 1200 165 200 0.825 336
1200 1400 67 200 0.335 403
1400 1700 14 300 0.0467 417
417
Seran los 35 individuos que son menores que 800, mas la parte
proporcional de los que se encuentran en el intervalo (800-1000],
es decir:
950 800 137
P = 35 + 136 = 137 = 0.329 32.9 %
1000 800 417
Int. ni ai hi Ni
200 600 4 400 0.01 4
600 800 31 200 0.155 35
800 1000 136 200 0.68 171
1000 1200 165 200 0.825 336
1200 1400 67 200 0.335 403
1400 1700 14 300 0.0467 417
N = 417
Int. ni ai hi Ni
200 600 4 400 0.01 4
600 800 31 200 0.155 35
800 1000 136 200 0.68 171
1000 1200 165 200 0.825 336
1200 1400 67 200 0.335 403
1400 1700 14 300 0.0467 417
N = 417
N c Ni1
Aplico la formula: X(c) = Li1 + ai
ni
Q3 : c = 34 Nc = 417 4 = 312.9. El primero en rebasar ese valor
es el intervalo (1000-1200]:
312.9 171
Q3 = 1000 + 200 = 1172
165
Int. ni ai hi Ni
200 600 4 400 0.01 4
600 800 31 200 0.155 35
800 1000 136 200 0.68 171
1000 1200 165 200 0.825 336
1200 1400 67 200 0.335 403
1400 1700 14 300 0.0467 417
N = 417
1
P10 : c = 10 Nc = 41.7. El primero en rebasarlo es el (800-1000].
D1 = P10 = 1000 + 41.735
136 200 = 809.9
9
P90 : c = 10 Nc = 375.3. El primero en rebasarlo es el (1200-1400].
D9 = P90 = 1200 + 375.3336
67 200 = 1317
Mediana=Q2 : c = 0.5 Nc = 208.5. El primero en rebasarlo es el
(1000-1200]. Me = 1000 + 208.5171
165 200 = 1053
Int. ni ai hi Ni
200 600 4 400 0.01 4
600 800 31 200 0.155 35
800 1000 136 200 0.68 171
1000 1200 165 200 0.825 336
1200 1400 67 200 0.335 403
1400 1700 14 300 0.0467 417
N = 417
El intervalo modal es el (1000-1200] pues tiene el hi mayor.
1 0.145
Mo = Li1 + ai = 1000 + 200 1045.67
1 + 2 0.145 + 0.49
donde 1 = hi hi1 = 0.825 0.68 = 0.145 y
2 = hi hi+1 = 0.825 0.335 = 0.49.
Int. ni ai hi Ni xi ni xi ni xi2
200 600 4 400 0.01 4 400 1600 64(10)4
600 800 31 200 0.155 35 700 21700 1519(10)4
800 1000 136 200 0.68 171 900 122400 11016(10)4
1000 1200 165 200 0.825 336 1100 181500 19965(10)4
1200 1400 67 200 0.335 403 1300 87100 11323(10)4
1400 1700 14 300 0.0467 417 1550 21700 33635(10)3
N = 417 436000 472505(10)3
Media: x = 436000
417 = 1045.6
Varianza: Calculo primero m2 = 472505000
417 = 1133105.516
V = m2 x2 = 1133105.516
(1045.6)
2 = 39902.38
3 365394.78
g1 = 3
= 0.04584 Debilmente sesgada a derecha
199.7563
4 5723159551.29
g2 = 4
3= 3 0.594498 Leptocurtica
199.7564
ni |xi 1053|2
P
16662353
ECM(1053) = i = 39957.681
N 417
Desviacion media respecto a la mediana:
P
ni |xi 1053| 65625
DM(Me) = i = = 157.374
N 417