Sie sind auf Seite 1von 20

1

Contenidos
1. Introduccin
2. Estadstica Descriptiva:
Univariante
Bivariante
3.- Probabilidades
4.- Distribucin de probabilidades
5.- Distribucin en el Muestreo
6.- Estimacin de Parmetros
7.- Dcimas de Hiptesis
Prof.: David Becerra Rojas 1
Bibliografa
1. Murray y Espieges Estadstica
2. Paul Newbold Estadstica para los negocios
3. Mario Triola Probabilidad y Estadstica
4. L. Chao
5. R. Levin
6. Mongomery
7. www.elprisma.com( Matemtica,.)
Prof.: David Becerra Rojas 2
ESTADISTICA
CIENCIA QUE NOS PERMITE TOMAR
DECISIONES BAJO CIERTA
INCERTIDUMBRE
3
Trminos Comunes
Prof.: David Becerra Rojas 4
Proceso de realizar una observacin o una medicin.
Caracterstica o fenmeno, que puede tomar distintos valores.
Resultado de la observacin de una variable.
Conjunto total de elementos o individuos, que poseen una
caracterstica comn, acerca de la cual se quiere informacin
Subconjunto de la poblacin, seleccionada de acuerdo a una regla o un plan.
Obtencin de todos los datos de inters que posee la poblacin
Funcin o formula que depende de los datos de la muestra
Estimacin del parmetro a travs del estadstico
Funcin o formula que depende de los datos de la poblacin
Muestra
Censo
Estadstico
Parmetro
Inferencia
Experimento
Variable
Dato
Poblacin
Mtodo Cientfico
1. Planteamiento del Problema
2. Diseo del Experimento
3. Experimentacin y Recoleccin
4. Organizacin y Descripcin de Resultados
5. Inferencia Estadstica
Prof.: David Becerra Rojas 5
Muestreo
Notacin:
N : Tamao de la Poblacin
n : Tamao de la Muestra
Prof.: David Becerra Rojas 6
2
Tipos de Muestreos Aleatorios
Aleatorio Simple
Estratificado
Sistemtico
Por Conglomerado
Prof.: David Becerra Rojas 7
Muestreo Aleatorio Simple
Todos los elementos de la poblacin, tienen la misma
oportunidad de estar contenidos en la muestra.
Prof.: David Becerra Rojas 8
Se enumeran todos los elementos, y luego se extraen
de uno en uno, aleatoriamente, hasta completar el
tamao de la muestra.
Cuando la poblacin es muy grande, se puede
recurrir a los nmeros aleatorios.
Muestreo Estratificado
Mtodo de seleccin, utilizado cuando la poblacin, est
dividida en grupos llamados estratos, cada uno, formado
por una gran cantidad de elementos homogneos.
Prof.: David Becerra Rojas 9
Se toma una muestra aleatoria simple, en cada
estrato.
Los estratos, pueden ser de igual o distinto tamao,
si son distintos, una manera posible de determinar el
tamao de la muestra al interior de cada estrato, es
que esta sea proporcional al tamao del mismo, a
este tipo de asignacin, se le conoce como Afijacin
Proporcional, que no siempre resulta la mejor,
debido al costo de muestreo en cada estrato.
Muestreo Sistemtico
Este mtodo, se utiliza cuando la poblacin tiene sus
elementos ordenados. Se divide la poblacin (de tamao
N) en tantas sub poblaciones, como sea el tamao de la
muestra (n), todas de igual tamao
(k = N/n).
Prof.: David Becerra Rojas 10
Se selecciona al azar un elemento de la primera sub
poblacin, y de ah en adelante, de las sub
poblaciones siguientes, se extrae el elemento
correspondiente.
Muestreo por Conglomerado
Se utiliza, cuando la poblacin, est dividida en una gran
cantidad de pequeos grupos, llamados Conglomerados,
cada uno formado por elementos heterogneos. Se toma
una muestra aleatoria de Conglomerados, y luego se
censan todos los conglomerados seleccionados.
Prof.: David Becerra Rojas 11
Tipos (Gnero) de Variable
1.- Numricas :
Prof.: David Becerra Rojas 12
a.- Discretas
b.- Continuas
2.- Categricas: a.- Ordinales
b.- Nominales
3
Organizacin de Datos
Consideremos que la variable X, se divide
En k clases o categoras, denominadas:
C
1
, C
2
, C
i
, C
k
Prof.: David Becerra Rojas 13
Dando origen a la Siguiente tabla de Frecuencia
Tablas de Frecuencia
Prof.: David Becerra Rojas 14
i X ni fi Ni Fi
1 C1 n1 f1 N1 F1
2 C2 n2 f2 N2 F2
: : : : : :
i Ci ni fi Ni Fi
: : : : : :
k Ck nk fk Nk Fk
T o t a l n 1 /// ///
Tablas de Frecuencias
Frecuencia Absoluta: (n
i
)
Frecuencia Relativa : ( f
i
=n
i
/n )
Frecuencia Acumulada Absoluta: (N
i
)
Frecuencia Acumulada Relativa : (F
i
=N
i
/n )
Prof.: David Becerra Rojas 15
Ejemplo 1:
Prof.: David Becerra Rojas 16
M MB B B R M MM R MB MB R B B M R
B B R MB B B B R M MM B R R B R
B R
Tabla
i X
1 MM
2 M
3 R
4 B
5 MB
Total
Determine: a.- La variable x:
b.- El tpo de Variable:
c.- Una tabla de frecuencia
ni
2
4
10
12
4
32
f
i
.06
.13
.31
.38
.12
1.0
N
i
2
6
16
28
32
//
F
i
.06
.19
.50
.88
1.0
//
Opinin de alumnos por una bebida nueva
d.- Determine e Interprete
k= f
4
=
n
3
= N
3
=
n= F
3
=
e.- Cuantos alumnos consideran que
la bebida es al menos regular?
5
10
32
.38
16
.50
26 alumnos
Opinin de los alumnos..
Categrica Ordinal
Ejemplo 2:
Prof.: David Becerra Rojas 17
4 3 5 8 3 6 3 2 2 4 4 3 3
5 8 6 8 3 6 6 4 3 5 2 2 4
6 6 3 5
Tabla
i X
1 2
2 3
3 4
4 5
5 6
6 7
7 8
Total
Determine: a.- La variable X:
b.- El tpo de Variable:
c.- Una tabla de frecuencia
ni
4
8
5
4
6
0
3
30
f
i
.13
.27
.17
.13
.20
.00
.10
1.0
N
i
4
12
17
21
27
27
30
//
F
i
.13
.40
.57
.70
.90
.90
1.0
//
Nmero de artculos defectuosos por da.
d.- Determine e Interprete
k= f4=
n3= N4=
n= F3=
e.- En cuantos das el nmero de artculos
defectuosos fue de al menos 4?
7
5
30
.13
21
.57
18 das
Nmero de artic. Defec. Por da
Numrica Discreta
f.- Cul fu el nmero mximo de artculos
def. por da en los 15 das que hubieron menos?
4 artculo
g.- Cuntos artculos en total, se juntaron en
Los 6 das en que hubieron ms?
42 art.
Tabla de Frecuencia con Intervalos de
Clase
1. Rango: R = Valor Mx. Valor mn. + 1
u (1u: Una unidad de
medida)
2. Cantidad de Intervalos, Segn Sturgers: k = 1
+ 3.3 log(n) kN
3. Amplitud: c = Rk (c valor superior cuando no es exacto)
Prof.: David Becerra Rojas 18
Aparentes (X
A
)
6. Marcas de Clases (X
i
)
Ej. Si 1
u
= 0.01
y C= R/k = 4.571 4.58 ( se expresa en la unidad de medida) 4. Adicionales: p = c*k R
5. Intervalos :
X
i
= ( Ls + Li ) 2
Caractersticas (X
A
):
1.- Limite inferior del primer intervalo corresponde al valor
mnimo menos las p* unidades adicionales correspondientes .
2.- Limite superior del ltimo intervalo corresponde al valor
mximo ms las p** unidades adicionales correspondientes.
3.- Se expresan en la unidad de medida.
4.- Estn separados por una unidad de medida.
Reales (X
R
)
Caractersticas ( X
R
):
Se obtienen a partir de los Intervalos Aparentes, ampliando
estos en media unidad de medida hacia cada extremo, de tal
manera, que el limite superior de un intervalo, corresponda al
inferior del intervalo siguiente.
Obs.: La amplitud (c), se puede obtener de la diferencia entre dos limites
inferiores o superiores consecutivos, o entre dos marcas de clases
consecutivas
4
Ejemplo
Sea Valor mnimo = 4.7
Valor Mximo = 12.6
n = 42
Determine los intervalos aparentes y reales
con sus respectivas marcas de clase.
Prof.: David Becerra Rojas 19
1. Rango R = 12.6 4.7 + 0.1 = 8.0
2. K = 1 +3.3 log(42) = 6.4 6
3. C = 8.0 6 = 1.33 1.4
4. P = 1.4*6 -8.0=0.4
5. =Intervalos :i X
A
X
R
X
i
Prof.: David Becerra Rojas 20
1
2
3
4
5
6
4.5 5.8
5.9 7.2
7.3 8.6
8.7 10.0
10.1 11.4
11.5 12.8
4.45 5.85
5.85 7.25
7.25 8.65
8.65 10.05
10.05 11.45
11.45 12.85
5.15
6.55
7.95
9.35
10.75
12.15
Ejemplo 2:
Considere los siguientes datos:
0.94 1.05 0.86 0.94 0.96 1.03 1.01
0.78 0.84 0.86 1.04 0.76 0.65 0.70
Prof.: David Becerra Rojas 21
Confeccione una tabla de frecuencia
Con 5 intervalos.
1. Rango R = 1.05 0.65 + 0.01 = 0.41
2. K = 5
3. C = 0.41/5=0.082 0.09
4. P = 0.09*5 -0.41=0.04
5. =Intervalos :
i X
A
X
R
X
i
n
i
f
i
N
i
F
i
Prof.: David Becerra Rojas 22
1
2
3
4
5
0.63 0.71
0.72 0.80
0.81 0.89
0.90 0.98
0.99 1.07
0.625 0.715
0.715 0.805
0.805 0.895
0.895 0.985
0.985 1.075
0.67
0.76
0.85
0.94
1.03
2
2
3
3
4
14
0.14
0.14
0.21
0.21
0.29
1.00
2
4
7
10
14
0.14
0.28
0.49
0.70
1.00
Prof.: David Becerra Rojas 23
Complete la siguiente Tabla
1 - 12
2 - 0.20 12.6
3 - 48
4 - 0.80 18.4
5 - 120
Total //// ///// /////
i X
R
n
i
f
i
N
i
F
i
X
i
24
12
96 48
24
9.7
21.3
15.5
8.25
11.15 14.05
14.05 16.95
16.95 19.85
19.85 22.75
36
12
120
Luego como C = 2.9
11.15
TIPOS de GRFICOS
Grfico de Barras
Grfico de Sectores
Histograma
Polgono
Ojiva
Pctograma
Prof.: David Becerra Rojas 24
Categricas y Numricas Discretas
Categricas
Numricas Continuas
Numricas Continuas
Numricas
Numricas y Categricas
Principalmente en variables :
5
Grfico de Barras
0
5
10
15
20
25
30
Prof.: David Becerra Rojas 25
H A K M B
n
i
x
i
Grfico de Sectores ( Circular)
Prof.: David Becerra Rojas 26
1
2
3
4
Histograma
Prof.: David Becerra Rojas 27
3.5 5.5 7.5 9.5 11.5 13.5 XR
|
|
|
|
|
|
|
_________________________
n
i
120
100
80
60
40
20
Polgono
0
20
40
60
80
100
120
Prof.: David Becerra Rojas 28
2.5 4.5 6.5 8.5 10.5 12.5 Xi
n
i
Ojiva
Prof.: David Becerra Rojas 29
,00%
20,00%
40,00%
60,00%
80,00%
100,00%
1 2 3 4 5 6 7 8 9 10
F
i
Pictograma
Prof.: David Becerra Rojas 30
1990
1995
2000
2005
1000 ejemplares
Consumo de carne de vacuno
6
Ejemplo 1
()ac
51.4
143.9
205.5
231.1
360.0
/////
i x
i
n
i
f
i
1 H 10
.143
2 A 18
.257
3 K 12
.171
4 M 5
.071
5 B 25
.357
To tal 70
1.00
f
i
x360
51.4
92.5
61.6
25.6
128.5
360
Prof.: David Becerra Rojas 31
Confeccione un grfico de Barras y uno de Sectores
Ejemplo 2
Prof.: David Becerra Rojas 32
i
1
2
3
4
X
4 - 5
6 - 7
8 - 9
10 - 11
T otal
ni
40
75
105
30
250
fi
.16
.30
.42
.12
1.0
Ni
40
115
220
250
Fi
.16
.46
.88
1.0
Xi
4.5
6.5
8.5
10.5
Confeccione un: Histograma, un Polgono, y un Ojiva
Ejercicio
Supongamos que los datos siguientes representan los tiempos, que
demoran unos atletas en terminar una maratn.
1:35 1:28 1:45 1:52 1:40 1:30 1:38
1:47 1:37 1:30 1:40 1:36 1:29 1:35
1:37 1:36 1:40 1:36 1:48 2:05 1:32
2:28 1:45 1:50 1:47 2:29 1:44 1:49
Prof.: David Becerra Rojas 33
1. Identifique la variable
2. Indique el gnero ( tipo)
3. Construya una tabla de frecuencia de 5 intervalos
4. Confeccione un; Histograma, Ojiva
ESTADISTICOS ( o Estimadores)
CUANTILES ( Estadsticos de Orden)
MEDIDAS DE TENDENCIA CENTRAL
MEDIDAS DE DISPERSIN
Prof.: David Becerra Rojas 34
CUANTILES: ( ESTADSTICOS DE ORDEN)
Prof.: David Becerra Rojas 35
Cuartles : ( K
k
)
Quintles : (Qq)
Decles : ( D
d
)
Percentles : ( P
p
)
Cuartiles:
Prof.: David Becerra Rojas 36
K
1
K
2
K
3
25%
50%
75%
k = 1, 2, 3
7
Quintiles:
Prof.: David Becerra Rojas 37
Q
q
q x 20%
Q = 1, 2, 3, 4
Deciles:
Prof.: David Becerra Rojas 38
D
d
(10*d)%
d = 1, 2, .., 9
Percentles:
Prof.: David Becerra Rojas 39
P
p
p%
p = 1, 2, ., 99
Ejercicio
La tabla siguiente, representa los aos de
Servicio de los trabajadores de una empresa.
Prof.: David Becerra Rojas 40
i X
i
n
i
1 3 15
2 6 18
3 9 26
4 10 38
5 12 30
6 18 25
Total 152
1. Calcular : K
1
, Q
3
, D
2
, P
45
N
i
15
33
59
97
127
152
F
i
0.09
0.22
0.39
0.64
0.84
1.00
2.- Cul es el ao de servicio mnimo
de los 30 trabajadores ms antiguos
12 aos
K
1
= 9
P
45
= 10
Q
3
= 10
D
2
= 6
Cuantiles:
Prof.: David Becerra Rojas 41
Li : Limite real inferior del intervalo que contiene el cuantil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (t/Sx100)%.
S : 4, 5, 10, 100 ( Cuartil, Quintil, Decl, Percentil , respectivamente)
N
t-1
: frec. Acumulada anterior al intervalo que contiene el C
t
.
n
t
: frec. Absoluta del intervalo que contiene el C
t
.
C : Amplitud del intervalo.
n : Tamao de Muestra ( Total de Datos)
t
t t
n
c
N
S
n t
Li C *
*
1
(

+ =

t : 1,2,3 Cuartiles
1,2,3,4 Quintiles
1,2..9 Deciles
1,2,99 Percentiles Cuando los datos estn ordenados en una tabla de frecuencia
Con intervalos de clase, se puede utilizar la siguiente expresin
Ejemplo
8
6 . 0
* 4
10
50 * 1
95 . 2
1 (

+ = D
5
6 . 0
* 37
4
50 * 3
75 . 4
3 (

+ = K
15
6 . 0
* 12
100
50 * 35
55 . 3
35 (

+ = P
Prof.: David Becerra Rojas 42
i X
1 2.4 - 2.9
2 3.0 - 3.5
3 3.6 - 4.1
4 4.2 - 4.7
5 4.8 - 5.3
6 5.4 - 5.9
Total
n
i
4
8
15
10
5
8
50
N
i
4
12
27
37
42
50
f
i
.08
.16
.30
.20
.10
.16
1.0
F
i
.08
.24
.54
.74
.84
1.0
= 4.81
= 3.025
Determine : K
3
, D
1
, P
35
, y P
74
, Q
3
= 3.77
Si la variable X representa la utilidad en M$ por da determine:
i.- Cul fue la utilidad mxima de los 15 das que gan menos?
ii. En cuntos das la utilidad fue de al menos M$ 5.0?
11 das
P
74
= 4.75
M$ 3.67
Q
3
= 4.33
8
MEDIDAS DE TENDENCIA CENTRAL
MODA
MEDIANA
MEDIA ARITMTICA
MEDIA ARMNICA
MEDIA GEOMTRICA
Prof.: David Becerra Rojas 43
MODA ( MODO)
La denotaremos por : Mo
a.-Est dada por la observacin que ms se repite la
de mayor frecuencia.
b.-Es posible calcularla para cualquier tipo de variable.
c.- Pueden existir muchas o ninguna.
Prof.: David Becerra Rojas 44
MODA
Ejemplo 1: Sean los siguientes datos:
F D R F T D R U D U U D
Prof.: David Becerra Rojas 45
i X
i
n
i
1 F 2
2 D 4
3 R 2
4 T 1
5 U 3
Total 12
Luego; en este caso la
Moda es:
Mo = D
MODA
Ejemplo 2 :
2 3 5 1 1 5 2 5 4 2 4 2 5 1 6
Prof.: David Becerra Rojas 46
i X
i
n
i
1 1 3
2 2 4
3 3 1
4 4 2
5 5 4
6 6 1
Total 15
En este caso tenemos dos Mo:
Mo
1
= 2 Mo
2
= 5
Prof.: David Becerra Rojas 47
MODA
La moda para datos tabulados, se obtiene a partir de la
siguiente expresin:
Donde: Li: Limite real inferior del intervalo que contiene la Mo que es aquel
que tiene mayor frecuencia

1
: Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo anterior.

2
: Diferencia entre las frecuencias absolutas del intervalo modal y
el intervalo posterior.
C : Amplitud del intervalo.
c Li M
o
*
2 1
1
(

+ =
Ejemplo :
2 *
64 34
34
5 . 7
(

+
+ = o M
c Li M
o
*
2 1
1
(

+ =
Prof.: David Becerra Rojas 48
i
1
2
3
4
X
4 - 5
6 - 7
8 - 9
10 - 11
T otal
n
i
42
68
102
38
250
= 8.19
Calcule la Moda
9
MEDIANA
La denotaremos como : Md
Puntuacin que divide la distribucin de los datos
( la muestra) en dos partes iguales.
Es decir nos indica el punto hasta donde se tiene
acumulado el 50% de las observaciones.
Nota: - Para su determinacin, los datos se
ordenan previamente.
- No tiene sentido cuando la variable
es categrica nominal.
Prof.: David Becerra Rojas 49
MEDIANA
Si el nmero de observaciones impar,
entonces la Md estar dada por la observacin
central.
Si el nmero de observaciones par, entonces
la Md estar dada por el promedio de las dos
observaciones centrales.
Prof.: David Becerra Rojas 50
MEDIANA
Ejemplo: 1
2 3 5 7 9 10 27 29 30 38 40 n=11
En este caso la Md = 10
Ejemplo: 2
2,3 2,6 3,6 5,8 6,8 7,9 n=6
Prof.: David Becerra Rojas 51
123
Luego ; Md = (3,6+5,8)/2 = 4,7
Prof.: David Becerra Rojas 52
MEDIANA
La mediana para datos tabulados, se obtiene a partir de
la siguiente expresin:
Donde: Li : Limite real inferior del intervalo que contiene la Md, que es aquel
donde por primera vez la frecuencia acumulada pasa el 50%.
n : Tamao de la muestra
N
d-1
: Frec. acumulada anterior al intervalo que contiene la Mediana.
n
d
: Frec. Absoluta del intervalo que contiene la Md
C : Amplitud del intervalo.
d
d d
n
c
N
n
Li M *
2
1 (

+ =

MEDIANA
Ejemplo: dado los siguientes datos:
Prof.: David Becerra Rojas 53
i X
1 4
2 5
3 6
4 7
5 8
6 9
Total
n
i
3
2
2
3
4
3
17
Determine; Md
4 4 4 5 5 6 6 7 7 7 8 8 8 8 9 9 9
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 N
i
3
5
7
10
14
17
F
i
.18
.29
.41
.59
.82
1.0
Md = 7
Ejemplo de Mediana
15
2
* 12
2
5 . 7
(

+ =
n
M
d
Prof.: David Becerra Rojas 54
i X
1 4 - 5
2 6 - 7
3 8 - 9
4 10 - 11
5 12 - 13
6 14 - 15
Total
n
i
4
8
15
18
2
3
50
N
i
4
12
27
45
47
50
f
i
.08
.16
.30
.36
.04
.06
1.0
F
i
.08
.24
.54
.90
.94
1.0
Luego la M
d
= 9.23
y la Moda Mo = 9.82
Determine; M
d
, M
o
10
Ejercicio.
Prof.: David Becerra Rojas 55
4.8 3.6 5.2 6.1 6.0
2.9 3.5 4.8 4.3 4.2
4.8 3.1 4.8 2.9 5.5
5.0 4.8 5.6 6.0
1. Calcular Mo , Md
2. Construya una tabla de frecuencia
3. Calcule de la tabla Mo , Md.
4. Comente.
Prof.: David Becerra Rojas 56
MEDIA ARITMTICA
La media Aritmtica tambin llamada Promedio
simplemente Media, y esta dada para datos no
tabulados por : (Se calcula solamente en variables numricas)
Donde: X
i
: Corresponde a las Observaciones
n : Tamao de la Muestra
N : Tamao de la Poblacin
n
X
X
n
i
i
=
=
1
N
X
N
i
i
=
=
1

Muestral
Poblacional
Prof.: David Becerra Rojas 57
Donde: Xi : Observacin Marca de Clase
n : Tamao de la muestra
n
i
: Frecuencia Absoluta de la observacin o del
intervalo
k : Nmero de intervalos
MEDIA ARITMTICA
Para datos Tabulados la Media est dada por :
n
X n
X
k
i
i i
=
=
1

=
=
k
i
i i
x f
1
Ejemplo: La tabla siguiente representa una muestra de los
aos de servicio de trabajadores.
= =

=
5
1 i
i i
n
x n
X
Prof.: David Becerra Rojas 58
i
1
2
3
4
5
Xi
5
10
12
15
20
ni
4
7
8
3
2
24
Xi*ni
20
70
96
45
40
271
fi
0.167
0.292
0.333
0.125
0.083
1.00
fixxi
0.835
2.920
3.996
1.875
1.660
11.286
--------------------------------------------
--------------------------------------------
Total
Determine la Media:
= =

=
5
1 i
i i
x f X
= 11.286
286 . 11
24
271
= = X
Ejemplo 2: Se toma una muestra de 21 observaciones,
calcule la Media.
807 . 2
21
95 . 58
=
2 . 0
21
15
95 . 2

+ = c
n
u n
A X
k
i
i i
=
+ =
1
Prof.: David Becerra Rojas 59
i X
1 2.3 - 2.4
2 2.5 - 2.6
3 2.7 - 2.8
4 2.9 - 3.0
5 3.1 - 3.2
6 3.3 - 3.4
Total
n
i
4
5
3
2
4
3
21
x
i
2.35
2.55
2.75
2.95
3.15
3.35
n
i
*x
i
9.40
12.75
8.25
5.90
12.60
10.05
58.95
Luego como
u
i
-3
-2
-1
0
1
2
n
i
*u
i
-12
-10
-3
0
4
6
-15
= 2.807
= =

=
5
1 i
i i
n
x n
X
MEDIA PONDERADA

= == =
= == =
k
1 i
x * n
n
i i
Prof.: David Becerra Rojas 60
_ _ _
_ n
1
x
1
+ n
2
x
2
+.+n
k
x
k
x
T
= ---------------------------------
n
1
+ n
2
+ .+ n
k
_
100x480 + 300x320 + 400x Xc
290 = ---------------------------------------
100 + 300 + 400
Ejemplo: En una empresa donde se distinguen tres tipos de trabajadores, el
salario medio es de 290. Los 100 trabajadores de la categora A
tienen un salario medio de 480, los 300 de la categora B tienen un
salario medio de 320, Cunto es el salario medio de los 400 de la
categora C?
_
Luego X
c
= 220
11
Tarea N
Ventajas y Desventajas de: Moda, Mediana
y Media.
Defina y de un ejemplo de :
Media Geomtrica : (G)
Media Armnica : (H)
Sesgo
Curtosis
Prof.: David Becerra Rojas 61
Media Geomtrica:
n
n n
x x x
i
n
i
G x * ..... * *
1
2 1
=
=
=

=
=
n
i i
x
n
H
1
1
Prof.: David Becerra Rojas 62
Media Armnica:
MEDIDAS DE DISPERSIN
Prof.: David Becerra Rojas 63
Desviacin Media: (DM)
Desviacin Intercuartlica: (K)
Desviacin Tpica: ( s )
Varianza: ( s
2
)
Rango: (R)
MEDIDAS DE DISPERSIN
Rango: (R)
Prof.: David Becerra Rojas 64
R = V. Mximo V. Mnimo + 1 Unidad de Medida
MEDIDAS DE DISPERSIN
Desviacin Intercuartlica: (K)
Prof.: David Becerra Rojas 65
2
1 3
K K
K

=
MEDIDAS DE DISPERSIN
Desviacin Media: (DM)
Prof.: David Becerra Rojas 66
Para datos No Tabulados
Para datos Tabulados
n
X X
DM
n
1 i
i

=
n
X X n
DM
k
i
i i
=

=
1
12
MEDIDAS DE DISPERSIN
Varianza: (s
2
,
2
)
Poblacional
2 1
2
1
2
2
) (

=

= =
N
x
N
x
N
i
i
N
i
i
Prof.: David Becerra Rojas 67
Muestral : Para datos No Tabulados
( )
1
1
2
2

=
n
X X
S
n
i
i
) 1 n ( n
x x n
2
n
1 i
i
n
1 i
2
i

|
|

\
|

=

= =
MEDIDAS DE DISPERSIN
Prof.: David Becerra Rojas 68
( )
1
1
2
2

=
n
X X n
S
k
i
i i
) 1 (
2
1 1
2

\
|

=

= =
n n
x n x n n
k
i
i i
k
i
i i
Muestral : Para datos Tabulados
Ejemplo
6
5
30
= = X
( )
5 . 7
4
30
1
1
2
2
= =

=
n
X X
S
n
i
i
2
5
10
1
= =

=
n
X X
DM
n
i
i
( )
5 . 7
4 * 5
30 210 * 5
) 1 (
2
2
1 1
2
2
=

\
|

=

= =
n n
x x n
S
n
i
i
n
i
i
Prof.: David Becerra Rojas 69
Obs. : x
1
x
2
x
3
x
4
x
5
Total
Xi : 2 5 6 8 9 30
Determinar: Desv Media
Varianza
___
x
i
- x : - 4 -1 0 2 3 0
_
x
i
- x : 4 1 0 2 3 10
_
(x
i
- x)
2
: 16 1 0 4 9 30
Sean las edades ( en ao) de 5 nios
X
2
i
: 4 25 36 64 81 210
MEDIDAS DE DISPERSIN
Desviacin Tpica: (S , )
2 1
2
1
2
) (

=

= =
N
x
N
x
N
i
i
N
i
i
Prof.: David Becerra Rojas 70
( )
1 n
X X
S
n
1 i
2
i

=
) 1 (
2
1 1
2

\
|

=

= =
n n
x x n
n
i
i
n
i
i
Poblacional:
Muestral : Para datos No Tabulados
MEDIDAS DE DISPERSIN
Prof.: David Becerra Rojas 71
Para datos Tabulados
( )
1
1
2

=
n
X X n
S
k
i
i i
) 1 (
2
1 1
2

\
|

=

= =
n n
x n x n n
k
i
i i
k
i
i i
COEFICIENTE DE VARIACIN

Prof.: David Becerra Rojas 72


( (( (
( (( (

( (( (






= == = = == =
X
S
CV
Mide la homogeneidad que existe en los datos
Respecto a la variable en estudio.
Mientras ms pequeo, ms homogneo.
13
Ejemplo 2
75 . 2
19
25 . 52
:
1
= = =

=
n
x n
X que Sabemos
k
i
i i
( )
) 1 19 ( 19
25 . 52 ) 61 . 145 ( 19
2

=
) 1 (
2
1 1
2

\
|

=

= =
n n
x n x n n
S
n
i
i i
n
i
i i
Prof.: David Becerra Rojas 73
i
1
2
3
4
5
6
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
n
i
4
5
3
2
4
1
19
x
i
2.35
2.55
2.75
2.95
3.15
3.35
n
i
xx
i
9.40
12.75
8.25
5.90
12.60
3.35
52.25
= 0.327
n
i
xx
i
2
22.09
32.51
22.69
17.41
39.69
11.22
145.61
Calcule: la Media , Desv. Tpica
119 . 0
75 . 2
327 . 0
= = =
x
s
CV
Ejemplo 2
c
n
u n
A X
k
i
i i
=
+ =
1
( )
) 1 19 ( 19
19 ) 67 ( 19
2 . 0
2


=
) 1 (
2
1 1
2

\
|

=

= =
n n
u n u n n
c S
n
i
i i
n
i
i i
2 . 0
19
) 19 (
95 . 2

+ =
Prof.: David Becerra Rojas 74
i
1
2
3
4
5
6
X
2.3 - 2.4
2.5 - 2.6
2.7 - 2.8
2.9 - 3.0
3.1 - 3.2
3.3 - 3.4
n
i
4
5
3
2
4
1
19
x
i
2.35
2.55
2.75
2.95
3.15
3.35
u
i
-3
-2
-1
0
1
2
n
i
*u
i
-12
-10
-3
0
4
2
-19
= 2.75
n
i
*u
i
2
36
20
3
0
4
4
67
= 0.327
Calcule: la Media , Desv. Tpica
por el Medio Provisorio
Coeficiente de Asimetra ( Sesgo )
Prof.: David Becerra Rojas 75
Su valor es cero cuando la distribucin es simtrica, positivo cuando existe
asimetra a la derecha y negativo cuando existe asimetra a la izquierda.
de Pearson
de Fisher
3
3
1
3
3 1
) (
1
S
x x n
S
k
i
i i

= =

=
Coeficiente de Curtosisi
ca Platicrti
a Mesocrtic
ca Leptocrti
: 0
: 0
: 0
2
2
2

Prof.: David Becerra Rojas 76


3 3 ) (
1
4
4
1
4
4 2
= =

=
S
x x n
S
k
i
i i

Estadstica Descriptiva
Bivariante
Prof.: David Becerra Rojas 77 Prof.: David Becerra Rojas 78
Sean las siguientes variables:
X : A
1
, A
2
, ...................A
f
Y : B
1
, B
2
,.....................B
c
Estas variables, se pueden ordenar en una tabla de
doble entrada llamada Tabla de Contingencia:
Estadstica Descriptiva Bivariante
14
Tabla de Contingencia
X \ Y B
1
B
2
..B
j
.. B
c
Total
A
1

n
11
n
12

:
n
1
.
A
2

n
21
n
22

:
n
2
.
A
i
. .
n
ij

.
n
i
.
: :
:
A
f
:
n
f
.
Total n.
1
n.
2
... n.
j
..... n.
c

n

Prof.: David Becerra Rojas 79
Frecuencia Absoluta
(Conjunta)
Prof.: David Becerra Rojas 80
Se denota por n
ij
y se define como: Cantidad de
elementos que cuentan simultneamente con la
caracterstica A
i
de la variable X y B
j
de la variable Y
Frecuencia Absoluta
Marginal
Prof.: David Becerra Rojas 81
n
i
.: Total de la fila i = n
ij
n.
j
: Total de la Columna j = n
ij
n.. : Total General = n
ij
= n ( Tamao muestra)
i=1 j=1
j=1
c
f
f c
i=1
Frecuencia Relativa
Conjunta
Prof.: David Becerra Rojas 82
Se denota por fij =
n
ij
n
Frecuencia Marginal Relativa
Prof.: David Becerra Rojas 83
f
i
. = f
ij
=
f.
j
= f
ij
=
f.. = f
ij
= 1
i=1 j=1
j=1
c
f
f c
i=1
n
n
n.
j
n
i
.
Frecuencia Condicional
. . i
ij
i
ij
i
j
n
n
f
f
f = =
j
ij
j
ij
j
i
n
n
f
f
f
. .
= =
Prof.: David Becerra Rojas 84
De x dado y ( x/y):
De y dado x ( y/x):
15
Independencia de Variables
Prof.: David Becerra Rojas 85
Diremos que dos variables X e Y son
independientes si y solo si, la conjunta es igual al
producto de las marginales, para todo i, y para todo j.
Es decir;
fij = fi. x f.j i , j
nij =
ni. X n.j
n
Estadstica Descriptiva Bivariante
Ejemplo: Considere una muestra de turistas
Sea X : Peso (Kg) de equipaje de Turistas
Y: Nacionalidad
X \ Y
Chilena Argentina Peruana Brasilea
Total
5 10
4 2 4 10 20
10 15
8 3 1 12 24
15 20
3 9 3 10 25
20 25
0 10 1 10 21
25 - 30
5 2 0 15 22
Total 20 26 9 57 112

Prof.: David Becerra Rojas 86
Determine e Interprete : f = n
51
=
f
34
=
n
..
= n
.3
=
n
2.
=
f
j=4/i=3
= f
i=4/j=3
= f
.2
= f
4.
=
c= 5 4 5
24 9 112
10/112 21/112 26/112 1/9 10/25
0.083 0.19 0.23 0.11 0.40
Asociacin de Variables
Numricas
Prof.: David Becerra Rojas 87
i
1
2
.
.
.
n
X
x
1
x
2
.
.
.
x
n
Y
y
1
y
2
.
.
.
y
n
. . .
.
.
.
.
.
.
.
.
.
x
y
Diagrama de
dispersin
Tipos de Asociacin
Prof.: David Becerra Rojas 88
Favorable :
. .
. . .
..
..
..
y
x
Inversa:
..
. .
.
..
..
.
x
y
x
i x
j
x
j
x
i
y
j
y
i
y
i
y
j
) ( ) ( y y x x
) )( ( y y x x
Prof.: David Becerra Rojas 89
Sea X:Remuneracin
Y: Cargas Familiares
1
1
3
4
4
5
18
3.0
2
3
3
5
2
6
21
3.5
-2
-2
0
1
1
2
0
1
2
3
4
5
6
Total
Media
-1.5
-0.5
-0.5
1.5
-1.5
2.5
0
Ejemplo:
3
1
0
1.5
-1.5
5
9
1.5
y x i
Covarianza ( cov(x,y) )
Prof.: David Becerra Rojas 90
n
y y x x
y x Cov


=
) )( (
) , (
5 . 1
6
9
) , ( = = y x Cov
16
Coeficiente de Correlacin


=
) ) ( )( ) ( (
2 2 2 2
y y n x x n
y x xy n
r
Prof.: David Becerra Rojas 91
-1 r 1
r : Se expresa en porcentaje
y x
y x Cov
r
*
) , (
=
) 21 87 * 6 )( 18 68 * 6 (
21 * 18 72 * 6
2 2

=
) ) ( )( ) ( (
2 2 2 2
y y n x x n
y x xy n
r
Prof.: David Becerra Rojas 92
X
1
1
3
4
4
5
18
Y
2
3
3
5
2
6
21
XY
2
3
9
20
8
30
72
i
1
2
3
4
5
6
Total
X
2
1
1
9
16
16
25
68
En nuestro caso tenemos:
Y
2
4
9
9
25
4
36
87
= 0.65
Regresin Lineal
Prof.: David Becerra Rojas 93
Y = a + bX
Consiste en ajustar a los datos (representados en el
diagrama de Dispersin, una lnea, que puede ser recta
o curvilnea .
En esta oportunidad analizaremos el caso de la lnea recta.
Esta recta, tambin sirve para marcar la tendencia
De los datos, para hacer proyecciones, y para estimar
algn valor de y dado un valor de x.

Prof.: David Becerra Rojas 94
Error:
i i i
y y e =
Varianza del Error: (
2
)
cuyo estimador est dado por:
2
) (
2
2 2

= =

n
y y
S S
i i
x
y e

= = O y y e
i i i
) (
Prof.: David Becerra Rojas 95
Debemos minimizar la varianza del Error
Para tal efecto debemos minimizar:
2 2
) ( ) (

= =
i i i i
bx a y y y A
Es decir derivar A
Prof.: David Becerra Rojas 96
0
0
=

b
A
a
A
Sistema de Ecuaciones Normales
17
Prof.: David Becerra Rojas 97

= + =
= =

i i
i i
y x b na
bx a y
a
A
0 ) 1 ( ) ( 2
Luego tenemos:

= +
= =

i i i i
i i i
y x x b x a
x bx a y
b
A
2
0 ) )( ( 2
Prof.: David Becerra Rojas 98


= +
= +
xy x b x a
y x b na
i i
i
2
Por lo tanto, el sistema de Ecuaciones Normales
queda de la siguiente forma:
Prof.: David Becerra Rojas 99
Por determinante tenemos;
( )



= =
2 2
2
x x n
x x
x n



= = xy x x y
x xy
x y
a
2
2



= = y x xy n
xy x
y n
b

=
a
a

=
b
b
Prof.: David Becerra Rojas 100
Estimadores Mnimos Cuadrado
2 2
2
) x ( x n
xy x x y
a

=
2 2
) x ( x n
y x xy n
b

=
a

=
b
X b Y =
Prof.: David Becerra Rojas 101
X
1
1
3
4
4
5
18
Y
2
3
3
5
2
6
21
XY
2
3
9
20
8
30
72
i
1
2
3
4
5
6
Total
X
2
1
1
9
16
16
25
68
En el caso que estamos analizando tenemos:
Y
2
4
9
9
25
4
36
87
^
Y
2.2
2.2
3.5
4.1
4.1
4.8
( e )
^
Y - Y
-0.2
0.8
-0.5
0.9
-2.1
1.2
0.0
( e
2
)
^
(Y Y)
2
0.04
0.64
0.25
0.81
4.41
1.44
7.59
Luego; 898 . 1
4
59 . 7
2
) (
2
2
= =

=

n
y y
S
i i
x y
Luego tenemos que; a = 1.571 b = 0.643
Prof.: David Becerra Rojas 102
Error Tpico: ( )
38 . 1 898 . 1
4
59 . 7
2
) (
2
2
= = =

= =

n
y y
S S
i i
e x y
2
2


= =

n
xy b y a y
S S
x
y e
Tambin se puede obtener a partir de:
18
Coeficiente de Determinacin
Prof.: David Becerra Rojas 103
El coeficiente de Determinacin, nos
indica la variabilidad explicada por la recta
de regresin lineal, es decir que tan bueno
es el ajuste de la recta.
Esta dado por: r
2
0 r
2
1
Nota: Referencia para el ajuste, tambin lo da
el error tpico S
y/x
Ejemplo:
Prof.: David Becerra Rojas 104
Supongamos que tenemos dos variables:
X : Aos de servicio de vendedores.
Y : Ventas en M$
Vendedor
1
2
3
4
5
6
Total
X
2
2
3
4
4
5
20
Y
1.2
2.4
4.1
3.1
2.4
3.8
17.0
XY
2.4
4.8
12.3
12.4
9.6
19.0
60.5
X
2
4
4
9
16
16
25
74
Y
2
1.44
5.76
16.81
9.61
5.76
14.44
53.82
1. Confeccione un diagrama de dispersin
2. Determine el grado de asociacin entre las variables
3. Estime a travs de una recta de m. c. cuanto debiera vender un
vendedor con siete aos de servicio?.
4. Estime a travs de una recta de m. c. cuanto aos de servicio debera
tener, un vendedor que vende m$ 4.0?.
Prof.: David Becerra Rojas 105
=

=


=
)
2
.) 17 ( .) 82 . 53 ( 6 )(
2
.) 20 ( .) 74 ( 6 (
.) 17 .)( 20 ( ) 5 . 60 ( 6
)
2
) y (
2
y n )(
2
) x (
2
x n (
y x xy n
r
=

=


2 2 2
) 20 ( ) 74 ( 6
) 17 )( 20 ( ) 5 . 60 ( 6
) x ( x n
y x xy n
b
=

=


2 2 2
2
) 20 ( ) 74 ( 6
) 5 . 60 )( 20 ( ) 74 )( 17 (
) x ( x n
xy x x y
a
Luego:
1.09
.523
=.5954
Prof.: David Becerra Rojas 106
Varianza del Error:
Error Tpico:
2 2
) (
2 2
2

=

n
xy b y a y
n
y y
S
i i
x y
2 2
) (
2 2

=

n
xy b y a y
n
y y
S
i i
x y
=.9552
=.9124
Las propiedades de la media son las siguientes:
- La media de una constante es la propia constante.
- La media de la suma o diferencia de variables es igual a la suma o diferencia de las
medias de dichas variables.
- La media del producto de una constante por una variable, es igual a la constante por la
media de la variable.
- La media de una combinacin lineal de dos o ms variables es igual a la combinacin
lineal de las medias de dichas variables.
- La media es el centro de gravedad de la distribucin, ya que las desviaciones respecto
a la media suman 0.
- Mediana: La mediana es el valor del elemento que ocupa el lugar central, si los datos
estn ordenados, bien de forma creciente o de forma decreciente.
- Moda: La moda es el valor ms frecuente, es decir es el valor de la variable que se
repite un mayor nmero de veces.
En el caso de una distribucin totalmente simtrica, la media y la mediana coinciden. Si
la media y la mediana difieren mucho significa que hay heterogeneidad entre los datos
y que la distribucin, por tanto ser asimtrica.
Prof.: David Becerra Rojas 107 Prof.: David Becerra Rojas 108
Las propiedades de la varianza son:
- La varianza es siempre positiva o cero.
- La varianza de una constante es cero.
- La varianza de la suma o diferencia de una variable y una constante es igual a la
varianza de la variable.
- La varianza de un producto de una constante por una variable es igual al cuadrado de
la constante por la varianza de la variable.
Las propiedades de la desviacin tpica son:
- La desviacin tpica es siempre positiva o cero.
- La desviacin tpica de una constante es cero.
- La desviacin tpica de una constante por una variable es igual a la constante por la
desviacin tpica de la variable.
- La desviacin tpica de la suma o diferencia de una variable y una constante es igual a
la desviacin tpica de la variable.
19
Teorema 3.5.5. (Propiedades de ) Para una distribucin bien definida,
el operador de valor esperado cumple:
Escala:
Adicin:
Independencia: si X e Y son independientes.
Composicin:
No desviado:
Prof.: David Becerra Rojas 109
Teorema 3.5.6. (Propiedades de la
varianza) Para una distribucin bien
definida, la varianza cumple:
Origen:
Adicin: si X e Y son independientes.
Escala:
Prof.: David Becerra Rojas 110
Ejercicio:
X \ Y
Chilena Argentina Peruana Brasilea
Total
5 10
4 2 4 10 20
10 15
8 3 1 12 24
15 20
3 9 3 10 25
20 25
0 10 1 10 21
25 - 30
5 2 0 15 22
Total 20 26 9 57 112

Prof.: David Becerra Rojas 111
Determine:
1.- Cuntos turistas chilenos app llevan un peso no superior a 12kr.
2.- Podemos decir que el comportamiento del peso que llevan los turistas
argentinos , es mas homogneo del que llevan los brasileros?
3.- Determine e interprete:
4.- Determine el grado de asociacin respecto al peso de equipaje,
entre los turistas chilenos y argentinos.
5.- A travs de una recta de m. c. estime cuntos turistas deberan llevar un
peso 27.5kr
Se toma una muestra de 112 turistas registrando
el peso de equipaje y nacionalidad.
f
j=1/i=2
=
Cuartiles
Prof.: David Becerra Rojas 112
Li : Limite real inferior del intervalo que contiene el cuartil t, que es aquel
donde por primera vez la frecuencia acumulada pasa el (k/4x100)%.
k
k k
n
c
N
n k
Li K *
4
*
1
(

+ =

Quintiles
Prof.: David Becerra Rojas 113
( Q
q
) q = 1,..,99
Li : Limite real inferior del intervalo que contiene el percentil q, que es aquel
donde por primera vez la frecuencia acumulada pasa el (q%)
q
q q
n
c
N
n q
Li Q *
5
*
1
(

+ =

Deciles
Prof.: David Becerra Rojas 114
( D
d
) d = 1,.,9
Li : Limite real inferior del intervalo que contiene el decil d, que es aquel
donde por primera vez la frecuencia acumulada pasa el (d*10)%
d
d d
n
c
N
n d
Li D *
10
*
1
(

+ =

20
Percentiles
Prof.: David Becerra Rojas 115
( P
p
) p = 1,..,99
Li : Limite real inferior del intervalo que contiene el percentil p, que es aquel
donde por primera vez la frecuencia acumulada pasa el (p%)
p
p p
n
c
N
n p
Li P *
100
*
1
(

+ =

Das könnte Ihnen auch gefallen