Sie sind auf Seite 1von 111

Estadstica Inferencial

Inferencia Estadstica

Como es la verdad
INFERENCIA

Deduccin de una cosa a partir de otra, conclusin.:

deduccin
f. Conclusin, inferencia:
con lo que sabes, deberas sacar tus deducciones y decidir.
filos. Mtodo de razonamiento que parte de conceptos generales o
principios universales para llegar a conclusiones particulares:
la deduccin presupone el pensamiento hipottico.
Descuento, rebaja:
aplique la deduccin por rendimiento del trabajo.
Estadstica inferencial

La inferencia estadstica o estadstica


inferencial es una parte de la Estadstica que
comprende los mtodos y procedimientos para
deducir propiedades (hacer inferencias) de una
poblacin, a partir de una pequea parte de la
misma (muestra).
La bondad de estas deducciones se mide en
trminos probabilsticos, es decir, toda
inferencia se acompaa de su probabilidad de
acierto.
Inferencia Estadstica
Se basa en las conclusiones a la que se llega por la
ciencia experimental basndose en informacin
incompleta (de una parte de la poblacin). La inferencia
estadstica es una parte de la Estadstica que permite
generar modelos probabilsticos a partir de un conjunto
de observaciones. Del conjunto se observaciones que
van a ser analizadas, se eligen aleatoriamente slo unas
cuantas, que es lo que se denomina muestra, y a partir
de dicha muestra se estiman los parmetros del modelo,
y se contrastan las hiptesis establecidas, con el objeto
de determinar si el modelo probabilstico es el adecuado
al problema real que se ha planteado.
Utilidad de la Inferencia
La utilidad de la inferencia estadstica, consiste
en que si el modelo se considera adecuado,
puede usarse para la toma de decisiones o para
la realizacin de las previsiones convenientes.
En el desarrollo del tema se utilizarn variables
aleatorias, que son variables determinadas por
el azar.
INFERENCIA
POBLACIN

Muestra
Procedimiento
La inferencia estadstica parte de un conjunto de
observaciones de una variable, y a partir de
estos datos infiere o genera un modelo
probabilstico; por tanto es la consecuencia de
la investigacin emprica, caundo se est
llevando a cabo, y como consecuencia de la
ciencia terica, cuando se estn generando
estimadores, o mtodos, con tal o cual
caracterstica para casos particulares. La
inferencia estadstica es, en consecuencia, un
planteamiento inductivo.
Definiciones complementarias
Es la parte de la estadstica matemtica que se
encarga del estudio de los mtodos para la
obtencin del modelo de probabilidad que sigue
una variable aleatoria de una determinada
poblacin, a travs de una muestra obtenida de
la misma
proceso de anlisis que consiste en inferir las
propiedades de una poblacin con base en la
caracterizacin de la muestra.
Problemas fundamentales
Los dos problemas fundamentales que
estudia la inferencia estadstica son el
"Problema de la estimacin" y el
"Problema del contraste de hiptesis"
Paramtrica y No paramtrica
Cuando se conoce la forma funcional de la
funcin de distribucin que sigue la variable
aleatoria objeto de estudio y slo tenemos que
estimar los parametros que la determinan,
estamos en un problema de inferencia
estadstica paramtrica ; por el contrario
cuando no se conoce la forma funcional de la
distribucin que sigue la variable aleatoria
objeto de estudio, estamos ante un problema de
inferencia estadstica no paramtrica.
Teoras en las que se basa
En todos estos problemas que estudia la
inferencia estadstica juega un papel
fundamental la "Teora de la
Probabilidad" (distintas formas
funcionales de las distribuciones de
probabilidad) y la "Teora de Muestras"
(procedimientos para tomar muestras de
manera apropiada).
Teora de Muestras
Consideremos la poblacin compuesta por los
nios espaoles al nacer. Una caracterstica
medible de los individuos de esta poblacin es
su peso; esta caracterstica depende de
mltiples factores y se puede considerar una
variable aleatoria. La distribucin que sigue esta
variable aleatoria es normal, pero, cul es su
media? y cul es su desviacin tpica?.
teora de muestras
Pues bien, la teora de muestras estudia
las tcnicas y procedimientos que
debemos emplear para que las muestras
sean representativas de la poblacin que
pretendemos estudiar, de forma que los
errores en la determinacin de los
parmetros de la poblacin objeto de
estudio sean mnimos.
Para conseguirlo, la muestra tiene que ser
representativa de la poblacin. Para que la
extraccin de la muestra sea representativa se
deben cumplir dos principios bsicos:
Que haya independencia en la seleccin de los
individuos que forman la muestra
Que todos los individuos tengan la misma
probabilidad de ser incluidos en la muestra
Para conseguir estos objetivos se emplean
distintas tcnicas de muestreo.
Modelos de Muestreo

Bsicos
Muestreo Aleatorio Simple

Para efectuar este tipo de muestreo en una


poblacin con N individuos:
Numeramos de 1 a N los N individuos de la
poblacin.
Mediante un programa de ordenador o una tabla
de generacin de nmeros aleatorios,
seleccionamos a los n individuos que formarn
la muestra. Despus de cada extraccin el
individuo seleccionado se devuelve a la
poblacin para que pueda volver a ser elegido.
Muestreo Aleatorio Estratificado
Cuando la poblacin no es homogenea respecto a la variable aleatoria
objeto de estudio, para mejorar las estimaciones, conviene distinguir en
ella, clases o estratos, y proceder a lo que se llama un muestreo aleatorio
estratificado. En este tipo de muestreo los estratos se deben elegir de
manera que sean lo ms homogeneos posible respecto a la variable
aleatoria a estudiar y que entre ellos exista la mayor diferencia posible.
Afijacin: Es el reparto del tamao de la muestra entre los diferentes
estratos en que hemos dividido la poblacin.
Afijacin Uniforne : Consiste en tomar para la muestra el mismo nmero
de individuos por cada estrato.
Afijacin Proporcional : Consiste en distribuir los individuos que forman la
muestra proporcionalmente al nmero de individuos de cada estrato.
Una vez determinado el nmero de individuos que deben pertenecer a cada
estrato, se procede a la seleccin de individuos de cada estrato por
muestreo aleatorio simple.
Ejemplo prctico.
En un instituto de enseanza secundaria
en que se ofertan los siguientes tipos de
enseanza :
Ciclos de grado superior : 110 alumnos.
Bachillerato : 162 alumnos.
Ciclos de grado medio : 210 alumnos
2 ciclo de enseanza secundaria
obligatoria : 338 alumnos.
Se pretende valorar las faltas de ortografa que cometen
los alumnos del centro mediante una prueba-dictado de
un texto de 20 lneas; la prueba se pasar a una
muestra de 50 alumnos, para minimizar el costo en
tiempo y medios. En esta situacin parece conveniente
utilizar para la extraccin de la muestra el muestreo
aleatorio estratificado con asignacin proporcional.
Dividimos la poblacin en cuatro estratos : ciclos de
grado superior, ciclos de grado medio, bachillerato y 2
ciclo de enseanza secundaria obligatoria.
Como el nmero total de alumnos son 820 y la muestra
debe estar formada por 50 alumnos, el clculo del
nmero de alumnos que se han de tomar de cada
estrato es:
Ciclos de grado superior :

Bachillerato :

Ciclos de grado medio :

2 ciclo de Enseanza Secundaria Obligatoria

Video
ESTADSTICA INFERENCIAL
ESTADSTICA INFERENCIAL

La estadstica Inferencial, es el proceso por el cual se


deducen (infieren) propiedades o caractersticas de una
poblacin a partir de una muestra significativa.

Poblacin Muestra
Definicin Coleccin de elementos Parte o porcin de la
considerados poblacin seleccionada
para su estudio
Caractersticas Parmetros Estadsticos
Smbolos Tamao de la poblacin = N Tamao de la muestra =
n
Media de la poblacin = m Media de la muestra = X

Desviacin estndar de la Desviacin estndar de


poblacin = s la muestra = s
MTODO DE MUESTREO

Mtodos no probabilsticos.- Interviene la opinin del investigador para


obtener cada elemento de la muestra.

Mtodos probabilsticos.- Muestra que se selecciona de modo que cada


integrante de la poblacin en estudio tenga una probabilidad conocida( pero
distinta de cero) de ser incluido en la muestra.

MUESTREO ALEATORIO SIMPLE


MUESTREO ALEATORIO SISTEMTICO
MUESTREO ALEATORIO ESTRATIFICADO
MUESTREO ALEATORIO POR CONGLOMERADO
MUESTREO ALEATORIO SIMPLE
Muestra seleccionada de manera que cada integrante de la poblacin
tenga la misma probabilidad de quedar incluido.

Ejemplo: un bingo, introduzco los nmeros en una nfora y


selecciono una muestra al azar

MUESTREO ALEATORIO SISTEMTICO


Los integrantes o elementos de la poblacin se ordenan en alguna forma
(Ejemplo: alfabticamente) se selecciona al azar un punto de partida y
despus se elige para la muestra cada k-simo elemento de la poblacin.

Ejemplo: se desea establecer una muestra 100 empleados de los 3000


que tiene una empresa, para lo cual ordeno alfabticamente a los
empleados, divido 3000/100 = 30 y selecciona a uno de cada treinta
empleados
MUESTREO ALEATORIO ESTRATIFICADO
Una poblacin se divide en subgrupos denominados estratos y se
selecciona una muestra de cada uno
ESTRATO EDADES N DE % DEL TOTAL CANTIDAD
EMPLEADOS MUESTREADA
1 MENOS DE 25 AOS 8 2 1
2 26-30AOS
3 31-35 AOS
35 10 5
4 36-40AOS 189 54 27
5 MS DE 41AOS 115 33 16
5 1 1
TOTAL 352 100 50

MUESTREO ALEATORIO POR CONGLOMERADO


Se divide a la poblacin en estratos (subunidades) se selecciona con
que subunidades se va a trabajar y de las unidades seleccionadas, se
toma una muestra aleatoriamente

EJEMPLO IPC
Guayaquil, Machala, Portoviejo, Quito, Ambato, Cuenca y, Manta, Esmeraldas
y Quevedo, Riobamba, Loja y Latacunga.
Con estas ciudades se cubre el 67% de la poblacin urbana del pas,
CONCEPTOS INICIALES
Estimacin Puntual.- Estadstico calculado a partir de la
informacin obtenida de la muestra y que se usa para
estimar el parmetro poblacional

Intervalo de confianza.- es un conjunto de valores


obtenido a partir de los datos muestrales en el que hay
una determinada probabilidad de que se encuentre el
parmetro, a esta probabilidad se le conoce como el nivel
de significancia

Error de muestreo.- Diferencia entre un valor estadstico


de muestra y su parmetro de poblacin correspondiente.
INTERVALOS DE CONFIANZA

m 1,96
s
n
m mz
s
n
X1

X2
X4 X3 X5
INTERVALOS DE CONFIANZA
INTERVALO DE CONFIANZA PARA MUESTRAS MAYORES A
30 ELEMENTOS
s
X z
n

INTERVALO DE CONFIANZA PARA MUESTRAS MENORES A 30


ELEMENTOS

s
X t
n
DESVIACIN ESTNDAR

s
( X m)2 X 2

( X ) 2
n
N s
n 1
PROPORCIONES
PROPORCIN.- Fraccin, razn o porcentaje que indica la parte de la
muestra o poblacin que tiene una caracterstica determinada

x
PROPORCIN MUESTRAL: p
n
INTERVALOS DE CONFIANZA PARA UNA
PROPORCIN POBLACIONAL
p zs p

ERROR ESTNDAR DE LA PROPORCIN MUESTRAL

p(1 p)
sp
n
EJERCICIO
Suponga que se toma una muestra de 30 empleados de los cuales reciben
en promedio 349$ y una desviacin estndar de 110$. Cul es el intervalo
de confianza?
s
X z 349 39
n

349 1,96
110 310 389
30
Suponga que se toma una muestra de 20 empleados de los cuales reciben
en promedio 346$ y una desviacin estndar de 126$. Cul es el intervalo
de confianza?
s
X t 346 59
n
126
346 2,093 287 405
20
EJERCICIO - PROPORCIONES

En una muestra aleatoria de 2000 miembros de sindicato, se tiene que 1600


estn a favor de fusionarse con otra empresa Cul es el valor estimado de
la proporcin poblacional?Cul es el intervalo de confianza al 95% de
confianza?
x
p
n
1600
p 0,80
2000

p(1 p)
pz
n

0,80(1 0,80)
0,80 1,96 0,80 0,018
2000
PRUEBAS DE HIPTESIS PARA UNA MUESTRA
HIPTESIS.- Es una afirmacin sobre una poblacin,
que puede someterse a pruebas al extraer una muestra
aleatoria.
PRUEBA DE HIPTESIS.- Formular una teora y luego
contrastarla

PASOS PARA PROBAR UNA HIPTESIS

1. PRUEBA DE HIPTESIS
2. SELECCIONAR EL NIVEL DE SIGNIFICANCIA
3. CALCULAR EL VALOR ESTADSTICO DE PRUEBA
4. FORMULAR LA REGLA DE DECISIN
5. DECIDIR
PASO1 PLANTEAR H0 Y H1
H 0 : m m0 Hiptesis nula: Afirmacin acerca del valor de un
parmetro poblacional
H 0:m m0

H 1 : m m0 Hiptesis Alternativa: Afirmacin que se


aceptar si los datos muestrales aseguran que
H 1 : m m0 es falsa H 0

Paso 2. Seleccionar el nivel de significancia


Generalmente son del 5% o 1% (Error de tipo I y Error de tipo II)

ERROR DE TIPO I.- Rechazar la hiptesis nula, H0 cuando es verdadera

ERROR DE TIPO II.- Aceptar la hiptesis nula, H0 cuando es Falsa


Paso 3. Calcular el valor estadstico de prueba.

Estadsticos de pruebas como: Z, t de Student, F y Ji


cuadrado
X m
z Para muestras grandes
s P
Z Para
n
(1 ) proporciones
X m n
t
s Para muestras pequeas
n

Paso 4: Formular la regla de decisin


Son las condiciones segn las que se acepta o rechaza la hiptesis nula

Paso 5: Tomar una decisin


El valor observado de la estadstica muestral se compara con el valor de
estadstica de prueba
EJEMPLO: PRUEBA DE HIPTESIS
La produccin diaria en una planta industrial registrada
durante n =30 das tiene una media Muestral de 990
toneladas y una desviacin estndar de 20 toneladas,
pruebe la hiptesis de que el promedio de la produccin
diaria difiere de 1000 toneladas por da.

PASO 1: ESTABLECER HIPTESIS


H 1 : m 1000toneladas
H 1 : m 1000toneladas
PASO 2: Nivel de significancia (0.05%)
PASO 3: Valor estadstico de prueba
x 990toneladas n 30das
X m 990 1000
m0 1000toneladas z z 2,7
s 20
s 20toneladas n 30
DOS COLAS (0.05%) UNA COLA

0.05/2=0.025 0.5-0.05=0.45

0.50-0.025 =0.475 -0.50 0.50


PASO 4: FORMULAR LA REGLA DE DECISIN
Para un nivel de significancia de 0.05, la regin de rechazo
es z >1.96 o z< -1.96

PASO 5: TOMAR UNA DECISIN

-2,7

Se rechaza H0 m no es igual a 1000 toneladas


EJEMPLO: PRUEBA DE HIPTESIS
El gerente de ventas de una empresa editora de libros, afirma que cada
uno de sus representantes realiza 40 visitas por semana a profesores.
Varios vendedores dicen que esa estimacin es muy baja. Para
investigar lo anterior, una muestra aleatoria de 28 representantes de
ventas revel que el nmero medio de visitas realizadas la semana
pasada fue de 42. Se calcul que la desviacin estndar de la muestra
fue de 2.1 visitas. Al nivel de significancia de 0.05, se puede concluir
que el nmero medio de visitas realizadas por vendedor y por semana
es mayor que 40?

PASO 1: ESTABLECER HIPTESIS


H 0 : m40
H1 : m 40
PASO 2: NIVEL DE SIGNIFICANCIA (0.05)

PASO 3:ESTADSTICO DE PRUEBA


En este caso es T de student

m 40visitas t
X m
s
x 42visitas n
s 2.1visitas
n 28
PASO 4: REGLA DE DECISIN
Rechazo H0 SI t calculado es mayor a 1.703

PASO 5: TOMAR DECISIN

T calculado = 5.04 cae en la regin de rechazo. Por lo tanto


rechazamos H0. El nmero medio de visitas realizadas por
vendedor y por semana es mayor que 40
PRUEBA CHI CUADRADOFRECUENCIAS
ESPERADAS IGUALES

( f0 fe )
2
x
2

fe
PRUEBA DE BONDAD DE AJUSTE DE
FRECUENCIAS ESPERADAS
EJEMPLO: Una empresa de venta VENDEDOR Vehculos
de vehculos desea comprobar si no
hay diferencia significativa en la A 13
venta de vehculos por sus B 33
vendedores, se espera que las
frecuencias observadas (fo) fueran C 14
iguales. Puede concluirse que D 7
existe diferencia entre la las ventas
de vehculos de cada vendedor E 36
F 17
TOTAL 120
Debido a que existen 120 datos, es de esperar
que 20 queden en cada una de las 6 categoras
Vehculos
Vendedores vendidos fo Nmero vendido esperado fe

A 13 20
B 33 20
C 14 20
D 7 20
E 36 20
F 17 20
TOTAL 120 100
PASO 1. Se establece Ho y H1
PASO 2. Se selecciona el nivel
Ho= Fo=fe de significancia 0.05, que es la
probabilidad de rechazar una
H1=Fo=fe
hiptesis nula verdadera
PASO 3. Seleccin del estadstico de prueba
( f0 fe )2
x
2

fe

El estadstico es chi cuadrado, con K-1 grados de libertad, donde:


K=es el numero de categoras
fo=es una frecuencia observada en una categora determinada
fe=es una frecuencia esperada en una categora determinada

PASO 4. Se formula la regla de decisin


Grados de
libertad rea de la cola derecha N= 6-1=5gdl
gl 0.10 0.05 0.02 0.01
1 2,706 3,841 5,412 6,635
Se rechaza Ho si el valor
ji cuadrada que se obtuvo
2 4,605 5,991 7,824 9,21
de los clculos es mayor
3 6,251 7,815 9,837 11,345
que 11,070.
4 7,779 9,488 11,668 13,277
5 9,236 11,07 13,388 15,086
JUGADOR fo fe (fo-fe) (fo-fe)2 (fo-fe)2/fe
RONALDO 13 20 -7 49 2,45
BEKAM 33 20 13 169 8,45
ADRIANO 14 20 -6 36 1,8
DEKO 7 20 -13 169 8,45
RONALDIO 36 20 16 256 12,8
SIDANE 17 20 -3 9 0,45

TOTAL 120 120 13 519 34.5

PASO 5. DECIDIR.
Como el resultado calculado 34.5 es mayor que el de la tabla 11.070,
rechazamos la hiptesis de que las frecuencias son iguales, las ventas
son diferentes.
PRUEBA DE BONDAD DEAJUSTE
FRECUENCIAS ESPERADAS
DIFERENTES
Una empresa quiere comparar si el comportamiento de los datos
de ingresos a un hospital obtenidos a nivel local difieren de los
obtenidos a nivel nacional

ESTUDIO NACIONAL ESTUDIO LOCAL


NMERO DE NMERO NMERO DE
VECES PORCENTAJ DE VECES PERSONAS, A simple vista, no
ADMITIDAS E DEL TOTAL ADMITIDAS Fo
podemos comparar entre
1 40 1 165
porcentajes y nmero de
2 20 2 7
personas
3 14 3 50
4 10 4 44
5 8 5 32
6 6 6 20
7 2 7 82
100 400
NMERO DE NMERO DE
VECES PERSONAS, NMERO ESPERADO DE ADMISIONES, Fe
ADMITIDAS Fo (1) = (2) x (3)
1 165 160 40 400
2 7 80 20 400
3 50 56 14 400
4 44 40 10 400
5 32 32 8 400
6 20 24 6 400
7 10 8 2 400
400 400 100

Deben ser iguales

PASO. 1.
Ho: No existe diferencia entre la situacin local y la situacin nacional
H1: Si existe diferencia entre las situaciones local y nacional
PASO 2. Se establece el nivel de significancia de 0.05%
PASO 3.El estadstico de prueba a utilizar es chi cuadrado
PASO 4. Se establece la regla de decisin

NMERO DE NMERO DE
VECES PERSONAS, Fe fo-fe (fo-fe)^2 (fo-fe)^2/fe
ADMITIDAS Fo
1 165 160 5 25 0,156
2 7 80 -1 1 0,013
3 50 56 -6 36 0,643
4 44 40 4 16 0,400
5 32 32 0 0 0,000
6 20 24 -4 16 0,667
7 10 8 2 4 0,500
400 400 Chi =68.96
Observando el valor de la tabla con 7-1 grados de libertad, obtenemos
un valor de 12,59. es decir, si el valor calculado de chi-cuadrado es
mayor al valor de la tabla, entonces rechazamos Ho caso contrario
aceptamos.
PASO 5. DECIDIR.
Como el valor calculado es 68,96 se encuentra en la regin de Rechazo,
es decir Rechazo Ho
Independencia - Dependencia
Cuando se estudian dos caractersticas simultneamente sobre una muestra,
se puede considerar que una de ellas influye sobre la otra de alguna
manera. Por ejemplo la altura y el peso o las horas de estudio y la
calificacin en un examen.

El objetivo principal de la regresin es descubrir el modo en que se relacionan.

Dos variables pueden considerarse:

Variables independientes No tienen relacin (una de ellas no sirve para


explicar los movimientos de la otra)
Dependencia funcional Y=f(x)
Dependencia estadstica

Dependencia
Independencia estadstica Dependencia funcional
estadstica

- + 55
Grado de asociacin entre dos variables
GRFICOS DE DISPERSIN: Permite ver si hay asociacin
Dadas dos variables X y Y tomadas sobre el mismo elemento de la
poblacin, el diagrama de dispersin es simplemente un grfico de
dos dimensiones, donde en un eje (la abscisa) se sita una
variable, y en el otro eje (la ordenada) se sita la otra variable. Si
las variables estn correlacionadas, el grfico mostrara algn nivel
de correlacin (tendencia) entre las dos variables. Si no hay
ninguna correlacin, el grfico presentara una figura sin forma,
una nube de puntos dispersos en el grfico.

Asociacin
positiva. Si
aumenta X
aumenta Y

56
GRFICOS DE DISPERSIN / RECTA DE REGRESIN
La relacin entre dos variables mtricas puede ser
representada mediante la lnea de mejor ajuste a los datos.
Esta recta se le denomina recta de regresin, que puede ser
negativa o positiva, la primera con tendencia decreciente y la
segunda creciente.

57
GRFICOS DE DISPERSIN / RECTA DE REGRESIN
Para el clculo de la recta de regresin se aplica el mtodo de
mnimos cuadrados entre dos variables. Esta lnea es la que
hace mnima la suma de los cuadrados de los residuos, es
decir, es aquella recta en la que las diferencias elevadas al
cuadrado entre los valores calculados por la ecuacin de la
recta y los valores reales de la serie, son las menores posibles.

y = a + bx

58
Recta de regresin Pendiente

yn
yn 1 y i
y3
u3 ui
yi
y1 yi
y2

Intercepto
x1 x2 x3 xi xn 1 xn

yi a bxi ui ui yi yi
Error 59
Llamemos a u perturbacin o error, siendo la diferencia que hay entre el
valor observado de la variable exgena (y) y el valor estimado que
obtendremos a travs de la rectay ide regresin .

y i a bxi
La metodologa para la obtencin de la recta ser hacer MNIMA la suma de
los CUADRADOS de las perturbaciones. Por qu se elevan al cuadrado?

n n

u ( yi yi ) 2
2
i i
u 2

i 1
i i
( y
i 1

y ) 2

n 2 n n
2
ui ( yi yi ) yi aq bpxi
2
min
q, p i 1 i 1 i 1
60
En el modelo de regresin lineal simple la funcin elegida para aproximar la relacin entre las
variables es una recta, es decir y=a+bx, donde a,b son los parmetros. A esta recta la
llamaremos RECTA DE REGRESIN DE Y SOBRE X.

Vamos a deducir su ecuacin usando el mtodo de los mnimos cuadrados. Dado un valor de
X, tenemos los dos valores de Y, el observado, yi , y el terico, yi* = a + bxi. Hemos de
minimizar los errores cometidos:
n n

y abx y abx 2 2 MINIMIZAR


i i i i
i 1 El valor que hemos
i 1
Errores cometidos al
aproximar por una recta
aproximado para y con
la recta de regresin y*
na y b x
i
i
i
i
a y bx

x y y bx x b x
i
i i
i
i
i
2
i

x y
y
x bxnx b x
i

yi a bxi 0 y ab x
2
2 i i
i i
n
i i
a
i i i
i i i i

x y a x b x

2 yi a bxi xi 0 i i i
2
i
xi yi ynx b

xi2 nx 2

b
i i i i i i
S xy
S xy bSx2 b 61
S x2
y obtenemos que la recta de regresin de Y sobre X: y = a + bx con los
valores a y b anteriormente calculados, o bien la siguiente expresin:

S xy
y y x x
S x2

Aplicando el mismo razonamiento llegaramos a la expresin de la recta de


regresin de X sobre Y: x = a + by con los valores a y b calculados como:

S xy
b' y a' x b' y
S y2

Por tanto, se podra expresar como:

S xy
x x y y
S y2 62
Varianza residual: Ayuda a medir la dependencia.

yi yi
2
Si es grande, los residuos, por trmino
VR = Su2 S R2y medio, sern grandes. Dependencia
N pequea y viceversa.

Varianza marginal: Es la varianza total de X o de Y. Si dividimos la


varianza residual entre esta se elimina el problema de unidades de
medida.
2 Su2 VR
2 Sx
Ayuda a determinar la
Sy S y2 VT y
asociacin pero en
sentido inverso. La
mejor medida es R.
Coeficiente de correlacin general:

Su2 rxy R
Haciendo unas transformaciones se demuestra que r(xy)
R 1 2 visto en el captulo 6 slo es un caso particular de R
SY
R2
Elevado al cuadrado obtenemos el coeficiente de determinacin que sirve como medida
del buen ajuste de la recta de regresin

2
Cuando solo exista una variable explicativa o S xy S xy S xy
2
R bb' 63 r 2
S x2 S y2 S x S y
independiente y una sola dependiente se cumple: xy

1 r 1 1 R 1 0 r 2 1 0 R2 1

Para el caso de distribuciones bidimensionales: R r R2 r 2

S S S
Recta de regresin: yi y XY2 x XY2 xi y XY2 xi x
SX SX SX

S XY S X SY S XY SY SY
yi y 2 i
x x y i
x x y r xi x
S X SY S X S X SY S X SX

r 1 1 r 0 r 0 0 r 1 r 1

Pendiente Negativa Positiva


Nula

64
2
S Y
Se descompone en:

S S VR
2
u
2
ry

S S S
2
R
2
Y
2
u
VE

S S 2
S 2
S 2 2
VR VE
R 1
2 u
Y R 1 u
SY2
2
2
S SY
Y
VT VT

S S S
2
Y
2
R
2
u VT VR VE

2
R Tanto por uno de la Y que viene explicado por la X

SIRVE PARA DETERMINAR SI EL AJUSTE HECHO ES BUENO. ES DECIR, SI65


LA
VARIABLE X EXPLICA LAS VARIACIONES DE LA VARIABLE Y. DEBER SER > 0.75
S XY
Prediccin yi qa bpxi y 2 xi x
SX
El objetivo ltimo de la regresin es la prediccin de una variable para un
valor determinado de la otra. La prediccin de Y para X = x0 ser simplemente
el valor obtenido en la recta de regresin de Y sobre X al sustituir el valor de x
por x0. La fiabilidad de esta prediccin ser tanto mayor cuando mayor sea la
correlacin entre las variables (es decir mayor sea R2 )

Dado un valor de la variable X que no ha sido observado, estimar el


correspondiente valor de Y
Dado x0 estimar y0

S XY
y 0 aq bpx0 y 2 x0 x
SX
66
PARADIGMAS
JOEL BARKER

"Usted puede y debe formar


su propio futuro, porque si
no alguien ms
seguramente."
Joel Barker
Capitulo III
Paradigmas, el negocio de descubrir el
futuro

Joel Barker lo hace en Paradigmas: el negocio de descubrir


el futuro se explica cmo detectar los cambios de
paradigma, la forma en que se desarrollan, y cmo sacar
provecho de ellas.
Joel Barker fue el primero en popularizar
el concepto de cambios de paradigma
para el mundo corporativo. Comenz su
trabajo en 1975 despus de pasar un ao
en el cumplimiento de compaerismo y
de trabajo con los pensadores
visionarios, tanto en Amrica del Norte y
Europa.
l descubri que el concepto de
paradigmas, que en ese momento fue
secuestrado en la discusin cientfica,
podra explicar el cambio revolucionario
en todas las reas del quehacer humano.
Excelencia est en la base
del xito en el siglo XXI. Si
usted no tiene los
componentes de la
excelencia, entonces no
Joel Barker, en su libro
tiene la oportunidad de ser
Paradigmas menciona los que, parte del juego.
para l, son los tres elementos
claves de la Gestin Estratgica La innovacin permite
Empresarial, para quienes deseen obtener ventaja
ser competitivos hoy en da, estos competitiva.
son:
Excelencia, Innovacin y Anticipacin proporciona
la informacin que
Anticipacin.
necesita para estar en el
Hace una reflexin acerca del lugar correcto en el
trmino, postulando varios momento adecuado.
ejemplos e invita a reconocer
sucesos paradigmticos que
podra ser la gua para las
prximas dcadas.
Captulo 12
Gerentes, lderes y paradigmas

Los directivos deben demostrar


flexibilidad. Los directivos deben permitir
y estar dispuestos a escuchar a sus
empleados para resolver un problema.
Los gerentes deben facilitar y
fomentar la comunicacin cruzada
significa que la gente de diversos
orgenes de la diversidad de opiniones
deben sentarse juntos y hablar.
Especialmente la gente de paradigma
diferente puede ser particularmente
buenas para ayudar a superar el
paradigma de otra persona.
Al escuchar todas esas ideas, los
gerentes tienen una influencia
especial a la innovacin debido a que
muchas ideas puede producir una buena
idea..
Los gerentes estn en una posicin
nica, ya que al escuchar todas las ideas
pueden hacer las conexiones.
A los lderes:

Un lder es una persona a la que seguir a un lugar que no ira por su


cuenta.
mejora de paradigma. Esto significa que usted hace las reglas mejor.

Lder-gerente
El gerente administra, el lder innova.
El gerente tiene una visin de corto alcance, el lder tiene una
perspectiva de largo alcance.
El gerente le pregunta cmo y cundo, el lder pregunta qu y por
qu.
El gerente tiene su ojo hacia la parte inferior, el lder tiene la mirada
puesta en el horizonte.
El gerente acepta el status quo, el lder los desafos.

"Nadie va a darle las gracias por cuidar a los presentes si han dejado de lado
el futuro".
Video: El nuevo negocio
de los paradigmas
Actividad en clase
Escribir por equipo de 3 personas en una
cuartilla, su opinin sobre el video del
nuevo negocio de los paradigmas.
Tiempo: 15 minutos.
DISTRIBUCION
DE FRECUENCIAS
DESPUES DE LA RECOPILACION DE LOS DATOS,
ES NECESARIO,CLASIFICARLOS, RESUMIRLOS Y
PRESENTARLOS EN FORMA TAL, QUE FACILITEN
SU COMPRENSION Y SU POSTERIOR ANALISIS Y
UTILIZACION. PARA ELLO SE ORDENAN EN UNA
TABLA DE DISTRIBUCION DE FRECUENCIAS Y
LUEGO SE PRESENTARAN EN GRAFICOS.
TABLA DE DISTRIBUCION
DE FRECUENCIAS
*PRESENTAN LA DISTRIBUCION DE UN CONJUNTO
DE DATOS DE ACUERDO AL TIPO DE VARIABLE QUE
SE TENGA. EN ELLA SE OBSERVA LA FRECUENCIA
(NUMERO DE DATOS OBSERVADOS EN CADA CLASE
O INTERVALO)DESPUES DE REALIZAR EL PROCESO
DE CONTEO O TABULACION.

*UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS


ES PARA CALCULAR ALGUNOS INDICADORES DE
RESUMEN, COMO LOS ESTADISTICOS.

EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS


DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A
MUESTRAS.
TABLA DE FRECUENCIAS
PARA VARIABLES CUALITATIVAS
Ejemplo: DE UN ESTUDIO DE INVESTIGACION
REALIZADA EN FORMA ALEATORIA A 80 PERSONAS
DE 12 A 20 AOS SE REGISTRARON LOS PROGRAMAS
MAS VISTOS EN LA TV.LOS RESULTADOS FUERON:

PROGRAMAS N DE TELEVIDENTES
variable
NOTICIEROS 17

SERIES 15

18
NOVELAS frecuencias
DIBUJOS 16

CULTURALES 14

TOTAL 80
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
PROGRAMAS Frecuencia Absoluta (fi) Frecuencia Relativa (hi)
(nmero de televidentes)
NOTICIEROS 17 0.2125
SERIES 15 0.1875

NOVELAS 18 0.2250
DIBUJOS 16 0.2000
CULTURALES 14 0.1750
TOTAL n=80 1.0000
(1)La frecuencia absoluta fi, es el nmero de datos observados en
cada categoria o modalidad. La suma de todas las frecuencias
absolutas es igual al total de datos observados (n=80).
(2)La frecuencia relativa hi se define por hi = fi /n
La suma de todas las frecuencias relativas es igual a uno.
(3)La frecuencia relativa se convierte en % multiplicandola por 100
(4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOS
REALIZAR ALGUNAS PREGUNTAS:

1.-CUANTAS PERSONAS PREFIEREN VER LOS


NOTICIEROS? RPTA. 17

2.-CUNTAS PERSONAS NO PREFIEREN VER EL


LOS NOTICIEROS? RPTA. 63

3.-QU PORCENTAJE DE PERSONAS PREFIEREN VER


LAS SERIES? RPTA. 18.75%

4.-CUL ES EL PORCENTAJE DE PERSONAS QUE NO


PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS
LA INFORMACION OBTENIDA EN LA TABLA DE
FRECUENCIAS PUEDE SER MOSTRADA EN
GRAFICOS ADECUADOS.

DIAGRAMAS DE BARRAS

20
FRECUENCIA ABSOLUTA

15

10

0
NOTICIEROS SERIES NOVELAS DIBUJOS CULTURALES

PROGRAMAS
DIAGRAMA CIRCULAR O TIPO PASTEL

CULTURAL
NOTICIEROS
18% 21%

DIBUJOS
SERIES
20%
19%
NOVELAS
22%

LOS SECTORES CIRCULARES


QUE COMPRENDEN LA GRAFICA
CIRCULAR TIENEN ANGULO
CENTRAL DADO POR:

hi x 360
TABLA DE FRECUENCIAS SIMPLES

PARA VARIABLES CUANTITATIVAS


DISCRETAS

SE EMPLEAN PARA DATOS CUANTITATIVOS


DISCRETOS(VALORES ENTEROS).

CUANDO SOLAMENTE SE PRESENTAN POCOS


DATOS DISTINTOS.
Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20
FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE
TIENEN , Y SE HA OBTENIDO EL SIGUIENTE
RESULTADO:

3 7 7 6 7 4 5 1 4 5
5 9 4 2 4 6 7 4 7 6

CONSTRUYA UNA TABLA DE DISTRIBUCION


DE FRECUENCIAS.
TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA
NDE TARJAS O CONTEO fi hi
HIJOS (NUMERO DE FAMILIAS)
1 / 1 0.05
2 / 1 0.05
3 / 1 0.05
4 //// 5 0.25
5 /// 3 0.15
6 /// 3 0.15
7 //// 5 0.25
8 0 0.00
9 / 1 0.05
TOTAL n = 20 1.00
GRAFICO DE LINEAS O BASTONES PARA
VARIABLES CUANTITATIVAS DISCRETAS
Frecuencia absoluta

6
5
No de familias

4
3
2
1
0
1 2 3 4 5 6 7 8 9
No de hijos
Frecuencias relativas

30
25
% de familias

20
15
10
5
0
1 2 3 4 5 6 7 8 9
No de hijos
TABLA DE FRECUENCIAS POR
INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS
Y TAMBIEN DISCRETAS

LA DISTRIBUCION DE FRECUENCIAS POR CLASE


O INTERVALOS SE USA CUANDO LA VARIABLE
ESTADISTICA ES CUANTITATIVA CONTINUA O
CUANDO EL NUMERO DE VALORES DISTINTOS
DE UNA VARIABLE DISCRETA ES MUY GRANDE
(GENERALMENTE MAS DE 20).
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS
POR INTERVALOS

VARIABLE

[Li , Ls > Xi fi hi Fi Hi

k
Total n f i
i 1

Donde: [Li , Ls> : Intervalos o Clases Li : Limite Inferior


Xi : Marca de clase Ls : Limite Supeior
fi : frecuencia absoluta
hi : frecuencia relativa
Fi : Frecuencia absoluta acumulada
Hi : Frecuencia relativa acumulada
CARACTERISTICAS

1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA


CANTIDAD DE OBSERVACIONES QUE HAY
EN EL i-ESIMO INTERVALO.

2.- LA FRECUENCIA RELATIVA (hi) INDICA LA


FRACCION DE LAS OBSERVACIONES QUE
ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n

3.- F1= f1 H1= h1


F2= f1+ f2 H2= h1+ h2
Fk= f1+ f2+...+ fk Hk= h1+ h2+...+ hk
4.- EN TODA TABLA DE DISTRIBUCION DE
FRECUENCIAS POR INTERVALOS:

h Fk n
k

i 1
fi n
i 1
i 1

5.- LA MARCA DE CLASE ES LA SEMISUMA DE


LOS LIMITES DE CLASE

L L
X i
i s

2
6.- EL ANCHO DE CLASE C REPRESENTA LA
LONGITUD DEL INTERVALO: C = Ls Li
GENERALMENTE ES CONSTANTE.

7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE


ENTONCES LA DISTANCIA ENTRE LAS MARCAS
DE CLASE ES CONSTANTE E IGUAL A C.
PROCEDIMIENTO PARA LA CONSTRUCION DE
TABLAS DE FRECUENCIAS POR INTERVALOS

1) CALCULAR EL RANGO: R = Xmx Xmin


2) HALLAR EL NUMERO DE INTERVALOS K,MEDIANTE
LA FORMULA DE STURGES: K = 1+3.3 Log(n)
DONDE n ES EL NUMERO DE DATOS, Y K SE
REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE)
EJMS: si K=6.28 SE REDONDEA A 6
si K=6.5 SE REDONDEA A 7

3) DETERMINAR EL ANCHO DE CLASE:


C = R /K
DONDE C SE REDONDEA POR EXCESO, DE ACUERDO
AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
El valor de C depender de la cantidad de lugares decimales de los datos
originales, que sern agrupados en la tabla de frecuencias:

Ejemplo de dato Ejemplo de Se


original valor de C redondea
calculado a:
15 (dato entero) 5.75 6
3.2 (dato con 1 decimal) 2.33782129 2.4
11.13 (dato con 2 decimales) 3.24920976 3.25
5.391 (dato con 3 decimales) 1.42135709 1.422
99.3489 (con 4 decimales) 9.2876405 9.2877
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA
Se ha aplicado una encuesta a 40 centros educativos con el fin de
observar el nmero de nios que estudian en ellos, obteniendose:

42 58 79 86 98 120 134 120 59 62

85 89 76 110 104 78 84 96 90 75

120 130 122 95 82 94 108 79 105 115

102 80 56 78 84 66 69 78 84 98

construya una tabla de frecuencias adecuada.


PROCEDIMIENTO:

Rango: R= 134 - 42 = 92

Nmero de intervalos: K = 1 + 3.3 log 40 = 6,29


(frmula de Sturges) redondeo simple a 6

Ancho de clase: C =92 / 6 = 15,33


redondeamos por exceso de decimales
a 16
Nmero de nios (variable) Centros educativos

Intervalos Tarjas Xi fi hi Fi Hi
o conteo
[42-58> 50 2 0.050 2 0.050

[58-74> 66 5 0.125 7 0.175

[74-90> 82 15 0.375 22 0.550

[90-106> 98 9 0.225 31 0.775

[106-122> 114 6 0.150 37 0.925

[122-138> 130 3 0.075 40 1.000

TOTAL n=40 1.000


EJEMPLO 2: SI LA VARIABLE CUANTITATIVA
ES CONTINUA.

En un comercio, se dispone de los datos de la venta semanal


(en miles de soles) para las ltimas 30 semanas.
Construya una tabla de distribucin de frecuencias.

14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5

15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8

13,9 14,2 14,9 13,1 12,2 14,1 15,1 15,7 13,4 13,2
PROCEDIMIENTO:

1. R= Xmax X min = 15,8 12,2 = 3,6

2. Hallar K mediante Sturges:

K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)

3. Determinar el ancho de clase C:

C= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal


como los datos)
Venta miles de soles (variable) Nmero de semanas

Intervalos Tarjas Xi fi hi
Fi Hi
o conteo
[12,2-12,8> // 12,5 2 0,0667 2 0,0667

[12,8-13,4> ///// 13,1 5 0,1667 7 0,2334

[13,4-14,0> ///// 13,7 5 0,1667 12 0,4000

[14,0-14,6> ////// 14,3 6 0,2000 18 0,6000

[14,6-15,2> /// 14,9 3 0,1000 21 0,7000

[15,2-15,8> ////// /// 15,5 9 0,3000 30 1,0000

TOTAL n=30 1.0000


INTERPRETACIONES UTILIZANDO LA TABLA
DE FRECUENCIAS

1.- Cuntas semanas tienen ventas entre 14,0 y 14,6 miles de soles?
Rpta. f4 = 6 semanas.

2.- Cul es la proporcin o el porcentaje del nmero de semanas


cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles?
Rpta. h2 = 0,1667 h2 = 16,67%

3.- Cuntas semanas tienen ventas menores a 14,6 miles de soles?


Rpta. F4 = 18 semanas

4.- Cul es la proporcin o el porcentaje del nmero de semanas


cuyas ventas son menores a 15,2 miles de soles?
Rpta. H5 = 0,70 H5 = 70%
LAS GRAFICAS EN UNA TABLA
DE FRECUENCIAS
Histograma de Frecuencias Absolutas

7
Frequencia Absoluta

0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Histograma de Frecuencias Relativas (%)

30

25
Frequencia Relativa %

20

15

10

0
12.2 12.8 13.4 14.0 14.6 15.2 15.8
Ventas
Poligono de Frecuencias Absolutas

7
numero de semanas

0
12.5 13.1 13.7 14.3 14.9 15.5
Ventas
Polgono de frecuencias absolutas

10
Num. de semanas

8
6
4
2
0
12.5 13.1 13.7 14.3 14.9 15.5
ventas
Observacin
Los polgonos de frecuencia son especialmente
tiles para comparar las distribuciones de dos
grupos de datos diferentes, para ello es
conveniente trabajar en un mismo grfico y
empleando los mismos intervalos.
Importante: Si la cantidad de datos es muy
diferente en ambos grupos es preferible trabajar
con polgonos de frecuencia relativa.
OJIVA
UNA OJIVA ES LA REPRESENTACION GRAFICA DE
UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS O LAS FRECUENCIAS RELATIVAS
ACUMULADAS.

OJIVA MENOR QUE O ASCENDENTE

ES LA REPRESENTACION GRAFICA DE UNA


DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS MENOR QUE O LAS FRECUENCIAS
RELATIVAS ACUMULADAS MENOR QUE.
DEL EJEMPLO1:
Fi

40 *

MENOR Fi Hi OJIVA MENOR QUE


QUE 37 *

42 0 0
58 2 0.05 31 *

74 7 0.174 22 *

90 22 0.550
7 *
106 31 0.775
122 37 0.925 2 *

138 40 1.000 *

0 42 58 74 90 106 122 138


DIAGRAMAS DE TALLOS Y HOJAS
ES UNA TECNICA QUE SE USA PARA ORGANIZAR
LOS DATOS COMO PRIMER PASO EN UN ANALISIS
EXPLORATORIO DE DATOS.

OBJETIVOS:

REPRESENTACION VISUAL DE LA INFORMACION.

DESCRIBIR UN PATRON DE COMPORTAMIENTO


DE LOS DATOS, ES DECIR QUE DISTRIBUCION
PUEDEN SEGUIR LOS DATOS.

IDENTIFICAR SI HAY VALORES EXTREMOS O


DATOS ANORMALES O VALORES ATIPICOS.
PROCEDIMIENTO:

ORDENAR LOS DATOS DE LA VARIABLE EN


FORMA CRECIENTE.

TOMAR COMO TALLO LA PRIMERA O LAS DOS


PRIMERAS CIFRAS DEL DATO Y COMO HOJA
LA ULTIMA CIFRA. A CONTINUACION SEPARADOS
POR UNA LINEA VERTICAL SE COLOCAN LOS
TALLOS A LA IZQUIERDA Y LAS HOJAS A LA
DERECHA DEL TALLO CORRESPONDIENTE.
DE ESTA FORMA CADA TALLO SE REPRESENTA
UNA SOLA VEZ Y DEFINE UNA CLASE Y EL
NUMERO DE HOJAS REPRESENTA LA FRECUENCIA
DE LA CADA CLASE.
EJEMPLOS:
. PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA
IZQUIERDA DE LA LINEA LA CIFRA DE LAS
DECENAS, QUE FORMAN EL TALLO, Y A LA
DERECHA LAS UNIDADES QUE SERAN LAS HOJAS.
POR EJEMPLO ESCRIBIR 85:

TALLO HOJA
8 5

ESCRIBIR 329 COMO TALLO Y HOJA

TALLO HOJA
32 9
Para los siguientes datos, construya un diagrama tallos y hojas:
12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53

LEAF UNIT = 1.0 ES LA UNIDAD DE HOJA,DICE DONDE


PONER EL PUNTO DECIMAL, EN EL
TALLO HOJAS EJEMPLO LEAF UNIT=1.0 ASI LA
PRIMERA OBSERVACION ES 12 ,SI LEAF
3 1 258 UNIT FUERA 0.10 SERIA 1.2, SI LEAF UNIT
FUERA 10 ENTONCES EL VALOR SERIA
120.
7 2 2467

(5) 3 13356 CENTRO DE LA DISTRIBUCION

7 4 2256 OBSERVE QUE SE PARECE A UN


HISTOGRAMA VOLTEADO!
3 5 013
Video

Das könnte Ihnen auch gefallen