Sie sind auf Seite 1von 133

Divisin de la Estadstica

ESTADISTICA
DESCRIPTIVA INFERENCIAL

ESTADISTICA DESCRIPTIVA
Procedimientos estadsticos que sirven para
organizar y resumir conjuntos de datos
numricos, no se realiza ninguna
generalizacin acerca de los diferentes grupos.




ESTADISTICA INFERENCIAL
Procedimientos estadsticos que sirven para
deducir o inferir algo acerca de un conjunto
de datos numricos (poblacin,
seleccionando un grupo menor de ellos,
muestra)



DI FERENCI A ENTRE MUESTRA Y
POBLACI ON
Poblacin
Conjunto de todos los posibles individuos,
personas, objetos o mediciones de inters
estadstico
Muestra
Una porcin o parte de una poblacin de inters


Datos
Son colecciones de cualquier cantidad de
observaciones relacionadas.
Los datos pueden provenir de registros o de
observacin directa.



Preguntas bsicas para controlar la
calidad de los datos
1. De dnde vienen los datos? Los datos son parciales?
2. Los datos comprueban o contradicen otras evidencias que
se poseen?
3. Hace falta alguna evidencia cuya ausencia podra
ocasionar que se llegue a una conclusin diferente?
4. Cuntas observaciones se tienen? Representan a todos los
grupos que se desean estudiar?
5. La conclusin es lgica?Se ha llegado a conclusiones que
nuestros datos no confirman?
RECOLECCI ON DE DATOS
CENSO
Se trabaja con toda la poblacin de inters

ENCUESTA
Se trabaja con un grupo de la poblacin (Muestra)

REGISTROS ADMINISTRATIVOS
Datos que existen en las instituciones


TI POS DE VARI ABLES
CUALITATIVA
Se observa una cualidad. Ejem: Gnero, color de
ojos, profesin.

CUANTITATIVA
Se expresa numricamente. Ejem: Nro de hijos,
aos de estudio, calificacin, velocidad, salario.
Puede ser discreta o continua



Discreta
Toma ciertos valores y existen brechas entre ellos.
Ejem: Nro de hijos, Nro de alumnos de un curso.

Continua
Asume cualquier valor dentro de un intervalo
especfico. Ejem: Velocidad, Distancia entre dos
ciudades, peso, estatura.




Nominal
Hace referencia a los datos que nicamente se
pueden clasificar en categoras, no existe un orden.
No intervienen mediciones, nicamente conteos. Las
categoras son mutuamente excluyentes y
exhaustivas.
Ejemplo: Gnero, preferencia religiosa, preferencia
por equipo de ftbol.



NI VELES DE MEDI CI ON
Ordinal
Corresponde a datos que se clasifican en categoras,
donde una categora es mayor que la siguiente. Las
categoras son mutuamente excluyentes y
exhaustivas.
Ejemplo: Calificaciones de excelente a psimo.


NI VELES DE MEDI CI ON
De Intervalo
Incluye todas las caractersticas de la escala ordinal,
pero adems la distancia entre valores es constante.
El punto cero es arbitrario. Ejemplo: temperatura.

NI VELES DE MEDI CI ON
De Razn (o cociente)
Incluye todas las caractersticas de la escala de
intervalo, la diferencia es que la escala de razn tiene
cero significativo y la razn o cociente entre dos
nmeros es significativa. Ejemplo: Salario, Peso,
Nro de aos que toma a un estudiante terminar su
carrera.

NI VELES DE MEDI CI ON
DI STRI BUCI ON DE
FRECUENCI AS
Agrupar datos en categoras que muestren
el nmero de observaciones de cada
categora mutuamente excluyente.
Variable Frecuencia (n
i
)
X
1
X
2
.
.
.

Clases o
Categoras
Aos de trabajo

Frecuencia (n
i
)
Los extremos de una clase pueden ser: abiertos o cerrados
Ejem: Aos de trabajo
Menos de 5
5 a 9
10 a 15
16 a 20

15
20
12
8

Extremo inferior
abierto

Extremo superior
cerrado

Construccin de una distribucin de
frecuencias
Recorrido ( R )
R = mx Xi min Xi

Nro de clases (k): Se puede fijar a priori. Puede
variar entre 5 a 15, o se puede calcular:


donde n= Nro de observaciones

Ancho de clase: c= R/k
n k =
FRECUENCIA ABSOLUTA
Conteo de las observaciones (n
i
)
FRECUENCIA RELATIVA
Porcentaje respecto al total de observaciones (f
i
)
f
i
= n
i
/n * 100
FRECUENCIA ACUMULADA ABSOLUTA
Suma de las observaciones hasta una determinada clase (N
i
)

Distribucin de frecuencias -
Conceptos importantes
FRECUENCIA ACUMULADA RELATIVA
Suma de la frecuencia relativa hasta una determinada clase
(F
i
)
PUNTO MEDIO
Suma del lmite inferior y superior de la clase divido entre 2.
Representante de clase (h
i
)

REPRESENTACI ON GRAFI CA
Permite visualizar de manera rpida una
distribucin de frecuencias

HISTOGRAMA
Serie de rectngulos, cuyo ancho es proporcional
al ancho de clase y la altura corresponde al nro de
observaciones en la clase. Se puede trabajar con
las frecuencias absolutas o relativas.





POLIGONOS DE FRECUENCIA
Se trabaja con los puntos medios o representantes de
clase. Se utilizan las frecuencias absolutas o relativas.

OJIVA
Se trabaja con las frecuencias acumuladas, absoluta o
relativa. Permite observar cuantas observaciones estn
por encima o por abajo de ciertos valores.

REPRESENTACI ON GRAFI CA
DIAGRAMA DE BARRAS
Se utiliza para variables discretas y cualitativas. La
altura es proporcional a la frecuencia.

DIAGRAMA CIRCULAR (TORTA)
Se utiliza en general para variables cualitativas.
Divide el crculo en sectores proporcionales a la
frecuencia


g
i
= 360n
i
/n






REPRESENTACI ON GRAFI CA
MEDI DAS DE TENDENCI A
CENTRAL Y DI SPERSI ON
ESTADIGRAFO (ESTADISTICA SUMARIA)
Son medidas que sintetizan la informacin.
Propiedades de los estadgrafos
1. Debe estar bien definido
2. Debe prestarse al clculo
3. Para su clculo deben intervenir la mayora de las
observaciones
4. Debe ser poco sensible
MEDI DAS DE TENDENCI A
CENTRAL Y DI SPERSI ON
Existen estadgrafos de:
Posicin
Central
No central o de orden
Dispersin
Forma (Sesgo)
Concentracin (Curtosis)
ESTADI GRAFOS DE POSI CI ON
CENTRAL
MEDIA ARITMETICA

Si se trata de una muestra, sus caractersticas se
denominan estadstica.

Si se trata de la poblacin, sus caractersticas se
denominan parmetro.

Estadgrafos de Nombre genricoPromedio. Seala
un centro de los valores.



Datos no agrupados (resultado real)








Datos agrupados (resultado aproximado)





n x X
n
i
i / ) (
1

=
=
n n h X
n
i
i i
/ ) (
1

=
=
Ventajas

1. Concepto claro,
2. Cada conjunto de datos tiene una media
3. Puede calcularse y es nica

Desventajas

1. Es muy sensible, se ve afectada por valores extremos
2. Clculo tedioso si se consideran todos los puntos de datos
3. No se puede calcular la media si los extremos de clase
son abiertos


MEDIA PONDERADA (PESADA)

Se toma en cuenta la importancia de cada valor respecto al
total.







=
= i
n
i
i i
w w x w X /
1
MEDIANA

Valor de la variable que divide en dos el conjunto de datos,
el 50% esta por encima de este valor y el 50% restante por
debajo.

Datos no agrupados

1. Ordenar los datos de manera ascendente o descendente.

2. Si el nmero de observaciones es impar , el valor central
es la mediana.










3. Si el nmero de observaciones es par, la mediana es el
promedio de los dos elementos centrales.

En general:

Ubicacin de la Mediana=(n+1)/2





Datos agrupados

(n+1)/2 (N
m-1
+1)
Me= --------------------- c + Lm
n
m


Donde: N
m-1
= Frecuencia absoluta acumulada hasta, pero
sin incluir la clase mediana

n
m
= Frecuencia de la clase mediana
c = Ancho de clase
Lm = Lmite inferior del intervalo de clase mediano









Ventajas

1. No es sensible a los valores extremos

2. Se puede calcular a partir de datos agrupados de
extremo abierto

Desventajas

1. Clculos estadsticos con la mediana son ms
complejos

2. Se deben ordenar previamente los datos







MODA

Valor que se repite ms veces en un conjunto de datos. Es el
valor de la variable que hace mximo al polgono de
frecuencia.

En general se calcula la moda de datos agrupados.

Mo = L
MO
+ d
1

--------- c
d
1
+ d
2
Donde:

L
MO
=

Lmite inferior de la clase modal

d
1
= Frecuencia de la clase modal menos la frecuencia de la
clase que se encuentra inmediatamente por debajo de ella

d
2
= Frecuencia de la clase modal menos la frecuencia de la clase que se
encuentra inmediatamente por encima de ella

c = Ancho del intervalo de la clase modal

Ventajas

1. Se puede utilizar para datos cualitativos y cuantitativos

2. No se ve afectada por los valores extremos

3. Se puede calcular an en conjuntos de datos de extremos
abiertos



Desventajas

1. No es una medida muy utilizada

2. El valor modal puede resultar intil, cuando los datos no
se repiten ms de una vez, o cuando existe ms de una
moda, resulta difcil de interpretar y comparar.



Si la distribucin es simtrica, los valores de la Media ,
Mediana y Moda son iguales.

La Mediana en general resulta ser la mejor medida de
posicin en distribuciones sesgadas, puesto que su valor se
encuentra entre el valor Modal y de la Media.

En distribuciones positivamente sesgadas (sesgada hacia la
derecha), la Media es el mayor valor, seguido del valor de la
Mediana y por ltimo la Moda.


COMPARACI ON DE LA MEDI A, LA
MEDI ANA Y LA MODA

En distribuciones negativamente sesgadas (sesgada
hacia la izquierda), la Moda es el mayor valor,
seguido de la Mediana y por ltimo la Media.





ESTADIGRAFOS DE POSICION NO
CENTRAL O DE ORDEN
FRACTILES

Fractil divide al conjunto ordenado en fracciones definidas, tal que:
el xf fractil presenta un valor menor o igual al valor del fractil.

Cuartiles: Divide al conjunto de datos en 4 partes iguales, existen
3 cuartiles

Deciles: Divide el conjunto de datos en 10 partes iguales, existen
9 deciles

Percentiles: Divide el conjunto de datos en 100 partes iguales,
existen 99 percentiles.





Se calcula:
X
f
= L
f
+ (fn N
f-1
)(c/n
f
)

Donde: f = Fractil a calcular
n = Nro de observaciones
N
f-1
= Suma de todas las frecuencias de clase hasta
pero sin incluir la clase fractil
c = Ancho de clase
n
f
= Frecuencia de la clase fractil
L
f
= Lmite inferior de la clase fractil








Miden la variabilidad de los datos
Es importante conocer la variabilidad porque
proporciona informacin adicional que permite
determinar la confiabilidad del estadgrafo de posicin
central.



ESTADI GRAFOS DE DI SPERSI ON




Alcance (Amplitud total)
Diferencia entre el mayor valor observado y el mnimo. Slo
indica la distancia
R = Xmax Xmin

Alcance Interfractil
Diferencia entre los valores de dos fractiles.

Alcance Intercuartil
Alcance Intercuartil = Q3 Q1






Varianza de una poblacin
Media aritmtica de las desviaciones cuadrticas con
respecto a la media

Datos no agrupados:
o
2
= E(x
i
)
2
= E x
i
2

2
N N

Datos agrupados:
o
2
= E n
i
(h
i
)
2
= En
i
h
i
2

2
N N






Desviacin Estndar de la poblacin
Raz cuadrada de la varianza



Le da significado a la media, si o es pequeo entonces la
media representa mejor los datos.



2
o o =




Varianza de una muestra

Datos no agrupados:










1 1 1
) (
2
2
2
2

=

n
x n
n
x
n
x x
s
i i




Datos agrupados:




Desviacin Estndar de la muestra









1 1 1
) (
2
2 2
2

=

n
x n
n
h n
n
x h n
s
i i i i
2
s s =




Para un conjunto cualquiera de observaciones (muestra o
poblacin), la proporcin mnima de los valores que se
encuentran dentro de k desviaciones estndares desde la media
es

al menos 1 1/k
2
, donde k es una constante mayor a 1.

TEOREMA DE CHEBYSHEV




Si la distribucin es simtrica con forma de campana:

1. El 68% de los valores de la poblacin cae dentro de +/-1
desviacin estndar a partir de la media

2. El 95% de los valores de la poblacin cae dentro de +/-2
desviacin estndar a partir de la media

3. El 99.7% de los valores de la poblacin cae dentro de
+/-3 desviacin estndar a partir de la media










Razn o cociente de la desviacin estndar a la media
aritmtica, expresada como porcentaje.

Para la poblacin:



Para la muestra:


A menor resultado menor variabilidad respecto a la
media.







COEFICIENTE DE VARIACION
100 *
x
s
CV =
100 *

o
= CV




Probabilidad
Es la medida de la incertidumbre
Se expresa en fracciones o en decimales
Vara entre cero a uno

Experimento
Comprobacin de un hecho. Observacin de
alguna actividad, cuyos resultados estn regidos
por la aleatoriedad.
TEORIA DE PROBABILIDADES




Espacio muestral (S)
El conjunto de todos los resultados posibles de un
experimento.

Evento (E)
Uno o ms de los posibles resultados de un
Experimento. Es un subconjunto del espacio
muestral.




Eventos mutuamente excluyentes
Los eventos son mutuamente excluyentes si uno y
solo uno de ellos puede ocurrir a la vez.

Lista colectivamente exhaustiva
Lista de todos los posibles eventos que pueden
resultar de un experimento.



1. Planteamiento clsico

P(E) = Nro de resultados en los que se presenta el evento
Nro total de resultados posibles

Cada resultado es igualmente posible. Probabilidad fijada a
priori. No se realiza necesariamente el experimento. Existe la
alternativa con sustitucin o sin sustitucin.


TIPOS DE PROBABILIDAD




2. Planteamiento de frecuencia relativa
La frecuencia relativa observada de un evento durante un
gran nmero de intentos, bajo condiciones estables.
Necesita un conjunto suficiente de datos.

3. Planteamiento subjetivo
Probabilidad asignada a un evento por un individuo, basada
en la evidencia que se tenga disponible.






Regla de adicin para eventos mutuamente excluyentes

P(A o B) = P(A) + P(B)

Caso especial:
P(A) = 1 P(no A)

Regla de adicin para eventos que no son mutuamente
excluyentes

P(A o B) = P(A) + P(B) P(AB)

REGLAS DE PROBABILIDAD





Probabilidades bajo condiciones de
independencia estadstica
Independencia
El resultado de un evento no tiene efecto en el resultado
del segundo.
Puede ser: Marginal, Conjunta o Condicional

Probabilidad Marginal (Incondicional)
Es la probabilidad simple de presentacin de un evento
P(A).





Probabilidad Conjunta bajo condiciones de
independencia

P(AB) = P(A) x P(B)

Probabilidad Condicional bajo independencia
estadstica

P(B/A) = P(B)





Dependencia
La probabilidad de que se presente algn suceso que
depende de otro evento. Puede ser: Condicional,
Conjunta o Marginal.

Probabilidad Condicional

P(B/A) = P(BA)
P(A)
P(A/B) = P(AB)
P(B)






Probabilidad Conjunta bajo condiciones de
dependencia

P(AB) = P(A/B) x P(B)
P(BA) = P(B/A) x P(A)

Probabilidad Marginal bajo dependencia estadstica

P(A) = Suma de la probabilidad de los eventos
conjuntos donde A se presenta







Distribucin de probabilidad, est relacionada con una
distribucin de frecuencias, describe la forma en que se
espera que varen los resultados.

Son modelos tiles para hacer inferencias y tomar
decisiones en condiciones de incertidumbre.

Una distribucin probabilstica se resume por su media y
su varianza.



DISTRIBUCIONES DE
PROBABILIDAD





Se clasifican en:
Discretas
Continuas

En una distribucin de probabilidades discreta, la
variable puede tomar nicamente un nmero limitado
de valores

En una distribucin de probabilidades continua, la
variable considerada puede tomar cualquier valor
dentro de un intervalo dado.


Tipos de distribuciones de
probabilidad





Cantidad que es el resultado de un
experimento aleatorio que, debido al azar,
puede tomar distintos valores. Puede ser
discreta o continua.

Variable Aleatoria





Es un promedio ponderado, en el que las
ponderaciones son las probabilidades
correspondientes a los valores posibles.

E(X) = E (XP(X))


Valor Esperado de una variable
aleatoria discreta





Distribucin de probabilidad de una variable
discreta, cuyos valores son resultado de un
experimento conocido como proceso de
Bernoulli.

DISTRIBUCION BINOMIAL





Uso del proceso de Bernoulli:
1. Se observan dos resultados posibles: xito
o fracaso
2. La probabilidad de cualquier resultado
permanece fijo en el tiempo.
3. Los intentos son estadsticamente
independientes.







Probabilidad de r xitos en n ensayos:






Donde: n = Nmero de intentos
r = Nmero de xitos observados
p = Probabilidad de tener xito en cada intento
q = 1-p = Probabilidad de fracaso


r n r
q p
r
n
r X P

|
|
.
|

\
|
= = ) (
r n r
q p
r n r
n
r X P

= =
)! ( !
!
) (
Frmula para la distribucin Binomial






Medidas de tendencia Central y Dispersin para la
Distribucin Binomial:

Media:


Desviacin estndar:

npq = o
np =





DISTRIBUCION NORMAL
(Gaussiana)
Distribucin de probabilidad continua, la variable puede
tomar cualquier valor en un intervalo de valores dado.

Es muy importante porque:
1. Tiene algunas propiedades que la hacen aplicable a un gran
nmero de situaciones en la que se debe hacer inferencias
mediante la toma de muestras.

2. La distribucin normal casi se ajusta a las distribuciones de
frecuencias reales observadas en muchos fenmenos









Caractersticas de la Distribucin
Normal de Probabilidad
Observando la curva de la distribucin normal se tiene:

1. La curva tiene un solo pico, es unimodal. Tiene forma
de campana.

2. La media de una poblacin distribuda normalmente
cae en el centro de su curva normal









3. Por la simetra de la distribucin normal, la mediana
y la moda se encuentran tambin en el centro.

Media=Moda=Mediana

4. Los dos extremos de la distribucin normal de
probabilidad se extienden indefinidamente y nunca tocan
el eje horizontal





Para definir una distribucin de probabilidad
Normal necesitamos definir:

1. La media ()

2. La desviacin estndar (o)





Definicin de una distribucin
Normal de Probabilidad



El rea total bajo la curva normal es 1. Adems
se cumple:

1. Aprox. el 68% de todos los valores de una poblacin
normalmente distribuida se encuentra dentro de +/-1
desviacin estndar de la media.

2. Aprox. el 95.5% de todos los valores de una poblacin
normalmente distribuida se encuentra dentro de +/-2
desviacin estndar de la media.



Areas bajo la curva normal



3. Aprox. el 99.7% de todos los valores de una
poblacin normalmente distribuida se encuentra
dentro de +/-3 desviacin estndar de la media.









Puesto que cada distribucin normal tiene media () y
desviacin estndar (o) diferentes, existe un nmero
ilimitado y de distribuciones normales.

La distribucin normal estndar permite encontrar las
reas bajo cualquier curva normal. Se caracteriza por:

1. Media = 0
2. Desviacin estndar = 1



Distribucin Normal Estndar



Uso de la distribucin Normal
Estndar
1. Convertir la distribucin a una distribucin normal estndar
(estandarizar) utilizando el valor z.


2.

Donde:

X: es el valor de cualquier observacin especfica

: es la media de la distribucin

o : es la desviacin estndar de la distribucin

Z: nro de desviaciones estndar que hay desde X a la media


Conociendo el valor Z (frmula), se puede obtener el rea o
probabilidad bajo la curva normal, mediante el uso de la tabla.

o

=
X
z




Si la variable X se distribuye Binomial, donde n es un nmero
grande, y se cumple que :

np>=5 y nq>=5

entonces se puede usar la distribucin Normal como una
aproximacin de la Binomial.

Donde:
= np
o
2
= npq
o = (npq)
1/2

La distribucin normal como una
aproximacin de la distribucin Binomial




Factor de correccin por continuidad
Suma y restar 0.5 a los valores de X para los cuales se desea
calcular la probabilidad.

1. Si P(X>a) => Sumar 0.5 a a

2. Si P(X<b) => Restar 0.5 a b

3. Si P(a<X<b) => Sumar 0.5 a a y Restar 0.5 a b








CENSO
Enumeracin completa

MUESTRA
Enumeracin de una parte de la poblacin

DENOMINACION DE LAS CARACTERISTICAS
Estadsticas son las caractersticas de una muestra
Parmetros son las caractersticas de una poblacin

MUESTREO DI STRI BUCI ONES DE
MUESTREO




RAZONES PARA REALIZAR MUESTREO

1. La naturaleza destructiva de ciertas pruebas
2. La imposibilidad de hacer un censo
3. Costos muy altos de los censos
4. En una encuesta por muestreo se pueden tocar temas con
mayor profundidad
5. Una encuesta por muestreo es ms oportuna que un censo





TIPOS DE MUESTREO
Muestreo no aleatorio o de juicio. Se emplea la
experiencia y la opinin personal para seleccionar
la muestra.

Muestreo aleatorio o de probabilidad. Todos los
elementos tienen la posibilidad de ser elegidos en
la muestra.





MUESTRAS SESGADAS
Los resultados de la muestra no son representativos
de la poblacin.

Para asegurar la validez de una muestra se debe
solicitar informacin adicional.






Muestreo por cuotas
Fija un nmero determinado de casos para estudiar







1. Muestreo aleatorio simple
2. Muestreo sistemtico
3. Muestreo estratificado
4. Muestreo de racimo


METODOS DE MUESTREO
PROBABI LI STI CO




Cada posible muestra tiene igual probabilidad de ser
seleccionada y cada elemento de la poblacin total
tiene una oportunidad igual de ser incluido en la
Muestra.

Muestreo Aleatorio Simple
Poblacin finita
Tiene un tamao establecido, existe un nmero
entero que nos dice cuantos elementos (N) hay en la
Poblacin.

Muestreo sin reemplazo
No reemplazamos al elemento de inters. Si se
utiliza muestreo con reemplazo, un elemento puede
estar incluido dos veces en la muestra.




Muestreo Aleatorio Simple
Poblacin infinita
Tericamente es aquella donde es imposible
observar a todos sus elementos.
En la prctica se denomina poblacin infinita a
toda aquella poblacin finita grande.

Seleccin de la muestra
Tabla de nmeros aleatorios.


Muestreo Aleatorio Simple
Los elementos son seleccionados de la poblacin dentro de
un intervalo uniforme que se mide con respecto al tiempo, al
orden o al espacio. Se selecciona al azar un punto de inicio
y despus se elige cada k-simo elemento de la poblacin
para la muestra.

Se puede introducir sesgos a la muestra, sin embargo resulta
menos costoso que el muestreo aleatorio simple y
requiere menos tiempo.



Muestreo Sistemtico




Una poblacin se divide primero en grupos, homogneos
denominados estratos. Dentro de cada estrato se tienen dos
opciones de seleccionar la muestra:
1. Seleccionamos aleatoriamente un nmero especfico de
elementos correspondiente a la fraccin de este estrato en la
poblacin. Proporcional
2. Se extrae un nmero igual de elementos de cada estrato y
se pesa los resultados de acuerdo a la fraccin de ese
estrato en la poblacin. No proporcional
Muestreo Estratificado




Ventajas
Si se disean adecuadamente, reflejan de manera ms
precisa las caractersticas de la poblacin de inters.


Muestreo Estratificado




Mediante el cual la poblacin se divide en grupos o racimos,
cuyos elementos son heterogneos al interior
de cada grupo y homogneo entre grupos.

Se supone que los racimos individuales son representativos
de Poblacin como un todo.

Generalmente cada conglomerado o racimo se denomina
Unidad Primaria.


Muestreo de Racimo o Conglomerados




Una distribucin probabilstica consta de una lista de todas
las medias muestrales posibles de un tamao de muestra
dado de una poblacin y la probabilidad de ocurrencia
asociada.

Se puede trabajar tambin con proporciones.




DI STRI BUCI ONES MUESTRALES DE
MEDI AS




Error Estndar
La desviacin estndar de la distribucin de las medias
de la muestra.

Mide el grado hasta el que se espera que varen las
medias de las diferentes muestras. Indica el tamao del
error de azar que se ha cometido y la precisin que se
obtendr si utilizamos una estadstica de la muestra para
estimar un parmetro de la poblacin.






Error estndar de la media



En la que:
o = Desviacin estndar de la poblacin
n = Tamao de la muestra
N-n = Factor de correccin por finitud; si n/N<0.05 se N-1
ignora



1

=
N
n N
n
x
o
o




Distribucin normal estndar


Donde:

_
x = Media de la muestra

= Media de la poblacin

o
x =
Error Estndar de la media

o

x
x
z

=




Propiedades de la distribucin de la media




Se cumple tambin para poblaciones no normales




Si n/N<0.05 se ignora




1

=
N
n N
n
x
o
o

=
x




En el caso de una poblacin con media y varianza o
2
, la
distribucin muestral de todas las muestras posibles de
tamao n generadas a partir de la poblacin, tendr una
distribucin aproximadamente normal (siendo la media de la
distribucin igual a y la varianza igual a o
2
/n) considerando
que el tamao de la muestra es bastante grande. ( n>=30).



TEOREMA DEL LI MI TE CENTRAL




Permite usar estadsticas de muestra para hacer
inferencias con respecto a los parmetros de la
poblacin, sin saber nada sobre la forma de la
distribucin de frecuencia de esa poblacin ms de
lo que se pueda obtener de la muestra.



I mportancia del Teorema del Lmite Central




Es cualquier estadstica de la muestra que se utilice
para estimar un parmetro de la poblacin.





ESTI MADOR





Para evaluar la calidad de una estadstica se utilizan los
siguientes criterios:
Imparcialidad (no sesgado)
Eficiencia; referida al tamao del error estndar de la
estadstica. A menor error estndar el estimador es ms
eficiente.
Coherencia; referida al tamao de la muestra. A mayor
tamao de muestra mayor aproximacin al parmetro de la
poblacin
Suficiencia; si extrae la informacin necesaria de la
muestra.
CRI TERI OS PARA SELECCI ONAR UN
BUEN ESTI MADOR





Estimacin Puntual
Estimacin por Intervalo


TI POS DE ESTI MACI ON




ESTIMACION PUNTUAL
Es un nmero que se utiliza para estimar un parmetro
poblacional. A veces es insuficiente, porque slo da
dos opciones se equivoca o acierta.








ESTIMACION POR INTERVALO
Expresa la amplitud dentro de la cual probablemente se
encuentra un parmetro poblacional.
Indica el error de dos maneras: Por la extensin del
intervalo
Por la probabilidad de obtener el verdadero parmetro de
la poblacin que se encuentra dentro del intervalo.





La media muestral es el mejor estimador de

Estimador puntual de la varianza y desviacin estndar




Estimacin puntual de la porcin de la poblacin






Estimaciones Puntuales
X
1
) (
1
2
2

=
n
X
n
i
i
x
S
n
a
p =



Estimaciones de I ntervalo para
Intervalos de Confianza de 68.3%


Intervalos de Confianza de 95.5%



Intervalos de Confianza de 99.7%
x
x o 1
x
x o 2
x
x o 3
En general:
Si se conoce o:


Si NO se conoce o utilizamos s como estimador:





Estimaciones de I ntervalo para
o o o
o o
= + ( (

1 ) (
2
1
2
1
x x
z x z x
o
o o
= + ( (

1 ) (
2
1
2
1
x x
s z x s z x

Estimaciones de I ntervalo para Proporciones
(p)
En general:










o o o
o o
= + ( (

1 ) (
2
1
2
1
p p
z p P z p
n
pq
P
= o

Estimaciones de I ntervalo mediante la
distribucin t
n<30, o desconocida y la distribucin es normal o
aproximadamente normal




x
n
x
n
s t x s t x
1
2
1
2

+ ( (
o o


ESTI MACI ONES DE I NTERVALO
Interpretacin:
Si se seleccionan muchas muestras aleatorias del mismo
tamao y si calculamos un intervalo de confianza para cada
una de ellas, entonces en alrededor del X% (nivel de
confianza) de los casos la media poblacional caer dentro
de este intervalo





DETERMI NACI ON DEL TAMAO DE
MUESTRA EN ESTI MACI ON


Tamao de muestra para estimar una media


Donde: e = error muestral, se aplica el fcpf si n/N>0.05

Tamao de muestra para estimar una proporcin




Donde: e = error muestral. se aplica el fcpf si n/N>0.05
e
z
n
2
2 2
2
1
o
o

=
e
pq
z
n
2
2
2
1
o

=

Si n es finito, n/N>0.05



N
n
n
n
c
c
+
=
1
PRUEBAS DE HI POTESI S
HIPOTESIS
Enunciado acerca del valor de un parmetro
Poblacional.
Es una afirmacin que esta sujeta a verificacin o
comprobacin.

Procedimiento basado en la evidencia muestral y
en la teora de probabilidad que se emplea para
determinar si la hiptesis es un enunciado
razonable y no debe rechazarse, o si es
irrazonable y debe ser rechazado.




Prueba de Hiptesis

Procedimiento de cinco pasos para probar
una hiptesis
Paso 1: Plantear las hiptesis nula y alternativa
Paso 2: Seleccionar un nivel de significacin
Paso 3: Identificar el valor estadstico de prueba
Paso 4: Formular una regla de decisin
Paso 5: Tomar una muestra y llegar a una decisin

Procedimiento de cinco pasos para probar
una hiptesis Paso 1

Hiptesis Nula (Ho)
Hiptesis que se probar, indica no hay diferencia, se
plantea con el objetivo de aceptarla o rechazarla, es una
afirmacin.
Hiptesis Alterna (H
1
)
Una afirmacin o enunciado que se aceptar si los datos
muestrales proporcionan amplia evidencia de que la
hiptesis nula es falsa.

Procedimiento de cinco pasos para probar
una hiptesis Paso 2

Nivel de significacin (o)
Riesgo que se asume acerca de rechazar la hiptesis
nula cuando en realidad debe aceptarse por ser
verdadera. Si se supone Ho correcta, entonces el nivel
de significancia indicar el porcentaje del estadstico de
la muestra que esta fuera de ciertos lmites.

El valor que se aplica vara entre 0 y 1, no existe una
regla, se acostumbra usar 0.05 para proyectos de
investigacin sobre consumo; 0.01 para control de
calidad y 0.10 para encuestas polticas.

Procedimiento de cinco pasos para probar
una hiptesis Paso 2

Error Tipo I
La probabilidad de rechazar la hiptesis nula Ho
cuando en realidad es verdadera (o)
Error Tipo II
La probabilidad de aceptar la hiptesis nula Ho cuando
en realidad es falsa (|)



Procedimiento de cinco pasos para probar
una hiptesis Paso 3

Elegir y calcular el valor estadstico de prueba, que es
un valor, determinado a partir de la informacin
muestral, que se utiliza para aceptar o rechazar la
hiptesis nula (Ho).

Existen muchos valores de prueba, corresponden a la
distribucin Z (Normal), t (t-student); F (Fisher), X
2
(Chi-Cuadrado)


Procedimiento de cinco pasos para probar
una hiptesis Paso 4

La regla de decisin es una afirmacin de las
condiciones bajo las que se acepta o rechaza la
hiptesis nula Ho.

Se determina el valor crtico que es el nmero que es
el punto divisorio entre la regin de aceptacin y la
regin de rechazo.



Procedimiento de cinco pasos para probar
una hiptesis Paso 5

Tomar la decisin de no rechazar o rechazar la hiptesis
nula de acuerdo donde caiga el valor de Z o t.
Antes de realizar una prueba de hiptesis, se
diferenciar entre una prueba de significacin de dos
extremos y de un extremo.
Prueba de dos extremos: Cuando H
1
<>
(Parmetro); existen dos regiones de rechazo.
Prueba de un extremo: Cuando H
1
< (Parmetro);
H
1
> (Parmetro)
Existe una regin de rechazo.
PRUEBA DE HI POTESI S PARA LA
MEDI A DE LA POBLACI ON()
Poblacin normalmente distribuida, o conocida
1. Prueba de dos extremos












(utilizar el fcpf si n/N > 0.05)

VALOR CRITICO:
o o
H = :
o
H = :
1
n
x
z
o
o

=
z
2
1
o

PRUEBA DE HI POTESI S PARA LA


MEDI A DE LA POBLACI ON()
2. Prueba de un extremo














(utilizar el fcpf si n/N > 0.05)

VALOR CRITICO:
o o
H = :
o
o
H
H


)
(
:
:
1
1
n
x
z
o
o

=
z
o 1
PRUEBA DE HI POTESI S PARA LA
MEDI A DE LA POBLACI ON()
o desconocida y n>30
1. Prueba de dos extremos










(utilizar el fcpf si n/N > 0.05)

VALOR CRITICO:

o o
H = :
o
H = :
1
n
s
x
z
o

=
z
2
1
o

PRUEBA DE HI POTESI S PARA LA


MEDI A DE LA POBLACI ON()
2. Prueba de un extremo














(utilizar el fcpf si n/N > 0.05)

VALOR CRITICO:

o o
H = :
o
o
H
H


)
(
:
:
1
1
n
s
x
z
o

=
z
o 1
PRUEBA DE HI POTESI S PARA LA
MEDI A DE LA POBLACI ON()
Poblacin distribuida Normalmente, o desconocida y n<=30,
1. Prueba de dos extremos








VALOR CRITICO: (observar tabla t con la que trabaja)

o o
H = :
o
H = :
1
n
s
x
t
o

=
t
n 2 / , 1o
PRUEBA DE HI POTESI S PARA LA
MEDI A DE LA POBLACI ON()
2. Prueba de un extremo











VALOR CRITICO : (observar tabla t con la que trabaja)

o o
H = :
n
s
x
t
o

=
t
n o , 1
o
o
H
H


)
(
:
:
1
1
PRUEBA DE HI POTESI S PARA LA
PORCI ON (n>30)
Cuando n>30 y np>5 y nq >5
1. Prueba de dos extremos







donde:




VALOR CRITICO:


o o
P P H = :
o
P P H = :
1
p
o
p p
z
o

=
n
q p
o o
p
=
o
z
2
1
o

PRUEBA DE HI POTESI S PARA LA


PORCI ON (n>30)
2. Prueba de un extremo













donde:
o o
P P H = :
o
o
P P H
P P H
)
(
:
:
1
1
p
o
p p
z
o

=
n
q p
o o
p
=
o
VALOR CRITICO:


z
o 1
PRUEBA DE HI POTESI S PARA
DI FERENCI A DE MEDI AS n
1
>30 y n
2
>30
Se conoce o
1
y o
2
(si no se conoce o
1
y o
2
usar s
1
y s
2
como estimadores).
Poblacin normalmente distribuida
1. Prueba de dos extremos










donde:


VALOR CRITICO:



2 1
: =
o
H
2 1 1
: = H
o

2 1
2 1
) ( ) (
2 1
x x
x x
z


=
(
(

+ =

n n
x x
2
2
2
1
2
1
2 1
o o
o
z
2
1
o

PRUEBA DE HI POTESI S PARA


DI FERENCI A DE MEDI AS n
1
>30 y n
2
>30
2. Prueba de un extremo












donde:



VALOR CRITICO:




2 1
: =
o
H
2 1 1
2 1 1
:
:


)
(
H
H
o

2 1
2 1
) ( ) (
2 1
x x
x x
z


=
(
(

+ =

n n
x x
2
2
2
1
2
1
2 1
o o
o
z
o 1
PRUEBA DE HI POTESI S PARA DI FERENCI A
DE MEDI AS n
1
<= 30 y n
2
<=30
No se conoce o
1
y o
2.
Poblaciones normalmente distribuidas
1. Prueba de dos extremos










donde: y



VALOR CRITICO: (observar tabla t con la que trabaja)




2 1
: =
o
H
s
x x
x x
t
2 1
2 1
) ( ) (
2 1


=

2 1
1 1
2 1
n n
s
p
x x
s
+ =

2 1 1
: = H
2
) 1 ( ) 1 (
2 1
2
2
2
2
1
1
2
+
+
=
n n
n n
s s
sp
t
n n 2 / , 2
2 1
o +
PRUEBA DE HI POTESI S PARA
DI FERENCI A DE MEDI AS n
1
<= 30 y n
2
<=30
2. Prueba de un extremo











donde: y



VALOR CRITICO: (observar tabla t con la que trabaja)




2 1
: =
o
H
s
x x
x x
t
2 1
2 1
) ( ) (
2 1


=

2 1
1 1
2 1
n n
s
p
x x
s
+ =

2
) 1 ( ) 1 (
2 1
2
2
2
2
1
1
2
+
+
=
n n
n n
s s
sp
t
n n o , 2
2 1
+
2 1 1
2 1 1
:
:


)
(
H
H
PRUEBA DE HI POTESI S PARA
DI FERENCI A DE PORCI ONES n
1
> 30 y
n
2
>30
1. Prueba de dos extremos





Estimado de la porcin
total de xitos





Donde:


VALOR CRITICO:



2 1
: P P H
o
=
2 1 1
: P P H =
2 1
2 2 1 1

n n
p n p n
p
+
+
=
2 1

2 1
n
q p
n
q p
p p
+ =

o
o

2 1
) ( ) (
2 1 2 1
p p
o H
p p p p
z


=
z
2
1
o

PRUEBA DE HI POTESI S PARA


DI FERENCI A DE PORCI ONES n
1
> 30 y
n
2
>30
2. Prueba de un extremo






Estimado de la porcin
total de xitos






Donde:

VALOR CRITICO: Z
1-o


2 1
: P P H
o
=
2 1
2 2 1 1

n n
p n p n
p
+
+
=
2 1

2 1
n
q p
n
q p
p p
+ =

o
o

2 1
) ( ) (
2 1 2 1
p p
o H
p p p p
z


=
2 1 1
2 1 1
:
:
P P H
P P H
)
(

Das könnte Ihnen auch gefallen