Sie sind auf Seite 1von 54

INSTITUTO TECNOLOGICO DE VERACRUZ

Alumnos:
Garay Sosa Eduardo.
Barrios Prez Raymundo.
Bravo Rodrguez Josey Sloan.

Materia: Estadstica I.

Catedrtico: Ing. Claudio Yepez Sosa.

Semestre: Agosto Diciembre 2011.



ndice
Tema pagina
Introduccin....1
Unidad 2 Distribuciones Mustrales
2.1 Introduccin.......2
2.2 Teorema de combinacin lineal de variables aleatorias y teorema del lmite
central.......3
2.3 Muestreo: Introduccin al muestreo y tipos de muestreo.....15
2.4 Teorema del lmite central.......21
2.5 Distribucin muestral de la media.....23
2.6 Distribucin muestral de la diferencia de medias...24
2.7 Distribucin muestral de la proporcin....27
2.8 Distribucin muestral de la diferencia de proporciones.29
2.9 Distribucin muestral de la varianza.31
2.10 Distribucin muestral de la relacin de varianzas.34
Unidad 3 Estimacin de parmetros
3.1 Introduccin.....37
3.2 Caractersticas de un buen estimador..37

3.3 Estimacin puntual.....39

3.3.1 Mtodos....41
3.3.1.1 Mxima verosimilitud...42
3.3.3.2 Momentos...45
3.4 Intervalo de confianza para la media....46
3.5 Intervalo de confianza para la diferencia de medias...49
Conclusiones..53
Bibliografa...54
Introduccin

El presente trabajo es una investigacin donde se expone la importancia de
las condiciones bajo las que trabaja cualquier empleado y debern ser seguras,
es decir, no deben suponer una amenaza o una posibilidad significativa de
sufrir un dao de cierta entidad, que pueda incapacitar aunque sea parcial y
temporalmente, por parte de los trabajadores en relacin con el trabajo.

Las distribuciones mustrales: pueden definirse como el estudio de
determinadas caractersticas de una poblacin se efecta a travs de diversas
muestras que pueden extraerse de ella.
El muestreo puede hacerse con o sin reposicin, y la poblacin de partida
puede ser infinita o finita. Una poblacin finita en la que se efecta muestreo
con reposicin puede considerarse infinita tericamente. Tambin, a efectos
prcticos, una poblacin muy grande puede considerarse como infinita. En
todo nuestro estudio vamos a limitarnos a una poblacin de partida infinita o a
muestreo con reposicin.

Estimacin de parmetros: Es el procedi mi ent o util izado para
conocer l as caract er st icas de un parmet ro poblacional , a
part i r del conocimi ent o de l a muest ra.
Con una muest ra al eat ori a, de t amao n, podemos efectuar una
esti maci n de un valor de un parmet ro de l a poblacin.
En tal sentido el presente trabajo es una investigacin se realiza con el
objetivo de examinar un tema o problema de investigacin. Sirve para
familiarizarnos con los conceptos bsicos de estadstica.

Unidad 2 Distribuciones Mustrales
2.1 Introduccin
Distribuciones Mustrales
En estudios pasados de Estadsticas centramos nuestra atencin en tcnicas
que describen los datos, tales como organizar datos en distribuciones de
frecuencias y calcular diferentes promedios y medidas de variabilidad.
Estbamos concentrados en describir algo que ya ocurri.
Tambin comenzamos a establecer los fundamentos de la estadstica
inferencial, con el estudio de los conceptos bsicos de la probabilidad, las
distribuciones de probabilidad discretas y continuas. Distribuciones que son
principalmente generadas para evaluar algo que podra ocurrir. Ahora veremos
otro tipo de distribucin de probabilidad, que se llaman distribuciones
mustrales.
Por qu muestrear?
Muestrear es una forma de evaluar la calidad de un producto, la opinin de los
consumidores, la eficacia de un medicamento o de un tratamiento. Muestra es
una parte de la poblacin. Poblacin es el total de resultados de un
experimento. Hacer una conclusin sobre el grupo entero (poblacin) basados
en informacin estadstica obtenida de un pequeo grupo (muestra) es hacer
una inferencia estadstica.
A menudo no es factible estudiar la poblacin entera. Algunas de las razones
por lo que es necesario muestrear son:
1. La naturaleza destructiva de algunas pruebas
2. La imposibilidad fsica de checar todos los elementos de la poblacin.
3. El costo de estudiar a toda la poblacin es muy alto.
4. El resultado de la muestra es muy similar al resultado de la poblacin.
5. El tiempo para contactar a toda la poblacin es inviable.
Distribucin Maestral de las Medias
El ejemplo de los ratings de eficiencia muestra como las medias de muestras
de un tamao especfico varan de muestra a muestra. La media de la primera
muestra fue 101 y la media de la segunda fue 99.5. En una tercera muestra
probablemente resultara una media diferente. Si organizamos las medias de
todas las posibles muestras de tamao 2 en una distribucin de probabilidad,
obtendremos la distribucin maestral de las medias.
Distribucin maestral de las medias. Es una distribucin de probabilidad de
todas las posibles medias mustrales, de un tamao de muestra dado,
seleccionada de una poblacin.

2.2 Teorema de combinacin lineal de variables
aleatorias y teorema del lmite central.
Variable Aleatoria

En el tratamiento que se ha dado, hasta el momento, a los fenmenos
aleatorios se ha visto que los eventos elementales no son necesariamente
nmeros. Sin embargo, en muchas situaciones experimentales se requiere que
el resultado de la observacin realizada sea registrado como un nmero, para
responder a preguntas planteadas con respecto al fenmeno de observacin.
As tenemos los siguientes ejemplos.
Ejemplo: Supongamos ahora que cada una de tres personas a las que
denominaremos A, B, C, tiran una moneda y se ajustan a las siguientes reglas:
Si las tres monedas muestran el mismo lado, no se efecta pago alguno. En
todos los otros casos, la persona con el lado diferente recibe una unidad
monetaria de cada una de las otras personas.
Desde el punto de vista A se tendra la correspondencia
css 2 scc 2
ccc 0 sss 0
ssc -1 csc -1
scs -1 ccs -1
Luego A puede considerar una funcin X
A
cuyo recorrido sea el punto {-1, 0,
2}
Como vemos en estos ejemplos, a partir del espacio muestral asociado al
fenmeno aleatorio en cuestin, considerado como dominio de una cierta
funcin, se ha generado un conjunto cuyos elementos son nmeros. Desde el
punto de vista del modelo, el concepto que responde al requerimiento
planteado, es el de variable aleatoria, cuya definicin formal es la siguiente.
Definicin: Dado un campo de probabilidad oe y una funcin real
valorada X, cuyo dominio es y su recorrido es un conjunto no vaco de
nmeros reales, se dice que X es una variable aleatoria si para cada nmero
real a que se considere, el conjunto de los eventos elementales tales que
es un evento, es decir
oe
Simblicamente tenemos la funcin
R ,
Tal que
oe para cada nmero a. (1)
Podemos notar que si consideramos oe = P
T
, entonces la condicin (1) no
necesita ser explcitamente comprobada, pues por ser un conjunto de
eventos elementales, es decir un subconjunto de , es siempre un evento. En
cambio, si el sigma lgebra de eventos no coincide con el conjunto potencial
del espacio muestral, puede ocurrir que la condicin (1) no se satisfaga para
algn valor de a y entonces la funcin en consideracin no sera una variable
aleatoria, como ilustraremos a travs de los siguientes ejemplos.
Ejemplo: En relacin con el ejemplo 3.2, consideremos
Oe
y el nmero real a tal que Tenemos entonces
oe
por lo que podemos afirmar que X
A
no es una variable aleatoria en el campo
oe .
Ejemplo: Sea el espacio maestral y sea la funcin Y tal que Y
(a) = O y Y (b) = Y (c) = Y (d) = 1
Si consideramos oe = P
T
entonces para cada nmero real a y
por ende oe, por que podemos afirmar que Y es una variable
aleatoria sobre el campo
oe .
Si, en cambio consideramos oe
1
dado por
oe
1

la situacin es

donde se tiene oe
1
. En este caso, entonces, Y no es una variable
aleatoria definida sobre oe
1
.
A este punto del desarrollo resulta conveniente plantear las siguientes
observaciones.
Observaciones:
1. Desde el punto de vista de la teora, la terminologa de variable
aleatoria no parece ser muy adecuada por que se la define como
funcin y se la denomina variable. Sin embargo, se mantiene la
denominacin debido a que los valores que realmente puede
tomar la variable aleatoria dependen del resultado observado, es
decir dependen del azar.
2. De acuerdo con lo observado en los ejemplos 3.3 y 3.4, no toda
funcin concebible es una variable aleatoria, pero esta dificultad
no se presenta en las aplicaciones donde, como se ha establecido
antes, el modelo a considerar tiene como sigma lgebra de
eventos, en general, el conjunto potencia del espacio muestral
asociado.
3. En algunos casos cada evento elemental es ya una caracterstica
numrica, y se tendr que X es la funcin identidad pues
.
4. En la mayora de las discusiones no interesa la naturaleza
funcional de X, sino sus posibles valores.
5. Por su naturaleza de funcin, a cada evento elemental W le
corresponde un solo valor de X, pero diferentes eventos
elementales pueden llevar a un mismo valor de X.
6. El recorrido o campo de variacin de X, denotamos por R
X
se
denomina a veces espacio recorrido y, en cierto sentido, puede
ser considerado como un espacio muestral, punto de partida
para construir un modelo de probabilidad: el modelo asociado a
la caracterstica numrica en estudio. Si la variable aleatoria es
la funcin identidad, entonces .
7. Al presentar la definicin de la variable aleatoria, se ha hecho
uso de la siguiente notacin

en forma similar tenemos

notacin que se interpreta diciendo que

s y slo si

Condiciones para Variable Aleatoria
Desde el punto de vista de la teora, es conveniente disponer de algunas
condiciones necesarias y suficientes, para que una funcin real valorada cuyo
dominio en un espacio muestral sea una variable aleatoria. Condiciones que
permitirn demostraciones de propiedades de variables aleatorias. La
demostracin de la validez de las condiciones que se presentan se apoya, a su
vez, en el uso de ciertos lemas referentes a conjuntos de eventos elementales
asociados con valores de funciones con dominio de un espacio muestral, los
cuales forman parte de esta seccin.
Lema: Si X es una funcin real valorada con dominio entonces

para todo nmero real a.
Teorema: Sea X una funcin con dominio y con recorrido un conjunto no
vaco de nmeros reales. Entonces X es una variable aleatoria s y slo si
oe
para todo nmero real a.
Suficiencia: Supongamos, ahora, que oe para todo nmero real a.
Entonces se cumple que
oe
por propiedad de oe. Y, por el teorema 3.1, X es una variable aleatoria.
Teorema: Si X es una funcin cuyo dominio es y cuyo recorrido es un
conjunto no vaco de nmeros reales, entonces X es una variable aleatoria s y
slo si
oe
para todo nmero real a.
Teorema: Una condicin necesaria y suficiente para que una funcin X, cuyo
dominio es y su recorrido es un conjunto no vaco de nmeros reales, sea
variable aleatoria es que
oe
para todo par de nmeros reales a, b tales que a < b.
Combinaciones de Variables Aleatorias
Por la naturaleza funcional de las variables aleatorias, se puede realizar
operaciones con ellas, generando nuevas funciones con dominio del espacio
muestral considerando, cules se irn definiendo en esta seccin a medida que
sean introducidas. La principal preocupacin es saber si las funciones
resultantes son a su vez variables aleatorias. Como demostraremos, cualquier
combinacin lineal de variables aleatorias proporciona una nueva variable
aleatoria, y en los teoremas que presentamos, se considerarn otras
operaciones con variables aleatorias y las condiciones que hay que exigir para
que el resultado tambin lo sea.
Teorema: Si X, Y son variables aleatorias definidas sobre el mismo campo de
probabilidad, entonces su suma X + Y es tambin una variable aleatoria.
Teorema: Si X es una variable aleatoria y si K es un nmero real cualquiera,
entonces KX es una variable aleatoria.
Teorema: Si X es una variable aleatoria, entonces X
2
es variable aleatoria.
Teorema: Si X, Y son variables aleatorias definidas sobre el mismo campo de
probabilidad, entonces su producto XY es una variable aleatoria.
Teorema: Si X Y son variables aleatorias definidas sobre el mismo campo de
Probabilidad y si , entonces es variable aleatoria.
Teorema: Si X, Y son variables aleatorias definidas sobre el mismo campo de
probabilidad, entonces mn (X, Y) es variable aleatoria.
Ejemplo: De una urna que contiene los tres dgitos 1, 2, 3, se extrae al azar un
dgito, se le repone y se extrae al azar un segundo dgito. Sea X la diferencia
del primer dgito menos el segundo dgito extrados y sea Y el producto de los
mismos. Consideremos las funciones X + Y, XY, mn (X, Y) y , para los
cuales deseamos obtener sus recorridos y decidir si son o no variables
aleatorias.
Resulta conveniente advertir que si disponemos de los recorridos
correspondientes a X y Y no podemos operar indiscriminadamente con los
elementos de estos conjuntos para obtener el recorrido de, por ejemplo, X + Y,
como comprobaremos al efectuar la evaluacin correspondiente. Para facilitar
la presentacin, construyamos la tabla siguiente.

De esta tabla tenemos que el recorrido de cada una de las funciones X, Y, X +
Y es

de donde vemos que por ejemplo no figure en R
X+Y
la suma de los puntos
y , por corresponder a diferentes eventos elementales.
En forma similar tenemos para las funciones restantes

Podemos observar que en este caso, es X = mn (X, Y) puesto que a cada
evento elemental w le asignan el mismo nmero real. Adems observamos que
no est definida para w
1
, w
5
, y w
9
por lo que tenemos dom .

Teorema del lmite central
El teorema del lmite central o teorema central del lmite indica que, en
condiciones muy generales, si S
n
es la suma de n variables aleatorias
independientes, entonces la funcin de distribucin de S
n
se aproxima bien a
una distribucin normal (tambin llamada distribucin gaussiana, curva de
Gauss o campana de Gauss). As pues, el teorema asegura que esto ocurre
cuando la suma de estas variables aleatorias e independientes es lo
suficientemente grande.
Definicin
Sea la funcin de densidad de la distribucin normal definida como

con una media y una varianza
2
. El caso en el que su funcin de densidad
es , a la distribucin se le conoce como normal estndar.
Se define S
n
como la suma de n variables aleatorias, independientes,
idnticamente distribuidas, y con una media y varianza
2
finitas (
2
0):

de manera que, la media de S
n
es n y la varianza n
2
, dado que son
variables aleatorias independientes. Con tal de hacer ms fcil la comprensin
del teorema y su posterior uso, se hace una estandarizacin de S
n
como

para que la media de la nueva variable sea igual a 0 y la desviacin estndar
sea igual a 1. As, las variables Z
n
convergern en distribucin a la distribucin
normal estndar N (0,1), cuando n tienda a infinito. Como consecuencia, si
(z) es la funcin de distribucin de N (0,1), para cada nmero real z:

donde Pr( ) indica probabilidad y lim se refiere a lmite matemtico.
Enunciado formal
De manera formal, normalizada y compacta el enunciado del teorema es:
Teorema del lmite central: Sea X
1
, X
2
, ..., X
n
un conjunto de variables
aleatorias, independientes e idnticamente distribuidas con media y varianza

2
distinta de cero. Sea

Entonces
.
Es muy comn encontrarlo con la variable estandarizada Z
n
en funcin de la
media muestral ,

puesto que son equivalentes, as como encontrarlo en versiones no
normalizadas como puede ser:
Teorema (del lmite central): Sea X
1
, X
2
,..., X
n
un conjunto de variables
aleatoria, independientes e idnticamente distribuidas de una distribucin con
media y varianza
2
0. Entonces, si n es suficientemente grande, la variable
aleatoria

tiene aproximadamente una distribucin normal con y .

Nota: es importante remarcar que este teorema no dice nada acerca de la
distribucin de X
i
, excepto la existencia de media y varianza.

Ejemplos:
La variable "tirar una moneda al aire" sigue la distribucin de Bernouilli. Si
lanzamos la moneda al aire 50 veces, la suma de estas 50 variables (cada una
independiente entre si) se distribuye segn una distribucin normal.
Este teorema se aplica tanto a suma de variables discretas como de variables
continuas.
Los parmetros de la distribucin normal son:
Media: n * m (media de la variable individual multiplicada por el nmero de
variables independientes)
Varianza: n * s
2
(varianza de la variable individual multiplicada por el
nmero de variables individuales)
Veamos ahora un ejemplo:
Se lanza una moneda al aire 100 veces, si sale cara le damos el valor 1 y si
sale cruz el valor 0. Cada lanzamiento es una variable independiente que se
distribuye segn el modelo de Bernouilli, con media 0,5 y varianza 0,25.
Calcular la probabilidad de que en estos 100 lanzamientos salgan ms de 60
caras.
La variable suma de estas 100 variables independientes se distribuye, por
tanto, segn una distribucin normal.
Media = 100 * 0,5 = 50
Varianza = 100 * 0,25 = 25
Para ver la probabilidad de que salgan ms de 60 caras calculamos la variable
normal tipificada equivalente:

(*) 5 es la raz cuadrada de 25, o sea la desviacin tpica de esta distribucin
Por lo tanto:
P (X > 60) = P (Y > 2,0) = 1- P (Y < 2,0) = 1 - 0,9772 = 0,0228
Es decir, la probabilidad de que al tirar 100 veces la moneda salgan ms de 60
caras es tan slo del 2,28%.
Ejercicio 1.
La renta media de los habitantes de un pas se distribuye uniformemente entre
4,0 millones ptas. y 10,0 millones ptas. Calcular la probabilidad de que al
seleccionar al azar a 100 personas la suma de sus rentas supere los 725
millones ptas.
Cada renta personal es una variable independiente que se ditribuye segn una
funcin uniforme. Por ello, a la suma de las rentas de 100 personas se le puede
aplicar el Teorema Central del Lmite.
La media y varianza de cada variable individual es:
m = (4 + 10) / 2 = 7
s
2
= (10 - 4) ^2 / 12 = 3
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya
media y varianza son:
Media: n * m = 100 * 7 = 700
Varianza: n * s
2
= 100 * 3 = 300
Para calcular la probabilidad de que la suma de las rentas sea superior a 725
millones ptas, comenzamos por calcular el valor equivalente de la variable
normal tipificada:

Luego:
P (X > 725) = P (Y > 1,44) = 1 - P (Y < 1,44) = 1 - 0,9251 = 0,0749
Es decir, la probabilidad de que la suma de las rentas de 100 personas
seleccionadas al azar supere los 725 millones de pesetas es tan slo del 7,49%

2.3 Muestreo: Introduccin al muestreo y tipos de
muestreo.
En estadstica se conoce como muestreo a la tcnica para la seleccin de una
muestra a partir de una poblacin.
Al elegir una muestra se espera conseguir que sus propiedades sean
extrapolables a la poblacin. Este proceso permite ahorrar recursos, y a la vez
obtener resultados parecidos a los que se alcanzaran si se realizase un estudio
de toda la poblacin.
Cabe mencionar que para que el muestreo sea vlido y se pueda realizar un
estudio adecuado (que consienta no solo hacer estimaciones de la poblacin
sino estimar tambin los mrgenes de error correspondientes a dichas
estimaciones), debe cumplir ciertos requisitos. Nunca podremos estar
enteramente seguros de que el resultado sea una muestra representativa, pero
s podemos actuar de manera que esta condicin se alcance con una
probabilidad alta.
En el muestreo, si el tamao de la muestra es ms pequeo que el tamao de la
poblacin, se puede extraer dos o ms muestras de la misma poblacin. Al
conjunto de muestras que se pueden obtener de la poblacin se denomina
espacio muestral. La variable que asocia a cada muestra su probabilidad de
extraccin, sigue la llamada distribucin muestral.
Tipos de muestreo
Existen dos mtodos para seleccionar muestras de poblaciones: el muestreo no
aleatorio o de juicio y el muestreo aleatorio (que incorpora el azar como
recurso en el proceso de seleccin). Cuando este ltimo cumple con la
condicin de que todos los elementos de la poblacin tienen alguna
oportunidad de ser escogidos en la muestra, si la probabilidad correspondiente
a cada sujeto de la poblacin es conocida de antemano, recibe el nombre de
muestreo probabilstico. Una muestra seleccionada por muestreo de juicio
puede basarse en la experiencia de alguien con la poblacin. Algunas veces
una muestra de juicio se usa como gua o muestra tentativa para decidir cmo
tomar una muestra aleatoria ms adelante.
Muestreo probabilstico
Forman parte de este tipo de muestreo todos aquellos mtodos para los que
puede calcular la probabilidad de extraccin de cualquiera de las muestras
posibles. Este conjunto de tcnicas de muestreo es el ms aconsejable, aunque
en ocasiones no es posible optar por l. En este caso se habla de muestras
probabilsticas, pues no es en rigor correcto hablar de muestras
representativas dado que, al no conocer las caractersticas de la poblacin, no
es posible tener certeza de que tal caracterstica se haya conseguido.

Sin reposicin de los elementos: Cada elemento extrado se descarta para la
subsiguiente extraccin. Por ejemplo, si se extrae una muestra de una
"poblacin" de bombillas para estimar la vida media de las bombillas que la
integran, no ser posible medir ms que una vez la bombilla seleccionada.
Con reposicin de los elementos: Las observaciones se realizan con
reemplazamiento de los individuos, de forma que la poblacin es idntica en
todas las extracciones. En poblaciones muy grandes, la probabilidad de repetir
una extraccin es tan pequea que el muestreo puede considerarse sin
reposicin aunque, realmente, no lo sea.
Con reposicin mltiple: En poblaciones muy grandes, la probabilidad de
repetir una extraccin es tan pequea que el muestreo puede considerarse sin
reposicin. Cada elemento extrado se descarta para la subsiguiente
extraccin.
Para realizar este tipo de muestreo, y en determinadas situaciones, es muy til
la extraccin de nmeros aleatorios mediante ordenadores, calculadoras o
tablas construidas al efecto.
Muestreo estratificado
Consiste en la divisin previa de la poblacin de estudio en grupos o clases
que se suponen homogneos con respecto a alguna caracterstica de las que se
van a estudiar. A cada uno de estos estratos se le asignara una cuota que
determinara el nmero de miembros del mismo que compondrn la muestra.
Dentro de cada estrato se suele usar la tcnica de muestreo sistemtico, una de
las tcnicas de seleccin ms usadas en la prctica.
Segn la cantidad de elementos de la muestra que se han de elegir de cada uno
de los estratos, existen dos tcnicas de muestreo estratificado:
Asignacin proporcional: el tamao de la muestra dentro de cada
estrato es proporcional al tamao del estrato dentro de la poblacin.
Asignacin ptima: la muestra recoger ms individuos de aquellos
estratos que tengan ms variabilidad. Para ello es necesario un
conocimiento previo de la poblacin.
Por ejemplo, para un estudio de opinin, puede resultar interesante estudiar
por separado las opiniones de hombres y mujeres pues se estima que, dentro
de cada uno de estos grupos, puede haber cierta homogeneidad. As, si la
poblacin est compuesta de un 55% de mujeres y un 45% de hombres, se
tomara una muestra que contenga tambin esos mismos porcentajes de
hombres y mujeres.
Para una descripcin general del muestreo estratificado y los mtodos de
inferencia asociados con este procedimiento, suponemos que la poblacin est
dividida en h subpoblaciones o estratos de tamaos conocidos N
1
, N
2
,..., N
h
tal
que las unidades en cada estrato sean homogneas respecto a la caracterstica
en cuestin. La media y la varianza desconocidas para el i-simo estrato son
denotadas por m
i
y s
i
2
, respectivamente.
Muestreo sistemtico
Se utiliza cuando el universo o poblacin es de gran tamao, o ha de
extenderse en el tiempo. Primero hay que identificar las unidades y
relacionarlas con el calendario (cuando proceda). Luego hay que calcular una
constante, que se denomina coeficiente de elevacin K= N/n; donde N es el
tamao del universo y n el tamao de la muestra. Determinar en qu fecha se
producir la primera extraccin, para ello hay que elegir al azar un nmero
entre 1 y K; de ah en adelante tomar uno de cada K a intervalos regulares.
Ocasionalmente, es conveniente tener en cuenta la periodicidad del fenmeno.
Esto quiere decir que si tenemos un determinado nmero de personas que es la
poblacin (N) y queremos escoger de esa poblacin un nmero ms pequeo
el cual es la muestra (n), dividimos el nmero de la poblacin por el nmero
de la muestra que queremos tomar y el resultado de esta operacin ser el
intervalo, entonces escogemos un nmero al azar desde uno hasta el nmero
del intervalo, y a partir de este nmero escogemos los dems siguiendo el
orden.
Se divide la poblacin en subconjuntos tomando en cuenta el factor de
elevacin. Por ejemplo: suponga que en una pequea ciudad de 8,000
habitantes segn el censo se va a haber una encuesta y se selecciona una
muestra sistemtica de 20 personas entre 1,200 padres de familia para conocer
el grado de aceptacin de la gestin administrativas de la ciudad por parte del
presidente municipal...(N = 1200 Poblacin n = 20 Muestra
Factor de Elevacin N/n = 1200/20 = 60
N SEDE TRIUNFO) Al azar un nmero de entre 1 y 60
{3+60} n =
{3,63,123,183,243,303,363,423,483,543,603,663,723,783,843,903,963,1023,1
083,1143.
Muestreo por estadios mltiples
Esta tcnica es la nica opcin cuando no se dispone de lista completa de la
poblacin de referencia o bien cuando por medio de la tcnica de muestreo
simple o estratificado se obtiene una muestra con unidades distribuidas de tal
forma que resultan de difcil acceso. En el muestreo a estadios mltiples se
subdivide la poblacin en varios niveles ordenados que se extraen
sucesivamente por medio de un procedimiento de embudo. El muestreo se
desarrolla en varias fases o extracciones sucesivas para cada nivel.
Por ejemplo, si tenemos que construir una muestra de profesores de primaria
en un pas determinado, stos pueden subdividirse en unidades primarias
representadas por circunscripciones didcticas y unidades secundarias que
seran los propios profesores. En primer lugar extraemos una muestra de las
unidades primarias (para lo cual debemos tener la lista completa de estas
unidades) y en segundo lugar extraemos aleatoriamente una muestra de
unidades secundarias de cada una de las primarias seleccionadas en la primera
extraccin.
Muestreo por conglomerados
Tcnica similar al muestreo por estadios mltiples, se utiliza cuando la
poblacin se encuentra dividida, de manera natural, en grupos que se supone
que contienen toda la variabilidad de la poblacin, es decir, la representan
fielmente respecto a la caracterstica a elegir, pueden seleccionarse slo
algunos de estos grupos o conglomerados para la realizacin del estudio.
Dentro de los grupos seleccionados se ubicarn las unidades elementales, por
ejemplo, las personas a encuestar, y podra aplicrsele el instrumento de
medicin a todas las unidades, es decir, los miembros del grupo, o slo se le
podra aplicar a algunos de ellos, seleccionados al azar. Este mtodo tiene la
ventaja de simplificar la recogida de informacin muestral.
Cuando, dentro de cada conglomerado seleccionado, se extraen algunos
individuos para integrar la muestra, el diseo se llama muestreo bietpico.
Las ideas de estratos y conglomerados son, en cierto sentido, opuestas. El
primer mtodo funciona mejor cuanto ms homognea es la poblacin
respecto del estrato, aunque ms diferentes son stos entre s. En el segundo,
ocurre lo contrario. Los conglomerados deben presentar toda la variabilidad,
aunque deben ser muy parecidos entre s.
Homogeneidad de las poblaciones o sus subgrupos
Homogneo siginifica, en el contexto de la estratificacin, que no hay mucha
variabilidad. Los estratos funcionan mejor cuanto ms homogneos son cada
uno de ellos respecto a la caracterstica a medir. Por ejemplo, si se estudia la
estatura de una poblacin, es bueno distinguir entre los estratos mujeres y
hombres porque se espera que, dentro de ellos, haya menos variabilidad, es
decir, sean menos heterogneos. Dicho de otro modo, no hay tantas
diferencias entre unas estaturas y otras dentro del estrato que en la poblacin
total.
Por el contrario, la heterogeneidad hace intil la divisin en estratos. Si se dan
las mismas diferencias dentro del estrato que en toda la poblacin, no hay por
qu usar este mtodo de muestreo. En los casos en los que existan grupos que
contengan toda la variabilidad de la poblacin, lo que se construyen son
conglomerados, que ahorran algo del trabajo que supondra analizar toda la
poblacin. En resumen, los estratos y los conglomerados funcionan bajo
principios opuestos: los primeros son mejores cuanto ms homogneo es el
grupo respecto a la caracterstica a estudiar y los conglomerados, si
representan fielmente a la poblacin, esto es, contienen toda su viariabilidad, o
sea, son heterogneos.
Muestreo de juicio
Aqul para el que no puede calcularse la probabilidad de extraccin de una
determinada muestra. Se busca seleccionar a individuos que se juzga de
antemano tienen un conocimiento profundo del tema bajo estudio, por lo
tanto, se considera que la informacin aportada por esas personas es vital para
la toma de datos.
Muestreo por cuotas
Es la tcnica ms difundida sobre todo en estudios de mercado y sondeos de
opinin. En primer lugar es necesario dividir la poblacin de referencia en
varios estratos definidos por algunas variables de distribucin conocida (como
el gnero o la edad). Posteriormente se calcula el peso proporcional de cada
estrato, es decir, la parte proporcional de poblacin que representan.
Finalmente se multiplica cada peso por el tamao de n de la muestra para
determinar la cuota precisa en cada estrato. Se diferencia del muestreo
estratificado en que una vez determinada la cuota, el investigador es libre de
elegir a los sujetos de la muestra dentro de cada estrato.
Muestreo de bola de nieve
Indicado para estudios de poblaciones clandestinas, minoritarias o muy
dispersas pero en contacto entre s. Consiste en identificar sujetos que se
incluirn en la muestra a partir de los propios entrevistados. Partiendo de una
pequea cantidad de individuos que cumplen los requisitos necesarios estos
sirven como localizadores de otros con caractersticas anlogas.
Muestreo subjetivo por decisin razonada
En este caso las unidades de la muestra se eligen en funcin de algunas de sus
caractersticas de manera racional y no casual. Una variante de esta tcnica es
el muestreo compensado o equilibrado, en el que se seleccionan las unidades
de tal forma que la media de la muestra para determinadas variables se
acerque a la media de la poblacin.
Vase tambin
Muestra estadstica
Tamao de la muestra
Error muestral
Ejemplo
Vamos a hallar el intervalo de probabilidad para el peso medio de una muestra
de 100 recin nacidos, con un nivel de confianza de 0,9, sabiendo que
=3.100 gramos y =150 gramos.
Solucin: como se ha dicho anteriormente, tenemos que evaluar la siguiente
expresin

si consultamos en la tabla de la N (0, 1), comprobaremos que
, por lo tanto, el intervalo de probabilidad ser el siguiente:

Que simplificado, es el intervalo
(3.075325; 3.124675)

2.4 Teorema del lmite central
El Teorema del Lmite Central o Teorema Central del Lmite indica que, bajo
condiciones muy generales, la distribucin de la suma de variables aleatorias
tiende a una distribucin gaussiana cuando la cantidad de variables es muy
grande.
Existen diferentes versiones del teorema, en funcin de las condiciones
utilizadas para asegurar la convergencia. Una de las ms simples establece que
es suficiente que las variables que se suman sean independientes,
idnticamente distribuidas, con valor esperado y varianza finitas.
La aproximacin entre las dos distribuciones es en general mayor en el centro
de las mismas que en sus extremos o colas, motivo por el cual se prefiere el
nombre Teorema del Lmite Central (central califica al lmite, ms que al
teorema).
Esta relacin entre la forma de la distribucin de la poblacin y la forma de la
distribucin de muestreo se denomina teorema del lmite central, que es tal
vez el ms importante de toda la inferencia estadstica. Nos asegura que la
distribucin de muestreo de la media se aproxima a la normal al incrementarse
el tamao de la muestra. Hay situaciones tericas en las que el teorema del
lmite central no se cumple, pero casi nunca se encuentran en la toma de
decisiones prctica. Una muestra no tiene que ser muy grande para que la
distribucin de muestreo de la media se acerque a la normal. Los estadsticos
utilizan la distribucin normal como una aproximacin a la distribucin de
muestreo siempre que el tamao de la muestra sea al menos de 30, pero la
distribucin de muestreo de la media puede ser casi normal con muestras
incluso de la mitad de ese tamao. La importancia del teorema del lmite
central es que nos permite usar estadsticas de muestra para hacer inferencias
con respecto a los parmetros de poblacin sin saber nada sobre la forma de la
distribucin de frecuencias de esa poblacin ms que lo que podamos obtener
de la muestra.



Ejemplo
En una asignatura del colegio la probabilidad de que te saquen a la pizarra en
cada clase es del 10%. A lo largo del ao tienes 100 clases de esa asignatura.
Cul es la probabilidad de tener que salir a la pizarra ms de 15 veces?
Se vuelve a aplicar el Teorema Central del Lmite.
Salir a la pizarra es una variable independiente que sigue el modelo de
distribucin de Bernouilli:
"Salir a la pizarra", le damos el valor 1 y tiene una probabilidad del 0,10
"No salir a la pizarra", le damos el valor 0 y tiene una probabilidad del 0,9
La media y la varianza de cada variable independiente es:
m = 0,10
s 2 = 0,10 * 0,90 = 0,09
Por tanto, la suma de las 100 variables se distribuye segn una normal cuya
media y varianza son:
Media: n * m = 100 * 0,10 = 10
Varianza: n * s2 = 100 * 0,09 = 9
Para calcular la probabilidad de salir a la pizarra ms de 15 veces, calculamos
el valor equivalente de la variable normal tipificada:

Luego:
P (X > 15) = P (Y > 1,67) = 1 - P (Y < 1,67) = 1 - 0,9525 = 0,0475
Es decir, la probabilidad de tener que salir ms de 15 veces a la pizarra a lo
largo del curso es tan slo del 4,75% ( nimo!!! no es tan grave)

2.5 Distribucin muestral de la media
Se encarga de la recoleccin, clasificacin, presentacin, organizacin,
anlisis e interpretacin de un conjunto de fenmenos, (naturales, econmicos,
polticos o sociales) de manera metdica y numrica, que permitan extraer
conclusiones de un hecho, en un momento determinado y as poder tomar
decisiones valederas. Estadstica
a) Estadstica
b) Fsica
c) Matemticas
d) Psicologia
e) Geografa

Ejemplo
Si la vida media de operacin de una pila de linterna es de 24 horas y est
distribuida normalmente con una desviacin de 3 horas. Cul es la
probabilidad de que una muestra aleatoria de 100 pilas tenga una media que se
desve por ms de 30 minutos del promedio?
SOLUCIN
P(X > 24.5horas) = 4.85%
= 30 horas de duracin
_ = 3 horas
n = 100 pilas
La probabilidad de que el promedio de la vida til de las pilas supere las
24.5horas es de 4.85%.
2.6 Distribucin muestral de la diferencia de
medias
Suponga que se tienen dos poblaciones distintas, la primera con media
1
y
desviacin estndar
1
, y la segunda con media
2
y desviacin estndar
2.
Ms an, se elige una muestra aleatoria de tamao n
1
de la primera poblacin
y una muestra independiente aleatoria de tamao n
2
de la segunda poblacin;
se calcula la media muestral para cada muestra y la diferencia entre dichas
medias. La coleccin de todas esas diferencias se llama distribucin
muestral de las diferencias entre medias o la distribucin muestral del
estadstico


La distribucin es aproximadamente normal para n
1
30 y n
2
30. Si las
poblaciones son normales, entonces la distribucin muestral de medias es
normal sin importar los tamaos de las muestras.
En ejercicios anteriores se haba demostrado que y que , por lo
que no es difcil deducir que y que .
La frmula que se utilizar para el clculo de probabilidad del estadstico de
diferencia de medias es:



Ejemplo
En un estudio para comparar los pesos promedio de nios y nias de sexto
grado en una escuela primaria se usar una muestra aleatoria de 20 nios y
otra de 25 nias. Se sabe que tanto para nios como para nias los pesos
siguen una distribucin normal. El promedio de los pesos de todos los nios
de sexto grado de esa escuela es de 100 libras y su desviacin estndar es de
14.142, mientras que el promedio de los pesos de todas las nias del sexto
grado de esa escuela es de 85 libras y su desviacin estndar es de 12.247
libras. Si representa el promedio de los pesos de 20 nios y es el
promedio de los pesos de una muestra de 25 nias, encuentre la probabilidad
de que el promedio de los pesos de los 20 nios sea al menos 20 libras ms
grande que el de las 25 nias.
Solucin:
Datos:
1
= 100 libras
2
= 85 libras
1
= 14.142 libras
2
= 12.247 libras
n
1
= 20 nios
n
2
= 25 nias
= ?


Por lo tanto, la probabilidad de que el promedio de los pesos de la muestra de
nios sea al menos 20 libras ms grande que el de la muestra de las nias es
0.1056.


2.7 Distribucin muestral de la proporcin

La necesidad de encontrar la proporcin, porcentaje o porciento de una
situacin dada en una poblacin es tarea frecuente en estadstica.
La distribucin muestral de proporciones es el conjunto de todas las muestras
posibles del mismo tamao extradas de una poblacin, junto con el conjunto
de todas las proporciones mustrales.

Ejemplo
Suponga adems que se seleccionan muestras aleatorias de tamao 2 sin
reemplazo. Calcule la antigedad media para cada muestra, la media de la
distribucin muestral y el error estndar, o la desviacin estndar de la
distribucin muestral.

Solucin:
Se pueden tener
3
C
2
=3 muestras posibles. La tabla lista todas las muestras
posibles de tamao 2, con sus respectivas medias mustrales.
Muestras Antigedad Media Muestral
A,B (6,4) 5
A,C (6,2) 4
B,C (4,2) 3
La media poblacional es:
La media de la distribucin muestral es:


La desviacin estndar de la poblacin es:


El error estndar o la desviacin estndar de la distribucin muestral es:


Si utilizamos la frmula del error estndar sin el factor de correcin

tendramos que:

Por lo que observamos que este valor no es el verdadero. Agregando el factor de
correccin obtendremos el valor correcto:


2.8 Distribucin muestral de la diferencia de
proporcines

Muchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones o porcentajes. A continuacin se citan
algunos ejemplos:
Educacin.- Es mayor la proporcin de los estudiantes que aprueban
matemticas que las de los que aprueban ingls?
Medicina.- Es menor el porcentaje de los usuarios del medicamento A
que presentan una reaccin adversa que el de los usuarios del frmaco B
que tambin presentan una reaccin de ese tipo?
Administracin.- Hay diferencia entre los porcentajes de hombres y
mujeres en posiciones gerenciales.
Ingeniera.- Existe diferencia entre la proporcin de artculos
defectuosos que genera la mquina A a los que genera la mquina B?
Cuando el muestreo procede de dos poblaciones binomiales y se trabaja con
dos proporciones mustrales, la distribucin muestral de diferencia de
proporciones es aproximadamente normal para tamaos de muestra grande
(n
1
p
1
5, n
1
q
1
5,n
2
p
2
5 y n
2
q
2
5). Entonces p
1
y p
2
tienen distribuciones
mustrales aproximadamente normales, as que su diferencia p
1
-p
2
tambin
tiene una distribucin muestral aproximadamente normal.


Cuando se estudi a la distribucin muestral de proporciones se comprob que
y que , por lo que no es difcil deducir que
y que .
La frmula que se utilizar para el calculo de probabilidad del estadstico de
diferencia de proporciones es:

Ejemplo
Los hombres y mujeres adultos radicados en una ciudad grande del norte
difieren en sus opiniones sobre la promulgacin de la pena de muerte para
personas culpables de asesinato. Se cree que el 12% de los hombres adultos
estn a favor de la pena de muerte, mientras que slo 10% de las mujeres
adultas lo estn. Si se pregunta a dos muestras aleatorias de 100 hombres y
100 mujeres su opinin sobre la promulgacin de la pena de muerte,
determine la probabilidad de que el porcentaje de hombres a favor sea al
menos 3% mayor que el de las mujeres.
Solucin:
Datos:
P
H
= 0.12
P
M
= 0.10
n
H
= 100
n
M
= 100
p (p
H
-p
M
0.03) = ?

Se recuerda que se est incluyendo el factor de correccin de 0.5 por ser una
distribucin binomial y se est utilizando la distribucin normal.



2.9 Distribucin muestral de la varianza
La causa es que el promedio de todas las varianzas de las muestras no coincide
con la varianza de la poblacin s2. Se queda un poco por debajo. En concreto,
se verifica que hemos usado el subndice n para recordar que en la varianza se
divide entre n. Si deseamos que la media de la varianza coincida con la
varianza de la poblacin, tenemos que acudir a la cuasivarianza o varianza
insesgada, que es similar a la varianza, pero dividiendo las sumas de
cuadrados entre n-1. Su raz cuadrada es la cuasidesviacin tpica o desviacin
estndar. Si se usa esta varianza, si coinciden su media y la varianza de la
poblacin lo que nos indica que la cuasivarianza es un estimador insesgado, y
la varianza lo es sesgado. La suma de cuadrados de la varianza, dividida entre
la varianza de la poblacin se distribuye segn una chi-cuadrado c2 con n-1
grados de libertad

La varianza muestral En muchos casos es importante conocer el valor de la
varianza de la poblacin Para aplicar el teorema central del lmite Para
estimar riesgos en inversiones (el riesgo depende de la varianza) Para estimar
desigualdades en ingresos, rentas, etc. Repetimos el estudio que hemos
realizado para la media muestral Partimos de que la varianza muestral es una
variable aleatoria Queremos relacionar sus momentos con los de la poblacin
Y si es posible, identificar su distribucin Esperanza de la varianza muestral
Si x denota la media muestral, se tiene que E" 1 n Xn i=1 (xi x)2 # = n 1
n_2 El valor esperado de la varianza muestral no es la varianza de la poblacin
Definamos la varianza muestral como s2 =1 n1 Xn i=1(xi x)2 Esperanza
de la varianza muestral Con esta definicin, tenemos E[s2] = _2 El valor
esperado de s2 coincide con el valor deseado (varianza de la poblacin) s2 es
un estimador insesgado de _2 Distribucin de la varianza muestral Nos
gustara tener informacin adicional sobre la varianza muestral y su
distribucin.
Ejemplo
Averiguar si la variabilidad de edades en una comunidad local es la misma o
mayor que la de todo el Estado. La desviacin estndar de las edades del
Estado, conocida por un estudio reciente es de 12 aos. Tomamos una muestra
aleatoria de 25 personas de la comunidad y determinamos sus edades. Calcular
la varianza de la muestra y usar la ecuacin anteriormente explicada para
obtener el estadstico muestral.
Las hiptesis nula y alternativas son:
H0 : 2 = 144
H1 : 2 144
Se toma la muestra y resulta una desviacin estndar muestral de 15
Aos. La varianza de la muestra es entonces 225, y el estadstico ji cuadrada
de la muestra es:
(n - 1 ) s2 (25-1)(15)2
2 = --------------- = ------------------- = 37,5
2 122
Si la hiptesis nula es cierta, el estadstico muestral de 37,5 se obtiene de la
distribucin ji cuadrada terica, en particular, la distribucin con 24 grados de
libertad (25 - 1 = 24).
Como se puede observar en la ecuacin anterior, cuanto ms grande es la
varianza muestral respecto a la varianza poblacional hipottica, mas grande es
el estadstico que se obtiene. Luego deducimos que de un estadstico muestral
grande llevamos al rechazo de la hiptesis nula, y un estadstico muestral
pequeo implicar que no se rechaze. La tabla ji cuadrada se usa para
determinar si es probable o no que el valor 37,5 haya sido obtenido de la
distribucin muestral ji cuadrada hipottica.
Supongamos que esta prueba debe llevarse a un nivel de significancia de 0,02.
En la columna 0,02 de la tabla de ji cuadrada y la fila 24, se encuentra el valor
critico de 40, 27. La regla de decisin es:
Si 2 40,27, se rechaza la hiptesis nula de que la varianza de la poblacin
es 144 (Se rechaza H0 si 2 > 40,27 ).
Como estadstico de prueba calculado es 37,5, la hiptesis nula no se rechaza
(con riesgo de un error de tipo II). Si en la tabla de ji cuadrada se hubiese
elegido un alfa de 0,05, el valor crtico de la tabla sera 36,415, y la hiptesis
nula se hubiera rechazado (37,5 > 36,415). En este ejemplo se ilustra la
importancia de pensar con cuidado en el riesgo apropiado de un error de tipo I
en una prueba de hiptesis.
Se supone que la hiptesis nula es cierta, lo que conduce a la obtencin de un
estadstico muestral de una distribucin ji cuadrada con 2 grados de libertad.

2.10 Distribucin muestral de la relacin de
varianzas
Se defini en la seccin de la introduccin de las distribuciones mustrales.
Esta seccin revisa algunas propiedades importantes de la distribucin
muestral de la media que se introdujeron en las manifestaciones de este
captulo.
Medio
La media de la distribucin muestral de la media es la media de la poblacin
de la cual los resultados se tomaron muestras. Por lo tanto, si una poblacin
tiene una media, , entonces la distribucin muestral de la media es . El
M

smbolo se utiliza para referirse a la media de la distribucin muestral de la
media. Por lo tanto, la frmula de la media de la distribucin muestral de la
media puede ser escrito como:

M
=
Diferencia
La varianza de la distribucin muestral de la media se calcula de la siguiente
manera:

Es decir, la varianza de la distribucin muestral de la media es la varianza de
la poblacin dividida por N, el tamao de la muestra (el nmero de
calificaciones utilizada para calcular una media). Por lo tanto, cuanto mayor
sea el tamao de la muestra, menor ser la varianza de la distribucin muestral
de la media.

Esta expresin se puede derivar muy fcilmente de la ley de la suma de
varianza . Comencemos por calcular la varianza de la distribucin muestral
de la suma de tres nmeros en la muestra de una poblacin con varianza
2.

La varianza de la suma sera
2
+
2
+
2.
Para los nmeros de N, la
varianza sera N
2.
Puesto que la media es de 1 / N veces la suma, la
varianza de la distribucin muestral de la media sera de 1 / N
2
veces la
varianza de la suma, que es igual a
2
/ N.
El error estndar de la media es la desviacin estndar de la distribucin
muestral de la media. Por lo tanto, la raz cuadrada de la varianza de la
distribucin muestral de la media y se puede escribir como:

El error estndar est representado por una porque es una desviacin
estndar. El subndice (M) indica que el error estndar en cuestin es el error
estndar de la media.

Ejemplo
Los siguientes son los pesos, en decagramos, de 10 paquetes de semillas de
pasto distribuidas por cierta compaa: 46.4, 46.1, 45.8, 47.0, 46.1, 45.9, 45.8,
46.9, 45.2 y 46. Encuentre un intervalo de confianza de 95% para la varianza
de todos los paquetes de semillas de pasto que distribuye esta compaa,
suponga una poblacin normal.
Solucin:
Primero se calcula la desviacin estndar de la muestra:

al elevar este resultado al cuadrado se obtiene la varianza de la muestra s
2
=
0.286.
Para obtener un intervalo de confianza de 95% se elige un = 0.05.
Despus con el uso de la tabla con 9 grados de libertad se obtienen los valores
de X
2
.

Se puede observar en la grfica anterior que el valor de X
2
corre en forma
normal, esto es de izquierda a derecha.
Por lo tanto, el intervalo de confianza de 95% para la varianza es:


Grficamente:

Se observa que la varianza corre en sentido contrario, pero esto es slo en la
grfica. La interpretacin quedara similar a nuestros temas anteriores
referentes a estimacin. Con un nivel de confianza del 95% se sabe que la
varianza de la poblacin de los pesos de los paquetes de semillas de pasto est
entre 0.135 y 0.935 decagramos al cuadrado.

Unidad 3 Estimacin de parmetros
3.1 Introduccin
Es el procedi mi ento uti li zado para conocer l as caract er st icas
de un parmet ro pobl aci onal , a part i r del conoci mi ento de la
muest ra.
Con una muest ra al eat ori a, de t amao n, podemos efectuar una
esti maci n de un valor de un parmet ro de l a pobl aci n; pero
t ambi n necesit amos precisar un:
Intervalo de confi anza
Se l lama as a un i nt ervalo en el que sabemos que est un
parmet ro, con un nivel de confianza espec fi co.
Ni vel de confianza
Probabil idad de que el parmet ro a esti mar se encuent re en el
i nt erval o de confianza.
Error de esti maci n admi si bl e
Que est ar rel acionado con el radi o del int ervalo de confi anza.


3.2 Caractersticas de un buen estimador

Conviene que los estadsticos, en su funcin de estimadores de los
correspondientes parmetros, renan determinados requisitos.
Fundamentalmente son:
a) CARENCIA DE SESGO.
Un estimador (estadstico) carece de sesgo si el promedio (media) de todos los
valores posibles de todas las muestras posibles de tamao n de una poblacin
es igual al parmetro, es decir, si la media de la distribucin muestral del
estadstico considerado es igual al valor del parmetro. As, la media es un
estimador insesgado de porque se puede demostrar que la media aritmtica
de una distribucin muestral coincide con el valor del parmetro, algo que no
puede decirse, por ejemplo, o de la varianza o de la mediana de una poblacin
no distribuida normalmente.
b) CONSISTENCIA.
Un estimador es consistente en la medida en que, al aumentar el tamao de la
muestra, (n) su valor se acerca cada vez ms al parmetro correspondiente o lo
que es lo mismo, si a medida que aumenta el tamao de la muestra, las
estimaciones que sta proporciona son cada vez ms prximas al valor del
parmetro.
Algunos estimadores sesgados son consistentes, acercndose cada vez ms sus
valores a los de sus respectivos parmetros a medida que el tamao de la
muestra (n) aumenta, tal es el caso de s o s2 que son estimadores sesgados
pero consistentes de la desviacin tpica () o de la varianza (2) de la
poblacin.
c) EFICIENCIA
La 3 propiedad de los estimadores es su eficiencia, que se refiere a la
precisin que alcanzan los estadsticos en la estimacin de los parmetros, es
decir, un estimador ser tanto ms eficiente cuanto menos vare de muestra a
muestra de una misma poblacin.
Como la variabilidad de una distribucin muestral viene dada por su error
tpico, un buen estimador ser aquel que menor error tpico alcanza. As, entre
la media y la mediana, la primera es claramente ms eficiente. La varianza de
la distribucin muestral de la mediana es mayor que la de la media, lo que
significa que la mediana flucta ms que la media en muestras sucesivas de la
misma poblacin.
En general, para escoger un ptimo estimador de un parmetro, deben
combinarse los criterios de no tendenciosidad (carencia de sesgo) y de
eficiencia. Ante dos estimadores insesgados del mismo parmetro, se preferir
aquel que tenga mayor eficiencia, es decir, que tenga el mnimo error en
trminos de varianza.
Estimadores insesgados: Media, Mediana, Moda, la desviacin tpica cuando
n es tiende a infinito, la cuasivarianza muestral
Estimadores sesgados: la varianza muestral.
Estimadores consistentes: Proporciones, la media, la varianza y desviacin
tpica.
Estimadores insesgados y no eficientes: Mediana muestral (estimador
insesgado de ]





3.3 Estimacin puntual
Puede decirse que la Estadstica es la ciencia que se preocupa de la recogida
de datos, su organizacin y anlisis, as como de las predicciones que, a partir
de estos datos, pueden hacerse. Los aspectos anteriores hacen que pueda
hablarse de dos tipos de Estadstica: Descriptiva e Inferencial.
La Estadsitica Descriptiva se ocupa de tomar los datos de un conjunto dado,
organizarlos en tablas o representaciones grficas y del clculo de unos
nmeros que nos informen de manera global del conjunto estudiado.
La Estadstica Inferencial estudia cmo sacar conclusiones generales para
toda la poblacin a partir del estudio de una muestra.
Existen dos formas de hacer Inferencia Estadstica:
- La estimacin de parmetros.
- Las pruebas de hiptesis.
En la Inferencia Estadstica hay varios mtodos, pero en cualquier caso es
necesario utilizar una muestra que represente a la poblacin, esto se consigue
con las Tcnicas de muestreo.
A partir de una muestra nos proponemos dos objetivos:
Obtener valores aproximados de parmetros poblacionales: Estimacin
puntual.
La estimacin por intervalos de confianza tiene por objeto proporcionar, a
partir de la informacin recogida en la muestra, un intervalo que contenga con
alto nivel de confianza (probabilidad), al parmetro objeto de nuestro inters.
A partir de dicho intervalo obtendremos una medida del error mximo
cometido al aproximar puntualmente el parmetro.
Esencialmente son tres los parmetros de inters:
En el caso de que investiguemos una variable cuantitativa:
a) Para la media de la poblacin tomaremos como aproximacin la media
de la muestra.
=


b) Para la varianza de la poblacin
2
tomaremos la cuasivarianza de la
muestra.
=
Si el estudio se centra en el estudio de un carcter cualitativo el parmetro de
inters ser la proporcin de elementos de la poblacin que pertenecen a cierta
categora C que lo aproximaremos con la correspondiente proporcin en la
muestra.


Ejemplo
En la prctica, los intervalos suelen indicarse dando el valor del estimador
puntual utilizado como centro del intervalo y un valor que debe sumarse y
restarse para obtener el lmite superior e inferior; por ejemplo:
Equivale a


3.3.1 Mtodos
En inferencia estadstica se llama estimacin al conjunto de tcnicas que
permiten dar un valor aproximado de un parmetro de una poblacin a partir
de los datos proporcionados por una muestra. Por ejemplo, una estimacin de
la media de una determinada caracterstica de una poblacin de tamao N
podra ser la media de esa misma caracterstica para una muestra de tamao n.
La estimacin se divide en tres grandes bloques, cada uno de los cuales tiene
distintos mtodos que se usan en funcin de las caractersticas y propsitos del
estudio:
Estimacin puntual
Mtodo de los momentos
Mtodo de la mxima verosimilitud
Mtodo de los mnimos cuadrados
Estimacin por intervalos
Estimacin bayesiana

3.3.1.1 Mxima verosimilitud
En estadstica, la estimacin por mxima verosimilitud (conocida tambin
como EMV y, en ocasiones, MLE por sus siglas en ingls) es un mtodo
habitual para ajustar un modelo y encontrar sus parmetros.
Fundamento
Supngase que se tiene una muestra x
1
, x
2
, , x
n
de n observaciones
independientes extradas de una funcin de distribucin desconocida con
funcin de densidad (o funcin de probabilidad) f
0
(). Se sabe, sin embargo,
que f
0
pertenece a una familia de distribuciones {f( |), }, llamada
modelo paramtrico, de manera que f
0
corresponde a =
0
, que es el
verdadero valor del parmetro. Se desea encontrar el valor (o estimador) que
est lo ms prximo posible al verdadero valor
0
.
Tanto x
i
como pueden ser vectores.
La idea de este mtodo es el de encontrar primero la funcin de densidad
conjunta de todas las observaciones, que bajo condiciones de independencia,
es

Observando esta funcin bajo un ngulo ligeramente distinto, se puede
suponer que los valores observados x
1
, x
2
, , x
n
son fijos mientras que
puede variar libremente. Esta es la funcin de verosimilitud:

En la prctica, se suele utilizar el logaritmo de esta funcin:



El mtodo de la mxima verosimilitud estima
0
buscando el valor de que
maximiza . Este es el llamado estimador de mxima verosimilitud
(MLE) de
0
:

En ocasiones este estimador es una funcin explcita de los datos observados
x
1
,, x
n
, pero muchas veces hay que recurrir a optimizaciones numricas.
Tambin puede ocurrir que el mximo no sea nico o no exista.
En la exposicin anterior se ha asumido la independencia de las
observaciones, pero no es un requisito necesario: basta con poder construir la
funcin de probabilidad conjunta de los datos para poder aplicar el mtodo.
Un contexto en el que esto es habitual es el del anlisis de series temporales.
Propiedades del estimador de mxima verosimilitud
En muchos casos, el estimador obtenido por mxima verosimilitud posee un
conjunto de propiedades asintticas atractivas:
consistencia,
normalidad asinttica,
eficiencia,
e incluso eficiencia de segundo orden tras corregir el sesgo.
Consistencia
Bajo ciertas condiciones bastante habituales,
2
el estimador de mxima
verosimilitud es consistente: si el nmero de observaciones n tiende a infinito,
el estimador converge en probabilidad a su valor verdadero:

Bajo condiciones algo ms fuertes,
3
la convergencia es casi segura:



Ejemplo
Sean y dos estimadores del parmetro , tales que:






Qu estimador es mejor?.


Calculamos el sesgo para cada estimador:

Sesgo del Estimador 1: sesgo1 = - = 0
Sesgo del Estimador 2: sesgo2 = - /2 = /2

Podemos observar, que el estimador 1 es insesgado, mientras que el estimador
2, es sesgado.

Para ver, que estimador es mejor, hallamos el error cuadrtico medio de cada
estimador:
.

ECM 1 = 10
ECM 2 = 4 + (/2)
2


Para saber cual estimador es mejor, usamos el cociente del error cuadrtico
medio:



Sustituyendo valores:


Para que el estimador 1 sea mejor que el estimador segundo, se debe
corroborar:


Despejamos:
40 <. 16 +
2

Por lo tanto, para que el estimador 1 sea ms eficiente que el estimador 2, se
debe cumplir:
2
> 24.

1.3.3.2 Momentos
Se trata de un mtodo de obtencin de estimadores muy intuitivo.
Bsicamente, consiste en igualar los momentos poblacionales (que sean
funcin del o los parmetros a estimar) con los momentos mustrales y
despejar el parmetro a estimar.

As, por ejemplo, la esperanza de una variable aleatoria se estimara por la
media muestral; la varianza, por la varianza muestral; etc.

La principal ventaja de este mtodo es su simplicidad. Sin embargo, aunque
los estimadores as obtenidos son consistentes, en general, no son centrados ni
eficientes. Adems, en ciertos casos puede proporcionar estimaciones
absurdas, como veremos en el siguiente ejemplo:

Supongamos que tenemos una variable con distribucin uniforme donde el
lmite inferior es cero y el superior es desconocido. Naturalmente, estaremos
interesados en estimar el lmite superior (al que llamaremos b) de nuestra
distribucin uniforme.
X sigue una distribucin uniforme (a = 0, b =?)
Recordemos que la esperanza de una distribucin uniforme comprendida entre
dos valores a y b es el promedio de estos dos valores.

Por tanto, para aplicar el mtodo de los momentos para estimar b, igualaremos
dicho promedio a la media aritmtica:

3.4 Intervalo de confianza para la media
En estadstica, se llama intervalo de confianza a un par de nmeros entre los
cuales se estima que estar cierto valor desconocido con una determinada
probabilidad de acierto. Formalmente, estos nmeros determinan un intervalo,
que se calcula a partir de datos de una muestra, y el valor desconocido es un
parmetro poblacional. La probabilidad de xito en la estimacin se representa
con 1 - y se denomina nivel de confianza. En estas circunstancias, es el
llamado error aleatorio o nivel de significacin, esto es, una medida de las
posibilidades de fallar en la estimacin mediante tal intervalo.
1

El nivel de confianza y la amplitud del intervalo varan conjuntamente, de
forma que un intervalo ms amplio tendr ms posibilidades de acierto (mayor
nivel de confianza), mientras que para un intervalo ms pequeo, que ofrece
una estimacin ms precisa, aumentan sus posibilidades de error.
Para la construccin de un determinado intervalo de confianza es necesario
conocer la distribucin terica que sigue el parmetro a estimar, . Es habitual
que el parmetro presente una distribucin normal. Tambin pueden
construirse intervalos de confianza con la desigualdad de Chebyshov.
En definitiva, un intervalo de confianza al 1 - por ciento para la estimacin
de un parmetro poblacional que sigue una determinada distribucin de
probabilidad, es una expresin del tipo [
1
,
2
] tal que P[
1

2
] = 1 - ,
donde P es la funcin de distribucin de probabilidad de .

Ejemplos
De una poblacin de media y desviacin tpica se pueden tomar muestras
de n elementos. Cada una de estas muestras tiene a su vez una media ( ). Se
puede demostrar que la media de todas las medias mustrales coincide con la
media poblacional:
2

Pero adems, si el tamao de las muestras es lo suficientemente grande,la
distribucin de medias mustrales es, prcticamente, una distribucin normal
(o gaussiana) con media y una desviacin tpica dada por la siguiente expresin:
.
Esto se representa como sigue: . Si estandarizamos, se sigue que:

En una distribucin Z ~ N (0, 1) puede calcularse fcilmente un intervalo
dentro del cual caigan un determinado porcentaje de las observaciones, esto
es, es sencillo hallar z
1
y z
2
tales que P[z
1
z z
2
] = 1 - , donde (1 - )100 es
el porcentaje deseado (vase el uso de las tablas en una distribucin normal).
Se desea obtener una expresin tal que
En esta distribucin normal de medias se puede calcular el intervalo de
confianza donde se encontrar la media poblacional si slo se conoce una
media muestral ( ), con una confianza determinada. Habitualmente se
manejan valores de confianza del 95 y del 99 por ciento. A este valor se le
llamar 1 (debido a que es el error que se cometer, un trmino opuesto).
Para ello se necesita calcular el punto X
/ 2
o, mejor dicho, su versin
estandarizada Z
/ 2
o valor crtico junto con su "opuesto en la distribucin"
X
/ 2
. Estos puntos delimitan la probabilidad para el intervalo, como se
muestra en la siguiente imagen:

Dicho punto es el nmero tal que:

Y en la versin estandarizada se cumple que:
z
/ 2
= z
/ 2

As:

Haciendo operaciones es posible despejar para obtener el intervalo:

De lo cual se obtendr el intervalo de confianza:

Obsrvese que el intervalo de confianza viene dado por la media muestral
el producto del valor crtico Z
/ 2
por el error estndar .
Si no se conoce y n es grande (habitualmente se toma n 30):
4

, donde s es la desviacin tpica de una muestra.
Aproximaciones para el valor z
/ 2
para los niveles de confianza estndar son
1,96 para 1 = 95% y 2,576 para 1 = 99%.
5

Intervalo de confianza para una proporcin
El intervalo de confianza para estimar una proporcin p, conocida una
proporcin muestral p
n
de una muestra de tamao n, a un nivel de confianza
del (1-) 100% es:

En la demostracin de estas frmulas estn involucrados el Teorema Central
del Lmite y la aproximacin de una binomial por una normal.

3.5 Intervalo de confianza para la diferencia de
medias
Sean X11, X12, X1n1, una muestra aleatoria de n1 observaciones tomadas
de una primera poblacin con valor esperado 1 y varianza s
1, y X21, X22, X2n2 una muestra aleatoria de n2 observaciones tomada de
la segunda poblacin con valor esperado 2 y varianza s
2. Si son las medias mustrales, la estadstica es un estimador puntual de 1 -
2, y tiene una distribucin normal si las dos poblaciones son normales, o
aproximadamente normal si cumple con las condiciones del teorema del lmite
central (tamaos de muestras relativamente grandes). Es decir, Por lo tanto,
Para calcular el intervalo de confianza para la diferencia de dos medias se
debe saber si las varianzas poblacionales son conocidas o desconocidas, y en
caso de que sean desconocidas, se debe probar si son iguales o diferentes.
Cada uno de estos tres casos se analizar por separado
Varianzas conocidas
Si las varianzas poblacionales son conocidas, los pasos a seguir para encontrar
el intervalo de confianza son los siguientes:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 -
2 ser T =, que es un estimador suficiente b) La variable aleatoria asociada
con el estimador ser la variable normal estndar dada por:
c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente
probabilidad:
Manipulando la expresin anterior en forma similar a como se hizo en los
casos de una sola muestra se llega al siguiente teorema que nos define el
intervalo de confianza para la diferencia entre dos medias 1 - 2 con
varianzas conocidas s1 y s 2.
Teorema. Si son las medias de dos muestras aleatorias independientes de tamao n1 y n2
tomadas de poblaciones que tienen varianzas conocidas s1 y s2, respectivamente, entonces
un intervalo de confianza del 100(1-a)% para 1 - 2.

Ejemplo
Construya un intervalo de confianza del 94% para la diferencia real entre las
duraciones de dos marcas de bombillos, si una muestra de 40 bombillos
tomada al azar de la primera marca dio una duracin media de 418 horas, y
una muestra de 50 bombillos de otra marca dieron una duracin media de 402
horas. Las desviaciones estndares de las dos poblaciones son 26 horas y 22
horas, respectivamente.
Solucin. Tenemos que:, , s1 = 26, s2 = 22, n1 = 40, n2 = 50, Z0.03 = 1.88. El
intervalo de confianza es, entonces:
El hecho de que ambos lmites sean positivos, y por lo tanto no contengan el
valor cero indican que ambas marcas no tienen la misma duracin media, y
sugiere que pueda pensarse que la primera marca de bombillos tenga una
duracin media superior a la segunda.
Varianzas desconocidas e iguales (= =)
Cuando las varianzas son desconocidas, se debe realizar previamente una
prueba estadstica para verificar si stas son iguales o diferentes. Para
realizarlo debemos hacer uso de la distribucin F, bien sea mediante el clculo
de la probabilidad de que la muestra tomada provenga de dos poblaciones con
varianzas iguales, o mediante el uso de un intervalo de confianza para la
relacin de dos varianzas, segn se estudiar ms adelante.
Si mediante el uso de la distribucin F se llega a la conclusin de que las
varianzas son iguales, el procedimiento a seguir para el clculo del intervalo
de confianza para la diferencia de dos medias ser el siguiente:
a) El estadstico usado como estimador puntual de la diferencia de medias 1 -
2 ser T =, que es un estimador suficiente.
b) La variable aleatoria asociada con el estimador ser la variable T definida
como: donde es un estimador combinado de s, mejor que por separado, y
c) Para calcular el intervalo de confianza se debe tener en cuenta la siguiente
probabilidad:
De nuevo, manipulando la expresin anterior en forma similar a los casos se
llega al siguiente teorema que nos define el intervalo de confianza para la
diferencia entre dos medias 1 - 2 con varianzas desconocidas s1 y s 2, pero
iguales.
CONCLUSIONES

El anlisis de los resultados del presente trabajo conduce a enunciar las
siguientes conclusiones derivadas del proceso de investigacin:
Que la estadstica como ciencia nos ayuda en la recoleccin, anlisis e
interpretacin de datos, ya sea para ayudar en la toma de decisiones o para
explicar condiciones regulares o irregulares de algn fenmeno o estudio
aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo
estadstica es ms que eso, en otras palabras es el vehculo que permite llevar
a cabo el proceso relacionado con la investigacin cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta las
ciencias sociales, desde las ciencias de la salud hasta el control de calidad. Se
usa para la toma de decisiones en reas de negocios o instituciones
gubernamentales.
La estadstica se divide en dos grandes reas:
La estadstica descriptiva, se dedica a los mtodos de recoleccin,
descripcin, visualizacin y resumen de datos originados a partir de los
fenmenos de estudio. Los datos pueden ser resumidos numrica o
grficamente. Ejemplos bsicos de parmetros estadsticos son: la
media y la desviacin estndar. Algunos ejemplos grficos son:
histograma, pirmide poblacional, clsters, entre otros.
La estadstica inferencial, se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin
teniendo en cuenta la aleatoriedad de las observaciones. Se usa para
modelar patrones en los datos y extraer inferencias acerca de la
poblacin bajo estudio. Estas inferencias pueden tomar la forma de
respuestas a preguntas si/no (prueba de hiptesis), estimaciones de
caractersticas numricas (estimacin), pronsticos de futuras
observaciones, descripciones de asociacin (correlacin) o
modelamiento de relaciones entre variables (anlisis de regresin).
Otras tcnicas de modelamiento incluyen anova, series de tiempo y
minera de datos.

Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada.
Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a
las bases tericas de la materia. La palabra estadsticas tambin se refiere al
resultado de aplicar un algoritmo estadstico a un conjunto de datos, como en
estadsticas econmicas, estadsticas criminales, entre otros.

Bibliografa
http://es.wikipedia.org/wiki/Estad%C3%ADstica
http://www.ucm.es/info/genetica/Estadistica/estadistica_basica.htm
http://webdelprofesor.ula.ve/arquitectura/jorgem/principal/guias/cap3.pdf
http://www.monografias.com/trabajos11/tebas/tebas.shtml
http://www.itch.edu.mx/academic/industrial/estadistica1/cap01c.html
http://www.uam.es/personal_pdi/psicologia/carmenx/EsquemaTema21b.pdf
http://www.mitecnologico.com/Main/DistribucionMuestralDeLaVarianza
http://colposfesz.galeon.com/inferencia/teoria/estima.htm
http://es.wikipedia.org/wiki/M%C3%A1xima_verosimilitud
http://es.wikipedia.org/wiki/Intervalo_de_confianza
http://www.ub.edu/stat/GrupsInnovacio/Statmedia/demo/Temas/Capitulo8/B0
C8m1t16.htm

Das könnte Ihnen auch gefallen