Sie sind auf Seite 1von 115

Captulo : DISTRIBUCIONES DE PROBABILIDAD

1.1 Definicin general


En lecciones anteriores se estudiaron probabilidades de eventos asociados a los
resultados fsicos del espacio muestral . Por ejemplo cuando se lanza una moneda 2
veces se obtiene como espacio muestral

y un evento de inters es

ocurrir una cara

cuyos elementos son

. este evento tiene como probabilidad

En la prctica resulta de mayor inters el estudio de eventos tales como:


A: ``nmero de caras que ocurren al lanzar dos monedas''
Similarmente, si dos personas empiezan a caminar desde el mismo punto al mismo
tiempo a lo largo de lneas perpendiculares, entonces el espacio muestral es el conjunto
de pares ordenados de nmeros reales
distancias desde el punto de inicio

Ahora si

positivos

correspondientes a sus

representan sus velocidades en kilmetros por hora y si estamos

interesados en la distancia
aleatoria de inters es

entre los dos despus de horas, entonces la variable

As, para todo punto (resultado del espacio muestral)


nmero real positivo

en

se puede asignar un

que representa la distancia entre las dos personas

despues de horas.
En ambos ejemplos estamos interesados no en la ocurrencia de un elemento
espacio muestral

sino en en algun nmero real asignado a

Frecuentemente el resultado

es en s mismo un nmero real.

del

1.1.1Definicin
Sea

un espacio muestral con una clase de eventos

elemento

un nmero real

. cualquier regla que asigna a cada

es llamada variable aleatoria.

El concepto de variable aleatoria (v.a.) proporciona un medio para relacionar cualquier


resultado de un experimento aleatorio con una medida cuantitativa, lo cual significa que
a cada elemento de un espacio muestral se le asigna un valor sobre la recta de los reales.
Nota 1.

Suponiendo que
aleatoria)

es una variable aleatoria sobre

Entonces la funcin (o variable

toma valores sobre la recta real, y as se induce otro espacio muestral


que puede ser tomado como

. En este caso es un caso

de espacio muestral no contable


Cales son los eventos en el espacio muestral

?.

Todos los subconjuntos de un solo punto y todos los intervalos (cerrados, abiertos, o
semicerrados) son eventos. Tambin uniones, diferencias e intersecciones de intervalos.
Cal es la
La

lgebra asociada al espacio muestral

lgebra asociada al espacio muestral

conformada por todos los subconjuntos

es la llamada

. Esta

lgebra es generada por la

coleccin de todos los intervalos semicerrados de la forma


Los conjuntos de

lgebra de Borel
y es denotada por

son llamados conjuntos de Borel.

Nota 2.

Las variables aleatorias ser denotadas con letras maysculas


valor

asignado por

, ,U,V,W, etc. El

ser denotado por . Esto es, se escribira por

Ejemplo 1
Nmero de hijos en una familia, nmero de cuartos en una casa, el ingreso de una
familia, el tiempo de duracin de una pieza de un equipo, el nmero de errores en un
pgina de un libro, la corriente elctrica que pasa por un punto dado.

Ejemplo 2

Un dado es lanzado una vez. En este caso el espacio muestral es


oberva que la ejecucin es un nmero real. Se define la variable aleatoria

la cual asigna a cada elemento del espacio muestral


muestra de manera explicita a continuacin:

. Se
como:

un nmero real

como se

2
3
4
5
6

Luegos se dice que la variable aleatoria toma valores


Ahora otra variable aleatoria para este experimento se definira como:

entonces

toma los valores

Ejemplo 3
Un dado es lanzado dos veces, entonces
Algunas variables aleatorias que se podran definir son:

El rango o los valores que toman las anteriores variables son respectivamente:

OTRA DEFINICION DE VARFIABLE ALEATORIA


Sea

un espacio muestral y

proyecta

en

la

lgebra asociada Una funcin de valor real que

es llamada variable aleatoria si la imagen inversa bajo

conjunto de Borel en

son eventos, esto es,

Determinar si una funcin

es una variable aleatoria por la definicin no es

fcil ya que se tendria que probar que la imagen inversa bajo


Borel en

de todo

de todo conjunto de

. Por ello se recomienda aplicar el siguiente teorema

Teorema
es una variable aleatoria si y solo si para cada

Ejemplo 1
Sea el experimento: lanzar una moneda, entonces el espacio muestral es
sea

lgebra

de

todos

los

subconjuntos

. Defina la variable aleatoria

de

como

y
dada

por

Entonces

luego para
lgebra

la imgen inversa

es siempre un conjunto de la

Ejemplo 2
Sea el experimento: lanzar dos monedas, entonces el espacio muestral es
y sea
la variable aleatoria

lgebra de todos los subconjuntos de

. Defina

como

nmero de caras

en

Entonces

luego para
lgebra

la imgen inversa

es siempre un conjunto de la

Ejercicios
1. Sea

el nmero de caras al lanzar tres monedas.

a. Determine el espacio muestral


b. Escriba los valores que

asigna a los elementos de

c. Escriba los elementos del evento


d. Escriba los elementos del evento
2. Un dado es lanzado dos veces. Sea
absoluto de la diferencia en las caras.

la suma de los valores de las caras , y

el valor

a. Determine el espacio muestral


b. Escriba los valores que

asigna a los elementos de

c. Escriba los valores que

asigna a los elementos de

d. Chequear si

es una variable aleatoria

e. Chequear si es una variable aleatoria


f. Otra definicin de variable aleatoria

1.2 Caso Discreto


Definicin
Una variable aleatoria (v.a.)
contable (finito o infinito).

es discreta si los valores que asigna forman un conjunto

Ejemplo

Sea el nmero de caras al lanzar dos monedas. Los valores que asigna son
el cual es un conjunto contable (finito).

Funcin de Probabilidad
Sea una variable discreta. La coleccin de nmeros
propiedades:

que satisface las

Se llamar una funcin de probabilidad o funcin de masa de probabilidad de la variable


aleatoria discreta

Ejemplo de 2 dados

Se realiza el siguiente experimento: se lanzan dos dados, uno rojo y otro azul.
El espacio muestral para este experimento es:

En una funcin de probabilidad sobre una sigma lgebra asociada al espacio muestral
es dada por:
:

donde

es definida como

Explicacin: Esta es una de las maneras de definir una funcin de probabilidad sobre la
sigma lgebra. En este caso debido a que el espacio muestral es finito, se define la
funcin de probabilidad para cada elemento de

Sea la variable aleatoria

que representa la suma de los nmeros obtenidos en las caras,

entonces la variable aleatoria


espacio muestral

como:

asigna nmeros reales a cada uno de los elementos de

como se muestra Aqu

De esta manera se dice que la variable aleatoria

La funcin de probabilidad para la variable


continuacin:

toma los valores

se determina como se muestra a

El valor

se obtiene de la funcin de probabilidad definida sobre la sigma lgebra

que fu denotado anteriormente como


Explicacin: Observe que la letra
variable aleatoria
muestral.

y la letra

representa l aprobabilidad de un evento para la

representa la probabilidad para un elemento del espacio

Anlogamente la probabilidad para los otros valores de la variable se presenta en la


siguiente tabla:
Probabilidad
=
=
=

Para poder observar mejor el comportamiento de la distribucin de la probabilidad de la


variable observe la figura que se presenta a continuacin.

En la grfica se observa que la distribucin de probabilidad es simtrica esto implica


que las medidas de tendencia: Media Aritmtica, Mediana y La moda , son iguales. La
manera de calcular estas medidas se estudia en la leccin Valor esperado. Observe que
lo ms probable que puede ocurrir al lanzar dos es que la suma de las caras sea 7.

Funcin de Probabilidad Acumulada


La funcin distribucin acumulada
distribucin de probabilidad es
o igual al valor

de la variable aleatoria discreta


, es la probabilidad de que la variable

, cuya
sea menor

Esto es,

Ejemplo

Para el ejemplo tratado anteriormente, La funcin distribucin acumulada


variable aleatoria discreta

de la

es determinada as:

1. Divida el rango de la variable en subintervalos:


y
. Esta
divisin es realizada de acuerdo a la particin de la recta real dada en la funcin de
probabilidad.

2. Calcule la funcin de probabilidad acumulada para un un valor que se encuentre en


el intervalo como la suma de las probabilidades de los valores de la variable menores a
.

ya que segn la definicin de la funcin de probabilidad


como es en este caso.

Luego La funcin distribucin acumulada


dada por

cuando

de la variable aleatoria discreta

es

Mas ejemplos
EJEMPLOS 1
Se extraen dos pelotas de una urna que contiene 4 pelotas rojas

R y 3 blancas (B).

Determine una funcin de probabilidad para la variable aleatoria


nmero de pelotas rojas para los casos siguientes:

que cuenta el

a. Cuando una pelota se extrae y se devuelve a la urna. (con reemplazamiento)


b. Cuando una pelota se extrae y no se devuelve a la urna. (sin reemplazamiento)

Solucin.
Los elementos del espacio muestral en este experimento son:

a.La funcin de probabilidad asociada con ese espacio muestral es:

La asignacin de las probabilidades es as:


Para el caso de

, al extraer la primera pelota, la probabilidad de que sea roja es

y como la pelota se regresa de nuevo a la urna, la probabilidad de que la segunda


pelota salga blanca es ya que hay 3 pelotas blancas entre las 7 de la urna. Un
razonamiento anlogo permite determinar los otros valores de probabilidad.
La variable aleatoria

es dada por:

1
2
0

As, los valores que toma la variable

son:

y la distribucin de probabilidad, para este caso en el que se hace con reemplazamiento


Los resultados posibles y los valores de la variable aleatoria Y, donde Y es el nmero
de pelotas rojas, son:

El evento

para la variable aleatoria

se obtiene cuando ocurre la interseccin de

los dos eventos


Sacar una pelota blanca en la primera extraccin y
Sacar
una pelota blanca en la segunda extraccin. Estos eventos estn dados explicitamente
por:
B,R

B,B

R,B

B,B

R,B

B,B

la interseccin es dada por:


B,R

B,B

luego el eveto mpara la variable aleatoria


as:

donde las probabilidades

B,B
es equivalente al evento

son obtenidas con la funcin de probabilidad

definida sobre la sigma lgebra como se mostr anteriormente. Asi:

y por ser

luego
Por tanto

B,B ,

una funcin de probabilidad, se cumple que

Un razonamiento anlogo nos permite llegar a que

Una manera ms sencilla de obtener el resultado anterior es conociendo que en este caso
la variable aleatoria se distribuye binomial , en donde

y as:

haciendo

un

razonamiento

similar

al

de

0
1
2
El grfico de esta funcin de probabilidad aparece en la figura.

b. Para el caso sin reemplazamiento, defina a

como:

se

obtiene

que

y proceda de una manera similar a la anterior, pero utilizando las probabilidades


anteriores para obtener los valores de la variable aleatoria, con lo cual llegara a que

0
1
2
2. El espacio muestral de un experimento aleatorio es
,y
cada resultado es igualmente probable. Se define una variable aleatoria de la siguiente
manera

1. Determine la funcin de probabilidad de x, hacer grfico.

2. Determinar las siguientes probabilidades

3 El espacio muestral de un experimento aleatorio es


, y cada resultado
es igualmente probable. Se define una variable aleatoria de la siguiente manera

b
c

1.5

d
e

La funcin de probabilidad acumulada para la variable aleatoria

es

Ejercicio 1
Verifique que la siguiente funcin es funcin de probabilidad y calcule las
probabilidades pedidas.
x

-2 -1 0 1 2

f(x)
1.
2.
3.
4.

P( X/2)
P( X>-2)
P( -1/X/1)
P( X/-1/text o X=2)

Ejercicio 2

Un grupo de partes moldeadas se clasifica de acuerdo con su longitud, de la siguiente


manera.

1. Si la variable aleatoria es la longitud (redondeada a la dcima de milmetro


ms cercana) de una parte moldeada seleccionada al azar, determine la funcin
de probabilidad de

2. Cul es el valor de
3. Cul es el valor de
Ejercicio 3
Un ingeniero de control de calidad muestrea cinco piezas de un lote grande de
percutores fabricados y determina si tiene defectos. Aunque el inspector no lo sabe, tres
de los cinco percutores muestreados tiene defectos. El ingeniero prueba los cinco
percutores en un orden escogido al azar hasta que observa un percutor defectuoso (en
cuyo caso se rechazar todo el lote). Sea Y el nmero de percutores que debe probar el
ingeniero de control de calidad. Calcule y grafique la distribucin de probabilidad de Y.

1.3 Caso Continuo


Una variable

es llamada continua si toma todos sus valores sobre un intervalo de la

recta real. Esto es, el conjunto


es un intervalo sobre . Como
ejemplo este caso se pueden considerar variables tiempo, edad y estatura.
Funcin de Densidad

Sea

una variable aleatoria definida sobre

es dada por alguna funcin integrable sobre

La funcin de densidad
tal que

para todo evento


Teorema

Sea

una variable aleatoria definida sobre

integrable sobre

y satisface:

. Toda funcin

que es

es la funcin de densidad de alguna variable aleatoria continua

Este teorema nos sirve para determinar cuando una funcin integrable sobre
funcin de densidad de alguna variable aleatoria continua

es una

Ejemplo

Sea

una funcin sobre

dada por

Esta es una funcin integrable que satisface que


puede observar en la figura 1.

para todo

como se

Figura 1. Grfico de funcin de probabilidad


Adems

Sea el evento A=

entonces la probabilidad de A puede ser calculada como

Funcin de Densidad Acumulada

La funcin de probabilidad acumulada o funcin de distribucin de una variable


aleatoria

sobre

, denotada por

, es definida por la relacin

Ejemplo

para el ejemplo tratado anteriormente la funcin de distribucin es determinada como


sigue:
1. Divida el rango de la variable en subintervalos:

. esta divisin es realizada de acuerdo a la particin de la recta real dada en la


funcin de probabilidad. cambie la notacin de

por

para evitar confuciones.

2. Calcule la funcin de probabilidad acumulada para un un valor que se encuentre en


el intervalo como la suma de las probabilidades de los valores de la variable menores a
.

ya que segn la definicin de la funcin de probabilidad

cuando

Luego la funcin distribucin acumulada


dada por

de la variable aleatoria continua

es

y el grfico

es dado

Figura 2. Grfico de funcin de probabilidad acumulada

Sea el evento A=

entonces la probabilidad de A puede ser calculada como

Teorema
Sea

una funcin de distribucin. Entonces


para todo
as F es no decreciente
para todo
derecha

lm
lm

F es continua a la

y lm

Ejemplo

Sea

una variable aleatoria con funcin de distribucin acumulada dada por (Figura 3)

Construir la Figura 3. Grfico de funcin de probabilidad

Diferenciando

La funcin

con respecto a se tiene

no es continua en

, o en

Mas ejemplos
Ejemplo 1

El error en la temperatura de reaccin, en grados centgrados, para un cierto


experimento controlado de laboratorio es una variable aleatoria continua
funcin de densidad de probabilidad:

Construir grafico y probar que es funcin de probabilidad.

, que tiene la

Ejercicio 1

El nmero total de horas, medidas en unidades de 100 horas, que una familia utiliza una
aspiradora en un periodo de un ao es una variable aleatoria continua
funcin de densidad

que tiene la

Encuentre la probabilidad de que en un periodo de un ao, una familia utilice su


aspiradora
a. menos de 120 horas
b. entre 50 y 100 horas
Ejercicio 2

Sea c una constante y consideremos la funcin de densidad

a. Calcule el valor de .
b. Obtenga la funcin de distribucin acumulativa
c. Calcule
d. Calcule
Ejercicio

1.4 Valor Esperado


Los promedios son parte de nuestro diario vivir. Nosotros escuchamos el promedio de
lluvia en una ciudad en un ao, el promedio de temperatura en Agosto, el promedio de
edad de los trabajadores de una empresa, entre otros. El objetivo de esta seccion es
mostrar algunas caractersticas numricas de una distribucin poblacional. El ms
comun promedio utilizado en estadstica es la media o valor esperado o esperanza
matemtica.
Sea
defina

una variable aleaoria definida sobre


por

y sea una funcin real definida sobre

1.4.1 Caso discreto


Suponga que

es una variable aleatoria es discreta. Si


, entonces se define la media de

de

o el valor esperado

por

1.4.2 Caso continuo


Suponga que

es una variable aleatoria continua y la funcin de densidad de


, entonces se define la media de

. Si

o el valor esperado de

por

Mas ejemplos
Ejemplo 1

Un jugador tiene tres oportunidades de lanzar una moneda normal y obtener cara, si cae
cara la 1ra vez el jugador gana $2, si cae cara la 2da vez gana $4 y si cae cara en la 3ra
vez gana $8, el juego termina en el momento en que cae una cara o despus de tres
intentos. Si no cae cara en los tres lanzamientos pierde $20.
Cul es la esperanza de ganancia o perdida en el juego?
La probabilidad de que en la 1ra ocasin salga cara es
La probabilidad de que en la 2ra ocasin salga cara es
La probabilidad de que en la 3ra ocasin salga cara es
La probabilidad de que no salga ninguna cara en los tres lanzamientos es

As, el jugador esperar ganar luego de muchos juegos $0.5. Cabe notar que 50 centavos
no es ninguno de los posibles valores de la variable aleatoria, as, es completamente
posible que una variable aleatoria nunca tome el valor de su esperanza.
Ejemplo 2

Suponga que el nmero de autos que pasa por un lavado de autos entre 4:00 p.m. y
5:00 pm en cualquier viernes soleado tiene la siguiente distribucin de probabilidad:

Sea
la cantidad de dinero en dlares, que el administrador paga al
dependiente. Encuentre las ganancias esperadas del dependiente en este periodo
particular.
Solucin:

Ejemplo 3

Sea la variable aleatoria continua el dimetro de un agujero taladrado en una placa de


metal. El dimetro requerido es 12.5 milmetros, pero muchas perturbaciones aleatorias
en el proceso dan como resultado dimetros ms grandes. La recopilacin de datos
indica que la distribucin de
probabilidad
?, Cul es su varianza?

puede modelarse con la funcin de densidad de


Cul es el valor esperado de la

Ejercicios
Ejercicio 1

En un estudio de exploracin petrolera Kinchen (1986) cita un ejemplo en el que un


presupuesto de exploracin de 50.000 dlares se asigna a un solo prospecto. El
resultado puede ser un pozo seco, 50.000 barriles (bbl), 100.000 bbl, 500.000 bbl o
1.000.000 bbl, con las probabilidades y resultados monetarios que se muestran en la
tabla. Sea

el valor monetario de un solo prospecto petrolero. Calcule

1. Calcule la media y la desviacin estndar de la longitud del cable.


2. Si las especificaciones para la longitud son
milmetros,Qu
valor de la media da la mayor proporcin de cables que cumplen con las
especificaciones?
Ejercicio 3

Demostrar las caractersticas de las medias y las varianzas (del 1 al 5).


EJERCICIOS PROPUESTOS
1. (Ejercicio 3.22 Montgomery) Una persona pide prestado un llavero con cinco llaves,
y no sabe cul es la que abre un candado. Por tanto, intenta con cada llave hasta que
consigue abrirlo. Sea la variable aleatoria

el nmero de intentos necesarios para abrir

el candado. Determine la funcin de probabilidad de

Cul es el valor de

Cul es el valor de

Cul es el valor de

2. (Ejercicio 3.26 Montgomery). Determine la funcin de distribucin acumulada para


la variable aleatoria del ejercicio 1; asimismo, calcule las probabilidades siguientes:

3. (Ejercicio 3.36 Montgomery). Si el rango de

es el conjunto

, determine la media y la varianza de la variable aleatoria.


(Ejercicio 5.13 Mendenhall) Investigadores de la University of Rochester estudiaron la
friccin que ocurre en el proceso de alimentacin de papel de una fotocopiadora
(Journal of Engineering for Industry, mayo de 1993). El coeficiente de friccin es una
proporcin que mide el grado de friccin entre dos hojas de papel adyacente en la pila
de alimentacin. En un experimento se utiliz una distribucin triangular para modelar
el coeficiente de friccin. La funcin de densidad para la distribucin de friccin
triangular est dada por:

f(y)=

Demuestre que
Calcule la media de la distribucin de friccin triangular.
Calcule la varianza de la distribucin de friccin triangular.

1.5 Distribuciones de variables aleatorias discretas


1.5.1 Distribucin Uniforme
Notacin:

X UD(

Definicin
Es la ms simple de todas las distribuciones modelo y en ella la variable aleatoria asume cada
uno de los valores con una probabilidad idntica.

" Sea la variable aleatoria X que puede asumir valores


con idntica
probabilidad. Entonces la distribucin uniforme discreta viene dada por:

O sea que el parmetro clave en esta distribucin es =nmero de valores que asume la
variable aleatoria X y que sera un parmetro de conto.
As por ejemplo cuando se lanza un dado correcto, cada una de las seis caras posibles
conforman el espacio muestral:
La v.a X: nmero de
puntos en la cara superior del dado tiene una distribucin de probabilidad Uniforme
discreta, puesto que:
=

para
en otro caso.

La representacin grfica de esta distribucin de probabilidad puede hacerse con un


histograma para v.a. discreta,

es en este caso la altura de

Planteemos sus caractersticas principales de tendencia central y dispersin.


El valor esperado y varianza de una distribucin discreta uniforme se obtienen as:
Valor esperado (

Varianza (

Para el caso del lanzamiento del dado: el valor esperado y la varianza del nmero de
puntos en la cara superior son:

Ejercicio

(Walpole, pg 122) Seleccin de un empleado entre equipo de 10 con el fin de


supervisar un proyecto especifico. Esa seleccin se hace al azar utilizando papeleta con
nmeros.
a- Cul es la probabilidad de que el nmero de la papeleta seleccionado sea menor de 4?
(
b- Cul es la media y la varianza de la distribucin de probabilidad del nmero de la
papeleta.?

1.5.2 Distribucin Multinomial


Notacin:

Definicin
Es una distribucin de probabilidad conjunta para mltiples variables aleatorias (
discretas donde cada
, dndose cuando en cada prueba
ensayo independiente (con reposicin) del E.A. interesa contar el nmero de exitos en
cada una de la k maneras como se puede dar un atributo.
Ejemplo

El atributo calidad de un producto se puede dar como: Excelente, bueno, regular y malo.

icas:

1. Son

pruebas ensayos repetidos e idnticos (con reposicin).

2. En cada prueba ensayo se pueden producir resultados.


3. Las probabilidadeds de cada uno de los resultados
constantes en todas las pruebas ensayos.

permanecen

4. Son pruebas ensayos independientes.


5. El interes se centra en contar los

xitos que se producen en los

ensayos de cada una de las categorias posibles de observar cada vez.


Si una prueba intento puede dar cualquiera de los resultados posibles
con probabilidades
probabilidad de que:

, entonces la distribucin multinomial dara la

En pruebas independientes.
y donde:

Como son pruebas independientes, cualquier orden especfico que produzca

ocurrir con

de probabilidad.

El nmero de ordenes arreglos que pueden producir resultados similares ser:

Combinando los dos componentes, se tiene entonces que:

Con

Ejemplo

Se sabe que las bombas de gasolina para autos existentes en el mercado se pueden
clasificar en:
de rendimiento excelente
de rendimiento bueno

.
.

de rendimiento regular
de rendimiento malo
Se selecciona una muestra de

.
.
bombas mediante proceso aleatorio. Cal sera la

probabilidad de que quede conformada por:

Ejercicio
(Walpole, pag 123)
Un estudiante que va a la universidad en carro encuentra un semforo, el cual
permanece en verde durante 35 segundos, en amarillo 5 segundos y en rojo 60
segundos. Su viaje a la universidad es entre 8:00 y 8:30 AM en la semana de 6 dias
hbiles. Sea
amarilla y

el nmero de veces que encuentra el semaforo en verde,


en luz roja. Hallar la distribucin conjunta de

1.5.3 Variable Aleatoria Bernoull


Experimento Bernoulli

en luz
.

Las caractersticas de un experimento aleatorio Bernoulli son:


1.El experimento tiene solamente dos posibles resultados mutuamente excluyente
denominados xito (E) y fracaso (F). de esta manera el espacio muestral es dado por

2.La probabilidad de xito y fracaso son constantes y se denotan por

respectivamente

Variable aleatoria Bernoulli y su funcin de probabilidad


Una variable aleatoria Bernoulli
Bernoulli

se define como el resultado numrico de una prueba

o de manera formal como una funcin

xito

y as el rango de la variable aleatoria es

, el cual es denotado como

.
Una variable aleatoria de Bernoulli, por s sola, tiene poco inters en las aplicaciones de
ingeniera. En cambio la realizacin de una serie de experimentos bernhoulli conduce a
varias distribuciones de probabilidad discretas muy tiles.
La funcin de probabilidad de una variable bernoulli es dada por

donde
es la probabilidad de xito en una sola prueba.
es el nmero de xitos en la prueba.
El parmetro es

Media y Varianza
La media y varianza de una variable aleatoria bernoulli son respectivamente

Ejemplo
El experimento de seleccionar un producto y observar si tiene defectos o no.
Aqui se puede definir ser defectuoso como el xito y no ser defectuoso como el fracaso.

Media y Varianza de la distribucin bernoulli


La media y varianza de una variable aleatoria bernoulli son respectivamente

1.5.4 Distribucin Binomial


Notacin:

Definicin

Es una de las distribuciones de probabilidad ms tiles ( control de calidad, produccin,


investigacin). Tiene que ver con el experimento aleatorio que produce en cada ensayo
o prueba uno de dos resultados posibles mutuamente excluyentes: ocurrencia de un
criterio o caracterstica especfico (llamado xito) y no ocurrencia de ste (llamado
fracaso). Los trminos o calificativos de "xito y fracaso" son solo etiqutas y su
interpretacin puede no corresponder con el resultado positivo o negativo de un
experimento en la realidad.
Ejemplo
xito podra ser hallar en un ensayo especfico que la unidad es defectuosa al examinarla. Cada
experimento aleatorio consiste en una serie de ensayos o pruebas repetidas realizadas en
idnticas condiciones (

veces), o sea que cada uno de ellos es independiente de los dems.

Sea la probabilidad de xito cada vez que el experimento se realiza y


la
probabilidad de fracaso. Sea X la variable aleatoria que representa el nmero de xitos
en los

ensayos o pruebas. El inters se centra en conocer la probabilidad de obtener

exactamente xitos en esos

ensayos.

Criterios o propiedades para definir la Distribucin Binomial


Resumiendo, podemos definir estos criterios:
1- El experimento aleatorio consiste en ensayos o pruebas repetidas, e idnticas y
fijadas antes del experimento (pruebas de Bernoulli). Son pruebas con reemplazamiento
o con reposicin.
2- Cada uno de los ensayos o pruebas arroja solo uno de dos resultados posibles
resultados: xito fracaso.
3- La probabilidad del llamado xito (
ensayo o prueba.

, pemanece costante para cada

4- Cada prueba o ensayo se repite en idnticas condiciones y es independiente de las


dems.
Cuando estas propiedades se cumplen en el experimento aleatorio se dice que el
constituye un proceso de Bernoulli y cada uno de los ensayos que lo conforman se llama
experimento de Bernoulli.
5. El inters recae en hallar la probabilidad de obtener nmero de xitos al realizar
ensayos del mismo E.A.
La funcin de probabilidad de X en esas condiciones ser:

Para

entero y

Planteamiento Bsico
Supongamos un proceso productivo en serie de una misma unidad metalmecnica y en
l que: Probabilidad de una unidad defectuosa :
defectuosa:

y probabilidad de unidad no

Supongamos que el inters est en evaluar el proceso mediante una muestra aleatoria de
4 unidades y por tanto se define la v.a X como el nmero de unidades defectuosas en la
muestra. Para garantizar que los ensayos resulten independientes hacemos la seleccin
con reemplazamiento o sustitucin.

Supongamos que centramos nuestro interes en

unidad defectuosa en las cuatro

pruebas o ensayos. Sea B=bueno y D= defectuoso. Por lo tanto el


por 16 resultados posibles

esta conformado

.....
Se puede entonces notar que los eventos favorables a

constiuyen el subconjunto

. Como no importa el orden de aparicin de


la unidad defectuosa sino que aparezca exactamente una unidad con esa caracterstica
tenemos:

o sea:
para cada posible resultado de una unidad defectuosa
Como son cuatro resultados los que satisfacen el inters especfico de una unidad
defectuosa entonces

Si generalizamos:

donde:

como xitos se producen dentro de los

ensayos;

son las distintas maneras


es la probabilidad de

xitos en cada una de las maneras distintas de producirse los xitos .


Para el caso del ejemplo:
Consideremos el caso ya no de
asumir X en las cuatro pruebas.

defectuoso; sino todos los valores que puede

Como son 4 ensayos y consideramos todos los posibles valores de


entonces la
Los valores de
se pueden calcular por medios electrnicos utilizando las tablas de
la distribucin binomial que proporcionan la solucin de estas operaciones, a veces
largas o laboriosas.
Con los resultados de esos clculos podemos construir la tabla de distribucin de
probabilidades, hacer su grfica y definir sus principales caractersticas.
Tomemos como ejemplo la distribucin binomial de parmetros

Caractersticas de la distribucin binomial.


Tendencia central:

aplicando la definicin

de valor esperado se obtiene que para esta distribucin :


Dispersin variacin:

lo que conduce a que una v.a. binomial X tiene como varianza


Por lo tanto su desviacin estandar:

Asimetria deformacon (Forma): con base en la razn entre los momentos centrales
de orden dos y tres como quedo definido antes:

sobre la base de que si:

Generalmente la distribucin binomial es sesgada asimetrica hacia la derecha, sesgo


que se va perdiendo cuanto ms grande sea el valor de
en que se acerque a
simtrica

(por lo tanto

tienda a

(# de pruebas) y en la medida
), limite en el cual se torna

Para el caso considerado y utilizando tanto la metodologa tradicional de la definicin


de conceptos como usando las frmulas simplificadas, tenemos:

Total

; tambien
;

Su funcin de distribucin acumulada sera:

Ejemplo
Una empresa adopt un proceso de control ded calidad consistente en diariamente
seleccionar al azar 20 unidadeds del total producido y conocer el nmero de unidades
defectuosas. El plan establece que si al examinar diariamente las veinte unidades, tres mas
salen defectuosas, algo esta pasando y se ordena detener el proceso productivo para buscar la
falla. Cal es la probabilidad de que se ordene parar el proceso productivo si se sabe por
experiencia que la probabilidad de una unidad defectuosa es 10%?

Se pide:
La solucin ms corta para este planteamiento sera entonces:

o sea
que sera la probabilidad de que cualquier dia se ordene parar el proceso de produccin
segn el planteamiento de control del mismo.
Si consideramos las caractersticas, tenemos:
Valor esperado

unidades defectuosas.

Varianza
Valores que como es lgico tambien pueden ser hallados por el mtodo tradicional.
Si se hace la grafica para determinar la forma (aunque se deduce que como
ser sesgada a la derecha). Veremos sin embargo que dado
como en el caso del otro ejemplo tratado aqui.

Si se hace crecer

, por ejemplo, hasta

tendiendo hacia una normal a pesar de que

, todava se torna ms simtrica,


no sea tan cercano a

cero ( ) de uno ( ). En la prctica, si


de (

, no es tan sesgada

pero si alejado de

ir tornandose simtrica para valores

Se puede obtener la funcin de distribucin acumulada y obtener asi los cuantiles


fractiles de la distribucin.
La siguiente figura muestra tres funciones de distribucin binomial con
valores

La A con

de

es ligeramente sesgada a la derecha con sesgo positivo. La B con


es simetrica y la C con

tendra sesgo negativo, interpretaciones

que resultan consecuentes con el indice de sesgo


Ejercicios

ya planteado.

1. Una empresa fabricante de neumticos para tractomulas realiza pruebas de


ponchaduras en un terreno difcil. Se encuentra que el
de los neumticos probados
presentaron pinchazo en el recorrido total. Se prueban 15 neumticos ms tomados al
azar: Halle la probabilidad de las siguientes cantidades de neumticos con pinchaduras :
Entre 3 a 6 .
Mas de 5 .

1.5.5 Distribucin Hipergeomtrica


Notacin:

Definicin
Muchas veces en la prctica es difcil realizar pruebas con reposicin
reemplazamiento. Por ejemplo, si en el control de calidad se pierde el elemento que se
prueba, pues no se puede hacer reposicin directamente. Se planta entonces la prueba
sin reposicin, donde los elementos de la muestra se toman todos a la vez y no
individualmente donde el elemento seleccionado no se reintegra al experimento a la
muestra nuevamente.
La diferencia mas simple con la binomial es la forma de aplicar el muestreo. En efecto,
en:
: Muestreo con reemplazamiento e independencia de pruebas ensayos.
: Muestreo sin reemplazamiento y sin independeencia entre pruebas
ensayos.
Sus aplicaciones estan en areas con uso considerable de muestreo de aceptacin,
pruebas electronicas y de aseguramiento de la calidad, fabricacin de piezas, etc.
Definicin
En la distribucin Hipergeomtrica
aleatoria (sin reposicin) de tamao

cantidad de resultados xitos en una muestra


, tomada de una poblacin de tamao

y de la

cual
satisface una caracteristica propiedad (xito) antes del muestreo y
satisface (fracaso).

no la

Criterios propiedades que la caracterizan.


1. La poblacin

del conjunto de unidades elementos es de orden fnito, de los

cuales una parte:

"son xitos", y otra parte:

son "fracasos".

2. Cada elemento puede ser caracterizado como xito fracaso.


3. Se obtiene una muestra aleatoria de elementos todos a la vez (sin
reemplazamiento) y no de forma independiente. No son pruebas repetidas.
4. El tamao de la muestra aleatoria

es grande relativamente en comparacin con

el tamao de la poblacin. Generalmente:


5. Se busca la probabilidad de
elementos y

nmero de xitos a partir de los

fracasos a partir de los

resultados

elementos asi clasificados, al

obtener una muestra aleatoria de tamao


Supongamos un lote de
Obtenemos muestra de

productos de los cuales:


productos, todos a la vez. Interesa entonces la probabilidad de

sacar productos defectuosos (Exito), o sea:


Planteado as el (E.A.) Podemos hacer el siguiente raciocinio:
De una poblacin de

elementos se pueden extraer muestras de tamo

diferentes (distintas muestras de tamao

de

formas

). Al extraer muestras de tamao

productos,

el nmero de formas de obtener productos defectuosos de

de ellos ser:

entonces

productos no defectuosos

entre

sera el nmero de formas de obtener

de ellos.

Como es el mismo evento compuesto, entonces el nmero de formas de seleccionar


productos defectuosos esta ligado con el nmero de formas de obtener
productos no defectuosos. Luego el total de formas posibles sera:

Combinando los casos

Los parmetros de la distribucin Hipergeomtrica son entonces:


Tamao de poblacin.
Nmero de elementos de

con una caracteristica propiedad especfica (xitos).

Tamao de muestra aleatoria extraida.


Nota: Algunos tratadistas simbolizan esta distribucin con:

Caractersticas de la Distribucin Hipergeomtrica.


En la practica, si

, no se aplica el

pues su valor tendera a cero

La funcin de distribucin acumulativa quedar definida entonces por:

Pueden ser calculos tediosos laborosos cuando


aplican la forma simplificada de recurrencia:

es grande. Por ello hay quienes

Ejemplo
En una empresa industrial diariamente se producen 90 unidades de unidad
metalmecnica, de las cuales generalmente 5 salen defectuosas. Se examina en un dia
cualquiera una muestra de 5 unidades. Hallar la probabilidad de unidades defectuosas.

para

que resolviendo permite definir la tabla de distribucin de probabilidad:

Si representamos grficamente la tabla resultante, tenemos:

Calculamos el valor de sus principales medidas caractersticas:


Media:

Que simplificadamente:

Varianza:
tambien.

y que an de forma mas simplificada:

Sesgo: Hacia la derecha positivo como se v graficamente. Adems, aqui:


pues

pues

1.5.7 Distribucin Poison


Notacin:
X

Introduccin
Llamada asi por su autor Simon Denis Poisson, probabilista del siglo XIX, pues fue el
primero en describirla. Es una generalizacin de la distribucin binomial cuando sobre
un
. se define una variable aleatoria que representa el nmero de xitos
independientes que ocurren para intervalos de medida especficos ( tiempos, lugares,
espacios) , ademas con una probabilidad de ocurrencia pequea.
Se le llama distribucin de los "eventos raros" pues se usa como aproximacin a la
binomial cuando el tamao de muestra es grande y la proporcin de xitos es pequea.

Esos intervalos de medida pueden referirse a: Tiempo: (Segundo , minuto, hora, dia,
semana, etc.) Area: (Segmento de linea, pulgada cuadrada, Centimetro cuadrado, etc).
Volumen:( Litro, galn, onza, etc.)
Ejemplo

Nmero de defectos por


.en piezas similares de un material ..
Nmero de personas que llegan a un taller automotriz en un lapso de tiempo
especfico.
Nmero de impulsos electrnicos errados transmitidos durante espacio de
tiempo especfico.
Nmero de llamadas telefnicas que ingresan a un conmutador por minuto.
Nmero de interrupciones en servicios de energa en intervalos de un dia.
Cantidad de tomos que se desintegran en sustancia radioactiva.
Nmero de accidentes automovilsticos en un cruce especfico durante una
semana.

Criterios propiedades
1. Se da un intervalo de medida que divide un todo de nmeros reales y donde el
conto de ocurrencias es aleatorio. Esa divisin puede ser un subintervalo de
medida.
2. El nmero de ocurrencias de resultados en el intervalo subintervalo de
medida, es independiente de los dems intervalos subintervalos. por eso se
dice que el proceso de Poisson no tiene memoria.
3. La probabilidad de que un solo resultado ocurra en un intervalo de medida muy
corto pequeo es la misma para todos los dems intervalos de igual tamao y
es proporcional a la longitud del mismo al tamao de medida.
4. La probabilidad de que ms de un resultado ocurra en un intervalo
subintervalo corto es tan pequea que se considera insignificante (cercana
igual a cero).
Procesos que se ajustan a estos criterios, se dice, son procesos de Poisson.
Definicin
Sea una variable aleatoria que representa el nmero de eventos aleatorios
independientes que ocurren con igual rapidez en un intervalo de medida. Se tiene
entonces que la funcin de probabilidad de esta variable, se expresa por:

Donde es parmetro de tendencia central de la distribucin y representa el nmero


promedio cantidad esperada de ocurrencias (xitos) del evento aleatorio por unidad de
medida por muestra;

Nmero de ocurrencias especificas para el

cual se desea conocer la probabilidad respectiva. Segun sea el valor de de


, se
define toda una familia de probabilidades de Poisson. La probabilidad de que una
variable aleatoria de Poisson sea menor igual a un valor de se halla por la funcin
de distribucin acumulativa, planteada entonces como:

Los resultados de las probabilidades individuales para valores de sern ms pequeos


conforme la variable aleatoria toma valores cada vez ms grandes.
Ejemplo
El nmero promedio de partculas radioactivas que registra un contador en un
milisegundo en la realizacin de un experimento aleatorio es de cinco (5) partculas.
Hallar la probabilidad de que se registre distinto nmero de partculas en un mismo
milisegundo.

Acudiendo a las tablas existentes para tal fn a los medios electrnicos, se llega a
construir la tabla de distribucin de probabilidades, dando:

y valores de ms grandes pero con probabilidad mas pequea. Se nota el punto de


inflexin entre

y no es tan sesgada a la derecha por el valor

Caractersticas de la distribucin de Poisson


Valor Esperado:

, el cual debe ser conocido.

Varianza:
Forma sesgo: Hacia la derecha con sesgo positivo y que se va perdiendo a medida
que crece. Veamos una grfica de funciones de probabilidad para diferentes valores de

Se puede calcular un coeficiente de asimetra mediante la expresin


observar que mientras en una distribucin binomial:

Es de

en Poisson se puede dar

que
Alternativa: Si se da la probabilidad de tener, de manera exacta, ocurrencias en un
intervalo veces mayor que el de refencia en la medicin entonces la distribucin de
probabilidades de Y nmero de xitos en la nueva unidad de referencia viene dada por

donde
y

Promedio de ocurrencias por intervalo unidad de medida considerada en X


Nmero de intervalos unidades de medida especificados.

Aqui

Ejemplo
El nmero de pulsos que llegan a un contador GEIGER se presentan en promedio de 6
pulsos por minuto. Hallar la probabilidad de que en 15 minutos se reciban exactamente
20 pulsos.

es decir, que una frecuencia de 6 pulsos por minuto es eqyivalente a una de 1


por

minutos.

1.6 Distribucin normal


Importancia de la distribucin normal
La distribucin normal es de suma importancia en estadstica por tres razones
principales:
1. Numerosas variables continuas de fenmenos aleatorios tienden a comportarse
probabilisticamente mediante sta.
2. Es el lmite al que convergen tanto variables aleatorias continuas como discretas.
3. Proporciona la base de la inferencia estadstica clsica debido a su relacin con
el teorema del lmite central.

Propiedades de la distribucin normal


1. Su grafica tiene forma acampanada.
2. El valor esperado, la mediana y la moda tienen el mismo valor cuando la
variable aleatoria se distribuye normalmente.
3. Su dispersin media es igual a 1.33 desviacines estndar. Es decir, el alcance
intercuartil est contenido dentro de un intervalo de dos tercios de una
desviacin estndar por debajo de la media a dos tercios de una desviacin
estndar por encima de la media.
En la prctica, algunas de las variables que observamos slo pueden aproximar estas
propiedades. As que si el fenmeno puede mediarse aproximadamente mediante la
distribucin normal se tendr:
1.
2.
3.
4.

Que el polgono puede verse en forma de campana y simtrico.


Sus mediciones de tendencia central tienen bastante parecido.
El valor intercuartil puede diferir ligeramente de 1.33 desviaciones estndar.
El dominio de la variable aleatoria normalmente distribuida generalmente caer
dentro de 3 desviaciones estndar por encima y por debajo de la media.

El modelo matemtico

El modelo o expresin matemtica que representa una funcin de densidad de


probabilidad se denota mediante el smbolo
la siguiente funcin de probabilidad.

. Para la distribucin normal, se tiene

donde
es la constante matemtica aproximada por 2.71828
es la constante matemtica aproximada por 3.14159

Parmetros
es cualquier valor de la variable aleatoria continua, donde
As,

A continuacin se presentan las grficas de las funciones de densidad Normal con el


objetivo de observar cambios en la distribucin de probabilidad:
caso 1:
Cuando se mantiene la misma media, pero cambia la varianza.
Ejemplo:

caso 2:
Cuando se mantiene la misma varianza, pero cambia la media.
Ejemplo: (

Ahora, al examinar la primera y segunda derivada de


propiedades de la curva normal:

, se pueden listar otras

1. La moda, que es el punto sobre el eje horizontal donde la curva es un mximo


ocurre cuando

2. La curva es simtrica alrededor de un eje vertical a travs del valor esperado


.
3. La curva tiene sus puntos de inflexin en

, es cncava hacia abajo

si
, y es cncava hacia arriba en cualquier otro punto.
4. La curva normal se aproxima al eje horizontal de manera asinttica conforme
nos alejamos de la media en cualquier direccin.
Haciendo una transformacin a la variable aleatoria normal

, sta se puede llevar a un

nuevo conjunto de observaciones de una variable aleatoria normal con media cero y
varianza 1. A dicha transformacin se le conoce como estadarizacin de la variable
aleatoria normal

Definicin
La distribucin de probabilidad de una variable aleatoria normal con media cero y
varianza 1 se llama distribucin normal estndar.
Funcin de Densidad
Normal (0,1)

Grfico 6.
En la distribucin normal estndar se sabe que las reas se distribuyen de la siguiente
manera:
Funcin de Densidad
Normal (0,1)

Manejo de tablas
La tabla anexa representa las probabilidades o reas bajo la curva normal calculadas
hasta los valores particulares de inters (Transformados). Al observar la tabla se
observa que todos los valores deben registrarse primero con hasta dos lugares
decimales. Por ejemplo, para leer el rea de probabilidad bajo la curva hasta
,
podemos recorrer hacia abajo la columna Z de la tabla hasta que ubiquemos el valor de
inters (en dcimas). As pues, nos detenemos en la fila
. A continuacin,
leemos esta fila hasta que intersecamos la columna que contiene el lugar de centsimas
del valor (
). Por tanto, en el cuerpo de la tabla, la probabilidad tabulada para
z=1.57 corresponde a la interseccin de la fila z=1.5 con la columna z=0.07 y es 0.9418.

Mtodos descriptivos para determinar la normalidad


En las siguientes clases se aprender a hacer inferencias acerca de la poblacin con base
en informacin de la muestra. Varias de estas tcnicas se basan en el supuesto de que la
poblacin presenta una distribucin normal aproximada. Por tanto, ser importante
determinar si los datos de la muestra provienen de una poblacin normal, antes de
aplicar dichas tcnicas.
Para determinar si los datos provienen de una distribucn aproximadamente normal, se
pueden considerar tres mtodos:
1. Construir en histograma de frecuencia relativa o bien un diagrama de tallos y
hojas para los datos. Si los datos son aproximadamente normales, la forma de la
grfica ser similar a la de la curva normal. (Con forma de joroba y simtrica
alrededor de la media.)

2. Calcular el rango intercuartlico (

) y la desviacin estndar ( ), para la

muestra, y luego calcular el cociente

. Si los datos son aproximadamente

normales,
3. Construir una grfica de probabilidad normal para los datos Si los datos son
aproximadamente normales, los puntos caern (aproximadamente) en una lnea
recta.

Construccin De Una Grfica de Probabilidad Normal Para Un Conjunto


De Datos
1.Haga una lista de las observaciones del conjunto de datos de muestra en orden
ascendente, donde

representa el i-simo valor ordenado.

2.Para cada observacin, calcule el rea de cola correspondiente de la distribucin


normal estndar ( ),

. Empricamente condicin de continuidad.

donde es el tamao de la muestra.


3.Calcule el valor esperado estimado de
siguiente frmula:

suponiendo normalidad, mediante la

donde es la desviacin estndar de la muestra y


rea

es el valor de que recorta un

de la cola inferior de la distribucin normal estndar.

4.Grafique las observaciones ordenadas


estimados correspondientes,

en el eje vertical y los valores esperados

en el eje horizontal.

NOTA: Las verificaciones de normalidad dadas son slo tcnicas descriptivas. Es


posible (aunque poco probable) que los datos no sean normales a pesar de que las
verificaciones se satisfacen razonablemente. Por tanto, se debe tener cuidado de no
asegurar que las mediciones, de hecho, se distribuyen normalmente. Slo podemos decir
que es razonable pensar que los datos provienen de una distribucin normal.

Aproximacin para la distribucin binomial


La distribucin normal frecuentemente es una buena aproximacin a una distribucin
discreta cuando la ltima adquiere una forma de campana simtrica. Desde un punto de
vista terico algunas distribuciones convergen a la normal conforme sus parmetros se
acercan a ciertos lmites. La distribucin normal es una aproximacin conveniente pues
la distribucin acumulada se tabula ms fcil. La distribucin binomial se aproxima

bien por la normal en problemas prcticos cuando se trabaja con la funcin de


distribucin acumulada.
Teorema. (Aplicacin del Teorema del Lmite Central)
Si

es una variable aleatoria binomial con media

y varianza

entonces la forma limitante de la distribucin de

cuando

, es la distribucin normal estndar

La distribucin normal proporciona una buena aproximacin de la binomial an cuando


es pequea y est razonablemente cercana a 0.5.

1.6.1 Distribucin Exponencial


Notacin:

Introduccin
Antes de introducir la variable exponencial puede mirarse un origen natural de sta a
partir de una variable aleatoria Poisson, la cual indica el nmero de veces que ocurre un
evento en una unidad de tiempo. Si se escribe la funcin de probabilidad Poisson de la
siguiente manera:

la probabilidad de que no ocurra algn evento, en el periodo hasta el tiempo est dada
por:

De esta manera, puede definirse ahora una variable aleatoria continua


tiempo que tarda en ocurrir el primer evento de Poisson. Es decir,

Lo que permite construir la funcin de distribucin acumulada as:

que mide el

Al derivar, con respecto a


exponencial

se tiene la funcin de densidad de la variable aleatoria

Definicin

La variable aleatoria

que es igual a la distancia (o tiempo) entre ocurrencias

sucecesivas de un proceso Poisson con media

tiene una distribucin

exponencial con parmetro


Funcin de densidad de Probabilidad:

Valor esperado:

Varianza:

Observaciones:

1. En la definicin de la variable aleatoria exponencial, sta se plantea como tiempo que


tarda en ocurrir el primer evento Poisson. Sin embargo, esta definicin puede hacerse
extensiva a las dems unidades de medicin consideradas en los eventos de Poisson, por
ejemplo, cantidad de metros de carretera que deben recorrerse hasta que aparezca el
primer bache, cantidad de
que deben inspeccionarse en una hacienda hasta que
aparezca el primer cafetal de broca, etc.
2. En el lenguaje de las aplicaciones tambin se utiliza la distribucin exponencial para
modelar tiempo entre eventos, distancia entre eventos, volumen entre eventos.
Ejemplo

Supngase que la duracin de los instrumentos electrnicos D y D tienen


distribuciones Exponenciales asi : D

Cual se debe preferir para usarlo durante un periodo de 45 horas?


Debera preferirse aquel instrumento que de mayor garanta de duracin para un mnimo
de tiempo como el requerido, es decir, debe calcularse la probabilidad de que el
instrumento dure por lo menos 45 horas, en cada caso.

El instrumento dos tiene mayor probabilidad de tener duracin de 45 o ms horas.


Comprueba los anteriores resultados utilizando la funcin de distribucin.

2. ESTADISTICA INFERENCIAL
1.1 DEFINICION DE TERMINOS
Parmetro: Es una medida estadstica (promedio, varianza, etc.) calculada con todos los
elementos de la poblacin. Generalmente se simbolizan con letras del alfabeto griego o con
letras maysculas.
Estimador: Es una medida estadstica (promedio, varianza, etc.) calculada con la
informacin suministrada por una muestra. Generalmente se simbolizan con la letra que
identifica al parmetro y un ^ encima que se lee estimado, o con letras minsculas de
nuestro alfabeto.
Estimacin: Es el valor numrico del estimador
Generalmente, en estadstica no es posible tomar toda la informacin, es decir, no se puede
hacer un censo, por lo tanto se debe tomar una muestra para analizarla y con base en la
informacin suministrada por la muestra generalizar el comportamiento de la poblacin. A
esta generalizacin o paso de lo particular a lo general se le llama inferencia estadstica .
En la estadstica es fundamental el proceso de inferencia, ya que se afirma algo acerca del
comportamiento de la poblacin a partir de una muestra.
Dentro del proceso de inferencia hay dos tipos de estimacin: estimacin puntual y
estimacin por intervalo.
1.2.1 ESTIMACION PUNTUAL . Si se toma una muestra aleatoria y con la informacin
suministrada por ella se obtiene un indicador cualquiera (promedio, desviacin estndar o
proporcin) es un estimador puntual del valor del parmetro. Es decir que un estimador
puntual es un solo valor que se supone nos representa adecuadamente el comportamiento
de una variable.
Un estimador puntual debe cumplir las siguientes condiciones mnimas para que sea
considerado un buen estimador. Estas condiciones o propiedades son: insesgado,
consistente, eficiente o de varianza mnima y suficiente.
Insesgado . Un estimador es insesgado si el valor promedio o esperanza matemtica del
estimador es igual al valor del parmetro.
Cuando un estimador es sesgado se puede introducir una correccin que elimine el sesgo.
Consistente . Un estimador es consistente, si a medida que aumenta el tamao de la
muestra, el valor del estimador se acerca al valor del parmetro.

Eficiente o de varianza mnima . Si se toman dos muestras aleatorias del mismo tamao
provenientes de la misma poblacin y si con cada una de estas muestras se obtiene un
estimador insesgado, es eficiente el que tenga menor varianza.
Suficiente . Un estimador es suficiente si para calcularlo se utiliza toda la informacin
suministrada por la muestra.

TEOREMA CENTRAL DEL LIMITE


Es frecuente tomar muestras de poblaciones que no son normales, cualquiera que sea la
distribucin de la poblacin con tal de que tenga varianza finita, la media muestral tendr
aproximadamente, para muestras grandes, la distribucin normal. Esta propiedad se conoce
como teorema central del lmite.
La importancia de este teorema, en lo que concierne a aplicaciones prcticas, se debe al
hecho de que el promedio de una muestra aleatoria procedente de cualquier distribucin con
varianza finita

, tiene para muestras grandes, una distribucin aproximadamente

normal con media m y varianza

/n.

DISTRIBUCIONES MUESTRALES
De una poblacin de tamao N, se pueden sacar N combinado n muestras diferentes de
tamao n. Con cada una de estas muestras es posible obtener un estimador, ya sea la
media, proporcin, varianza, etc.. La distribucin de estos estimadores se conoce como
distribucin en el muestreo.
El conocer la distribucin en el muestreo de algunos de estos estimadores es til en el
desarrollo terico de los temas correspondientes a estimacin por intervalo y pruebas de
hiptesis. A continuacin se vern las distribuciones en el muestreo ms utilizadas.

DISTRIBUCION MUESTRAL DE LA MEDIA


Dependiendo de las caractersticas de la poblacin y del tamao de la muestra se tienen
varios casos.
1.4.2.1 . Se selecciona una muestra aleatoria de tamao n de una poblacin con distribucin
normal con media m y varianza

, con s 2 conocida.

La media muestral tiene tambin distribucin normal,

(1.6)
1.4.2.2 . Se selecciona una muestra aleatoria de tamao n > 30 de una poblacin con
distribucin diferente a la normal

(1.7)

1.4.2.3 . Se selecciona una muestra aleatoria de tamao n < 30 . La distribucin t es


adecuada para trabajar con muestras pequeas, y se obtiene del cociente entre una
distribucin normal estndar y la raz cuadrada de una chi-cuadrado dividida por sus grados
de libertad, por lo tanto:

(1.8)
Si se utiliza la varianza corregida:

(1.9)

DISTRIBUCION MUESTRAL DE LA PROPORCION


Una proporcin poblacional se define como =X/N, donde X es el nmero de elementos en la
poblacin que poseen cierta caracterstica y N es el total de elementos de la poblacin.
Una proporcin muestral se define como p = x/n, donde x es el nmero de elementos en la
muestra que poseen cierta caracterstica y n es el total de elementos de la muestra.
Cuando se desea estimar una proporcin, el tamao de la muestra siempre debe ser grande,
es decir, n 30.
Si la muestra se obtiene con reemplazo, x tiene distribucin binomial y debido a que la
muestra es grande, por el teorema central del lmite se aproxima a una distribucin normal;
por consiguiente:

Debido a que se desconoce la proporcin poblacional, se utiliza la proporcin muestral para


estimar la varianza, por lo tanto:

(1.13)

DISTRIBUCION MUESTRAL DE LA VARIANZA


El supuesto fundamental es que la poblacin tiene distribucin normal con media

y varianza

. De esta poblacin se obtiene una muestra aleatoria de tamao n.


La varianza de la muestra se define como:

Si se multiplica por n/

se obtiene:

(1.1)
La expresin (1.1) es similar a:

(1.2)
que tiene distribucin chi-cuadrado con n grados de libertad. La nica diferencia es que en el
uno interviene la media muestral (x) y en el otro la media poblacional ( ). Por lo tanto, la
pregunta es si la expresin (1.1) tambin tiene distribucin chi-cuadrado con n grados de
libertad.
que tiene distribucin chi-cuadrado con n grados de libertad. La nica diferencia es que en el
uno interviene la media muestral (x) y en el otro la media poblacional ( ). Por lo tanto, la
pregunta es si la expresin (1.1) tambin tiene distribucin chi-cuadrado con n grados de
libertad.
Recordemos que una variable aleatoria con distribucin normal estndar, elevada al
cuadrado, tiene distribucion chi-cuadrado y sus grados de libertad dependen del nmero de
observaciones.
Si una variable aleatoria X tiene distribucin normal, N( ,
lmite:

), por el teorema central del

(1.3)
Para hacer la demostracin partimos de la expresin (1.2), a la que se le resta y se le suma
la media muestral:

Desarrollando el binomio y aplicando propiedades de la suma se obtiene:

Por propiedades de la media:

Despejando:

Por lo tanto,

(1.4)
Es decir que la sustitucin de la media poblacional por la media muestral reduce en 1 los
grados de libertad de la chi-cuadrado. Lo anterior nos indica que cada vez que se reemplaza
un parmetro por un estimador, se reduce en 1 los grados de libertad de la distribucin chicuadrado.

Si se utiliza la varianza corregida,

(1.5)
Lo anterior se debe a que la varianza corregida se define como:

En caso de ser iguales se trabaja con el 3 y si son diferentes se trabaja con el caso 4 de los
casos especiales.

DISTRIBUCION MUETRAL PARA DIFERENCIA DE MEDIAS


Cuando se toman dos muestras aleatorias de poblaciones diferentes, generalmente se
quieren comparar los dos promedios o medir la diferencia que hay entre ellos.
Si se toman dos muestras aleatorias independientes, de tamaos n1 y n2 procedentes de
poblaciones con medias y
y varianzas
y
respectivamente:

1.4.3.1 . Si las muestras proceden de poblaciones con distribucin normal y las varianzas
poblacionales son conocidas :

(1.10)
1.4.3.2 . Si las muestras provienen de poblaciones no normales pero los tamaos de
muestra son grandes , es decir, n1 30 y n2 30, la distribucin de la diferencia de medias es
como en el caso anterior.
1.4.3.3 . Si las muestras provienen de poblaciones normales con varianzas poblacionales
iguales pero desconocidas y tamaos de muestra pequeos , es decir, n1 30 y n2 30. Como
se desconocen las varianzas poblacionales se debe obtener una expresin que elimine dichas
varianzas, y debido a que las muestras son pequeas se debe obtener una distribucin tStudent

Simplificando se obtiene:

(1.11)
1.4.3.4 . Si las muestras provienen de poblaciones normales con varianzas poblacionales
desconocidas pero diferentes y tamaos de muestra pequeos , es decir, n1 30 y n2 30:

(1.12)
Donde:

Cuando se va a hacer una prueba de hiptesis o un intervalo de confianza para la diferencia


de medias y las muestras son pequeas, primero se debe comprobar si las varianzas
poblacionales son iguales o no. En caso de ser iguales se trabaja con el 3 y si son diferentes
se trabaja con el caso 4 de los casos especiales.

1.4.5 DISTRIBUCION DE LA DIFERENCIA DE PROPORCIONES De dos poblaciones se


toman dos muestras aleatorias independientes de tamaos n1 30 y n2 30, y en cada una
de ellas se observa una caracterstica o cualidad. La proporcin muestral de elementos con
una caracterstica se define como:

(1.14)
1.4.6 DISTRIBUCION DEL COCIENTE DE VARIANZAS De dos poblaciones con
distribucin normal y varianzas poblacionales
y
se toman dos muestras aleatorias
independientes de tamaos n1 y n2 .
Como se vi, en la distribucin de la varianza se llega a una distribucin chi-cuadrado y del
cociente de dos chi-cuadrado se obtiene una distribucin F de Snedecor.

(1.15)
Conocidas las distribuciones en el muestreo de los principales estimadores, se tiene la
fundamentacin terica que nos permite desarrollar el tema correspondiente a los intervalos
de confianza y las pruebas de hiptesis.

ESTIMACION POR INTERVALOS DE CONFIANZA


Hasta ahora se ha hablado de la estimacin puntual, en donde se halla un solo valor o
indicador del comportamiento de una variable, pero no se sabe qu tan cerca est el valor
estimado del parmetro y generalmente se necesita ms que un valor exacto, un rango
dentro del cual esperamos que est el valor del parmetro; por esta razn, es de gran
utilidad la estimacin por intervalo en donde se tiene en cuenta la dispersin de los datos y
de antemano se conoce la confiabilidad de la estimacin.

En el presente captulo se desarrolla el tema correspondiente a los intervalos de confianza


para la media, la proporcin y la varianza.
2.1 INTERVALO DE CONFIANZA
Cuando se selecciona una muestra aleatoria y se obtiene un estimador puntual (promedio,
proporcin, etc.), no se sabe qu tan cerca est dicha estimacin del parmetro, por sta
razn es necesario construir un intervalo de confianza, en donde adems de tener en cuenta
el grado de dispersin o variacin de los datos y el tamao de la muestra se establece un
nivel de confianza o probabilidad de que el valor del parmetro est contenido en dicho
intervalo o rango.
Para obtener un intervalo de confianza se determinan los valores Z1 y Z2 y a tales que la
confiabilidad de que el parmetro q est dentro de los lmites Z1 y Z2 sea - a , es decir:

Donde:
1- = Se conoce como confiabilidad o nivel de confianza y generalmente est entre el 90 y
el 99%
= Nivel de significancia o mrgen de error, del 1 al 10%
Z1 y Z2 = son percentiles correspondientes a una distribucin de probabilidad, la cual
depende de la distribucin en el muestreo del estimador con el que se est trabajando. Los
valores de estos percentiles tambin dependen del nivel de confianza.
Grficamente, se hallan dos valores tales que el rea que hay entre Z1 y Z2 sea 1- y el rea
restante ( ) se divide en dos partes iguales, quedando /2 en la parte inferior y el otro /2
en la parte superior de la distribucin, tal como se observa en la figura 2.1. Por esta razn
de ahora en adelante

Z1 y Z2 se notarn como

Figura 2.1 Nivel de confianza y nivel de significancia

INTERVALO DE CONFIANZA PARA LA MEDIA


Como en el caso de las distribuciones en el muestreo, se tienen varios casos, los cuales
dependen de las caractersticas de la poblacin y el tamao de la muestra.

CASOS DE LOS INTERVALOS DE CONFIANZA


CASOS :
2.2.1 . Intervalo de confianza para la media, cuando se selecciona una muestra
aleatoria de tamao n de una poblacin con distribucin normal con media
varianza
conocida.

En este caso, por las condiciones de la muestra se utiliza la distribucin normal estndar, por
lo tanto

pertenecen a una distribucin normal estndar. Como se trabaja con una

distribucin normal,

son iguales pero con diferente signo,

es negativo y

es

positivo, por lo tanto en la frmula se incluye el signo y


y
se reemplazan por Z. Para
obtener el intervalo de confianza para la media se utiliza la siguiente expresin:

(2.1)
Donde Z pertenece a una distribucin normal estndar.
Interpretando este intervalo se dir que el promedio poblacional estar entre:

con una confiabilidad del (1-

) por ciento.

EJEMPLO
Un proceso manufacturero usado por una fbrica durante los ltimos 10 aos, tiene una
distribucin normal con desviacin estndar de 8 unidades por hora. Se desea estimar un
intervalo de confianza del 90 por ciento para el promedio de unidades por hora producido
con dicho proceso. Para tal efecto, se toma una muestra aleatoria de la produccin por hora
durante 25 horas y se obtiene un promedio de 160 unidades.
Solucin . Como la distribucin de la poblacin es normal y se conoce la desviacin estndar
poblacional, se utiliza la expresin 2.1 para calcular el intervalo de confianza.
El valor de Z se halla en una tabla de la distribucin normal. La confiabilidad es del 90 por
ciento, por lo tanto el nivel de significancia o a (0.1) se divide en dos y se deja a /2 en la
cola inferior y a /2 en la cola superior. En la figura 2.2, el rea que hay de - a Z es 0,95 y
para sta rea el valor de Z en la distribucin normal es 1,64

2.2.2. Intervalo de confianza para la media si se selecciona una muestra aleatoria


de tamao n 30 de una poblacin con distribucin diferente a la normal.
Por las condiciones de la muestra, se utiliza la expresin (1.7). Haciendo el mismo proceso
que se hizo en el caso anterior se obtiene:

(2.2)
Donde Z pertenece a una distribucin normal estndar.

EJEMPLO
En un estudio elaborado acerca de la duracin de 51 bombillas de semforos en cierta
ciudad, se determin un promedio de duracin de 1.795 horas con una desviacin estndar
de 489 horas. Halle un intervalo con el 95 por ciento de confiabilidad para estimar la media
poblacional.
Solucin

Como el tamao de la muestra es mayor que 30, se utiliza la expresin 2.2 y para una
confiabilidad del 95 por ciento, el valor de Z en la distribucin normal es 1,96.
Reemplazando:

Interpretacin . Con una confiabilidad del 95 por ciento, la duracin promedio de las
bombillas de semforos de dicha ciudad, est entre 1.661 y 1.921 horas.

Figura 2.2 Percentil de la distribucin normal

Interpretacin . El promedio de unidades por hora producidas en dicha fbrica est entre
157 y 163 con una confiabilidad del 90 por ciento.
2.2.3 . Intervalo de confianza para la media si se selecciona una muestra aleatoria
de tamao n<30 .
Como la muestra es pequea, se utiliza la expresin (1.8) para despejar el intervalo de
confianza para , obtenindose:

(2.3)
En donde Z pertenece a una distribucin t con (n-1) grado de libertad.
Si se trabaja con la desviacin estndar corregida, se utiliza la expresin (1.9),
obtenindose:

(2.4)
En donde Z pertenece a una distribucin t con (n-1) grado de libertad.

EJEMPLO
Se desea hallar un intervalo de confianza para la estatura promedio de todos los estudiantes
de ingeniera industrial de la Universidad Nacional Sede Manizales. Para tal efecto, de los
estudiantes de dicha carrera se seleccion una muestra aleatoria de 15 personas a quienes
se les pregunt su estatura en metros, obtenindose los siguientes resultados:
ESTATURA: 1,50 1,63 1,50 1,69 1,69 1,79 1,73 1,69 1,56 1,70 1,65 1,74 1,70 1,70 1,65
Halle un intervalo de confianza del 95 por ciento.
Solucin . Con la informacin disponible se calcul el promedio aritmtico y la desviacin
estndar, los que respectivamente son 1,6613 y 0,0808 n = 15 y 1- = 0,95
Como la muestra es pequea se utiliza la expresin 2.3. El valor de Z se halla en una tabla
de la distribucin t con 14 grados de libertad, que para un nivel de confianza del 95 por
ciento es 2,145. Reemplazando:

Interpretacin . Con un 95 por ciento de confiabilidad, se puede afirmar que la estatura


promedio de los estudiantes de ingeniera industrial de la universidad Nacional Sede
Manizales, est entre 1,62 y 1,71 mts.

INTERVALO DE CONFIANZA PARA LA PROPORCION


Cuando se observa una caracterstica o cualidad en la muestra se puede estimar la
proporcin de elementos que tienen una caracterstica determinada; en estos casos, el
tamao de la muestra siempre debe ser grande, por lo tanto se tiene un solo caso.
Para despejar el intervalo de confianza se parte de la expresin (1.13) y haciendo el mismo
proceso que para el caso de la media, se obtiene:

(2.5)
Donde Z pertenece a la distribucin normal estndar.

Ejemplo
La Federacin Nacional de Cafeteros, realiz un estudio con el fin de conocer el porcentaje de
propietarios y arrendatarios de las fincas productoras del grano en la regin del viejo Caldas.
Para tal efecto se tom una muestra aleatoria de 100 fincas, en las cuales se encontr que
65 de los caficultores eran dueos del predio. Halle un intervalo del 95 por ciento de
confianza para el porcentaje de propietarios de fincas en la regin del viejo Caldas.
Solucin

Se utiliza la expresin 2.5. El valor de Z se halla en la tabla de la distribucin normal, que


para una confiabilidad del 95 por ciento es de 1,96. Reemplazando:

Interpretacin . En la regin del Viejo Caldas, el porcentaje de propietarios de fincas


cafeteras, est entre el 55,7 y el 74,3 por ciento, con una confiabilidad del 95 por ciento.

INTERVALO DE CONFIANZA PARA LA VARIANZA


De una poblacin con distribucin normal con media m y varianza s 2 se obtiene una
muestra aleatoria de tamao n. Para obtener el intervalo de confianza para la varianza ( s 2
) se parte de la expresin (1.4):

Se divide por ns2 :

Se invierte:

Reescribiendo:

(2.6)
Donde
lo tanto,

pertenecen a una distribucin chi-cuadrado con (n-1) grado de libertad, por


y

son diferentes y

<

Ejemplo
La varianza de la resistencia a la rotura de 30 cables probados fu de 32.000 lbs 2. Halle un
intervalo de confianza del 90 por ciento, para la varianza de la resistencia de todos los cables
de sta marca.
Solucin . Se utiliza la expresin 2.6. Los valores de
y
pertenecen a una
distribucin chi-cuadrado con 29 grados de libertad. como puede observarse en la figura 2.3
el rea que hay por debajo de Z a /2 es 0,05, por lo tanto
=17,71 y el rea que hay por
debajo de

es 0,95, por lo tanto

=42,56

Figura 2.3 Percentiles de la distribucin chi-cuadrado

Reemplazando en la expresin 2.6 se obtiene:

Por razones de utilidad se halla el intervalo de confianza para la desviacin estndar,


sacando la raz cuadrada de los lmites, por lo tanto:

Interpretacin . El promedio de variacin o de dispersin de la rotura de los cables de


dicha marca, est entre 150 y 233 lbs . con una confiabilidad del 90 por ciento.

PRUBAS DE HIPOTESIS
Dentro del proceso de inferencia, adems de la estimacin puntual y la por intervalo, en
muchas ocasiones es necesario hacer pruebas de hiptesis, las cuales se hacen con base en
la informacin muestral.
En este captulo se ver la prueba de hiptesis para la media, la proporcin, la varianza, la
diferencia de medias, la diferencia de proporciones, el cociente de varianzas, la prueba de
independencia y la prueba de bondad de ajuste.
3.1 HIPOTESIS
Una hiptesis estadstica es un supuesto acerca del valor de un parmetro de una poblacin
determinada. Este supuesto debe comprobarse con la informacin suministrada por una
muestra aleatoria obtenida de dicha poblacin.
Cuando se realiza una prueba de hiptesis, se plantean dos hiptesis que deben ser
mutuamente excluyentes; una es la hiptesis nula que se nota como H0 y la otra es la
hiptesis alternativa que se nota como H1 .
Se debe establecer un criterio o regla de decisin segn la cual no se rechace la hiptesis
nula o se rechace. Si se rechaza la hiptesis nula (H0 ) se acepta hiptesis alternativa (H1 ).
Para establecer esta regla de decisin la distribucin de probabilidad se divide en dos
categoras mutuamente excluyentes: la que lleva al rechazo de H0 , es decir est en la zona
de rechazo y la que lleva al no rechazo de H0 , es decir, est en la zona de no rechazo.
Debido a que se est trabajando con una muestra aleatoria, cuando se realiza una prueba de
hiptesis se pueden cometer dos tipos de errores. La hiptesis nula (H0 ) es en realidad
verdadera, pero debido a que los datos muestrales parecen ser inconsistentes con ella, se la
rechaza (ERROR TIPO I) y la probabilidad de cometer un error tipo I se llama nivel de
significancia ( ). Puesto que cuando se comete un error tipo I, seguiramos una accin
errnea, se puede definir el nivel de significancia como la probabilidad de decidirnos por H 1
dado que H0 es verdadera.
Por otro lado, podemos no rechazar H0 siendo en realidad falsa, a este error se le llama
ERROR TIPO II.

3.1.1 FORMULACION DE HIPOTESIS


El primer paso en la prueba de hiptesis es el planteamiento de las hiptesis, lo que en
algunos casos no es una tarea fcil.
Hay tres tipos de hiptesis, a saber:
- Prueba de hiptesis a dos colas
H0:

=k

H1:

- Prueba de hiptesis a una cola superior


H0 :

= k H0:

H1 :

> k H1 :

>k

- Prueba de hiptesis a una cola inferior

H0 :

= k H0 :

H1 :

< k H1 :

<k

Ntese que las hiptesis siempre se plantean para un parmetro

Una vez establacidas las hiptesis, se selecciona el nivel de significancia o mrgen de error (
) el que generalmente se fija entre el uno y el diez por ciento.
El tercer paso es la estadstica a probar o estadstica de trabajo, la cual depende de la
distribucin en el muestreo del estimador con el que se est trabajando y de los supuestos
correspondientes a la poblacin y al tamao de la muestra. Cuando se realizan los clculos
siempre se supone que la hiptesis nula (H0) es cierta.
El cuarto paso es establecer la regla de decisin, la cual depende de la distribucin de
probabilidad de la estadstica a probar, del nivel de significancia ( ) y de la hiptesis
alternativa (H1).
Finalmente se toma la decisin de no rechazar la hiptesis nula o rechazarla.

PRUEBA DE HIPOTESIS PARA LA MEDIA


El promedio aritmtico poblacional es un indicador muy importante, por lo tanto,
frecuentemente se desea probar si dicho promedio ha permanecido igual, ha aumentado o
ha disminudo. A travs de la prueba de hiptesis se determina si la media poblacional es
significativamente mayor o menor que algn valor supuesto.
Hiptesis
Se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 :

=k

H1 :

- Prueba de hiptesis a una cola superior


H0 :

= k H0 :

H1 :

>k H1 :

k
>k

- Prueba de hiptesis a una cola inferior


H0 :

= k H0 :

H1 :

< k H1 :

<k

En las distribuciones en el muestreo se vi que para el caso de la media, hay tres


situaciones, por consiguiente la estadstica de trabajo a utilizar depende de los supuestos de
la poblacin y del tamao de la muestra.
3.2.1 Prueba de hiptesis para la media si la poblacin de donde se obtiene la
muestra tiene distribucin normal con
conocida.

La estadstica de trabajo a usar corresponde a la expresin (1.6):

(3.1)
Donde:

es el valor que se est suponiendo en la hiptesis nula (H0).

REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como: H1 :
k se tiene una prueba de hiptesis
a dos colas, por lo tanto, el nivel de significancia ( ) se divide en dos partes iguales,
quedando estos valores en los extremos de la distribucin como se aprecia en la figura 3.1

Figura 3.1 Regla de decisin para una prueba de hiptesis a dos colas.

pertenecen a una distribucin normal estndar. Si el valor de la estadstica de

trabajo (Zx) est entre


y
no se rechaza la hiptesis nula, en caso contrario se
rechaza H0 lo cual implica aceptar H1. Es decir:

- Si se ha planteado la hiptesis alternativa como:


H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de
significancia ( ) en la parte superior de la distribucin, como se aprecia en la figura 3.2

Figura 3.2 Regla de decisin para una prueba de hiptesis a una cola superior.

pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo


(Zx) es menor que
no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo
cual implica aceptar H1. Es decir,

Si se ha planteado la hiptesis alternativa como:


H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de
significancia ( ) en la parte inferior de la distribucin, como se aprecia en la figura 3.3

Figura 3.3 Regla de decisin para una prueba de hiptesis a una cola inferior.

Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zx)


es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual
implica aceptar H1. Es decir,

EJEMPLO
Un proceso manufacturero usado por una fbrica durante los ltimos aos da una produccin
media de 100 unidades por hora con una desviacin estndar de 8 unidades. Se acaba de
introducir en el mercado una nueva mquina para realizar ese tipo de producto. Aunque es
muy cara comparada con la que est ahora en uso, si la media de produccin de la nueva
mquina es de ms de 150 unidades por hora, su adopcin dara bastantes beneficios.
Para decidir si se debiera comprar la nueva mquina, a la gerencia de la fbrica se le permite
hacer un ensayo durante 35 horas, hallndose un promedio de 160 unidades por hora. Con
sta informacin qu decisin se debe tomar si se asume un nivel de confianza del 99 por
ciento.
Solucin .
Segn el enunciado, solo se compra la mquina si la produccin es de mas de 150 unidades
por hora, por lo tanto las hiptesis son:
H0 :

= 150

H1 :

> 150

Para elegir la estadstica de trabajo se tiene en cuenta que se conoce la varianza poblacional,
por lo tanto se usa la expresin 3.1

por el planteamiento de la hiptesis alternativa se trabaja a una cola superior. En la


distribucin normal, con una confiabilidad del 99 por ciento el valor de Z es 2,33. como
puede observarse en la figura 3.4, la estadstica de trabajo est en la zona de rechazo de la
hiptesis nula, por lo tanto, se acepta que la produccin promedio por hora es superior a las
150 unidades y asumiendo un riesgo del 1 por ciento se puede comprar la nueva mquina.

Figura 3.4 Regla de desicin para una prueba de hiptesis a una cola inferior.

3.2.2 Prueba de hiptesis para la media si se selecciona una muestra aleatoria de


tamao n 30 de una poblacin con cualquier distribucin.
La estadstica de trabajo a usar es la expresin (1.7):

REGLA DE DECISION
Es la misma que en el caso anterior y depende en todo caso de la hiptesis alternativa.

EJEMPLO
La duracin promedio de las llantas producidas por una fbrica de llantas, segn experiencias
registradas es de 46.050 kms. Se desea probar si el promedio poblacional ha cambiado; para
tal efecto se toma una muestra aleatoria de 60 llantas y se obtiene una duracin promedio
de 45.050 kms. con una desviacin estndar de 3.070 kms.
Solucin
H

H1 :

= 46.050
46.050

Teniendo en cuenta que el tamao de la muestra es grande, como estadstica de trabajo se


utiliza la expresin 3.2

Por la hiptesis alternativa, la regla de decisin es a dos colas. La tabla a utilizar es la de la


distribucin normal. Asumiendo un nivel de confianza del 95 por ciento, los correspondientes
valores de Z son -1,96 y 1,96. Como puede observarse en la figura 3.5, el valor de la
estadstica de trabajo est en la zona de rechazo de la hiptesis nula, por consiguiente, con
una confiabilidad del 95 por ciento se acepta que la duracin promedio de las llantas ha
cambiado.

Figura 3.5 Regla de decisin para una prueba de hiptesis a dos colas

3.2.3 Prueba de hiptesis para la media si se selecciona una muestra aleatoria de


tamao n<30 .
En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin
corregir o corregida.
Si se utiliza la varianza sin corregir (

) la estadstica de trabajo es la expresin (1.8):

(3.3)
Si se utiliza la varianza corregida la estadstica de trabajo es la expresin (1.9):

(3.4)

EJEMPLO
En su calidad de comprador comercial para un supermercado, se toma una muestra aleatoria
de doce (12) sobres de caf de una empacadora. Se encuentra que el peso promedio del
contenido de caf de cada sobre es 15,97 grs. con una desviacin estndar de 0,15. La

compaa empacadora afirma que el peso promedio mnimo del caf es de 16 grs. por sobre.
Puede aceptarse sta afirmacin si se asume un nivel de confianza del 90 por ciento?
Solucin
Se desea probar si el peso mnimo es de 16 grs., es decir mayor o igual a 16 grs., as que las
hiiptesis adecuadas son:
H0 :

16

H1 :

< 16

Teniendo en cuenta que el tamao de la muestra es pequeo, como estadstica de trabajo se


utiliza la expresin 3.3
Teniendo en cuenta que el tamao de la muestra es pequeo, como estadstica de trabajo se
utiliza la expresin 3.3

Como lo indica la hiptesis alternativa, se trabaja a una cola inferior en la tabla de la


distribucin t con 11 grados de libertad y una confiabilidad del 90 por ciento, el valor de Z es
- 1,363
Como puede observarse (figura 3.6), la estadstica de trabajo (-0,663) est ubicada en la
zona de no rechazo de la hiptesis nula, por lo tanto, con un nivel de confianza del 90 por
ciento no se rechaza que los empacadores de caf tienen la razn, por lo tanto se concluye
que el peso promedio de los sobres de caf es mayor o igual a 16 grs.

Figura 3.6 Regla de decisin para una prueba de hiptesis a una cola inferior

PRUEBA DE HIPOTESIS DE LA PROPORCION


Frecuentemente se desea estimar la proporcin de elementos que tienen una caracterstica
determinada, en tal caso, las observaciones son de naturaleza cualitativa. Cuando se analiza
informacin cualitativa y se est interesado en verificar un supuesto acerca de la proporcin

poblacional de elementos que tienen determinada caracterstica, es til trabajar con la


prueba de hiptesis para la proporcin.
HIPTESIS
Como en el caso de la media, se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 :

=k

H1 :

- Prueba de hiptesis a una cola superior


H0 :

= k H0 :

H1 :

> k H1 :

>k

- Prueba de hiptesis a una cola inferior


H0 :
H1:

= k H0 :
< k H1 :

k
<k

Cuando se va a estimar una proporcin el tamao de la muestra (n) siempre debe ser mayor
a 30, por lo tanto se tiene un solo caso.
La estadstica de trabajo a utilizar es la expresin (1.13):

(3.5)

REGLA DE DECISION
Si se ha planteado la hiptesis alternativa como:
H1:
k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia (
) se divide en dos partes iguales, quedando estos valores en los extremos de la distribucin
como se aprecia en la figura 3.1
y

pertenecen a una distribucin normal estndar. Si el valor de la estadstica de

trabajo (Zp) est entre

no se rechaza la hiptesis nula, en caso contrario se

rechaza H0 lo cual implica aceptar H1 . Es decir, si

< Zp <

no se rechaza H0 .

- Si se ha planteado la hiptesis alternativa como:


H1 : > k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de
significancia ( ) en la parte superior de la distribucin, vease figura 3.2

pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp )


es menor que

no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual

implica aceptar H1 . Es decir, si Zp <

no se rechaza H0 .

- Si se ha planteado la hiptesis alternativa como:


H1 : < k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de
significancia ( ) en la parte inferior de la distribucin, vease figura 3.3
Z pertenece a una distribucin normal estndar. Si el valor de la estadstica de trabajo (Zp )
es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual
implica aceptar H1 . Es decir, si Zp > Z no se rechaza H0 .

EJEMPLO
Un fabricante afirma que por lo menos el 90 por ciento de las piezas de una maquinaria que
suministra a una fbrica guardan las formas especificadas. Un exmen de 200 de esas piezas
revel que 160 de ellas no eran defectuosas. Pruebe si lo que afirma el fabricante es cierto.
Solucin
H0 :

0,9

H1 :

< 0,9

Para realizar una prueba de hiptesis para la proporcin se utiliza la expresin 3.5

Asumiendo una confiabilidad del 95 por ciento, el valor correspondiente a Z en la distribucin


normal es -1,64
Como puede observarse en la figura 3.7, el valor de la estadstica de trabajo se encuentra en
la zona de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 95 por
ciento se concluye que la afirmacin del fabricante no es cierta.

Figura 3.7 Regla de decisin para una prueba de hiptesis a una cola inferior

PRUEBA DE HIPOTSIS DE LA VARIANZA


Es frecuente que se desee comprobar si la variacin o dispersin de una variable ha tenido
alguna modificacin, lo cual se hace con la prueba de hiptesis para la varianza.
Hiptesis
Se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 :

=k

H1 :

- Prueba de hiptesis a una cola superior


H0 :

= k H0 :

H1 :

> k H1 :

>k

- Prueba de hiptesis a una cola inferior


H0 :

= k H1 :

H1 :

< k H1 :

<k

En este caso se tienen dos situaciones, dependiendo de si se utiliza la varianza muestral sin
corregir o corregida.
Si se utiliza la varianza sin corregir (

) la estadstica de trabajo es la expresin (1.4):

(3.6)
Si se utiliza la varianza corregida, la estadstica de trabajo es la expresin (1.5):

(3.7)

REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como:
H1 :
k se tiene una prueba de hiptesis a dos colas, por lo tanto, el nivel de significancia
( ) se divide en dos partes iguales, quedando estos valores en los extremos de la
distribucin como se aprecia en la figura 3.8

Figura 3.8 Regla de decisin para una prueba de hiptesis a dos colas

pertenecen a una distribucin X2 con (n-1) grado de libertad. Si el valor de la

estadstica de trabajo (T) est entre

no se rechaza la hiptesis nula, en caso

contrario se rechaza H0 lo cual implica aceptar H1 . Es decir, si


H0.

<T<

no se rechaza

- Si se ha planteado la hiptesis alternativa como:


H1 :
> k, se tiene una prueba de hiptesis a una cola superior, quedando el nivel de
significancia ( ) en la parte superior de la distribucin, vease figura 3.9

Figura 3.9 Regla de decisin para una prueba de hiptesis a una cola superior

Z1-

pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica

de trabajo (T) es menor que

no se rechaza la hiptesis nula, en caso contrario se

rechaza H0 lo cual implica aceptar H1 . Es decir, si T <

no se rechaza H0 .

- Si se ha planteado la hiptesis alternativa como:


H1 :
< k, se tiene una prueba de hiptesis a una cola inferior, quedando el nivel de
significancia ( ) en la parte inferior de la distribucin, vease figura 3.10

Figura 3.10 Regla de decisin para una prueba de hiptesis a una cola inferior

Z pertenece a una distribucin X2 con (n-1) grado de libertad. Si el valor de la estadstica


de trabajo (T) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza
H0 lo cual implica aceptar H1 . Es decir, si T >Z no se rechaza H0.

EJEMPLO
Se supone que los dimetros de cierta marca de vlvulas estn distribudos normalmente con
una varianza poblacional de 0,2 pulgadas , pero se cree que ltimamente ha aumentado.
Se toma una muestra aleatoria de vlvulas a las que se les mide su dimetro, obtenindose
los siguientes resultados en pulgadas: 5,5 5,4 5,4 5,6 5,8 5,4 5,5 5,4 5,6 5,7
Con sta informacin pruebe si lo que se cree es cierto.
Solucin
Se cree que la varianza poblacional ha aumentado, es decir es superior a 0,2; por lo tanto:
H0 :

= 0,2

H1 :

> 0,2

Para realizar esta prueba de hiptesis se utiliza la expresin 3.6

Asumiendo un nivel de confianza del 95 por ciento, en la tabla de la distribucin chi-cuadrado


con 9 grados de libertad, se obtiene un valor para Z de 16,919. Como puede observarse en
la figura 3.11, el valor de la estadstica de trabajo se ubica en la zona de no rechazo de la
hiptesis nula, por consiguiente con una confiabilidad del 95 por ciento se puede afirmar que
la varianza poblacional no ha aumentado.

Figura 3.11 Regla de decisin para una prueba de hiptesis a una cola superior

PRUEBA DE HIPOTESIS COCIENTE DE VARIANZAS


Si de dos poblaciones con distribucin normal se seleccionan dos muestras aleatorias
independientes de tamaos n1 y n2 , se puede comparar la homogeneidad o variabilidad de
dichas poblaciones a travs de una prueba de hiptesis para el cociente de varianzas.
Cuando se planteen las hiptesis debe quedar en el numerador la poblacin cuya muestra
tenga mayor varianza. Es decir que la poblacin 1 ser la que tenga mayor varianza
muestral.
Hiptesis
Se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 :

H1 :

H0 :
H1 :

/
/

=1
1

- Prueba de hiptesis a una cola superior


H0 :

H0 :

H1 :

>

H1 :

>1

- Prueba de hiptesis a una cola inferior


H0 :

H0 :

H1 :

<

H1 :

<1

La estadstica de trabajo es la expresin (1.15)

(3.8)

REGLA DE DECISION
Si se ha planteado la hiptesis alternativa como:
H1 :
H1 :
/
1 se tiene una prueba de hiptesis a dos colas, por lo tanto, el
nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los
extremos de la distribucin como se aprecia en la figura 3.8
y
pertenecen a una distribucin F con (n1 -1) grado de libertad en el numerador y
(n2-1) grado de libertad en el denominador. Si el valor de la estadstica de trabajo (T) est
entre

no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual

implica aceptar H1 . Es decir, si

<T<

no se rechaza H0 .

- Si se ha planteado la hiptesis alternativa como:


H1 :
>
H1 :
/
> 1 , se tiene una prueba de hiptesis a una cola superior,
quedando el nivel de significancia ( ) en la parte superior de la distribucin, como se
aprecia en la figura 3.9
Z 1- a pertenece a una distribucin F con (n 1 -1) grado de libertad en el numerador y (n 2 1) grado de libertad en el denominador. Si el valor de la estadstica de trabajo (T) es menor
que Z 1- a no se rechaza la hiptesis nula, en caso contrario se rechaza H o lo cual implica
aceptar H 1 . Es decir, si T < Z 1- a no se rechaza H o .
- Si se ha planteado la hiptesis alternativa como:
H1 :
<
H1 :
/
< 1 , se tiene una prueba de hiptesis a una cola inferior,
quedando el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia
en la figura 3.10
Z a pertenece a una distribucin F con (n1 -1) grado de libertad en el numerador y (n2 -1)
grado de libertad en el denominador. Si el valor de la estadstica de trabajo (T) es mayor que
Z a no se rechaza la hiptesis nula, en caso contrario se rechaza H o lo cual implica aceptar
H 1 . Es decir, si T > Z a no se rechaza H0 .

EJEMPLO
Dos fuentes de materias primas estn siendo consideradas. Ambas fuentes parecen tener
caractersticas similares, pero no se est seguro de su homogeneidad. Una muestra de 10
grupos de la fuente A produce una varianza de 250 y una muestra de 11 grupos de la fuente
B produce una varianza de 195. Con base en sta informacin se puede concluir que la
varianza de la fuente A es significativamente mayor que la de la fuente B?. Asuma un nivel
de confianza del 99 por ciento.
Solucin
H

H1 :

A=
A>

B
B

Con un nivel de confianza del 99 por ciento, en la tabla de la distribucin F con 9 grados de
libertad en el numerador y 10 grados de libertad en el denominador, se obtiene un valor
para Z de 4,94. Como puede observarse en la figura 3.12, el valor de la estadstica de
trabajo est en la zona de no rechazo de la hiptesis nula, por lo tanto, con una confiabilidad
del 99 por ciento, no se puede rechazar que la variabilidad de las dos fuentes de materia
prima es igual.

Figura 3.12 Regla de decisin para una prueba de Hiptesis a una cola superior

PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS


Se tienen dos poblaciones y se toman muestras aleatorias independientes de tamaos n 1 y
n 2 , se puede comparar el comportamiento de dichas poblaciones a travs de los promedios.
Hiptesis
Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hiptesis:
- Prueba de hiptesis a dos colas
H0 :

H1 :

H0 :
H1 :

=k
k

- Prueba de hiptesis a una cola superior


H0 :

H0 :

H1 :

>

H1 :

>k

- Prueba de hiptesis a una cola inferior


H0 :

H0 :

H1 :

<

H1 :

<k

La estadstica de trabajo depende de las caractersticas de las poblaciones y del tamao de


las muestras.

3.6.1 . Prueba de hiptesis para la diferencia de medias, si las


muestras se obtienen de poblaciones con distribucin normal, con
varianzas poblacionales conocidas , la estadstica de trabajo es la expresin
(1.10):

(3.9)

REGLA DE DECISION
- Si se ha planteado la hiptesis alternativa como:
H1 :
>
H1 :
> k se tiene una prueba de hiptesis a dos colas, por lo tanto, el
nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los
extremos de la distribucin como se aprecia en la figura 3.1
y

pertenecen a una distribucin Normal estndar. Si el valor de la estadstica de

trabajo est entre


y
no se rechaza la hiptesis nula, en caso contrario se rechaza H
o lo cual implica aceptar H 1 . Es decir,

- Si se ha planteado la hiptesis alternativa como:


H1 :
>
H1 :
> k, se tiene una prueba de hiptesis a una cola superior, quedando
el nivel de significancia ( ) en la parte superior de la distribucin, como se aprecia en la
figura 3.2
pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo es
menor que
se acepta la hiptesis nula, en caso contrario se rechaza H0 lo cual implica
aceptar H<sub>1 . Es decir,

- Si se ha planteado la hiptesis alternativa como:


H1 :
<
H1 :
< k, se tiene una prueba de hiptesis a una cola inferior, quedando
el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia en la
figura 3.3
Z pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo es
mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual implica
aceptar H1 . Es decir,

EJEMPLO
Un constructor est considerando dos lugares alternativos para construir un centro
comercial. Como los ingresos de los hogares de la comunidad son una consideracin
importante en sta seleccin, desea probar que el ingreso promedio de la primera comunidad
excede al promedio de la segunda comunidad en cuando menos $1.500 diarios. Con la
informacin de un censo realizado el ao anterior sabe que la desviacin estndar del
ingreso diario de la primera comunidad es de $1.800 y la de la segunda es de $2.400
Para una muestra aleatoria de 30 hogares de la primera comunidad, encuentra que el
ingreso diario promedio es de $35.500 y con una muestra de 40 hogares de la segunda
comunidad el ingreso promedio diario es de $34.600. Pruebe la hiptesis con un nivel de
confianza del 95 por ciento.
Solucin
Se desea probar si la diferencia entre los ingresos de la comunidad 1 y la 2 es de $1.500 o
ms, por lo tanto:
H0 :

1.500

H1 :

< 1.500

El tamao de las muestras es grande y las varianzas poblacionales son conocidas, por
consiguiente la estadstica de trabajo a utilizar es la expresin 3.9

Para un nivel de confianza del 95 por ciento, en la tabla de la distribucin normal se tiene un
valor de Z de -1,64. Como puede observarse en la figura 3.13, la estadstica de trabajo se
ubica en la zona de aceptacin de la hiptesis nula; por lo tanto, con una confiabilidad del 95
por ciento, la diferencia entre el ingreso promedio por hogar en las dos comunidades es
mayor a $1.500 diarios.

Figura 3.13 Regla de decisin para una prueba de hiptesis a una cola inferior

3.6.2 Prueba de hiptesis para la diferencia de medias si las


muestras se obtienen de poblaciones con distribuciones diferentes a
la normal, pero n1 30 y n2 30 y varianzas poblacionales
desconocidas , la estadstica de trabajo es igual al caso anterior, solo que se reemplaza
la varianza poblacional por la muestral:

(3.10)

REGLA DE DECISIN
La regla de decisin es la misma que en caso anterior y en todo caso, depende de la
hiptesis alternativa.

EJEMPLO
Una muestra de 80 alambres de acero producidos por la fbrica A presenta una resistencia
promedio a la ruptura de 1.230 lbs . con una desviacin estndar de 120 lbs .. Una muestra
de 100 alambres de acero producidos por la fbrica B presenta una resistencia promedio a la
ruptura de 1.110 lbs . con una desviacin estndar de 90 lbs .. Con base en sta informacin
pruebe si la resistencia promedio a la rotura de los alambres de acero de la marca A es
significativamente mayor que la de los alambres de acero de la marca B. Asuma un nivel de
confianza del 99 por ciento.
Solucin
H0 :

A=

H1 :

A>

El tamao de las muestras es grande, las varianzas poblacionales son desconocidas, por la
tanto la estadstica de trabajo a utilizar es la expresin 3.10

Con un nivel del confianza del 99 por ciento, en la tabla de la distribucin normal el valor de
Z es 2,33. como puede observarse en la figura 3.14, la estadstica de trabajo est en la zona
de rechazo de la hiptesis nula, por consiguiente, con una confiabilidad del 99 por ciento se
acepta que la resistencia promedio de los alambres de la marca A es significativamente
mayor que la resistencia promedio de los alambres de la marca B.

Figura 3.14 Regla de decisin para una prueba de hiptesis a una cola superior

3.6.3 Prueba de hiptesis para la diferencia de medias si las


muestras se obtienen de poblaciones con distribucin normal, con
varianzas poblacionales iguales pero desconocidas y n1 <30 y n2
<30 , la estadstica de trabajo es la expresin (1.11):

(3.11)

REGLA DE DECISIN
La regla de decisin es la misma que en los casos anteriores, pero los valores de la tabla se
hallan en una distribucin t con (n1 +n2-2) grados de libertad.
Nota . Cuando se tienen muestras pequeas y se va a realizar una prueba de hiptesis para
la diferencia de medias, primero se debe probar si las varianzas poblacionales son iguales o
diferentes, lo cual se hace con la prueba de hiptesis para el cociente de varianzas. Si las
varianzas son iguales se aplica el caso 3.6.3 y si son diferentes se aplica el caso 3.6.4.

EJEMPLO
Se desea probar si la cantidad promedio de cera superficial en el lado interno (I) de las
bolsas de papel encerado es mayor que la cantidad promedio en el lado externo (E). Para tal
efecto se tom una muestra aleatoria de 25 bolsas, midindose la cantidad de cera en cada
lado de esas bolsas, obtenindose los siguientes resultados:

Con base en esta informacin cul es su conclusin?. Asuma un nivel de confianza del 90 por
ciento.
Solucin

Con la informacin suministrada se obtienen los estimadores necesarios:

En consideracin a que el tamao de las muestras es pequeo, antes de realizar la prueba de


hiptesis para la diferencia de medias, se debe probar si las varianzas poblacionales son
iguales o diferentes.
H0 :

=1

H1 :

Para la estadstica de trabajo se utiliza la expresin 3.8:

Con una confiabilidad del 90 por ciento, en la tabla de la distribucin F con 24 grados de
libertad en el numerador y 24 grados de libertad en el denominador, el valor de Z 0,05 es
0,505 y el valor de Z 0,95 es 1,98. como puede observarse en la figura 3.15, la estadstica
de trabajo cae en la zona de no rechazo de la hiptesis nula, por consiguiente las varianzas
poblacionales son iguales.

Como las varianzas poblacionales son iguales, para realizar la prueba de hiptesis para la
diferencia de medias se usa la expresin 3.11
H0 :

H1 :

I>

E
E

Con una confiabilidad del 90 por ciento, en la tabla de la distribucin t con 48 grados de
libertad, el valor de Z es 1,3. Como puede observarse en la figura 3.16, la estadstica de
trabajo se encuentra en la zona de no rechazo de la hiptesis nula, por lo tanto, con una
confiabilidad del 90 por ciento se concluye que la cantidad promedio de cera en el lado
interno no es mayor que la cantidad promedio de cera en el lado externo.

Figura 3.16 Regla de decisin para una prueba de hiptesis a una cola superior

3.6.4 Prueba de hiptesis para la diferencia de medias si las


muestras se obtienen de poblaciones con distribucin normal, con
varianzas poblacionales diferentes pero desconocidas y n1 <30 y n2
<30 , la estadstica de trabajo es la expresin (1.12):

(3.12)

REGLA DE DECISIN
La regla de decisin es la misma que en los casos anteriores pero los valores de la tabla se
hallan en una distribucin t con k grados de libertad, siendo:

(3.13)

EJEMPLO
Un fabricante de bombillos sospecha que una de sus lneas de produccin est produciendo
bombillos con una duracin promedio menor que la de otra lnea. Para probar su sospecha
toma una muestra aleatoria de 16 bombillos de la lnea sospechosa (s) y 18 de la otra lnea
(c), obteniendo los siguientes resultados:

Con sta informacin cul es su conclusin si se asume un nivel de confianza del 90 por
ciento.
Solucin
Como el tamao de las muestras es pequeo, para decidir cul es la estadstica de trabajo
adecuada para la prueba de hiptesis de la diferencia de medias, primero se debe probar si
las varianzas poblacionales son iguales o no.
H0 :

=1

H1 :

La estadstica de trabajo es:

Con una confiabilidad del 90 por ciento, en la tabla de la distribucin F con 15 grados de
libertad en el numerador y 17 grados de libertad en el denominador, el valor de Z 0,05 es
0,43 y el valor de Z 0,95 es 2,31. como puede observarse en la figura 3.17, la estadstica de
trabajo cae en la zona de rechazo de la hiptesis nula, por consiguiente las varianzas
poblacionales son diferentes.

Figura 3.17 Regla de decisin para una prueba de hiptesis a dos colas

Considerando que las varianzas poblacionales son diferentes, la estadstica de trabajo a


utilizar para la prueba de hiptesis para la diferencia de medias es la expresin 3.12

La estadstica de trabajo es:

H0 :

S=

H1 :

S<

Con la expresin 3.13 se calculan los grados de libertad de la distribucin t

En la tabla de la distribucin t, con 26 grados de libertad y una confiabilidad del 90 por


ciento, el valor de Z es -1,315. Como se observa en la figura 3.18, la estadstica de trabajo
cae en la zona de no rechazo de la hiptesis nula, por lo tanto, con una confiabilidad del 90
por ciento se concluye que no hay diferencia en el promedio de produccin de las dos lneas.

Figura 3.18 Regla de decisin para una prueba de hiptesis a una cola inferior

PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES


Cuando se tienen dos poblaciones y se han tomado muestras aleatorias de tamaos n 1 y n
2, para observar una caracterstica o cualidad, se puede comparar el comportamiento de
dicha caracterstica en las poblaciones a travs de la diferencia de proporciones.
Hiptesis
Como en los casos anteriores se puede plantear uno de los siguientes tres tipos de hiptesis:

- Prueba de hiptesis a dos colas


H0 :

1=

H1 :

2 H0 :
2 H1 :

1-

1-

2=k

- Prueba de hiptesis a una cola superior


H0 :

1=

2 H0 :

H1 :

1>

2 H1 :

11-

2>k

- Prueba de hiptesis a una cola inferior


H0 :

1=

2 H0 :

H1 :

1<

2 H1 :

11-

2<k

La estadstica de trabajo es la expresin 1.14:

(3.14)

REGLA DE DECISION
Como en los casos anteriores depende del tipo de hiptesis que se haya planteado.
- Si se ha planteado la hiptesis alternativa como:
H1 : 1
2 H1 : p 1 - p 2 k se tiene una prueba de hiptesis a dos colas, por lo tanto, el
nivel de significancia ( ) se divide en dos partes iguales, quedando estos valores en los
extremos de la distribucin como se aprecia en la figura 3.1
y

pertenecen a una distribucin Normal estndar. Si el valor de la estadstica de

trabajo (Zp1-p2 ) est entre

no se rechaza la hiptesis nula, en caso contrario se

rechaza H0 lo cual implica aceptar H1 . Es decir, si

< Zp1-p2 <

no se rechaza H0 .

- Si se ha planteado la hiptesis alternativa como:


H1 : 1 > 2 H1 : 1 - 2 > k, se tiene una prueba de hiptesis a una cola superior,
quedando el nivel de significancia ( ) en la parte superior de la distribucin, como se
aprecia en la figura 3.2
pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo es
menor que

no se rechaza la hiptesis nula, en caso contrario se rechaza H0 lo cual

implica aceptar H1 . Es decir, si Zp1-p2 <

no se rechaza H0 .

- Si se ha planteado la hiptesis alternativa como:

H1 : 1 < 2 H1 : 1 - 2 < k, se tiene una prueba de hiptesis a una cola inferior,


quedando el nivel de significancia ( ) en la parte inferior de la distribucin, como se aprecia
en la figura 3.3
Z pertenece a una distribucin Normal estndar. Si el valor de la estadstica de trabajo
(Zp1-p2) es mayor que Z no se rechaza la hiptesis nula, en caso contrario se rechaza H o lo
cual implica aceptar H1 . Es decir, si Zp1-p2 > Z no se rechaza H0 .

EJEMPLO
Se seleccion una muestra aleatoria de 100 hombres y 100 mujeres de un departamento de
Colombia; se hall que de los hombres 60 estaban a favor de una ley de divorcio y de las
mujeres 55 estaban a favor de dicha ley. Con base en sta informacin, pruebe que la
proporcin de hombres que favorece sta ley es mayor que la proporcin de mujeres. Asuma
un nivel de confianza del 99 por ciento.
Solucin
H0 :

H=

H1 :

H>

Se utiliza la expresin 3.14

Por la hiptesis alternativa se trabaja a una cola superior. En la tabla de la distribucin


normal con una confiabilidad del 99 por ciento, el valor de Z es 2,33. La estadstica de
trabajo est en la zona de no rechazo de la hiptesis nula (figura 3.19), es decir, con una
seguridad del 99 por ciento se concluye que no hay diferencia en la proporcin de hombres y
mujeres que favorecen la ley de divorcio.

Figura 3.19 Regla de decisin para una prueba de hiptesis a una cola superior

REGRESION Y CORRELACION
Cuando se posee informacin acerca de dos o ms variables relacionadas, es natural buscar
un modo de expresar la forma de la relacin funcional entre ellas. Adems, es deseable
conocer la consistencia de la relacin. Es decir, no se busca solamente una relacin
matemtica que nos diga de qu manera estn relacionadas las variables, sino que se desea
saber tambin con qu precisin se puede predecir o pronosticar el valor de una variable, si
se conocen o suponen valores para las otras variables. Las tcnicas usadas para lograr estos
dos objetivos se conocen como mtodo de regresin y correlacin.
Los mtodos de regresin se usan para elegir la "mejor" relacin funcional entre las
variables, es decir, la funcin o ecuacin que mejor se ajuste a los datos. Mientras que los
mtodos de correlacin se utilizan para medir el grado de asociacin o de relacin entre las
distintas variables.
Se debe tener en cuenta que la nica persona que puede decir con seguridad, que las
variables bsicas son las que se estn utilizando y que el mecanismo bsico opera de
acuerdo con la funcin matemtica elegida, es una persona bien entrenada en el asunto o
campo en el cual se est investigando. El anlisis estadstico es solamente un instrumento
que ayuda en el anlisis e interpretacin de los datos.

METODOLOGIA
Para dar un ejemplo de la metodologa, consideramos la teora Keynesiana del consumo 1: los
hombres estn dispuestos, por regla general y en promedio, a aumentar su consumo a
medida que su ingreso crece, aunque no tanto como el crecimiento de dicho ingreso.
Especificacin del modelo . Aunque Keynes postula una relacin positiva entre consumo e
ingreso, no especifica la forma precisa de la relacin funcional entre las dos variables,
entonces se puede sugerir la siguiente forma para la funcin de consumo de Keynes:
Y=

donde:
Y: son los gastos de consumo
X: ingreso
y

parmetros, siendo

la pendiente o propensin marginal a consumir.

Estimacin : especificado el modelo, se hacen las estimaciones de los parmetros del


modelo a partir de los datos disponibles.
Verificacin : Una vez obtenidas las estimaciones de los parmetros, se establece si las
estimaciones obtenidas estn de acuerdo con lo que se espera de la teora que se est
verificando.
Predicciones : La ecuacin obtenida se utiliza para predecir el valor futuro de la variable
dependiente con base en valores supuestos para la variable independiente.

MODELO LINEAL SIMPLE


4.2.1 Funcin de regresin poblacional
Una funcin de regresin poblacional es la unin de los promedios condicionales de la
variable dependiente (Y) para los valores fijos de la variable independiente o explicativa (X),
as que:

E(Y/Xi ) = f(Xi )
Si E(Y/Xi ) es una funcin lineal de Xi , se tiene:
E(Y/Xi ) =

Xi

Lo cual nos indica que el valor promedio de Y vara con X.

de regresin y especficamente,
coeficiente de interseccin y
anterior se conoce como funcin de regresin poblacional.

se denominan coeficientes
la pendiente. La ecuacin

Para un valor dado de Xi , los valores de Y se concentran alrededor del promedio de Y, lo cual
indica que se van a presentar algunas diferencias o desviaciones de un valor individual de Yi
alrededor de su valor esperado, por lo tanto:
Y i = E(Y/Xi ) + ui
Donde ui es una variable aleatoria que toma valores positivos o negativos. Esta ui se puede
considerar como una variable sustitutiva de todas las variables omitidas que pueden afectar
a Y, pero que por una u otra razn no pudieron incluirse en el modelo de regresin.
Reemplazando el E(Y/Xi ) se tiene:
Yi=

Xi + ui

que es la funcin de regresin poblacional.


4.2.2 Funcin de regresin muestral
Generalmente es necesario trabajar con informacin muestral y no poblacional, por lo tanto,
se plantea una ecuacin que nos permita estimar los valores de E(Y/X i ), b 0 , b 1 y u i ; as
que el objetivo es estimar la funcin de regresin poblacional con base en la funcin de
regresin muestral:

El caso ms simple de regresin es cuando se tienen dos variables (una dependiente y una
independiente o explicativa), es decir, n parejas de datos.
Una vez especificadas las variables es necesario determinar la relacin entre ellas, de la cual
se puede tener una idea general, graficando las variables en un sistema de coordenadas, en
donde, en el eje de las abcisas se ubica la variable independiente y en el de las ordenadas la
variable dependiente; esta grfica se llama nube de puntos .
La relacin ms sencilla es la lineal, la funcin de regresin poblacional es:
Yi =

Xi + ui

La cual no se puede observar directamente, por lo tanto, la estimamos a partir de la funcin


de regresin muestral:

Donde:

El significado grfico de estos coeficientes aparece en la figura 4.1.


Debido a que los valores observados no forman exactamente una lnea recta, es necesario
elegir un mtodo para estimar los coeficientes de regresin
que haga mnima la
diferencia entre los valores observados y los estimados o ajustados, este mtodo es el de los
mnimos cuadrados, (el procedimiento para obtener estos coeficientes se halla en el anexo A)
el cual proporciona las ecuaciones 4.2 y 4.3:

Figura 4.1 Representacin grfica de los coeficientes de regresin

Interpretacin de los coeficientes de regresin:

Es el valor promedio de la variable dependiente cuando la independiente vale cero.


Tambin se interpreta como el efecto promedio sobre la variable dependiente de todas las
variables omitidas en el modelo de regresin.

Cuando el valor del coeficiente de interseccin


sea negativo y su interpretacin no sea
lgica, se interpreta como cero, pero para efectos de proyeccin se deja el valor obtenido.

Si

la relacin entre las variables es directa y mide el incremento de la variable

dependiente por cada aumento de una unidad en la variable independiente. Si


la
relacin entre las variables es inversa y mide el decremento de la variable dependiente por
cada aumento de una unidad en la variable independiente o viceversa.
4.2.3 Supuestos tericos del mtodo de los mnimos cuadrados
Los supuestos tericos generales bajo los cuales se ha desarrollado la teora de la regresin
se presentan a continuacin:
1. El valor promedio de los errores es igual a cero; E(ei /Xi ) = 0
2. No existe autocorrelacin entre los errores; por lo tanto la covarianza (Cov) de los errores
es igual a cero, Cov (ei , ej ) = 0 , lo cual implica que no existe autocorrelacin en la variable
dependiente, es decir, Cov (Yi , Yj ) = 0.
3. La varianza de los errores es constante, es decir existe la homocedasticidad V(e i /Xi ) =
, lo cual implica que V(Yi /Xi ) =
4. No existe correlacin entre los errores (ei ) y la variable independiente X, por lo tanto:
Cov (ei , Xi ) = 0
5. El modelo de regresin est correctamente especificado tanto en la forma funcional como
en las variables que estn en el modelo.
La explicacin sobre estos supuestos y sus implicaciones, se trata en el apartado 4.5.
4.2.4 Coeficiente de determinacin
El objetivo principal del anlisis de regresin es proyectar el valor de la variable dependiente
conociendo o suponiendo valores para la variable independiente. La confiabilidad de las
proyecciones est dada por la confiabilidad de la ecuacin, la cual se mide a travs del
coeficiente de determinacin y de los errores de los coeficientes de regresin. El coeficiente
de determinacin (R2 ) nos dice qu tanto se ajusta la lnea de regresin a los datos.

Figura 4.2 Descomposicin de la variacin de Y

Para deducir este coeficiente se tiene en cuenta la figura 4.2 en donde se tiene la ecuacin
ajustada a unos datos. Para un valor dado de X se ha tomado el correspondiente valor de Y.
La distancia que hay entre el valor observado y la media
, puede descomponerse
en dos partes que son: la distancia entre el valor observado y el estimado con la ecuacin de
regresin
decir:

y la distancia entre el valor estimado y el promedio

, es

Siendo:

: Distancia Total.

: Distancia de una observacin a la regresin o residuo

: Distancia de la lnea de regresin a la media o distancia de la regresin


Como se tienen n observaciones, para cada caso se presenta la misma situacin, por lo tanto
se toma la suma de estas distancias al cuadrado:

En el anexo B se presenta la demostracin de que:

Es decir: SCT = SCR + SCE (4.4)


Lo cual indica que la SCT puede descomponerse en dos partes, una describe la variacin de
los residuos (SCR) y representa aquella parte de la SCT que no ha sido explicada por la
ayuda de X y la otra parte describe los valores ajustados de Y, es decir, representa aquella
porcin de la SCT que ha sido explicada por la regresin de Y sobre X.
Dividiendo la ecuacin 4.4 por SCT se obtiene:

El segundo trmino es el coeficiente de determinacin, as que:

Donde:

Como puede observarse, el coeficiente de determinacin es la proporcin de la variable


dependiente explicada por la variable independiente y por lo tanto est entre 0 y 1. Es decir:
0 R 2 1.
A medida que el R 2 se acerca a 1, la ecuacin de regresin es ms confiable, ya que de la
expresin 4.5 se deduce que la SCR tiende a cero y entre ms cercano est el R 2 de cero, la
ecuacin es menos confiable ya que la SCE tiende a cero.
Una medida estrechamente relacionada a R 2 pero conceptualmente diferente es el
coeficiente de correlacin (R) que es una medida del grado de asociacin entre dos

variables. Puede calcularse como:


Donde: Sx y Sy son las desviaciones estndar de X y Y respectivamente.
A continuacin se presentan algunas propiedades del coeficiente de correlacin (R):
- -1

- El signo de R depende del signo de la covarianza o de la pendiente (

- R es de naturaleza simtrica; lo anterior implica que el coeficiente de correlacin entre X y


Y (Rxy ) es igual al coeficiente de correlacin entre Y y X (Rxy ).
- Si X y Y son estadsticamente independientes, el coeficiente de correlacin entre ellos es
cero, pero si R=0, no se puede inferir que las dos variables sean independientes. En otras
palabras, una correlacin igual a cero no implica necesariamente independencia.
- Es una medida de asociacin lineal o dependencia lineal nicamente; por consiguiente
no tiene sentido, utilizarlo para describir relaciones no lineales.
En el contexto del anlisis de regresin, R2 es una medida ms significativa que R, debido a
que el primero muestra la proporcin de la varianza en la variable dependiente explicada por
la(s) variable(s) explicativa(s) y, por tanto, proporciona una medida global de la magnitud
del efecto que ejerce la variacin existente en una variable sobre la variabilidad de la otra.
De otro lado R no nos permite realizar inferencias de este gnero. Adems, la interpretacin
de R en un modelo de regresin mltiple es de un valor dudoso"1

El coeficiente de determinacin (R2) es til para evaluar la ecuacin de regresin


integralmente, pero es necesario evaluar la confiabilidad de cada uno de los coeficientes de
regresin, lo cual se hace con los errores de estos coeficientes y ms especficamente con las
pruebas de hiptesis para cada uno de ellos.
4.2.6 Prueba de hiptesis para los coeficientes de regresion regresion
Como en toda prueba de hiptesis, lo primero que se hace es plantear las hiptesis:
H0 :
H1 :

= 0 (equivalente a decir que la variable Xi no se necesita en el modelo)


0 (equivalente a decir que la variable Xi se necesita en el modelo)

Estadstica de trabajo:

Regla de decisin (figura 4.3): si


<T<
se acepta la hiptesis nula, en caso contrario
se rechaza la hiptesis nula. Si el tamao de la muestra es grande (n 30) los valores de Z
se hallan en una tabla de la distribucin normal. Si el tamao de la muestra es pequeo (n <
30) los valores de Z se hallan en una tabla de la distribucin t con n-2 grados de libertad.
NOTA : Si la prueba de hiptesis es para
, en la hiptesis nula se est planteando que no
es necesario el coeficiente de interseccin en el modelo.
Una vez evaluado el modelo de regresin a travs del coeficiente de determinacin y de las
pruebas de hiptesis, es til construir un intervalo de confianza para la pendiente (
que el valor que se obtiene en el modelo de regresin para
El intervalo de confianza para

), ya

, es un estimador puntual

es:

Como en la prueba de hiptesis, el valor de Z se halla en la distribucin normal si n 30 y si


n < 30 en la distribucin t con n-2 grados de libertad.

Este intervalo se interpreta como los valores dentro de los cuales aumentar (si

disminuir si
la variable dependiente (Y) por cada aumento de una unidad en la
variable independiente (X), con un nivel de confianza del (1- ) por ciento.
4.2.7 Proyeccin media
El principal objetivo del anlisis de regresin es el proyectar o estimar el valor de la variable
dependiente (Y) cuando se conoce o se supone un valor para la variable independiente (X).
Este objetivo se logra cuando se reemplaza en la ecuacin de regresin 4.1 el valor supuesto
para X. El valor obtenido, es una estimacin puntual, por lo tanto se puede construir una
estimacin por intervalo, ya sea para el valor individual de Y dado un valor de X o para el
valor promedio de Y.

4.2.7.1 Proyeccin individual. Si se desea el intervalo de confianza para el valor individual


de Yi dado un valor de X como Xi , es necesario obtener la desviacin estndar para esta
estimacin, la cual es:

El intervalo de confianza para el valor de Yi es:

4.2.7.2 Proyeccion media. Como en el caso anterior, para obtener el valor promedio de Y
dado un valor de X como Xi , se debe obtener la desviacin estndar para esta estimacin:

El intervalo de confianza para el valor promedio de Y es:

Cuando se utiliza la ecuacin de regresin para hacer proyecciones, se debe tener muy
presente que a medida de que nos alejemos del rango dentro del cual se observ X, la
proyeccin pierde confiabilidad y adems estos valores proyectados tienen sentido en la
medida que se conserven las condiciones bajo las cuales se observaron las variables.

4.2.8 Evaluacin de resultados


Despus de realizado el anlisis de regresin, se deben tener algunos criterios para saber
qu tan "buenos" son los resultados?. Ante todo, los signos de los coeficientes estimados
deben estar de acuerdo con las expectativas tericas o previas.... Segundo, si la teora o la
experiencia previa nos lleva a creer que un coeficiente determinado es, en trminos
estadsticos, significativamente diferente de cero, ... ,entonces si los resultados reales son de
hecho significativos, nuevamente se puede decir que stos son consistentes con la teora.
Tercero, puesto que el R2 mide la bondad global del ajuste del modelo de regresin
estimado, se puede decir que el modelo es satisfactorio si el valor de R 2 es razonablemente
alto, digamos, alrededor de 0,8. Pero este criterio no se debe ponderar demasiado ,
puesto que siempre se puede aumentar el R 2 agregando al modelo variables explicativas
adicionales. Por tanto, si los dos primeros criterios se cumplen y R2 es razonablemente alto,
todo est bien. Pero si se satisfacen los dos primeros criterios y el valor de R2 es bajo, por
ejemplo, menor que 0.6, no debemos desanimarnos." 1

EJEMPLO
Con la informacin sobre el consumo anual de agua y el nmero de suscriptores al servicio
de acueducto en Manizales entre 1977 y 1988 (cuadro 4.1) se aplica toda la teora vista
anteriormente.

Primero se debe identificar cul es la variable dependiente y cul la independiente; en ste


caso, el consumo de agua depende del nmero de suscriptores.
Para tener una idea general sobre el modelo o ecuacin que se puede ajustar a stos datos
se grafica la informacin en un sistema de coordenadas (Figura 4.4). En sta grfica se
puede observar que los datos siguen un comportamiento aproximadamente lineal; por lo
tanto se trabaja con la ecuacin 4.1.

Cuadro 4.1. Manizales: consumo anual facturado (en miles de metros cbicos) y nmero de
suscriptores al servicio de acueducto en el sector residencial. 1977-1988

AOS
1977
1978
1979
1980
1981
1982
1983
1984
1985
1986
1987
1988

CONSUMO (Y) SUSCRIPTORES (X)


9.775
22.192
11.028
23.256
11.120
24.747
13.267
27.869
12.045
29.636
12.879
32.458
13.740
36.230
13.673
39.074
13.593
40.729
13.940
41.823
14.990
43.380
15.163
44.684

Fuente: DANE. Monografa de Manizales, 1988. Cuadro 20.1.3, Pg.283

Fuente: cuadro 4.1


Figura 4.4 Manizales: Consumo anual (en miles de metros cbicos) y nmero de suscriptores
al servicio de acueducto en el sector residencial. 1977-1988
Con la informacin del cuadro 4.1 se obtienen los siguientes resultados:

n=12 M(X) = 33.839,833 M(X2 ) = 1.206'677.103 V(X) = 61'542.783,3


M(Y) = 12.934,4167 V(Y) = 2'470.383,077 M(X,Y) = 449'151.787

Para obtener

se utiliza la ecuacin 4.2:

El coeficiente de interseccin (
) indica que el consumo promedio anual de agua, debido a
otras variables no consideradas en el modelo, es de 6'636.730 (6.636,73 * 1000) metros
cbicos.
La pendiente por ser positiva, indica que hay una relacin directa entre el nmero de
suscriptores y el consumo de agua. El valor de 0,1861 indica que por cada suscriptor ms, el
consumo anual de agua se incrementa en 186,1 (0,1861 * 1000) metros cbicos.

El coeficiente de determinacin (R2 ) se obtiene con la ecuacin 4.5, para lo cual es necesario
hallar la Suma de Cuadrados Explicada (SCE) y la Suma de Cuadrados Total (SCT), con las
ecuaciones 4.6 y 4.7 respectivamente.
La Suma de Cuadrados de los Residuos (SCR) se obtiene con la ecuacin 4.8:

Por lo tanto, el coeficiente de determinacin (R2 ) es:

Este resultado indica que la ecuacin es confiable, ya que tenemos un valor cercano a 1.
Adems, quiere decir que el 86,26% del consumo de agua se debe o est explicado por el
nmero de suscriptores.

Para hacerle la prueba de hiptesis a cada uno de los coeficientes de regresin ( b 0 y b 1 ),


es necesario hallar los errores de los coeficientes, los cuales se obtienen con las ecuaciones
4.10 y 4.11:

Prueba de hiptesis para


H0 :
H1 :

= 0 (no es necesario el coeficiente de interseccin en el modelo)


0 (es necesario el coeficiente de interseccin en el modelo)

Regla de decisin: Para una confiabilidad del 95%, el valor en la distribucin t con 10 grados
de libertad es: 2,228. El valor de la estadstica de trabajo (T) est en la zona de rechazo
para H 0 (figura 4.5), por lo tanto se acepta que b 0 es diferente de cero, es decir que el
coeficiente de interseccin es necesario en el modelo.

Figura 4.5 Regla de decisin: prueba de hiptesis para


Prueba de hiptesis para

H0 :

= 0 (no hay relacin entre consumo de agua y No. de suscriptores)

H1 :

0 (s hay relacin entre consumo de agua y No. de suscriptores)

El valor de la estadstica de trabajo (T) est en la zona de rechazo para H0 (figura 4.5), por
lo tanto se acepta H1 , lo cual indica que s hay relacin entre el consumo de agua y el
nmero de suscriptores.
Con el valor obtenido en el coeficiente de determinacin, los signos de los coeficientes de
regresin y el resultado de las pruebas de hiptesis se puede concluir que el modelo es
confiable y por lo tanto, lo son las proyecciones o pronsticos que se hagan con dicho
modelo.
Intervalo de confianza para : El valor que se obtuvo para b 1 es una estimacin
puntual. La estimacin por intervalo se obtiene con la ecuacin 4.13:

Indicando que con una confiabilidad del 95%, por cada suscriptor ms, el consumo anual de
agua se incrementa entre 129 y 234 metros cbicos.
Proyeccin media . Se desea estimar o proyectar el consumo promedio anual de agua, si
se tienen 52.900 suscriptores.
Se reemplaza el valor de X en la ecuacin de regresin obtenida, as que:

Por lo tanto, si se tienen 52.900 suscriptores, el consumo promedio anual de agua, es de


16'508.420 metros cbicos.
La desviacin estndar para ste valor proyectado, se obtiene con la ecuacin 4.16:

El intervalo de confianza para el consumo promedio anual, se obtiene con la ecuacin 4.17:

Por lo tanto, con una confiabilidad del 95%, si el nmero de suscriptores es de 52.900, el
consumo promedio anual de agua, estar entre 15'430.270 y 17' 585.730 metros cbicos .

Intervalo de confianza para la diferencia de medias en dos


poblaciones

MUESTRAS RELACIONADAS o MUESTRAS PAREADAS

En general, supngase que los datos consisten de

pares

Las variables aleatorias


tienen medias

, respectivamente. Sea

la diferencia entre las

variables aleatorias en el j-simo para, esto es,


.
Supngase que las diferencias estn distribuidas de manera normal con
media

y varianza

. Las variables aleatorias dentro de los

son independientes. Sin embargo, dado que existen dos


mediciones de la misma unidad experimental, es posible las dos
mediciones

par no sean independientes. Considrese las

diferencias

Puede demostrarse con facilidad que la media


aleatoria

de la variable

es:

debido a que el valor esperado de

es la diferencia en los

valores esperados, sin importar si


varianza de la diferencia es:

son independientes. La

Por lo tanto, la media de las diferencias


promedio muestral de las

mientras que

varianza muestral de las diferencias

se estima con
se estima con

, el
, la

Para construir el intervalo de confianza ntese que:

sigue una distribucin

con

grados de libertad. Entonces,

Por lo tanto, un intervalo de confianza para

se obtiene:

Con el anterior intervalo se puede tambin probar la hiptesis nula


versus la alternativa

donde se rechaza la hiptesis nula si el valor cae fuera de este


intervalo de confianza. Adems, para probar esta hiptesis se puede
hacer uso del estadstico:

el cual rechaza

si

EJEMPLOS
Considernse el siguiente conjunto de datos:

los cuales tienen que ver con el tiempo que requieren 14 sujetos que
estacionan dos automviles sustancialmente distintos en cuanto al

tamao de la llanta y la relacin de vueltas del volante. Construya un


intervalo de confianza del 90% e interprete el resultado obtenido.
Solucin.
El inters es la diferencia entre el automvil 1 el 2

Un intervalo de confianza del 90% para esta diferencia es:

Ntese que el intervalo de confianza para


incluye el cero. Esto
implica que, con un nivel de confianza del 90%, los datos no apoyan la
afirmacin de que los automviles tienen diferentes tiempos promedio
de estacionamiento.
Si se utiliza el estadstico, se encuentra:

No rechazandose tambien la hiptesis nula.

Ejercicio 5
El administrador de un lote de automviles prueba dos marcas de
llantas radiales. Para ello asigna al azar una llanta de cada marca a
las dos ruedas posteriores de ocho automviles, y luego corre los
automviles hasta que las llantas se desgastan. Los datos obtenidos
(en kilmetros) aparecen en la siguiente tabla:

Encuentre un intervalo de confianza del 99% para la diferencia en el


tiempo promedio de duracin y con base en estos resultados, qu
llanta es la que usted preferira?

Ejercicio 6
Un cientfico de la computacin esta investigando la utilidad de dos
lenguajes de diseo para mejorar las tareas de programacin. Se pide a
doce programadores expertos, familiarizados con los dos lenguajes, que
codifiquen una funcin estndar en ambos lenguajes, anotando el
tiempo, en minutos, que requieren para hacer esta tarea. Los datos
obtenidos son los siguientes:

Encuentre un intervalo de confianza del 95% para la diferencia entre


los tiempos de codificacin promedio. Existe algo que indique una
preferencia por alguno de los dos lenguajes?

MUESTRAS INDEPENDIENTES Y VARIANZAS CONOCIDAS


Supngase que se tiene dos poblaciones independientes con medias
desconocidas

, y varianzas conocidas

, respectivamente.

Se desea encontrar un intervalo de confianza del

para la

diferencia de las medias

Sean

una muestra aleatoria de

de la primera poblacin y

observaciones tomadas

una muestra aleatoria de

observaciones tomadas de la segunda poblacin. Si


medias muestrales, la estadstica

son las

es un estimador puntual de

. La variable aleatoria

tiene una distribucin normal estndar si las dos poblaciones son


normales, o es aproximadamente normal estndar si se cumplen las
condiciones del teorema del lmite central, respectivamente.

Esto implica que:

La anterior expresin se puede expresar como:

Por lo tanto, un intervalo de confianza para la diferencia entre


se obtiene:

Con el anterior intervalo se puede tambin probar la hiptesis nula


versus la alternativa

, donde se

rechaza la hiptesis nula si el valor


cae fuera de este intervalo de
confianza. Adems, para probar esta hiptesis se puede hacer uso del
estadstico:

el cual rechaza

si

MUESTRAS INDEPENDIENTES Y VARIANZAS DESCONOCIDAS PERO


IGUALES
Tanto las medias
y
como las varianzas
y
son desconocidas.
Sin embargo, considrese que es razonable suponer que las dos
varianzas son iguales; esto es,

Se desea encontrar un

intervalo de confianza del

para la diferencia de las

medias
Se toman muestras aleatorias de tamao

de las dos poblaciones

representadas por

muestrales, y

las varianzas muestrales. Puesto que

, respectivamente; sean

estimadores de la varianza comn


estimador combinado de
estimador es:

las medias
y

, entonces puede obtenerse un

, mejor que

por separado. Este

son

Para desarrollar el intervalo de confianza para


distribucin de la estadstica:

es la distribucin

con

ntese que la

grados de libertad. Por lo tanto,

La anterior expresin se puede expresar como:

Por lo tanto, un intervalo de confianza para la diferencia entre


se obtiene:

Con el anterior intervalo se puede tambin probar la hiptesis nula


versus la alternativa

, donde se

rechaza la hiptesis nula si el valor


cae fuera de este intervalo de
confianza. Adems, para probar esta hiptesis se puede hacer uso del
estadstico:

el cual rechaza

si

EJEMPLOS
Un artculo publicado en el Hazardous Waste and Hazardous Materials
(Vol. 6, 1989) dio a conocer los resultados de un anlisis del peso de
calcio en cemento estndar y en cemento contaminado con plomo. Los
niveles bajos de calcio indican que el mecanismo de hidratacin del
cemento queda bloqueado y esto permite que el agua ataque varias
partes de una estructura de cemento. Al tomar diez muestras de cemento
estndar, se encontr que el peso promedio de calcio es 90.0, con una
desviacin estndar muestral 5.0; los resultados obtenidos con 15
muestras de cemento contaminado con plomo fueron que el peso promedio
es de 87.0 y una desviacin estndar de 4.0.
Supngase que el porcentaje de peso de calcio est distribuido de
manera normal. Encuntrese un intervalo de confianza del 95% para la
diferencia entre medias de los dos tipos de cemento. Por otra parte,
supngase que las dos poblaciones normales tienen la misma desviacin
estndar.
Solucin
El inters es la diferencia entre el promedio del peso de los cementos
:

Un intervalo de confianza del 95% para la diferencia en los pesos


promedio de los cementos es:

donde,

Por lo tanto, la estimacin combinada de la desviacin estndar es


El intervalo de confianza del 95% se obtiene como:

Ntese que el intervalo de confianza incluye el cero; por


consiguiente, para este nivel de confianza, no puede concluirse la
existencia de una diferencia entre las medias. Dicho de otra manera,
no hay evidencia alguna de que la contaminacin del cemento por plomo
tenga efecto sobre el peso promedio de calcio; en consecuencia, con un
nivel de confianza del 95%, no es posible afirmar que la presencia de
plomo afecte este aspecto del mecanismo de hidratacin
Si se utiliza el estadstico presentado en (2), se encuentra:

No rechazandose la hiptesis nula.


Si se utiliza el valor p para una prueba de hiptesis bilateral, este
valor resulta igual a 2P(T
=2P(T

>T

>1.67). Por lo tanto el valor p es tal que 0.1<p-valor<0.2, no

rechazndose la hiptesis nula. Si se decidiera rechazar H , se podra


cometer un error mayor del 10% en el caso que H

fuese verdadera.

Ntese que al usar las tres metodologas de decisin, los resultados


concuerdan.

Ejercicio 1
Un fabricante produce anillos para los pistones de un motor de
automvil. Se sabe que el dimetro del anillo est distribuido
aproximadamente de manera normal, y que tiene una desviacin estndar
mm. Una muestra aleatoria de 15 anillos tiene un diametro
promedio de

mm.

a. Construya un intervalo de confianza bilateral del 99% para el


dimetro promedio del anillo. b. Construya un lmite inferior de
confianza del 95% para el dimetro promedio del anillo.

Ejercicio 2
Un experimento para comparar la resistencia de cohesin a la tensin
del mortero modificado de ltex de polmeros (mortero de cemento
portland al que se han agregado emulsiones de ltex de polmeros
durante el mezclado), con la resistencia de mortero no modificado
resulto en

kgf/cm
kgf/cm

para el mortero modificado

para el mortero sin modificaciones

y
. Sean

y
las verdaderas resistencias de cohesin a la tensin para los
morteros modificado y no modificado, respectivamente.

a. Si se supone que

, pruebe

vs

al nivel de significancia del 1%.


b.Mediante un intervalo de confianza pruebe la hiptesis planteada en
el inciso a.

Das könnte Ihnen auch gefallen