Sie sind auf Seite 1von 64

ESTADISTICA EXPERIMENTAL

PARA LA TOMA DE DECISIONES


ANEXO APUNTES DE CLASE
Maestra en Ingeniera Industrial PUCP

Eduardo Carbajal Lpez


Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

INDICE

INDICE ................................................................................................................... 2

CONCEPTOS BSICOS DE ESTADSTICA .................................................................. 4

INTRODUCCIN.........................................................................................................................................4
DEFINICIONES...........................................................................................................................................4
ESTIMACIN PUNTUAL Y POR INTERVALOS .......................................................................................................6

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN ............................................ 7

MEDIDAS DE TENDENCIA CENTRAL ........................................................................................................7


MEDIDAS DE DISPERSIN ......................................................................................................................9

ALGUNAS DISTRIBUCIONES DE PROBABILIDAD ................................................... 13

REVISIN DE VARIABLES ALEATORIAS ........................................................................................................... 13


DISTRIBUCIN TRIANGULAR....................................................................................................................... 14
DISTRIBUCIN UNIFORME (RECTANGULAR) ................................................................................................... 16
DISTRIBUCIN NORMAL ........................................................................................................................... 17
DISTRIBUCIN DE POISSON ................................................................................................................. 21
OTRAS DISTRIBUCIONES ...................................................................................................................... 21
EJERCICIOS PROPUESTOS..................................................................................................................... 24

INTERVALOS DE CONFIANZA ............................................................................... 25

INTERVALO DE CONFIANZA PARA LA MEDIA .................................................................................................... 25


INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS MEDIAS ......................................................................... 28

Pgina | 2
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

PRUEBA DE HIPTESIS ......................................................................................... 31

TIPOS DE ERRORES ................................................................................................................................... 31


HIPTESIS UNILATERALES Y BILATERALES. ...................................................................................................... 32
PROCEDIMIENTO GENERAL ........................................................................................................................ 33
HIPTESIS REFERENTE A UNA MEDIA ............................................................................................................ 36
HIPTESIS REFERENTE A DOS MEDIAS Y DOS VARIANZAS. ................................................................................... 38
EJERCICIOS PROPUESTOS..................................................................................................................... 41

ANLISIS DE VARIANZA ....................................................................................... 42

EXPERIMENTOS CON UN SOLO FACTOR.......................................................................................................... 42


DISEO CON BLOQUES ALEATORIZADOS ........................................................................................................ 46
EXPERIMENTOS DE DOS FACTORES ............................................................................................................... 50
EJERCICIOS PROPUESTOS..................................................................................................................... 54

ANLISIS DE REGRESIN ..................................................................................... 55

REGRESIN LINEAL SIMPLE......................................................................................................................... 55


REGRESIN LINEAL MLTIPLE ..................................................................................................................... 58
EVALUACIN DE LA REGRESIN LINEAL.......................................................................................................... 59
EJERCICIOS PROPUESTOS..................................................................................................................... 64

Pgina | 3
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

ESTADISTICA EXPERIMENTAL PARA LA TOMA DE DECISIONES.

CONCEPTOS BSICOS DE ESTADSTICA

INTRODUCCIN
El entorno en el que se desarrolla nuestra actividad profesional es cada vez ms complejo y dinmico;
los clientes siempre demandan mejores productos y es posible satisfacerlos porque la tecnologa,
transporte y comunicaciones se han desarrollado grandemente.

No slo se trata de sobrevivir en el mercado como empresa o como persona en el puesto de trabajo,
sino se trata de tener el ratio de mejora ms creciente, el ratio de mejora de mayor pendiente.

El asunto es cmo mejorar?. Este es un tema muy tratado, pero con un enfoque no adecuado. Son los
mtodos de mejora planteados desde los conceptos de calidad los que mejores resultados han
obtenido en cuanto a los beneficios logrados despus de la mejora, y todos ellos se basan en conceptos
estadsticos. Es difcil explicar que en una organizacin todos deben tener conocimientos de
estadstica, quizs se pueda convertir hasta en una frustracin, pero es necesarios que as sea.

Lgicamente no todos deben saber de diseo de experimentos o de anlisis de regresin logstica; de


lo que se trata es que todos tengan el pensamiento estadstico, es decir, conocimientos de
herramientas estadsticas adecuadas para el trabajo y las decisiones que van a tomar.

DEFINICIONES
Estadstica: Es una ciencia que proporciona mtodos, tcnicas, procedimientos, para: recopilar,
organizar, presentar, analizar datos con el fin de describirlos o de realizar generalizaciones vlidas. Es
una ciencia que nos permite organizar datos para obtener informacin que permita evaluar el
desempeo del proceso que proporcionan los datos y finalmente tomar decisiones.

Pero de dnde nace la estadstica? pues de algo que se comentaba en la introduccin: la


variabilidad. Las cosas cambian, no existen en la naturaleza dos entidades con los mismos valores para
una de sus dimensiones.

La estadstica, pues, se encarga de recolectar datos de los distintos procesos en donde esta presenta la
variacin y analizarlos. Nos interesa que esto se realice con el objetivo de entender la variacin,
identificar sus causas y reducirla, como evidencia de mejora del proceso.

La estadstica tradicionalmente se divide en Estadstica Descriptiva y Estadstica Inferencial, tal como se


explica en el esquema de la pgina siguiente.

Pgina | 4
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

P OBLACIN
Una poblacin est formada por la totalidad de las observaciones en las cuales se tiene cierto inters.
Si el conjunto de estas observaciones es enumerable se denomina poblacin finita. Si no lo es, se
denomina poblacin infinita.

M UESTRA
Una muestra es un subconjunto de observaciones seleccionadas de una poblacin. Para que las
inferencias sean vlidas, la muestra debe ser representativa de la poblacin. A menudo resulta
atractivo seleccionar las observaciones ms convenientes corno muestra o ejercitar el juicio en la
seleccin de la muestra.

Es frecuente que estos procedimientos introduzcan un sesgo en la muestra, lo que trae como
consecuencia que el parmetro de inters sea subestimado (o sobrestimado) por la muestra.

Por otra parte, no es posible describir de manera estadstica el comportamiento de una muestra de
este tipo. Para evitar estas dificultades, es deseable seleccionar una muestra aleatoria como el
resultado de un mecanismo aleatorio.

En consecuencia, la seleccin de una muestra es un experimento aleatorio, y cada observacin de la


muestra es el valor observado de una variable aleatoria. Las observaciones en la poblacin
determinan la distribucin de probabilidad de la variable aleatoria.

E STADSTICA
Una estadstica es cualquier funcin de las observaciones contenidas en una muestra aleatoria. Por
ejemplo, si X1 , X2 , , Xn es una muestra aleatoria de tamao n, entonces la media muestral X , la
varianza muestral S2 , y la desviacin estndar muestral S, son estadsticas.

Puesto que una estadstica es una variable aleatoria, sta tiene una distribucin de probabilidad. Se
conoce como distribucin de muestreo a la distribucin de probabilidad de una estadstica.

Pgina | 5
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

E STIMADORES
Una variable aleatoria se caracteriza o describe mediante su distribucin de probabilidad. Tal
distribucin es descrita, a su vez, por sus parmetros. Por ejemplo, la media y la varianza 2 de la
distribucin normal son sus parmetros, mientras que es el parmetro de la distribucin de Poisson.
En el control estadstico de calidad se usa la distribucin de probabilidad para describir o modelar
alguna caracterstica de la calidad, como la dimensin crtica de un producto, o la fraccin de
defectuosos en un proceso de manufactura. Por lo tanto, interesa hacer inferencias respecto a los
parmetros de distribuciones de probabilidad.

Como suelen desconocerse los parmetros, es necesario disponer de procedimientos para estimarlos a
partir de datos muestrales y para ello se utilizan dos tipos de estimaciones: puntual y por intervalo.

Valor Esperado o esperanza matemtica - E(x):

n
- variable aleatoria discreta x E ( x ) xi . p i
i 1


- variable aleatoria continua x E ( x ) x. f ( x).dx

ESTIMACIN PUNTUAL Y POR INTERVALOS


Es la estimacin del valor del parmetro por medio de un nico valor obtenido mediante el clculo o
evaluacin de un estimador para una muestra especfica.
El estimador se expresa mediante una frmula. Por ejemplo, la media de la muestra:
n

X
1
X i
n i 1

es un posible estimador puntual de la media poblacional

A continuacin se presenta estimadores puntuales de la media, de la proporcin, de la varianza, de


diferencia de promedios y de la diferencia de proporciones.
Parmetro Estimador puntual

X
S2

p p

X1 X2

Pgina | 6
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

S12

S 22

p1 - p2 p1 p2

Es probable que un slo nmero no sea tan significativo como un intervalo, dentro del cual se espera
encontrar el valor de un parmetro. Una estimacin por intervalo de un parmetro es el intervalo
limitado por dos estadsticas, de manera que incluye el verdadero valor del parmetro con cierta
probabilidad. El intervalo estimado recibe el nombre de intervalo de confianza.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN

MEDIDAS DE TENDENCIA CENTRAL


Al describir grupos de observaciones, con frecuencia es conveniente resumir la informacin con un solo
nmero. Este nmero que, para tal fin, suele situarse hacia el centro de la distribucin de datos se
denomina medida o parmetro de tendencia central o de centralizacin. Entre las medidas de
tendencia central tenemos:

L A MEDIA O PROMEDIO
La media, es la suma de los valores observados dividida entre el nmero de observaciones. As pues si
se tienen las temperaturas mximas para cada da de la ltima semana: 15, 16, 18, 17, 15, 16 y 19 C, el
promedio o la media de temperatura mxima para la semana ser:
n
Xi 15 16 18 17 15 16 19
i 1
X 16 .57 C
n 7

donde Xi es la temperatura para cada da de la semana pasada.

Algunas propiedades del promedio son:


Su clculo es muy sencillo y en l intervienen todos los datos.
Su valor es nico para una serie de datos dada.
Se usa con frecuencia para comparar poblaciones, aunque es ms apropiado acompaarla de
una medida de dispersin.

L A M EDIANA
Para calcular la mediana de un grupo de datos es necesario ordenarlos primero y luego identificar cul
es el valor que est en el medio. La mediana ser el valor que tiene por debajo de l al 50% de las
observaciones menores y por encima de l est el 50% de las observaciones mayores. En la tabla

Pgina | 7
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

siguiente tenemos el nmero de productos vendidos en cada uno de los 24 das, ordenados (no se
olvide que si los datos no estn ordenados de menor a mayor, es necesario ordenarlos primero). El
50% de 24 es 12, eso quiere decir que debemos encontrar un nmero que separe a los 12 primeros
valores de ventas de los 12 ltimos. Entre la posicin 12 y la posicin 13, que corresponden a los
nmeros 25 y 27 respectivamente, se debe encontrar la mediana de la siguiente forma:

25 27
Me 26
2

Posicin 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24

Ventas
12 13 13 13 16 17 17 17 19 21 22 25 27 29 29 31 35 36 37 42 42 42 49 52
ordenadas

50% inferior Me=26 50% superior

Si la cantidad de datos fuera impar, por ejemplo la venta de 23 das solamente, el valor de la mediana
es ms fcil determinarlo, tal como podemos ver en la siguiente tabla. El valor de la posicin 12 tiene
11 datos por debajo y 11 datos por encima por lo que la Me=25.

Posicin 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Ventas
12 13 13 13 16 17 17 17 19 21 22 25 27 29 29 31 35 36 37 42 42 42 49
ordenadas

50% inferior Me=25 50% superior

Las principales propiedades de la mediana son:


Es menos sensible que la media a oscilaciones de los valores de la variable
Puede calcularse para datos agrupados en intervalos, incluso cuando alguno de ellos no est
acotado.
No se ve afectada por la dispersin. De hecho, es ms representativa que la media aritmtica
cuando la poblacin es bastante heterognea. Suele darse esta circunstancia cuando se
resume la informacin sobre los salarios de un pas o una empresa. Hay unos pocos salarios
muy altos que elevan la media aritmtica haciendo que pierda representatividad respecto al
grueso de la poblacin. Sin embargo, alguien con el salario "mediano" sabra que hay tanta
gente que gana ms dinero que l, como que gana menos.

L A M ODA
En un conjunto de datos, analizados individualmente, la moda es el valor que ms se repite. Si se trata
de datos agrupados en intervalos, podemos considerar que la moda es el centro del intervalo que tiene
mayor frecuencia, es decir, el intervalo con ms datos.

Pgina | 8
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Podra suceder que algunos datos no tengan moda o que tengan ms de una moda (ver la tabla
anterior de datos, en donde 13, 17 y 42 se repiten 3 veces cada uno, lo que nos indicara que hay 3
modas).

La moda no es muy usada para clculos matemticos ni de control de procesos, pues es un parmetro
muy bsico y poco riguroso en su determinacin.

Estas 3 medidas de tendencia central tienen sus ventajas y desventajas, que hacen sean aplicables en
uno u otro caso; por eso las describimos en la siguiente tabla.

Media Mediana Moda

Da una idea de dnde


Da una idea de dnde estn
Caracterstica Es el centro de estn localizadas la
localizadas la mayora de las
principal gravedad de los datos. mayora de las
observaciones
observaciones
En relacin al No usa todos los datos, No usa todos los datos, y los
Usa todas las
uso de los y los valores extremos valores extremos pueden
observaciones
datos pueden ser importantes ser importantes
No es necesario Es requerido poco
En relacin al No es necesario hacer
clasificar los datos, pero clculo, pero los datos
manejo de los clculos ni clasificar las
s hacer un clculo con deben estar clasificados
datos observaciones
todos los datos y ordenados
Sobre los
Pueden distorsionar el No es sensible a valores No es influenciado por
valores
valor de la media extrernos valores extremos
extremos
Puede no ser un valor Es un valor real, porque se
En algunos casos es un
Valor real real, ya que es obtiene de las
valor real
resultado de un clculo observaciones
Siempre se puede Siempre se puede Los datos pueden no tener
Existencia
determinar determinar moda
Frmula en
=Promedio(Datos) =Mediana(Datos) =Moda(Datos)
Excel

Las medidas de tendencia central tienen como objetivo el sintetizar los datos en un valor
representativo, sin embargo por si solas no siempre son representativas por la variabilidad de los
valores de la muestra. Es por eso que se recomienda emplear una medida de tendencia central, en
muchos casos junto con otra medida que nos de una idea del grado de dispersin de los datos.

MEDIDAS DE DISPERSIN
Las medidas de dispersin nos dicen hasta que punto las medidas de tendencia central son
representativas como sntesis de la informacin. Las medidas de dispersin cuantifican la separacin, la

Pgina | 9
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

dispersin, la variabilidad de los valores de la muestra respecto al valor central. Las medidas de
dispersin empleadas con mayor frecuencia son:

EL RANGO
El rango, es la diferencia entre el mximo valor y el mnimo valor del grupo de datos que se est
analizando. Nos da una idea general de qu tan grande es la variacin. Si entre los datos hay valores
fuera de lo normal, extraos (a estos datos se les llama espurios), el rango se va a ver afectado porque
ya sea el mximo valor (o el mnimo) va a ser ms grande (ms pequeo) de lo normal.
En Excel el rango usa la siguiente frmula: =Max(Datos)-Min(Datos). Si los datos fueran los de la
temperatura con los que se hall la media, 15, 16, 18, 17, 15, 16 y 19 C, el rango sera:

R = 19 15 = 4

E L RANGO INTERCUARTIL (RIC)


Para definir el rango intercuartil, primero debemos decir que un cuartil es aquel nmero que divide a
los datos en una cuarta parte. En un grupo de datos, existen cuatro cuartos, y 3 fronteras que los
dividen. Cada una de estas fronteras es un cuartil. En la tabla de datos siguiente se puede observar
que, luego de ordenar los datos de menor a mayor, se puede identificar la media Me = 25 como se
indic antes. El primer cuartil Q1 es el valor que divide la primera mitad en dos, es decir el que separa
al 25% inferior del 75% superior: Q1= 17. El tercer cuartil Q3 es el valor que divide la segunda mitad en
dos, es decir el que separa al 75% inferior del 25% superior: Q 3= 36. As pues, la mediana es llamada
tambin el segundo cuartil.

Posicin 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23

Ventas
12 13 13 13 16 17 17 17 19 21 22 25 27 29 29 31 35 36 37 42 42 42 49
ordenadas

25% inferior Q1 = 17 50% central Q3 = 36 25% superior

Una vez que hemos definido los cuartiles, el rango intercuartil marca la amplitud que hay desde el
primer al tercer cuartil, es decir, la amplitud del 50% central de los datos con los que se trabaja.

RIC = Q3 Q1

Para el ejemplo el RIC es 19. En Excel la funcin para calcular el cuartil es =Cuartil(Datos, Nmero de
Cuartil)

L A VARIANZA Y LA DESVIACIN ESTNDAR


La varianza, es una medida que cuantifica el grado de concentracin de los datos alrededor del centro
cuando el centro es definido como la media. La forma de clculo es:

Pgina | 10
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

x
n
2
i x
S2 i 1

n 1
donde n es la cantidad de datos que se usan para calcular el promedio x y xi es cada uno de esos
datos.

Si consideramos los datos de las temperaturas mximas para cada da de la ltima semana como: 15,
16, 18, 17, 15, 16 y 19 C, la varianza se calcula primero hallando la diferencia entre cada uno de los
valores y el promedio, luego esa diferencia se eleva al cuadrado y finalmente se suma la tercera
columna.

Temperatura x x i x x i x
2

(C)
(C) (C2)
15 -1.57 2.47
16 -0.57 0.33
18 1.43 2.04
17 0.43 0.18
15 -1.57 2.47
16 -0.57 0.33
19 2.43 5.90

x =16.57 13.71

Al dividir la suma entre el total de datos menos uno se tiene el valor de la varianza

x
n
2
i x
13.71
S2 i 1
2.2857 C 2
n 1 6

Usted puede darse cuenta que las unidades de las temperaturas son grados centgrados C y que al
elevar al cuadrado, la varianza termina con unidades de C 2 Para evitar usar dos unidades distintas, en
este ejemplo C y C2 se suele trabajar con la desviacin estndar, que es la raz cuadrada positiva de la
Varianza. Para este caso la desviacin estndar tiene un valor de s = 1.512.

Ejemplo 2.1
Se hace un estudio en el proceso de envase de fideos en bolsas de 250g. En la lnea de envase 1 las
bolsas tienen un peso promedio de 251g y una desviacin estndar de 2.1g. Analizando solamente el
valor de la desviacin estndar no se puede decir que la variacin que representa sea buena o no. La
lnea 2 tambin envasa el mismo producto y el promedio es 251.5g con una desviacin estndar de
2.5g. Ahora s, la desviacin estndar nos permite analizar que la variacin de los pesos en la lnea de
envase 1 es menor que en la lnea 2, es decir, la lnea 1 trabaja con menos variacin.

Pgina | 11
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Despus de hacer una limpieza, mantenimiento y calibracin en la lnea 2, resulta que se obtiene un
promedio de 250g y una desviacin estndar de 1.6g. Nos podemos dar cuenta que ha habido una
mejora en el proceso, los pesos son menos dispersos, independientemente del promedio, que tambin
se ha corregido.

La lnea 1 tambin es usada para envasar productos de 500g. En promedio las bolsas tienen 502g y la
desviacin estndar de los pesos es 3.5g. Qu pas con el proceso? Se da? Si comparamos los
2.1g con los 3.5 podemos concluir que ha aumentado la dispersin; pero ese anlisis no est
considerando que es una variacin de bolsas pequeas de fideos contra una variacin de bolsas
grandes. Para hacer ese anlisis es necesario presentar primero el concepto de coeficiente de
variacin.

C OEFICIENTE DE V ARIACIN
El coeficiente de variacin compara la desviacin estndar con la media, por lo que es til para
comparar la variabilidad de por lo menos dos grupos de datos que tienen promedios razonablemente
distintos.

S
CV
x

En el ejemplo que se discuta anteriormente, comparar las desviaciones estndares de 2.1g y 3.5g no se
justifica cuando stas son de procesos que tienen promedios muy distintos (prcticamente el doble). Si
se calcula el coeficiente de variacin (llamado tambin desviacin estndar relativa RSD) se tiene que:

Lnea 1 Lnea 1
250g 500g

Promedio 251g 502g

Desviacin estndar 2.1g 3.5g

Coef. de variacin 0.008367 0.006972

Entonces, comparativamente, la lnea 1 para 250g tiene mayor variacin relativa que para 500g. Dicho
de otra forma, la variacin para 250g es de 0.84% del promedio, cuando para 500g es solamente el
0.7% (redondeando).

Pgina | 12
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

ALGUNAS DISTRIBUCIONES DE PROBABILIDAD

Para una variable aleatoria, por ejemplo, el nmero de solicitudes de crdito inadecuadamente
completadas, el peso de una bolsa de azcar o el tiempo de atencin de una llamada telefnica, que
puede tomar un valor numrico, es necesario en muchos casos determinar la probabilidad de que
tome un valor especfico. Para ello se usan las distribuciones de probabilidad.

La utilidad de las distribuciones para nuestro curso estn relacionadas con el clculo de probabilidades
y estadsticos para los intervalos de confianza y las pruebas de hiptesis, as como con la identificacin
de la desviacin estndar asociada a la distribucin de probabilidad para que se pueda usar en la
determinacin de la incertidumbre. Pero antes es necesario revisar algunos conceptos relacionados
con las variables aleatorias.

REVISIN DE VARIABLES ALEATORIAS


Se dice que una variable es aleatoria cuando los valores que asume la variable han sido antecedidos
por una seleccin aleatoria de los objetos medidos o son resultado de un proceso al azar. Como en el
experimento hay una serie de resultados posibles, estos siempre pueden expresarse numricamente.

La variable aleatoria generalmente se representa con una letra mayscula (X, Y, etc.) y el valor que
toma la variable se denota con la respectiva letra minscula. Por ejemplo, si lanzamos un dado y
observamos que el resultado obtenido es 5, entonces en este caso:

X: resultado al lanzar el dado una vez. (V.A.)

: 1, 2, 3, 4, 5, 6. (espacio muestral)

Como el resultado registrado fue 5, entonces x = 5

Estas variables pueden ser discretas, cuando el rango es un conjunto finito o infinito numerable, o
continuas, cuando el rango es un conjunto infinito no numerable de valores.

F UNCIN DENSIDAD DE UNA VARIABLE ALEATORIA CONTINUA


Se denomina funcin densidad f(x) de una variable aleatoria continua a la funcin que satisface:

Pgina | 13
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

f ( x) 0 para todo x



f ( x).dx 1

b
P(a x b) f ( x).dx
a

En los dos siguientes puntos se presentan caractersticas y propiedades de los valores esperados y
desviaciones estndar. Esos temas son solamente informativos, no es necesario que el nivel de
entendimiento de estos temas sea alto.

V ALOR ESPERADO Y VARIANZA DE UNA VARIABLE ALEATORIA

n
variable aleatoria discreta x E ( x ) xi . pi
Valor i 1

esperado

variable aleatoria continua x E ( x ) x. f ( x).dx

n
variable aleatoria discreta x2 ( xi x ) 2 . pi
i 1
Varianza

variable aleatoria continua x2

( x ) 2 . f ( x).dx

n
variable aleatoria discreta x (x
i 1
i x ) 2 . pi
Desviacin
estndar

variable aleatoria continua x
( x ) 2 . f ( x).dx

DISTRIBUCIN TRIANGULAR
Existen situaciones en las cuales es necesario asumir una distribucin de probabilidad en funcin de
algunos parmetros, como el rango y el valor de mayor probabilidad o moda. En estos casos se puede
pensar en una distribucin que tenga la forma de un triangulo, cuya rea, como en todos los casos, sea
igual a 1

Pgina | 14
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

mnimo moda mximo


(a) (c) (b)

La funcin de densidad es:

0 ,x a
2 x a
, a x c
b a b c
f ( x)
2b x , c x b
b a b c

0 ,x b

Un caso particular de esta distribucin y el que ms se aplica para el clculo de la Incertidumbre de las
Mediciones, es cuando la moda c es el valor central entre a y b (c = (a+b)/2).

Para este caso la Media:


ab
x E ( x)
2

Varianza:

( a b) 2
2x
24

Ejemplo 3.1
Se presume que la medida obtenida con un instrumento analgico, ya sea una escala como la de una
pipeta o un reloj, sigue una distribucin triangular. Por ejemplo, en la figura adjunta puede observarse
que la medida no es 5 ni 6, es cualquier valor entre esas dos marcas. Se presume que la media y la
varianza de esa medida es:

56 (5 6) 2
x E ( x) 5.5 2x 0.04167
2 24
7

Pgina | 15
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

4cc

DISTRIBUCIN UNIFORME (RECTANGULAR)


Esta distribucin se usa cuando todos los posibles valores de la variable tienen igual probabilidad de
ocurrencia. Muchas veces se usa cuando solamente se tiene como informacin el rango de la variable.

La funcin de densidad de probabilidad para una distribucin Uniforme entre a y b esta dada por:
1
f ( x)
(b a)

ab
Media: x E ( x)
2

( a b) 2
Varianza: 2x
12

Ejemplo 3.2
Se presume que la medida obtenida con un instrumento digital, visualizada en una pantalla como la de
una balanza, sigue una distribucin rectangular. Por ejemplo, en la figura adjunta puede observarse
que la medida marca 45.3g, pero cualquier peso entre 45.25 y 45.34 (por practicidad se asume 45.35)
va a tener la misma indicacin en la pantalla. Se presume que la media y la varianza de esa medida es:

45.25 45.35 (45.25 45.35) 2


x 45.3 2x 0.00083
2 12
45.3

Pgina | 16
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

DISTRIBUCIN NORMAL
La mayora de procesos industriales y de la naturaleza siguen una distribucin normal, que est
caracterizada por tener una media o promedio y una desviacin estndar, es decir una medida de
tendencia central y una de dispersin. Por ejemplo, una variable aleatoria como el largo de una antena
de celular seguir una distribucin normal con media =75mm y desviacin estndar =0.005mm. Eso
quiere decir que algunas antenas de celular medirn 75mm y otras ms o menos. Si se obtiene una
muestra de antenas se espera que el promedio sea 75 y la desviacin estndar 0.005mm.

La funcin de densidad de probabilidad para una distribucin normal est dada por:
1 x
1 ( )2
f ( x) e 2
2

Se dice que la variable aleatoria X sigue una distribucin normal con parmetros y y se denota X ~
N (, 2). Pero en este caso no se puede calcular dicha integral a no ser que se usen mtodos
numricos. Por eso se calculan las probabilidades con tablas.
La forma de una distribucin normal es:

Para aproximar una distribucin de probabilidades a la distribucin normal, la apariencia de la


distribucin debe ser simtrica y con forma de campana, las medidas de tendencia central deben
coincidir y la dispersin de los datos debe tener un alcance de 3 .

Para hacer el clculo de probabilidades y usar la tabla que se muestra en la pgina siguiente, es
necesario realizar una estandarizacin. De lo que se trata es de transformar los datos de una

Pgina | 17
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

distribucin normal cualquiera a una distribucin normal estndar con media =0 y =1 usando la
frmula

x
Z

Ejemplo 3.3
Por ejemplo, si se ha tomado una muestra de 100 pesos de bolsas de azcar y se sabe que el promedio
del peso es 500g y la desviacin estndar 2.1g, se puede asumir que los pesos X siguen una distribucin
normal con =500 y =2.1. La variable X se puede transformar en otra variable llamada Z usando la
ecuacin anterior. Esta nueva variable Z sigue una distribucin normal estndar en donde =0 y =1 y
sus probabilidades se pueden calcular a partir de la siguiente tabla:

Pgina | 18
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Areas bajo la curva normal estndar, desde --infinito a z = (x - media)/desv. Est

z 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09

-3.5 0.000233 0.000224 0.000216 0.000208 0.000200 0.000193 0.000185 0.000179 0.000172 0.000165
-3.4 0.000337 0.000325 0.000313 0.000302 0.000291 0.000280 0.000270 0.000260 0.000251 0.000242
-3.3 0.000483 0.000467 0.000450 0.000434 0.000419 0.000404 0.000390 0.000376 0.000362 0.000350
-3.2 0.000687 0.000664 0.000641 0.000619 0.000598 0.000577 0.000557 0.000538 0.000519 0.000501
-3.1 0.000968 0.000936 0.000904 0.000874 0.000845 0.000816 0.000789 0.000762 0.000736 0.000711
-3.0 0.001350 0.001306 0.001264 0.001223 0.001183 0.001144 0.001107 0.001070 0.001035 0.001001
-2.9 0.001866 0.001807 0.001750 0.001695 0.001641 0.001589 0.001538 0.001489 0.001441 0.001395
-2.8 0.002555 0.002477 0.002401 0.002327 0.002256 0.002186 0.002118 0.002052 0.001988 0.001926
-2.7 0.003467 0.003364 0.003264 0.003167 0.003072 0.002980 0.002890 0.002803 0.002718 0.002635
-2.6 0.004661 0.004527 0.004397 0.004269 0.004145 0.004025 0.003907 0.003793 0.003681 0.003573
-2.5 0.006210 0.006037 0.005868 0.005703 0.005543 0.005386 0.005234 0.005085 0.004940 0.004799
-2.4 0.008198 0.007976 0.007760 0.007549 0.007344 0.007143 0.006947 0.006756 0.006569 0.006387
-2.3 0.010724 0.010444 0.010170 0.009903 0.009642 0.009387 0.009137 0.008894 0.008656 0.008424
-2.2 0.013903 0.013553 0.013209 0.012874 0.012545 0.012224 0.011911 0.011604 0.011304 0.011011
-2.1 0.017864 0.017429 0.017003 0.016586 0.016177 0.015778 0.015386 0.015003 0.014629 0.014262
-2.0 0.022750 0.022216 0.021692 0.021178 0.020675 0.020182 0.019699 0.019226 0.018763 0.018309
-1.9 0.028716 0.028067 0.027429 0.026803 0.026190 0.025588 0.024998 0.024419 0.023852 0.023295
-1.8 0.035930 0.035148 0.034379 0.033625 0.032884 0.032157 0.031443 0.030742 0.030054 0.029379
-1.7 0.044565 0.043633 0.042716 0.041815 0.040929 0.040059 0.039204 0.038364 0.037538 0.036727
-1.6 0.054799 0.053699 0.052616 0.051551 0.050503 0.049471 0.048457 0.047460 0.046479 0.045514
-1.5 0.066807 0.065522 0.064256 0.063008 0.061780 0.060571 0.059380 0.058208 0.057053 0.055917
-1.4 0.080757 0.079270 0.077804 0.076359 0.074934 0.073529 0.072145 0.070781 0.069437 0.068112
-1.3 0.096801 0.095098 0.093418 0.091759 0.090123 0.088508 0.086915 0.085344 0.083793 0.082264
-1.2 0.115070 0.113140 0.111233 0.109349 0.107488 0.105650 0.103835 0.102042 0.100273 0.098525
-1.1 0.135666 0.133500 0.131357 0.129238 0.127143 0.125072 0.123024 0.121001 0.119000 0.117023
-1.0 0.158655 0.156248 0.153864 0.151505 0.149170 0.146859 0.144572 0.142310 0.140071 0.137857
-0.9 0.184060 0.181411 0.178786 0.176186 0.173609 0.171056 0.168528 0.166023 0.163543 0.161087
-0.8 0.211855 0.208970 0.206108 0.203269 0.200454 0.197662 0.194894 0.192150 0.189430 0.186733
-0.7 0.241964 0.238852 0.235762 0.232695 0.229650 0.226627 0.223627 0.220650 0.217695 0.214764
-0.6 0.274253 0.270931 0.267629 0.264347 0.261086 0.257846 0.254627 0.251429 0.248252 0.245097
-0.5 0.308538 0.305026 0.301532 0.298056 0.294598 0.291160 0.287740 0.284339 0.280957 0.277595
-0.4 0.344578 0.340903 0.337243 0.333598 0.329969 0.326355 0.322758 0.319178 0.315614 0.312067
-0.3 0.382089 0.378281 0.374484 0.370700 0.366928 0.363169 0.359424 0.355691 0.351973 0.348268
-0.2 0.420740 0.416834 0.412936 0.409046 0.405165 0.401294 0.397432 0.393580 0.389739 0.385908
-0.1 0.460172 0.456205 0.452242 0.448283 0.444330 0.440382 0.436441 0.432505 0.428576 0.424655
0.0 0.500000 0.496011 0.492022 0.488033 0.484047 0.480061 0.476078 0.472097 0.468119 0.464144
0.1 0.539828 0.543795 0.547758 0.551717 0.555670 0.559618 0.563559 0.567495 0.571424 0.575345
0.2 0.579260 0.583166 0.587064 0.590954 0.594835 0.598706 0.602568 0.606420 0.610261 0.614092
0.3 0.617911 0.621719 0.625516 0.629300 0.633072 0.636831 0.640576 0.644309 0.648027 0.651732
0.4 0.655422 0.659097 0.662757 0.666402 0.670031 0.673645 0.677242 0.680822 0.684386 0.687933
0.5 0.691462 0.694974 0.698468 0.701944 0.705402 0.708840 0.712260 0.715661 0.719043 0.722405
0.6 0.725747 0.729069 0.732371 0.735653 0.738914 0.742154 0.745373 0.748571 0.751748 0.754903
0.7 0.758036 0.761148 0.764238 0.767305 0.770350 0.773373 0.776373 0.779350 0.782305 0.785236
0.8 0.788145 0.791030 0.793892 0.796731 0.799546 0.802338 0.805106 0.807850 0.810570 0.813267
0.9 0.815940 0.818589 0.821214 0.823814 0.826391 0.828944 0.831472 0.833977 0.836457 0.838913
1.0 0.841345 0.843752 0.846136 0.848495 0.850830 0.853141 0.855428 0.857690 0.859929 0.862143
1.1 0.864334 0.866500 0.868643 0.870762 0.872857 0.874928 0.876976 0.878999 0.881000 0.882977
1.2 0.884930 0.886860 0.888767 0.890651 0.892512 0.894350 0.896165 0.897958 0.899727 0.901475
1.3 0.903199 0.904902 0.906582 0.908241 0.909877 0.911492 0.913085 0.914656 0.916207 0.917736
1.4 0.919243 0.920730 0.922196 0.923641 0.925066 0.926471 0.927855 0.929219 0.930563 0.931888
1.5 0.933193 0.934478 0.935744 0.936992 0.938220 0.939429 0.940620 0.941792 0.942947 0.944083
1.6 0.945201 0.946301 0.947384 0.948449 0.949497 0.950529 0.951543 0.952540 0.953521 0.954486
1.7 0.955435 0.956367 0.957284 0.958185 0.959071 0.959941 0.960796 0.961636 0.962462 0.963273
1.8 0.964070 0.964852 0.965621 0.966375 0.967116 0.967843 0.968557 0.969258 0.969946 0.970621
1.9 0.971284 0.971933 0.972571 0.973197 0.973810 0.974412 0.975002 0.975581 0.976148 0.976705
2.0 0.977250 0.977784 0.978308 0.978822 0.979325 0.979818 0.980301 0.980774 0.981237 0.981691
2.1 0.982136 0.982571 0.982997 0.983414 0.983823 0.984222 0.984614 0.984997 0.985371 0.985738
2.2 0.986097 0.986447 0.986791 0.987126 0.987455 0.987776 0.988089 0.988396 0.988696 0.988989
2.3 0.989276 0.989556 0.989830 0.990097 0.990358 0.990613 0.990863 0.991106 0.991344 0.991576
2.4 0.991802 0.992024 0.992240 0.992451 0.992656 0.992857 0.993053 0.993244 0.993431 0.993613
2.5 0.993790 0.993963 0.994132 0.994297 0.994457 0.994614 0.994766 0.994915 0.995060 0.995201
2.6 0.995339 0.995473 0.995603 0.995731 0.995855 0.995975 0.996093 0.996207 0.996319 0.996427
2.7 0.996533 0.996636 0.996736 0.996833 0.996928 0.997020 0.997110 0.997197 0.997282 0.997365
2.8 0.997445 0.997523 0.997599 0.997673 0.997744 0.997814 0.997882 0.997948 0.998012 0.998074
2.9 0.998134 0.998193 0.998250 0.998305 0.998359 0.998411 0.998462 0.998511 0.998559 0.998605
3.0 0.998650 0.998694 0.998736 0.998777 0.998817 0.998856 0.998893 0.998930 0.998965 0.998999
3.1 0.999032 0.999064 0.999096 0.999126 0.999155 0.999184 0.999211 0.999238 0.999264 0.999289
3.2 0.999313 0.999336 0.999359 0.999381 0.999402 0.999423 0.999443 0.999462 0.999481 0.999499
3.3 0.999517 0.999533 0.999550 0.999566 0.999581 0.999596 0.999610 0.999624 0.999638 0.999650
3.4 0.999663 0.999675 0.999687 0.999698 0.999709 0.999720 0.999730 0.999740 0.999749 0.999758

Siguiendo con el ejemplo, si se desea saber la probabilidad de que una bolsa de azcar pese menos de
495g, entonces debemos calcular P(X<495). Si X se transforma a Z, entonces:

Pgina | 19
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

X 495 500
P( X 495) P PZ 2.38
2.1

y en la grfica es el rea marcada en negro. Para buscar esa probabilidad se usa la tabla anterior
buscando el valor 2.3 en la primera columna y movindose horizontalmente hasta encontrar la
columna que corresponda a un encabezado de 0.08. El valor es 0.00866, lo que quiere decir que cada
1000 bolsas de azcar en promedio 8.66 bolsas tendrn un peso menor a 495g

Si se quiere calcular la probabilidad que una bolsa pese ms de 503g, entonces:

X 503 500
P( X 503) P PZ 1.43 1 PZ 1.43 1 0.92364 0.07636
2.1

Tener en cuenta que la tabla slo permite calcular probabilidades del tipo P(X < x) y si fuera necesario
calcular la P(X > x) entonces se cambia a P(X > x) = 1 - P(X < x).

Podemos decir que bolsas se azcar con pesos que estn por encima de 503g y por debajo de 495g son
productos no conformes con las especificaciones. Entonces, cul es la probabilidad de que salga un
producto no conforme con las especificaciones? (0.00866+0.07636=0.08502) Cul la probabilidad de
que salga un producto conforme? (1-0.08502=0.91498).

Una propiedad importante de la distribucin normal es que si X 1, X2, X3, . . . , Xk son k variables
aleatorias independientes, tales que Xi ~ N(i, i), para cada i = 1, 2, 3, . . ., k, entonces, la variable

Pgina | 20
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

aleatoria Y = c1X1 + c2X2 + c3X3 + . . . + ckXk, (donde c1, c2, c3, . . . ck son constantes) est distribuida
normalmente con:

Media: Y = c1.1 + c2.2 + c3.3 + . . . + ck.k

Varianza: Y2 = c12.12 + c22.22 + c32.32 + . . .+ ck2.k2

Esto permite estudiar, por ejemplo, el caso en que el peso de una caja (cartn solamente) sigue una
distribucin normal con =150g y =1.3g y tiene como contenido 12 frascos de perfumes. El peso de
cada frasco sigue una distribucin normal con =250g y =2.6g. Entonces, el peso de la caja llena sigue

una distribucin normal con =150+12x250=3150g y = 1.3 12 2.6 31 .227 g. A partir de


2 2 2

esto se puede determinar las probabilidades para la caja llena de 12 frascos considerando estos dos
ltimos parmetros.

DISTRIBUCIN DE POISSON
La distribucin de Poisson, se aplica a varios fenmenos discretos de la naturaleza (esto es, aquellos
fenmenos que ocurren 0, 1, 2, 3, ... veces durante un periodo definido de tiempo o en un rea
determinada) cuando la probabilidad de ocurrencia del fenmeno es constante en el tiempo o el
espacio. Ejemplos de estos eventos que pueden ser modelados por la distribucin de Poisson incluyen:

El nmero de llamadas telefnicas en una central telefnica por minuto.


El nmero de fallas detectadas en cada metro de tela
El nmero de mutaciones de determinada cadena de ADN despus de cierta cantidad de
radiacin.

La funcin de densidad de probabilidad para una distribucin Poisson est dada por:

e x
f ( x)
x!
Se dice que la variable aleatoria X sigue una distribucin normal con parmetro y se denota X ~
Poisson (). Dado que esta es una variable aleatoria discreta X puede tomar valores de 0,1,2,3.... y la
probabilidad acumulada hasta un nmero dado se calcula como la sumatoria de todos valores enteros
menores evaluados en la funcin de densidad. As entonces por ejemplo la probabilidad P(X < 3) si X es
una variable aleatoria Poisson ser:

P( X 3) P( X 0) P( X 1) P( X 2)

OTRAS DISTRIBUCIONES
En la siguiente tabla se muestran otras importantes distribuciones de probabilidad.

Pgina | 21
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Distribucin t-student Para un valor de la variable aleatoria t ,k es tal


Se dice que la variable que el rea a su derecha bajo la curva de la
aleatoria t sigue una distribucin t con k grados de libertad es igual k 1

k 1
distribucin t con k grados a . 2 t2 2
f (t ) 1
de libertad
P (T t ,k ) k
k k
2
k
t = E(t) = 0 t2
k 2
Distribucin Chi-cuadrado Un valor de la variable aleatoria 2,k es tal
Se dice que X tiene una que el rea a su derecha bajo la curva de la f ( x)
distribucin chi cuadrado distribucin 2 con k grados de libertad es . 1
(1 / 2) x k / 2 1 e (1 / 2) x x0
con k grados de libertad y
P(
2 2
,k ) (1 / 2)
se denota X ~ 2 (k) 0
en cualquier otro caso
x = E(x) = k x2 2k

Distribucin F Un valor de la variable aleatoria x = F ,r1,r2 es r1


r1 r1 r2
Se dice que X tiene una tal que el rea a su derecha bajo la curva de
distribucin F con r1 y r2 la distribucin F con parmetros r1 y r2 es r2 2 x ( r1 / 2) 1
igual a . f ( x) ( r1 r2 ) / 2
x 0;
grados de libertad (enteros r r r1 x
1 2 1
positivos). Se denota X ~
P ( X F ,r1 ,r2 ) 2 2
F(r1,r2) r2

Pgina | 22
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Distribucin Weibull Existe una curva para cada par de valores y


f ( x)
Se dice que X tiene una
distribucin Weibull con
x2 2 1 x /
x = E(x) = x e 0 y ; 0; 0
parmetros y (, >0).
Se denota X ~ W (, ). 0
en cualquier otro caso

Pgina | 23
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

EJERCICIOS PROPUESTOS
Ejercicio 1
Una empresa de fabricacin de productos cermicos dispone de tres centros de produccin. En el
centro A, el ms grande y moderno, se hace un estudio de los m de azulejo producidos al mes durante
el ao pasado, obtenindose una media de produccin mensual de 250 000 m , con una desviacin
tpica de 15.000 m . Se sabe que el centro B, por tener maquinaria ms anticuada que A, produce
cada mes un tercio de la produccin de A, y que el centro C, por tener un horno menos que B, produce
cada mes 25.000 m menos que B Cual es la media y la varianza de la produccin mensual de C?

Ejercicio 2
Un organismo de control ambiental, con motivos de denuncias reiteradas presentadas por vecinos de
una fbrica, decide investigar el ruido que producen camiones pesados que circulan por una
determinada calle. Para ello toma una muestra de 30 camiones registrando sus respectivos niveles de
ruido en decibeles. Los resultados obtenidos fueron los siguientes:

a) Defina la variable en estudio, tipo y escala.


b) Cul es el nivel de ruido superado por el 50 % de los camiones?.
c) Halle la moda e interprete.
d) Cul es el nivel de ruido superado por el 75 % de todos los camiones?
e) Qu dispersin presenta el nivel de ruido?
f) Qu porcentaje de camiones supera los 85 decibeles?
g)Qu cantidad de camiones produce hasta 86 decibeles?

Ejercicio 3
Se realiz una investigacin sobre la contaminacin ambiental. Para ello se estudi la acidez del agua
de lluvia cada en 40 localidades del pas. Registrndose los siguientes niveles de pH:( pH pura 5,7 )

a) Defina la variable en estudio, tipo y escala.


b) cul es el nivel de acidez ms frecuente?
c) Cul es el nivel de acidez no superado por el 25% de las localidades donde se registran los menores
Ph ? Grafique.
d) Halle la desviacin estndar e interprete.

Pgina | 24
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

INTERVALOS DE CONFIANZA

En muchas situaciones, una estimacin puntual no proporciona informacin suficiente sobre un parmetro y
resulta ms significativo la estimacin de un intervalo, dentro del cual se espera encontrar el valor de dicho
parmetro. El intervalo estimado recibe el nombre de Intervalo de Confianza.

INTERVALO DE CONFIANZA PARA LA MEDIA


Supongamos que se tiene una poblacin con media desconocida y varianza 2. De esta poblacin se
toma una muestra aleatoria XI, X2 , ..., Xn de tamao n. La media muestral X es un estimador puntual
de la media poblacional
Puede obtenerse un intervalo de confianza del 100 (1 - )% para al considerar la distribucin de
muestreo de la media muestral X la cual es normal si la poblacin es normal y aproximadamente
normal si se satisfacen las condiciones del lmite central.

C ASO 1: V ARIANZA ( 2 ) CONOCIDA .


Si X es la media muestral de una muestra aleatoria de tamao n de una poblacin con varianza
conocida 2, un intervalo de confianza para del 100 (1 - ) por ciento est dado por:
_
_

x - z1 / 2 x z1 / 2
n n

Ejemplo 4.1:
Se est analizando la resistencia a la ruptura de la fibra textil usada en la fabricacin de cortinas. La
experiencia pasada indica que la desviacin estndar de la resistencia a la ruptura es 2psi. Se prueba
una muestra de 9 observaciones y se encuentra que la resistencia a la ruptura promedio es 98psi.
Encuentre el intervalo de confianza de dos colas con una confianza del 95%.

Datos: Solucin:

X = 98
1- = 0.975 por tabla: Z 1 2 = 1.96
=2 2
n =9
1- = 95% Aplicar frmula:

= 5% 98 - (1.96
2
) 98 + (1.96
2
)
9 9

96.693 99.307

Pgina | 25
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Seleccin del Tamao de Muestra


La precisin del intervalo de confianza definido anteriormente es z1-/2 . Esto significa que al utilizar
para estimar , el error E= - es menor o igual que z1-/2 con una confianza 100(1 - ). En los
casos en los que es posible controlar el tamao muestral, se puede elegir n de modo que se tenga una
confianza del 100(1 - a) % de que el error al estimar sea menor que un error especificado E. La
seleccin del tamao n de la muestra, necesario para proporcionar un intervalo de confianza de la
longitud requerida (2E), se obtiene cuando:

z1 / 2 E
n
Al solucionar esta ecuacin, obtenemos la siguiente frmula:


2
z
n 1 / 2
E
Ejemplo 4.2
Si se desea reducir a la mitad el intervalo hallado en el ejemplo anterior, cuntas muestras adicionales
se requieren?

Datos: Solucin:

X = 98 2
E = 1.96 = 1.307
=2 9
n =9
1- = 95% 1.307
E nuevo = = 0.653
= 5% 2

Z1 2
= 1.96
1.96 2
2

nnuevo = = 35.982 = 36
0.653

Redondear siempre al entero mayor

Pgina | 26
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

C ASO 2: V ARIANZA ( 2 ) DESCONOCIDA .


Si y S son la media y la desviacin estndar de una muestra aleatoria de tamao n, tomada de una
distribucin normal con varianza 2 desconocida, entonces un intervalo de confianza del 100 (1 - a) %
para est dado por:
_ _
s s
x - t (1 / 2) x t (1 / 2)
n n
donde t1-/2, n-1 es el punto crtico superior que corresponde al porcentaje /2 de la distribucin t con
(n-1) grados de libertad.

Ejemplo 4.3
Para el ejemplo anterior, suponga que no se conoce la desviacin estndar y que el valor 2psi fue
hallado con una muestra de tamao 9.

Datos: Solucin:

X = 98 t1n (1 / 2 ) = 2.306
s =2
n =9
1- = 95% 98 - tn 1(1 / 2)
2
98 tn 1(1 / 2)
2
9 9
= 5%

Ejemplo 4.4
Se tienen los siguientes datos referentes a una muestra de tamao 10:

n 1 2 3 4 5 6 7 8 9 10
Valor 55 57 56 57 56 55 57 58 55 56

Donde se obtiene una media de valor 56.2. Se solicita hallar el intervalo de confianza con =5%.
Solucin:
Datos:

x x
n
2
X = 56.2 i
S 2 i 1
1.0667 t1n (1 / 2 ) = 2.262
n = 10 n 1
1- = 95%
= 5%
1.033 1.033
56.2 - t n 1(1 / 2) 56.2 t n 1(1 / 2)
10 10

Pgina | 27
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Ejemplo 4.5
Para el ejemplo anterior, se desea obtener un error no mayor a 0.6. Cul ser el tamao de muestra
necesario para cumplir con la condicin anterior?

Datos:
Solucin:
s
X = 56.2 Eactual = t1n (1 / 2 ) = 0.739, al ser mayor que el
n
n = 10 Edeseado se aplica la siguiente frmula:
1- = 95%
= 5%
nnuevo = ( t n 1(1 / 2 ) * s /Edeseado) 2
S2 = 1.0667

t1n (1 / 2 ) = 2.262
nnuevo = 15.162 =16
Edeseado = 0.6

Para resolver este problema es necesario hacer un proceso iterativo. Se debe notar que para el clculo
del n nuevo el valor t y la desviacin estndar muestral dependen de la muestra, dependen de n. Es
decir, no se puede despejar n de la frmula del Error E.

Es por ello que basndonos en un tamao de muestra inicial, en este caso 10, calculamos la desviacin
estndar y que la muestra que se necesita es de 16, es decir los 10 datos y su desviacin estndar no
permiten lograr el error deseado. Es necesario tomar 6 datos adicionales (o 16 nuevas datos), adems
se debe hallar la desviacin estndar de estos 16 datos, as como el valor del t1-/2 respectivo. En esta
oportunidad escogeremos realizar una muestra nueva, cuyos valores obtenidos son:

n 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
valor 55 56 57 57 56 55 55 56 57 56 56 57 55 55 57 56

De la nueva muestra se pueden hallar los siguientes valores:

X = 56.077
S2 = 0.794 Enuevo = 0.36 < Edeseado =0.6

t (1 / 2 ) =2.059

INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE DOS MEDIAS


Supngase que se tiene dos poblaciones independientes con medias desconocidas 1 y 2, y varianzas

12 y 22 respectivamente. Si bien X 1 X 2 es una estimacin puntual de 1 - 2, se desea
encontrar un intervalo de confianza del 100 (1-) % para la diferencia de las medias 1 - 2

Pgina | 28
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

C ASO 1: V ARIANZAS CONOCIDAS .



Si X 1 y X 2 son las medias de dos muestras aleatorias independientes de tamaos n1 y n2 tomadas
de poblaciones que tienen varianzas conocidas 12 y 22 respectivamente, entonces un intervalo de
confianza del 100 (1-) % para 1 - 2 es:

12 22 12 22
( x1 - x 2 ) Z 1 / 2 1 - 2 x1 - x 2 z1 / 2
n1 n2 n1 n2

El nivel de confianza (1 - ) es exacto cuando las poblaciones son normales. Para poblaciones que no lo
son, el nivel de confianza es aproximadamente vlido para tamaos grandes de muestras.

C ASO 2: V ARIANZAS DESCONOCIDAS .


Sean X 1 , X 2 , S12 y S22 las medias y las varianzas de dos muestras aleatorias de tamaos n1 y n2
respectivamente, tomadas de dos poblaciones normales con varianzas desconocidas. Para hallar el
intervalo de confianza del 100 (1 - ) % para la diferencia entre medias 1 - 2, se van a distinguir dos
situaciones:

a) Si las varianzas poblacionales son desconocidas pero iguales

_ _ 1 1 _ _ 1 1
( x1 - x 2 ) - t n1 n2 -2, 1 / 2 S p2 - ( x1 - x 2 ) t n1 n2 -2, 1 / 2 S p2
n1 n2 1 2
n1 n2
(n1 - 1) S12 (n2 - 1) S 22
S p2
n1 n2 - 2

donde Sp es el estimado combinado de la desviacin estndar comn de la poblacin.

b) Si no es razonable suponer que las varianzas son iguales, entonces el intervalo de confianza es:

_ _ s2 s2 _ _ s12 s 22
( x1 - x 2 ) - t v , 1 / 2 1 2 - ( x1 - x2 ) t v , 1 / 2
n1 n2 n1 n2
1 2

Pgina | 29
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

2
S12 S 22

v 12
n n2
2
2
S12 S 22

n1 n2
n1 1 n2 1
donde son los grados de libertad

Ejemplo 4.5
Se investiga el dimetro de las varillas de acero fabricadas en dos mquinas de extrusin diferentes. Se
seleccionan dos muestras aleatorias e tamao n1=15 y n2=17, las medias muestrales son 8.73 y
8.68mm, y las varianzas muestrales son 0.32 y 0.40mm2. Construya el intervalo de confianza para la
diferencia asumiendo que las varianzas son iguales y luego asumiendo que son diferentes. Los
intervalos incluyen al cero?

Varianzas iguales

Datos: Solucin:

X1 = 8.73 t n1 n2 - 2, 1 / 2 = 2.042
X2 = 8.68
(15 - 1) 0.32 (17 - 1) 0.40
s12 = 0.32 S p2 = 0.363
15 17 - 2
s 22 = 0.40

1
_ _ 1 1 _ _ 1 1
= 15 ( x1 - x2 ) - tn1n2 -2, 1 / 2 S p2 - ( x1 - x2 ) tn1n2 -2, 1 / 2 S p2
n1 n2 1 2
n1 n2
2 = 17

= 5%
Varianzas diferentes

Datos: Solucin:

2
X1 = 8.73 0.32 0.40

t v , 1 / 2
v
15 17 = 32 = 2.037
X2 = 8.68 2 2
2
0.32 0.40

s12 = 0.32 15 17
15 1 17 1
s 22 = 0.40

1 = 15 _ _ s2 s2 _ _
( x1 - x2 ) - t v , 1 / 2 1 2 - ( x1 - x2 ) t v , 1 / 2
s12 s 22

n1 n2 n1 n2
1 2

2 = 17

= 5%
Pgina | 30
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

PRUEBA DE HIPTESIS

Para realizar pruebas de hiptesis deberemos hacer alguna inferencia o suposicin elaborada sobre
algn parmetro de la poblacin. Esta inferencia ser nuestra hiptesis. Despus tomaremos una
muestra para ver si la hiptesis podra ser correcta. La hiptesis que contrastamos se llama hiptesis
nula (Ho). La hiptesis nula se contrasta con la hiptesis alternativa (H1)

Despus, a partir de los resultados obtenidos en nuestra muestra, o bien rechazamos la hiptesis nula
a favor de la alternativa, o bien rechazamos la hiptesis nula y suponemos que nuestra estimacin
inicial del parmetro poblacional podra ser correcto.

El hecho de no rechazar la hiptesis nula no implica que sta sea cierta.


Significa simplemente que los datos de la muestra son insuficientes para inducir un rechazo de la
hiptesis nula.

Contraste de Hiptesis. La hiptesis que se contrasta. Es rechazada o no en funcin de la informacin


muestral. La hiptesis alternativa se especifica como opcin posible si se rechaza la nula

TIPOS DE ERRORES

Aceptar H0 Rechazar H0

H0 es cierta No hay error Error I ()

No hay error
H0 es falsa ErrorII
(1-)

Error Tipo I
Ocurre cuando se rechaza una hiptesis H0 que es verdadera. La probabilidad de error tipo I viene a ser
la probabilidad de rechazar la H0 verdadera.

P(Error tipo I)

El valor es fijado por la persona que realiza la investigacin (1-10%)

Error Tipo II
Ocurre cuando se acepta una hiptesis H 0 que es falsa, la probabilidad de error tipo II es la probabilidad
de aceptar una H0 que es falsa.

P(Error tipo II)

Pgina | 31
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Debido a que el valor real del parmetro es desconocido este error no puede ser fijado.
Potencia de prueba o Poder de Prueba
Es la probabilidad de rechazar una hiptesis planteada cuando esta es falsa.

Potencia de la prueba = 1 -

Como el valor de depende del valor del parmetro la potencia de prueba tampoco pude ser fijado,
sin embargo se puede asumir un conjunto de valores del parmetro y para cada uno de ellos hallar el
valor de la potencia de prueba. La curva que se genera se conoce como CURVA DE POTENCIA.

HIPTESIS UNILATERALES Y BILATERALES.


Al construir pruebas de hiptesis, siempre se plantea la hiptesis nula como una igualdad, de modo
que la probabilidad del error tipo 1 pueda controlarse en un valor especfico. La hiptesis alternativa
puede ser unilateral o bilateral, dependiendo de la conclusin que ha de obtenerse si se rechaza Ho

PRUEBA BILATERAL: Una prueba de cualquier hiptesis, tal como


H0: = 0
H1: 0

recibe el nombre de prueba bilateral, debido a que es importante detectar diferencias a partir del valor
hipottico de la media que se encuentren en cualquier lado de 0 . En una prueba de este tipo, la
regin crtica se separa en dos partes, con (usualmente) la misma probabilidad en cada cola de la
distribucin de la estadstica de prueba.

PRUEBA UNILATERAL: Muchos problemas de prueba de hiptesis involucran de manera natural


hiptesis alternativas unilaterales, tales como:
H0: = 0
H1: > 0

H0: = 0
H1: < 0

Si la hiptesis alternativa es H1: > 0, la regin crtica debe encontrarse en la cola superior de la
distribucin del estadstico de prueba, mientras que si la hiptesis alternativa es H 1: < 0, la regin
crtica debe encontrarse en la cola inferior de la distribucin. En consecuencia, en ocasiones estas
pruebas se conocen como pruebas de una cola.

Pgina | 32
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

PROCEDIMIENTO GENERAL
1. Identificar el parmetro de inters

: parmetros ( , 2 , P, 1 - 2 , P1 - P2 , 2 / 22 )
1

: media , 2: varianza , p: proporcin , 1 2: diferencia de medias


p1 p2: diferencia de proporciones , 21 / 22: cociente de varianzas

2. Planteo de la hiptesis.

H 0 : 0 H 0 : 0 H 0 : 0

H1 : 0 H1 : 0 H1 : 0

3. Fijar el nivel de significacin . Los valores usuales de son 1, 5, 10%

4. Pruebas estadsticas: dependiendo del parmetro a probar se usa un estadstico definido en la figura
de la pgina siguiente.

5. Pruebas estadsticas

Suposiciones para: ( , 2 , 1 2 , 2 / 22 )
1

Poblacion(es) normalmente distribuida(s).


Muestra(s) tomada(s) al azar.

Suposiciones para: ( p, p1 p2 )
Muestra(s) tomada(s) al azar.
Muestras grandes.

Pgina | 33
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Hiptesis

Nula Alternativa Regin crtica

H 0 : 0 vs H1 : 0 Z0 Z
1
H1 : 0
2
2
conocido Z 0 Z 1
H1 : 0 Z 0 Z1

H 0 : 0 vs H1 : 0 T0 t
1 , n 1
2
desconocido H1 : 0 T0 t1 ,n 1
2

H1 : 0 T0 t1 ,n 1

H 0 : 1 2 vs H 1 : 1 2 Z0 Z
1
y 2 2
conocidos H 1 : 1 2 2
1 2 Z 0 Z 1
H 1 : 1 2
Z 0 Z1

H 0 : 1 2 vs H 1 : 1 2 T0 t
1 , n1 n2 2
desconocidos
2 2 H 1 : 1 2 T0 t
2
1 2 1 , n1n2 2
H 1 : 1 2 T0 t1 ,n1n2 2

H 0 : 1 2 vs H 1 : 1 2 T0 t
1 , df
desconocidos
2 2
H 1 : 1 2 2
1 2
T0 t1 ,df
H 1 : 1 2
T0 t1 ,df

H 0 : 2 02 H 1 : 2 02 02 2 0 1 ,n 1
2 2
, n 1
H 1 : 2 02 2 2
02 12 ,n 1
H1 :
2 2

02 2 ,n 1
0

H 0 : 12 22 H 1 : 12 22 F0 F F0 F1 ,n 1,n
, n1 1, n2 1 1 2 1
H1 :
2 2 2 2

F0 F1 ,n1 1,n2 1
1 2

H 1 : 12 22
F0 F ,n1 1,n2 1

H 0 : p p0 H 1 : p p0 Z0 Z
1
H 1 : p p0 2
Z 0 Z 1
H 1 : p p0
Z 0 Z1

H 0 : p1 p 2 H 1 : p1 p 2 Z0 Z
1
H 1 : p1 p 2 2
Z 0 Z 1
H 1 : p1 p 2
Z 0 Z1

Pgina | 34
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

6. Regiones crticas
Cola derecha: Cuando H1 contiene ">"

Cola izquierda: Cuando H1 contiene "<"

Doble cola: Cuando H1 contiene ""

7. Calcular las cantidades muestrales necesarias, sustituirlas en la ecuacinp ara el estadstico de


prueba y calcular el valor correspondiente.

8. Resultados y conclusiones.

Pgina | 35
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

HIPTESIS REFERENTE A UNA MEDIA

Prueba de hiptesis de un promedio

Ejemplo 5.1
Las siguientes mediciones se registraron para el tiempo de secado, en horas, de cierta marca de pintura
de ltex:

3.4 2.5 4.8 2.9 3.6


2.8 3.3 5.6 3.7 2.8
4.4 4.0 5.2 3.0 4.8

Suponga que las mediciones representan una muestra aleatoria de una poblacin normal, pruebe la
hiptesis que el tiempo de secado es 4.5 horas.

Solucin:
Al tratarse de varianzas desconocidas se emplea el siguiente
Hiptesis estadstico de prueba

H0: = 4.5 X 0 3.787 4.5


t 2.85
H1: 4.5 S/ n 0.971 / 15

De los datos se obtiene: Este valor debe ser comparado con t 2.145
1 , n 1
2

n 15
X 3.787 Como 2.85 2.145 se rechaza la hiptesis nula, es
decir, el tiempo promedio de secado es diferente a 4.5 horas.
S 0.971
La salida del MINITAB es la siguiente:

T-Test of the Mean

Test of mu = 4.500 vs mu not = 4.500

Variable N Mean StDev SE Mean T P


x 15 3.787 0.971 0.251 -2.85 0.013

Pgina | 36
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Ahora ya sabemos que la media no es igual a 4.5, pero es sta mayor o menor a este valor?, para
responder a esta pregunta haremos una prueba unilateral.

Solucin: Al tratarse de varianzas desconocidas se emplea el siguiente


Hiptesis
estadstico de prueba

H0: = 4.5
X 0 3.787 4.5
H1: < 4.5 t 2.85
S/ n 0.971 / 15

De los datos se obtiene:


Este valor debe ser comparado con t1 ,n 1 1.761

n 15
X 3.787 Como 2.85 1.761 se rechaza la hiptesis nula, es decir,
el tiempo promedio de secado es inferior a 4.5 horas.
S 0.971

Ejemplo 5.2
De 100 momentos distintos, seleccionados al azar durante una semana de trabajo, se observa que un
operador de una mquina realiza trabajo productivo en 80 de estas observaciones. Pruebe la
hiptesis de que la proporcin real que un operador realiza trabajo productivo es 0.90. Use = 0.05.

Solucin:

Hiptesis Al tratarse de una hiptesis con proporciones, es necesario resolver


las siguientes frmulas:

H0: = 0.9
1 0.9 0.1
H1: 0.9 0.03
n 100

De los datos se obtiene:


0.8 0.9
Z 3.33
0.03
n 100
El valor obtenido para Z debe ser comparado con el de Z
1
2

Como 3.33 1.96 Se rechaza la hiptesis nula.

Pgina | 37
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

HIPTESIS REFERENTE A DOS MEDIAS Y DOS VARIANZAS.

P RUEBA DE HIPTESIS DE COMPARACIN DE VARIANZAS

Ejemplo 5.3
La American Car (AC) lleva a cabo un experimento para rebatir la aseveracin de que los automviles
extranjeros dan ms millas por galn que los autos americanos. Nicole Johnson, presidenta de la AC,
piensa que tanto los promedios y las varianzas en el millaje son los mismos, para esto se lleva a cabo
un estudio con 16 vehculos. Los resultados en millas por galn son:

Americano Extranjero
34.2 35.3
32.5 32.6
37.1 37.1
34.1 34.1
31.9 31.9
31.3 36.4
32.0 35.7
33.3 33.3

Pruebe las hiptesis respectivas con un nivel de significacin de = 0.05. (Asuma poblaciones
normales)

Prueba F para varianzas de dos muestras

Americano Extranjero
Media 33.30 34.55
Varianza 3.45 3.49
Observaciones 8 8
Grados de libertad 7 7
F 0.9910
P(F<=f) una cola 0.4954
Valor crtico para F (una cola) 0.2641

Pgina | 38
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

P RUEBA DE HIPTESIS DE COMPARACIN DOS MEDIAS INDEPENDIENTES

Prueba t para dos muestras suponiendo varianzas iguales

Americano Extranjero
Media 33.30 34.55
Varianza 3.45 3.49
Observaciones 8 8
Varianza agrupada 3.47
Diferencia hipottica de las medias 0
Grados de libertad 14
Estadstico t -1.3421
P(T<=t) una cola 0.1005
Valor crtico de t (una cola) 1.7613
P(T<=t) dos colas 0.2009
Valor crtico de t (dos colas) 2.1448

Two Sample T-Test and Confidence Interval

Two sample T for Millaje


Vehculo N Mean StDev SE Mean
Americanos 8 33.30 1.86 0.66
Extranjero 8 34.55 1.87 0.66

95% CI for mu (Americanos)-mu (Extranjero):(-3.25,0.75)


T-Test mu (Americanos)=mu Extranjero) vs not =):T= -1.34 P=0.20 DF=14
Both use Pooled StDev = 1.86

P RUEBA DE HIPTESIS DE COMPARACIN DE DOS MEDIAS RELACIONADAS

Ejemplo 5.4
El departamento de ingeniera civil del Instituto Politcnico Y Universidad Estatal de Virginia compara
una tcnica de ensayo modificada (M-5 hr) para recuperar coliformes fecales en charcos de agua de
lluvia en un rea urbana con la tcnica del nmero ms probable (MPN). Se colecta un total de 12
muestras de charcos y se analizan con las dos tcnicas. Los conteos de coliformes por 100 mililitros se
registran en la siguiente tabla:

Pgina | 39
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Muestra Conteo MPN Conteo con M - 5hr

1 2300 2010
2 1200 930
3 450 400
4 210 436
5 270 4100
6 450 2090
7 154 219
8 179 169
9 192 194
10 230 174
11 340 274
12 194 183

Existen diferencias significativas en los conteos medios de coliformes fecales entre las tcnicas M-5 hr y
MPN. Suponga que las diferencias de conteos se distribuyen de forma aproximadamente normal. Use
= 0.05.

Prueba t para medias de dos muestras emparejadas

Conteo MPN Conteo con M-5 hr


Media 514.08 931.58
Varianza 398125.17 1479274.99
Observaciones 12 12
Coeficiente de correlacin de Pearson 0.3057
Diferencia hipottica de las medias 0
Grados de libertad 11
Estadstico t -1.2188
P(T<=t) una cola 0.1242
Valor crtico de t (una cola) 1.7959
P(T<=t) dos colas 0.2484
Valor crtico de t (dos colas) 2.2010

Pgina | 40
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

EJERCICIOS PROPUESTOS
Ejercicio 1
Una mquina produce piezas metlicas de forma cilndrica. Se toma una muestra de piezas cuyos
dimetros son 1.01, 0.97, 1.03, 1.04, 0.99, 0.98, 0.99, 1.01, 1.03 centmetros. Con un nivel de
significancia de .01. Pruebe la hiptesis de que el dimetro promedio de piezas de esta mquina es
de 1.009?

Ejercicio 2
Una muestra aleatoria de 8 cigarrillos de una marca determinada tiene un contenido promedio de
nicotina de 2.6 miligramos y una desviacin estndar de 0.9 miligramos. Existe suficiente evidencia
estadstica para decir que el contenido promedio real de nicotina de esta marca de cigarros en
particular es de 2.4 miligramos? Con = .05.

Ejercicio 3
Se toma una muestra aleatoria de 12 agujas de tejer en un estudio de la dureza Rockwell de la cabeza
de las agujas. Se realizan las mediciones de la dureza para cada una de las 12 piezas, de lo que se
obtiene un valor promedio 48.50 con una desviacin estndar de 1.5. Suponiendo que las mediciones
estn normalmente distribuidas, pruebe la hiptesis de que la dureza Rockwell promedio es menor
48.705. Con = .05.

Ejercicio 4
Se compararon dos marcas de cigarrillos, C y D , respecto a su contenido de nicotina en miligramos,
dieron los siguientes resultados.

Marca C Marca D

= 40 = 50
= 14.3 = 15.7
= 2.9 = 3.8

Con un nivel de significancia de 0.01. Existe suficiente evidencia estadstica para decir que hay
diferencia entre las medias de contenido de nicotina para las dos marcas de cigarrillos.

Ejercicio 5
Se asume que se tienen la longitud del radio de 10 piezas antes y despus de habrseles aplicado un
tratamiento trmico, prubese con un nivel de significancia de o.10, existe evidencia para decir que
la media de la diferencia en los puntaje antes y despus del tratamiento es diferente?

Antes 9.0 7.3 6.7 5.3 8.7 6.3 7.9 7.3 8.0 8.5
Despus 9.2 8.2 8.5 4.9 8.9 5.8 8.2 7.8 9.5 8.0

Pgina | 41
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

ANLISIS DE VARIANZA

EXPERIMENTOS CON UN SOLO FACTOR

D ISEO COMPLETAMENTE ALEATORIZADOS


Supongamos que el experimentador cuenta con los resultados de k muestras aleatorias
independientes, cada una de tamao n, de ka diferentes poblaciones (esto es, datos relativos a k
tratamientos, k grupos, k mtodos de produccin, etc.) y le interesa probar la hiptesis de que las
medias de esas k poblaciones son todas iguales.

Tratam. Tratam.1 Tratam.2 ... Tratam.k Total


Muestra
1 Y11 Y21 ... Yk1 Y.1
2 Y12 Y12 ... Yk2 Y.2
3 Y13 Y23 ... Yk3 Y.3
. . . ... . .
. . . ... . .
. . . ... . .
N y1n y2n ... ykn y.n
Total y1. y2. ... yk. y..

Donde.
n k k n k n
yi.
j 1
yij , y. j
i 1
yij , y..
i 1
yi.
j 1
y. j y
i 1 j 1
ij

Para probar la hiptesis de que las muestras se obtuvieron de k poblaciones con medias iguales,
haremos varias suposiciones. Con ms precisin, supondremos estar trabajando con poblaciones
normales que tienen varianzas iguales.
Si i denota la media de las i-sima poblacin y 2 indica la varianza comn de las k poblaciones,
podemos expresar cada observacin y ij como i ms el valor de un componente aleatorio; es decir
podemos escribir

yij i ij para i 1, 2, . .., k ; j 1, 2, ..., n


Para lograr uniformidad en las ecuaciones correspondientes a clases de diseo ms complicados, se
acostumbra reemplazar i por + i, donde es la media de las i y i es el efecto del i-simo

Pgina | 42
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

k
tratamiento; de ah que
i 1
i 0 . Con estos nuevos parmetros, podemos escribir la ecuacin

modelo para el criterio de clasificacin.

yij i ij para i 1, 2, . .., k ; j 1, 2, ..., n

donde:

yij : La j- sima observacin en la i-sima muestra


: Parmetro de la media poblacional.
i : Efecto del i-simo tratamiento.
ij : Error aleatorio asociado a la observacin yij.
ij N(0, 2)

TABLA DE ANALISIS DE VARIANZA

Grados de
Fuente de Suma de cuadrados Cuadrado medio Fc Ft
libertad
variacin
k
CM ( Tr ) F(K-1,K(n-
Tratamientos K1
y 2
i.
y..2 SS (Tr )
F
CME 1),)
SS (Tr ) i 1
CM (Tr )
n kn K 1
K(n 1) SSE SST SS(Tr) SSE
Error CME
K ( n 1)

k n
y..2
Total nk - 1
SST yi 1 j 1
2
ij
kn

Pgina | 43
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Ejemplo 6.1
Las cifras siguientes son el nmero de errores realizados en cinco das consecutivos de trabajo por
cuatro tcnicos de un laboratorio fotogrfico:

Tcnico I Tcnico II Tcnico III Tcnico IV


6 14 10 9
14 9 12 12
10 12 7 8
8 10 15 10
11 14 11 11

Prueba con un nivel de significancia = 0.05 si las diferencias entre las cuatro muestras pueden
atribuirse al azar.

Solucin.
Tabla Resumen
Grupos Cuenta Suma Promedio Varianza
Tcnico I 5 49 9.8 9.2
Tcnico II 5 59 11.8 5.2
Tcnico III 5 55 11 8.5
Tcnico IV 5 50 10 2.5

Los totales para las cuatro muestras son, respectivamente, 49, 59, 55, y 50, el gran total es 213, y los
clculos con que se obtienen las sumas necesarias son los siguientes:

4 5

y
i 1 j 1
2
ij
( 213) 2
2268.45
nk (5)( 4)

SST (6) 2 (14) 2 (10) 2 . . . (11) 2 2268.45 114.55


( 49) 2 (59) 2 (55) 2 (50) 2
SS (Tr ) 2268.45 12.95
5

La tabla del anlisis de varianza es.


Fuente de Grados de Suma de Cuadrado
Fc Ft
variacin libertad cuadrados medio
Tratamientos 41=3 12.95 4.32 0.68 3.24
Error 4(5 - 1)= 16 101.60 6.35

Total 5(4) 1 = 19 114.55

Pgina | 44
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Puesto que el valor obtenido para F es menor que 3.24, que corresponde al valor F0.05 con 3 y 16
grados de libertad, la hiptesis nula no puede ser rechazada con nivel de significacin de 0.05;
concluimos que no se puede rechazar la hiptesis de que los tcnicos estn logrando resultados
consistentes.

La salida del MINITAB es:

One-way Analysis of Variance

Analysis of Variance
Source DF SS MS F P
Factor 3 12.95 4.32 0.68 0.577
Error 16 101.60 6.35
Total 19 114.55
Individual 95% CIs For Mean
Based on Pooled StDev
Level N Mean StDev ---+---------+---------+---------+---
Tcnico 5 9.800 3.033 (-----------*-----------)
Tcnico 5 11.800 2.280 (-----------*-----------)
Tcnico 5 11.000 2.915 (-----------*-----------)
Tcnico 5 10.000 1.581 (-----------*-----------)
---+---------+---------+---------+---
Pooled StDev = 2.520 8.0 10.0 12.0 14.0

Pgina | 45
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

DISEO CON BLOQUES ALEATORIZADOS


Se supone que el experimentador tiene a su disposicin mediciones relativas a a tratamientos
distribuidos sobre b bloques. En primer trmino, consideraremos el caso en que hay exactamente una
observacin de cada tratamiento en cada bloque.

Tratamientos
Totales
Bloques T1 T2 T3 ... Ti ... Ta
B1 y11 y21 y31 ... yi1 ... ya1 y .1

y12 y22 y32 ... yi2 ... ya2 y. 2


B2

y13 y23 y33 ... yi3 ... ya3 y. 3


B3

. . . . ... . ... . .
. . . . ... . ... . .
. . . . ... . ... . .

Y1j y2j y3j ... yij ... yaj y. j


Bj

. . . . ... . ... .
y1b y2b y3b ... yib ... Yab y. b
Bb

Totales y1. y 2. y3. ... y i. ... y a. y..

Cada observacin puede ser expresada con el siguiente modelo lineal.

yij i j ij para i 1,2,..., a ; j 1,2,..., b

donde:
yij : Es la observacin relativa al i-simo tratamiento del j-simo bloque.
: Es la gran media
i : Es el efecto del i-simo tratamiento.
ij : Es el efecto del j-simo bloque.
ij : es el error aleatorio correspondiente a la observacin y ij.

Pgina | 46
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

a b
Tambin
i 1
i 0 y
j 1
j 0

Pgina | 47
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

SUMA DE CUADRADOS
a b
y..2
SCTotal
i 1 j 1
y ij2
ab
a
y i2. y..2
SCT i 1
b

ab
b
y.2j y..2
SCB j 1
b

ab
SCE SCTotal SCT SCB

TABLA DE ANALISIS DE VARIANZA


Fuente de Grados de Suma de
Cuadrado medio F
variacin libertad cuadrados

SCT CMT
Tratamientos a-1 SCT CMT FT
a 1 CME

SCB CMB
Bloque b-1 SCB CMB FB
b 1 CME

SCE
Error (a - 1)(b - 1) SCE CME
(a 1)(b 1)

Total ab - 1 SCTotal

Ejemplo 6.2
Se han tomado muestras de aguas subterrneas de cinco diferentes zonas de depsito de aguas txicas
por cada una de tres agencias siguientes: la EPA, la compaa propietaria de los lugares de depsito y
un asesor independiente dedicados a asuntos de ingeniera. Cada muestra fue analizada buscando
detectar la presencia de cierto contaminante por todos los mtodos de laboratorio que la agencia que
recolect la muestra suele emplear. Se consideraron los siguientes resultados:

Lugar A Lugar B Lugar C Lugar D Lugar E


Agente 1 23.8 7.6 15.4 30.6 4.2
Agente 2 19.2 6.8 13.2 22.5 3.9
Agente 3 20.9 5.9 14.0 27.1 3.0

Existe alguna razn para creer que los laboratoristas no son, en sus mediciones, consistentes entre s?
Difiere una zona de depsito con respecto a cualquier otra en su nivel de contaminacin? Utilice un
nivel de significacin de 0.05.

Pgina | 48
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Solucin.
Las hiptesis nula y planteada son.

H o : 1 2 3 H o : 1 2 3 4 5

H1 : No todas las son iguales H1 : No todas las son iguales

El nivel de significacin: = 0.05.

Criterio:
Para tratamientos, se rechaza la hiptesis nula si F > 4.46, el valor de F 0.05 para 2 y 8 grados de libertad.
Para bloques, se rechaza la hiptesis nula si F > 3.84, el valor de F 0.05 para 4 y 8 grados de libertad.

Tabla Resumen:

RESUMEN Cuenta Suma Promedio Varianza


Agente 1 5 81.6 16.32 120.912
Agente 2 5 65.6 13.12 62.477
Agente 3 5 70.9 14.18 101.417

Lugar A 3 63.9 21.3 5.41


Lugar B 3 20.3 6.76666667 0.72333333
Lugar C 3 42.6 14.2 1.24
Lugar D 3 80.2 26.7333333 16.5033333
Lugar E 3 11.1 3.7 0.39

Clculos:
a b
Sustituyendo a = 3, b. = 5 y1. = 81.6, y2. = 65.6, y3. = 70.9 y.. = 218.1, y y
i 1 j 1
2
ij 436.97 en las

expresiones para calcular la suma de cuadrados, obtenemos.

3 5

y
i 1 j 1
2
ij
(218.1) 2
3171.17
a.b (15)

SST 4336.97 3171.17 1165.80


(81.6) 2 (65.5) 2 (70.9) 2
SS (Tr ) 3171.17 26.57
5 5 5
(63.9) 2 (11.1) 2
SSB ... 3171.17 1117.26
3 3
SSE SCT SC (Tr ) SCB 21.96

Pgina | 49
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

El cuadro de anlisis de varianza es.

Fuente de Grados de Suma de Cuadrado F Ftab


variacin libertad cuadrados medio
Tratamiento 31=2 26.57 13.29 4.84 4.46

Bloques 51=4 1117.26 279.32 101.75 3.84


Error (3-1)(5-1)=8 21.96 2.75
Total (3)(5) 1 = 14 1165.80

EXPERIMENTOS DE DOS FACTORES


Cuando se identifica dos o ms factores que actan tanto de manera aislada como de manera conjunto
en la variable respuesta es preferible analizar el modelo como un diseo factorial con dos o mas
factores.

Terminologa usada
Respuesta: es el nombre genrico que se da a la caracterstica estudiada.
Factores: se designa de esta forma a las variables que se considera puedan afectar a la respuesta.
Niveles: son los valores que toma un factor en un determinado experimento.

Ejemplo 6.3
Supngase que se desea disear un muelle de manera que el nmero mximo de compresiones hasta
la rotura sea lo mayor posible, y que para ello se pueda jugar con tres variables: la longitud, el grosor
del alambre de partida y el tipo de acero del alambre (pueden existir un conjunto mayor de variables).
Adems se ha determinado que se experimentar con dos valores de longitud, 10cm y 15cm, y con dos
niveles de grosor, dimetros de 5mm y 7mm, y con dos tipos de acero, A y B.

En este caso la respuesta (Y) ser el nmero de compresiones hasta la rotura.


El modelo para un experimento de dos factores es:

yijk i j ( ) ij ijk
para i 1,2,..., a j 1,2,..., b k 1,2,..., n
donde:
yij : Variable respuesta.
: Es la gran media
i : Es el efecto en el nivel i-simo del factor A.
ij : Es el efecto en el nivel j-simo del factor B.
ij : Es el efecto de la interaccin.

Pgina | 50
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

ij : Es el error aleatorio correspondiente a la observacin y ij.


N: Es el nmero de rplicas

SUMA DE CUADRADOS

r a b
y..2
SST y
k 1 i 1 j 1
2
ijk
abr
a b yij2. y..2
SS (Tr )
i 1 j 1 r

abr
SSE SST SS (Tr )

SUBDIVISIN DE LA SUMA DE CUADRADOS DE TRATAMIENTOS

1 a
y ..
2
SSA
br
y
i 1
2
i ..
abr
1 b
y ..
2
SSB
ar
y j 1
2
. j.
abr
SS ( AB ) SS ( Tr ) SSA SSB

TABLA DE ANALISIS DE VARIANZA


Suma de Cuadrado
Fuente de variacin Grados de libertad F
cuadrados medio
Efectos principales CMA
a 1 SSA CMA
A CME
CMB
b -1 SSB CMB
B CME
CM ( AB )
Interaccin AB (a 1)(b 1) SS(AB) CM(AB)
CME

Error ab (n - 1) SSE CME

Total abn - 1 SST

Pgina | 51
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Ejemplo 6.4
Para determinar las condiciones ptimas para un bao de galvanoplstico, los efectos de la
concentracin de sulfota y la de la temperatura del bao sobre la reflectividad del metal revestido se
estudian en un experimento factorial 2x5. Los resultados de tres rplicas son los siguientes:

Concentracin Temperatura Reflectividad


(g/l) (F) Rp.1 Rp.2 Rp.3 Total
5 75 35 39 36 110
5 100 31 37 36 104
5 125 30 31 33 94
5 150 28 20 23 71
5 175 19 18 22 59
10 75 38 46 41 125
10 100 36 44 39 119
10 125 39 32 38 109
10 150 35 47 40 122
10 175 30 38 31 99
Total 321 352 339 1012

Analice esos resultados y determine la condicin o condiciones del bao que producen la mxima
capacidad de reflexin.

Solucin.
Las hiptesis nula y planteada son.
{H o : 1 = 2 = 0 {H o : 1 = 2 = 3 = 4 = 5 = 0
{H o : ( )11 = ( )12 = ... = ( )25 = 0

El nivel de significacin: = 0.05.

Criterio:
Para el efecto principal del factor A: Si F> F(1,18)
Para el efecto principal del factor B: Si F> F(4,18)
Para el efecto interaccin: Si F> F(4,18)

Pgina | 52
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Tabla Resumen
RESUMEN 75 100 125 150 175 Total
5
Cuenta 3 3 3 3 3 15
Suma 110 104 94 71 59 438
Promedio 36.666667 34.666667 31.3333333 23.667 19.66666667 29.2
Varianza 4.3333333 10.333333 2.33333333 16.333 4.333333333 50.74285714

10
Cuenta 3 3 3 3 3 15
Suma 125 119 109 122 99 574
Promedio 41.666667 39.666667 36.3333333 40.667 33 38.26666667
Varianza 16.333333 16.333333 14.3333333 36.333 19 25.4952381

Total
Cuenta 6 6 6 6 6
Suma 235 223 203 193 158
Promedio 39.166667 37.166667 33.8333333 32.167 26.33333333
Varianza 15.766667 18.166667 14.1666667 107.77 62.66666667

Resultados:

Grados de Suma de Cuadrado


Fuente de variacin F p
libertad cuadrados medio
A 1 616.53 616.533 44.04 0

B 4 591.2 147.8 10.56 0

Interaccin 4 196.13 49.033 3.5 0.025

Error 20 280 14

Total 29 1683.87

Pgina | 53
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

EJERCICIOS PROPUESTOS
Ejercicio 1
Consideremos cuatro compaas (A, B, C y D), cuyas acciones cotizan en bolsa. Seleccionamos de forma
aleatoria las cotizaciones de estas acciones durante diferentes instantes de tiempo a lo largo de un
mes. As pues, para la compaa A se observa la cotizacin en cinco instantes aleatorios, para la B se
observa en cuatro, para la C se observa en seis y, finalmente, para la compaa D, en cinco. En la tabla
siguiente se da la cotizacin en pesetas de las diferentes acciones en los instantes de tiempo
seleccionados:

Contraste el nivel del 5% si las cotizaciones medias de las acciones de cada una de las cuatro compaas
se pueden considerar iguales. Confeccionad la tabla de anlisis de la varianza.

Ejercicio 2
Los estudiantes de segundo curso de una escuela universitaria de ingeniera estuvieron repartidos de
forma aleatoria en tres grupos. En cada grupo se ense estadstica con una estrategia docente
diferente. Al final del curso todos los alumnos hicieron el mismo examen. Se seleccionaron de forma
aleatoria algunas cualificaciones obtenidas por algunos alumnos de los tres grupos. Los resultados son
los siguientes:

Haga un anlisis de la varianza e indique si puede asegurar a un nivel significativo del 0,05 que el
resultado obtenido depende de la tcnica de enseanza utilizada.

Ejercicio 3
Una compaa necesita de cierto qumico como materia prima y est buscando donde mandarlo a
hacer. Antes de tomar una decisin, le pide a 4 laboratorios que le hagan 5 muestras. Vemos los
resultados en alguna mtrica en la siguiente tabla. Hay una diferencia entre las medias de las
poblaciones?
Lab 1 4.13 4.07 4.04 4.07 4.05
Lab 2 3.86 3.85 4.08 4.11 4.08
Lab 3 4.00 4.02 4.01 4.01 4.04
Lab 4 3.88 3.89 3.91 3.96 3.92

Pgina | 54
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

ANLISIS DE REGRESIN

El objetivo de muchas investigaciones estadsticas es hacer predicciones basados en ecuaciones matemticas.


Por ejemplo un ingeniero podra estar interesado en predecir la cantidad de xido que se forma cobre la
superficie de un metal cocido en un horno, durante una hora a 230 grados Celsius, o podra tambin predecir
la magnitud de deformacin en un anillo sometido a una fuerza de compresin de 1000 libras; justamente
para dar respuesta a tales interrogantes ser necesario contar con una regla funcional que relacione una
variable con otra u otras variables y de este estudio se encarga el anlisis de regresin.

REGRESIN LINEAL SIMPLE.


El anlisis de regresin lineal da como resultado una ecuacin matemtica que describe cierta relacin
determinada. La ecuacin puede usarse para estimar o predecir los valores de una variable cuando se
conocen o se suponen conocidos los valores de otra variable. En este caso es importante remarcar que
la relacin que se encontrar es lineal (exponente 1 de las variables) y es entre dos variables (X, Y)
solamente, por eso se llama simple.

E L DIAGRAMA DE DISPERSIN
El primer paso en el anlisis de regresin, es construir una grfica de los datos muestrales en un plano
bidimensional. Esta grfica se denomina diagrama de dispersin,

El diagrama de dispersin indica frecuentemente el tipo de tendencia de Y con respecto a X.

Ejemplo 7.1
En la tabla siguiente, X es la fuerza de tensin aplicada a un espcimen de acero en miles de libras y Y
es el alargamiento resultante en milsimas de pulgada:

X 1 2 3 4 5 6
Y 14 33 40 63 76 85

Elabore el diagrama de dispersin de los datos

Pgina | 55
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

DIAGRAMA DE DISPERSION
90

Y 80

70

60

50

40

30

20

10
1 2 3 4 5 6
x

L A ECUACIN DE LNEA RECTA


Dos importantes caractersticas de la lnea recta son:
La pendiente de la recta b
El intercepto de la recta (el valor de y cuando x = 0)
La ecuacin lineal es la siguiente:

i a bx
y

E L MTODO DE LOS MNIMOS CUADRADOS


El mtodo ms empleado para ajustar una lnea recta a un conjunto de puntos es conocido como la
tcnica de los mnimos cuadrados, cuya recta resultante tiene dos caractersticas importantes:

La suma de las desviaciones verticales de los puntos con relacin a la recta es cero; y
La suma de los cuadrados de las desviaciones es mnima (es decir, ninguna otra recta dara una
menor suma de cuadrados de tales desviaciones)

Simblicamente el valor que se minimiza es:


n

( y y )
i 1
i i
2

Los valores de a y b que minimizan la suma de los cuadrados de las desviaciones, son las soluciones de
las llamadas ecuaciones normales de la recta de regresin:

Pgina | 56
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

n
n
yi
i 1
na b xi
i 1
n
n
n 2

i 1
xi yi a xi b xi
i 1 i 1
Resolviendo las ecuaciones simultneas para a y b tenemos:

n n n
n xi y i xi y i
b i 1 i 1 i 1
2
n 2 n
n xi xi
i 1 i 1
a y bx

A continuacin se muestra una salida del MINITAB.

Regression Analysis

The regression equation is


y = 1.13 + 14.5 x

Predictor Coef StDev T P


Constant 1.133 3.686 0.31 0.774
x 14.4857 0.9465 15.31 0.000

S = 3.959 R-Sq = 98.3% R-Sq(adj) = 97.9%

Analysis of Variance
Source DF SS MS F P
Regression 1 3672.1 3672.1 234.25 0.000
Residual Error 4 62.7 15.7
Total 5 3734.8

Predicted Values
Fit StDev Fit 95.0% CI 95.0% PI
37.35 1.87 (32.15,42.55) (25.19, 49.51)

Pgina | 57
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

REGRESIN LINEAL MLTIPLE

El modelo lineal general para el anlisis de regresin mltiple es el siguiente:

Y = 0 + 1 x1 + 2 x2 + 1 x1 + ... + k xk +
Y : variable respuesta que se quiere predecir
0, 1,. ., k : constantes.
x1, x2,... , xk : variables predictoras independientes que se miden sin error.
: es un error aleatorio que, para cualquier conjunto dado de valores de x1,
x2,...,xk , tienen una distribucin normal con media igual a cero y una varianza
igual a 2. Los errores aleatorios, digamos , j asociados a cualquier par de
valores son independientes.

E CUACIN DE REGRESIN MUESTRAL


A partir de los datos de la muestra, se encuentran las estimaciones de los parmetros y se determina el
hiperplano que mejor se ajusta al conjunto de datos llamado hiperplano de regresin muestral. La
ecuacin es la siguiente:

Y = b0 + b1 x1 + b2 x2 + +... + bk xk
Y : valor estimado de la variable dependiente
b0, b1,. ., bk : estimaciones muestrales de los parmetros poblacionales
x1, x2,... , xk : son variables predictoras

E STIMACIN DE LOS PARMETROS


Para estimar los parmetros del anlisis de regresin mltiple tambin se utiliza el mtodo de mnimos
cuadrados.

Y1 = 0 + 1 x11 + 2 x12 + 3 x13 + ... + k x1k + 1


Y2 = 0 + 1 x21 + 2 x22 + 3 x23 + ... + k x2 k + 2
.
.
.

Yn = 0 + 1 xn1 + 2 xn 2 + 3 xn3 + ... + k xnk + n

Y = X +

Pgina | 58
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

El estimador de mnimos cuadrado de es: ( X ' X )-1 X 'Y


Y el modelo estimado es: y X
E ( )
Las propiedades estadsticas del estimador son:
Cov( ) 2 ( X ' X ) 1

C OEFICIENTE DE REGRESIN ESTIMADO


Los valores b0, b1,. ., bk se conocen como coeficientes de regresin estimados.
Un coeficiente de regresin estimado especfico mide el cambio promedio en la variable dependiente
debido a un incremento de una unidad en la variable predictora relevante, manteniendo constantes las
otras variables de prediccin.

EVALUACIN DE LA REGRESIN LINEAL .

A NLISIS DE VARIANZA
Para probar la significancia de una regresin puede utilizarse el mtodo del anlisis de varianza. El
procedimiento particiona la variabilidad total en la variable de respuesta en dos componentes:

y y y i y y i y i
n n n
2 2 2
i
i 1 i 1 i 1

Los dos componentes del lado derecho de la ecuacin miden, respectivamente, la cantidad de la
variabilidad en y tomada en cuenta por la recta de regresin (suma de los cuadrados de la regresin) y
la variacin residual que queda sin explicar por la recta (suma de los cuadrados de los errores).
De manera simblica, podemos escribir la ecuacin anterior como:

SST = SSR + SSE

Tabla de Anlisis de Varianza


Fuente g.l. SS MS
Regresin k SSR MSR = SSR / k
Error (n k -1) SSE MSE = SSE / (n - k -1)
Total (n - 1) SST

Pgina | 59
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

MS R
Por tanto, si la hiptesis nula Ho: 1 = 2 = 3 n = 0 se rechaza, el estadstico F que sigue la
MS E
distribucin Fk, n-k-1, debe ser: F > F1-, k, n-k-1 (valor crtico para un dado).

E RROR ESTNDAR DE LA ESTIMACIN


El error estndar de la estimacin mide la variabilidad, o dispersin, de los valores muestrales y
observados alrededor del plano de regresin.

SS E
s y. x MS E
n p
donde p = k +1es el numero de parmetros a estimar.

C OEFICIENTE DE DETERMINACIN MLTIPLE (R 2 )


El coeficiente de regresin mltiple mide el porcentaje de la variabilidad en y que se puede explicar
mediante las variables de prediccin.

Un valor de R2 cercano a uno significa que la ecuacin es muy exacta porque explica una gran porcin
de la variabilidad de y. Se define como:
SS R
R2
SST
Si embargo si se introducen excesivas variables ala modelo el coeficiente de determinacin
incrementar su valor, por tal razn se suele calcular el coeficiente de determinacin ajustado:

p(1 R 2 )
R ajustado R
2 2

n p 1

P RUEBAS DE HIPTESIS EN LA REGRESIN LINEAL MLTIPLE .


Una vez que se ha recogido una muestra aleatoria se han medido las variables y se ha examinado la
matriz de correlacin para determinar aquellas combinaciones de variables que son de inters, se
analizan los modelos con el mejor potencial. El objetivo es encontrar la mejor ecuacin para predecir y
despus decidir si sta ecuacin satisface las necesidades de exactitud del analista.

Los valores t calculados son de particular importancia en la regresin mltiple porque constituyen la
forma principal de detectar multicolinealidad. Si son suficientemente grandes, la correlacin entre las
dos variables predictoras no es un problema. Si uno o ambos valores t son menores que los valores t de
tablas, la multicolinealidad est presente.

Pruebas individuales Estadstico de prueba

H0 : i 0 i
T
H1 : i 0 s i

Pgina | 60
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Prueba conjunta Estadstico de prueba


H 0 : 1 2 ,..., k 0 MS R
F
H1 : j 0 MS E

Pgina | 61
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Ejemplo 7.2
A doce especmenes de lminas de acero reducido en fro con contenidos diferentes de cobre y
diferentes temperaturas de recocido se les mide su dureza con los siguientes resultados:

Dureza Contenido Temperatura


(Rockwell 30-T) de cobre (%) Del recocido (F)
78.9 0.02 1000
65.1 0.02 1100
55.2 0.02 1200
56.4 0.02 1300
80.9 0.10 1000
69.7 0.10 1100
57.4 0.10 1200
55.4 0.10 1300
85.3 0.18 1000
71.8 0.18 1100
60.7 0.18 1200
58.9 0.18 1300

Ajuste una ecuacin de la forma y = b0 +b1x1 + b2x2, donde x1 representa el contenido de cobre, x2
representa la temperatura de recocido y y representa la dureza.

Estime la dureza de una lmina de acero con un contenido de cobre de 0.05% y una temperatura de
recocido de 1150 F.

La salida de MINITAB se muestra a continuacin.

Pgina | 62
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

Regression Analysis

The regression equation is


Dureza = 161 + 33.0 Cobre - 0.0855 Temperatura

Predictor Coef StDev T P


Constant 161.34 11.43 14.11 0.000
Cobre 32.97 16.75 1.97 0.081
Temperat -0.085500 0.009788 -8.74 0.000
S = 3.791 R-Sq = 89.9% R-Sq(adj) = 87.7%

Analysis of Variance
Source DF SS MS F P
Regression 2 1152.19 576.09 40.09 0.000
Residual Error 9 129.34 14.37
Total 11 1281.53

Source DF Seq SS
Cobre 1 55.65
Temperat 1 1096.54

Predicted Values
Fit StDev Fit 95.0% CI 95.0% PI
64.66 1.38 (61.54, 67.78) (55.54, 73.78)

Pgina | 63
Profesor : Eduardo Carbajal Lpez
Curso : Estadstica Experimental para la Toma de Decisiones
Maestra Ingeniera Industrial

EJERCICIOS PROPUESTOS
Ejercicio 1

La resistencia del cemento depende, entre otras cosas, del tiempo de secado del cemento . En un
experimento se obtuvo la resistencia de bloques de cemento con diferente tiempo de secado los
resultados fueron los siguientes

Analice si existe una relacin lineal y de haberla encuentre el modelo que ajusta a estos datos.

Ejercicio 2

En 34 lotes de 120 libras de cacahuetes se observ el nivel medio de aflatoxin (partes por billn) y
el porcentaje de cacahuetes no contaminados en cada lote .

Analice si existe una relacin lineal y de haberla encuentre el modelo que ajusta a estos datos.

Pgina | 64

Das könnte Ihnen auch gefallen