Sie sind auf Seite 1von 130

www.monografias.

com
MINITAB
Manual de Entrenamiento
Estadsticas Bsicas
Manual del usuario
Minitab TM - Making Data Analysis Easier - Version 1
1! E"em#los y e"ercicios
$! %rueba T y %ruebas de %ro#orci&n
! 'egresi&n
(! 'egresi&n sim#le
)! 'egresi&n #olinomial
*! 'egresi&n m+lti#le
,! 'egresiones de los me"ores subcon"untos
-! El anlisis de .ariaci&n
/! Anlisis de la media
10! Balance AN1VA
E"em#los y e"ercicios
1b"eti.os
%rueba de 2i#&tesis
1b"eti.os
%rueba de la 3i#&tesis nula utili4ando t-test e inter.alos de con5ian4a!
E.aluaci&n del %o6er de la #rueba de 3i#&tesis utili4ando el anlisis del %o6er!
1
%rueba de 2i#&tesis
E"em#lo 1 7lenado 8a"as de cereal
El propsito de este ejemplo es de introducir los conceptos de la prueba de hiptesis. Tu usaras un one-sample t-test para analizar
datos procesados para determinar s el proceso esta en el objetivo.
%roblema
El objetivo. Tu quieres determinar s el proceso esta en el objetivo
'ecolecci&n de datos
Para evaluar el proceso de la media. Elegirs ! cajas de cereal al azar" las pesaras" # usaras los datos de ejemplo para estimar la
media de la poblacin.
2erramientas
9tat: Estadsticas bsicas:1-9am#le t
Data set
$E%E&'().*P+
%rueba de 3i#&tesis
;<u= es una #rueba de 3i#&tesis>
,na prueba de hiptesis usa datos de ejemplo para probar una hiptesis acerca de la poblacin de cual el ejemplo es tomado. El one-
sample t-test es uno de los muchos procedimientos disponibles para la prueba de una hiptesis en *-.-T&(.
Por ejemplo" suponga que quiere probar la medida de las ruedas del pistn es igual a la longitud deseada del objetivo. ,sted medir
un numero de ruedas # usara la medida de esas ruedas de ejemplo para estimar la medida de la rueda de la poblacin. Este es un
ejemplo de stastistical inference" usando informacin acerca de un ejemplo para hacer una inferencia acerca de una poblacin.
;8undo usar una #rueba de 3i#&tesis>
,sa una prueba de hiptesis cuando tengas datos de ejemplo # quieras hacer inferencias acerca de una o ms poblaciones.
;%or ?u= usar una #rueba de 3i#&tesis>
'a prueba de hiptesis puede a#udar a contestar preguntas como/
0Esta el proceso correctamente centrado1
0Es el producto de un proveedor mejor que el producto de otro1
02a# diferencias entre el tratamiento de los grupos # los e3perimentos1
Por ejemplo"
0 Es tu surtido de tu papel en media de 4.5 pulgadas de ancho1
0'a gasolina del proveedor es de mejor octanaje que la del proveedor (1
0El cliente prefiere una formulacin de una bebida sobre otra1
%robando la 3i#&tesis nula
.ecesitas determinar si la media de un proceso de empaque difiere significativamente del peso correcto que es 6!5 gramos. En
T7rminos estadsticos" el proceso de la media es tambi7n llamado la poblacin de la media.
2i#&tesis de estadstica
2a# 8 posibilidades" 9 es igual a 6!5 o no lo es. Estas alternativas pueden ser usadas como 8 hiptesis/
'a hiptesis nula :2;</ 9 es igual a .6!5 gramos
'a hiptesis alternativa:2=</ 9 no es igual a 65 gramos
2
Por que no puedes medir cada caja en la poblacin" nunca podrs saber con e3actitud cual hiptesis es correcta. >in embargo una
prueba de hiptesis apropiada pueda a#udarte a hacer un clculo formal. Para estos datos la prueba apropiada es la one-sample t-test
1- 9am#le t
1!- &bre el pro#ecto $E%E&'().*P+.
$!- Escoge 9TAT ? Basic 9tatistics ? 1-9am#le t!
!- $omplete el recuadro como se indica a continuacin/
(.- $lic@ 1@!
Inter#retando tus resultados
7a l&gica de la #rueba de 3i#&tesis
Todas las pruebas de hiptesis siguen los mismos pasos/
&sumir que 2; es verdadera.
Aeterminar que tan diferente es tu muestra de lo que esperas dado que 2; es verdad.
>i tu muestra es diferente dado que 2; es verdad" entonces descarta 2;.
Por ejemplo" los resultados de t-test indican que la muestra es 6!!.B;C. Ae esta manera el e3amen contestara la pregunta" D>i 9 es
igual a 6!5" como obtendrs una muestra de 6!!.B;C:o ma#or<. 'a respuesta es dada como una probabilidad que vale :P<" que para
esta prueba es igual a ;.=C6.
Tomando una decisi&n
Para tomar una decisin" necesitas Escoger el nivel de importancia" E :alpha<" antes de la prueba/
>i P es menor o igual a E" rechazas 2; .
>i P es ma#or que E" si fallas al rechazar 2; :T7cnicamente" nunca aceptas 2; " simplemente fallas al rechazarlo<.
3
,n valor tpico para E es ;.;5" pero valores ma#ores o menores puedes ser escogidos dependiendo de la e3actitud requerida para la
prueba. &sumiendo que escojas un E-.ivel de ;.;5 para los datos del peso de la caja no tendrs suficiente evidencia para rechazar
2;. P:;.=C6< es ma#or que E.
1ne-9am#le TA BoB6eig3
Test of mu F 6!5 vs not F 6!5
Gariable . *ean >tAev >E *ean H5I $- T P
(o3Jeigh ! 6!!.B;C 8.C;6 ;.H4= :6!C.=46" 6!H.88!< =.BC ;.=C6
8onsideraciones 5inales
8onclusiones #rcticas
(asado en tus datos de muestra" no puedes rechazar la hiptesis nula al ;.;5 nivel E. .o ha# suficiente evidencia para sugerir que los
pesos completos son diferentes a .6!5 gramos.
8onsideraciones de estadstica
$uando es conducida una prueba de hiptesis" siempre empiezas con dos hiptesis contrarias/
'a hiptesis nula:2;</
.ormalmente dice que si una propiedad de una poblacin :tal como la media< no es diferente de un valor especifico o de otra
poblacin.
Es asumido que es verdad hasta que tengas suficiente evidencia de lo contrario.
.unca es aceptado--- simplemente fallas al rechazarlo.
'a hiptesis alternativa:2=</
Aice que la hiptesis nula esta equivocada.
Tambi7n especifica la direccin de la diferencia.
$ada prueba de hiptesis esta basada en una o ms suposiciones acerca de los datos que estn analizando. >i esas suposiciones no
son conocidas" los resultados puede que no sean precisos. 'as suposiciones de cada prueba sern e3ploradas cuando cada prueba
sea discutida.
El Power de una prueba de estadstica es la probabilidad de rechazar correctamente la hiptesis nula. 'a tabla de abajo muestra los C
posibles resultados de la prueba de hiptesis.
2i#&tesis nula
Decisi&n Gerdadero Kalso
Kalla al rechazar
%echazar
El nivel E debe ser escogido antes de conducir la prueba/
-ncrementando E incrementas tus posibilidades de detectar una diferencia :# tu Power< pero tambi7n incrementas la
posibilidad de rechazar 2; cuando es verdad :error tipo -<.
Aisminu#endo E disminu#es tus posibilidades de cometer el error tipo -" pero tambi7n disminu#es el poder de la prueba.
Inter.alos de con5ian4a
E"em#lo $ #eso de la ca"a de cereal
%roblema
Aecisin correcta
pF=-E
Error tipo --
p F (
Error tipo -
p F E
Aecisin correcta
p F =- E
:Power<
4
%ecuerde que esta tratando de confirmar que el embalaje del cereal est7 en un objetivo. El objetivo del peso es de 6!5 gramos #
necesitas asegurarte que el proceso de la media est7 dentro de 8.5 gramos que es el objetivo.
'ecolecci&n de datos
>eis cajas de cereal fueron elegidas al azar # pesadas.
2erramientas
9tat : Basic statistics : 1-sam#le t
9et de Datos
$E%E&'().*P+
Inter.alos de con5ian4a
;<ue es un inter.alo de con5ian4a>
,n intervalo de confianza es un rango de posibles valores para un permetro de una poblacin :tal como 9< que esta basada en un
dato de muestra. Por ejemplo" mu# seguido usaras una muestra para calcular 9. ,n intervalo confidencial te dir que tan lejos esperes
ese clculo.
;8undo usar el inter.alo de con5ian4a>
,sa un intervalo de confianza para hacer inferencias de una o ms poblaciones de muestra de datos.
;%or ?ue usar inter.alos de con5ian4a>
'os intervalos de confianza te pueden a#udar a contestar muchas de las mismas preguntas de la prueba de hiptesis/
0Lue tan grande podra ser 91
0Lu7 tan grande podra ser la desviacin estndar de la poblacin1
0Podra 9 ser un valor cierto1
Por ejemplo"
Es posible que la longitud de la media de los lpices sea ma#or a 5.B5 pulgadas1
Podra M para la longitud de los lpices ser tan alto como ;.85 pulgadas1
Csando el inter.alo de con5ian4a
En el ejemplo anterior" usamos una prueba de hiptesis para determinar si la media de tu proceso fuera diferente al valor del objetivo.
Tambi7n puedes usar un intervalo de confianza para evaluar 7sta diferencia.
Esta >esin window resulta para =-sample t inclu#e valores para los fines ma#or # menores del H5I del intervalo de confianza.
Nbtiene una grafica representativa del intervalo al seleccionar (o3plot en Oraphs subdialog bo3.
=-9am#le t
1!- Escoge 9tat : Basic 9tatistics : 1-9am#le tD or #ress $trl P E.
$!- $lic@ Era#3s
!- $ompleta el recuadro como se indica a continuacin/
5
(!- $li@ 1@ en cada recuadro.
Inter#retando tus resultados
Inter.alo de con5ian4a
El intervalo de confianza es un rango de posibles valores para 9. Esta mostrado grficamente como una lnea roja # dos escuadras
cuadradas debajo del bo3plot.
Es un intervalo de confianza de H5I por que tomamos =;; muestras de la misma poblacin" los intervalos de H5 de las muestras
incluir a 9. Por lo tanto para cualquier ejemplo que pueda ser H5I seguro que la 9 est dentro del intervalo de confianza.
%rueba de 3i#&tesis
El punto rojo de la ) representa la media de la muestra # el punto azul de 2; representa la prueba de la media :6!5<. Puedes usar el
intervalo de confianza para probar la hiptesis nula/
>i 2; est fuera del intervalo" la p-value para la prueba de hiptesis tambi7n ser menor que ;.;5. Puedes rechazar la
hiptesis nula en EQlevel ;.;5.
>i 2; esta adentro del intervalo" la p-value ser ma#or que ;.;5. .o podrs rechazar la hiptesis nula en E-level ;.;5.
Por que 2; cae adentro del intervalo de confianza no puedes rechazar la hiptesis nula. .o ha# suficiente evidencia para concluir que
9 no es 6!5 gramos" en el ;.;5 nivel significante.
6
8onsideraciones 5inales
8onclusiones #rcticas
El intervalo de confianza de H5I :como el t-test< no provee suficiente evidencia para rechazar la hiptesis nula que la poblacin de la
media para el peso de las cajas de cereal sea de 6!5 gramos.
8onsideraciones de Estadstica
El intervalo de confianza provee un posible rango para
valores de 9:u otros parmetros de poblacin<.
En muchos casos" no puedes conducir un prueba de hiptesis usando un intervalo de confianza. Por ejemplo" si el valor de la prueba
no es entre un H5I de un intervalo de confianza" puedes rechazar 2; en el nivel E ;.;5. >in embargo si tu estructuras un HHI de
intervalo de confianza # no tiene una prueba de la media" puedes rechazar 2; en el nivel E ;.;=.
Inter.alos de con5ian4a
E"em#lo Entendiendo los inter.alos de con5ian4a
%roblema
Este ejemplo E3plora el concepto de las intervalos de confianza. >imularas la recoleccin de muestras al azar para una poblacin
normal usando *-.-T&(Rs generador de nSmeros al azar.
'ecolecci&n de Datos
Tu debes generar =; columnas de datos al azar
2erramientas
8alc : 'andom data : Normal!
9tat : basic 9tatistics : Dis#lay Descri#ti.e 9tatistics!
Data set
.inguno
Eenerando datos normales al a4ar
,sando un generado de datos al azar" puedes simular la recoleccin de datos al azar de una poblacin con una media dada. :Esto es
una situacin en la cual de hecho puedes saber el valor de 9.<
7
,sando el generador de datos al azar para simular la coleccin de =; muestras de una poblacin con una media:9< de =; # de una
desviacin estndar de =. >e generan 8; observaciones para cada muestra.
Normal
1! - Escoge File : Ne6
$! - >elecciona *-.-T&( Project.
! - $lic@ NT.
(! - Escoge 8alc : 'andom Data : Normal!
)!- $ompleta el recuadro como se indica a continuacin/
*!- $lic@ 1@ en cada recuadro.
8alculando inter.alos de 8on5ian4a del /0G
,sa Aispla# Aescriptive >tatistics para calcular intervalos de confianza del H;I para cada muestra. Por definicin" H de cada =;
intervalos deben contiener la 9. Aesde que sabes que la 9 representa muestras que son iguales a =;" puedes verificar esto
directamente.
En contraste a los intervalos de confianza del H5I" los de H;I son ms angostos: esto es que inclu#en menos valores<. Porque
estos contiene menos valores" es menos probable que contengan la 9.
Para probar la hiptesis nula que la 9 no es igual a un valor dado" un intervalo de confianza de H;I corresponde a un .=;. nivel de E.
Dis#lay Descri#ti.e 9tatistics
1!- Escoge 9tat : Basic 9tatistics : Era#3ical 9ummary!
$!- En Variables" enter C1-C10.
!- $ompleta el 8on5idence le.el como se muestra/
8
(!- $li@ 1k!
Inter#retando tus resultados
/0G de Inter.alo de con5ian4a #ara Mu HIJ
Toma un momento para repasar los intervalos de confianza para cada uno de tus muestras" 'as opciones seria que uno de tus
intervalos no va a contener 9:=;<.
Es posible que todos tus intervalos contengan 9. Tambi7n es posible que ninguno lo tenga :aunque es e3tremadamente inusual<. >in
embargo" si repites el ejercicio de la generacin de muestras al azar # calculando el intervalo de confianza del H;I" encontraras ese
apro3imado H;I de los intervalos que contiene 9.
'esultados 3i#ot=ticos
,n ejemplo de un intervalo de confianza de H;I que no contenga 9 es provedo por derecho. El intervalo se e3tiende de =;.;8B5 a
=;.B4HC.
Aate cuenta que este ejemplo en particular te llevar a un rechazo incorrecto de la hiptesis nula que 9 es igual a =; :asumiendo que
escojas el nivel E de ;.=;<.
Inter.alo de con5ian4a de /0G #ara sigma
Aate cuanta que la suma grfica tambi7n inclu#e a un intervalo de confianza de H;I para M :la desviacin estndar de la poblacin<.
El intervalo tiene en rango de ;.B448 a =.65;=. >i repites este procedimiento para un numero largo de muestras" cerca de H de =;
intervalos incluir el valor para M.
Estadsticas Descri#ti.as
9
8onsideraciones 5inales
8onclusiones #rcticas
Es probable que = de =; intervalos de confianza de H;I que calcules no contengan 9. >i este procedimiento fuera repetido para un
nSmero largo de muestras" cada =;I de todos los intervalos confidenciales de H;I no tendrn 9.
8onsideraciones de estadstica
Este intervalo de confianza provee un rango de valores para 9: los parmetros de la poblacin<.
En promedio" el H;I de los intervalos de confianza de H;I calculados para muestras al azar tomado de una distribucin normal de
poblaciones incluir a 9.
%o6er
E"em#lo ( E.aluando el %o6er
E"ercicio
.o estas seguro que confas en el resultado del anlisis del llenado del peso :pgina =-!<. Gas a conducir el anlisis del Power para
determinar si recolectaste suficientes datos
Luieres asegurarte que el llenado de las cajas no difiera del objetivo del peso de 6!5 gramos no ms de 8.5 gramos.
'ecolecci&n de datos
Gas a basar el anlisis del Power en los resultados del t-test del ejemplo =.
2erramientas
9tat: %o6er and 9am#le 9i4e: 1-9am#le t
Data set
.inguno
Anlisis del %o6er
;<ue es un anlisis del %o6er>
Power es la habilidad de una prueba para detectar un efecto cuando e3iste. $uando conduces una prueba de hiptesis" ha# C posibles
resultados/
2i#&tesis nula
Aecisin correcta
p F=-E
Error tipo --
p F U
Error tipo -
p F E
Decisi&n correcta
# K 1- L
H%o6erJ
10
Aecisin Gerdadero Kalso
Kalla al rechazar
%echazar
El Power de la prueba es la probabilidad que rechazara la hiptesis nula correctamente" dado que la hiptesis nula es falsa. Puedes
usar un anlisis Power para determinar cuanto poder tiene esta prueba" o a#udar a designar una nueva prueba para que tenga el
poder adecuado.
8uando usar un anlisis del %o6er
,sa un anlisis del Power cuando estas diseVando un e3perimento o despu7s de conducir una hiptesis nula. .o se requieren datos.
.ecesitaras estimar M :e3cepto por las pruebas de proporcin<.
;%or ?u= usar un anlisis del %o6er>
El anlisis del Power te puede a#udar a responder preguntas como/
0Es tu muestra lo suficiente grande1
0Lu7 diferencia puedes detectar con tu prueba1
0Aeberas confiar en los resultados insignificantes de la prueba 1
Por ejemplo"
0$untas muestras necesitas recolectar para determinar si el papel de proveedor es ms delgado que el de otro por ;.;;=5
pulgadas1
0Lu7 tan grande es la diferencia que puedes detectar entre la resistencia de una viga de acero # un historial de la media si
reSnes 4 muestras1
0Puedes confiar en los resultados de una prueba t-test que indica la resistencia de 8 frmulas de pegamento que no tienen
diferencia1
Determinando el %o6er
Tu meta es determinar que tan ciertos son los resultados del anlisis del llenado de las cajas de cereal :pagina=-!<
Valores
>i especificas valores para cualquiera de los 8 parmetros de la prueba" *-.-T&( calcular el parmetro restante/
>ample size----- el nSmero de observaciones en la muestra
Aifferences----- un significado cambio en el alejamiento del objetivo que estas interesado en detectar con alta probabilidad.
Power values----- el poder :probabilidad de rechazar 2; cuando es falso< que te gustara que tuviera la prueba.
9igma
Porque el poder de una prueba es parcialmente determinada por la variabilidad en los datos" debes proveer un estimado para M . ,sa
un estimado del historial o la desviacin estndar de la muestra.
1- 9am#le t
1!- Escoge 9tat : %o6er and 9am#le 9i4e : 1-9am#le t!
$!- $ompleta el recuadro como se indica a continuacin/
11
!- $lic@ 1@!
Inter#retando tus resultados
$on ! observaciones" una desviacin estndar de 8.;C6 # un E de ;.;5" el Power solo es de .56B!. Esto significa que 9 esta fuera del
objetivo por 8.5 gramos" solo tienes un 56.B!I de oportunidad para detectarlo.
Ae otra manera" ha# un C!.8CI de probabilidad que falles al rechazar 2; e incorrectamente conclu#e que el proceso est en el
objetivo.
;<u= sigue>
Ae manera que incrementes tu probabilidad de detectar un cambio si e3iste" es incrementar el tamaVo de la muestra. Aeterminar 7l
numero de observaciones requeridas para lograr el Power adecuado.
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F 8.C;6
Determinando el %o6er
$on ! observaciones el Power de tu prueba fue solo de ;.56B!. Para tener mejores posibilidades de detectar un efecto si es que
e3iste" debers incrementar el poder de tu prueba" que por lo menos sea de ;.4; :como regla general<.
$alcular el tamaVo de la muestra requerida para llegar los niveles de Power de ;.4;" ;.45" ;.H5" # ;.H5.
1-9am#le t
1!- Escoge 9tat : %o6er and 9am#le 9i4e : 1-9am#le t!
$!- $ompleta el recuadro como se indica a continuacin/
12
.- $lic 1@!
Inter#retando tus resultados
Para tener un Power de al menos ;.4; :objetivo del Power< para detectar una diferencia de 8.5 gramos al nivel E de ;.;5" necesitaras
una muestra de tamaVo =;.
Porque el tamaVo de las muestras debe ser siempre un numero entero. El Power actual de la prueba con =; observaciones :;.468B<
es escasamente ma#or que el objetivo Power.
Nbservaciones adicionales que dan mas Power/
$on == observaciones" el Power es de ;.4B6H.
$on =8 observaciones" el Power es de ;.H;54.
$on =5 observaciones" el Power es de ;.H!85.
&l duplicar el tamaVo de la muestra de ! a =8 cajas" incrementas tus posibilidades de detectar una diferencia de 8.5 gramos :s es que
e3iste< de 56.B!I a H;.54I.
Tal ves no quieran incrementar tu Power demasiado. >i tu Power es demasiado alto" podras empezar a detectar cambios que son
demasiado pequeVos para ser parcialmente importantes.
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F 8.C;6
13
%o6er
E"em#lo ) incrementando %o6er
E"ercicio
El resultado del anlisis de tu Power sugiere que necesitas una muestra ms grande para evaluar tu proceso. $on solo !
observaciones" haba mu# poco Power para detectar un diferencia de 8.5 gramos
'ecolecci&n de datos
=8 cajas de cereal son recolectadas al azar # pesadas
2erramientas
9tat: Basic statistic: 1-sam#le t
Data set
$E%E&'().*P+
.ombre Tipo de dato Tipo de variable
(o3Jeigh .um7rico %espuesta
%robando la 3i#&tesis nula
&naliza la nueva muestra para determinar si el proceso de la media es diferente a 6!5 gramos.
1-9am#le t
1!- &bre el pro#ecto $E%E&'().*P+.
$!- Escoge 9tat: Basic 9tatistics: 1-9am#le t
!- $ompleta el recuadro como se indica a continuacin/
(!- 2az clic en Era#3s!
)!- $heca BoB#lot o5 data!
*!- $lic@ 1@ en cada recuadro.
14
Inter#retando tus resultados
El t-test indica que la diferencia entre el proceso de la media # el objetivo de 6!5 gramos es significante en el nivel E ;.;5
El p-value :;.;=H< es menos que E :;.;5<.
El intervalo de confianza de H5I no inclu#e el valor del objetivo.
&parece que las cajas de cereal estn siendo sobre llenadas. >e deben tomar acciones correctivas para ajustar el proceso.
1ne-9am#le TA More1bs
Test of mu F 6!5 vs not F 6!5
Gariable . *ean >tAev >E *ean H5I $- T P
*oreNbs =8 6!!.!6! 8.;!; ;.5H5 :6!5.68B" 6!B.HC5< 8.B5 ;.;=H
Inter#retando tus resultados
El bo3plot ilustra lo que encontr la prueba/
El valor del objetivo:2;< esta afuera del intervalo de confianza.
'a muestra de la media :)< es ma#or que el valor del objetivo.
8onclusi&n
'a diferencia entre el proceso de la media # el valor del objetivo de 6!5 gramos es significante en el nivel E es de ;.;5.
8onsideraciones 5inales
8onclusiones #rcticas
Es probable que tu primera prueba del llenado de las cajas de cereal no sea significante porque tu Power era demasiado bajo. (asado
en el numero de observaciones :!<" la diferencia que quieres detectar :8.5<" # la variabilidad en los datos" la prueba tuvo un Power de
solo ;.56B!.
,sando una muestra grande te da mas Power" habilitndote para detectar la diferencia.
8onsideraciones estadsticas
Para asegurar que tu prueba tenga suficiente Power" es una buena idea el conducir un anlisis power para recolectar datos.
'as maneras de incrementar el Power de una prueba inclu#e/
-ncrementar el tamaVo de la muestra.
15
Aisminuir la variabilidad que no esta atribuida al efecto de inter7s.
-ncrementar E :aunque esto tambi7n te llevara a incrementar un error del tipo -<.
*a#or Power significa una ma#or probabilidad de detectar los errores. >in embargo tambi7n incrementa la probabilidad de detectar
errores pequeVos que puede que no sean de inter7s. El proceso del conocimiento a#uda a determinar el nivel optimo del Power en
una prueba.
E"ercicio )!1 Detectando #osibilidades en el dimetro de un balero
E"ercicio
,na parte del (alero manufacturado est fuera de especificaciones ;.;5 cm de lo correcto. ,n cambio de ;.;=cm es considerado lo
suficientemente importante para permitir el ajuste al equipo.
'a desviacin estndar de los dimetros es casi siempre de ;.;;C cm.
'ecolecci&n de datos
.inguno
Instrucciones
= ,se 9tat : %o6er and sam#le si4e : 1-sam#le t para calcular el tamaVo de la muestra necesitaras detectar una diferencia
de ;.;=cm con el Power de ;.45 en un nivel E de ;.;5
8 $alcular las diferencias puedes detectarlas con un power de ;.H; cuando recolectes 5 # =; observaciones.
Data set
.inguno
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F ;.;5
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F ;.;5
>ample
>ize Power Aifference
5 ;.H ;.;H48HCC
%o6er and 9am#le 9i4e
=->ample t Test
Testing mean F null :versus not F null<
$alculating power for mean F null P difference
&lpha F ;.;5 &ssumed standard deviation F ;.;5
>ample
>ize Power Aifference
=; ;.H ;.;5BB848
16
%'CEBA T M %'CEBA9 DE %'1%1'8INN
1b"eti.os
E.aluar la di5erencia entre la media del #roceso y un .alor de un ob"eti.o usando un 1ne-9am#le t-test!
E.aluar la di5erencia entre $ muestras de la media usando en T6o-9am#le t-test!
E.aluar las di5erencias entre $ obser.aciones usando un %aired t-test!
E.aluar la di5erencia entre una #ro#orci&n y un .alor de un ob"eti.o usando una #rueba de una #ro#orci&n!
8ontenidos
1ne-9am#le t-Test
E"em#lo 1 %roblema del Eran <ueso
E"ercicio
Tu compaVa" El Oran Lueso" -nc." sospecha que uno de tus proveedores de leche le esta aVadiendo agua a su leche para
incrementar sus beneficios. &Vadir agua a la leche incrementa su punto de congelacin" que normalmente es de Q;.5C5W $.
'ecolecci&n de datos
El punto de congelacin es medido para =; muestras al azar de la leche del proveedor.
2erramientas
9tat: Basic 9tatistics: Normality Test!
9tat: Basic 9tatistics: 1-9am#le t!
Data set
$2EE>E.*P+
17
1ne-9am#le TA Fr4Tem#
Gariable . *ean >tAev >E *ean H5I $-
KrzTemp =; -;.56H6!4 ;.;;BBHH ;.;;8C!! :-;.5CCHCB" -;.566BH;<
1ne-sam#le t-test
;<u= es un 1ne-9am#le t-test>
,n Nne->ample t-test te a#uda a determinar si 9 :la poblacin de la media< es igual a un valor d una hiptesis :la prueba de la media<.
'a prueba utiliza desviaciones estndar de una muestra para estimar M :la desviacin estndar de la poblacin<. >i la diferencia entre
la muestra de la media # la prueba de la media es grande relativamente a la variabilidad en la muestra" entonces 9 es improbable que
sea igual a la prueba de la media.
;8undo usar un one-sam#le t-test>
,sa un one-sample t-test cuando tienes datos continuos de una sola muestra al azar.
'a prueba asume que la poblacin esta distribuida normalmente. >in embargo es mu# justo a las violaciones de esta suposicin"
provedas las observaciones son recolectadas al azar # los datos son continuos # racionalmente sim7tricos. (ver Box, Hunter & Hunter
(1978). Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
;%or ?u= usar un one-sam#le t-test>
,n one-sample t-test te puede a#udar a responder preguntas tales como/
0Esta el proceso en el objetivo1
0El producto de tu proveedor cumple con tu criterio1
Por ejemplo"
Es el ancho de la media de las navajas ma#or o menor que el objetivo1
Es la resistencia de la media de los tornillos de tu proveedor menor de lo requerido1
Euas al Escoger las 2erramientas de Estadstica
Ti#o de Variable de 'es#uesta
18
%robando la su#osici&n de una normalidad
'a prueba de Estadstica apropiada para los datos de la temperatura congelante es un one-sample t-test. Esta prueba asume que la
poblacin esta normalmente distribuida.
,sa una prueba de normalidad para determinar si la suposicin de la normalidad es valida para esos datos.
%rueba de normalidad
1! &bre el pro#ecto $2EE>E.*P+
$! Elige 9tat: Basic statistics: Normality Test
! $ompleta el recuadro como se indica a continuacin/
19
Nne->ample t-Test
$orrelacin :dos
respuestas<
1 %'EDI8T1'
%egresin >imple
: 1 %'EDI8T1'
*Sltiple regresin
%espuesta >urface
1 %'EDI8T1'
Twp->ample t-Test
Nne-Ja# ?.NG&
: 1 %'EDI8T1'
*Sltiple %egresin
&. NG& Kactorial
Aesings
Test of Nne Proportion
$hi->quare
1 %'EDI8T1'
'ogistic %egresion
(! 2az clic en 1@
Inter#retando tus resultados
,sa el normal probabilit# plot para verificar que tus datos no se desven significativamente de una distribucin normal.
>i los datos vienen de una distribucin normal" los puntos mu# apenas seguirn la lnea de referencia.
>i los datos no vienen de una distribucin normal" los puntos no seguirn la lnea.
Anderson-Darling normality test
,n p-value de &nderson-Aarlin Test :;.;658< accesa a la probabilidad que los datos son de una poblacin con distribucin normal.
,sando en E de ;.;5" no ha# suficiente evidencia para sugerir que los datos no son de una poblacin normal.
8onclusi&n
(asado en el argumento # en la prueba es razonable asumir que tus datos no se desvan substancialmente de una distribucin
normal. Puedes proceder con el t-test.
20
8onduciendo el 1-sam#le t-test
$onducir un =-sample t-test para determinar si la temperatura congelante de la leche del proveedor es ma#or a Q;.5C5W $.
.o ha# razn para sospechar que el proveedor quitara el agua de la leche. &s" no necesitas probar si la temperatura congelante es
menor que Q;.5C5W $. En esta situacin" puedes usar una prueba =-tailed :en la cual 2= es direccional</
2; /9 F -;.5C5
2= /9 ? -;.5C5 :En una prueba 8-tailed" 2= .o es direccional/ 9 es diferente a Q;.5C5<
'a ventaja de la prueba =-tailed es que te da mas Power para detectar la diferencia especificada. >in embargo" una prueba =-tailed no
puede detectar una diferencia en la direccin contraria que especifica en 2=. Ae esta manera si ha# diferencias en ambas direcciones
son de inter7s" debers usar una 8 tailed test.
1-9am#le t
1! Escoge 9tat: Basic 9tatistics: 9am#le t!
$! $ompleta el recuadro como se indica a continuacin/
21
! 2az clic@ 1#tions!
(! Ae Alternati.e" Escoge greater t3an.
)! $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
,sa un nivel E de ;.;5 para la prueba.
T
El t-statistic :8.84< es calculado de esta manera/
T F :muestra de la media Q prueba de la media< X >E media
Aonde >E media es el error estndar de la media :una medida de variabilidad<. $omo el valor de t se incremente" el p-value se hace
mas pequeVo.
%
El p-value es ;.;8C. Porque este valor es menor que E:;.;5<" puedes rechazar la hiptesis nula. El resultado sugiere que el agua o
cualquier otro liquido halla sido aVadido a la leche.
%o6er
$uando sea apropiado" una prueba =-tailed es mas poderosa que una prueba 8-tailed. Por ejemplo" una prueba 8-tailed :2= / 9 es
diferente a Q;.5C5< regresa a p-value de ;.;C4" que es ma#or que ;.;8C.
1ne-9am#le TA Fr4Tem#
Test of mu F -;.5C5 vs ? -;.5C5
22
8onsideraciones 5inales
8onclusiones #rcticas
El =-tailed" =-sample t-test sugiere que la temperatura congelante de la leche del proveedor es ma#or a la que debe ser" indicando
que se le pudo haber aVadido agua. Esta es una acusacin mu# seria para el proveedor. Podra ser mejor evaluar que tan cierto es
antes de tomar una decisin.
$on un nivel E de ;.;5" las probabilidades de haber concluido que se le ha aVadido agua cuando no es as son de 5I. Para estar
seguro que no rechaces 2; incorrectamente" debers Escoger valores menores para E" tales como ;.;= o hasta ;.;;=. $on un E de
;.;=" no concluirs que se le all aVadido agua a la leche :p F ;.;8C<.
8onsideraciones estadsticas
$uando uses una =-sample t-test/
Tu muestra debe de ser al azar.
'os datos de muestra deben de ser continuos .
'os datos de muestra deben de distribucin normal.
Aebe de ser notado que los procedimientos del t-test son mu# justas a las violaciones de las suposiciones de normalidad" dadas esas
observaciones son recolectadas al azar # los datos son continuos # racionalmente sim7tricos. (ver Box, Hunter & Hunter (1978).
Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
,na prueba =-tailed es mas poderosa que una prueba 8-tailed. & menos que la diferencia no este en la direccin esperada" Por
ejemplo una prueba =-tailed con una hiptesis alternativa" 2= / 9 ? -;.5C5 nunca ser capaz de detectar la diferencia si alguien
disminu#e la temperatura congelante de la leche.
E"ercicio 1!1 Dimetro de los Valeros de Bola
E"ercicio
Tu compaVa produce Galeros de bola # necesitas verificar que el tamaVo del (alero que est7 en las especificaciones. 'a
especificacin del dimetro para los Galeros es de ;.5cm.
,sa un nivel E de ;.;5 para todas las pruebas.
'ecolecci&n de datos
=; Galeros son escogidos al azar # medidos.
Instrucciones
1! Prueba la muestra de normalidad usando 9tat: Basic 9tatics: Normality Test!
$! ,sa 9tat: Basic 9tatistics: 1-sam#le t para determinar si el proceso esta en el objetivo. $onduce una prueba 8-
tailed :2= / 9 es diferente a ;.5< # crea un bo3plot de los datos.
! ,sando la desviacin estndar de la muestra como un estimado de M" 0cul es el Power de la prueba para detectar
una diferencia de ;.;;5cm.1
(! 0$ul es el tamaVo mnimo para la muestra requerida para detectar la misma diferencia con un Power de ;.4;1
Data set
(E&%-.O>.*P+
23
T6o-9am#le t-Test
E"em#lo $ 'esistencia #lstica
E"ercicio
Tu compaVa hace estuches de plstico para calculadoras. .ecesitas comparar muestras de plsticos de 8 proveedores en cuanto a
su resistencia. El proveedor & dice tenar el plstico mas fuerte" pero cuesta mas que del proveedor (.
'ecolecci&n de datos
Pellets seleccionadas al azar de un grupo de plstico son prensadas en agua hasta ser barquillas del mismo grueso. 'a resistencia
para romperlos: en psi" libra por pulgada cuadrada< es tomada para cada barquilla.
2erramientas
9tat: Basic 9tatistics: Normality Test
9tat: Basic 9tatistics: $ .ariances
9tat: Basic 9tatistics: $-sam#le t
9et de Datos
P'&>T-$.*P+
T6o-sam#le t-test
;<u= es un t6o-sam#le t-test>
,na two-sample t-test te a#uda a determinar si 8 poblaciones de la media son iguales.
'a prueba usa las desviaciones estndar de la muestra para estimar M para cada poblacin. >i la diferencia entre la muestra de la
media es grande relativamente para la variabilidad estimada entre las poblaciones" entonces la media de la poblacin son improbables
a ser iguales.
,n two-sample t-test tambi7n te puede a#udar a evaluar si la media de 8 poblaciones es diferente por una cantidad especifica.
;8undo usar una #rueba t6o-sam#le t-test>
24
,sa una prueba two-sample t-test cuando tengas datos continuos de 8 muestras al azar independiente. 'as muestras son
independientes si las observaciones de un one.sample no estn relacionadas a las observaciones de la otra muestra. Por ejemplo" 8
medidas son tomadas por un mismo operador no son independientes.
'a prueba tambi7n asume que tus datos vienen de una poblacin normalmente distribuida. >in embargo es mu# justo hacia las
violaciones de esta suposicin provedas las observaciones son recolectadas al azar # los datos son continuos # razonablemente
sim7tricos. (ver Box, Hunter & Hunter (1978). Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
;%or ?ue usar una #rueba t6o-sam#le t-test>
,n two-sample t-test te puede a#udar a contestar preguntas tales como/
0>on los productos de dos proveedores comparables1
0Es la formula de un producto mejor que el otro1
Por ejemplo"
0Es similar la viscosidad del aceite de dos proveedores1
0Es la formula de una tinta ms brillante que otra1
%robando las su#osiciones de la normalidad
'a prueba de estadstica mas apropiada para los datos del proveedor es la two-sample t-test. Esta prueba asume que los datos son de
poblaciones distribuidas normalmente.
,sa la prueba de normalidad para determinar si la suposicin de la normalidad es valida para estos datos.
%rueba de normalidad
1! &bre el pro#ecto P'&>T-$.*P+.
$! Escoge 9tat: Basic statistics: Normality Test!
! En Gariable" enter Y>upplr&Y.
(! $lic@ 1@!
)! Escoge 9tat : Basic 9tatistics : Normality Test" or press ctrl. P E.
*! En VariableD enter Y>upplr(.
,! $lic@ 1@
Inter#retando tus resultados
,sa la normal probabilit# plot para verificar que tus datos no se desven significativamente de una distribucin normal.
>i los datos vienen de una distribucin normal" los puntos mu# apenas seguirn la lnea de referencia.
>i los datos no vienen de una distribucin normal" los puntos no seguirn la lnea.
El plot para el >upllr& indica que la distribucin de la muestra es razonablemente normalZ todos los puntos estn cerca de la lnea.
El plot para el >upplr( sin embargo aparentemente muestra desviacin de la normalidad.
Anderson-Darling Normality test
'a desviacin de la normalidad observada de >upplr( no es significante en un nivel E de ;.;5. &mbas p-values:;.!!C para >upplr&" #
;.;46 para >upplr(< son ma#or que ;.;5.
8onclusi&n
(asado en el plot # las pruebas" es racional asumir que tus datos no se desvan substancialmente de una distribucin normal. 'a
suposicin de una normalidad es relativamente satisfecha" as que puedes proceder con el t-test.
25
8om#arando las .ariaciones
&ntes de conducir el t-test" debes evaluar las variaciones de las 8 distribuciones para ver si difieren. 2a# dos razones para esto/
Es importante saber s el producto de un proveedor varia mas que el del otro
'os clculos para el two-sample t-test depende si las variaciones de las muestras son iguales o diferentes.
Para asegurar que encontraste una diferencia entre 8 variaciones si es que e3iste una. Aebes usar un nivel E de ;.=; para esta
prueba en lugar de la normal de ;.;5. Esto incrementara el power de la prueba.
$ Variances
1! Escoge 9tat: Basic statistics: $ Variances!
$! $ompleta el recuadro como se indica a continuacin/
26
! $lic@ 1#tions!
(! En 8on5idence le.el" enter H;.
)! $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
Inter.alos de con5ian4a
'os intervalos de confianza son Stiles para comparar M de las 8 poblaciones. >in embargo" tu decisin acerca de s las 8 variaciones
son iguales ser basadas en una apropiada prueba de variacin.
%ruebas de .ariaci&n
'os resultados inclu#en 8 pruebas de variacin separadas. El uso de la prueba depende de tus datos.
>i tus datos son continuos # de distribucin normal" usa el K-test.
>i tus datos son continuos pero no necesariamente de distribucin normal" usa el 'evene[s test.
'os datos dados son racionalmente normales" as que puedes usar el K-test. >in embargo" porque el p-value de la prueba de
normalidad del proveedor ( fue mu# baja :;.;46<" ha# que revisar los resultados de la prueba de 'evene[s tambi7n.
8onclusi&n
'os p-values para ambos K-test :;.;!B< # la 'evene[s :;.;58< son menos que E :;.=;<" as que puedes rechazar la hiptesis nula que
las variaciones son iguales. 'os resultados sugieren que las variaciones del plstico del proveedor & son ms pequeVos que las del
proveedor (.
27
K-Test :normal distribution<
Test statistic F ;.84" p-value F ;.;!B
'evene\s Test:an# continuous distribution<
Test statistic F C.8B" p-value F ;.;58
Test 5or E?ual Variances 5or 9u##lrAD 9u##lrB
Inter#retando tus resultados
'os mismos intervalos de confianza # las pruebas estadsticas incluidas en la ventana de resultados de la grafica tambi7n son
provedas en la ventana de sesin.
Test 5or E?ual VariancesA 9u##lrAD 9u##lrB
H5I (onferroni confidence intervals for standard deviations
K-Test :normal distribution<
Test statistic F ;.84" p-value F ;.;!B
'evene\s Test:an# continuous distribution<
Test statistic F C.8B" p-value F ;.;58
8onduciendo el T6o-9am#le t-test
Por que los datos son razonablemente normales" tu puedes usar 8 >ample t -to test #a sea la resistencia del plstico de los dos
diferentes proveedores.
'a prueba de 2iptesis es/
2; / 9 & Q 9 ( F ;
28
2= / 9 & Q 9 ( ] ;
Elabora dotplots # bo3plots para a#udar a visualizar los datos.
Asumir discre#ancias desiguales
>i asumes que las varianzas de las dos poblaciones son iguales" tu t-test ser ms confiable. >in embargo" si asumes que la varianza
es igual cuando no lo son" los resultados de tu t-test sern falsos. &s" si ha# alguna duda" es mejor no asumir que son iguales.
Porque la variance test indica que la poblacin de la varianza es diferente" no asuma que las varianzas son iguales.
$-9am#le t
1! Escoge 9tat : Basic 9tatistics : $-9am#le t!
$! $omplementa el recuadro como se indica a continuacin/
! $lic@ Era#3s!
(! %evisa Dot#lots o5 data # BoB#lots o5 data!
)! $lic@ 1@ en cada recuadro.
Inter#retando los 'esultados
'as grficas ilustran dos puntos /
El plstico del proveedor & se muestra ms resistente que el del proveedor (.
2a# mas variabilidad en la resistencia del Plstico del Proveedor ( que del Proveedor &.
29
Inter#retando tus 'esultados
T6o-9am#le T-Test and 8IA 9u##lrAD 9u##lrB
T6o-9am#le T-Test and 8I9u##lrAD 9u##lrB
30
Indi.idual Value %lot o5 9u##lrAD 9u##lrB
BoB#lot o5 9u##lrAD 9u##lrB
El promedio del punto de quiebre del plstico :media< # dos medidas de la variabilidad^la desviacin estndar :>tAev< # el error
estndar de la media :>E *ean<^se presentan en cada Proveedor.
Inter.alos de 8on5ian4a
'a diferencia entre la muestra de la media :B.C4C< se utiliza para estimar la diferencia entre la poblacin de la media :mu >upplr&^mu
>upplr(<. El intervalo de confianza por la diferencia se basa en esta estimacin # la variabilidad de las muestras.
Puede ser H5I confiable que la diferencia entre la poblacin de la media es entre !.!4B # 4.84= psi.
T-.alue y #-.alue
El T-value para la prueba es =H.48" lo cual se asocia con un p-value menor que ;.;;;5 :lo cual se redondea a ;.;;;<
&s" puedes rechazar la 2iptesis nula en ;.;5 E-level" donde conclu#e que las resistencias son diferentes.
8onsideraciones 5inales
8onclusiones #rcticas
El proveedor de plstico & es significativamente resistente # menos variable que el proveedor (. >in embargo" observamos que el
Proveedor & tambi7n nos cobra mas por el producto. &hora tienes que decidir si la diferencia entre los Proveedores es significativa.
>e cuenta con el H5I de confianza de la verdadera diferencia entre el proveedor !.!4B # 4.84= psi. Tu decides pagar o no un precio
alto por una pequeVa diferencia en la resistencia.
8onsideraciones estadsticas
$uando utilizas two-sample t-test /
'as muestras deben ser al azar.
'as muestras deben ser independientes.
'as muestra deben ser continuas.
'as muestras deber ser de distribucin normal.
Aebe acentuarse que el procedimiento para la t-test es lo suficientemente veraz a las violaciones de la &suncin de la normalidad"
provedas estas observaciones los datos son recolectados al azar" son continuos" unimodal # razonablemente sistemticos. (ver Box,
Hunter & Hunter (1978). Statistics for xperi!enters, "o#n $ile% & Sons, &nc.).
Inter#retando tus resultados
31
Dos-e"em#los T #ara 9u##1 rA .s 9u##1 'b
. *edia >tAev >E *edia
>upp=%a =; =!8.!=C ;.5HH ;.=H
>uppl=r( =8 =55.=6 =.=6 ;.66
Aiferencia F mu >upp=r& Q mu >upp=r(
Estimacin por diferencia/ B.C4C
H5I $- para diferencia/ :!.!4B" 4.84=<
T- Testo de diferencia F ; : vs no F </ T- Galor F =H.48 P-Galor F ;.;;; AK F =B
'a resistencia a ruptura media :medio<" # dos medidas de desviacin estndar de la variabilidad-:>tAev< # del error de estndar del
medio :el >E *ean<- se presenta para cada surtidor.
7os inter.alos de con5ian4a!
'a diferencia entre los medios de la muestra :B.C4C< se utilizan para estimar la diferencia entre los medios de la poblacin :mu
>upplr&-mu >upplr(<. El intervalo de la confianza para la diferencia se basa en esta estimacin la variabilidad dentro de las muestras.
,sted puede tener una confianza del H5I que la diferencia entre los medios de la poblacin est entre !.!4B # 4.84= P>-.
T-.alor y el #-.alor
El t-valor para la prueba es =H.48" que se asocia a un p-valor de menos de ;.;;;5 :que redondeado a ;.;;;<.
&s" usted puede rechazar la hiptesis nula en el ;.;5 _ - nivel" # conclu#e que las fuerzas son diferentes.
8onsideraciones Finales!
8onclusiones #rcticas!
El plstico de &[s del surtidor es perceptiblemente ms fuerte # menos variable que el surtidor ([s. sin embargo recuerda que el
surtidor & tambi7n carga ms para su producto. &hora usted debe decidir si la diferencia entre los surtidores es de significacin
prctica.
,sted es el H5I confiable que la diferencia verdadera entre los surtidores es entre !.!4B # 4.84= pis. ,sted decide que no est
dispuesto a pagar el precio alto ms elevado para la pequeVa fuerza de diferencia.

8onsideraciones Estadsticas!
&l usar una t-prueba de la dos-muestra/
'a muestra debe ser al azar.
'as muestras deben ser independientes.
'os datos de la muestra deben ser continuos.
'os datos independientes de la muestra deben ser distribuidas normalmente
Aebe ser observado que el procedimiento de la t-prueba es bastante robusto a las violaciones de la asuncin de la normalidad" la
condicin de que las observaciones se recogen aleatoriamente # los datos son continuos" unimodal" # razonablemente sim7tricas
:v7ase a la caja" al cazador" # a $azador :=HB4<. Estadstica para E3perimentos" +ohn Jile# ` >ons" -nc.<.
%rueba- t %areada
E"em#los del Estacionamiento de los 8arros!
%roblema
,n grupo de consumidor desea determinar si ha# una diferencia en la manipulacin de capacidad entre dos coches populares. Para
medir la capacidad de direccin de los coches" el tiempo lleva conductores el parque paralelo que cada uno de los coches se registra.
'ecolecci&n de datos
Geinte conductores parquean ambos coches :en orden al azar<" # el tiempo del estacionamiento registrado :en segundos<.
2erramientas
32
9tat : Estadsticas Bsicas : %aired
9et de Datos
$&%$'T.*P+
Nombre Ti#o de Dato Ti#o de Variable
$arro - & .um7rico %espuesta
$arro - ( .um7rico %espuesta
%rueba-t %areada
;<u= es una #rueba t #areada>
En una prueba t pareada tu puedes determinar si la media de la diferencia entre las observaciones pareadas es significativa
Estadsticamente" es equivalente a realizar una Prueba t de una-muestra de una diferencia. ,na t-prueba pareada se puede tambi7n
utilizar para evaluar si la diferencia es igual al valor especfico.
'as observaciones pareadas se relacionan de una cierta manera. 'os ejemplos inclu#en/
Pesos registrados para los individuos antes # despu7s un programa de ejercicio.
*uestras tomadas de la misma parte con dos diferentes dispositivos de medida.
;8undo utili4ar una #rueba t #areado>
,se una Prueba t pareada cuando tengas una muestra escogida al azar de observaciones pareadas. 'os datos deben ser continuos.
;%or?u= usar una #rueba t #areada>
'as pruebas t pareadas t puede a#udar a responder preguntas tales como/
0,n nuevo tratamiento causa la diferencia en el producto1
0Aos instrumentos de medida hacen lo mismo1
Para el ejemplo/
0Tratando la madera de construccin con ciertos productos qumicos aumenta su vida Stil1
aPueden dos calibradores medir id7nticas partes de la misma manera1
8onduciendo una #rueba t de #areada
Tu estas intentando determinar si un coche se puede estacionar ms rpidamente que otro. Porque se emparejan los datos :cada
individuo estaciono ambos coches<" tu utilizaras una prueba t pareado para probar las hiptesis siguientes/
2o/ 'a diferencia de la media entre las observaciones pareadas en la poblacin es cero.
2=/ 'a diferencia de la media entre las observaciones pareadas en la poblacin no es cero.
$ree los dotplots # los bo3plots para a#udar a visualizar los datos. ,tilice el nivel de la confianza del defecto del H5I para la prueba.
t %areadas
1!- &bre el Project 8A'87T!M%O!
$!- Elija 9tat ? Estadsticas bsicas ? Pareo t.
!- $ompleta el recuadro como se indica a continuacin/
33
(!- $lic@ Era5icas!
)!- Elija Do#lot de di5erencias # BoB#lot de di5erencias!
*!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
El bo3plot # el dotplot ilustran las diferencias entre las observaciones pareadas.
'a diferencia de la media : apro3imadamente 8< es representa por el ). 2o representa la diferencia de la poblacin que estas
probando :cero.
El inter.alo de con5ian4a
*-.-T&( tambi7n dibuja el intervalo de confianza para la diferencia de la media de la poblacin. &s que la hiptesis nula es verdad"
tu esperarais que 2o estuviera dentro de este intervalo.
Porque el intervalo de la confianza no esta incluido en 2o" tu puedes rechazar la hiptesis nula # concluir que al coche & le toma mas
tiempo estacionar que al coche (.
34
Inter#retando tus resultados
'as medias de los tiempos para estacionarse son 6C.4B segundos para el coche & # 68.H; segundos para el coche (. 'a diferencia
es =.H!B segundos.
'os puntos finales para el intervalo de confianza del H5I para la diferencia de la media son de ;.=B= # 6.B!C.
T-.alor y #-.alor
'a prueba da un valor de t de 8.8H" se asocia con un p-valor de ;.;6C. &s" tu puedes rechazar la hiptesis nula en el nivel ;.;5 _ #
concluir que el tiempo requerido para estacionar el coche & es ma#or que el tiempo requerido para estacionar el coche (.
%rueba T #ara 8arros A P 8arros PB
8onsideraciones 5inales
8onclusiones #rcticas
En promedio" a los conductores les tomo =.H!B segundos mas estacionar el coche & que el coche (. Esta diferencia aunque
pequeVa es estadsticamente significativa.
0Es una diferencia de 8-segundos de importancia practica1. Esto lo decides tu.
'os tiempos levemente ms largos para estacionarse se asocian a la frustracin creciente del conductor" los 8 segundos pueden ser
importantes. Tambi7n" esta diferencia puede ser de ma#or importancia a los conductores que seguido se estacionan paralelo.
35
8onsideraciones Estadsticas
$uando usar una prueba t pareada/
'as observaciones deben ser pareadas.
'os datos deben ser continuos.
'as diferencias deben ser distribuidas normalmente.
Aebe ser observado que el procedimiento de la prueba t es bastante robusto para las violaciones de las suposiciones de la
normalidad" a condicin de que los pares de observaciones se recojan aleatoriamente # los datos sean continuos" unimodal" #
razonablemente sim7tricos :v7ase a la caja" al cazador" # a $azador :=HB4<. Estadstica para E3perimentos" +ohn Jile# ` >ons" -nc.<.
,tilizando observaciones pareadas eliminas la variabilidad causada por individuos! Por ejemplo" al conductor = le tomo =4.H
segundos para estacionar el coche # =4.8 segundos para estacionar el coche (. En contraste" al conductor =4 le tom C6.4 # C=.=
segundos para estacionar los mismos coches. Nbviamente" ha# mucha variabilidad entre los conductores. Pero analizando las
diferencias para cada conductor" tu eliminas esta variabilidad de los clculos" aumentando el power de tu prueba.
E"ercicio !1 8om#araciones de 8alibradores
E"ercicio
Tu ests considerando la compra de dos diversos gage para medir vlvulas/ $alibradores por Eas#Oage # Too=-t. Tu deseas
comparar las dos marcas de fbrica del calibrador para determinarse si ofrecen las mismas medidas de promedio.
,tilice un _-nivel de ;.;5 para todas las pruebas.
'ecolecci&n de datos
Aoce operadores cada uno midieron la misma vlvula con los dos diversos calibradores. :El orden en la cual utilizaron el calibrador
fue seleccionado aleatoriamente.<
Instrucciones
=.- ,se una prueba t pareada para determinar si las medidas de cada calibrador son diferentes.
8.- $on la desviacin de estndar de la diferencia de la muestra como estimacin de _ " calcule la energa de la prueba al detectar
una media de la diferencia de ;.;;5 cm.. :-ndirecta/ $onducir una t-test paired es lo mismo que conducir una t-prueba de la una-
muestra es la diferencia entre las observaciones pareadas.
Por lo tanto" tu puedes utilizar 9tat : %o6er and sam#le si4e : 1- 9am#le t para evaluar el power de la prueba t pareada.
6.- 0cul es la energa de la prueba de detectar una diferencia de la media de ;.;;= centmetro1
>et de datos
$&'-PE%>.*P+
Nombre Ti#o de dato Ti#o de .ariable
Nperator .um7rico %espuesta
Eas# gage .um7rico %espuesta
Toollt .um7rico %espuesta
Aiff .um7rico %espuesta
%rueba de una %ro#orci&n
E"em#lo ( Tele.isiones 'e#aradas #or Tari5a
E"ercicio
Tu quieres determinar si la proporcin de tu sistema de televisin de 65- pulgada necesitara ser reparado en el plazo de C aVos de la
compra" es diferente que el ndice de la industria !.4I : ;.;!4<
'ecolecci&n de datos
&pro3imadamente =;;";;; encuestas fueron enviadas a los clientes que compraron una televisin 65-plagadas. Ae los 8"45! clientes
que regresaron las encuestas" 86! indicaron que su televisin haba requerido la reparacin en el plazo de C aVos de la compra.
2erramientas
36
9tat : Estadsticas Bsicas : 1 %ro#orci&n
9et de datos
.inguno
%rueba de una #ro#orci&n
;<u= es una #rueba de #ro#orci&n>
,na prueba de una proporcin te a#uda determina si una proporcin de la poblacin es diferente de un valor especfico :proporcin de
la prueba.<
;8undo utili4ar una #rueba de una #ro#orci&n>
,sa una prueba de proporcin para evaluar la proporcin de los datos de una sola muestra.
;%or?u= usar una #rueba de una #ro#orci&n>
,na prueba de una proporcin te puede a#udar a contestar preguntas tales como/
0Es una poblacin diferente de ;.51
b< 0Es una proporcin ma#or o menor que el criterio1
Por el ejemplo"
0En un programa de inteligencia artificial es posible contestar 9 Q No preguntas con ma#or e3actitud del 5;I1.
0Est el porcentaje de averas de los sujetadores plsticos debajo del m3imo aceptable1.
8onduciendo una #rueba de una #ro#orci&n
Tu ests evaluando los resultados de un e3amen enviado a los clientes que compraron una de sus televisiones.
'a proporcin de los que respondieron con televisin que la necesito reparacin dentro de los C aVos es 86! X 845! F ;.;48!. El
promedio de la industrial es ;.;!4.
,tiliza una prueba de una proporcin para determinar si esta diferencia es significativa.
'as hiptesis para la prueba es/
2o/ la proporcin de la poblacin para sus clientes es igual a ;.;!4.
2=/ la proporcin de la poblacin para los clientes no es igual a ;.;!4.
,tilice un nivel de la confianza del H5I.
1 %ro#orci&nA
1!- Elija 9tat ? 'a Estadstica (sica ? = Proporcin.
$!- >eleccione 9ummari4ed data!
!- En el .Smero de ensa#os" tipo 845!.
(!- En el N+mero de =Bitos" tipo 86!.
)!- $lic@ 1#ciones!
*!- $omplete el recuadro como se indica a continuacin/

,!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
,tilice _ de ;.;5 para la prueba.
'os resultados sugieren que el ndice de la reparacin para su televisin :muestra p F ;.;46< sea ms alta que el ndice a nivel
industrial de ;.;!4
El intervalo de confianza del H5I :;.;B8BHH8 & ;.;H666H< no inclu#e ;.;!4.
El p-valor :;.;;6< es menos que _ :;.;;5.<
Tu debes rechazar la hiptesis nula" #a que el ndice de tu reparacin igual que el ndice a nivel industrial.
37
Mas Q Para clculos de intervalos de confianza" vea a#uda de *initab.
Test y 8I #ara una %ro#orci&n
8onsideraciones 5inales
8onclusiones #rcticas
'a evidencia sugiere que la proporcin de que tu televisin requiera reparacin dentro de los de C aVos de la compra es ma#or que la
proporcin del ndice a nivel industrial de ;.;!4.
Por supuesto" la ma#ora de los clientes que recibieron el e3amen no lo devolvi. Es siempre posible que los clientes que han tenido
un problema en su televisin son los ms probables en devolver el e3amen. >i 7sta es la causa" la proporcin real puede ser mucho
menos de ;.;48!66.
8onsideraciones estadsticas
$uantas ms observaciones tu tengas" ms power tendr tu prueba de una proporcin.
Tambi7n puedes aumentar el power aumentando R! >in embargo esto tambi7n aumenta la posibilidad de que ocurra el error tipo =.
'EE'E9INN
1b"eti.osA
o *ida el grado de la asociacin linear entre dos variables usando los grficos # la estadstica.
o *odelo para la relacin entre variables de respuestas continuas # unas o ms variables de prediccin.
o Aetermine la fuerza de la relacin entre variable de respuesta continua # unas o ms variables de prediccin.
8ontenidos
38
8orrelaci&n
E"em#lo 1 de 9istemas de Medias
E"ercicio
Tu has desarrollado un sistema de medida en lnea que usted cree medirn el p2 como e3actamente el sistema actual en su
laboratorio. El sistema en lnea proporcionara una regeneracin ms rpida # la capacidad de ajustar los sistemas en tiempo real. Tu
quieres saber si los dos sistemas producen lecturas similares del p2.
'ecolecci&n de datos
'a coleccin de datos ambos sistemas se utiliza para medir el p2 de 8; +ornadas aleatoriamente seleccionadas del producto de
limpieza.
2erramientas
Era#3 : %lot
9tat : Basic 9tatistics : 8orrelation
9et de Datos
'&(>TE>T.*P+
Nombre Ti#o De datos Ti#o de Variable
'aboratorio .um7rica %espuesta
39
En lnea .um7rica %espuesta
8orrelaci&n
;<u= es correlaci&n>
'a muestra del coeficiente de correlacin r" mide el grado de la asociacin linear entre dos variables :el grado en la cual una variable
cambia con otra<.
,na correlacin positiva indica que ambas variables tienden a incrementarse juntas. ,na correlacin negativa indica que una variable
se incrementa" # la otra decrece.
;8undo utili4ar la correlaci&n>
,tiliza la correlacin cuando tengas datos para que dos variables continuas # desees determinen si ha# una relacin linear entre ellas.
'a correlacin no dir si estas variables estn relacionadas de una manera no lineal.
&lgunos estadsticas creen que la correlacin no debe ser utilizado si una variable # es dependiente de la respuesta de la otra.
;%or?u= usar la correlaci&n>
'a correlacin te puede a#udar a contestar preguntas tales como/
0Estn dos variables relacionadas en una manera linear1.
0$ul es fuerza de la relacin1.
Por ejemplo"
02a# una relacin entre la temperatura # la viscosidad del aceite de cocina1.
0Es fuerte la relacin entre la e3posicin ultravioleta # la fuerza reducida en el material de n#lon de la tienda1.
Dibu"ando los datos
$reando un diagrama te a#udar a visualizar la relacin entre las medidas tomadas por los dos sistemas que ests utilizando para
medir el p2.
Era5icando las .ariables
Orafica el laboratorio # el Nnline de la variable en ) # b respectivamente.
%lot
1!- &bre el pro#ecto '&(TE>T.*P+.
$. Escoge Era#3 : %lot
!- $ompleta el recuadro como se indica a continuacin/
(!- $lick 1@
40
Inter#retando tus resultados
El diagrama Nnline contra medidas del laboratorio indica/
2a# una relacin fuerte entre los dos sistemas que miden. $uando los valores para el laboratorio cambian" tambi7n lo hacen
los valores para Nnline.
'os datos siguen una lnea bastante recta que sugiere que la relacin es linear.
'os altos valores del sistema en lnea se asocian a altos valores del sistema del laboratorio" indicando que la relacin es
positiva.
;<ue se 3ace des#u=s>
Porque la relacin es linear" usted puede calcular la correlacin para cuantificar la fuerza de la asociacin.
8alculando la correlaci&n
Tu deseas calcular el coeficiente de correlacin de Pearson para determinar la fuerza de la asociacin linear entre las medidas en
Nnline # del laboratorio.
8orrelaci&n
1!- Escoge 9tat : Basic 9tatistics : 8orrelacion!
$.- Enter en Gariable 'aboratorio.
41
!- $lic@ 1@!
Inter#retando tus resultados
8orrelaci&nA 7aboratorio En lnea!
Prueba de la $orrelacin 'aboratorio En lnea F ;.H5H
P Q Galor F ;.;;;
,se una _ ;.;5 para el te3to.
%earson correlaci&n
El coeficiente de la correlacin de la muestra :r< es calculado por la frmula/
El valor de r estar siempre entre -= # =/
= indica una correlacin positiva perfecta.
; indica ninguna correlacin.
-= indica una correlacin negativo perfecto.
%-.alor
'a prueba del p-valor las hiptesis siguientes/
2o/ El coeficiente de correlacin :p o rho< para la relacin entre las poblaciones es igual a cero.
2=/ p no es igual a cero.
8onclusi&nA
El coeficiente de correlacin :;.H5H< indica que ah una fuerte asociacin lineal positiva entre la media del 'aboratorio # la del
Nnline. &dems el p-valor :;.;;;< es menos que ` :;.;5<" entonces tus puede rechazar la hiptesis nula" #a que no e3iste ninguna
asociacin lineal.
42
;<ue se 3ace des#u=s>
&ntes de sustituir el sistema de laboratorio con el sistema en lnea" tu necesitas evaluar dos aspectos adicionales entre la relacin de
los dos. -ncluso si la correlacin era perfecto :rF=<" todava podran haber diferencias importantes entre los sistemas/
'as medidas de un sistema podran ser coherentemente ms altas que las medidas del otro.
El coeficiente de correlacin no dirige estas cuestiones de tendencia # sensibilidad.
Anotaci&n de la gr5ica
,tilice el diagrama del argumento para a#udarte a evaluar si la medida de los dos sistemas es similar" # si los sistemas son
igualmente sensibles/
Traza con los datos los mismos valores del mnimo # del m3imo para ambas ).
b &gregue una lnea para indicar donde SFM. :usted podra agregar la lnea despu7s de que el grfico sea creado usando las
herramientas para graficas de *-.-T&([s. >in embargo" la caja del subdilogo de la anotacin proporciona una manera ms
e3acta de agregar lneas al grfico<.
%lot
1!-Elige Era#3 : %lot.
$!- Ael ca#tulo" elige el minuto y el mBimo!
!-Elige el mismo mnimo y mBimo #ara las S de S y de M!
(!- $lic@ 1@
)!- Para anotaci&n" elija la lnea!
*! Q $ompleta el recuadro como se indica a continuacin/
B.- $lic 1@ en cada recuadro.
Inter#retando tus resultados
Para cada punto referente en la lnea" S es igual a M. >i ambos sistemas van encima con las mismas medidas para cada muestra"
entonces todos los puntos de referencias caern en esta lnea.
$omparando los datos en la lnea de referencia revela lo siguiente/
o Todos" menos un punto est debajo de la lnea" indicando que el sistema en lnea produce medidas constantemente ms
altas que el sistema del laboratorio.
43
o 'a lnea que los datos siguen tiene bsicamente la misma cuesta que la lnea de referencia. Esto indica que los valores de
los rangos indican que los dos sistemas son similares.
8onsideraciones 5inales
8onclusiones #rcticas
2a# una fuerte correlacin positiva del :;.H5H< entre las medidas tomadas con el laboratorio # con los sistemas en lnea.
>in embargo el sistema en lnea rinde medidas constantemente ms altas que lo hace el sistema del laboratorio. Esto puede indicar la
necesidad de recalibracin.
'os resultados de los lmites en el e3perimento indican que es menos costoso # ms fcil utilizar el sistema en lnea # puede ser un
reemplazo conveniente para el sistema de medida del laboratorio.
8onsideraciones estadsticas
'a $orrelacin cuantifica el grado de la asociacin linear entre dos variables.
,na correlacin fuerte no implica una relacin de causa # efecto. Para el ejemplo" una correlacin fuerte entre dos variables puede
ser debido a la influencia de una tercera variable" no bajo consideracin.
,n coeficiente del correlacin cerca de cero no significa necesariamente ninguna asociacin" slo que esa asociacin no es linear. Tu
debes trazar siempre sus datos de modo que puedas identificar relaciones lineares cuando ests se presenten.
&lgunos estadsticos discuten que la correlacin que sea utilizada si una variable es una respuesta dependiente de la otra.
'a correlacin asume que los valores de ambas variables estn libres de variar. Tu no puedes utilizar la correlacin si fijas los valores
de una variables una para estudiar cambios en otra.
'egresi&n 9im#le
E"ercicio
Tu sospechas que la revoltura tiene un impacto en el nivel de impurezas en tu producto de pintura.
'ecolecci&n de datos
'as impurezas fueron medidas para lotes de pintura revueltas en rangos de movimientos a partir de 8; a C8 %P* :revoluciones por
minuto.<
2erramientas
9tat : 'egression : Fitted 7ine %lot!
9tat : 'egression : Fitted 7ine %lots!
44
9et de Datos
%AINT!M%O
'EE'E9INN 9IM%7E
;<u= es la regresi&n sim#le>
'a regresin simple e3amina la relacin entre una variable de respuesta continua :b< # una variable de prediccin :)<. 'a ecuacin
general para un modelo de regresin simple es/
b F b F Uo P U= ) P c

Aonde b es la respuesta" ) es la prediccin" Uo la es el interceptor :el valor de b cuando ) iguala el cero<" U= la es la cuesta" # c es
el error aleatorio.
;8undo usar la regresi&n sim#le>
,sa la regresin simple cuando tu tengas b continua # solo una ). 'as siguientes condiciones deben ser encontradas/
) puede ser ordinal" o continSa.
En la teora" ) debera ser fijada. En la prctica" sin embargo" a menudo le permiten para variar.
$ualquier variacin arbitraria en la medida de ) es asumida para ser insignificante comparada con el rango en cual ) es medido.
'os valores de b obtenidos en su muestra se diferenciarn de estas predicciones por el modelo de regresin :a no ser que todos los
puntos resulten caer sobre la lnea perfectamente recta.<. 'laman residual a estas diferencias.
&ntes de la aceptacin de los resultados de un anlisis de regresin" tu debes verificar que las suposiciones siguientes sobre los
residuales son vlidas para tus datos/
Ellos son independientes :# as arbitrarios<.
Ellos estn distribuidos normalmente.
Ellos tienen constantes variaciones a trav7s de todos los valores de ).
;%or ?u= usar la regresi&n sim#le>
'a regresin simple te puede a#udar a contestar preguntas tales como/
0$mo importante es ) en la prediccin b1
0Lu7 valor puedes tu esperar para b cundo ) es 8;1
0$unto es que cambio de b si ) en una unidad1
Por ejemplo"
0$mo el proceso de la temperatura de tratamiento se relaciona con la dureza de su acero1
0Lue fuerza tendr su acero si usted lo trata a una temperatura particular1
0$unto ms difcil tratar ser su acero si aumentas la temperatura en =;;1 d1
A"ustando el modelo lineal
Tu quieres determinar el efecto de tarifa de movimiento sobre la cantidad de impurezas en la pintura. ,tiliza Fitted 7ine %lot para
calcular # graficar la ecuacin de la regresin
Fitted 7ine %lot
1!- &bre el Project P&-.T.*P+.
$!- Escoge 9tat : 'egression : Fitted %lot!
45
!- $ompleta el recuadro como se indica a continuacin/
(!- $licT 1@
Inter#retando tus resultados
'egresi&n la ecuaci&n
'a ecuacin de %egresin relaciona la prediccin :stirrate< con la respuesta :la impureza</
-mpureza F-;.84H8BB P ;.C5!!C6 stirrate
'a inclinacin de la lnea de regresin" ;.C5!!C6" indica cuanto un cambio en la impureza es asociado con cada cambio de una
unidad de stirrate.
9
> es una estimacin del promedio de variabilidad media sobre la lnea de regresin. 'a > es la raz cuadrada positiva de *>E. 'a
mejor ecuacin predice la respuesta" mas bajo > ser.
'
$
H'-9?J
'a '
$
:$uadrada de r< es la proporcin de la variabilidad en la respuesta que es e3plicada por la ecuacin. &s" el H6.C I de la
variacin en la impureza puede ser e3plicado por su relacin lineal con el >tirrate.
Galores aceptables para '
$
varan dependiendo del estudio. Por ejemplo" los -ngenieros que estudian reacciones qumicas pueden
requerir una '
$
del H; I o ms. >in embargo" alguien estudiando el comportamiento humano :que es ms variable< puede estar
satisfecho con valores de '
$
inferiores.
A"ustada Hcuadrado de r Had"JJ
'
$
ajustada es sensible al nSmero de t7rminos :condiciones< en el modelo # es importante comparar los modelos con diferentes
nSmeros de t7rminos :Ger 6-54<.
46
7a menor lnea de regresi&n cuadrada
'os coeficientes para la ecuacin de regresin son escogidos para reducir al mnimo la suma de las diferencias cuadriculadas entre
los valores de respuesta observados en la muestra # aquellos predichos por la ecuacin.
En otras palabras" las distancias verticales entre los puntos # la lnea son reducidas al mnimo" ilustrado a la derecha. El resultado es
llamado/ 'a menor parte de la lnea de regresin cuadrada.
Est7 atento a esta lneas de fuera usando los procedimientos de la regresin. &lgSn lneas de fuera :llamados altos puntos < tienen un
efecto grande sobre el clculo de la menor parte de lnea de regresin de cuadrado. En tales casos" la lnea ms puede puede
representar al resto de datos mu# bien.
.ote/ este grfico ha sido corregido para la ilustracin.
Inter#retando tus resultados
,se el anlisis de varianza :&.NG&< resultados para evaluar si su modelo de regresin simple es Stil. El &.NG& compara su modelo a
un modelo restringido que no usa >tirrate :S< para predecir la impureza :M</
*odelo de %egresin/ b F Uo P U= ) P c
*odelo %estringido/ b F b F UoP c
47
El modelo restringido declara que los cambios de b estn previstos Snicamente al error arbitrario :c<. Es equivalente a un modelo de
regresin simple con una cuesta :U=< de cero. &s" las hiptesis para el &.NG& son"
2o/ U= es igual para cero.
2=/ U= no es igual a cero.
-nterprete el p-valor :P< as/
>i el p-valor es menos que o igual a _ " deseche 2o. El modelo de regresin e3plica considerablemente ms variabilidad en la
respuesta que hace el modelo restringido. 'a U= no iguala el cero.
>i el p-valor es a ma#or" usted no puede rechazar la 2o. U= no es considerablemente diferente del cero.
8onclusi&n
,sando un _ ;.;5" tu puedes rechazar el modelo simple restringido # afirmar que >tirrate realmente tiene un efecto significativo lineal
sobre la -mpureza.
Anlisis de 'egresi&nA Im#ure4a contra 9tirrate
Adicionando con5ian4a y %redicci&n
$onfidencialidad # bandas de prediccin.
Tu tambi7n quieres saber si confiar que la media # los puntos individuales en la variable b" -mpurezas caen dentro de ciertos lmites
de variabilidad.
'esiduales y Fits
El %esidual es la diferencias entre los valores ajustados de su modelo # los valores observados. >on las estimaciones de punto de la
respuesta estimados para cada nivel de la variable independiente. Tu debes almacenar estos valores para usar ms tarde.
,se un nivel de confianza de falta del H5 I.
Fitted 7ine %lot
1!- Escoja 9tat ? 7a 'egresi&n ? Fitted 7ine %lot presione $trl P E para volver al dialogo Fitted 7ine %lot al cuadro.
$!- . 8lick Npciones.
48
!- $ompleta el recuadro de dilogo como se indica a continuacin/
(!- $lic@ 1@!
)! - $lic@ 9torage!
*!- Elige 'esiduals y Fits!
,- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
Inter.alo de con5ian4a
El H5I de confianza define un e3celente rango de valores en la poblacin de la media de b. Para cualquier valor dado de SD tu pues
confiar que la poblacin de la media de b esta entre las lneas indicadas.
Inter.alo de #redicci&n
El intervalo de prediccin del H5 I define una gama probable de valores de M para observaciones individuales. Para cualquier valor
dado de S" tu puedes confiar con un H5 I que el valor correspondiente de M para una observacin estar entre las lneas indicadas.
'egresi&n %lot
49
8reando una gr5ica del 'esidual
El residual para cada observacin es la diferencia entre el valor observado de la respuesta # el valor predictivo por el modelo :el valor
ajustado<. Por ejemplo" si el valor de respuesta observado es =8 # el modelo predice =;" el residual es 8.
9u#osiciones
Para confirmar que tu anlisis de regresin es vlido" tu debes verificar todas las suposiciones sobre los residuales. ,sa las graficas
de la residual para comprobar que los residuales/
>ean aleatorios :independientes el uno del otro<
Est7n normalmente distribuidos.
Tienen la misma discrepancia a trav7s de todos los valores de S
.ota / >i tienes ms que una columna de residuales # Kits sobre su hoja de trabajo" se cuidadoso al seleccionar las columnas
correctas cuando crees las graficas de la residuales.
'esidual %lot
1! Escoja 9tat ? 'egresi&n ? 'esiduales %lots0
$! $ompletar el recuadro como se indica a continuacin/
50
! Q$lic@ 1@
Inter#retando tus residuales
7a gr5ica de #robabilidad de Normalidad
,sa la grafica de la probabilidad normal de la residual para verificar que el residual no este desviada sustancialmente de la
distribucin normal.
>i los residuales viene de una distribucin normal" los puntos apro3imadamente seguir una lnea directa.
>i los residuales no vienen de una distribucin normal" los puntos no seguir una lnea directa.
(asado en este grafico" es razonable asumir que los residuales para sus datos no se desva considerablemente de una distribucin
normal. ,na prueba de normalidad para estos datos :no mostrado dio un p-valor de ;.858.<
2istograma
Tu puedes usar el histograma de las residuales para evaluar la normalidad. >in embargo" la grafica de probabilidad normal es
generalmente ms fcil para hacer de interpretar" sobre todo para pequeVas muestras.
Inter#retaci&n sus resultados
51
Er5ica
'a grfica presenta los residuales en el orden de la recoleccin de los datos : proporcionando los datos que fueron entrados en el
misma orden en la cual ellos fueron recogidos<. ,se la grafica para verificar que el residual es independiente.
>i ha# un efecto debido a la orden de recoleccin de datos" el residual no estar disperso aleatoriamente sobre el cero. Tu debes
ser capaz de detectar este patrn en la grfica.
>i no ha# ningSn efecto debido al orden de recoleccin de datos" los residuales estar disperso aleatoriamente sobre el cero
.o aparece haber en ningSn momento efecto de orden en el set de datos presentes.
Inter#retando tus resultados
'esiduales Versus Fits
,se el grafico de los residuales versus ajustes para verificar que/
El modelo no omite ningSn termino cuadrtico.
'a variacin es constante es constante a trav7s de todos los valores ajustados.
.o ha# valores fuera de lnea en tus datos.
>i tu puedes ver cualquier tipo de patrn en esta grafica" una de estas suposiciones ha sido violada.
'a tabla debajo resume el patrn tpico que puedes ver.
El #atr&n Indica
$urvilneo ,n t7rmino cuadrtico
puede fallar en tu
modelo
'a e3tensin desigual
de las residuales a
trav7s de los diferentes
valores ajustados.
'a variacin de las
residuales no es
constante.
,n punto est situado
mu# lejos del cero.
Esta fuera de lnea.
52
'a grafica de los datos no parece revelar ningSn patrn.
8onsideraciones 5inales
$onclusiones #rcticas
El anlisis simple de la regresin linear revel que el aumento de los ritmos de revoltura est asociados a los niveles crecientes de
impurezas en su pintura
'a pendiente de la ecuacin de la regresin indica que cuando tu aumentas el ritmo del revolvimiento en = rpm" el nivel de impurezas
aumenta en ;.C5!!C6.
Tu puedes usar la ecuacin para determinar qu7 las impurezas sern diferentes para las mezclas de pintura. >in embargo" la
ecuacin es solamente vlida para la gama de datos que usted ha hecho un muestreo :revolviendo entre 8; # C8<.
8onsideraciones estadsticas
Tu no puedes utilizar el anlisis de la regresin para afirmar que los cambios en la prediccin fueron causados por la respuesta" a
menos que los valores del predictor fueran fijos en los niveles predeterminados en un e3perimento controlado. >i los valores de los
predictor se permiten variar aleatoriamente" otros factores pueden influenciar la prediccin # la respuesta.
Tu no debes aplicar los resultados de la regresin a los valores que son de S que estn fuera de su gama de la muestra. Por
ejemplo" Tu no debes utilizar la ecuacin de la regresin derivada en este ejemplo para predecir los niveles de impureza para un
ndice del revolvimiento de =;;" porque los ms altos ritmos de revolvimiento implicada en el anlisis son de C8. 'a relacin entre
%evolvimientos # la impureza puede ser mu# diferente para el ritmo de revolvimientos de C8.
Ten cuidado de las lneas de fuera cuando uses el procedimiento de regresin. &lgunas lneas de fuera: llamadas
Est7 alerta para los afloramientos al usar procedimientos de la regresin. &lgunos afloramientos :llamados puntos altos de
apalancamiento< tienen un efecto grande en el clculo de la lnea menor de la regresin de los cuadrados. En tales casos" la lnea
puede no representar el resto de los datos mu# bien.
E"ercicio $!1
%rotectores de Erosi&n
E"ercicio
Tu estas intentando predecir cmo los protectores de acero de la erosin para las turbinas de vapor resisten la p7rdida de la abrasin.
'a resistencia directamente que mide a la abrasin es difcil" costosa" # destructiva. Por lo tanto" tu esperas poder predecir la
resistencia a la abrasin usando la dureza de acero" que es ms conveniente # menos costosa medir.
'ecolecci&n de datosA
'a p7rdida # la dureza de la abrasin de la recoleccin de datos fueron medidas para 8C protectores aleatoriamente seleccionados de
la erosin.
53
Instrucciones
=. ,tilice la Kitted 'ine Plot para ajustar el modelo simple de la regresin linear con la abrasin como la respuesta # la dureza como el
predictor/ -nclu#a la confianza # la prediccin en sus resultados" # asegSrate de almacenar las residuales # los ajustes.
8. ,tiliza los diagramas residuales de validar las suposiciones necesarias.
>et de Aatos
E%N>-N..*P+
'EE'E9INN %17IN1MIA7
E"em#lo del caudal de la corriente!
E"ercicio
Tu ests conduciendo un estudio de los impactos para el medio ambiente # quieres utilizar la profundidad de una corriente para
estimar el caudal.
'ecolecci&n de datosA
'a profundidad # el flujo fueron registrados para una sola corriente en un periodo de ! meses.
2erramientas
Era#3 : #lot!
9tat : 'egression : Fitted 7ine %lot!
9tat : 'egresi&n : Argumentos 'esiduales!
9et de DatosA
K'NJ.*P+
'egresi&n %olinomial
;<ue es 'egresi&n #olinomial>
$omo la regresin lineal" 'a regresin polinomial e3amina la relacin entre una variable continua de la respuesta :M # una variable del
predictor :S<. Es diferente de la regresin simple" sin embargo" un modelo polinomial puede incluir los t7rminos para los e3ponentes
de S/
54
Aonde M es la respuesta" S es el predictor" Uo es el coeficiente para el t7rmino linear" U= es el coeficiente para el t7rmino ajustado" U8
es el coeficiente para el t7rmino cuadriculado" U6 es el coeficiente para el t7rmino cubicado" # c es error al azar.
;8undo utili4ar la 'egresi&n %olinomial>
,sa la %egresin Polinomial cuando tengas tiene una M continua # un solo S" # evidencia o teora sugiriendo no-linealidad.
S Puede ser ordinal o continuo o en la teora.
En teora S debe ser fijo. En la prctica" sin embargo" se permite a menudo variar.
$ualquier variacin aleatoria en la medida de S se asume como insignificante comparado en el rango en donde es
medida ).
Aespu7s de aceptar los resultados en el anlisis de la regresin simple" tu debes verificar que las siguientes suposiciones acerca del
residual sean validas en tus datos.
Aeben ser independientes :# as al azar<.
Aeben ser distribuidos normalmente.
Aeben tener variacin constante a trav7s de todos los valores de S.
;%or?u= usar la 'egresi&n %olinomial>
'a %egresin Polinomial te puede a#udar a responder preguntas tales como/
0-ncrementando S incrementa M para algunos valores del rango # disminu#e para otras1
0Lu7 valor puedes tu esperar para M cuando S es 8;1
Por ejemplo"
0&gregando ms cobre a su aleacin siempre es mas fuerte o la fuerza disminu#e en concentraciones ms altas1
$omo puedes esperar que tu aleacin sea de ;.;=I de cobre.
Dibu"ando los datos
Para visualizar la relacin entre la profundidad de la corriente # el caudal" utilice el diagrama para crear un scatterplot con la
respuesta :flujo< en el #-a3is # el predictor :profundidad< en el 3-a3is.
Plot
1!- &bre el Project K'NJ.*P+.
$!- Elija El Era#3 : %lot
!- $ompleta el recuadro como se indica a continuacin/
55
(!- $lic@ 1@
Inter#retando tus resultados
'a grfica revela una relacin potencialmente no lineal entre la profundidad # el flujo.
Por ejemplo" .ote que un aumento =.5- pies en profundidad a partir de la ;.5 a 8 pies parece aumentar dos veces el flujo tanto como
un aumento en profundidad a partir del !.; a B.5 pies.
A"ustando el modelo linear
,sa la grafica del modelo linear" para evaluar que tan bien esta el modelo de regresin linear en los datos.
Fitted 7ine %lot
1!- Elige 9tat : %egression : Fitted 7ine %lot!
$!- $ompleta el recuadro como se indica a continuacin/
56
!- $lic@ 1@
Inter#retando tus resultados
'a ecuacin linear que mejor describe los datos es/
Klujo F ;.6;=!B8 P ;.;B8!6H5 Profundidad
'
$
H'-r-9?J
El %
8
para el modelo linear indica que H=.5I de la variabilidad en flujo es e3plicado por profundidad de la corriente.
;<ue sigue>
*ientras que un porcentaje de la variabilidad es e3plicado por el modelo linear" parece una lnea levemente curvada cabra incluso
mejor. Tu debes evaluar cmo en modelo cuadrtico caben estos datos.
'egresi&n %lot
A"ustando el Modelo 8uadrtico
57
,sa el Kitted 'ine Plot para cuadrar tu modelo de regresin cuadrtico. &lmacene los ajustes # las residuales para una ree3aminacin
ms futura.
Fitted 7ine %lot
1!- Elige el 9tat : 'egresi&n : Fitted 7ine %lot o presiona $trlPE para volver a Fitted 7ine %lot del recuadro.
$!- $ompleta el recuadro como se indica a continuacin/
!- $lic 9torage!
(!- $ompruebe las 'esiduals # los Fits.
)!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
Ecuacin de %egresin
'a %egresin cuadrtica que mejor describe los datos es/
Klujo F ;.8C586; P ;.=66;8B Profundidad
- ;.;;4B=;; Aepthee8
'
$
H'-r-9?J y '
$
- ad"untos H' - 9?Had"JJ
%
8
indica que el modelo cuadrtico considera H!.;I de la variabilidad en el caudal. fste es algo ms que el %
8
de H=.5I obtenidos
con el modelo linear :v7ase 6-68<.
'a estadstica ajustada de %
8
estadstica ajustada es ajusta segSn el nSmero de t7rminos en el modelo" # debe ser utilizada al
comparar modelos con diversos nSmeros de predictores.
El %
8
ajustado para el modelo cuadrtico :H5.6I< es ma#or que el %
8
ajustado para el modelo linear :H;.BI<" indicando que el t7rmino
adicional mejora la prediccin.
'egresi&n %lot
58
Inter#retando tus resultados
,tilizan una _ ;.;5 para todas las pruebas.
Anlisis de Varian4a
El p-valor para el modelo en su totalidad :;.;;;< es significativo" indicando que el modelo es Stil.
El p-valor para el t7rmino linear :;.;;;< es tambi7n significativo" indicando que e3plica una cantidad significativa de variabilidad.
Pasado" el p-valor para el t7rmino cuadrtico :;.;;C< es significativo" indicando eso que agrega este t7rmino al modelo linear mejora la
prediccin perceptiblemente.
Anlisis %olin&mial De la 'egresi&nA
59
Era5icando los residuales
,tilizan las residuales # los ajustes correr graficas de diagnstico en el modelo cuadrtico. Tu ests utilizando diagramas residuales
para verificar que las suposiciones sobre el t7rmino del error en el modelo de la regresin han sido encontradas.
'esidual %lots
1!- Elige 9tat : 'egresi&n : 'esidual %lots!
$!- $ompleta el recuadro como se indica a continuacin/
!- $lic@ 1@
Inter#retando tus resultados
60
Diagramas de %robabilidad Normal
,sa los diagramas de probabilidad normal de los residuos para verificar que tus residuos no se desvan substancialmente de una
distribucin normal.
>i los residuos vienen de una distribucin normal" los puntos seguirn una lnea recta apro3imadamente
>i los residuos no vienen de una distribucin normal" los puntos no seguirn una lnea recta
(asado en este diagrama" es razonable asumir que los residuos para tus datos no se desvan substancialmente una distribucin
normal. : ,na prueba de normalidad para estos datos :no mostrado< permiti un p-valor de ;.6C;.<
2istograma
Puedes tambi7n usar el histograma de los residuos para evaluar la normalidad. >in embargo" la probabilidad normal es generalmente
ms fcil de interpretar sobre todo para las muestras pequeVas.
Inter#retando tus resultados
Era5ica 1
61
En la Orafica = se presenta los residuales en el orden de la recoleccin de datos :los datos que entraron en el mismo orden en los
que fueron recolectados< usa esta grafica para verificar que los residuos son independientes.
>i ha# un efecto debido al orden de coleccin de datos los residuales en ceros no sern esparcidos al azar. Podrs detectar
una tendencia en el plot.
>i no ha# efecto debido al orden de coleccin de datos" los residuales en ceros se esparcirn al azar
'os datos no aparecern en ningSn tiempo o los efectos del orden de los datos presentes.
Inter#retando tus resultados
7os residuales .s Fits
,se el plot de los residuales vs los Kits para verificarlo/
El modelo no est perdiendo ninguna condicin cuadrtica
'a variacin es constante por todo los valores de los Kits.
.o ha# datos fuera de lnea.
>i ves cualquier tipo de modelo en el plot uno de estas asunciones ha sido violada. Tu puedes ver en el siguiente cuadro debajo el
resumen de los modelos tpicos.
Este modelo -ndicag
$urvilneo ,n t7rmino cuadrtico puede
estar perdiendo su modelo.
'a e3tensin desigual de las
residuales a trav7s de los diferentes
valores ajustados.

'a variacin de los residuales
no es constante
,n punto est situado mu# lejos del
cero.
Kuera de lnea

Agregando con5ian4a y #redicci&n a las 8intas
$reando una nueva fitted line plot del modelo agregando confianza # prediccin a las cintas. *ostrando las cintas # los intervalos te
da una mejor idea de la variabilidad # estabilidad del modelo cuadrtico.
Kitted 'ine Plot
62
1!- Escoge >tat : 'egression : Fitted 7ine %lot!
$! -(ajo Ty#e o5 'egresi&n Model" Escoge <uadratic!
!-Pulse el botn las N#cions!
(!-$ompleta el recuadro como se indica a continuacin/
)!- pulse el botn NT en cada cuadro de dilogo
Inter#retando tus resultados
El inter.alo de con5ian4a
El H5I intervalo de confianza define un rango probable de valores para la media de la poblacin de b. para cualquier valor dado de )"
usted puede ser H5I seguro que la media de la poblacin para b est entre las lneas indicadas.
El inter.alo de la #redicci&n
El H5I intervalo de la prediccin define una demostracin del rango de los valores de b por las observaciones individuales. Por
cualquier valor dado en ) tu puedes tener H5I de confiabilidad correspondiente al valor de b por una observacin que ser dentro de
las lneas indicadas.

63
8onsideraciones Finales
8onclusiones #rcticas
El anlisis indica que la relacin entre la profundidad de la corriente # proporcin del flujo es ms bien cuadrtica que lineal. $uando
la corriente es baja" pequeVos incrementos se muestran en los resultados de la profundidad # grandes incrementos en el flujo. >in
embargo" cuando la corriente llega a ser mas profundo" los mismos incrementos en la profundidad causan menos cambios en el flujo.
8onsideraciones Estadsticas
Tu no puedes usar la anlisis de la regresin para afirmar que los cambios en las predicciones cambian las causas en la respuesta" a
menos que el valor predictivo fuere arreglado en la predeterminacin de niveles en un e3perimento controlado. >i los valores
predictivos se permiten variar al azar" otros factores pueden influenciar en ambos los predictivos # la respuesta.
.o debes aplicar los resultados de la regresin para responder a los valores que estn fuera del rango de la muestra.
E"ercicio !1 Descarga Diesel
Estas investigando los efectos de humedad en las emisiones de la descarga de camiones diesel
'ecolecci&n de datos
'os datos son de la 2are $.T. :=HHB<. D'ight Aut# Aiesel Emisin $orrection Kactors for &mbient $onditionsh el informe final a la
&gencia de proteccin del ambiente bajo contrato .o. !4-;8-=BBB" -nstituto de la investigacin sudoeste" >an &ntonio" T).
Instrucciones
1!- 'a informacin de la grafica visualiza la relacin entre las variables.
$!- ,sa Kitted 'ine Plot para adaptar el modelo apropiado de regresin.
!- &segSrate de verificar las asunciones necesarias con las graficas los residuales.
9et de Datos
E' A-E>E'. *P+
64
'EE'E9INN MT7TI%7E
E"em#lo ( 'educiendo el gol#e del Motor
%roblema
Trataras de identificar las llaves predoctoras del golpe del motor.
'as siguientes variables estn bajo las siguientes consideraciones/
'a eleccin del momento adecuado de la chispa
'a proporcin de aire-combustible :&K%<
'a temperatura de la succin
'a temperatura de la descarga
'ecolecci&n de los datos
'os datos son recolectados al azar de =6 motores seleccionados" todos trabajan con gasolina con un octanaje tasa de 4B.
2erramientas
Era#3 : MatriB #lot
9tat : Basic 9tatistics : 8orrelation
9tat : 'egression : 'egression
9et de Datos
T.N$T.*P+
'egresi&n M+lti#le
;8ul es la regresi&n m+lti#le>
'a regresin mSltiple e3amina la relacin entre una respuesta continua variable :b< # ms de un predictor :)< de variables. 'a
ecuacin general para un modelo de la regresin mSltiple es/
b .F U; P U= )= P U8 )8 P U6 )6 Pg. Pi
Aonde b es que la respuesta" U; es el intercepte cada )i es un predictor variable con una cuesta de Ui" # i es el error aleatorio.
8undo usar la regresi&n m+lti#le
65
,se la regresin mSltiple cuando tienes un b continuo # ms de una ).
) puede ser ordinal" o continua.
En teora" ) debera arreglarse. En la practica" sin embargo" con frecuencia permite la varianza.
$ualquier variacin aleatoria en la medida de ) se asume que es una comparacin insignificante en el rango en el cual ) es
medido.
&ntes de aceptar los resultados de anlisis de la regresin" debes verificar las siguientes asunciones sobre los residuales que son
vlidos para la informacin/
Ellos deben ser independientes :# as aleatorios<.
Ellos deben ser de distribucin normal.
Ellos deben tener una variacin constante por todo los valores de ) .
%or ?u= usa la regresi&n m+lti#le
'a regresin mSltiple puede a#udar a contestar las siguientes preguntas/
0Lu7 tan importantes son tus variables ) en prediccin con tus valores b1
0Lu7 valor esperas de b cuando )= es 8; # )8 es 61
0$unto cambiarn b si aumentas )6 por una unidad1
Por ejemplo"
0$mo procesas la temperatura # porosidad relacionada a la dureza del acero1
0Lu7 tan duro esperas que tu acero esta si tu proceso se encuentra a cierta temperatura por cierto tiempo1
0Lu7 tan resistente es la dureza del acero si incrementas la temperatura a =;; d1
8reando una Matri4 %lot
,saras primero una matriz plot # coeficientes de correlacin primero para ver si las relaciones e3isten entre la contestacin
inconstante # las variables de la prediccin.
Variables del gr5ico
Es ms fcil mirar la relacin entre la respuesta # la prediccin cuando entras en la respuesta de la ultima variable en las variables
del grfico.
Matri4 %lot
1!- &bre el pro#ecto T.N$T.*P+
$! - Escoge Era#3 : Matri4 %lot!
!- $omplete el recuadro como se indica a continuacin/
66
(! - $lic@ Nptions!
)! - (ajo Matri4 Dis#lay Escoge 7o6er 7e5t!
*! - $lic@ 1@ cada recuadro.
Inter#retando tus resultados
'os resultados inclu#en los grficos para cada combinacin de variables.
Kjate para evaluar la relacin entre el golpe # las predicciones.
Parece ser una correlacin negativa entre el golpe # chispa. &ll tambi7n parece ser correlaciones positivas entre el golpe # cada uno
de las predicciones restante
;<u= sigue>
,sa la correlacin para evaluar las fuerzas de relacin lineal.
67
8lculo de las 8orrelaciones m+lti#les
$ree una matriz de correlacin para evaluar las asociaciones entre el golpe # las predicciones.
8orrelaci&n
1!- Escoge 9tat:Basic 9tatistics:8orrelation
$!- $ompleta el recuadro como se indica a continuacin/

!- $lic@ 1@

Inter#retando tus resultados
'a salida inclu#e el coeficiente de correlacin # el p-valor para cada par de variables. :,se un ;.;5 para todas las comparaciones.<
,na sugerencia en la matriz plot" ha# una correlacin negativa significante entre el golpe # chispa : r F -;.!HH" pF;.;;4<. 2a#
tambi7n" correlaciones positivas significantes entre el golpe # cada uno de las predicciones restante/
&K%:r F ;.H!="P F ;.;;;<
-nta@e : r F;.!B6.P F ;.;=8<
E3haust : r F ;.!48" P F ;.;=;<
<ue sigue!
Porque &K% tiene la relacin lineal ms fuerte con la regresin de uso de golpe para ajustarse a un modelo de la regresin lineal
simple con el golpe como la contestacin # &K% como las predicciones.
68
Enca"ando a un modelo de la regresi&n sim#le
,sa la regresin para realizar un anlisis de la regresin lineal simple para el golpe # &K%. Podras tambi7n usar Kitted 'ine Plot
antes de realizar un anlisis.
'egresi&n
1!- Escoja 9tat : 'egresi&n : 'egression
$!- $ompleta el recuadro como se indica a continuacin/
!- $lic@ 1@
Inter#retando tus resultados
Ecuaci&n de la 'egresi&n
69
'a ecuacin relacionada con la respuesta # la prediccin es/
Tnoc@ F 85.5PC.85 &K%
Esto indica que el golpe aumenta C.85 veces por el aumento de la unidad en &K%
Tabla de coe5icientes
'as hiptesis para cada coeficiente es/
2o/ el coeficiente es igual a cero
2=/ el coeficiente no es igual a cero
El valor-p para la constante :U; " la intercepcin< # el coeficiente de &K% :U=" la cuesta< ambos son menores de ;.;5. &s nosotros
podemos rechazar 2o para cada uno a los ;.;5 E-level # concluimos que estos coeficientes no son cero. En este modelo" &K% es una
prediccin significativamente estadstica del golpe.
El anlisis de la regresin/ el golpe contra &K%
Inter#retando tus resultados
'UH'-9?J
El %j indica los H8.6I de la variabilidad del golpe predicho por este modelo.
El Anlisis de la .arian4a
'lamada que las hiptesis para un modelo de la regresin lineal simple son/
2o/ U= es igual a cero
2=/ U= no es igual a cero
;<u= sigue>
El modelo de la regresin simple con &K% es Stil para la prediccin del golpe. >in embargo" es posible que el Power de la prediccin
adicional puede ser ganada inclu#endo otras predicciones en el modelo de regresin.
El anlisis de la regresi&nA el gol#e contra AF'
70
EBaminando la asociaci&n residual
7os residuos contra las .ariables
,na t7cnica por determinar si otras variables pueden ser importantes en predecir la respuesta es la grafica de los residuales contra
cada prediccin potencial.
'egresi&n
1!- Escoja el 9tat : 'egresi&n : 'egression o presione ctrlPE para regresar al cuadro de dilogo.
$!- $lic@ Era#3ics!
!- $ompleta el recuadro como se indica a continuacin/
71
(!- Pulse el botn NT en cada recuadro.
Inter#retando tus resultados
$uando el plotted en contra de la descarga" los residuales no parecen completamente aleatorios. 'os residuales aparecen ms
grandes para los valores de descarga ms grandes. Esto indica que la descarga puede ser Stil respondiendo a la variabilidad adicional
en el golpe.
'a entrada # la chispa tambi7n parecen ser relacionadas con el golpear # pueden responder a la variabilidad adicional.
Es posible para dos o ms variables e3plicar la misma variabilidad en la respuesta. En este caso" el modelo final puede que no
inclu#a todas las variables.
72
73
Enca"ando a un modelo de la regresi&n m+lti#le
,sa la regresin para analizar el modelo de la regresin mSltiple con todos las cuatro predicciones.
'egresi&n
1!- Escoge 9tat : 'egresi&n : 'egresi&n o presione $trl.PE para regresar a la 'egresi&n en el recuadro.
$!- Presione K6 para borrar el cuadro de dilogo
!- $ompleta el recuadro como se indica a continuacin/
(!-$lic@ 1@.
Inter#retando tus resultados
,se un E de ;.;5 para todos los anlisis.
Ecuaci&n de regresi&n
74
'a ecuacin que relaciona la respuesta # la prediccin es/
Tnoc@ F 86.4 - ;.8H! P6.=H &K% P;.65H entrada P ;.;=6C descarga
Tabla de coe5icientes
Tenga el cuidado al interpretar los coeficientes de la regresin mSltiple.
El p-valor para cada variable slo indica si es significante en el modelo presente.
Por ejemplo" la chispa no es una prediccin significante en el modelo presente :p F ;.6!6<. >in embargo" si quitas la descarga del
anlisis" la chispa se hace significativa" est altamente correlacionados :r F - ;.B86"p F ;.;;5" vea pgina 6.CH< # as e3plica la misma
variacin en el golpe.
El anlisis de la regresi&nA el gol#e contra la c3is#aD succi&nD la descarga"
Inter#retando tus resultados
8uidado con multicolinealidad
$uando las predicciones son sumamente correlacionadas" la estimacin del coeficiente de regresin puede ser inestable :>ignifica
que varan ampliamente de un ejemplo al siguiente<. Esta condicin es llamada multicolinealidad" # eso hace que la evaluacin sea
importante en t7rminos individuales en la dificultad del modelo.
Puedes usar la correlacin para tratar de identificar las fuentes potenciales de la multicolinealidad. >i ha# multicolinealidad e3trema en
un modelo" *-.-T&( mostrar un mensaje en la ventana de la sesin # quita una o ms variables para reducir el problema.
Nunca ?uites mas de una #redicci&n en ning+n momento
,na buena forma de Escoger las predicciones de un modelo de regresin mSltiple es tratar a todas las combinaciones potenciales
usando el modelo de procedimientos de comparacin como el mejor subconjuntos o una regresin gradual.
El anlisis de la regresi&nA el gol#e contra la c3is#aD succi&nD la descarga
75
Inter#retando tus resultados
'UH'-9?J y 'U a"ust& H'-9?Had"JJ
El nuevo modelo e3plica H4.4I de la variabilidad en la respuesta" lo cual es una mejora sobre el %j logrando usar solamente &K%
para predecir el golpe
>in embargo %j nunca disminuir cuando aumente la prediccin al modelo" aun cuando eso no resulte un buen modelo. 'a estadstica
de %j ajustada :%->q:adj< F H4.8I< es ajustado para el nSmero de condiciones en el modelo" # debe usarse cuando son comparados
los modelos con diferente nSmeros las predicciones.
El %j ajustado para el modelo con slo &K% como el predictor tena H=.!I aVos. as" el modelo actual con un %j esta ajustado H4.8I
se mejora.
Anlisis de Variaci&n
'as hiptesis para un modelo de la regresin mSltiple es/
2o/ todo U= :a e3cepcin de U;< son iguales a cero
2=/ al menos uno Ui :no inclu#e U; < no es igual a cero
Porque p :;.;;;< es menos que E :;.;5<" puedes rechazar 2o.
El modelo de la regresin" con la chispa" &K%" >uccin" # descarga como las predicciones" es significativamente mejor que la
restriccin del modelo el cual inclu#e no predicciones.
El anlisis de la regresi&nA el gol#e contra la c3is#aD succi&nD la descargaD
76
$onsideraciones Kinales
8onclusiones #rcticas
'a ecuacin de la regresin para la $hispa usando ejemplar" &K%" >uccin # Aescarga para predecir el Oolpe es/
El golpe F 86.4-;.8H! $hispa P 6.=H &K% P ;.65H >uccin P;.;=6C Aescarga.
Este modelo responde de H4.4I de la variabilidad en el Oolpe.
2a# problemas del multicolieanidad con el modelo. >in embargo" la chispa sumamente correlacionado con la Aescarga.
En el pr3imo ejemplo" usars los mejores >ubconjuntos para procesar a todos los posibles modelos con estas cuatro predicciones #
Escoger el mejor.
8onsideraciones estadsticas
.o puedes usar el anlisis de la regresin para afirmar que los cambias en las predicciones causan cambios en la respuesta" a
menos que los valores de las predicciones cambien niveles predeterminados en un e3perimento controlado. >i los valores de las
predicciones variar al azar" otros factores pueden influir en las predicciones # la respuesta.
.o deberas aplicar los resultados de regresin # los valores de respuesta que son salidas de tu rango de los ejemplos.
'a precisin de medida es importante. 'a falta de precisin te lleva a la ine3actitud estimada de los coeficientes.
Ten cuidado de no pasar por alto los factores potencialmente importantes al diseVar un estudio de regresin.
Tenga cuidado con multicolinealidad.
$uando las variables de la prediccin estn sumamente correlacionadas/
'os coeficientes estimados de la regresin pueden ser inestables :Ellos pueden variar ampliamente de una muestra a la
siguiente muestra<
Puede ser difcil evaluar la importancia de las condiciones individuales del modelo.
Nunca ?uite ms de una #redicci&n en ning+n momento.
,na buena forma de Escoger las predicciones de un modelo de regresin mSltiple es tratar a todas las combinaciones potenciales
usando el modelo de procedimientos de comparacin como el mejor sub conjuntos o una regresin gradual.
77
*ejores >ubconjuntos de la %egresin
El ejemplo 5 %educiendo el Oolpe del *otor
%roblema
Ests intentando identificar las variables importantes que efectSan el Oolpe del motor. 'as siguientes variables estn bajo las
consideraciones/
'a eleccin del momento adecuado de la chispa
'a proporcin de aire-combustible :&K%<
'a temperatura de la succin
'a temperatura de la descarga
'ecolecci&n de datos
'os datos son recolectados al azar de =6 motores seleccionados
2erramientas
9tat : 'egressions:Best subsets!
9tat:'egressions:'egressions!
9et de Datos
T.N$T.*P+
'EE'E9I1NE9 DE 719 MEO1'E9 9CB81NOCNT19
;8ul es el me"or subcon"unto de regresi&n>
'a regresin de los mejores subconjuntos evalSa todas las posibles combinaciones de las predicciones para a#udarle a determinar
qu7 combinacin hace al mejor modelo de las regresiones. *-.-T&( usa un criterio de %8 m3imo para Escoger al mejor modelo .
Ntro criterio puede proporcionar a un modelo diferente.
;8undo usar los me"ores con"untos de regresi&n>
,se la regresin de los mejores subconjuntos cuando usted tiene mucho potencial de predicciones # as varios modelos de regresin
para Escoger.
;%or ?u= usar el me"or subcon"unto de regresi&n>
'os mejores subconjuntos pueden disipar las siguientes preguntas/
0 Lu7 combinacin de tus factores es 7l ms eficaz para predecir tu respuesta1
0$ul es el mejor modelo de regresin posible usando de 5 a 8; predicciones1
Por ejemplo"
0Est un modelo usando =; variables para predecir la suavidad del helado mas que uno que usa slo temperatura # velocidad
en la mezcla1
Escogiendo un modelo a#ro#iado
78
,se los mejores >ubconjuntos para a#udarle a Escoger a un modelo de las regresiones mSltiples para el Oolpe # evita los problemas
siguientes/
'os modelos incmodos e ineficaces son el resultado de muchas predicciones.
$oeficientes inestables que resultan de redundante # predicciones correlacionadas.
2abilidad inadecuada de predicciones que resulta pocas predicciones.
%redicciones libres
Entre todas las cuatro variables en las predicciones 'ibre. *-.-T&( probar todas las posibles combinaciones de estas variables # el
reporte estadstico para los mejores modelos. :Gariables de entradas de las Predicciones en todos los modelos sern incluidas en
cada modelo.<
Best 9ubsets
1!- >eleccione 9tat:'egressions:Best.
$!-$ompleta el recuadro como se indica a continuacin/
!- $lic@ 1@
-nterpretando tus resultados
'os )s al derecho de la tabla indica qu7 predicciones son incluidas en cada modelo.
Variables
'a columna de Gars indica el nSmero de predicciones en el modelo.
'$ H'-9?J y '$ a"ust& H'-9?Had"JJ
&l comparar a modelos/
>i el nSmero de predicciones es el mismo" busque al modelo con el %8 ms alto.
>i el nSmero de predicciones es diferente" busque al modelo con el %8 ms alto.
8#
(usque a modelos dnde $p es pequeVo # acerca el nSmero de parmetros en el modelo. Por ejemplo" para modelo con 6
predicciones # el interceptor" busque a un modelo con un $p cerca de C 'a frmula Para $p es/
8# K H99E#QM9EmJ-Hn-$#J
79
Aonde >>Ep son las sumas de error de los cuadrados para el modelo con los parmetros de p :incluso el interceptor<" *>Em el error
de la media cuadrada para el modelo con toda las predicciones de m" # n es el nSmero de observaciones.
'os mejores >ubconjuntos de regresin/ el Oolpe contra la $hispa" &K%" la >uccin" la Aescarga"
7a contestaci&n es el Eol#e
Inter#retaci&n tus resultados
Variabilidad
> es una estimacin de la media variabilidad sobre la lnea de las regresiones. *atemticamente" > es la raz cuadrada positiva del
*>E. En general" tu quieres que > sea tan pequeVo como posible.
8onclusi&n
(asado en 7stos criterios" el modelo con &K%" la >uccin" # la Aescarga es el mejor. El modelo
$onteniendo todos las cuatro predicciones es comparable" pero > para este modelo es ligeramente ms grande # all no parece ser
cualquier ganancia en %8 ajustado para usar el modelo. Es generalmente sabio Escoger al modelo ms simple a menos que un
modelo ms complicado sea claramente mejor.
7os me"ores 9ubcon"untos de regresi&nA el Eol#e contra la 83is#aD AF'D la 9ucci&nD la Descarga
7a contestaci&n es el Eol#e
80
E.aluando el +ltimo Modelo
,sa la 'egresi&n para evaluar al Sltimo modelo. $alcule la ecuacin de regresin # confirme que todas las asunciones sobre los
residuales sean conocidas.
'egression
1!- Escoge 9tat : 'egresi&n : 'egresi&n
$!- En 'es#onse" enter @noc@.
!- En %redictors" enter &K% inta@e e3haust
(!- $lic@ Era#3s
)!- $omplete el recuadro como se indica a continuacin/
81
!.- clic@ 1@ en cada recuadro.

Inter#retando tus resultados
,se una E de ;.;5 para todos los anlisis.
7a ecuaci&n de regresi&n
'a ecuacin de regresin es/
El golpe F =!.5 P6.8= &K% PN.64! >uccin P;.;=!! Aescarga
Tabla del coe5iciente
El valor de p ms bajos :p k ;.;5< en la tabla del coeficiente indica que todas las condiciones en el modelo son significantes.
Anlisis de .ariaci&n
Porque p :;.;;;< es menor que E :;.;5< puedes rechazar 2;. El modelo de la regresin que inclu#e &K%Z las >ucciones # la Aescarga
son significativamente buenas que el modelo restringido que no inclu#e ninguna prediccin.
82
Inter#retando tus resultados
83
'as grficas residuales verifican que se han reunido todas las asunciones acerca de los residuales. 'os residuales/
.o parta substancialmente de la normalidad.
&parece la distribucin aleatoria a cero.
&parece tener la variacin constante por los todos valores de ajustes.
.o e3hiba un tiempo - el efecto del orden.
8onsideraciones 5inales
8onclusiones #rcticas
El mejor modelo para predecir el golpe es/
Tnoc@F =!.5 P6.8= &K%P;.64! -nta@e P ;.;=!! E3haust
8onsideraciones estadsticas
&ntes de usar el mejor subconjunto de regresin para evaluar los modelos de regresin que son diferentes" asegSrate de que tus
predicciones # respuestas son validas para todo el modelo potencial sean modelos validos de regresin.
Todos reglas # las guas tambi7n pertenecen a los modelos de la regresin mSltiple tambi7n aplican cuando Escoge un modelo que
usa este procedimiento.
84
E7 ANV7I9I9 DE VA'IA8INN
1b"eti.osA
8om#are gru#os de .ariables usando una #rueba de .arian4a!
8om#are las medias de las muestras recolectadas en di5erentes ni.eles de un solo 5actor utili4ando 1ne-Way AN1VA!
8om#are las medias de las muestras recolectadas en di5erentes ni.eles de un solo 5actor usando el anlisis de la
media!
8om#are las medias de las muestras recolectadas en di5erentes ni.eles de uno o ms 5actores utili4ando Balance
AN1VA!
8om#are las medias de las muestras recolectadas en di5erentes ni.eles en mas de un 5actor utili4ando el Modelo
7ineal Eeneral!
8ontenidos
E"em#los y e"ercicios %ro#&sito %agina
&.NG& sentido Snico 1*-1(/
Ejemplo =
El Precalentamiento del $%T Time
EvalSe la diferencia entre los medios del grupo para un solo
factor que usa un &.NG& Nne-Ja#.
El anlisis de la media 1)0-1)(
Ejemplo 8
El Precalentamiento del $%T Time %evisited
EvalSe la diferencia entre los grupos de medias usando
&nlisis de la *edia.
&.NG& equilibrado 1))-1*,
Ejemplo 6
El ,so de la pintura
Emplee el bloc@ing de variables para reducir la variacin en un
anlisis usando (alanced &.NG&.
El *odelo 'ineal Oeneral 1*--1-)
Ejemplo C
'a Aistancia de frenado
EvalSe la diferencia entre las medias del grupo para factores
mSltiples que usan el Oeneral el *odelo 'ineal.
Ejercicio C.=
Prueba de Gino
EvalSe la diferencia entre las medias del grupo para factores
mSltiples que usan el Oeneral el *odelo 'ineal.
Ejercicio C.8
El Golumen de fosfato
EvalSe la diferencia entre las medias del grupo para factores
mSltiples que usan el Oeneral el *odelo 'ineal.
85
1ne Way AN1VA
E"em#lo 1
%recalentamiento del 8'T Time
E"ercicio
Tu ests probando tres lotes de tubos de ra#o catdico para determinar si los perodos del precalentamiento son consistentes.
'ecolecci&n de datos
,na muestra aleatoria de cuatro tubos se toma de cada lote # es probada durante el tiempo del precalentamiento.
2erramientas
9tat : AN1VA : Test 5or E?ual Variances!
9tat : AN1VA : 1ne-Way!
9et de datos
$%T.*P+
Nombre Ti#o de dato Ti#o de Variable Ni.eles
Tubet#pe .um7rico Kactor ="8"6
Timelsec .um7rico %espuesta
AN1VA 1ne Way
;<u= es AN1VA 1ne-Way>
Nne-Ja# &.NG& :&nlisis de varianza< procedimiento es una generalizacin independiente de las pruebas t. &l contrario de la prueba t. >in
embargo" Nne- Ja# &.NG& puede usarse para analizar las medias de ms de dos grupos :muestras< de una vez.
'a lgica bsica detrs de &.NG& es/
86
'a variacin dentro del grupo slo es debida al error aleatorio.
Por consiguiente" si la cantidad de variacin de los grupos es similar dentro de los grupos :lo alto dela grafica<" es probable que la media
del grupo slo difiera tambi7n debido al error aleatorio.
>in embargo" si la variacin dentro del grupo es relativamente grande dentro del grupo de variacin : grfico< es probable que las
diferencias entre las medias del grupo sean causadas por las diferencias por las marcadas de los niveles de factor.
;8undo usar 1ne-Way AN1VA>
,se Nne-Ja# &.NG :tambi7n llamado el solo factor &.NG&< cuando tengas respuestas continuas de datos de dos o ms niveles fijos de un solo
factor.
&ntes de aceptar los resultados en el &.NG&" debes verificar las siguientes suposiciones acerca del residual # validar los resultados.
'a residual debe ser independiente : # ser la azar<.
'a residual no tiene una desviacin sustancial de la distribucin normal.
'a residual debe tener constantes variaciones a trav7s de los niveles de factor.
;%or ?u= usar 1ne Way AN1VA>
Nne-Ja# &.NG& te puede a#udar las preguntas de la respuesta como/
02a# diferencias entre los productos de tus proveedores1
02a# diferencias entre los tratamientos de los grupos1
Por ejemplo
0 'a dureza de las muestras de plsticos de tus cuatro o proveedores son diferentes1
0'a combustin es ms eficaz cundo usas el aditivo de combustible &" ( o ningSn aditivo de combustible1
0'as fuerzas de las muestras plsticas son de sus cuatro proveedores diferente1 0'a combustin es ms eficaz cundo usted usa el
aditivo de combustible ,." combustible ( aditivo" o ningSn aditivo de combustible1
Galidando la Gariacin -guales
,sa la prueba para las Gariaciones iguales para validar las suposiciones que las variaciones de todos los grupos comparados sean iguales.
'as respuestas de datos de cada grupo deben estar en la misma columna" con el nivel de factor indicado en otra columna.
,se el nivel de confianza de H5I por default.
Test 5or E?ual Variances
87
1!- &bre el pro#ecto 8'T!M%O!
$!- Escoge 9tat :AN1VA :Test 5or E?ual Variances!
!- $ompleto el cuadro de dilogo como indica a continuacin?
(!- Pulse el botn 1@
Inter#retando sus resultados
Inter.alos de 8on5ian4a
'os intervalos de confianza son Stiles para comparar la M para las diferentes poblaciones. >in embargo" tu decisin acerca si las variaciones son
iguales deben ser basado en una prueba de varianza apropiada.
Ael grfico" aparece una sigma para el tubo tipo 8" ms largo que para los otros grupos.
%ruebas de las .ariaciones
'os resultados inclu#en dos pruebas de la variacin separadas.
Lu7 prueba uses depende de tus datos/
>i tus datos son continuos # normalmente distribuidos" use la Prueba de (artletths. :> solamente se comparan dos grupos" un K-prueba
reportara instantneamente una prueba (artletths<.
>i sus datos son continuos" pero no necesariamente normalmente distribuidos" use la Prueba de 'evenehs.
8onclusi&n
'os p-valores para ambas pruebas :pF;.=;; para (artletths TestZ pF;.8C4 para 'evenehs Test< es ma#or que ;.;5. Pero no ha# bastante evidencia
as : que con un nivel de ;.;5 M< se conclu#e que las variaciones no son iguales.
88
E"ecutando 1ne-Way AN1VA
,sa Nne-Ja# &.NG& para comparar la media del tiempo de calentamiento para diferentes tipos de tubos de ra#o catdico" # crea los grficos
para visualizar los datos.
1ne- Way
1!- Escoge el 9tat:AN1VA:1ne-Way!
$!- $omplete el recuadro como se indica a continuacin/
89
!- $lic@ Era#3s!
(!- >elecciona Do#lots o5 data and BoB#lots o5 data!
)!- $lic@ 1@ en cada cuadro de dilogo.
Inter#retando sus resultados
BoB#lots
'a grafica bo3plot muestra que el rango de valores en el Orupo 8 es ms grande" que el de los otros grupos.
Dot#lots
'a grafica dotplot revela que el grupo 8 contiene una sola observacin con un e3traordinario valor alto. $on slo C observaciones en cada grupo"
tal lnea de fuera tiene largos efectos en la media # una desviacin de la muestra.
Tales fuera de lnea como esta puede ser el resultado de una variacin aleatoria" o ellos pueden indicar que algSn empalme pas en tu proceso. Tu
debes investigar las lneas de fuera para determinar que causo que eso fuera posible.
Para el presente anlisis" asume que todas las observaciones son vlidas.
90
91
Inter#retando sus resultados
El anlisis de .arian4a
'a primera fila en la tabla del anlisis de varianza contiene todas las estadsticas asociadas con el factor/ t#bet#pe. 'a siguiente fila contiene
todas las estadsticas asociadas con el error aleatorio : error<.
7os grados de libertad
'os grados de libertad :AK< se refieren al nSmero de valores usados para calcular la suma de los cuadrados :>>< para cada fuente.
7a suma de cuadrados
'a suma de cuadrados :>>< es la medida de la cantidad de variabilidad que cada fuente contribu#e a los datos. .ote que el importe global de
variabilidad en los datos :>> suman" 6B4.B< es igual al >> para el tubet#pe :==C.B< ms el >> para el Error :8!C.;<.
Media cuadrada
:*>< para cada fuente es igual al >> dividi por el AK.
El *> para el factor es una estimacin del promedio de la media junto con el grupo de variabilidad.
El *> para el error es una estimacin del promedio dentro del grupo.
AN1VA sentido +nicoA el timeXsec contra el tubety#e
92
Inter#retando sus resultados
F-estadstica
K es el radio de la variabilidad contribuida por el factor de la variabilidad contribuida por el error. Es calculado como el *> para el factor :el
tubet#pe< dividi por el *> para el error.
$uando las diferencias entre el nivel de factor de la media es similar a las diferencias entre las observaciones de cada nivel. K ser cerrado a =.
>i la variabilidad entre el nivel de factor de la media es mas larga que la variabilidad entre las observaciones dentro del factor" K ser ms grande
que =.
El %-.alor
P-valor es la probabilidad que K sera tan grande como es :o ms grande< si su factor no tiene los efectos. $uando K es grande" sugiere que el
nivel de factor de la media es ms diferente que los esperados para la ocasin. &s que p-valor es pequeVo.
93
,se el p - el valor de probar las hiptesis lo siguiente/
2o: hiptesis nula< todos los factores del nivel de la son iguales.
2=:la hiptesis alternativa< todos los factores del nivel de la son diferentes.
8onclusi&nA
Porque P es ma#or que :;.;5<" tu no puedes rechazar 2o. .o ha# suficiente evidencia para sugerir que los niveles de las medias son diferentes.
Inter#retando sus resultados
/)G 8Is indi.iduales %ara la Media
Para cada nivelado de tu factor *-.-T&( despliega el intervalo de confianza." &s como lo siguiente las estadsticas/
.--------- .Smero de observaciones.
*ean--- *edia de las observaciones.
>tAev--- Aesviacin estndar de las observaciones
7os inter.alos de con5ian4a
'os intervalos de confianza representan rangos de valores probables para la media de cada nivel. Tu puedes estar seguro en un H5I que 9 : de
la poblacin de la media< para cada nivel esta dentro del rango indicado.
94
$alculando los intervalos" *-.-T&( combina las desviaciones estndar de cada nivel con la estimacin agrupada de M : desviacin estndar de la
poblacin< tambi7n llamada desviacin estndar agrupada : Pooled >tAev<.
.ote que ha# mucho traslapo entre los intervalos para los tres los tipos de tubos diferentes. fsta es una buena indicacin de que las medias no
son significativamente diferentes uno del otro
>in embargo" la prueba de la comparacin es necesaria antes de que cualquier conclusin pueda figurar.
AN1VA sentido +nicoA el timeXsec contra el tubety#e
Validando las 9u#osiciones de la 'esidual
&ntes de que tu puedas confiar en los resultados de un Nne-Ja# &.NG&" tu debes revisar que todas las suposiciones acerca de la residual han
sido encontradas.
,sa Nne Ja# para crear unan grafica de residuales.
95
1ne-Way
1.-Escoja 9tat :AN1VA : 1ne-Way o presiona 8trs Y E para regresar al recuadro de 1ne Way!
$!-$lic@ Era#3s!
!- $omplete el recuadro como se indica a continuacin
6 - $lic@ 1@ en cada cuadro de dilogo.
Inter#retando sus resultados
7a gra5ica de #robabilidad normal
,sa la grafica de probabilidad normal de la residual para verificar que tu residual no este desviado sustancialmente de la distribucin normal.
>i la residual viene de la distribucin normal" los puntos seguirn una lnea recta.
>i la residual no viene de la distribucin normal" los puntos no seguirn una lnea recta.
(asado en esta grafica" es razonable asumir que la residual de los datos de $%T no estn desviados sustancialmente de la distribucin normal.
96
$omo notaste previamente" ha# una lnea de fuera en el conjunto de datos. Tu debes investigar la lnea de fuera para determinar que fue lo que la
hizo posible.
Alternati.as
Tu tambi7n puedes usar un histolograma de la residual para evaluar la normalidad. >in embargo la grafica de probabilidad normal es generalmente
fcil de interpretar" especialmente para muestras pequeVas.
Inter#retando sus resultados
'esiduales contra Fits
,se la grafica de la residual versus las fits para verificar que las siguientes suposiciones han sido encontradas/
Gariaciones constantes a trav7s de la combinacin de todos los factores.
.o estn fuera de lnea los datos.
>i tS ves cualquier tipo de patrn en la grafica" una de estas suposiciones encontradas han sido violada. 'a tabla abajo resume los tipos de
patrones que tS puedes ver
97
7os #atronesA IndicaZ
'a e3tensin desigual de las
residuales a trav7s de los
diferentes valores ajustados.
'a variacin de tu residual
no es constante.
,n punto est situado mu# lejos
del cero.
Kuera de lnea.
2a# un residual e3traordinariamente alto da que la apariencia de una variacin no constante. Tu debes poder determinar que causo esta lnea de
fuera. Tal vez es apropiado volver a analizar los datos sin esta lnea. >in embargo tu solamente deberas remover la observacin para
estabilizarla" sin puede establecer que no era representativo de la poblacin.
Inter#retando sus resultados
7a residual .ersus el orden
,tiliza la grafica de la residual contra el orden para verificar que la residual es independiente.
98
>i ha# un efecto debido al orden de la recoleccin de los datos" los residuos no se esparcirn aleatoriamente cerca del cero. Tu debes ser
capaz de detectar este patrn en la grafica.
>i ha# un efecto debido al orden de la recoleccin de los datos" la residual esta aleatoriamente cerca del cero.
'a grafica revela la misma fuera de lnea identificada en la grafica de residual contra el Kitted values plot.
-gnorando la lnea de fuera por un momento" ha# dos valores mu# bajos que ocurren uno despu7s del otro.
Tal vez en alguna causa especial causo que la recoleccin de los tubos # las pruebas del tiempo de calentamiento fueran mas rpidamente que
los otros tubos.
Tal vez valga la pena investigar.
Puede haber tambi7n evidencia de un aumento sistemtico en el precalentamiento para los primeros cuatro tubos probados.
8onsideraciones 5inales
8onclusiones #rcticas
El anlisis los tubos de ra#o catdico no revelaron ninguna diferencia en el tiempo de calentamiento. >in embargo e3isten problemas potenciales
con el estudio/
99
Kuera de lnea--- ,n valor aparece fuera de lnea # debe ser investigado. Puede haber tambi7n evidencia de un incremento sistemtico en
el tiempo de calentamiento de los primeros cuatro tubos probados.
'os Patrones--- dos tubos consecutivos tienen ms corto el tiempo de calentamiento que lo normal.
(ajo Power--- basado en una estimacin de un 5.C=!" el power de la prueba para descubrir una diferencia de B segundos :a los ;.;5
nivel< es solamente de ;.8!C8 . Esto es est menos de un 8BI de oportunidad para descubrir una diferencia. Ae hecho en el orden tu
tienes un power de ;.4;" # deberas tener una diferencia de .4; segundosX
(asado en estos resultados" quizs el curso mejor de accin sera asegurar el proceso bajo control # recolectar muestras grandes # realizar la
prueba nuevamente. $on una sigma reducida de 6.; # una recoleccin de ! muestras de tubos de cada lote" tu puedes detectar una diferencia de
B segundo con un power de ;.H=66
8onsideraciones estadsticas
$omparando el nivel del factor mSltiple con un solo &.NG& es preferible a hacer una comparacin de dos niveles del tiempo con dos muestras
separadas Esto es porque dirigiendo los aumentos de las pruebas e3tras incrementa tu posibilidad de error tipo = :rechazando 2o" cuando 2o
es verdadera.
'as suposiciones de la independiente son criticas. >i las observaciones son afectadas sistemticamente por otros factores que el que usted este
estudiando los resultados de este &.NG& son sin sentido.
'a suposicin de la normalidad no es generalmente crucial especialmente en muestras grandes.
ANV7I9I9 DE 7A MEDIA
E"em#lo $ 8'T 'e.isi&n de tiem#o de calentamiento
%roblema
En el ejemplo = :pgina C-6< realizaste una prueba de tres lotes de tubo de ra#o catdico para determinar si los periodos de calentamiento son
consistentes.
8olecci&n de datosA
,na muestra al azar de los cuatro tubos es tomada de cada grupo # probadas para determinar el tiempo de calentamiento :'os datos de la
muestra son tomados del ejemplo =" Pagina C-6<.
2erramientasA
9tat : AN1VA :Analysis o5 Means
9et de Datos
8'T!M%O
Nombre Ti#o de dato Ti#o de Variable Ni.eles
Tubet#pe .um7rico Kactor ="8"6
Timelsec .um7rico %espuesta
100
Anlisis de la media
;<u= es un anlisis de la media>
.o es nada parecido que el &.NG&" el cual es usado para determinar si el nivel de la media difiere de algSn otro" el anlisis de la media
: &.N*< es usado para determinar si el nivel de la media es diferente de la gran media.
'a gran media es la media de todas las observaciones sin tener en cuenta el nivel. Por ejemplo/ si tS tienes cuatro observaciones por cada 6
niveles en el factor" la gran media es la suma de las =8 observaciones divididas entre =8.
El resultado de un anlisis de la media es usualmente similar al obtenido con el &.NG&. >in embargo/
El anlisis de la media es generalmente ms sensible que el &.NG&" cuando un nivel de la media es difiere del resto.
&.NG& es generalmente ms sensible que el anlisis de la media cuando los niveles de los grupos de la media son diferentes cada uno
de los otros.
;8undo usar el anlisis de la media>
,sa el anlisis de la media cuando tengas datos de uno o dos factores. 'os datos deben de proceder de la distribucin normal" (inomial o
Aistribucin de Poisson.
;%or?u= usar el anlisis de la media>
El anlisis de la media te a#uda a responder preguntas tales como/
0Es un tratamiento mejor que el promedio1
Por ejemplo/
Entre tablas tratadas con diferentes acabados" un acabado confiere mejor que el promedio de las otras caractersticas utilizadas.
Desarrollo del anlisis de la media
,se el anlisis de la media para evaluar los datos. ,se un m de ;.;5 para la prueba
Anlisis de la mediaA
=. - Elija/ 9tat : AN1VA :Analysis o5 Means!
8.- $omplete el recuadro como se indica a continuacin
101
6.- Presione 1@
Inter#retando tus resultados
El anlisis de la media comparado con el nivel de la media :puntos negros< con la gran media :lnea central verde. 'a gran media es la media de
las =8 observaciones.
>i un nivel de la media es ma#or o menor que el valor critico representado por la lnea decisiva :en rojo< esta es significativamente diferente de la
gran media.
8onclusionesA
.inguno de los niveles individuales de la media de los datos de la $%T son significativamente diferentes de la gran media.
102
8onsideraciones 5inales
8onsideraciones #rcticasA
Aiferencias no significativas fueron detectadas en medio del nivel del factor de la media # de la gran media.
>in embargo recordemos que cuando los mismos datos fueron analizados Snicamente con el procedimiento de &.NG& se observaron algunos
problemas con el control del proceso. 'a ma#or desventaja del procedimiento de &nlisis de la media es que no suministra graficas de residual
para a#udarte ubicar problemas en los datos.
8onsideraciones estadsticas
'os resultados del anlisis de la media son usualmente similares a los obtenidos con &.NG&" >in embargo/
El anlisis de la media es generalmente ms sensible que el &.NG&" cuando un nivel de la media es diferente del resto.
&.NG& es generalmente ms sensible que el anlisis de la media cuando los niveles de los grupos de la media son diferentes cada uno
de los otros.
>i bien usando &.NG& con dos factores" el diseVo debe tener balance :esto es" debe tener los mismos nSmeros de observaciones por cada
combinacin de niveles de factor.
>i bien usando &.NG& con datos binomiales" np # n:=-p< deben los dos tener por lo menos cinco" porque &.NG& usa una apro3imacin normal
de la binomial : n es el tamaVo de muestra que deben tener todas las muestras" # P es generalmente proporcional.
Para datos de Poisson" la media debe ser por lo menos de 5.
103
Balance AN1VA
E"em#lo Desgaste de #intura
%roblema
Estas estudiando las caractersticas que deben llevar los cuatros diferentes tipos de pintura amarilla para carreteras.
'ecolecci&n de datosA
Pruebas de restos de cada pintura que fueron aplicadas en las carreteras de Kiladelfia" Pittsburg" 2arrisburg # >cranton" Pensilvania.
Aespu7s de un tiempo conveniente de e3posicin al mal tiempo # al trfico" el desgaste de la pintura fue medido en cada una de las cuatro
localizaciones. ,n alto puntaje de la media arrojo que la pintura estaba erosionada.
2erramientasA
9tat : Ano.a-1ne-6ay!
Era#3 : 83art!
9tat-AN1VA : Balanced AN1VA!
9et de Datos
%NTWEA'!M%O
Balanced AN1VA
;<u= es el balance AN1VA>
(alance &.NG& es similar al &.NG&" e3cepto que las respuestas pueden ser clasificadas en dos o ms factores al mismo tiempo.
Por ejemplo/ 'a tabla de abajo es el diseVo de un estudio para evaluar si la temperatura del motor funcionando es un factor de ambos/ Peso del
aceite # las revoluciones por minuto del motor.
104
'a informacin de cada celda de la tabla representa la Snica combinacin de %P* # aceite. 'as observaciones son clasificadas en las dos
variables.
;8undo usar Balance AN1VA>
,sa (alance &.NG& cuando tengas respuestas continuas de datos fijos en uno o ms factores. 'os datos deben estar balanceados" Esto es"
Ddeben tener los mismos nSmeros de observaciones en cada celda del diseVo.
&ntes de aceptar los resultados en el &.NG&" debes verificar las siguientes suposiciones acerca del residual # validar los resultados.
'a residual debe ser independiente : # ser la azar<.
'a residual no tiene una desviacin sustancial de la distribucin normal.
'a residual debe tener constantes variaciones a trav7s de los niveles de factor.
;%or ?u= ?ue usar Balance AN1VA>
(alance &.NG& te puede a#udar a responder preguntas tales como/
02a# diferencias en tus productos a causa de varios factores identificados1
0>on ciertas combinaciones de los niveles de factor ideales1
Por ejemplo"
0El nivel de temperatura del motor funcionando cambia por el factor de %P* o Peso del aceite1.
0E3isten ciertos cambios de maquinas en tus planta que son mas productivos que otros" o es una maquina mas productiva en ciertos
cambios" pero no en otras1
E"ecutando 1ne Way AN1VA
Para una comparacin" primero ejecuta one-wa# &.NG&" para analizar el desgaste de la pintura como un factor del tipo de pintura solamente.
1ne-Way AN1VA
1!- &bre el pro#ecto P.TJE&%.*P+.
$!- Escoge 9tat : AN1VA-1NE WAM !
!- En 'es#uesta enter PntJear.
(!- En Factor enter Paint.
)!- $lic@ 1@!
'%M
Aceite =";;; 8";;; 6";;;
5w6; %P* F =";;;
&ceite F 5w6;
%P* F 8";;;
&ceite F 5w6;
%P* F 6";;;
&ceite F 5w6;
=;w6; %P* F =";;;
&ceite F=;w6;
%P* F 8";;;
&ceite F=;w6;
%P* F 6";;;
&ceite F =;w6;
105
Inter#retando tus resultados
&unque la mejor pintura es la de b-;8C8 :media F =C.85< # la peor de b-=B85m :media F =;.B5< estas diferencias fueron no significativas Den el
nivel ;.;5 m :p F;.==5<.
Era5icando los datos
-nformacin importante se pierde cuando no inclu#es el factor de localizacin en tu anlisis. Para ilustrar esto" usa el chart para crear unas barras
agrupadas ilustrando el desgaste de la pintura en funcin de ambos tipos/ de pintura # locacion.
83art
1!- Escoge Era#3 : 83art!
$!- $omplete el recuadro como se indica a continuacin.
106
e &segSrate de cambiar para cada uno de Era#3 a Erou#!
!- $lic@/ 1#tions.
(!- %evisa el Erou# # enter Paint.
5.- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
'a grafica muestra una gran cantidad de variabilidad en los datos asociados con 'ocalizacin. En general" el menor desgaste de pintura se
presenta en Philadelphia # la peor en >cranton.
$uando tu no inclu#es D'ocalizacinh en tu anlisis" esta variabilidad es atribuida al error :dentro del grupo con variacin<. Esto disminu#e tu K
ratio.
107
Csando una segunda .ariable del blo?ue de .ariaci&n de 7ocaci&n!
-nclu#endo locacin en tu anlisis quieres prevenir la variabilidad asociada con este factor" donde se les atribu#e el error. Esto incrementara tu
habilidad para detectar diferencias en desgaste de cada pintura.
,sa (alance &.NG& para analizar si el desgaste de pintura es un factor de ambos Pintura # 'ocalizacin. Esto es llamado/ AiseVo aleatorio
del bloque" porque el factor de inter7s es la pintura" # 'ocalizacin es incluido solamente para reducir el error de variabilidad" Tal factor es
llamado DGariable de bloqueh.
'a respuesta debe estar en una columna con descripciones # columnas adicionales indicando los niveles de cada factor por cada observacin.
Balance AN1VA
1!- Escoge 9tat : AN1VA : Balance AN1VA!
$!- $omplete el recuadro como se indica a continuacin
108
!- $lic@ 1@!
Inter#retando tus resultados
En este modelo el efecto de ambos/ Pintura # 'ocalizacin son significantes en un nivel ;.;5 m :p F ;.;;6 # ;.;;B respectivamente<.
.ote que el *> del error :tambi7n llamado *>E< en este modelo es solamente =.845" comparado con el C.=H; del modelo que no inclu#o
localizacin como factor" porque el *>E es el denominador de todos los K-ratios" reduciendo el *>E" incrementa el K-Galues.
109
Anali4ando el residual
Aespu7s de que confes en los resultados de &.NG&" debes revisar" para estar seguro de todas las suposiciones acerca del residual que ha#as
encontrado.
,sa (alance &.NG& para crear una tabla de %esidual.
Balanced AN1VA
1!- Escoge 9tat : AN1VA : Balanced AN1VA # presiona $trl P E para regresar a Balance Analysis o5 Variance de los recuadros.
$!- $lic@ Era#3s!
!- *arca las cuatro opciones bajo 'esidual %lots!
(!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
110
,sa un cuadro de distribucin normal # un histolograma para verificar que tu residual no este desviado considerablemente de la distribucin
normal.
>i la residual viene desde la distribucin normal" los puntos tienen una lnea recta en la grafica normal # en el histolograma no tiene una
forma de campana recta.
>i el residual no viene desde una distribucin normal" los puntos no continSan en lnea recta en la grafica .ormal # en el histolograma no
tiene forma de campana.
(asado en los recuadros" es razonable asumir que la residual no esta desviada sustanciablemente de la distribucin normal. :.ormalmente
pruebas ejecutadas del residual :no presentadas en este ejemplo< produce que p F valor menos de ;.C86.<
111
Inter#retando tus resultados
,sa las graficas de residual contra el ajuste para verificar que las siguientes suposiciones han sido encontradas/
Gariaciones constantes a trav7s de la combinacin de todos los factores.
.o estn fuera de lnea los datos.
>i tS ves cualquier tipo de patrn en la grafica" una de estas suposiciones encontradas has sido violada. 'a tabla abajo resume los tipos de
patrones que tS puedes ver/
Para los datos del desgaste de pintura" la varianza de la residual
aparece bastante constante.
'os Patrones -ndicanggg
'a e3tensin desigual de las
residuales a trav7s de los
diferentes valores ajustados.
'a variacin de tu residual no
es constante.
,n punto est situado mu#
lejos del cero.
Kuera de lnea.
112
Inter#retando tus resultados
,sa la grafica de la residual contra el orden de los datos para verificar que las residuales son independientes.
>i ha# algSn efecto debido a la recoleccin de los datos" la residual no ser aleatoriamente dispersa cerca del cero. TS sers capaz de
detectar este patrn en la grafica.
>i no ha# algSn efecto debido al orden de la recoleccin de datos las residuales sern aleatoriamente dispersas cerca del cero.
.o ha# ningSn patrn que aparezca en las residuales" por lo tanto las suposiciones de independencia son validas.
8onsideraciones 5inales
8onclusiones #rcticasA
-nicialmente un simple anlisis de los tipos de pintura no revelo diferencias significativas. >in embargo cuando 'ocacin fue incluida en el anlisis
de un bloque de variable" efectos significativos de la pintura fueron revelados.
Esto ilustra una de las ventajas del modelo de *ulti-Kactor &.NG&/
TS puedes algunas veces disminuir la cantidad de un error ine3plicable de variacin en la respuesta" si inclu#es factores adicionales en
el modelo.
TS puedes algunas veces aprovechar recursos investigando dos o ms factores en el mismo tiempo.
$on un modelo apropiado" tS puedes evaluar interacciones entre dos factores. Esta interaccin ocurre cuando los efectos de un factor
cambian basndose en el nivel de algSn otro factor.
8onsideraciones estadsticasA
Para usar (alance &.NG& tus datos deben estar balanceados.
113
Es importante validar las suposiciones de la residual despu7s dibujando las conclusiones finales de los resultados de cualquier &.NG&.
Modelo 7ineal Eeneral
E"em#lo ( Distancia de 5renado!
%roblemaA
TS quieres conocer si la distancia que le toma a un carro para frenar en un pavimento mojado es afectada por los siguientes factores/
El *odelo de la llanta :'lanta<.
'a banda de rodadura :Tread<.
>i el seguro de freno es adecuado :&(><.
8olecci&n de datos
El mismo carro es utilizado para la recoleccin de los datos. 'a distancia requerida para frenar a una velocidad de C; millas por hora en un
pavimento mojado fue medida con cada combinacin de llantas" banda de rodadura # el &(>. $orridas e3perimentales fueron realizadas en
orden aleatorio.
2erramientasA
9tat-Table : 8ross Tabulation!
9tat-AN1VA : Balanced AN1VA!
9tat-AN1VA : Eeneral 7inear Model!
9et de datos
(%&TEA->.*P+
.ombre Tipo de datos Tipo de variable .iveles
'lanta Te3to Kactor *)"OT"'>
(anda de
rodadura
.um7rico Kactor =;" =.5
&(> Te3to Kactor $apaz
.o capaz
Aistancia .um7rico %espuesta
Modelo lineal Eeneral
;<u= es el Modelo lineal general H E7MJ>
114
O'* es similar al (alance &.NG& e3cepto que/
Puede ser usado en pruebas de diseVo no balanceadas.
Puede ser usado tambi7n para comparar los niveles individuales de las medias.
;8undo usar el Modelo lineal general>
,sa el O'* cuando tengas respuesta continSas de datos de niveles estables de uno o ms factores. El diseVo no debe ser balanceado.
Aespu7s de aceptar los resultados del &.NG&" tS debes verificar que las siguientes suposiciones acerca de la residual sean validas en tus datos/
'a residual debe ser independiente :# de esta manera al azar<.
'a residual no debe estar desviada sustanciablemente de la distribucin normal.
'a residual debe tener constantes variaciones a trav7s de todos los niveles de factor.
;%or ?u= usar el Modelo lineal general>
O'* te a#uda a responder preguntas tales como/
02a# diferencia en tu producto debido a diferentes factores identificados1
0>on ciertas combinaciones de niveles de factor ideales1
Por ejemplo"
0El color de tu plstico cambia en funcin de la temperatura" humedad o presin1
0Es el color del plstico generalmente mejor cuando la presin es alta" o depende este de la presin1
1bser.ando los datos en la tabla
,sa $%N>> tabulacin para crear una tabla con los datos para ver posibles diferencias entre doce combinaciones tratadas.
8ross tabulaci&n
1!- &bre el pro#ecto (%&TEA->.*P+.
$!- Escoge 9tat : Table-9tatistics descri#ti.e!
!- En 8lassi5ication .ariables enter Tire Tread &(>.
(!- En Asociated .ariables enter Aistancia.
)!- $omplete el recuadro como se indica a continuacin.
115
*!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
%rinci#ales e5ectos
.ote que la media de la distancia de frenado cuando el &(> no es utilizado es de H;.!!B. Este es ms largo que la distancia que requiere para
frenar con &(> :BC.B5;< la diferencia es llamada Principales efectos del AB9!
E5ectos de interacci&n
.ote que/
$uando el &(> fue no utilizado" el =.5 mm de la banda de rodadura frena mas rpidamente
: media F H;.=! < que el =;.mm de banda de rodadura : media FH=.=!B<.
116
$uando el &(> fue utilizado" el =;.; mm de banda de rodadura :media F B6.466< frena mas rpidamente que el =.5 mm de la banda de
rodadurah: media F B5.!!B<.
'os efectos son llamados interacci'n del &(> b# tread" porque los efectos de la banda de rodadura dependen del nivel del &(>. :>in embargo las
diferencias no son grandes. ,na prueba apropiada revelara que la interaccin no es significante.
Anali4ando tu modelo com#leto
,sa el balance &.NG& para analizar el modelo completo. El modelo completo contiene todos los posibles efectos e interacciones.
Anotaciones
Para indicar los t7rminos de interaccin" simplemente junta los nombre con un asterisco. Ae esta manera el modelo completo de frenado a
distancia de los datos contiene los siguientes t7rminos/
$omo un atajo el modelo completo puede ser usado tambi7n cargando los datos en barra vertical.
Tire Tread - &(>
'as barras verticales le dicen al minitab que considere los efectos principales e interacciones contenidas en medio de los t7rminos indicados.
Balance AN1VA
117
1!- Escoge 9tat : AN1VA : Balanced AN1VA.
$!-$omplete el recuadro como se indica a continuacin
!- $lic@ 1@.
Inter#retando tus resultados
,sa el Galor de P" para la prueba de significanca de cada t7rmino. En este modelo los siguientes efectos son significantes en un ;.;5 m.
'lanta :p F ;.;;6<.
&(> :p F ;.;;;<.
Porque hubo solamente dos niveles del &(> :capaz # no capaz<" tS sabes que la significanca en los t7rminos refleja diferencias significativas entre
los dos niveles.
%rueba de com#araci&n
Porque hubo tres niveles en las llantas" tu quieres realizar una comparacin estadstica en orden para determinar cuales niveles son diferentes
entre cada uno.
El procedimiento (alanced &.NG& no permite comparaciones individuales entre niveles de la media" por eso vas a usar el *odelo lineal general
para dirigir las pruebas despu7s de eliminar las no significancas # revisar el residual.
118
A"ustando el modelo reducido
El paso siguiente para ajustar el modelo reducido es removiendo los t7rminos no significantes. ,sa el modelo lineal general para ajustar el modelo
con solo la llanta # el &(>. :El modelo proporciona opciones para analizar las diferencias entre niveles individuales de la media<.
TS debes tambi7n crear graficas de residual" para poder validar las suposiciones de la prueba.
Modelo 7ineal Eeneral
1!- Escoge 9tat : AN1VA : Eeneral 7inear Model!
$!- 8om#lete el recuadro como se indica a continuaci&n!
119
!- 8lick Era#3s!
(!- %evisa las opciones bajo 'esidual %lots!
)!- $lic@ 1@ en cada recuadro.
Inter#retando tus resultados
$omo es esperado" ambos/ 'lanta # &(>" tengan una significanca de ;.;;5 m del nivel en el modelo ajustado.
120
Inter#retando tus resultados
(asado en la grafica de probabilidad normal # en el histolograma es razonable asumir que el residual no esta desviado sustanciablemente de la
distribucin normal.
121
Inter#retando tus resultados
'a grafica de la residual contra el ajuste" confirma que la variacin de la residual es bastante constante.
122
'a grafica de la residual contra el orden de los datos no presenta ningSn patrn" de esa manera las suposiciones de independencia parecen ser
validas.
.o parece haber ninguno fuera de lnea.
123
Era5icando los #rinci#ales e5ectos e interacciones
8om#araci&n gr5ica de la media
&hora que tS te has establecido en un modelo" este es usado para visualizar los resultados del anlisis de la media utilizando las graficas # los
principales efectos e interacciones.
&unque tS has elegido no incluir todos los t7rminos del modelo final" es de mucha a#uda incluir todos los factores en las graficas para visualizar
t7rminos significantes # no significantes.
%rinci#ales e5ectos e interacciones gra5icas
1!- Elige 9tat : AN1VA : Main E55ects %lot!
$!- En 'es#onse presiona Distance!
!- En Factors presiona Tire Tread &(>.
(!- Presiona 1@!
)!- Elige 9tat : AN1VA : Interactions %lot!
*!- En 'es#onse presiona Aistance.
,!- En Factors presiona Tire Tread &(>.
-!- Presiona 1@!
Inter#retando tus resultados
124
'a grfica de efectos principales de llanta # &(> tienen lneas inclinadas" indicando que estos efectos son importantes.
En esta grfica esta claro que/
'a 'lanta con la distancia mas corta de frenado fue la OT.
'as distancias de frenado mas cortas fueron llevadas a cabo con el sistema &(>.
'a grafica de la banda de rodadura muestra una pequeVa inclinacin sugiriendo que los efectos no son significativos. 'as bandas de rodadura
producen casi id7ntica frenada a distancia.
Inter#retando tus resultados
'as interacciones de la grafica muestran los dos sentidos de la interaccin. 'os nombre de los factores a la izquierda de cada grafica son
representados en el eje b" # todos los factores llamados por debajo de cada grafica son representados en el eje ).
'as lneas de cada grafica en su ma#or parte paralelas" sugieren que no ha# interaccin en medio de ningSn t7rmino. Pero es quizs alguna
evidencia de una interaccin entre las llantas # la banda de rodadura pero el &.NG& ndico que esto no fue significante.
125
8onduciendo la com#araci&n del desgaste de #intura
,tilice el modelo lineal para probar las diferencias entre los niveles de factores significantes.
Eeneral 7inear Model
126
1.- Elija 9tar : AN1VA : Eeneral 7inear Model!
$!- Presione K6 para regresar a las opciones generales
!- En 'es#onse enter Aistancia.
(!- En Model enter Tire &(>.
)!- Presiona 8om#arison!
*!- $ompleta el recuadro como se indica a continuacin/
,!- Presiona 1@ en cada recuadro
Inter#retando tus resultados
,se un m de ;.;5 para todas las pruebas.
'a primera tabla compara las llantas OT con las '> # las *). 'os resultados revelan que el promedio de distancia de frenado obtenidos con las
llantas OT es significativamente mas bajo que los obtenidos con cualquier de las otras llantas '> :p F ;.;;;4< # *) :p F ;.;=6=<.
'a segunda tabla compara las llantas '> # *)" donde no hubo diferencias significativas :p F ;.CC6!<
8onsideraciones 5inales
8onclusiones #rcticas
En los t7rminos de frenado # pavimento mojado" la mejor llanta es la OT. Tambi7n es mejor tener el sistema &(> disponible" # no parece mu#
importante que la banda de rodadura sea de =;. mm o =.5 mm de profundidad.
8onsideraciones estadsticas
'as ventajas del procedimiento inclu#en lo siguiente/
127
Puede ser usado con un modelo desbalanceado.
Puede ser usado para evaluar las diferencias entre niveles individuales de medias.
Es importante validar las suposiciones del residual" antes de dibujar cualquier conclusin final de los resultados del &.NG&.
Este anlisis inclu#e factores estables significando que los niveles incluidos fueron de inter7s directo # no significo que fueran generalizados a
otros niveles. El procedimiento del modelo lineal general puede tambi7n ser usado con factores aleatorios" los cuales son factores para que los
niveles sean seleccionados aleatoriamente # sean pro#ectados para representar una ma#or poblacin de posibles niveles.
,n ejemplo e3celente es un estudio de un gage %`%.
Todos los factores en este anlisis fueron cruzados significando por ejemplo" que cada nivel de llanta puede ser probado con cada nivel de banda
de rodadura. 'os factores son considerados jerarquizados si todos lo niveles de un factor suceden completamente dentro de un nivel de otro.
E"ercicio (!1 %rueba de .inos
%roblemaA
TS tratas de determinar si e3isten diferencias significativas en la calidad de tres vinos/ *atador" $onquistador # >aeta.
8olecci&n de datos
=; jueces de vinos probaron tres vinos cada uno # cada uno califico su calidad. El orden de las pruebas fue aleatorio # cada juez pruebo los
vinos en diferente orden.
-nstrucciones/
=.- ,se el modelo lineal Oeneral para analizar los puntajes en funcin del vino.
-nclu#e los jueces en el bloque de variables para reducir la variabilidad.
%ealiza el ajuste :Kits< # el residual.
-nclu#e el pairwise comparacin en el factor del vino en tus resultados.

8.- Oenera los efectos principales en la grfica de vinos.


6.- usa 9tat : 'egression : 'esidual %lots para validar las suposiciones del modelo.
9et de Datos
%-N+&.*P+
128
E"ercicio (!$ 8ontenido de 5os5ato
%roblema
TS quieres evaluar cuanto tiempo toma el uso del gravmetro contra el m7todo spectometrico para medir el contenido fosfato que contienen dos
tipos de material.
8olecci&n de datos
>eis ingenieros tomaron muestras del contenido de fosfato de cada material usando cada m7todo.
'os datos son de +. .eter" J. Jasserman # *.2. Tutner :=H45< &plicacin lineal del modelo estadstico" segunda edicin -rwin " -n. Pagina H6!.
Instrucciones
1!- ,se el modelo lineal general para analizar el tiempo como una funcin del material # del m7todo.
-nclu#e a los ingenieros en el bloque de variables para reducir la variabilidad.
%ealiza el ajuste :Kits< # el residual.
-nclu#e el pairwise comparacin # la interaccin entre el m7todo e material en tus resultados.
$!- Oenera una grafica de interaccin del material e m7todo.
!- ,sa 9tat : 'egression : 'esidual %lot para validar el modelo de suposiciones.
9et de datos
P2N>P2&b.*P+
129
Trabajo elaborado por
7ic! 8ecilia 8! Da4 Earca
ccdiagarnhotmail.com
7ic! Ang=lica Es?ui.el
Ing! Maria Valle
*aestra en &dministracin # 'iderazgo
*ateria Estadstica para administradores
&lumnas de la ,niversidad del .oreste de $oahuila
130

Das könnte Ihnen auch gefallen