Sie sind auf Seite 1von 23

ESTADSTICA CON EXCEL

ESTADISTICA DESCRIPTIVA CON EXCEL

Excel se puede usar para generar las medidas estadsticas descriptivas que explicamos en este capitulo.
En ese apndice mostraremos como se usa Excel para generar varias de las medidas de localizacin y
dispersin para una sola variable. Y para generar la covarianza y el coeficiente de correlacin como
medidas de la asociacin entre dos variables.

COMO USAR LAS FUNCIONES DE EXCEL

Excel cuenta con funciones para calcular medidas como la media, mediana, moda, varianza de la
muestra y la desviacin estndar de la muestra. Ilustramos el uso de estas funciones de Excel mediante
el calculo de la media, mediana, varianza muestral y desviacin estndar de la muestra para los datos
de salarios iniciales de la tabla 3.1. Consulte la figura 3.12 conforme describimos los pasos necesarios.
Los datos se introdujeron en la columna B.
La funcin PROMEDIO (AVERAGE) de Excel se puede usar para calcular la media al escribir la
formula en la celda E1.

=AVERAGE(B2:B13)

Figura 3.12 COMO USAR LAS FUNCIONES DE EXCEL PARA CALCULAR LA MEDIA,
MEDIANA, MODA, VARIANZA Y DESVIACIN ESTNDAR

De manera similar, las formulas =MEDIAN(B2:B13), MODE(B2:B13), =VAR(B2:B13) y


=STDEV(B2:B13) se tecleen las celdas E2:E5 respectivamente, para calcular la mediana, moda,
varianza y desviacin estndar. La hoja de calculo que aparece al frente muestra los calores calculados
con las funciones de Excel y son los mismos que calculamos antes en el capitulo.

Excel cuanta tambin con fusiones que se pueden usar para calcular la covarianza y el coeficiente de
correlacin. Sin embargo, se debe tener cuidado al usar estas fusiones debido a que la fusin de la
covarianza trata a los datos como si fueran una poblacin y la fusin de correlacin como si se tratara
de una muestra. As que el resultado obtenido con la funcin de covarianza de Excel se debe ajustar
para obtener la covarianza de la muestra. Aqu se mostrara la manera de usar estas fusiones para
calcular la covarianza de la muestra y el coeficiente de correlacin para los datos del almacn de
equipos estreo fnicos de la tabla.3.7 consulte la figura 3.13 conforme se presentan los pasos
necesarios.
La fusin Excel para la covarianza, COVAR, se puede utilizar para el calculo de la covarianza
poblacional al introducir la formula siguiente en la celda F1.

=COVAR(B2:B11,C2:C11)

De manera similar, la formula=CORREL(B2:B11,C2:C11) se escribe en la celda F2 para calcular el


coeficiente de correlacin muestral. La hoja de clculo que aparece en el frente muestra los valores
calculados mediante las funciones de Excel. Observe que el valor del coeficiente de correlacin de la
muestra (0.93) es el mismo que se calculo por medio de la ecuacin (3.12). Sin embargo, el resultado
que produce la fusin. Por tanto, se debe ajustar el resultado de Excel de 9.9 para obtener la covarianza
de la muestra. El ajuste es bastante simple Primero, observe que la formula para la covarianza
poblacional, ecuacin(3.11), requiere que se divida entre el numero total de observaciones en el
conjunto de datos. No obstante, la formula par ala covarianza de la muestra, ecuacin (3.10), requiere
que se divida entre el numero total de observaciones menos 1. As, para usar el resultado de Excel de
9.9 para calcular la covarianza de la muestra, simplemente multiplicamos 9.9 por n/(n-11). Debido a
que n=10, se obtiene
9 = 11

Por tanto, la covarianza de la muestra para los datos de


equipos estereofnicos es 11.

FIGURA 3.13 COMO USAR LAS FUCIONES DE


EXCEL PARA CALCULAR LA COVARIANZA
Y LA CORRELACION.

COMO USAR LAS HERRAMIENTAS DE ESTADSTICAS DESCRIPTIVAS DE EXCEL


Como ya se demostr, Excel cuenta con fusiones estadsticas para calcular las estadsticas descriptivas
para un conjunto de datos. Estas fusiones se pueden usar para calcular una estadstica a la vez (p.ej.,
media, varianza, etc.). Excel tambin cuenta con varias herramientas de anlisis de datos. Una de estas,
que se llama Estadsticas descriptivas, permite al usuario calcular diversas estadsticas descriptivas a la
vez. A continuacin mostramos como se puede usar para calcular estadsticas descriptivas para los
datos de salarios iniciales de la tabla 3.1 Consulte la figura 3.14 a medida que se describen los pasos
necesarios.

Paso 1. Seleccione el men desplegable Herramientas (Tools)


Paso 2. Elija Anlisis de datos ( Data analysis)
Paso 3. Seleccione Estadsticas descriptivas (Descriptive Statistics) de la lista de Herramientas de
anlisis
Paso 4. Cuando aparezca el cuadro de dialogo Estadsticas Descriptivas:
Teclee B1:B13 en el cuadro Rango de entrada ( Input Range)
Seleccione Agrupando por Columnas (Grouped by Columns)
Seleccione Etiqueta en el primer rengln (Labels in First Row)
Seleccione Rango de salida (Output Range)
Escriba D1 en el cuadro Rango de salida (Output Range) (para identificar la esquina superior
izquierda de la seccin de la hoja de clculo donde aparecer la estadstica descriptiva).
De clic en Aceptar (OK)
Las celdas D1:E15 de la figura 3.14 muestran las estadsticas descriptivas que resultan con Excel. Los
elementos en negrita son las estadsticas descriptivas que se estudiaron en este capitulo. Las estadsticas
descriptivas que no estn en negrita se estudian ms delante en el texto o se explican en libros mas
avanzados.

FIGURA 3.14 EMPLEO DE LA HERRAMIENTA ESTADSTICA DESCRIPTIVA DE EXCEL

Caso de muestras grandes donde se supone que se conoce el valor de o


Para ejemplificar se utiliza el ejemplo de CJW de la seccin 8.1. Se supone que se conoce la desviacin
estndar poblacional = 20. Los datos se introdujeron en una hoja de calculo de Excel con la leyenda
Puntuacin (Score) en la celda A1 y las puntuaciones de satisfaccin para la muestra de 100 clientes
CJW en las celdas A2:A101. Para calcular el intervalo de confianza de 95% del promedio poblacional
se utilizan los pasos siguientes.

Paso 1. Calcule el promedio muestral en la celda C2

= PROMEDIO(A2:A101)

Paso 2. Calcule el margen de error en la celda C3

=CONFIANZA(0.05, 20, 100)

Paso 3. Calcule el limite inferior de la estimacin del intervalo en la celda C4

=C2-C3

Paso 4. Calcule el limite superior de la estimacin del intervalo en la celda C5

=C2+C3
En la figura 8.10 aparece el resultado formateado con las leyendas.

CASO DE MUESTRA GRANDES CON ESTIMADA MEDIANTE S

Para ilustrar se utiliza los datos del balance de tarjetas de crdito de la tabla 8.2. Los datos se
introdujeron en una hoja de calculo de Excel con la leyenda Balance en la celda A1 y los balances de
las tarjetas de crdito para la muestra de 85 hogares en las celdas A2:A86. No.

FIGURA 8.10 RESULTADOS DE EXCEL PARA LA ESTIMACIN DEL INTERVALO DE CJW DE


UN PROMEDIO POBLACIONAL
Nota: Los renglones 10 al 95 estn ocultos.

Se conoce la desviacin estndar poblacional o y se estimara mediante la desviacin calculo muestral s.


Calcule la desviacin estndar muestral en la celda C1.
=STDEV(A2:A86)

A continuacin construyamos la estimacin del intervalo por medio de los mismos pasos para el caso
de muestras grandes donde se supone que se conoce el valor de o.

Paso 1. Calcule el promedio muestral en la celda C2

=PROMEDIO(A2:A86)

Paso 2. Calcule el margen de error en la celda C3

=CONFIANZA(0.05,C1,85)

Paso 3. Calcule el lmite inferior de la estimacin del intervalo en la celda C4

=C2-C3

Paso 4. Calcule el lmite superior de la estimacin del intervalo en la celda C5

=C2+C3

El resultado con la desviacin estndar muestral que aparece en la celta C1 ser muy al resultado
mostrado en la figura 8.10.

Tabla 8.4
Empleado Tiempo Empleado Tiempo Empleado Tiempo
1 52 6 59 11 54
2 44 7 50 12 58
3 55 8 54 13 60
4 44 9 62 14 62
5 45 10 46 15 63

Caso de muestras pequeas donde se supone se conoce

Si es apropiado la suposicin de que la poblacin tiene una distribucin normal, el muestras pequeas ,
donde se supone se conoce o, utiliza el mismo procedimiento pasado ya descrito en el caso de muestras
generales, donde se supone que o es conocida.

Caso de muestras pequeas con estimada mediante.

Los datos de la tabla 8.4 muestran los tiempos del programa de capacitacin para la de empleados.
Los datos se introdujeron en una hoja de calculo de Excel con la tiempo en la celda A1 y lo tiempos del
programa de capacitacin en das en las celdas A2:A16. En este caso no se conoce la desviacin
estndar poblacional o y se estima mediante la desviacin estndar muestral s. Mediante los pasos
siguientes se calcula una ecuacin del intervalo de confianza de 95% para el promedio poblacional.

Paso 1. Seleccione el men desplegable Herramientas (Tools)


Paso 2. Seleccione la opcin Anlisis de datos (Data Analysis)
Paso 3. Cuando aparezca el cuadro de dialogo anlisis de datos:
Seleccione Estadstica descriptiva (Descriptive Statistics)
Seleccione Aceptar (OK)
Paso 4. Cuando aparezca el cuadro de dialogo Estadstica descriptiva:
Teclee A1:A16 en el cuadro Rango de entrada ( Input Range)
Seleccione Rtulos en primera fila (Labels in First row)
Seleccione Resumen de estadsticas (Summary Statistics)
Seleccione Nivel de confianza para la media y teclee 95 en el cuadro
Seleccione Rango de salida (Output Range) y teclee B1 en el cuadro Oprima Aceptar (OK)

La media de la muestra 53.87 aparece en la celda C3 y el margen de error 3.78 en le celda C16 observe
que el nombre en Excel para el margen de error es Nivel de Confianza
(95.0%). El intervalo de confianza se puede obtener al restar y sumar despus del margen de error al
promedio muestral. La formula =C3-C16 se puede usar para colocar el limite superior en la celda C18.

TABLA 9.2 DATOS DE LA DISTANCIA PARA UNA MUESTRA ALEATORIA


SIMPLE DE 36 PERSONAS DE GOLF SUPERFLIGHT

Pelota Yarda Pelota Yarda Pelota Yarda

1 269 13 296 25 272


2 300 14 265 26 285
3 268 15 271 27 293
4 278 16 279 28 281
5 282 17 284 29 269
6 263 18 260 30 299
7 301 19 275 31 263
8 295 20 282 32 264
9 288 21 260 33 273
10 278 22 266 34 291
11 276 23 270 35 274
12 286 24 293 36 277

SECCION 9.5
A una muestra aleatoria simple de 12 viajeros se les pidi calificar al aeropuerto Heathrow de Londres
y las calificaciones obtenidas fueron:

7 8 10 8 6 9 6 7 7 8 9 8

Apndice 9.2 PRUEBA DE HIPTESIS CON EXCEL


Caso de muestra grandes

Ilustraremos el caso de muestras grandes con los datos de las distancias de las pelotas de golf de la
tabla 9.2. El rotulo yardas aparece en la celda A1 y los 36 valores de distancia aparecen en las celdas
A2 y A37 de una hoja de calculo de Excel. Observa que el nivel de significacin para la prueba de
hiptesis es = 0.05 y la desviacin estndar poblacional o se estima mediante la desviacin estndar
maestral s.

Una forma relativamente fcil de hacer la prueba de hiptesis con Excel es que usted construya su
propia hoja de clculo y utilice el criterio de valor p para obtener la conclusin. La hoja de clculo que
construimos se muestra en la figura 9.18. Los pasos que se pueden usar para probar H 0 : = 280 y H a :
280 son los siguientes:

Paso 1. Teclee 280 en la celda D2


Paso 2. Calcule el tamao de la muestra en la celda D6

=CONTAR(A2:A37)

Paso 3. Calcule la media muestral en la celda D7

=PROMEDIO(A2:A37)

Paso 4. Calcule la desviacin estndar de la muestra en la celda D8

=DESVEST(A2:A37)

Paso 5. Calcule la estadstica de prueba en la celda D9

=(D7-D2)/(D8/RAIZ(D6))

Paso 6. Calcule el valor p en la celda D10

=2*(1-DISTR NORM ESTAND(ABS (D9)))

La celda D9 contiene la formula para la estadstica de prueba

La celda D10 contiene la formula para calcular el valor p, que es el rea


bilateral de la distribucin normal asociada con la estadstica de prueba z en la
celda D9.
En el estudio de la pelota del golf Superflight se utilizo la desviacin estndar
muestral s para estimar la desviacin de la poblacional o. En una prueba de
hiptesis con muestra.

FIGURA 9.18 HOJA DE CALCULO DE EXCEL PARA LA PRUEBA DE HIPTESIS DE LA


PELOTA DE GOLF SUPERFLIGHT.
Grandes donde supone que se conoce o, el valor de o se puede introducir directamente en la celda D8
porque no se necesita ningn clculo. Por ultimo, en el estudio de la pelota de golf Superflight fue
necesaria una prueba de hiptesis bilateral. La formula de la celda D10 =DISTR NORM ESTAND(D9)
da el valor de p cuando la regin de rechazo esta en el extremo inferior y la formula de la celda
D10=DISTR NORM ESTAND(9) da el valor de p cuando la regin de rechazo esta en el extremo
superior.

Casos de muestras pequeas

Las evaluaciones que 12 viajeros dieron al aeropuerto Heathrow se listaron en la seccin 9.5. Los datos
se introdujeron en una hoja de clculo de Excel con el rotulo Evaluacin en la celda A1 y las 12
evaluaciones en las celdas A2:A13. El nivel de significancia para la prueba es =0.05 y la desviacin
estndar de la poblacin, , se estima mediante la desviacin estndar muestral s. Con el diseo de hoja
de calculo que se muestra en la figura 9.18, se pueden usar los pasos siguientes para probar las
hiptesis Ho : 7 y Ha : 7.
Paso 1. Teclee 7 en la celda D2
Paso 2. Calcule el tamao de la muestra en la celda D6.

=CONTAR(A2:A13)

Paso 3. Calcule la media muestral en la celda D7.

=PROMEDIO(A2:A13)

Paso 4. Calcule la desviacin estndar de la muestra en la celda D8

=DESVEST(A2:A13)

Paso 5. Calcule la estadstica de prueba en la celda D9


=(D7-D2)/(RAIZ(D6))

Paso 6. Calcule el valor p en la celda d10

=SI(D90,DISTR T(D9,D6-1,1), 1-DISTR T(ABS(D9), D6-1,1))

La celda D9 contiene la formula para el estadstico de prueba

La celda D10 contiene la formula para calcular el valor p, que es el rea del
extremo superior de la distribucin t asociada con el estadstico de prueba t. Esta
formula es relativamente compleja porque la expresin para calcular el valor p
depende de si el estadstico de prueba de la celda D9 es positiva o negativa.
En el estudio del aeropuerto de Heathrow se utilizo la desviacin estndar
muestral s para estimar la desviacin estndar de la poblacin, 0. En una prueba
de hiptesis con muestras pequeas donde se supone que se conoce a, el valor de o se puede introducir
directamente en la celda D8 porque no se necesita ningn calculo. En este caso, el estadstico de prueba
z y su valor asociado p se calculan por medio de la funcin DISTR NORM ESTAND en la forma como
se describi para el caso de muestras grandes.
Por ultimo, el estudio para muestras pequeas del aeropuerto Heathrow requiri una prueba de
hiptesis unilateral y una regin de rechazo en el extremo superior. Sin embargo, este procedimiento se
puede modificar fcilmente para otras pruebas de hiptesis. Por ejem. La formula de la celda D10
=SI(D90,1-DISTR T (D9,D6-1,1),1-DISTR T (ABS(D9,D6-1,1)) da el valor de p cuando la regin de
rechazo esta en el extremo inferior y la formula de la celda D10=DISTR T(ABS(D9)D6-1,2)) da el
valor de p para una prueba bilateral.

TABLA 10.1 DATOS DE CALIFICACIONES EN EL EXAMEN

Centro de adiestramiento A Centro de adiestramiento B

97 83 91 64 66 91 84
90 84 87 85 83 78 85
94 76 73 72 74 87 85
79 82 92 64 70 93 84
78 85 64 74 82 89 59
87 85 74 93 82 79 62
83 91 88 70 75 84 91
89 72 88 79 78 65 83
76 86 74 79 99 78 80
84 70 73 75 57 66 76

TABLA 10.3 TIEMPOS DE TERMINACIN Y ESTADSTICOS DEL ESTUDIO DE PRUEBA


DEL PROGRAMA
Tecnologa actual Nuevo programa de computo

300 276
280 222
344 310
385 338
372 200
360 302
288 317
321 260
376 320
290 312
301 334
283 265
Resumen estadstico
Tamao n1=12 n2=12
Media de la muestra x1=325 x2=288
Desviacin estndar de la muestra s1=40 s2=44

10.3 Inferencias acerca de la diferencia entre las medias de dos poblaciones muestras

TABLA 10.4 TIEMPOS DE TERMINACIN DE LA TAREA PARA UN DISEO CON


MUESTRA PAREADA
Tiempo de terminacin Tiempo de terminacin Diferencia en
Con el mtodo 1 con el mtodo 2 tiempos de
Trabajador (minutos) (minutos) terminacin (d
1 6.0 5.4 0.6
2 5.0 5.2 -0.2
3 7.0 6.5 0.5
4 6.2 5.9 0.3
5 6.0 6.0 0.0
6 6.4 5.8 0.6

Muestras pareadas

Utilizamos los datos de los tiempos de produccin de la tabla 10.4 para ilustrar el procedimiento de
muestras pareadas o por pares.

En la columna C1 se escriben los tiempos de terminacin para el mtodo 1 y en la columna C2 los que
corresponden al mtodo 2. Los pasos de Minitab para la prueba de hiptesis de muestras por pares son
los siguientes:
Paso 1. Seleccione el men desplegable Stat
Paso 2. Seleccione Basic Statistics
Paso 3. Seleccione Paired t
Paso 4. Cuando aparezca el cuadro de dialogo Paired t:
Teclee C1 en el cuadro First sample
Teclee C2 en el cuadro Second Sample
Elija Optiones
Paso 5.Escriba 95 en Confidence level
Escriba 0 en el cuadro Test Mean
Escriba diferente de en el cuadro Alternative
De clic en OK
Paso 6. Seleccione OK

Apndice 10.2 DOS MEDIAS POBLACIONES CON EXCEL


Describiremos como usar Excel para tres pruebas de hiptesis acerca de la diferencia entre las medias
de dos poblaciones.

Caso de muestras grande


Utilizaremos las puntuaciones de exmenes de la tabla 10.1. En la celda A1 se coloca el rotulo Centro
A y en la celda B1 el rotulo Centro B. Las puntuaciones del centro A estn en las celdas A2:A31 y las
que correspondencia al centro B estn en las celdas B2:B41. Supondremos que para calcular las
varianzas de las poblaciones se utilizo la funcin VAR. As que usaremos s 12 = (8)2 = 64 y s22 = (10)2 =
100. Los pasos para llevar a cabo la prueba son los siguientes:

Paso 1. Seleccione el men desplegable Herramientas (Tools)


Paso 2. Seleccione Anlisis de datos (Data Analysis)
Paso 3. Cuando aparezca el cuadro de dialogo Anlisis de datos (Data Anlisis)
Seleccione Prueba z para medias de dos muestras (z-Test:Two Sample for Means)
Oprima Aceptar (OK)
Paso 4. Cuando Aparezca el cuadro Prueba z para medidas de dos muestras (z-Test:Two Sample for
Means):

Teclee A1:A31 en el cuadro rango para la variable 1 ( Variable 1Range)


Teclee B1:B41 en el cuadro tango para la variable 2 (Variable 2 Range)
Teclee 0 en el lugar Diferencia Hipottica entre las medias (Hypothesized Mean Difference)
Teclee 64 en el cuadro Varianza para la Variable 1 (Variable 1 Range)
Teclee 100 en el cuadro varianza para la variable 2 (Variable 2 Range)
Seleccione Rtulos (Labels)
Teclee 0.05 en el lugar alfa (cs valor por omisin)(Alpha)
Seleccione Rango de salida y teclear C1 en el cuadro (Output Range ) Oprima Aceptar (OK)

En la celda D8 aparece el valor del estadstico de prueba z=2.09. El valor p bilateral, 0.0366, aparece
en la celda D11 con el nombre valor critico z (dos colas).

Caso de muestras pequeas

Usaremos los datos del estudio de prueba de software de la tabla 10.3. Los datos se introdujeron en una
hoja de calculo de Excel con el rotulo Actual en la celda A1 y el rotulo Nuevo en la celda B1. Los
tiempos de terminacin para la tecnologa actual estn en las celdas A2:A13, y los tiempos de
terminacin para el software nuevo estn en las celdas B2:B13.Con los pasos siguientes se puede llevar
a cabo la prueba de hiptesis de muestras pequeas acerca de la diferencia entre dos medias
poblacionales:
Paso 1. Seleccione el men desplegable Herramientas (Tools)
Paso 2. Seleccione Anlisis de datos (Data Analysis)
Paso 3. Cuando aparezca el cuadro de dialogo Anlisis de datos (Data Analysis)
Seleccione Prueba z para medias de dos muestras (z-Test:Two Sample for Means)
Seleccione prueba t para dos muestras suponiendo varianza iguales:
Paso 4: Cuando aparece el cuadro de dilogo Prueba t para dos muestras suponiendo varianzas iguales:
Teclee A1:A31 en el cuadro rango para la variable 1 ( Variable 1Range)
Teclee B1:B41 en el cuadro tango para la variable 2 (Variable 2 Range)
Teclee 0 en el lugar Diferencia Hipottica entre las medias (Hypothesized Mean Difference)
Seleccione Rtulos (Labels)
Teclee 0.05 en el lugar alfa
Seleccione Rango de salida y teclear C1 en el cuadro (Output Range ) Oprima Aceptar (OK)
El valor del estadstico de prueba t=2.16 aparece en la celda D10, y el valor p unilateral 0.021 aparece
en la celda D11.

Muestras pareadas

Para ejemplificar se utilizan los tiempos de terminacin de muestras pareadas de la tabla 10.4.Los datos
se escriben en una hoja de calculo con el rotulo Mtodo 1 en la celda A1 y el rotulo Mtodo 2 en la
celda B1. En las celdas A2:A7 estn los tiempos de terminacin para el mtodo 1 y los que
corresponden al mtodo 2 estn en las celdas B2:B7. El procedimiento de Excel utiliza los pasos antes
descritos para el caso de muestras pequeas, excepto que en el paso 3 el usuario elige la Prueba t para
medias de dos muestras emparejas en anlisis de datos del men herramientas. El rango de la variable 1
es A1:A7 y el rango de la variable 2 es B1:B7. El valor de la estadstica de prueba t=2.196 aparece en
la celda D10 y el valor bilateral p=0.08 aparece en la celda D13.

QUALITY ASSOCIATES, INC.


Esta empresa es una consultora que aconseja a sus clientes sobre los procedimientos estadsticos y de
muestreo que puedan usar para controlar sus procesos de manufactura. En cierto caso, un cliente les
proporciono una muestra de 800 observaciones tomadas mientras su proceso trabajaba en forma
satisfactoria. La desviacin estndar de la muestra con esas caractersticas fui de 0.21 y, en
consecuencia, se supuso que la desviacin estndar poblacional era de 0.21. Quality Associates sugiri
tomar entonces muestras aleatorias de tamao 30 para vigilar el proceso en forma continua. Al analizar
sus muestras, el cliente pudo ver rpidamente si su proceso trabajaba en forma satisfactoria. Cuando no
sucede asi, se pueden emprender acciones correctivas para eliminar el problema. La especificacin de
diseo indic que la media del proceso debe ser 12. La prueba de hiptesis que sugiri Quality Asciate
fue:

H0 : = 12
Ha : 12

Se debe de emprender una accin correctiva siempre que H0 sea rechazada.


Las muestras siguientes fueron tomadas con intervalos de una hora, durante el primer da de operacin
con el nuevo procedimiento de control estadstico del proceso. Estas datos estn disponibles en el
conjunto de datos de Quality:

MUESTRA 1 MUESTRA 2 MUESTRA 3 MUESTRA 4

11.55 11.62 11.91 12.02


11.62 11.69 11.36 12.02
11.52 11.59 11.75 12.05
11.75 11.82 11.95 12.18
11.90 11.97 12.14 12.11
11.64 11.71 11.72 12.07
11.80 11.87 11.61 12.05
12.03 12.10 11.85 11.64
11.94 12.01 12.16 12.39
11.92 11.99 11.91 11.65
12.13 12.20 12.12 12.11
12.09 12.16 11.61 11.90
11.93 12.00 12.21 12.23
12.21 12.28 11.56 11.88
12.32 12.39 11.95 12.03
11.93 12.00 12.01 12.35
11.85 11.92 12.06 12.09
11.76 11.83 12.76 11.77
12.16 12.23 11.82 12.20
11.77 11.84 12.12 11.79
12.00 12.07 11.60 12.30
12.04 12.11 11.95 12.27
11.98 12.05 11.96 12.29
12.30 12.37 12.22 12.47
12.18 12.25 11.75 12.03
11.97 12.04 11.96 12.17
12.17 12.24 11.95 11.94
11.85 11.92 11.89 11.97
12.30 12.37 11.88 12.23
12.15 12.22 11.93 12.25

Informe Gerencial
1. Efectu la prueba de hiptesis para cada muestra, al nivel de significancia de 0.01, y determine
que accin, si es el caso, se debe tomar. Presente el estadstico y el valor p para cada prueba.
2. Calcule la desviacin estndar de cada una de las 4 muestras. Parece razonable la hiptesis de
0.21 para la desviacin estndar de la poblacin?
3. Calcule los limites de la media x alrededor de = 12 tales que, mientras una media de la
muestra este dentro de ellos, se considera que el proceso funciona en forma satisfactoria. Si x es
mayor que el limite superior, o menor que el limite inferior, se debe emprender una accin
correctiva. Esos lmites se llaman lmite superior e inferior de control, para fines de control de
calidad.
4. Describa las implicaciones de cambiar el nivel de significacia a un valor mayor. Qu error
podra aumentar si se hiciera eso?

Cada mes la oficina estadounidense de estadstica laboral publica diversas estadsticas acerca del
desempleo, como el nmero de individuos sin trabajo y el tiempo promedio que han estado
desempleados. Para el mes de noviembre de 1998, la oficina informo que el tiempo promedio de
desempleo fue de 14.6 semanas.

El alcance de Filadelfia solicito en estudio sobre el estado del desempleo en esa rea. Una muestra de
50 residentes de Filadelfia desempleados contena datos acerca de la edad y nume4ro de semana sin
trabajo. A continuacin se muestra una parte de lo datos reunidos en noviembre de 1998. El conjunto
complejo de datos se encuentra en el archivo electrnico.

Edad Semana Edad Semana


56 22 25 5
35 19 40 20
22 7 25 12
57 37 25 1
40 18 59 33
22 11 49 26
48 6 33 13
48 22

Informe Gerencial

1. Resuma los datos de estadstica descriptiva.


2. Construya un intervalo de confianza de 95% de la edad promedio de los individuos de
sempleados en Filadelfia.
3. Lleve a cabo una prueba de hiptesis para determinar si la duracin promedio de desempleo en
Filadelfia es mayor que la duracin media nacional de 14.6 semanas. Utilic un nivel de
significancia de 0.01. Cul es su conclusin?
4. Existe alguna relacin entre la edad de un individuo desempleado y el nmero de semanas
desempleo? Explique su respuesta.

Apndice 11.2 VARIANZA POBLACIONAL CON EXCEL


Describimos como usar Excel para calcular los valores de p para el estadstico de prueba cuadra y el
estadstico de prueba F. Estos valores p se pueden usar en pruebas de hiptesis
Acerca de la varianza de una poblacin o para las varianzas de dos poblaciones.

UNA POBLACION

Utilizaremos los datos del ejemplo de Autobuses urbanos de la seccin 11.1. La hora de calculo
de Excel tiene el rotulo Tiempo en la celda A1 y los 10 tiempos de llegada en las Celdas A2 a A11. La
prueba de hiptesis es H0 = 2 4 y Ha :2 d 4. La forma ms fcil de usar Excel para esta prueba de
hiptesis es elaborar su propia hoja de clculo y usar el valor p para obtener la conclusin. La hoja de
clculo que construimos se muestra en la figura 11.6. Las entradas de las celdas son como se describen
a continuacin

Paso 1. Teclee 4 en la celda D2


Paso 2. Teclee el tamao de muestra en la celda D6
=CONTAR (A2:A11)

Paso 3. Calcule la varianza muestral en la celda D7

=VAR(A2:A11)

Paso 4. Calcule el estadstico de prueba en la celda D8

=(D6-1)*D7/D2

Paso 5. Calcule el valor p en la celda D9

=DISTR.CHI(D8,D6-1)

FIGURA 11.6

Apndice 11.2 Varianza poblacional con Excel.


La celda D8 contiene la formula para calcular el estadstico de prueba.

La celda D9 contiene la formula para calcular el valor p, que es la rea del


extremo superior basado en el valor del estadstico de prueba
Si la prueba de hiptesis hubiera sido una prueba unilateral con la regin de
rechazo en el extremo inferior, en la celda D9 se habra usado = 1 CHIDIST(D8,D6-1). Una prueba
Bilateral requiere de celda del valor p= IF(CHIDIST(D8,D6-6)0.5,2*(CHIDIST(D8,D6-1)),2*(1-
CHIDIST(D8, D6-1)))

DOS POBLACIONES

Utilizaremos los datos del estudio del autobs escolar de la seccin 11.2 La hoja de calculo de Excel
tiene el rotulo Transporte rpidos en la celda A1 el rotulo Transporte eficaces en la celda B1. Los
tiempos para la muestra de Transportes Rpidos estn en las celdas A2:A26 y lo tiempos para la
muestra de transporte eficaces estn en las celdas B2:B17. Los pasos para llevar a cabo la prueba de
hiptesis Ho : 21 = 22 y Ha : 21 022 son como sigue:

Paso 1. Seleccione el men desplegable Herramientas (tools)


Paso 2. Elija Data Anlisis
Paso 3. Cuando aparezca el cuadro de dialogo Anlisis de Datos (Data Anlisis):
Elija F-Test Two-Sample for Variances (Prueba F para Varianza de dos muestras)
De clic en Aceptar (OK)
Paso 4. Cuando aparezca el cuadro de dialogo Prueba F para varianza de dos muestras:
Teclee A1:A26 en el cuadro Tango para la variable 1(Variable 1 Range)
Teclee B1:B17 en el cuadro Rango para variable 2 (Variable 2 Range)
Seleccione Rtulos (Labels)
Teclee 0.05 en el cuadro Alfa (Alpha)
(Nota: en este procedimiento de Excel se utiliza alfa como el rea de un Extremo)

Seleccione Rango de salida (Output Range) y teclee C1 en el cuadro


De clic en Aceptar (OK)

El resultado P(F f) = 0.041 es el rea unilateral asociada con el estadstico de prueba F= 2.40. Por
tanto, el valor p bilateral es 2(0.041) = 0.082. Si la prueba de hiptesis hubiera sido una prueba
unilateral, el rea de la celda marcada como P(F f) proporciona la informacin necesaria para
determinar el valor p para la prueba.

Caso a resolver PROGRAMA DE ADIESTRAMIENTO DE LA FUERZA AEREA

Un curso elemental de electrnica en la Fuerza area emplea un sistema personalizado de


adiestramiento en el cal cada alumno ve una clase videograbada y, posteriormente, se le da un texto
terminado el adiestramiento y haber pasado un examen. Es preocupante la variacin en la rapidez con
la que terminan los alumnos esta parte de su programa de adiestramiento. Algunos pueden terminar el
texto programado con relativa rapidez, mientras que otros tardan mucho ms y requieren tiempo
adicional de curso. Los alumnos rpidos esperan hasta que los lentos terminen el curso elemental, para
que todo el grupo pase a adiestrase en otros aspectos.
Un sistema alternativo propuesto implica el uso de enseanza asistida por computadora. En ese mtodo,
todos los alumnos ven la misma clase videograbada y, despus, a cada uno se le asigna una terminal de
computo para continuar el adiestramiento. La computadora gua al alumno, que trabaja en forma
independiente, en el referente a la parte autodidacta.
Para comparar los mtodos propuestos y actual de adiestramiento, en un grupo nuevo de 122 alumnos
se asigno al azar uno de los dos mtodos. Un grupo de 61 alumnos uso el mtodo actual de texto
programado, y el estudio se anoto el tiempo, en horas, para alumno y se obtuvieron los siguientes datos.

**************************

INFORME GERENCIAL

1. Aplique los estadsticos adecuados para sintetizar los datos de tiempo de adiestramiento para
cada mtodo. Qu semejanzas y/o diferencias observa en los datos de la muestra?
2. Aplique los mtodos del capitulo 10 para hacer comentarios acerca de alguna diferencia entre
las medias de poblacin para los dos mtodos. Comente sus resultados.
3. Calcule la desviacin estndar y la varianza de cada mtodo de adiestramiento. Realice una
prueba de hiptesis acerca de la igualdad de varianza poblacionales para los dos mtodos de
adiestramiento. Describa sus resultados.
4. A que conclusin llegara respecto alas diferencias entre los dos mtodos? Cul es su
recomendacin? Explique sus propuestas.
5. Puede sugerir otros datos u otras pruebas que seria convenientes para tomar una decisin final
referentes al programa de adiestramiento que se debe usar en el futuro?

Apndice 14.4 ANALISIS DE REGRESIN CON EXCEL

En este apndice ilustraremos como utilizar la herramienta de regresin de Excel para llevar a cabo los
clculos del anlisis de regresin para el problema de Pizzeras Armad. Consulte la figura 14.23 de la
pagina siguiente conforme se describen los pasos del caso. Los rtulos Restaurante, Poblacin y Ventas
se introdujeron en las celdas A1:C1 de la hoja de clculo. Para identificar cada una de las 10
observaciones se escribieron los nmeros del 1 al 10 en las celdas A2:A11. Los datos de la muestra se
teclearon en las celdas B2:C11.En los pasos siguientes se describe como usar Excel para obtener los
resultados de la regresin.

Paso 1. Seleccione el men desplegable Herramientas (Tools)


Paso 2. Elija Anlisis de datos (Data Analysis)
Paso 3. Selecciones Regresin (Regresin) de la lista de Herramientas de anlisis
Paso 4. Elija Aceptar(OK)
Paso 5. Cuando aparezca el cuadro de dialogo Regresin:
Teclee C1:C11 en el cuadro Rango Y de entrada (Imput Y Range)
Teclee B1: B11 en el cuadro Rango X de Entrada (Imput Y Range)
Seleccione Rtulos (Labels)
Selecciones Nivel de confianza (Confidence Level)
Seleccione Rango de salida (Output Range)
Teclee 99 en el cuadro Nivel de confianza
Seleccione Rango de salida (output Range)
Teclee A13 en el cuadro Rango de salida
(Cualquier celda de la esquina superior izquierda que indique donde se va a empezar la salida se
podra introducir aqu)
De clic en Aceptar(OK)

La primera seccin de la salida, titulada estadstica de regresin, contiene las estadsticas del
resumen como el coeficiente de determinacin (R cuadrada). La segunda seccin de la salida, la
cual no tiene titulo, contiene los coeficientes de regresin estimados e informacin relacionada.
Comenzaremos nuestro anlisis con la interpretacin de la salida de regresin con la
informacin contenida en las celdas A28:I30.

FIGURA 14.23 HOJA DE CALCULO DE EXCEL, CON LA SOLUCION DEL PROBLEMA DE


PIZZERA ARMAND.

*********************
INTERPRETACIN DEL RESULTADO DE LA ECUACIN DE REGRESIN ESTIMADA.

La ordenada al origen (y) de la tecla de regresin estimada, b 0 =60, se muestra en la celda B29, y la
pendiente de la recta de regresin estimada, B1 =5, se observa en la celda B30. El rotulo Ordenada al
origen en la celda A29 y el rotulo Poblacin en la celda A30 se cumplen para identificar estos dos
valores.

En la seccin 14.5 mostramos que la desviacin estndar estimada de b1 es sb1 = 0.5803.


Observe que el valor en la celda C30 es 0.5803. El rotulo error estndar en la celda C28 es la manera de
Excel para indicar que el valor en la celda C30 es el error estndar, o la desviacin estndar de b 1 .
Recuerde que en la prueba t para una relacin significa se requiere calcular el estadstico de prueba t,t =
b1 /sb1 . Para los datos de Pizzera Armand, el valor t que calculamos fue t= 5/0.5803 =8.62. El rotulo de
la celda D28,t Stat, nos recuerda que la celda D30 contiene el valor del estadstico de prueba t.
En la seccin 14.5 mostramos tambin que para un nivel de significanca de = 0.01 y n- 2 =10-2=8
grados de libertad, t0.005 = 3.355. Con t= 8.623.355, podemos concluir con un nivel de significancia de
0.01 que B1 no es igual a 0. En otras palabras, la evidencia estadstica es suficiente para concluir que
tenemos una relacin significativa entre la poblacin de estudiantes y las ventanas. El valor en la celda
E30 por medio de la notacin cientfica. Para obtener el valor decimal, movemos el punto decimal
cinco lugares a la izquierda, con lo cual se obtiene un valor de 0.0000255. Debido a que el valor p=
0.0000255 = 0.01, rechazamos H0 y concluimos que tenemos una relacin significativa entre la
poblacin de estudiantes y las ventas trimestrales.

La informacin de las celdas F28:I30 se emplean para construir estimaciones de los intervalos de
confianza de la ordenada al origen (y) y la pendiente de la ecuacin de regresin estimada. Mediante
Excel siempre se obtiene los lmites superiores e inferiores para un intervalo de confianza de 95%.
Recuerde que en el paso 4 seleccionamos Nivel de confianza y se tecleo 99 en el cuadro Nivel de
confianza. Como resultado, la herramienta de regresin de Excel tambin proporciona los limites
superior e inferior para un intervalo de confianza de 99% El calor de la celda H30 es el limite inferior
para la estimacin del intercalo de confianza de 99% de B 1 y el valor de la celda I30 es el limite
superior. Por tanto, despus de redondear, la estimacin del intervalo de confianza de 99% de B 1 es
3.05 a 6.95. Los valores de las celdas F30 y G30 proporcionan los lmites superior e inferior para el
intervalo de confianza de 95%. As, el intervalo de confianza de 95% es 3.66 a 6.34.
INTERPRETACIN DEL RESULTADO DE ANOVA

La informacin de las celdas A22:F26 es un resumen del anlisis de datos de los clculos de varianza.
Las tres fuentes de variacin se rotulan como regresin, residual y total. El rotulo df en la celda B23
representa los grados de libertad, el rotulo SS en la celda C23 indica la suma de cuadros y el rotulo MS
en la celda D23 significa el cuadrado de la media.
En la seccin 14.5 se enuncio que el error cuadrado medio, obtenido al dividir el error cuadrado medio,
obtenido al dividir el error o la suma residual de cuadrados entre sus grados de libertad, proporcional
una estimacin de 2 . El valor de la celda D25, 191.25, es el error cuadrado medio para el resultado de
la regresin de Pizzeras Armand. En la seccin 14.5 se mostr que se poda usar una prueba f para la
significancia de la regresin. El valor de la celda F24, 0.0000255, es el valor de p asociado con la
prueba f para la significancia. Debido a que el valor p = 0.0000255 = 0.01, se rechaza H0 y se
concluye que hay una relacin significativa entre la poblacin de estudiantes y las ventas trimestrales.
El rotulo que utiliza Excel para identificar el valor p para la prueba de significancia F, mostrado en la
celda F23, es valor crtico de F.

INTERPRETANCION DEL RESULTADO DE LAS ESTADSTICAS DE REGRESIN.

El coeficiente de determinacin, 0.9027, aparece en la celda B17; el rotulo correspondiente, R


cuadrada, se muestra en la celda A17. La raz cuadrada del coeficiente de determinacin proporciona el
coeficiente de correlacin muestral de 0.9501 mostrado en la celda B16. Observe que Excel utiliza el
rotulo R mltiple (Celda A16 para identificar este valor. En la celda A19, se utiliza el rotulo error
estndar par identificar el valor del error estndar de la estimacin mostrada en la celda B19. Por
consiguiente, el error estndar de la estimacin es 13.8293. Se advierte al lector que no olvide que, en
el resultado de Excel, el rotulo error estndar aparece en dos lugares distintos. En la seccin Estadstica
de regresin del resultado, el rotulo error estndar se refiere a la estimacin de 0. En la seccin del
resultado ecuacin de regresin estimada, el rotulo error estndar se refiere a s b1, la desviacin estndar
de la distribucin de muestreo de b1.

CASO A RESOLVER DEPARTAMENTO DE TRANSPORTE DE ESTADOS UNIDOS

Como parte de un estudio sobre la seguridad en el transporte, el Departamento de transporte en ese pas
reuni datos sobre la cantidad de accidentes fatales por cada 1000 licencias de conducir y el porcentaje
de los conductores con licencia menor de 21 aos, en una muestra de 42 ciudades. A continuacin
vemos esos datos, recopilacin durante un periodo de un ao.

Porcentaje Accidentes fatales Porcentaje Accidentes fatales


Menor de 21 aos por 1000 licencias menor de 21 aos por 1000 licencias

13 2.962 17 4.100
12 0.708 8 2.190
8 0.885 16 3.623
12 1.652 15 0.835
11 2.091 9 0.820
17 2.627 8 2.890
18 3.830 14 1.267
8 0.368 8 3.224
13 1.142 15 1.014
8 0.645 10 0.493
9 1.028 10 1.443
16 2.801 14 1.443
12 1.405 18 3.614
9 1.433 10 1.926
10 0.039 14 1.643
9 0.338 16 2.943
11 1.849 12 1.913
12 2.246 15 2.814
14 2.855 13 2.634
14 2.352 9 0.926
11 1.294 17 3.256

INFORME GERENCIAL

1. Elabore resmenes numricos y grficos para estos datos.


2. Aplique el anlisis de regresin para investigar la relacin entre la cantidad de accidentes fatales
y el porcentaje de conductores menores de 21 aos. Comente sus resultados.
3. Qu conclusin y/o recomendaciones puede ofrecer de su anlisis?

CASO A RESOLVER 3 DONACIONES DE LOS ALUMNOS

Estas contribuciones son una fuente importante de ingresos para los colegios y universidades. Si los
administradores pudieran determinar los factores que afectan los incrementos en el porcentaje de
alumnos que hacen una donacin, estaran en la posibilidad de poner en prctica polticas que lograran
incrementar los ingresos. En la investigacin se observa que los estudiantes que estn ms satisfechos
con su relacin con los maestros tienen ms probabilidades de graduarse. Como resultados, se podra
esperar que, mientras mas pequeos sea el grupo y menores las relaciones estudiante-facultad, el
resultado seria un mayor porcentaje de graduados satisfechos, que a su vez dara lugar a incrementos en
el porcentaje de alumnos que hacen una donacin. En la tabla 14.15 de la pagina siguiente se muestran
los datos para 48 universidades estadounidenses (Americas Best Colleges, edicin ao 2000). La
columna marcada como % de grupos con menos de 20 muestras el porcentaje de grupos que tienen
menos de 20 estudiantes. La columna marcada como relacin estudiante / facultad es la cantidad de
estudiantes inscritos dividida entre el numero total de la facultad. Por ultimo, la columna marcada
como Tasa de donacin es el porcentaje de alumnos que hacen una donacin a la universidad.

INFORME GERENCIAL

1. Elabore resmenes numricos y grficos de los datos.


2. Por medio del anlisis de regresin obtenga una ecuacin de regresin estimada que permita
predecir la tasa de donacin dado el porcentaje de grupos con menos de 20 alumnos.
3. Utilice el anlisis de regresin para obtener una ecuacin estimada de regresin que permita
predecir la tasa de donacin dada la relacin estudiante- facultad.
4. Cul de las dos ecuaciones de regresin estimados proporciona el mejor ajuste? para esta
ecuacin estimada de regresin efectu un anlisis de los residuos y explique sus hallazgos y
conclusiones.
5. Qu conclusiones y recomendaciones puede deducir de su anlisis?

TABLA 14.15 DATOS PARA 48 UNIVERSIDADES ESTADOUNIDENSES

Proporcin
%de grupos con Relacin alumnos que hacen
Menos de 20 Estudiante/Facultad una donacin

Boston College 39 13 25
Brandres University 68 8 33
Brown University 60 8 40
California Institute of Technology 65 3 46
Carnegie Mellori University 67 10 28
Case Western Reserve Univ. 52 8 31
College of William and Mary 45 12 27
Columbia University 69 7 31
Cornell University 72 13 35
Datmounth College 61 10 53
Duke University 68 8 45
Emory University 65 7 37
George Town University 54 10 29
Harvard University 73 8 46
Johns Hopkins University 64 9 27
Lehigh University 55 11 40
Massachusett Ins. Of Technololy 65 6 44
New York University 63 13 13
North Western University 66 8 30
Pennsylvania State Univ. 32 19 21
Princeton University 68 5 67
Rice University 62 8 40
Stanford University 69 7 34
Tufts University 67 9 29
Tulane University 56 12 17
U. of California Berkeley 58 17 18
U. of California Davis 32 19 7
U. of California Irvine 42 20 9
U. of California Los ngeles 41 18 13
U. of California San Diego 48 19 8
U. of California Santa Barbara 45 20 12
U. of Chicago 65 4 36
U. of Florida 31 23 19
U. of Illinois Urbana Champaign 29 15 23
U. of Michigan Ann Arbor 51 15 13
U. of North California Chapel Hill 40 16 26
U. of Notre Dame 53 13 49
U. of Pennsylvania 65 7 41
U. of Rochester 63 10 23
U. of Southem California 53 13 22
U. of Texas Austin 39 21 13
U. of Virginia 44 13 28
U. of Washington 37 12 12
U. of Wisconsin Madison 37 13 13
Vanderbilt University 68 9 31
Wake Forest University 59 11 38
Washington University St. Louis 73 7 33
Yale University 77 7 50

Tomado de Estadstica para Administracin y Economa


Anderson, Sweeney, Williams
Editorial Thomson

Das könnte Ihnen auch gefallen