Sie sind auf Seite 1von 43

Estadstica

en las Organizaciones Ing. Blanca Morales


RESPUESTAS A LOS EJERCICIOS DE TAREA DE LOS CAPITULOS 12,


13 y 14
Consulte la siguiente gua de respuestas a las preguntas hechas en
la tarea y compare las respuestas dadas por usted a manera de auto
retroalimentacin para su aprendizaje. Este ejercicio es solo de
retroalimentacin, NO SE ENVA NI SE PUEDE ENTREGAR COMO
SOLUCIN A SU TAREA.
Tarea F

Captulo 12

Problema 1

Cierta empresa piensa que el tipo de campaa influye en la zona del pas, ya que la empresa
indica que unas son ms agresivas que otras. Para probar lo anterior se obtuvo la
preferencia segn la zona, lo anterior se muestra a continuacin:


Usando un nivel de significancia del 2.5%, se le pide que sustente sus respuestas en forma
estadstica para lo cual deber de contener lo siguiente:

a. Las hiptesis
b. El valor del estadstico de prueba
c. El valor que tom el p-valor
d. Decisin que se tom
e. Conclusin a la cual lleg

Para este problema, son necesarios los conocimientos adquiridos en la lectura del captulo 12
(punto 12.2) del libro de texto. Sus respuestas servirn para el punto 3.2 de la etapa 3 del proyecto
integrador
Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 1

Estadstica en las Organizaciones Ing. Blanca Morales

Respuesta:

En este caso, se tienen dos variables que son el tipo de campaa y la zona del pas; estas
dos variables sus niveles o valores que toman son Tipo A, Tipo B y Tipo C para campaa y
para la zona del pas son Norte, Sur, Este Oeste y Centro; entonces ambas variables son
cualitativas; adems se indica que se debe de probar que el tipo de campaa influye en la
zona del pas; esto indicara que las variables se encuentran relacionadas, es decir hay que
probar si las variables son o no independientes; esto sealara que es necesario realizar una
prueba de hiptesis de independencia; adems como dato adicional se da el nivel de
significancia o sea = 0.025

Otra forma de ver esto es que se da un conteo, es decir se tienen las frecuencias y se pide
probar si una variable influye en la otra, es decir si ambas variables estn relacionadas (o
sea son dependientes), por lo tanto, se trata de una prueba de independencia.

a. Las hiptesis
Las hiptesis para una prueba de independencia, sera en la nula que las variables son
independientes y en la alterna que no lo son, esto sera:
( :
; :
o bien:
; :

b. El valor del estadstico de prueba
Para el estadstico de prueba, el cual es la Ji-cuadrada), se necesita:
=
=
?@ ?@
=
?@
? @
La frecuencia o f fue dada, lo que sigue es encontrar la e, para esta es necesario
utilizar la siguiente frmula:


?@ =

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 2

Estadstica en las Organizaciones Ing. Blanca Morales

Lo anterior indica que es necesario encontrar los totales de las filas y de las
columnas, esto se muestra en la siguiente tabla:


Ahora bien, para calcular la frecuencia esperada o e, sera de la siguiente manera;
para la fila 1 (Norte) y columna 1 (Tipo A) sera:

1 1 460 781
F,F = = = 153.53
2,340

Para la fila 2 (Sur) y columna 1 (Tipo A) esto es:

2 1 480 781
=,F = = = 160.21
2,340

Fila 3 (Este) y columna 1 (Tipo A) esto es:

3 1 460 781
N,F = = = 153.53
2,340

El proceso contina hasta las ltima celdas o casillas, la cual sera fila 5 (Centro) y
columna 3 (Tipo C) la cual es:

5 3 480 777
O,N = = = 159.38
2,340

Los datos obtenidos de todas las frecuencias esperadas se muestran a continuacin


en la siguiente tabla:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 3

Estadstica en las Organizaciones Ing. Blanca Morales

Note que la suma de las columnas y de los renglones da el mismo valor en las
frecuencias esperadas y observadas. La siguiente tabla muestra ambas frecuencias
y de nuevo note que la suma de cada una, da el mismo valor; esto siempre debe
de coincidir:


Ahora se sustituye las frecuencias en la frmula de la Ji-cuadrada o bien se realiza
por tabla, la informacin de las frecuencias observadas (f) menos la esperada (e)
se muestra en la siguiente tabla:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 4

Estadstica en las Organizaciones Ing. Blanca Morales

Cada valor de la ltima columna que se obtuvo, se eleva al cuadrado; esto se ve en


la siguiente tabla:


Ahora cada valor de la ltima columna, se divide entre su valor esperado (e), estos
valores se muestran en la ltima columna de la siguiente tabla:


Note que se obtuvo el total o la suman de los valores de la ltima columna; por lo
que el estadstico de prueba, el cual es la Ji-Cuadrada toma el siguiente valor = =
5.471


Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 5

Estadstica en las Organizaciones Ing. Blanca Morales

c. Valor crtico
Como el estadstico proviene de valores cuadrados, el tipo de distribucin junto con
el nivel de confianza y significancia, seran:


Ahora para los grados de libertad, el nmero de renglones es 8 y el de columnas
tambin es 3, por lo que los grados de libertad seran:
. . = 1 1 = 5 1 3 1 = 8
Entonces, buscando en tablas, se tiene que buscar los 8 grados de libertad por el
lado izquierdo y por arriba el 0.025, se trazan dos lneas hasta encontrase estas y
as se obtiene el valor crtico, este se muestra en la siguiente figura:


Entonces el valor crtico sera:
= 17.535

d. Basndose en el valor crtico, decisin se tom y a qu conclusin se lleg
Para llegar a una decisin, es necesario usar el estadstico de prueba y compararlo
con el valor crtico, ya que la regla de decisin dice que para rechazar la hiptesis nula
es necesario que:
=
Como el estadstico de prueba tiene un valor de 5.471 y se compara para ver si es
mayor o menor al valor crtico, el cual es 17.535 por lo que:
5.471 < 17.535
Por lo que no se rechaza la hiptesis nula.
Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 6

Estadstica en las Organizaciones Ing. Blanca Morales


e. Basndose en el valor crtico, a qu conclusin se lleg
Al rechazar la hiptesis nula, se debe de concluir en base a lo que indica sta
hiptesis, la cual es:
( :
Concluyendo: con un 97.5% (cuyo valor sali de 1-0.025=0.975) de confianza, se tiene
evidencia estadstica para afirmar que no se rechaza la hiptesis nula y se puede
afirmar que los tipos de campaas no estn relacionados con las zonas del pas o bien
que la opinin de las zonas del pas es independiente del tipo de campaa, tambin
se puede afirmar que las opiniones del pas son independientes del tipo de campaa.

ESTOS SIGUIENTES INCISOS NO FUERON ENCARGADON EN LA TAREA, PERO FUERON


AGREGADOS POR SI DESEAS SOBER SOBRE COMO ENCONTRAR Y CONCLUIR CON EL P-
VALOR

f. El p-valor
Para el mtodo del p-valor, es necesario el estadstico de prueba Ji-Cuadrada, la cual
dio un valor de = = 5.471 y para buscar el p-valor, son necesario los grados de
libertad los cuales son:
. . = 1 1 = 5 1 3 1 = 8
Donde R es el nmero de renglones y C es el nmero de columnas que la tabla
cruzada tiene, pero sin contabilizar los totales: con los grados de libertad y el
estadstico de prueba se busca en la tabla de la Ji-cuadrada, nicamente utilizando
el rengln de 8 y buscando el 5.471, esto se muestra en la siguiente figura, donde
tambin se ve dnde posiblemente se encuentre el valor-P:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 7

Estadstica en las Organizaciones Ing. Blanca Morales

Note que el valor del estadstico de prueba = = 5.471 se encuentra entre 3.490 y
13.362, subiendo para encontrar las probabilidades; como lo indica la flechas que se
muestran a continuacin:


Entonces el valor-p oscilara entre:
0.10 < < 0.90
Ya que el valor-p sera el rea que la tabla muestra, es decir:


Segn la figura de la tabla y la anterior, la probabilidad dada sera el extremo
derecho, el cual corresponde al p-valor, pero para encontrar el verdadero valor se
utiliz el Excel o MiniTab, este corresponde a 0.7060

g. Decisin que se tom
La regla de decisin indica que para rechazar la hiptesis nula es necesario que el:

Entonces comparando ambos valores para saber si el 0. 7060 es mayor o menor que
el 0.025; se tiene que:
0.7060 > 0.025
Por lo que la decisin que se tom es que no se rechaza la hiptesis nula.

h. Conclusin a la cual lleg
Al no rechazar la nula, es necesario concluir en base a lo que indica sta, es decir en
basndose en la hiptesis nula, la cual es:
( :

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 8

Estadstica en las Organizaciones Ing. Blanca Morales

Concluyendo: con un 97.5% (cuyo valor sali de 1-0.025=0.975) de confianza, se tiene


evidencia estadstica para afirmar que no se rechaza la hiptesis nula y se puede
afirmar que los tipos de campaas no estn relacionados con las zonas del pas o bien
que la opinin de las zonas del pas es independiente del tipo de campaa, tambin
se puede afirmar que las opiniones del pas son independientes del tipo de campaa.
Como se ve, se lleg a la misma decisin.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 9

Estadstica en las Organizaciones Ing. Blanca Morales

Captulo 13

Problema 2

Para esta tarea, es necesario que entres a: Recursos de apoyo / Bases de datos para
resolver /Ch 13 Exp. Design / AirTraffic. Copie los datos en un archivo de Excel para que
realice el problema, el cual indica que en el Centro de Control Cleveland en Oberlin, Ohio,
se instalaron tres alternativas de estacin de trabajo, los cuales se llaman Sistema A, B y C.
Se seleccion en forma aleatoria a seis controladores y se le asign a cada individuo uno de
los sistemas para que lo operara. Despus de aplicar una entrevista y un examen mdico a
cada uno de los participantes en el estudio, se obtuvieron las mediciones del estrs de cada
controlador en cada uno de los sistemas; el nivel de estrs se muestra en la siguiente tabla.


El Centro de Control piensa que el nivel de estrs es diferente en alguno de los Sistemas; se
le pide que usando un nivel de significancia del 1%, pruebe lo anterior, base sus respuestas
en forma estadstica, que debern de contener lo siguiente:

a. Las hiptesis
b. El valor del estadstico de prueba
c. El valor crtico
d. Decisin que se tom
e. La conclusin a la cual lleg

Para este problema, son necesarios los conocimientos adquiridos en la lectura del captulo 13
(puntos 13.1, 13.2 y 13.3) del libro de texto y los Apndices del mismo. Sus respuestas servirn
para el punto 3.3 de la etapa 3 del proyecto integrador.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 10

Estadstica en las Organizaciones Ing. Blanca Morales

Respuesta:

Se tienen datos cuantitativos ya que son mediciones del estrs de cada controlador en cada
uno de los sistemas, adems se piden ver si las mediciones del estrs son diferentes; lo
anterior indicara que se debe de realizar una prueba de hiptesis de ms de dos medias (ya
que son 3 Sistemas instalados el A, B y C). Adems de lo anterior se indica que el nivel de
significancia es de = 0.01

a. Las hiptesis
Lo primero seran las hiptesis, como se tienen 3 Sistemas, la nula indicara que:
( F = = = N
Y la hiptesis alternativa sera:
; ?
Donde i= 1, 2 y 3

b. El valor del estadstico de prueba
Como se necesitan comparar ms de muestras cuantitativas, esto tiene que ser a
travs de sus promedios; por lo que para comparar ms de dos promedios sera a
travs del anlisis de varianza o ANOVA, pero para poder encontrar el estadstico de
prueba, es necesario calcular, medias, varianza, etc. y las tres variaciones, ahora se
obtendrn los primeros, pero para esto, es necesario calcular primero la media total
o la gran media, para esta son necesarios todos los datos, los cuales se muestra a
continuacin:


A continuacin, sera calcula la media total, la cual es:

15 + 14 + 10 + 13 + + 16 + 13
= = 14.00
18

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 11

Estadstica en las Organizaciones Ing. Blanca Morales

Como siguiente sera calcular la n, media y varianza de cada una de las tiendas, esto
se mostrar para una sola, pero el procedimiento se repite para los tres restantes;
se escogi la rama de Business:


Donde se tienen 6 datos, es decir nF = 6 y el promedio sera:

15 + 14 + 10 + 13 + 16 + 13 81
F = = = 13.50
6 6
La varianza de esta es:
=
15 13.5 + 14 13.5 = + + 13 13.5 =
F= = = 4.30
61
Una vez obtenido lo anterior se realiza lo mismo para las dems muestras
(tratamientos o ramas) de los sistemas, los resultados se muestran en la siguiente
tabla, donde tambin se le incluy la gran media (o la media total) y el nmero total
de datos (N) con los que se cuenta:


Esto tambin se puede resumir en la siguiente tabla que arroja el Excel a travs del
Anlisis de Datos:


Ahora se procede a encontrar las tres variaciones:
Variacin entre los tratamientos, en este caso sera entre columnas:
Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 12

Estadstica en las Organizaciones Ing. Blanca Morales

b
=
= @ @
@cF
Donde K es el nmero de muestras (o tratamientos o ramas de los sistemas como
en este caso), ya que la frmula indica con la j=1, que se debe de iniciar con la
primera rama, luego la segunda y as sucesivamente hasta llegar a los K tratamientos
o ramas como en este caso y que se debe de utilizas la n y el promedio, adems de
la media total; sustituyendo los datos en la frmula sera:
= 6 13.5 14 = + 6 13 14 = + 6 15.5 14 = = 21.0
Los grados de libertad se calculara con las 3 ramas:

. . = 1 = 3 1 = 2

Por ltimo el cuadrado medio debido a los tratamientos sera:


21.0
= = = 10.50
1 21
Variacin dentro de los tratamientos, en este caso sera dentro de las columnas:
b

= @ 1 @=
@cF
De nuevo, la K es el nmero de muestras (tratamientos o ramas de los sistemas
como en este caso), ya que la frmula indica con la j=1, que se debe de iniciar con la
primera rama, luego la segunda y as sucesivamente hasta llegar a los K tratamientos
o ramas y que la frmula indica que se debe de utilizas la n y la varianza;
sustituyendo los datos en la frmula sera:
= 6 1 4.3 + 6 1 2.0 + 6 1 3.5 = 49.0
Los grados de libertad se calculara con los 18 datos y las 3 ramas:

. . = g = 18 3 = 15

Por ltimo el cuadrado medio dentro de los tratamientos sera:


49.0
= = = 3.26667
g 18 3
La ltima de las variaciones, sera, la Variacin Total, en este caso es:
b hi
=
= ?@
@cF ?cF
Aqu la i=1 indica que se empieza con el primer dato del tratamiento 1 hasta la n
de este tratamiento para la j=1, la cual sera para la muestra 1; luego sigue la
segunda muestra y as sucesivamente ya que la frmula indica con la K que para

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 13

Estadstica en las Organizaciones Ing. Blanca Morales

cada una de las muestras (o ramas en este caso sistemas), se debe de utilizar cada
dato y el promedio total; sustituyendo los datos en la frmula sera:
= 15 14 = + 14 14 = + + 16 14 = + 13 14 =
Entonces la variacin total o suma de cuadrados totales sera:
= 70.0
Por ltimo, los grados de libertad se calculara con los 75 datos y las 4 zonas:

. . = g 1 = 18 1 = 17

En este caso, no se calcula el cuadrado medio. Otra forma de encontrar la suma de


cuadrados totales (o la Variacin Total) sera:
= +
Sustituyendo los valores seran:
= 21.0 + 49.0 = 70.0
Como se ve, da el mismo valor. Ahora, le sigue el estadstico de prueba sera la F la
cual es obtenida a travs de:
10.5
= = = 3.21428571
3.26667
La informacin anterior resumida en la tabla ANOVA, se muestra a continuacin:


La tabla anterior con frmulas se puede ser resumida de la siguiente manera:


Entonces el estadstico de prueba es:
F = 3.214

c. El valor crtico
El mtodo del valor crtico, se tiene que, el estadstico de prueba F el cual dio un
valor de F = 3.214, el nivel de significancia, el cual es = 0.01 y los grados de
libertad fueron:
Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 14

Estadstica en las Organizaciones Ing. Blanca Morales

. . 1 = 2 y . . 2 = 15
Entonces se busca el 2 (grados de libertad) por arriba y el 15 por la columna del lado
izquierdo, esto se muestra a continuacin:


Como siguiente, en la segunda columna del lado izquierdo, en donde se encuentra
el 15, se deber de escoger el nivel de significancia, el cual es 0.01. esto se muestra
en la siguiente figura:


Posterior a esto, se deben de trazar dos lneas hasta encontrar donde se cruzan y
este sera el valor crtico, lo cual se muestra a continuacin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 15

Estadstica en las Organizaciones Ing. Blanca Morales


Entonces el valor crtico sera:
= 6.359
La informacin obtenida en el Excel de la Tabla ANOVA que arroja el anlisis de
datos, se muestra a continuacin:


Note que es el mismo valor en el F crit que el valor crtico.

d. Decisin que se tom
En este punto, se pide se comparen ambos el valor crtico y el estadstico de prueba,
para hacer esto, es necesario recordar la regla de decisin para el valor crtico, se
sabe que para rechazar la hiptesis nula es necesario que:

Como el estadstico de prueba tiene un valor de 3.214 y se compara para ver si es
mayor o menor al valor crtico, el cual es 6.359 por lo que:
3.214 < 6.359
La decisin que se tom es que no se rechaza la hiptesis nula.

e. Conclusiones a la que lleg
Al no rechazar la hiptesis nula, se debe de concluir en base a lo que indica la
hiptesis nula, la cual es:

( F = = = N
Concluyendo, con un 99% de confianza, que se cuenta con evidencia estadstica
suficiente para afirmar que no se rechaza la hiptesis nula y se puede afirmar que

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 16

Estadstica en las Organizaciones Ing. Blanca Morales

en todos los Sistemas (A, B y C) se obtienen los mismos promedios; esto implicara
que no importa donde los operadores realicen su trabajo, ya que se obtiene el
mismo estrs promedio en cada uno de los tres sistemas.

ESTOS SIGUIENTES INCISOS NO FUERON ENCARGADON EN LA TAREA, PERO FUERON
AGREGADOS POR SI DESEAS SABER SOBRE COMO ENCONTRAR Y CONCLUIR CON EL
VALOR CRTICO

f. Muestre el valor-p
Para el p-valor, como se tiene una prueba de hiptesis donde el estadstico de
prueba procede de valores cuadrados, adems de que el nivel de significancia en
este problema es de 0.01, las reas que se tienen seran:


Como los grados de libertad en el estadstico F son 2, el primero del numerador y el
segundo del denominador los cuales fueron ya encontrados:
. . 1 = 2 y . . 2 = 15
Entonces, buscando en tabla F, se tiene que localizar los dos grados de libertad el 2
por arriba y el 15 por el lado izquierdo, esto se muestra a continuacin:


Y ahora solo es la columna donde se localiz el 2, se deber de buscar el estadstico
de prueba F = 3.214 pero solo en la columna que corresponde al 2 de ambos los
grados de libertad y limitarlo solo al 15 del segundo de los grados de libertad, es

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 17

Estadstica en las Organizaciones Ing. Blanca Morales

decir solo a los siguientes valores que se encuentran en restringidos en la siguiente


figura:


Se repite de nuevo, se deber de buscar el valor del estadstico de prueba que es
F = 3.214, note que el valor anterior, se encuentra entre 2.695 y 3.682 y ahora se
busca en la probabilidad, esto se muestra en la siguiente figura:


Note que la probabilidad en ambos valores son 0.10 y 0.050 y el valor-p a encontrar
sera la regin sombreada de la grfica de la tabla; ahora bien el p-valor en la F se
encuentra en en la siguiente regin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 18

Estadstica en las Organizaciones Ing. Blanca Morales

Segn la figura anterior y la tabla F, comparando ambas figuras; se puede decir que
ambas figuras corresponden; entonces el:
0.05 < < 0.10
Ahora bien, para encontrar el verdadero valor sera por medio del Excel, MiniTab o
Apndice F, el cual se mostrar a continuacin;


Recuerde borrar los valores Enter F , Numerator df y Denominator df ;
esto se ve en la siguiente figura:


Ahora en Enter F ponga el valor del estadstico de prueba, el cual es F = 3.214,
en Numerator df . . 1 = 2 y Denominator df . . 2 = 15; lo cual se
muestra en la siguiente figura:


Ahora como el valor-p se ve en la siguiente figura:


Lo anterior indicara que el p-valor es el que se encuentra en donde indica p-value
(Upper Tail) el cual es:
= 0.0689
Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 19

Estadstica en las Organizaciones Ing. Blanca Morales


g. Decisin que se tom
Lo siguiente sera ver el nivel de significancia que se pidi utilizar en este problema,
el cual es = 0.01 por ltimo, sera recordar la regla de decisin del valor-p, la cual
es, que para rechazar la hiptesis nula es necesario que el:

Entonces comparando ambos valores para saber si el 0.0689 es mayor o menor que
el 0.01; se tiene que:
0.0689 > 0.01
La decisin que se tom, es que no se rechaza la hiptesis nula

h. Conclusiones a la que se lleg
Al no rechazar la hiptesis nula, se debe de concluir en base a lo que indica la
hiptesis nula, la cual es:

( F = = = N
Concluyendo, con un 99% de confianza, que se cuenta con evidencia estadstica
suficiente para afirmar que no se rechaza la hiptesis nula y se puede afirmar que
en todos los Sistemas (A, B y C) se obtienen los mismos promedios; esto implicara
que no importa donde los operadores realicen su trabajo, ya que se obtiene el
mismo estrs promedio en cada uno de los tres sistemas.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 20

Estadstica en las Organizaciones Ing. Blanca Morales

Captulo 14

Problema 3
Para esta tarea, es necesario que entres a:

Recursos de apoyo / Bases de datos para hacer /Ch 15 Multiple Regression / FortuneBest. Copie
la base en un nuevo archivo de Excel, la base de datos trata sobre la revista Fortune, la cual publica
una lista anual con las mejores 100 empresas para trabajar. Los datos que se encuentran en el
archivo FortuneBest corresponden a una parte de una muestra aleatoria de 30 empresas incluidas
en la lista de 2012 (Fortune, 6 de febrero de 2012). La columna etiquetada como Rank muestra la
posicin que ocupa la empresa dentro de la lista Fortune100, la etiquetada como Size indica si la
empresa es pequea, mediana o grande; la etiquetada como Salaries ($1,000s) muestra el promedio
del sueldo anual de los empleados en nmina redondeado en miles; la etiquetada como Hourly
($1,000s) muestra el promedio del sueldo anual de los empleados por hora redondeado en miles.
La revista clasifica a las empresas como grandes cuando tienen ms de 10,000 empleados, medianas
cuando tienen entre 2,500 y 10,000 empleados, y pequeas cuando tienen menos de 2,500. Los
datos se muestran a continuacin:

Para la base de datos anterior, la variable Tamao (Size), se convertir en una variable ficticia
poniendo el valor 1 si la empresa es Large y con 0 si no lo es, es decir si la variable tamao toma un
valor de Small y Midsize se le asigna un 0 y si toma el valor de Large, se le asigna un valor de 1.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 21

Estadstica en las Organizaciones Ing. Blanca Morales

Usando el Excel, vea como crear la nueva variable llamada Dimensin; esto se muestra a
continuacin:

Recuerde que Large es para empresas Grandes, Small es para las Pequeas y Midsize para las
Medianas. Se muestra solo 10 datos de toda la base de datos; en la zona de :

= (3 = "", 0,1))

La anterior se usa cuando el Excel esta en ingls; la misma frmula para el Excel en espaol:

= (3 = "", 0,1))

Note que solo se tiene una condiciona y que indica que si el valor en la variable Tamao es Large va
a poner un 0 (cero), caso contrario, pondr un 1 (uno), es decir si la variable es Midsize y Small,
pondr el 1 (uno). Por lo que la nueva base de datos qued de la siguiente manera:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 22

Estadstica en las Organizaciones Ing. Blanca Morales

Se piensa que el Sueldo del asalariado depende del sueldo de los contratados Por Horas. Si necesita
un nivel de confianza utilice el 95%.

Note que en la redaccin no dice cul es la variable X y cul es la variable Y, pero lo anterior indica
que el Sueldo del asalariado depende del sueldo de los contratados Por Horas., lo que lo anterior
dice es que Y es el Sueldo y la otra variable es las que causan un efecto en Y, pero esto son
denominadas X que sera Por Horas. Basndose en la tabla anterior, usando un nivel de significancia
del 5%; se le pide que conteste lo siguiente:

a. Presente un diagrama de dispersin e indique el tipo de relacin que se tiene entre


la Y y la variable X, qu indica la grfica?
b. Realice una regresin simple por medio del Excel y muestre sus resultados
relacionado a la variable Y y variable X.
c. De los resultados que se obtuvieron del Excel, muestre en qu lugar se encuentra la
ecuacin de regresin estimada para predecir el Y.
d. Realice la prueba de hiptesis para mostrar que, a mayor cantidad de contratos Por
Hora, mayor sera el Sueldo.
e. Indique la calidad de ajuste (muestre R cuadrada y el error estndar del estimado) e
indique si usara esta ecuacin para saber si es cierto lo que indican sobre el riesgo
y la edad, para poder determinar si la variable X (Por Hora), hace se incremente el
Sueldo.
f. El supuesto de normalidad en los errores se cumple?

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 23

Estadstica en las Organizaciones Ing. Blanca Morales

g. Ahora realice una regresin con la variable Dimensin (X) y la variable Sueldo (Y).
Note que la variable utilizada era cualitativa y que se convirti en una variable ficticia
para poder usarla en la regresin.
h. Midiendo la calidad de ajuste de esta nueva regresin, explica de mejor manera el
Sueldo o bien la variable Por Horas explica de mejor manera a la variable Sueldo?
Para responder esta pregunta use la calidad de ajuste de ambas regresiones.

Para este problema, son necesarios los conocimientos adquiridos en la lectura del captulo 14 del
libro de texto y los Apndices del mismo. Sus respuestas servirn para el punto 3.4 y te apoyaran
tambin en los puntos 3.5, 3.6 y 3.7 de la etapa 3 del proyecto integrador

Respuesta:

Primero hay que decidir quin es X y quin es Y; en base a la redaccin el Sueldo del
asalariado depende del sueldo de los contratados Por Horas., se puede indicar entonces
que:

es la percepcin por horas.

es el sueldo de los empleados.

El nivel de significancia es = 0.05 o bien el nivel de confianza sera 1 = 0.95

Ahora se procede a realizar cada inciso del problema:

a. Presente un diagrama de dispersin e indique el tipo de relacin que se tiene entre


la Y y la variable X, qu indica la grfica?
Como se indic antes, el Sueldo es la Y y cualquier otra variable sera una X; por lo
que la X en este caso sera las percepciones Por Hora. Recuerde que en el eje X ira
Por Horas y en el eje Y el Sueldo, realizando la grfica de dispersin en el Excel, se
obtuvo lo siguiente:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 24

Estadstica en las Organizaciones Ing. Blanca Morales

Salaried ($1000s)
200
180
160
140
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90

Donde Sueldo es Salaried ($1,000s). Note que los puntos se encuentran alejados del
origen para la X y para Y, por lo que se procede a cambiar el origen por valores ms
cercanos a los datos; esto se muestra a continuacin:

Salaried ($1000s)
215
195
175
155
135
115
95
75
55
35
20 30 40 50 60 70 80 90

Se puede notar que cuando Por Horas aumenta, el Sueldo tambin incrementa;
entonces se puede indicar que se tiene una relacin directa porque si aumenta la X,
tambin aumenta la Y o si la X disminuye, tambin lo hace la Y; aunque lo siguiente
no se pide, pero se muestra ya que puede ayudar a determinar si la lnea va en
ascenso o descenso; si se traza una lnea recta por medio de la regresin (se agrega
una lnea de tendencia), esto se muestra a continuacin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 25

Estadstica en las Organizaciones Ing. Blanca Morales

Salaried ($1000s)
215
195
175
155
135
115
95
75
55
35
20 30 40 50 60 70 80 90

Note que la lnea (de color rojo) va ascendiendo por lo que indica lo pasado que se
coment; que la relacin es directa y que pasa por la parte central del rea en donde
se encuentran concentrados todos los puntos (o datos que son los puntos de color
azul) y que ciertos puntos (o valores) se encuentran sobre la lnea pero muchos otros
valores no estn sobre la lnea, por lo anterior, tambin se puede indicar que la
relacin no es perfecta ya que existe mucha dispersin entre los puntos y esto hace
que dichos puntos no se encuentren todos sobre la lnea, al decir que existe mucha
dispersin, se dice que varios puntos se encuentran alejados de esta lnea. Ahora
bien, si se le pide que agregue la R cuadrada y la ecuacin de la lnea, dicha lnea fue
dada por la regresin; la grfica con estos datos, se muestra a continuacin:

Salaried ($1000s)
215
y = 1.1947x + 40.349
195
R = 0.35392
175
155
135
115
95
75
55
35
20 30 40 50 60 70 80 90

Ahora bien, la grfica que el Excel da como resultado al realizar la Regresin Simple
por el Anlisis de Datos, sera la siguiente:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 26

Estadstica en las Organizaciones Ing. Blanca Morales

Hourly ($1000s) Line Fit Plot


200
180
Salaried ($1000s) 160
140
120
100
80
60
40
20
0
0 10 20 30 40 50 60 70 80 90
Hourly ($1000s)

Salaried ($1000s) Predicted Salaried ($1000s)



Donde Salaried es Salario y sera la variable dependientes o Y y Hourly es para Horas
y sera la variable X
Note que es similar a la primera grfica obtenida y que los puntos naranjas seran la
lnea de tendencia que se traz en la pasada grfica con la lnea roja, adems de
esto, los puntos azules son los datos y que ambas grficas son similares, lo nico
sera mover el origen para obtener lo mismo; esto se muestra en la siguiente grfica:

Hourly ($1000s) Line Fit Plot


235
Salaried ($1000s)

185

135

85

35
20 30 40 50 60 70 80 90
Hourly ($1000s)

Salaried ($1000s) Predicted Salaried ($1000s)



Note que ahora si coinciden ambas grficas.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 27

Estadstica en las Organizaciones Ing. Blanca Morales

b. Realice una regresin simple por medio del Excel y muestre sus resultados
relacionado a la variable Y y variable X.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 28

Estadstica en las Organizaciones Ing. Blanca Morales



c. De los resultados que se obtuvieron del Excel, muestre en qu lugar se encuentra la
ecuacin de regresin estimada para predecir el Y.
La ecuacin de regresin se encuentra en la tabla de los coeficientes, la cual se
muestra a continuacin:


En la columna Coefficients y los valores de esta columna que son los primeros
datos de la tabla, lo cual se muestra a continuacin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 29

Estadstica en las Organizaciones Ing. Blanca Morales

Note que del lado izquierdo de la tabla, vienen los nombres de Intercept y Hourly
con lo anterior, se da la ecuacin de regresin, la cual sera:
= 40.348523 + 1.19468724
O bien si se substituye las variables por su nombre, esto sera:
= 40.348523 + 1.19468724
Donde S=Sueldo y sera la Y y H=Hourly y sera la X

d. Realice la prueba de hiptesis para mostrar que a mayor cantidad de contratos Por
Hora, mayor sera el Sueldo.
Para este inciso, es necesario realizar una prueba de hiptesis en regresin simple,
la prueba global que se realiza con la F y la prueba individual que se hace con la
prueba t hacen los mismo, es decir demuestran (o prueban) lo mismo; entonces en
regresin simple, ambas prueba sirven para lo mismo, por lo que usar la F o la t,
producira los mismos resultados o demostrara lo mismo, pero recuerde que solo
se puede en Regresin Simple porque en regresin mltiple ambas pruebas no
produce los mismos resultados. Por lo anterior, se procede entonces a utilizar
cualquiera de las dos. Las hiptesis para ambas pruebas seran las mismas, es decir:
( : F = 0
; : F 0
Una vez realizado esto, se procede a decidir que prueba usar, sera por la F o por la
t.
Usando la F:
Si se decide que se usar la F; este estadstico de prueba, se encuentra en la Tabla
ANOVA, la cual se muestra a continuacin:


Para realiza la prueba de hiptesis, es necesario decidir si la prueba de hiptesis se
har por el valor crtico o por el valor-p; tanto para uno o para el otro, se necesitan
informacin diferente; esto es, para el valor crtico, se necesitan los grados de
libertad (df por sus siglas en ingls y gl por sus siglas en espaol), la forma de
conseguirlos es a travs de la tabla ANOVA, esto se muestra a continuacin:


Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 30

Estadstica en las Organizaciones Ing. Blanca Morales

Posterior a esto, con los grados de libertad, se busca el valor crtico en la tabla F y se
compara con el estadstico de prueba, el cual se muestra a continuacin:


Ahora bien, suponga que se escoge realizar dicha prueba por medio del p-valor;
como siguiente sera conseguir este valor, el cual se muestra a continuacin:


El valor-p se encuentra en la tabla anterior es donde se indica Signifinace F; es
necesario recordar que nivel de significancia se pidi en este tema, o bien qu nivel
de confianza se dio; lo que indica la redaccin del problema es usando un nivel de
significancia del 5%; entonces
= 0.05
Ahora es necesario recordar la regla de decisin, la cual es, que para rechazar la
hiptesis nula es necesario que el:

Comparando ambos valores para saber si el 0.00052548 es mayor o menor que el
nivel de significancia que se pidi, entonces, se tiene que:
0.00052548 < 0.05
Concluyendo que se rechaza la hiptesis nula, al rechazar la nula, es necesario
concluir en base a lo que indica la hiptesis alterna, la cual es:
; : F 0
Concluyendo que con un 95% de confianza, se tiene evidencia estadstica para
afirmar que se rechaza la hiptesis nula y se puede afirmar el coeficiente Betta es
diferente de cero; pero, qu significa que F 0? el que este coeficiente sea
diferente de cero indica que la variable que acompaa a este coeficiente ayuda a
explicar de manera significativa el comportamiento de la Y, en este caso, se indica
entonces que la variable Por horas (Hourly) puede explicar el comportamiento de la
variable Sueldo (Salaries). Adems de esto, note que la es positiva:
= 40.348523 + 1.19468724
De nuevo, note que el valor del coeficiente es positivo, por lo que esto indicara que
a mayor Por Horas, mayor ser el Sueldo de los empleados.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 31

Estadstica en las Organizaciones Ing. Blanca Morales

LA SIGUIENTE PARTE NO FUERON ENCARGADON EN LA TAREA, PERO FUE


AGREGADA POR SI DESEAS SABER SOBRE COMO ENCONTRAR Y CONCLUIR CON EL
VALOR-P

Usando la t:
Si se decide que se usar la t; este estadstico de prueba, se encuentra en la Tabla
de los coeficientes, la cual se muestra a continuacin:


Recuerde que las hiptesis son las mismas, es decir:
( : F = 0
; : F 0
Para realiza la prueba de hiptesis, es necesario decidir si la prueba de hiptesis se
har por el valor crtico o por el valor-p; tanto para uno o para el otro, se necesitan
informacin diferente; esto es, para el valor crtico, se necesitan los grados de
libertad (df por sus siglas en ingls y gl por sus siglas en espaol), la forma de
conseguirlos es a travs de la tabla ANOVA, esto se muestra a continuacin:


Note que solo se usaron 1 de los dos grados de libertad y estos son 28; posterior a
esto, con los grados de libertad, se busca el valor crtico en la tabla t y se compara
con el estadstico de prueba, el cual se muestra a continuacin:


Note que se cuenta con dos estadstico; es necesario escoger el estadstico de
prueba de la variable X; esto se muestra a continuacin:


Ahora bien, suponga que se escoge realizar dicha prueba por medio del p-valor;
como siguiente sera conseguir este valor, el cual se muestra a continuacin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 32

Estadstica en las Organizaciones Ing. Blanca Morales

El valor-p se encuentra en la tabla anterior es donde se indica P-value; ahora es


necesario recordar que nivel de significancia o bien qu nivel de confianza se dio;
como ya se indic con anterioridad, este valor del nivel de significancia es:
= 0.05
Ahora es necesario recordar la regla de decisin, la cual es, que para rechazar la
hiptesis nula es necesario que el:

Comparando ambos valores para saber si el 0.00052548 es mayor o menor que el
nivel de significancia que se pidi, entonces, se tiene que:
0.00052548 < 0.05
Concluyendo que se rechaza la hiptesis nula, al rechazar la nula, es necesario
concluir en base a lo que indica la hiptesis alterna, la cual es:
; : F 0
Concluyendo que con un 95% de confianza, se tiene evidencia estadstica para
afirmar que se rechaza la hiptesis nula y se puede afirmar el coeficiente Betta es
diferente de cero; pero, qu significa que F 0? el que este coeficiente sea
diferente de cero indica que la variable que acompaa a este coeficiente ayuda a
explicar de manera significativa el comportamiento de la Y, en este caso, se indica
entonces que la variable Por horas (Hourly) puede explicar el comportamiento de la
variable Sueldo (Salaries). Adems de esto, note que la es positiva:
= 40.348523 + 1.19468724
De nuevo, note tres cosas:
Primero: que el valor del coeficiente es positivo, por lo que esto indicara que a
mayor Por Horas, mayor ser el Sueldo de los empleados.
Segundo que el valor-p en F y t es el mismo y estos siempre sucede en regresin
simple.
Que si se rechaza en la F tambin se rechazar en la t y que si ni se rechaza en la F,
en la t tampoco se rechzar, de nuevo, esto siempre ser en regresin simple.

e. Indique la calidad de ajuste (muestre R cuadrada y el error estndar del estimado) e
indique si usara esta ecuacin para saber si es cierto lo que indican sobre el riesgo
y la edad, para poder determinar si la variable X (Por Hora), hace se incremente el
Sueldo.
Para medir la calidad de ajuste, se usa la R cuadrada y el error estndar; ambos dos
valores se encuentra en la tabla de resumen, la cual se muestra a continuacin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 33

Estadstica en las Organizaciones Ing. Blanca Morales


Donde la R cuadrada sera:


Entonces el coeficiente de determinacin sera:
= = 0.3539
Este valor, muchas veces se presenta como porcentaje ya que el valor indica cuanto
del comportamiento (o la variabilidad o lo que vara) de Y se logra explicar o captar
por medio de la ecuacin. Entonces, del 100% del comportamiento de Y se logr
captar el 35.39%; este valor es un poco bajo, podra lograr explicarse de mejor
manera usando posiblemente otras variables o bien puede existir alguna relacin
que sea no-lineal entre las variables (Por hora y Sueldos).
Ahora bien, el error estndar del estimado, el cual se muestra en la tabla:


Por lo que el valor del error estndar del estimado es:
= 30.264
Este valor indica la dispersin o variabilidad que tienen los datos alrededor de la
lnea de regresin; esta lnea (la lnea roja que se muestra en las grficas del inciso
A) es la que se encuentre por medio de la ecuacin de la regresin.
Para poder indicar si este valor es bueno o no, es necesario tener otro valor de algn
otro modelo de regresin para decir si existe o no menor variabilidad. Lo que s se
puede indicar es que existe dispersin ya que es mayor a cero y que es preferible
que este valor sea lo ms cercano a cero que se pueda.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 34

Estadstica en las Organizaciones Ing. Blanca Morales

Para tener mayor claridad sobre lo anterior, se puede revisar la grfica (diagrama de
dispersin), la cual se muestra a continuacin:

Salaried ($1000s)
215
195
175
155
135
115
95
75
55
35
20 30 40 50 60 70 80 90

Como ya se indic con anterioridad, la grfica anterior muestra en los puntos azules
los datos reales (observaciones que fueran dadas) de las variables y en puntos rojos
los datos obtenidos a travs de la lnea de regresin (datos estimados a travs de la
lnea de regresin lineal); se puede indicar viendo la grfica que se tiene al menos
un valor atpico (4 valores muy alejado de los dems) y que existe mucha dispersin
de los datos reales (puntos azules) y los estimados (puntos rojos).
Lo anterior (las medidas de la calidad de ajuste y la grfica) dieron ms conocimiento
para indicar que no se usara esta ecuacin para pronosticar o estimar los valores de
Y, ya que aunque la variable logra explicar el comportamiento de Y la calidad de
ajuste es baja en la R cuadrada (valor de R cuadrada muy cercano a cero) y baja
tambin en el error estndar (valor del error estndar muy grande o mayor a cero y
lejano de este).

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 35

Estadstica en las Organizaciones Ing. Blanca Morales


f. El supuesto de normalidad en los errores se cumple?
Para este supuesto se puede usar la grfica de Probabilidad Normal, la cual se
muestra a continuacin:

Normal Probability Plot


200

150
Salaried ($1000s)

100

50

0
0 20 40 60
Sample Percentile 80 100 120

Como se puede ver, los puntos se encuentran casi en lnea recta; para ver mejor
esto, se le agreg una lnea a la siguiente grfica que se muestra:

Normal Probability Plot

200
180
160
140
Salaried ($1000s)

120
100
80
60
40
20
0
0 20 40 60 80 100 120
Sample Percentile


Para poder indicar si los errores siguen una distribucin normal, es necesario que la
mayora de los puntos se encuentren sobre la lnea o cerca de la lnea y que dichos
puntos se pueden separar un poco en los extremos.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 36

Estadstica en las Organizaciones Ing. Blanca Morales

Note que en el rea de los percentiles entre 60 y 80 se separan mucho; adems de


que los puntos se separan mucho al final. Si existen dudas sobre lo anterior, se puede
ver en la siguiente grfica, la cual fue encontrada por medio del MiniTab:


Como se puede ver, se cuenta con ms informacin, la cual se explicar a
continuacin:
La grfica anterior muestra los resultados de la prueba de Anderson-Darling, donde
expone el valor del estadstico de prueba AD=1.310 y su valor-p<0.005; las hiptesis
para esta prueba seran:
( :
; :
La hiptesis nula indica que los errores siguen una distribucin normal (N) y la
hiptesis alternativa dice que los errores no siguen una distribucin normal (N); una
vez realizadas las hiptesis, se procede a usar la regla de decisin para el valor-p, la
cual es que para rechazar la hiptesis nula es necesario que el:

Entonces comparando ambos valores para saber si el 0.005 es mayor o menor que
el 0.05; se tiene que:
0.005 > 0.05
La decisin que se tom, es que se rechaza la hiptesis nula, al rechazar la nula, es
necesario revisar lo que indica la hiptesis alternativa, la cual es:
; :
De nuevo; concluyendo: con un 95% de confianza, que se tiene evidencia estadstica
para afirmar que se rechaza la hiptesis nula y se puede indicar que los errores no
Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 37

Estadstica en las Organizaciones Ing. Blanca Morales

siguen una distribucin normal; por lo que este supuesto no se cumple. Entonces
esta ecuacin de regresin no se recomienda para poder estimar los sueldos.

g. Ahora realice una regresin con la variable Dimensin (X) y la variable Sueldo (Y).
Note que la variable utilizada era cualitativa y que se convirti en una variable ficticia
para poder usarla en la regresin.
Se procede a introducir los datos de las variables en Excel a travs del Anlisis de
Datos, donde la variable Riesgo ira en la Y y la variable Fuma en la X; los resultados
se muestran a continuacin:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 38

Estadstica en las Organizaciones Ing. Blanca Morales



LA SIGUIENTE PARTE NO SE PIDE, PERO SE REALIZAR PARA DAR MAYOR
APRENDIZAJE EN ESTE TEMA:
Ecuacin de Regresin:
La ecuacin de regresin donde se incluye la variable Y (Sueldo) y la X (Tamao) es:


= 84.3076923 + 23.6923077
O bien si se substituye las variables por su nombre, esto sera:
= 84.3076923 + 23.6923077
Donde S=Sueldo y sera la Y y D=Dimensin (variable cualitativas que se convirti en
ficticia para poder usarla en regresin) y sera la X

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 39

Estadstica en las Organizaciones Ing. Blanca Morales

Ahora se realizar la prueba de hiptesis, para mostrar que si el tamao de la


empresa es grande (large), sera mayor el Sueldo de los empleados; pero
Como en el inciso D se us la F, ahora se har uso de la t:
Las hiptesis son:
( : F = 0
; : F 0
Note que son las mismas, pero con diferentes variables, en el inciso D se us Por
Hora, ahora se utiliza Dimensin de la empresa y como se decidi usar la t; el
estadstico de prueba, se encuentra en la Tabla de los Coeficientes:


Para realiza la prueba de hiptesis, es necesario decidir si la prueba de hiptesis se
har por el valor crtico o por el valor-p; suponga que se escoge el p-valor; ahora es
necesario recordar la regla de decisin, la cual es, que para rechazar la hiptesis nula
es necesario que el:

Entonces si se usa el p-valor, es necesario buscar este valor en la tabla de los
coeficientes, lo cual se muestra a continuacin:


De nuevo, note que se tienen dos p-valores, el segundo es el que se usa para realizar
la prueba de hiptesis para saber si la variable Dimensin ayuda a explicar a la
variable Sueldo; entonces el valor-p en la tabla anterior es donde se indica P-value;
note que es el mismo p-valor de la F, comparando ambos valores para saber si el
0.08192589 es mayor o menor que el nivel de significancia que se pidi, el cual es
0.05; se tiene que:
0.08192589 > 0.05
Concluyendo que no se rechaza la hiptesis nula, al no rechazar la nula, es necesario
concluir en base a lo que indica sta, la cual es:
( : F = 0
Concluyendo: con un 95% de confianza, que se tiene evidencia estadstica para
afirmar que no se rechaza la hiptesis nula y se puede indicar el coeficiente Betta es
igual a cero; pero de nuevo, qu significa que F = 0? el que este coeficiente sea
igual a cero indica que la variable que acompaa a este coeficiente NO ayuda a
explicar significativamente el comportamiento de Y, en este caso, se indica entonces

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 40

Estadstica en las Organizaciones Ing. Blanca Morales

que la variable Dimensin debe de ser retirada de la ecuacin ya que no puede


explicar el comportamiento de la variable Sueldo y esto con un 95% de confianza.
Observaciones extras:
= 84.3076923 + 23.6923077
O bien si se substituye las variables por su nombre, esto sera:
= 84.3076923 + 23.6923077
Note que el valor del coeficiente que acompaa a la variable dimensin es positivo
y que como la variable es ficticia, solo puede tomar valores de 1 (para cuando la
dimensin de la empresa es Large) y de 0 (cuando la dimensin de la empresa no es
Large, es decir si es Small y Midsize lleva el valor de cero), por lo que esto indicara
que si toma la variable el valor de 1 incrementara el valor del riesgo y si toma el
valor de 0, el riesgo se mantendra constante en 84.3076923, entonces si fuera
significativa la ecuacin (recuerde que no lo es), a mayor valor en X, mayor ser el
sueldo. Lo anterior solo sucedera si la ecuacin fuera significativa (que se rechazara
la Hiptesis Nula) pero como no lo es; entonces la variable dimensin no hara que
el sueldo cambie.
Note tambin que el supuesto de que los errores siguen una distribucin normal, en
esta ecuacin si se cumple, se muestra la grfica del MiniTab:



h. Midiendo la calidad de ajuste de esta nueva regresin, explica de mejor manera el
Sueldo o bien la variable Por Horas explica de mejor manera a la variable Sueldo?
Para responder esta pregunta use la calidad de ajuste de ambas regresiones.
La calidad de ajuste con la R-cuadrada en el ltimo modelo de regresin, sera:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 41

Estadstica en las Organizaciones Ing. Blanca Morales


El coeficiente de determinacin sera:
= = 0.1041
Entonces, del 100% del comportamiento de Y se logr captar el 46.30%; este valor
es un poco bajo, podra lograr explicarse de mejor manera usando posiblemente
otras variables.
Ahora bien, el error estndar del estimado, el cual se muestra en la tabla:


Por lo que el valor del error estndar del estimado es:
= 35.6364
Este valor indica la dispersin o variabilidad que tienen los datos alrededor de la
lnea de regresin.
Ahora comparando ambas regresiones, se muestran los coeficientes de ambos
modelos:


Con la R cuadrada:

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 42

Estadstica en las Organizaciones Ing. Blanca Morales

= = 0.3539 y = = 0.1042
Se explica de mejor manera el Sueldo a travs de la ecuacin con Por Horas y ahora
con el error estndar:
= 30.26385 y = 35.63644
Se tiene menor dispersin con Sueldo y Por Horas, concluyendo, que se explica de
mejor manera el sueldo de los empleados a travs del modelo de regresin con la
variable independiente Por Horas.
Aunque es necesario recordar que esta ecuacin, el supuesto de normalidad no se
cumple, entonces no puede usarse esta ecuacin para estimar los sueldos de los
empleados.

Anderson, Sweeney and Williams. (2015). Estadstica para negocios y economa. Ing. Blanca Morales 43

Das könnte Ihnen auch gefallen