Beruflich Dokumente
Kultur Dokumente
en desacuerdo y 5:
1
1
1
1
2
2
2
3
3
3
4
4
4
5
5
5
Apellidos y
Nombres
Oscar Estrada
Miriam Castro
Enrique Palacios
Mario Poggi
Maruja Ostolaza
Julio Hinostroza
Rosa Martn
Lourdes Paredes
Tania Mendoza
Jos Rodrguez
Julio Campos
Santiago Quispe
18
5
15
20
19
12
15
15
14
10
12
11
19
10
12
15
12
11
15
16
14
12
11
5
18
14
15
18
12
13
12
10
15
11
15
10
Ex.final
(40%)
10
13
12
12
15
16
12
13
13
10
17
12
Prom.PC Prom.
(60%)
final
Tipo: Mediante esta opcin se puede indicar el tipo de variable, las cuales pueden
ser: Numrica, Coma, Punto, Notacin cientfica, fecha, Dlar, Moneda
personalizada, Cadena.
Por lo general se usan variables de tipo numrico y cadena (de caracteres, como el caso
de nombres)
Alineacin: Se define la alineacin en la que se quiere que aparezcan los datos que
puede ser: izquierda, derecha o centrado.
Medida: Define el tipo de medida de la variable, que puede ser: Escala, Nominal,
Ordinal.
Especifique el nombre en el recuadro File name, por defecto SPSS guarda los
archivos con extensin sav.
Seleccione las variables correspondientes a las Prcticas y haga clik en el tringulo que
separa los dos campos, para que las variables seleccionadas pasen al campo de variables
12
12
12
12
Mnimo
5.00
5.00
10.00
10
Mximo
20.00
19.00
18.00
Media
13.8333
12.6667
13.5833
Desv. tp.
4.19596
3.52480
2.74552
Vlidos
Economia
Finanzas
Total
Frecuencia
6
6
12
Porcentaje
50.0
50.0
100.0
11
Porcentaje
vlido
50.0
50.0
100.0
Porcentaje
acumulado
50.0
100.0
12
15,00
10,00
5,00
0,00
Economia
Finanzas
especial
13
6. Compare mediante un grfico las notas de las tres prcticas calificadas por
especialidad.
En este caso seleccione la opcin de barras agrupadas, y en el eje vertical, coloque las
tres prcticas calificadas.
14
Prctica 1
Prctica 2
Prctica 3
20,00
Media
15,00
10,00
5,00
0,00
Economia
Finanzas
especial
15
2.
43
137
36
54
66
190
83
48
138
120
70
67
68
103
114
52
48
115
113
75
244
49
124
143
46
171
26
16
Experiencia
N vlido (segn lista)
N
Estadstico
30
30
Media
Estadstico
93.90
Desv. tp.
Estadstico
52.046
Asimetra
Estadstico Error tpico
.981
.427
c) Elabore un histograma con los datos de esta variable. Comente sobre la asimetra
de la distribucin.
En el men Grficos entre en el generador de grficos, y seleccione la opcin
histograma.
17
18
Frecuencia
Media =93,9
Desviacin tpica =52,046
N =30
0
0
50
100
150
200
250
Experiencia
3.
19
Categora laboral
Administrativo
Seguridad
Directivo
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
Media
Intervalo de confianza
para la media al 95%
Media recortada al 5%
Mediana
Varianza
Desv. tp.
Mnimo
Mximo
Rango
Amplitud intercuartil
Asimetra
Curtosis
20
Lmite inferior
Lmite superior
Lmite inferior
Lmite superior
Lmite inferior
Lmite superior
Estadstico
$27,838.54
$27,057.40
Error tp.
$397.217
$28,619.68
$27,290.50
$26,550.00
57274548
$7,567.995
$15,750
$80,000
$64,250
$8,400
1.905
7.977
$30,938.89
$30,102.37
.128
.255
$406.958
$31,775.40
$31,007.72
$30,750.00
4471602.6
$2,114.616
$24,300
$35,250
$10,950
$1,200
-.368
3.652
$63,977.80
$60,018.44
.448
.872
$1,990.67
$67,937.16
$62,728.31
$60,500.00
3.3E+008
$18,244.78
$34,410
$135,000
$100,590
$20,475
1.181
2.107
.263
.520
21
29
$125.000
32
343
18
Salario actual
$100.000
218
$75.000
272
234
$50.000
52
72
161
80
5 17
146
291 303
281
206
386
$25.000
126
$0
Administrativo
Seguridad
Categora laboral
22
Directivo
23
20
Media
1.28960
Desviacin
tp.
.003500
Error tp. de
la media
.000783
Dimetro exterior
t
1647.613
gl
19
Sig. (bilateral)
.000
Diferencia
de medias
1.289600
90% Intervalo de
confianza para la
diferencia
Inferior
Superior
1.28825
1.29095
24
25
Desviacin
tp.
.003500
Media
1.28960
20
Error tp. de
la media
.000783
Dimetro exterior
t
-.511
gl
19
Sig. (bilateral)
.615
Diferencia
de medias
-.000400
90% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.00175
.00095
Como H 0 : = 1,29 frente a H 1 : 1,29 se trata por tanto de una prueba de hiptesis
de dos colas (bilateral), el estadstico de prueba toma el valor -0,511. En este caso no
podemos rechazar la hiptesis nula, el valor p de 0,615 es mayor que el nivel de
significacin de 0,10.
Bajo un nivel de significacin del 10% concluimos que la longitud media del dimetro
exterior de los tubos usados en el cableado elctrico es de 1,29 pulgadas
Observacin:
Puede calcularse el intervalo de confianza de la media sumando a la media
hipottica los valores -0,00175 y 0,00095 de la tabla anterior y obtenemos el
mismo resultado que en la parte a)
Cuando la prueba de hiptesis es de una sola cola (lateral izquierda o lateral
derecha), el nivel de significacin debe compararse con la mitad de Sig que aparece
en la tabla anterior
26
normal. Las pruebas se realizan bajo condiciones controladas idnticas. Los datos
resultantes son los siguientes:
Premium
Normal
35,0
40,0
34,5
29,6
31,6
32,1
32,4
35,4
34,8
34,0
31,7
34,8
35,4
34,6
35,3
34,8
36,6
32,6
36,0
32,2
Solucin:
a) Comenzamos introduciendo los datos en el editor de datos de SPSS creando dos
variables: una de ellas corresponde al tipo de gasolina (variable de agrupacin): 1:
gasolina sin plomo premium y 2: gasolina sin plomo normal (existen tantos 1 como
repeticiones tiene el tipo de gasolina sin plomo Premium; existen tantos 2 como
repeticiones tiene el tipo de gasolina sin plomo Normal), una segunda variable es el
rendimiento, cuyos valores estn dados por el rendimiento en ambos tipos de
gasolina. La ventana siguiente muestra una de las formas de tratar esta informacin.
Para determinar el intervalo de confianza solicitado, es necesario saber si las
varianzas de las poblaciones de las cuales se han extrado las muestras son
homogneas, entonces debe realizarse una prueba de hiptesis de homogeneidad de
varianza.
Las hiptesis son:
H 0 : P2 = N2
H 1 : P2 N2
Consideramos un nivel de significacin del 1% en esta prueba
Para realizar esta prueba aprovechamos el reporte de SPSS, obtenido mediante el
siguiente procedimiento:
Elegimos en el men Analizar Comparar medias Prueba T para muestras
independientes.
27
Rend
Tipo_gas
Gasolina sin
plomo premium
Gasolina sin
plomo normal
Media
Desviacin
tp.
Error tp. de
la media
10
34.370
1.8105
.5725
10
33.980
2.6720
.8450
28
F
Rend
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
.401
0,535 >0,01: No se
rechaza la hiptesis
nula de varianzas
iguales
Sig.
.535
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
99% Intervalo de
confianza para la
diferencia
Inferior
Superior
.382
18
.707
.3900
1.0207
-2.5479
3.3279
.382
15.825
.707
.3900
1.0207
-2.5955
3.3755
Lmite inferior de
confianza para la
diferencia de medias
asumiendo varianzas
iguales
Lmite Superior de
confianza para la
diferencia de medias
asumiendo varianzas
iguales
H0 : P = N
H1 : P N
Nivel de significacin: 1%
En esta prueba tambin requerimos saber si las varianzas de las poblaciones de las
cuales se han extrado las muestras son homogneas, pero en la parte a) se ha concluido
que las varianzas son similares.
29
F
Rend
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
.401
Sig.
.535
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
99% Intervalo de
confianza para la
diferencia
Inferior
Superior
.382
18
.707
.3900
1.0207
-2.5479
3.3279
.382
15.825
.707
.3900
1.0207
-2.5955
3.3755
p = 0,707 >0,01: No se
rechaza la hiptesis nula de
medias iguales
Conclusin:
Solucin:
Procedemos de la misma manera que en el ejemplo 2
30
Prueba de hiptesis
a) para la igualdad de varianzas
2
H 0 : ID
= II2
2
H 1 : ID
II2
Estadsticos de grupo
Produccin de energa
Tipo de Inyeccin
Inyeccin directa
Inyeccin idirecta
Media
38.356
37.938
16
13
Desviacin
tp.
.6408
1.2319
Error tp. de
la media
.1602
.3417
F
Produccin de energa
Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
8.568
Sig.
.007
gl
Sig. (bilateral)
Diferencia
de medias
Error tp. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
1.178
27
.249
.4178
.3547
-.3101
1.1457
1.107
17.192
.283
.4178
.3774
-.3777
1.2133
Nivel de significacin: 5%
Como Sig. = 0,007 < 0,05; rechazamos la hiptesis nula de varianzas iguales
31
Bajo un nivel de significacin del 5%, podemos afirmar que existe evidencia
estadstica suficiente para concluir que las varianzas de las poblaciones de las cuales
fueron extradas las muestras no son similares
Luego los lmites inferior y superior de confianza del 95% para la diferencia de
medias de produccin de energa elctrica cuando se usa inyeccin directa de
combustible y cuando se usa inyeccin indirecta de combustible son -0,3777 y
1,2133 respectivamente.
F
Produccin de energa
Se han asumido
8.568
varianzas iguales
No se han asumido
varianzas iguales
Sig.
.007
gl
1.178
27
.249
.4178
.3547
-.3101
1.1457
1.107
17.192
.283
.4178
.3774
-.3777
1.2133
Dado que las varianzas no son similares, el valor del estadstico de prueba es 1,107 (no
se han asumido varianzas iguales) y la significacin bilateral es de 0,283; por lo tanto
no podemos rechazar la hiptesis nula de igualdad de media, entonces la conclusin es:
Bajo un nivel de significacin del 5% podemos concluir que no existen diferencias
significativas entre las producciones medias de energa cuando se usa inyeccin directa
e inyeccin indirecta de combustible.
32
MATRIZ DE CORRELACIONES
El primer paso que daremos consiste en analizar la matriz de correlaciones. Analizando
dicha matriz se podr determinar cul de las variables independientes esta ms
correlacionada con la variable dependiente.
La secuencia de pasos es: Analizar, Correlaciones, Bivariadas:
33
Ventas (mills $)
Nro distribuidoras
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Ventas
(mills $)
1
Nro
Nro Autos
distribuidoras
(mills)
.739**
.548
.009
.081
11
11
11
.739**
1
.670*
.009
.024
11
11
11
.548
.670*
1
.081
.024
11
11
11
Por el momento slo se proceder a obtener la ecuacin del modelo as como algunos
valores representativos para la validacin de dicho modelo.
Un anlisis ms riguroso del modelo y su validacin se har para el caso de regresin
lineal mltiple.
34
Resultados obtenidos:
Resumen del modelo
Modelo
1
R
.739a
R cuadrado
corregida
.496
R cuadrado
.546
Error tp. de la
estimacin
9.7718
Regresin
Residual
Total
Suma de
cuadrados
1033.836
859.393
1893.229
gl
1
9
10
Media
cuadrtica
1033.836
95.488
F
10.827
Sig.
.009a
Modelo
1
(Constante)
Nro distribuidoras
Coeficientes no
estandarizados
B
Error tp.
10.881
6.409
.012
.004
Coeficientes
estandarizad
os
Beta
.739
t
1.698
3.290
Sig.
.124
.009
35
Una forma grfica de verificar la relacin lineal entre Y con X es realizar un grfico de
dispersin, el cul muestra la posible tendencia y/o relacin posible entre variable
dependiente e independiente.
La secuencia para obtener dicho grfico es la siguiente:
36
52.3
46.2
Ventas (mills $)
38.2
35.0
33.1
30.0
26.0
25.2
20.2
16.0
3.5
125
480
650
1233
1694
1699
1840
Nro distribuidoras
37
2011
2214
2302
2850
LINEAL
Resumen del modelo
R cuadrado
.966
.933
R cuadrado
corregida
.920
Error tpico de la
estimacin
9.017
gl
Media
cuadrtica
Sig.
Regresin
5675.152
5675.152
69.795
.000
Residual
406.557
81.311
Total
6081.709
6
La variable independiente esMillas.
Coeficientes
38
Coeficientes no
estandarizados
Coeficientes
estandarizados
Millas
B
-2.040
Error tpico
.244
(Constante)
91.660
5.080
Beta
-.966
Sig.
-8.354
.000
18.042
.000
LOGARTMICO
Resumen del modelo
R cuadrado
corregida
R cuadrado
.973
Error tpico de la
estimacin
.946
.936
La variable independiente esMillas.
8.071
ANOVA
Suma de
cuadrados
gl
Media
cuadrtica
Sig.
5756.025
5756.025
88.368
.000
Residual
325.683
65.137
Total
6081.709
Regresin
6
La variable independiente esMillas.
Coeficientes
Coeficientes no
estandarizados
Coeficientes
estandarizados
ln(Millas)
B
-22.189
Error tpico
2.360
(Constante)
106.754
5.818
Beta
-.973
Sig.
-9.400
.000
18.350
.000
CUADRTICO
Resumen del modelo
R cuadrado
.993
.986
R cuadrado
corregida
.979
Error tpico de la
estimacin
4.584
gl
2
Media
cuadrtica
2998.830
Residual
84.048
21.012
Total
6081.709
Regresin
39
F
142.721
Sig.
.000
Coeficientes no
estandarizados
Millas
B
-3.924
Coeficientes
estandarizados
Error tpico
.497
Beta
-1.858
.922
Millas ** 2
.048
.012
(Constante)
99.897
3.330
Sig.
-7.900
.001
3.918
.017
29.998
.000
CBICO
Resumen del modelo
R
.997
R cuadrado
corregida
.988
R cuadrado
.994
Error tpico de la
estimacin
3.559
gl
3
Media
cuadrtica
2014.570
Residual
38.000
12.667
Total
6081.709
Regresin
F
159.047
Sig.
.001
Coeficientes
estandarizados
Error tpico
Beta
Sig.
-5.626
.972
-2.664
-5.786
.010
Millas ** 2
.160
.059
3.055
2.695
.074
Millas ** 3
-.002
.001
-1.371
-1.907
.153
(Constante)
103.925
3.339
31.124
.000
Millas
EXPONENCIAL
Resumen del modelo
R
.989
R cuadrado
.979
R cuadrado
corregida
.974
Error tpico de la
estimacin
.104
Regresin
Suma de
cuadrados
2.496
gl
1
Media
cuadrtica
2.496
Residual
.054
.011
Total
2.550
6
La variable independiente esMillas.
40
F
229.924
Sig.
.000
Coeficientes no
estandarizados
Millas
(Constante)
Coeficientes
estandarizados
Error tpico
Beta
Sig.
-.043
.003
-.989
-15.163
.000
99.496
5.840
17.036
La variable dependiente es ln(Porcentaje).
.000
Porcentaje
Observada
Lineal
Logartmico
Cuadrtico
Cbico
Exponencial
100,00
80,00
60,00
40,00
20,00
0,00
0,00
20,00
40,00
Millas
41
Ventas (mills)
Activos (mills)
Inversion de accionistas
Utilidades %
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Correlacin de Pearson
Sig. (bilateral)
N
Ganancias
por accin
1
30
.316
.089
30
.333
.072
30
.355
.054
30
.451*
.012
30
Inversion de
Activos (mills)
accionistas
Utilidades %
.333
.355
.451*
.072
.054
.012
30
30
30
.994**
.978**
-.085
.000
.000
.653
30
30
30
30
.994**
1
.992**
-.062
.000
.000
.744
30
30
30
30
.978**
.992**
1
-.051
.000
.000
.790
30
30
30
30
-.085
-.062
-.051
1
.653
.744
.790
30
30
30
30
Ventas (mills)
.316
.089
30
1
Como se observa, existe una baja correlacin entre la variable dependiente y las
posibles predictoras. Adems, existe una alta correlacin entre las variables
independientes.
MULTICOLINEALIDAD:
El problema de multicolinealidad se presenta cuando existe una alta correlacin entre
variables independientes, como es el caso: correlacin entre Ventas y Activos (0.994);
correlacin entre Ventas e Inversin (0.978).
Adems se comprueba la multicolinealidad siguiendo el criterio propuesto en clase:
Menor correlacin entre Y y las Xs 0.316
Existe correlaciones entre Xs mayor que 0.316
An en la presencia detectada de multicolinealidad estimaremos el modelo para
determinar lo adecuado que puede ser su uso para la prediccin:
Seguimos la siguiente secuencia: Analizar, Regresin, Lineal
42
R cuadrado
corregida
.257
R
R cuadrado
.600a
.360
Error tp. de la
estimacin
2.70416
Regresin
Residual
Total
Suma de
cuadrados
102.660
182.812
285.472
gl
4
25
29
Media
cuadrtica
25.665
7.312
F
3.510
Sig.
.021a
En forma conjunta las variables son significativas para el modelo, considerando un nivel
de significacin del 5% (P-Valor = 0.021). Las hiptesis que se proponen son las
siguientes:
H o : 0 = 1 = ... = 4 = 0 En forma conjunta las variables no contribuyen al modelo
H1 : i 0
Coeficientesa
Modelo
1
(Constante)
Ventas (mills)
Activos (mills)
Inversion de accionistas
Utilidades %
Coeficientes no
estandarizados
B
Error tp.
-.039
1.313
.000
.001
.000
.001
.001
.001
.186
.065
Coeficientes
estandarizad
os
Beta
t
-.029
.275
-.549
.966
2.862
.457
-1.444
1.364
.470
Sig.
.977
.786
.588
.343
.008
44
R cuadrado
corregida
.175
.298
R
R cuadrado
.451a
.204
.589b
.347
Error tp. de la
estimacin
2.84917
2.62787
Regresin
Residual
Total
Regresin
Residual
Total
Suma de
cuadrados
58.175
227.297
285.472
99.018
186.454
285.472
gl
1
28
29
2
27
29
Media
cuadrtica
58.175
8.118
49.509
6.906
F
7.166
Sig.
.012a
7.169
.003b
Coeficientes a
Modelo
1
2
(Constante)
Utilidades %
(Constante)
Utilidades %
Inversion de accionistas
Coeficientes no
estandarizados
B
Error tp.
.493
1.243
.179
.067
-.054
1.168
.186
.062
.000
.000
Coeficientes
estandarizad
os
Beta
.451
.471
.379
t
.397
2.677
-.047
3.022
2.432
Sig.
.695
.012
.963
.005
.022
Variables excluidas c
Modelo
1
Ventas (mills)
Activos (mills)
Inversion de accionistas
Ventas (mills)
Activos (mills)
Beta dentro
.357a
.362a
.379a
-.349b
-.808b
t
2.259
2.304
2.432
-.449
-.662
Sig.
.032
.029
.022
.657
.514
Correlacin
parcial
.399
.405
.424
-.088
-.129
Estadsticos
de
colinealidad
Tolerancia
.993
.996
.997
.041
.017
MODELO FINAL:
Luego, el programa nos entrega el mejor modelo. En este caso las variables de
prediccin seleccionadas son Ventas y Activos. A continuacin se muestra el
resumen para este modelo:
45
R
.589a
R cuadrado
corregida
.298
R cuadrado
.347
Error tp. de la
estimacin
2.62787
Regresin
Residual
Total
Suma de
cuadrados
99.018
186.454
285.472
gl
2
27
29
Media
cuadrtica
49.509
6.906
F
7.169
Sig.
.003a
Modelo
1
(Constante)
Inversion de accionistas
Utilidades %
Coeficientes no
estandarizados
B
Error tp.
-.054
1.168
.000
.000
.186
.062
Coeficientes
estandarizad
os
Beta
.379
.471
t
-.047
2.432
3.022
Sig.
.963
.022
.005
SUPUESTO DE NORMALIDAD:
Otro supuesto del modelo es la normalidad que presentan los errores. Para verificar este
supuesto podemos realizar el grfico de probabilidad normal.
Lo primero que se debe hacer es seleccionar la opcin guardar y en el cuadro de
dilogo que se muestra marcar las pociones: Residuos: No tipificados y Valores
Pronosticados: No tipificados. Los valores de los residuos se generaran
automticamente y se guardaran en dos columnas adicionales en nuestra base de datos.
46
1,0
0,8
0,6
0,4
0,2
0,0
0,0
0,2
0,4
0,6
0,8
47
1,0