Sie sind auf Seite 1von 7

ACTIVIDAD 1

Aplicacin con SPSS

Nuestro objetivo es determinar cul es la relacin entre profesionales y su consumo de tabaco. Para poder realizar un anlisis de correspondencias tendremos que seleccionar: -Analizar -Reduccin de datos -Anlisis de Correspondencias A continuacin seleccionamos las variables con las que vamos a trabajar y las categoras que tiene cada una. La variable Fila ser personal, la cual tiene cinco categoras (ordenadas de la 1 a la 5) por lo que el rango tomar como valor mximo el 5 y el mnimo el 1. La variable Columna ser los que fuman, y el rango ser de 1 a 4. Con el botn modelos especificaremos el nmero de dimensiones, la medida de distancia, el mtodo de estandarizacin y el mtodo de normalizacin. El nmero de dimensiones ptimo ser el menor nmero de dimensiones que necesitaremos para explicar la mayor parte de la variacin. En este caso vamos a elegir dimensin 3.

A continuacin con el botn Estadsticos y seleccionando todas las opciones posibles, obtenemos: Tabla de correspondencias para las dos variables, con sus marginales. En las filas se representan las categoras laborales y en las columnas el comportamiento fumador. Grupo de personal Fumadores Margen Nada Poco Medio Mucho activo Directores Sr 8 3 11 10 32 Directores Jr 6 4 11 10 31 Empleados Sr 24 13 20 6 63 Empleados Jr 18 18 34 14 84 Secretarias 14 12 7 3 36 Margen activo 70 50 83 43 246

Los totales marginales de fila, muestran que la empresa encuestada presenta una mayor representacin de Empleados(Jr y Sr) que Directores y Secretarias. Los totales de columna indican que los no-fumadores y fumadores-medio predominan respecto a los dems niveles de consumo de tabaco. Asimismo, la categora de Mucho consumo de tabaco presenta un menor nmero respecto a las dems categoras.

Dimensi n

Valor propio

ChiInercia cuadrado

1 ,290 ,084 2 ,124 ,015 3 ,090 ,008 Total ,108 a. 12 grados de libertad

26,504

Resumen Proporcin de Confianza para el Valor Sig. inercia propio Explica Acumul Desviaci da ada n tpica Correlacin 2 3 ,781 ,781 ,060 ,088 ,051 ,143 ,925 ,063 -,063 ,075 1,000 ,066 a ,009 1,000 1,000

En esta tabla destacaremos varios aspectos: a) Valor propio: sirve para ver la inercia haciendo la raz cuadrada. b) Inercia: Mide la importancia de un eje, por lo que vemos que el primer eje es el ms importante con inercia 0,084. c)Inercia total: Los ejes explican un total de 0,108. d) Proporcin de inercia: aunque el valor de la inercia pueda parecer pequeo, los 3 ejes explican el 100 de la varianza y ms concretamente el primero el 78,1%, el segundo el 14,3% y el tercero el 7,5% e) Chi-cuadrado: con este valor obtenemos el contraste de independencia entre ambas variables, el contraste de la chi-cuadrado en las Tablas de Contingencia contrasta la independencia como hiptesis nula frente a la dependencia. En este caso al ser el p-valor 0,009 aceptaremos la hiptesis de dependencia entre variables. f ) Examen de los puntos fila: Con inercia vemos lo que aporta cada categora al total de inercia, por ejemplo, del total de inercia (0,108) las secretarias son las que ms aportan con 0,034. Con contribucin de los puntos a la inercia de la dimensin se mide la importancia de un punto a la hora de explicar un eje, por ejemplo Secretarias es el valor ms importante para la orientacin del primer eje, Empleados Jr para el segundo, y Empleados Sr para el tercero. Con contribucin de la dimensin a la inercia del punto vemos el porcentaje de cada modalidad explicado por cada eje, el primer eje explica el 93,7% de la categora Directores Jr frente a slo el 3,6% del segundo eje y 2,7% del tercero.

g) Examen de los puntos columna: Igual que en el caso anterior, adems de los valores para representar en los ejes, podemos ver que el primer eje viene muy determinado por los que fuman poco, el segundo lo hace por los fumadores medio y el tercero por los que no fuman nada. Tambin podemos ver por ejemplo que el primer eje explica el 91,3% de la varianza de los que fuman mucho, mientras que el segundo eje y el tercero explican el 6,3% y 2,3% respectivamente.

Si seleccionamos todos los grficos posibles obtenemos:

Si analizamos los perfiles fila, vemos una semejanza entre Directores Jr y Sr muy diferenciada de las Secretarias y Empleados Sr, siendo estos ltimos diferentes en la dimensin 3. Observamos viendo la combinacin de dimensiones 1 y 2 que la categora de Empleados Jr est bastante apartada del resto. Observando los perfiles columna parece que existe semejanza entre poco y nada, presentando una dependencia positiva en la primera componente. Los fumadores medios no tienen una dependencia notable en ninguna de las tres dimensiones evaluadas y en cambio los que fuman mucho presentan una dependencia fuertemente negativa para la dimensin 1. Con el grfico de las filas y columnas podemos sacar las conclusiones finales. Los que fuman mucho suelen ser los Directores Jr y Sr, los Empleados Jr fuman un nivel medio, y, por su parte, las Secretarias y los Empleados Sr se relacionan con una actividad fumadora escasa o nula.

Aplicacin con R

En primer lugar instalamos el paquete ade4. Una vez instalado y listo para usar, abrimos el fichero correspondencias3.txt que contiene la tabla de contingencia obtenida con el programa SPSS.
> datos<-read.table("correspondencias3.txt",header=TRUE) > datos Mucho Medio Nada Poco DirecJr 10 11 6 4 DirecSr 10 11 8 3 EmpleJr 14 34 18 18 EmpleSr 6 20 24 13 Secret 3 7 14 12

A continuacin mandamos la orden:

> acs<-dudi.coa(datos)

R nos consulta con cuantas dimensiones queremos trabajar, para ello nos facilita el grfico de los autovalores. En este caso decidiremos quedarnos con tres componentes. Select the number of axes: 3 Y sin mas que ejecutar la salida nos proporciona los objetos del analisis:
> acs Duality diagramm class: coa dudi $call: dudi.coa(df = datos) $nf: 3 axis-components saved $rank: 3 eigen values: 0.08419 0.01542 0.008126 vector length mode content 1 $cw 4 numeric column weights 2 $lw 5 numeric row weights 3 $eig 3 numeric eigen values data.frame nrow 1 $tab 5 2 $li 5 3 $l1 5 4 $co 4 5 $c1 4 other elements: N ncol 4 3 3 3 3 content modified array row coordinates row normed scores column coordinates column normed scores

Nos proporciona los valores de inercia, 0.08419, 0.01542 y 0.008126, por lo que concluimos que el primer eje tiene mucho ms poder clasificatorio que el segundo y el tercero.
> acs$cw Mucho Medio Nada Poco 0.1747967 0.3373984 0.2845528 0.2032520 > acs$lw DirecJr DirecSr EmpleJr EmpleSr Secret 0.1260163 0.1300813 0.3414634 0.2560976 0.1463415

stos son los pesos, respectivamente de las columnas y filas. Podemos observar que dentro de las columnas, la ms influyente son los fumadores medios y en las filas la categora Empleados Jr. Finalmente las ultimas salidas son las coordenadas por las y columnas:
> acs$li DirecJr Axis1 0.4130145 Axis2 0.08126465 Axis3 0.06977842

0.00

0.02

0.04

0.06

0.08

DirecSr 0.3788860 0.16524906 -0.03047892 EmpleJr 0.0663442 -0.16478417 0.01493106 EmpleSr -0.2297749 0.04131730 -0.12486263 Secret -0.4451360 0.09532519 0.15067587 > acs$l1 RS1 RS2 RS3 DirecJr 1.4234200 0.6543526 0.7740888 DirecSr 1.3057992 1.3306051 -0.3381187 EmpleJr 0.2286498 -1.3268618 0.1656381 EmpleSr -0.7919000 0.3326918 -1.3851669 Secret -1.5341243 0.7675698 1.6715269 > acs$co Comp1 Comp2 Comp3 Mucho 0.4916166 0.12959006 0.07865610 Medio 0.1351643 -0.13556556 -0.06717212 Nada -0.2482962 0.13454320 -0.07030804 Poco -0.2995484 -0.07476911 0.14229272 > acs$c1 CS1 CS2 CS3 Mucho 1.6943159 1.0434746 0.8725736 Medio 0.4658324 -1.0915900 -0.7451757 Nada -0.8557320 1.0833579 -0.7799641 Poco -1.0323685 -0.6020498 1.5785282

Es conveniente realizar tambin el contraste de la chi-cuadrado para comprobar la dependencia de las variables:
> chisq.test(datos) Pearson's Chi-squared test data: datos X-squared = 26.504, df = 12, p-value = 0.009102

donde podemos ver que el p-valor es 0.009102 < = 0.05, por lo que las variables son dependientes y tiene sentido hacer el anlisis. Con respecto los grficos haremos:
> scatter.coa(acs,method=1) > scatter.coa(acs,method=2) > scatter.coa(acs,method=3)

Grficos de las filas, columnas y las filas y columnas


d = 0.2 d = 0.5

Eigenvalues

Eigenvalues

Nada

Mucho

Nada
Secret EmpleSr

DirecSr

Mucho
Secret EmpleSr EmpleJr DirecSr DirecJr

DirecJr

Poco Medio EmpleJr

Poco

Medio

Eigenvalues

d = 0.5

DirecSr

Secret EmpleSr
Nada Poco Medio Mucho

DirecJr

EmpleJr

Observamos una clara coherencia con las conclusiones obtenidas en SPSS, recordamos: los que fuman mucho suelen ser los Directores Jr y Sr, los Empleados Jr fuman un nivel medio, y, las Secretarias y los Empleados Sr se relacionan con una actividad fumadora escasa o nula.

Das könnte Ihnen auch gefallen