Tablas de doble entrada: Tambin llamadas tablas de
contingencias, son aquellas tablas de datos referentes a dos variables, formada, en las cabeceras de las filas, por las categoras o valores de una variable y en las de las columnas por los de la otra, y en las casillas de la tabla, por las frecuencias o nmero de elementos que renen a la vez las dos categoras o valores de las dos variables que se cruzan en cada casilla. Para la tabulacin de un material agrupado de observaciones simultneas de dos variables aleatorias necesitaremos una tabla COMO SIGUE:
Este tipo de tablas brindan informacin estadstica de dos eventos relacionados entre s, es til en casos en los cuales los experimentos son dependientes de otro experimento. Empezando con SPSS Con el men Analizar/Estadsticos descriptivos/tablas de contingencia se pueden crear tablas de doble entrada.
Al darle clic, nos mostrada el siguiente cuadro de dialogo:
Si se indican varias variables en filas o columnas harn tantas tablas de doble entada como combinaciones se puedan hacer
Como parte del ejemplo, utilizaremos edad que sera como la entrada x y peso como entrada y. Al darle clic en aceptar nos aparece la siguiente tabla de contingencia.
En el men casillas puede especificar la informacin requerida para cada par de valores de las dos variables (frecuencias absolutas, relativas conjuntas y relativas condicionadas)
CREACIN O TRANSFORMACIN DE VARIABLES Este comando nos va a permitir crear nuevas variables o transformar las ya existentes mediante el uso de operadores aritmticos, funciones aritmticas, funciones estadsticas, funciones lgicas, funciones de cadena, funciones de fecha y hora, funciones de distribucin, funciones de variables aleatorias y funciones de valores perdidos.
Men Transformar/ Calcular...
1. Asignar un nombre a la nueva variable. Este nombre lo introduciremos en laceldaVariable de destino. 2. Especificar el tipo de variable que queremos crear y, opcionalmente, la etiquetade la nueva variable. 3. En Expresin numrica tendremos que escribir la expresin a travs de la cual se determina los distintos valores que toma esta nueva variable. Para ellotenemos una serie de botones con dgitos del 0 al 9, operadores aritmticos, operadores lgicos, etc. Adems, tenemos un conjunto de funciones que nos permitirn realizar distintas operaciones. Una vez seleccionado un grupo concreto de funciones, seleccionaremos una funcin determinada.
4. Con el botn "Si..." podemos establecer una expresin condicional. De esta forma, la nueva variable slo se calcular para aquellos casos en los cuales se cumpla la condicin. En aquellos casos, en los que no se cumpla la condicin la nueva variable no tomar ningn valor y, como resultado de ello, tendremos un valor perdido del sistema. Al presionar dicho botn aparece un cuadro de dilogo, deberemos seleccionar la opcin Incluir si el caso satisface la condicin y establecer la condicin que ha de cumplir un determinado caso para que el valor correspondiente de la nueva variable sea calculado. Finalmente haremos clic en el botn "Continuar".
5. Hacer clic en el botn "Aceptar" del cuadro de dilogo de Calcular variable. RECODIFICAR VARIABLES Permite modificar los valores de las variables recodificndolos. Esto es til para aadir o combinar categoras en una variable. El resultado de la recodificacin puede guardarse en la misma variable, sustituyendo as los valores originales, o bien generar una nueva variable. a) Para recodificar los valores de una variable en la misma variable: Elegir los mens: Transformar/ Recodificar/ En las mismas variables...
- Seleccionar las variables que se deseen recodificar. Si se seleccionan varias variables, debern ser del mismo tipo (numricas o de cadena). - Pulsar en Valores antiguos y nuevos y especificar cmo recodificar los valores.
b) Para recodificar los valores de una variable en una nueva variable: Elegir los mens:
Transformar/ Recodificar/ En distintas variables...
- Seleccionar las variables que se deseen recodificar. Si se seleccionan variasvariables, debern ser del mismo tipo (numricas o de cadena).
- Introducir el nombre de una (nueva variable) de los resultados para cada variable seleccionada y pulsar Cambiar.
- Pulsar en Valores antiguos y nuevos y especificar cmo recodificar los valores.
- Tambin existe la posibilidad de realizar la recodificacin automticamente, el sistema se encarga de establecer la transformacin e informa de cules son y a qu corresponden los valores de la nueva variable.
MANIPULACIN DE ARCHIVOS Ordenar datos Permite ordenar todos los casos de un archivo, utilizando como criterio una o ms variables.
Men Datos / Ordenar casos. Entonces, aparecer en pantalla un cuadro de dilogo:
Deberemos introducir en el cuadro "Ordenar por", en primer lugar, la variable que va a constituir el criterio de ordenacin principal y, a continuacin, la variable o variables que se van a tener en cuenta cuando existan determinados casos que tengan para dicha variable el mismo valor. Asimismo, habr que especificar el "Orden de clasificacin", es decir, si queremos que los casos los ordene de menor a mayor (ascendente) o de mayor a menor (descendente).
Agrupar datos Esta opcin permite agrupar casos basndose en los valores de una variable de agrupacin y crear un nuevo archivo donde habr un caso por cada grupo. Men Datos / Agregar / Variable de segmentacin: /Variables agregadas: Funcin /Crear archivo El resultado de la agrupacin puede aparecer en el archivo activo, en un nuevo conjunto de datos o en un nuevo archivo.
Segmentacin de un archivo. Este comando nos va a permitir dividir nuestro archivo de datos en distintosgrupos de elementos. Por ejemplo, pensemos que tenemos las variables peso, edad y sexo. Podramos estudiar el peso y la edad por separado en los hombres y en las mujeres.
Con el men datos/segmentar archivo. Se pueden organizar los resultados que se obtengan para una variable en funcin de grupos formados por valores de otra u otras variables, lo que resulta muy til para trabajar con distribuciones condicionadas
Al darle clic nos arrojara el siguiente cuadro de dilogo
Segmentar un archivo es un procedimiento que crea un nuevo grupo cada vez que aparece un nuevo valor de la variable que se emplea para segmentar el archivo dedatos. Las opciones que podemos seleccionar en el cuadro de dilogo son: Analizar todos los casos, no crear los grupos: Analiza todos los casos juntos. De esta manera, si se selecciona esta opcin se dejar de realizar los distintos anlisis estadsticos para cada uno de los posibles grupos en que estuviera segmentado el archivo, pasando a realizarse sobre el total de casos. Se indica la variable (o variables con respecto a las que se quiere segmentar el archivo y se selecciona comparar los grupos) Comparar los grupos: Los resultados obtenidos tras la ejecucin de un determinado procedimiento se presentan juntos para que puedan ser comparados.
Organizar los resultados por grupos: Los resultados de cada grupo se presentan por separado para cada grupo en que est segmentado el archivo. Finalmente, hay dos opciones ms que se activan cuando seleccionamos Comparar los grupos u Organizar los resultados por grupos:
Ordenar los archivos segn variable de agrupacin: El archivo es ordenado en funcin de los valores de las variables que aparecen en la lista Grupos basados en, teniendo en cuenta el orden en que dichas variables aparecen en la lista. Seleccionaremos esta opcin cuando el archivo de datos no est ordenado segn los valores de las variables de agrupacin. El archivo ya est ordenado: El archivo ya est ordenado por las variables que aparecen en la lista Grupos basados en. Con los archivos muy grandes esta opcin tiene la ventaja de que nos permite ahorrar bastante tiempo de procesamiento. Sin embargo, tiene el inconveniente de que puede aparecer un gran nmero de grupos intiles en el supuesto de que el archivo no est ordenado en el orden correcto.
Como consecuencia los anlisis que se realicen a continuacin sobre una variable (ejemplo: edad) se harn separando los datos para esos grupos y comparando los resultados).
Observe que mientras el fichero permanezca segmentado, se indicar en la vista de datos. Para volver a trabajar con todos los datos se repite el proceso de segmentacin y se selecciona analizar todos los casos, no crear grupos. Diagrama de dispersin. En el men grficos/cuadros de dialogo antiguos/dispersin/Puntos permite obtener el diagrama de dispersin.
Nos arroja el siguiente cuadro de dilogo, donde podemos escoger el subtipo
Al darle definir, nos muestra el siguiente cuadro de dialogo
Escoge el suptipo y dale definir Se definen las variables que vayamos a graficar
Podemos cambiarles el titulo y hay algunas otras opciones que se pueden utilizar, como la exclusin de de casos, etc.
El diagrama que aparece en la ventana de resultados, puede editarse haciendo doble clic encima de la grafica. De esta manera se accede al editor de grficos, que presenta distintas opciones de edicin, entre las que se encuentra el insertar la recta de regresin de mnimos cuadrados.
Matriz de correlaciones La matriz de correlacin es una matriz conformada por n filas y por n columnas. Adems es una matriz simtrica; es decir, que los valores de los elementos a ij de la matriz, es el mismo valor en los elementos a ji de la matriz.
La matriz de correlacin nos explica cmo se encuentran relacionadas cada una de las variables con otra variable. Su diagonal siempre contendr el valor de 1. Si tiene un valor 0, nos indicar que no tiene ninguna relacin con esa variable, por lo menos no lineal; es decir, pueda que tenga una relacin cuadrtica o de otro grado.
Cuando la correlacin es positiva, esto nos indica que su proyeccin de la regresin lineal va a tender a crecer conjuntamente con la contra variable.
Cuando la correlacin es negativa, esto nos indica que su proyeccin de la regresin lineal va a tender a decrecer conjuntamente con la contra variable.
En el men analizar/correlaciones/Bivariadas pueden abstenerse los coeficientes de correlacin para un conjunto de variables cuantitativas (dos a dos).
Se puede indicar ms de dos variables. Si lo hace se calcularan las correlaciones las variables dos a dos
En opciones tambin se puede solicitar el clculo tambin de las covarianzas. Los estadsticos aparecen en la ventana de resultados
Regresin de mnimos cuadrados El anlisis de regresin lineal es una tcnica estadstica utilizada para estudiar la relacin entre variables cuantitativas. Tanto en el caso de dos variables (regresin simple) como en el de ms de dos variables (regresin mltiple), el anlisis regresin lineal puede utilizarse para explorar y cuantificar la relacin entre una variable llamada dependiente o criterio(Y) y una o ms variables llamadas independientes o predictoras (X1, X2, , Xp), as como para desarrollar una ecuacin lineal con fines predictivos.
En Dependiente se traslada la variable cuyos valores se desea predecir o resumir. En independientes, en este recuadro nos sirve para introducir las variables independientes, nos permite hacer varios anlisis de regresin a la vez, alternando los botones anterior y siguiente, y adems no deja elegir el mtodo de introduccin de las variables independientes. Independientes se trasladan las variables utilizadas para predecir el valor de la variable dependiente. Tambin se denominan variables predictoras o variables explicativas. Para poder ejecutar este procedimiento, la lista debe contener al menos una variable.
Mtodo: Permite seleccionar el mtodo por el cual se introducen las variables independientes en el anlisis. Nos vale para elegir la mejor ecuacin de regresin. Permite construir una variedad de modelos de regresin a partir del mismo conjunto de variables: - Introducir (Entry): Procedimiento para la seleccin de variables en el que todas las variablesde un bloque se introducen en un solo paso. Es el mtodo por defecto. - Pasos sucesivos (Stepwise): En cada paso se introduce la variable independiente que no se encuentre ya en la ecuacin y que tenga la probabilidad para F ms pequea, si esa probabilidad es suficientemente pequea. Las variables ya introducidas en la ecuacin de regresin se eliminan de ella si su probabilidad para F llega a ser suficientemente grande. El mtodo termina cuando ya no hay ms variables candidatas a ser incluidas o eliminadas. - Eliminar (Remove): Procedimiento para la seleccin de variables en el que las variables de un bloque se eliminan en un solo paso. - Hacia atrs (Backward): Procedimiento de seleccin de variables en el que se introducen todas las variables en la ecuacin y despus se van excluyendo una tras otra. Aquella variable que tenga la menor correlacin parcial con la variable dependiente ser la primera en serconsiderada para su exclusin. Si satisface el criterio de eliminacin, ser eliminada. Tras haber excluido la primera variable, se pondr a prueba aquella variable, de las que queden en la ecuacin, que presente una correlacin parcial ms pequea. El procedimiento termina cuando ya no quedan en la ecuacin variables que satisfagan el criterio de exclusin. - Hacia delante (Forward): Procedimiento de seleccin de variables en el que stas son introducidas secuencialmente en el modelo. La primera variable que se considerar para ser introducida en la ecuacin ser aqulla que tenga mayor correlacin, positiva o negativa, con la variable dependiente. Dicha variable ser introducida en la ecuacin slo si satisface el criterio de entrada. Si ha entrado la primera variable, se considerar como prxima candidata la variable independiente que no est en la ecuacin y cuya correlacin parcial sea la mayor. El procedimiento termina cuando ya no quedan variables que satisfagan el criterio de entrada. En Variable de seleccin se traslada una variable que limite el anlisis a un subconjunto de casos que tengan un valor particular para esta variable. Con Regla podemos definir el subconjunto de casos que se emplearn para estimar el modelo de regresin. En Etiquetas de caso designamos una variable para identificar los puntos de los grficos. Para cada punto de un diagrama de dispersin podemos utilizar la herramienta de seleccin de puntos y mostrar el valor de la variable de etiquetas de casos correspondiente al caso seleccionado. Ponderacin MCP: Permite obtener un modelo de mnimos cuadrados ponderados. Los puntos de los datos se ponderan por los inversos de sus varianzas. Esto significa que las observaciones con varianzas grandes tienen menor impacto en el anlisis que las observaciones asociadas a varianzas pequeas.
Estadsticos Con el botn Estadsticos accedemos al cuadro de dilogo que muestra la figura 2 que nos valepara solicitar resultados estadsticos opcionales, incluyendo los coeficientes de regresin, descriptivos, Estadsticos de ajuste del modelo, la prueba de Durbin-Watson y diagnsticos de la colinealidad.
Coeficientes de regresin. En este recuadro podemos obtener tanto las estimaciones de los coeficientes de regresin, la bondad del ajuste del modelo elegido, los intervalos de confianza de cada coeficiente as como la matriz de covarianzas. Podemos elegir una o ms de las opciones: - Estimaciones: nos muestra coeficientes de regresin y medidas relacionadas. Los coeficientes no estandarizados (no tipificados) son los coeficientes de regresin parcial que definen la ecuacin de regresin en puntuaciones directas. Los coeficientes estandarizados () son los coeficientes que definen la ecuacin de regresin en puntuaciones tpicas. Estos coeficientes estandarizados ayudan a valorar la importancia relativa de cada variable independiente dentro de la ecuacin. Muestra las pruebas de significacin de cada coeficiente, el estadstico de contraste (t) as como su nivel crtico (Sig.). Una significacin pequea nos permite afirmar que el coeficiente es significativo. - Intervalos de confianza: nos muestra intervalos de confianza al 95% para los coeficientes de regresin. - Matriz de covarianzas: nos muestra la matriz de varianza-covarianza de los coeficientes de regresin, las varianzas en la diagonal y las covarianzas por debajo y por encima de la diagonal.
Ajuste del modelo. Muestra el coeficiente de correlacin mltiple (R mltiple), y su cuadrado (R2, coeficiente de determinacin, que expresa la proporcin de varianza de la variable dependiente que est explicada por la variable o variables independientes), la R cuadrado corregida y el error tpico de la estimacin (desviacin tpica de los residuos). Tambin, una tabla de ANOVA muestra las sumas de cuadrados, los grados de libertad, las medias cuadrticas, el valor del estadstico F y el nivel crtico (Sig.) de la F. Cambio en R cuadrado. Nos muestra el cambio en el estadstico R cuadrado que se produce al aadir o eliminar una variable independiente. Si el cambio en R cuadrado asociado a una variable es grande, significa que esa variable es un buen predictor de la variable dependiente. Descriptivos. Muestra las medias de las variables, las desviaciones tpicas y la matriz de correlaciones con las probabilidades unilaterales. Correlaciones parcial y semiparcial. Muestra las correlaciones de orden cero, semiparcial y parcial. Los valores del coeficiente de correlacin van de -1 a 1. El signo del coeficiente indica la direccin de la relacin y su valor absoluto indica la fuerza de la relacin. Los valores mayores indican que la relacin es ms estrecha.
Diagnsticos de colinealidad. Muestra las tolerancias para las variables individuales y una variedad de estadsticos para diagnosticar los problemas de colinealidad. La colinealidad (o multicolinealidad) es una situacin no deseable en la que una de las variables independientes es una funcin lineal de otras variables independientes.
Residuos. Este recuadro nos permite seleccionar una de las opciones:
- Durbin-Watson: Muestra la prueba de D-W para los residuos correlacionados serialmente. ste estadstico oscila entre 0 y 4 y toma el valor 2 cuando los residuos son completamente independientes. Los valores mayores de 2 indican autocorrelacin positiva y los menores de 2 autocorrelacin negativa. Suele asumirse que los residuos son independientes si el estadstico de D-W est entre 15 y 25. Tambin muestra estadsticos de resumen para los residuos y los valores pronosticados.
- Diagnsticos por caso: Genera diagnsticos por casos, para todos los casos que cumplan el criterio de seleccin (los valores atpicos por encima de n desviaciones tpicas).
Ejemplo en SPSS
En el men Analizar/Regresin/lineal se estiman los coeficientes de la recta de regresin que mejor se ajusta a la nube de puntos (segn el criterio de los mnimos cuadrados) para dos variables cuantitativas
Al darle clic nos aparecer el siguiente cuadro de dialogo, observe que en estadsticos se calculan, por defecto, las estimaciones de los coeficientes y la bondad de ajuste, pero existen ms opciones
Como resultado de este procedimiento se obtiene informacin sobre la estimacin de los coeficientes de la recta y la bondad de ajuste.
Practica 4 Objetivo de la prctica: que el alumno aprenda a hacer tablas de doble entrada, grficas de dispersin, covarianzas, segmentar archivos, etc. Utilizando la informacin del fichero practica.sav, responda las siguientes cuestiones: 1. Obtenga la distribucin conjunta para las variables de Comunidad Autnoma de residencia y nivel de estudios, y para los variables estado civil y sexo. Seale el porcentaje de: a) Individuos que residen en Murcia b) Individuos que residen en Murcia entre los que tienen un nivel de estudios medio c) Individuos que residen en Murcia entre los que tienen un nivel de estudios medio d) Mujeres e) Mujeres casadas f) Mujeres entre los individuos casados
2. Halle la distribucin, en forma de frecuencias relativas, del tipo de contrato para los individuos que tengan con un nivel de estudios medio. Reptalo para los individuos con un nivel de estudios alto o muy alto. 3. En el caso de los hogares de ms de cuatro miembros, halle la superficie media, mediana y modal de los pisos. Tambin para esos hogares, pero solo en la comunidad de Madrid. Cul es el gasto medio anual en ocio y el intervalo que agrupa el 50% central de la distribucin.
Excel para principiantes: Aprenda a utilizar Excel 2016, incluyendo una introducción a fórmulas, funciones, gráficos, cuadros, macros, modelado, informes, estadísticas, Excel Power Query y más