Beruflich Dokumente
Kultur Dokumente
ESTADÍSTICA DESCRIPTIVA:
REPRESENTACIONES GRÁFICAS
Objetivos
El primer paso en el análisis de datos, una vez introducidos los mismos, es realizar un
análisis descriptivo. Este análisis inicial proporciona una idea de la forma que tiene la
distribución de las observaciones y permite obtener estadísticos de tendencia central
(media, mediana y moda), de dispersión (varianza, desviación típica, rango), de forma
(asimetría, curtosis), de posición (percentiles), así como gráficos de barras, de sectores e
histograma.
El SPSS proporciona varias herramientas para realizar esta descripción, todas ellas bajo
el menú Analizar y, dentro de él, la opción Estadísticos descriptivos. Estos
procedimientos son: Frecuencias…, Descriptivos… y Explorar….
Procedimiento “Frecuencias…”
Procedimiento “Descriptivos…”
Restablecer permite restablecer todas las opciones por defecto del sistema y
elimina del Cuadro de diálogo todas las asignaciones hechas con las variables
Continuar permite aceptar las asignaciones hechas con las variables
Cancelar permite ignorar todas las asignaciones hechas con las variables
Pegar envía la sintaxis del procedimiento a la ventana de sintaxis
Aceptar, elegidas las especificaciones, se pulsa el botón Aceptar para obtener
los resultados del procedimiento.
Procedimiento “Explorar…”
Los valores fuera de los límites están etiquetados (en SPSS por el número de
caso al que corresponden, cuando no se ha especificado ninguna variable para
etiquetar). En la figura anterior se representan con un círculo aquellos valores
que sobrepasan los límites LI y LS y con un asterisco los que sobrepasan los
límites LI* y LS*, que se calculan del siguiente modo:
En resumen:
Diagrama de tallos y hojas: Una técnica que se utiliza para la observación de la forma
de la distribución de frecuencias es el diagrama de tallo y hojas, que es una
representación gráfica en la que los datos se colocan en dos niveles de tal modo que
podemos visualizar la forma de la distribución. Un diagrama de tallos y hojas consiste
en una serie de filas horizontales de números. En la primera columna se escriben los
llamados tallos, junto a ella se traza una línea vertical y, a su derecha, en cada fila se
escriben las correspondientes hojas. El número utilizado para designar una fila es su
tallo, el resto de números de la fila se denominan hojas. El tallo es la mayor porción del
número. Por ejemplo, en los números 1.0, 2.3, 1.4, 1.1, 3.5, 4.6, 5.1, 5.3, 5.7 y 5.9. Los
primeros dígitos servirán como nombre de los tallos (1, 2, 3, 4, 5). Las hojas dan una
información secundaria acerca del número, en nuestro ejemplo sería la cifra decimal.
(Véase Estadística para Biología y Ciencias Ambientales: Tratamiento Informático
mediante SPSS. Ana Lara (2010) pág 47).
Procedimiento “Gráficos”
Además de las gráficas producidas por los anteriores procedimientos descriptivos, SPSS
cuenta con un menú dedicado expresamente para la obtención de resultados gráficos.
Sirvan estas notas como una breve exposición de las características generales en el
manejo de los procedimientos gráficos. Una exposición más detallada de estos
procedimientos requeriría una extensión que sobrepasaría los objetivos de este
documento introductorio.
Seleccionando en el Menú principal Gráficos, se obtiene la siguiente ventana, donde se
muestran los distintos gráficos que se pueden realizar.
donde se selecciona el gráfico que se desee realizar (En el ejercicio guiado de esta
práctica se muestra como se realiza un histograma interactivo).
donde se puede elegir entre realizar un Gráfico de barras Simple, Agrupado o Apilado.
Si se elige Agrupado se pulsa a continuación Definir y se muestra la siguiente ventana
Para crear un gráfico de barras agrupado se debe seleccionar una variable de categorías
y una variable de agrupación. De esta forma, una vez pulsado el botón Aceptar, se
genera un gráfico de barras de las categorías elegidas agrupado por la variable de
agrupación elegida.
Evidentemente, a un mayor conocimiento de los datos que se analizan y con una idea
clara de las gráficas que se quieren obtener, se seguirá un mayor aprovechamiento de las
capacidades gráficas del SPSS. En este punto, es importante animar a la
experimentación, es decir, a la generación de distintas gráficas que pongan en evidencia,
desde distintos puntos de vista, la circunstancia que se quiera resaltar. Posteriormente
habrá tiempo de seleccionar aquella que se ajuste mejor a nuestros objetivos.
Ventana de Resultados
que indica el nombre que SPSS da por defecto al fichero de resultados, Resultados1 y
el nombre de la ventana, IBM SPSS Statistics Visor
Esta ventana de resultados presenta una Barra de menú similar a la que muestra
el Editor de datos, ampliada con dos nuevos menús: Insertar y Formato.
Ejemplo
Pulsar Definir
En la ventana resultante introducir en la casilla Eje de categorías: la variable Sexo y en
Panel mediante filas: la variable Calificación. Pulsar el botón Títulos para escribir el
título del gráfico y notas al pie. Se puede seleccionar en Los barras representan:
frecuencias relativas y acumuladas, porcentajes relativos y acumulados y otro
estadístico.
En el Editor de gráficos,
que se muestra haciendo doble clik sobre el gráfico, hay diversos botones que permiten
distintas opciones de edición: se puede cambiar el color, cambiar el tipo de letra, mover
las leyendas de los ejes….
Gráfico de sectores: Seleccionando en el Menú principal Gráficos/Cuadros de
diálogo antiguos/Sectores. En el cuadro de diálogo activar Resúmenes para grupos
de casos (activada por defecto)
Pulsar Definir
Se pulsa Aceptar
Realizar el gráfico de cajas, para la población total y agrupando por sexos, para
las variables Puntuación1 y Puntuación2.
Se pulsa Aceptar
2. Realizamos un Diagrama de cajas agrupado por la variable Sexo: Para ello,
seleccionar Agrupado y Resúmenes para distintas variables. Se pulsa Definir y en el
cuadro de diálogo resultante, introducir las variables Puntuación1 y Puntuación2 en la
casilla Las cajas representan: y la Variable Sexo en la casilla Eje de categorías:
Se pulsa Aceptar
4. Gráfico de barras agrupadas
Ejercicios
Ejercicio Guiado
A continuación se va a proceder a iniciar una aplicación
Java, comprueba que tengas instalada la Máquina Virtual
Java para poder ejecutar aplicaciones en Java.
Para estudiar el efecto de las aguas residuales de las alcantarillas que afluyen a un
lago, se toman 40 muestras distintas en las que se mide la concentración de nitrato
en el agua. Los datos obtenidos son los siguientes:
Se pide:
Ejercicios Propuestos
Ejercicio Propuesto 1
zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116
Se pide:
Ejercicio Propuesto 2
Se pide:
zona 1: 194 199 191 202 215 214 197 204 199 202 230 193 194 209
zona 2: 158 161 143 174 220 156 156 156 198 161 188 139 147 116
Se pide:
Solución:
Para saber en que zona hay mayor dispersión se debe de calcular el Coeficiente de
Variación de Pearson, CV, (Cociente entre la desviación típica y la media) que
representa el número de veces que la desviación típica contiene a la media, por tanto,
cuanto mayor sea el coeficiente de variación de Pearson significa que mayor número de
veces contiene la desviación típica a la media y por tanto la media aritmética es menos
representativa.
Los resultados nos muestran que hay mayor dispersión en la zona 2 ya que el
coeficiente de variación es mayor que el de la zona 1
Gráficamente son evidentes las diferencias existentes entre los valores de las variables.
Se observa como para el caso de nº de colonias de la zona 1, el grueso de las
observaciones se encuentra entre los valores 190 y 210, y para el nº de colonias de la
zona 2, entre 140 y 180. Lo que está en consonancia con
los resultados obtenidos anteriormente, los valores de la media, mediana y moda para el
nº de colonias de la zona 2 son inferiores a los obtenidos para el nº de colonias de la
zona 1.
3. Representar gráficamente los datos con un diagrama de caja simple (donde los
datos del gráfico son resúmenes para distintas variables).
Recordemos que:
o El diagrama de caja viene determinado por los valores de los cuartiles, y
la línea más gruesa que aparece dentro del diagrama representa el valor
de la mediana.
o Los límites, a partir de los cuales se dibujan las pestañas del diagrama de
caja y se marcan los valores extremos, se calculan del siguiente modo:
Los valores fuera de los límites están etiquetados por el número de caso al que
corresponden, puesto que no se ha especificado ninguna variable para etiquetar.
Se representan con un círculo aquellos valores que sobrepasan los límites LI y
LS y con un asterisco los que sobrepasan los límites LI* y LS*,
que se calculan del siguiente modo:
Se pide:
a) Resumen estadístico: Tabla de frecuencias, estadísticos de tendencia central, de
dispersión, de posición (Percentil 60)
c) Gráfico de cajas
Solución:
La columna Número indica las frecuencias. Es preciso, previo a realizar los análisis,
ponderar los valores de la variable Contenido mediante la variable Número
Datos/Ponderar casos
c) Gráfico de cajas
Forma una nueva variable con el nombre Contenido1 que se obtiene recodificando la
variable Contenido en tres categorías:
Para efectuar análisis estadístico para cada grupo se elige en el Menú principal
Datos/Segmentar archivo
Deja un comentario
Nombre *
Correo electrónico *
Web
Comentario