Beruflich Dokumente
Kultur Dokumente
Anlisis descriptivo:
Los procedimientos Frecuencias y
Descriptivos
Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse
una idea lo ms exacta posible acerca de sus caractersticas. Esto se consigue prestando atencin a tres aspectos bsicos: tendencia central, dispersin y forma de la distribucin. Ahora
bien, las medidas de tendencia central y de dispersin, y los ndices y grficos sobre la forma
de la distribucin, resultan ms o menos tiles dependiendo del tipo de variable que se intente
caracterizar. Con variables categricas, por ejemplo, las medidas de tendencia central y de
dispersin carecen de importancia comparadas con la utilidad de una distribucin de frecuencias o un grfico sobre la forma de la distribucin. Por el contrario, con variables continuas una distribucin de frecuencias pierde importancia comparada con la capacidad informativa de las medidas de tendencia central y de dispersin. Por otro lado, los diagramas que
informan sobre la forma de una distribucin son diferentes dependiendo de que la variable estudiada sea categrica o continua.
En este captulo vamos a describir dos procedimientos SPSS que permiten obtener la informacin necesaria para caracterizar apropiadamente tanto variables categricas como cuantitativas: el procedimiento Frecuencias y el procedimiento Descriptivos.
Frecuencias
Una distribucin de frecuencias informa sobre los valores concretos que adopta una variable
y sobre el nmero (y porcentaje) de veces que se repite cada uno de esos valores. El procedimiento Frecuencias permite obtener distribuciones de frecuencias, pero adems contiene
opciones para:
La utilizacin de estas opciones depende en gran medida del hecho de que la variable estudiada sea categrica o continua.
Para obtener una distribucin de frecuencias:
| Seleccionar la opcin Estadsticos descriptivos > Frecuencias... del men Analizar para
acceder al cuadro de dilogo Frecuencias que muestra la figura 10.1.
Figura 10.1. Cuadro de dilogo Frecuencias.
Vlidos
474
Perdidos
0
Vlidos
Total
Administrativo
Seguridad
Directivo
Total
Frecuencia
363
27
84
474
474
Porcentaje
76,6
5,7
17,7
100,0
100,0
Porcentaje
vlido
76,6
5,7
17,7
100,0
Porcentaje
acumulado
76,6
82,3
100,0
Puesto que no hemos seleccionado ningn estadstico, la tabla 10.1.a slo muestra el nmero
de casos vlidos y el nmero de valores perdidos.
La tabla 10.1 ofrece informacin sobre: los valores de la variable catlab (sus etiquetas),
la frecuencia absoluta de cada valor (Frecuencia), la frecuencia porcentual (Porcentaje), la frecuencia porcentual calculada sobre los casos vlidos, es decir, sin tener en cuenta los casos con
valores perdidos (Porcentaje vlido) y la frecuencia porcentual acumulada (Porcentaje acumulado). En la ltima lnea aparece el nmero total de casos.
Estadsticos
Podemos obtener informacin adicional utilizando los botones especficos del cuadro de
dilogo Frecuencias (figura 10.1). Para obtener estadsticos descriptivos:
| Pulsar el botn Estadsticos... para acceder al subcuadro de dilogo Frecuencias: Estadsticos que muestra la figura 10.2.
Figura 10.2. Subcuadro de dilogo Frecuencias: Estadsticos.
Valores percentiles. Este recuadro contiene varias opciones para solicitar cuantiles: cuartiles,
deciles, percentiles, etc.
G Cuartiles. Calcula los percentiles 25, 50 y 75, es decir, los valores por debajo de los
cuales se encuentra el 25 %, el 50 % y el 75 % de los casos, respectivamente. Para
saber cmo calcula el SPSS estos cuantiles, puede consultarse el apartado Estadsticos
del captulo 11.
G Puntos de corte para k grupos iguales. Calcula los kn1 valores que dividen la muestra en k grupos del mismo tamao. El valor por defecto de k es 10, pero puede escribirse cualquier otro valor entre 2 y 100.
G Percentiles. Permite solicitar percentiles concretos (valores que acumulan un determinado porcentaje de casos). Para obtener un percentil concreto:
G Media. Media aritmtica: suma de todas las puntuaciones dividida por el nmero de
puntuaciones.
G Mediana. Valor por debajo del cual se encuentra el 50 % de los casos (equivale al
percentil 50). Si el nmero de casos es par, la mediana se calcula como el promedio
de los dos casos centrales cuando stos se encuentran ordenados. Si el nmero de casos es impar, la mediana es el valor del caso central de la distribucin.
G Desv. tpica. Desviacin tpica: raz cuadrada de la varianza. Mide el grado en que
las puntuaciones de la variable se alejan de su media.
G Varianza. Medida de dispersin que se obtiene dividiendo por nn1 la suma de los
cuadrados de las diferencias entre cada puntuacin y la media.
G
G
G
G
G Curtosis. ndice que expresa el grado en que una distribucin acumula casos en sus
colas en comparacin con los casos acumulados en las colas de una distribucin normal con la misma varianza. La curtosis positiva indica que en las colas de la distribucin hay acumulados ms casos que en las colas de una distribucin normal (lo cual
suele coincidir con distribuciones ms puntiagudas que una distribucin normal). Los
ndices de curtosis prximos a cero indican semejanza con la curva normal.
Los resultados tambin recogen el error tpico del ndice de curtosis, el cual puede
utilizarse para tipificar el valor del ndice de curtosis y poder interpretarlo como una
puntuacin z distribuida aproximadamente N (0, 1). ndices mayores que 1,96 en valor
absoluto permiten afirmar que la distribucin se aleja de la distribucin normal.
G Los valores son puntos medios de grupos. En el caso de que la variable que deseamos
estudiar se encuentre agrupada en intervalos, esta opcin permite calcular la mediana y los
percentiles interpolando valores, es decir, considerando que los valores de la variable son
los puntos medios de intervalos uniformemente distribuidos.
Puesto que esta opcin afecta a todas las variables de la lista Variables (ver figura
10.1), no debera marcarse si una o ms variables de las listadas no se encuentran agrupadas en intervalos.
| Pulsar el botn Estadsticos... y marcar todas las opciones del subcuadro de dilogo
Frecuencias: Estadsticos (ver figura 10.2).
Con estas elecciones, el Visor muestra los estadsticos que recoge la tabla 10.2 (la tabla ha sido
pivotada para adaptarla mejor a las dimensiones de la pgina):
Tabla 10.2. Tabla de Estadsticos del procedimiento Frecuencias.
Salario actual
Estadstico
N
Media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Curtosis
Rango
Mnimo
Mximo
Suma
Percentiles
Vlidos
Perdidos
$10.00
$20.00
$25.00
$30.00
$40.00
$50.00
$60.00
$70.00
$75.00
$80.00
$90.00
Error tp.
474
0
$34,419.57
$28,875.00
$30,750
$17,075.66
$291,578,214.45
2,125
5,378
$119,250
$15,750
$135,000
$16,314,875
$21,000.00
$22,950.00
$24,000.00
$24,825.00
$26,700.00
$28,875.00
$30,750.00
$34,500.00
$37,162.50
$41,100.00
$59,700.00
$784.31
,112
,224
10
Observando la tabla vemos, por ejemplo, que el salario medio es de 34.419,57 dlares (Media),
que la mitad de los sujetos tienen salarios por debajo de 28.875 dlares (Mediana, Percentil
50), que entre el sujeto que gana ms y el que gana menos existe una diferencia de 119.250 dlares (Rango), que el 50 % de los sujetos tiene salarios comprendidos entre 24.000 y 37.162,50
dlares (Percentiles 25 y 75), que el grado de asimetra es acusadamente positivo (pues el
cociente entre el ndice de asimetra y su error tpico vale 2,125/0,112 = 18,97, y este valor es
demasiado grande para pensar que pertenece a una distribucin con valor esperado cero), y
que la acumulacin de casos en las colas (Curtosis) es mayor que la que corresponde a una
distribucin normal (pues tipificando el ndice de curtosis obtenemos 5,378/0,224 = 24,01, y
este valor es demasiado grande para pensar que pertenece a una distribucin con valor esperado
cero, que es el valor que indica una curtosis equivalente a la de una curva normal).
11
Grficos
El procedimiento Frecuencias tambin ofrece la posibilidad de obtener algunos grficos bsicos. En concreto, permite obtener grficos de barras, grficos de sectores e histogramas. (El
men Grficos de la barra de mens tambin permite obtener estos mismos grficos, adems
de otros muchos). Para obtener una grfico de barras, un grfico de sectores, o un histograma:
| Pulsar el botn Grficos... del cuadro de dilogo Frecuencias (ver figura 10.1) para acceder al subcuadro de dilogo Frecuencias: Grficos que muestra la figura 10.3.
Figura 10.3. Subcuadro de dilogo Frecuencias: Grficos.
F Histogramas. Similares a los grficos de barras, pero con las barras juntas, dando as
la impresin de continuidad. Slo pueden obtenerse con variables numricas. Para
construir el histograma, el SPSS agrupa la variable en 21 intervalos (o menos, si la
amplitud de la variable es menor que 21).
12
G Con curva normal. Esta opcin permite obtener una curva normal superpuesta sobre el histograma (la curva normal se genera a partir de la media y
la desviacin tpica de la variable representada).
Valores del grfico. En los grficos de barras y de sectores es posible decidir qu tipo de frecuencia se desea representar: