Sie sind auf Seite 1von 12

Captulo 10

Anlisis descriptivo:
Los procedimientos Frecuencias y
Descriptivos

Al analizar datos, lo primero que conviene hacer con una variable es, generalmente, formarse
una idea lo ms exacta posible acerca de sus caractersticas. Esto se consigue prestando atencin a tres aspectos bsicos: tendencia central, dispersin y forma de la distribucin. Ahora
bien, las medidas de tendencia central y de dispersin, y los ndices y grficos sobre la forma
de la distribucin, resultan ms o menos tiles dependiendo del tipo de variable que se intente
caracterizar. Con variables categricas, por ejemplo, las medidas de tendencia central y de
dispersin carecen de importancia comparadas con la utilidad de una distribucin de frecuencias o un grfico sobre la forma de la distribucin. Por el contrario, con variables continuas una distribucin de frecuencias pierde importancia comparada con la capacidad informativa de las medidas de tendencia central y de dispersin. Por otro lado, los diagramas que
informan sobre la forma de una distribucin son diferentes dependiendo de que la variable estudiada sea categrica o continua.
En este captulo vamos a describir dos procedimientos SPSS que permiten obtener la informacin necesaria para caracterizar apropiadamente tanto variables categricas como cuantitativas: el procedimiento Frecuencias y el procedimiento Descriptivos.

Captulo 10. Anlisis descriptivo

Frecuencias
Una distribucin de frecuencias informa sobre los valores concretos que adopta una variable
y sobre el nmero (y porcentaje) de veces que se repite cada uno de esos valores. El procedimiento Frecuencias permite obtener distribuciones de frecuencias, pero adems contiene
opciones para:

Calcular algunos de los estadsticos descriptivos ms utilizados (sobre tendencia


central, posicin, dispersin, asimetra y curtosis).

Construir algunos diagramas bsicos (grficos de barras, de sectores e histogramas).

Controlar el formato de presentacin de las distribuciones de frecuencias.

La utilizacin de estas opciones depende en gran medida del hecho de que la variable estudiada sea categrica o continua.
Para obtener una distribucin de frecuencias:

| Seleccionar la opcin Estadsticos descriptivos > Frecuencias... del men Analizar para
acceder al cuadro de dilogo Frecuencias que muestra la figura 10.1.
Figura 10.1. Cuadro de dilogo Frecuencias.

Este cuadro de dilogo permite obtener distribuciones de frecuencias absolutas y porcentuales,


varios estadsticos descriptivos y algunos grficos bsicos. Para ello:

Captulo 10. Anlisis descriptivo

| Trasladar a la lista Variables, mediante el botn flecha, la variable o variables cuya


distribucin de frecuencias se desea obtener. La especificacin mnima requerida es
una variable numrica o de cadena corta; las variables de cadena larga no estn disponibles en la lista de variables del archivo de datos.

| Pulsar el botn Aceptar.


G Mostrar tablas de frecuencias. Esta opcin (activa por defecto) permite decidir si se desea o no obtener la distribucin de frecuencias. Puede desactivarse si, por ejemplo, slo
interesa ver algn grfico o algn estadstico descriptivo (como suele ocurrir cuando se
intenta describir una variable cuantitativa continua).
Si se desactiva esta opcin y no se efecta ninguna otra seleccin, los resultados slo
muestran el nmero total de casos y de valores perdidos.

Captulo 10. Anlisis descriptivo

Ejemplo (Estadsticos descriptivos > Frecuencias)


Este ejemplo muestra cmo obtener una distribucin de frecuencias con las especificaciones
mnimas que el procedimiento Frecuencias tiene establecidas por defecto:

| Seleccionar la opcin Estadsticos descriptivos > Frecuencias del men Analizar.


| Trasladar, mediante el botn flecha, la variable catlab (categora laboral) a la lista
Variables.

| Pulsar el botn Aceptar.


Aceptando estas elecciones, el Visor de resultados ofrece dos tablas pivotantes: una con el nmero de casos vlidos y de casos con valores perdidos (tabla 10.1.a), y otra con la distribucin
de frecuencias solicitada (tabla 10.1.b).
Figura 10.1.a. Tabla de estadsticos del procedimiento Frecuencias.
N
Categora laboral

Vlidos
474

Perdidos
0

Tabla 10.1.b. Tabla de frecuencias del procedimiento Frecuencias.

Vlidos

Total

Administrativo
Seguridad
Directivo
Total

Frecuencia
363
27
84
474
474

Porcentaje
76,6
5,7
17,7
100,0
100,0

Porcentaje
vlido
76,6
5,7
17,7
100,0

Porcentaje
acumulado
76,6
82,3
100,0

Puesto que no hemos seleccionado ningn estadstico, la tabla 10.1.a slo muestra el nmero
de casos vlidos y el nmero de valores perdidos.
La tabla 10.1 ofrece informacin sobre: los valores de la variable catlab (sus etiquetas),
la frecuencia absoluta de cada valor (Frecuencia), la frecuencia porcentual (Porcentaje), la frecuencia porcentual calculada sobre los casos vlidos, es decir, sin tener en cuenta los casos con
valores perdidos (Porcentaje vlido) y la frecuencia porcentual acumulada (Porcentaje acumulado). En la ltima lnea aparece el nmero total de casos.

Captulo 10. Anlisis descriptivo

Estadsticos
Podemos obtener informacin adicional utilizando los botones especficos del cuadro de
dilogo Frecuencias (figura 10.1). Para obtener estadsticos descriptivos:

| Pulsar el botn Estadsticos... para acceder al subcuadro de dilogo Frecuencias: Estadsticos que muestra la figura 10.2.
Figura 10.2. Subcuadro de dilogo Frecuencias: Estadsticos.

Valores percentiles. Este recuadro contiene varias opciones para solicitar cuantiles: cuartiles,
deciles, percentiles, etc.

G Cuartiles. Calcula los percentiles 25, 50 y 75, es decir, los valores por debajo de los
cuales se encuentra el 25 %, el 50 % y el 75 % de los casos, respectivamente. Para
saber cmo calcula el SPSS estos cuantiles, puede consultarse el apartado Estadsticos
del captulo 11.

G Puntos de corte para k grupos iguales. Calcula los kn1 valores que dividen la muestra en k grupos del mismo tamao. El valor por defecto de k es 10, pero puede escribirse cualquier otro valor entre 2 y 100.

Captulo 10. Anlisis descriptivo

G Percentiles. Permite solicitar percentiles concretos (valores que acumulan un determinado porcentaje de casos). Para obtener un percentil concreto:

| Escribir el valor deseado en el cuadro de texto Percentiles.


| Pulsar el botn Aadir para trasladar ese valor a la lista de percentiles.
| Pulsar los botones Cambiar y Borrar para modificar o eliminar, respectivamente,
valores previamente aadidos.
Tendencia central. Puede seleccionarse uno o ms de los siguientes estadsticos:

G Media. Media aritmtica: suma de todas las puntuaciones dividida por el nmero de
puntuaciones.

G Mediana. Valor por debajo del cual se encuentra el 50 % de los casos (equivale al
percentil 50). Si el nmero de casos es par, la mediana se calcula como el promedio
de los dos casos centrales cuando stos se encuentran ordenados. Si el nmero de casos es impar, la mediana es el valor del caso central de la distribucin.

G Moda. Valor que ms se repite. Si existen dos o ms valores empatados en el nmero


de repeticiones, solo se muestra el ms pequeo de ellos.

G Suma. Suma de todos los valores.


Dispersin. Puede seleccionarse uno o ms de los siguientes estadsticos:

G Desv. tpica. Desviacin tpica: raz cuadrada de la varianza. Mide el grado en que
las puntuaciones de la variable se alejan de su media.

G Varianza. Medida de dispersin que se obtiene dividiendo por nn1 la suma de los
cuadrados de las diferencias entre cada puntuacin y la media.

G
G
G
G

Amplitud. Diferencia entre el valor ms grande (mximo) y el ms pequeo (mnimo).


Mnimo. Valor ms pequeo.
Mximo. Valor ms grande.
E.T. media. Error tpico de la media: desviacin tpica de la distribucin muestral de
la media. Se obtiene dividiendo la desviacin tpica de la variable por la raz cuadrada
del nmero de casos.

Captulo 10. Anlisis descriptivo

Distribucin. Puede seleccionarse uno o ms de los siguientes estadsticos:

G Asimetra. ndice que expresa el grado de asimetra de la distribucin. La asimetra


positiva indica que los valores ms extremos se encuentran por encima de la media.
La asimetra negativa indica que los valores ms extremos se encuentran por debajo
de la media. Los ndices de asimetra prximos a cero indican simetra.
Los resultados tambin recogen el error tpico del ndice de asimetra (es decir,
la desviacin tpica de la distribucin muestral del ndice de asimetra), el cual permite
tipificar el valor del ndice de asimetra e interpretarlo como una puntuacin z con
distribucin aproximadamente N (0, 1). ndices tipificados mayores que 1,96 en valor
absoluto permiten afirmar que existe asimetra (positiva o negativa, dependiendo del
signo del ndice).

G Curtosis. ndice que expresa el grado en que una distribucin acumula casos en sus
colas en comparacin con los casos acumulados en las colas de una distribucin normal con la misma varianza. La curtosis positiva indica que en las colas de la distribucin hay acumulados ms casos que en las colas de una distribucin normal (lo cual
suele coincidir con distribuciones ms puntiagudas que una distribucin normal). Los
ndices de curtosis prximos a cero indican semejanza con la curva normal.
Los resultados tambin recogen el error tpico del ndice de curtosis, el cual puede
utilizarse para tipificar el valor del ndice de curtosis y poder interpretarlo como una
puntuacin z distribuida aproximadamente N (0, 1). ndices mayores que 1,96 en valor
absoluto permiten afirmar que la distribucin se aleja de la distribucin normal.

G Los valores son puntos medios de grupos. En el caso de que la variable que deseamos
estudiar se encuentre agrupada en intervalos, esta opcin permite calcular la mediana y los
percentiles interpolando valores, es decir, considerando que los valores de la variable son
los puntos medios de intervalos uniformemente distribuidos.
Puesto que esta opcin afecta a todas las variables de la lista Variables (ver figura
10.1), no debera marcarse si una o ms variables de las listadas no se encuentran agrupadas en intervalos.

Captulo 10. Anlisis descriptivo

Cundo utilizar cada estadstico


Por lo que se refiere a los percentiles, slo tiene sentido calcularlos con variables al menos ordinales. Carecen de significado con variables nominales.
Entre las medidas de tendencia central, la media requiere variables cuantitativas (de intervalo o razn, aunque tambin suele calcularse con datos ordinales). La mediana es un estadstico tpicamente ordinal (requiere variables ordinales al menos). Al contrario de lo que ocurre
con la media, la mediana es insensible a la presencia de valores extremos y, por tanto, es preferible a la media cuando la distribucin es asimtrica. La moda sirve para todo tipo de variables,
pero es ms apropiada para caracterizar datos categricos porque, por un lado, es un estadstico
que slo aprovecha informacin nominal y, por otro, con variables continuas es esperable que
todos los valores tengan una frecuencia igual a 1.
En cuanto a las medidas de dispersin, la desviacin tpica, la varianza y el error tpico de
la media nicamente poseen significado con variables cuantitativas (de intervalo o razn, aunque tambin suelen calcularse con datos ordinales). La amplitud o rango es apropiada para todo
tipo de variables, excepto para las nominales, en las que no tiene sentido hablar de dispersin.
En lo relativo a los ndices de asimetra y curtosis, de nuevo solo tiene sentido calcularlos
con variables cuantitativas.

Captulo 10. Anlisis descriptivo

Ejemplo (Estadsticos descriptivos > Frecuencias > Estadsticos)


Este ejemplo muestra cmo obtener algunos estadsticos descriptivos utilizando el procedimiento Frecuencias:

| En el cuadro de dilogo Frecuencias (ver figura 10.1), seleccionar la variable salario


y trasladarla a la lista Variables.

| Pulsar el botn Estadsticos... y marcar todas las opciones del subcuadro de dilogo
Frecuencias: Estadsticos (ver figura 10.2).
Con estas elecciones, el Visor muestra los estadsticos que recoge la tabla 10.2 (la tabla ha sido
pivotada para adaptarla mejor a las dimensiones de la pgina):
Tabla 10.2. Tabla de Estadsticos del procedimiento Frecuencias.
Salario actual
Estadstico
N
Media
Mediana
Moda
Desv. tp.
Varianza
Asimetra
Curtosis
Rango
Mnimo
Mximo
Suma
Percentiles

Vlidos
Perdidos

$10.00
$20.00
$25.00
$30.00
$40.00
$50.00
$60.00
$70.00
$75.00
$80.00
$90.00

Error tp.

474
0
$34,419.57
$28,875.00
$30,750
$17,075.66
$291,578,214.45
2,125
5,378
$119,250
$15,750
$135,000
$16,314,875
$21,000.00
$22,950.00
$24,000.00
$24,825.00
$26,700.00
$28,875.00
$30,750.00
$34,500.00
$37,162.50
$41,100.00
$59,700.00

$784.31

,112
,224

Captulo 10. Anlisis descriptivo

10

Observando la tabla vemos, por ejemplo, que el salario medio es de 34.419,57 dlares (Media),
que la mitad de los sujetos tienen salarios por debajo de 28.875 dlares (Mediana, Percentil
50), que entre el sujeto que gana ms y el que gana menos existe una diferencia de 119.250 dlares (Rango), que el 50 % de los sujetos tiene salarios comprendidos entre 24.000 y 37.162,50
dlares (Percentiles 25 y 75), que el grado de asimetra es acusadamente positivo (pues el
cociente entre el ndice de asimetra y su error tpico vale 2,125/0,112 = 18,97, y este valor es
demasiado grande para pensar que pertenece a una distribucin con valor esperado cero), y
que la acumulacin de casos en las colas (Curtosis) es mayor que la que corresponde a una
distribucin normal (pues tipificando el ndice de curtosis obtenemos 5,378/0,224 = 24,01, y
este valor es demasiado grande para pensar que pertenece a una distribucin con valor esperado
cero, que es el valor que indica una curtosis equivalente a la de una curva normal).

Captulo 10. Anlisis descriptivo

11

Grficos
El procedimiento Frecuencias tambin ofrece la posibilidad de obtener algunos grficos bsicos. En concreto, permite obtener grficos de barras, grficos de sectores e histogramas. (El
men Grficos de la barra de mens tambin permite obtener estos mismos grficos, adems
de otros muchos). Para obtener una grfico de barras, un grfico de sectores, o un histograma:

| Pulsar el botn Grficos... del cuadro de dilogo Frecuencias (ver figura 10.1) para acceder al subcuadro de dilogo Frecuencias: Grficos que muestra la figura 10.3.
Figura 10.3. Subcuadro de dilogo Frecuencias: Grficos.

Tipo de grfico. Puede elegirse entre:

F Ninguno. No se genera ningn grfico. Es la opcin por defecto.


F Grficos de barras. Grficos en los que a cada valor de la variable se le asigna una
barra con altura equivalente a su frecuencia absoluta o porcentual. La escala de la
altura de las barras se ajusta automticamente teniendo en cuenta la frecuencia ms
alta de las representadas.

F Grficos de sectores. Grficos circulares en los que a cada valor de la variable se le


asigna un sector de tamao equivalente a su frecuencia absoluta o porcentual.

F Histogramas. Similares a los grficos de barras, pero con las barras juntas, dando as
la impresin de continuidad. Slo pueden obtenerse con variables numricas. Para
construir el histograma, el SPSS agrupa la variable en 21 intervalos (o menos, si la
amplitud de la variable es menor que 21).

Captulo 10. Anlisis descriptivo

12

G Con curva normal. Esta opcin permite obtener una curva normal superpuesta sobre el histograma (la curva normal se genera a partir de la media y
la desviacin tpica de la variable representada).
Valores del grfico. En los grficos de barras y de sectores es posible decidir qu tipo de frecuencia se desea representar:

F Frecuencias. La escala y la etiqueta del eje correspondiente a la altura de las barras


(o al tamao de los sectores) estn expresadas en frecuencias absolutas. Es la opcin
por defecto.

F Porcentajes. La escala y la etiqueta del eje correspondiente a la altura de las barras


(o al tamao de los sectores) estn expresadas en frecuencias porcentuales.

Das könnte Ihnen auch gefallen