Sie sind auf Seite 1von 25

3 ESTADISTICA DESCRIPTIVA

3.1 Introduccin
Los resultados obtenidos en una investigacin cientfica no son de utilidad alguna
mientras no sean analizados e interpretados. Por lo general estos resultados son un gran
conjunto de valores que constituyen en la mayora de los casos una cantidad enorme de
cifras difciles de manejar, interpretar y presentar, especialmente cuando no se cuenta
con experiencia en el ramo de la estadstica. Esta problemtica hace necesario aprender
y manejar tcnicas, procedimientos o rutinas para ordenar los resultados de manera
significativa y relevante.

Cuando se tienen muchos valores de una misma caracterstica, la tabla de Distribucin
de Frecuencias constituye una forma compacta y til de resumir los datos, sin embargo
esta distribucin de frecuencias no es la nica forma til de organizar y presentar la
informacin contenida en un conjunto de valores. Para algunos fines, uno o dos
nmeros informativos, derivados de la distribucin de frecuencias, dan una informacin
resumida tan buena como la propia distribucin. Tales nmeros reciben el nombre de
Estadsticas Descriptivas o medidas de resumen descriptivas.

Estas medidas descriptivas son tiles para analizar e interpretar datos cuantitativos, ya
sea que estn organizados como datos no agrupados o resumidos en distribuciones de
frecuencias, datos agrupados. Son valores que definen el comportamiento de la
distribucin de los datos y se dividen en dos tipos:
medidas de tendencia central
medidas de dispersin

3.2 Medidas De Tendencia Central

La caracterstica ms importante que describe o resume un grupo de datos es su
posicin. En general los conjuntos de datos muestran una tendencia definida a agruparse
o resumirse en torno a cierto punto, por lo que para cualquier conjunto particular de
datos, es posible seleccionar un valor tpico para describir, representar o resumir todo el
38
conjunto de datos. Este valor tpico representativo se llama promedio, que es una
medida de tendencia central o posicin.

Las medidas de tendencia central, en resumen, se usan para indicar un valor que tiende a
tipificar o a ser el ms representativo de un conjunto de datos. Las tres medidas que ms
comnmente se emplean son las siguientes:
Media aritmtica
Mediana
Moda

3.2.1 Media aritmtica.

La media aritmtica de una variable estadstica es la suma de todos sus posibles
valores, dividida entre el nmero total de valores. En la prctica la mejor medida de
tendencia central es la media aritmtica. Su clculo tiene como objetivo obtener un
valor al cual tienden los datos u observaciones individuales. Para representar la media
poblacional y la media muestral se utilizan los siguientes dos smbolos:

- es la letra griega (mu) que determinar la media de una poblacin..
X - determina la media de la muestra analizada.

3.2.1.1 Media de la poblacin

La media de la poblacin es un parmetro o caracterstica fija que rara vez
conocemos, mientras que la media de la muestra X es una estadstica que es una
variable aleatoria que puede variar de magnitud de muestra a muestra en una misma
poblacin.

39
La media de una poblacin se define como:
poblacin la de elementos de nmero el es -
poblacin la de i elemento el es X
donde
i
3 2 1 1
N
N
X X X X
N
X
N
N
i
i

+ + + +
= =

=


Para calcular la media poblacional se deben conocer todos y cada uno de los elementos
que componen a la poblacin.

3.2.1.2 Media muestral

Ya que rara vez se conoce el valor de por motivos de tiempo y costo, se lleva a cabo
la seleccin de muestras que representen debidamente a la poblacin, para estimar la
media a partir de la muestra.

3.2.1.2.1 Formas para estimar la media

De acuerdo a la organizacin de los datos hay dos formas de estimar la media: para
datos no agrupados y para datos agrupados.

3.2.1.2.1.1 Datos no agrupados.
Para los datos no agrupados, la media de una muestra se define como:
muestra la de elementos de nmero el es -
muestra la de i elemento el es X
donde
i
3 2 1 1
n
n
X X X X
n
X
X
n
n
i
i

+ + + +
= =

=




40
3.2.1.2.1.2 Datos agrupados.

En el caso de que los datos se encuentren agrupados en una distribucin de frecuencias,
la media aritmtica se obtiene como el cociente de la suma de multiplicaciones de los
puntos medios o marcas de clase de cada intervalo por sus respectivas frecuencias, entre
la suma de las frecuencias, esto es:

muestra la de elementos de nmero el es
i intervalo del clase de marca la es - X
intervalos de nmero el es -
donde
1
i
2 2 1 1 1
1
1
=
+ +
= = =

=
=
=
=
n f
k
n
f X f X f X
n
f X
f
f X
X
k
i
i
k k
k
i
i i
k
i
i
k
i
i i


A continuacin se calcula con ambas ecuaciones la media con los datos del ejemplo
presentado en la seccin para medir el ingreso promedio anual de las familias que
habitan en un determinado sector.

Clculo de la media para los valores individuales (datos no agrupados).
INGRESOS ANUALES EN PESOS
1000 1110 1010 1070 1030 1000
1150 990 1090 1080 1150 1200
1050 1030 1120 1050 1030 1150
1230 1170 1180 1110 1160 1100
1100 1060 1130 1105 935 1210

333 . 1093
30
32800
30
1210 1170 1030 990 1110 1100 1230 1050 1150 1000
30
30
1
= =
+ + + + + + + + +
= =

=
X
X
X
i
i



41
Este valor, 1093.33 se interpreta como el ingreso promedio de las familias encuestadas.


Clculo de la media para los valores agrupados (datos agrupados)

De la tabla de distribucin de frecuencias se obtiene el desarrollo de la ecuacin para
este tipo de datos.

INTERVALO DE
CLASE
PUNTO MEDIO O
MARCA DE CLASE
FRECUENCIA
930 - 980 955 1
980 - 1030 1005 7
1030 - 1080 1055 5
1080 - 1130 1105 8
1130 - 1180 1155 6
1180 - 1230 1205 3
TOTAL 30

333 . 1088
30
32650
30
3615 6930 8840 5275 7035 955
30
) 3 ( 1205 ) 6 ( 1155 ) 8 ( 1105 ) 5 ( 1055 ) 7 ( 1005 ) 1 ( 955
30
1
6
1
6
1
= =
+ + + + +
=
+ + + + +
= = =

=
=
=
X
f X
f
f X
X
k
i
i i
i
i
i
i i


Cualquiera de los dos mtodos que se utilicen para estimar la media aritmtica ser
correcto. La diferencia radica en que si los datos se encuentran agrupados, el modelo
que se ajusta a esos casos puede aplicarse sin necesidad de conocer los valores
individuales.

Comparando la media aritmtica para los datos agrupados, con respecto a la media para
los valores individuales, se obtiene un error relativo de estimacin de:
42
0045731 .
3 . 1093
3 . 1093 33 . 1088
=

= e
en trminos porcentuales se tiene un .4573 % de error de estimacin que es
prcticamente despreciable.


3.2.2 Mediana
La mediana m de un conjunto de datos x
1
,x
2
,,x
n
, es el valor x
i
que se encuentra en el
punto medio o centro cuando se ordenan los valores de menor a mayor. La
interpretacin geomtrica de la mediana, es el valor de la abcisa que corresponde a la
vertical que divide un histograma en dos partes iguales.

Al igual que la Media, de acuerdo a la organizacin de los datos se tienen dos formas de
estimar la media: para datos no agrupados y para datos agrupados.

3.2.2.1 Datos no agrupados.
El procedimiento de clculo es el siguiente:
Paso 1.- Ordenar de menor a mayor los valores x
i
del conjunto de datos individuales
Paso 2.- Identificar si n es par o impar.
Paso 3.- Si n es impar, la mediana m es:

2
1 +
=
n
x m
Si n es par, la mediana m es:

2
1
2 2
+
+
=
n n
x x
m
Ejemplo 1.- Encontrar la mediana del siguiente conjunto de datos que corresponden al
tiempo requerido por una cajera para marcar la compra de artculos en un supermercado
que utiliza verificadores automticos. { 10, 15, 62, 53, 11, 38, 75, 112, 40, 22, 57 }.
Paso 1: El conjunto de datos ordenados es el siguiente:
{ 10, 11, 15, 22, 38, 40, 53, 57, 62, 75, 112 }.
Paso 2: n =11 por tanto es impar
43
Paso 3: n es impar, por tanto la mediana m es:

40
40
6
2
12
2
1 11
2
1
6
6
2
1
2
1
= =
= =
= =
+
=
+
=
+
+
x m
x x
n
x m
n
n


Ejemplo 2: Aplicando el procedimiento a los datos del ejemplo para medir el ingreso
promedio anual de las familias que habitan en un determinado sector, se tiene:
Paso 1.- El conjunto ordenado es:
{935, 990, 1000, 1000, 1010, 1030, 1030, 1030, 1050, 1050, 1060, 1070, 1080, 1090,
1100, 1100, 1105, 1110, 1110, 1120, 1130, 1150, 1150, 1150, 1160, 1170, 1180, 1200,
1210, 1230 }

Paso 2.- n =30 es un nmero par
Paso 3.- Como n es par, la mediana m es:

1100
2
2200
2
1100 1100
1100 dato el y 1100 dato el por tanto
16 1 15 1
2
y 15
2
30
2
2
16
1
2
15
2
1
2 2
= =
+
=
= = = =
= + = + = =
+
=
+
+
m
x x x x
n n
x x
m
n n
n n


3.2.2.2 Datos agrupados:

Para obtener el valor de la mediana, en el caso de que los datos estn agrupados, se debe
obtener primero la clase mediana. La clase mediana se define como la primera clase
que aparece en la tabla, para la cual la frecuencia acumulada, Fi, sea igual o exceda
inmediatamente a la suma de todas las frecuencias entre dos. De esta forma se ubica el
centro de la distribucin. Los pasos que se siguen son:


44

Paso 1.- Obtener la Clase mediana, es decir, el primer intervalo que cumpla la
condicin:
2
n
F
k

donde n - es el nmero total de datos del conjunto.
k - es el nmero del intervalo de clase que cumple la condicin
F
k
- es la frecuencia acumulada del intervalo de clase k.

Paso 2.- Calcular la mediana con la siguiente ecuacin:
C
f
F
n
L m
m
L
m


+ =
2

en donde
L
m
=Lmite inferior del intervalo que corresponde a la clase mediana.
n =Total de frecuencias (total de datos)
F
L
=Suma de frecuencias de todas las clases por debajo de la clase mediana, (frecuencia
acumulada absoluta de las clases anteriores a la clase mediana)
f
m
=Frecuencia absoluta en la clase mediana.
C =Tamao del intervalo de clase. (amplitud del intervalo)

El trmino entre parntesis circular, se define como el ajuste por el sesgo presentado en
la distribucin, conocido como factor de correccin.

45
Ejemplo.- Continuando con el ejemplo de ingreso por familias cuya tabla de
distribucin de frecuencias es:

INTERVALO
DE CLASE
MARCA
DE
CLASE
FRECUENCIA
ABSOLUTA

fi
FRECUENCIA
ABSOLUTA
ACUMULADA
F
i
FRECUENCIA
RELATIVA

f
i
/n
FRECUENCIA
RELATIVA
ACUMULADA
F
I
/n
(930 - 980] 955 1
1 1/30 1/30
(980 1030] 1005 7
8 7/30 8/30
(1030 1080] 1055 5
13 5/30 13/30
(1080 1130] 1105 8
21 8/30 21/30
(1130 1180] 1155 6
27 6/30 27/30
(1180 1230] 1205 3
30 3/30 30/30 = 1
30 30/30=1

la Mediana se obtiene llevando a cabo los pasos descritos anteriormente.
Paso 1.- n =30, por tanto 15
2
30
2
= =
n
, entonces
2
n
F
k
se cumple para el 4 intervalo, esto es, k =4, ya que la frecuencia acumulada
absoluta de F
4
=21 15. Por tanto el cuarto intervalo se identificar como la clase
mediana.

Paso 2.- Para calcular la mediana con la expresin:
C
f
F
n
L m
m
L
m


+ =
2

de la tabla se obtienen los siguientes datos:
L
m
=1080 pesos, ya que el intervalo de la clase mediana es (1080 1130]
n =30 observaciones
F
L
=13 observaciones
f
m
=8 observaciones
C =50 pesos
La Mediana es entonces


46
50 . 1092 5 . 12 1080 50 ) 25 (. 1080 50
8
13 15
1080 50
8
13
2
30
1080 = + = + =


+ =


+ = m
La interpretacin de este valor, es que la mitad de las familias entrevistadas ganan
menos de 1,092.50 pesos.

Comparando la mediana para los datos agrupados, con respecto a la mediana para los
valores individuales, se obtiene un error relativo de estimacin de:
006818 .
00 . 1100
00 . 1100 50 . 1092
=

= e
en trminos porcentuales se tiene un .6818 % de error de estimacin que es
prcticamente despreciable.

3.2.3 Moda
Al igual que la media y la mediana es una medida de tendencia central y est
representada como el valor x
i
que se repite un nmero mayor de veces en el conjunto de
datos x
1
,x
2
,,x
n
. De acuerdo a la organizacin de los datos se tienen dos formas de
estimar la moda: para datos no agrupados y para datos agrupados.

3.2.3.1 Datos no agrupados.
Se obtiene identificando el valor x
i
que se repita ms veces en el conjunto, esto es:
Moda =x
i
, donde x
i
es el valor ms repetido en el conjunto.
Ejemplo: en el conjunto de datos dados para medir el ingreso promedio anual de las
familias que habitan en un determinado sector, se tiene:

{935, 990, 1000, 1000, 1010, 1030, 1030, 1030, 1050, 1050, 1060, 1070, 1080, 1090,
1100, 1100, 1105, 1110, 1110, 1120, 1130, 1150, 1150, 1150, 1160, 1170, 1180, 1200,
1210, 1230 }.

En este conjunto hay dos valores que aparece ms veces : 1030 ( 3 veces) y 1150 ( 3
veces), por tanto la moda es:
47
Moda =1030 y 1150,
y en este se dice que el conjunto de datos es bimodal.

3.2.3.2 Datos agrupados.
La Moda estar representada por la clase que posee la ms alta frecuencia,
denominndose clase modal. La Moda ser entonces aquel valor del intervalo que posea
la mayor cantidad de frecuencias.
El clculo de la Moda se obtiene con la siguiente expresin:
C L Moda
I

+

+ =
1 2
1

Donde:
L
I
=Lmite real inferior del intervalo de clase, de la clase modal.

1
=Exceso de la frecuencia modal sobre la frecuencia de la clase contigua inferior.

2
=Exceso de la frecuencia modal sobre la frecuencia de la clase contigua superior.
C =Tamao del intervalo de clase.

El trmino entre parntesis circular, se define como el ajuste por el sesgo presentado en
la distribucin, conocido como factor de correccin.

Para los datos del ejemplo: medir el ingreso promedio anual de las familias que habitan
en un determinado sector, los datos tomados de la tabla de frecuencia son:
Intervalo de clase: (1080 1130]
Frecuencia absoluta: 8 (la mayor frecuencia absoluta de la tabla)
L
I
=1080 pesos

1
= f
4
f
3
=8 - 5 =3 observaciones
2 =f
4
f
5
=8 - 6 =2 observaciones
C =50 pesos
1110 30 1080 50
5
3
1080 50
2 3
3
1080
1 2
1
= + =

+ =

+
+ =

+

+ = C L Moda
I

Este valor de $ 1,110.00 se interpreta como el ingreso familiar que con ms frecuencia
se da, o que la mayora de las familias poseen ingresos cercanos a $ 1,110.00

48
3.2.4 Relacin entre la Media, Mediana y Moda.
3.2.4.1 Curvas asimtricas
Si las medidas de tendencia central se presentan en el siguiente orden de magnitud:

Moda < Mediana < Media o Media < Mediana < Moda

Se dice que el polgono de frecuencias (histograma) es asimtrica, lo que indica que lo
los datos se encuentran distribuidos con algn grado de tendencia. En forma forma
grfica para cada uno de los casos se tiene:

3.2.4.1.1 Curva sesgada a la derecha o con sesgo positivo (Moda < Mediana <
Media )


como se puede ver en este caso la mayora de las observaciones se encuentran por
debajo de la Media.


49
3.2.4.1.2 Curva sesgada a la izquierda o con sesgo negativo (Media < Mediana <
Moda)

En este caso la mayora de las observaciones se encuentran por encima de la Media.

La identificacin de la tendencia y nivel del sesgo de los datos, sirve para tomar
correcciones al hacer inferencia estadstica, y tambin para seleccionar la mejor medida
para lograr las estimaciones deseadas.

3.2.4.1.3 Curvas Simtricas o Normales
Si la Media, Moda y Mediana son iguales, esto es,
Media = Mediana = Moda
se dice que los datos se distribuyen simtricamente.

Media
Moda
Mediana
50
En el ejemplo de los ingresos por familia el resumen de los resultados es:

Media = 1,088.30 pesos
Mediana = 1092.50 pesos
Moda = 1,110.00

Por tanto: Media <Mediana <Moda y el sesgo que presenta es negativo o a la
izquierda.



51
3.3 Medidas De Dispersin.

La segunda caracterstica ms importante que describe un conjunto de datos, es la
dispersin. La dispersin es la cantidad de variacin, dispersin o diseminacin en los
datos, esto es, determina si los valores estn relativamente cercanos entre s, o no.

Una medida de dispersin, tiene como propsito ofrecer informacin adicional que
permita juzgar la confiabilidad de la medida de tendencia central. Entre otras
aplicaciones, se les usa para comparar distribuciones y para calcular los errores
estndar, que sern de importancia en la estadstica inferencial, en las pruebas de
hiptesis y en los intervalos de confianza.

3.3.1 Varianza

La medida de dispersin ms utilizada es la varianza, que indica qu tan dispersos se
encuentran los datos, en promedio, de la media de la poblacin.

Para representar la varianza poblacional y la varianza muestral se utilizan los siguientes
dos smbolos:

2
- donde es la letra griega (sigma ) al cuadrado que determinar la varianza de
una poblacin..
s
2
- determina la varianza de la muestra analizada.

3.3.1.1 Varianza Poblacional

La frmula para calcular la varianza de una poblacin est dada por la expresin:

52

=


=
=
=
N
i
N
i
i
i
N
i
i
N
x
x
N N
x
1
2
1 2 1
2
2
1
1
1
) (

donde
x
i
= son las observaciones que componen la poblacin, i =1, 2, 3,...,N
=la media de la poblacin.
N =El nmero total de elementos de la poblacin.

2
=La varianza de la poblacin.

3.3.1.2 Varianza Muestral

La expresin que se usa depende de si los datos estn o no agrupados.

3.3.1.2.1 Varianza Muestral para Datos No Agrupados.

Para calcular la varianza muestral, se utiliza la misma frmula reemplazando las
variables
2
y N por s
2
y n, respectivamente., esto es:

=


=
=
=
n
i
n
i
i
i
n
i
i
n
x
x
n n
x x
s
1
2
1 2 1
2
2
1
1
1
) (

donde: x - es la media muestral
x
i
- son las observaciones que componen la poblacin, i =1, 2, 3,...,n
n - el nmero total de elementos de la muestra
s
2
- La varianza de la muestra.





53
3.3.1.2.2 Varianza Muestral para Datos Agrupados.
Para calcular la varianza muestral para datos agrupados se utiliza la frmula:

=


=
=
=
k
i
k
i
i i
i i
k
i
i i
n
x f
x f
n n
x x f
s
1
2
1 2 1
2
2
1
1
1
) (

donde: x - es la media muestral
x
i
- es la marca de clase i, i =1, 2, 3,...,k
f
i
- es la frecuencia absoluta del intervalo de clase i, i =1, 2, 3,...,k
k - es el nmero de intervalos de clase
n - el nmero total de elementos de la muestra
s
2
- La varianza de la muestra.

3.3.2 Desviacin Estndar

En la varianza, los resultados son expresados en unidades originales al cuadrado, por lo
que se requiere de una medida de desviacin que sea til en unidades originales que no
estn al cuadrado. Esta media es llamada desviacin estndar y es la raz cuadrada de
la varianza.

Para representar la desviacin estndar poblacional y la desviacin estndar muestral se
utilizan los siguientes dos smbolos:

- donde es la letra griega (sigma ) que determinar la desviacin estndar de una
poblacin..
s

- determina la desviacin estndar de la muestra analizada.

3.3.2.1 Desviacin Estndar Poblacional

La frmula para calcular la desviacin estndar poblacional es:

54
1
) (
1
2

=

=
N
x
N
i
i



Este valor se calcula con la finalidad de obtener una unidad de medida que coincida con
la media para poder hacer inferencia acerca de la poblacin de inters.

3.3.2.2 Desviacin Estndar Muestral
La expresin que se usa depende de si los datos estn o no agrupados.
3.3.2.2.1 Desviacin Estndar Muestral para Datos No Agrupados.

Para calcular la desviacin estndar muestral para datos no agrupados, se utiliza la
misma frmula utilizada para el clculo de la desviacin estndar de la poblacin,
reemplazando las variables y N por s y n, respectivamente., esto es:

=
=
=
n
i
n
i
i
i
n
i
i
n
x
x
n n
x x
s
1
2
1 2 1
2
1
1
1
) (

donde: x - es la media muestral
x
i
- son las observaciones que componen la poblacin, i =1, 2, 3,...,n
n - el nmero total de elementos de la muestra
s

- es la desviacin estndar de la muestra.

3.3.2.2.2 Desviacin Estndar Muestral para Datos Agrupados.
Para calcular la desviacin estndar muestral para datos agrupados se utiliza la frmula:

=
=
=
k
i
k
i
i i
i i
k
i
i i
n
x f
x f
n n
x x f
s
1
2
1 2 1
2
1
1
1
) (

donde: x - es la media muestral
x
i
- es la marca de clase i, i =1, 2, 3,...,k
55
f
i
- es la frecuencia absoluta del intervalo de clase i, i =1, 2, 3,...,k
k - es el nmero de intervalos de clase
n - el nmero total de elementos de la muestra
s
2
- La varianza de la muestra.


Ejemplo: Con el ejemplo que se ha venido presentando del ingreso medio de las
familias de un sector de la poblacin, el clculo de la varianza y desviacin estndar
para datos no agrupados y datos agrupados se obtiene a travs de las siguientes tablas:

Tabla A- Datos No agrupados.
n Xi Xi^2
30 935.00 874225
n-1 990 980100
29 1000 1000000
1000 1000000
1010 1020100
1030 1060900
1030.00 1060900
1030.00 1060900
1050 1102500
1050 1102500
1060 1123600
1070 1144900
1080 1166400
1090 1188100
1100 1210000
1100 1210000
1105 1221025
1110 1232100
1110 1232100
1120 1254400
1130 1276900
1150 1322500
1150.00 1322500
1150 1322500
1160.00 1345600
1170 1368900
1180 1392400
1200 1440000
1210 1464100
1230 1512900
SUMA 32800.00 36013050


56
Por tanto la varianza de datos no agrupados es:
[ ] 6092 . 5231 3 . 35861333 36013050
29
1
30
) 32800 (
36013050
29
1

30
) 32800 (
36013050
29
1
1
1
1
) (
2
2
1
2
1 2 1
2
2
= =

=
=
=
n
i
n
i
i
i
n
i
i
n
x
x
n n
x x
s

y la desviacin estndar:


33 . 72 6092 . 5231
1
1
1
) (
2
1
2
1 2 1
2
= = =

=


=
=
=
s s
n
x
x
n n
x x
s
n
i
n
i
i
i
n
i
i



57
Tabla B- Datos Agrupados.

INTERVALO
DE CLASE
MARCA DE
CLASE

X
i
FRECUENCIA
ABSOLUTA

fi



X
i
2



f
i
X
i



f
i
X
i
2
(930 - 980] 955 1
912025 955 912025
(980 1030] 1005 7
1010025 7035 7070175
(1030 1080] 1055 5
1113025 5275 5565125
(1080 1130] 1105 8
1221025 8840 9768200
(1130 1180] 1155 6
1334025 6930 8004150
(1180 1230] 1205 3
1452025 3615 4356075
30=n

32650 35675750
29= n-1


[ ] 057 . 4885 3 . 35534083 35675750
29
1

30
) 32650 (
35675750
29
1
1
1
1
) (
2
1
2
1 2 1
2
2
= =

=


=
=
=
k
i
k
i
i i
i i
k
i
i i
n
x f
x f
n n
x x f
s

y la desviacin estndar es:
89 . 69 057 . 4885
1
1
1
) (
1
2
1 2 1
2
= =
=

=
= =
s
n
x f
x f
n n
x x f
s
k
i
k
i
i i
i i
k
i
i i


Este ltimo clculo significa que existe una dispersin de $ 69.89 con respecto a la
media. Esta unidad de medida es congruente con la obtenida al calcular la media
aritmtica, por lo tanto, se pueden hacer inferencias con respecto a la poblacin objeto
de estudio a travs de los denominados intervalos de confianza.

58
3.3.3 Coeficiente De Variacin

Es la dispersin relativa existente entre la desviacin estndar y la media aritmtica de
los datos. Este coeficiente est dado como el cociente resultante de dividir la desviacin
estndar entre la media:
X
S
V C = . .
El porcentaje del coeficiente de variacin es: C.V. x 100.

Esta medida de variabilidad puede ser comparada entre coeficientes que involucren
unidades experimentales diferentes, ya que expresa la desviacin estndar por unidad
experimental como una medida general del experimento. De esta forma se puede
comparar entre dos o ms coeficientes de variacin, y observar cul muestra tiene
mayor variabilidad.

La siguiente tabla servir de gua para interpretar el valor del coeficiente de variacin.
Interpretacin del coeficiente Valor del coeficiente
de variacin (%)
Variabilidad Estabilidad
Igual a 0 Nula Muy alta
Mayor de 0 hasta 20 Baja Alta
Mayor de 20 hasta 60 Moderada Moderada
Mayor de 60 hasta 90 Alta Baja
Mayor de 90 Muy alta Nula


En el ejemplo de los ingresos de las familias, el coeficiente de variacin es calculado a
continuacin.



59
Para datos no agrupados.

% 62 . 6 ) 100 ( 06615 . 0
06615 . 0
33 . 1093
33 . 72
. .
= =
= = =
PCV
X
S
V C

Para datos agrupados:

% 42 . 6 ) 100 ( 06615 . 0
06422 . 0
33 . 1088
89 . 69
. .
= =
= = =
PCV
X
S
V C


Este resultado implica una variacin baja, lo cual se traduce a que la variable presenta
una buena estabilidad en su comportamiento, por lo tanto, las estimaciones que se
deriven de ella podrn considerarse confiables.
60
3.3.3.1 Regla Emprica y Aproximacin de la Desviacin Estndar
3.3.3.1.1 Regla emprica

Para una distribucin de mediciones que es aproximadamente normal (forma de
campana) el intervalo:

mediciones las de 99% el contiene - 3
mediciones las de 95% el contiene - 2
mediciones las de 68% el contiene -
s x
s x
s x



y se puede obtener la estimacin de la desviacin estndar conociendo nicamente el
rango ( amplitud ) de los datos, ya que
Rango =4 S
Donde Rango =X
max
- X
min

S - es la desviacin estndar

Por tanto S =Rango/4.

Ejemplo: Encontrar los intervalos para el conjunto de datos agrupados del ingreso de
familias, aproximando la desviacin estndar:

S = Rango/4 = (1230-935)/4 = 295/4 = 73.75

% DE DATOS INTERVALOS
68 1088.3373.75 (1014.58, 1162.08)
95 1088.332(73.75) (940.83, 1235.83)
99 o 100 1088.333(73.75) (867.08, 1309.58)

61
3.3.4 Medida de Simetra
Como se mencion en la seccin 3.2.4, la simetra o falta de ella en una curva de
distribucin de frecuencias es importante para saber si los valores de la variable se
concentran en una determinada zona del recorrido de la variable.

El sesgo es el grado de asimetra o falta de la misma de una distribucin de frecuencia,
por lo que numricamente se puede calcular como:

simtrica. es curva la 0 sesgo Si
derecha la a sesgada esta curva la 0 Si
izquierda la a sesgada esta curva la 0 Si
) ( 3
=
>
<

=
sesgo
sesgo
s
Moda Media
s
mediana x
sesgo

Esto se puede ver en las grficas presentadas en la secciones 3.2.4.1.1, 3.2.4.1.2 y
3.2.4.1.3.

Para el ejemplo que se est trabajando el sesgo es:
Sesgo = (1088.33-1100)/73.75 = -.1582
Por tanto la grfica de distribucin de frecuencias est ligeramente sesgada a la
izquierda

62

Das könnte Ihnen auch gefallen