Sie sind auf Seite 1von 14

Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Bloque 0.- REPASO CONCEPTOS BÁSICOS DE ESTADÍSTICA.

Generalidades:

Iniciaremos el curso, repasando los conceptos y procedimientos estadísticos ya estudiados en E.S.O.


y en el primer curso de Bachillerato. Insistiendo sobre todo en el manejo de tablas, y el cálculo de
medidas estadísticas de centralización, dispersión y localización.

Así mismo es importante el uso de herramientas como la calculadora, para realizar cálculos
estadísticos con relativa facilidad y rapidez.

Contenidos:
Tema 1 “ Distribuciones Unidimensionales”
1.1 Introducción:
1.1.1 Conceptos de: Población, muestra, subpoblación,
1.1.2 Variables estadísticas, clasificación:
1.2 Tablas Estadísticas: Tipos
1.3 Técnicas de recuento,
1.4 Distintos tipos de frecuencia
1.5 Medidas estadísticas:
1.5.1 Centralización: Moda, Mediana y Media
1.5.2 Dispersión: Desviación, desviación media, desviación típica, varianza.
1.5.3 Localización: Cuartiles, deciles, percentiles
1.5.4 Simetría.
1.5.5 Curtosis.

Tema 2: “Distribuciones Bidimensionales”

2.1 Introducción a la Dependencia estadística.


2.2 Variables cuantitativas:
2.2.1 Análisis de la correlación.
2.2.2 Rectas de regresión.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 1 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

TEMA 1 Distribuciones unidimensionales:


1.1 Introducción:
La palabra “estadística” suele utilizarse bajo dos significados distintos, a saber:

1º Como colección de datos numéricos.- Esto es el significado más vulgar de la palabra estadística. Se sobrentiende que
dichos datos numéricos han de estar presentados de manera ordenada y sistemática. Una información numérica
cualquiera puede no constituir una estadística, para merecer este apelativo, los datos han de constituir un conjunto
coherente, establecido de forma sistemática y siguiendo un criterio de ordenación.

Tenemos muchos ejemplos de este tipo de estadísticas. El Anuario Estadístico publicado por el Instituto Nacional de
Estadística, El Anuario de Estadísticas del Trabajo,…

2º Como ciencia.- En este significado, La Estadística estudia el comportamiento de los fenómenos de masas. Como
todas las ciencias, busca las características generales de un colectivo y prescinde de las particulares de cada elemento.
Así por ejemplo al investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo numeroso de
nacimientos y obtener después la proporción de varones. Es muy frecuente enfrentarnos con fenómenos en los que es
muy difícil predecir el resultado; así, no podemos dar una lista ,con las personas que van a morir con una cierta edad, o
el sexo de un nuevo ser hasta que transcurra un determinado tiempo de embarazo,…

Por tanto, el objetivo de la estadística es hallar las regularidades que se encuentran en los fenómenos de masa.

1.1.1 Población, elementos y caracteres.


Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto
de personas o cosas es lo que denominaremos población.

Las personas o cosas que forman parte de la población se denominan elementos. En sentido estadístico un elemento
puede ser algo con existencia real, como un automóvil o una casa, o algo más abstracto como la temperatura, un voto, o
un intervalo de tiempo.

A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico.
Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres:
- Sexo
- Edad
- Nivel de estudios
- Profesión
- Peso
- Altura
- Color de pelo
- Etc.

Luego o tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres.

La población puede ser según su tamaño de dos tipos:

Población finita: cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos
de un centro de enseñanza, o grupo clase.

Población infinita: cuando el número de elementos que la forman es infinito, o tan grande que pudiesen
considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre los productos que hay en el
mercado. Hay tantos y de tantas calidades que esta población podría considerarse infinita.

Ahora bien, normalmente en un estudio estadístico, no se puede trabajar con todos los elementos de la población sino
que se realiza sobre un subconjunto de la misma. Este subconjunto puede ser una muestra, cuando se toman un
determinado número de elementos de la población, sin que en principio tengan nada en común; o una subpoblación,
que es el subconjunto de la población formado por los elementos de la población que comparten una determinada
característica, por ejemplo de los alumnos del centro la subpoblación formada por los alumnos de 3º ESO, o la
subpoblación de los varones.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 2 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

1.1.2 Variables y atributos.

Como hemos visto, los caracteres de un elemento pueden ser de muy diversos tipos, por lo que los podemos clasificar
en: dos grandes clases:

- Variables Cuantitativas.
- Variables Cualitativas o Atributos.

Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el peso, Altura, Edad,
Número de Suspensos…
A su vez este tipo de variables se puede dividir en dos subclases:

- Cuantitativas discretas. Aquellas a las que se les puede asociar un número entero, es decir, aquellas que
por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos, páginas
de un libro, etc.
- Cuantitativas continuas: Aquellas que no se pueden expresar mediante un número entero, es decir,
aquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar
cualquier valor intermedio, por ejemplo peso, tiempo. etc.

No obstante en muchos casos el tratamiento estadístico hace que a variables discretas las trabajemos como si fuesen
continuas y viceversa.

Los atributos son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos asignar un
número. Por ejemplo Sexo Profesión, Estado Civil, etc.
A su vez las podemos clasificar en:

- Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, El nivel de
estudios, etc.
- No ordenables: Aquellas que sólo admiten una mera ordenación alfabética pero no establece orden por su
naturaleza, por ejemplo el color de pelo, seco, estado civil, etc.

1.2. Tablas Estadísticas:


A partir de este momento nos vamos a ocupar de las estadísticas de una sola variable, “Estadísticas Unidimensionales”.

Las tablas estadísticas según el número de observaciones y según el recorrido de la variable estadística, así tenemos los
siguientes tipos de tablas estadísticas:

Tablas tipo I:
Cuando el tamaño de la muestra y el recorrido de la variable son pequeños, por ejemplo si tenemos una muestra de las
edades de 5 personas, por lo que no hay que hacer nada especial simplemente anotarlas de manera ordenada en filas o
columnas.
Edad de los 5 miembros de una familia:
5, 8, 16, 38, 45

Tablas tipo II:


Cuando el tamaño de la muestra es grande y el recorrido de la variable es pequeño, por lo que hay valores de la variable
que se repiten. Por ejemplo, si preguntamos el número de personas activas que hay en 50 familias obtenemos la
siguiente tabla:

Personas Activas en 50 familias


2 1 2 2 1 2 4 2 1 1
2 3 2 1 1 1 3 4 2 2
2 2 1 2 1 1 1 3 2 2
3 2 3 1 2 4 2 1 4 1
1 3 4 3 2 2 2 1 3 3

Podemos observar que la variable toma valores comprendidos entre 1 y 4, por lo que precisaremos una tabla en la que
resumamos estos datos quedando la siguiente tabla:

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 3 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Personas Activas Número de Familias


1 16
2 20
3 9
4 5
Total 50
Tablas tipo III:
Cuando el tamaño de la muestra y el recorrido de la variable son grandes, por lo que será necesario agrupar en
intervalos los valores de la variable. Por ejemplo si a un grupo de 30 alumnos les preguntamos el dinero que en ese
momento llevan encima, nos encontramos con los siguientes datos:

450 1152 250 300 175 80 25 2680 605 785 1595 2300 5000 1200 100
5 180 200 675 500 375 1500 205 985 185 125 315 425 560 1100

Evidentemente, la variable estadística tiene un recorrido muy grande, 4998 pesetas, por lo que sí queremos hacer una
tabla con estos datos tendremos que tomar intervalos. Para decidir la amplitud de los intervalos, necesitaremos decidir
¿cuántos intervalos queremos?. Normalmente se suele trabajar con no más de 10 o 12 intervalos.
Amplitud =4998/10 = 499,8 Por lo que tomaremos intervalos de amplitud 500

Debemos tener en cuenta las siguientes consideraciones:

Tomar pocos intervalos implica que la “pérdida de información” sea mayor.


Los intervalos serán siempre Cerrados por la izquierda y Abiertos por la Derecha [ Li-1 , Li )
Procuraremos que en la decisión de intervalos los valores observados no coincidan con los valores de los extremos del
intervalo y si esto ocurre que no sea en más de un 5% del total de observaciones.

Con estas recomendaciones tendremos la siguiente tabla:

[ Li-1 , Li ) Frecuencia
[ 0,500) 16
[ 500, 1000) 6
[ 1000,1500) 3
[ 1500, 2000) 2
[ 2000, 2500) 1
[ 2500, 3000) 1
[ 3000, 3500) 0
[ 3500, 4000) 0
[ 4000, 4500) 0
[ 4500, 5000) 0
[ 5000,5500) 1

1.3. Técnicas de recuento.


Aunque hoy en día, si se realiza un estudio estadístico importante esta tarea la realiza el ordenador, ya sea por medio de
programas de estadística específicos BMDP, SPSS, o bien utilizando herramientas informáticas de propósito general
como Bases de Datos u Hojas de Cálculo

A lo largo del curso, veremos como mediante hojas de cálculo o bases de datos podemos realizar este recuento.
Veamos como realizaríamos este proceso manualmente, para ello veremos diversas técnicas de ir anotando
puntuaciones:

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 4 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Aunque el método más utilizado o conocido sea el primero, quizás el más cómodo de utilizar es el 2º en la mayoría de
los casos.
1.4. Distintos Tipos de Frecuencia:

Una de los primeros pasos que se realizan en cualquier estudio estadístico es la tabulación de resultados, es decir,
recoger la información de la muestra resumida en una tabla en la que a cada valor de la variable se le asocian
determinados números que representan el número de veces que ha aparecido, su proporción con respecto a otros
valores de la variable, etc. Estos números se denominan frecuencias:
Así tenemos los siguientes tipos de frecuencia:

Frecuencia absoluta:
La frecuencia absoluta de una variable estadística es el número de veces que aparece en la muestra dicho valor de la
variable, la representaremos por ni

Frecuencia relativa:
La frecuencia absoluta, es una medida que está influida por el tamaño de la muestra, al aumentar el tamaño de la
muestra aumentará también el tamaño de la frecuencia absoluta. Esto hace que no sea una medida útil para poder
comparar. Para esto es necesario introducir el concepto de frecuencia relativa, que es el cociente entre la frecuencia
absoluta y el tamaño de la muestra. La denotaremos por fi

f =
n i
Donde N = Tamaño de la muestra
i
N
Porcentaje:

La frecuencia relativa es un tanto por uno, sin embargo, hoy día es bastante frecuente hablar siempre en términos de
tantos por ciento o porcentajes, por lo que esta medida resulta de multiplicar la frecuencia relativa por 100. La
denotaremos por pi.
p= f i i
• 100 %

Frecuencia Absoluta Acunulada:

Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa o
cualitativa ordenable. En otro caso no tiene mucho sentido el cálculo de esta frecuencia. La frecuencia absoluta
acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que
el de la variable y lo representaremos por Ni.

Frecuencia Relativa Acunulada:

Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el
tamaño de la muestra, y la denotaremos por Fi
N
F=N i
i

Porcentaje Acumulado:
Análogamente se define el Porcentaje Acumulado y lo vamos a denotar por Pi como la frecuencia relativa acumulada
por 100.
P = F • 100 %
i i
Veamos esto con un ejemplo: Tomamos para ello los datos relativos a las personas activas.

Personas Activas Número Familias


Xi ni Fi pi Ni Fi Pi
1 16 16/50 32% 16 16/50 32%
2 20 20/50 40% 36 36/50 72%
3 9 9/50 18% 45 45/50 90%
4 5 5/50 10% 50 50/50 100%
Total 50

En este ejemplo se puede ver fácilmente como se calculan estas frecuencias.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 5 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

1.5 Medidas Estadísticas:


En el resto del tema nos ocuparemos exclusivamente de las variable cuantitativas, puesto que con los atributos no se
pueden realizar operaciones aritméticas. Como hemos estudiado, las variables estadísticas cuantitativas se dividen o
clasifican en discretas o continuas, por lo que necesitaremos precisar cómo se calculan dichas medidas en cada caso.

En las variables cuantitativas continuas, dado que la tabulación de los datos se hace mediante intervalos, necesitaremos
tomar un valor del intervalo para poder operar. Este valor se denomina marca de clase y es el punto medio del intervalo.

Las medidas estadísticas pretenden “resumir” la información de la ”muestra” para poder tener así un mejor
conocimiento de la población. Se clasifican en:

• Medidas de Centralización:
Que nos sirven para ver sobre que valores se concentra la variable.
• Medidas de Dispersión:
Nos van a dar una idea sobre la representatividad de las medidas centrales, a mayor dispersión menor
representatividad.
• Medidas de Localización:
Útiles para encontrar determinados valores importantes, para una “clasificación” de los elementos de la
muestra.
• Medidas de la Simetría:
Sirven para ver si la distribución tiene el mismo comportamiento por encima y por debajo de los valores
centrales.
• Medidas de la Forma:
Comparan la forma de la distribución con la forma de la distribución Normal, que es la distribución que se
toma como referencia.

Por otra parte el Estadístico Yule ha definido algunas propiedades deseables para una medida estadística:

1ª Debe definirse de manera objetiva: dos observadores distintos deben llegar al mismo resultado numérico.
2ª Usar todas las observaciones y no algunas de ellas solamente, de manera que si varia alguna observación la
medida considerada debe reflejar esta variación.
3ª Tener un significado concreto: la interpretación debe ser inmediata y sencilla
4ª Ser sencilla de calcular.
5ª Prestarse fácilmente al cálculo algebraico: Lo que permitirá demostraciones mas elegantes.
6ª Ser poco sensible a las fluctuaciones muestrales. Esta condición es imprescindible en la Estadística
Matemática y en la Teoría de Sondeos.

1.5.1. Medidas de Centralización: Media, Mediana y Moda:

Media:
Media aritmética:
La media aritmética de una variable se define como la suma ponderada de los valores de la variable por sus frecuencias
relativas y lo denotaremos por x

n
x = ∑ xi • f =∑ =
n
x •n
i i
xi representa el valor de la variable o en su caso la marca de clase.
i=1
i
i=1 N
Propiedades:

Si multiplicamos o dividimos todas las observaciones por un mismo número, la media queda multiplicada o dividida
por dicho numero.
Si le sumamos a todas las observaciones un mismo número, la media aumentará en dicha cantidad.
Además de la media aritmética existen otros conceptos de media, como son la media geométrica y la media armónica.

Media geométrica:
La media geométrica de N observaciones es la raíz de índice N del producto de todas las observaciones. La
representaremos por G.

G= N
x n • x n •. ....• x n
1
1
2
2
p
p

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 6 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Solo se puede calcular si no hay observaciones negativas. Es una medida estadística poco o nada usual.
Media armónica:
La media armónica de N observaciones es la inversa de la media de las inversas de las observaciones y la denotaremos
por H
1
H= n
1

x n
• i
i=1 i
Al igual que en el caso de la media geométrica su utilización es bastante poco frecuente.

Mediana:
La mediana es el valor central de la variable, es decir, supuesta la muestra ordenada en orden creciente o decreciente, el
valor que divide en dos partes la muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta o continua.

Cálculo de la mediana en el caso discreto:


Tendremos en cuenta el tamaño de la muestra.

X
Si N es Impar, hay un término central, el término N +1
2
que será el valor de la mediana.

Si N es Par, hay dos términos centrales, X , X


N N
+1 la mediana será la media de esos dos valores
2 2
Veamos un ejemplo.
N par N Impar
1,4,6,7,8,9,12,16,20, 24,25,27 N=12 1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13
Términos Centrales el 6º y 7º 9 y 12 Término Central el 7º , 12
9 + 12
Me= = 10,5 Me=12
2
Cálculo de la mediana en el caso continuo:
Si la variable es continua, la tabla vendrá en intervalos, por lo que se calcula de la siguiente forma:
Nos vamos a apoyar en un gráfico de un histograma de frecuencias acumuladas.

N LA MEDIANA SERÁ Me = Li−1 + x


−N
De donde la mediana vale:
Me = Li−1 +
2 COMOi .−1 LOS TRIANGULOS ABC Y ADE SON
SEMEJANTES• ai
donde ay es la amplitud del intervalo

N i − N ADi −1 DE
= SE TIENE QUE

Veámoslo por medio de un ejemplo.


AB BC
AD = x de la siguiente forma:
Supongamos los pesos de un grupo de 50 personas se distribuyen
AB = Li − Li.−1 = a i
N
DE = − N i.1
2
BC = N i − N i−1

Li-1 Li ni Ni Como el tamaño de la muestra es N=50, buscamos el intervalo en el que


45 55 6 6 la Frecuencia acumulada es mayor que 50/2=25, que en este caso es el
55 65 10 16 3º y aplicamos la fórmula anterior. Luego la Mediana será
65 75 19 35 50 − 16
75 85 11 46 Me= 65 + 2 • 10 = 69.74
85 95 4 50 35 − 16
Moda:
La moda es el valor de la variable que tenga mayor frecuencia absoluta, la que más se repite, es la única medida de
centralización que tiene sentido estudiar en una variable cualitativa, pues no precisa la realización de ningún cálculo.
Por su propia definición, la moda no es única, pues puede haber dos o más valores de la variable que tengan la misma
frecuencia siendo esta máxima. En cuyo caso tendremos una distribución bimodal o polimodal según el caso.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 7 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Por lo tanto el cálculo de la moda en distribuciones discretas o cualitativas no precisa de una explicación mayor; sin
embargo, debemos detenernos un poco en el cálculo de la moda para distribuciones cuantitativas continuas.

Para ello veamos como se obtiene de modo gráfico y posteriormente llegaremos a su determinación analítica
Para ello vamos a utilizar el siguiente sistema de referencia: Como Origen el Punto L i-1 Como eje horizontal la recta

horizontal que contiene al punto Li-1 y como eje vertical la recta AB.
Según este sistema de referencia las coordenadas de los puntos ABCD son las siguientes:
A(0,ni-1), B(0,ni), C(ay, ni) y D(ay, ni+1) . Queremos calcula el valor de x, que es la abscisa del punto P intersección de las
rectas AC y BD.
Recta AC Recta BD
x = y −n i −1 x = y −n i

a n −n
i i i −1 a n −n
i i+1 i
Despejando y en ambas ecuaciones
x .( n − n ) x .( n − n )
y =
i i −1
+ ni−1 y =
i i+1
+ ni
a i a i
Igualando, queda una ecuación lineal en x cuya solución es:
n −n
x = ( n − )( n − ) • a
i i+1

n n i
i i+1 i i −1

n −n
Luego la expresión definitiva para la Moda será: Mo = L i −1
+
( n − n )( n − n ) a
i
• i+1
i
i i+1 i i−1

Otros autores dan una expresión aproximada para la moda que viene dada por la siguiente expresión:

n
Mo = L i −1
+
n
i+1
+ ni −1
• ai
i+1

Veamos su cálculo mediante un ejemplo, para ello usaremos los datos del apartado anterior
.
Li-1 Li ni Ni 19 − 10
45 55 6 6 Mo = 65 + • 10 = 70,29
(19 − 10) + (19 − 11)
55 65 10 16
Utilizando la fórmula aproximada
65 75 19 35
11
75 85 11 46 Mo = 65 + • 10 = 70,24
85 95 4 50 10 + 11

1.5.2. Medidas de Dispersión:

Rango: Es la primera medida que vamos a estudiar, se define como la diferencia existente entre el valor mayor y el
menor de la distribución,. Lo notaremos como R. Realmente no es una medida muy significativa e la mayoría de los
casos, pero indudablemente es muy fácil de calcular.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 8 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Hasta el momento hemos estudiado los valores centrales de la distribución, pero también es importante conocer si los
valores en general están cerca o alejados de estos valores centrales, es por lo que surge la necesidad de estudiar medidas
de dispersión.

Hemos estudiado varias medidas de centralización, por lo que podemos hablar de desviación con respecto a cualquiera
de ellas, sin embargo, la mas utilizada es con respecto a la media.

Desviación: Es la diferencia que se observa entre el valor de la variable y la media aritmética. La denotaremos por di .

No es una medida, son muchas medidas, pues cada valor de la variable lleva asociada su correspondiente desviación,
por lo que precisaremos una medida que resuma dicha información.

La primera solución puede ser calcular la media de todas las desviaciones, es decir, si consideramos como muestra la de
todas las desviaciones y calculamos su media. Pero esta solución es mala pues como veremos siempre va a ser 0.

D=∑
n
d • n = ∑ (x − x ) • n = ∑ x • n − ∑ n • = −
n
i i
n n

N x x x
i i i i i
=0
i=1 N N N i=1 i=1 i=1
Luego por lo tanto esta primera idea no es valida, pues las desviaciones positivas se contrarrestan con las negativas.
Para resolver este problema, tenemos dos caminos:
· Tomar el valor absoluto de las desviaciones. Desviación media
· Elevar al cuadrado las desviaciones. Varianza.

Desviación media:
Es la media de los valores absolutos de las desviaciones, y la denotaremos por dm.
n
d •n =∑ x −x •n n

dm = ∑
i i i i

i=1 N N i=1
Varianza:
σ
2 2
Es la media de los cuadrados de las desviaciones, y la denotaremos por S x
o también por x
.

( xi− x) • n
2
2
d •n n n

S =σ = ∑ N = ∑
2 2 i
i i
x x
N i=1 i=1
Veamos que también es posible calcularlo como:

( xi− x)
2
x •n n 2
2
=∑
2
Sx =σ x
2 2

N
i i
x − 2x x + x De
2
− x Para ello basta con trabajar con el binomio. = i i
i=1

donde se obtiene: ∑ ( x i − x ) •
2 2
n =∑ x •n −
n
∑ x • n − 2 =∑ x • n − 2 + 2
2 n n n

N N
i=1
2 x • N x N 2x x i

i=1
i i

i=1
i i

i=1
i i

Luego queda probado.

Este estadístico tiene el inconveniente de ser poco significativo, pues se mide en el cuadrado de la unidad de la variable,
por ejemplo, si la variable viene dada en cm. La varianza vendrá en cm2.

Desviación típica:
Es la raíz cuadrada de la varianza, se denota por Sx o σ x.

2 2

∑d n ∑x n
n
• n

S =σ
2
x
= i i
= i i
−x
x
i=1 N i=1 N
Este estadístico se mide en la misma unidad que la variable por lo que se puede interpretar mejor.
Otros dos estadísticos importantes son la cuasivarianza y la cuasidesviación típica, que como veremos cuando
estudiemos el tema de estimación estadística, son los estimadores de la varianza y desviación típica poblacionales
respectivamente.

Cuasivarianza:

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 9 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Es una medida de dispersión, cuya única diferencia con la varianza es que dividimos por N-1, la representaremos por
σ
2 2
S N −1
o N −1
y la calcularemos de la siguiente forma:

d • n = ∑ ( xi− x) • n = ∑ x • n
2
2 2
n n n
N N
=∑
i
= σ N −1
2 2 2 2
S N −1
N −1
i=1
i i
N −1i=1 N −1 i=1
i i

N −1
•x = S
N −1 x
Cuasidesviación típica:
La raíz cuadrada de la cuasivarianza y la denotaremos por SN—1 o σ N-1.
N
= σ N −1 =
S N −1 σ x
N −1

Todas estas medidas de dispersión vienen influidas por la unidad en la que se mide la variable, esto implica que si
cambiamos de unidad de medida, los valores de estos estadísticos se vean a su vez modificados. Además, no permite
comparar por ejemplo, en un grupo de alumnos si los pesos o las alturas presentan mas dispersión. Pues no es posible
comparar unidades de distinto tipo.
Precisamos por lo tanto, una medida “escalar”, es decir, que no lleve asociado ninguna unidad de medida.

Coeficiente de Variación:
Es un estadístico de dispersión que tiene la ventaja de que no lleva asociada ninguna unidad, por lo que nos permitirá
decir entre dos muestras, cual es la que presenta mayor dispersión. La denotaremos por C.V.

C.V . =
σ x
• 100 %
x
Veamos por último un ejemplo de cómo se calculan todas estas medidas.

L L n N
i −1 i i i x i n •x
i i d n •d n • d
i i i i
2
i n •x
i
2
i
45 55 6 6 50 300 -19,4 116,4 2258,16 15000
55 65 10 16 60 600 -9,4 94 883,6 36000
65 75 19 35 70 1330 0,6 11,4 6,84 93100
75 85 11 46 80 880 10,6 116,6 1235,96 70400
85 95 4 50 90 360 20,6 82,4 1697,44 32400
N= 50 3470 420,8 6082 246900
x = 3470
= 69.4
50
Dm= 420.8
= 8.416
50
σ x = 6082 = 12164 246900
2
. = − 69.42 = 12164
.
50 50
σ x = 12164 . = 11029.
σ N −1 = 50 • 12164
2
. = 124122.
49
σ N −1 = 124122. = 11141
.
11029
.
C.V.= • 100 = 15892
. %
69.4

1.5.3. Medidas de Localización: Cuartiles, deciles y percentiles.

Las medidas de localización dividen la distribución en partes iguales, sirven para clasificar a un individuo o elemento
dentro de una determinada población o muestra. Así en psicología los resultados de los Test o pruebas que realizan a un
determinado individuo, se clasifican según el percentil correspondiente a la puntuación obtenida por el sujeto.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 10 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

Cuartiles
Medida de localización que divide la población o muestra en cuatro partes iguales.

Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.


Q2= Valor de la variable que deja a la izquierda el 50% de la distribución = mediana.
Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.
.
Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos, depende del tipo de variable.

Caso I: Variable cuantitativa discreta:

En este caso tendremos que observar el tamaño de la muestra: N


Veamos la tabla adjunta:

N PAR N IMPAR
N/2 PAR N/2 IMPAR (N-1)/2 PAR (N-1)/2 IMPAR
n1 n2 N1 n1 n2 n1
N N N N −1 N −1 N +1
+1 +1 +1
4 4 2 4 4 4
2

Q=x n1
+ xn2 Q1 = x n1 Q=x n1
+ xn2 Q=x
1 n1
1 2 1 2
N N N N +1 N +1 N +1
+ n1
2 n2
+1
2 n1 2 n1 2 n2
+ + 2 + +
+ n1 2
2

Q=x
+ xn2
Q=x
n1 Q =x n1
+ xn2 Q =x
3 n1 3 n1
3 2 3 2
Caso II: Variable cuantitativa continua:

En este caso el cálculo es más simple:, sea la distribución que sigue:

[Li-2 -- Li-1) ni-1 Ny-1


[Li-1 -- Li) ni Ny Intervalo donde se encuentra el Cuartil correspondiente:

−N N 3N
4 − N i −1 •
Q1 = Li −1 + 4 − i −1 • a i Q =L
N i − N i −1 a i
+
N i N i −1 3 i −1

Deciles
Medida de localización que divide la población o muestra en 10 partes iguales

No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las
variables continuas.

dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la distribución.

[Li-2 -- Li-1) ni-1 Ny-1


[Li-1 -- Li) ny Ny Intervalo donde se encuentra el Decil correspondiente:

k•N
10 − N i −1 •
d k = Li−1 + N i − N i−1 ai
k = 1 .. 9

Percentiles:

Medida de localización que divide la población o muestra en 100 partes iguales

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 11 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que lo vamos a ver sólo para las
variables continuas.

pk = Percentil k-simo es aquel valor de la variable que deja a su izquierda el k % de la distribución.

[Li-2 -- Li-1) ni-1 Ny-1


[Li-1 -- Li) ni Ny Intervalo donde se encuentra el percentil corespondiente:

k•N
100 − N i −1 •
p =L
N i − N i−1 ai
k i −1
+ k=1 .. 99

Como se puede observar la forma de calcular estas medidas es muy similar a la del cálculo de la mediana.
Veamos el cálculo de algunas de estas medidas en el ejemplo que estamos estudiando.
Vamos a calcular Q1,Q, d7, y p45
Li-1 Li ni Ni
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50

Cálculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que supere al 25% de N=50,
corresponde al 2º intervalo.(50/4=12.5)
50 − 6
Q1 = 55 + 164− 6 • 10 = 615.
Análogamente calculemos Q3, Buscamos ahora en la misma columna el correspondiente al 75 %de N que en este caso
es el 4º intervalo (3.50/4=37.5)
3.•50 − 35
4
Q3 = 75 + 46 − 35
• 10 = 77.27
Veamos ahora el decil 3º. (corresponde al 30 % 3 · 50 / 10 = 15) sería el 2º intervalo.
3.•50
10 − 6 • 10 = 64
d 3 = 55 + 16 − 6
Por último veamos el percentil 45 (45·50/100 = 22.5) Corresponde al intervalo 3º.
45.•50
100 − 16 • 10 = 68.421
p 45
= 65 +
35 − 16
Una vez estudiadas las medidas de localización surgen dos nuevas medidas de dispersión, que son:
- Recorrido intercuartílico: R =Q −Q
Q 3 1

Q −Q
- Semirecorrido intercuartílico: SR = 2Q
3 1

- Recorrido interdecílico: R =d −d
D 9 1
- Recorrido intercentilico: R =c −c
C 99 1

1.5.4. Medidas de Simetría:


Las medidas de la asimetría, al igual que la curtosis, van a ser medidas de la forma de la distribución, es frecuente que
los valores de una distribución tiendan a ser similares a ambos lados de las medidas de centralización. La simetría es
importante para saber si los valores de la variable se concentran en una determinada zona del recorrido de la variable.
As<0 As=0 As>0
Simétrica Asimetría Positiva a la izquierda

Para medir la asimetría se puede realizar atendiendo básicamente a dos criterios:

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 12 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

- Comparando la Media y la Moda.


- Comparando los valores de la variable con la media.
Comparando la Media y la Moda:
Si la diferencia x −M 0 es positiva, diremos que hay asimetría positiva o a la derecha, en el caso de que sea
negativa diremos que hay asimetría negativa o a la izquierda. No obstante, esta medida es poco operativa al no ser una
medida relativa, ya que esta influida por la unidad en que se mida la variable, por lo que se define el coeficiente de
Asimetría como:
x − Mo
As =
σ x
Esta medida es muy fácil de calcular, pero menos precisa que el coeficiente de asimetría de Pearson.

El coeficiente de asimetría de Pearson se basa en la comparación con la media de todos los valores de la variable, así
que es una medida que se basará en las diferencias x − x , como vimos en el caso de la dispersión si medimos la
i

media de esas desviaciones sería nulas, si las elevamos al cuadrado, serían siempre positivas por lo que tampoco
servirían, por lo tanto precisamos elevar esas diferencias al cubo.
Para evitar el problema de la unidad, y hacer que sea una medida escalar y por çlo tanto relativa, dividimos por el cubo
de su desviación típica. Con lo que resulta la siguiente exopresión:

( xi− x) • n
3

n

i

i=1 N
As =
σ
3
x

1.5.5 Medida de apuntamiento, Curtosis:


La curtosis es una medida del apuntamiento, que nos indicará si la distribución es muy apuntada o poco apuntada

Curtosis Negativa Curtosis nula Curtosis Positiva


Platicúrtica Mesocúrtica Leptocúrtica

Como podemos observar, el coeficiente de curtosis nos mide el grado de apuntamiento de la distribución. Este
coeficiente lo vamos a denotar por K y se calcula según la siguiente expresión:

( xi− x) • n
4

n

i

i=1 N
K= −3
σ
4
x

Veamos por último el cálculo de estos dos últimos coeficientes en el ejemplo que estamos estudiando.
L L n N
i −1 i i i x i n •x
i i d i n •d
i
3
i n •d
i
4
i
45 55 6 6 50 300 -19,4 -43808,304 849881,098
55 65 10 16 60 600 -9,4 -8305,84 78074,896
65 75 19 35 70 1330 0,6 4,104 2,4624
75 85 11 46 80 880 10,6 13101,176 138872,466
85 95 4 50 90 360 20,6 34967,264 720325,638

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 13 de 14
Bloque 0 Repaso Conceptos Básicos de Estadística: Distribuciones Unidimensionales

N= 50 3470 -4041,6 1787156,56


x=3470
= 69.4
50
Mo= 70.24
σ x = 11029
.

As=
69.4 − 70.24
= -0,892
11029
.
Coeficiente de Asimetría de −40416 .
Pearson As= 50 = -0,06025162
. 3
11029
1787156.566
K= 50 − 3 = -0,58431795
. 4
11029
Luego es una distribución asimétrica negativa o a la izquierda y Platicúrtica.

/var/www/apps/scribd/scribd/tmp/scratch4/8813514.doc Página 14 de 14

Das könnte Ihnen auch gefallen