Sie sind auf Seite 1von 23

Medidas de tendencia central

Medidas de tendencia central


Medidas de Posicin: son aquellos valores numricos que nos permiten o bien dar alguna medida de tendencia central, dividiendo el recorrido de la variable en dos, o bien fragmentar la cantidad de datos en partes iguales. Las ms usuales son la media, la mediana, la moda, los cuartiles, quintiles, deciles y percentiles. Pueden ser de dos tipos: de tendencia central o de tipismo.
Medidas de Dispersin: se llaman medidas de dispersin aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentracin de los datos en un cierto sector del recorrido de la variable. Se trata de coeficientes para variables cuantitativas. Las ms usuales son el desvo estndar y la varianza.

La Media
medias de los diferentes conjuntos. 3) Es posible hallar la media de La idea de media o promedio (tambin llamada media aritmtica) formaliza el concepto intuitivo de punto de equilibrio de las observaciones. Es decir, es el punto medio del recorrido de la variable segn la cantidad de valores obtenidos.
Ese valor tiene varias propiedades importantes. 1) Si se suma la distancia de todos los valores respecto de la media, esa suma da cero. 2) Si se toman una cantidad cualesquiera de conjuntos de valores, cada uno con su respectiva media, la media del conjunto general es igual a la suma de cada una de las un conjunto de valores de una variable a partir de tomar la distancia de las observaciones a un valor cualquiera (pertenezca o no al recorrido de la variable) 4) si a un conjunto de observaciones de una variable se le realiza una operacin matemtica usando un valor constante, entonces la media del nuevo grupo de valores as obtenidos es igual a la aplicacin de la misma operacin matemtica usando ese valor constante sobre la media original.

El clculo de la Media
Dado un conjunto de observaciones la media se representa mediante y se obtiene dividiendo la suma de todos los datos por el nmero de ellos, es decir:

La interpretacin de la media como centro (o punto de equilibrio) de los datos se apoya en una propiedad que afirma que la suma de las desviaciones

de un conjunto de observaciones a su media es igual a cero; es decir, puede probarse que

Media aritmtica (I)

La media aritmtica de un conjunto de datos es el cociente entre la suma de todos los datos y el nmero de estos. Ejemplo: las notas de Juan el ao pasado fueron: 5, 6, 4, 7, 8, 4, 6 Hay 7 datos que suman 40

La nota media de Juan es:

5 6 4 7 8 4 6 40 5,7 Nota media = 7 7

Media aritmtica (II)

Clculo de la media aritmtica cuando los datos se repiten. 1. Se multiplican los datos por sus frecuencias absolutas respectivas, y se suman. 2. El resultado se divide por el total de datos. Ejemplo. Las notas de un grupo de alumnos fueron:
Notas Frecuencia Notas x absoluta F. absoluta 3 5 15 5 8 40 6 10 60 7 2 14 Total 25 129

Datos por frecuencias

Media

129 5,1 25

Total de datos

Mediana
La mediana, a diferencia de la media no busca el valor central del recorrido de la variable segn la cantidad de observaciones, sino que busca determinar el valor que tiene aquella observacin que divide la cantidad de observaciones en dos mitades iguales. Por lo tanto es necesario atender a la ordenacin de los datos, y debido a ello, este clculo depende de la posicin relativa de los valores obtenidos. Es necesario, antes que nada, ordenar los datos de menor a mayor (o viceversa).

en caso que N sea impar

La mediana

La mediana de un conjunto de datos es un valor del mismo tal que el nmero de datos menores que l es igual al nmero de datos mayores que l.

Ejemplo:

Los pesos, en kilogramos, de 7 jugadores de un equipo de ftbol son: 72, 65, 71, 56, 59, 63, 72 56, 59, 63, 65, 71, 72, 72

1. Ordenamos los datos:

2. El dato que queda en el centro es 65. Caso:

La mediana vale 65.

Si el nmero de datos fuese par, la mediana es la media aritmtica de los dos valores centrales.

Para el conjunto 56, 57, 59, 63, 65, 71, 72, 72, la mediana es: 63 65 64 2

Moda
La moda, es aquel dato, aquel valor de la variable que ms se repite; es decir, aquel valor de la variable (que puede no ser un nico valor) con una frecuencia mayor.

La moda

La moda de un conjunto de datos es el dato que ms se repite. Ejemplo. Una zapatera ha vendido en una semana los zapatos que se reflejan en la tabla:
38 16 39 21 40 30 41 35 42 29 43 18 44 10 45 7

N de calzado N de personas

El nmero de zapato ms vendido, el dato con mayor frecuencia absoluta, es el 41.

Lo compran 35 personas

La moda es 41.

Cuartil, Quintiles, Deciles, Percentiles


La mediana, como vimos, separa en dos mitades el conjunto ordenado de observaciones. Podemos a su vez subdividir cada mitad en dos, de tal manera que resulten cuatro partes iguales. Cada una de esas divisiones se conoce como Cuartil y lo simbolizaremos mediante la letra Q agregando un subndice segn a cual de los cuatro cuartiles nos estemos refiriendo. Se llama primer cuartil (Q1) a la mediana de la mitad que contiene los datos ms pequeos. Este cuartil, corresponde al menor valor que supera o que deja por debajo de l a la cuarta parte de los datos. Se llama tercer cuartil (Q3) a la mediana de la mitad formada por las observaciones ms grandes. El tercer cuartil es el menor valor que supera o que deja por debajo de l a las tres cuartas partes de las observaciones. Con esta terminologa, la mediana es el segundo cuartil (Q2) y el cuarto cuartil (Q4) coincide con el valor que toma el ltimo dato, luego de ordenados.

Medidas de Dispersin
El desvo estndar Es posible identificar conjuntos de datos que a pesar de ser muy distintos en trminos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentracin o dispersin alrededor de la media.

Una manera de evitar que los distintos signos se compensen es elevarlas al cuadrado, de manera que todas las desviaciones sean positivas. La raz cuadrada del promedio de estas cantidades recibe el nombre de desvo estndar, o desviacin tpica y es representada por la siguiente frmula:

A mayor valor del coeficiente del desvo estndar, mayor dispersin de los datos con respecto a su media. Es un valor que representa los promedios de todas las diferencias individuales de las observaciones respecto a un punto de referencia comn, que es la media aritmtica. Se entiende entonces que cuando este valor es ms pequeo, las diferencias de los valores respecto a la media, es decir, los desvos, son menores y, por lo tanto, el grupo de observaciones es ms homogneo que si el valor de la desviacin estndar fuera ms grande. O sea que a menor dispersin mayor homogeneidad y a mayor dispersin, menor homogeneidad. La Varianza El cuadrado de la desviacin estndar recibe el nombre de varianza y se representa por . La suma de los cuadrados de los desvos de la totalidad de las observaciones, respecto de la media aritmtica de la distribucin, es menor que la suma de los cuadrados de los desvos respecto de cualquier otro valor que no sea la media aritmtica. Si observamos, veremos que la varianza no es ms que el desvo estndar al cuadrado. Precisamente la manera de simbolizarla es. Por lo mismo, el desvo estndar puede definirse como la raz cuadrada de la varianza

8 cms.

Aqu tenemos 9 rectngulos cuya altura es de 8 centmetros (y todos tienen la misma base). Existe alguna variacin respecto de su altura entre estos rectngulos? Cul es el promedio de la altura de estos rectngulos? 8+8+8+8+8+8+8+8+8 9 = 72 =8 9

10 cms 6 cms 8 cms.

El quinto rectngulo y el octavo rectngulo en un acto de rebelda cambiaron su altura. El quinto rectngulo, ahora de color rojo, mide 10 centmetros, y el octavo rectngulo, de color azul, mide 6 centmetros? Cul es el nuevo promedio de estos 9 rectngulos? 8 + 8 + 8 + 8 + 10 + 8 + 8 + 6 + 8 9

72 =8 9

... el mismo promedio! Pero... ha habido variacin?

10 cms 6 cms

8 cms.

El rectngulo rojo tiene +2 centmetros sobre el promedio, y el rectngulo azul tiene 2 centmetros bajo el promedio. Los otros rectngulos tienen cero diferencia respecto del promedio. Si sumamos estas diferencias de la altura respecto del promedio, tenemos 0+0+0+0+2+0+02+0 =0 Este valor nos parece indicar que no ha habido variabilidad! Y sin embargo, ante nuestros ojos, sabemos que hay variacin.

10 cms 6 cms 8 cms.

Una forma de eliminar los signos menos de aquellas diferencias que sean negativas, esto es de aquellos mediciones que estn bajo el promedio, es elevar al cuadrado todas las diferencias, y luego sumar... 02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 8 Y este resultado repartirlo entre todos los rectngulos, es decir lo dividimos por el nmero de rectngulos que es 9 02 + 02 + 02 + 02 + 22 + 02 + 02 + ( 2)2 + 02 = 9 8 = 0,89 9

10 cms 6 cms 8 cms.

Se dice entonces que la varianza fue de 0,89 Observemos que las unidades involucradas en el clculo de la varianza estn al cuadrado. En rigor la varianza es de 0,89 centmetros cuadrados. De manera que se define

0,89 0,943
La raz cuadrada de la varianza se llama desviacin estndar

10 cms 6 cms 8 cms.

Que la desviacin estndar haya sido de 0,943 significa que en promedio la altura de los rectngulos variaron (ya sea aumentando, ya sea disminuyendo) en 0,943 centmetros. Es claro que esta situacin es en promedio, puesto que sabemos que los causantes de la variacin fueron los rectngulos quinto y octavo. Esta variacin hace repartir la culpa a todos los dems rectngulos que se portaron bien. La desviacin estndar mide la dispersin de los datos respecto del promedio

10 cms 8 cms. 8 cms. 8 cms. 8 cms. 8 cms. 7 cms. 6 cms 4 cms

Cul es la varianza y la desviacin estndar de las alturas de los rectngulos?

En primer lugar debemos calcular el promedio


8 + 4 + 8 + 8 + 10 + 8 + 7 + 6 + 8 = 7,44 9 Luego debemos calcular la varianza

10 cms
8 cms. 4 cms 8 cms. 8 cms. 8 cms. 7 cms. 8 cms. 6 cms

0,56 -3,44 0,56

0,56

2,56

0,56 -0,44

-1,44 0,56

7,44 Promedio 0,562 + (-3,44)2 + 0,562 + 0,562 + 2,562 + 0,562 + (-0,44)2 + (-1,44)2 + 0,562 9 Este es el valor de la varianza 22,2224 9

= 2,469

10 cms
8 cms. 4 cms 8 cms. 8 cms. 8 cms. 7 cms. 8 cms. 6 cms

7,44

Promedio
Si la varianza fue de 2,469, entonces la desviacin estndar es de...

2, 469 1,57
Lo que significa que, en promedio, los rectngulos se desviaron ms o menos (ms arriba o ms abajo) en 1,57 centmetros.

Para entender la varianza necesariamente debe saber: Sumar Restar

Multiplicar
Dividir Potencia de orden 2 Raz cuadrada Y es claro que esto no es suficiente (salvo que queramos que aprenda de memoria los clculos). Necesitamos estimular su imaginacin para que vea la variabilidad existente en la naturaleza. Entregue una lista de fenmenos en que un mismo atributo tenga variabilidad si se mide este atributo a un nmero de individuos u objetos.