Sie sind auf Seite 1von 44

Estadstica-Unidad 4

Medidas de Tendencia Central y Medidas de Dispersin


Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 1

Herramientas numricas para el tratamiento de datos cuantitativos


Media Mediana Moda Cuartiles Percentiles Asimetra Curtosis Rango - Rango Intercuartlico Varianza Desviacin Estndar Coeficiente variacin
Estadstica - FHyCS

Tendencia central Posicin Forma

Dispersin
2

Unidad 4: Medidas de Tendencia Central y de Forma

Medidas de Tendencia Central


Permiten tener una idea rpida de cmo estn distribuidos los datos Buscan determinar un valor comn o valor central alrededor del cual est la mayora de ellos
16 14 12 10 8 6 4 2 0 2 3 4 5 6 7 Calificaciones obtenidas 8

Nmero de exmenes

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

Medidas de Posicin o de orden


Se basan en dividir los datos en porciones (cuartos, dcimos) se busca eliminar del anlisis los datos extremos, o analizar los datos por tramos Valores que toma la variable en lugares especficos Ej: percentil 20

Percentiles

P10 P20 P30 P40 P50 P60 P70 P80 P90 P100
C1 =Q1 C2= Me C3= Q3

Curtiles

Estadstica - FHyCS

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% Datos ordenados segn su valor

100%
4

Unidad 4: Medidas de Tendencia Central y de Forma

Medidas de Forma

Junto con la centralidad y la dispersin, conviene ver otras medidas que tienen que ver con la forma de la distribucin y nos da una informacin complementaria

Kurtosis

Asimetra

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

Medidas de Dispersin

Adems de conocer el punto central de un conjunto de datos tambin interesa conocer su dispersin, es decir cun lejos tienden a estar los datos del centro
45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

Ejemplo 1:
Se tienen los exmenes de 29 alumnos de Estadstica con los siguientes valores: 4, 5, 7, 5, 2, 6, 4, 5, 3, 6, 4, 7, 3, 5, 4, 4, 6, 5, 3, 8, 2, 7, 5, 3, 6, 5, 8, 7, 6

Nota: stos nmeros desordenados son muy difcil de interpretar Paso 1: Ordenar mis datos: 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma

Paso 2: se debe confeccionar una Tabla de Frecuencias (cuando son muchas categoras es til agrupar los datos en intervalos de clase - Regla emprica: entre 6 y 15 intervalos)

Calificacin (valor) (x1) 2 3 4 5 6 7 8

N de pruebas (Frecuencia) ( f1) 2 4 5 7 5 4 2

Observar los valores !!!


8

Nmero de exmenes

7 6 5 4 3 2 1 0
2 3 4 5 6 7 8

Calificaciones obtenidas

Paso 3: Aplicar las tcnicas de tratamiento de datos cuantitativos


Unidad 4: Medidas de Tendencia Central y de Forma

Estadstica - FHyCS

Medidas de Tendencia Central


Media, Mediana y Moda
16 Nmero de exmenes 14 12 10 8 6

4
2 0 2 3 4 5 6 7 Calificaciones obtenidas 8

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

La media

Resulta de dividir la suma de todos los valores observados de la variable por el nmero de observaciones

x1 x2 ... xn xi x datos no agrupados n n x1. f1 x2 . f 2 ... x y . f y xi . fi x datos agrupados n n

Smbolos: `X para una muestra (x barra) y m para una poblacin (mu)


Unidad 4: Medidas de Tendencia Central y de Forma 10

Estadstica - FHyCS

Descripcin de un conjunto de datos ms elemental: su centro Media o promedio: el centro de gravedad Ejemplos: la nota media en un examen, ingreso medio por familia, nmero de hijos medio por pareja MUY IMPORTANTE: la media no tiene por qu ser representativa Cuando puede utilizarse? Cuando los datos estn agrupados en torno a un valor central No debe utilizarse cuando estn muy dispersos, o tienen valores extremos

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 11

Ventajas y Desventajas de la Media:


Ventajas: Toma en cuenta todos los valores Es de fcil clculo e interpretacin Se puede usar para clculos Permite estimar totales a partir de muestras Desventajas: Muy afectada por valores extremos No puede calcularse en el caso de intervalos de clase abierto.
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 12

Propiedades de la Media:

Suma de las desviaciones de un conjunto de observaciones respecto a su media, es igual a cero xi ~ 0 x La media puede verse muy afectada por unas pocas observaciones cuyo valor sea muy diferente de los dems, valor atpico (outlier) Cuando el grfico que representa la distribucin de valores no es simtrico, sino sesgado, la media est desviada, hacia la cola ms larga. Cuanto ms sesgada es la distribucin: menos representativa es la media
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 13

Ejemplo 1 Clculo de la Media


x1 x2 ... xn x n

xi
n

~ x

xi. fi
n

2 2 3... 8 147 x 5.07 29 29 (2 x2) (3x 4) .. (8 x2) 147 x 5.07 29 29


Interpretacin: el promedio de las evaluaciones del exmen de Estadstica es de 5.07
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 14

Mediana:
Si todos los valores se ordenan de menor a mayor, es el valor que divide el conjunto de datos en dos mitades con igual nmero de observaciones hacia cada lado El valor de mediana puede ser uno directo o el promedio de dos valores directos Smbolo: Mdn Propiedades: La Mediana es menos sensible a datos extremos. La mediana es ms sensible que la media a la variabilidad en el muestreo.

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 15

Ventajas y Desventajas de la Mediana

Ventajas: Fcil clculo Es posible utilizar intervalos abiertos No est afectada por valores extremos Desventajas: No utiliza todos los valores No hay una frmula matemtica slo aproximacin. No puede usarse para clculos No puede obtenerse una medida total.
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 16

Mediana: Frmula y clculos


n 1 Posicin Mna 2
Muestras impares En nuestro ejemplo (muestra impar):

n n2 Posicin Mna y 2 2
Muestras pares

29 1 30 Posicin Mna posicin n 15 2 2


Posicin n 15

2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8
Interpretacin:
Estadstica - FHyCS

el Valor de la Mediana es 5
Unidad 4: Medidas de Tendencia Central y de Forma 17

La moda

50 40 30 20

El valor de mayor frecuencia Si hay dos, la distribucin es bimodal es el valor que ms se repite en un conjunto de datos. Smbolo: Mo
10 0

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15

En nuestro ejemplo el nmero que ms se repite es el nmero 5


Medidas de Resumen de nuestro ejemplo: Media: 5,0 Mediana: 5 Modo: 5 Interpretacin: el conjunto de datos de ste ejemplo presenta una distribucin simtrica
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 18

Ventajas y Desventajas del Modo


Ventajas: Fcil clculo No est afectado por valores extremos Puede obtenerse con cualquier escala Desventajas: Afectado por el redondeo y agrupamiento de datos No utiliza todas las observaciones Pueden ser 1,2, 3 o 0 No pueden hacerse clculos
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 19

90 80 70 60 50 40 30 20 10 0

Distribucin simtrica

Media Mediana Moda

Cuando hay datos extremos muy diferentes se debe usar la mediana como medida del centro.
13

Distribucin sesgada a la izquierda Asimetra negativa Distribucin sesgada a la Derecha A. positiva


30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13

10

11

12

Moda

30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13

Moda Mediana Media

Mediana

Media

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

20

Relacin entre Medidas:


DISTRIBUCIN Simtrica Positiva Asimtrica Negativa
Estadstica - FHyCS

RELACIN Media=Mediana =Modo Mo<Me<Media Media<Me<Mo


Unidad 4: Medidas de Tendencia Central y de Forma 21

Grfico Resumen: Cajas y bigotes


Presenta al mismo tiempo una medida de dispersin, tendencia central y de valores extremos Se debe determinar la mediana, el primero y el tercer cuartil y los valores mximo y mnimo y el rango IC
8 6 5 4 2
22

Ejemplo:

Mximo Mximo Cuartil 3 Mediana Cuartil 1 Mnimo Mnimo

Estadstica - FHyCS

Unidad 4: Medidas de software Infostat Grfico confeccionado conTendencia Central y de Forma

Grfico de Caja y Bigotes (Box-plot)


Min Max

Q1

mediana

Q3

Escala

Especialmente tiles cuando queremos comparar varios conjuntos de datos


Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 23

Ejercicio a resolver:
En un diario de tirada nacional presentan el siguiente grfico de caja y bigotes. La variable en estudio es calificacin en un examen de ingreso

Teniendo en cuenta esta grfica indique en forma aproximada: a)Qu calificacin obtuvo el estudiante con menor nota? b)Qu calificacin obtuvo el estudiante con mayor nota? c)Cul es el primer cuartil? d)Cul es el tercer cuartil? e)Cul es la mediana?
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 24

Medidas de Dispersin
Rango, Varianza, Desviacin Media, Desviacin Tipo
45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
25

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

Dos conjuntos de datos pueden tener la misma media pero ser muy distintos 13, 15, 17, 21, 23, 25 (media es 19) 3, 5, 7, 31, 33, 35 (media es 19) Diferencia: dispersin respecto a media Consecuencia: junto a la media (central) es necesario otro valor que exprese la dispersin.

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 26

El rango o recorrido
La diferencia entre el mximo y el mnimo de los valores de la poblacin Re x max x min Es de fcil clculo Muy afectado por los valores extremos No toma en cuenta todas las observaciones No puede hacerse operaciones algebraicas

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 27

Desviacin Media

Promedio de las distancias de los valores observados respecto a la media. Clculo: la media de las desviaciones respecto a la media
DM xi ~ x n

Problema: el numerador es cero (se compensan) Solucin: elevar al cuadrado, calcular la media de los cuadrados, y hallar la raz cuadrada
Unidad 4: Medidas de Tendencia Central y de Forma 28

Estadstica - FHyCS

Desviacin media:

Ejemplo 2: hallar la desviacin media de la serie Xi = 2, 3, 5, 8 y 12


~ 30 6 x 5

DM

xi ~ x n

xi 6
5

16 3,2 5

Usa valores absolutos (sin tomar en cuenta el signo).


Unidad 4: Medidas de Tendencia Central y de Forma 29

Estadstica - FHyCS

Desviacin Tipo o Estndar


Indica como se dispersan los datos por encima y por debajo de la media. Es igual a la raz cuadrada de la varianza Smbolo:

S para una muestra

s para una poblacin (sigma)


DS S ( xi ~ )2 x n
Unidad 4: Medidas de Tendencia Central y de Forma 30

Estadstica - FHyCS

Varianza:

Promedio de los cuadrados de las desviaciones de la media.


Varianza S 2 (xi - ~ )2 x n

Valores ms altos de varianza indican que los datos estn ms dispersos (alejados de la media) Se expresa en unidades al cuadrado (difcil interpretacin)

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 31

Clculo alternativo de la DT o DS

Igual que la media, cuando hay valores repetidos, la desviacin tpo tambin puede calcularse con esta otra frmula:
DS S ( xi ~ )2 . fi x n

Si tenemos intervalos de clase el xi es la marca de clase del intervalo


Unidad 4: Medidas de Tendencia Central y de Forma 32

Estadstica - FHyCS

Propiedades de la DT
Siempre valor positivo Slo valor 0 si todas las observaciones tienen el mismo valor Ventajas: Est definida rigurosamente Se basa en todos los valores Fcil clculo Se pueden realizar operaciones algebraicas Desventajas: Como la media, muy afectada por valores atpicos

Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 33

Observaciones e Interpretacin:

Por razones tcnicas (matemticas), cuando se calcula la desviacin tpica y la varianza de una muestra, en lugar de la de una poblacin, el denominador es (n-1) en lugar de n Mide la dispersin: cuanto ms grande, mayor dispersin. Es la media de las desviaciones respecto a la media Unidades: las mismas en las que se exprese la variable (pesos, metros, puntos en examen...) Grande o pequea? Segn lo que sepamos de la variable misma IMPORTANTE: si la DT es mayor que la media indica asimetra (sesgo), si no es menor que la mitad de la media cuidado!, puede haber sesgos.
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 34

Clculo de DS Ejemplo Tabla 4 Unidad 3


Edad 1-11 12-22 23-33 34-44 45-55 56-66 Marca de Frecuencia clase (xi) fi 6 17 28 39 50 61 8 13 14 2 1 2 40 fi.xi Xi -`X (xi - `X )2 fi.(xi -`X)2

48
221

-16,775
-5,775

281,400625 27,300625

2251,205 382,20875

33,350625 433,558125 263,250625 526,50125 741,200625 741,200625 1461,150625 2922,30125 7256,975

392
78 50 122 911

5,225
16,225 27,225 38,225 7256,975

xi . fi 911 22,775 x
n 40
Estadstica - FHyCS

( xi ~ )2 . fi x n

180,4 13,4
35

Unidad 4: Medidas de Tendencia Central y de Forma

Interpretacin de las medidas:


`X = 22,7 aos Mo = 24 aos Mdn = 22 aos Q1 = 17 aos ; Q3 = 23 aos DS = 13,4 aos El promedio de edad de los lesionados es de 22,7 aos, con una dispersin tipo de ms o menos 13,4 aos. El 50% de los valores se encuentra entre los 17 y 23 aos. Se puede utilizar Archivo Excel Unidad 4.XLSX y Archivo Infostat Unidad 4.IDB2
Unidad 4: Medidas de Tendencia Central y de Forma 36

Estadstica - FHyCS

Tratamiento de Datos:

Resumen descriptivo que se realiza para la organizacin, representacin y medicin de datos.


Tablas de Frecuencia

Tratamiento de Datos de Variable Cualitativa nominal

Grficos: Diagrama de barras. Diagrama de Pareto. Grfico circular o de sectores. Medidas: de Tendencia central: Moda

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

37

Tratamiento de Datos:

Resumen descriptivo que se realiza para la organizacin, representacin y medicin de datos.


Tablas de Frecuencia Moda

Tratamiento de Datos de Variable Cualitativa ordinal

Grficos: Diagrama de barras. Diagrama de Pareto. Grfico circular o de sectores. Medidas: de Tendencia central: Moda y Mediana

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

38

Tratamiento de Datos:

Resumen descriptivo que se realiza para la organizacin, representacin y medicin de datos.


Tablas de Frecuencia: serie simple y datos agrupados.

Tratamiento de Datos de Variable Cuantitativa Discreta

Grficos: Diagrama de barras. Diagrama de Caja. Grfico de frecuencias acumuladas.


Medidas: de Tendencia central, posicin, dispersin y de forma

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

39

Tratamiento de Datos:

Resumen descriptivo que se realiza para la organizacin, representacin y medicin de datos.


Tablas de Frecuencia: para datos agrupados.

Tratamiento de Datos de Variable Cuantitativa continua

Grficos: Histograma, Ojiva, Polgono de frecuencias, Tallos y Hojas Grfico de Caja.


Medidas: de Tendencia central, posicin, dispersin y de forma

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

40

Qu hemos visto?

Medidas de Tendencia Central Media Mediana Moda Medidas de Dispersin Varianza Desviacin Media Desviacin Tipo Rango o Recorrido Ejemplos y Ejercicios
Unidad 4: Medidas de Tendencia Central y de Forma 41

Estadstica - FHyCS

Actividades:

Conformacin de grupos de trabajo ( no ms de cinco integrantes)


Planteo y resolucin de los Ejercicio n 1 y 5 de ambas series en forma grupal y presentacin en forma oral de un grupo elegido al azar. Realice los Ejercicios de aplicacin de la Guia de Aprendizaje N4.
Unidad 4: Medidas de Tendencia Central y de Forma 42

Estadstica - FHyCS

Bibliografa:

Cap. 2 y 3 Estadstica Fcil, Clegg F., 1984,

Ed. Crtica. Espaa.

Apuntes de la Ctedra

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

43

Preguntas ??

Estadstica - FHyCS

Unidad 4: Medidas de Tendencia Central y de Forma

44

Das könnte Ihnen auch gefallen