Beruflich Dokumente
Kultur Dokumente
Dispersin
2
Permiten tener una idea rpida de cmo estn distribuidos los datos Buscan determinar un valor comn o valor central alrededor del cual est la mayora de ellos
16 14 12 10 8 6 4 2 0 2 3 4 5 6 7 Calificaciones obtenidas 8
Nmero de exmenes
Estadstica - FHyCS
Se basan en dividir los datos en porciones (cuartos, dcimos) se busca eliminar del anlisis los datos extremos, o analizar los datos por tramos Valores que toma la variable en lugares especficos Ej: percentil 20
Percentiles
P10 P20 P30 P40 P50 P60 P70 P80 P90 P100
C1 =Q1 C2= Me C3= Q3
Curtiles
Estadstica - FHyCS
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% Datos ordenados segn su valor
100%
4
Medidas de Forma
Junto con la centralidad y la dispersin, conviene ver otras medidas que tienen que ver con la forma de la distribucin y nos da una informacin complementaria
Kurtosis
Asimetra
Estadstica - FHyCS
Medidas de Dispersin
Adems de conocer el punto central de un conjunto de datos tambin interesa conocer su dispersin, es decir cun lejos tienden a estar los datos del centro
45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Estadstica - FHyCS
Ejemplo 1:
Se tienen los exmenes de 29 alumnos de Estadstica con los siguientes valores: 4, 5, 7, 5, 2, 6, 4, 5, 3, 6, 4, 7, 3, 5, 4, 4, 6, 5, 3, 8, 2, 7, 5, 3, 6, 5, 8, 7, 6
Nota: stos nmeros desordenados son muy difcil de interpretar Paso 1: Ordenar mis datos: 2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8
Paso 2: se debe confeccionar una Tabla de Frecuencias (cuando son muchas categoras es til agrupar los datos en intervalos de clase - Regla emprica: entre 6 y 15 intervalos)
Nmero de exmenes
7 6 5 4 3 2 1 0
2 3 4 5 6 7 8
Calificaciones obtenidas
Estadstica - FHyCS
4
2 0 2 3 4 5 6 7 Calificaciones obtenidas 8
Estadstica - FHyCS
La media
Resulta de dividir la suma de todos los valores observados de la variable por el nmero de observaciones
Estadstica - FHyCS
Descripcin de un conjunto de datos ms elemental: su centro Media o promedio: el centro de gravedad Ejemplos: la nota media en un examen, ingreso medio por familia, nmero de hijos medio por pareja MUY IMPORTANTE: la media no tiene por qu ser representativa Cuando puede utilizarse? Cuando los datos estn agrupados en torno a un valor central No debe utilizarse cuando estn muy dispersos, o tienen valores extremos
Propiedades de la Media:
Suma de las desviaciones de un conjunto de observaciones respecto a su media, es igual a cero xi ~ 0 x La media puede verse muy afectada por unas pocas observaciones cuyo valor sea muy diferente de los dems, valor atpico (outlier) Cuando el grfico que representa la distribucin de valores no es simtrico, sino sesgado, la media est desviada, hacia la cola ms larga. Cuanto ms sesgada es la distribucin: menos representativa es la media
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 13
xi
n
~ x
xi. fi
n
Mediana:
Si todos los valores se ordenan de menor a mayor, es el valor que divide el conjunto de datos en dos mitades con igual nmero de observaciones hacia cada lado El valor de mediana puede ser uno directo o el promedio de dos valores directos Smbolo: Mdn Propiedades: La Mediana es menos sensible a datos extremos. La mediana es ms sensible que la media a la variabilidad en el muestreo.
Ventajas: Fcil clculo Es posible utilizar intervalos abiertos No est afectada por valores extremos Desventajas: No utiliza todos los valores No hay una frmula matemtica slo aproximacin. No puede usarse para clculos No puede obtenerse una medida total.
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 16
n n2 Posicin Mna y 2 2
Muestras pares
2, 2, 3, 3, 3, 3, 4, 4, 4, 4, 4, 5, 5, 5, 5, 5, 5, 5, 6, 6, 6, 6, 6, 7, 7, 7, 7, 8, 8
Interpretacin:
Estadstica - FHyCS
el Valor de la Mediana es 5
Unidad 4: Medidas de Tendencia Central y de Forma 17
La moda
50 40 30 20
El valor de mayor frecuencia Si hay dos, la distribucin es bimodal es el valor que ms se repite en un conjunto de datos. Smbolo: Mo
10 0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
90 80 70 60 50 40 30 20 10 0
Distribucin simtrica
Cuando hay datos extremos muy diferentes se debe usar la mediana como medida del centro.
13
10
11
12
Moda
30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13
Mediana
Media
Estadstica - FHyCS
20
Presenta al mismo tiempo una medida de dispersin, tendencia central y de valores extremos Se debe determinar la mediana, el primero y el tercer cuartil y los valores mximo y mnimo y el rango IC
8 6 5 4 2
22
Ejemplo:
Estadstica - FHyCS
Q1
mediana
Q3
Escala
Ejercicio a resolver:
En un diario de tirada nacional presentan el siguiente grfico de caja y bigotes. La variable en estudio es calificacin en un examen de ingreso
Teniendo en cuenta esta grfica indique en forma aproximada: a)Qu calificacin obtuvo el estudiante con menor nota? b)Qu calificacin obtuvo el estudiante con mayor nota? c)Cul es el primer cuartil? d)Cul es el tercer cuartil? e)Cul es la mediana?
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 24
Medidas de Dispersin
Rango, Varianza, Desviacin Media, Desviacin Tipo
45 40 35 30 25 20 15 10 5 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
25
Estadstica - FHyCS
Dos conjuntos de datos pueden tener la misma media pero ser muy distintos 13, 15, 17, 21, 23, 25 (media es 19) 3, 5, 7, 31, 33, 35 (media es 19) Diferencia: dispersin respecto a media Consecuencia: junto a la media (central) es necesario otro valor que exprese la dispersin.
El rango o recorrido
La diferencia entre el mximo y el mnimo de los valores de la poblacin Re x max x min Es de fcil clculo Muy afectado por los valores extremos No toma en cuenta todas las observaciones No puede hacerse operaciones algebraicas
Desviacin Media
Promedio de las distancias de los valores observados respecto a la media. Clculo: la media de las desviaciones respecto a la media
DM xi ~ x n
Problema: el numerador es cero (se compensan) Solucin: elevar al cuadrado, calcular la media de los cuadrados, y hallar la raz cuadrada
Unidad 4: Medidas de Tendencia Central y de Forma 28
Estadstica - FHyCS
Desviacin media:
DM
xi ~ x n
xi 6
5
16 3,2 5
Estadstica - FHyCS
Estadstica - FHyCS
Varianza:
Valores ms altos de varianza indican que los datos estn ms dispersos (alejados de la media) Se expresa en unidades al cuadrado (difcil interpretacin)
Clculo alternativo de la DT o DS
Igual que la media, cuando hay valores repetidos, la desviacin tpo tambin puede calcularse con esta otra frmula:
DS S ( xi ~ )2 . fi x n
Estadstica - FHyCS
Propiedades de la DT
Siempre valor positivo Slo valor 0 si todas las observaciones tienen el mismo valor Ventajas: Est definida rigurosamente Se basa en todos los valores Fcil clculo Se pueden realizar operaciones algebraicas Desventajas: Como la media, muy afectada por valores atpicos
Observaciones e Interpretacin:
Por razones tcnicas (matemticas), cuando se calcula la desviacin tpica y la varianza de una muestra, en lugar de la de una poblacin, el denominador es (n-1) en lugar de n Mide la dispersin: cuanto ms grande, mayor dispersin. Es la media de las desviaciones respecto a la media Unidades: las mismas en las que se exprese la variable (pesos, metros, puntos en examen...) Grande o pequea? Segn lo que sepamos de la variable misma IMPORTANTE: si la DT es mayor que la media indica asimetra (sesgo), si no es menor que la mitad de la media cuidado!, puede haber sesgos.
Estadstica - FHyCS Unidad 4: Medidas de Tendencia Central y de Forma 34
48
221
-16,775
-5,775
281,400625 27,300625
2251,205 382,20875
392
78 50 122 911
5,225
16,225 27,225 38,225 7256,975
xi . fi 911 22,775 x
n 40
Estadstica - FHyCS
( xi ~ )2 . fi x n
180,4 13,4
35
`X = 22,7 aos Mo = 24 aos Mdn = 22 aos Q1 = 17 aos ; Q3 = 23 aos DS = 13,4 aos El promedio de edad de los lesionados es de 22,7 aos, con una dispersin tipo de ms o menos 13,4 aos. El 50% de los valores se encuentra entre los 17 y 23 aos. Se puede utilizar Archivo Excel Unidad 4.XLSX y Archivo Infostat Unidad 4.IDB2
Unidad 4: Medidas de Tendencia Central y de Forma 36
Estadstica - FHyCS
Tratamiento de Datos:
Grficos: Diagrama de barras. Diagrama de Pareto. Grfico circular o de sectores. Medidas: de Tendencia central: Moda
Estadstica - FHyCS
37
Tratamiento de Datos:
Grficos: Diagrama de barras. Diagrama de Pareto. Grfico circular o de sectores. Medidas: de Tendencia central: Moda y Mediana
Estadstica - FHyCS
38
Tratamiento de Datos:
Estadstica - FHyCS
39
Tratamiento de Datos:
Estadstica - FHyCS
40
Qu hemos visto?
Medidas de Tendencia Central Media Mediana Moda Medidas de Dispersin Varianza Desviacin Media Desviacin Tipo Rango o Recorrido Ejemplos y Ejercicios
Unidad 4: Medidas de Tendencia Central y de Forma 41
Estadstica - FHyCS
Actividades:
Estadstica - FHyCS
Bibliografa:
Apuntes de la Ctedra
Estadstica - FHyCS
43
Preguntas ??
Estadstica - FHyCS
44