Beruflich Dokumente
Kultur Dokumente
Representacin Grfica
Puesto que el objetivo de la estadstica es realizar inferencias de una poblacin de inters, se utilizan grficos que contribuyen a tener una mejor visualizacin de los datos analizados y as poder ver la naturaleza de la distribucin.
Entre estos grficos se pueden mencionar los Histogramas, los Diagramas de barras, las grficas circulares, etc.
de Barras Grficas Circulares Categricos: atributos (datos nominales como sexo, colores u ordinales como bueno, regular, malo) **Ver diapositivas 35 a 40
Los histogramas y los polgonos de frecuencias son dos representaciones grficas de las distribuciones de frecuencias.
Un histograma o histograma de frecuencias, consiste en un conjunto de rectngulos con: (a) bases en el eje X horizontal, centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase y (b) reas proporcionales a las frecuencias de clase. Si los intervalos de clase tienen todos la misma anchura, las alturas de los rectngulos son proporcionales a las frecuencias de clase, y entonces se acostumbra tomar las alturas iguales a las frecuencias de clase. Un polgono de frecuencias es un grfico de trozos de la frecuencia de clase con relacin a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectngulos del histograma.
Histogramas
Un histograma consiste en una escala horizontal para valores de los datos que se estn representando, una escala vertical para las frecuencias, y barras que representan la frecuencia de cada clase de valores.
Histogramas
Histogramas
Generalmente se construyen para representar un conjunto de datos despus de haber creado una tabla de frecuencia que represente dichos valores. Cada barra se marca con su frontera de clase inferior a la izquierda y su frontera de clase superior a la derecha. Sin embargo, a menudo se mejora la claridad del histograma si se usan las marcas de clase en lugar de las fronteras de clase.
Histograma
Antes de construir un histograma a partir de una tabla de frecuencia, se debe escoger las escalas que se utilizarn en los ejes vertical y horizontal. La frecuencia mxima deber sugerir un valor para la parte ms alta de la escala vertical; el 0 deber estar hasta abajo. La escala horizontal deber disearse de manera que d cabida a todas las clases de la tabla de frecuencia.
Histograma - Ejemplo
Clase 50-59 60-69 70-79 80-89 90-99 100-109 Marca de clase Frecuencia 54.5 3 64.5 7 74.5 18 84.5 12 94.5 8 104.5 2
12 10
f
CLASE (PASAJEROS)
Diagrama de Caja
mediana, los cuartiles y los valores extremos se localizan en una recta numrica.
Diagrama de Caja
0 25 50 75 100 125 150 175 200 225 250
f1 Q1 Q2 Q3
f2
Diagrama de Caja
1.
2. 3.
4.
Centro Dispersin Naturaleza y magnitud de cualquier desviacin de la simetra Identificacin de puntos inusuales (atpicos).
Diagrama de Caja
Diagrama de Caja
Determinar
el rango intercuartlico
RI = Q3 Q1
Diagrama de caja
= Q1 1.5 RI = Q3 + 1.5 RI
Son observaciones legtimas cuyo valor tan solo es inusualmente alto o bajo. Resultan de errores de medicin, tcnicas de experimentacin o errores de registro.
EJEMPLO: Se us ultrasonido para reunir los datos de corrosin sobre el espesor de la placa de piso de un tanque elevado para almacenar petrleo (milsimas de pulgada) 40 92 52 94 55 94 60 95 70 75 85 85 90 90
98 100
Posicin de la Mediana = (n+1)/2 = (19+1)/2 = 10 Mediana = Q2 = 90 (Notar que los datos ya estn ordenados)
Q1 Q1 Q3 Q3 = = = = Posicin n/4 + = 5.25 70 + 0.25*(75-70) = 71.25 Posicin 3n/4 + = 14.75 95 + 0.75*(98-95) = 97.25
Q1 71
Q3 97
Diagrama de caja
= Q1 1.5 RI f2 = Q3 + 1.5 RI
f1
Diagrama de Caja
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140
f1
Q1
Q2 Q3
f2
El 75% de las observaciones son menores que 97. Aproximadamente 50% de los datos quedan entre 71 y 97 Cualquier observacin mayor que f2 (136) o menor que f1(32) (es inusual (atpica), tiene un comportamiento diferente al conjunto de datos. La amplitud de los datos, es la longitud del diagrama completo La distribucin es asimtrica.
EJEMPLO: nmero de das con ndices de contaminacin 100 o mayor en 15 ciudades de Estados Unidos
33 47 47 55 58 60 79 82
88
106
113
118
128
208
248
Posicin de la Mediana = (n+1)/2 = (15+1)/2 = 8 Mediana = Q2 = 82 Q1 Q1 Q3 Q3 = = = = Posicin n/4 + = 4.25 55 + 0.25*(58-55) = 55.75 Posicin 3n/4 + = 11.75 113 + 0.75*(118-113) = 116.75 Q1 56
Q3 117
Diagrama de Caja
= Q1 1.5 RI f2 = Q3 + 1.5 RI
f1
Diagrama de Caja
0 25 50 75 100 125 150 175 200 225 250
Q1
Q2
Q3
f2
248
El 75% de las observaciones son menores que 117 Aproximadamente 50% de los datos quedan entre 56 y 117 La amplitud de los datos, es la longitud del diagrama completo. El extremo superior 248 est muy alejado del grupo principal de datos. Cualquier observacin mayor que f2 (208) es inusual (atpica), tiene un comportamiento diferente al conjunto de datos.
Ojiva
La grfica de una distribucin de frecuencias acumulada se llama ojiva y se utiliza para determinar cuntas observaciones hay mayores o menores que un valor determinado en una distribucin.
Ojiva
Una ojiva menor que indica cuntos elementos de la distribucin tienen un valor menor que el lmite superior de cada clase. Primero se construye una distribucin de frecuencias acumuladas. Despus se representan esas frecuencias acumuladas en el lmite superior de cada clase. Por ltimo, se conectan los puntos con lneas rectas para formar la curva ojiva.
Ojiva
Tambin se puede construir una ojiva menor que para una distribucin de frecuencias relativas. La nica diferencia est en la escala del eje vertical, que estar dada en la escala de 0 a 100%, para indicar la fraccin del total de observaciones que caen dentro o por debajo de cada clase.
Ojiva
Una ojiva mayor que muestra cuntos elementos de la distribucin tienen un valor mayor que o igual al lmite inferior de una clase especfica. Este tipo de curva tambin se puede desarrollar tanto para la distribucin de frecuencias acumuladas como para la de frecuencias relativas acumuladas.
f acum
El diseo preciso puede adaptarse para que se ajuste a cualquier conjunto de datos, identificando un punto conveniente en el cual las observaciones puedan separarse de tal manera que formen un tallo y una hoja.
Puede definirse como un hbrido que combina los aspectos visuales del histograma con la informacin numrica que proporciona una tabla de distribucin de frecuencias.
En trminos generales un diagrama de esta naturaleza hace visibles las siguientes caractersticas:
Muestra
el rango de valores que los datos cubren. Determina donde se concentran la mayora de los datos. Describen la simetra del conjunto de datos. Identifican si existen huecos en la distribucin de datos. Seala aquellos valores que claramente se desvan del conjunto de datos.
de Barras Grficas Circulares Categricos: atributos (datos nominales como sexo, colores u ordinales como bueno, regular, malo)
Diagrama de barras
Parecido a un histograma. Puede mostrar cantidades o porcentajes para dos o ms valores sobre el eje vertical. Es otro mtodo habitual de presentar en forma grfica datos con escala nominal u ordinal. Cada barra representa la frecuencia de una categora
Diagrama de barras
La altura de la barra es proporcional al nmero de elementos en esa categora. En general, las barras se ponene en posicin vertical con base en el eje horizontal de la grfica. Las barras se separan y a ello se debe que se utilice con tanta frecuencia para los datos nominales y ordinales: la separacin pone de manifiesto que se estn dibujando frecuencias de categoras distintas.
Diagrama de barras
Diagram a de barras: colores favoritos de 32 personas 14
Frecuencias
Grfica Circular
Tambin se le conoce como diagrama de pastel (pie en ingls). Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Este tipo de diagrama es particularmente til si se quiere hacer hincapi en los tamaos relativos de las componentes de los datos. Un crculo completo, 360, representa el nmero total de observaciones. El tamao de las porciones es proporcional a la frecuencia relativa de cada categora.
Grfica Circular
Grfica Circular: colores favoritos de 32 personas
25%
Ejemplo: Desempeo del ndice Dow Jones (promedios industriales a intervalos de 5 minutos)
3345 3335 3325 3315 3305 3295 3285 3275
30 40 50 00 10 20 30 40 50 00 10 20 30 40 50 09: 09: 09: 10: 10: 10: 10: 10: 10: 11: 11: 11: 11: 11: 11: 12: 00
3500 3450 3400 3350 3300 3250 3200 3150 3100 3050 3000
09 :30 09 :40 09 :50 10 :00 10 :10 10 :20 10 :30 10 :40 10 :50 11 :00 11 :10 11 :20 11 :30 11 :40 11 :50 12 :00