Sie sind auf Seite 1von 42

Probabilidad y Estadstica

CLASE 4 REPRESENTACIONES GRFICAS

Representacin Grfica

Puesto que el objetivo de la estadstica es realizar inferencias de una poblacin de inters, se utilizan grficos que contribuyen a tener una mejor visualizacin de los datos analizados y as poder ver la naturaleza de la distribucin.
Entre estos grficos se pueden mencionar los Histogramas, los Diagramas de barras, las grficas circulares, etc.

Descripcin grfica de un conjunto de datos

Para este caso se utilizan principalmente


Histogramas

y Polgono de Frecuencias Diagramas de caja Ojivas Diagramas de tallo y hojas

Descripcin de datos categricos

En estos casos se utilizan:


Diagramas

de Barras Grficas Circulares Categricos: atributos (datos nominales como sexo, colores u ordinales como bueno, regular, malo) **Ver diapositivas 35 a 40

Histograma y Polgono de Frecuencias

Los histogramas y los polgonos de frecuencias son dos representaciones grficas de las distribuciones de frecuencias.

Un histograma o histograma de frecuencias, consiste en un conjunto de rectngulos con: (a) bases en el eje X horizontal, centros en las marcas de clase y longitudes iguales a los tamaos de los intervalos de clase y (b) reas proporcionales a las frecuencias de clase. Si los intervalos de clase tienen todos la misma anchura, las alturas de los rectngulos son proporcionales a las frecuencias de clase, y entonces se acostumbra tomar las alturas iguales a las frecuencias de clase. Un polgono de frecuencias es un grfico de trozos de la frecuencia de clase con relacin a la marca de clase. Puede obtenerse conectando los puntos medios de las partes superiores de los rectngulos del histograma.

Histogramas

Un histograma consiste en una escala horizontal para valores de los datos que se estn representando, una escala vertical para las frecuencias, y barras que representan la frecuencia de cada clase de valores.

Histogramas

Histogramas

Generalmente se construyen para representar un conjunto de datos despus de haber creado una tabla de frecuencia que represente dichos valores. Cada barra se marca con su frontera de clase inferior a la izquierda y su frontera de clase superior a la derecha. Sin embargo, a menudo se mejora la claridad del histograma si se usan las marcas de clase en lugar de las fronteras de clase.

Histograma

Antes de construir un histograma a partir de una tabla de frecuencia, se debe escoger las escalas que se utilizarn en los ejes vertical y horizontal. La frecuencia mxima deber sugerir un valor para la parte ms alta de la escala vertical; el 0 deber estar hasta abajo. La escala horizontal deber disearse de manera que d cabida a todas las clases de la tabla de frecuencia.

Histograma - Ejemplo
Clase 50-59 60-69 70-79 80-89 90-99 100-109 Marca de clase Frecuencia 54.5 3 64.5 7 74.5 18 84.5 12 94.5 8 104.5 2

Polgono de Frecuencias Ejemplo


POLIGONO DE FRECUENCIAS
20 18 16 14

Clase 50-59 60-69 70-79 80-89 90-99 100-109

Marca de clase Frecuencia 54.5 3 64.5 7 74.5 18 84.5 12 94.5 8 104.5 2

12 10
f

8 6 4 2 0 54.5 64.5 74.5 84.5 94.5 104.5

CLASE (PASAJEROS)

Diagrama de Caja

El diagrama muestra la mediana, los cuartiles y la amplitud en una misma grfica.


La

mediana, los cuartiles y los valores extremos se localizan en una recta numrica.

Diagrama de Caja
0 25 50 75 100 125 150 175 200 225 250

f1 Q1 Q2 Q3

f2

f1 = lmite interno1 Q1 = Quartil 1

Diagrama de Caja
1.
2. 3.

4.

Centro Dispersin Naturaleza y magnitud de cualquier desviacin de la simetra Identificacin de puntos inusuales (atpicos).

Diagrama de Caja

Est basado en medidas que son resistentes a la presencia de puntos atpicos:


La

mediana Los cuartiles

Diagrama de Caja

Este diagrama se elabora con la siguiente informacin:


Determinar

la mediana (n+1)/2 Determinar el primer cuartil (Q1).


El 25% de los datos es menor o igual que Q1.
Determinar

el tercer cuartil (Q3).

El 75% de los datos es menor o igual que Q3.

Determinar

el rango intercuartlico

RI = Q3 Q1

Diagrama de caja

Determinar lmites internos


f1 f2

= Q1 1.5 RI = Q3 + 1.5 RI

Estos puntos se usan para identificar valores atpicos. Valores atpicos:


Son observaciones legtimas cuyo valor tan solo es inusualmente alto o bajo. Resultan de errores de medicin, tcnicas de experimentacin o errores de registro.

EJEMPLO: Se us ultrasonido para reunir los datos de corrosin sobre el espesor de la placa de piso de un tanque elevado para almacenar petrleo (milsimas de pulgada) 40 92 52 94 55 94 60 95 70 75 85 85 90 90

98 100

115 125 125

Posicin de la Mediana = (n+1)/2 = (19+1)/2 = 10 Mediana = Q2 = 90 (Notar que los datos ya estn ordenados)
Q1 Q1 Q3 Q3 = = = = Posicin n/4 + = 5.25 70 + 0.25*(75-70) = 71.25 Posicin 3n/4 + = 14.75 95 + 0.75*(98-95) = 97.25

Q1 71
Q3 97

Diagrama de caja

Rango Intercuartil = Q3 Q1 = 97.25 71.25 = 26


Lmites Internos:

= Q1 1.5 RI f2 = Q3 + 1.5 RI
f1

= 71.25 1.5*26 = 32.25 f2 = 97.25 + 1.5*26= 136.25


f1

Diagrama de Caja
0 10 20 30 40 50 60 70 80 90 100 110 120 130 140

f1

Q1

Q2 Q3

f2

El 75% de las observaciones son menores que 97. Aproximadamente 50% de los datos quedan entre 71 y 97 Cualquier observacin mayor que f2 (136) o menor que f1(32) (es inusual (atpica), tiene un comportamiento diferente al conjunto de datos. La amplitud de los datos, es la longitud del diagrama completo La distribucin es asimtrica.

EJEMPLO: nmero de das con ndices de contaminacin 100 o mayor en 15 ciudades de Estados Unidos
33 47 47 55 58 60 79 82

88

106

113

118

128

208

248

Posicin de la Mediana = (n+1)/2 = (15+1)/2 = 8 Mediana = Q2 = 82 Q1 Q1 Q3 Q3 = = = = Posicin n/4 + = 4.25 55 + 0.25*(58-55) = 55.75 Posicin 3n/4 + = 11.75 113 + 0.75*(118-113) = 116.75 Q1 56

Q3 117

Diagrama de Caja

Rango Intercuartil = Q3 Q1 = 116.75 55.75 = 61

= Q1 1.5 RI f2 = Q3 + 1.5 RI
f1

= 56 1.5*61 = -35.5 -36 f2 = 117 + 1.5*61= 208.5 208


f1

Diagrama de Caja
0 25 50 75 100 125 150 175 200 225 250

Q1

Q2

Q3

f2

248

El 75% de las observaciones son menores que 117 Aproximadamente 50% de los datos quedan entre 56 y 117 La amplitud de los datos, es la longitud del diagrama completo. El extremo superior 248 est muy alejado del grupo principal de datos. Cualquier observacin mayor que f2 (208) es inusual (atpica), tiene un comportamiento diferente al conjunto de datos.

Ojiva

La grfica de una distribucin de frecuencias acumulada se llama ojiva y se utiliza para determinar cuntas observaciones hay mayores o menores que un valor determinado en una distribucin.

Ojiva

Una ojiva menor que indica cuntos elementos de la distribucin tienen un valor menor que el lmite superior de cada clase. Primero se construye una distribucin de frecuencias acumuladas. Despus se representan esas frecuencias acumuladas en el lmite superior de cada clase. Por ltimo, se conectan los puntos con lneas rectas para formar la curva ojiva.

Ojiva

Tambin se puede construir una ojiva menor que para una distribucin de frecuencias relativas. La nica diferencia est en la escala del eje vertical, que estar dada en la escala de 0 a 100%, para indicar la fraccin del total de observaciones que caen dentro o por debajo de cada clase.

Ojiva
Una ojiva mayor que muestra cuntos elementos de la distribucin tienen un valor mayor que o igual al lmite inferior de una clase especfica. Este tipo de curva tambin se puede desarrollar tanto para la distribucin de frecuencias acumuladas como para la de frecuencias relativas acumuladas.

Ojiva menor que


Ojiva
60 50 40 30 20 10 0 59 69 79 89 99 109 Lmite superior de la clase

f acum

Diagrama de Tallo y Hojas


Es una alternativa para el Histograma, ya que proporciona una impresin visual rpida sobre el nmero de observaciones en cada clase. Cada observacin se divide en dos partes: un tallo y una hoja, separadas por una recta vertical.

Diagrama de Tallo y Hojas

El diseo preciso puede adaptarse para que se ajuste a cualquier conjunto de datos, identificando un punto conveniente en el cual las observaciones puedan separarse de tal manera que formen un tallo y una hoja.

Diagrama de Tallo y Hojas

Puede definirse como un hbrido que combina los aspectos visuales del histograma con la informacin numrica que proporciona una tabla de distribucin de frecuencias.

Diagrama de Tallo y Hojas

Este diagrama se construye de la siguiente manera:


Datos: 22.4 26.5 19.7 26.3 24.2 19.3 26.7 26.1

1. Ordenar el lote de datos en magnitud


creciente
19.3 19.7 22.4 24.2 26.1 26.3 26.5 26.7

2. Escoger los dgitos que permitan fraccionar


en dos partes el lote de datos.

Diagrama de Tallo y Hojas


19 19 22 24 26 26 26 26 3 7 4 2 1 3 5 7
19 22 24 26 3 4 2 1
5 7 5 7 19 22 24 26 3 3 4 2 1 19 22 24 26 3 4 2 1 7 3

Diagrama de Tallo y Hojas

En trminos generales un diagrama de esta naturaleza hace visibles las siguientes caractersticas:
Muestra

el rango de valores que los datos cubren. Determina donde se concentran la mayora de los datos. Describen la simetra del conjunto de datos. Identifican si existen huecos en la distribucin de datos. Seala aquellos valores que claramente se desvan del conjunto de datos.

Descripcin de datos categricos

En estos casos se utilizan:


Diagramas

de Barras Grficas Circulares Categricos: atributos (datos nominales como sexo, colores u ordinales como bueno, regular, malo)

Diagrama de barras
Parecido a un histograma. Puede mostrar cantidades o porcentajes para dos o ms valores sobre el eje vertical. Es otro mtodo habitual de presentar en forma grfica datos con escala nominal u ordinal. Cada barra representa la frecuencia de una categora

Diagrama de barras

La altura de la barra es proporcional al nmero de elementos en esa categora. En general, las barras se ponene en posicin vertical con base en el eje horizontal de la grfica. Las barras se separan y a ello se debe que se utilice con tanta frecuencia para los datos nominales y ordinales: la separacin pone de manifiesto que se estn dibujando frecuencias de categoras distintas.

Diagrama de barras
Diagram a de barras: colores favoritos de 32 personas 14

Frecuencias

12 10 8 6 4 2 0 Rojo Verde Azul Amarillo Colores Favoritos

Grfica Circular

Tambin se le conoce como diagrama de pastel (pie en ingls). Es una forma efectiva de desplegar los porcentajes en que se dividen los datos. Este tipo de diagrama es particularmente til si se quiere hacer hincapi en los tamaos relativos de las componentes de los datos. Un crculo completo, 360, representa el nmero total de observaciones. El tamao de las porciones es proporcional a la frecuencia relativa de cada categora.

Grfica Circular
Grfica Circular: colores favoritos de 32 personas

13% 37% 25%

25%

Estadstica, Grficas y tica


Como ltimo punto respecto a la creacin e interpretacin de distintos tipos de grficas, debe tenerse cuidado para evitar distorsiones. Es fcil distorsionar deliberadamente una grfica para dar una imagen incorrecta de los hechos.

Ejemplo: Desempeo del ndice Dow Jones (promedios industriales a intervalos de 5 minutos)
3345 3335 3325 3315 3305 3295 3285 3275
30 40 50 00 10 20 30 40 50 00 10 20 30 40 50 09: 09: 09: 10: 10: 10: 10: 10: 10: 11: 11: 11: 11: 11: 11: 12: 00

3500 3450 3400 3350 3300 3250 3200 3150 3100 3050 3000
09 :30 09 :40 09 :50 10 :00 10 :10 10 :20 10 :30 10 :40 10 :50 11 :00 11 :10 11 :20 11 :30 11 :40 11 :50 12 :00

Das könnte Ihnen auch gefallen