Sie sind auf Seite 1von 16

Introduccin

En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia (coordenadas), permiten presentar informacin cuantitativa. La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis De los datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino tambin para analizarla. En este trabajo solo nos vamos a centrar nicamente en los grficos como vehculo de presentacin de datos, sin abordar su otra faceta como herramienta de anlisis. Grficos estadsticos Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros. Tipos de grficos estadsticos
Barras Lneas Circulares reas Cartogramas Mixtos Histogramas Otros Dispersograma Pictogramas

Grficos de barras verticales (Llamados por algunos software de columnas) Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a graficar sea discreta o continua. Pueden usarse para representar:

una serie dos o ms series (tambin llamado de barras comparativas)

Grficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos.

para una serie para dos o ms series

Grficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total.

Las barras pueden ser:


Verticales Horizontales

Grficos de barras comparativas Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las barras pueden ser:

Verticales horizontales

Grficos de barras apiladas Se usan para mostrar las relaciones entre dos o ms series con el total. Las barras pueden ser:

verticales horizontales

Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar:

una serie dos o ms series

Estos grficos se utilizan para representar valores con grandes incrementos entre s.

Grficos circulares Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden ser:

En dos dimensiones en tres dimensiones

Grficos de reas En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser:

Para representar una serie para representar dos o ms series en dos dimensiones en tres dimensiones.

Cartogramas Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.

Grficos Mixtos En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series. Pueden ser:

en dos dimensiones en tres dimensiones.

Histogramas Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn software especfico para estadstica grafican la curva de gauss superpuesta con el histograma.

OTROS Grficos En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector. Dispersograma Los dispersogramas Son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.

Pictogramas Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma.

Pueden ser:

En dos dimensiones En tres dimensiones.

Pirmide de poblacin
Otra forma corriente de presentacin visual de datos estadsticos es la llamada pirmide de poblacin. Las pirmides de poblacin se utilizan en la expresin de informaciones demogrficas, econmicas o sociales, y en ellas se clasifican comnmente los datos de la poblacin del grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.

Distribucin de frecuencias
En estadstica, se denomina distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas. Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencia Frecuencia absoluta

La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.

Frecuencia relativa

La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.


Frecuencia acumulada

La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.


Frecuencia relativa acumulada

La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi 27 28 29 30 31 32 33 34 III III I I II Recuento fi 1 2 6 7 8 3 3 1 31 Fi 1 3 9 16 24 27 30 31 ni 0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1 Ni 0.032 0.097 0.290 0.516 0.774 0.871 0.968 1

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Distribucin de frecuencias agrupadas


La distribucin de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un nmero grande de valores o la variable es continua. Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.
Lmites de la clase

Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase.
Amplitud de la clase

La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase.


Marca de clase

La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.

Construccin de una tabla de datos agrupados


3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 se localizan los valores menor y mayor de la distribucin. En este caso son 3 y 48. 2 Se restan y se busca un nmero entero un poco mayor que la diferencia y que sea divisible por el nmero de intervalos de queramos poner. Es conveniente que el nmero de intervalos oscile entre 6 y 15. En este caso, 48 - 3 = 45, incrementamos el nmero hasta 50 : 5 = 10 intervalos. Se forman los intervalos teniendo presente que el lmite inferior de una clase pertenece al intervalo, pero el lmite superior no pertenece intervalo, se cuenta en el siguiente intervalo.
ci [0, 5) 2.5 1 fi 1 Fi ni 0.025 Ni 0.025

[5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50)

7.5 12.5 17.5 22.5 27.5 32.5 37.5 42.5 47.5

1 3 3 3 6 7 10 4 2 40

2 5 8 11 17 24 34 38 40

0.025 0.075 0.075 0.075 0.150 0.175 0.250 0.100 0.050 1

0.050 0.125 0.200 0.2775 0.425 0.600 0.850 0.950 1

Distribuciones de frecuencia
Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. La Tabla 1 es una distribucin de frecuencias de alturas (registradas con aproximacin de pulgada) de 100 estudiantes de la Universidad XYZ.

La primera clase o categora, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. Los datos ordenados y resumidos como en la distribucin de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas as de manifiesto.

Intervalos de clase y lmites de clase


Un smbolo que define una clase, tal como 60 - 62 de la tabla anterior, se conoce como intervalo de clase. Los nmeros extremos, 60 y 62, son los lmites de clase; el nmero menor 60 es el lmite inferior de la clase y el mayor 62 es el lmite superior. Los trminos clase e intervalo de clase se utilizan a menudo indistintamente, aunque el intervalo de clase es realmente un smbolo para la clase. Un intervalo de clase que, al menos tericamente, no tiene lmite superior o inferior, se conoce como intervalo de clase abierto. Por ejemplo, al referirse a la edad de grupos de individuos el intervalo de clase, mayores de 65 aos es un intervalo de clase abierto.

Lmites reales de clases


Si las alturas se registran con aproximacin de pulgada, el intervalo de clase 60 - 62 tericamente incluye todas las medidas desde 59,5000... a 62,5000 pulgadas. Estos nmeros, representados brevemente por los nmeros exactos 59,5 y 62,5, se conocen como lmites reales de clase o lmites verdaderos de clase; el menor de ellos, 59,5, es el lmite real inferior y el mayor de ellos, 62,5, es el lmite real superior. Prcticamente, los lmites reales de clase se obtienen sumando al lmite superior de un intervalo de clase el lmite inferior del intervalo de clase contiguo superior y dividiendo por 2. A veces, los lmites reales de clase se utilizan para simbolizar las clases. Por ejemplo, las diferentes clases de la primera columna de la Tabla 1 podran indicarse por 59,5 - 62,5, 62,5 - 65,5, etc. Sin embargo, con tal notacin aparece una ambigedad, pues los lmites reales de clase no coincidiran con las observaciones reales. As si una observacin fuese 62,5 no sera posible discernir si pertenece al intervalo de clase 59,5 - 62,5 o al 62,5 - 65,5. TAMAO O ANCHURA DE UN INTERVALO DE CLASE El tamao o anchura de un intervalo de clase es la diferencia entre los lmites reales de clase que lo forman y se conoce como anchura de clase, tamao de clase o longitud de clase. Si todos los intervalos de clase de una distribucin de frecuencias tienen igual anchura, esta anchura comn se representa por c. En tal caso, c es igual a la diferencia entre dos sucesivos lmites de clase inferiores o superiores. Para los datos de la Tabla 1, por ejemplo, el intervalo de clase es c = 62,5 - 59,5 = 65,5 - 62,5 = 3.

La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los lmites inferior y superior de la clase y dividiendo por 2. As, la marca de clase del intervalo 60 62 es (60 + 62)/2 = 61. La marca de clase se llama tambin punto medio de la clase. Para anlisis matemticos posteriores, todas las observaciones pertenecientes a un intervalo de clase dado se suponen coincidentes con la marca de clase. As, todas las alturas en el intervalo de clase 60 - 62 pulgadas se considerarn como de 61 pulgadas.

Reglas generales para formar las distribuciones de frecuencia


l. Determinar el mayor y el menor entre los datos registrados y as encontrar el rango (diferencia entre el mayor y el menor de los datos). 2. Dividir el rango en un nmero conveniente de intervalos de clase del mismo tamao. Si esto no es posible, utilizar intervalos de clase de diferente tamao o intervalos de clase abiertos. El nmero de intervalos de clase se toma generalmente entre 5 y 20 dependiendo de los datos. Los intervalos de clase se eligen tambin de forma que las marcas de clase o puntos medios coincidan con datos realmente observados. Esto tiende a aminorar el llamado error de agrupamiento, en los anlisis matemticos posteriores. Sin embargo, los lmites reales de clase no coincidirn con los datos observados. 3. Determinar el nmero de observaciones que caen dentro de cada intervalo de clase, es decir, encontrar las frecuencias de clase. Lo mejor para esto es utilizar una hoja de conteo. HISTOGRAMAS Y POLIGONOS DE FRECUENCIA son dos representaciones grficas de las distribuciones de frecuencia. 1. Un histograma o histograma de frecuencias consiste en una serie de rectngulos que tienen (a) Sus bases sobre un eje horizontal (el eje X) con centros en las marcas de clase y longitud igual al tamao de los intervalos de clase. (b) Superficies proporcionales a las frecuencias de clase. Si los intervalos de clase tienen todos igual tamao, las alturas de los rectngulos son proporcionales a las frecuencias de clase y se acostumbra en tal caso a tomar las alturas numricamente iguales a las frecuencias de clase. Si los intervalos de clase no son de igual tamao, estas alturas debern ser calculadas. 2. Un polgono de frecuencias es un grfico de lnea trazado sobre las marcas de clase. Puede obtenerse uniendo los puntos medios de los techos de los rectngulos en el histograma. El histograma y el polgono de frecuencias correspondiente a la distribucin de frecuencias de las alturas de los estudiantes se muestran en el mismo sistema de ejes en la Fig.1. Se acostumbra a prolongar el polgono con PQ y RS hasta las marcas de clase inferior y superior inmediatas, que corresponderan a la clase de frecuencia cero. En tal caso, la suma de las reas de los rectngulos del histograma es igual al e rea total limitada por el polgono de frecuencias y el eje X.

Distribuciones de frecuencia relativa


La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de frecuencias de todas las clases y se expresa generalmente como porcentaje. Por ejemplo, la frecuencia relativa de la clase 66 - 68 de la Tabla 1 es 42/100 = 42 %. La suma de las frecuencias relativas de todas las clases es evidentemente 1 100 %. Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las correspondientes frecuencias relativas, la tabla resultante se llama distribucin de frecuencias relativas, distribucin porcentual o tabla de frecuencias relativas. Las representaciones grficas de distribuciones de frecuencia relativa pueden obtenerse del histograma o del polgono de frecuencias, sin ms que cambiar la escala vertical de frecuencia a frecuencia relativa, conservndose exactamente el mismo diagrama. Los grficos que resultan se llaman histogramas de frecuencias relativas o histogramas porcentuales y polgonos de frecuencias relativas o polgonos porcentuales, respectivamente.

Distribuciones de frecuencia acumulada. Ojivas

La frecuencia total de todos los valores menores que el lmite real superior de clase de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase inclusive. Por ejemplo, la frecuencia acumulada hasta el intervalo de clase 66 - 68 inclusive en la Tabla 1, es 5 + 18 + 42 = 65, significando que 65 estudiantes tienen alturas menores que 68,5 pulgadas. Una tabla que represente las frecuencias acumuladas se llama distribucin de frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente distribucin acumulada, y se muestra en la Tabla 2, para la distribucin de la altura de los estudiantes. Un grfico que muestre las frecuencias acumuladas menores que cualquier lmite real superior de clase trazado sobre los lmites reales superiores de clase se llama polgono de frecuencias acumuladas u ojiva y se muestra en la Fig. 2-2 para la distribucin de la altura de los estudiantes. En algunos casos es preferible considerar una distribucin de frecuencias acumuladas de todos los valores mayores o iguales al lmite real inferior de clase de cada intervalo de clase. En este caso consideramos las alturas de 59,5 pulgadas o ms, 62,5 pulgadas o ms, etc., sta se llama a veces distribucin acumulada o ms, mientras que la considerada anteriormente es la distribucin acumulada menor que. De la una se obtiene fcilmente la otra. Las correspondientes ojivas se llaman o ms y menor que. Siempre que nos refiramos a distribuciones acumuladas u ojivas sin especificar, se entender que son del tipo menor que. DISTRIBUCIONES DE FRECUENCIAS RELATIVAS ACUMULADAS. OJIVAS PORCENTUALES La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia acumulada dividida por la frecuencia total. Por ejemplo, la frecuencia relativa acumulada de alturas menores que 68,5 pulgadas es 65/100 = 65 %, queriendo con ello decir que el 65 % de los estudiantes tienen alturas menores de 68,5 pulgadas. Si se utilizan en la Tabla 2, y Fig. 2, las frecuencias relativas acumuladas en lugar de las frecuencias acumuladas, los resultados se llaman distribuciones de frecuencias relativas acumuladas o distribuciones porcentuales acumuladas y polgonos de frecuencias relativas acumuladas u ojivas porcentuales, respectivamente.

CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extrada de una poblacin grande. A causa de las muchas observaciones que podemos realizar en la poblacin es posible tericamente (para datos continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero adecuado de observaciones dentro de cada clase. As se tiene que el polgono de frecuencias o el de frecuencias relativas para una poblacin grande puede estar formado por muchos pequeos segmentos rectos que aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas de frecuencias o curvas de frecuencias relativas, respectivamente. Es razonable esperar que tales curvas tericas provengan de la suavizacin de los polgonos de frecuencias o de los polgonos de frecuencias relativas de la muestra, la aproximacin es tanto ms exacta conforme aumenta el tamao de la muestra. Por esta razn una curva de frecuencias se conoce como un polgono de frecuencias suavizado. De una forma anloga las ojivas suavizadas provienen de la suavizacin de los polgonos de frecuencias acumuladas u ojivas. Normalmente es ms sencillo suavizar una ojiva que un polgono de frecuencias.

Tipos de curvas de frecuencia

Las curvas de frecuencia presentan determinadas formas caractersticas que les distinguen como se indica en la Figura 3. (a) Las curvas de frecuencia simtricas o bien formadas se caracterizan por el hecho de que las observaciones que equidistan del mximo central tienen la misma frecuencia. Un ejemplo importante es la curva normal. (b) En las curvas de frecuencia moderadamente asimtricas o sesgadas la cola de la curva a un lado del mximo central es mayor que al otro lado. Si la cola mayor se presenta a la derecha de la curva se dice que sta est sesgada a la derecha o que tiene sesgo positivo, mientras que si ocurre lo contrario se dice que la curva est sesgada a la izquierda o que tiene un sesgo negativo. (c) En las curvas en forma de J o de J invertida, el mximo se presenta en un extremo. (d) Las curvas de frecuencias en forma de U tienen el mximo en ambos extremos. (e) Una curva de frecuencias bimodal tiene dos mximos. (f) Una curva de frecuencias multimodal tiene ms de dos mximos.

Das könnte Ihnen auch gefallen