Beruflich Dokumente
Kultur Dokumente
En estadstica denominamos grficos a aquellas imgenes que, combinando la utilizacin De sombreado, colores, puntos, lneas, smbolos, nmeros, texto y un sistema De referencia (coordenadas), permiten presentar informacin cuantitativa. La utilidad De los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis De los datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino tambin para analizarla. En este trabajo solo nos vamos a centrar nicamente en los grficos como vehculo de presentacin de datos, sin abordar su otra faceta como herramienta de anlisis. Grficos estadsticos Los grficos son medios popularizados y a menudo los ms convenientes para presentar datos, se emplean para tener una representacin visual de la totalidad de la informacin. Los grficos estadsticos presentan los datos en forma de dibujo de tal modo que se pueda percibir fcilmente los hechos esenciales y compararlos con otros. Tipos de grficos estadsticos
Barras Lneas Circulares reas Cartogramas Mixtos Histogramas Otros Dispersograma Pictogramas
Grficos de barras verticales (Llamados por algunos software de columnas) Representan valores usando trazos verticales, aislados o no unos de otros, segn la variable a graficar sea discreta o continua. Pueden usarse para representar:
Grficos de barras horizontales Representan valores discretos a base de trazos horizontales, aislados unos de otros. Se utilizan cuando los textos correspondientes a cada categora son muy extensos.
Grficos de barras proporcionales Se usan cuando lo que se busca es resaltar la representacin de los porcentajes de los datos que componen un total.
Verticales Horizontales
Grficos de barras comparativas Se utilizan para comparar dos o ms series, para comparar valores entre categoras. Las barras pueden ser:
Verticales horizontales
Grficos de barras apiladas Se usan para mostrar las relaciones entre dos o ms series con el total. Las barras pueden ser:
verticales horizontales
Grficos de lneas En este tipo de grfico se representan los valores de los datos en dos ejes cartesianos ortogonales entre s. Se pueden usar para representar:
Estos grficos se utilizan para representar valores con grandes incrementos entre s.
Grficos circulares Estos grficos nos permiten ver la distribucin interna de los datos que representan un hecho, en forma de porcentajes sobre un total. Se suele separar el sector correspondiente al mayor o menor valor, segn lo que se desee destacar. Se pueden ser:
Grficos de reas En estos tipos de grficos se busca mostrar la tendencia de la informacin generalmente en un perodo de tiempo. Pueden ser:
Para representar una serie para representar dos o ms series en dos dimensiones en tres dimensiones.
Cartogramas Estos tipos de grficos se utilizan para mostrar datos sobre una base geogrfica. La densidad de datos se puede marcar por crculos, sombreado, rayado o color.
Grficos Mixtos En estos tipos de grficos se representan dos o ms series de datos, cada una con un tipo diferente de grfico. Son grficos ms vistosos y se usan para resaltar las diferencias entre las series. Pueden ser:
Histogramas Estos tipos de grficos se utilizan para representa distribuciones de frecuencias. Algn software especfico para estadstica grafican la curva de gauss superpuesta con el histograma.
OTROS Grficos En esta categora se encuentran la mayora de los grficos utilizados en publicidad. Se los complementa con un dibujo que est relacionado con el origen de la informacin a mostrar. Son grficos llamativos, atraen la atencin del lector. Dispersograma Los dispersogramas Son grficos que se construyen sobre dos ejes ortogonales de coordenadas, llamados cartesianos, cada punto corresponde a un par de valores de datos x e y de un mismo elemento suceso.
Pictogramas Los pictogramas son grficos similares a los grficos de barras, pero empleando un dibujo en una determinada escala para expresar la unidad de medida de los datos. Generalmente este dibujo debe cortarse para representar los datos. Es comn ver grficos de barras donde las barras se reemplazan por dibujos a diferentes escalas con el nico fin de hacer ms vistoso el grfico, estos tipos de grficos no constituyen un pictograma.
Pueden ser:
Pirmide de poblacin
Otra forma corriente de presentacin visual de datos estadsticos es la llamada pirmide de poblacin. Las pirmides de poblacin se utilizan en la expresin de informaciones demogrficas, econmicas o sociales, y en ellas se clasifican comnmente los datos de la poblacin del grupo de muestra considerado en diferentes escalas de edad y diferenciada por sexo.
Distribucin de frecuencias
En estadstica, se denomina distribucin de frecuencias a la agrupacin de datos en categoras mutuamente excluyentes que indican el nmero de observaciones en cada categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero existente en cada clase. Estas agrupaciones de datos suelen estar agrupadas en forma de tablas. Una distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencia Frecuencia absoluta
La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N.
Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria.
Frecuencia relativa
La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni.
La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento.
Ejemplo
Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta.
xi 27 28 29 30 31 32 33 34 III III I I II Recuento fi 1 2 6 7 8 3 3 1 31 Fi 1 3 9 16 24 27 30 31 ni 0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1 Ni 0.032 0.097 0.290 0.516 0.774 0.871 0.968 1
Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase.
Amplitud de la clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.
[5, 10) [10, 15) [15, 20) [20, 25) [25, 30) [30, 35) [35, 40) [40, 45) [45, 50)
1 3 3 3 6 7 10 4 2 40
2 5 8 11 17 24 34 38 40
Distribuciones de frecuencia
Cuando se dispone de gran nmero de datos, es til el distribuirlos en clases o categoras y determinar el nmero de individuos pertenecientes a cada clase, que es la frecuencia de clase. Una ordenacin tabular de los datos en clases, reunidas las clases y con as frecuencias correspondientes a cada una, se conoce como una distribucin de frecuencias o tabla de frecuencias. La Tabla 1 es una distribucin de frecuencias de alturas (registradas con aproximacin de pulgada) de 100 estudiantes de la Universidad XYZ.
La primera clase o categora, por ejemplo, comprende las alturas de 60 a 62 pulgadas y viene indicada por el smbolo 60 - 62. Puesto que 5 estudiantes tienen una altura perteneciente a esta clase, la correspondiente frecuencia de clase es 5. Los datos ordenados y resumidos como en la distribucin de frecuencia anterior, se suelen llamar datos agrupados. Aunque con el proceso de agrupamiento generalmente se pierde parte del detalle original de los datos, tiene la importante ventaja de presentarlos todos en un sencillo cuadro que facilita el hallazgo de las relaciones que pueda haber entre ellos, puestas as de manifiesto.
La marca de clase es el punto medio del intervalo de clase y se obtiene sumando los lmites inferior y superior de la clase y dividiendo por 2. As, la marca de clase del intervalo 60 62 es (60 + 62)/2 = 61. La marca de clase se llama tambin punto medio de la clase. Para anlisis matemticos posteriores, todas las observaciones pertenecientes a un intervalo de clase dado se suponen coincidentes con la marca de clase. As, todas las alturas en el intervalo de clase 60 - 62 pulgadas se considerarn como de 61 pulgadas.
La frecuencia total de todos los valores menores que el lmite real superior de clase de un intervalo de clase dado se conoce como frecuencia acumulada hasta ese intervalo de clase inclusive. Por ejemplo, la frecuencia acumulada hasta el intervalo de clase 66 - 68 inclusive en la Tabla 1, es 5 + 18 + 42 = 65, significando que 65 estudiantes tienen alturas menores que 68,5 pulgadas. Una tabla que represente las frecuencias acumuladas se llama distribucin de frecuencias acumuladas, tabla de frecuencias acumuladas o brevemente distribucin acumulada, y se muestra en la Tabla 2, para la distribucin de la altura de los estudiantes. Un grfico que muestre las frecuencias acumuladas menores que cualquier lmite real superior de clase trazado sobre los lmites reales superiores de clase se llama polgono de frecuencias acumuladas u ojiva y se muestra en la Fig. 2-2 para la distribucin de la altura de los estudiantes. En algunos casos es preferible considerar una distribucin de frecuencias acumuladas de todos los valores mayores o iguales al lmite real inferior de clase de cada intervalo de clase. En este caso consideramos las alturas de 59,5 pulgadas o ms, 62,5 pulgadas o ms, etc., sta se llama a veces distribucin acumulada o ms, mientras que la considerada anteriormente es la distribucin acumulada menor que. De la una se obtiene fcilmente la otra. Las correspondientes ojivas se llaman o ms y menor que. Siempre que nos refiramos a distribuciones acumuladas u ojivas sin especificar, se entender que son del tipo menor que. DISTRIBUCIONES DE FRECUENCIAS RELATIVAS ACUMULADAS. OJIVAS PORCENTUALES La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia acumulada dividida por la frecuencia total. Por ejemplo, la frecuencia relativa acumulada de alturas menores que 68,5 pulgadas es 65/100 = 65 %, queriendo con ello decir que el 65 % de los estudiantes tienen alturas menores de 68,5 pulgadas. Si se utilizan en la Tabla 2, y Fig. 2, las frecuencias relativas acumuladas en lugar de las frecuencias acumuladas, los resultados se llaman distribuciones de frecuencias relativas acumuladas o distribuciones porcentuales acumuladas y polgonos de frecuencias relativas acumuladas u ojivas porcentuales, respectivamente.
CURVAS DE FRECUENCIAS. OJIVAS SUAVIZADAS El conjunto de datos puede considerarse normalmente como perteneciente a una muestra extrada de una poblacin grande. A causa de las muchas observaciones que podemos realizar en la poblacin es posible tericamente (para datos continuos) elegir los intervalos de clase muy pequeos y todava tener un nmero adecuado de observaciones dentro de cada clase. As se tiene que el polgono de frecuencias o el de frecuencias relativas para una poblacin grande puede estar formado por muchos pequeos segmentos rectos que aproximan el conjunto a una curva, las curvas de este tipo pueden llamarse curvas de frecuencias o curvas de frecuencias relativas, respectivamente. Es razonable esperar que tales curvas tericas provengan de la suavizacin de los polgonos de frecuencias o de los polgonos de frecuencias relativas de la muestra, la aproximacin es tanto ms exacta conforme aumenta el tamao de la muestra. Por esta razn una curva de frecuencias se conoce como un polgono de frecuencias suavizado. De una forma anloga las ojivas suavizadas provienen de la suavizacin de los polgonos de frecuencias acumuladas u ojivas. Normalmente es ms sencillo suavizar una ojiva que un polgono de frecuencias.
Las curvas de frecuencia presentan determinadas formas caractersticas que les distinguen como se indica en la Figura 3. (a) Las curvas de frecuencia simtricas o bien formadas se caracterizan por el hecho de que las observaciones que equidistan del mximo central tienen la misma frecuencia. Un ejemplo importante es la curva normal. (b) En las curvas de frecuencia moderadamente asimtricas o sesgadas la cola de la curva a un lado del mximo central es mayor que al otro lado. Si la cola mayor se presenta a la derecha de la curva se dice que sta est sesgada a la derecha o que tiene sesgo positivo, mientras que si ocurre lo contrario se dice que la curva est sesgada a la izquierda o que tiene un sesgo negativo. (c) En las curvas en forma de J o de J invertida, el mximo se presenta en un extremo. (d) Las curvas de frecuencias en forma de U tienen el mximo en ambos extremos. (e) Una curva de frecuencias bimodal tiene dos mximos. (f) Una curva de frecuencias multimodal tiene ms de dos mximos.