Sie sind auf Seite 1von 12

http://sapiens.ya.

com/trescomacatorce

MÉTODO ESTADÍSTICO
La estadística, como ciencia que es, utiliza una metodología propia que recibe el
nombre de método estadístico. Para realizar un estudio estadístico de un fenómeno,
el proceso que sigue suele ser el siguiente:

1. Definir la variable que va a ser objeto de estudio. Este es el primer paso, tener claro
qué es lo que se va a estudiar.

2. Delimitar el colectivo. No basta saber qué es lo que se quiere estudiar, es preciso


delimitar con precisión a qué elementos o individuos se va a aplicar el estudio.

3. Elegir una muestra. Teniendo en cuenta el tiempo de que se dispone, el presupuesto


económico y la variable que se va a estudiar, se procede a la elección de la muestra.
Las técnicas de muestreo, que son un completo conjunto de métodos de selección,
contemplan distintas formas de elegir una muestra representativa de una población.

4. Recoger los datos. Los datos que se van a estudiar pueden ser recogidos
directamente por el investigador; reciben, entonces el nombre de datos estadísticos
primarios. O bien, haber sido ya recopilados en anteriores estudios (por instituciones
oficiales, como el Instituto Nacional de Estadística, en España, o por distintos anuarios);
en tal caso se denominan datos estadísticos secundarios. Cuando es el propio
investigador quien va a recopilar los datos, se ve necesitado, en muchas ocasiones, de
la elaboración de una encuesta.

5. Tabular los datos. Esta tarea consiste en ordenar y agrupar, en una tabla, los datos
obtenidos para su posterior análisis y estudio. Como resultado se obtienen las tablas de
frecuencias.

6. Analizar los datos. Una vez obtenidos y tabulados los datos, se procede a su análisis
para determinar las características del fenómeno y enunciar las conclusiones
pertinentes. En este análisis está incluido el estudio de las medidas de centralización y
dispersión, que posteriormente se verán.

7. Representar gráficamente los datos. En la descripción del fenómeno y en la


interpretación, suele ser muy útil estudiar su representación gráfica. Hay diversas
formas de representar gráficamente un fenómeno: diagramas de líneas, de barras, de
sectores, histogramas, pictogramas, pirámides de población, etc. Es el investigador
quien decide cuál es conveniente utilizar en cada caso, siendo a veces conveniente
elegir dos o tres representaciones gráficas de un mismo fenómeno.

Aquí termina el cometido de la estadística descriptiva. De los pasos siguientes en el


estudio se ocupa la estadística inductiva, y son:

8. Estudiar la fiabilidad de la muestra. En muchas ocasiones, el estudio se aplica a


varias muestras distintas de la misma población. En este paso se trata de determinar si
las diferencias que se pueden observar en los resultados de dos muestras distintas son,
o no, considerables, significativas.

9. Extrapolar los resultados muestrales a la población. Se trata de determinar cómo se


comporta la población a partir del conocimiento del comportamiento de la muestra.

10. Contrastar hipótesis. Se estudia la veracidad o falsedad de una hipótesis sobre el


comportamiento de la población establecida, de antemano, a partir del estudio de la
muestra.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

TABLAS DE FRECUENCIA
Las tablas de frecuencia son el resultado de un proceso de tabulación de los datos
recogidos en un estudio. Reflejan, normalmente, la frecuencia absoluta, la frecuencia
relativa, la frecuencia absoluta acumulada, la frecuencia relativa acumulada o los
porcentajes correspondientes a cada dato o valor de la variable.

Frecuencia absoluta
Supóngase que se lanza un dado al aire 20 veces obteniéndose los siguientes
resultados:

6 1 6 3 1 4 5 2 5 6 1 5 3 4 1 4 6 1 3 1

La frecuencia absoluta del dato 6 es 4, puesto que el 6 ha aparecido 4 veces. La


frecuencia absoluta del dato 1 es 6, puesto que el 1 ha aparecido 6 veces,... Estos
resultados se representan mediante una tabla:

Puntuaciones N.º de apariciones


____________ _________________
1 6
2 1
3 3
4 3
5 3
6 4
______
20

La primera columna se refiere a los distintos valores que toma la variable puntuación
obtenida al lanzar un dado y, la segunda, al número de veces que aparece cada
puntuación, es decir, a las frecuencias absolutas.

Si llamamos x1, x2, ... , x6 a los seis posibles valores que puede tomar esta variable, y
n1, n2, ... , n6 a las correspondientes frecuencias absolutas, escribimos la misma tabla
así:

xi ni
___ ____
1 6
2 1
3 3
4 3
5 3
6 4
____
20

donde el subíndice i , que puede tomar los valores 1, 2, ..., 6, hace referencia al lugar
que ocupa cada dato. Así, x3 es el tercer valor de la variable (que en este caso es 3) y
n1 es la frecuencia absoluta del primer valor de la variable (que en este caso es 6).

La suma de las frecuencias absolutas se representa por N y refleja el total de los datos.
En este caso se tiene N = 20.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

Frecuencia relativa
La información que da saber que el 1 ha salido 6 veces, no permite afirmar,
directamente, si ha salido muchas o pocas veces. Para ello hay que hacer referencia al
número total de lanzamientos: si ha salido 6 veces en un total de 8 lanzamientos, puede
decirse que el 1 ha salido muchas veces; pero si es de un total de 100 lanzamientos, ha
salido pocas veces. Para aclarar esta cuestión se introduce el concepto de frecuencia
relativa.

La frecuencia relativa de un dato es el cociente entre la frecuencia absoluta del dato y


el número total de datos:

La frecuencia relativa del 4 en el ejemplo de los lanzamientos de un dado que estamos

La frecuencia relativa se representa por fi:

La frecuencia relativa es siempre un número menor o igual que 1, ya que el numerador,


(frecuencia absoluta de un dato), nunca puede ser mayor que el denominador (número
total de datos).

La frecuencia relativa puede transformarse en porcentaje multiplicando por 100. La


frecuencia relativa expresada en porcentaje o frecuencia relativa porcentual de la

Lanzamientos F. Absolutas F. Relativas Porcentaje


xi ni fi %

1 6 6/20 30
2 1 1/20 5
3 3 3/20 15
4 3 3/20 15
5 3 3/20 15
6 4 4/20 20
________ ________ ________
N=20 1=20/20 100

La suma de las frecuencias relativas es 1, ya que se suman fracciones del mismo


denominador, N, y la suma de numeradores (suma de las frecuencias absolutas), es
también N.

Frecuencia absoluta acumulada


La frecuencia absoluta acumulada de un dato es la suma de su frecuencia absoluta
más las frecuencias absolutas de los valores de la variable anteriores a él.

En el ejemplo de los lanzamientos de dado, la frecuencia absoluta acumulada del dato


4 es 3+3+1+6=13, donde los números 3, 3, 1, 6 son las frecuencias absolutas de los
datos 4, 3, 2, 1 respectivamente. Esto significa que ha habido 13 lanzamientos en los
que se han obtenido puntuaciones menores que 5 ó, dicho de otra forma, menores o
iguales que 4.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

La frecuencia absoluta acumulada del dato 2 es 1+6=7, siendo 1 la frecuencia absoluta


del dato 2, y 6 la del dato 1; es decir hay 7 lanzamientos con puntuación inferior a 3.

La frecuencia absoluta acumulada se representa por Ni.

Puntuaciones F. Absolutas F. Relativas Porcentaje F. Abs. acum.


xi ni fi % Ni
____________ ___________ __________ _________ _______
1 6 6/20 30 6
2 1 1/20 5 7
3 3 3/20 15 10
4 3 3/20 15 13
5 3 3/20 15 16
6 4 4/20 20 20
____ _______ ____
N=20 1=20/20 100

Obsérvese que el último valor de la frecuencia absoluta acumulada coincide con el total
de los datos, N.

Frecuencia relativa acumulada


La frecuencia relativa acumulada de un dato es la suma de su frecuencia relativa más
las frecuencias relativas de los datos anteriores a él.

La frecuencia relativa acumulada del dato 4 es

relativas de los datos 4, 3, 2 y 1. La frecuencia relativa acumulada del dato 2 es

respectivamente.

La frecuencia relativa acumulada se representa por Fi y puede transformarse en


porcentaje multiplicando por 100. Así, la frecuencia relativa acumulada en porcentaje de

puntuaciones inferiores a 5.

xi ni fi fi (%) Ni Fi Fi (%)
___ ___ _____ _____ ____ _____ _____
1 6 6/20 30 6 6/20 30
2 1 1/20 5 7 7/20 35
3 3 3/20 15 10 10/20 50
4 3 3/20 15 13 13/20 65
5 3 3/20 15 16 16/20 80
6 4 4/20 20 20 20/20 100
_____ ________ ____
N=20 1=20/20 100

El último valor de la frecuencia relativa acumulada, como se explicaba anteriormente,


es 1.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

DISTINTOS EJEMPLOS DE TABLAS DE FRECUENCIA


Para variable cualitativa
En un estudio realizado por Warren (político norteamericano del siglo XX), sobre el tipo
de color asociado a la palabra paz, se consultó a 100 personas, pidiéndoles que
escogiesen el más representativo de dicha palabra entre cuatro colores: rojo, azul,
amarillo y verde. Los resultados se reflejan en la siguiente tabla de frecuencias:

xi ni fi fi (%) Ni Fi Fi (%)
________ ___ ______ _____ ___ ______ _____
rojo 6 6/100 6 6 6/100 6
azul 58 58/100 58 64 64/100 64
amarillo 19 19/100 19 83 83/100 83
verde 17 17/100 17 100 100/100 100
___ _______ _____
N=100 1=100/100 100

Interpretación de la tabla:
Considérese, por ejemplo, la tercera fila de la tabla.

n3 = 19 significa que 19 personas escogieron el color amarillo como más


representativo de la palabra paz.

N3 = 83 significa que 83 personas escogieron el rojo, azul o amarillo como color más
representativo de la palabra paz.

encuestados.

Para variable cuantitativa discreta


En un estudio realizado para obtener información sobre el número de hijos de las
familias españolas, se tomó una muestra de 1 000 familias, obteniéndose los resultados
que reflejan la tabla:

xi ni fi fi (%) Ni Fi Fi (%)
________ _____ _________ ______ _____ _________ _____
0 60 60/1 000 6 60 60/1 000 6
1 95 95/1 000 9,5 155 155/1 000 15,5
2 220 220/1 000 22 375 375/1 000 37,5
3 410 410/1 000 41 785 785/1 000 78,5
4 100 100/1 000 10 885 885/1 000 88,5
5 50 50/1 000 5 935 935/1 000 93,5
6 40 40/1 000 4 975 975/1 000 97,5
más de 6 25 25/1 000 2,5 1 000 1 000/1 000 100
_____ ________ _____
1 000 1 100

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

Interpretación de la tabla:
Considérese, por ejemplo, la quinta fila de la tabla.

n5 = 100 significa que 100 familias de las mil tienen 4 hijos.

N5 = 885 significa que hay 885 familias, de las mil, que tienen menos de 5 hijos.

Para variable cuantitativa continua


Cuando el estudio se refiere a una variable cuantitativa continua, peso, talla, velocidad,
etc., o, cuando tratándose de una variable cuantitativa discreta, el número de
observaciones es muy grande y la cantidad de valores diferentes que toma la variable
también, se recurre a agrupar los datos en intervalos. Cada uno de estos intervalos
recibe el nombre de clase.

Por ejemplo:

En un estudio realizado sobre la estatura de cuarenta alumnos de un curso (variable


cuantitativa continua, puesto que entre dos estaturas distintas puede haber un alumno
que tenga una estatura intermedia), se han obtenido los siguientes resultados en
metros:

1,55 1,66 1,69 1,63 1,64 1,67 1,63 1,56 1,62 1,68
1,68 1,62 1,66 1,62 1,69 1,56 1,57 1,60 1,65 1,64
1,67 1,69 1,63 1,64 1,60 1,62 1,63 1,62 1,71 1,72
1,61 1,61 1,64 1,60 1,70 1,76 1,65 1,65 1,68 1,66

Para su estudio, se procede a la agrupación de los datos en intervalos o clases.


Primero se observa cuáles son los valores menor y mayor que toma la variable. En este
caso son 1,55 m y 1,76 m respectivamente.

Definición:

A la diferencia entre el mayor y el menor valor de la variable se le llama recorrido. En


el ejemplo de las estaturas de los alumnos el recorrido es: R = 1, 76 - 1, 55 = 0,21.

Una posible agrupación es considerar, dentro de un mismo intervalo, a los alumnos que
miden entre 1,60 m y 1,65 m; en otro, a los que miden entre 1,65 y 1,70 m; y así
sucesivamente hasta llegar al último intervalo, que incluirá a los alumnos cuya talla esté
comprendida entre 1,75 y 1,80 m. Así:

Estatura de
los alumnos
__________
1,55-1,60
1,60-1,65
1,65-1,70
1,70-1,75
1,75-1,80

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

A la hora de realizar el recuento de los alumnos que están en el primer intervalo, hay
que decidir dónde ubicar a los que miden, por ejemplo, 1,60 m. Pueden contarse en el
primer intervalo o en el segundo. Lo mismo ocurre con los que miden 1,65, 1,70 y
1,75 m. Para hacer esta asignación, se consideran distintos tipos de intervalos:

a) Intervalo cerrado. Incluye los dos extremos y todos los valores intermedios; se
representa entre corchetes. En el intervalo cerrado [1,55-1,60] estarían todas las
estaturas comprendidas entre 1,55 m y 1,60 m ambas incluidas.

b) Intervalo abierto. Sólo incluye los valores comprendidos entre los extremos, es
decir, excluyendo éstos; se representa entre paréntesis. Así, el intervalo abierto (1,55-
1,60) representaría todas las estaturas comprendidas entre 1,55 m y 1,60 m, ambos
excluidos.

c) Intervalo semicerrado. Incluye sólo a uno de los extremos y a todos los valores
intermedios. Puede ser semicerrado por la izquierda, que incluye el valor extremo
inferior. En el intervalo [1,55-1,60) representaría todas las estaturas comprendidas entre
1,55 m y 1,60 m incluyendo la de 1,55 m y excluyendo la de 1,60 m.

Se representarían (1,55-1,60] todas las estaturas comprendidas entre 1,55 m y 1,60 m,


excluyendo la de 1,55 m e incluyendo la de 1,60 m.

Volviendo a la relación de 40 estaturas, si se hace la asignación

Estatura de Número de
los alumnos alumnos
__________ __________
[1,55-1,60) 4
[1,60-1,65) 18
[1,65-1,70) 14
[1,70-1,75) 3
[1,75-1,80) 1
______
N = 40

los alumnos que miden 1,60 m están incluidos en el segundo intervalo; los que miden
1,65 m, en el tercero; y así sucesivamente.

El agrupar los datos en intervalos tiene como ventaja una mayor comodidad en su
tratamiento estadístico, pero tiene como inconveniente la pérdida de información
respecto a los datos iniciales. Por ejemplo: la observación de esta última tabla
proporciona la información de que hay tres alumnos que miden entre 1,70 y 1,75 m,
pero no se sabe exactamente cuál es su estatura.

Amplitud del intervalo o tamaño de clase es la diferencia entre el límite superior y el


límite inferior del intervalo.

La amplitud del intervalo [1,70-1,75] es 1,75 - 1,70 = 0,05 m.


A la hora de confeccionar una tabla de frecuencias de variable continua, conviene, en la
medida de lo posible, que todas las clases o intervalos tengan la misma amplitud.

Marca de clase es el punto medio de la clase. Para su cálculo, basta con sumar el
extremo superior y el inferior de la clase y dividir entre dos. La marca de la clase
[1,70-1,75] es:

Para configurar la tabla de frecuencias se representa la marca de clase por x'i.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

INTRO. SERIES ESTADÍSTICAS


Este tema se centra en el estudio de las series estadísticas, su clasificación y los
distintos modos de representarlas gráficamente.

Las series estadísticas y su representación gráfica constituyen un capítulo


importante de la estadística descriptiva.

La representación gráfica de una serie es el complemento adecuado a su estudio


cuantitativo; conjuntamente, aportan una idea clara y precisa del comportamiento
de las series.

Una serie estadística es una colección o conjunto de datos numéricos debidamente


ordenados y clasificados según un determinado criterio. La interpretación de esos datos
no es sencilla a simple vista, sobre todo en los casos en que las series son largas; y por
ello se recurre a su representación gráfica, que ofrece una rápida visión de conjunto y
es una ayuda eficaz para su análisis. No hay que olvidar, sin embargo, que son un
medio y que, en ellas, no termina el estudio de una serie.

Hay diversos modos de representar una serie estadística correctamente y es el


investigador quien tiene que decidir, en cada caso, cuál es el adecuado.

Tan importante como saber representar gráficamente una serie, es poder interpretar su
gráfica. Es decir, no basta con saber trazar unas líneas en un papel que representen a
la serie, sino que es necesario ser capaz de interpretar lo que esas líneas significan.

CLASIFICACIÓN DE LAS SERIES

Series estadísticas temporales o cronológicas

Si en una serie estadística se estudia la evolución de la variable en un periodo de


tiempo determinado, se trata de una serie estadística temporal . En ellas la
ordenación de los datos se hace con arreglo a alguna unidad de tiempo: año, mes,
semana, día, etc.

Series estadísticas atemporales

En estas series todos los datos han sido tomados en el mismo momento. Las series
atemporales se clasifican en atemporales espaciales y atemporales de frecuencia.

• Series estadísticas atemporales espaciales


Los datos se ordenan en función de su situación espacial, geográfica, y se refieren a un
momento concreto.

• Series estadísticas atemporales de frecuencia


Estas series expresan el número de observaciones que corresponde a cada valor de la
variable, es decir, la frecuencia absoluta de cada dato.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

Los datos pueden o no estar agrupados en intervalos. En el primer caso, la variable


puede tomar cualquier valor del intervalo, y se denomina variable continua (estaturas de
personas, por ejemplo). Si sólo puede tomar valores puntuales se denomina variable
discreta (puntuación de un dado, o edades de una población, por ejemplo).

Ejemplos:

1. La serie correspondiente a la producción española, en millones de litros, de distintas


clases de leche durante el año 1985, es atemporal de frecuencia.

Clase de leche Millones de litros

De vaca 6 282
De oveja 225
De cabra 360

2. La serie que refleja la puntuación obtenida al lanzar 100 veces un dado, es atemporal
de frecuencia de datos no agrupados (variable discreta).

Puntuación Frecuencia absoluta

1 18
2 15
3 17
4 16
5 16
6 18

3. La serie correspondiente a la distribución de los alumnos de una clase con arreglo a


su estatura (dada en metros),

Estatura Número de alumnos

[1,50 - 1,55 ) 6
[1,55 - 1,60 ) 12
[1,60 - 1,65 ) 24
[1,65 - 1,70 ) 8

es atemporal de frecuencia de datos agrupados (variable continua).

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

REPRESENTACIONES GRÁFICAS
Los datos de una serie estadística pueden ser representados en un gráfico. Éstos
aportan una ventaja: permiten observar con rapidez el comportamiento de una serie
estadística y sus principales características.

La extensa variedad de gráficos que se emplean actualmente en estadísticas de


cualquier tipo, hace que sea muy difícil una enumeración exhaustiva de los mismos.
Las clases de representaciones gráficas más utilizadas son:

1. Diagrama de líneas. 5. Polígono de frecuencias.


2. Diagrama de barras. 6. Cartograma.
3. Diagrama de sectores. 7. Pictograma.
4. Histograma. 8. Pirámide de población.

Sea cual fuere el tipo de gráfico elegido para representar una serie, en él se deben
contemplar las informaciones que faciliten su posterior interpretación. Las reglas
básicas son:

_ El título del estudio, especificando la variable que se trata.


_ El tipo de gráfico utilizado.
_ La unidad de medida de cada uno de los ejes.

DIAGRAMA DE LÍNEAS
Se realiza en un sistema de ejes cartesianos.

En uno de los ejes (abscisas) se marcan los datos y en otro (ordenadas) la frecuencia
de cada dato.

No es necesario que los dos ejes tengan la misma graduación. Se señalan los puntos
correspondientes (dato-frecuencia) y éstos se unen con líneas rectas.

Estos gráficos se utilizan, principalmente, para hacer representaciones de series


temporales y de series atemporales de frecuencia cuyos datos no estén agrupados en
intervalos.

Interpretación de un diagrama de líneas

La interpretación de un diagrama de líneas es sencilla: si la línea asciende, la


frecuencia aumenta; si la línea desciende, la frecuencia disminuye.

El punto más alto del diagrama corresponde al valor de la variable que tiene mayor
frecuencia; y el punto más bajo corresponde al valor de la variable que tiene menor
frecuencia.

El que la línea sea casi horizontal se puede deber a dos causas:

1. La graduación que se ha tomado para los ejes es inadecuada.

2. Todos los valores de la variable tienen frecuencias muy similares.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

DIAGRAMA DE BARRAS
Para representar una serie en un diagrama de barras se utiliza un sistema de ejes
cartesianos. En el eje de abscisas se representan los valores de la variable, y en el eje
de ordenadas sus frecuencias. Por los puntos marcados en el eje de abscisas se
dibujan barras, cuya longitud queda determinada por la frecuencia de cada dato.

No es necesario que las escalas utilizadas en cada uno de los ejes sean iguales. Se
utilizan para representar series temporales y atemporales para datos no agrupados.

En algunas ocasiones, las barras o columnas se trazan horizontalmente. En tales


casos, la variable se representa en el eje de ordenadas y la frecuencia en el de
abscisas.

El diagrama de barras es especialmente útil cuando se quieren contrastar distintos


aspectos de la misma variable. Esto se consigue dibujando las columnas referentes a
un aspecto a continuación de las otras con diferentes colores, o bien superponiendo las
columnas de los distintos aspectos, cada una con un color.

Interpretación de un diagrama de barras

Para interpretar correctamente un diagrama de barras hay que tener en cuenta que el
grosor de la barra no tiene ninguna significación. Únicamente hay que fijarse en la
altura de las barras o columnas.

La barra más alta corresponde al valor de la variable que tiene mayor frecuencia,
mientras que la más baja corresponde al valor de la variable que tiene menor
frecuencia.

DIAGRAMA DE SECTORES
El diagrama de sectores consiste en dividir un círculo en sectores circulares, de modo
que la amplitud de cada sector sea proporcional a la frecuencia del dato que
representa. Para conseguirlo basta con aplicar una simple regla de tres, tantas veces
como sea necesario:

Si 360º representan el número total de datos, N, Xº representarán la frecuencia de un


determinado dato.

Una vez obtenido el número de grados que corresponde a cada valor o modalidad de la
variable, con un compás, se traza una circunferencia; se dibuja un radio de la misma y,
a partir de él, con el transportador de ángulos, se miden los grados que corresponden al
primer valor; se pinta el sector circular así determinado y se continúa del mismo modo
con el siguiente dato, hasta completar los 360º.

Este tipo de gráfico se utiliza principalmente para representar series atemporales


espaciales y atemporales de frecuencia.

El diagrama de sectores tiene la desventaja de requerir bastantes cálculos y de ofrecer


una representación, casi siempre, aproximada, debido a la dificultad que plantea
representar gráficamente un número exacto de grados, minutos y segundos. En
cambio, tiene la ventaja de lograr un buen impacto visual, lo cual facilita su
interpretación.

Interpretación de un diagrama de sectores

El diagrama de sectores es una de las representaciones gráficas más sencillas de


interpretar.

Teoría Estadística
http://sapiens.ya.com/trescomacatorce

El sector más grande corresponde al valor de la variable de mayor frecuencia, y el


sector más pequeño corresponde al de menor frecuencia.

En el diagrama de sectores no hay ejes que graduar, con lo que la objetividad de esta
representación es mayor que en casos anteriores.

El investigador tan sólo ha de elegir el tamaño apropiado del círculo para efectuar el
diagrama.

HISTOGRAMAS
Esta representación gráfica se utiliza para series atemporales cuando los datos están, o
no, agrupados en intervalos.

Utiliza un sistema de representación cartesiana.

Para construir un histograma se representa sobre el eje de abscisas la amplitud de


cada intervalo. Se levantan unos rectángulos que tienen por base dichas amplitudes,
con la condición de que el área de cada rectángulo sea proporcional a la
frecuencia del intervalo que representa.

Como el área de un rectángulo es base por altura, y la base viene determinada por la
amplitud del intervalo, conviene distinguir dos casos:

1. Todos los intervalos tienen la misma amplitud

Si todos los intervalos tienen la misma amplitud, basta con construir rectángulos cuya
altura sea igual a su frecuencia.
El área de cada rectángulo será la amplitud del intervalo multiplicada por su frecuencia.

2. Todos los intervalos no tienen la misma amplitud

Las bases de los rectángulos siguen siendo las amplitudes de los intervalos. Para
obtener las alturas hay que tener presente que el área de cada rectángulo debe ser
proporcional a su frecuencia. Una forma de conseguir dichas alturas consiste en dividir
la frecuencia absoluta de cada intervalo entre su amplitud.

Interpretación de un histograma

Para interpretar adecuadamente un histograma, es necesario fijarse en las medidas de


la altura y de la base de cada rectángulo; que es tanto como decir que los resultados en
un histograma se miden por las áreas de los rectángulos representados.

POLÍGONOS DE FRECUENCIA
Un polígono de frecuencias es un gráfico que se obtiene a partir de un histograma,
uniendo los puntos medios de los techos, o bases superiores, de los rectángulos. Se
acostumbra a prolongar el polígono hasta puntos de frecuencia cero.

Un polígono de frecuencia permite ver con gran claridad las variaciones de la


frecuencia de una clase a otra. Son muy útiles cuando se pretende comparar dos o más
distribuciones, ya que, así como es difícil representar dos o más histogramas en un
mismo gráfico, resulta muy sencillo hacerlo con dos o más polígonos de frecuencias.

La suma de las áreas de los rectángulos de un histograma de amplitud constante, es


igual al área total limitada por el polígono de frecuencias y el eje X.
El polígono de frecuencias resume, en una línea, el resultado del histograma
correspondiente. Siguiendo el trazado del polígono, se ve la evolución de la serie.

Teoría Estadística