Beruflich Dokumente
Kultur Dokumente
(3)
1,133'
0 , 3
4 , 3
E
E
N
O
= =
(4)
C
O
NC
OC
E
E
E
E
(5)
La relacin que se establece en (5) indica que esta escala no es de nivel de razn pues no
conserva las proporciones; sto sucedera tambin si consideramos, por ejemplo, la diferencias de
alturas respecto a un patrn o las diferencias en volmenes de venta respecto a un ao base.
En el caso de la temperatura, a pesar de que se coment durante la exposicin de los niveles de
medicin como un nivel de intervalo, es un hecho conocido que la escala Kelvin no es arbitraria y
el cero en ella representa el cero absoluto, es decir, ausencia de energa. El ltimo de los casos
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
32
que merece un comentario deliberado se refiere a las horas de mantenimiento; la confusin puede
presentarse porque las horas son unidades de tiempo y el tiempo es una variable continua; sin
embargo, est claro que el caso en cuestin, tal como est enunciado, tiene un propsito
enumerativo, es decir funciona como un contador y no es una medida de tiempo en el sentido que
comnmente se le atribuye.
e) RECOLECCI N DE DATOS
El propsito de esta seccin es familiarizar al lector con algunas de las fuentes principales de
datos estadsticos e indicar alguna de las prcticas que deben ser observadas para que los datos
recolectados en estudios estadsticos sean confiables. Como se ha sealado hasta ahora, el primer
paso en un proceso estadstico es la obtencin de datos para que sean procesados, convirtindolos
as en un insumo til para el anlisis y la toma de decisiones; el procesamiento abarca lo relativo
a la ordenacin y presentacin de la data. Por ser el dato el principal insumo de los procesos
estadsticos y el protagonista de la estadstica descriptiva, es necesario ocuparse brevemente del
proceso de recoleccin.
i).- Investigacin Estadstica
Las investigaciones estadsticas son frecuentemente asociadas con las encuestas, de hecho estas
ltimas se han convertido en una de las fuentes primordiales de datos estadsticos tiles para que
gerentes pblicos y privados seleccionen acertadamente entre las diversas opciones de las que
disponen. Realizar una operacin orientada a la recopilacin de informacin original sobre un
universo poblacin es una tarea complicada que requiere de una planificacin y conduccin
competente para obtener datos precisos; en muchos casos la complejidad y envergadura de la
investigacin exige la colaboracin de equipos interdisciplinarios altamente especializados, tal
como sucede en la elaboracin de los censos de poblacin de una nacin. En otras oportunidades
la labor investigativa puede referirse a la medicin sistemticamente organizada de los resultados
de mltiples experimentos estadsticos, entendindose como tales los estudios de un situacin
creada en la que la poblacin es inexistente o mejor dicho hipottica; el objeto del experimento es
establecer, por mtodos estadsticos, algunas caractersticas de la poblacin si sta existiera. Por
ejemplo, los experimentos biolgicos, farmacolgicos, psicolgicos y mdicos donde se evala el
efecto o impacto de alguna intervencin bajo ciertas condiciones que varan a voluntad del
investigador. Por ltimo, las investigaciones pueden ser tan simples como la recopilacin de
datos estadsticos obtenidos de informaciones provenientes de fuentes oficiales a nivel
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
33
institucional o de publicaciones de organismos altamente especializados en estas materias. Todos
los profesionales en contacto con datos estadsticos deben conocer ampliamente los problemas
enfrentados su recopilacin para poder evaluar la influencia de esas limitaciones cuando sean
usados, a razn de lo cual se pretende dar una orientacin sobre algunos de los aspectos bsicos
en el planteamiento de una investigacin, las cuales abarcan las siguientes fases:
) Objeto de la investigacin: comprende la respuesta a la pregunta: qu se investigar?,
precisando adicionalmente en qu condiciones, con qu medios, en que momento y en cul
sitio se llevar a cabo.
) Unidad de investigacin: corresponde a la unidad estadstica y significa el elemento del
universo poblacin que origina la informacin, debe ser clara en su definicin, fcilmente
identificable y mesurable.
) Recoleccin de la observacin: es la fase de observacin del universo poblacin que
permite obtener los valores de la variable que la definen.
) Procesamiento de la informacin: consiste en ordenar la informacin, filtrarla eliminando
posibles errores y analizarla mediante los mtodos y normas de la estadstica.
) Publicacin: es la etapa final de entrega de la informacin despus de revisada, ya sea para
uso propio o ajeno. Esta fase requiere que los datos se presenten adecuadamente.
Al disear el plan de la investigacin, es decir, al organizar las actividades que son necesarias
desarrollar para lograr el objetivo propuesto, deben definirse cada una de las actividades, prever
posibles obstculos, y establecer los requerimientos de recursos y tiempo para llevarlas a cabo.
ii).- Observacin de la Poblacin
Muchos de los datos estadsticos que se requieren en una organizacin son datos internos, es
decir, datos acerca de la produccin, venta y otras operaciones propias de la empresa. Esos datos
internos se compilan en infinidad de registros bsicos que se realizan en las empresas, por
ejemplo: el nmero de personas que solicit ayuda al Help Desk, la temperatura del horno en
intervalos regulares de tiempo durante la jornada de operacin, las ausencias y horas extras
laboradas por el personal, el costo de la materia prima y el momento de su recepcin, las
caractersticas fsicas, qumicas o estructurales de la produccin, las comisiones y las ventas de
cada departamento, etc. Por la naturaleza de los ejemplos citados, es intuitivo descubrir que los
registros internos se llevan a cabo durante la ejecucin de las operaciones y que estos insumos se
presentan en forma de reportes, de los cuales destacan los financieros y los de operacin. Estos
ltimos son quizs los ms relevantes para el desempeo profesional de un ingeniero industrial,
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
34
porque no slo contienen informacin en unidades monetarias, sino que versan sobre aspectos
tales como: unidades manufacturadas, compras de material, gastos de mantenimiento, unidades
defectuosas, fallas en maquinarias y operarios, tiempos de ejecucin de actividades rutinarias,
reportes de verificacin de estndares de calidad en materias primas y productos terminados,
tiempo de espera para cumplir con pedidos, horas extras, volumen de trabajo en proceso (WIP
6
),
disponibilidad de productos en inventario, tiempos de entrega de los proveedores de bienes y
servicios, condiciones de operacin de las maquinarias, etc. Asimismo, los reportes se recaudan
en una base temporal, pudiendo ser: diaria, mensual, trimestral, semestral o anualmente,
dependiendo de su impacto en los resultados de la empresa y la frecuencia con que son llevadas a
cabo las actividades que los originan. Muchos de estos reportes sirven para comparar con las
metas empresariales lo que permite aplicar correctivos cuando es necesario o prever la atencin
de nuevas actividades o mercados; por ello, pueden estar estandarizados o responder a
requerimientos especiales y especficos demandados por los ingenieros, administradores y
gerentes. La mayora de los datos y reportes internos en formato electrnico estn a la disposicin
de quienes los necesitan para decidir, prcticamente con inmediatez, debido a los potentes y
minuciosamente diseados sistemas de informacin tan comunes hoy en da.
Adems de estos datos tambin son necesarios otros que escapan del alcance de la actividad
interna de la empresa, particularmente buscados en la actualidad; son datos acerca de otras
compaas similares para comparar el desempeo (benchmarking). Estos datos se obtienen de
reportes y publicaciones, impresas o electrnicas, elaboradas por organizaciones
gubernamentales, asociaciones industriales, gremiales o comerciales, empresas especializadas en
la recopilacin de informacin y el desarrollo de estudios estadsticos.
Esta situacin permite identificar una de las formas ms comunes de diferenciar a los datos
estadsticos segn su fuente. Cuando se utiliza un informe que contiene datos que fueron
originalmente recopilados y publicados por cualquier ente distinto a quien lo publica, se habla de
la utilizacin de fuentes secundarias u observacin indirecta; en cambio, si los que publican el
reporte tambin acopiaron los datos se identifican como datos estadsticos de fuentes primarias o
de observacin directa. Muchas publicaciones son fuentes primarias de algunos datos y
secundarias de otros.
6
Se le conoce por sus siglas en ingles Work in Process, y significa la cantidad de pedidos ya comenzados y an no
terminados en un momento de tiempo determinado.
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
35
Las fuentes primarias presentan ventajas respecto a las secundarias en aspectos como la
presentacin y la cantidad de informacin, debido a que suelen mostrarse de forma ms completa
y detallada, incluyendo explicaciones acerca de los mtodos utilizados en la recoleccin, lo que
se convierte en un auxilio para la evaluacin e interpretacin de los datos. Adems, siempre
existe la posibilidad de que aparezcan en una fuente secundaria errores que no existan en los
datos originales, principalmente asociados al proceso de trascripcin
7
e intercambio de datos.
Estos errores en trascripcin, procesamiento y presentacin de los datos no son exclusivos de las
fuentes secundarias, de hecho, el trabajo de trascripcin es una labor fundamental y muy delicada
en el momento de coleccionar los datos, aunado a la imposibilidad de descartar que en su
compendio se hayan empleado tcnicas inapropiadas de obtencin y la diversidad de datos de
distintas fuentes que se compilan en las fuentes secundarias las hacen muy convenientes; de
hecho este es el tipo de observacin que se usa al resolver los ejercicios y ejemplos de este texto.
El profesional debe prestar mucha atencin al momento de evaluar la precisin y pertinencia de
los datos estadsticos consultados o recabados para cualquier anlisis.
Como se ha sealado hasta ahora, para recolectar los datos de un estudio estadstico, es necesario
observar al universo poblacin que reviste inters, ya se ha expuesto el principal criterio para
clasificar la tarea observadora. Sin embargo, existen otros juicios igualmente vlidos para
clasificar las distintas formas de observacin, enumeracin y medicin del objeto a estudiar.
Dependiendo de la concepcin del problema se puede establecer una tipologa en atencin no
slo con la fuente, sino considerando tambin la periodicidad y la cobertura. Atendiendo a la
fuente las observaciones se clasifican en directas e indirectas; segn la periodicidad puede ser
continua, peridica o circunstancial; y en relacin con la cobertura pueden separarse en
exhaustiva, parcial o mixta. A continuacin se desarrollan un poco las clasificaciones recin
introducidas:
Observacin Continua: es aquella que se lleva a cabo de un modo permanente, por ejemplo,
los registros contables de una empresa.
Observacin Peridica: es la que se ejecuta en perodos de tiempo constantes; normalmente
la base temporal puede ser diaria, semanal, mensual, trimestral, anual, etc. El resultado de
7
Muchos se preguntarn quin se va a poner a pasar los datos existiendo disquetes, CDs y mail? la respuesta es
trivial, existen casos en que ello sigue siendo necesario por que los datos que se necesitan slo existen en un material
impreso y la segunda razn est vinculada a que el intercambio electrnico no est exento de problemas de
corrupcin de la informacin en el proceso de transferencia, ni de vulnerabilidad de la integridad de la data por
errores del operario del software.
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
36
este tipo de observacin produce series estadsticas denominadas series de tiempo
cronolgicas, sobre las cuales se realizan extensas actividades de investigacin por su
relacin con los pronsticos.
Observacin Circunstancial: en este caso responde a una necesidad momentnea y
especfica que requiere una evaluacin espordica, por ejemplo, el nmero de pacientes
diagnosticados con fiebre amarilla en el Estado Zulia en agosto de este ao.
En lo relativo a la cobertura puede aclararse que:
Observacin Exhaustiva: se denomina cuando la actividad se realiza sobre la totalidad de
los elementos que conforman el universo-poblacin; un ejemplo adecuado son los censos
que elabora el Instituto Nacional de Estadstica (INE8). En virtud de que esta operacin se
ejecuta cada diez aos, es tambin una observacin peridica; ms an por ser una encuesta
que es administrada y publicada por el mismo organismo corresponde a una observacin
directa. Es importante resaltar que cada investigacin estadstica podr ser clasificada a
partir de todos y cualquiera de los criterios sealados.
Observacin Parcial: como se argument anteriormente la observacin de los universos
poblaciones es poco prctica y no siempre factible. Por lo tanto, es ms comn centrar la
investigacin en una muestra, dado que en este caso el investigador se fija en slo una parte
de las unidades estadsticas, se clasifica como observacin parcial.
Observacin Mixta: cuando un estudio se hace sobre una serie de caractersticas, es natural
que todas ellas no revistan igual atractivo. Una alternativa para enfrentar estos estudios, de
forma que la informacin recabada justifique su costo, consiste en la adecuada combinacin
de la observacin exhaustiva con la parcial, de tal manera que las caractersticas que se
consideren no bsicas se observen mediante una muestra.
iii).- Fuentes de Datos Estadsticos
La existencia de publicaciones contentivas de datos estadsticos se remonta a principios de siglo.
Como se ha explicado previamente en el texto, desde sus orgenes la estadstica ha estado
vinculada a la recopilacin de informacin acerca de las actividades del estado y sus habitantes;
entonces es natural que en todas partes del mundo funcionen organizaciones gubernamentales
vinculadas a la recoleccin de datos estadsticos. La actividad de recaudar datos con distintas
finalidades no est limitada al espacio de lo pblico; debido a los intereses particulares que
8
Anteriormente, responda al nombre de Oficina Central de Estadstica e Informtica (OCEI).
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
37
demandan cierto tipo de informacin se conocen una basta cantidad de empresas cuya actividad
est referida a la realizacin de estudios estadsticos particulares y a la comercializacin de bases
de datos que renan estadsticas de inters general. Existen miles de fuentes impresas donde se
informan datos estadsticos recolectados peridicamente; lo ms comn es que esta literatura se
presente en entregas mensuales o en tomos anuales. A pesar de ello, no siempre es una tarea
sencilla disponer de los datos estadsticos abiertos al pblico, dependiendo del inters especfico
de quin requiere los datos; lo ms oportuno es consultar una fuente de datos primarios estndar
en la que sea razonable esperar que dichos datos aparezcan, en particular, si el objetivo es un
estudio de seguridad industrial y se demandan datos acerca del nmero de accidentes laborales en
las industrias manufactureras venezolanas con incapacitacin temporal, lo ms sensato es acudir a
los registros del Ministerio de Trabajo y Desarrollo Social.
Dada la extensin, facilidad y cotidianidad con la que se utiliza Internet como herramienta de
bsqueda y publicacin de informacin sobre los diversos tpicos, se har nfasis en las
posibilidades que brinda dicha herramienta. Entre otras facultades, Internet permite acceder a las
pginas de organizaciones gubernamentales.
En el mbito local se dispone de:
1.- http://www.bcv.org.ve/c2/indicadores.asp: Es la pgina de informacin estadstica del
Banco Central que presenta los datos fundamentales acerca de aspectos econmicos del pas.
2.- http://www.ine.gov.ve/ine/indexine.asp: Es la pgina del Instituto Nacional de Estadsticas
y permite el acceso online a diversos datos, principalmente demogrficos y econmicos.
A nivel mundial, se obtienen con relativa facilidad datos acerca de Estados Unidos de Amrica en
pginas como:
3.- http://lib.mansfield.edu/govstats.html: Pgina Web de la biblioteca "North Hall" de la
Universidad de Mansfield; contiene datos estadsticos de varias reas socioeconmicas
norteamericanas, documentos gubernamentales y trabajos de referencia, adems de un link
para informacin internacional distribuidos en diez pginas individuales.
4.- http://devdata.worldbank.org/data-query/: Esta pgina del Banco Mundial permite
observar 53 series estadsticas para los aos 1998-2002 de casi todos los pases del globo;
algunas de ellas bien interesantes para diagnosticar la economa, tecnologa y desarrollo
industrial de los pases.
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
38
5.- http://faculty.babson.edu/turner/fish/finecn.htm: Es una pgina que rene una serie de
vnculos que dan acceso a una diversidad de datos econmicos reales recopilados por
instituciones de gran prestigio internacional.
6.- http://globaledge.msu.edu/ibrd/busresmain.asp?ResourceCategoryID=10: Desde aqu se
puede acceder a pginas con datos compilados por la CIA, British Petroleum, UNESCO,
Banco Mundial y otras de reconocida validez por su solvencia profesional. Adems, cuenta
con un servicio buscador.
Como se puede apreciar en esta pequea muestra, existe una gran y diversa disponibilidad de
datos estadsticos en lnea. Conectndose con servicios de bsqueda de pginas Web, esta lista se
extendera ampliamente; queda de ustedes aprovechar los recursos que oferta el ciberespacio.
f) RESUMEN
Este captulo le permiti conocer el origen, concepto, aplicacin e importancia de la estadstica
adems de aclarar la mayor parte de los trminos que emplear de aqu en adelante. Conocer e
identificar variables y sus niveles de medicin le permitir aplicar los conceptos que se
desarrollarn en el siguiente captulo, adems, entender la naturaleza del colectivo en estudio, le
significar comprender el alcance de la informacin que obtiene y las conclusiones que esboza.
Se le dio a conocer fuentes de donde poder extraer datos estadsticos para realizar anlisis que
soporten conclusiones que le interesen, se espera haber incentivado su curiosidad por conocer
datos reales y ubicar fuentes confiables de aquellos pertinentes a su especialidad profesional. Sin
embargo, en opinin del autor lo ms importante debe ser que usted reflexione ante su forma de
observar el mundo y se de cuenta de las caractersticas importantes de los colectivos, que juzgue
adecuadamente las informaciones que lea y escuche en trminos de su variabilidad y su validez
estadstica, todo ello har de sus decisiones, acciones cada vez mejor tomadas y justificadas.
g) EJERCI CI OS PROPUESTOS
1.- Se realiz un estudio acerca del tipo de transporte utilizado para ir al trabajo por sus
residentes. La informacin obtenida de encuestar una muestra de ellos es la siguiente:
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
39
TIPO DE
TRANSPORTE
No. DE
RESIDENTES
Auto Particular 41
Taxi 22
Metro 42
Auto por Puesto 52
Autobs 37
Otros 25
a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la variable y de qu tipo es?
d) Cul es la unidad estadstica?
e) Cul es la escala de medicin
utilizada?
2.- En cada caso indique, cul es la variable, el tipo y la escala de medicin:
a) El nmero de catastro de los terrenos ubicados en Prados del Este.
b) El volumen de los recipientes de los detergentes.
c) El nmero de defectos de los lpices fabricados en Berol.
d) El nmero de glbulos rojos por centmetro cbico de sangre de los pacientes del Hospital
Vargas.
3.- El laboratorio de control de calidad de una empresa realiza un test de rapidez de accin de un
pesticida de jardn, en 50 plantas infectadas. Los resultados fueron observados cada hora,
habindose obtenido los siguientes datos del nmero de plantas totalmente libre de plagas
despus de los lapsos que se indican: 3 horas, 3 plantas; 4 horas, 7 plantas; 5 horas, 10 plantas; 6
horas, 16 plantas; 7 horas, 9 plantas; 8 horas, 5 plantas.
a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la variable?
d) De qu tipo es la variable?
e) Cul es la escala de medicin utilizada?
4.- Se realiza un estudio en 120 hogares de la clase media de la ciudad X, para conocer el tipo de
aceite o grasa usada en la cocina. Los resultados son los siguientes: oliva, 3 hogares; crtamo, 65
hogares; ajonjol, 21 hogares; maz, 14 hogares; compran aceite a granel sin especificar tipo, 7
hogares; grasas de origen animal, 11 hogares; grasas de origen vegetal, 6 hogares.
Conceptos Bsicos sobre Estadstica Raquel Centeno Silva
40
a) Cul es la poblacin?
b) Cul es la muestra?
c) Cul es la variable?
d) De qu tipo es la variable?
e) Cuntas clases tiene la variable?
f) Qu tipo de escala se ha utilizado en la clasificacin de la variable?
5.- Se efecta un censo de capacidad de las fbricas textiles existentes en el Municipio A, de
acuerdo con el nmero de telares instalados en cada fbrica. Los resultados del censo son los
siguientes: 3 telares: 7 fbricas; 4 telares: 2 fbricas; 5 telares: 8 fbricas; 6 telares: 6 fbricas; 7
telares, ninguna fbrica; 8 telares: 5 fbrica; 9 telares: 1 fbrica; 10 telares: 3 fbricas.
a) Cul es la poblacin?; cul es la muestra?; c) cul es la variable?; d) de qu tipo es la
variable?; e) cuntas clases tiene la variable?; f) qu tipo de escala se ha utilizado en la
clasificacin de la variable?.
6.- En cada caso indique: a.- cul es la variable, y de qu tipo; b.- cul es la unidad estadstica; c.-
cul es la escala de medicin utilizada.
a) Espectculo preferido por los habitantes del Estado Mrida.
b) Catastro de los terrenos del Municipio Libertador.
c) Peso de los interruptores producidos por la empresa XX, C.A.
d) Nmero de expedientes procesados diariamente por la PTJ.
e) Serial de las computadoras almacenadas en los depsitos.
f) Nombre de las ciudades ms visitadas por los asiticos.
41
II. DISTRIBUCIONES DE FRECUENCIA
Cuando se realiza un experimento estadstico con la finalidad de describir y analizar algn
fenmeno en un colectivo de inters, se realizan observaciones sobre los elementos que integran
dicho colectivo. Si uno se concentra en determinar las veces en que se repiten cada una de las
distintas observaciones, se pueden descubrir caractersticas y patrones que permiten extraer
conclusiones importantes. La forma de clasificar y agrupar esas observaciones incide mucho en
las conclusiones que se extraen. Una de las actividades fundamentales del ingeniero industrial se
denomina anlisis de fallas, la mejor manera de abordarlo es realizando un estudio de la
frecuencia de ocurrencia de las fallas, mediante un histograma de Pareto, esta herramienta se le
presentar en este aparte. Mediante el estudio de este captulo se pretende que Usted sea capaz
de:
1. Expresar el concepto de series estadsticas.
2. Describir cada una de las caractersticas de las series estadsticas.
3. Explicar el concepto de distribucin de frecuencias, destacando sus componentes.
4. Explicar los conceptos de: rango total, intervalo de clase, lmite de clase, lmite nominal,
lmite real, marca de clase, frecuencias: absolutas, relativa, porcentual y acumuladas.
5. Construir distribuciones de frecuencias de una serie estadstica agrupando sus datos
ordenadamente segn su magnitud y tipo de variable.
6. Representar grficamente las distribuciones de frecuencias mediante histogramas,
polgonos de frecuencias y ojivas.
7. Calcular frecuencias relativas, frecuencias porcentuales, frecuencias acumuladas,
percentiles y rango percentil.
8. Reconocer la importancia y aplicabilidad de los histogramas de Pareto.
9. Realizar anlisis de Pareto a partir de las distribuciones de frecuencia acumulada.
Distribuciones de Frecuencia Raquel Centeno Silva
42
a) SERI ES ESTAD STI CAS
Tal como se estableci en el captulo anterior, la estadstica no se ocupa de hechos aislados, sino
que tiene como objeto el estudio de los colectivos. Al llevar a cabo un estudio estadstico se
observan, cuentan o miden una o ms caractersticas de las unidades estadsticas que conforman
el universo-poblacin; estas actividades generan una masa de datos que deben ser organizados
para disponerlos en alguna secuencia lgica que facilite su anlisis. Esta coleccin de datos
numricos, obtenida durante la investigacin, clasificada y ordenada segn un determinado
criterio, se denomina serie estadstica, conocida tambin como distribucin estadstica.
La forma en que se observa al colectivo sujeto de estudio permite clasificar a las series
estadsticas segn la periodicidad en la observacin, es decir, de acuerdo a la influencia del
tiempo en la recoleccin de la data. Este criterio permite tipificar las series estadsticas en: a)
series temporales o cronolgicas, y b) series de frecuencias o atemporales. Asimismo las series de
frecuencia pueden discriminarse en: cuantitativas, cualitativas, y las series espaciales o
geogrficas.
i).- Series Temporales
Son el conjunto de datos que se obtiene al registrar un fenmeno cuantificable de forma reiterada
en diferentes momentos equiespaciados en el tiempo. Ejemplos de ellas pueden ser: a) utilidad
antes de impuesto de Empresas Polar al 31 de marzo de cada ao en la ltima dcada, y b)
cantidad promedio de piezas defectuosas producidas en cada ao por Sanitarios Maracay entre
1995 y 2002. Usted debera notar una sutil pero relevante diferencia que existe entre los ejemplos
enunciados; mientras el primero de los citados est referido a un instante de tiempo particular (el
ltimo da del mes de marzo), el segundo se refiere a un perodo de tiempo (un ao completo).
Visto que es posible realizar cada observacin sucesiva, bien sea a lo largo de un perodo o para
un instante particular, urge entonces, especificar la forma en que estn referidos los datos
observados.
ii).- Series Atemporales
Son aquellas donde las observaciones se efectan en un mismo instante de tiempo o sobre un
perodo en particular. En estas condiciones, y dado que el tiempo durante el cual se cuantifica el
fenmeno es el mismo para todas las observaciones, el universo-poblacin que se selecciona
proporciona una fotografa de una cierta situacin, es decir, una visin instantnea del patrn
establecido por el fenmeno estudiado; ejemplos apropiados pueden ser: a) costo en Bs. del
Distribuciones de Frecuencia Raquel Centeno Silva
43
inventario de materia prima perecedera de las empresas afiliadas a la CAVIDEA al primero de
diciembre del 2002, b) ventas brutas en Bs. de paales Huggies por zonas de distribucin, y c)
nmero de veces que se procesan 6, 7, 8, 9, 10, 11, 12 o 13 transacciones electrnicas diarias por
la gerencia de B2B
9
de Ford Motors de Venezuela. Una serie estadstica donde sea explcito que
los valores dependen del espacio geogrfico, como la del segundo ejemplo, se conoce como serie
espacial o geogrfica. Los otros dos ejemplos corresponden o pueden transformarse a lo que se
denomina distribuciones de frecuencias, las cuales revisten una gran importancia en los estudios
estadsticos y por ello se ahondar en detalles a lo largo del captulo.
b) DI STRI BUCI ONES DE FRECUENCI A
Tal como se ha hecho hincapi hasta ahora, para analizar una variable y explotar la utilidad de la
estadstica se hace necesario, en primer lugar, recopilar una cantidad de valores, realizando un
experimento estadstico mediante el cual se obtiene una secuencia de observaciones,
mayoritariamente representadas por nmeros, que se registran anotndose en el orden en el que
suceden. Este registro conforma un conjunto de datos conocidos con el nombre de datos en bruto
o no agrupados. Los datos en bruto deben ser ordenados y clasificados para obtener una
descripcin informativa de las manifestaciones del colectivo; particularmente til es determinar el
nmero de casos en que se presentan cada una de sus clases, es decir, la frecuencia de repeticin
de las observaciones en el conjunto, para ello se emplea un arreglo tabular que contiene todas las
clases o variantes de la variable y sus frecuencias respectivas. Esta construccin que indica como
se agrupan las repeticiones o frecuencias de aparicin de los valores de una variable dentro de
clases o categoras es denominada distribucin de frecuencias, trmino que se abrevia
normalmente como distribucin. La conversin de datos observados en distribuciones de
frecuencia constituye, a menudo, la aplicacin primaria del mtodo estadstico, visto que expresar
los hechos observados en forma de distribuciones de frecuencia es el paso inicial en la mayora
de las investigaciones.
La determinacin de la frecuencia con la que ocurre cada variante puede llevarse a cabo a travs
del estudio u observacin de toda la poblacin, en cuyo caso se trata de un censo o de un
inventario. Las distribuciones de frecuencia tambin pueden emplearse con datos cualitativos o
9
Acrnimo proveniente del ingls Business to Business empleado para designar las transacciones nter empresariales
realizadas en forma electrnica sin soporte fsico. Las transacciones entre empresas y consumidores, tales como la
compra de software, libros, regalos, etc., consultas de cuentas bancarias por Internet se conocen como B2C por
Business to Consumers.
Distribuciones de Frecuencia Raquel Centeno Silva
44
categricos. En algunas aplicaciones, cuando la variable ha sido clasificada usando una escala
cuyo nivel de medicin es ordinal, la distribucin de frecuencia debe reflejar el
ordenamiento natural de las categoras mediante una presentacin que respete una
secuencia lgica para maximizar la claridad de la descripcin realizada y con ello su
comprensin
10
. En las aplicaciones cuyo nivel de medicin es nominal el orden de las categoras
es arbitrario y depende del que presente los datos.
Para elaborar una distribucin de frecuencias es necesario construir lo que se denomina una tabla
de conteo, para ello se siguen estos pasos:
1) Hacer una tabla o lista de dos columnas, tal como esta:
Clases Marcas
FIGURA N 8 BOSQUEJO DE UNA TABLA DE CONTEO
2) Determinar por inspeccin del conjunto de datos el valor mnimo y el valor mximo.
3) Definir las variantes o clases como cada uno de los valores posibles de la variable,
comprendidos entre el menor y el mayor de los valores observados.
4) Colocar en la primera columna, ordenados de menor a mayor
11
, cada una de las variantes o
clases.
5) Observar, uno a uno, los datos en bruto y registrar con una marca vertical (palito) en la clase
que corresponda a cada observacin; para mejorar la visual de las marcas y facilitar el conteo
se sugiere agrupar las marcas de cinco en cinco, haciendo el quinto registro tachando los
cuatro previos. El resultado debera verse similar a:
10
Si los datos son cuantitativos tambin debe seguirse el ordenamiento natural, habitualmente, en orden ascendente,
aun cuando puede hacerse de forma contraria.
11
El orden ascendente es el ms habitual, no obstante es absolutamente vlido emplear el ordenamiento descendiente
para estos fines.
Distribuciones de Frecuencia Raquel Centeno Silva
45
N de Conexiones Marcas
9 \\
10 \\\\
11 \\\\ \\
12 \\\\
13 \\\
FIGURA N 9 REPRESENTACIN DE UNA TABLA DE CONTEO LLENA
Normalmente, las tablas de conteo no aparecen en los informes estadsticos; sin embargo,
perctese como el encabezado correspondiente a la columna donde se listan las clases se rotula
con el nombre de la variable que define a la poblacin en cuestin. Una vez que se cuantifica el
nmero de repeticiones de cada variante dentro del conglomerado de datos, se puede establecer la
distribucin de frecuencias en un arreglo tabular similar, donde se sustituyen las marcas de
conteo por el nmero que las identifica, conocido como frecuencia absoluta. Otra posibilidad
muy empleada por su capacidad de sntesis son la denominadas tablas de frecuencia, que pueden
incluir cinco columnas, la primera de ellas corresponde al ordenamiento de las clases, en la
segunda se registran las frecuencias absolutas en el caso ilustrado en Figura N 9 esta columna
contemplara una lista con los nmeros: 2, 4, 7, 5 y 3 las columnas subsiguientes contienen la
frecuencia relativa, la frecuencia absoluta acumulada y la frecuencia relativa acumulada. La
frecuencia relativa es el valor que se obtiene al dividir la frecuencia absoluta de una clase entre el
nmero total de observaciones o tamao de la muestra; la frecuencia absoluta acumulada
representa todas las frecuencias correspondientes a los valores de la muestra que son menores o
iguales a cierto valor; se calcula sumando el valor de la frecuencia absoluta acumulada anterior
con el valor de la frecuencia absoluta de la clase sucesiva; evidentemente para la primera de las
clases no existe ningn valor previo y, consecuentemente, la frecuencia absoluta acumulada
anterior es nula. La frecuencia relativa acumulada de cada clase es el resultado de dividir la
frecuencia absoluta acumulada entre el nmero total de observaciones.
N de
Conexiones
Marcas
Frecuencia
Absoluta
Frecuencia
Relativa
Frecuencia Absoluta
Acumulada
Frecuencia
Relativa
Acumulada
9 \\ 2 2/21=0,0952 0+2=2 0+0,0952=0,0952
10 \\\\ 4 4/21=0,1905 2+4=6 0,0952+0,1905=0,2857
11 \\\\ \\ 7 0,3333 13 0,6190
12 \\\\ 5 0,2381 18 0,8671
13 \\\ 3 0,1429 21 1,0000
Totales 21 1,0000
FIGURA N 10 EJEMPLO DE UNA TABLA DE FRECUENCIAS
Distribuciones de Frecuencia Raquel Centeno Silva
46
Hay quienes consideran que una tabla con seis columnas, como la mostrada en la figura previa,
facilita el trabajo de construccin de la tabla de frecuencias al incorporar entre las columnas
correspondientes a las clases y la frecuencia absoluta, la columna de marcas. Si cierto valor
numrico no aparece en una muestra su frecuencia ser cero; por el contrario, si todas las
observaciones corresponden a una clase en particular su frecuencia ser el tamao de la muestra
N. A partir de este hecho y la definicin de frecuencia relativa se puede establecer el siguiente
teorema:
TEOREMA 1 : [Kreysig, 1973] La frecuencia relativa es al menos igual a 0 y a lo ms igual a 1.
En virtud del teorema 1, podemos inferir de forma inmediata que las frecuencias relativas pueden
expresarse en porcentajes, una modalidad de uso ms comn al redactar informes analticos,
simplemente multiplicndolas por cien.
Porcentaje = 100h
i
(1)
Tomando una muestra dada de tamao N que consta de nc clases:
x
1
, x
2
,..., x
nc
(nc N)
con sus respectivas frecuencias relativas:
nc
h h h
)
K
) )
, , ,
2 1
Entonces se podr introducir la funcin de frecuencias de la muestra, (x) h
)
, que representa
como estn distribuidos los valores de la muestra:
, 2, 1,
contrario caso en 0
cuando
nc k
x x h
(x) h
k k
L
)
)
=
=
= (2)
En virtud de que las frecuencias no son ms que observaciones y que el conjunto de datos que
conforma la muestra son todas las observaciones, forzosamente la suma de todas las frecuencias
absolutas de una muestra coinciden con el tamao de la misma, lo cual permite establecer el
prximo teorema:
TEOREMA 2: [Kreysig, 1973] La suma de todas las frecuencias relativas en una muestra es igual a
1, esto es,
1 ) ( ) ( ) ( ) (
1
= + + + =
=
nc 2 1
nc
k
k
x h x h x h x h
)
L
) ) )
Lo que permite introducir la funcin de frecuencias relativas acumuladas de la muestra
funcin de distribucin de la muestra:
=
x t
t h x H ) ( ) (
~
)
(3)
Distribuciones de Frecuencia Raquel Centeno Silva
47
En la ecuacin (3) se establece la relacin entre la funcin de frecuencia y la funcin de
distribucin de la muestra, por lo tanto resulta evidente, que a partir de los valores de cualquiera
de ellas pueden obtenerse los de la otra. Un aspecto interesante que surge al introducir las
funciones definidas en las ecuaciones (2) y (3) es que como toda funcin, stas tienen una
representacin grfica en el plano cartesiano, por ende, una forma de visualizar el
comportamiento de la muestra; para el ejemplo de la Figura N 10, se tiene:
0,0952
0,1905
0,3333
0,2381
0,1429
0,00
0,05
0,10
0,15
0,20
0,25
0,30
0,35
8 9 10 11 12 13 14
Nmero de Conexiones
Frecuencia
Relativa
(a) Funcin de Frecuencia de la Muestra
0,00
0,10
0,20
0,30
0,40
0,50
0,60
0,70
0,80
0,90
1,00
8 9 10 11 12 13 14
Nmero de Conexiones
Frecuencia
Relativa
Acumulada
(b) Funcin de Distribucin de la Muestra
FIGURA N 11 REPRESENTACIN GRFICA DE LAS FUNCIONES DE FRECUENCIA Y DISTRIBUCIN
Cuando el nmero de clases de la variable es muy grande la funcin de frecuencias y su
representacin grfica se complica, provocando confusin en vez de claridad; por ello, puede
resultar preferible la construccin de una distribucin o tabla de frecuencias agrupada, es decir,
incluyendo en cada clase un rango de mediciones de la variable en vez de un nico valor. Se
justifica la agrupacin para obtener una mejor descripcin, visualizacin y explicacin de los
hechos. A razn de la simplificacin que ofrece el proceso de agrupamiento, siempre que se
convierten los datos originales en una distribucin de este tipo, se pierden detalles sobre los datos
iniciales. Sin embargo, esta prdida en la informacin es pequea si se le compara con la
facilidad de interpretacin ganada al obtener una visin ms ntida del conjunto, lo que permite la
revelacin de patrones y tendencias exhibidos por l. Adems, cuando los valores de la variable
se resumen en una tabla de frecuencias agrupadas se pueden obtener caractersticas adicionales de
las variables, aplicando ciertas tcnicas estadsticas, tales como las medidas de posicin y
dispersin.
Antes de comentar como construir una distribucin de frecuencias agrupadas, deben
puntualizarse ciertos trminos que faciliten la sistematizacin del procedimiento, la comprensin
del mismo y de sus resultados:
Distribuciones de Frecuencia Raquel Centeno Silva
48
) Intervalo total: conocido tambin como recorrido o rango de la serie de datos y corresponde a
la diferencia entre el mayor y el menor de los valores observados.
I
T
= x
mayor
x
menor
(4)
) Clases: corresponden al fraccionamiento que se hace del intervalo total y comprenden un
rango de valores de la variable estudiada. La cantidad total de fracciones resultantes de la
segmentacin del intervalo total se conoce como nmero de clases (nc) de la distribucin de
frecuencias agrupadas.
) Lmites de clase: son los valores extremos del recorrido delimitado por cada clase, de esta
forma todas las clases poseen un lmite inferior (Li) y un lmite superior (Ls). La siguiente
ilustracin permitir delinear el problema primordial al establecer los lmites de clase:
FIGURA N 12 PROBLEMAS CON LOS LMITES DE CLASE
En la prctica, al construir una distribucin de frecuencias agrupadas hay que tener cuidado
de que los lmites de las clases no coincidan con valores observados de la variable; ello para
evitar cualquier ambigedad con respecto a la clase a que pertenece una observacin en
particular. Si fijamos en el primero de los casos que se visualizan, existen problemas al tratar de
clasificar datos cuyos valores observados sean 13 15, debido a que son simultneamente el
lmite superior de una clase y el inferior de otra, en consecuencia, se est en presencia de clases
que no son mutuamente excluyentes. Sin embargo, esta situacin se presenta sin extraeza en la
prctica diaria, resolvindose la claridad de la situacin a criterio del investigador, quien
establece un intervalo semicerrado donde, habitualmente, el L
i
est incluido en el rango de datos
Distribuciones de Frecuencia Raquel Centeno Silva
49
y simultneamente todos los datos de la clase son estrictamente menores que el L
s
. Esta forma de
proceder se identifica como clases con lmites nominales, puesto que la misin de los lmites
superiores es funcionar como etiqueta que seala la frontera del intervalo; lamentablemente la
ambigedad de clasificacin de los datos en las clases persiste para el lector de la investigacin.
Otra opcin para resolver el problema se corresponde con el caso (b) de la figura, en donde se
introducen dos lmites adicionales marcados con las letras B y C; en efecto, la expresin de los
intervalos de clase as delimitadas son mutuamente excluyentes cuando los datos son discretos.
No obstante, para datos continuos se sabe que no hay ruptura real y por ende existe una serie de
valores que no pertenecen a ninguna clase. Las clases as definidas no sern colectivamente
exhaustivas. La tercera imagen, propuesta en la Figura N 12, funciona tanto para datos discretos
como continuos. Para datos continuos es necesario sealar una separacin arbitraria
adecuadamente establecida por la precisin de la medicin; cuando se realiza el proceso de
registro de los datos de una variable continua se obtienen una serie de valores con alguna
separacin entre ellos, es decir, las observaciones discretizan a las variables continuas. Observe
que diferenciar entre variable continua y discreta obliga a profundizar en el gnero filosfico y
conceptual de la variable propiamente dicha y ampla la disertacin a los valores posibles y
observados, punto donde no se ha alcanzado un consenso entre los diversos autores; para evitar
ese conflicto se puede utilizar la expresin menor que, en el sentido en que es posible acercarse a
un valor tanto cuanto se quiera pero sin llegar al valor en s; este recurso lingstico se logra
operativamente utilizando como valor del lmite superior de una clase el valor nominal
sustrayndole una unidad en la ltima cifra de apreciacin del instrumento empleado en la
medicin. El lmite inferior de la clase subsiguiente ser el lmite superior nominal de la clase
previa que ya no puede ser representado en ella. Con lo cual cada observacin pertenecer de
manera inequvoca a una nica clase, es decir, se dispondr de clases mutuamente excluyentes y
colectivamente exhaustivas. Pueden ahora puntualizarse algunas definiciones importantes y sus
correspondientes relaciones matemticas en caso de existir:
) Intervalos de clases: es la distancia que existe entre el lmite superior y el inferior de cada
clase; es frecuente que los trminos intervalo de clase y clase se intercambien, sin embargo es
importante resaltar que el intervalo es un atributo de la clase.
ic = L
s
L
i
(5)
No es necesario que los intervalos de clase sean iguales, excepto cuando la necesidad radica
en comparar una muestra cualquiera con otra previamente agrupada donde se exige la
Distribuciones de Frecuencia Raquel Centeno Silva
50
misma longitud para los intervalos. Elaborar intervalos del mismo ancho es una prctica
comn, tanto por la simplicidad de la construccin de la distribucin y la facilidad de los
clculos ulteriores, como por la mejora de la informacin visual en la distribucin de
frecuencias. En cuyo caso la amplitud de los intervalos de clase viene dada al conocer el
intervalo total y el nmero de clases, segn la expresin:
nc
I
ic
T
= (6)
En ciertas situaciones pueden ser necesarios intervalos de clase desiguales para evitar un gran
nmero de clases vacas o casi vacas; estas circunstancias se suelen manifestar cuando el
intervalo total presenta una longitud muy amplia. Un caso particular donde se hace patente
esta necesidad sucede en aplicaciones donde existen ciertas observaciones cuyos valores
difieren en cuanta del resto. Para estos casos se emplean intervalos de clase que, al menos
tericamente, carecen de lmite superior o inferior. Este tipo de intervalos de clase se conocen
como intervalos de clase abiertos y ocurren en la primera clase, en la ltima clase o en ambas.
En cada aplicacin particular se debe elegir el intervalo ms adecuado para mostrar la
informacin deseada.
) Frecuencia absoluta: es el nmero de ocurrencias, dentro de las observaciones, cuyos valores
estn comprendidos entre de los lmites de una clase, y se denota como f
i
. Anlogamente al
caso de las distribuciones no agrupadas, el cociente entre la frecuencia absoluta y el nmero
total de datos proporciona la frecuencia relativa (h
i
)
N
f
h
i
i
= (7)
y en virtud del Teorema 2, 1 h
nc
1 i
i
=
=
(8)
Tambin para las distribuciones agrupadas de frecuencias se emplean las frecuencias
acumuladas, la absoluta designada como F
i
y la relativa denotada con H
i
. En ambos casos
expresan la suma de las frecuencias absolutas o relativas, respectivamente, de todos los
valores de la variable precedentes y la suya propia.
) Marca de clase: es el valor central o punto intermedio del intervalo de clase, razn por la cual
tambin se le conoce como punto medio de la clase. Si se asume que los valores que estn
incluidos en el intervalo de clase estn uniformemente distribuidos, entonces la marca de
clase (x
i
) es el valor tpico ms representativo de todos ellos. Se utiliza, bsicamente, como
insumo para el clculo de las medidas de tendencia central y de dispersin, as como para la
Distribuciones de Frecuencia Raquel Centeno Silva
51
representacin puntual del intervalo de una clase y se determina mediante la semisuma de los
lmites de la clase:
2
L L
x
s i
i
+
= (9)
La desventaja principal de las distribuciones agrupadas estriba en que la marca de clase puede
discrepar de los valores observados de la variable; cuando sto sucede, los clculos derivados a
partir de los datos de la distribucin tienen asociado imprecisiones conocidas como errores de
agrupamiento. Por ello, los intervalos de clase se deben seleccionar de modo tal que las
marcas de clase coincidan con datos realmente observados.
La cuestin de cundo y cmo se debe presentar una distribucin de frecuencias en forma
agrupada slo puede decidirse con la ayuda del criterio que va delineando la experiencia. En
trminos generales, son preferibles las distribuciones que no contengan un nmero excesivo de
clases y nuevamente, la interpretacin del adjetivo excesivo es relativa y se forma con la
experiencia. Si se plantea como alternativa plausible el interrogante bajo las condiciones del
tamao del intervalo no escapamos del problema, ya que puede establecerse que si los intervalos
son muy pequeos (un nmero muy grande de clases) puede limitar su uso al dejar sin
observaciones a algunas de las clases, mientras que si son excesivamente amplios (un nmero
muy pequeo de clases) puede ocultar la distribucin real del conjunto de datos diluyendo los
detalles. El nmero de clases depende del nmero de observaciones y de la dispersin de los
datos y debe aumentar en funcin del nmero de observaciones que conforman la poblacin o la
muestra a analizar. La seleccin, bien sea del nmero de clase o del tamao del intervalo,
constituye el problema bsico, al construir distribuciones agrupadas de frecuencias. La
experiencia del autor revela que las distribuciones pueden englobarse en un nmero de
clases que oscila entre 7 y 15. Yamane, (1974) tambin considera conveniente tener de siete a
quince intervalos, aunque destaca la ausencia de reglas fijas; Canavos, (1987) refuerza este
criterio al sealar que en ningn caso el nmero de clases debe ser menor de cinco, y que
generalmente no excede de quince. Portus, (1998) es un poco ms flexible al afirmar que la
cantidad de intervalos de clase no debe ser mayor de dieciocho ni menor de cinco.
Para establecer un nmero adecuado de clases en una aplicacin especfica existen distintas
maneras de proceder. Montgomery y Runger, (1996) sealan que se obtienen buenos resultados
si se hace la seleccin del nmero de clases aproximadamente igual a la raz cuadrada del
Distribuciones de Frecuencia Raquel Centeno Silva
52
nmero de observaciones
12
, Mendelhall y Sincich, (1997) establecen una regla emprica en
funcin del nmero de observaciones:
Nmero de observaciones N Nmero de clases
Menos de 25 de 5 a 6
Entre 25 y 50 de 7 a 14
Ms de 50 de 15 a 20
Existe un estndar DIN
13
, el nmero 55302 que dispone las siguientes recomendaciones en un
entorno de muestras muy grandes:
Nmero de observaciones N Nmero de clases
Hasta 50 No agrupar
Entre 50 y 100 mnimo 10
Entre 100 y 1000 mnimo 13
Entre 1000 y 10000 mnimo 16
Otra opcin determinstica disponible para estimar el nmero de clases lo constituye el Mtodo
de Sturges, tal como lo expone Deseda, (1988), una vez conocido el nmero de observaciones
consiste en redondear adecuadamente el resultado de aplicar la siguiente frmula:
) N ( log 322 . 3 1 nc
10
+ = (10)
Una ecuacin con resultados idnticos al Mtodo de Sturges que est establecida en la norma
industrial europea CNOMO [PSA Peugeot, Citren, Renault, 1991] es:
( )
3
N log 10
1 nc
10
+ = (11)
Juran y Gryna (1980) proponen la siguiente ecuacin:
nc = 1,5ln(N) + 0,5 (12)
A partir de la ecuacin (12) el autor construye la siguiente tabla de recomendaciones:
Nmero de observaciones N Nmero de clases Nmero de observaciones N Nmero de clases
Entre 20 y 50 6 Entre 51 y 100 7
Entre 101 y 200 8 Entre 201 y 500 9
Entre 501 y 1000 10 Ms de 1000 Entre 11 y 20
Resulta evidente que ante la carencia de una norma taxativa, dos personas distintas pueden
decidir agrupar el mismo fenmeno en un nmero de clases diferente. En caso de mantener
12
Es importante notar que segn el ms flexible de los criterios establecidos en el prrafo precedente, Si N > 400, el
nmero de clases permanece fijo en 20. Para el autor esta observacin es vlida a partir de N = 225, donde las clases
se mantendrn constantes en 15.
Distribuciones de Frecuencia Raquel Centeno Silva
53
alguna duda en cuanto a la cantidad definitiva de clases a utilizar, se recomienda excederse
con un nmero de clases sobredimensionado de intervalos reducidos para clasificar las
cifras. El razonamiento detrs de esta prctica gravita en que siempre es posible hacer
agrupaciones inmediatas de las frecuencias en intervalos mayores, mediante la unin de los
intervalos que se dispusieron originalmente; en cambio, si se opta por pocos intervalos grandes al
principio, no pueden ser subdivididos sin realizarse nuevamente todos las cuentas.
Cualquier lector podra resultar abrumado ante el abanico de posibilidades existentes para
establecer un adecuado nmero de clases; por ello, se presenta la siguiente grfica con intencin
de comparar los resultados de las diferentes herramientas:
0
3
6
9
12
15
18
21
10 100 1000 10000
Nmero de Observaciones (N)
N
m
e
r
o
d
e
C
l
a
s
e
s
(
n
c
)
Mont. & Runger Ajustado Sturges CNOMO Juran
FIGURA N 13 COMPARACIN DE LOS MTODOS EMPRICOS
En la Figura N 13 se puede notar como todos los mtodos son proporcionales al nmero de
datos que se consideran; sin embargo, la regla emprica propuesta por Montgomery & Runger
crece a mayor velocidad que las otras. Una caracterstica relevante que no se observa en la figura,
respecto a la regla en cuestin, es que la misma presenta problemas de adaptacin a los criterios
generalmente establecidos, dado que puede fijar un nmero de clases menor que cinco (5) o
mayor que veinte (20), por ello la curva que representa a esta regla, se rotula como ajustada en
virtud de que para valores de N mayores de 400 se fij el nmero de clases como 20,
independientemente del resultado que arroja la ecuacin. La coincidencia de la cantidad de clase
establecidas por el Mtodo de Sturges y la regla CNOMO es natural si observamos que el
coeficiente que afecta el logaritmo es virtualmente el mismo 3,322 y 3,333 respectivamente.
13
Siglas de la oficina de normalizacin alemana (Deutsches Institut fr Normung), cuyas regulaciones son
ampliamente utilizadas alrededor del mundo.
Distribuciones de Frecuencia Raquel Centeno Silva
54
Tambin resulta interesante percatarse que el resultado obtenido empleando cualquiera de las
ecuaciones no es compatible con las tablas de recomendaciones establecidas en la normas DIN
las sugeridas por Montgomery & Runger.
Una vez pormenorizados los aspectos relevantes de la conversin de datos en bruto en
distribuciones de frecuencia, se puede establecer un procedimiento especfico para organizar
conjuntos de datos en distribuciones agrupadas; este ser:
1. Ordene los datos en forma ascendente.
2. Mediante la ecuacin (4) halle el intervalo total.
3. Si no est establecido por el problema, seleccione el nmero de clases, puede hacerlo de
forma arbitraria, o empleando cualquiera de los criterios referidos previamente.
4. Aplicando la ecuacin (6) obtenga el intervalo de clase. Si como suele ocurrir el nmero
determinado no es un entero redondee al entero superior, en cuyo caso debe ajustarse el rango
mediante las expresiones:
nc ic I
ajustado
T
= (12)
Residuo
T
ajustado
T
I I = (13)
El residuo se distribuye entre los dos extremos del rango de la forma ms simtrica que sea
posible.
5. Decida si emplear lmites nominales o lmites reales para definir las clases. Si los lmites son
nominales puede proceder directamente a establecer las clases; en caso de emplear lmites
reales necesitar:
5.1. Fijar el lmite inferior de la primera clase, que concuerde con el menor valor observado,
salvo que haya sido necesario restarle alguna proporcin del exceso.
5.2. Obtener el lmite superior de la primera clase incrementando el valor del lmite inferior,
en una cantidad que corresponda al intervalo de clase a utilizar, habindole restado la
menor unidad de apreciacin del instrumento de medicin. Por ejemplo, si el instrumento
es un contador la apreciacin es una unidad; si es una regla estndar la apreciacin es un
milmetro; en la balanza analtica de un laboratorio es una diezmilsima de gramo, etc.
5.3. Establezca como lmite inferior de la siguiente clase el valor consecutivo al lmite
superior de la clase previa. Halle el lmite superior repitiendo el paso anterior y reitere
este procedimiento hasta definir todas las clases.
Distribuciones de Frecuencia Raquel Centeno Silva
55
6. Prepare una tabla de conteo a partir de las clases establecidas (ver Figura N 9).
7. Llene la tabla de frecuencias siguiendo el ejemplo de la Figura N 10.
Este algoritmo, tal como todos los de aplicacin prctica que se estudian en este texto, se
convierte, para su facilidad, en un organizador grfico. La idea que subyace en ellos es establecer
una pauta para lograr el objetivo final mediante la consecucin de todos los objetivos intermedios
o prerrequisitos.
Consta de seis tipos de elementos: (a) cajas de registro; son cajas con dos zonas, la superior
sombreada contiene una instruccin, la inferior vaca es para escribir el resultado de ejecutar la
instruccin, (b) cajas de instrucciones; no tienen espacio para registrar informacin porque la
extensin de la misma amerita que se registre en una hoja aparte, (c) valos de proceso; son
similares a las cajas de instruccin, slo que se refieren a la ejecucin de algn algoritmo
expuesto previamente, (d) rombos de decisin; se incluyen cuando existen procedimientos
alternativos que dependen de algn criterio cuya aplicacin origina respuestas del tipo si no, (e)
ciclos de repeticin; son comentarios con una flecha circular que los interconecta consigo
mismos; cuando aparecen indican que el valo de proceso o la caja de instruccin adyacente debe
ejecutarse tantas veces como se indique y (f) flechas direccionadas; que indican el camino a
tomar desde cualquier parte del diagrama. La forma de leerlos es desde arriba hacia abajo y las
claves son:
" Las cajas a las que no les ingresa flecha representan datos del problema que pueden
leerse directamente del enunciado, de una tabla o de un grfico.
" Para resolver una caja a la que le ingresen flechas se deben haber llenado previamente
las cajas donde dichas flechas se originan.
Para la construccin de distribuciones agrupadas de frecuencia el organizador grfico que resume
y sistematiza; el procedimiento es:
Distribuciones de Frecuencia Raquel Centeno Silva
56
FIGURA N 14 ORGANIZADOR GRFICO PARA FACILITAR LA CONSTRUCCIN DE DISTRIBUCIONES AGRUPADAS
DE FRECUENCIAS
Con el objeto de aclarar las tcnicas hasta ahora expuestas, procedemos a desarrollar el ejemplo
que se presenta de seguido:
EJEMPLO: Para determinar la calidad del aire en los alrededores de una refinera al noreste de San
Francisco, U.S.A., se midi la concentracin de un contaminante (monxido de carbono CO) en
Distribuciones de Frecuencia Raquel Centeno Silva
57
partes por milln (ppm). La muestra fue recogida en un lapso de 31 das consecutivos desde el 16
de abril de 1993 y los valores obtenidos se presentan en la siguiente tabla:
TABLA N 1 PPM DE CO EN AIRE
45 63 99 37 75 43 21 161
30 43 63 55 58 102 40 86
38 102 58 58 36 52 141 71
42 86 34 153 59 30 85
Fuente: http://lib.stat.cmu.edu/DASL/Stories/MeasuringAirPolution.html
Construya una tabla de frecuencias a partir de los datos de la Tabla N 1.
RESOLUCI N:
1) Lo que se har es ir completando la informacin en el orden que lo pide el organizador
grfico, al hacerlo se obtendr lo siguiente:
FIGURA N 15 RESOLUCIN DE UN EJEMPLO DE CONSTRUCCIN DE DISTRIBUCIONES DE FRECUENCIAS
AGRUPADAS EMPLEANDO EL ORGANIZADOR GRFICO
Distribuciones de Frecuencia Raquel Centeno Silva
58
2) Para establecer las clases se comienza desde el nuevo x
min
, aadiendo el intervalo de clase
ajustado se obtiene el lmite superior de la clase. Como se decidi usar lmites nominales este
valor se repite como lmite inferior de la clase siguiente. El procedimiento se repite hasta
colocar el valor del nuevo x
max
. Con ello se obtiene la tabla que se muestra de seguido:
TABLA N 2 LISTADO DE IDENTIFICACIN DE LAS CLASES NOMINALES
Clase N Lmite Inferior Lmite Superior
1 19 37
2 37 55
3 55 73
4 73 91
5 91 109
6 109 127
7 127 145
8 145 163
3) Luego, slo resta contar el nmero de datos contenidos dentro de los lmites de cada una de
las clases establecidas, completando la tabla de frecuencias absolutas, tal como que se puede
apreciar a continuacin:
TABLA N 3 FRECUENCIAS EN LA MEDICIN DE LA CONTAMINACIN DEL AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993
Clase N
Lmite
Inferior
Lmite
Superior
Marca de Conteo
Frecuencia
Absoluta
1 19 37 \\\\ \ 6
2 37 55 \\\\ \\\ 8
3 55 73 \\\\ \\ 7
4 73 91 \\\\ 4
5 91 109 \\\ 3
6 109 127 0
7 127 145 \ 1
8 145 163 \\ 2
c) REPRESENTACI N GRFI CA DE LAS DI STRI BUCI ONES DE FRECUENCI A
Como ha quedado de manifiesto, la distribucin de frecuencias ofrece un resumen compacto que
facilita la interpretacin de los datos. Comprender lo que los datos revelan requiere del analista
una capacidad de visualizacin que le proporcione tendencias y patrones, en otras palabras,
representarse la dispersin de los datos e imaginar como estn repartidos. Por ello es til
Distribuciones de Frecuencia Raquel Centeno Silva
59
presentar las distribuciones en forma grfica, que suele ser ms persuasiva, mxime cuando se
desean comparar los perfiles de dos o ms conjuntos de datos. La conversin de la forma
descriptiva tabular de los datos a su presentacin visual se ajusta a un boceto predefinido que se
denomina histograma. Un histograma es una representacin en un plano delimitado por dos ejes,
uno horizontal, donde se ubican la escala de medicin y se representan las fronteras de clase, y
otro vertical, en el cual se sealan las frecuencias absolutas, relativas, porcentuales, y sus
versiones acumuladas dependiendo de lo que se desea mostrar; hay quienes prefieren las
frecuencias relativas porque la escala del eje vertical vara exclusivamente entre cero y la unidad;
la escala vertical es la nica diferencia entre los histogramas. En cualquiera de los casos la
frecuencia observada en cada intervalo es representada por un rectngulo, y el rea de cada
rectngulo dibujado tiene que ser proporcional a la frecuencia presentada. Para que exista cierta
estandarizacin en la impresin visual que proporciona un histograma es habitual ajustar la
longitud del eje vertical de modo que alcance tres cuartos de la longitud del eje horizontal.
Operativamente, sto significa que las condiciones del problema intervalos de clase y nmero
de clases determinan el eje de las abcisas y luego se fija la longitud del eje vertical como el
75% de la longitud del horizontal.
La propiedad de la proporcionalidad directa del rea de las representaciones grficas de las
distribuciones con las frecuencias, hace relucir una de las ventajas al emplear intervalos de clase
con idntica amplitud durante la construccin de las distribuciones de frecuencia: si los intervalos
de clase son del mismo ancho, la altura del rectngulo coincide numricamente con la
frecuencia
14
. Es aconsejable manejar esta coincidencia con aprensin porque puede conducir a
confusiones conceptuales en el sentido de que la altura de los rectngulos indica, realmente, la
densidad de frecuencia de cada intervalo de clase en unidades de frecuencia por intervalo
(
int
f .
sta, como todas las definiciones de densidad, est referida a una cierta unidad base; en este caso,
como todos los intervalos de clase son iguales, se emplea esta longitud como la unidad patrn. Si
la frecuencia est conceptualmente representada por el rea del rectngulo la altura ser
efectivamente el valor de la frecuencia si y slo si la amplitud de los intervalos de clase es
unitaria. Sin duda un histograma de una distribucin de frecuencias cuyos intervalos de clase son
iguales ser ms fcil de interpretar, en particular, los histogramas que representan las
14
Esta coincidencia se debe a la propiedad distributiva de la multiplicacin, en virtud de que una fraccin a la que se
le multiplican numerador y denominador por el mismo nmero no se altera. De hecho, dado que el rea de un
rectngulo es la multiplicacin de la base por su altura
2
1
2
1
2
1
2 2 1 1
h
h
h . b
h . b
A
A
entonces , h b A y h b A Si = = = =
Distribuciones de Frecuencia Raquel Centeno Silva
60
distribuciones de frecuencia construidas con datos cualitativos o categricos deben dibujarse con
clases del mismo ancho.
Debe recordarse que cuando los datos son discretos existe una separacin o espaciado entre los
intervalos de clase, que al ser representados grficamente conducira a una disyuncin entre los
rectngulos que se dibujan. Para evitar este aspecto que tericamente es incorrecto y puede lucir
desagradable, se definen y emplean puntos de divisin, calculados como la semisuma de los
lmites superior de una clase e inferior de la clase subsiguiente:
+ =
=
=
1 i j
1 nc , 2 , 1 i
2
L L
divisin de punto
j
i
i
s
ij
L
, (14)
donde la clase j es la que aparece a continuacin de la clase i.
El arreglo propuesto al aplicar los puntos de divisin es importante porque evita la confusin
entre un histograma y un diagrama de barras como se ver ms adelante es una forma de
presentar grficamente informacin que permite algunas apreciaciones estadsticas los
histogramas son una aplicacin particular de las distribuciones de frecuencias y exhiben
determinadas propiedades matemticas que los hacen nicos, por ello, los histogramas siempre
deben ser dibujados sin dejar espacio entre los rectngulos. Cuando se emplean datos
discretos correspondientes a una distribucin de frecuencias no agrupadas, se emplean lneas en
vez de rectngulos para la representacin grfica. Asimismo, tal como se indic para las
distribuciones, los histogramas estn profundamente afectados por el nmero de intervalos de
clase y su amplitud. Esto es particularmente cierto si el conjunto contiene una pequea cantidad
de datos, en cuyo caso la apariencia de los histogramas puede cambiar claramente cuando se
modifica el nmero de clases o el ancho de las mismas. Los histogramas ganan estabilidad a
medida que aumenta el nmero de datos del conjunto, esta tendencia se consolida cuando
existen 75 o ms datos.
Para corroborar esto procedamos a representar el histograma correspondiente a la distribucin de
frecuencias agrupadas del registro de partes por milln de monxido de carbono en el aire
cercano a una refinera cuyo resultado se present en la Tabla N 2
Distribuciones de Frecuencia Raquel Centeno Silva
61
0
1
2
3
4
5
6
7
8
9
19-37 37-55 55-73 73-91 91-109 109-127 127-145 145-163
ppm de CO en Aire
N
m
e
r
o
d
e
D
a
s
(a) Histograma con 8 Clases
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
21-56 56-91 91-126 126-161
ppm de CO en Aire
N
m
e
r
o
d
e
D
a
s
(b) Histograma con 4 Clases
FIGURA N 16 SENSIBILIDAD DE UN HISTOGRAMA AL NMERO DE CLASES
El comportamiento que se observa en los histogramas es ms sencillo si tratamos de comparar la
forma de ambos debido a que la forma es seal de patrones de conducta de los datos agrupados.
Para ello, construyamos una lnea suave que aproximadamente una las marcas de clase lo que se
presenta de seguidas:
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1 2 3 4 5 6 7 8
Clase Nro.
F
e
c
u
e
n
c
i
a
Sturges
4 Clases
FIGURA N 17 COMPARACIN DE LA FORMA DE LOS HISTOGRAMAS DEL EJEMPLO
Se puede afirmar de forma inmediata que la forma cambi sensiblemente al reducir el nmero de
clases a la mitad. Mientras que el histograma construido a partir del nmero de clases
determinado por el Mtodo de Sturges ocho en total presenta una forma ascendente al
principio y que rememora una conducta cclica, el histograma de tan slo cuatro clases decrece en
forma permanente. Esto lleva a sacar conclusiones distintas en ambos casos, en el segundo de
ellos el ingeniero puede considerar que la refinera causa un bajo impacto ambiental en el aire,
puesto que la curva es exponencial decreciente y seala que existe elevadas frecuencias en las
Distribuciones de Frecuencia Raquel Centeno Silva
62
concentraciones bajas y luego el nmero de repeticiones va decayendo a medida que el nivel de
contaminacin aumenta. En cambio el otro seala que se pueden esperar altsimas
concentraciones con mucha frecuencia si se toman suficientes mediciones, debido a que la curva
comienza a crecer a partir de la penltima clase y podra ser bimodal, es decir exhibir dos valores
mximos o ms frecuentes. Como un comentario adicional y anticipando que el lector sea
escptico podramos sealar que ninguno de los mtodos que se discutieron para determinar el
nmero de clases arrojara cuatro de ellas, dado que se ha sealado como restriccin al
determinar el nmero de clases que nunca debe ser menor de cinco. Sin embargo, se coloca est
cantidad como un ejemplo acadmico que le permita observar la sensibilidad de los histogramas,
donde entre otros aspectos, puede ser interesante que el lector note que no tiene clases vacas;
tambin se mencion que la presencia abundante de clases vacas es una seal de una distribucin
muy segregada.
Para obviar el problema de emplear cuatro clases se podra tratar de comparar con un histograma
de seis clases que es el menor nmero recomendado y que para los datos del ejemplo se obtiene
empleando el criterio de la raz cuadrada o siguiendo las recomendaciones de Juran y Gryna En
este caso lo que observaremos es un histograma con una clase vaca y un perfil exponencial, por
lo tanto, todas las conclusiones que se apuntaron cuando se realiz la comparacin del impacto
del nmero de clases los histogramas utilizando el ejemplo de la concentracin de CO en aire
se mantienen. tal como se ilustra en la Figura N 18
0
2
4
6
8
10
12
19-43 43-67 67-91 91-115 115-139 139-163
ppm de CO en Aire
N
m
e
r
o
d
e
D
a
s
(a) Histograma
0
2
4
6
8
10
12
1 2 3 4 5 6
Clase Nro.
F
r
e
c
u
e
n
c
i
a
A
b
s
o
l
u
t
a
(b) Perfil del Histograma
FIGURA N 18 HISTOGRAMA DEL NIVEL DE CO EN EL AIRE CON FRECUENCIAS AGRUPADAS EN SEIS CLASES
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993
Una alternativa a los histogramas son los denominados diagramas de tallo y hojas. Esta tcnica de
representacin es relativamente simple y presenta una ventaja evidente respecto a los histogramas
en el sentido de que no se pierde la informacin de los datos individuales, sin embargo esa
Distribuciones de Frecuencia Raquel Centeno Silva
63
ventaja surge a consecuencia de permitir un nmero elevado de categoras. Para realizarlo se
requiere:
1. Registrar en una columna ordenada ascendentemente los valores con un lugar decimal
menor que la precisin presentada por los datos.
2. Dibujar una lnea vertical a la derecha de los valores registrados.
3. Para cada dato, en orden de aparicin, se selecciona el primer nmero registrado en la
primera columna estrictamente menor a l. Se registra el valor decimal, ignorado en el
primer paso, a la derecha de la lnea vertical.
Una vez ubicadas todos los datos se obtendr una representacin numrica que asemeja a un
histograma rotado 90 sobre el origen. El diagrama de tallo y hojas se ilustra para el ejemplo de la
contaminacin del aire con CO, que se ha venido desarrollando:
TALLO HOJAS
2 1
3 0 8 4 7 6 0
4 5 2 3 3 0
5 8 5 8 8 9 2
6 3 3
7 5 1
8 6 5 6
9 9
10 2 2
11
12
13
14 1
15 3
16 1
FIGURA N 19 DIAGRAMA DE TALLO Y HOJAS PARA LA CONCENTRACIN DE CO EN AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993
Existen otras posibilidades a la hora de representar los datos, una de ellas se designa como
polgono de frecuencias. El polgono es un grafico donde se representan las frecuencias de clase
versus las marcas de clase y se puede obtener conectando por medio de lneas rectas los puntos
medios de la parte superior de los rectngulos expuestos en un histograma; en el caso de que
Distribuciones de Frecuencia Raquel Centeno Silva
64
exista algn intervalo vaco, la lnea recta correspondiente tocar y/o partir del eje de las
abcisas; en particular se les aaden lneas de cierre del polgono contra el eje en puntos situado
antes de la primera clase y a continuacin de la ltima clase a una distancia igual a la mitad del
intervalo de clase de la serie. Otra caracterizacin grfica til, de un conjunto de datos, es la
distribucin de frecuencias acumuladas, normalmente conocida como ojiva. La misma se obtiene
al representar en el eje vertical la frecuencia acumulativa de una clase contra el lmite inferior de
la siguiente sobre el eje horizontal y uniendo con segmentos de recta todos los puntos
consecutivos. Dependiendo del tipo de frecuencia acumulada representada en eje vertical, el
polgono obtenido se denominar ojiva absoluta, ojiva relativa u ojiva porcentual. Para el ejemplo
de contaminacin ambiental que se ha venido trabajando, estas representaciones se muestran de
seguido:
0
1
2
3
4
5
6
7
8
9
10 28 46 64 82 100 118 136 154 172
ppm de CO en Aire
N
m
e
r
o
d
e
D
a
s
(a) Polgono de Frecuencias
0
2
4
6
8
10
12
14
16
18
20
22
24
26
28
30
32
19 37 55 73 91 109 127 145 163
ppm de CO en Aire
N
m
e
r
o
d
e
D
a
s
(b) Ojiva Absoluta
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
19 37 55 73 91 109 127 145 163
ppm de CO en AIre
P
o
r
c
e
n
t
a
j
e
d
e
D
a
s
(c) Ojiva Porcentual
FIGURA N 20 POLGONO Y OJIVAS PARA LA CONCENTRACIN DE CO EN AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993
Una de las caractersticas ms interesantes que brinda la Figura N 20 es que permite constatar
que las ojivas absoluta y porcentual son idnticas en su forma, el grfico de cada una de ellas slo
Distribuciones de Frecuencia Raquel Centeno Silva
65
difiere en la escala que se emplea en el eje vertical. La misma conclusin podra extraerse si se
hubiese representado la ojiva relativa. Tambin resulta relevante que se observe como la curva
que representa el perfil del histograma con el nmero de clases establecido con el Mtodo de
Sturges representado en la Figura N 17, no es ms que el polgono de frecuencias que se observa
en la Figura N 20-a trazando segmentos de curvas suaves en vez de rectas para unir los puntos.
Curvas similares a la que se represent en la Figura N 17 son de mucha importancia en
estadstica y de ellas se hablar con mayor profundidad ms adelante.
El uso principal de las ojivas es lo que se conoce como cuantiles. Un cuantil es el valor bajo el
cual se encuentra una determinada proporcin de los valores de la distribucin. Se lee en la
direccin opuesta en el eje horizontal a la proyeccin de la curva en el punto correspondiente
a proporcin deseada, que se ubica mediante el valor respectivo en el eje vertical. Los cuantiles
operan como segmentadores de la globalidad de los datos; los ms comunes son:
9 Cuartiles: corresponde a un fraccionamiento en cuatro partes iguales, a saber: primer cuartil
abarca el 25% de los datos, el segundo cuartil un 50%, el tercer cuartil un 75% de los datos y
el 100% estarn en el cuarto cuartil.
9 Quintiles: es la segmentacin en cinco partes iguales de 20% cada una, por ende, el primer
quintil alcanza hasta el 20% de cobertura, el segundo, tercero, cuarto y quinto quintil
corresponden a 40%, 60%, 80% y 100% de los datos, respectivamente.
9 Deciles: en este caso, la segmentacin es de diez en diez por ciento.
9 Centiles o Percentiles: subdividen el conglomerado en estudio en cien clases distintas,
representando el valor de la variable bajo el cual se encuentra un porcentaje dado. Por
ejemplo, empleando el caso representado en la Figura N 20-c se puede leer directamente que
el 80% de los das la concentracin del monxido de carbono en el aire fue inferior a 91 ppm.
Los datos que se recopilan y cuya frecuencia se representa grficamente pueden ser calificados
como una muestra de una poblacin grande; si ella est representada por una variable continua
pudieran existir datos en abundancia, entonces es posible, al menos en teora, disminuir
paulatinamente el tamao del intervalo de clase y continuar existiendo un nmero razonable de
observaciones en cada una de las clases. A medida que la amplitud de los intervalos decrece, el
tamao de los segmentos de recta que interconectan las respectivas marcas de clase se reducen, si
las figuras resultantes se suavizan, la representacin que se obtiene es una curva llamada curva de
frecuencias o polgono de frecuencias suavizado. Del mismo modo puede procederse para
Distribuciones de Frecuencia Raquel Centeno Silva
66
obtener una ojiva suavizada, en cuyo caso los errores de aproximacin al suavizar suelen ser
menores que cuando se trabaja con polgonos de frecuencia.
Las curvas de frecuencia pueden presentar un nico valor mximo, o varios valores que
representan mximos locales; el primero de los casos descritos se conoce como curva de
frecuencia unimodal, Una curva de frecuencia simtrica presenta un mximo centrado respecto al
intervalo total y las frecuencias de las observaciones equidistantes a dicho mximo son las
mismas, parecindose a una campana. El ejemplo ms importante de esta curva es la distribucin
normal. Cuando el valor modal
15
separa las colas en forma de que una es ms larga que la otra se
dice que la distribucin es sesgada, si la cola ms prolongada est a la derecha se denomina sesgo
positivo, caso contrario, sesgo negativo. Una funcin de frecuencias bimodal se caracteriza por
que posee dos mximos. Se encuentran tambin, curvas de frecuencias con ms de dos valores
modales representados como mximos locales, en cuyo caso las distribuciones correspondientes
se denominan multimodales.
d) ANLI SI S DE LAS DI STRI BUCI ONES DE FRECUENCI A
Una de las aplicaciones ms importantes de las distribuciones de frecuencia es dar respuesta a
interrogantes comunes que nacen de la interaccin diaria con datos; entre ellas se pueden
formular preguntas tales como: Cul es el porcentaje de cajeros cuyo tiempo de atencin es
menor a 11 minutos?, Cuantos de los bombillos de la muestra ensayada duraron entre 1100 y
1300 horas?, Cul es la resistencia a la tensin por encima de la cual estn 25 de las 100 guayas
que conforman la muestra de un ensayo de calidad?, Cul es el precio en el que se realiza el
70% de las ventas de la compaa?, etc. Todas esas preguntas pueden responderse una vez
organizados los datos en distribuciones y su aclaratoria, evidentemente, profundiza el anlisis y la
comprensin de los datos, lo que conduce a conclusiones y decisiones ms asertivas. Como se
mencion en la seccin concerniente a representacin grfica de las distribuciones de frecuencia,
el uso primordial de las ojivas son los cuantiles, de los cuales el ms comnmente usado es el
percentil. El anlisis como producto de las respuestas a las inquietudes establecidas al inicio del
prrafo hace uso del concepto de percentiles y se conoce como anlisis percentlico. Lo que se
propone el investigador al realizar un anlisis percentlico no es ms que hallar los valores de la
variable debajo de los cuales se encuentran ciertos porcentajes dados de la frecuencia, o bien,
conocer el porcentaje de valores que se encuentran por debajo o por encima de un valor
15
el valor modal es el correspondiente al mximo de la curva de frecuencias.
Distribuciones de Frecuencia Raquel Centeno Silva
67
especfico de la variable; este porcentaje de valores es lo que se denomina rango percentil. Para
obtener este tipo de informacin se dispone de dos vas alternas: mediante la inspeccin de las
grficas de ojivas porcentuales o a travs de las distribuciones, en cuyo caso el procedimiento
emplea la tcnica aritmtica de la interpolacin lineal de los segmentos de recta que unen a los
distintos intervalos de clase; la ecuacin resultante es:
N
100
ic
) L r ( f
F ) r x ( P
j
i j
aa
(
(
+ = < , (15)
donde:
r, un valor dado de la variable para el que se desea determinar el porcentaje
de datos menores que l.
P(x>r), porcentaje de datos para los cuales el valor de la variable es menor que r.
F
aa
, frecuencia acumulada anterior a la clase que contiene al valor dado de r.
f
j
, valor de la frecuencia absoluta de la clase j que contiene al valor dado de r.
L
j
i
, lmite inferior de la clase j que contiene a r.
ic, intervalo de clase.
N, nmero total de datos en la distribucin.
Es importante que se reflexione acerca de que con esta ecuacin se puede dar respuesta a
cualquiera de las interrogantes planteadas previamente y a cualquiera similar. Si se esta
interesado en el porcentaje menor a un cierto valor, la aplicacin es directa. En el caso
diametralmente opuesto, es decir, el porcentaje mayor a un cierto valor se puede determinar
sabiendo que ambos porcentajes el solicitado y el que se calcula mediante (14) son
complementarios, esto es:
) r x ( P 100 ) r x ( P % 100 ) r x ( P ) r x ( P < = > = < + > (16)
Si por el contrario el inters radicara en obtener el porcentaje de un rango acotado por ambos
extremos, en vez del limitado por un nico valor, ese rango puede determinarse por sustraccin
de los valores menores que el extremo inferior a los valores menores al extremo superior, tal
como se observa en la siguiente representacin grfica:
Distribuciones de Frecuencia Raquel Centeno Silva
68
FIGURA N 21 ILUSTRACIN DEL RANGO PERCENTIL ACOTADO ENTRE DOS VALORES
Por tanto:
) q x ( P ) r x ( P ) r x q ( P < < = < < q < r (17)
Adems, dado que se conoce el nmero total de observaciones, enumeraciones o mediciones que
componen la muestra, si se desea conocer la cantidad absoluta de datos que cumplan con la
condicin impuesta, slo basta con recordar que se cumple la siguiente relacin:
N ) r x ( P ) r x ( n < = < (18)
La nica de las cuestiones formuladas al inicio de esta seccin cuya resolucin no ha sido
explcitamente proporcionada, es la relativa a determinar el valor de la variable para el cual se
alcanza un determinado porcentaje. Tal como se seal con anterioridad, la ecuacin (15) es la
que se emplea para todos los clculos que aqu conciernen; despejando el valor de r se obtiene:
ic
f
F ) r x ( P
100
N
L r
j
aa
j
i
<
+ =
(19)
No obstante disponer de la expresin anterior, es necesario sealar que para poder usarla con
efectividad es menester llevar a cabo el siguiente procedimiento:
" Determinar los porcentajes acumulados para cada clase.
" Identificar el intervalo de clase que est delimitado por los porcentajes acumulados que
abarquen al porcentaje buscado.
Una vez identificada la clase correctamente ya se dispone de todos los datos exigidos por la
ecuacin (19). Se puede ilustrar el juego de ecuaciones presentadas respondiendo algunas
preguntas selectas:
Distribuciones de Frecuencia Raquel Centeno Silva
69
EJEMPLO: Con el conjunto de datos presentados en la Tabla N 1, responda las siguientes
preguntas: a) Cul es el porcentaje de das con concentraciones de CO menores de 110 ppm?, b)
Cuntos das el aire de la zona presenta niveles de contaminacin de CO entre 85 y 110 ppm?, c)
Cuntos das se midieron concentraciones por encima de 110 ppm?, d) Qu valor de
concentracin acota al 75% de las mediciones?, y e) Qu porcentaje de las mediciones
realizadas tienen concentraciones mayores a 85 ppm?
RESOLUCI N:
a).- En este caso r=110 ppm, que est contenido en la sexta clase (j=6) que comprende las
concentraciones mayores que 109 y hasta 127 ppm, con lo cual se conoce que la frecuencia
acumulada anterior ser F
aa
= 28, la frecuencia absoluta de la sexta clase f
6
= 0, cuyo lmite
inferior es 109, la longitud del intervalo de clase es, ic = 18 y el nmero total de mediciones
es N = 31, entonces de la ecuacin (15) se obtiene:
% 32 , 90
31
100
18
) 119 62 ( 0
28 ) 110 x ( P =
(
+ = <
De donde se determina el nmero de das mediante la ecuacin (18)
das 28
% 100
31 % 32 , 90
31 ) 110 x ( P ) 110 x ( n =
= < = <
b).- Para responder esta interrogante se hace uso de la ecuacin (17)
) 85 x ( P ) 110 x ( P ) 110 x 85 ( P < < = < <
Debemos determinar previamente con el auxilio de la ecuacin (15) los dos porcentajes
requeridos, para 110 ppm ya se obtuvo en la pregunta anterior, entonces faltara para 85
ppm. Los datos son: j = 4, F
aa
= 21, L
i
= 73, ic = 18 y N=31, entonces P(x < 85) ser:
% 34 , 76
31
100
18
) 73 85 ( 4
21 ) 85 x ( P =
(
+ = <
El valor solicitado vendr dado por:
% 98 , 13 % 34 , 76 % 32 , 90 ) 110 x 85 ( P = = < <
c).- En esta oportunidad se halla el porcentaje de das con concentraciones mayores a 110 ppm a
partir de la ecuacin (16). Sabiendo, porque se determino en la primera parte, que el valor
de P(x<110)=90,32%, se tiene:
% 68 , 9 % 32 , 90 % 100 ) 110 x ( P 100 ) 110 x ( P = = < = >
Distribuciones de Frecuencia Raquel Centeno Silva
70
Como se hizo previamente usando la ecuacin (18) se especfica el nmero de das que
cumplen con la condicin:
das 3
% 100
31 % 68 , 9
31 ) 110 x ( P ) 110 x ( n =
= > = >
d).- Esta pregunta se responde utilizando la ecuacin (19), que requiere de cierto procedimiento
previo. Se hallan los porcentajes acumulados para cada clase, tal como se muestra de
seguido:
TABLA N 4 TABLA DE FRECUENCIAS Y PORCENTAJE ACUMULADO DE LA CONCENTRACIN DE CO EN AIRE
PPM de CO en Aire, Baha de San Francisco, U.S.A., Abril-Mayo 1993
Clase Frecuencia [f
j
]
Frecuencia
Acumulada [H
j
]
% acumulado
(
100
N
H
j
19-37 6 6 19,35%
37-55 8 14 45,16%
55-73 7 21 67,74%
73-91 4 25 80,65%
91-109 3 28 90,32%
109-127 0 28 90,32%
127-145 1 29 93,55%
145-163 2 31 100,00%
Con la ayuda de la tabla se puede identificar que la clase que comprende al 75% de los
valores es aqulla entre los porcentajes acumulados de 67,74% y 80,65%, es decir la cuarta
clase (j = 4), sabiendo entonces que los otros datos son: F
aa
= 21, L
i
= 73, ic = 18 y N=31, se
puede aplicar ahora la ecuacin (19)
ppm 125 , 83 18
4
21 75
100
31
73 r =
+ =
e).- Aqu nuevamente emplearemos la ecuacin (16)
% 66 , 23 % 34 , 76 % 100 ) 85 x ( P 100 ) 85 x ( P = = < = >
En el clculo se emple el valor de P(x < 85) que se haba calculado en el segundo
apartado.
Como se mencion previamente, es posible hacer un anlisis percentlico a partir de la respectiva
ojiva porcentual; debe recordarse que en una representacin de este tipo el plano est delimitado
por un eje de las ordenadas, contentivo de las frecuencias relativas acumuladas expresadas en
Distribuciones de Frecuencia Raquel Centeno Silva
71
porcentajes
16
, y un eje de las abcisas que comprende los valores de la variable. En este caso, si se
desea obtener el rango percentil de un valor de variable dado, se ubica ste en el eje x y se levanta
una perpendicular al eje hasta cortar a la ojiva de porcentajes, desde el punto de corte se traza una
lnea horizontal que intercepte al eje de las ordenadas. El valor de la interseccin corresponder
al rango percentil para el valor dado. Resulta evidente, que este procedimiento es reversible, en el
sentido de que si lo que se requiere es el valor de la variable para que abarca un porcentaje dado
de los datos se realiza en sentido inverso el procedimiento descrito.
Es interesante indicar que el anlisis percentlico no slo es til cuando se desea comprender y
relacionar datos dentro de un mismo colectivo, tal como se hace al dar respuesta a las inquietudes
que se propusieron al comenzar la seccin, sino cuando se trata de establecer comparaciones
acerca de una caracterstica comn entre dos o ms conjuntos de datos recopilados mediante
experimentos diferentes. La condicin imprescindible para lograr este tipo de comparaciones es
que en cada colectivo se hayan efectuado la misma cantidad de observaciones, es decir, que
tengan la misma base. La comparacin relativa permite obviar el requisito de la base comn; es
ms, el anlisis percentlico soporta comparaciones globales y adems, es posible indicar la
posicin relativa al grupo al que pertenece la observacin.
Otra conclusin interesante que se puede obtener a partir de las distribuciones de frecuencias est
vinculada a la jerarquizacin de intereses o actividades, particularmente empleada por los
ingenieros industriales en el anlisis frecuencial de fallos. Esta tcnica se conoce con el nombre
de anlisis ABC o anlisis de Pareto, en honor al economista italiano Vilfredo Pareto (1848-
1923) quin en 1897 demostr para la distribucin del ingreso per cpita una conclusin que se
observa en la mayora de los eventos, conocida como la Ley de Pareto o la Regla del 80/20 que
establece que cerca del 20% de las causas son responsables del 80% de los efectos. Un diagrama
de Pareto permite separar las pocas causas vitales de las muchas triviales permitiendo establecer
prioridades para concentrar las acciones correctivas. El procedimiento para desarrollar un anlisis
de Pareto consiste en: (Adaptado de [Crossley, 2000] )
1. Decidir el objetivo (p.e defectos por tipo, ventas por localidad, etc.).
2. Recolectar los datos en una tabla de conteo (ver Figura N 9).
3. Ordenar las categoras de los datos recolectados en forma descendente segn la frecuencia
absoluta.
16
Es decir, las frecuencias relativas acumuladas multiplicadas por cien.
Distribuciones de Frecuencia Raquel Centeno Silva
72
4. Determinar el porcentaje que representa cada clasificacin respecto al total.
5. Desarrollar una distribucin porcentual acumulada hasta englobar el 100% de los datos.
6. Construir un histograma porcentual colocando las categoras en el orden establecido
durante la ejecucin del paso 3.
7. Dibujar la curva generada por los datos hallados en el paso 5. Esta curva de conoce como
Lnea de Lorenz
17
o Curva de Pareto
EJEMPLO: En el desempeo como consultor de empresas de servicio, usted ha sido contratado para
ayudar a un consultorio odontolgico en la mejora del servicio que prestas a sus clientes. Durante
la entrevista con los mdicos contratantes se llega a la conclusin de que existen los siguientes
asuntos que deben afectar el nivel del servicio: falta de cortesa de los empleados, costo del
servicio, explicacin adecuada del procedimiento, decoracin de la oficina, sabor del enjuague
bucal, el nivel de dolor del tratamiento, la seleccin de revistas disponibles en la sala de espera, el
profesionalismo del personal mdico, la puntualidad en las citas, la limpieza del consultorio, y el
acceso al consultorio. Se decide entonces realizar una encuesta a los clientes al concluir sus citas
donde se le pide que seale su nivel de aceptacin acerca del funcionamiento de la empresa en
cada uno de esos once tems. Usted procesa los resultados elaborando la siguiente tabla:
TABLA N 5 FRECUENCIA DE RESPUESTAS NO ACEPTABLE
Asunto
Nmero de
respuestas
Falta de cortesa de los empleados 10
Costo de las consultas y tratamientos 35
Explicacin adecuada del procedimiento 11
Decoracin de la oficina 3
Sabor del enjuague bucal 1
Nivel de dolor en el tratamiento 60
Seleccin de revistas en la sala de espera 8
Profesionalismo de los mdicos 2
Puntualidad de las citas 2
Limpieza del consultorio 6
Acceso al consultorio 12
17
M.O. Lorenz grafic en su momento la concentracin de la riqueza usando el porcentaje acumulado de poblacin
en un eje y el porcentaje de riqueza en el otro. Dada la similitud de los mtodos de ambos investigadores se suelen
intercambiar estos nombres.
Distribuciones de Frecuencia Raquel Centeno Silva
73
Como la definicin inicial era muy ambiciosa para tratar de mejorarlos todos, se espera de usted
como consultor que le seale a los mdicos contratantes cules de esos factores son en los que
ellos deben concentrar su atencin para garantizar mejoras sustanciales.
RESOLUCI N:
La forma de obtener las reas crticas es empleando un histograma de Pareto, por lo tanto se debe
rearreglar los datos recolectados en orden descendente de frecuencia y determinar el porcentaje
que representa cada rea de forma absoluta y acumulada. Ello se muestra en la siguiente tabla:
TABLA N 6 DISTRIBUCIN DE FRECUENCIAS ORDENADAS PARA ANLISIS DE PARETO
Asunto
Nmero de
respuestas
Porcentaje del
total de respuestas
Porcentaje acumulado
del total de respuestas
Nivel de dolor en el tratamiento 60 40,0 40,0
Costo de las consultas y tratamientos 35 23,3 63,3
Acceso al consultorio 12 8,0 71,3
Explicacin adecuada del procedimiento 11 7,3 78,6
Falta de cortesa de los empleados 10 6,7 85,3
Seleccin de revistas en la sala de espera 8 5,3 90,6
Limpieza del consultorio 6 4,0 94,6
Decoracin de la oficina 3 2,0 96,6
Puntualidad de las citas 2 1,3 97,9
Profesionalismo de los mdicos 2 1,3 99,2
Sabor del enjuague bucal 1 0,8 100,0
Totales 150 100,0
Hecho este arreglo se puede concluir que poco ms del 63% de los asuntos que los clientes
califican como no aceptable se restringe tan slo a dos de las categoras encuestadas, es decir,
el 18% de la lista de once preocupaciones originalmente planteadas. Su consejo a los odontlogos
ser que deben enfocar su atencin en procurar disminuir el nivel de dolor que causan en sus
pacientes y explorar la posibilidad de reducir sus tarifas.
Distribuciones de Frecuencia Raquel Centeno Silva
74
Para exponer a los mdicos su recomendacin puede presentar la informacin grficamente:
0 10 20 30 40 50 60
Nmero de Respuestas "No Aceptable"
Nivel de dolor en el tratamiento
Costo de las consultas y tratamientos
Acceso al consultorio
Explicacin adecuada del procedimiento
Falta de cortesa de los empleados
Seleccin de revistas en la sala de espera
Limpieza del consultorio
Decoracin de la oficina
Puntualidad de las citas
Profesionalismo de los mdicos
Sabor del enjuague bucal
FIGURA N 22 DIAGRAMA DE PARETO PARA EL CONSULTORIO ODONTOLGICO
Como puede ver sta tcnica es de gran utilidad cuando se trata de distribuir recursos entre varias
opciones, porque promueve la eficacia del gasto, mejorando el desempeo de la organizacin en
base a decisiones ms slidamente tomadas.
e) RESUMEN
Este captulo ha comenzado a proveerle de recursos tiles y aplicados en su desempeo
profesional, se expuso la tcnica fundamental de la estadstica descriptiva: las distribuciones de
frecuencia, se le incluy un organizador grfico para enfrentar el reto que le proponen los casos
donde debe construir distribuciones de frecuencia agrupadas, adems se resolvi un ejercicio
empleando el organizador grfico a manera de ejemplo para obtener su confianza en la
herramienta. Todos los contenidos estudiados hasta ahora son bsicos en el desarrollo posterior
del trabajo estadstico, porque como afirma Rice (2002): una vez que el propsito, el nmero y
tipos de variables, niveles de medicin, seleccin de la muestra, el nmero de grupos, y la forma
de las distribuciones es conocida, las tcnicas estadsticas apropiadas para inferir pueden ser
Distribuciones de Frecuencia Raquel Centeno Silva
75
determinadas; por ello, se llev a cabo una discusin profusa acerca de la forma de determinar el
nmero de clases que deben seleccionarse para agrupar frecuencias en una distribucin, inclusive
se presentaron comparaciones grficas y aplicadas entre los distintos mtodos para ayudarlo a
obtener experiencia en un rea muy delicada, puesto que influye en la forma de las distribuciones
y, consecuentemente, en las conclusiones que se elaboran a partir de ellas. Tambin se
presentaron las formas grficas de mostrar distribuciones de frecuencia, por ser estas series
estadsticas las ms importantes de las que se ocupa un profesional. Ms adelante se discutir la
forma de presentar los datos de otras series estadsticas para poder analizarlos y extraer
informacin til de ellos para la toma de decisiones.
f) EJERCI CI OS PROPUESTOS
1.- Con los datos:
15 20 25 28 30 18 23 17
18 17 18 15 23 17 20 20
23 18 20 17 25 20 25 18
25 20 20 23 23 18 30 20
28 23 25 28 20 30 28 23
Construya una distribucin de frecuencias de
cinco clases. Determinar los diferentes tipos
de frecuencias relativas (absolutas y
acumuladas) y porcentajes (absolutos y
acumulados). Adicionalmente, construya: a)
histograma de frecuencias absolutas; b)
histograma de frecuencias acumuladas; c)
polgono relativo; d) ojiva porcentual.
2.- Los jornales por hora (en cientos de Bs.) de los operarios de una industria (redondeados a la
unidad) son:
62 44 42 39 37 32 30 47 58 40
58 50 43 30 41 52 37 43 46 44
57 49 41 43 42 36 52 49 64 45
46 43 37 38 54 46 36 45 47 45
45 51 40 52 38 42 40 50 46 57
46 47 54 55 53 52 42 43 50 51
Distribuciones de Frecuencia Raquel Centeno Silva
76
a) Elabore un cuadro de datos ordenados.
b) Seleccione un tamao de clase conveniente y elabore un cuadro de frecuencias agrupadas.
c) Encuentre los lmites reales.
d) Halle las marcas de clase.
e) Dibuje el histograma correspondiente.
f) Dibuje el polgono de frecuencias.
3.- Construya las clases correspondientes a la distribucin que se presenta de seguido:
Clases
X
i
(Marca de Clase)
f
i
5 12
10 20
15 32
20 18
25 8
4.- Dibuje hipotticamente (sin datos de distribucin de frecuencias):
a) Un polgono relativo.
b) Un histograma porcentual.
c) Una ojiva absoluta.
d) Explique como se leen las grficas dibujadas en los apartes a), b), y c).
5.- Una industria manufacturera de tradicin decide mejorar el rendimiento de sus equipos, para
lo cual ha planificado reemplazar los chips de memoria elctricos por electrnicos, y para efectos
de un estudio descriptivo del nuevo proyecto con respecto al costo en dlares ($) de dichos chips,
el departamento de produccin y finanzas cuenta con la informacin que a continuacin se
presenta:
9 18 chips con costo promedio de $ 50.
9 Con costo mnimo de $ 65, 11 chips.
9 El menor costo es de $ 15, a partir del cual se agrupan 68 chips.
9 16 chips con costos menores a $ 35.
Distribuciones de Frecuencia Raquel Centeno Silva
77
9 Con costos de por lo menos $ 25 e inferiores a $ 35, 9 chips.
9 El estudio abarca costos de cuando ms $ 85.
9 Chips con costos superiores o iguales a $ 75, 5 chips.
9 Con costos de por lo menos $ 55 y cuando ms $ 85, 21 chips.
Partiendo de la informacin anterior:
a) Construya la distribucin de frecuencias relativa de siete clases de igual amplitud.
b) Grafique la ojiva absoluta y explquela.
c) Determine el % de chips que tienen costos inferiores a $ 73,50.
d) Cul es el costo mximo de los 36 chips ms caros?
e) Halle en la grfica del punto b) el costo correspondiente al percentil 60%.
f) Halle con en la grfica del punto b) el rango percentil de un de $ 72.
6.- En la siguiente distribucin de frecuencias especifique cuales son los inconvenientes que
podran presentarse en caso de un anlisis detallado de la informacin:
PRECIOS (Bs.)
N o. DE
ARTCULOS
1.890 2.090 5
2.110 2.210 7
2.210 2.500 9
2.490 2.800 6
2.805 3.500 4
7.- Convierta la distribucin de frecuencias siguiente en una distribucin de frecuencias
acumulada.
VARIABLE
N. DE UNIDADES
ESTADSTICAS
50 100 7
100 150 15
150 200 30
200 250 45
250 300 25
300 350 10
350 400 8
a) Seale para que valor de la variable representa el 50% de las unidades estadsticas
Distribuciones de Frecuencia Raquel Centeno Silva
78
b) Cuntas unidades estadsticas se encuentran por debajo del valor 290 de la variable?.
Qu porcentaje representan?
8.- A partir de la siguiente informacin, construya la distribucin de frecuencias absoluta y
grafique el polgono porcentual:
SALARIO MENSUAL ($)
N o. DE
TRABAJADORES
500 600 7/80
600 700 20/80
700 800 23/80
800 900 18/80
900 1.000 12/80
c) Determine cul es el porcentaje de trabajadores que devengan salarios mensuales entre
650 y 850$
d) Cules son los salarios que agrupan: el primer decil, el segundo cuartil y el percentil 70?
9.- Con los datos del ejercicio No. 5 del Captulo I, a) construya una distribucin de frecuencias
en orden descendente; b) cul es la 1era Clase?; c) cul es la frecuencia de la cuarta clase?.
10.- Los siguientes se refieren a los espesores en decmetros de un nmero determinado espigas
elctricas:
15 20 25 28 30 18 23 17
18 17 18 15 23 17 20 20
23 18 20 17 25 20 25 18
25 20 20 23 23 18 30 20
28 23 25 28 20 30 28 23
e) Construir una distribucin de frecuencias relativa con limites de clases nominales y
construya la ojiva absoluta.
f) Convierta la distribucin anterior en una distribucin absoluta
g) Seale cuantas espigas tienen un espesor mayor de 220 cm.
Distribuciones de Frecuencia Raquel Centeno Silva
79
h) Calcule bajo cual espesor estn contenidas el 80% de las espigas
11.- Suponga que se tiene la siguiente distribucin sobre los defectos estructurales en las puertas
de un automvil: abolladuras, 4; picaduras, 4; partes ensambladas fuera de frecuencia, 6; partes
subajustadas, 21; falta de agujeros/ranuras, 8; partes no lubricadas, 5; partes fuera de contorno, 30
y partes con rebarbas, 3. Construya un diagrama de Pareto e interprete.
12.- Los datos siguientes representan la duracin en horas de una muestra de lmparas
incandescentes que fueron sometidas a una prueba de su vida til:
1115 1567 1223 1782 1055 798 1016 2100 910 1501
1310 1883 375 1522 1764 1020 1102 1594 1730 1238
1540 1203 2265 1792 1330 865 1605 2023 1102 990
1502 1270 1910 1000 1608 2130 706 1315 1578 1468
1258 1015 1018 1820 1535 1421 2215 1269 758 1512
1315 845 1452 1940 1781 1109 785 1260 1416 1750
1085 1674 1890 1120 1750 1481 885 1888 1560 1642
a) Construya un diagrama de tallo y hoja para visualizar estos datos.
b) Existe evidencia de qu una lmpara sobrevivir ms all de las 2.000 horas?
Justifique su respuesta.
13.- Su profesor de Ingls le afirma que en ese idioma las cinco letras ms empleadas son: a, e, o,
h, y s. Como escptico estudiante de Ingeniera Industrial usted decide corroborar esa
informacin. Demuestre o rechace la afirmacin del profesor y justifique el procedimiento
empleado. En caso de rechazarla proponga usted cuales letras pueden considerarse las ms
frecuentes.
80
III. FORMAS TABULARES DE PRESENTAR INFORMACIN
Existen dos mtodos bsicos para presentar datos cuantitativos, uno de ellos consiste en mostrar
los nmeros, propiamente dichos, en lo que se conoce como tablas estadsticas; el otro involucra
la interpretacin visual de las magnitudes en lo que se denomina grficos estadsticos. Cada tipo
de presentacin posee tcnicas y usos particulares; este captulo se concentrar en exponer las
tcnicas y recomendaciones relativas a tablas estadsticas, mientras que el estudio de los grficos
estadsticos se posterga hasta el prximo captulo. La finalidad de las tcnicas de representacin
es destacar la informacin que se suministra a quienes toman decisiones relativas a los resultados
de un experimento estadstico que caracteriza un fenmeno o procedimiento. Si una informacin
no es presentada en una forma efectiva quien acceda a ella har caso omiso de la misma, por sta
razn los dos captulos que siguen son de vital inters en su vida, tanto acadmica como
profesional. Mediante el estudio de este captulo se pretende que Usted sea capaz de:
1. Expresar el concepto de tabla estadstica.
2. Clasificar a las tablas estadsticas de acuerdo al uso y la clasificacin de los datos.
3. Construir tablas estadsticas a partir de datos disponibles.
4. Interpretar la informacin presentada en una tabla estadstica.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
81
Los datos que estn contenidos en los registros internos de las organizaciones o que han sido
recopilados en un estudio estadstico, deben ser organizados o tabulados, de forma que puedan
ser tiles para sus propsitos. Las estadsticas deben ser presentadas en forma efectiva para que
los hechos y las relaciones significativas emerjan a partir del volumen de datos en vez de ser
ocultados por ellos. La presentacin efectiva es una importante ayuda para clarificar el anlisis y
la interpretacin de los datos, por ello es una necesidad ocupar parte de este texto con la
exposicin de los procedimientos para la efectiva presentacin de los datos estadsticos. Un
profesional que no organice y ajuste sus datos para que sean analizados efectivamente,
fallar en descubrir el significado que pudiera estar contenido en esos datos. Adems, el
lector de un reporte referido a datos cuantitativos presentados de forma ineficiente,
independientemente de la importancia de la informacin que pueda desprenderse de ellos,
descartar los hallazgos del mismo, por su incapacidad para entender como fueron deducidos. La
necesidad de una presentacin efectiva de los datos estadsticos est vinculada al hecho de que
los datos no hablan por si mismos.
Cuando un analista emplea cualquiera o ambos de los mtodos de representacin de datos
cuantitativos, procura resaltar los rasgos distintivos de una determinada situacin. No debe
entenderse que por su propsito la representacin de los datos sustituye en forma alguna a los
procedimientos para su agrupacin que se estudiaron previamente; ms bien representan un
complemento para que los lectores puedan percibir los hechos ms resaltantes del fenmeno que
se estudia mediante dichos datos. En vista de que algunos investigadores han reportado que, por
lo general, las personas poseen pocos conocimientos estadsticos [Utts, 2002], es recomendable
disear adecuadamente las formas de representacin para que sean lo ms sencillas y
comprensibles posibles, y consecuentemente, puedan lograr su cometido.
En algunas situaciones, los datos estadsticos que requieren ser presentados, no son lo
suficientemente extensos para ocasionar dificultades en la interpretacin, en estos casos los datos
se suelen presentar integrados al texto, lo que se denomina presentacin textual. La
caracterstica fundamental de la presentacin textual es que los datos no pueden separarse
de su contexto verbal inmediato, independientemente de que se arreglen en columnas para
permitir una mejor visualizacin. Cuando la cantidad de datos es considerable, este tipo de
presentacin le impide al lector hacerse una idea efectiva de su significado, inclusive el lector
promedio ignorar esa parte del texto dirigiendo su atencin y lectura al final de los mismos,
razn por la cual resulta inconveniente abusar de esta forma de representacin. Sin embargo,
cuando se citan muy pocos datos con propsitos ilustrativos, la presentacin textual suele ser la
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
82
ms indicada porque refuerza la relacin de los indicadores registrados con los argumentos
propuestos, tal como se desea al redactar conclusiones o recomendaciones que provienen de un
estudio cuantitativo. Un ejemplo de presentacin textual puede ser el siguiente tomado del
Informe del Grupo de Trabajo de Energa y Transporte del Consejo Presidencial para el
Desarrollo Sustentable (1996):
...El ndice de congestin de carreteras muestra que para el perodo que comienza en 1982 y
culmina en 1990 las ciudades con la mayor densidad poblacional presentan la mayor congestin y
su mayor incremento; 47 de las 50 ciudades experiment incrementos en la congestin. Los costos
de la congestin de trfico en 1990 tambin se midieron, resultando en promedio 200.000 horas de
retraso y 860 millones de dlares representados por el tiempo de retraso y los gastos de combustible.
En 1999 se espera que al menos la mitad de las millas recorridas sean en congestin severa
comparado con un 31% para 1989...
La representacin tabular no es ms que la colocacin de los datos mediante un arreglo lgico en
filas y columnas que contemple las especificaciones relacionadas con la naturaleza de dicha
informacin, sin embargo, la elaboracin de un cuadro no es tan sencilla y debe planearse
cuidadosamente su tamao y la distribucin acorde a la importancia de las series o
categoras. Es necesario, adems, ser cuidadoso con la eleccin de las columnas y sus
encabezamientos, ya que en ellas se pondrn las relaciones que se desean destacar.
La diferencia ms relevante de la presentacin tabular respecto a la representacin textual radica,
en que estos arreglos son auto-explicativos, entre otras razones, porque son independientes de su
contexto verbal inmediato y se separan de l mediante una identificacin que incluye un titulo y
un nmero, adems sealan la fuente de la que se desprenden los datos y las unidades
descriptivas. La correcta eleccin de las unidades de medida de las magnitudes es otro
aspecto importante porque una buena eleccin de las mismas beneficia la claridad y el
tamao del cuadro. En la mayor parte de los casos en que los datos son complicados y/o
abundantes, ser conveniente mostrar esos datos distribuyndolos en ms de una tabla estadstica
para afianzar la claridad de la presentacin y consecuentemente la interpretacin de la
informacin que ellos revelan. Una de las ventajas principales de las tablas estadsticas es que
una vez incorporadas, el autor puede referirse a los datos contenidos en ellas varias veces a lo
largo del reporte; ms an, las tablas permiten la flexibilidad al poder ser ubicadas en cualquier
lugar del reporte para satisfacer las exigencias estticas.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
83
a) DESCRI PCI N DE LAS TABLAS ESTAD STI CAS
Las diferencias existentes entre los distintos tipos de tablas estadsticas no ocasionan mayores
distinciones al momento de su elaboracin, es decir, siguen los mismos patrones o normas. Por
ello, antes de elaborar una tipologa se preferir distinguir y comentar los elementos que
forzosamente deben incluirse al construir un cuadro estadstico. La figura siguiente permite
reconocerlos:
FIGURA N 23 ESQUEMA DE LAS PARTES FUNCIONALES DE UNA TABLA ESTADSTICA
Procedamos ahora, a aclarar cada uno de los componentes destacados en la Figura N 23:
D Nmero del cuadro: El objetivo que se persigue al numerar una tabla estadstica es facilitar la
posterior cita de los datos contenidos en ella. La numeracin que se adopta por convencin
refleja el orden de aparicin, en reportes muy extensos divididos en captulos, es una
buena prctica que dicha codificacin est compuesta por una cifra que seale el
captulo y otra que numere la figura, en el orden de aparicin dentro del captulo
correspondiente; ambas cifras se separan mediante un punto. Ocasionalmente el nmero se
omite si el cuadro es el nico contenido en el reporte.
D Ttulo: El ttulo de un cuadro es muy importante y debe reflejar con claridad lo que
representan los datos contenidos en l. Para ello, se acostumbra que el ttulo responda a las
siguientes preguntas acerca de las actividades realizadas para recopilar los datos presentados:
qu? , dnde? , cundo? , y cmo se clasificaron?. Es importante resaltar que un ttulo
ser adecuado a sus propsitos si la descripcin no es excesivamente extensa, ni
extremadamente breve.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
84
D Nota de Encabezamiento: Se emplea solamente cuando es menester revelar pormenores tales
como: las unidades en que estn expresadas las variables, indicar si los datos provienen de
una muestra o un universo-poblacin, tambin pueden proveer informacin adicional al ttulo,
en aras de limitar la extensin de ste sin omitir detalles relevantes sobre el contenido de la
tabla. Puede o no escribirse entre parntesis, lo importante, es que el autor de un reporte que
incluya tablas estadsticas debe ser consistente en su presentacin, seleccionando slo una de
las alternativas existentes para ello.
D Encabezado: El encabezamiento comprende los ttulos, etiquetas o rtulos, que describen lo
que se representa en cada columna, sea ello series o categoras, en el ltimo caso, si las
columnas agrupan datos de clases subsumidas en otra mayor, debe existir un subttulo
maestro en la parte superior, abarcando el espacio que ellas ocupan. El encabezado se ubica
en la parte superior del cuadro, debajo del ttulo y la nota de encabezamiento si existiese
debe ser claro, conciso y estar separado del resto del cuadro mediante lneas horizontales un
poco ms gruesas. Se procura que las etiquetas estn escritas en forma horizontal, en vez
de vertical, para facilitar su lectura.
D Columna Matriz: Es la columna a la extrema izquierda de la tabla, comprende las etiquetas
que rotulan cada una de las filas y el encabezado de la matriz, es decir, un ttulo explicativo
de las categoras o series que se representan de cada fila. Al igual que en el encabezado, cada
etiqueta debe ser clara y explcita, de hecho puede ser ms extensas en esta parte porque
disponen de mayor espacio til. El profesional debe ser muy cuidadoso cuando la tabla
comprende ms de una clasificacin por filas, de modo tal que el lector pueda entender
la relacin existente entre cada fila y el esquema global de clasificacin que se desea
presentar.
D Cuerpo de la Tabla: El cuerpo del cuadro resume la informacin estadstica que se presenta,
esta integrado por las celdas que se forman al interceptar cada fila con cada columna. Una
celda es el contenedor de un dato estadstico individual cuyo significado est indicado por las
especificaciones establecidas en las etiquetas de la columna y la fila que se interceptan. Un
valor de celda vaco puede interpretarse de muchas maneras, entre ellas, como un error de
trascripcin o como ausencia o inexistencia del valor, por ello, es absolutamente necesario
que cada celda contenga un dato, si su valor es cero debe colocarse, igualmente si la
informacin respectiva no est disponible debe estar indicado con alguna convencin,
por ejemplo, las siglas N.D., S.I., etc.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
85
D Notas al Pie: Las notas al pie de las tablas, tal como se mencion anteriormente, se utilizan
para hacer aclaratorias sobre uno o varios elementos contenidos en la misma. En la Figura N
23, la celda 2,2 contiene una marca (una a en negritas) que invita a leer la nota al pie, la
informacin que contendra la nota, puede variar entre indicar que el valor es slo estimado,
hasta sealar una explicacin si ste variase mucho respecto a los otros valores reportados.
D Fuente: La nota sobre la fuente indica el origen de los datos recopilados en el cuadro. El
objetivo al proporcionar la fuente de los datos es doble, por una parte se reconoce a la persona
u organismo que recopilo y/o publico los datos, y por la otra, se le permite, a quienes deseen
verificar o ampliar la informacin, acudir a consultar la fuente por ellos mismos. Lo
apropiado ser entonces que la fuente sea suficientemente completa como para servir a ambos
propsitos. A pesar, de que en la Figura N 23 la nota sobre la fuente de los datos se coloc
en la parte inferior de la tabla, ocurre de forma menos frecuente que algunos autores la
incluyan en la nota de encabezamiento, debajo del ttulo. En ocasiones, cuando la fuente de
los datos se sobrentiende se puede omitir, esta situacin ocurre cada vez que los datos
son recopilados por el autor del reporte.
Es posible que para algunos lectores exista confusin entre las notas al pie y las notas de
encabezamiento, en particular, su relacin con el ttulo del cuadro. Con fines aclarativos puede
sealarse que la relacin entre el ttulo y la nota de encabezamiento es muy prxima, mientras
que entre el ttulo y las notas al pie suele ser remota debido a que las notas al pie slo se
requieren si una porcin muy especfica de los datos en la tabla debe ser explicada; en cambio,
las notas de encabezamiento son ms frecuentes por su capacidad para limitar la extensin de los
ttulos.
b) CLASI FI CACI N DE LAS TABLAS ESTAD STI CAS
Existen distintos pareceres para clasificar a los tablas estadsticas, a tal efecto en este texto
emplearemos una tipologa relativa a dos criterios no necesariamente excluyentes, ellos son: a)
propsito, en cuyo caso se reconocen tablas de referencia y tablas analticas, b) clasificacin de
los datos por el cual se tienen tablas clasificadas en un solo sentido, tablas de clasificacin
cruzada, y tablas de clasificacin mltiple.
i).- Tablas de Referencia
Estos cuadros tambin denominados tablas de propsito general, depsitos o fuente, son por lo
general muy extensas, pudiendo ocupar varias pginas al publicarse. Su objetivo es actuar como
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
86
un almacn de informacin estadstica que pretende dar informacin detallada que sirva como
referencia y no como trmino de comparacin entre las distintas partidas. Deben disearse en
forma tal que sea sencillo para el lector localizar cualquier dato particular en la misma, ello se
logra, listando las categoras ordenadas por algn criterio preestablecido, entre otros suelen
usarse: alfabtico cuando las categoras son textuales, numrico ascendente si estn codificadas, o
cronolgicos si se refieren al tiempo. Los cuadros generales o de referencia, por el hecho de que
frecuentemente contienen demasiada informacin, no permiten realizar, a partir de ellos, un
anlisis sencillo de las relaciones entre las diferentes categoras o series que puedan contener.
ii).- Tablas Analticas o de Resumen
Resultara imprctico informar a quien toma las decisiones solamente sobre los resultados
obtenidos de la enumeracin o medicin de la realidad de un colectivo. Tambin es importante
dar a conocer sobre las posibles relaciones subyacentes a los datos o brindar respuesta a alguna
inquietud especfica sobre el fenmeno que los genera, cuando se requiere satisfacer un propsito
investigativo que responde alguna pregunta especfica, por ejemplo: cmo se comparan la
condiciones ambientales entre dos das de produccin cuyo nmero de piezas defectuosas difiere
notablemente?, se construyen tablas analticas. Los cuadros analticos pueden formarse
directamente con los datos obtenidos de los experimentos estadsticos en cuestin o pueden ser
producto de la reduccin de uno o de varios cuadros generales o de referencia. Las tablas
analticas son de tamao relativamente reducido para poder resaltar en forma clara los datos que
se encuentren relacionados. Se trata, en lo posible, que ocupen una sola pgina para permitir
que los datos se vean en su totalidad, ya que de lo contrario se dificultara su estudio.
Tambin resulta esencial que los datos estn dispuestos en forma tal que se facilite el anlisis de
las relaciones importantes, por ejemplo, la mayora de los lectores sienten que es ms fcil
relacionar y comparar datos arreglados en columnas en vez de filas [Neter & Wasserman,
1954]. Adicionalmente, resulta evidente que los datos se compararen con mayor facilidad si estn
cercanos entre si, es decir, los datos deben en lo posible colocarse de tal forma que las
comparaciones se lleven a cabo entre columnas o filas adyacentes.
No obstante, existen otros argumentos menos sofisticados que limitan la seleccin de las
categoras que se colocan en cada parte del cuadro, entre otras, si la lista de clases es muy
extensa o requiere de etiquetas detalladas, imperativamente debe ubicarse en la matriz de
la tabla porque es la ubicacin con mayor espacio disponible para rotular. El principio
general que debe tomarse en cuenta para que una tabla se convierta en una herramienta efectiva
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
87
para el anlisis y la toma de decisiones, puede resumirse en que los datos contenidos en un
cuadro deben estar dispuestos para favorecer el descubrimiento de las analogas entre las series
estadsticas o las categoras resumidas en l. Siempre que no impida la percepcin de alguna
relacin relevante, es conveniente ordenar las clases a partir de su tamao u orden de
magnitud. En algunas situaciones es necesario considerar ms clasificaciones que las que
pueden presentarse efectivamente en una tabla, en cuyo caso, es mejor construir una serie
de tablas relacionadas, cada una de las cuales presenta claramente un grupo particular de
las relaciones que quieren ser destacadas.
Es una buena y habitual prctica que los cuadros estadsticos incluyan filas y columnas que
resuman los datos presentados. Este resumen suele ser una totalizacin, en otras ocasiones
puede mostrar algunos clculos estadsticos relevantes como el promedio o la desviacin. El uso
adecuado de las columnas y filas de resumen es una caracterstica que exhiben las presentaciones
tabulares efectivas, en muchos problemas, ellas constituyen un insumo importante para el anlisis
de los datos, en particular cuando se desean destacar proporciones desbalanceadas y posiciones
relativas.
La ubicacin de las filas y columnas de resumen dependen del inters del analista en destacar los
aspectos generales o los particulares. Si el nfasis se desea en lo general, la fila de resumen
debe colocarse arriba y la columna a la izquierda de los datos que resumen; en caso
contrario, debe ubicarse la fila posterior y la columna a la derecha de las series resumidas.
La razn de esta ubicacin radica en que el lector promedio procesa la informacin de izquierda a
derecha y desde arriba hacia abajo, por lo tanto, las ubicaciones sugeridas provocan que el lector
fije su atencin primero en lo que se desea subrayar.
iii).- Tablas en un solo sentido
Cuando los datos que se deben mostrar pueden ser discriminados en una sola clasificacin, el
cuadro estadstico que los contiene se identifica como un cuadro clasificado en un solo sentido.
Este tipo de tablas son las ms sencillas, sin embargo, no estn restringidas a presentar una sola
serie estadstica, mientras que ambas series se refieran a datos de la nica clasificacin que se
muestra.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
88
El sentido de la clasificacin es indistinto, es decir, las categoras pueden ser las etiquetas de la
filas o de las columnas. Las tablas referenciales suelen estar clasificadas en un solo sentido. En la
prxima figura se ilustra este criterio y algunas de sus peculiaridades:
FIGURA N 24 ESQUEMA DE TABLAS CLASIFICADAS EN UN SOLO SENTIDO
En la figura se puede observar la representacin de una o dos series, en ambos casos, la
clasificacin est hecha en un solo sentido porque las nicas categoras son: a) profesores, b)
administradores, y c) servicios. Ntese que en este tipo de cuadros solo puede haber resumen en
el sentido de la clasificacin, en particular en la Figura N 24, no tendra ningn sentido que
aparezca una columna resumen. Tambin es interesante destacar como el ttulo se ajusta para
explicar de manera suficiente los datos que se presentan, en la tabla inferior se agreg una nota de
encabezado que aclara las unidades en que se presenta la informacin.
En los cuadros estadsticos, frecuentemente se utilizan porcentajes, tal como aparece en la parte
inferior de la Figura N 24. La finalidad del uso de los porcentajes en los cuadros es facilitar la
comparacin, de tal manera que las relaciones que puedan existir se perciban. Cuando se
muestran valores porcentuales es indispensable researle al lector la unidad que representa
el total. En la figura usada como ejemplo en esta discusin puede observarse que en la fila de
resumen el total correspondiente a columna porcentaje suma 100; esto le indica al lector que la
base de cada porcentaje es nmero total de empleados. El total de porcentajes se pudo haber
omitido, ya que por tener la tabla una sola columna sola clasificacin, resulta evidente a quin se
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
89
refieren los totales, aun cuando no exista duda en cuanto a quin representa la totalidad es una
buena prctica acostumbrarse a totalizar los por cientos siempre, dado que una omisin de
este tipo de cuadros ms complejos hace difcil determinar a cul de las partidas estn
referidos los mismos. Existen cuadros que slo poseen datos en forma de porcentaje, mientras
que otros, como la Figura N 24, vienen expresados tanto en valores absolutos como en
porcentajes.
iv).- Tablas de Clasificacin Cruzada
En ocasiones, se aprovecha el espacio que ocupa la tabla para reflejar clasificaciones en ambos
sentidos, en vez de series en uno y categoras en el otro, tal como se realiz en la parte inferior de
la Figura N 24. Cuando los datos pueden ser clasificados en categoras mutuamente excluyentes,
empleando ms de un criterio, los arreglos tabulares exhiben ventajas evidentes. En esos casos
cada una de las celdas representa los valores que simultneamente exhiben la caracterstica
relativa a la clasificacin horizontal y a la vertical. Las etiquetas de las filas designan las clases
acordes a unos de los criterios y las de las columnas respetan el otro, los criterios
correspondientes sern escritos en el encabezado de la matriz y en el subttulo maestro,
respectivamente. Esta construccin se ilustra en la siguiente figura:
FIGURA N 25 CARACTERSTICAS DE UNA TABLA DE CLASIFICACIN CRUZADA
En la figura se muestra como se clasifican los datos en categoras mutuamente excluyentes, la
clasificacin vertical corresponde al criterio sexo de la persona empleada e incluye una columna
de totalizacin a la derecha; mientras que la clasificacin horizontal corresponde al criterio
ocupacin y se suma en la ltima fila. Por ejemplo, la celda 2,2 de la tabla ilustrada representa
el nmero de mujeres dedicadas a labores administrativas en la situacin a la que se refiera el
cuadro.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
90
Las tablas estadsticas de clasificacin cruzada deben contabilizar en las filas y columnas de
resumen la totalidad de los datos recopilados, sin embargo, hay casos donde es innecesario, o
no es factible presentar los datos de todas las clases individuales en que se representa la variable
en cuestin, en situaciones como la descrita es recomendable agrupar las clases irrelevantes
segn el objeto del estudio en una fila o columna, segn sea el caso, etiquetada como otros
o todos los dems. Si la situacin se presenta en las filas, la fila compuesta se ubica en la
parte inferior de la tabla, mientras que en el caso de una columna compuesta se coloca a la
extrema derecha del cuadro.
v).- Tablas de Mltiples Clasificaciones
Otro tipo de tabla que podemos encontrar son las tablas de clasificacin mltiple, donde la
multiplicidad se refiere al nmero de secciones que presenta, pudiendo ser dobles o triples,
multiplicidades superiores no son frecuentes. Cada seccin corresponde al valor de una variable o
categora cuyo anlisis puede ser refinado mediante la agrupacin de los datos que pertenecen a
ella en subcategoras ms especficas. Un ejemplo se muestra en la Figura N 26.
FIGURA N 26 ESQUEMA DE UNA TABLA DE CLASIFICACIN CRUZADA MLTIPLE
Es importante que el lector note que la tabla de la figura precedente tiene las siguientes
caractersticas, en primer lugar, corresponde a una tabla de clasificacin cruzada, debido a que
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
91
toda tabla con clasificacin mltiple no puede estar dispuesta en un solo sentido, adicionalmente,
se puede constatar que la multiplicidad se verifica en uno slo de ellos: el horizontal. En
ocasiones ambos sentidos de clasificacin pueden exhibir ms de una seccin. Otra caracterstica
relevante se puntualiza en el hecho de que cada seccin presenta su propia fila de resumen, donde
se totalizan en este caso los valores para cada perodo de ocupacin.
c) CONSI DERACI ONES PARA OBTENER INFORMACI N DE LAS TABLAS
ESTAD STI CAS
Cuando usted se encuentre en la situacin de tener que leer los datos que se le presentan en forma
de cuadro estadstico debera hacerlo siguiendo un proceso delimitado por ciertas guas
metodolgicas, entre otras que pueden ser tiles para muchas de las presentaciones tabulares se
tienen:
9 Antes de fijarse en los nmeros, uno debe tener claro acerca de lo que la tratan los datos
contenidos en la tabla y del tipo de informacin que puede derivarse de ellos.
9 Observar primero los valores totales o de resumen es una buena costumbre para obtener un
marco general de orientacin.
9 Piense acerca de los datos que usted podra calcular, a partir de aqullos contenidos en la
tabla, y que podran esclarecer la informacin presentada; entre otros estos clculos pueden
referirse a totalizaciones, variaciones, porcentajes o proporciones.
Una vez culminado la inspeccin de la tabla bajo las consideraciones antes descritas usted debe
escribir sus hallazgos, enfatizando lo importante y omitiendo lo trivial. Haciendo referencia a la
Figura N 26 puede comenzar con una frase como: ...los datos de los profesores de sexo
masculino empleados por menos de cinco aos revelan que.... Siempre debe estarse atento de
las unidades a las que se refieren los datos cuantitativos presentados, recordando que
muchas veces los nmeros que se muestran en una tabla pueden representar millones, miles
o cientos de unidades, en vez de la cifra reflejada en aras de exhibir una presentacin ms
elegante. Otra prctica aconsejable consiste en colocar los datos derivados por usted en otra
tabla si es el caso que su extensin lo amerita, por ejemplo, si son ms de tres o cuatro.
Cuando est redactando sus observaciones existen ciertas precauciones que debe procurar, entre
ellas, no debe convertir la tabla y los datos reflejados en ella, en una presentacin textual de los
mismos, visto que se perdera su funcionalidad y restara inters a quienes vayan a leer sus
argumentos. Tambin es importante que usted no vaya a comenzar a escribir acerca de un dato
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
92
cualquiera y saltar luego en forma que parezca aleatoria a otros sin ninguna razn aparente; en lo
posible, debe tratar de mantener una coherencia en la redaccin que puede en principio
soportarse en un eje direccional establecido por las relaciones entre los datos que revela la
conformacin, diseo y estructura del cuadro estadstico. Cuando se analiza los datos que se
muestran en una tabla debe evitarse asegurar lo que no est demostrado por los datos, si
usted desea especular o realizar conjeturas explicativas de los datos debe comenzar la frase
con: Posiblemente esto es debido a.... Lo escrito en esta seccin del captulo no pretende ser
ms que unas pequeas guas para mitigar la inexperiencia del lector al enfrentar datos
presentados en forma tabular, sin embargo cada tabla presenta sus propias dificultades y una de
las mejores formas de ganar experiencia radica en leer frecuentemente ejemplos de comentarios
de tablas bien elaborados.
d) RESUMEN
En este captulo se ha discutido las ventajas de presentar la informacin estadstica en arreglos
tabulares autocontenidos, sin embargo tambin se le ha indicado cuando es apropiado presentar
los datos en forma textual. Se describieron las partes de un cuadro estadsticos, haciendo nfasis
en sus caractersticas y las buenas prcticas para hacerlas lo ms efectivas posibles. Se distingui
entre tablas de referencia y tablas analticas discutindose cuando y donde colocar filas y
columnas de resumen que permitan aclarar la informacin presentada y extraer conclusiones
interesantes. Se le mostr como usar clasificaciones cruzadas y mltiples para abordar realidades
complejas de manera eficiente. Adems, se le proporcionaron consejos acerca de cmo descifrar
la informacin que se encuentra en una tabla estadstica. Toda esta informacin ser valiosa en su
desempeo acadmico y profesional y puede constituir una excelente referencia en un futuro, en
el prximo captulo se discutir como hacer ms atractiva la presentacin de ciertos datos
relevantes al usar la impresin visual para transmitir la informacin y captar la atencin mediante
presentaciones grficas.
e) EJERCI CI OS PROPUESTOS
1.- Analice el siguiente informe del consumo de energa elctrica en Gigavatios-hora, en
Colombia en el ao 1995. Consumo total: 18.709; para uso industrial: 5.671; comercial: 2.195;
domstico: 7.816; oficial y alumbrado pblico: 3.027. A partir de estos datos elabore un cuadro
que destaque; a) el porcentaje de cada grupo sobre el total; b) la suma de los otros tres.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
93
2.- En una empresa industrial la nmina de pago mensual por estamentos en cierto mes se
comport de la siguiente manera: personal de administracin: $ 423.380,00; personal de ventas: $
560.325,00; personal de produccin: $ 2.360.420. Elabore un cuadro que destaque: a) el
porcentaje de cada categora con base en el total de la nmina; b) el porcentaje de la nmina de
pago de cada categora y del total con base en el total de ventas que fue de $ 10.775.514,00.
3.- Un colegio tiene 1.740 alumnos y para su funcionamiento tiene el siguiente personal por
naturaleza: directivo: 1 rector y 2 vicerrectores; de control: 1 inspector jefe y 4 inspectores;
docente: 39 profesores y 3 psiclogos; de administracin: 7 empleados; y de aseo y
mantenimiento: 9 personas. Elabore un cuadro en el que se muestre: a) por personal, uno por cada
tantos alumnos; b) por naturaleza de personal.
4.- A continuacin se le presenta el formato de una tabla estadstica. Sugiera mejoras que deban
ser realizadas a dicho formato:
TABLA 1 GASTOS PARA UNA PLANTA NUEVA Y EQUIPOS
(Datos Estadsticos)
(a)
Manufactura
Actividad
Bienes no
Perecederos
Bienes
Perecederos
Minera Ferrocarril
Otros
Transportes
Otros
(b)
1952
1949
1950
1951
Gran Total
(c)
1949
1950
1951
1952
a. En billones de dlares.
b. Otros
(d)
incluye bienes pblicos, comercio, servicios, finanzas, comunicaciones y construccin.
c. Gran Total de los datos de las filas superiores.
d. No incluye agricultura
Fuente: Washington, D.
Formas Tabulares de Presentar Informacin Raquel Centeno Silva
94
5.- Se realizaron una serie de encuestas para determinar el ingreso antes de impuestos para los
ejecutivos la empresa TVB durante los aos 1998 y 1999. Estos datos fueron discriminados segn
el monto del ingreso en unidades monetarias arrojando las siguientes categoras: por debajo de
1.000, 1.000-1.999, 2.000-2.999, 3.000-3.999, 4.000-4.999, 5.000-7.499, 7.500 y ms) y adems
se clasificaron atendiendo al departamento de adscripcin en: Gerencia de Mantenimiento,
Gerencia de Sistemas, Gerencia de Ventas, Gerencia de Procura, Gerencia Logstica, Gerencia de
Recursos Humanos, Gerencia de Relaciones Pblicas, Gerencia de Produccin y Otras Gerencias.
Se le solicita:
a) elaborar el formato de un arreglo tabular efectivo que permita registrar para cada departamento
el porcentaje de total de los ejecutivos encuestados que ganen cuna cierta cantidad antes de
impuestos
b) Coloque dentro de la celda apropiada del formato diseado los siguientes datos: En 1998, 11%
de los ejecutivos de la Gerencia Logstica ganaron entre 1.000 y 1.999 unidades monetarias antes
de impuestos. En 1999, 40% de los ejecutivos de la Gerencia de Ventas ganaron 7.500 unidades
monetarias o ms. En 1999, 20% de todos los ejecutivos ganaron entre 5.000 y 7.499 unidades
monetarias antes de impuestos. Fuente de los datos: Auditores Externos de la Empresa TVB
95
IV. FORMAS GRFICAS DE PRESENTAR INFORMACIN
A lo largo del texto se ha enfatizado la necesidad de representar los datos estadsticos para poder
obtener la informacin que se desprende de ellos, en el captulo anterior se discuti la
presentacin textual de la data observando sus debilidades y las fortalezas de organizarlas en
cuadros estadsticos para poder obtener una visin de conjunto del fenmeno estudiado. Los
datos que se muestran grficamente suelen poner al descubierto hechos esenciales y relaciones
que de otra forma pueden pasar desapercibidos, por ello, las representaciones grficas se
convierten en un instrumento estadstico de gran utilidad que permite poner el acento en alguna
caracterstica en particular en menoscabo de los detalles. Su uso apropiado y oportuno ser
primordial en el campo profesional y las caractersticas y las tcnicas que se lo permitan sern
explicadas en este captulo, al finalizar su estudio se pretende que usted sea capaz de:
1. Explicar el concepto de grfica estadstica.
2. Describir las caractersticas de cada tipo de grfica estadstica.
3. Construir las representaciones grficas correspondientes a series estadsticas dadas.
4. Interpretar la informacin presentada en una grfica estadstica.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
96
Si se acepta que el sistema de representacin visual es uno de los ms desarrollados por el comn
de las personas, se estar de acuerdo en que las imgenes valen ms que las palabras cuando se
trata de describir una situacin cualquiera. Un grfico o diagrama, es un instrumento para
presentar los datos estadsticos en trminos de magnitudes interpretadas visualmente. Las
representaciones grficas se convierten en un instrumento estadstico de gran utilidad, a pesar de
ello se debe reiterar que en ningn momento los grficos o diagramas son prcticas que puedan
considerarse como sustitutivas, sino ms bien complementarias a las tcnicas estadsticas de
agrupacin que son el fundamento de la estadstica descriptiva.
A pesar del gran valor prctico que se ha argumentado, los grficos poseen ciertas limitaciones
que se deben reconocer para poder emplearlos adecuadamente. En primer lugar, las grficas
permiten rpidamente obtener una idea de la situacin descrita, pero carecen de la profundidad
necesaria para ahondar en detalles. Los datos cuantitativos, por ser observaciones numricas,
vienen representados por valores exactos que al ser llevados a una grfica slo pueden, en
general, representar un aproximado de dicho valor. Otra limitacin inherente al empleo de
grficas es su inconveniencia para representar tantas series estadsticas como puede hacerse en
una tabla. Por tanto, es aconsejable que cuando se requiera mostrar una situacin de mltiples
experimentos se empleen, en vez de una sola grfica que contenga a todos los datos, una
coleccin de grficas donde en cada una de ellas se puedan representar apropiadamente algunos
de los grupos de datos, de forma tal que se logre la visualizacin del fenmeno. Otra prctica
muy frecuente es acompaar a las grficas estadsticas de un pequeo texto explicativo,
donde se redunda en cuanto a los puntos importantes que haya que destacar. Esta
redundancia se hace con el propsito de que no pasen inadvertidos los aspectos ms relevantes
sobre los que se desea informar a los lectores. En trminos generales una grfica tiene presente
los componentes que se despliegan en el siguiente modelo:
FIGURA N 27 ELEMENTOS QUE COMPONEN UN GRFICO
Formas Graficas de Presentar Informacin Raquel Centeno Silva
97
Ttulo y Subtitulo: El ttulo se coloca debajo del grfico y debe indicar de manera concisa y
completa lo que se presenta en el diagrama, debe registrar el nombre de la serie graficada y
adicionalmente puede contener el nombre de la organizacin a la que se refieren los datos y el
tiempo en que se llevo a cabo su recoleccin, en ocasiones estas caractersticas opcionales y
alguna otra que el autor juzgue relevante se presentan en el subttulo.
Identificacin de los ejes: Deben sealarse las unidades en que se expresan los datos y ciertos
valores distribuidos uniformemente a lo largo de los mismos. Si el diagrama se puede
considerar muy amplio resulta conveniente repetir los valores de la escala en el otro
extremo, es decir, arriba y abajo si se presenta un diagrama muy alto de forma horizontal o a
izquierda y derecha de uno vertical muy ancho. En el caso en que se presenten diagramas que por
su construccin requieran dos escalas, cada una de ellas debe estar plena y notoriamente
identificada.
Escala: La seleccin de las escalas debe respetar la proporcin entre el ancho y la altura, esta
relacin depender de la configuracin y el diseo del reporte en que est incluido el grfico.
Lneas de fondo: Para facilitar la interpretacin de los grficos pueden incluirse lneas de un
trazado ms fino que el empleado en los ejes. De esta forma se construye una especie de malla en
la que el lector puede ubicar alguno de los valores representado que le despierte inters. Cuando
se representan los valores mediante curvas o lneas esta malla debe ser omitida si obstaculiza la
apreciacin del fenmeno representado, en cuyo caso sirve de gua al lector las marcas de
graduacin en los ejes.
Marcas de graduacin: Son pequeos segmentos de recta que se trazan perpendiculares a los ejes
distribuidos de forma de sealar la ubicacin de algunos de los valores, o bien, el nombre de las
categoras que se representan en cada eje.
Fuente de los datos: Al igual que se exige para las tablas estadsticas debe incluirse la
informacin necesaria para que quien desee ahondar o validar los datos que se representan pueda
hacerlo. La fuente de los datos slo se omite cuando es obvia, por ejemplo, si el autor recopil
tambin la informacin.
Rotulado: Es preferible que todas las etiquetas se coloquen en disposicin horizontal para facilitar
la lectura, esta recomendacin slo debe exceptuarse cuando el espacio requerido para ello
sacrifique la resolucin de la grfica por las limitaciones de espacio impuestas por el diseo del
reporte.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
98
a) TI POS DE GRFI CAS
Para representar grficamente las series estadsticas, se pueden usar diferentes tipos de grficas,
entre las cuales destacan: a) diagramas lineales, b) diagramas de barras, c) grficas circulares, y
d) pictogramas y cartogramas. En lo sucesivo sern descritos cada uno de ellos para poder
determinar sus ventajas y desventajas en las diferentes aplicaciones.
i).- Diagramas Lineales
La representacin lineal consiste en expresar en un plano, bajo el sistema de coordenadas
rectangulares o cartesianas, varios pares de valores. Estos pares estn conformados por un valor
de una de las variables y el otro correspondiente a la segunda variable. Cada pareja de estos
valores, da lugar a un punto en el plano que representa un estado del fenmeno o sistema bajo
estudio. La unin de cada par de puntos mediante segmentos de recta da la representacin lineal
de la totalidad del fenmeno o sistema observado durante el experimento estadstico. La
convencin que se sigue para ubicar las variables es colocar en el eje de las ordenadas
aquella cuyo comportamiento se desea explicar o comparar, el cual se asume que depende
de cierta variable independiente ubicada en el eje horizontal
18
. Los ejes se cruzan en un punto
denominado origen que corresponde al par de valores nulos de cada variable, cada eje debe ser
dividido en segmentos determinados por una escala que se toma arbitrariamente y que depender
del fenmeno que se quiera representar. Es habitual que por razones de proporcionalidad ambos
ejes no se expresen en una misma escala, dado que cada variable puede contarse o medirse en
rdenes de magnitud distintos. Sin embargo, en ambos ejes los valores representados
aumentan a medida que alejamos del origen. La forma de obtener los puntos que sern unidos
para representar el diagrama se ilustra en la siguiente figura:
18
En aquellos casos donde las dos variables pueden depender mutuamente (dependencia bilateral o
interdependencia), se pueden colocar indistintamente una u otra variable en uno cualquiera de los ejes, y la otra
variable en el otro eje.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
99
(a) Ubicacin del Primer Punto
(b) Ubicacin del Segundo Punto
(c) Todos los Puntos Ubicados
(d) Trazado de las Lneas de Unin
FIGURA N 28 BOSQUEJO DE LA CONSTRUCCIN DE UN DIAGRAMA LINEAL
En la parte (a) de la figura se representa el proceso de ubicacin del primer punto formado por
el par de valores (x
1
, y
1
) se comienza trazando una perpendicular al eje x en el valor x
1
, luego de
traza una perpendicular al eje y en el valor y
1
; la interseccin de ambas perpendiculares,
representadas en color azul, sealar el valor del punto. El proceso se repite para cada par de
datos que se desean representar hasta obtener lo que se observa en la parte (c) de la Figura N 28,
posteriormente y en el orden de representacin impuesto por la variable independiente (eje x) se
unen cada par de puntos con un segmento de recta, tal como se aprecia en la parte (d) de la figura,
mediante trazado amarillo.
Los diagramas lineales se usan frecuentemente para representar series cronolgicas y series de
frecuencias cuantitativas. Por su construccin, un diagrama de lneas es especialmente til
cuando se desea visualizar la relacin entre dos variables o bien cuando se desea comparar
dos o ms series estadsticas. En el rea administrativa, en particular, se emplean
frecuentemente para estudiar series cronolgicas porque los diagramas lineales ponen mayor
nfasis en las fluctuaciones de la variable en el tiempo en vez de la comparacin entre
perodos en especfico. Esta caracterstica de los diagramas lineales permite acentuar la direccin
y magnitud de los cambios, lo que obliga a discernir sus causales para tomar las acciones
requeridas que refuercen o corrijan los efectos observados. En las representaciones temporales se
Formas Graficas de Presentar Informacin Raquel Centeno Silva
100
toma como norma llevar la frecuencia con que se presente la variable al eje vertical, y sobre el eje
horizontal colocar la variable tiempo, tal como se observa en la siguiente figura:
0
10
20
30
40
50
60
70
80
90
100
1997 1998 1999 2000 2001 2002
Aos
M
i
l
l
o
n
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
FIGURA N 29 VENTAS DE LAS COMPAA TVB
La Figura N 29 permite destacar algunas de las caractersticas de los ejes comentadas
previamente, en primer lugar mientras la variable independiente, es decir el tiempo, est
expresado en el valor del ao calendario en cuestin, la magnitud del eje de las ordenadas est en
millones, variando entre 20 y 95, con lo cual se recalca la disparidad de escalas. Adicionalmente,
y tal como se suceder con estas series temporales, el eje de la abcisas no comienza en cero y por
lo tanto el punto de cruce de los ejes no es, estrictamente hablando, el origen de sistema de
coordenadas. Si en estos casos se comenzara en el origen las lneas quedaran desplazadas muy a
la derecha y el tamao total de la imagen relativa al rea de trazado del diagrama sera mnimo.
Observemos ahora como el tamao y la escala de los ejes influye en la percepcin que el
lector puede hacer sobre un diagrama de lneas, mediante la construccin de una secuencia de
diagramas lineales sobre el porcentaje de uso de la capacidad instalada de la empresa TVB en el
perodo 1999-2002.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
101
(a) Eje y con longitud desproporcionada
(b) Eje y no comienza en cero
MALA CONSTRUCCIN DE LOS EJES EN DIAGRAMAS DE LNEA
(c) Eje y comienza en cero
(d) Eje y muestra la interrupcin
BUENA CONSTRUCCIN DE LOS EJES EN DIAGRAMAS DE LNEA
FIGURA N 30 INFLUENCIA DE LOS EJES EN LOS DIAGRAMAS DE LNEA
Porcentaje de Utilizacin de la Capacidad Instalada de la Empresa TVB (1998-2002)
Tal como se indic previamente, cuando el valor inicial de una de las variables es muy alto se
suele interrumpir la escala del eje donde se va a representar tal variable con el objeto de dar una
mejor visin de la grfica. Cuando se trunca el eje de las ordenadas se aumentan artificialmente
las pendientes de las lneas de unin, tal como se comprueba al observar el recuadro (b) de la
Figura N 30. El observador de un diagrama comnmente dirige su atencin a la altura vertical y
las pendientes, cuanto ms inclinada sea una lnea se concluye que mayor es la variacin en la
relacin entre las cantidades que miden los ejes, pero se puede extraer una conclusin engaosa o
mal fundamentada al prestarle poca atencin a las escalas de valores de los ejes. Esta actitud en
ocasiones es empleada para crear con las grficas efectos artificiosos de apreciacin a travs de
una manipulacin maliciosamente hbil del eje vertical, por ello, cuando la intencin de quien
presenta el reporte es destacar los cambios en una serie debe sealar la interrupcin del eje
de las ordenadas en forma visible porque est sacrificando la visin de la importancia
relativa de esos cambios en trminos de las magnitudes absolutas de los datos. La prctica
habitual recomienda emplear una lnea quebrada, tal como se muestra en la parte (d) de la
Formas Graficas de Presentar Informacin Raquel Centeno Silva
102
Figura N 30. Otra forma de tergiversar la informacin que se muestra en un diagrama de lneas
consiste en elaborarlas, consciente o inconscientemente, sobre unos ejes que no guarden una
proporcin adecuada en lo relativo a su longitud, tal como se muestra en el recuadro (a) de la
Figura N 30, en este caso al igual que en recuadro (b) se trasmite la sensacin de que la cada
en la utilizacin de la capacidad instalada se desmorona vertiginosamente entre el ao 2001 y
2002 debido a que el segmento de lnea que une ambos valores es prcticamente vertical. Del
mismo modo el incremento experimentado entre los aos 1999 y 2000 se hace ver muy
pronunciado. Para evitar este tipo de deformaciones reiteramos la convencin (citada
previamente en la construccin de histogramas) conocida como regla de los tres cuartos de
altura. Esta costumbre se fundamenta en fijar como altura del eje vertical o de las
ordenadas un valor aproximadamente igual a tres cuartos de la longitud del eje horizontal.
En la prctica esto fija la escala puesto que la altura del eje y estar prxima al valor ms alto de
la variable dependiente. Esta norma se aplic en las representaciones (b), (c) y (d) de la Figura N
30.
Una misma grfica puede mostrar el comportamiento de varias series, cuando se emplean
diagramas de lneas en estudios comparativos debe tenerse especial precaucin en la
identificacin apropiada de la lnea que representa a cada serie, adems de la forzosa seleccin de
una variable independiente en comn, en las series cronolgicas esto implica realizar la
comparacin de varias series a lo largo de un periodo. La Figura 31 ms abajo muestra las
ventas en los dos segmentos de mercado diferenciados de la empresa TVB, desde 1992 hasta
2002. Fcilmente podemos ver que las ventas en ambos segmentos estn creciendo, con el
componente nacional por adelante del componente internacional en cada uno de los aos.
0
10
20
30
40
50
60
70
80
90
100
1992 1993 1994 1995 1996 1997 1998 1999 2000 2001 2002
Aos
M
i
l
l
o
n
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
Nacionales
Internacionales
FIGURA N 31 EVOLUCIN DE LAS VENTAS DE LA EMPRESA TVB SEGN EL SEGMENTO DE MERCADO
Formas Graficas de Presentar Informacin Raquel Centeno Silva
103
Si en los grficos se dibujan simultneamente varios diagramas, llega un momento en el cual la
vista no los puede separar y se suele crear confusin aunque stos se hayan distinguido por
colores o por diferentes tipos de trazado, esto constituye la limitacin fundamental al emplear
diagramas lineales como herramienta de comparacin. Cuando las series a comparar se pueden
considerar como componentes de una totalidad como es el caso de la Figura N 31 puede ser
relevante el comportamiento de la totalidad del fenmeno. En estas situaciones se emplean
diagramas de lnea segmentados; para su construccin se ubican los puntos correspondientes a la
primera serie, luego se representan los de las siguientes series mediante una serie de puntos
obtenidos manteniendo el valor de las abcisas y sumando al valor de la ordenada el
correspondiente al de la serie anterior, es decir P
j+1
= (x
j
, y
j
+y
j+1
), de esta forma el diagrama se
construye por capas que deben ser diferenciadas entre si porque cada una representa un
componente especfico del total. Si para tomar cierta decisin privan ms los cambios relativos
que los absolutos se pude transformar el diagrama segmentado de forma tal que muestre la
distribucin porcentual. Para determinar la distribucin porcentual solo se requiere dividir la
magnitud de cada componente entre la suma de las magnitudes de todos ellos y multiplicarlo por
cien. La ltima serie que se representa siempre estar mostrada por una lnea horizontal dado que
la totalidad de cualquier fenmeno observado corresponde al 100% y por ende no es necesario
calcularla. En los casos en que se construyen grficos de lneas segmentados es preferible
rellenar, sombrear o colorear el rea delimitada por las lneas para aumentar la claridad de
interpretacin. Las caractersticas aqu planteadas se muestran en la siguiente figura:
0
20
40
60
80
100
1992 1994 1996 1998 2000 2002
Aos
M
i
l
l
o
n
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
Nacionales
Internacionales
0%
20%
40%
60%
80%
100%
1992 1994 1996 1998 2000 2002
Aos
M
i
l
l
o
n
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
Internacionales Nacionales
FIGURA N 32 VENTAS TOTALES Y POR SEGMENTO DE MERCADO DE LA EMPRESA TVB, PERODO (1992-2002)
Despus de haber pasado revista a las principales caractersticas de estos diagramas se pueden
resumir algunas reglas para el trazado de diagramas lineales:
1. El cero de la escala vertical siempre debe colocarse. Si se hace necesario interrumpir la
escala vertical, esto debe mostrarse en forma clara y franca con una lnea quebrada.
2. La curva debe trazarse ms gruesa que las coordenadas para que resalte.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
104
3. Los ttulos deben ser claros y todos los letreros y notas deben colocarse en el sentido de la
lectura, si el espacio lo permite se prefiere que sea horizontalmente.
4. Las unidades que se utilizan deben destacarse claramente.
5. La longitud de los ejes debe seleccionarse de modo que la grfica resulte balanceada a lo
alto y ancho (regla de los ).
6. Si hay que mencionar puntos particulares de la curva, deben indicarse con notas al pie.
7. Indique siempre la fuente de informacin.
ii).- Diagramas de Barras
Esta forma de representar los datos se utiliza con mucha frecuencia debido a la facilidad de
interpretacin que presenta para cualquier lector. Una grfica de barras puede usarse para
describir cualquiera de los niveles de medicin: nominal, ordinal, de intervalo o de razn, por ello
comnmente se emplean para mostrar distribuciones cuantitativas donde la variable toma pocos
valores distintos, tambin para distribuciones de frecuencias cualitativas y por ltimo, suelen ser
empleadas para representar series de tiempo. Las grficas de barras pueden acomodar las
barras en posicin horizontal o vertical, prefirindose la primera cuando las categoras son
cualitativas y cuando las etiquetas que las rotulan son relativamente extensas y las segundas
cuando se representan series de tiempo. La magnitud con que viene expresada la variable es
determinada por la longitud de las barras y no su amplitud, de hecho las barras deben tener el
mismo ancho. Esta caracterstica diferencia radicalmente a los histogramas de las grficas de
barra, porque en los primeros las frecuencias (que corresponden al valor de la variable) estn
indicadas por el rea de la barra
19
, adems los histogramas se presentan siempre en forma tal que
las categoras estn en el eje de las abcisas y por ende las barras son verticales. Es conveniente,
con el objeto de dar una visin objetiva del fenmeno, que las barras tengan una balanceada
proporcin, es decir, que no sean ni excesivamente cortas ni anchas, ni demasiado largas y
angostas. Se debe dejar un espacio entre las barras que formen la grfica, con la finalidad de
facilitar al lector la identificacin de la correspondencia entre las barras y sus etiquetas. Dicho
espacio debe estar relacionado con el ancho de las barras para que ellas no estn muy separadas
ni que el espacio sea demasiado pequeo; un criterio histricamente utilizado es hacer este
espacio igual a la mitad del ancho de las barras.
Para elaborar un diagrama de barras se debe completar la siguiente secuencia:
19
Slo en los casos de intervalos de clase del mismo ancho, como la base de cada barra es idntica, la frecuencia y la
altura de la barra son coincidentes.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
105
1. Decidir la direccin de las barras evaluando la longitud de las etiquetas y la caracterstica
que se va a exhibir.
2. Tomar un sistema de coordenadas rectangulares y colocar en el eje correspondiente (de
las abscisas si la presentacin es vertical y de las ordenadas en caso contrario) las
etiquetas que muestran los valores que toma la variable y en el eje contrario se expresan
las magnitudes a visualizar. Si la presentacin es vertical estos rtulos se acomodan a la
derecha, mientras que en la configuracin horizontal se ubican en la parte superior como
un encabezado.
3. Construir, tomando como base al eje correspondiente, unas columnas o barras, cuya altura
o longitud ser igual a cada una de las distintas magnitudes con que se presenta cada
categora o valor de la variable. Resulta ventajoso para la lectura de la grfica que se
dibujen lneas correspondientes a los valores de las marcas presentadas en el eje de
magnitudes, de forma tal que el rea de trazado de las barras o columnas se ubique sobre
una especie de malla, en vez de una superficie blanca.
4. Si el nivel de medicin de los valores de la variable que corresponden a cada barra o
columna es nominal, deben arreglarse en forma tal que reflejen su magnitud, bien sea en
orden creciente o decreciente, con la finalidad de facilitar las comparaciones entre ellas.
5. Si existe una categora del tipo todas las dems o miscelneos la barra que la
represente debe ubicarse al fondo del diagrama o bien la columna debe presentarse
completamente a la derecha del mismo, independientemente de que se contrare el inciso
anterior, puesto que estas categoras representan un conjunto de clases relativamente
insignificantes. Tambin se aplica este acuerdo cuando se desea mostrar un valor estndar
o de comparacin, por ejemplo, un tiempo promedio de ejecucin cuya barra o columna
respectiva ser menor que algunas y mayor que otras. Algunos autores suelen destacar
mediante sombreado o coloracin diferencial estas barras o columnas.
6. Tal como se seal, en los diagramas de lnea pueden ofrecerse interpretaciones mal
fundamentadas o artificiosas si la escala de magnitudes no comienza en cero. Sin
embargo, es factible que existan casos donde los valores estn concentrados en alguna
categora en particular, en cuyo caso la longitud de esta barra o la altura de la columna
pertinente ser desproporcionada respecto a las dems, inhabilitando las comparaciones
que puedan surgir entre las otras categoras. En estas situaciones debe procederse
interrumpiendo la barra ms alargada en el valor apropiado para observar a las otras y
sealando explcitamente la magnitud que sta representa. Recordemos nuevamente que si
Formas Graficas de Presentar Informacin Raquel Centeno Silva
106
se desean presentar magnitudes absolutas se exige la clara identificacin del valor cero
para poder realizar comparaciones vlidas por medio de razones o proporciones.
Hasta ahora se han expuesto las tcnicas y limitaciones de los grficos de barra, sin embargo slo
se ha considerado la construccin de barras o columnas individuales sin segmentar. Estas otras
cualidades, agrupacin y segmentacin, amplan la versatilidad y funcionalidad de los diagramas
de barras. Se pueden reconocer cuatro posibilidades para los grficos de barras o columnas: a)
individuales sin segmentar, b) segmentadas, c) agrupadas, y d) bidireccionales. A continuacin se
puntualizarn las diferencias y las posibles aplicaciones.
Las grficas de barras o columnas segmentadas se dibujan mediante segmentos de tal manera que
cada uno represente las partes componentes de un total y la longitud de la barra o altura de la
columna reflejar la suma de las magnitudes de cada componente. Los segmentos deben
diferenciarse adecuadamente, para lograr este propsito se suelen sombrear de distintas maneras
o gracias a los equipos de impresin modernos se les dan distintos colores. Debido a que los
segmentos se apilan en orden de aparicin, todos los segmentos que no emerjan directamente de
la base de la barra o columna comenzarn en sitios diferentes por lo cual la nica comparacin
sencilla de realizar respecto a los componentes entre s sucede con el segmento inicial. Estas
representaciones son tiles para tratar de descubrir o resaltar proporciones, mientras se
mantiene el enfoque en los totales.
Cuando lo que reviste inters es la comparacin entre varios componentes de una variable, y
simultneamente visualizar la relacin entre las distintas categoras de dicha variable la
presentacin ms adecuada consiste en diagramas de barras agrupadas. Las grficas de barras
agrupadas consisten en construir, en conjuntos diferenciables, distintas barras o columnas que
correspondan a la comparacin de dos series de datos durante varias categoras, pudiendo
corresponder cada grupo de barras a distintas partes componentes de un total o ser partes
diferentes totales. Tambin se pueden comparar mediante este tipo de grficas, dos o ms
categoras en perodos de tiempo distintos. Cuando se usan grficas de barras agrupadas lo usual
es no dejar espacio entre dos barras correspondientes a un grupo y dejar un espacio prudencial
entre los grupos de las barras; espacio que puede, como se acot para las barras individuales, la
mitad del ancho de una de las barras. Las grficas de barras agrupadas no permiten, a
diferencia de las segmentadas, la comparacin entre totales. Una ilustracin con fines
comparativos de la apariencia de los tipos de grficos de barras que se acaban de precisar se tiene
en la siguiente figura:
Formas Graficas de Presentar Informacin Raquel Centeno Silva
107
0
300
600
900
M
i
l
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
1994 1995 1996 1997
Aos
Cobre Hierro
(a) Columnas Agrupadas
0
300
600
900
1200
M
i
l
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
1994 1995 1996 1997
Aos
Cobre Hierro
(b) Columnas Segmentadas
FIGURA N 33 COMPRA DE MATERIA PRIMA PARA RECICLAR POR LA EMPRESA TVB
Es interesante destacar que la observacin de la parte (a) de la figura muestra la inexacta
apreciacin de que la inversin en materia prima reciclada se incrementa en el ao 1996 cayendo
ligeramente al ao siguiente, debido a la proporcin que representan las compras de material de
cobre respecto al ferroso. En cambio cuando se observan los totales en las columnas segmentadas
de la parte (b) se nota el efecto real que es justamente el contrario, una declinacin leve en el 96 y
un aumento ligero en el 97. Es interesante destacar que las barras agrupadas mantienen la
claridad cuando representan tres, mximo cuatro, modalidades; si las necesidades superan
estas limitaciones es mejor emplear grficos lineales para representar las series
correspondientes a cada modalidad, adems, Neter y Wasserman, (1954) sostienen que es ms
efectivo rotular directamente las barras en vez de suministrar una leyenda. Las barras
segmentadas son muy efectivas cuando presentan dos componentes, a partir de all es ms
la informacin que ocultan que la que revelan.
En las situaciones donde se desean representar cantidades positivas y negativas es til emplear
diagramas de barras de dos direcciones. Estos casos pueden ser, entre otros, ganancias y prdidas,
porcentajes de cambio en el tiempo, desviaciones alrededor de un estndar, etc. Difieren de los
otros diagramas vistos hasta ahora en que las barras se extienden a la derecha y a la izquierda de
Formas Graficas de Presentar Informacin Raquel Centeno Silva
108
una base vertical o lnea cero. Debe procurarse que las barras que representan cantidades
positivas se ordenen en forma descendente y en sentido contrario las que muestran
cantidades negativas, de forma tal que se favorezca la comprensin del diagrama. Barras
agrupadas y/o segmentadas tambin pueden exhibirse en dos direcciones, recordando que en la
misma medida en que aumenta la elaboracin y el nivel de detalle que se plasma en un
diagrama se disminuye su efectividad como transmisor de informacin. La siguiente figura
es un ejemplo del uso de diagramas bidireccionales:
-25 -20 -15 -10 -5 0 5 10 15 20 25
Porcentaje (%)
Deshumidificadores
Aires
Acondicionados
Neveras
Congeladores
Chillers
FIGURA N 34 CAMBIOS PORCENTUALES DEL AO 2001 RELATIVO AL AO 2000 DE LA PRODUCCIN DE LA
EMPRESA TVB, SEGN EL TIPO DE PRODUCTO
Por ltimo, conviene recordar que los diagramas de barras, como todos los tipos de grficas,
tienen por finalidad dar una visin simplificada del fenmeno, por tanto nunca se debe sacrificar
la claridad en aras de la cantidad de la informacin presentada, es decir, no es apropiado
recargarlos con demasiadas partes componentes o barras agrupadas ya que esto genera grficas
muy complejas.
Un diagrama de difcil interpretacin ser inefectivo en su propsito, por ello, es prudente reiterar
que un buen grfico quedar balanceado, mostrar un espacio entre las barras, y presentar lneas
de fondo. El autor siempre debe evaluar el producto final con criterios estticos y verificar la
claridad en la apreciacin visual.
En ocasiones la esencia de la informacin que desea presentarse demanda el uso de diagramas
combinados. A continuacin se presentan algunas posibles aplicaciones con la finalidad de
propiciar la reflexin acerca de lo necesario que resulta destacar visualmente los aspectos de
mayor relevancia, segn lo demande la decisin que debe tomarse en cada situacin:
Formas Graficas de Presentar Informacin Raquel Centeno Silva
109
R
e
c
i
b
i
d
a
s
E
n
t
r
e
g
a
d
a
s
No Completadas
0
10
20
30
40
50
60
70
80
90
100
1er trim. 2do trim. 3er trim. 4to trim.
N
m
e
r
o
d
e
r
d
e
n
e
s
FIGURA N 35 NMERO DE RDENES DE PEDIDO RECIBIDAS, ENTREGADAS E INSATISFECHAS, EMPRESA TVB
AO 1997
La Figura N 35 permite a quin evala la relacin con los clientes, no slo saber el
comportamiento del volumen de pedidos (rdenes recibidas) que en este caso presenta poca
variacin, sino simultneamente saber que la cantidad de rdenes no entregadas se ha estado
incrementando durante el ao a causa de una disminucin sostenida de los envos. Otro arreglo
permite comparar la produccin actual con la planificada, como se muestra en la siguiente figura:
0
50
100
150
200
250
300
1er trim. 2do trim. 3er trim. 4to trim.
N
m
e
r
o
d
e
r
d
e
n
e
s
Producin Real
Produccin Planeada Acumulada
Produccin
Real Acumulada
FIGURA N 36 NMERO DE RDENES PRODUCIDAS POR LA EMPRESA TVB EN EL AO 1997
La Figura N 36 permite al observador ver la brecha existente entre la produccin planificada y lo
llevado a cabo realmente, adems de visualizar simultneamente el comportamiento trimestral
para poder puntualizar en las causas donde se produjo mayor desvo respecto a las metas. Un
ejemplo, donde se compara contra un estndar se ilustra de seguido:
Formas Graficas de Presentar Informacin Raquel Centeno Silva
110
45,0
47,5
50,0
52,5
55,0
1er trim. 2do trim. 3er trim. 4to trim.
M
i
l
e
s
d
e
U
n
i
d
a
d
e
s
M
o
n
e
t
a
r
i
a
s
Costo Estndar
FIGURA N 37 COSTO DE PRODUCCIN UNITARIA DE CONDENSADORES TIPO A, EMPRESA TVB (AO 1997)
En el ltimo de los diagramas, el encargado de tomar las decisiones puede observar que las
desviaciones respecto al estndar no son muy pronunciadas, lo cual permite asumir que el valor
fijado est bien colocado y puede ser satisfecho por la empresa. Asimismo, se observan
fluctuaciones alternativas en el sentido de la variacin de los costos de produccin, pudiendo
ahora inferir que al presentarse un trimestre con costos bajos se relajan las condiciones de
operacin provocando el aumento sucesivo, desatando medidas restrictivas que inciden en la baja
posterior. Una presentacin en conjunto de las dos ltimas figuras permite presumir una relacin
entre el nivel de produccin y el costo unitario de cada pieza. Ambas inferencias pueden dar pie a
otras investigaciones que permitan afianzar las conclusiones.
iii).- Grficos Circulares
Este tipo de grfica se utiliza para presentar los tamaos relativos de las partes componentes de
una globalidad, mediante alcuotas superficiales de un crculo proporcionales a las magnitudes de
los datos, asemejando las rebanadas de un pastel, por lo que se les denomina con frecuencia
diagramas de torta. Una grfica de pastel es especialmente til para describir datos de nivel
nominal, ejemplos clsicos de su aplicacin en el contexto industrial seran la representacin de
la distribucin de los costos de produccin, la distribucin de los empleados segn algn atributo
de inters como formacin profesional, la distribucin de las ganancias o de las ventas de una
empresa entre otros. Para construir un diagrama de torta se considera al crculo como la
representacin de la totalidad del fenmeno estudiado; por tanto, se requieren representar tantas
secciones como partes componentes tenga el fenmeno en estudio. La superficie de cada una de
las secciones en que se dividir del crculo deben ser proporcionales a la magnitud de cada
componente representado. Para ello, se calculan los grados del arco que corresponden a ciertos
valores porcentuales uniformes (p.e. en intervalos del cinco por ciento: 0, 5, 10,..., 95) por medio
Formas Graficas de Presentar Informacin Raquel Centeno Silva
111
de una sencilla regla de tres que distribuya los 360 grados proporcionalmente a las cifras
20
y se
registran en el permetro del circulo manualmente hablando con la ayuda de un transportador.
Ahora, si usted desea graficar el 55 por ciento de participacin en el total, trace una lnea desde
cero hasta el centro del crculo y despus otra lnea desde el centro hasta el punto de la
circunferencia donde registr el valor de 55%. Para representar otras porciones debe proceder en
dos pasos, primero agregue al 55 por ciento que ya ubic, la prxima cantidad; supongamos
ahora que la siguiente categora en importancia representa un 19 por ciento, el resultado de la
suma es 74 por ciento; luego, el rea abarcada entre 55 y 74 por ciento representar la nueva
alcuota, en consecuencia, usted deber trazar una lnea desde el centro del crculo hasta el punto
del permetro que corresponda al valor 74. Como en la construccin que propusimos se sealaron
los valores cada 5%, no se observa una marca para el 74%. Para ubicarla debern marcarse los
puntos correspondientes al 1% dentro del sector comprendido entre 70 y 75%. Este
procedimiento se reitera hasta agotar los componentes que deben ser representados, ntese que la
ltima fraccin queda dibujada automticamente, que en nuestro caso podra representar una
clase del tipo todas las dems. Una vez marcada con las lneas radiales la circunferencia, se
rellenan de forma distintiva los correspondientes sectores circulares.
El mtodo se ilustra en la Figura N 38. Como las reas del pastel representan la participacin
relativa de cada categora, podemos compararlas rpidamente. Si el ejemplo utilizado significa
volumen de ventas, el mayor porcentaje de los ingresos se obtiene de la primera actividad, siendo
esta cantidad ms de la mitad del total, y ms del doble de la cantidad otorgada a la categora que
le sigue en tamao. Adems existen dos productos o servicios fundamentales y un grupo de
pequeo impacto individual pero que genera ms recursos en conjunto que la segunda actividad
importante (26% vs. 19%).
20
18
% 100
360 % 5
x
x % 5
360 % 100
=
Formas Graficas de Presentar Informacin Raquel Centeno Silva
112
(1) Registrar ngulos uniformemente
distribuidos en la circunferencia
(2) Trazar las lneas que delimitan
al primer sector desde las 12 m
(3) Identificar el porcentaje acumulado
para la siguiente clasificacin
(4) Trazar la lnea que delimita el
segundo borde de la nueva seccin
FIGURA N 38 CONSTRUCCIN DE UN DIAGRAMA DE PASTEL
Pueden puntualizarse otras recomendaciones tiles, entre ellas, sealizar cada sector del crculo
con etiquetas arregladas en direccin horizontal en vez de radial; tambin horizontalmente, es
adecuado expresar en la grfica los porcentajes que representan las cifras respecto del total para
facilitar el trabajo y la comprensin del lector. Como en todas las grficas y diagramas la
sencillez es una necesidad fundamental, es prudente emplear pocas categoras para no
sobrecargar la figura. Una versin refinada del ejemplo construido en la figura previa podra
verse de seguido:
55%
19%
26%
Refrigeradores
Compresores
Todos los
Dems
FIGURA N 39 DISTRIBUCIN DE LOS INGRESOS POR VENTAS SEGN PRODUCTO DE LA EMPRESA TVB, AO 2001
Formas Graficas de Presentar Informacin Raquel Centeno Silva
113
Cuando se coloca una secuencia de diagramas circulares, por ejemplo, cuando se desea
comparar en el tiempo la evolucin de cierta distribucin, deben emplearse crculos con la
misma rea total para evitarle al lector interpretaciones errneas respecto a la magnitud
absoluta que ellos representan.
26%
19%
55%
Refrigeradores
Compresores
Todos los
Dems
(a) Ao 2001
16%
27%
57%
Refrigeradores
Compresores
Todos
los Dems
(b) Ao 2002
FIGURA N 40 COMPARACIN DE LA DISTRIBUCIN DE LOS INGRESOS POR VENTAS SEGN PRODUCTO DE LA
EMPRESA TVB, AOS SELECCIONADOS
La ltima figura mostrada permite inferir como la empresa se est dedicando a fortalecer sus
principales rubros de mercado, disminuyendo la importancia relativa de la categora todos los
dems, mientras incrementa sus ingresos a partir de las ventas de la clase refrigeradores,
manteniendo aproximadamente igual el tem compresores.
iii).- Pictogramas
Los diagramas pictricos son representaciones grficas que utilizan smbolos y figuras que por su
forma deben sugerir la naturaleza del dato o fenmeno que se quiere representar. Si el estudio se
refiere al personal de una empresa, las figuras a utilizar sern humanas. Los pictogramas tienen
como objetivo mostrar comparaciones impactantes llamando as la atencin de aquellas personas
que por desinters, aversin o desconocimiento de la estadstica no observaran una grfica ms
formal. Son usadas como herramientas de comunicacin efectiva debido a su apariencia atractiva.
El autor pone de manifiesto su creatividad tratando de trasmitir un hecho o informacin que
juzgue relevante para la audiencia ante la cual se presenta. Sin embargo este tipo de diagrama se
utiliza muy pocas veces como ayuda al anlisis estadstico serio del fenmeno representado,
debido tanto a que los conos empleados en su elaboracin podran operar como distractores, y
ms importante an, por la carencia de rigurosidad con que se ajustan a escalas precisas los
valores mostrados, tal como corresponde a datos de naturaleza cuantitativa.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
114
Si se emplea un pictograma ha de estarse consciente de que quien lo observe siempre le ser
problemtico comparar alturas, reas y/o volmenes; por esto, en todo trabajo con pictogramas
las diferencias de magnitudes de los datos se revelan empleando un mayor o menor nmero
de figuras iguales. Las aproximaciones se hacen por fraccin de figura usando mitades e
inclusive cuartas partes de la misma.
Las caractersticas a la que ms atencin deben prestrsele al concebir un pictograma pueden
resumirse en indicar con absoluta claridad en el encabezamiento del pictograma la cantidad
representada por cada figura, las representaciones pictricas se ajustan ms cuando la
informacin se puede presentar en forma difana, los conos deben ser utilizados en arreglos
naturales que no perturben la comprensin del observador, por ejemplo, si se estn
presentando los niveles de produccin de una ensambladora de vehculos automotrices, los
grupos de automviles deben mostrarse en filas horizontales y no apilados en columnas.
Cualquiera que sea el smbolo grfico a emplear debe ser fcil e inequvocamente reconocible, y
tal como se mencion previamente, tienen que ser representativos de aquello a lo que el dato hace
referencia.
FIGURA N 41 PICTOGRAMA DEL COSTO DE PRODUCCIN UNITARIA DE CONDENSADORES TIPO A
EMPRESA TVB (AO 1997)
En la Figura N 41 se ilustra nuevamente lo mostrado en la Figura N 37. En aquel entonces se
comparaba con un costo estndar para que el gerente o supervisor de la lnea de produccin se
percatar o investigar las fluctuaciones en los costos, entre las decisiones posibles podra
incluirse realizar una presentacin a los empleados de la lnea de produccin para
conscientizarlos y motivarlos, en este caso la presentacin en forma de pictograma puede ser ms
efectiva por su capacidad para llamar la atencin.
Formas Graficas de Presentar Informacin Raquel Centeno Silva
115
iv).- Cartogramas
Los cartogramas son representaciones grficas empleadas para mostrar datos estadsticos cuando
por su naturaleza pueden ser clasificados por reas geogrficas. Existen al menos tres
modalidades para presentar los datos de una serie geogrfica en un cartograma, la ms simple de
todas consiste en oscurecer o sombrear las diferentes zonas geogrficas de acuerdo a la magnitud
de las observaciones. Es habitual que cuando se utiliza esta tcnica la intensidad del sombreado
ser proporcional al valor de la serie en la regin respectiva, siendo ms oscuro para las
magnitudes mayores y aclarndose a medida que el valor disminuye.
Una forma similar al sombreado es representar una cierta cantidad o valor por medio de un punto
disponiendo, en cada regin, un nmero de puntos proporcional al valor de la serie en dicha zona.
Es importante destacar que con stas tcnicas puede dificultrsele al observador comparar las
magnitudes para diferentes regiones, si se codifican mediante sombras muchos niveles de valor
diferentes, ser arduo distinguir entre categoras adyacentes en valor, y si se emplean los puntos,
ser especialmente difcil captar el valor para aquellas zonas que exhiban los mismos en
una elevada cantidad relativa al rea dibujada.
Una forma que procura, pero no logra del todo, facilitar las comparaciones es presentando mapas
en los que se inserten barras que denoten la magnitud de la variable medida para cada regin. Sin
embargo, son las nicas viables si se desean presentar sobre un mapa series obtenidas en
diferentes oportunidades, porque podra incluirse una barra por cada ocasin donde se recopilasen
datos. Esta variante permite las comparaciones cronolgicas dentro de cada regin. A
continuacin se muestra un ejemplo que ilustra la densidad poblacional en el pas:
Fuente: http://www.a-venezuela.com/mapas/map/html/densidadpoblacional.html
FIGURA N 42 DENSIDAD POBLACIONAL EN VENEZUELA POR ENTIDAD FEDERAL
116
Para concluir y a manera de sntesis se puede sealar que no existen reglas absolutas para la
construccin de los grficos, ni tampoco puede decidirse de una manera determinstica cual es la
forma de presentacin adecuada para cada situacin en particular, lo visto hasta ahora es un
promotor para estimular su ingenio cuando usted decida elaborar una presentacin grfica.
Adems se pretende haber indicado un conjunto de buenas prcticas y recomendaciones para
construir diagramas simples y efectivos. Las representaciones grficas solo pueden ser evaluadas
una vez realizadas, apoyndose en su capacidad para trasmitir al observador la informacin que al
autor le interesa. Por lo sugestivas y la facilidad de evocacin que logran en la mayora de las
personas, las grficas son un instrumento estadstico de gran utilidad. Los datos que proporcionan
son aproximados y por esto se debe ser cuidadoso en su elaboracin e interpretacin, adems, en
mltiples ocasiones son aplicadas de forma tendenciosa, con o sin intencin; por ello, siempre
que vea un diagrama o una grfica, analcela cuidadosamente tratando de descubrir que pretende
mostrar el autor y si podra estar sesgado presentando una visin parcializada del fenmeno.
b) RESUMEN
En este captulo se discutieron los aspectos ms relevantes acerca de la presentacin grfica de la
informacin, en el se presentaron los elementos que debe contener un buen diagrama y se
particularizaron las tcnicas para construir diagramas de barras, lneas o crculos, como
elementos efectivos para la presentacin y el anlisis estadstico. Adems, se introdujeron los
cartogramas y los pictogramas como herramientas para captar la atencin y mejorar la
presentacin de un reporte; pero con poca rigurosidad estadstica. Se comentaron algunas de las
limitaciones ms importantes de los grficos y los problemas que se presentan al usar
indebidamente los ejes. A pesar de su impacto y utilidad debe recordarse que los grficos no son
sino aproximaciones de los valores cuantitativos debiendo ser, por tanto, un apoyo
complementario y no la base de ningn trabajo estadstico serio. En general le han sido
presentados para su informacin y estudio los aspectos de la estadstica descriptiva que atienen a
la organizacin, clasificacin, presentacin e interpretacin de la informacin, los contenidos
hasta ahora expuestos son la base de todo trabajo estadstico ulterior y, adems, se convierten en
una herramienta til para aplicar en otras reas del conocimiento.
c) EJERCI CI OS PROPUESTOS
1.- Dibuje el diagrama lineal correspondiente a las ventas de un almacn en el semestre enero-
junio de un ao. El reporte de contabilidad fue: enero, Bs. 675.532.000,00; febrero, Bs.
117
563.684.000,00; marzo, 785.322.000,00; abril, Bs. 760.520.000,00; mayo, Bs. 821.230.000,00; y
junio, Bs. 890.410.000,00.
2.- Muestre en un pictograma la serie cronolgica correspondiente a la matrcula de la UNEXPO
en el ltimo quinquenio.
3.- Elabore un diagrama de barras con las exportaciones de esmeraldas de Colombia en el
quinquenio 1991 1995. En millones de dlares FOB: 1991: 142,8; 1992: 179,7; 1993: 399,6;
1994: 422,4; 1995: 452,3.
4.- En una industria el informe de contabilidad muestra que la produccin fue de Bs.
62.600.000,00 y los gastos de: administracin, Bs. 11.160.000,00; materiales y energticos, Bs.
15.650.000,00; salarios y prestaciones, Bs. 18.780.000,00. Elabore a partir de estos datos un
diagrama circular.
5.- El departamento de control de calidad de una fbrica que produce un tipo de tornillo de acero
especial, preocupado por las desviaciones observadas en el producto, realiza un estudio aleatorio
de la produccin de un da midiendo cuidadosamente una muestra. Los resultados obtenidos (en
cm.) son los siguientes: 96, 96, 102, 102, 104, 104, 108, 126, 126, 128, 128, 140, 156, 160, 160,
164 y 170. Construya un diagrama apropiado y justifique su seleccin.
118
AGRADECIMIENTOS
A Rut,
por su paciencia y amor, por el tiempo
que sacrific para el logro de esta meta.
A Manuel Serafin,
compaero incansable, amigo a toda prueba
y apoyo personal. Gracias por estar conmigo
y ser como eres.
119
V. REFERENCIAS BIBLIOGRFICAS
1. Arias, F.G. (1999), El Proyecto de Investigacin: Gua para su Elaboracin. (3ra. ed.)
Caracas: Episteme.
2. Bessant, K., y E. MacPherson (2002), Thoughts on the Origins, Concepts, and Pedagogy of
Statistics as a Separate Discipline. The American Statiscian, Vol. 56, 22-29.
3. Braselton, S. y B. Decker (1994), Understanding graphic organizers to improve the reading
of mathematics. The Reading Teacher, Vol. 48, 276-281.
4. Canavos, G. C. (1987), Probabilidad y Estadstica: Aplicaciones y Mtodos. Mxico:
McGraw-Hill.
5. Castillo, H., y R. Romero (2002), Destrezas Bsicas de Enseanza: El Desempeo Docente
a travs de la Tcnica de la Microenseanza. Caracas: Universidad Central de Venezuela,
Vicerrectorado Acadmico, Sistema de Actualizacin Docente del Profesorado.
6. Chou, Y. (1977), Anlisis Estadstico. Mxico: Interamericana.
7. Coob, G. W. y D. Moore (1997), Mathematics, Statistics, and Teaching. The American
Mathematicat Monthly, Nro. 104, 801-823.
8. Crossley, M. (2000), The Desk Reference of Statistical Quality Methods. Milwaukee, WI:
ASQ Quality Press.
9. Deseda, L. (1988), Mtodos Estadsticos. Caracas: Nueva Expresin.
10. Dietrich, E., y A. Schulze (1999), Statistical Procedures for Machine and Process
Qualification. Milwaukee, WI: ASQ Quality Press.
11. Energy and Transportation Task Force (1996), Energy and Transportation Task Force
Report. [Documento en lnea]. Presidential Council for the Sustainable Development,
Washington, DC.
Disponible: http://clinton4.nara.gov/textonly/PCSD/Publications/TF_Reports/energy-top.html
[Consulta: 2003, Agosto 11].
12. Garfield, J. (2002), The Challenge of Developing Statistical Reasoning. Journal of
Statistics Education [Revista en lnea], Vol. 10(3)
Disponible: www.amstat.org/publications/jse/v10n3/garfield.html
[Consulta: 2003, Mayo 26].
13. Garfield, J., y B. Chance (2000), Assessment in Statistics Education: Issues and
Challenges. Mathematics Thinking and Learning, Vol. 2, 99-125.
14. Ginsburg, H. P. (1977), Childrens Arithmetic. Nueva York: Van Nostrand.
120
15. Gonzlez, H., Meneses, L., Rios C., y M. Fernndez (1983 Reedicin), Estadistica 1:
Mdulos 0,1,2,3 y 4. Caracas: Universidad Nacional Experimental Simn Rodrguez,
Vicerrectorado Acadmico, Programa de Estudios Universitarios Supervisados.
16. Haber, A., y R. Runyon (1972), Estadstica General. Los Angeles, CA: Fondo Educativo
Interamericano.
17. Hald, A. (1990), A History of Probability and Statistics and Their Applications Before
1750. Nueva York: Wiley.
18. Hollis, R. J. (1997), Ideas for Improving Statistics Education. International Journal of
Mathematical Eduaction in Science and Technology, Vol. 28, 569-573.
19. Juran, J., y F. Gryna (1980), Quality Planning and Analysis. (3ra. ed.) Nueva York, NY:
McGraw-Hill.
20. Kettering, J. R. (1997), Shaping Statistics for Success in the 21
st
Century. Journal of the
American Statistical Association, Vol. 92, 1229-1234.
21. Kreysig, E. (1973), Introduccin a la Estadstica Matemtica: Principios y Mtodos.
Mxico: Limusa.
22. Lan, W., Bradley, L. y G. Parr (1993), The Effects of a Self-Monitoring Process on College
Students Learning in a Introductory Statistics Course. Journal of Experimental Education,
Vol. 62, 26-40.
23. Leach, C. (1982), Fundamentos de Estadstica: Enfoque no Parmetrico para Ciencias
Sociales. Mxico: Limusa.
24. Lewes, F. (1986), Where Should We Start?. [Revista en lnea] Teaching Statistics. en The
Best of Teaching Statistics Disponible: http://science.ntu.ac.uk/rsscse/ts/bts/lewes/text.html
[Consulta: 2003, Mayo 26].
25. Lind, D., Mason, R., y W. Marchal (2001), Estadstica para la Administracin y Economa.
(3ra. ed.) Mxico: McGraw-Hill.
26. Lobez, J., y E. Casa (1969), Estadstica Intermedia. Barcelona: Vincens-Vives.
27. Mendenhall, W., y T. Sincich (1997), Probabilidad y Estadstica para Ingeniera y Ciencias.
(4ta. ed.) Mxico: Prentice-Hall Hispanoamericana.
28. Mndez, C. E. (1995), Metodologa: Gua para Elaborar Diseos de Investigacin en
Ciencias Econmicas, Contables y Administrativas. (2da. ed.) Bogot: McGraw-Hill.
29. Miller, I., y J. Freund (1970), Probabilidad y Estadstica para Ingenieros. Mxico: Revert.
121
30. Montgomery, D., y G. Runger (1996), Probabilidad y Estadstica Aplicada a la Ingeniera.
Mxico: McGraw-Hill.
31. Moore, D. (1997), New Pedagogy and New Content: The Case of Statistics. International
Statistical Review, Vol. 65, 123-165.
32. Moore, D. (2000), Undergraduate Programs and the Future of Academic Statistics
[Documento en lnea].
Disponible: http://www.amstat.org/meetings/jsm/2000/usei/undergradFuture.pdf
[Consulta: 2003, Julio 22].
33. Neter, J. y W. Wasserman (1954), Fundamental Statistics for Business and Economics.
Boston: Allyn & Bacon.
34. Newbold, P. (1997), Estadstica para los Negocios y la Economa. (4ta. ed.) Madrid:
Prentice-Hall.
35. Pearson, E. S. (Comp.) (1978), The History of Statistics in the 17th and 18th Centuries:
Against the Changing Background of Intellectual, Scientific, and Religious Thought,
Lectures by Karl Pearson Given at University College London During the Academic Sessions
1921-1933.Londres: Charles Griffin & Company.
36. Portus, L. (1998), Introduccin a la Estadstica. (2da. ed.) Bogot: McGraw-Hill.
37. Proao, H. (1975), Estadstica Aplicada a la Mercadotecnia: Teora y Casos Prcticos.
Mxico: Diana.
38. PSA Peugeot, Citren, Renault (1991), CNOMO Norm E41.36.110.N. Produktionsmittel,
Zulassung der Funktionsfhigkeit von Memitteln, Spezifische Prfmittel.
39. Rice, Marti H. (2002), Statistical analyses: making sense of them in the research report.
Journal of Neuroscience Nursing, Vol. 34, 105-111.
40. Seldmeier, P. (1999), Improving Statistical Reasoning: Theoretical Models and Practical
Implication. Mahwah, NJ: Lawrence Erlbaum.
41. Senge, P., Kleiner, A., Roberts, C., Ross, R., Roth, G., y B. Smith (2000), La Danza del
Cambio: los Retos de Sostener el Impulso en Organizaciones Abiertas al Aprendizaje.
Bogot: Norma.
42. Sirias, D. (2002), Using graphic organizers to improve the teaching of business statistics.
Journal of Education for Busines, Vol. 78, 33-38.
43. Spiegel, M. (1991), Estadstica. (2da. ed.) Mxico: McGraw-Hill.
122
44. Stigler, S. (1986), The History of Statistics: The Measurement of Uncertainty Before 1900.
Cambrige, MA: Belknap Press.
45. Utts, J. (2003), What educated citizens should know about statistics and probability. The
American Statistician, Vol. 57, 74-80.
46. Walpole, R., y R. Myers (1992), Probabilidad y Estadstica. (4ta. ed.) Mxico: McGraw-
Hill.
47. Yamane, T. (1974), Estadstica. (3ra. ed.) Mxico: Harper & Row Latinoamericana.
48. Yule, Y., y M. Kendall (1954), Introduccin a la Estadstica Matemtica. Madrid: Aguilar.