Sie sind auf Seite 1von 132

- 1 -

- 2 -
T TT TABLA DE ABLA DE ABLA DE ABLA DE C CC CONTENIDO ONTENIDO ONTENIDO ONTENIDO


1. Conceptos Preliminares. 1. Conceptos Preliminares. 1. Conceptos Preliminares. 1. Conceptos Preliminares. . .. . P PP Pg. 5 g. 5 g. 5 g. 5

1.1 Introduccin.
1.2 Qu es la Estadstica?
1.3 Tipos de Estadstica.
1.4 Variables en Estadstica.
1.5 Escalas de medicin.
1.6 Ejercicios

2. Encuestas. 2. Encuestas. 2. Encuestas. 2. Encuestas. . .. . P PP Pg. 13 g. 13 g. 13 g. 13

2.1 Qu es una encuesta?
2.2 Preparacin de una encuesta.
2.3 Tipos de Encuestas.
2.4 El Cuestionario.
2.5 Poblaciones y muestras.
2.6 Ejercicios.

3. Tablas y Grficos. 3. Tablas y Grficos. 3. Tablas y Grficos. 3. Tablas y Grficos. . .. . P PP Pg. 20 g. 20 g. 20 g. 20

3.1 Introduccin.
3.2 Tablas y distribuciones de frecuencias.
Tabla para una variable de atributo.
Tabla para una variable discreta.
Tabla para una variable continua.
Tablas para diferentes tipos de frecuencias.
Tablas de doble entrada.
Comentarios acerca del uso de tablas.
3.3 Grficos.
Columnas.
Circular.
Puntos.
Barras.
Histograma.
Polgono de frecuencias.
Tallo y hojas.

- 3 -
Grfico de caja (Boxplot).
Dispersin (Nube de puntos).
Pareto.
Pictogramas.
Perfiles.
Columnas o barras apiladas.
Lneas.
reas.
Columnas en tres dimensiones.
Cotizaciones.
baco de probabilidad.
Comentarios acerca del uso de grficos.
3.4 Ejercicios.

4. Medidas de Centralizacin y Localizacin. 4. Medidas de Centralizacin y Localizacin. 4. Medidas de Centralizacin y Localizacin. 4. Medidas de Centralizacin y Localizacin. . .. . P PP Pg. 54 g. 54 g. 54 g. 54
4.1 Introduccin.
4.2 Media aritmtica.
4.3 Media aritmtica ponderada (W).
4.4 Media geomtrica (G).
4.5 Media armnica (H).
4.6 Error medio cuadrtico (Emc).
4.7 Media potencial (Mp).
4.8 Mediana (Me).
4.9 Cuantiles.
4.10 Moda (M
O
).
4.11 La relacin X XX X > Me > Mo.
4.12 La relacin H < G < X XX X < Q para dos datos.
4.13 La relacin H < G < X XX X < Q para n datos.
4.14 Ejemplos.
4.15 Ejercicios.

5. Medidas de Dispersin. 5. Medidas de Dispersin. 5. Medidas de Dispersin. 5. Medidas de Dispersin. P PP Pg. 105 g. 105 g. 105 g. 105

5.1 Introduccin.
5.2 Recorrido (Re).
5.3 Desviaciones medias.
5.4 Desviacin media.
5.5 Desviacin media respecto a la mediana.
5.6 Desviacin mediana.
5.7 Varianza (S
2
).
5.8 Desviacin estndar (S).
5.9 Coeficiente de variacin media de Pearson (CV
x
).

- 4 -
5.10 Otros Coeficientes de dispersin relativa.
5.11 Coeficiente de variacin mediana.
5.12 Intervalo intercuartlico relativo.
5.13 Desviacin cuartlica relativa.
5.14 Coeficiente de variacin cuartlica.
5.15 Ejemplos.
5.16 Ejercicios.


- 5 -
1 11 1. .. . C CC CONCEPTOS ONCEPTOS ONCEPTOS ONCEPTOS B BB BSICOS SICOS SICOS SICOS

1.1 1.1 1.1 1.1 Introduccin Introduccin Introduccin Introduccin. .. .
En diversos campos de las ciencias sociales y naturales, el mundo de hoy se enfrenta a un
volumen de informacin que cada vez va en aumento y que es necesario manejar gil y
eficientemente. En muchos casos, la estadstica se constituye en una buena alternativa para
hacerlo. Evidentemente, la estadstica est presente en muchas actividades de la vida diaria de
los individuos y por ello se hace necesario que el ciudadano comn y corriente maneje de
manera apropiada ideas y conceptos bsicos del lenguaje estadstico y conozca y comprenda
algo acerca del razonamiento estadstico. Por ejemplo, se requiere que pueda usar las
herramientas bsicas de la estadstica como apoyo para asimilar, criticar y contrastar la
informacin recibida y que adems las pueda aplicar en el campo del saber donde
desarrollar su trabajo.
Algunas veces un anlisis estadstico comienza con un conjunto de datos. Por ejemplo, el
gobierno colecciona y publica con cierta regularidad datos acerca de los porcentajes de
desempleo y de los precios de artculos de consumo bsicos de los ciudadanos. La estadstica
se debe utilizar entonces para resumir y analizar estos datos. Sin embargo, en otras situaciones
no hay datos disponibles, entonces en estos casos la estadstica tambin se puede utilizar
para disear un experimento apropiado para generar datos. El experimento seleccionado
depender del uso que se quiera hacer de los datos. Bien sea que sean generados a partir de
un diseo experimental, o que simplemente estn disponibles o se obtengan de
observaciones naturales no planeadas de manera experimental, los datos finalmente se deben
describir. Para la descripcin de los datos la estadstica proporciona diferentes conceptos y
sistemas de representacin. Las representaciones grficas y los arreglos tabulares son dos
medios muy utilizados para presentar y resumir datos; por otra parte, la localizacin, la
centralidad, la dispersin y la correlacin son, algunas de las nociones y conceptos relevantes
de la estadstica. El uso y aplicacin de estos conceptos y representaciones se suele
acompaar y materializar en la generacin de grficos de distribuciones y el clculo e
interpretacin de medidas de resumen como porcentajes, promedios o desviaciones, todas
ellas, estadsticas que se constituyen en diferentes tipos de descripcin que se pueden calcular
con el fin de caracterizar diversos datos.
1.2 Qu es la Estadstica? 1.2 Qu es la Estadstica? 1.2 Qu es la Estadstica? 1.2 Qu es la Estadstica?
Hay muchas definiciones posibles de estadstica, y una breve revisin de algunas de las dadas
por diferentes personas que han aportado trabajos relevantes a la estadstica pone de
manifiesto el carcter cambiante de su definicin en la historia y por ende de dar una
definicin precisa de ella. En particular, Ross (1996), presenta una seleccin interesante de

- 6 -
algunas definiciones que vale la pena considerar; especficamente, para l la estadstica es el
arte de aprender de los datos y trata con la recoleccin de los datos, su subsiguiente
descripcin y su anlisis, el cual frecuentemente lleva a unas conclusiones
En 1849, Quetelet (1796-1874) consideraba que la estadstica tiene como objetivo presentar
una fiel representacin de un estado en una poca determinada; en esa poca todava
predominaba una visin de la estadstica asociada al manejo del estado o gobierno de un pas.
Para Fisher (1890-1962) en 1925, la estadstica se poda ver como el estudio de poblaciones,
de la variacin, o como el estudio de los mtodos de reduccin de datos; ya al entrar el siglo
20, la concepcin de la visin de la estadstica se ampla en su aplicacin a las ciencias
naturales. Para Pearson (1857-1936), en 1936, la estadstica era una disciplina cientfica que
trataba con la recoleccin, anlisis e interpretacin de datos obtenidos de la observacin o
experimentacin. Esta disciplina tiene una estructura coherente que se fundamenta en la
teora de la probabilidad e incluye muchos diferentes procedimientos que contribuyen a la
investigacin y desarrollo de la ciencia y la tecnologa. W. Weaver (1894-1978) hacia el ao
1952, dijo que estadstica es el nombre para la ciencia y el arte que trata con inferencias
inciertas que utilizan nmeros para conseguir informacin acerca de alguna cosa de la
naturaleza o de la experiencia. Para Porter (1947-), en 1986, la estadstica ha llegado a ser
conocida en el siglo veinte como la herramienta matemtica para el anlisis datos de
experimentos u observaciones.
Sin embargo, siguiendo a Batanero y Godino (2004), dos definiciones que reflejan de manera
ms apropiada una concepcin ms actual del tema son:
"La estadstica estudia el comportamiento de los fenmenos llamados de colectivo. Est
caracterizada por una informacin acerca de un colectivo o universo, lo que constituye su
objeto material; un modo propio de razonamiento, el mtodo estadstico, lo que constituye su
objeto formal y unas previsiones de cara al futuro, lo que implica un ambiente de
incertidumbre, que constituyen su objeto o causa final." (Cabri, 1994).
La estadstica es la ciencia de los datos. Con ms precisin, el objeto de la estadstica es el
razonamiento a partir de datos empricos. La estadstica es una disciplina cientfica autnoma,
que tiene sus mtodos especficos de razonamiento. Aunque es una ciencia matemtica, no es
un subcampo de la Matemtica. Aunque es una disciplina metodolgica, no es una coleccin
de mtodos. (Moore, 1995).
1.3 Tipos de Estadstica. 1.3 Tipos de Estadstica. 1.3 Tipos de Estadstica. 1.3 Tipos de Estadstica.
Es difcil dividir la estadstica en partes separadas, sin embargo, una divisin clsica hasta hace
pocos aos ha sido distinguir entre estadstica descriptiva y estadstica inferencial.
En la estadstica descriptiva estadstica descriptiva estadstica descriptiva estadstica descriptiva se tiene como fin presentar resmenes de un conjunto de datos y
poner de manifiesto sus caractersticas, principalmente mediante representaciones grficas. La
descripcin de datos se usa para fines comparativos, y no suele utilizar principios de
probabilidad. El inters se centra en describir el conjunto de datos y no se plantea el extender
las conclusiones a otros datos diferentes o a una poblacin.

- 7 -
Por el contrario, la inferencia estadstica inferencia estadstica inferencia estadstica inferencia estadstica estudia los resmenes de datos con referencia a un
modelo de tipo probabilstico. Se supone que el conjunto de datos analizados es una muestra
de una poblacin y el inters principal es predecir el comportamiento de la poblacin, a partir
de los resultados de la muestra.
Actualmente, las capacidades de clculo y representacin grfica de los computadores y
tambin de las calculadoras graficadoras posibilitan la obtencin de una amplia variedad de
grficos y clculos estadsticos de una forma sencilla. La tecnologa actual con sus
posibilidades interactivas, favorecen la introduccin, desde los primeros niveles de
enseanza, de la filosofa basada en los estudios estadsticos introducida por Tukey (1977):
el Anlisis Exploratorio de Datos Anlisis Exploratorio de Datos Anlisis Exploratorio de Datos Anlisis Exploratorio de Datos (A. E. D.). Esta ltima es una perspectiva de anlisis
intermedia entre la estadstica descriptiva y la inferencia y le da un papel bien importante a la
visualizacin por medio de diferentes grficos.
Bajo esta filosofa se presta especial atencin al problema de la interpretacin de resultados
y la generacin de hiptesis sobre el problema investigado, a partir de los resultados de los
anlisis iniciales. Adems, esta filosofa no slo se aplica a nivel de estadstica elemental. En
muchos de los mtodos del anlisis de datos multivariantes utilizados actualmente tambin se
aplica esta filosofa, para analizar fenmenos fsicos o sociales complejos (Godino y Batanero,
1994).
1.4 Variables en Estadstica. 1.4 Variables en Estadstica. 1.4 Variables en Estadstica. 1.4 Variables en Estadstica.
La definicin de lo que es una variable y los tipos de variables que se suelen distinguir al
utilizar la estadstica, es uno de los asuntos que debe tener claro un analista de datos. Adems,
en relacin con los tipos de variables es relevante discutir la idea de medicin y las escalas o
niveles en los que se puede de medir una variable. Una variable estadstica variable estadstica variable estadstica variable estadstica es una
caracterstica cuantitativa o cualitativa que se mide o se observa en una poblacin. Para
clasificar las variables en Estadstica es conveniente hacer tres distinciones:
Desde lo continuo y discreto Desde lo continuo y discreto Desde lo continuo y discreto Desde lo continuo y discreto: Se dice que una variable es continua si toma cualquiera de sus
valores en un intervalo de nmeros reales, en la unin de intervalos de nmeros reales o, en
general, en el conjunto de los nmeros reales. Como ejemplo de este tipo de variable se
puede citar la longitud de los tornillos producidos en una fbrica, la estatura de los
estudiantes de una escuela, el tiempo gastado por un estudiante para transcribir una pgina, la
distancia recorrida por un ciclista en una hora, etc. Por otra parte, cuando es posible contar
los valores que puede tomar una variable o sta solo toma valores enteros se dice que la
variable es discreta. Por ejemplo, el nmero de estudiantes por curso de un colegio, el
nmero de hijos de cada uno de los empleados de una empresa, la cantidad de autos
accidentados en cada departamento de Colombia, la cantidad de asignaturas reprobadas por
los estudiantes de un grado particular, etc.
Desde lo cuantitativo y cualitativo Desde lo cuantitativo y cualitativo Desde lo cuantitativo y cualitativo Desde lo cuantitativo y cualitativo: Se dice que una variable es cualitativa cualitativa cualitativa cualitativa, cuando los valores
que toma son atributos o cualidades de los objetos. Por ejemplo: El estado civil induce una
clasificacin natural (soltero, casado, divorciado o separado); los grados o insignias de los
oficiales del ejrcito colombiano permiten hacer un escalafn de acuerdo a la OTAN (General,

- 8 -
Mayor general, Brigadier general, Coronel, Teniente coronel, Mayor, Capitn, Teniente y
Subteniente); el NIT de las instituciones de educacin superior en Colombia; El nombre de las
diferentes dependencias u oficinas de una universidad, etc. En contraste, se dice que una
variable es cuantitativa cuantitativa cuantitativa cuantitativa, , , , cuando los valores que toma son numricos y representan cantidades
con las que se pueden realizar operaciones y comparaciones. Por ejemplo: la estatura de los
estudiantes de una escuela, el peso de los nios que ingresan a una clnica peditrica, el
salario de los docentes del distrito, la cantidad de docentes de planta de las diferentes
universidades colombianas, etc.
Desde lo determinsti Desde lo determinsti Desde lo determinsti Desde lo determinstico y aleatorio co y aleatorio co y aleatorio co y aleatorio: :: : Una variable es deterministica deterministica deterministica deterministica si su valor corresponde al
resultado o salida de un proceso o experimento determinstico y es singularmente
determinado por una entrada dada. Estn ligadas a las funciones y frmulas usadas en las
diferentes reas del conocimiento. Por ejemplo: El volumen de una esfera dada, la velocidad
de una partcula que recorre una distancia d en un tiempo t, el determinante de una matriz de
tamao 2x2, la distancia recorrida por una pelota de bisbol lanzada a una velocidad inicial v
con un ngulo de inclinacin de 45, las races de una ecuacin cuadrtica dada, etc. Una
variable es aleatoria aleatoria aleatoria aleatoria cuando sus resultados estn asociados a experimentos aleatorios o
procesos en donde los resultados son impredecibles. Formalmente son funciones cuyo
dominio es el conjunto de los posibles resultados de un experimento aleatorio o
probabilstico y cuyo rango es un conjunto de nmeros reales, a su vez se clasifican en
discretas, continuas y conjuntas. Por ejemplo: Cantidad de aciertos en un test de 20 preguntas
de seleccin mltiple, la suma de los puntos resultantes cuando se lanzan cuatro dados
distinguibles, la cantidad de sellos que aparecen cuando se lanzan tres monedas distinguibles,
la cantidad de personas que se deben examinar para encontrar cuatro donantes con sangre A
Rh positivo, la cantidad de taxis que pasarn por la interseccin de dos avenidas entre las 4:00
pm y las 6:00 pm de un da determinado, etc.
1.5 Escalas de medicin. 1.5 Escalas de medicin. 1.5 Escalas de medicin. 1.5 Escalas de medicin.

En cuanto a los niveles o escalas en que se puede medir una variable se har mencin a
cuatro niveles: nominal, ordinal, de intervalo y de razn.
Nivel de medicin Nivel de medicin Nivel de medicin Nivel de medicin nominal nominal nominal nominal: :: : Es aquel en el que slo se puede manifestar una relacin de
pertenencia a las categoras o valores que puede asumir la variable. Se debe sealar que entre
los valores de una variable de tipo nominal, no se puede establecer ninguna jerarqua, no se
puede trazar ningn ordenamiento. Por ejemplo: el tipo de sangre de los empleados de una
empresa (A, AB, B, O), el credo religioso de los gerentes de las empresas privadas del
continente (Cristianismo, Taoismo, Budismo, Induismo, Islamismo, Judaismo,
Zoroastrianismo, Confucionismo, Shintoismo, Jainismo, Sikhismo), el cereal cultivado en las
diferentes regiones del pas (trigo, maz, centeno, sorgo, cebada, avena, arroz, amaranto, mijo,
quinua, etc.), el nmero de documento de identidad de los nuevos graduados de una
universidad, etc.

- 9 -
Nivel de medicin Nivel de medicin Nivel de medicin Nivel de medicin ordinal ordinal ordinal ordinal: :: : En este se distinguen los diferentes valores de la variable
jerarquizndolos simplemente de acuerdo a un rango. Se establece que existe una gradacin
entre uno y otro valor de la escala, de tal modo que cualquiera de ellos es mayor que el
precedente y menor que el que le sigue. Sin embargo, la distancia entre un valor y otro no
queda definida sino que es indeterminada. Por ejemplo: la posicin de los competidores al
finalizar una carrera automovilstica (Primero, segundo, tercero, cuarto, etc.), el estrato
socioeconmico de los deportistas de la ciudad (uno, dos, tres, etc.), el mximo nivel de
formacin acadmica alcanzado por los artistas colombianos (primaria, bachillerato, tcnico,
tecnlogo, profesional, especialista, magster, doctorado, postdoctorado).
Nivel de medicin de Nivel de medicin de Nivel de medicin de Nivel de medicin de intervalo intervalo intervalo intervalo: :: : Es aquel en el que adems de poseerse la equivalencia de
categoras y el ordenamiento interno entre ellas, se tiene la caracterstica de que la distancia
entre dos resultados cualesquiera est claramente determinada. La diferencia entre dos
mediciones tiene sentido y permite comparar las unidades estudiadas. Ejemplos tpicos de
medicin a nivel de intervalo son las escalas termomtricas, la temperatura de una persona, el
nivel del aceite del motor de un automvil medido con una varilla graduada, sobrepeso de las
personas que asisten a un gimnasio con respecto a una tabla de medidas internacionales, etc.
Nivel de medicin de Nivel de medicin de Nivel de medicin de Nivel de medicin de razn razn razn razn: Se caracteriza por conservar las propiedades de los casos
anteriores pero adems se le aade la existencia de un valor cero que tenga un sentido real,
con lo que se hacen posibles ciertas operaciones matemticas. El cociente entre dos
mediciones tiene un significado interpretable en funcin de una proporcin o razn entre las
dos magnitudes. Esto quiere decir que un valor de 20 en una escala de este tipo es el doble de
un valor de 10, o de las dos terceras partes de un valor de 30. Ejemplos de variables medidas
en este nivel son la longitud, la masa, la intensidad de corriente elctrica, cantidad de litros
diarios de agua que consumen los deportistas que asisten a los juegos olmpicos, la cantidad
de goles anotados por los delanteros de los equipos profesionales del ftbol colombiano, etc.
.
.
.
.
.
.
.
.
.
.
.

- 10 -
1.6 1.6 1.6 1.6 Ejercicios. Ejercicios. Ejercicios. Ejercicios.
1. Observe cuidadosamente el siguiente diagrama y sugiera una interpretacin del mismo
para proponer una definicin de lo que significa estadstica.
SISTEMA ORDENADO DE REGLAS Y PRINCIPIOS
PUBLICAR
PARA PARA PARA
OBSERVAR RECOLECTAR ORGANIZAR DESCRIBIR
PARA PARA PARA PARA
ANALIZAR INTERPRETAR
CONTROLAR EVALUAR
UNA SERIE DE HECHOS CON EL FIN DE:
ESTADISTICA
PLANEAR DECIDIR DIRIGIR COORDINAR EJECUTAR

2. De qu forma, desde su quehacer diario, puede utilizar la Estadstica? D su respuesta en
trminos del diagrama.
3. Qu uso ha observado que tiene la estadstica en la informacin que suministra la prensa
escrita? Cmo considera este uso?
4. Por qu cree que es importante que un estudiante de educacin bsica y educacin
media tenga conocimientos de estadstica?
5. Una variable continua se puede considerar que es una variable cualitativa? Explique.
6. Un experimento aleatorio consiste en lanzar 5 monedas de la misma nominacin pero
distinguibles, y anotar la figura resultante en cada una de ellas (cara o Sello). Elabore una
lista con los posibles resultados. Elabore una tabla para la funcin X o variable aleatoria X
definida como el nmero Caras resultantes.
7. Un experimento aleatorio consiste en lanzar 5 dados normales distinguibles, y anotar los
nmeros resultantes en la cara superior de cada uno de ellos. Elabore una tabla para la
funcin X o variable aleatoria X definida como la suma resultante. Elabore una tabla para
la funcin Y o variable aleatoria Y definida como la cantidad de 5 resultantes.
8. De un grupo de 5 deportistas, entre los cuales hay 3 beisbolistas y 2 ciclistas, se eligen al
azar 3 de ellos y se anotan sus nombres. Elabore una lista de las posibles elecciones o
selecciones. Elabore una tabla para la variable aleatoria X definida como el nmero de
beisbolistas que resulta en una seleccin.
9. Un experimento consiste en lanzar un dado dos veces y anotar la pareja de nmeros (X,Y),
donde X es la cantidad de pares que resultan en el primer lanzamiento, Y es la cantidad de
pares entre los dos lanzamiento. Escriba la poblacin de posibles parejas resultantes.
10. Un experimento consiste en lanzar cinco monedas distinguibles y anotar el resultado que
aparece en la cara visible de cada moneda. Las monedas no tienen Caras y Sellos, sino

- 11 -
Cuatros y Cincos. Escriba la poblacin de posibles resultados y las posibles sumas
resultantes.
11. En un campeonato de ajedrez participan ocho jugadores: Lasker, Alekhine, Capablanca,
Botvinnik, Fischer, Spaski, Krpov, Kasprov. Determine la poblacin de posibles partidos
que deben realizarse, en cada una de las siguientes metodologas de eliminatoria: (a)
Juegan todos contra todos un solo partido. (b) Juegan todos contra todos dos partidos:
uno con fichas blancas y otro con negras. (c) Se juegan 4 partidos en la primera ronda y se
eliminan cuatro, luego se juegan dos partidos en la segunda ronda y se eliminan dos, y en
la tercera ronda se define el campen.
12. Interprete la siguiente representacin acerca de las escalas de medicin.

Razn Cero absoluto
Intervalo Distancia
Ordinal Relacin de orden
Nominal Relacin de identidad

13. Clasifique las siguientes variables segn su tipo y nivel de medicin.
a) Nmero de estafilococos por mililitro.
b) Nmero de habitantes por kilmetro cuadrado.
c) Nmero de ciruelas por rbol.
d) Duracin de cierta marca de tubos fluorescentes.
14. D otros ejemplos de variables que se puedan ubicar en cada una de las escalas de
medicin consideradas en este captulo.
15. Discutir y establecer el nivel de medicin de los siguientes casos:
a) Clases de bacterias en una muestra de agua contaminada.
b) Latitud de una ciudad.
c) Rango militar en el ejrcito colombiano.
d) Intensidad de corriente elctrica.
e) Densidad de diferentes muestras de un mismo lquido.
f) Tamao de gaseosa que se vende en restaurantes de comida rpida.
g) Velocidad de un automvil al pasar por la calle 100 con 7.
h) Salario mensual de los profesores de cierta universidad.
i) Tiempo de duracin de cierta marca de tubos fluorescente.
j) Estrato socio-econmico indicado en el recibo de energa.

- 12 -
k) Temperatura de Bogot a las 12 meridiano.
l) Ubicacin temporal de un acontecimiento histrico.
m) Tipos de productos enlatados para la alimentacin.
n) Altitud de ciudades de Colombia.
o) Nmero telefnico de los estudiantes de Estadstica.
p) Primer beneficiario de una pliza de seguros.
q) Da de la semana en la que ms estudia un estudiante.
r) Talla de calzado que utiliza un estudiante.
s) Grado de escolaridad de un trabajador.
t) Hora GMT.
u) Medicin de un taxmetro.
v) Sintona de un programa de televisin.
w) ndice de masa corporal.
x) Magnitud de los terremotos ocurridos en los ltimos cinco aos.
y) Intensidad del sonido de los instrumentos musicales.
z) Puntaje obtenido en un Test de medicin de CI.



















- 13 -
2. 2. 2. 2. E EE ENCUESTAS NCUESTAS NCUESTAS NCUESTAS

2.1 Qu es una encuesta? 2.1 Qu es una encuesta? 2.1 Qu es una encuesta? 2.1 Qu es una encuesta?
Para Garca Ferrando (1986) todo fenmeno social puede ser estudiado a travs de las
encuestas. Para l la encuesta es una investigacin realizada sobre una muestra representativa
de sujetos pertenecientes a un colectivo ms amplio que utiliza procedimientos
estandarizados de interrogacin con el propsito de obtener mediciones cuantitativas de una
gran variedad de caractersticas objetivas y subjetivas de una poblacin.
La encuesta es una de las escasas tcnicas de que se dispone para el estudio de las actitudes,
valores, creencias y motivos. Las tcnicas de encuestas se adaptan a todo tipo de informacin
y a cualquier poblacin. Adems, las encuestas permiten recuperar informacin sobre sucesos
acontecidos a los entrevistados y estandarizar los datos para un anlisis posterior, obteniendo
gran cantidad de datos a un precio bajo y en un periodo corto.
Por su parte Martnez Bencardino (2005, p. 45) afirma que la encuesta es una investigacin
estadstica parcial cuando se limita a recoger datos numricos y deja de serlo cuando se
restringe a anotaciones literarias. Adems, menciona como ejemplo de ellas a algunas
publicaciones que suelen organizar peridicos y revistas, donde critica que algunas son
estudios que no se someten verdaderamente a un recuento o elaboracin estadstica.
Sierra Bravo (1983) destaca como caractersticas de una encuesta los siguientes aspectos:
No es una observacin directa de los hechos, sino que se basa en lo que manifiestan los
interesados.
Es un mtodo preparado para la investigacin.
Permite una aplicacin masiva que mediante un sistema de muestreo puede extenderse a
una nacin entera.
Hace posible que la investigacin social pueda abordar el estudio de aspectos subjetivos
de los miembros de la sociedad.
Ejemplos de encuestas que se citan con frecuencia son las encuestas sobre ingresos y gastos,
o las encuestas sobre problemas sociales que se llevan a cabo en casi todos los pases del
mundo. En particular la sociologa emplea con frecuencia la observacin a travs de
encuestas.
Se supone que las encuestas, cuando son aplicadas con base en mtodos de muestreo,
aportan muestras representativas de un colectivo en estudio. Por ello, es ventajoso aplicar
encuestas por razones como cuando la poblacin es muy grande, por motivos econmicos,
por falta de personal adecuado, por motivos de calidad de los resultados, o bien para mayor
rapidez en recoger datos y presentar resultados. Sin embargo, las encuestas tambin
presentan algunas limitaciones.

- 14 -
2.2 Preparacin de una encuesta. 2.2 Preparacin de una encuesta. 2.2 Preparacin de una encuesta. 2.2 Preparacin de una encuesta.
La preparacin de una encuesta conlleva la realizacin de una serie de pasos y la utilizacin
recursos econmicos y humanos. En trminos muy generales la elaboracin y aplicacin de
una encuesta requiere de la definicin de un proyecto, de la formulacin del cuestionario, del
trabajo de campo y del procesamiento de la informacin recolectada.
En la definicin de un proyecto se suele contemplar la formulacin del problema de
investigacin, la concrecin de los objetivos del estudio, la definicin y delimitacin de las
variables a considerar, el diseo de muestreo y la determinacin del marco muestral y el
presupuesto de tiempo y de gastos de aplicacin y procesamiento de la informacin.
La formulacin del cuestionario, por su parte, implica su diseo, la aplicacin de una prueba
piloto y la aplicacin a la muestra definitiva. En cuanto al trabajo de campo, es de especial
importancia la seleccin y preparacin de los entrevistadores para una apropiada obtencin
de los datos.
El paso final del proceso de aplicacin de una encuesta es el procesamiento de la
informacin. En esta etapa es relevante la codificacin de informacin, la produccin de
grficas y tablas y el clculo de estadsticas, para la presentacin y elaboracin de un informe
de los resultados encontrados.
2.3 Tipos de Encuestas. 2.3 Tipos de Encuestas. 2.3 Tipos de Encuestas. 2.3 Tipos de Encuestas.
Los tipos de encuestas que se pueden mencionar dependen de diversos aspectos. Por
ejemplo, se puede hablar de encuestas privadas o pblicas de acuerdo al organismo que las
aplique. Tambin se habla de encuestas exhaustivas, cuando se aplican a todo el colectivo,
universo o poblacin, como es el caso bien conocido de los censos; o encuestas parciales
cuando se aplican a una muestra, como el caso de la Encuesta Nacional de Hogares.
Las encuestas privadas son frecuentes en muchos pases en donde existe una inclinacin
grande entre el pblico a dar repuestas a las preguntas formuladas en ellas. Sin embargo, este
tipo de encuesta es quizs menos frecuente en los pases latinos. La prensa tambin las utiliza
con el propsito de medir la opinin o para hacer publicidad, y las entidades cientficas de
carcter privado tambin las utilizan para sus investigaciones.
Otra distincin que se hace es entre encuestas directas e indirectas. Son del primer caso,
cuando la unidad estadstica se observa a travs de la investigacin propuesta registrndose
en el cuestionario, como en el caso de un formulario de admisin; y son de tipo indirecto,
cuando los datos obtenidos no corresponden al objetivo principal de la encuesta
pretendiendo en realidad averiguar algo distinto, o bien cuando los resultados son deducidos
de anteriores investigaciones, caso tpico, de los cuestionario de entrevistas de empleo.
Las encuestas tambin pueden ser acerca de hechos, cuando lo que se pretende es averiguar
lo que el pblico en general piensa acerca de una determinada materia o sobre
acontecimientos ya ocurridos, como por ejemplo la conformidad de la gente con la firma de
un tratado de libre comercio. En contraste con las anteriores estn las encuestas de opinin,
que se dan cuando lo que se pretende es averiguar lo que el pblico considera debe hacerse
en una circunstancia concreta, caso tpico de las encuestas sobre intencin de voto.

- 15 -
2.4 El Cuestionario. 2.4 El Cuestionario. 2.4 El Cuestionario. 2.4 El Cuestionario.
Una parte fundamental de una encuesta lo constituye el instrumento con base en el que se
recolecta la informacin, es decir, el cuestionario. Un cuestionario bsicamente es un
conjunto de preguntas sobre los hechos o aspectos que interesan en una investigacin y que
son contestadas por los encuestados.
Los cuestionarios pueden ser de diversos tipos o estilos. Estn, por ejemplo, los cuestionarios
individuales donde el encuestado contesta de forma individual por escrito sin que intervenga
el encuestador y se suelen presentar en forma de boletn o cuadernillo. Por otro lado, el
llamado cuestionario lista se utiliza cuando se interroga al encuestado en una entrevista por
uno de los especialistas de la investigacin. El especialista anota en una matriz las respuestas,
en donde cada columna se reserva para cada pregunta y cada fila para un encuestado.
Otro tipo de cuestionario es el sociomtrico, donde se proponen preguntas que tienen
atribuido un valor numrico que permite cuantificar los resultados y medir alguna capacidad o
cualidad del encuestado. Un ejemplo bien conocido de este tipo de cuestionario es el del
cociente intelectual. Tambin tiene afinidad con este tipo de cuestionario las pruebas
psicomtricas aplicadas por algunos psiclogos.
En cuanto al diseo y tipos de preguntas que se pueden formular en un cuestionario hay
varios aspectos que es conveniente tener en cuenta. Respecto al diseo de preguntas, en
general se recomienda que las preguntas sean cerradas y que se formulacin lleve a opciones
que sean excluyentes, es decir, que no se puedan elegir dos respuestas para la misma
pregunta; igualmente, se sugiere que las respuestas sean exhaustivas, es decir, que
contemplen todas las posibilidades para que no se deje de responder a la pregunta.
La clasificacin del tipo o variedad de preguntas que se pueden formular en un cuestionario
se puede organizar de acuerdo a diferentes criterios. Quizs la distincin ms conocida es la
que se refiere al tipo de contestacin que se busca. As, se habla entonces de preguntas preguntas preguntas preguntas
abiertas abiertas abiertas abiertas, que recogen la respuesta en palabras del encuestado; y de preguntas cerradas preguntas cerradas preguntas cerradas preguntas cerradas en las
que se plantean las opciones de cada pregunta en forma dicotmica o politmica.
Sin embargo, el tipo de preguntas tambin se puede organizar de acuerdo a la clase de
contenido que se pretende conseguir. Desde esta perspectiva se habla entonces de preguntas preguntas preguntas preguntas
de identificacin de identificacin de identificacin de identificacin, por ejemplo se proponen preguntas acerca de la edad, el gnero, la
profesin y/o la nacionalidad del encuestado. Tambin hay preguntas de hechos preguntas de hechos preguntas de hechos preguntas de hechos, en las que
se interroga al encuestado acerca de acontecimientos concretos, por ejemplo, se le pregunta
al encuestado si tiene casa. Las llamadas preguntas preguntas preguntas preguntas de accin de accin de accin de accin, se pueden referir acerca de
actividades realizadas por el encuestado, por ejemplo, utiliz transmilenio la semana pasada?
Otro tipo de preguntas son las preguntas de informacin preguntas de informacin preguntas de informacin preguntas de informacin, con ellas se busca indagar acerca de
conocimientos del encuestado, por ejemplo, sabe qu es el SIDA? Las preguntas de intencin preguntas de intencin preguntas de intencin preguntas de intencin
buscan conocer intenciones especficas del encuestado, por ejemplo, va a viajar en las
prximas vacaciones? Y finalmente, estn las preguntas de opinin preguntas de opinin preguntas de opinin preguntas de opinin que son preguntas del
estilo est de acuerdo con la reeleccin del presidente?
Una tercera manera de organizar la clasificacin del tipo de preguntas se puede proponer en
funcin del papel que desempeen en un cuestionario. Algunas preguntas de este tipo son:

- 16 -
Preguntas filtro Preguntas filtro Preguntas filtro Preguntas filtro. Son preguntas que se realizan previamente a otras para eliminar a los que
no les afecte. Por ejemplo, tiene auto? piensa comprar auto? qu modelo de auto tiene?
etctera.
Preguntas de control Preguntas de control Preguntas de control Preguntas de control. Son preguntas que se formulan para descubrir la intencin con que
se responde, aqu se incluyen respuestas contradictorias.
Preguntas de introduccin o rompehielos Preguntas de introduccin o rompehielos Preguntas de introduccin o rompehielos Preguntas de introduccin o rompehielos. Este tipo de preguntas se utiliza para iniciar un
cuestionario o para enlazar temas.
Preguntas muelles o colchn Preguntas muelles o colchn Preguntas muelles o colchn Preguntas muelles o colchn. Este tipo de preguntas se propone cuando se quiere abordar
temas peligrosos o difciles de formular suavemente.
Preguntas en batera Preguntas en batera Preguntas en batera Preguntas en batera. Son preguntas, que vienen encadenadas y que se complementan
entre s.
Preguntas embudo Preguntas embudo Preguntas embudo Preguntas embudo. Se utiliza esta tcnica cuando se empieza por cuestiones generales
hasta llegar a los puntos esenciales.
Para finalizar este apartado se enuncian una serie de sugerencias a tener en cuenta cuando se
disea un cuestionario: formule pocas preguntas, los cuestionarios con demasiadas preguntas
agotan al encuestado e incluso, lo pueden indisponer; en general es preferible formular
preguntas cerradas y numricas, las preguntas abiertas exigen un mayor trabajo de anlisis y
validaciones externas de su interpretacin; utilice un lenguaje sencillo; formule preguntas
concretas y precisas; evite el uso de palabras abstractas y ambiguas; son preferibles las
preguntas cortas; en lo posible, evite la formulacin de preguntas que contengan sesgos, las
preguntas se deben formular de forma neutral; evite la formulacin de preguntas que
impliquen: esfuerzos memorsticos, consulta de archivos, realizacin de clculos numricos
complicados, que sean indiscretas, generen prejuicios en los encuestados o que condicionen
o conlleven una carga emocional grande; se debe procurar que la redaccin de las preguntas
se haga de forma personal y directa, buscando que la respuesta sea directa e inequvoca y
limitada a una sola idea o referencia.
2.5 Poblaciones y muestras. 2.5 Poblaciones y muestras. 2.5 Poblaciones y muestras. 2.5 Poblaciones y muestras.
Aunque en este libro no se consideran mtodos de inferencia estadstica, como las pruebas de
hiptesis o los intervalos de confianza, es relevante establecer la diferencia y los matices que
hay respecto a los conceptos de poblacin y muestra. Se dedicar este apartado a precisar
algunas ideas al respecto.
La poblacin poblacin poblacin poblacin de una investigacin, o simplemente la poblacin de estudio de estudio de estudio de estudio, se define como el
conjunto de todos los entes a los cuales se pueden aplicar las conclusiones obtenidas a travs
de la prediccin, estimacin, o verificacin de una hiptesis, acciones stas realizadas como
parte final de la investigacin. Por otra parte, La poblacin de datos poblacin de datos poblacin de datos poblacin de datos o simplemente la
poblacin poblacin poblacin poblacin se define como el conjunto de todas las mediciones que es posible obtener a partir
de observar una cierta caracterstica en cada uno de los elementos de la poblacin de estudio.
En cuanto a la idea de muestra, se dice que una muestra de estudio es cualquier subconjunto
no vaco de la poblacin de estudio, y de manera similar, a la distincin hecha antes, se
considera que una muestra de datos es cualquier subconjunto no vaco de la poblacin de
datos.

- 17 -
2.6 2.6 2.6 2.6 Ejercicios. Ejercicios. Ejercicios. Ejercicios.
1. Defina un problema sencillo de investigacin que se pueda abordar por medio de
encuestas. Asociado al problema formulado, explicite una o varias hiptesis, unos
objetivos a realizar por medio de una encuesta, una propuesta de cuestionario y las
unidades o variables estadsticas a tener en cuenta. Procure que el cuestionario contenga
variables que utilicen diferentes niveles de medicin y diferentes tipos de preguntas con
sus respectivas opciones de respuesta para el caso de preguntas cerradas.
2. En las grandes ciudades del pas, durante la ltima dcada, el nmero de padres de familia
separados se ha incrementado sustancialmente, trayendo esto como consecuencia
dificultades en el desarrollo emocional y mental de sus hijos. El Instituto Colombiano de
Bienestar Familiar (ICBF) preocupado por el problema social que genera esa circunstancia
contrat con la Universidad Pedaggica Nacional el primer semestre del ao 2009 un
estudio en Bogot para detectar posibles causas de la separacin de las parejas con hijos.
El grupo de investigadores de la Universidad aplic una encuesta a 36 parejas que quieren
seguir juntas y a 30 parejas que estn pensando en separarse, todas con hijos. El
contenido de la encuesta se presenta a continuacin:
1) Tipo de unin: Religiosa ___ Civil ___ Libre ___
2) Quieren separarse: S ___ No ____
3) La situacin econmica del hogar ha originado conflictos: S ___ No ___
4) Califique en una escala de 1 a 5 la tolerancia que tienen como pareja ___
5) Entre semana, cunto tiempo diario promedio comparten en pareja?
(No incluya el tiempo de sueo) ________
a. Defina en sus palabras el problema de estudio.
b. Establezca la poblacin de estudio. Determine el objetivo del estudio.
c. Determine cules son las variables que se consideran en el estudio y cules de ellas
estratifican la poblacin. De qu tipo son las variables?
d. Cuntas muestras de estudio hay? Cuntas muestras de datos hay? Mencinelas.
3. El PNDM (Plan Nacional para el Desarrollo de la Microempresa) desde su inicio atiende
fundamentalmente empresas de los sectores econmicos de manufactura, comercio y
servicios. Las empresas objeto de atencin del PNDM son aquellas que tienen hasta 10
trabajadores en el caso de la manufactura, y hasta 5 en los casos de comercio y servicios.
En el ao 2003 el Banco Mundial poda desembolsar un prstamo de 50.000 millones de
pesos para la financiacin del PNDM, sin embargo, ese prstamo estaba condicionado a la
justificacin que la entidad diera con relacin a las necesidades de capital de trabajo de las
microempresas cobijadas. En consecuencia, la Direccin del PNDM se dispona a
establecer esas necesidades y para ello dise una encuesta que deba aplicar a una
muestra estratificada por sector econmico y ubicacin geogrfica de las microempresas.
La Direccin posea informacin de segunda mano sobre la distribucin del nmero de
microempresas en todo el pas, discriminada por las dos variables de estratificacin. Esta
se presenta en el siguiente cuadro.

- 18 -


a) Defina en sus palabras el problema de estudio y precise cual es el objetivo general del
estudio.
b) Establezca la poblacin de estudio.
c) Identifique las variables involucradas en la situacin y las poblaciones de datos que
ellas generan.
d) Explique cmo se obtiene de la misma informacin de la tabla los porcentajes de filas
y columnas.
e) Por motivos de presupuesto, los directivos del PNDM decidieron que el tamao
mximo de muestra fuera 2.000. Cmo conformara tal muestra de manera que la
poblacin est proporcionalmente representada en ella?
4. Para conocer la opinin de los bogotanos acerca del desempeo del entonces presidente
de Colombia, un grupo de politlogos llev a cabo en Bogot, en febrero de 2006, varias
encuestas en las que se peda calificar de 1 a 5 el desempeo del presidente, teniendo en
cuenta el manejo de tres asuntos:
Manejo de la poltica exterior,
Manejo del problema del narcotrfico y
Manejo de la economa colombiana.
Para realizar la encuesta se dividi la poblacin por estratos teniendo en cuenta el nivel
socioeconmico y el sexo. En total se encuest a 200 personas; las del estrato bajo fueron
seleccionadas en el barrio Meisen, las del estrato medio se seleccionaron en el barrio
Miranda y las del estrato alto en el barrio Santa Brbara.

- 19 -
En la tabla siguiente aparecen tabulados los resultados de la encuesta para la calificacin
del manejo del problema del narcotrfico, discriminados segn nivel socioeconmico y
sexo:
Estrato alto Estrato alto Estrato alto Estrato alto Estrato medio Estrato medio Estrato medio Estrato medio Estrato bajo Estrato bajo Estrato bajo Estrato bajo
Calificacin Calificacin Calificacin Calificacin 1 2 3 4 5 1 2 3 4 5 1 2 3 4 5
Hombres Hombres Hombres Hombres 1 2 1 7 9 10 3 15 10 2 20 5 20 10 5
Mujeres Mujeres Mujeres Mujeres 0 2 3 4 4 0 5 8 8 5 13 5 10 5 8

a) Identifique las poblaciones y muestras de estudio y de datos.
b) Para la divisin de la poblacin por estratos y para la calificacin del desempeo del
Presidente se consideraron varias variables. Cules fueron esas variables y de qu tipo
son?
c) En la muestra, cul es la proporcin de personas de estrato alto que calificaron el
manejo del narcotrfico con una nota de 4 5? Comprela con la proporcin de
personas de estrato bajo, que tambin calificaron el mismo aspecto con una nota de 4
5. Qu se puede concluir?
5. Durante los primeros tres meses del ao pasado, casi a diario, los habitantes de los
municipios de Cha, Cajic y Cota han visto levantarse columnas de humo en diferentes
zonas de sus montaas colindantes con el consiguiente prdida de madera quemada de
rboles de pino, vegetacin nativa, matorrales y pastos que se chamuscan bajo el fuego.
La Oficina de Prevencin de Emergencias, el Cuerpo de Bomberos, la Defensa Civil, el
Ejrcito Nacional, y la Polica, han visto reflejada esta situacin en los datos de registro y
reconocimiento de su Cuerpo de Bomberos, los cuales muestran la dimensin del
problema ecolgico a que se han visto abocados los municipios. Puesto que el gobierno
nacional debe prever el suministro anual de recursos para atender emergencias, quiere
analizar la situacin tal como se ha presentado en el primer trimestre del ao pasado,
aceptando que eso representa una muestra de lo que puede ocurrir durante el prximo
ao. La siguiente tabla presenta los incendios ocurridos en esos meses.

Incendios forestales presentados durante Incendios forestales presentados durante Incendios forestales presentados durante Incendios forestales presentados durante
el primer trimestre del ao pasado el primer trimestre del ao pasado el primer trimestre del ao pasado el primer trimestre del ao pasado
Ubicacin geogrfica Ubicacin geogrfica Ubicacin geogrfica Ubicacin geogrfica Tipo de incendio Tipo de incendio Tipo de incendio Tipo de incendio
Menor magnitud De gran magnitud
Cerros al oriente de Cota 30 9
Cerros al oriente de Cajic 38 4
Cerros al occidente de Cha 58 6

a) Defina en sus palabras el problema e identifique el objetivo del estudio.
b) Cules son las variables relevantes del estudio? Determine los valores que pueden
asumir dichas variables y de qu tipo son ellas.
c) Identifique la poblacin de estudio. Identifique la muestra de estudio, y las muestras
de datos.
d) Con base en la tabla anterior: Qu representa la cifra 58? Cuntos incendios han
ocurrido?

- 20 -
3 33 3. .. . T TT TABLAS Y ABLAS Y ABLAS Y ABLAS Y G GG GRFICOS RFICOS RFICOS RFICOS

3.1 Introduccin. 3.1 Introduccin. 3.1 Introduccin. 3.1 Introduccin.
La recopilacin de informacin es de gran importancia para analizar fenmenos o
comportamientos en los campos educativo, social, econmico, cientfico y poltico, entre
otros. Igualmente es clave que los resultados numricos de cualquier estudio se presenten de
manera clara y concisa, de tal forma que la persona que lea la informacin obtenga
rpidamente una sensacin apropiada en torno a las caractersticas esenciales de los datos. Lo
anterior es particularmente necesario cuando el conjunto de datos es muy grande. En
realidad, una presentacin efectiva de los datos usualmente revela caractersticas importantes
tales como su rango de variacin, el grado de simetra, qu tan concentrados o dispersos estn
los datos, en dnde se concentra la mayor parte de los datos, etctera. En este captulo se
presentan algunas tcnicas para graficar y tabular datos.
La manera de recopilar datos y presentar la informacin obtenida, de algn colectivo a
estudiar, es una de las actividades que se desarrollan en el trabajo estadstico y como parte de
esta labor es muy importante la forma en que los datos se organizan para su descripcin,
anlisis, interpretacin y publicacin. Hay dos maneras bsicas de presentar los datos que son
de uso cotidiano en la estadstica: las tablas y las grficas. Es con base en estas dos formas que
se pueden presentar y destacar diversas ideas que se desean expresar acerca de una
informacin recopilada en forma de datos.
En este captulo se har una descripcin de varias formas de organizar datos en forma de
tablas, as como de presentar estos datos en diversas formas de representacin grfica.
Adems se dar cuenta de algunas caractersticas relevantes de la elaboracin de tablas y
grficas de datos y distribuciones de frecuencias. Por ejemplo veremos, que el tipo de variable
considerada en un anlisis de datos, se relaciona e influye en la apropiada eleccin de la
organizacin y presentacin de los datos.
En la presentacin se hablar de tres tipos de variables: en primer lugar, de variables
categricas o de atributos haciendo referencia a variables que pueden ubicarse en un nivel de
medicin nominal u ordinal, es decir, no numrico; en segundo lugar, de variables discretas
para hacer referencia a las que corresponden a mediciones ordinales codificadas en forma
numrica, o a las que provienen de conteos naturales sobre variables numricas; y finalmente,
de variables continuas para referirse a aquellas que se pueden medir en escalas de intervalo o
de razn.
3 33 3.2 Tablas y distribuciones de frecuencias. .2 Tablas y distribuciones de frecuencias. .2 Tablas y distribuciones de frecuencias. .2 Tablas y distribuciones de frecuencias.
Buena parte de las tablas que se utilizan en estadsticas son conocidas como tablas de
distribuciones de frecuencias. La tablas de frecuencia usualmente tienen dos columnas; una
de ellas, la primera, muestra todos los posibles valores que asume la variable y la segunda,

- 21 -
para cada valor de la variable, muestra el nmero de veces que se presenta dicho valor, en el
contexto en el que se est trabajando; tal nmero se denomina frecuencia frecuencia frecuencia frecuencia. .. .
Respecto a los tipos de tablas que se utilizan, se pueden mencionar al menos tres criterios
para clasificarlas. De acuerdo al tipo de variables involucradas, se puede tener tablas de
atributos, de variables discretas y de variables continuas. De acuerdo a la forma como se
organizan las frecuencias se tienen: tablas de frecuencias absolutas, de frecuencias relativas,
de frecuencias porcentuales, de frecuencias acumuladas absolutas, de frecuencias acumuladas
relativas y de frecuencias acumuladas porcentuales. Finalmente, de acuerdo a la cantidad de
variables consideradas se tienen tablas de una variable, tablas de dos variables y tablas
multivariadas. En el segundo caso se pueden reconocer dos formas de presentacin: en
paralelo o en forma cruzada. Las tablas cruzadas tambin son llamadas como tablas de doble
entrada, de contingencia o de correlacin.
En lo que sigue se presentar diversos esquemas y ejemplos de la manera de organizar tablas.
3.2.1 Tabla para una variable de atributo. 3.2.1 Tabla para una variable de atributo. 3.2.1 Tabla para una variable de atributo. 3.2.1 Tabla para una variable de atributo.
Este tipo de tabla se utiliza para representar informacin que provenga de una variable
nominal. La arreglo tabular se presenta en dos columnas o filas, en una se indican las
categoras o valores de la variable y en la otra la frecuencia. El esquema general es de esta
forma:

Categoras de la Categoras de la Categoras de la Categoras de la
variable A variable A variable A variable A
Fre Fre Fre Frecuencias cuencias cuencias cuencias
absolutas absolutas absolutas absolutas
A
1
f
1

A
2
f
2


A
k
f
k

Total N
Tabla 1. Esquema de tabla para una variable de atributo.

En este esquema A
i
representa el nombre con el que se reconoce la categora i, es decir, el
valor de la variable, f
i
representa la frecuencia absoluta y N el nmero total de datos.

Ejemplo Ejemplo Ejemplo Ejemplo 1 11 1. .. . En la Tabla 2 se presentan datos acerca del nmero de incendios forestales
ocurridos en diferentes regiones espaolas en el ao 2004. Ntese que no se evidencia el uso
de algn criterio para decidir sobre el orden en que se presentan las regiones. Por ejemplo, se
podran haber ordenado de manera ascendente de acuerdo a la frecuencia observada en cada
regin.


- 22 -
Regin Regin Regin Regin N de Incendios N de Incendios N de Incendios N de Incendios
Pas Vasco 124
Catalua 565
Galicia 10618
Andaluca 1055
Castilla La Mancha 1364
Navarra 261
Extremadura 1623
Madrid 379
Castilla y Len 1942
Ceuta 3
Melilla 0
Total Total Total Total 17.934 17.934 17.934 17.934
Tabla 2. Nmero de incendios forestales ocurridos
en diferentes regiones espaolas en el ao 2004.

3.2.2 3.2.2 3.2.2 3.2.2 Tabla para una variable discreta. Tabla para una variable discreta. Tabla para una variable discreta. Tabla para una variable discreta.
Este tipo de tabla es similar a la tabla que se usa para una variable de atributo. La diferencia
con el caso anterior, es que los valores de la variable, es decir los x
i
, son numricos. El
esquema general de este tipo de tabla se presenta en la Tabla 3.
Valores de la variable Frecuencias absolutas
x
1
f
1

x
2
f
2


x
k
f
k

Total N
Tabla 3. Esquema de tabla de una distribucin de
frecuencias absolutas de una variable discreta.

Ejemplo Ejemplo Ejemplo Ejemplo 2 22 2. .. . En la Tabla 4 se presenta la frecuencia del nmero de ausencias al trabajo en una
empresa. Ntese que en este ejemplo se organiz la informacin en filas y no en columnas.

Valor 0 1 2 3 4 5 6 7 8 9
Frecuencia 12 8 5 4 5 8 0 5 2 1
Tabla 4. Frecuencias del nmero de ausencias al trabajo en una empresa


- 23 -
3.2.3 Tabla para una 3.2.3 Tabla para una 3.2.3 Tabla para una 3.2.3 Tabla para una variable continua. variable continua. variable continua. variable continua.
Cuando se quiere organizar la informacin de una variable continua o medida en una escala
de intervalo o razn, puede ser necesario, sobre todo cuando la cantidad de datos es muy
grande, reagrupar los valores en algunas pocas categoras llamadas intervalos de clase. En la
prctica el nmero de estos intervalos suele oscilar entre cinco y veinte; sin embargo, no hay
un criterio nico o ms recomendable para determinar el nmero de intervalos de clase. En
general, el nmero de intervalos que se usen depende del contexto del que surgen los datos,
de la experiencia de quien organiza la informacin, y/o de las intenciones de lo que quiera
hacer notar el analista de datos. En la Tabla 5 se presenta un esquema general de este tipo de
tabla.
Este tipo de tablas contiene elementos sobre los que es conveniente hacer algunos
comentarios. La columna titulada orden de clase, es de uso opcional y se utiliza para
numerar los intervalos de clase. En general, los intervalos de clase son una particin del
conjunto en donde asume valores la variable. Esta particin es excluyente y exhaustiva, es
decir, la unin de todos los intervalos es precisamente el conjunto de todos los valores que
asume la variable y la interseccin entre cualquier par de intervalos diferentes es vaca. Esto
implica que un valor cualquiera de los datos siempre se puede clasificar de manera nica en
alguno de los intervalos de clase que definen la particin. La Tabla 5 presenta un esquema
general de este tipo de tablas. Aunque la convencin para la utilizacin de los intervalos de
clase en este esquema es la de utilizar un intervalo cerrado a la izquierda y abierto a la
derecha, tambin se presentan variaciones a esta convencin. Finalmente, la marca de clase es
un valor representativo del intervalo de clase y corresponde a su punto medio.

Orden de Clase Intervalo [Li1, Li) Marca de clase Frecuencia absoluta
1 [L
0
, L
1
) m
1
f
1

2 [L
1
, L
2
) m
2
f
2


k [L
k1
, L
k
] m
k
f
k

Total N
Tabla 5. Esquema de tabla para una variable continua.

Ejemplo Ejemplo Ejemplo Ejemplo 3 33 3. .. . En la Tabla 6 se presenta las temperaturas en grados centgrados reportadas por
cien estaciones meteorolgicas colombianas a las doce del da el 23 de febrero de 2006.

Intervalo Marca de clase Frecuencias absolutas
[22,5; 25,5) 24 45
[25,5; 28,5 ) 27 43
[28,5; 31,5) 30 11
[31,5; 34,5] 33 1
Total 100
Tabla 6. Temperaturas de cien estaciones meteorolgicas
de Colombia a las 12:00 el 23 de febrero de 2006.

- 24 -
Ejemplo Ejemplo Ejemplo Ejemplo 4 44 4. En la Tabla 7 se presenta un ejemplo hipottico de los resultados obtenidos por
cincuenta estudiantes de una institucin universitaria en un curso de estadstica bsica

Intervalo de Clase Frecuencia n
i
Frecuencia Relativa (f
i
)
30 39 4 0.08
40 59 14 0.28
60 69 12 0.24
70 - 89 16 0.32
90 100 4 0.08
Total 50 1
Tabla 7. Calificaciones en un examen obtenidas por
cincuenta estudiantes de una institucin universitaria

3.2.4 Tablas para diferentes tipos de frecuencias. 3.2.4 Tablas para diferentes tipos de frecuencias. 3.2.4 Tablas para diferentes tipos de frecuencias. 3.2.4 Tablas para diferentes tipos de frecuencias.
El hecho de que las frecuencias se puedan presentar en diferentes formas puede causar
confusin a los inexpertos. Aunque no se acostumbra presentar, en trabajos prcticos, todos
estos tipos de frecuencias de manera simultnea, a manera de ilustracin se presenta un
esquema, en la Tabla 8, que recopila las diferentes formas de presentar las frecuencias. Por
ejemplo, si N=50, una frecuencia absoluta de 25, corresponde a una frecuencia acumulada de
0.5 y a un porcentaje del 50%. Por otra parte, las frecuencias acumuladas lo que hacen es
acumular el valor de las frecuencias absolutas, relativas o porcentuales.

Valores
variable
Frecuencia
absoluta
Frecuencia
relativas
%
Frecuencia
absoluta
acumulada
Frecuencias
relativa
acumulada
% acumulado
x
1
f
1
fr
1
p
1
F
1
Fr
1
P
1

x
2
f
2
fr
2
p
2
F
2
Fr
2
P
2


x
k
f
k
fr
k
p
k
F
k
Fr
k
P
k

Total N 1 100 100
Tabla 8. Esquema de tabla con todas las versiones de tipos de frecuencias
3.2.5 Tablas de doble entrada. 3.2.5 Tablas de doble entrada. 3.2.5 Tablas de doble entrada. 3.2.5 Tablas de doble entrada.
Este tipo de tablas se utiliza con mucha frecuencia para organizar los resultados del cruce de
frecuencias de dos variables. Adems, cuando estas tablas se utilizan para analizar relaciones
de dependencia entre las variables, se habla de tablas de contingencia. En estos casos es usual
que en la ltima fila y columna se presenten los resultados de las frecuencias marginales
correspondientes a cada variable.

Ejemplo Ejemplo Ejemplo Ejemplo 5 55 5. La Tabla 9 presenta los resultados de lanzar un par de dados distinguibles (por
ejemplo un dado rojo y uno azul al lanzarlos en 120 ocasiones. Adems, el ejemplo ilustra una
manera manual y prctica de hacer conteos de frecuencia.

- 25 -

Tabla 9. Tabla de doble entrada donde han registrado los resultados
del lanzamiento de un par de dados distinguibles en 120 ocasiones
Ejemplo Ejemplo Ejemplo Ejemplo 6 66 6. La Tabla 10 presenta los resultados de la intencin de separacin de 66 parejas
heterosexuales cruzada con el tipo de unin bajo la que conviven. Ntese que en este
ejemplo, puede ser de inters establecer si el tipo de unin est relacionada con la intencin
de separacin en una relacin de pareja.

Tipo de unin
Civil Libre Religiosa
Total
general
no 7 17 12 36 Intencin de
separacin
si 10 11 9 30

Total
general
17 28 21 66
Tabla 10. Tabla de doble entrada donde han registrado los resultados
del lanzamiento de un par de dados distinguibles en 120 ocasiones

3.2.6 Comentarios acerca del uso de tablas. 3.2.6 Comentarios acerca del uso de tablas. 3.2.6 Comentarios acerca del uso de tablas. 3.2.6 Comentarios acerca del uso de tablas.
Las tablas de atributos son el tipo de tablas que se utilizan ms a menudo para organizar la
informacin de atributos, es decir, de variables cualitativas de nivel nominal u ordinal. Este
tipo de tablas se puede organizar en orden ascendente o descendente de acuerdo a la
frecuencia de los valores o se acuerdo a algn orden impuesto al atributo como por ejemplo
el orden alfabtico. Tambin se pueden dar casos en que las categoras de organizacin
contengan a su vez subcategoras sobre las cuales tambin se realizan conteos.

- 26 -
En cuanto a las tablas de variables discretas son las que se utilizan ms a menudo para
organizar la informacin de variables numricas discretas o cuantitativas ordinales. No es
recomendable su uso cuando existen demasiados valores diferentes de la variable de
observacin. Este tipo de tablas, usualmente se presentan en orden ascendente de acuerdo a
los valores de la variable.
Las tablas para variables continuas son las que se utilizan ms a menudo para organizar la
informacin de variables cuantitativas que se miden en un nivel de intervalo o de razn. En
general se debe sopesar, para determinar el nmero de intervalos de clase a contemplar, el
error generado por el agrupamiento utilizado con las dificultades de clculo posterior,
especialmente si no se tiene a la mano un computador para los clculos. La construccin de
este tipo de tablas exige la generacin de criterios de particin para realizar el proceso de
agrupamiento por el cual se generan los intervalos de clase; en general, es preferible que la
amplitud de las clases sea constante, aunque en ocasiones pueden verse mejor algunas
caractersticas de los datos si se utilizan clases de diferente amplitud. Este tipo de tablas puede
generar problemas de clculo de estadsticas, como la media aritmtica, o de representacin
grfica cuando los intervalos extremos no se definen de manera acotada.
Finalmente, respecto a las tablas de doble entrada, se puede decir que son de uso frecuente
cuando se consideran dos variables de tipo categrico, aunque tambin las hay para organizar
el cruce de dos variables continuas. Este tipo de tablas es llamado como tabla de
contingencia, cuando se utilizan para analizar la relacin de dependencia entre las dos
variables categricas, o como tabla de correlacin cunado las variables consideradas son
continuas. En este tipo de tablas se debe tener que las categoras de clasificacin sean
excluyentes y exhaustivas.

3.3 Grficos. 3.3 Grficos. 3.3 Grficos. 3.3 Grficos.
La forma en que los datos se organizan para su descripcin, anlisis, interpretacin y
publicacin es de importancia fundamental en la estadstica. La representacin grfica es una
manera de presentar los datos y que permite destacar algunas ideas que se desean expresar.
Al igual que en el caso del uso de representaciones tabulares, las representaciones grficas
son de tipos muy variados, segn se trate de variables unidimensionales, bidimensionales,
multidimensionales o de conjuntos de datos observados a intervalos regulares de tiempo
(como en el caso de las series de tiempo o cronolgicas), de atributos, etctera. Para la
seleccin apropiada de un tipo de grfico se debe considerar el tipo de variable y la cantidad
de clases o categoras. Aqu se presentarn los de mayor uso.
3.3.1 Columnas. 3.3.1 Columnas. 3.3.1 Columnas. 3.3.1 Columnas.
Un diagrama de bloques es una grfica que se emplea para representar la distribucin de una
variable discreta o nominal. Consta de una serie de rectngulos, cada uno de los cuales
representa una categora de la variable. Las bases de los rectngulos estn sobre una misma
recta y se nombran con los valores que toma la variable cuya distribucin se quiere

- 27 -
representar. Las bases de todos los rectngulos tienen la misma longitud y la altura de cada
uno de ellos es proporcional al nmero de observaciones de la muestra que estn incluidas en
cada clase. Los rectngulos que conforman la grfica estn separados entre s para indicar que
entre uno y otro valor de la variable no hay ms valores.

Ejemplo Ejemplo Ejemplo Ejemplo 7 77 7. En la Figura1 se muestra la calificacin promedio asignado a un grupo de
veinticinco trabajadores en cuanto a sus actitudes de disponibilidad hacia el trabajo, iniciativa
para realizar labores y capacidad de cuestionamiento de su labor en una empresa de
produccin de flores.


Figura 1. Calificacin promedio asignada por veinticinco trabajadores a su actitud en trminos de su
disponibilidad, iniciativa y capacidad de cuestionamiento de su trabajo.
3.3.2 Circular. 3.3.2 Circular. 3.3.2 Circular. 3.3.2 Circular.
Un diagrama circular es una grfica que se emplea para representar la distribucin de una
variable categrica. Para construirlo se utiliza un crculo: se divide en tantos sectores como
categoras tenga la variable. El tamao de cada sector (o sea del ngulo central
correspondiente) debe ser proporcional al nmero de observaciones de la muestra que estn
incluidas en cada clase. En otras palabras, el grfico debe presentar el aporte de cada valor
con respecto al total.

Ejemplo Ejemplo Ejemplo Ejemplo 8 88 8. La Figura 2 muestra la distribucin de las inscripciones de estudiantes a diferentes
carreras en una universidad. Para mayor claridad, tambin se incluye la tabla de donde
proviene la informacin.

Programas Diseo Electrnica Matemticas Qumica Biologa Fsica Total
Inscritos 250 150 350 200 150 100 1200
Porcentaje 21% 13% 29% 17% 13% 8% 100%


- 28 -
21%
12%
29%
17%
13%
8% DISEO
ELECTRONICA
MATEMATICAS
QUIMICA
BIOLOGIA
FISICA

Figura 2. Distribuciones de las inscripciones de los
estudiantes a diferentes en una Universidad.
3.3.3 Puntos. 3.3.3 Puntos. 3.3.3 Puntos. 3.3.3 Puntos.
Un diagrama de puntos es una grfica que se emplea para dar una idea aproximada de la
forma de la distribucin de una variable cuantitativa discreta. Sobre una misma recta
(usualmente horizontal) se disponen en orden ascendente los posibles valores de la variable y
encima de cada uno de esos valores se anotan tantos puntos como veces se repita el valor.

Ejemplo Ejemplo Ejemplo Ejemplo 9 99 9. Cuarenta estudiantes universitarios participaron en un estudio acerca del efecto del
sueo sobre las puntuaciones en los exmenes. La Figura 3 presenta los resultados de 20 de
los estudiantes que estuvieron voluntariamente despiertos estudiando toda la noche anterior
al examen (grupo experimental que no durmi). En la Figura 4 se presentan los resultados de
los otros 20 estudiantes (grupo control) que se acostaron a las 11 p.m. la noche anterior al
examen. Las puntuaciones en el examen se muestran en los siguientes grficos. Cada punto
representa la puntuacin de un estudiante particular. Por ejemplo, los dos puntos encima del
nmero 80 en el Grfico 4, indican que dos estudiantes en el grupo control tuvieron una
puntuacin de 80 en el examen.




30 40 50 60 70 80 90 100
Figura 3. Puntuaciones del grupo experimental.




30 40 50 60 70 80 90 100
Figura 4. Puntuaciones del grupo control.

- 29 -
3.3.4 Barras. 3.3.4 Barras. 3.3.4 Barras. 3.3.4 Barras.
Un diagrama de barras es una grfica que se emplea para representar la distribucin de una
variable cuantitativa discreta o nominal. Sobre una misma recta (usualmente vertical) se
disponen en orden ascendente los posibles valores de la variable y al lado de cada uno de
esos valores se trazan segmentos de recta cuya longitud es proporcional a la frecuencia de
cada valor de la variable. En realidad este tipo de grfico se puede ver como equivalente al de
columnas, salvo por la disposicin de las barras en forma horizontal. Por lo tanto, las alturas
de las barras deben ser iguales y el largo de las mismas debe ser proporcional al nmero de
observaciones de la muestra que estn incluidas en cada clase.

Ejemplo Ejemplo Ejemplo Ejemplo 10 10 10 10. .. . En la Figura 5 se muestran los resultados de una investigacin en la que una
muestra de 107 profesores respondi una prueba acerca de la interpretacin y el
razonamiento con probabilidades.

63,4
26,9
0 50
Utilizacin de razonamiento
proporcional para calcular
probabilidades
Interpretacin de probabilidades
Utilizacin de razonamiento
combinatorio para calcular
probabilidades
Porcentajes

Figura 5. Porcentaje de aciertos de profesores en una prueba acerca
de interpretacin y razonamiento con probabilidades.

3.3.5 Histograma. 3.3.5 Histograma. 3.3.5 Histograma. 3.3.5 Histograma.
Un histograma es una grfica que se emplea para representar la distribucin de una variable
cuantitativa continua. Est constituida por rectngulos ubicados sobre una misma recta. Cada
uno de los grupos en que se clasifica la variable est representado por la base de un
rectngulo; y la altura del mismo es proporcional a la frecuencia del correspondiente grupo
de valores. Adems tales rectngulos son adyacentes. Aunque el histograma es una forma
tpica de visualizar el comportamiento de una variable continua, tambin se puede utilizar
para una variable discreta cuando tiene un nmero muy elevado de valores. En su
elaboracin, para elegir la cantidad apropiada de bloques se toma la parte entera de la
cantidad de datos, y para determinar la longitud de la base de los rectngulos (longitud de
clase) se divide la diferencia de los datos extremos por la cantidad de bloques.


- 30 -
Ejemplo Ejemplo Ejemplo Ejemplo 11 11 11 11. .. . El histograma que se presenta en la Figura 6, representa el nmero de visitas que
ha tenido una pgina Web de Internet, dependiendo de la hora de la visita. Ntese que en este
ejemplo las frecuencias se han indicado, encima de los bloques que conforman el histograma.


Figura 6. Porcentaje de aciertos de profesores en una prueba acerca
de interpretacin y razonamiento con probabilidades
3.3.6 Polgono de frecuencias. 3.3.6 Polgono de frecuencias. 3.3.6 Polgono de frecuencias. 3.3.6 Polgono de frecuencias.
Un polgono de frecuencias es un tipo de grfico que suaviza el contorno de un histograma.
Es una forma geomtrica obtenida de segmentos de recta que unen los puntos medios de los
intervalos de clase adyacentes del histograma. Los polgonos de frecuencia son especialmente
tiles para comparar varias distribuciones en donde la superposicin de histogramas causara
confusin.

Ejemplo Ejemplo Ejemplo Ejemplo 12 12 12 12. .. . El polgono de frecuencias que se muestra en la Figura 7 corresponde a la
suavizacin que se realiz al histograma presentado en la Figura 6.


Figura 7. Suavizacin de la grfica de la Figura 5, sobre el porcentaje de aciertos de profesores en una
prueba acerca de interpretacin y razonamiento con probabilidades.


- 31 -
3.3.7 Tallo y hojas. 3.3.7 Tallo y hojas. 3.3.7 Tallo y hojas. 3.3.7 Tallo y hojas.
El grfico de tallo y hojas es uno de los mtodos bsicos del anlisis exploratorio de datos que
aplica a variables numricas. La idea de la construccin del mismo se basa en definir un tallo
de valores que represente el primer o primeros dgitos del cuerpo de datos, y a lado de cada
uno de estos valores se escriben los siguientes dgitos de cada nmero, que semejan las hojas
que se desprenden de un tallo. Una ventaja de este grfico es la de permitir ver la forma de la
distribucin de los datos preservando toda o buena parte de la informacin numrica.

Ejemplo Ejemplo Ejemplo Ejemplo 13 13 13 13. .. . En la Figura 8 se presenta el grfico de tallo y hojas correspondiente a las notas
de veinte estudiantes en un examen. Tambin se incluye el conjunto de datos para que se
verifique la construccin del grfico.
78 93 61 100 70 83 88 74 97 72
66 73 76 81 83 64 91 70 77 86

6 1 4 6
7 0 0 2 3 4 6 7 8
8 1 3 3 6 8
9 1 3 7
10 0
Figura 8. Grfico de tallos y hojas de las calificaciones de los 20 estudiantes.

6- 1 4
6+ 6
7- 0 0 2 3 4
7+ 6 7 8
8- 1 3 3
8+ 6 8
9- 1 3
9+ 7
10- 0
Figura 9. Grfico de tallos y hojas extendido de las calificaciones de los 20 estudiantes.

Por otra parte, en la Figura 9 se ilustra una manera de abrir el grfico de tallo y hojas
presentado en la Figura 8. La convencin utilizada consiste en usar el signo - para colocar
las hojas con valores entre 0 y 4 y el signo + para colocar las hojas" entre 5 y 9.
3.3.8 Grfico de caja (Boxplot). 3.3.8 Grfico de caja (Boxplot). 3.3.8 Grfico de caja (Boxplot). 3.3.8 Grfico de caja (Boxplot).
El grfico de caja, conocido en la literatura inglesa como Boxplot Boxplot Boxplot Boxplot, proviene del anlisis
exploratorio de datos y es muy apropiado para mostrar el comportamiento de los datos
cuando interesa presentarlos estratificados por alguna variable cualitativa. Para su
construccin es necesario calcular los cuartiles (Q
1
, Q
2
y Q
3
), el rango intercuartlico (RQ) y los
lmites que determinan la zona de anomalas (Q
1
1,5RQ y Q
3
+ 1,5RQ).

- 32 -
Ejemplo 1 Ejemplo 1 Ejemplo 1 Ejemplo 14 44 4. .. . En la Figura 10 se presentan los resultados obtenidos en grado dcimo en un
examen final de matemticas en cuatro cursos dirigidos por diferentes profesores. Se puede
observar, por ejemplo, que en el cursos 1, hubo un estudiante con un puntaje que sobresale
respecto a los dems estudiantes de su curso, mientras que en el curso 2, se identifica a un
estudiante que obtuvo un puntaje significativamente menor que loa puntajes obtenidos por
los dems estudiantes del curso. Asimismo, en cuanto a la homogeneidad de los resultados
obtenidos, se puede observar que el curso 4 es el ms heterogneo de los cuatro cursos.

Figura 10. Resultados en examen de matemticas de los estudiantes
de cuatro cursos, del mismo nivel acadmico, en un colegio
Ejemplo Ejemplo Ejemplo Ejemplo 15 15 15 15. La Figura 11 ilustra la construccin del grfico de caja para los 20 datos
ordenados de la siguiente tabla.

Orden: 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20
Datos: 5 7 8 9 9 9 9 9 9 9 10 10 11 11 11 11 14 15 16 18











Figura 11. Grfico de caja donde Q
1
es el primer cuartil, Q
2
es la mediana,
Q
3
es el tercer cuartil y RQ es el rango intercuartlico (Q
3
-Q
1
)

Q1
Q2 Q3
ltimos valores antes de entrar a la zona de anomalas

Q1
Q3
Q2
RQ
1,5RQ
1,5RQ
Zona de
anomalas
Zona de
anomalas

- 33 -
3.3.9 Dispersin (Nube de puntos). 3.3.9 Dispersin (Nube de puntos). 3.3.9 Dispersin (Nube de puntos). 3.3.9 Dispersin (Nube de puntos).
Este grfico muestra los puntos asociados con los datos, en un plano bidimensional y se usa
para representar los pares de valores (nube de puntos) de una distribucin bivariante. Cada
dato, representado por un punto, nos indica una sola unidad de observacin sobre las cuales
han sido hechas dos mediciones, x y y. Los valores de cada una de las mediciones son
llevadas a escala sobre los ejes x y y respectivamente. Los grficos de dispersin son tiles
para analizar la correlacin entre variables cuantitativas, ya que la nube de puntos que se
genera permite identificar tendencias o ausencias de correlacin.

Ejemplo Ejemplo Ejemplo Ejemplo 16 16 16 16. .. . En la Figura 12 se ilustra el uso de este tipo de grfico.
0
1
2
3
4
5
6
7
8
9
10
0 1 2 3 4 5 6 7 8 9 10
F
I
L
O
S
O
F
I
A
MATEMATICAS

Figura 12. Resultados obtenidos en matemticas y estadstica por diez estudiantes.

3.3.10 Pareto. 3.3.10 Pareto. 3.3.10 Pareto. 3.3.10 Pareto.
El grfico de Pareto permite visualizar e identificar las principales razones que generan o se
atribuyen a un evento que se desee estudiar. En particular, se utiliza en la supervisin de
control de calidad cuando, por ejemplo, se desea determinar las razones que provocan una
mala calidad en la elaboracin del algn producto textil. Ntese adems, que este no es
propiamente un grfico de frecuencias pues la suma de las ocurrencias de los eventos es, en
general, ms alta que el total de los objetos o productos que se revisan.


Ejemplo Ejemplo Ejemplo Ejemplo 17 17 17 17. .. . La Figura 13 muestra las razones atribuidas por treinta consumidores para
devolver las chaquetas vendidas en un almacn.

En el grfico de Pareto la suma de las ocurrencias es mucho mayor que 30, que es el nmero
de chaquetas revisadas. Para su elaboracin lo que se hace es contar el nmero de
ocurrencias que se atribuyen al fenmeno en cuestin y luego se muestran las ocurrencias en
columnas ordenadas de mayor a menor.

- 34 -
29
22
12
8
4 4
0
5
10
15
20
25
30
35
TELA COLOR AJUSTES BOTONES MANGAS FORRO
O
C
U
R
R
E
N
C
I
A
S
RAZONES
MOTIVOS DE DEVOLUCIN DE CHAQUETAS

Figura 13. Razones para la devolucin de chaquetas en un almacn.
3.3.11 Pictogramas. 3.3.11 Pictogramas. 3.3.11 Pictogramas. 3.3.11 Pictogramas.
Los pictogramas usualmente consisten en dibujos icnicos cuyo tamao suele representar
cantidades o proporciones de la variable o variables de las que se est informando.
Ejemplo Ejemplo Ejemplo Ejemplo 18 18 18 18. En la Figura 14 se
muestra un ejemplo de la manera
como se utiliza el pictograma.



Figura 14. Poblacin de E.U. de 1930 a 1990.
3.3.12 Perfiles. 3.3.12 Perfiles. 3.3.12 Perfiles. 3.3.12 Perfiles.
Los grficos de perfiles se pueden considerar como una extensin de los grficos de columnas
o de barras. Se usan para comparar resultados atribuibles a los efectos de controlar u observar
dos variables.

Ejemplo 1 Ejemplo 1 Ejemplo 1 Ejemplo 19 99 9. En la Figura 15 y en la tabla que se presenta a continuacin, se comparan los
promedios de efecto de sueo (en horas) de tres tipos de drogas somnferas en diferentes
dosificaciones en una muestra de 60 pacientes voluntarios.

Dosis en miligramos Dosis en miligramos Dosis en miligramos Dosis en miligramos Droga 1 Droga 1 Droga 1 Droga 1 Droga 2 Droga 2 Droga 2 Droga 2 Droga 3 Droga 3 Droga 3 Droga 3
95 5 2 1
96 6 2 1
97 7 3 2
98 8 5 3
99 8 6 2


- 35 -
0
1
2
3
4
5
6
7
8
9
95 96 97 98 99
Droga 1
Droga 2
Droga 3

Figura 15. Comparacin del efecto promedios de sueo (en horas) de tres tipos de drogas somnferas
en diferentes dosis, en una muestra de 60 pacientes voluntarios.

En la Figura 16, se representan los datos de la tabla utilizando un diagrama de perfiles con
barras horizontales.
0 2 4 6 8 10
95
96
97
98
99
Droga 1
Droga 2
Droga 3

Figura 16. Versin en presentacin de barras de los datos de la grfica de la Figura 15.

3 33 3.3.13 Columnas o barras apiladas. .3.13 Columnas o barras apiladas. .3.13 Columnas o barras apiladas. .3.13 Columnas o barras apiladas.
Una variacin de la grfica de perfiles la aporta los grficos de columnas o de barras apiladas,
que permiten comparar entre categoras el aporte de cada valor al total. Como se ver en los
ejemplos este tipo de grficas se puede presentar en versiones absolutas o porcentuales.


Ejemplo Ejemplo Ejemplo Ejemplo 20 20 20 20. .. . Los datos presentados en la tabla siguiente muestran el nmero de autos,
camionetas y camperos vendidos durante los meses de diciembre de los aos 1995 a 1999 en
un concesionario de venta de carros. En las Figuras 17 y 18, se muestra la versin de
apilamiento absoluta en columnas y barras respectivamente.


- 36 -
Ao Ao Ao Ao Autos Autos Autos Autos Camionetas Camionetas Camionetas Camionetas Camperos Camperos Camperos Camperos
95 5 2 1
96 6 2 1
97 7 3 2
98 8 5 3
99 8 6 2

0
2
4
6
8
10
12
14
16
18
95 96 97 98 99
Camperos
Camionetas
Autos

Figura 17. Nmero de autos, camionetas y camperos vendidos durante los meses de diciembre de los
aos 1995 a 1999 en un concesionario de venta de carros.

0 5 10 15 20
95
96
97
98
99
Autos
Camionetas
Camperos

Figura 18. Versin presentada en barras de la Figura 17. Observe que en este caso se ha hecho un
manejo menos preciso de la escala numrica horizontal.

Ejemplo 2 Ejemplo 2 Ejemplo 2 Ejemplo 21 11 1. Respecto a los mismos datos considerados en el ejemplo anterior, en las Figuras
19 y 20, se muestra la versin de apilamiento porcentual en columnas y barras
respectivamente.

- 37 -
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
95 96 97 98 99
Camperos
Camionetas
Autos

Figura 19. Porcentaje de autos, camionetas y camperos vendidos durante los meses de diciembre de
los aos 1995 a 1999 en un concesionario de venta de carros.

0% 20% 40% 60% 80% 100%
95
96
97
98
99
Autos
Camionetas
Camperos

Figura 20. Versin en barras de la Figura 18.

3.3.14 Lneas. 3.3.14 Lneas. 3.3.14 Lneas. 3.3.14 Lneas.
Este tipo de grficos se utiliza para presentar tendencias a lo largo del tiempo o entre
categoras. Cuando una de las variables es el tiempo y la otra es por ejemplo, las ventas, el
grfico tambin se conoce con el nombre de series de tiempo. Por otra parte, y al igual que
en los casos de los grficos de columnas y barras, en los grficos de lneas se pueden elaborar
apilamientos absolutos y porcentuales.
Ejemplo Ejemplo Ejemplo Ejemplo 22 22 22 22. Los datos de los ejemplos presentados en el apartado sobre grficos de columnas
o barras apiladas tambin se pueden utilizar para representar las diferentes modalidades de
los grficos de lneas.

- 38 -
0
1
2
3
4
5
6
7
8
9
95 96 97 98 99
Autos
Camionetas
Camperos

Figura 21. Nmero de autos, camionetas y camperos vendidos durante los meses de diciembre de los
aos 1995 a 1999 en un concesionario de venta de carros.
0
2
4
6
8
10
12
14
16
18
95 96 97 98 99
Autos
Camionetas
Camperos

Figura 22. Versin apilada absoluta de grfico de lneas del nmero de autos, camionetas y camperos
vendidos durante diciembre en los aos 1995 a 1999.
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
95 96 97 98 99
Camperos
Camionetas
Autos

Figura 23. Versin apilada porcentual de grfico de lneas del nmero de autos, camionetas y camperos
vendidos durante diciembre en los aos 1995 a 1999.


- 39 -
En la Figura 21 se muestra una versin sin apilar del nmero de autos, camionetas y camperos
vendidos durante los meses de diciembre en los aos 1995 a 1999 en un concesionario de
venta de carros, mientras que en las Figuras 22 y 23, se muestras las versiones apiladas
absolutas y porcentuales respectivamente de los mismos datos.
3.3.15 reas. 3.3.15 reas. 3.3.15 reas. 3.3.15 reas.
En este tipo de grfico, como en los grficos de lnea, tambin se presenta la tendencia de los
valores de los datos a lo largo del tiempo o entre categoras.

Ejemplo Ejemplo Ejemplo Ejemplo 23 23 23 23. El presupuesto de inversin del gobierno en miles de millones de pesos en las
reas de educacin y ciencia y tecnologa se presenta en la siguiente tabla.

Aos Aos Aos Aos Educacin Educacin Educacin Educacin Ciencia y tecnologa Ciencia y tecnologa Ciencia y tecnologa Ciencia y tecnologa Totales Totales Totales Totales
2001 250 200 450
2002 200 150 350
2003 250 180 430
2004 270 150 420
2005 220 200 420
2006 350 250 600

Obsrvese que en la Figura 24 se presentan los presupuestos sin realizar apilamientos,
mientras que en la Figura 25 y 26 respectivamente se utilizan los apilamientos absolutos y
porcentuales.
0
50
100
150
200
250
300
350
400
2001 2002 2003 2004 2005 2006
EDUCACIN
CIENCIA Y TEC.

Figura 24. Presupuesto de inversin de los aos 2001 a 2006, en educacin y
ciencia y tecnologa (versin sin apilamientos).
0
100
200
300
400
500
600
700
2001 2002 2003 2004 2005 2006
CIENCIA Y TEC.
EDUCACIN

Figura 25. Presupuesto de inversin de los aos 2001 a 2006, en educacin y
ciencia y tecnologa (versin con apilamientos absolutos).

- 40 -
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
2001 2002 2003 2004 2005 2006
CIENCIA Y TEC.
EDUCACIN

Figura 26. Presupuesto de inversin de los aos 2001 a 2006, en educacin y
ciencia y tecnologa (versin con apilamientos porcentuales).
3.3.16 Columnas en tres dimensiones. 3.3.16 Columnas en tres dimensiones. 3.3.16 Columnas en tres dimensiones. 3.3.16 Columnas en tres dimensiones.
Los grficos columnas en tres dimensiones sirven para representar la informacin que
proviene de tablas de doble entrada ya que con base en ellos se pueden comparar frecuencias
entre categoras bivariantes. En realidad, este tipo de grfico puede verse como extensin del
histograma aplicado a dos variables o como variacin de los grficos de columnas (barras), o
de perfiles para dos variables.

Ejemplo Ejemplo Ejemplo Ejemplo 24 24 24 24. La venta de carros en diciembre de 2008 (autos, camionetas y camperos) en tres
concesionarios diferentes se puede volver a utilizar para ilustrar el uso de este tipo de
grficos. Los datos que se representan en la Figura 27 se organizaron en la siguiente tabla

C1 C1 C1 C1 C2 C2 C2 C2 C3 C3 C3 C3
Autos Autos Autos Autos 2 3 4
Camionetas Camionetas Camionetas Camionetas 1 5 3
Camperos Camperos Camperos Camperos 4 2 1


Figura 27. Nmero de carros vendidos en tres concesionarios
diferentes en diciembre de 2008

- 41 -
3.3.17 Cotizaciones. 3.3.17 Cotizaciones. 3.3.17 Cotizaciones. 3.3.17 Cotizaciones.
Los grficos de cotizaciones, como lo indica su nombre, se utilizan en el mercado burstil para
analizar las fluctuaciones de los precios de las acciones.

Ejemplo Ejemplo Ejemplo Ejemplo 25 25 25 25. .. . Las Figuras 28, 29 y 30 ilustran la utilizacin de los grficos de cotizaciones, en
tres modalidades. Los datos que se tomaron para elaborar estos grficos aparecen en la
siguiente tabla y corresponden al comportamiento de una accin particular. Las columnas
corresponden al da de la semana, volumen de acciones transadas en el da, precio de
apertura en el da, mximo precio alcanzado durante el da, mnimo valor alcanzado durante
el da y precio de cierre en el da.


Da Da Da Da Volumen Volumen Volumen Volumen Apertura Apertura Apertura Apertura Mximo Mximo Mximo Mximo Mnimo Mnimo Mnimo Mnimo Cierre Cierre Cierre Cierre
1 11 1 200 55 58 52 56
2 22 2 250 53 60 52 54
3 33 3 300 59 62 56 60
4 44 4 250 54 56 54 55
5 55 5 300 56 54 57 55
6 66 6 150 58 56 59 57
7 77 7 200 56 60 52 58

46
48
50
52
54
56
58
60
62
64
1 2 3 4 5 6 7
V
A
L
O
R
E
S
DIAS


Figura 28. Fluctuaciones de los valores en miles de pesos de una accin durante una semana. Se
indican los valores mximos y mnimos alcanzados y el precio de cierre con una marca rectangular.


- 42 -
46
48
50
52
54
56
58
60
62
64
1 2 3 4 5 6 7
V
A
L
O
R
E
S
DIAS

Figura 29. Fluctuaciones de los valores (en miles de pesos) de una accin durante siete das. Se
indican los valores mximos y mnimos alcanzados y los precios de apertura y cierre de la accin se
representan con un rectngulo. Observe que el rectngulo no est relleno cuando el precio de apertura
es menor que el de cierre.
46
48
50
52
54
56
58
60
62
64
0
50
100
150
200
250
300
350
1 2 3 4 5 6 7
V
A
L
O
R
E
S
V
E
N
T
A
S
DIAS

Figura 30. Fluctuaciones de los valores (en miles de pesos) de una accin durante siete das. Este
grfico contiene la informacin del grfico anterior, pero adems, incluye la informacin de monto total
de las ventas en millones de pesos.
3.3.18 baco de probabilidad. 3.3.18 baco de probabilidad. 3.3.18 baco de probabilidad. 3.3.18 baco de probabilidad.
Este tipo de grfico se utiliza para representar tablas de frecuencias relativas asociados a una
variable discreta o para representar una tabla de probabilidades de variables aleatorias
discretas.

Ejemplo Ejemplo Ejemplo Ejemplo 26 26 26 26. .. . Un juego consiste en lanzar 3 dados distinguibles y apostarle a la aparicin de
cierto nmero. Si resulta una vez el 6 el jugador se gana un punto, si resulta dos veces el 6
se gana dos puntos, si resulta tres veces el 6 se gana tres puntos y si no sale el 6 se pierde
un punto.
Los posibles resultados de este juego son 216 ternas: 111, 112, 121, 211, 113, 131, 311, , 666.

La variable aleatoria es el puntaje ganado por el jugador, la cual toma los valores -1, 1, 2 y 3,
los cuales dependen de la cantidad de veces que aparece el 6.

- 43 -
En la siguiente tabla aparecen las posibles ganancias y la cantidad de resultados para los
cuales se obtendran las respectivas ganancias:

Cantidad Cantidad Cantidad Cantidad
de 6 de 6 de 6 de 6
Ganancia Ganancia Ganancia Ganancia
(Puntaje) (Puntaje) (Puntaje) (Puntaje)
Cantidad de Cantidad de Cantidad de Cantidad de
resultados resultados resultados resultados
Frecuencias Frecuencias Frecuencias Frecuencias
relativas relativas relativas relativas
0 -1 125 125/216
1 1 75 75/216
2 2 15 15/216
3 3 1 1/216
El grfico que se muestra en la Figura 31, similar a un diagrama de barras, se conoce como
baco de probabilidad.
0
0,1
0,2
0,3
0,4
0,5
0,6
0,7
0 1 2 3

Figura 31. Probabilidades de ganancia de un jugador de dados.

Ejemplo 2 Ejemplo 2 Ejemplo 2 Ejemplo 27 77 7. .. . Un estudiante presenta un examen que contiene 4 preguntas de Falso y
Verdadero. Las dos primeras preguntas son de Estadstica y las dos ltimas son de
Probabilidad. X es la cantidad de veces que puede marcar Verdadero en las dos primeras
preguntas, y Y es la cantidad de veces que puede marcar Verdadero en todo el examen.

Las preguntas P1, P2, P3 y P4 del examen se pueden responder de las siguientes maneras:

No No No No 1 11 1 2 22 2 3 33 3 4 44 4 5 55 5 6 66 6 7 77 7 8 88 8 9 99 9 10 10 10 10 11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16
P1 V V V V F V F V F V F V F F F F
P2 V V V F V V F F V F V F V F F F
P3 V V F V V F V F V V F F F V F F
P4 V F V V V F V V F F V F F F V F

La tabla anterior nos permite realizar los conteos para las variables X e Y que se muestran en la
siguiente tabla:

- 44 -
1 11 1 2 22 2 3 33 3 4 44 4 5 55 5 6 66 6 7 77 7 8 88 8 9 99 9 10 10 10 10 11 11 11 11 12 12 12 12 13 13 13 13 14 14 14 14 15 15 15 15 16 16 16 16
X 2 2 2 1 1 2 0 1 1 1 1 1 1 0 0 0
Y 4 3 3 3 3 2 2 2 2 2 2 1 1 1 1 0

Se puede ver que hay 16 maneras de responder el examen. En el primer caso, la variable X
toma el valor 2 y la variable Y toma el valor 4. Con base en esta tabla se obtiene la siguiente
tabla de frecuencias, y con base en esta tabla se obtiene el baco para las dos variables que se
muestra en la Figura 32.
0 00 0 1 11 1 2 22 2 3 33 3 4 44 4
0 00 0 1 2 1 0 0
1 11 1 0 2 4 2 0
2 22 2 0 0 1 2 1
X XX X
Y YY Y



Figura 32. baco para las variables X,Y.
3.3.19 Comentarios acerca del uso de grficos. 3.3.19 Comentarios acerca del uso de grficos. 3.3.19 Comentarios acerca del uso de grficos. 3.3.19 Comentarios acerca del uso de grficos.
Para la elaboracin de grficas se pueden dar algunas recomendaciones. La finalidad de las
grficas es visualizar mejor la informacin. Por ello, la mejor grfica suele ser la ms simple. Al
presentar grficas siempre se debe buscar sencillez y claridad, de tal manera que stas sean
comprensibles sin la ayuda de las descripciones de textos. Toda grfica debe tener ttulo e
indicar con claridad el contenido de la misma. Las columnas, barras y lneas en los diversos
grficos de este tipo deben preservar en lo posible el nivel de frecuencia cero para no generar
grficos engaosos.
Las grficas no se deben ver como un sustituto de tablas u otros medios de representacin
estadstica, ms bien son un complemento del anlisis de datos. En realidad, la grfica es
considerada como el principal medio de expresin de la estadstica por diferentes razones: es
ms llamativa y sugestiva, deja en la memoria una expresin ms duradera que las tablas o el
slo texto y requiere de un menor tiempo de lectura. El grfico de Tallo y hojas Tallo y hojas Tallo y hojas Tallo y hojas y el de Caja Caja Caja Caja
son tpicos del anlisis exploratorio de datos y aunque tambin se usan para estudiar una sola
variable, alcanzan su mayor potencia cuando se utilizan para abordar anlisis de tipo
multivariado, por ejemplo para comparar distribuciones.
.
.
.
.
.

- 45 -
3.4 3.4 3.4 3.4 Ejercicio Ejercicio Ejercicio Ejercicios. s. s. s.
1. La persona encargada de administrar un taller de carros, quiere determinar los motivos
que inducen con ms frecuencia a que los clientes ingresen su automvil para revisin y
mantenimiento. Despus de recoger la informacin va a presentarla en un grfico.
a) Cul es la variable que se va a medir? De qu tipo es?
b) Qu tipo de diagrama es el ms adecuado? Por qu?
2. Un estudiante de derecho quiere determinar la proporcin de estudiantes que hay en cada
una de las carreras que conforman la facultad de Humanidades para corroborar su
afirmacin de que los estudiantes de derecho son los que deciden en una votacin pues
son la mayora. Despus de que haya recogido la informacin va a presentarla en un
grfico.
a) Cul es la variable que se va a medir? De qu tipo es?
b) Qu tipo de diagrama es el ms adecuado? Por qu?
3. El administrador de un supermercado est interesado en determinar si es necesario
instalar ms cajas registradoras en el almacn para darle una atencin ms rpida a la
comunidad. Para el efecto, la persona encargada de hacer la investigacin toma, un da
cualquiera, una muestra aleatoria de 50 compradores y anota el tiempo que cada uno de
ellos gasta haciendo cola para pagar sus compras. Despus de que haya recogido la
informacin va a presentarla en un grfico.
a) Cul es la variable que se va a medir? De qu tipo es?
b) Qu tipo de diagrama es el ms adecuado? Por qu?
4. En el curso de estadstica se han realizado tres parciales. El profesor del curso cree que, en
general, sus alumnos van bien pues la mayora de ellos han aprobado los tres parciales. El
profesor quiere presentar la informacin correspondiente en un diagrama.
a) Cul es la variable que se va a medir? De qu tipo es?
b) Qu tipo de diagrama es el ms adecuado? Por qu?
5. El lenguaje es la herramienta propia del hombre para comunicarse con los otros miembros
de una sociedad. Con el fin de comprobar el cumplimiento de la funcin comunicativa de
su peridico en toda la sociedad cucutea, el director de un destacado diario de la capital
de Santander del Norte, adelant una investigacin que pretenda medir el alcance de la
informacin contenida en el peridico con respecto al grado de comprensin que de sta
lograba el lector. Para tal efecto, se tom una muestra de cien suscriptores del diario a
quienes se pidi calificar tres tipos de escritos segn el grado de dificultad de
comprensin que presentaban. A continuacin se especifica un poco ms el estudio a
travs de cuatro tablas: la primera presenta la muestra estratificada por nivel
socioeconmico de los suscriptores del peridico, la segunda indica los tipos de textos
sometidos a calificacin, la tercera indica la escala de calificaciones para el grado de
dificultad de comprensin del texto y la ltima tabla presenta los resultados, de la
calificacin general a los tres textos, obtenidos segn el nivel socioeconmico.

- 46 -


Alto Alto Alto Alto 20
Medio alto Medio alto Medio alto Medio alto 30
Medio bajo Medio bajo Medio bajo Medio bajo 20
Bajo Bajo Bajo Bajo 30



A AA A Temas de inters general
B BB B Temas sociales y polticos
C CC C Temas especializados




+2 +2 +2 +2 Muy difcil
+1 +1 +1 +1 Difcil
0 00 0 No muy difcil
- -- -1 11 1 Fcil
- -- -2 22 2 Muy fcil

0 +1 +1 0 -1 -1 -1 +2 0 0
Alto Alto Alto Alto
0 +1 +1 -1 -1 -1 0 0 +1 -1
-1 -2 +2 +2 0 0 +1 +1 +1 0
-1 -2 -2 0 0 +1 +1 +2 -1 0 Medio alto Medio alto Medio alto Medio alto
-2 -1 0 0 0 +1 0 0 0 +1
-1 0 +1 0 0 +1 -1 -2 +2 +1
Medio bajo Medio bajo Medio bajo Medio bajo
0 0 +1 +1 0 -1 -1 -1 -1 0
0 0 +1 -1 -2 +2 +2 0 0 0
+1 +1 +1 +2 0 0 0 -1 0 0 Bajo Bajo Bajo Bajo
+1 +1 +1 +2 0 0 +1 +1 0 0

a) Cul es el problema de estudio?
b) Cul es la muestra de estudio?
c) Cules son las variables y de qu tipo son?
d) Elabore una tabla de frecuencias para las calificaciones dadas y represente la
informacin con un grfico apropiado.
e) Elabore tablas de frecuencias y represente en grficos apropiados las calificaciones
obtenidas segn los cuatro niveles socioeconmicos considerados en el conjunto de
datos presentado.
f) Compare los cuatro grficos y concluya sobre la relacin entre el nivel
socioeconmico y el grado de comprensin.
g) Puede concluir algo sobre la diferencia entre grado de comprensin y el tipo de texto
presentado? Explique su respuesta.

6. La siguiente tabla muestra el nmero de hombres y mujeres en los diferentes
departamentos de una empresa. Contabilidad (C), Estadstica (E), Servicios generales (G),
Tesorera (T), Sistemas (S), Ventas (V) y Direccin (D).

C CC C E EE E G GG G T TT T S SS S V VV V D DD D
Hombres Hombres Hombres Hombres 30 35 35 20 25 40 10
Mujeres Mujeres Mujeres Mujeres 40 20 30 25 30 50 20

a) Proponga un grfico apropiado para representar el nmero de mujeres por
departamento.

- 47 -
b) Proponga un grfico apropiado para representar el nmero de mujeres y hombres por
departamento.
c) En qu departamento hay mayor nmero de empleados? Cul grfica muestra ms
claramente este resultado?
d) En qu departamento hay mayor diferencia entre el nmero de hombres y mujeres?
Cul grfica muestra claramente este resultado?
e) Para observar en qu departamento hay mayor porcentaje de mujeres, qu tipo de
grfico se puede utilizar?

7. La tabla que se muestra ms abajo se refiere al comercio de Colombia en el grupo Andino
entre los aos 1975 y 1979. Datos en millones de pesos. Proponga un grfico en el que
pueda comparar las exportaciones y las importaciones por ao. Tendra sentido presentar
los datos en un grfico de columnas o barras porcentuales? Explique.

Ao Ao Ao Ao Exportaciones Exportaciones Exportaciones Exportaciones Importaciones Importaciones Importaciones Importaciones
1975 80 55
1976 90 40
1977 90 55
1978 140 80
1979 160 90

8. En la siguiente tabla se muestran las razones por las cuales 30 computadores configurados
en la universidad se encuentran en el taller de mantenimiento. Las partes se compran a
diferentes proveedores. Las razones por las cuales cada computador entr al taller se
detallan en la siguiente tabla:

N R1 R2 R3 R4 R5 R6 R7 R8 R9 R10 N R1 R2 R3 R4 R5 R6 R7 R8 R9 R10
1 x x x x x 16 x x x x
2 x x x x 17 x x x x x
3 x x x x x x 18 x x x
4 x x x x x 19 x x x x x
5 x 20 x x x x x
6 x x x x 21 x x x
7 x x x 22 x x x
8 x x x x x x 23 x x x x
9 x x 24 x x x x x
10 x x x x 25 x x x
11 x x x 26 x x
12 x x x 27 x x x x x
13 x x x x x 28 x x x x
14 x x x 29 x x x
15 x x x x x x 30 x x x x

- 48 -
Donde las razones son:

R1 = Actualizar sistema operativo R2 = Cambio de batera de la bios
R3 = Molesta la tarjeta de sonido R4 = Molesta la tarjeta de video
R5 = Se desconfigura el teclado R6 = Daada la tarjeta de red
R7 = Escasa memoria R8 = Dao del disco duro
R9 = Dao en unidad de CD R10 = Dao en la unidad 3 A

a) Represente grficamente esta informacin.
b) Sugiera en qu caso se deben tomar medidas correctivas?
9. El siguiente conjunto de datos corresponde al consumo en metros cbicos de agua de 81
residencias de una ciudadela durante el segundo semestre del ao 2006.

40,00 40,30 40,60 40,90 41,20 41,50 41,80 42,10 42,40
40,25 40,70 41,15 41,60 42,05 42,50 42,95 43,40 43,85
40,50 41,10 41,70 42,30 42,90 43,50 44,10 44,70 45,30
40,75 41,50 42,25 43,00 43,75 44,50 45,25 46,00 46,75
41,00 41,90 42,80 43,70 44,60 45,50 46,40 47,30 48,20
41,25 42,30 43,35 44,40 45,45 46,50 47,55 48,60 49,65
41,50 42,70 43,90 45,10 46,30 47,50 48,70 49,90 51,10
41,75 43,10 44,45 45,80 47,15 48,50 49,85 51,20 52,55
42,00 43,50 45,00 46,50 48,00 49,50 51,00 52,50 54,00


a) Elabore tablas de frecuencias relativas y acumuladas.
b) Represente de tres formas diferentes el conjunto de datos.

10. En un zoocriadero destinado a la cra de chigiros para exportacin se ha descuidado la
alimentacin de los animales y se ha presentado un desarrollo inesperado en estos. Se han
clasificado los animales en diez grupos, teniendo en cuenta el peso en kilogramos. La
siguiente tabla muestra la cantidad de animales en cada categora de pesos:

Pesos Pesos Pesos Pesos
35.00 35.00 35.00 35.00 - -- - 85.00 85.00 85.00 85.00
Cantidad de Cantidad de Cantidad de Cantidad de
animales animales animales animales
Porcentaje Porcentaje Porcentaje Porcentaje
de animales de animales de animales de animales
Porcentaje Porcentaje Porcentaje Porcentaje
acumulado acumulado acumulado acumulado
Marca de la Marca de la Marca de la Marca de la
categora categora categora categora
35.00 - 40.00 20
40.10 - 45.00 25
45.10 - 50.00 30
50.10 - 55.00 10
55.10 - 60.00 15
60.10 - 65.00 20
65.10 - 70.00 25
70.10 - 75.00 35
75.10 - 80.00 10
80.10 - 85.00 10


- 49 -
a) Complete la tabla.
b) Estime cuntos animales pesan menos de 70.00 kilos.
c) Estime cuntos animales pesan menos de 58.00 kilos.
11. Indague como se elaboran los grficos de: anillos, burbujas, radial y superficie. Proponga
cuatro conjuntos de datos con los cuales tenga sentido la utilizacin de estos diagramas.
12. En el anlisis multivariado de datos existen algunos mtodos de representacin grfica
como los dispersogramas, las curvas de Andrews y los rostros de Chernov. Investigue cual
es la finalidad de estos grficos y proponga conjuntos datos para los que tenga sentido su
utilizacin.
13. La siguiente tabla presenta la informacin correspondiente a cantidad de estudiantes
matriculados en un postgrado de Estadstica en una universidad del estado, durante el
periodo 1995 2004. H=(Cantidad de hombres), M=(Cantidad de mujeres).

Ao Ao Ao Ao 1995 1995 1995 1995 1996 1996 1996 1996 1997 1997 1997 1997 1998 1998 1998 1998 1999 1999 1999 1999 2000 2000 2000 2000 2001 2001 2001 2001 2002 2002 2002 2002 2003 2003 2003 2003 2004 2004 2004 2004
H HH H 15 18 20 25 20 20 18 10 22 24
M MM M 25 25 22 15 15 17 22 35 25 20
Para la informacin organizada en la tabla, elabore un diagrama de perfiles, un diagrama
de lneas y un diagrama de reas.
14. La informacin que se presenta en la siguiente tabla corresponde a 20 pacientes atendidos
en un consultorio peditrico durante la primera semana del mes de junio. Se ha recabado
la siguiente informacin: X=Edad (en meses), Y=Peso (en gramos), Z=Talla (en
centmetros).
Paciente Paciente Paciente Paciente X = Edad X = Edad X = Edad X = Edad Y = Peso Y = Peso Y = Peso Y = Peso Z = Talla Z = Talla Z = Talla Z = Talla
Beb 01 3 3500 55
Beb 02 4 4500 60
Beb 03 5 6000 60
Beb 04 4 5000 55
Beb 05 5 4500 60
Beb 06 5 7500 65
Beb 07 5 6500 65
Beb 08 6 6000 65
Beb 09 6 7000 55
Beb 10 6 6500 70
Beb 11 8 7500 70
Beb 12 8 8000 75
Beb 13 9 10000 70
Beb 14 9 8500 80
Beb 15 11 10000 85
Beb 16 1 4000 45
Beb 17 1 3500 45
Beb 18 11 10500 90
Beb 19 12 9500 85
Beb 20 7 8000 70

- 50 -
a) Elabore un diagrama de dispersin para las variables Y y Z.
b) Elabore un diagrama de columnas 3D para las variables X y Z.
c) Elabore un diagrama de perfiles para las variables X, Y y Z.
15. Una caja de compensacin ha establecido 10 categoras para clasificar a sus afiliados de
acuerdo a sus salarios, de tal manera que un afiliado queda clasificado en la categora Cn
si su salario se encuentra en el intervalo [535.000n, 535.000(n+1)), donde n=1,2,3,,10. La
cantidad de empleados en cada categora es:

16. C
1
17. C
2
18. C
3
19. C
4
20. C
5
21. C
6
22. C
7
23. C
8
24. C
9
25. C
10

26. 25
0
27. 35
0
28. 50
0
29. 70
0
30. 70
0
31. 75
0
32. 40
0
33. 40
0
34. 20
0
35. 25
0

a) Qu porcentaje de afiliados tiene salarios entre $2.500.000 y $3.500.000?
b) Qu porcentaje de afiliados tiene salarios superiores o iguales a $3.000.000?
c) Elabore un grfico adecuado para representar la informacin de la caja de
compensacin.
16. Un estudiante contesta al azar las 10 preguntas de un examen, en donde cada pregunta
tiene cuatro opciones de respuesta, pero solo una opcin es la respuesta correcta.
Elabore una tabla de frecuencias relativas en donde se clasifiquen todas las posibles
formas de contestar el examen de acuerdo a la variable aleatoria X definida como
Cantidad de aciertos que puede obtener el estudiante.
17. En un instituto que cuenta con 12 especialistas (3 fisilogos, 4 genetistas, 5 inmunlogos)
se seleccionar aleatoriamente un grupo de 4 para realizar una investigacin en un
laboratorio extranjero. Elabore una tabla de frecuencias relativas en donde los grupos se
clasifiquen los posibles grupos de acuerdo a la cantidad de fisilogos que queden en los
grupos.
18. Una moneda que no tiene Cara y Sello sino 2 y 3 se lanza 10 veces. Se anota la sucesin
de los 10 nmeros resultantes (2`s y 3`s) y se suman estos 10 nmeros. Elabore una tabla
de frecuencias relativas en donde se clasifiquen los posibles resultados de acuerdo a la
suma de los 10 nmeros resultantes.
19. Se extraen simultneamente 5 cartas de una baraja de 52 cartas y se observa la cantidad de
Ases resultantes en la muestra extrada. Elabore una tabla de frecuencias relativas en
donde se clasifiquen las posibles muestras de acuerdo a la cantidad de Ases posibles en
las muestras.
20. En un recipiente se encuentran 5 objetos: 3 buenos y 2 defectuosos. Se extrae una muestra
de dos objetos, uno tras otro sin reemplazo. Sea X el nmero de objetos defectuosos en la
primera extraccin, y Y el nmero de objetos defectuosos en la segunda extraccin.
a) Elabore una tabla de frecuencias absolutas en donde se clasifiquen las posibles
muestras resultantes de acuerdo a las variables X y Y.

- 51 -
b) Elabore una tabla de frecuencias relativas en donde se clasifiquen las posibles
muestras resultantes de acuerdo a las variables X y Y.
21. Una compaa ofrece dos seguros a sus clientes: seguro de automvil y seguro de
vivienda. Las plizas para seguro de automvil son de $ 100, $ 200 y $ 300; mientras que
las plizas para seguro de vivienda son de $ 50, $ 150 y $ 250. Sea X la cantidad pagada
por la pliza de automvil, y Y la cantidad pagada por la pliza de vivienda. La siguiente
tabla muestra la cantidad de personas en los diferentes pares de seguros. Hallar la tabla de
frecuencias relativas.

Y YY Y
(X,Y) (X,Y) (X,Y) (X,Y)
50 50 50 50 150 150 150 150 250 250 250 250
100 100 100 100 30 40 50
2 22 200 00 00 00 60 20 20 X XX X
300 300 300 300 60 40 80

22. Se lanza 5 veces una moneda y se anotan las figuras que resultan (Cara, Sello). Sea X el
nmero de caras en los dos primeros lanzamientos, y Y el nmero total de caras en los
cinco lanzamientos. Elabore una tabla de frecuencias relativas en donde se clasifiquen los
posibles resultados en los cinco lanzamientos de acuerdo a las variables X y Y.
23. Un dado balanceado se lanza dos veces y se anotan los nmeros obtenidos. Sea X es el
nmero de cuatros, y Y es el nmero de cincos, que se obtienen en dos lanzamientos del
dado. Elabore una tabla de frecuencias relativas en donde se clasifiquen los posibles
resultados en los dos lanzamientos de acuerdo a las variables X y Y.
24. Se quiere conformar una brigada de salud de 10 profesionales para atender una
emergencia en una poblacin que sufri las inundaciones de dos ros que la atraviesan. La
secretara de salud de la regin dispone de 12 mdicos, 15 enfermeras, 6
gastroenterlogos y 7 epidemilogos. Se define X como el nmero de mdicos en la
brigada, y Y como el nmero de enfermeras en la brigada. Elabore una tabla de
frecuencias relativas en donde se clasifiquen las posibles brigadas de acuerdo a las
variables X y Y.
25. Una moneda que no tiene Cara y Sello sino 2 y 4 se lanza cuatro veces. Se anota el
nmero que resulta a medida que se lanza la moneda. Sea X la suma acumulada en los
dos primeros lanzamientos, y Y la suma acumulada en los cuatro lanzamientos. Elabore
una tabla de frecuencias relativas en donde se clasifiquen los posibles resultados en los
cuatro lanzamientos de acuerdo a las variables X y Y.
26. Un almacn tiene en existencia 30 componentes de cierto tipo, 8 de los cuales fueron
proporcionados por el proveedor 1, 10 por el proveedor 2 y 12 por el proveedor 3. Se va a
seleccionar una muestra de 6 componentes. Sea X el nmero de componentes
seleccionados del proveedor 1, Y el nmero de componentes seleccionados del proveedor
2, y Z el nmero de componentes seleccionados del proveedor 3.

- 52 -
a) Elabore una tabla de frecuencias relativas en donde se clasifiquen las posibles
muestras resultantes de acuerdo a las variables X y Y.
b) Elabore una tabla de frecuencias relativas en donde se clasifiquen las posibles
muestras resultantes de acuerdo a las variables X y Z.
c) Elabore una tabla de frecuencias relativas en donde se clasifiquen las posibles
muestras resultantes de acuerdo a las variables Y y Z.

27. Se seleccionan 4 repuestos para un bolgrafo de una caja que contiene 3 repuestos azules,
4 rojos y 5 negros. Supngase que X representa el nmero de repuestos azules en la
muestra seleccionada, y Y el nmero de repuestos rojos en la muestra seleccionada.
Elabore una tabla de frecuencias relativas en donde se clasifiquen las posibles muestras de
acuerdo a las variables X y Y.

28. En un grupo de 9 ejecutivos de una empresa hay 4 que son casados, 3 solteros y 2
divorciados. Se debe hacer una seleccin 3 ejecutivos. Sea X el nmero de ejecutivos
casados en la seleccin, Y el nmero de ejecutivos solteros en la seleccin. Elabore las
tablas de frecuencias absolutas y relativas en donde se clasifiquen las posibles selecciones
de acuerdo a las variables X y Y.

29. Un dado balanceado se lanza 5 veces y se anotan los nmeros obtenidos. Sea X es el
nmero de cuatros en los tres primeros lanzamientos, y Y es el nmero de cuatros en los
cinco lanzamientos. Elabore una tabla de frecuencias relativas en donde se clasifiquen los
posibles resultados en los cinco lanzamientos de acuerdo a las variables X y Y.

30. Una urna contiene 6 bolas de colores diferentes: dos numeradas con el nmero 3 y cuatro
numeradas con el nmero 6. Se seleccionan dos bolas simultneamente. Sea X el menor
de los nmeros seleccionados, y Y el mayor de los nmeros seleccionados. Elabore una
tabla de frecuencias relativas en donde se clasifiquen las posibles selecciones de acuerdo
a las variables X y Y.

31. Una urna contiene 5 bolas de colores diferentes: dos numeradas con el nmero 2 y tres
numeradas con el nmero 3. Se seleccionan tres bolas simultneamente. Sea X el menor
de los nmeros seleccionados, y Y el mayor de los nmeros seleccionados. Elabore las
tablas de frecuencias absolutas y relativas en donde se clasifiquen las posibles selecciones
de acuerdo a las variables X y Y.

32. Se lanza cuatro veces un dado y se anota el nmero que resulta en cada lanzamiento. Sea
X la cantidad de nmeros pares en los dos primeros lanzamientos, y Y la cantidad de
nmeros pares en los cuatro lanzamientos. Elabore las tablas de frecuencias absolutas y
relativas en donde se clasifiquen los posibles resultados de acuerdo a las dos variables
definidas.

- 53 -
33. De una baraja de 52 cartas se extraen 5 cartas, una tras otra sin reposicin, y se va
anotando el valor de la carta. Sea X la cantidad de Ases acumulados al finalizar la tercera
extraccin, y Y la cantidad de Ases acumulados al finalizar la quinta extraccin. Elabore las
tablas de frecuencias absolutas y relativas en donde se clasifiquen los posibles resultados
de las cinco extracciones de acuerdo a las variables X y Y.

34. Se sacan simultneamente 4 cartas de las 16 cartas de las letras J, Q, K y A, que tiene una
baraja de 52 cartas. Sea X el nmero de Jotas, y Y el nmeros de Ases que resultan en la
muestra seleccionada. Elabore las tablas de frecuencias absolutas y relativas en donde se
clasifiquen las posibles muestras resultantes de acuerdo a las variables X y Y.

35. De una baraja de 52 cartas se seleccionan simultneamente 5 cartas, se anota valor y palo
de las cartas seleccionadas, y no se reponen. Luego se seleccionan simultneamente otras
tres cartas de las 47 cartas restantes, se anota valor y palo de las cartas seleccionadas, y no
se reponen. Sea X la cantidad de cartas de trboles en la primera seleccin, y Y la cantidad
de cartas de trboles en la segunda seleccin. Elabore las tablas de frecuencias absolutas y
relativas en donde se clasifiquen los posibles resultados de las dos selecciones hechas de
acuerdo a las variables X y Y.


















- 54 -
4. 4. 4. 4. M MM MEDIDAS DE EDIDAS DE EDIDAS DE EDIDAS DE C CC CENTRALIZACIN Y ENTRALIZACIN Y ENTRALIZACIN Y ENTRALIZACIN Y L LL LOCALIZACIN OCALIZACIN OCALIZACIN OCALIZACIN

4.1 Introduccin. 4.1 Introduccin. 4.1 Introduccin. 4.1 Introduccin.
La elaboracin de tablas de distribucin de frecuencias hace parte, como se dijo en el captulo
anterior, del proceso de reduccin de los datos estadsticos. La mxima expresin del
resumen de todos los datos observados, relativos a una variable, se obtiene al elegir un nico
valor representativo o tpico de la distribucin.
Cuando los datos observados corresponden todos a una poblacin de estudio, este valor
representativo o tpico, que es fijo para cada poblacin, recibe el nombre de parmetro parmetro parmetro parmetro. Sin
embargo, lo ms usual es trabajar con datos de una o varias muestras dicho valor
representativo, que al referirse a una muestra recibe el nombre de estadstico estadstico estadstico estadstico o estadgrafo estadgrafo estadgrafo estadgrafo. Lo
habitual es que el valor de un estadstico vare de una u otra muestra acercndose ms menos
al valor del parmetro. Justamente es la estadstica inferencial o inductiva la que establece las
condiciones bajo las cuales el estadstico representa al parmetro que pretende estimar.
En realidad, los resmenes numricos o estadsticos, surgen de la necesidad de modelar la
variacin estadstica en diferentes sentidos: localizacin, dispersin, forma (asimetra y
curtosis) y concentracin. Para ello se suele considerar diferentes tipos de estadsticas o
estadgrafos que concretan cada una de estos conceptos en trminos de una medicin
estadstica.
En este captulo centraremos la discusin en las medidas de localizacin y trataremos de
responder a cuestiones como qu son, cules son, cmo se definen, qu propiedades,
ventajas e inconvenientes las caracterizan y en qu tipos de problemas o situaciones se
aplican.
Las medidas de localizacin medidas de localizacin medidas de localizacin medidas de localizacin, tambin conocidas como medidas de posicin, son un conjunto
de estadgrafos con los que se busca identificar un valor que resuma, represente o caracterice
una posicin o tendencia particular de un conjunto de datos. Algunos ejemplos de medidas
de localizacin son: el mximo de los datos, el mnimo de los datos, la media aritmtica, los
cuantiles y la moda. El caso particular y ms relevante de las medidas de localizacin lo
constituyen las medidas de tendencia central medidas de tendencia central medidas de tendencia central medidas de tendencia central que buscan identificar un valor intermedio, ms
caracterstico o de posicin central de los datos. De los ejemplos nombrados antes slo la
media aritmtica y la moda son medidas de tendencia central. Los procedimientos de clculo
y las caractersticas de estas medidas varan de acuerdo al tipo de variables que se quiera
resumir y a la cantidad de informacin que se trabaje.
En lo que sigue, primero se har una descripcin de las medidas de tendencia central ms
conocidas, luego se comentarn otras medidas de localizacin como los cuartiles y finalmente
se presentar una serie de ejemplos, para ilustrar el clculo y la eleccin apropiada de los
diferentes estadsticos de localizacin.

- 55 -
4.2 Media aritmtica. 4.2 Media aritmtica. 4.2 Media aritmtica. 4.2 Media aritmtica.
La media aritmtica denotada por , X es quizs la medida de tendencia central ms utilizada,
conocida y sencilla de calcular. Adems, es una medida de gran estabilidad en el muestreo y
sus frmulas admiten tratamientos algebraicos. Su principal desventaja es la de ser muy
sensible a cambios que se hagan en alguno de sus valores, como por ejemplo cuando los
valores extremos son valores demasiado grandes o pequeos.
La media aritmtica es el nmero obtenido al dividir la suma de todos los valores de la
variable entre el nmero total de observaciones, y se puede definir de manera general, a
travs de la expresin
k
i i
i 1
k
i
i 1
x n
X
n
=
=
=

.
En realidad esta expresin usualmente se utiliza cuando se trabaja con datos agrupados en
donde los n
i
representan las frecuencias absolutas y los x
i
representan los diferentes valores
que asumen los datos, o bien corresponden a las marcas de clase m
i
de tablas de variable
continua. Entonces, el nmero de marcas de clase o de valores diferentes es k y el total de
datos es
k
i
i 1
n .
=
Cuando no se trabaja con datos agrupados se entiende que n
i
= 1 para toda i,
que
k
i
i 1
n
=
= n el total de datos y la media aritmtica simplemente se denota como:
n
i
i 1
x
X
n
=
=



En cuanto a las propiedades que caracterizan a la media aritmtica tenemos:
Si los datos x
i
se transforman en datos de la forma y
i
= a + b x
i
, entonces se tiene que Y = a
+ b X
La suma de las desviaciones de los valores de una variable x, respecto a su media
aritmtica es cero. Es decir,
n
i
i 1
(x x) 0
=
=
La suma de las desviaciones al cuadrado es mnima en X, es decir, X es el valor que
minimiza la funcin
F(u) =
n
2
i
i 1
(x u)
=


Respecto a sus ventajas se pueden citar las siguientes:
Es quizs, la medida ms fcil de entender, la ms usada y viene expresada en las mismas
unidades que la variable.
Es un nmero comprendido entre el menor y el mayor de los valores a los que se aplica.

- 56 -
En su clculo intervienen todos los valores de la distribucin de datos.
Representa, en trminos fsicos, el centro de gravedad de toda la distribucin de datos.
Es nica, ya que X sin agrupar se puede ver como una funcin de R
n
en R y de manera
similar para X agrupada.
Es muy estable en el muestreo de datos.
Es altamente sensible a cualquier cambio en los datos de la distribucin.
Es adaptable cuando se trata de hacer clculos matemticos posteriores con sta, como en
el caso del promedio ponderado o del promedio de promedios.

En cuanto a sus inconvenientes se tiene que:
Se ve afectada por los valores extremadamente grandes o pequeos de la distribucin de
los datos. Por ello, la inclusin de valores atpicos en la distribucin que se est
estudiando, puede dar una media aritmtica que no sea realmente un representante tpico
del grupo.
Cuando una distribucin de datos es marcadamente asimtrica, casos donde la media
aritmtica, la mediana y la moda difieren en forma apreciable, debe considerarse la
posibilidad de que pueda no ser el nico valor representativo de los datos.
Cuando la distribucin de datos tiene forma de U, la media aritmtica corresponde a los
valores menos comunes de los datos y por tanto, puede dar una idea irreal de la
distribucin.
4.3 Media aritmtica ponderada (W). 4.3 Media aritmtica ponderada (W). 4.3 Media aritmtica ponderada (W). 4.3 Media aritmtica ponderada (W).
La media aritmtica ponderada, denotada como W, es una variacin de la media aritmtica
que se emplea en distribuciones de tipo univariado, en las que se introducen unos
coeficientes de ponderacin, denominados w
i
, que son valores positivos que representan el
nmero de veces que un valor de la variable es ms importante que otro.
k
w
i i
i 1
k
w
i
i 1
x
W
=
=
=


En general la media aritmtica ponderada goza de las mismas propiedades, ventajas e
inconvenientes de la media aritmtica, ya que se puede equiparar con una media aritmtica
agrupada.
4.4 Media geomtrica (G). 4.4 Media geomtrica (G). 4.4 Media geomtrica (G). 4.4 Media geomtrica (G).
Para una distribucin de frecuencias definida en trminos de k parejas (x
i
, n
i
), la media
geomtrica, que denotaremos como G, se define como la raz n-sima del producto de los n
valores, es decir
3 1 2 k
n n n n
...
1 2 3
k
n
G x x x x = .

- 57 -
Si se utilizan datos sin agrupar se reduce simplemente a
1 2 3 n
n
G x x x ...x = .

El empleo ms frecuente de la media geomtrica es el de promediar mediciones tales como
porcentajes, tasas, nmeros ndices. etc., es decir, en los casos en los que se supone que la
variable presenta variaciones acumulativas.
En cuanto a las ventajas e inconvenientes de la media geomtrica se destaca lo siguiente:
En su clculo intervienen todos los valores de la distribucin.
Su valor est comprendido entre el menor y el mayor de los datos.
Ante la presencia de valores extremos tienen menor influencia que en el caso de la media
aritmtica.
Es nica, ya que se puede ver como una funcin de R
n
en R
Su clculo es ms complicado que el de la media aritmtica.
No cambia cuando se reordenan los valores de la variable y cumple la propiedad de
homogeneidad.
Cuando la variable toma al menos un valor x
i
= 0 entonces G se anula, y si la variable toma
valores negativos se pueden presentar una gama de casos particulares en los que tampoco
queda determinada debido al problema de las races de ndice par para nmeros
negativos.
4.5 Media armnica (H). 4.5 Media armnica (H). 4.5 Media armnica (H). 4.5 Media armnica (H).
Hay ocasiones en que los valores de una variable vienen expresados en trminos de otra que
es inversamente proporcional o recproca de la primera como en el caso de la velocidad y el
tiempo o de la demanda de un bien y su precio de mercado. En estos casos se necesita un
promedio que tenga en cuenta la reciprocidad. La media armnica, que se denotar como H,
satisface estos requerimientos y se define as:
k
i
i
i 1
N
H
1
n
x
=
=


Para datos sin agrupar la media armnica simplemente ser:
n
i
i 1
n
H
1
x
=
=


En cuanto a las ventajas e inconvenientes de la media armnica se mencionan las siguientes:
Es nica y en su clculo intervienen todos los valores de la distribucin.
Su valor siempre estar comprendida entre el menor y el mayor de los valores de la
variable.
Su clculo no tiene sentido cuando algn valor de la variable toma el valor cero.
Su uso no es recomendable en distribuciones de variables con valores pequeos.

- 58 -
4.6 Error medio cuadrtico (Emc). 4.6 Error medio cuadrtico (Emc). 4.6 Error medio cuadrtico (Emc). 4.6 Error medio cuadrtico (Emc).
Esta medida, que se denota como Emc, se usa raramente como medida de tendencia central.
Por ejemplo, se utiliza cuando se quiere dar un estimativo del error cometido en una
medicin en donde hay valores negativos y positivos y se quiere prescindir de si estos errores
fueron por exceso o por defecto.
Para datos agrupados se define como
k
i 1
1
2
i i
n
Emc (x x) n
=
=


Para datos sin agrupar se define como
n
i 1
1
2
i
n
Emc (x x)
=
=


En cuanto a ventajas e inconvenientes cabe sealar los siguientes:
Es demasiado sensible a la oscilacin de valores extremos.
Es invariante ante una reordenacin de los datos.
Satisface la propiedad de homogeneidad
En el ejemplo 14 de la prxima seccin, se comentan ms detalles acerca de esta medida, y de
la forma como se define.
4.7 Media potencial (Mp). 4.7 Media potencial (Mp). 4.7 Media potencial (Mp). 4.7 Media potencial (Mp).
Se llama media potencial media potencial media potencial media potencial de grado p pp p de los nmeros x
1
, x
2
, ,x
n
al nmero Mp definido como
1/p
p p p
1 2 n
x x ... x
Mp
n
| |
+ + +
= |
|
\
.
En particular:
Si p=2, el nmero
1/2
2 2 2
1 2 n
2
x x ... x
M
n
| |
+ + +
= |
|
\
se llama media cuadrtica media cuadrtica media cuadrtica media cuadrtica.
Si p=-1, el nmero
1
1 1 1
1 2 n
1
1 2 n
x x ... x n
M
1 1 1 n
...
x x x

| |
+ + +
= = |
|
\
+ + +
se llama media media media media
armnica armnica armnica armnica.
4.8 Mediana (Me). 4.8 Mediana (Me). 4.8 Mediana (Me). 4.8 Mediana (Me).
Dada una distribucin de frecuencias con los valores ordenados de menor a mayor, se llama
mediana y se representa por Me, al valor de la variable, que deja a su izquierda el mismo
nmero de frecuencias que a su derecha, o en trminos ms sencillos, la mediana es el valor
que divide al conjunto en dos partes iguales, de tal forma que el nmero de valores mayor o
igual a la mediana es igual al nmero de valores menores o igual a sta. Para el clculo de la
mediana se contemplan tres casos.

- 59 -
En primer lugar, la determinacin del valor de la mediana para variables discretas no
agrupadas de un conjunto de n datos se puede realizar as: primero se ordenan los datos en
una tabla de frecuencias y se calcula n/2, luego se construye la columna de las frecuencias
acumuladas (N
i
) y entonces se observa cual es la primera N
i
que supera o iguala a n/2
distinguindose dos casos:
Si existe un valor x
i
tal que N
i-1
< n/2 < N
i
, la mediana es Me = x
i
.
Si existe un valor x
i
tal que N
i
= n/2, la mediana es Me = (x
i
+ x
i+1
)/2.
En segundo lugar, cuando no se tiene a la mano una distribucin de frecuencias o no se desea
elaborarla, debido por ejemplo, a que hay muy pocos datos, el clculo de la mediana se
puede realizar as: se ordenan los datos de menor a mayor o viceversa y dependiendo del
nmero de observaciones se darn dos casos:
Si el nmero de datos es impar, la mediana es igual al dato central, es decir al dato nmero
(n+1)/2.
Si el nmero de datos es par, la mediana es igual al promedio aritmtico de los datos
centrales o a cualquier valor comprendido entre ellos.
Finalmente, cuando se tiene una variable continua agrupada en una tabla de frecuencias, la
mediana se puede calcular teniendo en cuenta dos casos:
Caso 1: cuando
j 1
n
N
2

= se tiene Me = y
j-1

Caso 2: cuando
j 1
n
N
2
<

se tiene Me = y
j-1
+
n
N
j 1
2
n
j
C
(

(
(
(


Donde n es el nmero de observaciones, C es la amplitud de la clase, y
j-1
es el extremo
inferior de la clase a la cual pertenece la mediana, n
j
es la frecuencia absoluta de la clase a la
que pertenece la mediana y
j 1
N

es la frecuencia acumulada correspondiente a la clase


anterior a la que contiene la mediana.
Una propiedad interesante de la mediana es que la suma de los valores absolutos de las
desviaciones tiene su valor mnimo, cuando se consideran las desviaciones con respecto a la
mediana, es decir, el valor que minimiza la funcin G es la mediana donde
n
i
i 1
G(u) x u
=
=


En cuanto a las ventajas e inconvenientes se mencionan los siguientes:
Es la medida ms representativa en el caso de variables que slo admitan la escala ordinal.
Es fcil de calcular cuando se tienen pocos datos.
En su clculo slo influyen los valores centrales y es insensible a los valores extremos o
atpicos, lo cual tambin se puede ver como una desventaja si no hay valores atpicos.
En su determinacin no intervienen todos los valores de la variable, por lo que no
aprovecha toda la informacin de los datos.

- 60 -
Tiene menor estabilidad en el muestreo que la media aritmtica, pero es ms estable que
otras medidas.
La mediana no se adapta a clculos posteriores aritmticos, en la medida en que si
obtenemos las medianas de diferentes grupos, no podemos obtener una mediana de los
grupos reunidos.
4.9 Cuantiles. 4.9 Cuantiles. 4.9 Cuantiles. 4.9 Cuantiles.
Los cuantiles se pueden ver como una familia general de estadsticos de localizacin, ya que
son aquellos valores de la variable, que ordenados de menor a mayor, dividen a la
distribucin de datos en partes, de tal manera que cada una de ellas contiene el mismo
nmero de frecuencias. Los cuantiles ms conocidos son los Cuartiles (Qi), los Deciles (Di) y
los Percentiles (Pi). En lo que sigue se dedicar ms atencin a los cuartiles, pues, como se
reporta en el captulo anterior, es con base en ellos que se construye e interpreta el Grfico de
caja.

4.9.1 Cuartiles (Q 4.9.1 Cuartiles (Q 4.9.1 Cuartiles (Q 4.9.1 Cuartiles (Q
i ii i
). ). ). ).
Con base en estos estadsticos se identifican valores de la variable que dividen la distribucin
de datos, previamente ordenada de menor a mayor, en cuatro partes, cada una de las cuales
engloba el 25% de las mismas. Se denotan de la siguiente forma: Q
1
es el primer cuartil que
deja a su izquierda el 25 % de los datos; Q
2
es el segundo cuartil que deja a su izquierda el
50% de los datos (este cuartil es la misma mediana), y Q
3
es el tercer cuartil que deja a su
izquierda el 75% de los datos.
En cuanto al clculo de los cuartiles es curioso y confuso, ver que hay diferentes criterios para
determinar los cuartiles. Behar y Grima (2004) comentan e ilustran cuatro mtodos de los que
se dar cuenta en este apartado: el de Tukey, el de Moore y McCabe, el de Minitab y el de
Excel. Se comienza comentado el mtodo de Tukey.

Mtodo de Tukey Mtodo de Tukey Mtodo de Tukey Mtodo de Tukey
(Para un nmero impar de datos)
2 4 6 8 10

Q
1
= 4 Me = 6 Q
3
= 8
Mtodo de Tukey
(Para un nmero par de datos)
2 4 -- 6 8
Q
1
= 3 Me = 5 Q
3
= 7
Tabla 1. Ejemplo del mtodo de Tukey para calcular los cuartiles

En la Tabla 1 se distinguen dos casos. Cuando hay un nmero impar de datos (en el ejemplo
hay cinco datos) los cuartiles Q
1
y Q
3
coinciden con los valores de los datos ubicados en la
posicin segunda y cuarta respectivamente, mientras que cuando hay un nmero par de
datos, Tukey propone calcular el promedio de los datos primero y segundo para Q
1
y de los
datos tercero y cuarto para Q
3
.


- 61 -

Mtodo de Moore y McCabe Mtodo de Moore y McCabe Mtodo de Moore y McCabe Mtodo de Moore y McCabe
(Para un nmero impar de datos)
2 4 6 8 10
Q
1
= 3 Me = 6 Q
3
= 9
Mtodo de Moore y McCabe
(Para un nmero par de datos es igual a Tukey)
2 4 -- 6 8
Q
1
= 3 Me = 5 Q
3
= 7
Tabla 2. Ejemplo del mtodo de Moore y McCabe para calcular los cuartiles

Cuando hay un nmero impar de datos, Moore y McCabe prefieren, como se puede ver en la
Tabla 2, calcular el promedio de los datos primero y segundo para Q
1
, y de los datos cuarto y
quinto para Q
3
. Para el caso de un nmero par de datos, el mtodo de Moore y McCabe
coincide con el de Tukey.

Mtodo de Minitab Mtodo de Minitab Mtodo de Minitab Mtodo de Minitab - Usa posicionadores 0,25( n+1) y 0,75( n+1)
Para nmero par de datos usa como interpoladores
Q
1
= x
1
+ 0,25(x
2
-x
1
) y Q
3
= x
3
+ 0,75(x
4
-x
3
)
Para nmero impar de datos usa como interpoladores
Q
1
= x
1
+ 0,5(x
2
-x
1
) y Q
3
= x
3
+ 0,5(x
5
-x
4
)
2 4 -- 6 8
Q
1
= 2,5 Me = 5 Q
3
= 7,5

2 4 6 8 10
Q
1
= 3 Me = 6 Q
3
= 9
Tabla 3. Ejemplo del mtodo de Minitab para calcular los cuartiles
En cuanto a los programas para computadora, como Minitab y Excel, los algoritmos que se
emplean utilizan la idea de posicionadores. En particular, Minitab utiliza las expresiones
0,25(n+1) y 0,75(n+1) para identificar las posiciones de Q
1
y Q
3
respectivamente. En la Tabla 3,
cuando n = 4 se tiene que 0,25 (n+1) = 1,25, lo que indica que el valor de Q
1
estar entre los
dato x
1
y x
2,
de manera que Q
1
= x
1
+ 0,75(x
2
-x
1
) = 2,5. En cambio en Excel, como se ve en la
Tabla 4, cuando n = 4 el posicionador da 0,25(n-1) + 1 = 1,75, lo que indica tambin que el
valor de Q
1
estar entre los dato x
1
y x
2,
pero en este caso Q
1
= x
1
+ 0,75(x
2
-x
1
) = 3,5.

Mtodo de Excel Mtodo de Excel Mtodo de Excel Mtodo de Excel - Posicionadores: 0,25( n-1) +1 y 0,75( n-1) +1
Para nmero par de datos usa como interpoladores
Q
1
= x
1
+ 0,75(x
2
-x
1
) y Q
3
= x
3
+0,25(x
4
-x
3
)
Para nmero impar de datos el posicionador da una posicin exacta.
2
4 -- 6 8
Q
1
= 3,5 Me =5 Q
3
= 6,5

2
4 6 8 10
Q
1
= 4 Me = 6 Q
3
= 8
Tabla 4. Ejemplo del mtodo de Excel para calcular los cuartiles


- 62 -
En la Tabla 5 se presenta un resumen de los valores obtenidos cuando se aplica cada mtodo.

Datos: 2, 4, 6, 8 Datos: 2, 4, 6, 8, 10
Mtodo
Q
1
Q
3
Q
1
Q
3

Tukey 3 7 4 8
Moore McCabe 3 7 3 9
Minitab 2,5 7,5 3 9
Excel 3,5 6,5 4 8
Tabla 5. Resumen de los cuatro mtodos utilizados para calcular los cuartiles
Entonces la pregunta que surge es cul es el mtodo ms correcto? Para Behar y Grima esto
no importa demasiado en la prctica, ya que cuando se est interesado en conocer el valor de
los cuartiles el conjunto de datos es grande, lo que implica que las diferencias entre los
diferentes mtodos sern muy pequeas.
4.9.2 Deciles (D 4.9.2 Deciles (D 4.9.2 Deciles (D 4.9.2 Deciles (D
i ii i
) y Percentiles (P ) y Percentiles (P ) y Percentiles (P ) y Percentiles (P
i ii i
). ). ). ).
Los deciles son los valores de la variable que dividen a la distribucin de datos en partes
iguales, cada una de las cuales engloba el 10 % de los datos; en total habr 9 deciles. Los
percentiles son los valores que dividen a la distribucin de datos en 100 partes iguales, cada
una de las cuales engloba el 1% de las observaciones; en total habr 99 percentiles.
4.10 Moda (M 4.10 Moda (M 4.10 Moda (M 4.10 Moda (M
O OO O
). ). ). ).
La moda, que se denotar como Mo, es el valor de la variable que ms veces se repite. Cuando
se tienen distribuciones de frecuencias agrupadas en intervalos y se identifica en la columna
de frecuencias el valor de la distribucin al que corresponde la mayor frecuencia, el
respectivo intervalo se lo llamar clase modal.
En cuanto al clculo de la moda, la determinacin de la moda no tiene mayor problema si hay
pocos datos y/o no estn agrupados. Sin embargo, la situacin es un poco ms complicada si
los datos vienen agrupados. En este caso, cuando los intervalos son de distinta amplitud, se
define el intervalo modal, y se denota por (L
i-1
, L
i
], como aquel que posee mayor densidad de
frecuencia, donde h
i
= n
i
/c
i
, y n
i
es la frecuencia absoluta y c
i
la amplitud del intervalo i. Bajo
esta notacin se tiene que la moda es dada por:
i 1
i 1 i
i 1 i 1
h
Mo L c
h h
+

+
= +
+

En el caso de intervalos de igual longitud las densidades de las frecuencias se cambian por las
respectivas frecuencias absolutas. En el caso de esta medida de tendencia central, a veces
aparecen distribuciones de variables con ms de una moda llamadas bimodales, trimodales,
etctera o incluso con una moda absoluta y otras relativas.
En cuanto a ventajas y desventajas de la moda se mencionan las siguientes:
Su determinacin es muy sencilla, cuando los datos no estn agrupados y es de fcil
interpretacin.

- 63 -
Es la nica medida de posicin central que puede obtenerse en las variables de tipo
cualitativo de escala nominal.
En su determinacin no intervienen todos los valores de la distribucin de datos.

4.11 La relacin 4.11 La relacin 4.11 La relacin 4.11 La relacin X XX X > Me > Mo. > Me > Mo. > Me > Mo. > Me > Mo.
Es interesante identificar algunas relaciones que existen entre diferentes medidas de tendencia
central. Por ejemplo, si la distribucin de datos es bastante simtrica, los valores de la media
aritmtica, la mediana y la moda, tendern a ser iguales.
Cuando X > Me > Mo, la distribucin de los datos tendr una asimetra positiva, mientras que
si X < Me < Mo la distribucin de datos tendr una asimetra negativa. Adems, entre media
aritmtica, mediana y moda, la relacin ( X Mo) 3( X Me), se puede verificar de manera
emprica, cuando se tiene una distribucin de datos convexa y moderadamente asimtrica, ya
que la mediana cae entre la media aritmtica y la moda, quedando aproximadamente dos
veces ms lejos de esta ltima que de la primera.
4.12 La relacin H < G < 4.12 La relacin H < G < 4.12 La relacin H < G < 4.12 La relacin H < G < X XX X < Q < Q < Q < Q para dos datos para dos datos para dos datos para dos datos. .. .
Resulta muy interesante y bastante ilustrativo considerar algunas construcciones geomtricas
que permiten comparar las medias armnica (H), geomtrica (G), aritmtica ( X ) y cuadrtica
(Q), y concluir la desigualdad Q> X >G>H.
a) Primera Primera Primera Primera ilustraci ilustraci ilustraci ilustracin nn n. Inicialmente se realizar en el plano coordenado XY la construccin
que se muestra en la siguiente figura, y luego se demostrar la desigualdad para dos
valores positivos a y b.

Figura 1.

- Sobre una recta horizontal se ubican los puntos O, A y B tales que las longitudes de los
segmentos OA y AB son respectivamente a y b.
- M el punto medio del segmento OB y OM mide
a b
2
+
.

- 64 -
- Se traza una semicircunferencia con centro en M y radio OM.
- Los segmentos CA y DM son perpendiculares al segmento OB. Los puntos C y D son
puntos de la semicircunferencia.
- El segmento AE es perpendicular al segmento CM.
- Los puntos O, C y B son vrtices de un tringulo rectngulo. En un tringulo
rectngulo, la altura correspondiente a la hipotenusa es media geomtrica de los
segmentos en los cuales la hipotenusa es dividida por dicha altura. Aplicando este
teorema, el segmento CA es media geomtrica de los segmentos OA y AB, es decir,
CA= ab .
- El segmento AM mide
b a
2

y el segmento DM mide
a b
2
+
. Aplicando el teorema de
Pitgoras en el tringulo AMD se obtiene que el segmento AD mide
2 2
a b
2
+
.
- El segmento CM mide
a b
2
+
y los tringulos CAM y CEA son semejantes. De la
proporcin
CE CA
CA CM
= resulta
2ab
CE
a b
=
+
.
- Hasta aqu se tiene que
2ab
CE H
a b
= =
+
(Media armnica), CA ab G = = (Media
geomtrica),
a b
CM DM X
2
+
= = = (Media aritmtica) y
2 2
a b
AD Q
2
+
= = (Media
cuadrtica).
- Para demostrar la cadena de desigualdades, observe que en el tringulo AEC,
2ab
CE H
a b
= =
+
es un cateto y CA ab G = = es la hipotenusa, por lo tanto H<G. En
el tringulo MAC, CA ab G = = es un cateto y
a b
CM X
2
+
= = es la hipotenusa,
entonces G< X . En el tringulo AMD,
a b
DM X
2
+
= = es un cateto y
2 2
a b
AD Q
2
+
= = es la hipotenusa, por lo tanto X <Q. As queda demostrado que
H<G< X <Q.

b) Segunda ilustracin Segunda ilustracin Segunda ilustracin Segunda ilustracin. Primero se traza una recta OX y sobre sta se ubican dos puntos A y B
tales que los segmentos OA y AB midan respectivamente a y b, luego se construye la
siguiente figura:

- 65 -

Figura 2.
- M es el punto medio del segmento AB, es decir, OM mide
a b
2
+
.
- Se traza una circunferencia C
M
con centro en M y radio AM=
b a
2

.
- Como OM=
a b
2
+
y MT=AM=
b a
2

, entonces el cateto OT = ab .
- Se traza la recta OT, que es tangente a la circunferencia CM. Para obtener esta recta se
halla el punto medio C del segmento OM y se traza la circunferencia C
C
con centro en C
y radio OC. Los puntos donde se intersecan las circunferencias C
M
y C
C
son los puntos
de tangencia.
- Los segmentos DT y FM son perpendiculares a la recta OX, y el segmento MT es
perpendicular a la recta OT por ser el tringulo OTM un tringulo rectngulo.
- Los tringulos rectngulos OTM y TLM son semejantes. De la proporcin
LT OT
OM MT
= se
obtiene que LT=
b a
ab
b a
| |

|
|
+
\
.
- En el tringulo rectngulo OLT, OT = ab y LT=
b a
ab
b a
| |

|
|
+
\
, entonces OL=
2ab
a b +
.
- En el tringulo rectngulo OMT, OM=
a b
2
+
y FM=
b a
2

, entonces OF=
2 2
a b
2
+
.
- Para demostrar la cadena de desigualdades, observe que: OL=
2ab
a b +
es una cateto y
OT = ab es la hipotenusa del tringulo OLT, por lo tanto
2ab
a b +
< ab . OT = ab es

- 66 -
un cateto y OM=
a b
2
+
es la hipotenusa del tringulo OTM, entonces ab <
a b
2
+
.
OM=
a b
2
+
es un cateto y OF=
2 2
a b
2
+
es la hipotenusa del tringulo OMF, por lo
tanto
a b
2
+
<
2 2
a b
2
+
. As que demostrado que
2ab
a b +
< ab <
a b
2
+
<
2 2
a b
2
+
.
c) Tercera ilustracin Tercera ilustracin Tercera ilustracin Tercera ilustracin. Esta ilustracin no permite concluir H<G< X <Q, pero permite definir
stas medias geomtricamente con base en un trapecio cuyas bases menor y mayor miden
a y b respectivamente, y cuya altura mide h.
- Considrese el trapecio issceles OABC, en donde O=(0,0), A=
b a
, h
2
| |

|
|
\
,
B=
a b
, h
2
| |
+
|
|
\
y C=(b,0).
- Se trazan las rectas OB y AC, cuyas ecuaciones son
2h
f (x) x
a b
=
+
y
( )
2h
g(x) x b
a b

=
+
, respectivamente.
- Las rectas OB y AC se intersecan en el punto P=
b bh
,
2
a b
| |
|
|
+
\
.
- Se trazan las rectas OA y BC, cuyas ecuaciones son
2h
h(x) x
b a
=

y
( )
2h
k(x) x b
a b
=

, respectivamente.
- La recta paralela a las bases y que pasa por P tiene la ecuacin m(x)=
bh
a b +
. Esta recta
se interseca con los lados OA y BC en los puntos M=
b b a bh
,
2
a b a b
| | | |

| |
| |
+ +
\ \
y
N=
b 3a b bh
,
2
a b a b
| | | |
+
| |
| |
+ +
\ \
.
- El segmento MN mide
2ab
a b +
. (Media armnica).

- 67 -

Figura 3.

- Sean E y F los puntos medios de los segmentos OA y BC, respectivamente. Las
coordenadas de stos puntos son
b a h
E ,
4 2
| |

=
|
|
\
y
3b a h
F ,
4 2
| |
+
=
|
|
\
. El segmento EF
determinado estos puntos medios es la media paralela del trapecio y su longitud es
a b
EF
2
+
= . (Media aritmtica).
- Si se traza un segmento GH paralelo a las bases del trapecio OABC de tal manera que
los trapecios GABH y OGHC sean semejantes, Cunto mide el segmento GH?. De la
proporcin
AB GH
GH OC
= se obtiene que la medida de GH es ab . (Media geomtrica).
- Si se traza un segmento QR paralelo a las bases del trapecio OABC de tal manera que
resulten dos trapecios de igual rea, Cunto mide el segmento QR?.
- Al igualar las reas de los trapecios QABR y OQRC, resulta la igualdad
(AB+QR)AT=(QR+OC)TK.
- Al comparar los tringulos rectngulos semejantes QTA y OKA, resulta la igualdad
(QR-AB)AK=(OC-AB)AT.
- Si QR=x, AT=y, AB=a, OC=b y AK=h, entonces las igualdades se transforman en el
sistema de ecuaciones
(a x)y (x b)(h y)
(x a)h (b a)y

+ = +

. De la solucin del sistema resulta


x=QR=
2 2
a b
2
+
. (Media cuadrtica)
- Ahora pueden definirse las medias (armnica, geomtrica, aritmtica y cuadrtica) con
base en los segmentos construidos anteriormente en el trapecio OABC de bases a y b,
as: La media armnica es la medida del segmento paralelo a las bases que pasa por la
interseccin de las diagonales del trapecio. La media geomtrica es la medida del
segmento paralelo a las bases que divide al trapecio en dos trapecios semejantes. La

- 68 -
media aritmtica es la medida del segmento paralelo medio a las bases. La media
cuadrtica es la medida del segmento paralelo a las bases que divide al trapecio en
dos trapecios de igual rea.
- Para cualquier par de valores a y b (medidas de las bases del trapecio OABC), se puede
verificar la relacin AB<MN<GH<EF<QR<OC, es decir,
a<
2ab
a b +
< ab <
a b
2
+
<
2 2
a b
2
+
<b.
d) Cuarta ilustracin Cuarta ilustracin Cuarta ilustracin Cuarta ilustracin. Sobre un sistema de ejes coordenados se ubican los puntos O=(0,0),
A=(a,0), B=(b,0) y C=(a+b,0). Adems se trazan las lneas y=x, xy=ab, x+y=a+b.

Figura 4.

- Los segmentos OA y AP=OB miden respectivamente a y b, por lo tanto, OP mide
2 2
a b + .
- Se traza la circunferencia con centro en O y radio OP. La ecuacin de esta
circunferencia es x
2
+y
2
=a
2
+b
2
.
- El punto T es la interseccin de la circunferencia x
2
+y
2
=a
2
+b
2
con la recta y=x.
2 2 2 2
a b a b
T ,
2 2
| |
+ +
|
=
|
\
. Como Q es la proyeccin de T sobre OC entonces OQ
mide
2 2
a b
2
+
.
- El punto F es la interseccin de la recta x+y=a+b con la recta y=x. Como
a b a b
F ,
2 2
| |
+ +
=
|
|
\
y X es la proyeccin de F sobre OC, entonces OX mide
a b
2
+
.
- El punto R es la interseccin de la lnea xy=ab con la recta y=x. Como
( )
R ab, ab = y G es la proyeccin de R sobre OC, entonces OG mide ab .

- 69 -
- Como OX=OU, entonces la ecuacin de la recta UF es
a b
y
2
+
= . La interseccin de
esta recta con la lnea xy=ab es el punto V, cuyas coordenadas son
2ab a b
,
2
a b
| |
+
|
|
+
\
.
- Como H es la proyeccin de V sobre OC, entonces OH mide
2ab
a b +
.
- De acuerdo a lo que se muestra en la figura, OA<OH<OG<OX<OQ<OB, con lo que se
demuestra a<
2ab
a b +
< ab <
a b
2
+
<
2 2
a b
2
+
<b.
4.13 4.13 4.13 4.13 La relacin La relacin La relacin La relacin H < G < H < G < H < G < H < G < X XX X < Q < Q < Q < Q para n datos. para n datos. para n datos. para n datos.
Si x
1
, x
2
, , x
n
son n nmeros reales positivos entonces se cumple la relacin
2 2 2
1 2 n 1 2 n
n
1 2 n
1 2 n
x x ... x x x ... x n
x x ...x
1 1 1 n n
...
x x x
+ + + + + +

+ + +
.
Para probar esta afirmacin se debe tener en cuenta que si x
1
, x
2
, x
n
son nmeros positivos
tales que x
1
x
2
x
n
=1, entonces
1 2 n
x x ... x n + + + .
Si
n
1 2 n
g x x ...x = , entonces
n
1 2 n 1 2 n 1 2 n
n n
n
x x ...x x x ...x x x x
1 ...
g g g g
g
= = = .
Elevando al cuadrado a cada lado de la igualdad se obtiene
1 2 n
x x x
... 1
g g g
= , entonces
1 2 n
x x x
... n
g g g
+ + + , es decir,
1 2 n
x x ... x
n
g
+ + +
.
De
1 2 n
x x ... x
n
g
+ + +
se obtiene
1 2 n
x x ... x
g
n
+ + +
, que equivale a tener
1 2 n
n
1 2 n
x x ... x
x x ...x
n
+ + +
. Ahora,
n
1 2 n
x x ...x
1
g
= implica
n
1 2 n
g
1
x x ...x
= , lo cual
permite afirmar que
n
n
1 2 n 1 2 n 1 2 n
g g g g g g g
1 ... 1 ... n
x x ...x x x x x x x
= = + + + . Al
despejar g se tiene
1 2 n
n
g
1 1 1
...
x x x

+ + +
, es decir
n
1 2 n
1 2 n
n
x x ...x
1 1 1
...
x x x

+ + +
.

- 70 -
Sea
1 2 n
x x ... x
x
n
+ + +
= . Como
( )
2
k
x x 0 para k=1,2,,n entonces
( )
n
2
k
k 1
x x 0
=

y
( )
n n n n
2
2 2
k k k
k 1 k 1 k 1 k 1
x x x 2x x x 0
= = = =
= +

, por lo tanto,
n n
2 2
k k
k 1 k 1
nx 2x x x 0
= =
+

o
n
2 2 2
k
k 1
nx 2nx x 0
=
+

.
Si se divide por n y se despeja
n
2
k
k 1
x
=

queda
n
2
k
2 k 1
x
x
n
=

.
La desigualdad
n
2
k
2 k 1
x
x
n
=

conduce a la desigualdad
n
2
k
k 1
x
x
n
=

, es decir,
n
2
k
k 1 1 2 n
x
x x ... x
n n
=
+ + +

.
4.14 4.14 4.14 4.14 Ejemplos. Ejemplos. Ejemplos. Ejemplos.
Para cerrar esta seccin se presenta una recopilacin de ejemplos con los que se pretende
ilustrar buenos y malos usos de este tipo de estadsticas.
Ejemplo 1. Estimacin del peso de un objeto. Ejemplo 1. Estimacin del peso de un objeto. Ejemplo 1. Estimacin del peso de un objeto. Ejemplo 1. Estimacin del peso de un objeto.
Nueve estudiantes pesaron un objeto pequeo con un mismo instrumento en una clase de
ciencias. Los pesos registrados por cada estudiante (en gramos) son: 6.2, 6.0, 6.0, 15.3,
6.1, 6.3, 6.2, 6.15 y 6.2.
Los estudiantes quieren determinar con la mayor precisin posible el peso real del objeto.
Cul de los siguientes mtodos recomiendas usar?
a) Usar el nmero ms comn, que es 6.2
b) Usar 6.15, puesto que es el peso ms preciso
c) Sumar los nueve nmeros y dividir la suma por nueve
d) Desechar el valor 15.3, sumar los otros ocho nmeros y dividir por ocho.
Discusin. Discusin. Discusin. Discusin. Las opciones de respuesta a este ejemplo pretenden ilustrar acerca del concepto
de media como mejor estimador de una cantidad desconocida, en presencia de errores de
medida. En general la mejor estimacin de un valor desconocido, en situaciones como la que
se presenta viene dada por la media aritmtica. No obstante, su adecuacin a un caso
particular debe ser valorada. El ejemplo propuesto introduce un valor atpico (15.3) que es
recomendable descartar antes de proceder al clculo de la media aritmtica, ya que un valor

- 71 -
atpico suele afectar de manera notable el valor del promedio aritmtico y por ello puede
generar un sesgo en la estimacin. Por lo tanto, este ejemplo pretende discriminar entre el
simple conocimiento algortmico de la frmula de clculo, y la comprensin relacional del
concepto. Entonces la respuesta ms correcta es la opcin (d).
Ejemplo 2. Promedio de nios por familia Ejemplo 2. Promedio de nios por familia Ejemplo 2. Promedio de nios por familia Ejemplo 2. Promedio de nios por familia. .. .
El comit escolar de una pequea ciudad quiso determinar el nmero promedio de nios por
familia en su ciudad. Dividieron el nmero total de nios de la ciudad por 50, que es el
nmero total de familias. Cul de las siguientes frases debe ser cierta si el nmero promedio
de nios por familia es 2.2?
a) La mitad de las familias de la ciudad tienen ms de 2 nios.
b) En la ciudad hay ms familias con 3 nios que con 2 nios.
c) Hay un total de 110 nios en la ciudad.
d) Hay 2.2 nios por adulto en la ciudad.
e) El nmero ms comn de nios en una familia es 2.
Discusin Discusin Discusin Discusin. . . . En este ejemplo, , , , la pregunta propuesta al final del enunciado, sugiere que el valor
de la media de la variable nmero de nios por familia es de 2,2 en un pueblo. Adems y
dado que tambin se conoce el nmero total de familias, en el ejemplo se presentan una serie
de afirmaciones sobre los estadsticos de la distribucin asociada a dicha variable, cuya forma
no se especifica. No obstante, por la experiencia, se sabe que la variable analizada es
asimtrica y est acotada inferiormente por cero. En el ejemplo se aborda el conocimiento de
la relacin entre las tres medidas de tendencia central ms conocidas (media, mediana y
moda) en distribuciones simtricas y asimtricas. Es conocido que en distribuciones simtricas
los valores de estas medidas coinciden, sin embargo, esto no necesariamente debe ser as para
distribuciones asimtricas. Se considera que la opcin (c), es la correcta.
Ejemplo 3. Media de vida en pases de habla hispana Ejemplo 3. Media de vida en pases de habla hispana Ejemplo 3. Media de vida en pases de habla hispana Ejemplo 3. Media de vida en pases de habla hispana. .. .
En la Tabla 16 se presentan los promedios de vida de diecinueve pases de habla hispana.
Cul es la media de vida en pases de habla hispana?

Pas Pas Pas Pas Promedios Promedios Promedios Promedios Pas Pas Pas Pas Promedios Promedios Promedios Promedios
Cuba 78 Ecuador 71
Chile 77 El Salvador 62
Costa Rica 77 Espaa 65
Argentina 75 Guatemala 63
Uruguay 75 Nicaragua 76
Venezuela 75 Panam 69
Mxico 74 Paraguay 72
Per 71 Puerto Rico 77
Bolivia 65 Dominicana (Rep.) 100
Colombia 76
Tabla 16. Media de vida en diecinueve pases de habla hispana.

- 72 -
Discusin Discusin Discusin Discusin. Un analista de datos con poca experiencia puede pensar que el problema
simplemente se reduce a sumar de todos los datos de las medias de vida y dividir por
diecinueve, que es el total de pases, es decir, a calcular la media aritmtica de los datos
dados, este clculo arroja una media de las medias de vida de 73,58. Sin embargo, una mirada
ms detallada a los datos sugiere que en Repblica Dominicana, la media de vida es mucho
mayor que en los dems pases. De hecho, un grfico de caja de los datos presentados en la
Tabla 16 es:


El grfico caja pone en evidencia lo atpico del dato correspondiente a Repblica Dominicana.
En situaciones como sta, algunos analistas de datos pueden sugerir la exclusin del valor
atpico, lo cual arrojara una media de 72,11, o bien la consideracin del clculo de la mediana
que nos conduce al valor 75, que sera una estimacin incluso mayor que el 73,58 obtenido
cuando ya est incluido el valor atpico. As pues, encontrar un representante de la media de
vida, no es nada claro.
Quizs sea entonces conveniente buscar otro tipo de informacin para tener un criterio ms
objetivo, en la eleccin del valor representante en cuestin. Al respecto en la Tabla 17 se
presentan las poblaciones de estos pases en el ao 2000. Como puede verse hay pases con
poblaciones muy pequeas y otros con poblaciones muy grandes. As, otra alternativa con
base en esta informacin es considerar el clculo de una media ponderada. Se puede tomar
como ponderacin para cada pas, el total de su poblacin dividido por el total de todas las
poblaciones, es decir, por 328.958 millones de habitantes.

Pas Pas Pas Pas Habitantes Habitantes Habitantes Habitantes Pas Pas Pas Pas Habitantes Habitantes Habitantes Habitantes
Cuba 10.603 Ecuador 11.937
Chile 14.625 El Salvador 5.221
Costa Rica 3.303 Espaa 39.730
Argentina 35.671 Guatemala 9.197
Uruguay 3.221 Nicaragua 3.871
Venezuela 22.777 Panam 2.563
Mxico 81.250 Paraguay 5.088
Per 24.367 Puerto Rico 3.522
Bolivia 7.774 Rep. Dominicana 7.170
Colombia 37.068 Total Total Total Total 328.958
Tabla 17. Poblacin en millones de habitantes en pases de habla hispana en el ao 2000.


- 73 -
Al considerar la ponderacin sugerida para el clculo de la media ponderada, se le da ms
importancia a pases como Mxico, Colombia, Espaa y Argentina, que tienen las poblaciones
ms grandes que a los dems pases. Desde esta perspectiva la media ponderada arroja un
resultado de 73,13 si se tiene en cuenta los diecinueve pases, o de 72,53 cuando se excluye a
Repblica Dominicana y slo se considera la ponderacin de cada pas como el total de su
poblacin dividida por 321.778, total de la poblacin si excluye Repblica Dominicana. Por
otra parte, si en lugar de calcular la media ponderada, se calcula la mediana, con base en los
datos de la Tabla 18, el resultado es 74.

En definitiva y a manera de conclusin, no se puede afirmar que alguno de los mtodos
sugeridos sea mejor que otro. Quizs lo ms importante del ejemplo es notar, la variedad de
criterios que se pueden argumentar detrs de la eleccin de un buen representante, como la
inclusin o exclusin de un valor atpico o la ponderacin de los datos.

Pas Pas Pas Pas
Media de Media de Media de Media de
vida vida vida vida
Poblacin Poblacin Poblacin Poblacin
Poblacin Poblacin Poblacin Poblacin
acumulada acumulada acumulada acumulada
El Salvador 62 5.221 5.221
Guatemala 63 9.197 14.418
Bolivia 65 7.774 22.192
Espaa 65 39.730 61.922
Panam 69 2.563 64.485
Per 71 24.367 88.852
Ecuador 71 11.937 100.789
Paraguay 72 5.088 105.877
Mxico 74 81.250 187.127
Argentina 75 35.671 222.798
Uruguay 75 3.221 226.019
Venezuela 75 22.777 248.796
Colombia 76 37.068 285.864
Nicaragua 76 3.871 289.735
Chile 77 14.625 304.360
Costa Rica 77 3.303 307.663
Puerto Rico 77 3.522 311.185
Cuba 78 10.603 321.788
Rep.
Dominicana
100 7.170 328.958

Tabla 18. Distribucin acumulada de las medias de vida cuando se construyen
las frecuencias con base en las poblaciones de cada pas.



- 74 -
Ejemplo 4. Promedios de bateo en el bisbol Ejemplo 4. Promedios de bateo en el bisbol Ejemplo 4. Promedios de bateo en el bisbol Ejemplo 4. Promedios de bateo en el bisbol. .. .
Los datos de la Tabla 19 muestran el desempeo al bate de jugadores venezolanos de bisbol
que juegan en la liga Nacional y en las grandes ligas del bisbol norteamericano:
a) Cul es el promedio de bateo del jugador Alfonso E?
b) Cuntos hits sencillos tiene que lograr Blanco H. para tener el mismo promedio de
bateo que Escobar A?
c) Es posible que Torrealba Y. con diferencia de 3 turnos al bate logre conseguir el mismo
promedio de bateo de Prez T? Cmo?
d) Si Ordoez M. lograra en su prximo partido conectar 3 hits en 4 turnos al bate, cmo
cambiara su promedio?


Jugador Jugador Jugador Jugador Liga Liga Liga Liga B BB B S SS S D DD D T TT T J JJ J BB BB BB BB AVG AVG AVG AVG
Blanco H. Americana 118 11 7 0 3 10 0.194
Escobar A. Americana 124 18 7 1 1 12 0.241
Torrealba
Y.
Americana 49 4 2 0 1 5 0.159
Alfonso E. Nacional 157 29 7 0 1 17
Prez T. Nacional 52 4 3 1 1 3 0.183
Gonzales
A.
Nacional 162 16 10 0 3 20 0,204
Ordoez M. Americana 188 34 7 2 8 25 0,313
Olmedo R. Nacional 1 0 0 0 0 0 0,000

Convenciones utilizadas:
B BB B: Nmero total de turnos al bate S SS S: Nmero de hits sencillos.
D DD D: Nmero de hits dobles. T TT T: Nmero de hits triples.
J JJ J: Nmero de cuadrangulares. AVG AVG AVG AVG: Promedio de bateo.
BB BB BB BB: Nmero de concesiones de base por bola.
Tabla 19. Desempeo al bate de jugadores de bisbol de Venezuela
en las ligas Nacional y Americana.

Discusin Discusin Discusin Discusin. Para calcular el promedio de bateo de un jugador de bisbol no se saca
simplemente la media aritmtica del nmero de hits (sencillos, dobles y triples) y de
cuadrangulares. En realidad ms que un promedio lo que se saca es un proporcin (o
porcentaje) de bateo. La forma en que se calcula ese promedio es un ejemplo de cmo dos
razones a b y c d se combinan para formar una nueva razn (a c) (b d) + + que se halla
entre las dos razones anteriores. Es decir:
Si
a c
,
b d
< entonces
a a c c
.
b b d d
+
< <
+



- 75 -
Adems, se puede dar una interpretacin geomtrica a esta desigualdad: la pendiente
(a c) (b d) + + es una intermedia entre las pendientes a b y c d . (ver Figura 33).

Figura 33. Interpretacin geomtrica de la desigualdad
a a c c
b b d d
+
< <
+
.
Tambin es interesante sealar que si a y b son respectivamente mucho mayores que c y d,
entonces a b y (a c) (b d) + + estarn muy cerca. La pendiente de la hipotenusa del
tringulo con catetos a y b es muy similar a la pendiente de la hipotenusa del tringulo de
catetos a + c y b + d (Figura 34). Este hecho se podr evidenciar cuando se considere, ms
adelante, la solucin al literal (d).

Figura 34. Comparacin de las pendientes
a a c
y
b b d
+
+
cuando a y b
son respectivamente mucho mayores que c y d.
Para responder entonces al literal (a) del ejemplo, se tiene entonces que el promedio de bateo
es la suma el nmero de hits sencillos, dobles, triples y cuadrangulares, dividido entre el
nmero de turnos al bate menos el nmero de bases por bola. Es decir:
29 7 0 1 37
AVG 0, 264
157 17 140
+ + +
= = =


Entonces el promedio de bateo del jugador Alfonso E. es de 0,264.
En cuanto al literal (b), en este caso hay un valor desconocido, que se encuentra al hallar el
valor de la incgnita.

- 76 -
S 7 0 3
0, 241
118 10
+ + +
=


Al despejar la incgnita, y redondeando el resultado, se obtiene S = 16. Por lo tanto, para
tener el mismo promedio de bateo de Escobar A., Blanco H. debe lograr aproximadamente 16
hits sencillos.
En cuanto al literal (c), se presentan varias posibilidades ya que se pueden lograr hits
sencillos, dobles, triples o cuadrangulares. Para empezar se considera el caso de hits sencillos.
En este caso se plantea:
S 2 0 1
0,183
49 3 5
+ + +
=
+

Al despejar y redondeando el resultado, se obtiene que S = 6, por lo que es imposible con
slo hits sencillos que Torrealba Y. en 3 turnos al bate logre conseguir el mismo promedio
de bateo de Prez T.
De manera similar, si el asunto se plantea en trminos de hits dobles o triples, entonces las
ecuaciones a resolver respectivamente, son:
4 D 0 1
0,183
49 3 5
+ + +
=
+
y
4 2 T 1
0,183
49 3 5
+ + +
=
+

Al despejar y redondeando los resultados, se obtiene que D = 4 y T = 2 por lo que tampoco es
posible con slo hits dobles que Torrealba Y. en 3 turnos al bate logre conseguir el mismo
promedio de bateo de Prez T., pero si lo podr superar si conecta dos triples. Igualmente,
se puede verificar que si conecta tres cuadrangulares logra superar el promedio de Prez T.
Finalmente, para responder al literal (d), veamos las diferencias en los siguientes clculos
34 7 2 8
0, 313
188 25
+ + +
=

y
34 7 2 8 3
0, 323
192 25
+ + + +
=


El primero es su promedio antes del ltimo partido y el segundo el promedio despus de
ste. Observe que la variacin es muy leve.

Ejemplo 5. Notas en el colegio Ejemplo 5. Notas en el colegio Ejemplo 5. Notas en el colegio Ejemplo 5. Notas en el colegio. .. .
En el Colegio Distrital Luis Carlos Galn, al finalizar el ao escolar la profesora de espaol se
dispone a realizar el parcial final, Camilo le pide a la profesora sus notas y ella le muestra el
siguiente reporte:
Actividad Talleres Cuaderno Tareas Parcial 1 Parcial 2 Parcial F
% 30% 10% 10% 15% 15% 20%
NOTA 3,4 2,5 3,0 2,1 3,0
a) Qu nota mnima debe sacar en el parcial final para aprobar la materia?
b) Si la profesora decide no realizar el Parcial Final y cambiar el porcentaje de los Parciales 1
y 2 cada uno al 25%. Con qu nota finaliza el ao?

- 77 -
c) Si aprueba espaol con 3,2. Qu nota sac en el Parcial Final?

Discusin Discusin Discusin Discusin. Para resolver este tipo de problemas el estudiante ingenuo suele calcular la
media aritmtica, sin tener en cuenta la ponderacin de las notas. Incluso puede llegar al
extremo de pensar que si el promedio que tiene acumulado es de 2,8 (resultado de la media
aritmtica, sin hacer ponderaciones), lo que necesita para pasar es un 3,2. Es claro que lo que
se requiere aqu es utilizar una media ponderada. Cuando las ponderaciones vienen dadas en
trminos de porcentajes, se debe verificar que stas sumen exactamente el 100%. Adems, en
este caso la media ponderada se puede utilizar para determinar en cuanto lleva el 80%, al
plantear el siguiente clculo
30% 3, 4 10% 2, 5 10% 3, 0 15% 2, 3 15% 3, 0
x 2, 95
80%
+ + + +
= =

Entonces, Camilo lleva la nota en 2,95, y para mirar que nota debe sacar para por lo menos
aprobar la materia debe plantear la siguiente ecuacin
2, 95 80% x 20%
x 3, 0
100%
+
= =
Al resolver, se tiene entonces x = 3,2. Observe que aunque el estudiante ingenuo obtuvo el
mismo resultado, lo hizo con un procedimiento errado. En realidad el hecho de que se llegue
a la misma respuesta es una simple coincidencia.
Cuando se cambian las ponderaciones de los parciales 1 y 2, cada uno al 25%, y no hay parcial
final, el estudiante saca
30% 3, 4 10% 2, 5 10% 3, 0 25% 2, 3 25% 3, 0
x 2, 59
100%
+ + + +
= =
Finalmente, si el estudiante obtiene un 3,2 como nota definitiva, la nota que sac en el parcial
final se obtiene al resolver

30% 3, 4 10% 2, 5 10% 3, 0 15% 2, 3 15% 3, 0 20% x
x 3, 2
100%
+ + + + +
= = Al despejar se
llega a x = 3,025.

Ejemplo 6. Sueldos en una empresa Ejemplo 6. Sueldos en una empresa Ejemplo 6. Sueldos en una empresa Ejemplo 6. Sueldos en una empresa. .. .
En una empresa de odontologa los sueldos correspondientes a los cargos son los siguientes:

Gerente General $ 18000,000 1
Director de DPTO $ 4000,000 5
Jefe Inmediato $ 3000,000 5
Analista $ 1500,000 10
Auxiliares $ 800,000 10
Servicios Generales $ 550,000 2

- 78 -
El analista de nmina dice que el promedio de salario de la empresa es de $1846,875 Cmo
calcul el analista de nmina el promedio de salario de la empresa?
Discusin Discusin Discusin Discusin. Como ya ha sido enfatizado, la media aritmtica se puede afectar ante la presencia
de valores atpicos.

Lo atpico del salario del gerente comparado con los dems salarios se evidencia en el grfico
de caja anterior. En efecto, si se calcula la media aritmtica de estos datos, incluyendo el
salario del gerente, se obtiene un valor de $2315.150, que no corresponde con el valor
calculado por el analista de nmina. Tampoco puede ser la mediana pues, fcilmente se
puede determinar que esta es de $1500.000. En realidad, para obtener el valor de $1846,875
lo que hizo el analista fue descartar el salario del gerente y calcular una media aritmtica en la
que el nmero de datos es 32, la cantidad de empleados sin contar el gerente.
Ejemplo 7. Conviene apostar? Ejemplo 7. Conviene apostar? Ejemplo 7. Conviene apostar? Ejemplo 7. Conviene apostar?
Se propone un juego de dados donde el jugador participante debe lanzar tres dados de seis
caras al mismo tiempo. Las reglas del juego son:
si al lanzar los dados saca en uno de ellos un 6 gana $1.000,
si el al lanzar los dados saca en dos ellos un 6 gana $2.000,
si al lanzar los dados saca en los tres dados un 6 gana $3.000 y
si no obtiene 6 en ningn dado, entonces pierde $1.500.
Estara dispuesto a jugar este juego?

Discusin. Discusin. Discusin. Discusin. Este es un problema clsico de juegos de azar que involucra nociones bsicas de
probabilidad. El concepto ms relevante que se debe contemplar es el de valor esperado.
Aunque no se entrar en muchos detalles acerca de la asignacin de probabilidades a los
cuatro eventos en cuestin (sale un 6, salen dos 6, salen tres 6 y no sale 6) si se pretende
establecer una conexin entre el clculo del valor esperado de la variable aleatoria,
implcitamente definida, y el clculo de la media ponderada, asociada a la variable aleatoria
implicada en el juego. Por otra parte, para la asignacin de probabilidades se puede asumir
un enfoque frecuencial emprico o a posteriori, o un enfoque clsico a priori.
En primer lugar, se har explicita la definicin de la variable aleatoria involucrada en el juego,
luego se presentarn los dos tipos de asignacin de probabilidades mencionados y finalmente
se har el clculo del valor esperado que, como veremos, es un caso especial de clculo de
una media ponderada.

- 79 -
En general, una variable aleatoria es una asignacin de valores numricos a eventos de un
espacio de probabilidades. Para este juego la asignacin de valores que tiene sentido es la
que se establece a travs de las reglas del juego (las cuatro vietas presentadas en el
enunciado). En cuanto a la asignacin de probabilidades primero se comenta la asignacin
clsica que se basa en un recuento de todos los casos posibles de resultados del lanzamiento
de los tres dados (216 en total), y de todos los casos favorables asociados a cada evento (1
caso para salen tres 6, 15 casos para salen dos 6, 75 casos para sale un 6, y 125 casos
para no sale 6). En la tabla que sigue se resume toda la informacin:

Evento Evento Evento Evento Sale un 6 Salen dos 6 Salen tres 6 No sale 6
Valor de x Valor de x Valor de x Valor de x $1.000 $2.000 $3.000 $1.500
Nmero de ca Nmero de ca Nmero de ca Nmero de casos sos sos sos 75 15 1 125
Probabilidad Probabilidad Probabilidad Probabilidad 75/216 15/216 1/216 125/216

El valor esperado asociado al juego, de acuerdo con la asignacin de probabilidades
presentada, se define como la suma de los productos de los valores de la variable aleatoria
por sus respectivas probabilidades, es decir como:
75 15 1 125
1000 2000 3000 1500 368
216 216 216 216
+ +

Observe que el clculo realizado coincide con el clculo de una media ponderada donde las
ponderaciones de los valores son 75, 15, 1 y 125. En cuanto a la interpretacin del resultado
se debe tener en cuenta dos asuntos: el primero tiene que ver con el signo y el segundo con el
nmero de veces que se estara dispuesto a jugar.

En cuanto al signo del valor esperado, si al calcularlo el valor que da es mayor que cero, es
favorable jugar; si es igual que cero, el juego es equilibrado; y si no es mayor que cero, no es
favorable jugar. Sin embargo, tambin se debe tener en cuenta el segundo asunto: el valor
esperado es un resultado que tiene sentido interpretar slo cuando se realiza un nmero
grande de juegos. La verdad es que cuando slo se va a realizar un juego no es recomendable
considerarlo como una regla de decisin. Quizs, la discusin del segundo enfoque de
asignacin de probabilidades ayude a precisar esta cuestin.

Otra manera de asignar probabilidades a eventos es con base en recopilar un historial de
cuantas veces suceden los eventos en cuestin cuando se repite el lanzamiento de los tres
dados, un nmero grande de veces, por ejemplo 100 veces, 500 veces o 1000 veces; entre ms
veces se pueda repetir, la asignacin de probabilidad se har ms estable y segn la teora
estadstica, deber converger a la asignacin clsica de probabilidades. Para realizar el
lanzamiento de los tres dados se utilizaron mtodos de simulacin basados en la generacin
de nmeros aleatorios y para ello se us una hoja electrnica de Excel. Una salida de este tipo
de simulacin se presenta en la siguiente tabla.


- 80 -
S1(100) P1 S2(500) P2 S3(1000) P3 P. Terica
Pierde 1500 58 0,580 302 0,604 590 0,590 0,5787
Gana 1000 29 0,290 154 0,308 328 0,328 0,3472
Gana 2000 11 0,110 41 0,082 77 0,077 0,0694
Gana 3000 2 0,020 3 0,006 5 0,005 0,0046

La tabla anterior contiene en la columnas S1(100), S2(500) y S3(1000) el nmero de veces que
se perdi o gan al jugar 100, 500 y 1000 veces respectivamente. Adems, en las columnas P1,
P2 y P3 se presenta la asignacin de probabilidades a posteriori, es decir, la basada en los
resultados de una simulacin. Por otra parte, en la tabla que sigue se presenta el balance de
los juegos con 100, 500 y 1000 simulaciones, la media ponderada correspondiente a cada caso
y la ganancia en teora.

S1(100) S2(500) S3(1000)
Ganancia total -30000 -208000 -388000
Media ponderada -300 -416 -388
Ganancia en teora -36800 -184000 -368000

Ejempl Ejempl Ejempl Ejemplo 8. Salario de un obrero o 8. Salario de un obrero o 8. Salario de un obrero o 8. Salario de un obrero. .. .
Un obrero eventual que trabaj ciertos meses cada ao, cobr la misma cantidad de dinero
cada ao. Si el salario mensual fue de $80.000 en 1989, de $95.000 en 1990 y de $120.000 en
1991. Cul es el salario medio al mes del obrero?

Discusin Discusin Discusin Discusin. De nuevo tenemos un problema cuya solucin le puede parecer al estudiante
ingenuo, como una simple aplicacin de la media aritmtica, donde ($80.000 + $95.000 +
$120.000)/3 = $98.333. Sin embargo, la solucin anterior es incorrecta. Detrs de una solucin
correcta al problema se esconde la aplicacin de la media armnica. A continuacin se
explicarn los detalles del razonamiento que llevan a esto.
Para empezar suponga que C es la cantidad cobrada cada ao. Entonces, el nmero de meses
trabajados en el primer ao es C/80.000, en el segundo C/95.000y en el C/120.000. Como C
designa la cantidad cobrada cada ao, el nmero total de meses trabajados ser la suma de los
relativos a cada ao, es decir:
95.000 120.000
C C C
80.000
+ +
Por lo tanto el salario mensual ser:
95.000 120.000 95.000 120.000
3C 3
S
1 1 1 C C C
80.000 80.000
+ + + +
= =

Entonces el salario promedio, al resolver la expresin anterior, ser de $95.664,34. La forma
final de la expresin anterior tambin explica por s misma que se trata del clculo de una
media armnica.


- 81 -
Ejemplo Ejemplo Ejemplo Ejemplo 9. Velocidad de remado 9. Velocidad de remado 9. Velocidad de remado 9. Velocidad de remado. .. .
Una persona rema ro arriba a una velocidad de 25 km/h y de regreso a 40Km/h. cul es la
velocidad promedio de todo el recorrido?

Discusin Discusin Discusin Discusin. Algunos remadores estiman que si manejan la primera mitad de un recorrido con
una velocidad de 25 km/h, y la segunda mitad de la distancia a 40 km/h., la velocidad media,
o promedio de todo el viaje ser de (25 +40)/2 = 32,5 km/h. Ellos se sorprenden al observar
que si se viaja todo el trayecto a una velocidad constante de 32,5 km/h, llegan ms tarde de lo
pensado. El tiempo que se requiere para cada una de los viajes, ro arriba y ro abajo, no es el
mismo, y la velocidad menor se tiene que sopesar ms que la velocidad mayor.
Algunas veces los estudiantes tienen dificultad para resolver problemas, como el que se
enuncia, porque no pueden calcular el tiempo total, ya que no se da la distancia. En realidad
lo que aqu es igual son las distancias de ida y regreso y lo que cambian son los tiempos. Por
ejemplo, si la velocidad v
1
es dos veces mayor que la otra velocidad v
2
, para distancias iguales
el conductor pasar el doble del tiempo viajando a la velocidad menor. La velocidad media
deber estar ms cerca de la velocidad menor en una razn de 1 a 2. En general, el tiempo de
viaje a una velocidad ser inversamente proporcional a la misma. En otras palabras, al
promediar velocidades sobre distancias iguales, la importancia que debemos dar a cada
velocidad es precisamente el inverso de cada velocidad.
Ahora se mostrarn los detalles del razonamiento. En primer lugar se debe tener claro la
definicin de la velocidad como el cociente de la distancia sobre el tiempo, esto es: v = d/t.
Entonces se tiene que la velocidad cuando la persona rema ro arriba es v
1
= d/t
1
y cuando
regresa es v
2
= d/t
2
. As pues, al despejar los tiempos en cada una de estas expresiones se tiene
que t
1
= d
1
/v
1
y t
2
= d
2
/v
2
y entonces el tiempo total de viaje ser t
1
+ t
2
y la distancia total d
1
+
d
2
, adems se sabe que d
1
= d
2
= d, Por lo tanto, la velocidad media ser:
1 2
1 2
1 2 1 2
1 2
v
1 1 d d d d
v v v v
v v
2d 2d 2d 2
t t
= = = =
+ +
+
+


Se concluye entonces que para hallar la velocidad media en cuestin, basta con calcular la
media armnica de las velocidades de cada recorrido. En suma, se tiene como respuesta que
la velocidad media es
1 2
v 33,11
1 1 1 1
v v 25 40
2 2
= =
+ +

Ejemplo 1 Ejemplo 1 Ejemplo 1 Ejemplo 10. Tiempo para realizar una obra de construccin 0. Tiempo para realizar una obra de construccin 0. Tiempo para realizar una obra de construccin 0. Tiempo para realizar una obra de construccin. .. .
Jos puede hacer una obra en cuatro das, Juan en seis das y Andrs en doce das. En cunto
tiempo pueden hacer la obra los tres juntos?


- 82 -
Discusin Discusin Discusin Discusin. Este es otro ejemplo, en el que se puede aplicar la media armnica. Se presenta el
siguiente razonamiento para convencerse de ello. Sea x el nmero de das que tardaran en
hacer toda la obra trabajando los tres juntos. Si en das los tres juntos hacen toda la obra, en 1
da harn 1/x de la obra. Jos, trabajando solo, hace la obra en 4 das; luego, en un da hace
1/4 de la obra. Juan, trabajando solo, hace la obra en 6 das; luego, en un da hace 1/6 de la
obra. Andrs, trabajando solo, hace la obra en 12 das; luego, en un da hace 1/12 de la obra.
Luego los tres juntos harn en un da (1/4 + 1/6 + 1/12) de la obra; pero como en un da los
tres hacen 1/x de la obra, tenemos
1 1 1 1
4 6 12 x
+ + = .

Resolviendo la expresin se debe llegar a x = 2. Se Obtiene entonces que el tiempo que se
gastan los tres obreros en hacer la obra juntos es de 2 das. Ntese que utilizando la formula
de la media armnica se llega a la siguiente respuesta:
v 6
1 1 1
4 6 12
3
= =
+ +
.
Lo anterior quiere decir que un solo obrero trabajando a una velocidad equivalente a la media
de los tres obreros se gastara 6 das. As pues, si trabajan los tres al tiempo, lo que gastarn
ser 6/3 = 2 das.

Ejemplo 11. Crecimiento de un depsito de ahorro Ejemplo 11. Crecimiento de un depsito de ahorro Ejemplo 11. Crecimiento de un depsito de ahorro Ejemplo 11. Crecimiento de un depsito de ahorro. .. .
A continuacin se muestra el crecimiento de un depsito de ahorro de $1000 durante cinco
aos, de acuerdo a las tasas de inters de 7, 8, 10, 12 y 18 por ciento para los aos 1, 2, 3, 4 y 5
respectivamente.

a) Cul es el factor de crecimiento promedio?
b) A qu tasa de inters corresponde el factor de crecimiento?

Ao
Porcentaje de la
tasa de inters
Factor de
crecimiento
Ahorros al final
del ao ($)
1 7 1.07 1070.00
2 8 1.08 1155.60
3 10 1.10 1271.16
4 12 1.12 1423.69
5 18 1.18 1679.95

Discusin Discusin Discusin Discusin. Con este ejemplo, se pasa a contemplar un caso en donde tiene sentido la
aplicacin de la media geomtrica. Suponga que primero se calcula la media aritmtica de las
tasas de inters, es decir (7 + 8 + 10 +12 +18)/5 = 11. Entonces es el factor medio de
crecimiento de los ahorros sera 1,11. Pero si el ahorro creciera de esta forma los cinco aos,
no se llegara al mismo resultado final, como se puede ver en la tabla que sigue.


- 83 -
Ao Ao Ao Ao
Porcentaje de la Porcentaje de la Porcentaje de la Porcentaje de la
tasa de inters tasa de inters tasa de inters tasa de inters
Factor de Factor de Factor de Factor de
crecimiento crecimiento crecimiento crecimiento
Ahorros al final Ahorros al final Ahorros al final Ahorros al final
del ao ($) del ao ($) del ao ($) del ao ($)
1 7 1.11 1110,00
2 8 1.11 1232,10
3 10 1.11 1367,63
4 12 1.11 1518,07
5 18 1.11 1685,06
Por lo tanto la media aritmtica no es un buen indicador de la tasa media de crecimiento de
los ahorros. Adems, note que el factor de crecimiento promedio correcto debe ser
ligeramente menor a 1.11.
Si los ahorros crecen a una tasa constante i, para que al final del quinto ao tenga el mismo
efecto que las tasas del ejemplo, se debe verificar que:
1.000(1+i)(1+i)(1+i)(1+i)(1+i) = 1.000(1+0,07)(1+0,08)(1+0,1)(1+0,12)(1+0,18)
De donde se tiene que:
5
(1 i ) 1, 07 1, 08 1,10 1,12 1,18 1,10932819 + = =
De manera que si se hubiera tenido este factor de crecimiento de la tasa de ahorro (ntese que
lo que se calcul fue la media geomtrica), hubiera conducido a un ahorro final exactamente
igual a la que se obtuvo. Es decir, que la tasa media de crecimiento del ahorro ha sido de
10,932819%.

Ejemplo12. Salarios en una compaa de telefona celular Ejemplo12. Salarios en una compaa de telefona celular Ejemplo12. Salarios en una compaa de telefona celular Ejemplo12. Salarios en una compaa de telefona celular. .. .
Los salarios mensuales pagados en una compaa de telefona celular, son los siguientes:

$342.000 30 Obreros
$390.000 3 Tcnicos, 1 Asistente
$392.000 35 Obreros
$440.000 1 Tcnico, 1 Asistente
$442.000 2 Interventores, 2 Ingenieros
$490.000 5 Tcnicos, 40 Obreros
$492.000 20 Obreros
$540.000 3 Asistente, 2 Interventores, 3 Ingenieros
$542.000 4 Interventores, 2 Directores
$590.000 2 Asistentes, 2 Ingenieros
$592.000 2 Interventores, 10 Obreros
$642.000 1 Director, 2 Asistentes

a) Cul es el salario que mejor representa el sueldo de los empleados de la empresa de
telefona celular?
b) Organiza los datos en una tabla de datos agrupados, utilizando seis intervalos de clase y
determina para estos datos agrupados, la media aritmtica, la mediana y la moda.

- 84 -
c) Cules son los salarios medios que mejor representan los salarios de los empleados si se
discriminan por tipo de empleo en la empresa?
d) Determina cual es el salario mximo que tiene el 25% del grupo de empleados con salarios
ms bajos, y el salario mnimo que tiene el 25% del grupo de empleados con salarios ms
altos.

Discusin Discusin Discusin Discusin. En este tipo de problemas sobre salarios de una empresa donde se pide seleccionar
una medida de tendencia central que sea ms representativa, generalmente conviene utilizar
un diagrama de caja para revisar si hay valores atpicos e identificar la ubicacin de la
mediana y la media aritmtica.


En el grfico se identifica que no hay valores extremos o atpicos; que la media aritmtica, que
aparece indicada con un signo ms, es menor que la mediana con un valor aproximado es de
$450.000; y que la mediana, que aparece representada un poco ms arriba como la lnea
negra repisada, prcticamente coincide con el valor del tercer cuartil con un valor aproximado
de $490.000. En realidad se puede verificar a partir de la tabla de frecuencias, que se presenta
ms abajo, que la media aritmtica es $456.879 y que la mediana es $490.000, coincidiendo
esta ltima con el valor de la moda.

El hecho de que la mediana coincida con la moda hace tentador proponer el valor de
$490.000 como el mejor representante del salario medio. Sin embargo la media aritmtica,
cuyo valor es un poco ms bajo, est reflejando el hecho de que haya dos salarios ms bajos
que la moda, uno de $342.000 y otro de $392.000, que tienen las siguientes frecuencias ms
altas. Entonces, qu medida de tendencia central es ms representativa? Quizs, la mejor
respuesta es que las tres, ya que cada una de ellas refleja diferentes aspectos de la distribucin
de los datos.
La tabla de frecuencias que se present antes resume de manera suficiente la organizacin de
los datos. En este caso, quizs no es procedente agrupar los datos. No obstante, se realizar la
agrupacin de con el objeto de ilustrar la construccin de la tabla y para comparar la precisin
de los resultados de las estimaciones de las medidas de tendencia central con las que se
obtuvieron de manera no agrupada.

- 85 -

Sala Sala Sala Salario rio rio rio Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia acumulada Frecuencia acumulada Frecuencia acumulada Frecuencia acumulada
342.000 30 30
390.000 4 34
392.000 35 69
440.000 2 71
442.000 4 75
490.000 45 120
492.000 20 140
540.000 8 148
542.000 6 154
590.000 4 158
592.000 12 170
642.000 3 173

La determinacin de los intervalos de clase no tiene mayor dificultad, dado que la diferencia
entre el valor mximo y mnimo de los datos, que es 300.000, es divisible por seis. Entonces
el intervalo de clase ser de longitud 50.000 y la tabla de frecuencias, incluidas las marcas de
clase y la frecuencia acumulada, es la siguiente:

Intervalos Intervalos Intervalos Intervalos Marca de clase Marca de clase Marca de clase Marca de clase Frecuencia Frecuencia Frecuencia Frecuencia Frec. Acumulada Frec. Acumulada Frec. Acumulada Frec. Acumulada
De $342.000 hasta $392.000 367.000 34 34
De $392.000 hasta $442.000 417.000 37 71
De $442.000 hasta $492.000 467.000 49 120
De $492.000 hasta $542.000 517.000 28 148
De $542.000 hasta $592.000 567.000 10 158
De $592.000 hasta $642.000 617.000 15 173

Se puede calcular la media aritmtica sin tener en cuenta los miles de pesos y luego
multiplicar por mil. La expresin a calcular es:
367 34 417 37 467 49 517 28 567 10 617 15
173
+ + + + +

Al realizar la operacin, luego multiplicar por mil y redondear las cifras decimales despus de
la coma, se obtiene $463.532. Entonces hay una prdida de precisin al calcular la media de
manera agrupada que causa una sobrestimacin de un poco ms de $6.000.
Para calcular la mediana agrupada, primero se identifica el intervalo en se ubica la mediana
que corresponde al primer intervalo que supere en su frecuencia acumulada al 50% de los
datos, en este ejemplo corresponde al intervalo que va de $442.000 a $492.000. Entonces la
mediana se obtiene al calcular la expresin:

- 86 -
173
71
2
Me 442.000 50.000
49
(

(
= + (
(
(


El resultado redondeando es $457.816 y la prdida de precisin al agrupar es de ($490.000
$457.816) = $32.184, considerablemente mayor que en el caso de la media aritmtica. En
cuanto al clculo de la moda agrupada, primero se identifica el intervalo modal, que
corresponde al que va de $442.000 a $492.000. Como en este caso los intervalos son de igual
longitud, no es necesario determinar densidades de frecuencia y la expresin para la moda se
reduce a
i 1
i 1
i 1 i 1
n
Mo L C
n n
+

+
= +
+

Donde L
i-1
, es el extremo inferior del intervalo modal, n
i
la frecuencia absoluta del intervalo
modal y C la amplitud del intervalo. Entonces:
28
Mo 442.000 50.000
37 28
= +
+

Al calcular la expresin y redondear se obtiene $463.538. Entonces hay una prdida de
precisin de ($490.000-$463.538) = $26.432, que aunque es menor que para el caso de la
mediana tambin es mucho mayor si se compara con el caso de la media aritmtica.


Obr. Obr. Obr. Obr. Tec. Tec. Tec. Tec. Asi. Asi. Asi. Asi. Ing. Ing. Ing. Ing. Int. Int. Int. Int. Dir. Dir. Dir. Dir.
$ 342.000 30
$ 390.000 3 1
$ 392.000 35
$ 440.000 1 1
$ 442.000 2 2
$ 490.000 40 5
$ 492.000 20
$ 540.000 3 3 2
$ 542.000 4 2
$ 590.000 2 2
$ 592.000 10 2
$ 642.000 2 1
Total 135 9 9 7 10 3
Media $439.556 $451.111 $546.000 $526.286 $531.600 $575.333
Mediana $490.000 $490.000 $540.000 $540.000 $542.000 $542.000
Moda $490.000 $490.000 $540.000 $540.000 $542.000 $542.000

La tabla anterior presenta la forma como se distribuyen las frecuencias de los salarios si se
discriminan por tipo de empleo. Se observa la misma estabilidad de las estimaciones de las
medianas y las modas, en el sentido de que conducen a los mismos valores de acuerdo al tipo

- 87 -
de empleo e incluso no evidencian diferencias entre los cargos de obreros y tcnicos, entre
asistentes e ingenieros, y entre interventores y directores. En cambio, las estimaciones de la
media aritmtica permiten establecer diferencias en los salarios de acuerdo a los cargos, pero
no es consistente con el orden que generan la mediana y la moda respecto a los salarios.
Para finalizar con el ejemplo se har referencia a la determinacin del salario mximo que
tiene el 25% del grupo de empleados con salarios ms bajos, y del salario mnimo que tiene el
25% del grupo de empleados con salarios ms altos. Al respecto, lo que se requiere es el
clculo de los cuartiles Q
1
y Q
3
que se pueden estimar visualmente en el grfico de caja
presentado al comienzo de la discusin. Tambin es relativamente fcil determinar estos
valores con base en la tabla de frecuencias de los salarios sin agrupar. El primer cuartil se
debe ubicar entre los datos 43 y 44, ya que 173/4 = 43,25, este valor es $392.000. El tercer
cuartil, se debe ubicar entre los datos, 129 y 130, ya que 173*3/4 = 129,75, y este valor
corresponde a $492.000. No debe sorprender el hecho de que la diferencia entre el valor de la
mediana (o la moda) y el del tercer cuartil apenas sea de $2.000, ya que hay una gran cantidad
de salarios, como precisamente lo indica la moda, de $490.000.

Ejemplo13. Cul es la edad ideal para casarse? Ejemplo13. Cul es la edad ideal para casarse? Ejemplo13. Cul es la edad ideal para casarse? Ejemplo13. Cul es la edad ideal para casarse?
Se realiz una encuesta para indagar sobre la edad en la que a las mujeres les gustara casarse.
Para ello se les pregunt a 113 mujeres, que fueron a un supermercado de Bogot a realizar
alguna compra durante el mes pasado, cul era su opinin al respecto. Las respuestas
obtenidas se organizaron en un grfico de puntos que se presenta ms adelante.
Para facilitar el estudio de los datos obtenidos en la encuesta, primero se pide que se agrupen
los datos que se presentan en el grfico de puntos, en cinco grupos de edades y con base en
sta que se responda a las siguientes preguntas:
a) Entre que valores oscila la edad ms comn para casarse?
b) Cules son los dos intervalos de edad que en opinin de las mujeres son apropiados para
casarse?
c) Cul es el intervalo en el que para las mujeres no es muy comn casarse?

Discusin Discusin Discusin Discusin. Aunque la edad se supone que es una variable continua, en este ejemplo, la
informacin se presenta de manera discreta, es decir, no hay valores intermedios entre dos
edades enteras consecutivas como 23 y 24. En estos casos se sugiere presentar los intervalos

- 88 -
de clase con valores extremos que tambin formen parte del intervalo. Adems, como hay un
total de 20 valores diferentes, la agrupacin es fcil de definir: simplemente debe incluir 20/5
= 4 valores en cada intervalo. La tabla resultante con los valores de las respectivas frecuencias
es:

Intervalos de edades Intervalos de edades Intervalos de edades Intervalos de edades Frecuencia Frecuencia Frecuencia Frecuencia
De 20 a 23 aos 8
De 24 a 27 aos 25
De 28 a 31 aos 42
De 32 a 35 aos 22
De 36 a 39 aos 16

Por supuesto, esta informacin tambin se puede resumir en un grfico de puntos
agrupado.

Una breve mirada a la tabla, o al grfico, permite identificar que la edad ms comn para
casarse es de los 28 a los 31 aos. Tambin se puede observar que de los 24 a los 27 aos y de
los 28 a los 31 aos es la edad ms comn en que las mujeres les gustara casarse, es decir de
los 24 a los 31 aos. Finalmente, se tiene que la edad menos comn para casarse es de los 20
a los 23 aos.

Ejemplo 14. Mediciones con un planmetro Ejemplo 14. Mediciones con un planmetro Ejemplo 14. Mediciones con un planmetro Ejemplo 14. Mediciones con un planmetro. .. .
Un planmetro es un instrumento para medir reas de superficies planas. Con este instrumento
se tom una muestra de cinco mediciones a las reas de un lote de baldosas que se utilizarn
en una construccin para realizar un control de calidad. La tabla siguiente muestra este
conjunto de mediciones.

Baldosa Baldosa Baldosa Baldosa rea (cm rea (cm rea (cm rea (cm
2 22 2
) ) ) )
1 402
2 398
3 405
4 406
5 400
a) Determine el error medio cuadrtico.

- 89 -
b) De acuerdo al resultado anterior, y suponiendo que la muestra tomada es representativa
de un lote aceptable de produccin, sera extrao o poco usual encontrar una baldosa
que midiera 412 cm
2
?

Discusin Discusin Discusin Discusin. Antes de abordar el ejemplo propuesto es bueno tener en cuenta algunas
observaciones acerca de lo que se debe entender como error de medicin error de medicin error de medicin error de medicin y sobre la
definicin misma del error medio cuadrtico, ya que existe una medida de resumen
estadstico llamada media cuadrtica muy relacionada con el error medio cuadrtico.
En primer lugar, las consideraciones estadsticas juegan un papel en relacin con las
mediciones fsicas, ya que en general cualquier tipo de medicin incluye un error. Por esta
razn, es importante tener algunas nociones bsicas de cmo se podra trabajar
estadsticamente con errores de medicin. En realidad ya desde los tiempos de Gauss y
Laplace se tiene una propuesta sobre teora de errores, que se basa de manera esencial en el
supuesto de un comportamiento normal de la distribucin de los errores de medicin. El error error error error
de m de m de m de medicin edicin edicin edicin, tambin conocido como error de observacin error de observacin error de observacin error de observacin, se debe a la naturaleza de las
mediciones fsicas, a la persona que efecta la medicin, a los instrumentos que se usan en la
medicin y al sistema medido, ya que se ven afectados por pequeas perturbaciones no
predecibles. El error de medicin se puede reducir de tamao, con el uso de mejores mtodos
e instrumentos, pero nunca se puede anular por completo.
En algunas ocasiones hay que tener en cuenta cuando se trabaja con errores de medicin, que
si se usa un instrumento de medicin como un voltmetro que est mal calibrado, cada
medicin se ver afectada de la misma forma. En estos casos el error correspondiente tiene un
componente de error constante o sistemtico error constante o sistemtico error constante o sistemtico error constante o sistemtico. Cuando se utiliza la teora de la probabilidad,
este tipo de error no es el que verdaderamente interesa. Lo que realmente importa son los
errores estadsticos errores estadsticos errores estadsticos errores estadsticos de mediciones que son provocados por un gran nmero de pequeas
perturbaciones que afectan las mediciones y cuyo efecto no se puede predecir. Sin embargo,
si se puede tener alguna comprensin acerca de su efecto a luz de lo que llamaremos
supuesto de normalidad supuesto de normalidad supuesto de normalidad supuesto de normalidad. La idea anterior se puede precisar ms de la siguiente manera:
supngase que Emc Emc Emc Emc, es el error cuadrtico medio y que x es la media de las mediciones,
entonces se espera que alrededor de 2/3 (67%) de los valores de las mediciones se localizar
entre x Emc y x + Emc y que 19/20 (95%) de los valores se localizar entre x 2Emc y x
+ 2Emc en una muestra suficientemente grande.
En segundo lugar, en cuanto a la definicin del error cuadrtico medio hay que sealar que la
definicin dada coincide con la de la desviacin estndar S, que se comenta con ms detalle
en la prxima seccin sobre medidas de dispersin. Por ahora slo se explicitar que
n n n n n
2 2 2 2
i i i i
i 1 i 1 i 1 i 1 i 1
2 2
1 1 1 1 1
(Emc) (x x) x x x x x x
n n n n n = = = = =
= = 2 + =
As, el trmino
n
2
i
i 1
1
x
n =
es el cuadrado de la llamada media cuadrtica, es decir, de la expresin
n
2
i
i 1
1
x
n =
. Entonces se tiene es que el cuadrado del error medio cuadrtico es el cuadrado de

- 90 -
la media cuadrtica menos un factor de correccin dado por el cuadrado de la media de la
muestra. En otras palabras, la media cuadrtica es una forma de error medio cuadrtico que
no contempla el efecto de la media de las mediciones.
Hechas las aclaraciones anteriores, se aborda la solucin del ejemplo. Primero se obtiene que
x = 402, 2 cm
2
y con este valor se encuentran los errores respecto a la media como se muestra
en la tabla.

Baldosa Baldosa Baldosa Baldosa rea (cm rea (cm rea (cm rea (cm
2 22 2
) ) ) ) | x | x | x | x
j jj j
- -- - x | || | ( x ( x ( x ( x
j jj j
- -- - x ) )) )
2 22 2

1 402 0,2 0,04
2 398 4,2 17,64
3 405 2,8 7,84
4 406 3,8 14,44
5 400 2,2 4,84
Suma 2011 13,2 44,80

Luego Emc =
44, 80
5
= 2,99. Entonces, suponiendo que hay normalidad en las mediciones
realizadas con este instrumento, se puede esperar que entre (402,2 2x2,99) cm
2
y (402,2 +
2x2,99) cm
2
se encuentre el 95% de las mediciones, es decir entre 396,22 cm
2
y 408,18 cm
2
.
Con base en esta informacin se puede afirmar que una medicin que arroje un valor de 412
cm
2
es poco probable de encontrar, pues estara a una distancia de ms de 3 veces el valor del
error medio cuadrtico.

Ejemplo Ejemplo Ejemplo Ejemplo 15. 15. 15. 15. I II Interpolacin nterpolacin nterpolacin nterpolacin para datos agrupados para datos agrupados para datos agrupados para datos agrupados. .. .
Una fbrica de bombillas realiza un proceso de control de calidad que consiste en instalar 200
bombillas en 200 portalmparas que se encuentran debidamente organizadas en varias mesas,
todas son encendidas al tiempo y se registra en tiempo de duracin de cada bombilla.
Supngase que el registro de las duraciones o vida til de cada bombilla se presenta en la
tabla que se muestra ms adelante. Con base en la tabla se debe determinar la vida media, la
moda, la mediana, los cuartiles, los deciles y los percentiles de la vida til de las bombillas.

Discusin Discusin Discusin Discusin. Para calcular la media, se deben agregar dos columnas, una que contendr las
marcas de clase de cada intervalo de clase y otra en donde se colocarn los productos de cada
marca de clase con su respectiva frecuencia absoluta.
Se realizan los productos FiMi y la suma
i 15
i 1
FiMi
=
=

, finalmente se calcula
i 15
i 1
i 15
i 1
FiMi
51.500
X 206
250
Fi
=
=
=
=
= = =

.

- 91 -
Duracin Duracin Duracin Duracin
(Horas) (Horas) (Horas) (Horas)
Cantidad de Cantidad de Cantidad de Cantidad de
bombillas (Fi) bombillas (Fi) bombillas (Fi) bombillas (Fi)
Marca de Clase Marca de Clase Marca de Clase Marca de Clase
Mi Mi Mi Mi
Fi x Mi Fi x Mi Fi x Mi Fi x Mi
[10,35) 5 22,5 113
[35,60) 5 47,5 238
[60,85) 10 72,5 725
[85,110) 15 97,5 1463
[110,135) 15 122,5 1838
[135,160) 20 147,5 2950
[160,185) 25 172,5 4313
[185,210) 15 197,5 2963
[210,235) 35 222,5 7788
[235,260) 30 247,5 7425
[260,285) 50 272,5 13625
[285,310) 10 297,5 2975
[310,335) 5 322,5 1613
[335,360] 10 347,5 3475
Total Total Total Total 250 Total Total Total Total 51500


Para estimar el valor de la moda, se realiza un procedimiento geomtrico que consiste en:

- Dibujar el histograma, tomar la clase con mayor frecuencia (clase modal) y las dos
clases adyacentes.
- Asignar coordenadas a los puntos A, B C y D de acuerdo a los lmites del intervalo de
la clase modal y las frecuencias de las tres clases tomadas. As, los puntos son
A=(260,30), B=(285,50), C=(260,50) y D=(285,10).
- Hallar las ecuaciones de las rectas que contienen a los segmentos AB y CD,
respectivamente.

0
10
20
30
40
50
60
[10,35) [35,60) [60,85) [85,110) [110,135) [135,160) [160,185) [185,210) [210,235) [235,260) [260,285) [285,310) [310,335) [335,360]


- 92 -

Se halla el punto de interseccin de los segmentos AB y CD, es
decir, la solucin del sistema
4x 5y 890
8x 5y 2330
+ =

+ =

, es cual es
805 110
,
3 3
| |
|
\
.
Por lo tanto, la moda es aproximadamente Mo=268.33, (la
proyeccin de la interseccin sobre el eje X).



Para calcular la mediana o cualquiera de los cuantiles se elabora una tabla de frecuencias
acumuladas relativas y el diagrama para la tabla.
0%
20%
40%
60%
80%
100%
120%
35 60 85 110 135 160 185 210 235 260 285 310 335 360
Duracin menor o igual a:
F
r
e
c
u
e
n
c
i
a

a
c
u
m
u
l
a
d
a


Duracin Duracin Duracin Duracin
(Horas) (Horas) (Horas) (Horas)
Cant idad de Cant idad de Cant idad de Cant idad de
bombillas bombillas bombillas bombillas
Bombillas con Bombillas con Bombillas con Bombillas con
duracin < o = duracin < o = duracin < o = duracin < o =
Frecuencia Relativa Frecuencia Relativa Frecuencia Relativa Frecuencia Relativa
Porcentual Porcentual Porcentual Porcentual
[10,35) 5 5 2%
[35,60) 5 10 4%
[60,85) 10 20 8%
[85,110) 15 35 14%
[110,135) 15 50 20%
[135,160) 20 70 28%
[160,185) 25 95 38%
[185,210) 15 110 44%
[210,235) 35 145 58%
[235,260) 30 175 70%
[260,285) 50 225 90%
[285,310) 10 235 94%
[310,335) 5 240 96%
[335,360] 10 250 100%
Total Total Total Total 250


- 93 -
Para el clculo de la mediana Me o cualquiera de los cuantiles, se debe tener en cuenta que:
Hasta la mediana se acumula el 50% de los datos, hasta el primer cuartil se acumula el 25% de
los datos, hasta el octavo decil se acumula el 80% de los datos, y hasta el percentil p se
acumula el p% de los datos registrados. En la tabla, para el caso de la mediana, el porcentaje
50% se encuentra entre los porcentajes 44% y 58%. La duracin correspondiente a la mediana
se encuentra entre las duraciones 210 y 235.
Despus de organizar la informacin en una tabla y se realiza una regla de tres.

Duracin


Porcentaje
210

44%
Me

50%
235

58%

Me 210 235 210
50 44 58 44
Me 210 25
6 14
1545
Me 220.71
7

=

=
= =


4.15 4.15 4.15 4.15 Ejercicios. Ejercicios. Ejercicios. Ejercicios.
1. Demostrar la frmula de la mediana para datos agrupados suponiendo que la variable es
continua.
2. Obtener una frmula para calcular los cuartiles en datos agrupados, suponiendo que la
variable es continua y que los intervalos de clase son de igual longitud.
3. Obtener una frmula para calcular los deciles en datos agrupados, suponiendo que la
variable es continua y que los intervalos de clase son de igual longitud.
4. La Universidad Nacional tiene organizadas las carreras por edificios, por ejemplo el
edificio de medicina se encuentra a 27.5 m de la entrada principal, el de arte a 29.9 m y el
de psicologa a 28.7m. En la siguiente tabla se registra el tiempo que gastan 4 estudiantes
en desplazarse de la entrada a sus respectivos edificios

Estud Estud Estud Estudiante iante iante iante Tiempo (minutos) Tiempo (minutos) Tiempo (minutos) Tiempo (minutos) Distancia(edificio) Distancia(edificio) Distancia(edificio) Distancia(edificio)
1 5 27.5 m
2 8 29.9 m
3 8 28.7 m
4 6 26 m
Cul es el tiempo promedio que gastan las estudiantes en llegar a su respectivo edificio?
5. Verificar los diferentes clculos de medias, medias ponderadas y medianas que aparecen
reportados en el Ejemplo 3.
6. Explique por qu para obtener la velocidad promedio de un objeto que viaja con dos
velocidades diferentes durante tiempos iguales, la media aritmtica de las velocidades es
apropiada.

- 94 -
7. El sbado pasado, Cristian un empleado de un kiosco de bebidas sirvi en total 50 bebidas
durante la maana de ese da. Vendi 5 bebidas de $250, 15 de $270, otras 15 de $300 y
otras 15 de $350. A cmo vendi en promedio cada bebida ese da?
8. En Miss Universo las cinco finalistas candidatas a la corona obtuvieron los siguientes
puntajes:

Tipo de traje Tipo de traje Tipo de traje Tipo de traje Colombia Colombia Colombia Colombia Venezuela Venezuela Venezuela Venezuela Mxico Mxico Mxico Mxico R. Dominicana R. Dominicana R. Dominicana R. Dominicana Rusia Rusia Rusia Rusia
Bao 9,40 9,20 9,00 8,90 8,85
Gala 9,83 9,40 8,90 8,88 9,00
Tpico 9,48 9,60 9,20 9,80 8,50
a) Si se escogiera a la reina teniendo en cuenta el mayor puntaje obtenido. Cul sera la
Reina?
b) Quines seran la Virreina, 1 Princesa, 2 Princesa y 3 Princesa?
9. Considere el siguiente juego con tres dados de seis caras: si la suma de los tres dados es 18
gana $3000, si la suma de los tres dados es 12 gana $2.000, si la suma de los tres dados es
6 gana $1.000, y si la suma es diferente de 6,12 y 18 pierde $500.
a) Es conveniente jugar este juego? Justifique su respuesta en trminos de una
ponderacin apropiada a los valores de ganancia y prdida.
b) Construya una simulacin en Excel y compare resultados tericos y de la simulacin
para 100, 500 y 1.000 juegos.
10. Un estudiante de Administracin de Empresas est cursando el quinto semestre, el
promedio de notas de los semestres anteriores ha sido el siguiente:

Semestre I II III IV
Nota promedio 3,8 3,7 3,9 4,0
Las notas obtenidas en el quinto semestre son las siguientes:

Materia Materia Materia Materia Crditos Crditos Crditos Crditos Nota Nota Nota Nota
Mercadotecnia
Macroeconoma
Matemtica Financiera
Presupuestos
Ingls
3
5
4
3
2
3,8
4,5
4,2
4,0
3,5
a) Cul es el promedio que obtuvo el estudiante en el quinto semestre?
b) Qu promedio lleva el estudiante hasta el momento?
c) Qu promedio debe tener en VI semestre para que su promedio general sea 4,0?
d) Es posible que el promedio total hasta VI semestre sea mayor 4,5?

- 95 -
11. Los siguientes datos corresponden al crecimiento de un parque Automotor en la ciudad de
Bogot durante 5 aos:

Aos Aos Aos Aos Nmero de Matriculas Nmero de Matriculas Nmero de Matriculas Nmero de Matriculas Factor de Crecimiento Factor de Crecimiento Factor de Crecimiento Factor de Crecimiento
2001 1200 1,20
2002 1440 1,25
2003 1800 1,30
2004 2340 1,20
2005 2808 1,25
Cul es la tasa promedio de crecimiento del parque automotor en la ciudad?
12. Una profesora quiere cambiar la colocacin de sus alumnos en clase, con la esperanza de
que ello incremente el nmero de preguntas que hacen. En primer lugar, decide ver
cuntas preguntas hacen los estudiantes con la colocacin actual. El registro de nmero
de preguntas hechas por sus ocho estudiantes durante la clase se muestra a continuacin.

Iniciales del alumno. Iniciales del alumno. Iniciales del alumno. Iniciales del alumno.

A.A. R.F. A.G. J.G. C.K. N.K. J.L. A.W.
N de pregunt N de pregunt N de pregunt N de preguntas as as as 0 5 2 22 3 2 1 3
La profesora quiere representar o resumir con un nmero la cantidad de preguntas hechas
por estudiante. Cul de los siguientes procedimientos le recomendaras? Explica porqu.
a) Usar el nmero ms comn, que es el 2.
b) Sumar los 8 nmeros y dividir por 8.
c) Descartar el 22, sumar los otros 7 nmeros y dividir por 7.
d) Descartar el 0, sumar los otros 7 nmeros y dividir por 7
e) Otro mtodo Cul?
13. En los ltimos cinco aos los suscriptores a telefona celular han aumentado notoriamente
de tal manera que el 1 de enero del ao 1999 haba 12.000 suscriptores y al 31 de
diciembre del 2004 haba 4.600.000 suscriptores. La siguiente tabla muestra los detalles:

Crecimiento de poblacin de suscriptores Crecimiento de poblacin de suscriptores Crecimiento de poblacin de suscriptores Crecimiento de poblacin de suscriptores
Ao Ao Ao Ao
Suscriptores al Suscriptores al Suscriptores al Suscriptores al
inicio del ao inicio del ao inicio del ao inicio del ao
Tasa de Tasa de Tasa de Tasa de
Crecimi Crecimi Crecimi Crecimiento ento ento ento
Suscriptores al Suscriptores al Suscriptores al Suscriptores al
final del ao final del ao final del ao final del ao
Factor de Factor de Factor de Factor de
Crecimiento Crecimiento Crecimiento Crecimiento
1999 12.000 36.000
2000 36.000 120.000
2001 120.000 400.000
2002 400.000 900.000
2003 900.000 2.000.000
2004 2.000.000 4.600.000
Cul es la tasa promedio de crecimiento anual y cul es el factor promedio de
crecimiento?

- 96 -
14. Se sabe que dos obreros A y B gastan, respectivamente, 50 y 40 minutos en remontar un
par de zapatos. Cul es el tiempo promedio requerido para montar un par de zapatos?
15. Un avin recorre 3000 km. Los 1000 primeros a 700 km/h, los 1000 siguientes a 800 km/h,
y los 1000 restantes a 900 km/h. Cul ha sido la velocidad media?
16. En el circuito de Indianpolis 5 competidores presentaron las siguientes estadsticas en las
5 primeras y 5 ltimas vueltas:

Cinco pri Cinco pri Cinco pri Cinco primeras Vueltas meras Vueltas meras Vueltas meras Vueltas Cinco ltimas vueltas Cinco ltimas vueltas Cinco ltimas vueltas Cinco ltimas vueltas
Vuelta N Vuelta N Vuelta N Vuelta N
Velocidad Velocidad Velocidad Velocidad Velocidad Velocidad Velocidad Velocidad
Montoya 288 km/h 312 km/h
Schumacher 300 km/h 310 km/h
Barichelo 320 km/h 290 km/h
Raikonem 290 km/h 280 km/h
Alonso 322 km/h 300 km/h
a) Cul fue el promedio de las cinco primeras vueltas?
b) Cul fue el promedio de las cinco ltimas vueltas?
c) Qu competidor tuvo el mejor promedio de velocidad teniendo en cuenta el principio
(5 primeras vueltas) y final (5 ltimas vueltas) de la carrera?
17. Una poblacin que tena 10.000 habitantes en el ao cero (2000), creci el primer ao a
una tasa del 5%, el segundo ao creci a una tasa del 20% y el tercer ao al 50%. A qu
tasa promedio ha crecido la poblacin en esos tres aos?
18. Los datos que se presentan en la tabla corresponden al ingreso percpita, de pases de
Amrica del sur. El ingreso percpita es un indicador econmico que hace referencia a
todas las entradas econmicas que recibe un pas (en este caso en millones de dlares)
dividido por el total de su poblacin. Este indicador se considera como el ingreso medio
percpita de los habitantes de cada pas.

Pas Pas Pas Pas 1995 1995 1995 1995 1998 1998 1998 1998
Argentina 9.728 8.030
Bolivia 2.205 1.010
Brasil 6.460 4.630
Chile 8.507 4.990
Colombia 5.861 2.470
Ecuador 3.003 1.520
Paraguay 4.312 1.760
Per 4.180 2.440
Uruguay 8.541 6.070
Venezuela 5.706 3.530
Guayana 7.504 7.200
Surinam 2.304 5.432

- 97 -
a) Cul es el promedio del ingreso percpita en millones de dlares de Amrica del sur
en el ao de 1995?
b) Cul es el promedio del ingreso percpita en millones de dlares de Amrica del sur
en el ao de 1998?
c) En qu ao Amrica del sur tuvo mayor ingreso percpita?
d) Cul es el promedio de ingreso percpita en millones de dlares en los dos aos?
19. La cajera de una tienda va anotando los precios y las cantidades de los productos que ha
adquirido un cliente. En el ticket de compra aparece esta relacin:

Producto Producto Producto Producto N unidades N unidades N unidades N unidades Precio por unidad Precio por unidad Precio por unidad Precio por unidad
Azcar
Aceite girasol
Leche semi-descremada
Zumo
Latas de refrescos
Botella de vino
4
10
10
6
12
2
156
115
64
75
50
139
Cul ser el precio superado por la mitad del precio de los productos?
20. Las tiendas High Fidelity etiquetan su mercanca 35% por encima del costo de su ltima
adicin al inventario. Hasta hace 4 meses, la grabadora de marca Mp3-Dynamic 400S
costaba $300.000. Durante los ltimos 4 meses High Fidelity recibi 4 embarques
mensuales de esta grabadora con los siguientes costos unitarios: $275.000, $250.000,
$240.000 y $225.000. A qu tasa promedio mensual ha disminuido el precio de venta de
High Fidelity en estos 4 meses?
21. Los datos contenidos en la siguiente tabla muestran el desempeo de 28 equipos de la
Liga Nacional de ftbol Americano en 1976.

Equipos Equipos Equipos Equipos Juegos ganados Juegos ganados Juegos ganados Juegos ganados Equipos Equipos Equipos Equipos Juegos ganados Juegos ganados Juegos ganados Juegos ganados
Washington 10 Denver 30
Minnesota 11 Detroit 6
New England 11 Green Bay 5
Oakland 13 Houston 5
Pittsburgh 10 Kansas City 5
Baltimore 11 Miami 6
Los ngeles 10 New Orleans 4
Dallas 11 New York Giants 6
Atlanta 4 New York Jets 6
Buffalo 1 Philadephia 17
Chicago 7 San Francisco 8
Cincinnati 10 Tampa Bay 0
Cleveland 9
Cul es el nmero que usted escogera para representar el desempeo de los equipos de
ftbol? Por qu?

- 98 -
22. En un zoocriadero destinado a la cra de chigiros para exportacin se ha descuidado la
alimentacin de los animales y se ha presentado un desarrollo inesperado en estos. Se han
clasificado los animales en 10 grupos, teniendo en cuenta sus pesos en kilogramos. La
siguiente tabla muestra la cantidad de animales en cada categora de pesos:

Intervalos de pesos Intervalos de pesos Intervalos de pesos Intervalos de pesos Nmero de animales Nmero de animales Nmero de animales Nmero de animales
35.00 - 40.00 20
40.10 - 45.00 25
45.10 - 50.00 30
50.10 - 55.00 10
55.10 - 60.00 15
60.10 - 65.00 20
65.10 - 70.00 25
70.10 - 75.00 35
75.10 - 80.00 10
80.10 - 85.00 10
Calcule la media para estos datos agrupados y estime el valor de la mediana para estos
datos agrupados.
23. En el almacn Tornillo Loco Tornillo Loco Tornillo Loco Tornillo Loco lleg un pedido de 25 tornillos de 3 centmetros de largo.
Cuando el dueo del almacn revis su mercanca encontr 5 tornillos con las siguientes
medidas:

Tornillo Tornillo Tornillo Tornillo Medida (mm) Medida (mm) Medida (mm) Medida (mm)
1 5
2 4
3 6
4 8
5 6
Cul es el error medio cometido, prescindiendo de si este ha sido por exceso o por
defecto?
24. Las siguientes fueron la causas de mortalidad de 100.000 jvenes de Medelln, Bogot, Cali
y Barranquilla de 1989 a 1999:

10.000 mueren por tener cncer y se suicidaron
4.500 mueren por tener enfermedades transmisibles y se suicidaron
13.500 mueren por suicidio
7.500 mueren por enfermedades transmisibles
7.890 mueren en accidentes de trnsito
5.400 mueren en accidentes de trnsito por causa de paro cardiaco
3.500 mueren por homicidios por tener enfermedades transmisibles
4.300 mueren por tumores malignos
5.900 mueren a causa de asma
19.900 mueren por homicidio
110 mueren por bronquitis

- 99 -
10.000 mueren accidentes de trnsito
2.500 mueren por enfermedad cerebro-vasculares de tumor maligno
5.000 mueren debido a enfermedad del sistema urinario
Identifique cul es la causa ms frecuente de mortalidad de los jvenes de estas ciudades
en las categoras relativas a: homicidios, accidente de transporte terrestre, enfermedad
transmisible, tumores malignos (cncer, leucemia, tejido linftico, etc.), enfermedad del
aparato respiratorio, enfermedad cerebro vascular, agresiones auto infligidas (suicidios) y
enfermedad del sistema urinario.
25. En el Colegio Cooperativo la maestra pidi a sus alumnos que con ayuda de sus padres
midieran el largo de la terraza. Los miembros de la familia de David miden la longitud de
la terraza en metros y encuentran los resultados que aparecen a continuacin: 15.25,
12.32, 16.15, 15.25 y 11.28. Cul es el error medio cuadrtico de estas mediciones?
26. Demuestre que cuando se trabaja con datos agrupados, los cuantiles se pueden
calcular aplicando la frmula
i 1
i
i
i
i N
F
s
C (s) L a
i 1
f

= +

para i = 1, 2, , s-1., donde i


representa el i-simo cuantil, L
i-1
, f
i
y a
i
designa el lmite inferior, la frecuencia absoluta y la
amplitud del intervalo, respectivamente, de la clase a la que pertenece el cuantil y F
i-1
la
frecuencia acumulada absoluta de la clase anterior a ella.
27. El conteo bacterial de cierto cultivo pas de 1000 a 6000 en 6 das. Cul fue el promedio
del incremento porcentual por da?
28. Durante cinco aos sucesivos un agrnomo compr aceite diesel para sus tractores a los
precios respectivos de $125, $200, $350, $430 y $580 por galn. Cul fue el promedio del
costo por galn del aceite para el periodo de los 5 aos?
29. En promedio, cuntos aciertos se espera que obtenga una persona cuando contesta al
azar las 20 20 20 20 preguntas de un examen en donde cada pregunta tiene 4 44 4 opciones de
respuesta, pero solo una opcin es correcta?. Justifique su respuesta en trminos de una
ponderacin apropiada para la cantidad de aciertos posibles.
30. Una caja de compensacin ha clasificado a sus afiliados en 10 categoras, de acuerdo a sus
salarios. Un afiliado se ubica en la categora C(n) si su salario se encuentra en el intervalo
[ [[ [535.600n, 535.600 (n+1)) )) ), donde n=1,2,3,,10. La tabla muestra la cantidad de
empleados en cada categora.
C(1) C(2) C(3) C(4) C(5) C(6) C(7) C(8) C(9) C(10)
400 350 500 650 900 800 400 450 300 250
a) Calcule la Moda de la variable Salarios.
b) Grafique el diagrama de Cajas (Box Plot).
c) Cul es el mximo salario clasificado en el tercer decil?
d) Cul es el mnimo salario clasificado en el sptimo decil?

- 100 -
31. Un embarque de 15 computadoras similares que se enva a un distribuidor contiene 7
aparatos defectuosos. Una escuela escoge aleatoriamente 10 de estas computadoras y las
compra. Se define la variable aleatoria X como el nmero de computadoras defectuosas
entre las computadoras compradas. En promedio, Cuntas computadoras defectuosas se
espera que lleve el comprador?.
32. Un juego de apuestas consiste en lanzar seis veces un dado normal y apostar cierta
cantidad de dinero a un resultado, de tal manera que si el nmero apostado resulta n
veces, entonces gana 500n pesos, y si no resulta pierde 2000 pesos. Un jugador apuesta al
nmero 6. Se define la variable aleatoria como el beneficio del jugador en 6
lanzamientos de un dado. Use la media ponderada para determinar la ganancia esperada
del jugador.
33. Un objeto de tiro al blanco est formado por 5 crculos concntricos de radios 10 cm, 20
cm, 30 cm, 40 cm y 50 cm. Un hombre que dispara al blanco recibe 50 puntos, 40 puntos,
30 puntos, 20 puntos o 10 puntos, segn pegue en la zona 1 (crculo pequeo), zona 2,
zona 3, zona 4 o zona 5 (anillos circulares). La probabilidad de que el disparo haga
contacto con cualquiera de las 5 zonas del blanco es 1/3, y la probabilidad de no dar en el
blanco es 2/3. Si X se define como el puntaje en un disparo, Cul el puntaje esperado?
34. Anatoly recibe 5 cartas de una baraja francesa a la que le faltan 4 cartas de corazones y 4
cartas de diamantes, mientras que Boris recibe 5 cartas de una baraja francesa completa.
Quin tiene mayor expectativa de obtener corazones?
35. La empresa Cinascar se ha posicionado en el pas por la venta de vehculos a precios
cmodos. La empresa empez en el 2004 vendiendo 1200 vehculos, en los aos
siguientes hasta el 2009, ha vendido 1440, 1800, 2340, 2808 y 3510 vehculos
respectivamente. Cul es la tasa promedio de crecimiento de las ventas de estos ltimos 5
aos?
36. Un juego consiste en lanzar 4 dados distinguibles y apostarle a la aparicin del nmero 6.
Si ste nmero no sale el apostador pierde 100 pesos. Si ste le aparece 1, 2, 3 o 4 veces la
ganancia ser de 100, 200, 300 o 400 pesos respectivamente. Cul es la ganancia media
del jugador, en un lanzamiento de los dados?
37. Use la medida ponderada para determinar la favorabilidad del siguiente juego: Se lanzan
tres dados normales: si la suma de los tres dados es 18 gana $3000, si la suma de los tres
dados es 12 gana $2.000, si la suma de los tres dados es 6 gana $1.000, y si la suma es
diferente de 6,12 y 18 pierde $500. Es conveniente jugar este juego? Justifique su
respuesta en trminos de una ponderacin apropiada a los valores de ganancia y prdida.
38. La serie final de un campeonato de bisbol fue disputada por los equipos A y B, cada uno
con 20 jugadores. Al final de la serie se contabilizaron los batazos de hit conectados por
los jugadores titulares de cada equipo y se lleg a la distribucin que se muestra en la
tabla, con la cual se puede estimar informacin ms precisa de la variable Cantidad de
Hits conectados por jugador.

- 101 -

Hits Hits Hits Hits Jugadores Jugadores Jugadores Jugadores
[100,120) 4
[120,140) 8
[140,160) 12
[160,180) 6
[180,200) 8
[200,220] 2

a) Calcule el promedio de la cantidad de hits conectados por jugador.
b) Calcule la mediana de la cantidad de hits conectados por jugador.
c) Calcule la moda de la cantidad de hits conectados por jugador.
39. El siguiente diagrama representa la distribucin de frecuencias de los valores de una
variable continua X.
5
10
15
10
20
5
10
5
0
5
10
15
20
25
[ 00 , 10 ) [ 10 , 20 ) [ 20 , 30 ) [ 30 , 40 ) [ 40 , 50 ) [ 50 , 60 ) [ 60 , 70 ) [ 70 , 80 ]

a) Calcule el promedio aritmtico, la mediana y la moda de la variable X.
b) Calcule el cuartil 3, el decil 7 y el percentil 65.
40. Un examen de Clculo se aplic a los cuatro grupos de grado 11 de una institucin. En la
siguiente tabla se presenta la cantidad de estudiantes con notas en cada rango de notas
para cada uno de los cuatro grupos. Calcular para cada grupo la media, la mediana, la
moda, el cuartel 1 y el decil 7.


- 102 -
41. La siguiente tabla presenta las calificaciones en una prueba especfica de Matemticas de
un grupo de 150 aspirantes que han aprobado previamente una prueba de potencialidad
pedaggica.
5,0 5,3 5,6 5,9 6,2 6,5 6,8 7,1 7, 4 7,7 8,0 8,3 8,6 8,9 9,2
17,0 17,5 18,0 18,5 19,0 19,5 20,0 20,5 21,0 21,5 22,0 22,5 23,0 23,5 24,0
25,0 25,6 26,2 26,8 27,4 28,0 28,6 29,2 29,8 30,4 31,0 31,6 32,2 32,8 33,4
35,0 35,7 36,4 37,1 37,8 38,5 39,2 39,9 40,6 41,3 42,0 42,7 43,4 44,1 44,8
45,0 45,8 46,6 47,4 48,2 49,0 49,8 50,6 51,4 52,2 53,0 53,8 54,6 55,4 56,2
57,0 57,9 58,8 59,7 60,6 61,5 62,4 63,3 64,2 65,1 66,0 66,9 67,8 68,7 69,6
70,0 70,2 70,4 70,6 70,8 71,0 71,2 71,4 71,6 71,8 72,0 72,2 72,4 72,6 72,8
73,0 73,1 73,2 73,3 73,4 73,5 73,6 73,7 73,8 73,9 74,0 74,1 74,2 74,3 74,4
75,0 76,0 77,0 78,0 79,0 80,0 81,0 82,0 83,0 84,0 85,0 86,0 87,0 88,0 89,0

a) Los aspirantes cuyas calificaciones se ubiquen en el primer cuartil son retirados del
proceso de admisin. Cul es la menor calificacin entre los estudiantes que siguen
en el proceso?
b) Los estudiantes cuyas calificaciones se encuentren en los dos ltimos deciles no
presentan entrevista y ya quedan admitidos. Cul debe ser la mnima calificacin para
quedar en este selecto grupo?

42. En la siguiente tabla se encuentran clasificados los puntajes de la prueba de potencialidad
pedaggica de los aspirantes a un programa de licenciatura de una universidad oficial.

Calificaciones Calificaciones Calificaciones Calificaciones
Cantidad de Cantidad de Cantidad de Cantidad de
Aspirantes Aspirantes Aspirantes Aspirantes
[0.0 0.5) 45
[0.5 1.0) 50
[1.0 1.5) 20
[1.5 2.0) 35
[2.0 2.5) 40
[2.5 3.0) 20
[3.0 3.5) 40
[3.5 4.0) 30
[4.0 4.5) 15
[4.5 5.0) 15



Calificaciones Calificaciones Calificaciones Calificaciones
Cantidad de Cantidad de Cantidad de Cantidad de
Aspirantes Aspirantes Aspirantes Aspirantes
[5.0 5.5) 45
[5.5 6.0) 55
[6.0 6.5) 50
[6.5 7.0) 35
[7.0 7.5) 25
[7.5 8.0) 25
[8.0 8.5) 40
[8.5 9.0) 30
[9.0 9.5) 0
[9.5 10.) 0


a) Use el mtodo de interpolacin lineal en frecuencias acumuladas para calcular los
percentiles P
35
y P
65
, y los deciles D
3
y D
7
.
b) Use la frmula
k-1
k k-1
k
kN
- F
s
Q (s) = L + L
f
| |
|
|
|
|
\
, (k=1,2,,s-1) para calcular los percentiles P
35

y P
65
, y los deciles D
3
y D
7
.
Donde:

- 103 -
k es k-simo cuantil;
L
k-1
es Lmite inferior de la clase cuantlica;
f
k
es Frecuencia absoluta de intervalo cuantlico;
Fk-1 es Frecuencia acumulada hasta el intervalo anterior al intervalo cuantlico;
L: Longitud de clases; s= 4 (cuartiles), 10 (deciles), 100 (percentiles).

43. El histograma de la figura representa los pesos en kilogramos de 104 deportistas que
representan a Colombia en unos juegos panamericanos.
a) Calcular la moda de los pesos.
b) Calcular los deciles de los pesos.
0
4
6
10
14
20 20
14
10
6
4
0
0
2
4
6
8
10
12
14
16
18
20
22
[30,37) [37,44) [44,51) [51,58) [58,65) [65,72) [72,79) [79,86) [86,93) [93,100)

44. El polgono de frecuencias de la figura representa los salarios en euros de 100 empleados
de una empresa de correos.
a) Calcular el salario promedio.
b) Calcular la mediana de los salarios.
c) Calcular la moda de los salarios.
d) Calcular los cuartiles de los salarios y grafique el diagrama de cajas.
0
2
4
6
8
10
12
14
[300,370) [370,440) [440,510) [510,580) [580,650) [650,720) [720,790) [790,860) [860,930) [930,1000)


- 104 -
45. X es una variable continua que toma N valores distribuidos en n intervalos de longitud L,
la frecuencia de la clase modal es fm y las frecuencias de las clases anterior y posterior a la
clase modal son fa y fp respectivamente, los lmites de las tres clases consideradas son La,
Li, Ls y Lp. (Ver figura).

a) Demuestre, usando argumentos geomtricos, que la moda de datos agrupados de la
variable X es igual a
Dp
Mo Li L
Da Dp
| |
= +
|
+
\
, donde Da=fm-fa y Dp=fm-fp.
b) Demuestre que Mo es la abscisa del vrtice de la parbola que pasa por los puntos
La Li
, fa
2
| | +
|
\
,
Li Ls
, fm
2
| | +
|
\
y
Ls Lp
, fp
2
| | +
|
\
.






- 105 -
M MM MEDIDAS DE DISPERSIN EDIDAS DE DISPERSIN EDIDAS DE DISPERSIN EDIDAS DE DISPERSIN

5.1 Introduccin. 5.1 Introduccin. 5.1 Introduccin. 5.1 Introduccin.
Al estudiar caractersticas o variables de una poblacin o muestra, siempre se manifiestan
discrepancias o diferencias en los resultados individuales de las observaciones. La variabilidad
es algo inherente a cada fenmeno aleatorio, y origina en ellos cierta homogeneidad o
heterogeneidad, segn que las discrepancias o diferencias sean pequeas o grandes. A este
grado de variabilidad, de diferencia entre observaciones es a lo que se llama dispersin.

Ocurre entonces, cuando se quiere asignar un nmero a cada grado de variabilidad, que
surgen diferentes medidas de dispersin. Las definiciones de estas medidas se pueden
establecer entre valores determinados de la muestra de datos o entre todos los valores y un
valor de referencia, que suele ser una medida de tendencia central, como la media aritmtica
o la mediana, con el propsito de que la medicin se vea poco influenciada por las propias
unidades de medida de los valores cuya dispersin se desea estimar.

Se pueden reconocer al menos dos tipos generales de medidas de dispersin. Por ejemplo,
Fernndez y Fuentes (1995) sugieren distinguir entre dos tipos de medidas de dispersin. A
las medidas de dispersin expresadas en trminos de la misma unidad de medida que los
datos, se las llaman medidas de dispersin absoluta, y a las que se expresan de manera
adimensional, es decir, de manera independiente a las unidades de medicin, las llaman
medidas de dispersin relativa.

El reconocimiento de la existencia de la variabilidad como punto de partida para el estudio de
la aleatoriedad y la construccin de modelos estadsticos, hace que las medidas de dispersin
sean necesarias para efectuar comparaciones significativas entre grupos de observaciones. De
hecho, cuando se mide la dispersin de los valores de una variable respecto a una de sus
medidas de tendencia central, se est midiendo el grado de representatividad que dicha
medida de tendencia central tiene respecto al conjunto de datos que pretende resumir. As
pues, a mayor dispersin se tendr una menor representatividad de la medida de posicin y
viceversa. Adems, la medicin con este tipo de medidas debe ser no negativa y consonante
con el nivel de dispersin en el sentido de que valores pequeos del estadgrafo en uso
deben reflejar un nivel bajo de dispersin y viceversa.

Esta cuestin de la representatividad se puede precisar un poco ms con un ejemplo.
Suponga que en el estudio de dos grupos de familias A y B, de quince familias cada grupo, la
distribucin del nmero de hijos se tiene como se muestra en la siguiente tabla.


- 106 -
Grupo A Grupo A Grupo A Grupo A Grupo B Grupo B Grupo B Grupo B
Nmero de hijos
x
i

Frecuencia
f
i

Nmero de hijos
x
i

Frecuencia
f
i

1 2 0 7
2 11 2 1
3 2 4 7
Total 15 Total 15
Tabla 20. Nmero de hijos en dos grupos de quince familias.

Se puede observar que en ambos grupos la media aritmtica del nmero de hijos es dos.
Entonces a primera vista se puede afirmar que el comportamiento de los dos grupos es el
mismo respecto al nmero de hijos. Sin embargo, es evidente que el grupo B, presenta los
datos ms dispersos que el grupo A. Por lo tanto la media aritmtica es ms representativa de
lo que sucede en el grupo A, ya que en ste los resultados se apartan menos de la media
aritmtica que en el grupo B.
Como se acaba de ver en el ejemplo anterior la media aritmtica caracteriza mejor al grupo A
de familias que al B, respecto al nmero de hijos. En general, para caracterizar una
distribucin de frecuencias, las medidas de tendencia central se deben acompaar de una
medida de dispersin que ponga de manifiesto el grado de representatividad del conjunto de
datos.
Algunos ejemplos de medidas de dispersin son el recorrido, la desviacin media, la
desviacin estndar, el rango medio, la desviacin intercuartlica, la varianza y el coeficiente
de variacin. En lo que sigue, primero se har una descripcin de las medidas dispersin
absoluta que son ms utilizadas, luego se comentar algunas de las principales medidas de
dispersin relativa, y finalmente se presentar una serie de ejemplos, para ilustrar el clculo y
utilizacin de las mismas.
5.2 5.2 5.2 5.2 Recorrido (Re). Recorrido (Re). Recorrido (Re). Recorrido (Re).
El recorrido o rango de dispersin (Re), se define como la diferencia entre el valor mximo y
el valor mnimo de los datos. Aunque se considera que es una medida imperfecta, cuando es
razonable suponer que los datos se distribuyen de manera uniforme, entonces se espera que
si, por ejemplo, el mnimo y el mximo estn comprendidos entre 3 y 26, los datos
presentarn ms alejamiento mutuo que si los mismos datos estn comprendidos entre 13 y
19, cuya diferencia es menor.
De todas maneras el rango tiene la ventaja de ser muy fcil de calcular y es recomendable
tenerlo en cuenta cuando hay pocos datos por analizar. Sin embargo, el hecho de depender
exclusivamente del mximo y el mnimo, puede ocasionar el que no refleje de manera
apropiada la dispersin de una distribucin de datos, cuando se tiene una buena cantidad de
datos con valores intermedios. Adems, no es posible su aplicacin en los casos en que
alguno de los valores, mximo o mnimo, como ocurre en ocasiones, quede indeterminado.
Este tipo de inconvenientes ponen de manifiesto la necesidad de considerar otras medidas de
dispersin. Por ejemplo, cuando los valores prximos al mximo y el mnimo de una serie de

- 107 -
datos estn excesivamente alejados del resto, la consideracin de un recorrido ms corto,
prescindiendo de un porcentaje determinado de los datos ms alejados, puede dar una idea
de la dispersin del conjunto de datos ms acorde con la realidad, que si se emplea la
diferencia entre los valores ms extremos. Por ello, alternativas que algunas veces se
contemplan son el intervalo intercuartlico (Q
3
Q
1
), el interdeclico (D
9
D
1
) o el
intercentlico (P
99
P
1
).
5.3 5.3 5.3 5.3 Desviaciones medias. Desviaciones medias. Desviaciones medias. Desviaciones medias.
La suma de todas las desviaciones respecto a la media aritmtica de una distribucin de
frecuencias, como se seal en el captulo anterior, vale cero. Por lo tanto, la media aritmtica
de dichas desviaciones no sirve para medir la dispersin de los valores de una variable. Sin
embargo al considerar el valor absoluto de las desviaciones respecto a una medida de
tendencia central como la media aritmtica o la mediana, permite definir tres tipos de
desviaciones que se comentan enseguida.
5.4 5.4 5.4 5.4 Desviacin media. Desviacin media. Desviacin media. Desviacin media.
La desviacin media es la media aritmtica de los valores absolutos de las diferencias de los
datos respecto de la media aritmtica. Con datos agrupados se puede escribir as:
i i
i 1
1
N
k
D x x f
x
=
=
Donde se tienen k valores diferentes de los datos o k intervalos de clase, segn que la variable
considerada sea discreta o continua, y N es el total de datos. Para datos sin agrupar se
considera que n es el total de datos y se expresa as:
i
i 1
n
1
D x x
x
n
=
=
Respecto a la desviacin media es apropiado sealar que al considerar la funcin D(u)
i
i 1
n
1
x u
n
=
= asociada a los posibles promedios de los valores absolutos de la desviaciones
respecto a u, se puede demostrar (ver por ejemplo, Cansado (1967)) que el punto en que se
minimiza esta funcin es en el valor de la mediana. Por ello, si se usan desviaciones medias
para cuantificar la dispersin, quizs sea preferible utilizar el promedio de los valores
absolutos de las desviaciones respecto a la mediana, medida que se pasa a considerar
enseguida.
5.5 5.5 5.5 5.5 Desviacin media respecto a la mediana. Desviacin media respecto a la mediana. Desviacin media respecto a la mediana. Desviacin media respecto a la mediana.
La desviacin media respecto a la mediana es la media aritmtica de los valores absolutos de
las desviaciones de los datos respecto a la mediana y se puede expresar para datos agrupados
como:
i i
i 1
1
Me
N
k
D x Mef
=
=

- 108 -
Y para datos sin agrupar se expresa como:
i
i 1
n
1
Me
D x Me
n
=
=
Las letras k, N, n, etctera, tienen la misma interpretacin que en el caso de la desviacin
media.
5. 5. 5. 5.6 66 6 Desviacin mediana. Desviacin mediana. Desviacin mediana. Desviacin mediana.
La desviacin mediana se define como la mediana de la distribucin cuyos valores son las
desviaciones, en valor absoluto, de los datos respecto a la mediana. Por ejemplo, si los valores
de una variable son 2, 4, 8, 11, 13, 17 y 21, su mediana es Me = 11. De manera que los valores
absolutos de las desviaciones respecto a la mediana son 0, 2, 3, 6, 7, 9 y 10, cuya mediana es
6, por lo tanto la desviacin median es 6.
La interpretacin que se le puede dar a la desviacin mediana es similar a la que se le puede
dar a la desviacin intercuartlica (Q
3
Q
1
), en el sentido de recoger la variacin entre el 50%
de los datos intermedios. En realidad, cuando la distribucin es simtrica, ambas medidas
coinciden.
5.7 5.7 5.7 5.7 Varianza (S Varianza (S Varianza (S Varianza (S
2 22 2
). ). ). ).
La varianza es una de las medidas de dispersin ms mencionadas en la literatura estadstica.
En realidad de todas las medidas de dispersin la varianza y la desviacin estndar (que se
presenta en el siguiente apartado), son las ms importantes para un desarrollo terico de la
estadstica. El propsito de la varianza es medir la mayor o menor dispersin de los valores de
una distribucin de datos respecto a la media aritmtica. Cuanto mayor sea la varianza mayor
dispersin existir y por tanto menor representatividad se podr atribuir a la media aritmtica.
En trminos agrupados la varianza se define como:
2 2
i i
i 1
1
N
k
S (x x) n
=
=
Y para datos sin agrupar, se define as:
2 2
i
i 1
1
n
S (x x)
n
=
=
Quizs el principal problema con la varianza es que su valor no se exprese en las mismas
unidades que la variable analizada, sino elevada al cuadrado, lo cual dificulta su
interpretacin. No obstante, debido a sus propiedades matemticas la varianza goza de
excelente reputacin.
Algunas de las propiedades que se pueden destacar de la varianza son las siguientes:
Si se considera la funcin F(u) de variable real definida como
F(u) =
2
i i
i 1
1
N
k
(x u) n
=
se tiene que valor donde es mnima para u es la media aritmtica.

- 109 -
Por la manera cono est definida, una suma de cuadrados, nunca es negativa y slo puede
ser nula cuando todos los valores son iguales.
Adems, si y
i
= k.x
i
+ c entonces
2 2 2
y x
S k S =
La siguiente igualdad tambin se utiliza con frecuencia
2 2 2
)
i i
i 1 i 1
1 1
i
N N
k k
(x u) n (x n (x)
i
= =
=
5.8 5.8 5.8 5.8 Desviacin estndar (S). Desviacin estndar (S). Desviacin estndar (S). Desviacin estndar (S).
Ya se ha dicho que la varianza no viene expresada en las mismas unidades de medida que las
de los datos. Sin embargo, la raz cuadrada de la varianza nos lleva a la desviacin estndar
tambin conocida como desviacin tpica. Se define como la raz cuadrada con signo positivo
de la varianza. En su versin para datos agrupados, se presenta as:
2 2
i i
i 1
k
1
N
S S (x x) n
=
= + +
Y para datos sin agrupar as:
2
n
1
S (x x)
i
n
i 1
=
=

La desviacin estndar es la ms utilizada entre las medidas de dispersin y satisface las
mismas propiedades que se mencionaron para la varianza. Sin embargo, otra propiedad, no
mencionada antes, que es interesante y relevante mencionar, se deduce a continuacin.
Suponga que x
1
, x
2
, , x
n
, es una coleccin de valores numricos de los datos de una
distribucin. Entre todas las diferencias
2
i
(x x) para i =1,2, , n seleccione todas aquellas
diferencias cuyos valores xi verifiquen la desigualdad x x k
i
, donde k designa un nmero
positivo. Ahora suponga que
2
i1
(x x) ,
2
i2
(x x) ,,
2
ip
(x x) son las p cantidades que
satisfacen la desigualdad. Entonces
2 2 2
i ij
i 1 j 1
p n
1 1
S (x x) (x x)
n n

= =
=
Por otra parte, como x x k
ij
para j = 1,2, , p, se tiene entonces que
2
2
x x k
ij
y por lo
tanto
2 2 2
ij
j 1 j 1
p p
(x x) k pk
= =
= , por lo tanto
2 2 2 2
i ij
i 1 j 1
p n
1 1 p
S (x x) (x x) k
n
n n

= =
=

- 110 -
Ntese que el cociente p/n que aparece al final de la desigualdad representa la frecuencia
relativa de los x
i
tal que x x k
i
. Si p/n se denota ms bien como fr( x x k)
i
, entonces
se tiene que
2
2
S
fr( x x k)
i
k

Pero dado que en una distribucin de frecuencias se satisface la igualdad fr( x x k)
i
+
fr( x x k)
i
< = 1, entonces se llega a:
2
2
S
fr( x x k) 1
i
k
<
Si ahora se elige el valor de k como tS
2
, la desigualdad anterior se transforma en la siguiente:
2
2
1
fr( x x tS ) 1
i
t
<
La desigualdad obtenida se puede ver como la interpretacin frecuencial de la llamada
desigualdad de Tchevichev utilizada en estadstica matemtica y teora de la probabilidad.
Para este caso le da el siguiente sentido a la desviacin estndar: la proporcin de datos que
caen en el intervalo (x tS, x tS) + es a lo menos 1 (1/t
2
). Por ejemplo, la proporcin de datos
incluidos en el intervalo (x 2S, x 2S) + es al menos 1 (1/2
2
) = , es decir, del 75% del total;
mientras que los datos que caen en el intervalo (x 3S, x 3S) + es como mnimo del 1 (1/3
2
)=
8/9 = 0,88, que equivale al 88%. Se ve pues, que la desviacin estndar es una medida
bastante precisa de la dispersin de los datos en torno a la media aritmtica de la distribucin
y por ello goza de tanta reputacin.
Para finalizar, se tiene que la desviacin estndar siempre dar un valor mayor o igual al de la
desviacin media, puesto que la media cuadrtica de las observaciones x x
i
es mayor o
igual que la media aritmtica de stas, es decir D S.
x

5.9 5.9 5.9 5.9 Coeficiente de variacin media de Pearson ( Coeficiente de variacin media de Pearson ( Coeficiente de variacin media de Pearson ( Coeficiente de variacin media de Pearson (CV CV CV CV
x xx x
). ). ). ).
Todas las anteriores medidas de dispersin que fueran consideradas antes, son medidas de
dispersin absoluta, ya que se expresan en trminos de la unidad que se utiliza para hacer
mediciones. Las medidas de dispersin relativa, evaden este problema al considerar cocientes
entre una medida de dispersin absoluta (excepto la varianza) y una medida de tendencia
central.
En este sentido el coeficiente de variacin media de Pearson, indica la relacin existente entre
la desviacin tpica de una muestra y su media, ya que se define como
S
CVx
X
= .
Al dividir la desviacin tpica por la media se convierte la medicin en un valor libre de la
unidad de medida. As pues, si comparamos la dispersin en varios conjuntos de
observaciones, el que tenga menor dispersin ser el que tenga menor coeficiente de
variacin.

- 111 -
Este coeficiente es quizs el ms importante y fiable de las medidas de dispersin relativa,
entre otras razones por venir expresado en trminos de dos estadsticas bien reconocidas que
en general son objetivas y representativas de un conjunto de datos. Adems, permite
comparaciones de variacin de conjuntos de datos expresados en diferentes unidades de
medida.
El principal inconveniente del coeficiente de variacin media de Pearson (y de otros
coeficientes definidos de manera similar), es que al ser un coeficiente inversamente
proporcional a la media aritmtica, cuando sta tome valores cercanos a cero, a menos que se
lleve a cabo un cambio de origen en los datos.
5.10 5.10 5.10 5.10 Otros Coeficientes de dispersin relativa. Otros Coeficientes de dispersin relativa. Otros Coeficientes de dispersin relativa. Otros Coeficientes de dispersin relativa.
Como ya se dijo, los coeficientes de variacin relativa se definen como cocientes entre
medidas de dispersin absoluta y una medida de tendencia central. Las medidas de tendencia
central ms utilizadas para ello, son la mediana y la media aritmtica, mientras que las ms
utilizadas como medidas de dispersin absoluta son la desviacin estndar o los recorridos
intercuartlicos. A continuacin se presentan las definiciones de otros coeficientes de variacin
relativa, que se pueden tener en cuenta en la prctica del anlisis de datos.
5.11 5.11 5.11 5.11 Coeficie Coeficie Coeficie Coeficiente de variacin mediana. nte de variacin mediana. nte de variacin mediana. nte de variacin mediana.
El coeficiente de variacin mediana, V
Me
, se define como el cociente entre la desviacin
estndar y la mediana.
Me
V
S
Me
=
5.12 5.12 5.12 5.12 Intervalo intercuartlico relativo. Intervalo intercuartlico relativo. Intervalo intercuartlico relativo. Intervalo intercuartlico relativo.
El intervalo intercuartlico relativo tambin llamado razn intercuartil, I
Q
, se define como el
cociente entre la desviacin estndar y la mediana.
3 1
Q
I
Q Q
Me
=


5.13 5.13 5.13 5.13 Desviacin cuartlica relativa. Desviacin cuartlica relativa. Desviacin cuartlica relativa. Desviacin cuartlica relativa.
La desviacin cuartlica relativa, D
Q
, a diferencia del anterior, en vez de el recorrido
intercuartlico, propone la utilizacin de la desviacin intercuartlica, dividido por la mediana.
3 1
Q
D
Q Q
2 Me
=


5.14 5.14 5.14 5.14 Coeficiente de variacin cuartlica. Coeficiente de variacin cuartlica. Coeficiente de variacin cuartlica. Coeficiente de variacin cuartlica.
El coeficiente de variacin cuartlica, V
Q
, se define como el cociente entre la desviacin
cuartlica Q = (Q
1
Q
3
)/2 y la media aritmtica de los cuartiles primero y tercero, (Q
1
+ Q
3
)/2.

- 112 -
Q
Q Q
1 3
V
Q Q
1 3

=
+


Si se tiene en cuenta que la desviacin tpica es la ms fiable medida de dispersin absoluta,
usualmente resulta preferible el uso del coeficiente de variacin mediana, al compararse con
los otros tres coeficientes referidos en este apartado.
5.15 5.15 5.15 5.15 Ejemplos. Ejemplos. Ejemplos. Ejemplos.
Ejemplo 1. Altura de unas palmeras Ejemplo 1. Altura de unas palmeras Ejemplo 1. Altura de unas palmeras Ejemplo 1. Altura de unas palmeras
Las alturas de 5 palmeras son 4 metros, 6 metros, 10 metros, 8 metros y 20 metros. Si las
medidas se cambian a decmetros, cmo cambiar la desviacin estndar?
a) Aumentar en 10
b) Disminuir en 10
c) Aumentar en un factor de 10
d) Disminuir en un factor de 10
e) No cambiar


Discusin Discusin Discusin Discusin. Este tem pretende valorar si se reconoce la manera como se afecta la desviacin
estndar cuando se introduce un cambio en la escala de los datos y en este caso la respuesta
correcta es la opcin (c). Los distractores (a) y (b), expresan que el cambio en la escala de los
datos tiene un efecto aditivo., lo cual es falso. La opcin (d) aunque sugiere que si hay un
cambio multiplicativo no se reconoce el sentido correcto en que se da. Y por ltimo, la
eleccin de la opcin (e) sugiere que se piensa equivocadamente, en que la desviacin
estndar es invariante ante cambios de escala.
Ejemplo 2. Trabajo perdido en una empresa Ejemplo 2. Trabajo perdido en una empresa Ejemplo 2. Trabajo perdido en una empresa Ejemplo 2. Trabajo perdido en una empresa. .. .
Durante los ltimos veinte das laborables, el nmero total de horas de trabajo perdidas
diariamente en una empresa de cien obreros viene dada por los datos: 1, 3, 1, 1, 2, 4, 2, 2, 1, 2,
800, 6, 8, 400, 1, 5, 4, 6, 3, 1.
a) Si se supone que la jornada laboral es de ocho horas diarias, qu porcentaje medio de
horas se han perdido en esos das?
b) Encuentre la desviacin absoluta media, y la desviacin media respecto a la mediana y
con base en esta informacin valore, entre la media y la mediana, cul de ellas es ms
representativa de la tendencia central de los datos.

Discusin Discusin Discusin Discusin. En esta empresa el nmero de horas diarias de trabajo corresponde a 100 x 8 = 800.
Si se denota con x
i
el nmero de horas de trabajo perdidas en un da i, el cociente x
i
/800
representa la proporcin de horas de trabajo en ese da. Tambin se puede expresar x
i
/800 en
trminos porcentuales multiplicando por 100. As, (100x
i
)/800 = x
i
/8 %.
En la tabla que sigue se organiza la informacin de los datos suministrados.


- 113 -
Horas perdidas Horas perdidas Horas perdidas Horas perdidas
por das por das por das por das
x xx x
i ii i

Frecuencia Frecuencia Frecuencia Frecuencia
absoluta absoluta absoluta absoluta
f ff f
i ii i

Porcentaje Porcentaje Porcentaje Porcentaje
por da por da por da por da
x xx x
i ii i
/8 % /8 % /8 % /8 %
Porcentaje Porcentaje Porcentaje Porcentaje
total total total total
% %% %
1 6 0,125 0,750
2 4 0,250 1,000
3 2 0,375 0,750
4 2 0,500 1,000
5 1 0,625 0,625
6 2 0,750 1,500
8 1 1,000 1,000
400 1 50,000 50,000
800 1 100,000 100,000

Total N=15 156,625
El porcentaje medio de horas perdidas a lo largo de los veinte das es la media aritmtica de
los porcentajes totales (ltima columna de la tabla). Por lo tanto el porcentaje medio de horas
de trabajo perdidas en trminos de la media aritmtica es 156,625/20 = 7,831.
Para determinar el valor de la desviacin absoluta media respecto a la media aritmtica y
respecto a la mediana, se organizan los clculos intermedios en la siguiente tabla.

x xx x
i ii i
f ff f
i ii i
F FF F
i ii i
x xx x
i ii i
f ff f
i ii i
| x | x | x | x
i i i i
x | || |f ff f
i ii i
| x | x | x | x
i i i i
Me Me Me Me| || |f ff f
i ii i

1 6 6 6 369,90 9
2 4 10 8 242,60 2
3 2 12 6 119,30 1
4 2 14 8 117,30 3
5 1 15 5 57,65 2,5
6 2 17 12 113,30 7
8 1 18 8 54,65 5,5
400 1 19 400 337,35 397,5
800 1 20 800 737,35 797,5
Total 20 1.253 2.149,40 1.225,0
Medias 62,65 107,50 61,3

La media aritmtica de horas diarias de trabajo perdido es x = 1253/20 = 62,65. Entonces la
desviacin media respecto a la media aritmtica se obtiene del cociente 2149,4/20 = 107,5. La
mediana de horas diarias de trabajo perdido se ubica entre el dato 10 y el 11, por lo que
entonces la mediana es (2+3)/2 = 2,5. Por lo tanto, la desviacin absoluta respecto a la
mediana se obtiene del cociente 1255/20 = 61,3.
El tamao de la desviacin absoluta media respecto a la media aritmtica sugiere poca
representatividad para la media aritmtica. En realidad, la desviacin absoluta media respecto
a la media aritmtica viene ms influenciada por los valores extremos 400 y 800, algo atpicos
dentro de la serie de datos. La mediana, al considerar los datos extremos no por su valor sino
por la posicin que ocupan dentro del conjunto ordenado de los datos, refleja de forma ms
realista la tendencia central. De hecho el valor de la desviacin absoluta media respecto a la

- 114 -
media aritmtica, casi duplica el valor de la desviacin absoluta media respecto a la mediana.
Las consideraciones anteriores sugieren entonces que la mediana es ms representativa que la
media.

Ejemplo 3. Valoracin de la gestin del alcalde Ejemplo 3. Valoracin de la gestin del alcalde Ejemplo 3. Valoracin de la gestin del alcalde Ejemplo 3. Valoracin de la gestin del alcalde. .. .
Para conocer la conformidad de los habitantes de Bogot, acerca de la gestin realizada por el
actual alcalde de la ciudad, durante el periodo en el que ha despeando sus funciones, se
practic una encuesta de opinin a 740 personas, en donde se calificaba la gestin del alcalde
en una escala de 0 a 10. Los resultados de la encuesta fueron los que se muestran en la
siguiente tabla.
Calificacin de Calificacin de Calificacin de Calificacin de
la gestin la gestin la gestin la gestin
Nmero de Nmero de Nmero de Nmero de
encuestado encuestado encuestado encuestados ss s
[0, 1) 50
[1, 3) 60
[3, 4) 90
[4, 6) 100
[6, 8) 240
[8, 9) 120
[9, 10] 80

Determine la media aritmtica de las calificaciones arrojadas por la encuesta y estime la
representatividad de dicha media.

Discusin Discusin Discusin Discusin. Una disposicin prctica para exhibir los clculos que se requieren para hallar la
media y la varianza de la muestra se presentan en la tabla de la pgina siguiente.
De los datos de la tabla se puede encontrar la media aritmtica como 4420/740 = 5,97. La
varianza resulta del cociente 5104, 46/ 740 = 6,9 y entonces la desviacin estndar es la raz
cuadrada de 6,9, es decir, 2,63. Tambin es posible hallar la varianza con la expresin
alternativa dada por
2 2
) f
i
i 1
k
1
N
(x (x)
i
=
de donde se obtiene (31.505/740 (5,97)
2
= 6,9 en
concordancia con la otra manera de calcularla.

Calificacin Calificacin Calificacin Calificacin f ff f
i ii i
x xx x
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i

2
i i
x f
[0, 1) 50 0,5 25 1497,67 12,5
[1, 3) 60 2,0 120 947,07 240,0
[3, 4) 90 3,5 315 550,40 1102,5
[4, 6) 100 5,0 500 94,67 2500,0
[6, 8) 240 7,0 1680 253,15 11760,0
[8, 9) 120 8,5 1020 766,30 8670,0
[9, 10] 80 9,5 760 995,19 7220,0
Total 740 4420 5104,46 31505,0


- 115 -
Observe que el valor de la desviacin estndar resulta ser menor que una vez el valor de la
media aritmtica. Si este hecho se considera como criterio prctico, se tiene que la media es
aceptablemente representativa.

Ejemplo 4. Reaccin ante una vacuna para la gripe Ejemplo 4. Reaccin ante una vacuna para la gripe Ejemplo 4. Reaccin ante una vacuna para la gripe Ejemplo 4. Reaccin ante una vacuna para la gripe
Como parte de una investigacin para combatir la gripe comn, un grupo de 500 personas se
distribuy en cincuenta grupos de de diez personas cada grupo y se les aplic una vacuna
experimental. Luego se anot el nmero de personas por grupo que present reaccin ante la
vacuna. Los datos obtenidos se muestran en la siguiente tabla:

Nmero de personas por grupo
que reaccionan a la vacuna
0 1 2 3 4 5 6 7 8 9 10
Nmero de grupos 9 9 8 8 5 3 3 2 1 1 1

a) Encuentre la media aritmtica y la desviacin estndar del nmero de personas por
grupo que tuvieron reaccin ante la vacuna.
b) Qu porcentaje de personas reacciona ante la vacuna entre (x , x ) + y entre
(x 2 , x 2 ) + ? S es la desviacin estndar de la variable X.

Discusin Discusin Discusin Discusin. Una disposicin prctica para exhibir los clculos para hallar la media y la
desviacin estndar de la muestra se presentan en la siguiente tabla, donde x
i
denota el
nmero de personas por grupo con reaccin ante la vacuna y f
i
el nmero de grupos.

x xx x
i ii i
f ff f
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i

0 9 0 73,62
1 9 9 31,14
2 8 16 5,92
3 8 24 0,16
4 5 20 6,50
5 3 15 13,74
6 3 18 29,58
7 2 14 34,28
8 1 8 26,42
9 1 9 37,70
10 1 10 50,98
Total 50 143 310,02

Con base en la informacin de la tabla se tiene que la media aritmtica se obtiene como
143/50 = 2,86. Para la varianza se calcula 310,02/50 = 6,2, de donde la desviacin estndar, al
sacar la raz cuadrada, da 2,49.

- 116 -
En cuanto al literal (b,) se tiene que entre (x S) = 2,86 -2,49 = 0,37 y (x S) + = 2,86 + 2,49 =
5,35, hay 1x9 + 2x8 + 3x8 + 4x5 + 5x3 = 84 personas, mientras que entre = ) 2 ( S x 2,86
2x(2,49) = 2.12 y (x S) + = 2,86 + 2x(2,49) = 7,84, hay 9 + 84 + 6x3 + 7x2 = 125 personas. En
el primer caso el porcentaje de personas a una desviacin de la media es de 84/143 = 58,74%
y a dos desviaciones de la media hay 125/143 = 87,41%.
Observe que los resultados son consistentes, con lo que dice la versin frecuencial de la
llamada desigualdad de Tchevichev.
Ejemplo 5. Temperaturas registradas en un observatorio Ejemplo 5. Temperaturas registradas en un observatorio Ejemplo 5. Temperaturas registradas en un observatorio Ejemplo 5. Temperaturas registradas en un observatorio
En un observatorio meteorolgico de Canad se llev un registro de las temperaturas, en
grados centgrados, durante los primeros 59 das del ao 2008 y se anotaron en la tabla que se
muestra a continuacin.

Temperatura Temperatura Temperatura Temperatura (C) (C) (C) (C) Nmero de das Nmero de das Nmero de das Nmero de das
[-12, -8) 2
[-8, -5) 4
[-5, -2) 8
[-2, 0) 18
[0, 4) 17
[4, 6) 6
[6, 8) 3
[8, 10] 1

a) Encuentre los coeficientes de variacin cuartlica y de variacin media de Pearson y
evalu cul de los dos coeficientes mide de manera ms fiable la dispersin relativa de las
temperaturas.
b) Si se transforma la medicin de la temperaturas de la escala de grados centgrados a la
escala de grados Fahrenheit (F = 32 + 9/5xC) Cul coeficiente resulta ms fiable?

Discusin Discusin Discusin Discusin. Dado que para calcular los coeficientes de variacin cuartlica y media de Pearson
se requiere determinar el valor de los cuartiles primero y tercero, la media aritmtica y la
desviacin estndar, en la tabla de la pgina siguiente se disponen algunos de los clculos
requeridos. Para encontrar los cuartiles se debe empezar por determinar las posiciones de los
cuartiles las cuales resultan de calcular N/4 = 59/4 = 14,75 y 3N/4 = (3x59)/4 = 44,25.
Entonces, aplicando la frmula general dada en el ejercicio 26 del captulo anterior, para
establecer el valor de un cuantil i, tomando s = 3, es decir:
i 1
i
i
i
i N
F
s
C (s) L a
i 1
f

= +

para i = 1, 2, , s-1.


- 117 -
donde L
i-1
, f
i
y a
i
designa el lmite inferior, la frecuencia absoluta y la amplitud del intervalo,
respectivamente, de la clase a la que pertenece el cuantil y F
i-1
la frecuencia acumulada
absoluta de la clase anterior a ella. As se obtiene
1
14, 75 14
Q 2 2 1, 971
18

= + = y
3
44,25 32
Q 0 4 2, 882
17

= + =

Temperatura Temperatura Temperatura Temperatura ( (( ( C CC C) )) ) f ff f
i ii i
x xx x
i ii i
F FF F
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i

[-12, -8) 2 -10,0 2 -20 201,36
[-8, -5) 4 -6,5 6 -26 170,77
[-5, -2) 8 -3,5 14 -28 99,91
[-2, 0) 18 -1,0 32 -18 19,24
[0, 4) 17 2,0 49 34 65,71
[4, 6) 6 5,0 55 30 147,97
[6, 8) 3 7,0 58 21 145,58
[8, 10] 1 9,0 59 9 80,39
Total 59 2 930,93

La media aritmtica de la temperatura es 2/59 = 0,034 C, la varianza se obtiene de 930,93/59 =
15,78, y la desviacin estndar se obtiene al sacar la raz cuadrada a este nmero dando 3,972.
C. De lo anterior se llega a que el coeficiente de variacin cuartlica es:
3 1
Q
3 1
Q Q
2, 882 ( 1,971)
V 4,973
Q Q 2,882 ( 1, 971)


= = =
+ +

Mientras que el coeficiente de variacin de Pearson da:
x
S 3, 972
V 117,17 11, 71%
x 0,034
= = =
Como se puede notar, el valor del coeficiente de variacin de Pearson resulta muy
distorsionado debido a la proximidad de la media aritmtica al valor cero. En este caso resulta
ms razonable utilizar el coeficiente de variacin cuartlica.
Ahora bien, cuando se cambia la escala de los datos aplicando la relacin F = 32 + 9/5xC, se
obtiene la siguiente tabla de frecuencias.

Temperatura Temperatura Temperatura Temperatura ( (( ( F FF F) )) ) f ff f
i ii i
x xx x
i ii i
F FF F
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i

[10,4; 17,6) 2 14,0 2 28,0 652,40
[17,6; 23,0) 4 20,3 6 81,2 553,29
[23,0; 28,4) 8 25,7 14 205,6 323,70
[28,4; 32,0) 18 30,2 32 543,6 62,34
[32,0; 39,2) 17 35,6 49 605,2 212,91
[39,2; 42,8) 6 41,0 55 246 479,43
[42,8; 46,4) 3 44,6 58 133,8 471,68
[46,4; 50,0] 1 48,2 59 48,2 260,47
Total Total Total Total 59 1891,6 3016,22

Ahora los cuartiles inferior y superior vienen dados por

- 118 -
1
14, 75 14
Q 28, 4 3, 6 28,55
18

= + = y
3
44,25 32
Q 32 7,2 37,19
17

= + =

Con estos resultados se obtiene el coeficiente de variacin cuartlica y el coeficiente de
variacin de Pearson as:
Q
37,19 28,55
V 0,131 13,1%
37,19 28,55

= = =
+


x
3016,22
59
V 0,223 22,3%
1891,6
59
= =

En este caso con ambos coeficientes se manifiesta una baja dispersin relativa, siendo el
coeficiente de variacin de Pearson ms fiable que el de la variacin cuartlica, dado que el
primero tiene en cuenta toda la informacin de los datos, mientras que el segundo solamente
la posicin ordenada de los valores de los datos.
Ejemplo 6. Pesos de dos grupos de estudiantes Ejemplo 6. Pesos de dos grupos de estudiantes Ejemplo 6. Pesos de dos grupos de estudiantes Ejemplo 6. Pesos de dos grupos de estudiantes. .. .
El mdico de un colegio tiene registro las medias aritmticas y de las varianzas de los pesos de
dos grupos A y B que se muestran en la siguiente tabla:

Grupo Grupo Grupo Grupo Media Media Media Media Varianza Varianza Varianza Varianza
A 64 kg
1 ,4 kg
2

B 68 kg
1,1 kg
2


a) Si se sabe que la media aritmtica de los dos grupos es 67, en qu proporcin estn los
tamaos de los dos grupos A y B?
b) Cul es la varianza conjunta de los dos grupos?

Discusin Discusin Discusin Discusin. Suponga que N
A
y N
B
son los tamaos de la muestras de los grupos A y B. Como 67
corresponde a la media ponderada de las medias de los grupos A y B, se puede plantear que:

A B
A B
N 64 N 68
67
N N
+
=
+

De donde se tiene que 67( N
A
+ N
B
) = 64N
A
+ 68N
B
, entonces (67 64) N
A
= (68 67) N
B
;
que es lo mismo que 3N
A
= N
B
. Es decir, N
A
y N
B
estn en proporcin de uno a tres.
Para encontrar la varianza ponderada se requiere realizar un poco de lgebra. Supngase que
x
i
, x
2
, , x
NA, x y
2
x
S son los pesos del grupo A, su media y su varianza, respectivamente, y que
y
i
, y
2
, , y
NB, y y
2
y
S los pesos, la media y la varianza relativas al grupo B. Si z y
2
z
S
representa la media y la varianza del grupo completo se tiene que:

- 119 -
A B
N N
2 2 2
z i i
A B i 1 i 1
1
(x z) (y z)
N N
S
= =
(
(
= +
( +


=
A B
N N
2 2
i i
A B i 1 i 1
1
((x x) (x z)) ((y y) (y z))
N N
= =
(
(
= + + +
( +



A A A
N N N
2 2
i i
A B i 1 i 1 i 1
1
(x x) 2(x z) (x x) (x z)
N N
= = =
(
(
= + + +
( +



B B A
N N N
2 2
i i
A B i 1 i 1 i 1
1
(y y) 2(y z) (y y) (y z)
N N
= = =
(
(
+ +
( +




Pero dado que
A
N
i
i 1
(x x)
=

=
B
N
i
i 1
(y y)
=

= 0, entonces se tiene que:


A B
N N
2 2 2 2 2
z i A i B
A A B B i 1 i 1
1 1
S (x x) N (x z) (y y) N (y z)
N N N N
= =
( (
( (
= + + +
( ( + +



A B
N N
2 2 2 2 A B
i i
A A A B B B i 1 i 1
N N 1 1
(x x) (x z) (y y) (y z)
N N N N N N
= =
( (
( (
= + + +
( ( + +



2 2 2 2 A B
x y
A A B B
N N
S (x z) S (y z)
N N N N
( (
= + + +

+ +

Por lo tanto
2 2 2 2
A x y B
2
z
A B
N S (x z) N S (y z)
S
N N
( (
+ + +

=
+


Reemplazando los datos de medias y varianzas dados en el enunciado y expresando N
B
en
trminos de N
A
se obtiene:
2 2
A A 2
z
A A
N 1, 4 (64 67) 3N 1,1 (68 67)
S 4,175
N 3N
( (
+ + +

= =
+


Observe que aunque las varianzas de cada grupo son relativamente pequeas, la del grupo en
conjunto es casi cuatro veces ms grande. Esto pone de manifiesto una diferencia significativa
entre los valores de las medias de cada grupo.

Ejemplo 7. Pesos de bebes y estatura de adultos Ejemplo 7. Pesos de bebes y estatura de adultos Ejemplo 7. Pesos de bebes y estatura de adultos Ejemplo 7. Pesos de bebes y estatura de adultos. .. .
Como parte de un estudio mdico, investigadores de la salud quieren establecer y comparar la
variacin de los pesos de una muestra de 500 bebes, respecto de la variacin de las estaturas
de una muestra de 500 adultos. Los datos recogidos se presentan en la siguiente tabla.

- 120 -

Peso en kilogramos Peso en kilogramos Peso en kilogramos Peso en kilogramos f ff f
i ii i
Estatura en centmetros Estatura en centmetros Estatura en centmetros Estatura en centmetros f ff f
i ii i

[2,6; 2,8) 5 [130; 140) 3
[2,8; 3,0) 10 [140; 150) 10
[3,0; 3,2) 40 [150; 160) 65
[3,2; 3,4) 55 [160; 170) 170
[3,4; 3,6) 160 [170; 180) 210
[3,6; 3,8) 110 [180; 190) 36
[3,8; 4,0) 90 [190; 200) 5
[4,0; 4,2] 30 [200; 210] 1
Total 500 500

Compare la dispersin relativa de ambas distribuciones y comente sobre la fiabilidad de los
coeficientes considerados.

Discusin Discusin Discusin Discusin. Primero se considera la muestra de pesos de los 500 bebes. En la siguiente tabla se
disponen los clculos requeridos, para estimar diferentes medidas de dispersin.

Peso en kilogramos Peso en kilogramos Peso en kilogramos Peso en kilogramos f ff f
i ii i
x xx x
i ii i
F FF F
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i

[2,6; 2,8) 5 2,7 5 13,5 3,85
[2,8; 3,0) 10 2,9 15 29,0 4,60
[3,0; 3,2) 40 3,1 55 124,0 9,14
[3,2; 3,4) 55 3,3 110 181,5 4,25
[3,4; 3,6) 160 3,5 270 560,0 0,97
[3,6; 3,8) 110 3,7 380 407,0 1,64
[3,8; 4,0) 90 3,9 470 351,0 9,33
[4,0; 4,2] 30 4,1 500 123,0 8,17
Total 500 1789,0 42,0

De los resultados de la tabla anterior tenemos que la media aritmtica es 1789/500 = 3,578, la
varianza es 42/500 = 0,0839 de donde la desviacin estndar es 0,29.
Para determinar el valor de los cuartiles se utiliza la misma expresin utilizada en el Ejemplo 5
de este captulo. Entonces:

1
125 110
Q 3, 4 0,2 3, 418kg
160

= + =
2
250 110
Q 3, 4 0,2 3,575kg
160

= + =
3
375 270
Q 3,6 0,2 3, 791Kg
110

= + =

Con estos resultados ya se pueden establecer las siguientes medidas de dispersin relativa:
Recorrido relativo Recorrido relativo Recorrido relativo Recorrido relativo:
x x
4,2 2,6
mximo mnimo
A 0, 4471
r
x 3,578

= = =

- 121 -
Coeficiente de variacin cuartlica Coeficiente de variacin cuartlica Coeficiente de variacin cuartlica Coeficiente de variacin cuartlica:
Q Q
3, 791 3, 418
1 3
V 0, 0517
Q
3, 418 3, 791 Q Q
1 3

= = =
+ +

Intervalo intercuartlico relativo Intervalo intercuartlico relativo Intervalo intercuartlico relativo Intervalo intercuartlico relativo:
3 1
Q Q
I
Q
Me

=
3, 791 3, 418
0,1043
3,575

= =

Desviacin cuartlica relativa Desviacin cuartlica relativa Desviacin cuartlica relativa Desviacin cuartlica relativa:
3 1
Q
Q Q
3, 791 3, 418
D 0, 0521
2 Me 2 3,575


= = =


Coeficiente de variacin de Pearson Coeficiente de variacin de Pearson Coeficiente de variacin de Pearson Coeficiente de variacin de Pearson:
S 0,29
CVx 0, 081
3,57
X
= = =
Coeficiente de variacin mediana Coeficiente de variacin mediana Coeficiente de variacin mediana Coeficiente de variacin mediana:
Me
S 0,29
V 0, 0811
Me 3,575
= = =
Ahora se pasa a considerar las estaturas de los 500 adultos. En la siguiente tabla se presentan
los clculos preliminares.

Estatura en centmetros Estatura en centmetros Estatura en centmetros Estatura en centmetros f ff f
i ii i
x xx x
i ii i
F FF F
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i

[130; 140) 3 135 3 405 3496,62
[140; 150) 10 145 13 1450 5827,40
[150; 160) 65 155 78 10075 12996,07
[160; 170) 170 165 248 28050 2913,73
[170; 180) 210 175 458 36750 7211,32
[180; 190) 36 185 494 6660 9055,43
[190; 200) 5 195 499 975 3343,70
[200; 210] 1 205 500 205 1285,94
Total Total Total Total 500 84570 46130,20


De los resultados de la tabla anterior tenemos que la media aritmtica es 84.570/500 =
3.169,14, la varianza es 46.130,2/500 = 92,26 de donde la desviacin estndar es 9,61.
Para determinar el valor de los cuartiles se vuelve a utilizar la frmula dada en el Ejemplo 5 de
este captulo. Entonces:

1
125 78
Q 160 10 162, 764cm
170

= + =
2
250 248
Q 170 10 170,095cm
210

= + =
3
375 248
Q 170 10 176,047cm
110

= + =

Entonces las medidas de dispersin relativa son:
Recorrido relativo Recorrido relativo Recorrido relativo Recorrido relativo:
x x
210 130
mximo mnimo
A 0, 473
r
x 169,14

= = =
Coeficiente de variacin cuartlica Coeficiente de variacin cuartlica Coeficiente de variacin cuartlica Coeficiente de variacin cuartlica:
Q Q
176, 05 162, 76
1 3
V 0, 039
Q
176, 05 162, 76 Q Q
1 3

= = =
+ +


- 122 -
Intervalo intercuartlico relativo Intervalo intercuartlico relativo Intervalo intercuartlico relativo Intervalo intercuartlico relativo:
3 1
Q Q
I
Q
Me

=
13,283
0,0781
170, 095
= =
Desviacin cuartlica Desviacin cuartlica Desviacin cuartlica Desviacin cuartlica relativa relativa relativa relativa:
3 1
Q
Q Q
0, 0781
D 0, 039
2 Me 2

= = =


Coeficiente de variacin de Pearson Coeficiente de variacin de Pearson Coeficiente de variacin de Pearson Coeficiente de variacin de Pearson:
S 9, 67
CVx 0, 0568
169,14
X
= = =
Coeficiente de variacin mediana Coeficiente de variacin mediana Coeficiente de variacin mediana Coeficiente de variacin mediana:
Me
S 0,29
V 0, 0562
Me 3,575
= = =

A manera de resumen se organizan todos los resultados en la siguiente tabla:

Medidas de dispersin r Medidas de dispersin r Medidas de dispersin r Medidas de dispersin relativa elativa elativa elativa Pesos Pesos Pesos Pesos Estaturas Estaturas Estaturas Estaturas
Recorrido relativo 0,447 0,473
Coeficiente de variacin cuartlica 0,051 0,039
Intervalo intercuartlico relativo 0,104 0,078
Desviacin cuartlica relativa 0,052 0,039
Coeficiente de variacin de Pearson 0,081 0,057
Coeficiente de variacin mediana 0,081 0,056

En la tabla anterior se puede observar, en trminos generales, que hay una dispersin relativa
moderadamente mayor en los datos que corresponden a la columna de los pesos de los
bebes. Por otra parte, la discrepancia del valor del recorrido relativo ejemplifica la escasa
fiabilidad de estas medidas en las comparaciones.

Ejemplo 8. Tiempo de atencin en un hospital Ejemplo 8. Tiempo de atencin en un hospital Ejemplo 8. Tiempo de atencin en un hospital Ejemplo 8. Tiempo de atencin en un hospital. .. .
En un hospital se ha llevado el registro, sobre el tiempo de espera para ser atendidos, de los
ltimos 320 pacientes que han acudido a la unidad de atencin de urgencias. Los datos se
presentan en la siguiente tabla:

Tiempo de espera Tiempo de espera Tiempo de espera Tiempo de espera f ff f
i ii i

[0; 5) 3
[5;10) 31
[10; 15) 102
[15; 20) 63
[20; 25) 54
[25; 30) 43
[30; 35) 12
[35; 40) 6
[40; 45) 5
[45; 50] 1
Total 320

- 123 -
Determine la media aritmtica y la mediana de esta distribucin de datos y mida la dispersin
de los datos en torno a estas estimaciones de tendencia central.

Discusin Discusin Discusin Discusin. Para empezar vale la pena recordar que la representatividad de la media se debe
evaluar con la desviacin estndar, mientras que la de la mediana es preferible evaluarla con
base en la desviacin media respecto a la mediana. En la tabla que sigue se presentan los
primeros clculos para hallar los valores de las estimaciones requeridas.

Tiempo de espera Tiempo de espera Tiempo de espera Tiempo de espera f ff f
i ii i
x xx x
i ii i
F FF F
i ii i
x xx x
i ii i
f ff f
i ii i
( x ( x ( x ( x
i i i i
x ) )) )
2 22 2
f ff f
i ii i
| x | x | x | x
i i i i
x | || |f ff f
i ii i
| x | x | x | x
i i i i
Me Me Me Me| || |f ff f
i ii i

[0; 5) 3 2,5 3 7,5 759,03 14,4 43,2
[5;10) 31 7,5 34 232,5 3687,33 9,4 291,4
[10; 15) 102 12,5 136 1275,0 3558,15 4,4 448,8
[15; 20) 63 17,5 199 1102,5 51,74 0,6 37,8
[20; 25) 54 22,5 253 1215,0 904,97 5,6 302,4
[25; 30) 43 27,5 296 1182,5 3555,94 10,6 455,8
[30; 35) 12 32,5 308 390,0 2383,61 15,6 187,2
[35; 40) 6 37,5 314 225,0 2187,43 20,6 123,6
[40; 45) 5 42,5 319 212,5 2902,54 25,6 128,0
[45; 50] 1 47,5 320 47,5 846,45 30,6 30,6
Total 320 5890 20837,19 2048,8
La media aritmtica se obtiene como 5890/320 = 18,41 minutos. Para obtener la mediana,
primero ubicamos la posicin la calcular N/2 = 320/2 = 160; entonces la mediana es Me =15 +
[(160-136)/63]x5 = 16,9 minutos. Para la obtencin de la desviacin estndar, se le saca la raz
cuadrada a la varianza dada por 20.837, 19/2 = 65,11, para obtener 8,06 minutos. Y en cuanto
a la obtencin de la desviacin media respecto a la mediana resulta de 2.048,8/320 = 6,4
minutos.
El valor de la desviacin estndar en relacin con el de la media aritmtica es 2,28 veces
menor que la media aritmtica, mientras que en el caso de la desviacin media respecto a la
mediana es de 2,64 veces menor que la mediana. Como hay una diferencia de (2,64-2,28) =
0,36, bajo el criterio mencionado antes, es preferible utilizar la mediana. Sin embargo, el valor
un poco ms alto de la media aritmtica advierte que hay algunos pocos pacientes que tienen
que esperar tiempos muy grandes.

Ejemplo 9 Ejemplo 9 Ejemplo 9 Ejemplo 9. . . . Variaciones en la crianza de animales. Variaciones en la crianza de animales. Variaciones en la crianza de animales. Variaciones en la crianza de animales.
Se tienen dos zoocriaderos de iguanas, cada uno con 200 iguanas. En el zoocriadero A los
animales son alimentados con una mezcla de sorgo-yerbas-harina de pltano, mientras que
los animales del zoocriadero B son alimentados con una mezcla de maz-yerbas-harina de
yuca. Estas diferencias en la alimentacin han acarreado desarrollos desordenados en las
iguanas. Dos empleados, Anatoly y Boris, son encargados de observar, medir y clasificar los
animales. Anatoly se encarg del zoocriadero A y Boris del zoocriadero B. Los empleados
entregaron las siguientes tablas:


- 124 -

Peso (lb) Peso (lb) Peso (lb) Peso (lb) Cantidad Cantidad Cantidad Cantidad
[1.5-2.0) 15
[2.0-2.5) 20
[2.5-3.0) 25
[3.0-3.5) 30
[3.5-4.0) 30
[4.0-4.5) 35
[4.5-5.0) 45










Longitud (cm) Longitud (cm) Longitud (cm) Longitud (cm) Cantidad Cantidad Cantidad Cantidad
[35.5-44.0) 45
[44.0-52.5) 35
[52.5-61.0) 30
[61.0-69.5) 30
[69.5-78.0) 25
[78.0-86.5) 20
[86.5-95.0) 15
De acuerdo al coeficiente de variacin, en cul de los dos zoocriaderos se presenta mayor
desorden en el desarrollo de los animales?
Discusin. Discusin. Discusin. Discusin. Vale aclarar que para comparar la dispersin de dos conjuntos de datos en
donde se manejen diferentes unidades de medidas, se debe usar el coeficiente de
dispersin de Pearson. Como los datos estn agrupados y las variables son continuas
se requieren las marcas de clases, las cuales aparecen en las siguientes tablas para los
diferentes intervalos de clases.

Peso (lb) Peso (lb) Peso (lb) Peso (lb) Cantidad Cantidad Cantidad Cantidad Marcas Marcas Marcas Marcas
[1.5-2.0) 15 1.75
[2.0-2.5) 20 2.25
[2.5-3.0) 25 2.75
[3.0-3.5) 30 3.25
[3.5-4.0) 30 3.75
[4.0-4.5) 35 4.25
[4.5-5.0) 45 4.75










Longitud (cm) Longitud (cm) Longitud (cm) Longitud (cm) Cantidad Cantidad Cantidad Cantidad Marcas Marcas Marcas Marcas
[35.5-44.0) 45 39.75
[44.0-52.5) 35 48.25
[52.5-61.0) 30 56.75
[61.0-69.5) 30 65.25
[69.5-78.0) 25 73.75
[78.0-86.5) 20 82.25
[86.5-95.0) 15 90.75

Sea P la variable Peso (en libras) y L la variable longitud (en centmetros). Si f
k
y M
k
son las
frecuencias absolutas y las marcas de clases, respectivamente, entonces
k 7
k k
k 1
f M
P 3.5625
200
=
=
= =


y
k 7
k k
k 1
f M
L 59.9375
200
=
=
= =

son las medias aritmticas de las variables P y L.



- 125 -
Las varianzas de las variables P y L son
( )
k 7
2
k k
2 k 1
P
f M P
S 0.92109375
200
=
=

= =

y
( )
k 7
2
k k
2 k 1
L
f M L
S 266.196094
200
=
=

= =

, y las desviaciones estndar son S


P
=0.9597 y S
L
=16.3155. Por
lo tanto, los coeficientes de variacin son
P
P
S
CV 0.26939
P
= = y
L
L
S
CV 0.27221
L
= = , para las
variables P y L respectivamente.
Como se puede apreciar, los desarrollos han sido muy similares en los dos conjuntos de datos,
presentndose ligeramente mayor variacin en el zoocriadero de Boris.
Ejemplo 10. Ejemplo 10. Ejemplo 10. Ejemplo 10. La r La r La r La recta que mejor se ajusta. ecta que mejor se ajusta. ecta que mejor se ajusta. ecta que mejor se ajusta.
Se tienen diez puntos y dos rectas. Los puntos son A(1,4), B(2,2), C(3,5), D(4,3), E(5,6), F(6,4),
G(7,6), H(8,4), J(9,8) y K(10,4). Las ecuaciones de las rectas son -4x+15y=45 y -4x+15y=47.
Cul de las dos rectas se ajusta mejor al conjunto de puntos?
Discusin. Discusin. Discusin. Discusin. Una manera de determinar cul de las dos rectas se ajusta mejor al conjunto de
puntos es considerar las distancias verticales entre los puntos y cada una de las rectas, y luego
calcular la varianza o desviacin estndar de estas distancias para cada recta. Por ejemplo, la
distancia vertical entre un punto P(x
1
,y
1
) y una recta con ecuacin y=mx+b es
1 1
mx b y + .
Al conjunto de distancias se le calcula la media aritmtica y finalmente se calcula la desviacin
estndar. El conjunto de distancias con menor dispersin corresponde a las distancias de la
recta que mejor se ajusta, la cul es la recta ms cercana al conjunto de puntos.
A continuacin se presentan estos clculos para las rectas
45 4x
y1
15
+
= y
47 4x
y2
15
+
= .



- 126 -
La media aritmtica de las distancias
k k
Y1 Y es
k 7
k k
k 1
Y1 Y
Y1 1.333
10
=
=

= =

;
La varianza de las distancias
k k
Y1 Y es
k 7
2
k
2 k 1
Y1 Y
S (Y1) 0.293
10
=
=

= =

y la desviacin estndar
es S(Y1)=0.542.


La media aritmtica de las distancias
k k
Y2 Y es
k 7
k k
k 1
Y2 Y
Y2 1.333
10
=
=

= =

;
La varianza de las distancias
k k
Y2 Y es
k 7
2
k
2 k 1
Y2 Y
S (Y2) 0.276
10
=
=

= =

y la desviacin estndar
es S(Y2)=0.525.

Al comparar las dispersiones se concluye que la recta que mejor se ajusta al conjunto de
puntos es -4x+5y=47.
.
.

- 127 -
5.16 5.16 5.16 5.16 Ejercicios. Ejercicios. Ejercicios. Ejercicios.
1. A continuacin se presenta la informacin dada por diez estudiantes con respecto a la
distancia, medida en cuadras, del lugar en donde ellos viven, al colegio en donde
estudian.

40 50 30 45 45 48 35 60 36 10
a) Con qu medidas estadsticas se puede resumir la distancia que tiene que recorrer un
estudiante para ir de su hogar al colegio? Alguna de esas medidas es ms apropiada?
Explique.
b) Con base en qu medida estadstica se puede resumir la variabilidad de las distancias
recorridas por los estudiantes? Alguna de esas medidas es ms apropiada? Explique.
c) Qu representaciones grficas se podran utilizar para ilustrar la situacin? Alguna de
esas representaciones grficas es ms apropiada? Explique.
2. La siguiente informacin presenta los datos en miles de pesos de los salarios de secretarias
que trabajan en cuatro empresas diferentes:

Empresa 1: 350 400 350 2100
Empresa 2: 350 400 350 400 550
Empresa 3: 350 350 350 350 1300
Empresa 4: 300 400 500 600 700 800
Con qu medidas estadsticas de tendencia central y de dispersin sera apropiado
resumir el comportamiento de los salarios de las secretarias de cada una de las empresas
anteriores?.
3. Construya un conjunto de diez datos que tenga un promedio de 39.9 y una desviacin
estndar de 0.
4. Proponga tres conjuntos, cada uno de 10 datos que satisfagan las siguientes condiciones:
promedio 6 y desviacin estndar 1; promedio 10 y desviacin estndar 1; promedio 7 y
desviacin estndar 2.
5. Construya un conjunto de diez datos con las siguientes caractersticas: promedio 39.9; que
todos los datos sean diferentes; y que la distancia entre cualquier par de datos contiguos,
una vez ordenados de manera ascendente o descendente, sea la misma. Con respecto al
valor de la desviacin estndar que se obtuvo con los datos iniciales del ejercicio 1, qu
relacin de orden espera encontrar entre las desviaciones estndar correspondientes a la
distribucin del ejercicio 1 y a la que acaba de construir? qu efecto puede tener sobre la
desviacin el aumentar o disminuir la distancia entre los datos?
6. Construya un conjunto de diez datos con las siguientes tres caractersticas: promedio de
39.9; que los datos contengan slo dos valores diferentes, y tal que los dos valores
diferentes ocurran con distinta frecuencia. Bajo las condiciones anteriores, intente
establecer una relacin entre los dos valores de frecuencias de los datos y las dos
distancias de los datos al promedio.

- 128 -
7. A continuacin se presenta la representacin grfica de un par de distribuciones:
1 2 3 4 1 2 3 4

Cul de las dos distribuciones le parece que es ms dispersa? Qu efecto puede tener
sobre los valores de las medidas de dispersin, el que las frecuencias de los valores de las
distribuciones anteriores se cambien pero mantenindose la misma relacin de 3 a 1 que
se insina en las grficas?
8. Construya un conjunto de diez datos con las siguientes tres caractersticas: promedio de
39.9; que los datos contengan slo dos valores diferentes, y tal que los dos valores
diferentes ocurran con igual frecuencia. Luego calcule el rango y la desviacin estndar.
Luego, proponga otros conjuntos que satisfagan las mismas condiciones anteriores y trate
de identificar un patrn de relacin entre la desviacin estndar y el rango.
9. Construya dos nuevos conjuntos de datos U y V, que satisfagan simultneamente la
siguientes condiciones: la desviacin estndar de los elementos de U debe ser mayor que
la desviacin estndar de los elementos de V, el rango de los elementos de U debe ser
menor que el rango de los elementos de V.
10. En un zoocriadero destinado a la cra de chigiros se ha descuidado la alimentacin de
estos animales y se ha presentado un desarrollo inesperado. Se han clasificado los
animales en 10 grupos, teniendo en cuenta sus pesos en kilogramos. La siguiente tabla
muestra la cantidad de animales en cada categora de pesos:

P PP Pesos esos esos esos
C CC Cantidad de antidad de antidad de antidad de
animales animales animales animales
35.00 - 40.00 20
40.10 - 45.00 25
45.10 - 50.00 30
50.10 - 55.00 10
55.10 - 60.00 15
60.10 - 65.00 20
65.10 - 70.00 25
70.10 - 75.00 35
75.10 - 80.00 10
80.10 - 85.00 10
a) Calcule la media y la desviacin estndar para estos datos y evale la
representatividad de la media como medida de tendencia central, Ser preferible la
mediana?

- 129 -
b) Verifique la versin frecuencial de la desigualdad de Tchevichev para los casos de
una desviacin respecto a la media y dos desviaciones respecto a la media
11. En un colegio, los estudiantes de grado 10 se repartes en cuatro grupos {A, B, C, D} de
igual cantidad de estudiantes para las asignaturas no deportivas. Se practica el examen
final de fsica. La siguiente tabla muestra las calificaciones obtenidas por los estudiantes en
cada grupo:

12 56 36 52 52 57 43 35 50 31 38
A 72 67 31 51 66 53 52 61 60 38 63
45 77 24 52 51 35 49 43 90 54 46
52 77 45 49 57 66 67 61 50 68 49
B 64 66 46 68 57 52 63 50 59 47 52
64 46 12 66 79 62 29 50 45 39 73
33 34 49 36 55 60 57 54 45 47 69
C 84 56 39 52 88 36 60 61 54 65 47
52 42 56 25 37 46 57 65 65 63 52
56 70 38 69 57 60 82 66 25 58 58
D 61 53 44 74 73 60 23 50 33 51 55
33 61 62 71 56 77 77 46 57 39 49

a) Qu porcentaje x de las notas de los estudiantes satisface las desigualdades?
(I) x x x < < + (II) x 2 x x 2 < < + (III) x 3 x x 3 < < +
b) En cul de las asignaturas se presenta mayor dispersin?
12. Como parte de un programa de control de calidad en la produccin de bateras para usar
en diferentes aparatos elctricos, se someten a una prueba de duracin 64 bateras de tipo
A y 105 bateras de tipo B, provenientes de dos fabricantes diferentes. Los resultados
obtenidos se organizan en la siguiente tabla:

Tiempo de duracin Tiempo de duracin Tiempo de duracin Tiempo de duracin
(en das) (en das) (en das) (en das)
Tip Tip Tip Tipo A o A o A o A
(frecuencia) (frecuencia) (frecuencia) (frecuencia)
Tipo B Tipo B Tipo B Tipo B
(frecuencia) (frecuencia) (frecuencia) (frecuencia)
[90; 120) 6 7
[120; 150) 9 12
[150; 180) 18 31
[180; 210) 21 29
[210; 240) 7 22
[240; 270) 3 4
a) Compare la variabilidad de ambas distribuciones de datos en trminos de
coeficientes de dispersin relativa.
b) Comente acerca de la fiabilidad de los coeficientes que fueron considerados en el
literal anterior.
13. Un examen de Clculo se aplic a los cuatro grupos de grado 11 de una institucin. En la
siguiente tabla se presentan las frecuencias absolutas.

- 130 -


Calcular para cada grupo el Coeficiente de Variacin de Pearson y ordnelos de menor a
mayor grado de heterogeneidad.
14. En un zoocriadero destinado a la cra de chigiros para exportacin se ha descuidado la
alimentacin de los animales y se ha presentado un desarrollo inesperado en estos. Se han
clasificado los animales en 10 grupos, teniendo en cuenta sus pesos en kilogramos. La
siguiente tabla muestra la cantidad de animales en cada categora de pesos:

Pesos Pesos Pesos Pesos
Cantidad de Cantidad de Cantidad de Cantidad de
animales animales animales animales
35.00 - 40.00 20
40.10 - 45.00 25
45.10 - 50.00 30
50.10 - 55.00 10
55.10 - 60.00 15
60.10 - 65.00 20
65.10 - 70.00 25
70.10 - 75.00 35
75.10 - 80.00 10
80.10 - 85.00 10

a) Calcule la media y la desviacin estndar para estos datos y evale la
representatividad de la media como medida de tendencia central, Ser preferible la
mediana?
b) Verifique la versin frecuencial de la desigualdad de Tchevichev para los casos de
una desviacin respecto a la media y dos desviaciones respecto a la media

- 131 -
15. Se tienen dos zoocriaderos (A y B) de iguanas, cada uno con 200 iguanas. En el
zoocriadero A los animales son alimentados con una mezcla de sorgo-yerbas-harina de
pltano, mientras que los animales del zoocriadero B son alimentados con una mezcla de
maz-yerbas-harina de yuca. Estas diferencias en la alimentacin han producido
desarrollos desordenados en las iguanas. Dos empleados, Anatoly y Boris, son encargados
de observar, medir y clasificar los animales. Anatoly se encarg del zoocriadero A y Boris
del zoocriadero B. Desafortunadamente Anatoly tom los pesos y Boris tom la longitud
nariz-cola, y con eso entregaron las siguientes tablas:


De acuerdo al coeficiente de variacin, en cul de los dos zoocriaderos se presenta
mayor desorden en el desarrollo de los animales?
16. El siguiente diagrama representa la distribucin de frecuencias de los valores de una
variable continua X. Calcule el coeficiente de variacin de Pearson.

5
10
15
10
20
5
10
5
0
5
10
15
20
25
[ 00 , 10 ) [ 10 , 20 ) [ 20 , 30 ) [ 30 , 40 ) [ 40 , 50 ) [ 50 , 60 ) [ 60 , 70 ) [ 70 , 80 ]


17. La serie final de un campeonato de bisbol fue disputada por los equipos A y B, durante la
temporada en cada equipo participaron 40 jugadores. Al final de la serie se contabilizaron
los batazos de hit conectados por los dos equipos y se construyeron las distribuciones que
se muestra en las siguientes tablas:

- 132 -


Equipo A Equipo A Equipo A Equipo A
Hits Jugadores
100-125 2
125-150 3
151-175 5
176-200 1
201-225 9
226-250 8
251-275 7
275-300 5




Equipo B Equipo B Equipo B Equipo B
Hits Jugadores
125-160 8
161-195 7
196-230 5
231-265 6
266-270 4
271-305 5
306-340 3
341-375 2
En cul de los dos equipos el ritmo de bateo fue ms homogneo durante la temporada?

18. Un juego consiste en lanzar cinco dados, apostar $1000 y ganar $1000 por cada cinco
que aparezca, es decir, si le salen n cincos se gana 1000n pesos. Otro juego consiste en
lanzar seis dados, apostar $1250 y ganar $1250 por cada cinco que aparezca, es decir, si
le salen n cincos se gana 1250n pesos. En ambos juegos, si al jugador no le sale el nmero
apostado, entonces pierde el doble del dinero apostado. En cual de los dos juegos vara
en mayor grado la ganancia?
19. En un saln de juegos se encuentran dos objetos (A y B) de tiro al blanco, los cuales estn
formados por 5 crculos concntricos de radios 10 cm, 20 cm, 30 cm, 40 cm y 50 cm. Un
hombre que dispara al blanco en el objeto A recibe 50 puntos, 40 puntos, 30 puntos, 20
puntos o 10 puntos, segn pegue en la zona 1 (crculo pequeo), zona 2, zona 3, zona 4 o
zona 5 (anillos circulares). Un hombre que dispara al blanco en el objeto B recibe 45
puntos, 40 puntos, 35 puntos, 30 puntos o 20 puntos, segn pegue en la zona 1 (crculo
pequeo), zona 2, zona 3, zona 4 o zona 5 (anillos circulares). La probabilidad de que el
disparo haga contacto con cualquiera de las 5 zonas del blanco es 1/3, y la probabilidad
de no dar en el blanco es 2/3. Si X se define como el puntaje ganado por jugador que
dispara en el objeto A, y Y se define como el puntaje ganado por un jugador que dispara
en el objeto B, En cul de los dos objetos hay mayor variabilidad en las ganancias
obtenidas??
20. Un embarque de 20 computadoras similares que se enva a un distribuidor contiene 8
aparatos defectuosos. Una escuela escoge aleatoriamente 10 de estas computadoras y las
compra. Se define la variable aleatoria X como el nmero de computadoras defectuosas
entre las computadoras compradas. Cul es la varianza de la variable X?

Das könnte Ihnen auch gefallen