Sie sind auf Seite 1von 82

Facultad de Ciencias Económicas

Área de Formación Docente y Producción Educativa


Universidad Nacional de Córdoba
Estadística I
Tomo I (cap. 1, 2 y 3)

1
AUTORIDADES
Mgter. JHON BORETTO
Decano
Dra. MARÍA LUISA RECALDE
Vicedecana
Cr. FACUNDO QUIROGA MARTÍNEZ
Secretario Técnico
Cr. DIEGO CRIADO DEL RÍO
Secretario de Administración
Mgter. GERARDO HECKMANN
Secretaria de Asuntos Académicos
Lic. JUAN SAFFE
Secretario de Extensión
Cr. MATÍAS LINGUA
Secretario de Asuntos Estudiantiles
Dr. ANDRÉS MATTA
Secretaria de Ciencia, Técnica y Relaciones Internacionales
Mgter. CLAUDIA CARIGNANO
Prosecretaria de Evaluación Institucional y Acreditación de Carreras
Cr. HUGO PRIOTTO
Director de la Carrera Contador Público
Mgter. MARCELO CAPELLO
Director de la Carrera de Licenciatura en Economía
Lic. TOMÁS GASTÓN
Director de la Carrera de Licenciatura en Administración

2
CICLO BÁSICO A DISTANCIA
ÁREAS QUE PARTICIPAN
Coordinación Académica
Secretaría de Asuntos Académicos
Mgter. Gerardo Heckmann
Coordinación Organizativa de Divisiones a Distancia
Lic. David Taborda
Área de Formación Docente y Producción Educativa
Coordinador General
Oscar Margaría
Asesora pedagógica
Dra. Adela Coria
Equipo de producción en tecnología educativa y comunicación
Mgter. Gabriela Sabulsky
Lic. Cecilia Botino
Lic. Víctor R. Cacciagiú
Lic. Laura Delmonte
Lic. Vanesa Guajardo
Esp. Verónica Pacheco
Lic. María Florencia Scidá
Administración
Lic. Nora Ceballos

3
Proyecto “Elaboración de material didáctico en formato digital para Estadística I” en el marco del
Programa de Apoyo y Mejoramiento a la enseñanza de grado de la UNC aprobado por Res. HCS Nº583-
2015.
Coordinadora del Proyecto:
Margarita Díaz
AUTORES
Norma Patricia Caro
Rosana Beatriz Casini
Margarita Díaz
Fernando García
Mariana González
Martín Saino
María Inés Stímolo
Los autores agradecen especialmente a los Profesores Asistentes por la colaboración prestada en la
resolución y revisión de las actividades.
María Inés Ahumada
Lorena Anaya
Verónica Arias
Mariana Guardiola
Roberto Infante
Adrian Moneta Pizarro
Olga Padro
Andrea Righetti
Julio Rosales

4
Proyecto “Fortalecimiento del Ciclo Básico a Distancia” en el marco del Programa de Apoyo y
Mejoramiento a la enseñanza de grado de la UNC aprobado por Res. HCS Nº 604-2014.
Coordinadora del Proyecto:
Dra. Adela Coria
Maquetación de materiales
Lic. Víctor R. Cacciagiú y Lic. Ismael Rodríguez
Diseño gráfico y audiovisual
Lic. Laura Delmonte
Asesoramiento y diseño pedagógico - didáctico
Esp. Verónica Pacheco y Lic. Vanesa Partepilo
Asesoramiento y diseño comunicacional
Lic. Cecilia Botino y Lic. María Florencia Scidá

5
ÍNDICE
Capítulo 1:
Los métodos estadísticos en la investigación científica
1. Introducción (1)
2. ¿Por qué estudiar estadística? (1)
3. Breve historia de la estadística (2)
4. ¿Qué es la Estadística? (3)
4.1. Población y muestra (4)
4.2. Estadística descriptiva e inferencial (5)
5. Etapas del método estadístico (6)
5.1. Planteamiento del Problema (7)
5.2. Recopilación de datos (10)
5.3. Tipos de variables (13)
5.4. Organización y presentación de datos estadísticos (16)
5.4.1. Distribuciones Unidimensionales (17)
5.4.2. Distribuciones Bidimensionales (33)
5.4.3. Otro tipo de Gráfico: Gráfico logarítmico (42)
5.5. Algunos lineamientos a considerar en la presentación de informes (45)
6. Actividades de aprendizaje (46)
7. Casos de discusión y análisis (53)
8. Referencias Bibliográficas (56)
9. Soluciones y respuestas al Capítulo 1 (57)

6
Capítulo 1
Los métodos estadísticos en la investigación científica

7
Capítulo 1: Los métodos estadísticos en la investigación científica
1. Introducción
En esta unidad, a partir de la base de conceptos adquiridos en los cursos de matemática, damos inicio a
este primer curso de estadística que nos permitirá conocer la utilidad de estas herramientas en nuestra área
del conocimiento y las etapas que debemos seguir para realizar un análisis estadístico de los datos. Además
veremos cómo obtener una primera aproximación a un conjunto de datos, a través de su organización en
tablas y gráficos.
En resumen en esta unidad vamos a:
 Visualizar los aportes de la estadística en el proceso de producción de conocimientos en distintos
campos científicos.
 Comprender la lógica de las etapas del método estadístico.
 Distinguir entre los distintos tipos de investigación de acuerdo a la manera en que se recolectan los
datos y a los fines que persiguen.
 Identificar los distintos tipos de variables y las correspondientes escalas de medición.
 Organizar los datos en tablas y gráficos para encontrar una primera descripción de los mismos.
2. ¿Por qué estudiar estadística?
En la actualidad, la estadística y sus aplicaciones forman parte de la vida cotidiana, en ámbitos tan diversos
como la política, la medicina, la educación, los negocios, entre otros. Las posibilidades de acceso a la
información y el aumento de capacidad de cálculo de las computadoras, han hecho posible en las últimas
décadas importantes avances en el almacenamiento de grandes bases de datos en los más diversos
campos de la Ciencias. Como afirma Peña, “… el reto más importante de la estadística en este Siglo XXI es
cómo extraer la información de estas grandes masas de datos y utilizarla de manera efectiva para aumentar
nuestro conocimiento, orientar la toma de decisiones y dirigir la mejora de procesos y servicios” (2001:
pág.42)
En el área de las Ciencias Económicas la estadística es una herramienta muy importante y de gran utilidad.
A menudo escuchamos acerca de las estadísticas en las bajas y alzas en la Bolsa de Valores, las
estadísticas sobre los precios vigentes de un cierto producto o bien de relaciones estadísticas puntuales,
como por ejemplo: 1) el comportamiento de las familias que como agente económico en el mercado genera
estadísticas de ventas que, a su vez, ayudan a las empresas a tomar decisiones sobre los productos que
deben mantenerse, descartarse o modificarse; ó 2) las empresas aseguradoras de autos recopilan datos
acerca de la edad de los conductores, el tipo de vehículo, accidentes más comunes y tales estadísticas
guían a las empresas para fijar las primas de seguro a cobrar.
Como la información permite generar conocimiento, se plantean de esta manera modelos estadísticos para
simplificar la realidad incorporando un cierto grado de confianza a los resultados, dando una medida a la
incertidumbre y obteniendo, de esta manera, información útil que contribuya a las decisiones.

1
Un modelo conocido, es por ejemplo, el que establece una relación lineal inversa entre el precio de un bien
y la cantidad demandada. La estadística aporta métodos que permiten evaluar la compatibilidad entre ese
modelo teórico planteado y la información empírica que surge de los valores observados de precios y
cantidades, incorporando el concepto de aleatoriedad, para considerar los distintos resultados posibles que
se puedan presentar. Dentro de las Ciencias Económicas, la Estadística puede aplicarse a diversas áreas,
razón por la cual es una herramienta necesaria para los profesionales en esta área. Como ejemplos
podemos enumerar:
En el área contable:
 Analizar determinadas variables en el tiempo, tales como nivel de facturación, de gastos, índices de
endeudamiento, etc.
 Seleccionar muestras de comprobantes y realizar tareas de control.
 Realizar control de calidad sobre los artículos fabricados por una empresa.
 Estudiar los factores que inciden en la rentabilidad de las empresas.
En el área de economía:
 Cuantificar el impacto de ciertos factores en el desempleo.
 Medir la distribución del ingreso.
 Modelar el comportamiento del Producto Bruto Geográfico a través del tiempo.
En el área de administración:
 Identificar el perfil requerido de los empleados de una empresa.
 Mejorar la calidad de los servicios.
 Estimar la proporción de clientes que prefieren determinados productos.
Llegar a informar cada una de las situaciones precedentes, exige todo un proceso anterior que abarca
desde el planteo de un objetivo, la recolección de los datos pertinentes, el análisis estadístico de los mismos
y, por último, la obtención y presentación de los resultados. Esta es la razón por la cual necesitamos una
formación estadística, ya que un profesional de Ciencias Económicas debe ser capaz de leer e interpretar
datos de manera crítica, definir cuáles dan respuestas claras a cuestiones importantes y conocer las
metodologías que nos permitirán extraer conclusiones objetivas basadas en análisis de dichos datos.
(Información adicional)
Lo invitamos ahora a ingresar a la sección Materiales Recursos del aula virtual para mirar la producción
audiovisual “Serie Horizontes” de Canal Encuentro para acercarnos al surgimiento de la Estadística y
sus categorías conceptuales
(Fin de información adicional)
3. Breve historia de la estadística
El origen de la estadística se remonta a la edad antigua. Los estados ya recogían datos en Egipto, hacia el
año 3050 A.C. bajo el reinado de Ramsés II, en Israel, bajo el reinado del rey David, en China hace más de
cuarenta siglos, como así también en la Grecia antigua. La información recogida tenía como propósito, entre
otros, recaudar impuestos, repartir tierras, tener registros de nacimientos y muertes, etc. No obstante su
origen antiguo, fueron los romanos quienes hicieron censos con mayor sistematicidad y con una
periodicidad de 5 años; cuenta la historia que durante el nacimiento de Cristo se llevó a cabo uno de ellos.
Luego de la caída del imperio romano vino un largo período de pobres registros, resurgiendo recién en el
año 762 en Francia con Carlomagno y casi trescientos años después, en Inglaterra, bajo el reinado de
Guillermo El Conquistador, cuando se logra un gran compendio estadístico conocido como el Domesday
Book, para el año 1086.

2
Ya en la edad moderna, específicamente a mediados del S. XVII, en Alemania y de la mano de Conring, se
afianza la visión de la estadística cuyo objetivo se definía como la descripción cuantitativa de los hechos
notables de un estado, tendencia que fue proyectada y consolidada por Achenwall, quien utilizó el término
alemán “statistik” para referirse a esta disciplina, y posteriormente por Von Scholer, a quien se le atribuye
haber separado el estudio de la teoría estadística de su aplicación práctica. Todos ellos formaron parte de la
Estadística Universitaria Alemana, lo que constituye el antecedente más formal de la estadística descriptiva
actual.
A su vez, en Inglaterra, Graunt y posteriormente Petty encabezan otra línea denominada Estadística
Investigadora. Esta escuela centró la atención en la búsqueda de leyes empíricas que explicaran los
fenómenos sociales y políticos de la época. En base a sus ideas se comienzan a realizar los primeros
censos oficiales en el sentido moderno del término. Como antecedente a ello, se conoce que el primero fue
realizado por España en Perú, en 1548, mientras que, en la propia Europa el primero fue en Irlanda en el
año 1703. Y ya a comienzos del Siglo XIX casi todos los países de Europa recogen información mediante
censos oficiales. En nuestro país, bajo la presidencia de Sarmiento se llevó a cabo el primer censo nacional
de población en 1869, aunque “el más lejano antecedente estadístico argentino de que se tiene noticia está
constituido por los primitivos recuentos de soldados y familias dispuestos por Don Juan de Garay al fundar
la ciudad de Santa Fé. Una experiencia similar se registra en 1577, cuando Don Lorenzo Juárez de
Figueroa encaró el reparto de los solares de la Ciudad de Córdoba” INDEC (1983).
Paralelamente y con muy pocos puntos de contacto, durante el Siglo XVII se desarrolla una rama de la
matemática conocida como Teoría de Probabilidad, que surge para resolver problemas de juegos de azar,
modelando fenómenos aleatorios. Entre los precursores se encuentran Pascal y Fermat. En el Siglo XVIII,
matemáticos como Bernoulli, Laplace y Gauss desarrollan importantes técnicas estadísticas como la
estimación de un parámetro, el desarrollo de la ley normal para describir la variabilidad de los errores de
medida y el planteo del problema de mínimos cuadrados. Posteriormente se aplicó para el tratamiento de
los errores de medición en el campo de la física y la astronomía, y en el Siglo XIX se extendió a aplicaciones
biológicas y a otras áreas, como las Ciencias Sociales. En este sentido, podemos mencionar a Quetelet,
quien introduce la aplicación de la estadística a las Ciencias Sociales y a Galton que introdujo el término
regresión para explicar el comportamiento de la estatura entre padres e hijos. A su vez, debemos mencionar
a sus discípulos Pearson, Goset (Student) y Fisher que desarrollaron metodologías que constituyen el
núcleo de la estadística actual.
(Información adicional)
Glosario
La investigación científica es un proceso guiado y el objetivo de los métodos estadísticos es hacer este
proceso tan eficiente como sea posible mediante la formulación de hipótesis y la confrontación con los
hechos.
El método científico permite llevar a cabo el proceso de investigación científica, es la aplicación de la
lógica y la objetividad a la comprensión de los fenómenos. De las sucesivas confrontaciones entre hipótesis
y datos se va avanzando en el conocimiento.
(Fin de información adicional)
4. ¿Qué es la Estadística?
Como hemos hecho referencia en el punto anterior, los métodos estadísticos constituyen una herramienta
indispensable para llegar a conclusiones confiables a partir de resultados empíricos que surgen del análisis
de datos.
En un sentido amplio, la estadística es el arte y la ciencia de reunir, analizar, presentar e interpretar datos.
Mood y Graybill expresan que la estadística es “la tecnología del método científico. La estadística
proporciona instrumentos para la toma de decisiones cuando prevalecen condiciones de incertidumbre”
(1978; pág. 3). Otros autores consideran que es la ciencia desarrollada para resolver problemas en
presencia de variabilidad. La esencia de la estadística consiste en el desarrollo y uso de modelos de
pensamiento que se dirigen hacia la comprensión del mundo real y a la predicción del futuro ya que tiene en
cuenta la incertidumbre.
¿Qué se entiende en estadística por variabilidad e incertidumbre? Hablamos de variabilidad porque una
serie de datos estadísticos surge de mediciones efectuadas a ciertos elementos y los resultados varían de
una unidad a otra.

3
Además, muy a menudo se trabaja con una parte de la totalidad de los elementos o individuos que están
bajo consideración en una investigación, lo cual genera incertidumbre. En estadística, a esa totalidad de
elementos se denomina Población. Como las poblaciones a menudo son muy grandes, es imposible o muy
costoso recoger información de toda la población, lo que obliga a trabajar con una parte representativa de
esa población, denominada Muestra Aleatoria.
(Información adicional)
Ahora, lo invitamos a ingresar a la sección Materiales Recursos del aula virtual a ver la producción
audiovisual “Serie Horizontes” de Canal Encuentro, en relación al tema población y muestra.
Glosario
Un generador de números aleatorios es un dispositivo informático o físico diseñado para producir
secuencias de números sin un orden aparente. Por ejemplo el uso de los bolilleros en los sorteos, o en
Excel las funciones “aleatorio” o “aleatorio.entre”.
(Fin de información adicional)
4.1. Población y muestra
Una población es el conjunto completo de elementos o individuos que interesa en una investigación, cada
elemento se designa como unidad estadística y su tamaño se representa por la letra N. Una muestra es
una parte de la población que se selecciona para realizar una determinada investigación y su tamaño se
indica con n.
Necesitamos una muestra que sea representativa de la población, a fin de extender las conclusiones hacia
la población de donde la misma ha sido seleccionada. Para ello los elementos de la muestra deben ser
seleccionados aleatoriamente.
Una Muestra Aleatoria es aquella en la que todos los elementos de la población tienen una probabilidad
conocida de ser seleccionados. Si la probabilidad es igual para todas las unidades estadísticas, el método
se conoce como Muestra Aleatoria Simple.
El listado de los elementos a partir del cual se selecciona la muestra en estadística es denominado Marco
muestral.
Las características de la unidad estadística relacionada con el tema sobre el cual estamos investigando que
deben relevarse se denominan variables en estadística.
Ejemplo Análisis Industrias de Córdoba
Para ilustrar los conceptos de población y muestra, utilizaremos el siguiente ejemplo:
La Unión Industrial de Córdoba, durante el año 2006, realizó un estudio para analizar distintos aspectos de
la actividad industrial. Para ello, de la población de 2000 industrias radicadas en la provincia (N=2000), se
tomó una muestra aleatoria de 150 empresas (n=150).
En este ejemplo, para una muestra aleatoria simple, cada una de las 2000 industrias tiene igual probabilidad
de ser seleccionada (0,005=1/2000). Una forma de conformar la muestra de 150 empresas es elegir al azar
150 números de un listado de 2000 números que se han asignado a las empresas. El listado de las 2000
industrias se denomina en estadística marco muestral.
Toda medida resumen que se calcula para describir características del estudio a partir de la muestra se
denomina Estadístico, el que podrá ser utilizado para inferir conclusiones sobre la población.
(Información adicional)
Podrá leer el “Informe del Análisis de las industrias de Córdoba” en la sección Enlaces de Interés del aula
virtual.
(Fin de información adicional)

4
Parámetro y Estadístico
Toda medida resumen que se calcula para describir características poblacionales se llama parámetro, el
cual es una cantidad fija que generalmente no se conoce y debe ser estimada. Un estadístico es una
medida calculada con las observaciones muestrales.
4.2. Estadística descriptiva e inferencial
Dada la base de datos, y después de una primera organización de los datos, es posible avanzar en el
descriptivo de los datos y aplicar técnicas que permiten la resolución de problemas bajo condiciones de
incertidumbre. Teniendo en cuenta ello, podemos dividir los métodos estadísticos en dos grandes ramas:
La Estadística Descriptiva está formada por aquellos métodos gráficos y numéricos que se utilizan para
resumir y procesar los datos, con el fin de describir apropiadamente sus principales características. La
Inferencia Estadística incluye los métodos que permiten hacer generalizaciones con respecto a la
población con base en información proporcionada por una muestra aleatoria, con un grado de incertidumbre
cuantificable.
La Estadística Descriptiva, desde la década del 60, incorporó nuevas medidas y gráficos al análisis
descriptivo tradicional que se presentaron bajo el nombre Análisis exploratorio de datos. Los métodos de la
Estadística Inferencial se basan en la teoría de probabilidad, y permiten construir intervalos de estimación
para los parámetros desconocidos y realizar pruebas de hipótesis.
El siguiente esquema ilustra los conceptos definidos en esta sección.
(Información adicional)
Esquema.
Estadística descriptiva: resume y describe al conjunto de datos, calculando medidas (parámetros o
estadísticos según corresponda).
Población flecha muestra flecha estadísticos flecha parámetros.
Estadística inferencial: permite hacer generalizaciones con respecto a la población en base a información
proporcionada por la muestra con un grado de incertidumbre cuantificable. Flecha. Probabilidad.
(Fin de información adicional)
En esta asignatura aprenderemos los métodos englobados en estadística descriptiva, así como la teoría de
probabilidad y variables aleatorias. En el último capítulo introduciremos al estudio de las distribuciones en el
muestreo, que constituye el fundamento teórico para el estudio de los métodos inferenciales.

5
Ejemplo Análisis Industrias de Córdoba
Con los datos de la muestra se realizó un análisis descriptivo de cada una de las características relevadas y
de algunas relaciones entre variables (estadística descriptiva).
Además, otro objetivo del estudio consistió en estimar el porcentaje de empresas de la población que usan
Internet, para lo cual se utilizaron métodos inferenciales como la estimación de parámetros por intervalos
(estadística inferencial).
No obstante las diferencias en cuanto a los objetivos que pueden tener los estudios, siempre debe seguirse
un razonamiento lógico que puede resumirse en las etapas del método estadístico.
5. Etapas del método estadístico
Las etapas a seguir para realizar un estudio estadístico que permitirá la toma racional de decisiones, se
pueden organizar de la siguiente manera:
(Información adicional)
Esquema.
Marco conceptual del área de estudio:
 Definición del problema y objetivos.
 Diseño y recopilación de datos.
 Organización y presentación de datos.
 Análisis.
 Resultados y conclusiones.
Metodología estadística.
(Fin de información adicional)
En resumen cada etapa consiste en:
 Planteamiento del Problema: en primer lugar se deben definir los objetivos del estudio, la población
objetivo, a partir de la cual se construirá el marco muestral y las variables de interés y sus relaciones.
Cuando se trabaja con una muestra, en el planteamiento del problema, se debe decidir el método de
muestreo más conveniente, determinar el tamaño de la muestra y la precisión esperada, temas que escapan
al alcance de esta materia
 Diseño y recopilación: Formulación estadística de la cuestión: definir la población de estudio a partir del
marco muestral, el tipo de estudio a realizar y las variables de interés. Diseñar cómo se obtienen los datos,
una vez recolectados se realiza un análisis de consistencia, elaborando de esta manera la base de datos
para su análisis.
 Organización y presentación de datos: se refiere a la presentación de los datos en tablas y gráficos,
que muestran su comportamiento y de este modo nos ayudan a comprender la información recabada.
 Análisis: consiste en el cálculo de medidas descriptivas y la interpretación de la información obtenida
(estadística descriptiva), lo que, de manera conjunta, nos permitirá responder los objetivos del estudio.
Cuando se está trabajando con una muestra, los resultados se proyectan a la población, estableciendo un
error, esto forma parte de la estadística inferencial que básicamente consiste realizar estimaciones por
intervalos, contrastar hipótesis y validar los supuestos en que se basa los modelos planteados.
 Resultados: Finalmente se informan los resultados más relevantes respondiendo a los objetivos iniciales
planteados en la formulación del problema. Es necesario presentar los resultados de manera adecuada, de
forma tal que contribuya a una mejor comprensión y exposición de los mismos, en función de los objetivos
del trabajo.
(Información adicional)
Estos métodos de inferencia estadística serán estudiados en Estadística II. De manera intuitiva un
intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el
verdadero valor del parámetro, con una probabilidad determinada. Una prueba estadística es un
procedimiento para, a partir de una muestra aleatoria, extraer conclusiones que permitan aceptar o
rechazar una hipótesis previamente formulada sobre el valor de un parámetro desconocido de una
población.
(Fin de información adicional)

6
En este capítulo y en el siguiente se introducen los conceptos de las dos primeras etapas señaladas y se
ilustran las técnicas para la organización, cálculo de medidas descriptivas y su interpretación. A continuación
analizamos en detalle cada etapa.
5.1. Planteamiento del Problema
Como se señaló precedentemente, lo primero que se debe hacer en una investigación es definir el problema
que se quiere abordar, para lo cual debe tenerse muy en claro la población objetivo, los parámetros a
estimar y/o pruebas de hipótesis que se plantean. Para ello se deberá definir:
Ejemplo Análisis Industrias de Córdoba
El marco muestral fue confeccionado a partir del listado de aproximadamente 2000 empresas provisto por el
Registro Industrial de la Provincia. De ese padrón se seleccionó una muestra aleatoria de 150 empresas y
un grupo adicional de 53 firmas, elegidas conforme a criterios predeterminados por la Unión Industrial. Una
de las dimensiones del estudio fue la inserción internacional de la firma, para lo cual se definieron, entre
otras, las siguientes características —variables— a relevar: Si la empresa es exportadora; si lo es, si tiene
necesidad de financiación y asesoramiento para exportar, como así también la evolución de las
exportaciones en relación al año anterior.
(Información adicional)
Explore el contenido del “Informe sobre Análisis de las industrias de Córdoba”. Observe el título, los
diferentes apartados, el índice, etc.
(Fin de información adicional)
De acuerdo a los objetivos que persiguen, los estudios se clasifican como se muestra en el siguiente
esquema.
(Información adicional)
Esquema.
Tipos de estudio:
1. Estudios exploratorios:
 Observacionales
 Entrevistas
 Grupos focales
2. Estudios descriptivos/confirmatorios
2.1. Experimentos
2.2. Relevamientos muestrales
(Fin de información adicional)

7
Estudios Exploratorios: estos estudios se basan en casos seleccionados discrecionalmente (no
aleatoriamente) y suelen ser el paso inicial de estudios posteriores, porque ayudan a familiarizarnos con la
situación o el problema, a identificar las variables importantes y a utilizar estas últimas para plantear
hipótesis que puedan ponerse a prueba en una investigación posterior.
La falta de aleatorización es una limitación básica de los estudios observacionales. Esta limitación se ve
reflejada en el análisis de los datos donde se debe tener mucho cuidado en el momento de obtener
conclusiones y en la generalización de las mismas.
La validez de las conclusiones obtenidas depende en gran medida de los conocimientos del experto sobre
el tema que investiga y de la incorporación de información externa proveniente de otros estudios.
(Información adicional)
Glosario
Validez es la comprobación de lo que se deseaba medir es medido realmente.
(Fin de información adicional)
Algunos ejemplos de estudios exploratorios:
- La Unión Industrial solicita un estudio sobre un conjunto específico de empresas, seleccionadas por
ciertas características particulares para analizar las formas de gerenciamiento de las mismas a través de
entrevistas a personas claves dentro de la empresa.
- Frecuentemente en marketing es necesario probar la eficacia de diversas campañas publicitarias. En
técnicas conocidas como grupos focales, se analiza la reacción de un grupo seleccionado de clientes
potenciales ante distintas propuestas de presentación del producto.
- Existen estudios observacionales denominados “paneles de basura” que estudian la basura humana
para analizar los patrones de consumo doméstico. Actualmente el uso de los escáneres electrónicos
permiten hacer estudios observacionales (en reemplazo a la observación humana) sobre el consumo de
productos y cambio de comportamientos de consumo.
Estudios descriptivos/confirmatorios: en estos estudios el objetivo es hacer inferencia respecto a la
población, para lo que se trabaja con una muestra aleatoria. En los relevamientos muestrales se estiman
parámetros desconocidos de la población. En los experimentos el diseño es más exigente ya que se quieren
probar relaciones de causalidad. A continuación se explican algunas características de estos estudios.
Diseños de experimentos: tienen como objetivo determinar si algunas variables, generalmente llamadas
tratamientos, afectan a otra conocida como variable respuesta. Para obtener conclusiones válidas sobre
causalidad, se debe ejercer control sobre uno o más factores que afectan la respuesta. Los experimentos
son investigaciones que se caracterizan por ser estudios organizados y controlados por el investigador.
Además de utilizar técnicas apropiadas de diseño experimental, se efectúa una buena planificación
estadística que permite establecer una relación entre los tratamientos en estudio y las respuestas
observadas. Para realizar un experimento se asignan aleatoriamente las unidades muestrales a cada uno
de los tratamientos, observando posteriormente los resultados obtenidos.
Estudios de este tipo se llevan a cabo frecuentemente en agronomía y medicina, aunque ha tenido un
importante desarrollo en administración.
Ejemplos de diseños de experimentos:
- Un ejemplo en agronomía, consiste en seleccionar parcelas, a las cuales se les aplican diferentes
fertilizantes (tratamientos) y se quiere saber cuál es el que produce mayor rendimiento (respuesta). Para
obtener conclusiones válidas se deben controlar algunos factores como pueden ser la calidad del suelo y la
cantidad de riego.

8
- En investigación de mercado, cuando se desarrolla un nuevo empaque para un producto y se desea
conocer si el mismo va a tener éxito en cuanto al aumento de las ventas. El producto se vende en 10
supermercados de la ciudad. El investigador de mercado dividirá a los supermercados en dos grupos de 5. A
un grupo de 5 supermercados enviará el producto envasado en el empaque tradicional y al otro grupo de 5
supermercados enviará el producto con su nuevo envase. La aleatorización será contemplada por el
investigador si la asignación de los supermercados a los distintos empaques se hace estrictamente al azar.
Si se ha respetado esta aleatorización, se puede aplicar una metodología estadística conveniente que le
permitirá tomar decisiones en cuanto a la eficacia del nuevo empaque.
A pesar de la garantía en cuanto a la validez de sus conclusiones, los experimentos no siempre son posibles
de realizar debido a la existencia de restricciones lógicas o éticas que limitan la aplicación de las técnicas de
aleatorización. Por ejemplo, un investigador médico no puede dejar a un grupo de pacientes sin darle una
cierta droga para el tratamiento de una enfermedad simplemente para comparar la eficacia de una droga en
el tratamiento de la enfermedad. Se enfrentará así a un problema ético, aparentemente contrapuesto al
avance de la ciencia.
Relevamientos muestrales: En el relevamiento muestral el investigador estudia una población bien
definida extrayendo de ella un subconjunto de unidades de observación denominado muestra. Si la muestra
se obtiene al azar se dice que se tiene una muestra aleatoria. Sólo las muestras aleatorias permiten obtener
conclusiones respecto de las poblaciones de las cuales se extraen, además de informar el error estadístico
de tales conclusiones.
Es evidente que para que las conclusiones obtenidas a partir de una muestra reflejen verdaderamente lo
que está ocurriendo en la población, el investigador debe tener en cuenta el proceso de aleatorización al
diseñar su plan de muestreo y al obtener la información pertinente. Para seleccionar una muestra aleatoria
se debe contar con un marco de muestreo adecuado que es el listado de todos los elementos que
componen la población.
La mayoría de los estudios que se realizan en el área de las Ciencias Económicas se hacen a través de
encuestas por muestreo, razón por la cual nos detenemos en este tipo de estudio.
Algunos de los numerosos ejemplos que podemos plantear son los siguientes:
- Si se quiere seleccionar una muestra de alumnos de la Facultad de Ciencias Económicas, un marco de
muestreo adecuado estaría dado por el registro de alumnos que se encuentra en el despacho de Alumnos
de la Facultad donde se los tiene ordenados por número de legajo. Una manera de seleccionar los alumnos
al azar podría ser seleccionar sistemáticamente 1 de cada 100 alumnos. A estos alumnos seleccionados al
azar se les hará la entrevista correspondiente. También se podrían generar números aleatorios utilizando un
programa de computación adecuado y los alumnos que se corresponden con los números seleccionados,
serán luego entrevistados. La selección aleatoria de la muestra asegura la representatividad de la misma y
la buena generalización de los resultados obtenidos en la muestra a la población de alumnos de la Facultad.
- En el estudio realizado por la Unión Industrial, se seleccionó aleatoriamente una muestra de 150
empresas, a las que se les administró un cuestionario. Revise la introducción del informe de del Análisis de
las industrias de Córdoba.
- Para determinar la eficacia de una campaña publicitaria en una ciudad, se selecciona una muestra
aleatoria de personas a entrevistar.
- En una auditoría contable, se selecciona una muestra aleatoria de comprobantes para estimar el
porcentaje que tienen errores.

9
5.2. Recopilación de datos
Los datos pueden provenir de fuentes primarias o secundarias. Una de las principales fuentes primarias es
la encuesta por muestreo (“survey”), en los que los datos son recolectados aplicando un cuestionario a los
elementos de la población o muestra seleccionada.
En el punto siguiente trataremos algunos aspectos a tener en cuenta en la elaboración de este instrumento.
Diseño de cuestionarios
El diseño del instrumento para recolectar datos es vital a la hora de realizar la encuesta, ya que nos permite
recabar información significativa que ayude al proceso de toma de decisiones. El procedimiento general
para diseñar un cuestionario involucra:
- la elección de preguntas que deben responder a los objetivos del estudio
- determinar la forma de administrar el cuestionario (personal, telefónico o por correo)
- la redacción de las preguntas
- determinar el formato de respuestas: preguntas cerradas o abiertas
- prueba y evaluación del cuestionario
A continuación se presentan como ejemplos de cuestionarios un bloque del cuestionario administrado a la
muestra de empresas seleccionadas en el estudio realizado por la Unión Industrial y un cuestionario que se
aplica a los alumnos de Estadística con fines educativos.
(Información adicional)
Podrá acceder al formulario completo del estudio realizado por la Unión Industrial en la sección Recursos y
Materiales del aula virtual.
Formulario C. Inserción Internacional de la Firma.
16. ¿Exporta? Sí/No.
17. Si no exporta, ¿quisiera exportar alguno de sus productos? Sí/No. Pasar a la pregunta 25.
18. ¿Necesita asesoramiento para exportar? Sí/No
19. ¿Necesita financiación para exportar? Sí/No
20. Señale el motivo.
1- Capital de trabajo
2- Adquisición de maquinaria
3- Postfinanciamiento de exportaciones
4- Otras (especificar)
(Si respondió “No” en la pregunta 16, pasar a la pregunta 25)
21. Las exportaciones directas de la empresa durante 2005 constituyeron el (completar porcentaje) del total
de las ventas de igual período.
22. El monto total de las exportaciones en el 2005 comparadas con las del 2004:
1- Aumentaron
2- Disminuyeron
3- Sin cambios
4- No exportó en el año 2004.
23. En su operatoria normal de exportación, ¿tiene alguna dificultad especial que le signifique una pérdida
competitiva? Sí/No.
24. ¿Podría identificarlas en orden de importancia?

10
Encuesta Estadística 1 – Año 2006 – Cátedra (completar)
El objetivo de esta encuesta es obtener una base de datos para el análisis de los mismos durante el dictado
de la materia.
Datos Personales
1. DNI (tres últimos dígitos): (completar)
2. SEXO: Masculino/Femenino
3. EDAD: (completar) años.
4. Peso: (completar) (en kg)
5. Estatura: (completar) cm
6. Ud. vive en:
Casa/Departamento
Vivienda Propia/Alquila/Vivienda Prestada
Vive con Padres/Amigos/Solo/Otro ¿Quién?
9. Lugar de procedencia: Ciudad de Córdoba / Interior de la Pcia. de Córdoba / Otras Provincias / Otros
aíses
10. ¿Cuantas Horas diaria trabaja? No trabaja / Trabaja (completar) hs.
Desempeño académico
11. Su primer año universitario puede calificarse como: Muy Fácil / Fácil / Regular / Difícil / Muy Difícil
12. Cantidad de materias aprobadas
13. Cantidad de aplazos en examen
14. En general las matemáticas son para Ud.: Muy Fácil / Fácil / Regular / Difícil / Muy Difícil
Nota obtenida en el examen final de:
15. Matemática I: 1, 2, 3, 4, 5, 6, 7, 8, 9,10. No Rindió
16. Matemática II: 1, 2, 3, 4, 5, 6, 7, 8, 9,10. No Rindió
17. ¿Cuántas veces al año solicita libros en la biblioteca?
18. Indique el gasto promedio (en pesos) que realiza en:
1- Libros y apuntes (anual)
2- Movilidad (mensual)
19. ¿Cuánto tiempo (en horas) dedica en promedio para preparar un examen de:
1- Área matemática (completar) hs.
2- Área administrativa contable (completar) hs.
20. ¿Cómo se autocalificaría como estudiante universitario? Distinguido / Muy Bueno / Bueno / Regular /
Malo
Hábitos de vida
21. Fuma: Sí/No
22. Qué actividad física realiza:
1- No hace activ. Física
2- Camina y/o corre, cuantas veces por semana: 1, 2, 3, 4, 5, 6, 7. Marcar con un círculo
3- Gimnasia, cuantas veces por semana: 1, 2, 3, 4, 5, 6, 7. Marcar con un círculo
4- Deportes, cuantas veces por semana: 1, 2, 3, 4, 5, 6, 7. Marcar con un círculo
23. Consume bebidas alcohólicas
1- Todos los días
2- Todos los fines de semana
3- Eventualmente en algunas ocasiones
4- Nunca
(Fin de información adicional)

11
En ambos modelos de cuestionarios pueden observarse dos tipos de preguntas:
1) aquellas que se completan con la información solicitada, las que se denominan preguntas abiertas —por
ejemplo la pregunta 24 del primer cuestionario— y
2) preguntas en la que el entrevistado debe seleccionar una o más de las opciones presentadas, las que se
denominan preguntas cerradas. También es conveniente señalar que el cuestionario no debe ser
demasiado largo y que las preguntas deben ser concisas, no ambiguas y preferentemente de tipo cerradas.
Las preguntas abiertas condicionan menos al entrevistado y permite explorar significados pero la desventaja
es que reciben mayor influencia del encuestador, hay más dificultad para codificar las respuestas y se
recaban más respuestas inapropiadas.
Los datos de fuentes secundarias son aquellos que han sido reunidos y publicados por otras instituciones.
En general se trabaja con datos provenientes de organismos públicos o privados tales como INDEC, BCRA,
AFIP, Cámaras empresariales, ONU, FMI, sólo para mencionar algunos, muchos de los cuales, desde hace
algunos años están disponibles en internet.
Los datos de fuentes primarias son los que recopila el propio investigador para resolver un problema
particular. Un instrumento habitual para recoger datos primarios es el cuestionario, en el que se formulan
preguntas respecto a datos personales, opiniones, actitudes, comportamiento y otras características.
(Información adicional)
Algunos organismos importantes con información estadística disponible son:
- Instituto Nacional de Estadísticas y Censos.
- Dirección Nacional de Estadísticas y Censos de la Provincia.
- Comisión Económica para América Latina y el Caribe.
Podrá acceder a los sitios oficiales desde la sección Enlaces de Interés del aula virtual.
De la “Encuesta Permanente de Hogares” se han extraído algunas variables para 100 casos de 1 onda.
Podrá acceder a ella desde la sección Enlaces de Interés → Bases de Datos → EPH.XLS del aula virtual.
(Fin de información adicional)
Actividad 1
En cada uno de los siguientes casos defina la población y clasifique el tipo de estudio de acuerdo a sus
objetivos.
Caso 1.- La Encuesta Permanente de Hogares se realiza dos veces al año en base a una muestra
representativa de hogares de las principales ciudades del país. El objetivo de la misma consiste en describir
la situación del empleo y la comparación de situaciones de desempleo entre ciudades y entre períodos en
los cuales se realiza la encuesta.
Caso 2.- El Departamento de Compras de una fábrica de tractores ha encarado el estudio de la duración de
las baterías que compra a 3 proveedores con el fin de mejorar la calidad de sus productos en base a un plan
de calidad total. Para ello solicita una muestra de 10 baterías a cada uno de los proveedores, cuidando que
todas las baterías tengan exactamente las mismas características de funcionamiento.
Las baterías son llevadas al Departamento de Investigación y Desarrollo de la fábrica donde se han
implementado una serie de tests de durabilidad apropiada. Todas las baterías son sometidas a los mismos
tests bajo las mismas condiciones (calor, humedad, personal encargado de efectuar las mediciones, etc.). Al
finalizar se anota una cierta medida de durabilidad que luego será comparada entre los 3 proveedores para
ver si hay alguno de ellos que se diferencia realmente en cuanto a la calidad de las baterías.
Caso 3.- Una Oficina de Salud desea efectuar un estudio de la tasa de mortalidad asociada a la causa del
fallecimiento. Para ello utiliza los certificados de defunción otorgados en distintas municipalidades. El
objetivo del estudio consiste en tomar acciones preventivas para disminuir el riesgo de determinadas
enfermedades.

12
Caso 4.- La encuesta industrial se realiza en forma trimestral en el Instituto de Estadística de la Facultad
con el objetivo de evaluar la marcha de la industria cordobesa a través de la opinión de los empresarios.
Para ellos se toma una muestra de firmas seleccionadas al azar, teniendo en cuenta el tamaño de las
mismas medido por la cantidad de empleados. Luego de analizar los datos se publican tablas mostrando los
porcentajes correspondientes a las opiniones de las empresas encuestadas.
Caso 5.- A los efectos de indagar el sistema de evaluación de los empleados de las empresas familiares de
la Ciudad de Córdoba un investigador seleccionará discrecionalmente 10 empresas que difieren en tamaño
y tipo de actividad de un total de 300 empresas. En las que realizara entrevistas en profundidad a directivos
y empleados.
5.3. Tipos de variables
En estadística, cada una de las características a estudiar se denomina variable, la cual admite diversas
respuestas para las unidades estadísticas. A su vez, la realización de una respuesta particular constituye un
dato.
En el ejemplo Encuesta a alumnos, para las variables sexo, cantidad de materias aprobadas y gastos en
libros, los datos de un alumno en particular son:
Sexo: Mujer
Cantidad de materias aprobadas: 3
Gasto en libros: $147
En el estudio de las industrias, donde se miden las variables actividad, cantidad de personal, monto de
ventas anuales y si es exportadora, para una empresa particular se obtuvieron los siguientes datos:
Actividad: Industria Alimenticia
Cantidad de personal: 50
Monto de ventas anuales: $8.000.000
Exporta: Sí
Clasificación de las variables
Las variables se clasifican en:
(Información adicional)
Esquema.
Variables:
1. Numéricas
1.1. Discretas
1.2. Continuas
2. Categóricas
(Fin de información adicional)
Cuando la pregunta admite como respuesta un número, se trata de una variable cuantitativa o numérica.
A su vez, si los valores que asume la variable surgen de un conteo o de una enumeración, la variable es
numérica discreta, como por ejemplo “cantidad de materias aprobadas” (números enteros). En cambio si
se obtienen datos a través de un sistema de medición, la variable es continua ya que asumiría valores en
un intervalo (números reales). En el relevamiento a los alumnos, el “gasto en libros” y la “estatura”
constituyen ejemplos de este tipo de variables.

13
Cuando la variable no admite una respuesta numérica, sino que la unidad de análisis se asigna a una clase
o categoría la variable es cualitativa o categórica. Ejemplos de variables cualitativas son: sexo, lugar de
procedencia, nivel de educación de los padres, el motivo por el cual necesita financiación para exportar.
Cómo se miden las variables
La medición de una variable (o característica de estudio) es el proceso de asignar números u otros símbolos
a los elementos. La regla por la cual se asignan los números o símbolos constituye una escala de
medición, y cada escala cuenta con propiedades que las distinguen.
La escala de medición es nominal cuando los elementos se asignan a categorías preestablecidas. La
propiedad que la caracteriza es categorizar o dar categorías, por ejemplo en la variable procedencia se
definieron las categorías: Ciudad de Córdoba, Interior de la Pcia de Córdoba, Otras provincias, Otros
países; a las que se les asignaron números de 1 a 4. Estos números sólo tienen el valor de dar un código a
cada categoría, la elección es arbitraria ya que podríamos haberle dado cualquier otro valor o cambiar el
orden de la codificación.
Por ejemplo:
Tabla
1- Otros países 10- Otros países
2- Interior de la Provincia de Cba. 20- Interior de la Provincia de Cba.
3- Otras Provincias 30- Otras Provincias
4- Ciudad de Córdoba 40- Ciudad de Córdoba
Las categorías a las que se asignan las unidades de observación se expresan por palabras y son
mutuamente excluyentes y exhaustivas. El concepto mutuamente excluyente significa que si un elemento
pertenece a una categoría no puede pertenecer a la vez a otra categoría de la variable. Exhaustiva significa
que todos los elementos de la población o muestra deben ser clasificados en una categoría. Las variables
sexo y el motivo por el cual necesita financiación para exportar, son también ejemplos de variables
categóricas medidas en escala nominal. En el caso particular en el que las variables presentan sólo dos
categorías se denominan variables dicotómicas.
La escala es ordinal cuando las respuestas están dispuestas en un cierto orden, al asignarle números se
utiliza la propiedad de orden, como por ejemplo el nivel de educación de los padres. También aquí las
categorías deben ser mutuamente excluyentes y exhaustivas.
Otro ejemplo es la variable Su primer año universitario puede calificarse como:
1. Muy Fácil
2. Fácil
3. Regular
4. Difícil
5. Muy Difícil
Las escalas de intervalo y de razón que veremos a continuación sólo pueden ser utilizadas con variables
numéricas.

14
La Escala de Intervalo, agrega a la propiedad de orden, la de igualdad de diferencias dada por distancias o
intervalos iguales. No sólo permite conocer cuál es el valor más grande sino cuantificar en cuánto es más
grande, por lo que representa, matemáticamente hablando, un nivel de medición más preciso que las
anteriores. En esta clase de medida, la proporción de dos intervalos cualesquiera es independiente de la
unidad de medida y del punto cero. Un ejemplo típico es la medición de la temperatura en la que se utilizan
básicamente dos escalas, Celsius y Fahrenheit, en ambas el valor cero es diferente, es un valor arbitrario
definido por una convención determinada. Cuando medimos la temperatura en grados Celsius podemos
afirmar que entre 40º y 20º hay 20 grados de diferencia pero no podemos decir que 40º es el doble de calor
que 20º porque el punto cero de referencia tiene distinto significado en cada escala.
Sin embargo en la mayoría de las mediciones con escala numérica, se define un punto cero real en su
origen, lo que define una escala de razón. Los ejemplos de variables numéricas planteados están dados
en escala de razón: cantidad de materias aprobadas, gastos en libros y estatura. Son variables donde el
cero indica nulidad o ausencia de los que se estudia. Para las materias aprobadas, 0 indica que no ha
aprobado ninguna.
Esta escala además de la distinción de orden y distancia, permite establecer en qué proporción es mayor un
valor de la variable que otro.
(Información adicional)
Glosario
La distinción entre escalas de intervalos y razón es muy sutil, incluso pocas veces nos encontramos con
ejemplos de escalas de intervalos, por lo que este material se trabajará con escalas de razón.
(Fin de información adicional)
Por ejemplo, si los alumnos A y B tienen 4 y 6 materias aprobadas respectivamente, podemos afirmar que
B tiene dos materias aprobadas más que A, o que tiene el 50% más de materias aprobadas.
En el cuadro siguiente se resumen los tipos de variable y sus posibles niveles de medición, en el que se
observa que las variables numéricas son las que permiten elegir distintos niveles de medición.
Por ejemplo, el nivel de ingresos de los jefes de hogar puede obtenerse en una escala numérica (escala de
razón) como Ingresos obtenidos en pesos en el último mes.
Sin embargo, puede el nivel de ingresos organizarse como categorías, definiendo por ejemplo tres
categorías, a saber: ingresos bajos (de 0 a 5000$), ingresos medios (de 5000 a 15000$) e ingresos altos
(más de 15000$). En este último caso hemos modificado la escala pasando de una escala de razón a una
escala ordinal, limitando las posibilidades de análisis de los datos.
Esta limitación puede ser definida en pos a una respuesta más confiable, sabiendo que la información
sobre ingresos no siempre es dada en forma fidedigna por prejuicios de índole social o impositivo, los que
se evitan definiendo intervalos de ingresos en la pregunta.
Tabla.
TIPO DE VARIABLE NIVEL DE MEDICIÓN SENTIDO EN QUE SE PUEDEN
MODIFICAR LAS ESCALAS
Categórica Nominal
Ordinal
Numérica De intervalos
(discreta y continua) De razón
Es muy importante la elección de la escala porque el análisis estadístico difiere según el tipo de variable y la
escala utilizada.
Actividad 2:
1- Determine si cada una de las siguientes variables es categórica (cualitativa) o numérica (cuantitativa), ysi
es numérica indique si es discreta o continua.
a) Cantidad de personas que habitan por vivienda.
b) Tipo de vivienda.
c) Cantidad de habitaciones.
d) Cantidad de dormitorios.
e) Ingreso total de las personas que habitan la vivienda.
f) Gasto en bienes duraderos por semestre.
g) Si tiene línea telefónica
h) Gasto en bienes de consumo por mes.

15
2- De la clasificación anterior identifique una variable dicotómica y una variable con escala nominal.
3- Modifique una variable con escala numérica a una escala ordinal.
5.4. Organización y presentación de datos estadísticos
Una vez que disponemos de los datos los organizamos en una tabla donde en las columnas definimos las
variables y en las filas cada individuo A esta tabla la denominamos base de datos
Actualmente la disponibilidad de datos en soporte electrónico, permite trabajar los mismos desde programas
informáticos orientados especialmente para la organización y análisis de datos. Existe una gran oferta de
estos programas dentro de los cuales hemos seleccionado Infostat. El diseño de Infostat es similar al de
otros softwares estadísticos, lo que brinda al usuario la posibilidad de adaptarse de manera relativamente
fácil, y además cuenta con un manual de ayuda al que se puede acceder seleccionando la opción
MANUAL en el menú AYUDA.
(Información adicional)
Infostat
Este software ha sido diseñado en la Universidad de Córdoba desde la Facultad de Ciencias Agropecuarias.
Existe una versión libre disponible su página web. Usted puede solicitar una clave gratuita ingresando por
“Clave gratuita para versión estudiantil”.
Para una introducción más detallada del uso del software puede consultar la “Guía de introducción al uso
del software estadístico InfoStat” disponible en la sección Enlaces de Interés del Aula Virtual.
(Fin de información adicional)
Aspectos generales del software
Al abrir InfoStat, se visualizará una barra de herramientas localizada en la parte superior de la ventana del
programa, la que contiene los siguientes menús: Archivo, Edición, Datos, Resultados, Estadísticas, Gráficos,
Ventanas, Aplicaciones y Ayuda. Los softwares estadísticos en general permiten crear una base de datos o
leer una base de datos generada por otro programa (excel, acces, o algún programa estadístico). En Infostat
podemos abrir una base de datos en formato del programa (extensión idb) o desde otros formatos como
Excel, veamos a continuación como abrimos la base “alumnos.xls” (disponible en la sección Materiales y
Recursos del aula virtual).
Veamos cómo hacemos con Infostat
Al ingresar al programa Infostat, seleccione del menú ARCHIVO → NUEVA TABLA y se presentará una
“Nueva Tabla” en blanco donde podrá cargar los datos relevados a los efectos de conformar la base de
datos deseada.
A continuación se muestra la tabla de Infostat con la información de las respuestas de los siete primeros
alumnos de la encuesta.

Imagen
Para abrir una base de datos elaborada con otro aplicativo seleccione menú
ARCHIVO → ABRIR y en el recuadro que se despliega busque el archivo y marque la opción ABRIR.
El programa permite tener abiertas varias bases de datos (tablas) simultáneamente, las que pueden
desactivarse con la opción ARCHIVO → CERRAR.

16
Las bases pueden guardarse en formato InfoStat (con extensión .idb - InfoStat Data Base) correspondiente
al Infostat con Menú ARCHIVO → GUARDAR TABLA. Otra posibilidad es guardar la tabla con otro formato
(EXCEL, texto, DBASE, Paradox) usando la opción GUARDAR TABLA COMO.
Una vez que disponemos de una base de datos es posible realizar modificaciones en la misma.
El menú DATOS tiene una serie de opciones para definir el tipo de datos y realizar algunas acciones sobre
las filas (datos) o columnas (variables) de la tabla.
Una vez construida la base debemos realizar un análisis de consistencia de los datos y depurarla, para lo
cual podemos ayudarnos con la representación de las variables en tablas y gráficos. Este resumen o
representación depende del tipo de variable considerada, y permite realizar un primer análisis de éstas. En
las secciones siguientes trabajaremos con cada tipo de variable en particular, a fin de poder organizar y
presentar los datos.
El resumen y la presentación de datos a través de tablas y gráficos, permite mostrar la información de un
conjunto de datos a una forma más simple, de tal manera que facilita a quien los lee tener una idea general
de su comportamiento, es decir de la forma en que están distribuidos.
Otro aspecto que consideraremos es si el análisis es para una variable, lo que en estadística se denomina
análisis unidimensional o si se analizan dos o más variables conjuntamente (análisis bidimensional o
multidimensional. En esta asignatura, veremos los dos primeros tipos (unidimensional y bidimensional),
apuntando en este capítulo, a la forma en que habitualmente se presentan los datos.
5.4.1. Distribuciones Unidimensionales
Comenzaremos con el análisis de las variables categóricas, para continuar luego con numéricas discretas y
continuas.
En la sección anterior mostramos que en una base de datos cada fila corresponde a una unidad de análisis
y cada columna a una variable. Si tomamos una columna en particular, la misma constituye lo que en
estadística se llama una serie simple, la que muestra cada una de las observaciones en el orden en que
fueron recopiladas. A partir de esos datos elaboraremos distribuciones de frecuencias.
Variables Categóricas
Para armar una tabla resumen de este tipo de variables, contamos la cantidad de casos que pertenecen a
cada clase o categoría, lo que se denomina frecuencia absoluta y calculamos la proporción de casos en
cada una de ellas, lo que se denomina frecuencia relativa, las que pueden expresarse en porcentajes. Con
estas frecuencias, se puede construir una tabla de tres columnas, donde en la primera se anotarán las
categorías y en las otras dos, la cantidad y el porcentaje de observaciones.
Para la variable Sector de la Economía al que pertenecen 148 industrias, cuyas categorías están
expresadas en escala nominal, las frecuencias se presentan en la Tabla 1.1.
(Información adicional)
Los ejemplos se ilustrarán con las variables de la base de industrias cordobesas (industrias.xls) y se
indicarán los comandos del programa estadístico Infostat. Podrá acceder a este archivo en la sección
Enlaces de Interés del aula virtual.
Glosario:
Frecuencia absoluta: es el número de casos que se repite cada categoría de la variable.
Frecuencia relativa: es la proporción de casos que se repite cada categoría de la variable.
(Fin de información adicional)
InfoStat. Posicionados al inicio de la variabla Sector, para categorizarla:
DATOS → CATEGORIZAR → ASIGNAR CATEGORIAS SEGÚN CODIGO DE VALORES
Asignamos los códigos según las referencias, se genera una nueva variable Cat_sector con los nombres de
las categorías.
Para construir la tabla de frecuencias ESTADISTICAS → TABLA DE FRECUENCIA.
En la solapa VARIABLES seleccionar la variable Cat_sector (para seleccionar una variable marcar la
variable y con la flecha pasarla al cuadro de la derecha).

17
En la ventana TABLA DE FRECUENCIAS marcar FA y FR para obtener una tabla con las frecuencias
absolutas y relativas, que se presenta en una nueva ventana de Resultados
Tablas de frecuencias
Variable Clase FA FR
Cat_sector 1 49 0,33
Cat_sector 2 36 0,24
Cat_sector 3 50 0,34
Cat_sector 4 13 0,09
Los resultados obtenidos son presentados en la tabla1.1
Tabla 1.1 Sector de la economía
SECTOR DE LA ECONOMÍA FRECUENCIA ABSOLUTA PORCENTAJE
De Origen Agropecuario 49 33,1
Productos no metálicos 36 24,31
Productos metálicos 50 33,8
Otras Industrias 13 8,8
Total 148 100,0
Observando las frecuencias absolutas y porcentajes, podemos concluir que de 148 empresas encuestadas,
49 pertenecen al sector industrial de origen agropecuario, lo que representa el 33,1% del total; 36 al sector
de productos no metálicos (24,3%), 50 industrias que fabrican productos metálicos (33,8%) y el resto a
Otras actividades industriales (8,8%).
Esta información puede representarse gráficamente. Los gráficos no agregan información pero se emplean
para tener una representación visual de la totalidad de la misma, presentando los datos de tal modo que se
pueda percibir fácilmente los hechos esenciales y compararlos con otros. En el caso de variables
categóricas, utilizamos el Diagrama Circular y el Gráfico de Barras.
En el Diagrama Circular (Gráfico 1.1) se representa en el círculo el 100% de las empresas encuestadas y
las porciones o divisiones se hacen en función a los tipos de empresas según las frecuencias ya indicadas.
Puede utilizarse también el gráfico de barras (Gráfico 1.2), donde cada una de ellas representa una
categoría (en el ejemplo, un sector de la economía) y la altura de cada barra, la frecuencia correspondiente.
InfoStat. Para graficar la variable Cat_sector
GRÁFICOS → GRÁFICOS DE SECTORES
Para realizar un gráfico de sectores, por ejemplo, indicar la variable que va a graficar y especificar que las
categorías están en filas. Luego, junto con el gráfico emerge la ventana HERRAMIENTAS GRÁFICAS que
permite modificar el color, título, etc.
Gráfico 1.1.
Sector de la economía

Imagen

1
49/148 x100
18
Es válido también representar la distribución de frecuencias de la variable Sexo con un gráfico de barras
Gráficos → Gráfico de barras.
A continuación se elige en variable a graficar: "Caso" y en variable de clasificación: Cat_Sector. Luego de
aceptar se elige “Frecuencias absolutas” o “Frecuencias relativas” según lo que se desee graficar.
Gráfico 1.2.
Sector de la economía
Sector de la Economía

51,9
Caso: frecuencia absoluta

41,7

31,5

21,3

11,2
Agropecuario No metálicos Metálicos Otras
Cat_sector
Imagen
Del análisis de la tabla y los gráficos podemos decir que en esta muestra, las empresas del sector industrial
de productos metálicos y del sector de origen agropecuario poseen participación similar en el total, siendo
los dos grupos más representativos, le siguen en importancia las industrias de productos no metálicos. Otra
variable categórica relevada en escala ordinal fue la opinión de las empresas acerca de “la suficiencia de la
oferta de mano de obra calificada”. Las respuestas se agruparon en cuatro categorías, según se presenta
en la Tabla 1.2.
Tabla 1.2. Suficiencia de la Oferta de Mano de Obra Calificada
SUFICIENCIA DE LA FRECUENCIA PORCENTAJE FRECUENCIA PORCENTAJE
OFERTA DE MANO DE ABSOLUTA ABSOLUTA ACUM.
OBRA CALIFICADA ACUM.
Suficiente 50 33,8 50 33,8
Medianamente suficiente 42 28,4 92 62,2
Escasamente suficiente 39 26,4 131 88,52
Insuficiente 17 11,5 148 100,0
Total 148 100,0
La escala es ordinal, ya que las categorías indican un cierto orden en relación al nivel de suficiencia
manifestado por las empresas. Cuando la variable es categórica ordinal se pueden obtener las frecuencias
absolutas o relativas acumuladas, si lo que queremos saber es la cantidad o proporción de elementos
hasta cierta categoría en particular. En el gráfico 1.3 se representa a la variable categórica analizada.

2
131/148 x100
19
Gráfico 1.3.
Oferta de Mano de Obra Calificada

Imagen
El Gráfico 1.3, fue realizado con la planilla de cálculo MS Excel. La tabla que se obtiene como resultado en
Infostat se puede copiar a una planilla Excel y desde el menú INSERTAR → GRÁFICOS, seleccionar el
gráfico que se quiera utilizar.
Actividad 3
El gerente de una empresa desea conocer la distribución de empleados de acuerdo a su nivel de instrucción
máximo alcanzado. Una vez recolectada la información realizó un resumen de los datos, obteniendo la
siguiente tabla de distribución de frecuencias:
Tabla.
NIVEL DE INSTRUCCIÓN FRECUENCIA ABSOLUTA FRECUENCIA RELATIVA
Primario 48
Secundario 36
Terciario 15
Universitario 5
No sabe / no contesta 2
Total 106
a) Identifique la variable de estudio y a qué tipo pertenece.
b) Complete el cuadro calculando las frecuencias relativas para cada categoría.
c) Represente las frecuencias por medio de un gráfico.
Variables numéricas
En primer lugar analizaremos las variables numéricas discretas, que son aquellas que provienen de un
proceso de conteo y que estarán representadas con números enteros. Los valores que asume la variable en
las n mediciones, a los que hemos llamado serie simple, pueden denotarse x1, x2,..., xn, en general xi para
i=1,2,...,n donde el subíndice i indica el orden en que se efectuaron las mediciones.
Para resumir la información, construiremos la tabla de distribución de frecuencias de manera análoga a
como lo hicimos para las variables categóricas. En la primera columna de la tabla se enumerarán los k
valores distintos de la variable, que se denotan con xi para i= 1,2,...,k, donde x1 es el mínimo y xk es el
máximo valor que asume. Observe que el número de distintos valores (k) que asume la variable es siempre
menor o a lo sumo igual al número de observaciones (n).
Para una mejor comprensión de la tabla de frecuencias consideremos el siguiente ejemplo referido al bloque
de indicadores de innovación tecnológica. En el mismo se relevó la cantidad de empleados que realizan
actividad de diseño e ingeniería industrial en cada una de las firmas de la muestra que tienen desarrollada
esta área de innovación tecnológica y se obtuvo una variable que asume valores entre 1 y 6. En las
columnas 2 y 3 de la Tabla 2.3 3 se presentan las frecuencias absolutas y relativas simples denotadas como
ni y hi, respectivamente y en las dos restantes las acumuladas: absoluta (Ni) y relativa (Hi). Como se señaló
antes, las frecuencias relativas simples y acumuladas, pueden expresarse porcentualmente.

3
Error es tabla 1.3
20
(Información adicional)
Para reflexionar
¿En qué situación la cantidad de valores distintos de la variable es igual al número de observaciones?
(Fin de información adicional)
InfoStat.
Para la variable personal_diseño definirla como un valor entero desde
DATOS → TIPO DE DATOS → Entero
Luego pedir una tabla de frecuencia
ESTADISTICAS → TABLA DE FRECUENCIA
En la solapa VARIABLES elegir personal_diseño, en la ventana TABLA DE FRECUENCIAS y marcar, FA,
FR, FAA y FRA.
Tabla 1.3. Cantidad de empleados área Diseño e Ingeniería Industrial
EMPLEADOS QUE FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA
REALIZAN LA (NI)4 RELATIVA ABSOLUTA ACUM. RELATIVA ACUM.
ACTIVIDAD (HI)5 (Ni) (Hi)
Xi
1 13 0.46 176 0.46
2 7 0.25 20 0.71
3 3 0.11 23 0.82
4 2 0.07 25 0.89
5 2 0.07 27 0.96
6 1 0.04 28 1.00
Total 28 1.00
Observemos que la suma de las frecuencias absolutas es igual al tamaño de la muestra, en tanto que la
suma de las frecuencias relativas es igual a uno.
En símbolos:
k

n i  n, k  n
i 1 N xmax  n
La sumatoria de todas las
frecuencias absolutas en la El valor de la frecuencia
Frecuencias absolutas
columna 2 de la tabla 1.3, da absoluta acumulada
como resultado 28=n, donde asociada al xmax=6, es
n denota el tamaño de la N6=28=n
muestra.
ni
hi  h i 1 H xmax  1
n i

Frecuencias relativas La sumatoria de todas las El valor de la frecuencia


frecuencias relativas en la relativa acumulada
columna 3 de la tabla 1.3, da asociada al xmax=6, es
como resultado 1. H6=1
El total de empresas que cuentan con un departamento de diseño e ingeniería industrial son 28 (n=28). De
la lectura de la Tabla 1.3 surge que las empresas que cuentan con un solo empleado afectado al
departamento de diseño e ingeniería industrial (x1=1) son 13 (n1=13), las que representan un 46% (h1=0,46)
del total, mientras que las que tienen 5 empleados o menos son 27 (N5=27) lo que representa una
proporción de 0,96 del total (H5=0.96). Podemos hacer otra lectura diciendo que las empresas con más de 4
empleados en el departamento de diseño son 3, lo cual equivale en porcentaje al 11%.
Para representar gráficamente las frecuencias calculadas en la tabla, utilizamos gráficos cartesianos; en el
eje de las abscisas se marcan los distintos valores que puede asumir la variable y en el eje de las
ordenadas se va a representar la cantidad o porcentaje de observaciones. Las frecuencias simples
(absolutas o relativas) se representan en un gráfico de bastones (Gráfico 1.4.), donde para los distintos

4
Error es ni en minúscula
5
Erro es hi en minúscula
6
Error es 13
21
valores que puede asumir la variable se levanta una ordenada que representa la cantidad o porcentaje de
observaciones.

22
Infostat al igual que muchos software estadísticos no poseen un comando para la construcción de los
gráficos de bastones y escalonados directamente. Veamos una manera de simular estos gráficos con
Infostat. Para graficar las frecuencias absolutas o relativas simple seleccionar GRÁFICOS → GRÁFICOS
DE BARRAS.

Imagen
En la ventana siguiente seleccionar

Imagen
Luego se puede mejorar la edición del grafico cambiando la solapa series el tamaño y en el eje Y los límites
de la escala.

23
Gráfico 1.4.
Cantidad de empleados área Diseño e Ingeniería Industrial (frecuencias absolutas)
14 Gráfico de bastones
13
13
12
11
Caso: frecuencia absoluta

10
9
8
7
7
6
5
4
3
3
2
2
1 1
1
0
2 1 3 6 4 5
personal_diseño
Imagen
Observamos en la tabla y en el gráfico de bastones, que la mayor cantidad de empresas poseen un
empleado en el área de diseño e ingeniería industrial. La máxima cantidad de empleados que se posee en
esa área es de seis. Para las frecuencias acumuladas (absolutas y relativas) se utiliza un gráfico
escalonado (Gráfico 1.5.), donde para cada valor xi se marca la frecuencia acumulada, valor que se
mantiene constante hasta el siguiente donde se produce el próximo escalón.
En Infostat se puede hacer este gráfico DESDE GRÁFICOS → HISTOGRAMA, seleccionar la variable y
desde la solapa series de la ventana de Herramientas gráficas:
- cambiar la cantidad de clases a los distintos valores de la variable
- cambiar a frecuencias acumuladas (puede ser absolutas o relativas)
- destildar cuerpo
Gráfico 1.5.
Cantidad de empleados área Diseño e Ingeniería Industrial (frecuencias absolutas acumuladas)

Diagrama escalonado

30

25
frec. abs. acumulada

20

15

10

0
1 1 2 3 4 5 6 6
personal_diseño
Imagen

24
Dada la naturaleza discreta de la variable, entre los valores 3 y 4, por ejemplo, no asume ningún otro valor;
por lo tanto dentro de ese intervalo la frecuencia será constante (igual a 23) y recién en 4 aumenta a 25 que
se mantendrá hasta el valor 5, y así sucesivamente.
Actividad 4:
La siguiente tabla muestra la cantidad de kioscos que tienen una cierta cantidad de cospeles
STOCK DE COSPELES CANTIDAD DE KIOSCOS
300 3
400 5
500 7
600 6
700 5
800 4
a) Represente gráficamente la distribución de frecuencias relativas (simple y acumuladas).
b) Obtenga todas las conclusiones posibles y responda:
b1) ¿Cuántos kioscos tienen 500 cospeles?
b2) ¿Cuántos kioscos tienen como máximo 500 cospeles?
b3) ¿Qué porcentaje de kioscos tienen 800 cospeles?
b4) ¿Qué porcentaje de kioscos tienen más de 500 cospeles?
Actividad 5:
El gerente de ventas de “La Favorita”, desea lanzar una campaña de promociones para lograr que los
compradores acudan con mayor frecuencia a su negocio. Para obtener información preguntó a 25
consumidores mientras esperaban en la caja para abonar: ¿Cuántas veces concurrió a este negocio en el
último mes? Para un día particular obtuvo las siguientes respuestas:
Tabla
4 5 3 3 1
4 6 5 4 2
6 6 7 1 5
1 2 4 3 2
2 4 7 7 6
Sobre la base de esta información:
a) Organice los datos en una tabla de frecuencias.
b) Grafique convenientemente esta información.
c) Calcule y grafique las frecuencias absolutas acumuladas. ¿Cómo se denomina este gráfico?
En el caso de variables numéricas continuas donde es necesario agrupar los datos en intervalos. Cabe
aclarar que cuando la variable es discreta pero asume muchos valores distintos puede también presentarse
por una distribución por intervalos. Como ejemplo de este tipo de variables analizaremos el “porcentaje que
representan los costos laborales en los costos totales de la empresa”, incluida en la sección Personal
Ocupado del cuestionario.

25
Previo a la confección de la tabla por intervalos, podemos realizar una primera exploración de este tipo de
datos, utilizando el diagrama de tallo y hojas, que constituye una variante de la distribución de frecuencias.
Este diagrama divide a las observaciones en “dígitos primarios y dígitos derivados”. Por ejemplo, si las
observaciones de los datos tuvieran a lo sumo dos dígitos, la columna de las decenas sería el dígito
primario y la columna restante sería el dígito derivado. Si las observaciones fueran de tres dígitos, el dígito
primario estaría formado por las centenas y las decenas, y el dígito derivado por las unidades. Cuando los
datos estén formados por más de tres dígitos lo conveniente es cambiar la escala de medida. Los dígitos
primarios de los datos se denominan “tallo”; y los dígitos derivados (unidades) se denominan “hojas”. La
unidad de hoja se refiere a la escala que se utiliza para presentar los datos en el diagrama.
Para una mejor comprensión de este diagrama veremos cómo se representa en éste la variable a analizar.
Los valores de la variable Porcentaje de Costo Laboral son los siguientes:
Tabla
50 45 30 7 10 50 30 30 50 39
40 50 8 25 49 25 50 38 50 10
30 25 5 7 40 26 20 30 25 40
40 40 25 40 66 25 38 21 40 33
33 30 78 15 5 10 38 40 10 66
8 30 18 20 50 35 7 20 36 30
30 20 30 20 40 15 25 35 26
25 60 40 10 25 38 32 30 40
28 40 40 22 52 40 40 8 6
25 50 50 30 35 19 25 47 15
25 60 35 10 18 25 23 29 20
20 50 50 3 10 20 15,3 20 55
45 20 17 30 30 35 17 45 40
13 15 20 30 35 40 20 50 20
40 35 50 10 25 25 50 35 35
Representaremos la variable costos laborales en este tipo de diagrama (Gráfico 1.6.). El gráfico ha sido
construido con el software estadístico SPSS ya que INFOSTAT no lo hace.
Gráfico 1.6.
Diagrama de Tallo y hoja de Porcentaje de Costo Laboral
leaf unit: 1
n: 141
0 | 3556777888
1 | 0000000035555577889
2 | 00000000000001235555555555555556689
3 | 000000000000000233555555555688889
4 | 00000000000000000055579
5 | 0000000000000025
6 | 0066
7|8
A través de éste gráfico podemos observar el comportamiento de la variable, donde representamos en el
tallo el primer dígito del valor observado y en las hojas o ramificaciones el segundo dígito, lo cual nos da una
idea de la concentración de los valores más frecuentes, los valores menores y los más grandes.

26
En este conjunto de datos los valores más frecuentes (35 en total) están comprendidos entre el 20% y el
29% de los costos laborales, siendo los valores mínimo y máximo el 3% y el 78%, respectivamente.
Actividad 6:
El siguiente ejemplo muestra la distribución de edades de 100 personas. El diagrama de tallo y hojas fue
realizado empleando el programa SPSS (10.0).
EDAD - Diagrama de tallo y hojas (“Stem-and-Leaf Plot”).
Tabla
Frecuencia Tallo y hojas
7.00 1-8889999
16.00 2-0001111222334444
12.00 2-56666678999
10.00 3-0122223344
12.00 3-555677888899
15.00 4-001112223333344
10.00 4-5667778899
6.00 5-011224
8.00 5-55578889
1.00 6-4
3.00 6-789
Analice la distribución de edades
Tabla de frecuencias por intervalos
Para construir una tabla de distribución de frecuencias por intervalos, debemos seguir los siguientes pasos:
1) decidir la cantidad de intervalos de clase apropiados;
2) obtener la amplitud de los mismos;
3) establecer una regla general para definir los límites del intervalo de cada clase.
1) Decidir la cantidad de intervalos de clase apropiados (k): si bien depende de la cantidad de
observaciones con las que se cuenta, se recomienda establecer no menos de 5 intervalos y no más de 20.
Si fueran muy pocas clases, los intervalos podrían ser muy grandes, es decir cada intervalo abarcaría
demasiada cantidad de observaciones para permitir detectar la tendencia de los datos. Por otra parte, tener
demasiados intervalos se contradice con el propósito que se persigue que es resumir un conjunto grande de
datos, para facilitar el análisis o la toma de decisiones. Continuando con el tratamiento de la variable
“porcentaje de costo laboral” y dado que posee 141 observaciones, 7 intervalos serán más que suficientes
(con la fórmula automática de Infostat resulta 7,21, por esta razón tomamos 7 intervalos).
2) Obtener la amplitud de los intervalos de clase (c): una opción que se usa frecuentemente es que todos
los intervalos sean de igual amplitud, lo cual facilita la interpretación. Ese valor c se obtiene calculando la
diferencia entre el valor más grande del conjunto de datos (valor máximo) y el más pequeño (valor mínimo)
dividiendo luego esta diferencia entre el número de clases elegido. El desvío del numerador es lo que se
conoce como Recorrido o Rango (R).
3) c = R (sobre) k = valor máximo – valor mínimo (sobre) k
Donde:
c: amplitud de cada intervalo.
R: recorrido o rango de variación de la variable.
k: cantidad de intervalos elegidos.
Para el ejemplo:
c = 78 – 3 (sobre) 7 = 10,714 ≈ 11
c’ = 11
donde: c’ es la amplitud definida

27
Por conveniencia y facilidad de lectura se deberá siempre redondear el valor c por exceso, ya que al
multiplicar la amplitud definida (c’= 11) por la cantidad de intervalos, da como resultado un nuevo recorrido
(R’) ligeramente superior al original, de tal manera que aquel incluya los dos extremos de este último. Se
repartirá para finalizarla diferencia entre el Nuevo Recorrido y el original (R’- R) por defecto y exceso.
R’ – R = 77 – 75 = 2 (1 por defecto / 1 por excesso)
Entonces el valor mínimo definido será:
R’ – R = 3 – 1 = 2
Para construir los intervalos de clase al valor mínimo definido se le sumará la amplitud definida (c’) hasta
conformar los 7 intervalos, de la siguiente forma:
Tabla.
y’i-1 - y’i
2 ; 13
13 ; 24
24 ; 35
35 ; 46
46 ; 57
57 ; 68
68 ; 79
(Información adicional)
Para reflexionar
Si el recorrido teórico y original coinciden la diferencia entre ellos es cero. Para que todos los valores de la
variable queden representados en un intervalo el primero o el último, debe ser cerrado.
(Fin de información adicional)
4) Establecer una regla general para definir los límites del intervalo de cada clase: para evitar el doble
conteo de las observaciones. Los intervalos serán semiabiertos, pueden ser abiertos por derecha o por
izquierda. Por ejemplo, en la primera alternativa los intervalos son: “[ )” cerrados por la izquierda y abiertos
por la derecha, lo que significa que se incluirá dentro del intervalo un valor que sea igual al límite inferior;
mientras que un valor exactamente igual al límite superior del intervalo, será incluido en el intervalo
siguiente. Así el valor 35, para este caso, se computará dentro del cuarto intervalo.
La principal desventaja de este tipo de tabla resumen es que no se puede saber cómo se distribuyen los
valores individuales dentro de cada intervalo de clase ya que cada uno puede representarse por un punto
medio o marca de clase que se obtiene como el promedio simple entre los límites de cada intervalo de
clase, es decir, yi =(y’i-1+y’i)/2

28
Para el ejemplo, la primera marca de clase se obtiene como: y1=(y’0+y’1)/2=(2+13)/2=7,5

Si se desea obtener una distribución de frecuencias absolutas, una vez construidos los intervalos se deberá
contar la cantidad de valores que se incluyen dentro de cada uno y así quedará conformada. Para obtener el
resto de las distribuciones se debe proceder de manera similar a cuando se trabajó con datos discretos.
Seguidamente en la Tabla 1.4 se presentan las distribuciones de frecuencias vistas hasta aquí.
Tabla 1.4. Porcentaje de costo laboral
PORCENTAJE DE FREC. PORCENTAJE FREC. PORCENTAJE
COSTO LABORAL ABSOLUTA Hi ABSOLUTA ACUM. ACUM.
y’i-1 - y’i Ni Ni Hi
2 – 13 18 12,8 18 12,8
13 – 24 27 19,1 45 31,9
24 – 35 37 26,2 82 58,2
35 – 46 36 25,5 118 83,7
46 – 57 18 12,8 136 96,5
57 – 68 4 2,8 140 99,3
68 – 79 1 0,7 141 100,0
141 100,0
InfoStat.
Para lograr una tabla de distribución por intervalos en Infostat debe tildarse la siguiente información: límites
inferiores (LI) y superiores (LS) de los intervalos de clase, marca de clase (MC), frecuencias absolutas (FA),
frecuencias relativas (FR), frecuencias absolutas acumuladas (FAA) y frecuencias relativas acumuladas
(FRA). El número de clases, puede ser obtenido en forma automática o definido por el usuario
(PERSONALIZADO). Para la forma automática InfoStat obtiene el número de clases tomando el log2(n+1)
que da igual a 7 tal como lo hemos construido.
Para ilustrar la posibilidad que da Infostat de calcular los intervalos en forma personalizada, construiremos
una tabla de frecuencia para la variable de cinco intervalos. Para ello, tildando la opción Personalizado,
debe indicarse 5 intervalos, definiendo el mínimo y máximo valor de la variable. Por defecto, Infostat
construye los intervalos cerrados a la derecha, lo que se puede cambiar destildando la opción en el cuadro
de dialogo.
ESTADISTICAS → TABLA DE FRECUENCIA
En la solapa VARIABLES elegir costos lab/costo total, en la ventana TABLA DE FRECUENCIAS marcar, LI,
LS, MC, FA, FR, FAA y FRA. Además indicar NUMERO DE CLASES PERSONALIZADO; en nuestro caso
considerar 5 clases.

29
Imagen
Y se obtiene una tabla como la siguiente:
Tablas de frecuencias
Variable Clase LI LS MC FA FR
costos lab/costo totAL 1 [ 3,00 18,00 ] 10,50 28 0,20
costos lab/costo totAL 2 ( 18,00 33,00 ] 25,50 54 0,38
costos lab/costo totAL 3 ( 33,00 48,00 ] 40,50 37 0,26
costos lab/costo totAL 4 ( 48,00 63,00 ] 55,50 19 0,13
costos lab/costo totAL 5 ( 63,00 78,00 ] 70,50 3 0,02
Los gráficos de las frecuencias absolutas o relativas simples para distribuciones por intervalos son
gráficos de superficie llamados histogramas. El histograma (Gráfico 1.7.a), es uno de los medios gráficos de
más fácil interpretación, está formado por rectángulos o barras que se levantan desde el eje de las abscisas
donde se han marcado previamente, en una escala numérica, los límites de cada intervalo de clase. La
altura de cada una de las barras, que se registra en el eje de las ordenadas, se determina de manera tal que
su área sea proporcional a la frecuencia de cada clase, pudiendo representarse tanto las frecuencias
absolutas como las relativas o porcentajes cuando los intervalos son de la misma amplitud.
(Información adicional)
Glosario
Densidad de frecuencia es el cociente entre las frecuencias absolutas y la amplitud del intervalo ni / ci
(Fin de información adicional)
Cuando los intervalos son de distinta amplitud, la altura de cada barra se obtendrá como la proporción entre
las frecuencias absolutas y la amplitud del intervalo n i / ci, fracción que se denomina densidad de
frecuencia y será el resultado de esta fracción lo que se marcará sobre el eje de las ordenadas para cada
intervalo.
Es importante señalar dos cuestiones a tener en cuenta:
a) Nunca deben quedar el primer intervalo y el último con frecuencia nula.
b) Generalmente es más útil presentar los datos en función de las frecuencias relativas, ya que los términos
absolutos pueden variar entre distintas mediciones dependiendo esta variación fundamentalmente de la
cantidad de observaciones, es decir, la proporción entre los intervalos tiene mayor permanencia.
Si suavizamos los extremos de cada intervalo, el histograma se transforma en un polígono de frecuencias
(Gráfico 1.7.b), que representa la forma tradicional de graficar un conjunto de datos de escalas medibles.
El histograma y el polígono de frecuencias tienen la misma superficie, ya que cada porción de la superficie
(triángulo) del histograma que se pierde en un extremo del intervalo de clase, se gana en el otro extremo del
mismo, lo que se puede visualizar en el Gráfico 1.7 c en el que se ha superpuesto un polígono al
histograma. En ambos gráficos el área total para la distribución de frecuencia relativa es 1 y para la
frecuencia en porcentaje es 100%.

30
Igual que la tabla de distribución de frecuencias, estos gráficos nos permiten observar que entre 24 y 35 %
se encuentra la mayor cantidad de empresas.
La representación gráfica de las frecuencias acumuladas cuando la variable en cuestión es numérica
continua, es la Ojiva (Gráfico 1.8), que es un gráfico lineal y se utiliza cuando se desea aproximar cuántas o
qué porcentaje de las observaciones están por encima o por debajo de ciertos valores clave.
Una distribución de frecuencias acumuladas en base menor (mayor) indica cuántas observaciones de la
distribución tienen un valor menor (mayor o igual) que el límite superior (inferior) de cada clase.
Mediante la ojiva en base menor se puede aproximar por ejemplo que el 50% de las empresas poseen
porcentajes de costos laborales menores al 32%, o bien interpolando en sentido inverso: el porcentaje de
empresas que tienen un porcentaje de costo laboral menor al 40% es aproximadamente el 70%. Este tipo
de gráfico resulta interesante al querer comparar dos ó más distribuciones.
(Información adicional)
Para construir un polígono de frecuencias se marcan los puntos medios o marcas de clase de cada
intervalo sobre el eje de las abscisas, agregando en los extremos (por defecto y por exceso) dos nuevos
intervalos con frecuencia cero. La frecuencia de cada clase se representa en el eje de las ordenadas.
Uniendo luego los puntos de coordenadas que surgen de la intersección de la frecuencia de clase y el punto
medio obtendremos el polígono de frecuencias.
Los dos nuevos intervalos agregados en los extremos son para cerrar el gráfico en el eje horizontal.
Para construir una ojiva, la variable se marca sobre el eje de las abscisas y las frecuencias acumuladas
sobre el eje de las ordenadas. Los puntos de coordenadas estarán dados por el límite inferior de cada
intervalo de clase y la frecuencia acumulada hasta el intervalo anterior.
Para el último intervalo se marcará también el límite superior del mismo y la frecuencia acumulada total.
Luego, para obtener la curva de ojiva se conectan estos puntos por líneas rectas.
(Fin de información adicional)
InfoStat.
GRÁFICOS → HISTOGRAMA.
Al construir un histograma, la ventana HERRAMIENTAS GRÁFICAS muestra un cuadro de diálogo que
permite modificar los atributos del histograma obtenido. En la solapa SERIES de esta ventana hay un menú
de opciones de histograma que permite cambiar el número de clases (Clases) que por defecto son
calculadas como Log2(n+1). Además la ventana permite elegir la frecuencia representada en el histograma
(Frec.). Las frecuencias a graficar pueden ser: frecuencia relativa (Frec. rel) que es la opción por defecto,
frecuencia absoluta (Frec. abs.), frecuencia absoluta acumulada (Frec.abs. acum.) y frecuencia relativa
acumulada (Frec. rel. acum.). El campo Bordes permite eliminar los contornos de las barras que forman el
histograma. Se puede construir el polígono de frecuencia activando el campo Polígono. El campo Cuerpo
permite eliminar el histograma de fondo a partir del cual se dibujó el polígono. Los campos LIPC y LSUC
permiten ingresar los límites inferior y superior para la primera y última clase respectivamente. Para lograr
que los “ticks” se correspondan con las marcas de clase de cada intervalo activar M. clases en la solapa
Series.
En el siguiente gráfico se eligieron frecuencias absolutas, 7 clases y polígono de frecuencias.
Gráfico 1.7. Porcentaje de Costo Laboral

Imagen

31
(a) InfoStat. Para graficar las frecuencias acumuladas se debe elegir GRÁFICOS → HISTOGRAMA. En la
solapa SERIES de la ventana HERRAMIENTAS GRÁFICAS, destildar “Bordes” y “Cuerpo”, tildar “Marca
de clases” y “Polígono” y seleccionar “Frecuencias acumuladas” (relativas o absolutas). El gráfico que
resulta es la OJIVA.
Gráfico 1.8. Ojiva de base menor para el de frecuencias acumuladas en porcentaje de Costo Laboral
OJIVA

1,00

0,75
frec. rel. acumulada

0,50

0,25

0,00
-8 3 14 24 35 46 57 67 78 89
costos lab/costo totAL
Imagen.
Interpretación de la forma de los gráficos de frecuencias
Los gráficos de frecuencias pueden presentar distintas formas. Si se analiza cómo se distribuyen las
observaciones entre todos los valores que asume la variable, advertimos que pueden hacerlo de forma
simétrica o asimétrica. En una distribución simétrica (Gráfico 1.9) los datos están concentrados en los
valores centrales, disminuyendo de manera similar hacia ambos lados de la frecuencia máxima, lo que se ve
representada en una Ojiva con forma de S.
En una distribución asimétrica los datos pueden estar más concentrados en los valores menores de la
variables (asimetría derecha o positiva) o en los valores mayores (asimetría izquierda o negativa) (Grafico
1.9 b y c respectivamente). En la asimetría derecha la ojiva presenta una fuerte acumulación de las
observaciones al inicio, y en la izquierda esta acumulación ser presenta al final de la distribución.
Gráfico 1.9. Análisis de la forma de la distribución de los datos
Distribución simétrica

Imagen

32
Distribución asimétrica derecha o positiva

Imagen
Distribución asimétrica izquierda o negativa

Imagen
Actividad 7:
Las ventas diarias (en $) para los últimos 120 días de una compañía de servicios de transporte se
organizaron en la siguiente distribución de frecuencias:
Tabla.
INTERVALO FRECUENCIA FRECUENCIA FRECUENCIA FRECUENCIA
yi-1 - yi ABSOLUTA RELATIVA ABSOLUTA RELATIVA
ACUMULADA ACUMULADA
ni hi
Ni Hi
530 - 730 3
730 - 930 7
930 - 1130 11
1130 - 1330 22
1330 - 1530 40
1530 - 1730 24
1730 - 1930 9
1930 - 2130 4
Total 120

33
Determine:
a) ¿Cuántos días se vendieron entre $1130 y $ 1330?
b) ¿Qué porcentaje de días se registraron ventas de entre $ 1130 y $ 1330?
c) Represente mediante un histograma y un polígono de frecuencias, la información dispuesta en la tabla.
d) Aproximadamente, ¿cuál es el porcentaje de días que tienen como ingreso $ 1730 o más?
e) ¿Podría describir la forma de la distribución?
Actividad 8:
Los precios de venta (en miles de $) de 40 casas de una zona residencial de la ciu dad de Córdoba son los
siguientes:
90 99 78 84 45 124 113 52 49 109
101 107 111 90 105 80 123 125 100 42
56 47 69 50 81 96 73 93 62 57
113 82 115 86 85 104 73 130 84 129
a) Organice los datos en una distribución de frecuencias tomando cinco Intervalos de clase de una amplitud
de $ 18, comenzando con el valor 41.
b) Confeccione los gráficos que correspondan.
c) ¿Cuántas casas cuestan entre $ 77.000 y $ 95.000?
d) ¿Qué porcentaje de casas con un valor entre $ 77.000 y $ 95.000 se venden?
e) ¿Aproximadamente cuál es el porcentaje de las viviendas que se venden en $ 77.000 o más?
5.4.2. Distribuciones Bidimensionales
Para estudiar el comportamiento de dos variables en forma conjunta, como una primera inspección de los
datos, podemos resumir la información en tablas o gráficos según el tipo de variable que estemos
considerando.
Dos variables categóricas
Cuando se analizan dos variables categóricas, se construye una tabla de frecuencias conjunta denominada
tabla de contingencia. En una tabla de contingencia una variable se representa en las filas y otra en las
columnas, por lo tanto la tabla tendrá tantas filas y columnas como las categorías de las variables.
En cada celda de la tabla se representa la frecuencia (absoluta o relativa) asociada al par de categorías que
se intersecan entre la fila y la columna.
Consideremos que queremos analizar conjuntamente si la empresa es exportadora y el Sector de la
Economía al que pertenece. Construiremos una tabla de contingencia (Tabla 1.5.) con las variables Sector
de la economía con tres categorías representadas en las filas, y la variable Exporta, con dos posibilidades Si
o No en las columnas.

(b)

34
Tabla 1.5. Tabla de contingencia Sector de la economía y Exporta
SECTOR DE LA ECONOMÍA EXPORTA EXPORTA TOTAL
Si No
De Origen Agropecuario 10 39 49
Productos no metálicos 6 30 36
Productos metálicos 13 37 50
Otras Industrias 6 7 13
Totales 35 113 148
Las empresas de Productos no metálicos y que exportan, es decir que presentan estas dos características
conjuntamente son 6, este valor se denomina frecuencia conjunta. Observemos que el total de cada fila es
la cantidad de empresas que pertenecen a cada categoría del sector de la economía y el total de cada
columna, es el total de empresas que exportan o no. Los totales por filas y por columnas son las frecuencias
marginales y corresponden a las frecuencias de cada variable individualmente.
Generalizando, para las variables categóricas X con I categorías e Y, con J categorías, simbolizaremos con
nij a la frecuencia correspondiente a categoría i de X conjuntamente con j de Y, los totales por fila se
denotan “ni.” y los totales por columna “n.j”.
Podemos representar en forma general una tabla de contingencia con I filas y J columnas donde I y J son
las categorías de las distintas variables (Tabla 1.6.).
Tabla 1.6. Tabla de contingencia
X Y1 Y2 … YJ TOTAL
X1 n11 n12 … n1J n1.
X2 n21 n22 … n2J n2.
. . . … . .
. . . … . .
. . . … . .
XI nI1 nI2 … nIJ nI.
TOTAL n.1 n.2 n.J n

35
En la Tabla de Contingencia se cumplen las siguientes relaciones:
La suma de todas las frecuencias I J 3 2

conjuntas nij debe ser igual al total ��nij  n


i 1 j 1
��n
i 1 j 1
ij  148
de observaciones n.
Para nuestro ejemplo:
La sumatoria de todas las 11 12 21 22 31 32 41 42
ij n +n +n +n +n +n +n +n =
frecuencias conjuntas n ,
10+39+6+30+13+37+6+7=148=n
para i=1,2,…I, j=1,2…,J es

iguales a n
La suma de cada fila nij con i fijo, J J

es igual a la frecuencia marginal �n j 1


ij  ni . �n
j 1
3j  n3. n3.  50
de la categoría representada en la
fila ni.. ij Para nuestro ejemplo fijamos i=3,
La sumatoria de n con i n31+n32=13+37=50=n3.
i.
fijo, j=1,2…J, es igual a n
La suma de cada columna nij con j I I

fijo es igual a la frecuencia �nij  n. j


i 1
�n
i 1
i2  n.2 n.2  113
marginal de la categoría
representada en la columna n.j ij Para nuestro ejemplo fijamos j=2,
La sumatoria de n con j n12+n22+n32+n42=
j 39+30+37+7=113=n.2
fijo, i=1,2,…I, es igual a n.
La suma de las frecuencias I J I J
marginales por fila ni. y por �ni .  n
i 1
�n. j  n
j 1
�n i. n �n .j n
columnas n.j son iguales al total de i 1 j 1

datos n. i.
La sumatoria n para i=1,2, Para nuestro ejemplo
1. 2. 3. 4.
…,I, es igual a n n +n +n +n =

Similarmente, la sumatoria 49+36+50+13=148=n


.j
de n para j=1,2,…,J, es Por otra parte,
.1 .2
igual a n n +n =35+113=148=n

36
Si dividimos todos los valores de la tabla por el total de observaciones, se obtienen las frecuencias
relativas conjuntas, que denotaremos como hij y se calculan como:
hij = nij (sobre) n
Tabla.
La suma de todas las frecuencias I J

relativas conjuntas hij es igual a uno. ��hij  1


i 1 j 1

ij
Para nuestro ejemplo:
La sumatoria de h para
h11+h12+h21+h22+h31+h32+h41+h42=

i=1,2,…,I, j=1,2,…,J, es 10/148+39/148+6/148+30/148+

igual a 1 13/148+37/148+6/148+7/148=1
La suma de cada fila con i fijo es J

igual a la frecuencia relativa marginal �h


j 1
ij  hi .
de la variable representada en la fila
hi. ij
La sumatoria de h con i
Para nuestro ejemplo i =3,
h31+h32=13/148+37/148
fijo, j=1,2,…,J, es igual a
=50/148=0,338=h3.
i.
h
La suma de cada columna con j fijo I

es igual a la frecuencia relativa �h


i 1
ij  h. j
marginal de la categoría
representada en la columna h.j ij
La sumatoria de h con j
Para nuestro ejemplo j =2
.j
h12+h22+h32+h42=
fijo, i=1,2,…,I, es igual a h
39/148+30/148+37/148+7/148=
113/148=0,764=h.2
La suma de las frecuencias
marginales por fila hi. y por columnas
h.j son iguales uno. La sumatoria de hi. para Para nuestro ejemplo
i=1,2,…,I es igual a 1. 1. 2. 3. 4.
h +h +h +h =
Similarmente, la sumatoria
de h.j para j=1,2,…,J es
49/148+36/148+50/148+13/148=1
igual a 1.
Similarmente,
.1 .2
h +h =35/148+113/148=1
InfoStat. Para construir una tabla de contingencia en Infostat, acceder desde el menú ESTADISTICAS →
DATOS CATEGORIZADOS → TABLAS DE CONTINGENCIAS.
Aparece una ventana en la que se deben desplazar las variables Cat_exporta y Cat_sector a la ventana
CRITERIOS DE CLASIFICACIÓN de la solapa VARIABLES. Luego al aceptar aparecerá la ventana TABLA
DE CONTINGENCIA; en la solapa SELECCIÓN DE FILAS Y COLUMNAS se debe indicar cuál de las
variables se corresponderá con las filas de la tabla y cuál con las columnas y destildar presentación en
orden alfabético. En la solapa OPCIONES se pueden elegir los tipos de frecuencias, dejamos tildado sólo
Frecuencias absolutas y Frecuencias relativas al total, y destildamos las pruebas (chi cuadrado y otras que
se estudiarán en la asignatura Estadística II). En la ventana resultados se muestran las tablas siguientes.
Tablas de contingencia
Frecuencias absolutas
En columnas: Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 39 10 49
Productos no metálicos 30 6 36
37
Productos metálicos 37 13 50
Otras Industrias 7 6 13
Total 113 35 148
Frecuencias relativas al total
En columnas: Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 0,26 0,07 0,33
Productos no metálicos 0,20 0,04 0,24
Productos metálicos 0,25 0,09 0,34
Otras Industrias 0,05 0,04 0,09
Total 0,76 0,24 1,00

38
Las frecuencias relativas pueden ser más útiles que las absolutas en algunas interpretaciones. Por ejemplo
el 9% de las empresas (frecuencia relativa al total igual 0,09), fabrican productos metálicos y exportan.
Considerando solamente la variable exporta, leemos la frecuencia marginal por columna y podemos
observar que el 76 % de las empresas no exportan. Las industrias de origen agropecuario que no exportan
son las más frecuentes, con el 26%.
Para graficar las frecuencias absolutas o relativas conjuntas se pueden utilizar los gráficos de barras
múltiples o los de barras componentes.
En un gráfico de barras múltiples, se representa para cada categoría de una variable (en este caso los tipos
de industria) tantas barras como categorías de la otra (si exporta o no) y la altura de cada barra es el
porcentaje de frecuencia conjunta entre las dos categorías analizadas. A continuación se presenta un gráfico
de barras múltiples construido con Excel.
Gráfico 1.10. Análisis conjunto de Sector de la economía y Exporta.

Imagen
En cambio en un gráfico de barras componentes, cada barra representa cada categoría de una variable y se
divide en tantas partes como categorías de la otra. A continuación veremos cómo construir con Infostat un
gráfico de barras componentes.
Para construir un gráfico de barras apiladas en Infostat, desde la ventana de resultados debe capturarse
la tabla de contingencia como una tabla de datos para lo cual debe seleccionarse la tabla que se quiera
considerar y hacer clic en el icono

Imagen
Para graficar ingrese a GRÁFICOS → GRÁFICO DE BARRAS APILADAS. Como Variables seleccione SI y
NO y como Criterio de Clasificación, seleccione Cat_sector. El gráfico obtenido se muestra a continuación:

39
 Seleccionando apilar valores observados
Gráfico 1.11. Cantidad de empresas que exportan en cada sector
53 CANTIDAD DE EMPRESAS QUE EXPORTAN EN CADA SECTOR

39
Valores acumulados

26

13

0
De Origen AgropecuarioProductos no metálicos Productos metálicos Otras Industrias
Cat_sector
Imagen
 Seleccionando apilar proporciones
Gráfico 1.12. Proporción de empresas que exportan dentro de cada sector
Empresas que exportan dentro de cada sector

1,00

0,75

0,50

0,25

0,00
De Origen AgropecuarioProductos no metálicos Productos metálicos Otras Industrias
Cat_sector
Imagen
A partir del análisis gráfico ¿qué conclusión puede obtener respecto a la exportación en el sector industrial?
Frecuencias condicionadas
Cuando analizamos una tabla de contingencia muchas veces interesa conocer la proporción que representa
una variable sobre una determinada categoría de la otra. Esto es calcular proporciones sobre los totales fila
o columna según la variable que estamos considerando.
Si queremos analizar qué proporción representa la variable Y sobre cada categoría de la variable X se
calculan las proporciones filas, como se muestra en la Tabla 1.7., donde podemos observar que el total de
cada fila es 1.

40
Tabla 1.7. Frecuencias Condicionales por Fila
X Y1 Y2 … YJ TOTAL
X1 n11 / n1. n12 / n1. … n1J / n1. 1
X2 n21 / n2. n22 / n2. … n2J / n2. 1
. . . … . .
. . . … . .
. . . … . .
XI nI1 / nI. nI1 / nI. … nIJ / nI. 1
Las proporciones de cada fila se denominan frecuencias condicionadas, en este caso, por filas. Las
frecuencias condicionadas por filas indican la proporción de la categoría j de la variable Y sobre el total de la
categoría i de la variable X.
De la misma forma se calculan las frecuencias condicionadas por columnas. Las frecuencias condicionadas
por columnas indican la proporción de la categoría i de la variable X sobre el total de cada categoría j de la
variable Y.
InfoStat. ESTADISTICAS → DATOS CATEGORIZADOS → TABLAS DE CONTINGENCIAS.
En la solapa OPCIONES se pueden elegir los tipos de frecuencias, dejamos tildado sólo Frecuencias
relativas por filas y Frecuencias relativas por columnas. En la ventana resultados se muestran las tablas
siguientes.
Tablas de contingencia
Frecuencias relativas por filas
En columnas: Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 0,80 0,20 1,00
Productos no metálicos 0,83 0,17 1,00
Productos metálicos 0,74 0,26 1,00
Otras Industrias 0,54 0,46 1,00
Total 0,76 0,24 1,00
Frecuencias relativas por columnas
En columnas: Cat_exporta
Cat_sector NO SI Total
De Origen Agropecuario 0,35 0,29 0,33
Productos no metálicos 0,27 0,17 0,24
Productos metálicos 0,33 0,37 0,34
Otras Industrias 0,06 0,17 0,09
Total 1,00 1,00 1,00
De las Frecuencias relativas por filas (condicionadas a la fila) se observa que del total de empresas que
pertenecen al sector agropecuario, el 0,20 exporta y el 0,80 no.
Las frecuencias condicionadas por columna, indican que del total de empresas exportadoras el 0,37
corresponden a Productos metálicos, el 0,29 corresponden al sector agropecuario, el 0,17 a Productos No
Metálicos y la misma proporción a otras industrias. Mientras que las no exportadoras el 0,35 son empresas
de origen agropecuario y el 0,33 de productos metálicos.

41
Otros gráficos de frecuencias condicionadas
En muchas situaciones es útil calcular frecuencias de una variable dado una valor particular de otra variable
analizada, que denominamos frecuencias condicionadas.
Las empresas analizadas fueron también consultadas respecto a su participación en emprendimientos
conjuntos con otras empresas, en los últimos cinco años.
Tabla 1.8. ¿Participa o ha participado en emprendimientos conjuntos con otras em presas?
PARTICIPA FRECUENCIA ABSOLUTA PORCENTAJE
SI 16 10,8
NO 132 89,2
TOTAL 148 100,0
A las 16 empresas que contestaron afirmativamente, se les pidió que indique la localización de las empresas
con las que se asociaron.
Tabla 1.9. Localización de otras empresas con las que han participado en empren dimientos
LOCALIZACIÓN DE FRECUENCIA PORCENTAJE
OTRAS EMPRESAS ABSOLUTA
Locales (100 km) 10 62,5
De la provincia 3 18,75
Nacionales 3 18,75
TOTAL 16 100,00
Para representar estas variables puede utilizarse un gráfico circular combinado (Gráfico 1.13). Este gráfico
está construido con Excel.
Gráfico 1.13. Gráfico para frecuencias condicionadas

Imagen
La respuesta a la localización de las empresas con las que participa o participó del algún tipo de
emprendimiento es de naturaleza ordinal, ya que indica un cierto orden en relación a la jurisdicción a la que
pertenece la empresa socia.

42
Tabla 1.10. Localización de otras empresas
LOCALIZACIÓN DE FRECUENCIA PORCENTAJE FRECUENCIA PORCENTAJE
OTRAS ABSOLUTA ABSOLUTA ACUMULADO
EMPRESAS ACUMULADA
Locales (100 km) 10 62,5 10 62,50
De la provincia 3 18,75 13 81,25
Nacionales 3 18,75 16 100,00
TOTAL 16 100,00
Interpretemos los siguientes valores de las frecuencias acumuladas:
 Un 62,50% se asoció con empresas radicadas a una distancia de hasta 100 Km.
 13 empresas se asociaron con empresas locales o radicadas en la provincia, lo que constituye el 81,25
%.
Actividad 9:
Los establecimientos agropecuarios de la Provincia de Córdoba han sido clasificados de acuerdo a sus
niveles de producción, en altos, medianos y bajos y de acuerdo a la zona geográfica donde se encuentran
ubicados. Los resultados se muestran en la siguiente tabla:
Zona geográfica de la Provincia
NIVEL DE PRODUCCIÓN ZONA “A” ZONA “B” ZONA “C” TOTAL
Alto 69 47 23 139
Mediano 40 25 80 145
Bajo 38 32 36 106
TOTAL 147 104 139 390
Se pide:
a) ¿En qué dirección sería preferible calcular los porcentajes? ¿Por qué?
b) Calcule dichos porcentajes y obtener algunas conclusiones.
c) Obtenga la razón entre el número de establecimientos con nivel de producción alto y el número de
establecimientos con nivel de producción bajo en cada una de las tres zonas. Comente sus resultados.
Dos variables numéricas
Ahora veremos el caso de dos variables numéricas; por ejemplo se conoce la cantidad de personal ocupado
y el porcentaje del costo laboral en el costo total de las empresas.
No es conveniente representar estos datos en una tabla de frecuencias debido a que se trata de variables
continuas o discretas numerosas y la combinación de ambas variables pueden estar repetidas muy pocas
veces o ninguna. Para visualizar su comportamiento conjunto es conveniente realizar un gráfico de
dispersión.
En este gráfico, representamos en el eje de las abscisas el porcentaje del costo laboral y en el eje de las
ordenadas el personal ocupado; podemos observar que menores niveles de costo laboral se corresponden
con menor cantidad de personal ocupado. (Gráfico 1.14).

43
InfoStat. Se puede realizar un gráfico de dispersión como el siguiente desde el menú de GRÁFICOS →
DIAGRAMA DE DISPERSIÓN
Gráfico 1.14. Diagrama de Dispersión
Relación entre personal y participación del costo laboral
300
270
240
210
180
Personal

150
120
90
60
30
0
0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85
Costos lab/costo total
Imagen
Para construir esta gráfica con Infostat transformamos primero la variable desde el menú Datos 
Transformar, seleccionar la variable y en la ventana de dialogo siguiente la transformación que se quiere
realizar.
Para graficar seleccionar Gráficos  Gráfico de la distribución empírica.
Actividad 10
La tasa de desempleo (x) y la tasa de renuncia (y) para 13 regiones se relevaron en un momento
determinado del tiempo. Los datos obtenidos se presentan en la siguiente tabla:
Caso Tasa se renuncia Tasa de desempleo
1 1,30 6,20
2 1,20 7,80
3 1,40 5,80
4 1,40 5,70
5 1,50 5,00
6 1,90 4,00
7 2,60 3,20
8 2,60 3,60
9 2,50 3,30
10 2,70 3,30
11 2,10 5,60
12 1,80 6,80
13 2,20 5,60
Construya un diagrama de dispersión y analice el tipo de relación entre las variables.

44
5.4.3. Otro tipo de Gráfico: Gráfico logarítmico.
Los gráficos logarítmicos o a escala logarítmica son utilizados para representar series económicas,
comerciales o en general de cualquier tipo. La diferencia entre una escala aritmética y una escala
logarítmica es que en la escala aritmética una diferencia numérica se representa siempre por la misma
distancia vertical, por ejemplo la diferencia entre 200 y 100 o entre 1300 y 1200 es la misma distancia. En
cambio en la escala logarítmica la misma diferencia porcentual se representa siempre por la misma
distancia, por ejemplo la diferencia entre 200 y 100 o entre 40000 y 20000 es la misma distancia, por esta
causa los gráficos con esta escala suelen llamarse gráficos de razones o proporciones.
¿Cuándo usamos un gráfico a escala aritmética y cuándo uno a escala logarítmica?
 Si se quiere representar gráficamente magnitudes y compararlas entre sí, el gráfico que se debe utilizar
debe estar a escala aritmética o natural, y las diferencias estarán expresadas en términos de cantidades
reales.
 Si lo que se quiere mostrar son variaciones en porcentajes, o la relación porcentual en el cambio de
cierto conjunto de datos con respecto a otros, es necesario utilizar una escala logarítmica.
Considerar el comportamiento de una serie económica o comercial en escala logarítmica, implica la
comparación de tasas de cambio, es decir, la razón entre un par de valores sucesivos de la serie analizada
o el cálculo de números índices. Un gráfico logarítmico evita realizar este cálculo de proporciones sucesivas.
Herramientas matemáticas en los que se fundamenta su confección
En primer lugar veamos la relación que existe entre una progresión numérica aritmética y una logarítmica.
La siguiente secuencia de números 1, 2, 4, 8, 16, 32, 64, 128, ... sigue una progresión geométrica y
representa las potencias de 2 : 2 0, 21, 22, 23, 24, 25, 26, 27,... Examinando los exponentes observamos que los
mismos siguen una progresión aritmética 0, 1, 2, 3, 4, 5, 6, 7,… donde la base de estas potencias es un
valor fijo.
Recordemos que un logaritmo está definido como la potencia a la cual se eleva una base común a fin de
obtener un cierto valor prefijado. Utilizando esta definición en el ejemplo dado:
20 = 1  log 2 1 = 0
21 = 2  log 2 2 = 1
22 = 4  log 2 4 = 2
23 = 8  log 2 8 = 3
24 = 16  log 216 = 4
25 = 32  log 232 = 5
26 = 64  log 264 = 6
Realizando cambio de base en los logaritmos se puede formar otra serie con potencias de cualquier otra
base común, normalmente los logaritmos se toman sobre la base 10.
De esta manera podemos reescribir la serie geométrica 1, 2, 4, 8, 16, 32, 64, ... de la siguiente manera 10 0,
100,3010, 100,6020, 100,9030, 101,2040, 101,5050,… nuevamente los exponentes forman una serie aritmética, entonces
los logaritmos también forman una serie aritmética. La relación entre las series permite tratar a una serie
geométrica como aritmética mediante el uso de los correspondientes logaritmos de base común y fija.

45
Volviendo a las series económicas y comerciales, éstas presentan un comportamiento que podría ser
asimilado a una serie geométrica y que puede ser analizado a través de los logaritmos. Podemos
transformar los datos en sus correspondientes logaritmos, y por simple comparación de los mismos es
posible descubrir rápidamente cualquier variación en los cambios.
Representación gráfica
Como se mencionó en el último párrafo del punto anterior un camino es calcular el logaritmo de la variable y
representar gráficamente este último en coordenadas aritméticas.
Otra forma no necesita transformar los datos originales, lo que se transforma es la escala de los gráficos en
escala logarítmica antes de la representación de los datos.
A continuación se presenta un ejemplo, donde los datos son la producción de dos empresas entre los años
2000 y 2007 expresados en miles de pesos y los logaritmos de los datos.
Tabla 1.11. Tabla de frecuencias
PRODUCCIÓN (en miles de pesos)
AÑOS EMPRESA A EMPRESA B LOG. EMP. A LOG. EMP. B
2000 40 2 3,69 0,69
2001 80 4 4,38 1,39
2002 120 8 4,79 2,08
2003 160 16 5,08 2,77
2004 200 32 5,30 3,47
2005 240 64 5,48 4,16
2006 280 128 5,63 4,85
2007 320 256 5,77 5,55
En el Gráfico 1.15 se muestran los valores de la variable en escala aritmética, donde se pueden analizar los
cambios en los niveles de producción de un año a otro en términos absolutos.
Gráfico 1.15. Escala Aritmética
Imagen

46
Para analizar las variaciones porcentuales o las tasas de cambio de un año a otro necesitamos trabajar con
logaritmos, en este ejemplo como una variable es el tiempo éste se representa en el eje de las abscisas a
escala aritmética. En el Gráfico 1.16.a, la escala del eje de las ordenadas es logarítmica y en el Gráfico
1.16.b se utilizó en el eje de las ordenadas una escala aritmética pero se graficaron los logaritmos de los
valores de la variable.
Gráfico 1.16.
(a) Escala Logarítmica

Imagen
(b) Variables transformadas con el logaritmo
Imagen
InfoStat. Esta última gráfica es posible construirla con Infostat, para ello transformamos primero la variable
con DATOS  TRANSFORMAR, seleccionar la variable y en la ventana de dialogo siguiente la
transformación que se quiere realizar. Para graficar seleccionar GRÁFICOS  GRÁFICO DE LA
DISTRIBUCIÓN EMPÍRICA.
Observamos que la representación gráfica que se obtiene es la misma en los dos casos y diferente de la
gráfica a valores aritméticos. En estos dos últimos gráficos es posible analizar la variación en la tasa de
crecimiento de la producción a través de los años.
¿Te animas a realizar un informe con las conclusiones que surgen de estos gráficos?

47
5.5. Algunos lineamientos a considerar en la presentación de informes
Los resultados de un estudio estadístico deben ser informados a los interesados. Es necesario presentar los
resultados de manera adecuada, de forma tal que contribuya a una mejor comprensión y exposición de
dichos resultados, en función de los objetivos del trabajo. Para organizar una presentación es necesario
conocer con precisión la audiencia para buscar y seleccionar correctamente los relatos y el lenguaje
adecuado, así como los recursos visuales y gráficos que puedan captar su atención. Esto puede resultar
más complejo cuando la información es abierta utilizando Internet donde hay un público muy diverso y no
siempre se conoce las características de quienes reciben la información de los resultados.
Existen tres tipos fundamentales de presentación: en forma escrita, con cuadros estadísticos y gráficas.
 La presentación escrita es la forma más habitual de presentar un informe de resultados y conclusiones
y/o recomendaciones. Debe limitarse a lo estrictamente necesario, cuidando de mantener una secuencia
lógica en la exposición sin incurrir en repeticiones, citando todas las tablas y figuras a que se haga
referencia.
 Los cuadros estadísticos resultan de gran ayuda ya que permiten mostrar frecuencias, relaciones,
contrastes, variaciones y tendencias en una forma sintetizada, más comprensible y ordenada de la
información.
 Las tablas deben ser autoexplicativas, para que el lector no tenga necesidad de acudir al texto para
conocer de qué trata determinada tabla.
Las partes de una tabla son:
o Número de orden: para facilitar la referencia a la tabla en el texto.
o Título completo, claro y conciso: es decir, debe reflejar claramente en qué consiste el contenido.
o Cuadro propiamente dicho o cuerpo de la tabla.
o Notas explicativas o calce (también se le llama pie). Sirven para indicar la fuente de donde se
obtuvieron los datos y, de ser pertinente, la significación estadística o alguna breve nota aclaratoria del
contenido.
 Los gráficos constituyen un complemento importante para la presentación de los resultados.
Generalmente se elaboran a partir de tablas estadísticas, pero al presentar los resultados. Es un error
acompañar a cada tabla por un gráfico, ello origina repeticiones en la información y pérdida de espacio. El
gráfico debe agregar información, no duplicarla, por lo que el gráfico debe utilizarse cuando se quiera
mostrar algún patrón especial en los resultados, destacar tendencias o ilustrar comparaciones de forma
clara y exacta. El gráfico, también debe ser autoexplicativo, sencillo y de fácil comprensión.
Las partes del gráfico son:
 Número de orden.
 Título.
 Cuerpo o gráfico propiamente dicho.
 Leyenda permite identificar claramente los diferentes elementos del cuerpo del gráfico.

48
(Información adicional)
Las últimas tres características: 8. Coordinación a nivel nacional; 9. Estándares internacionales; 10.
Cooperación internacional, están referidas específicamente a las estadísticas de organismos oficiales.
(Fin de información adicional)
Las Naciones Unidas en su documento Cómo hacer comprensibles los datos dice: “Un relato estadístico
debe basarse en un conocimiento suficiente de los datos y del fenómeno en estudio, de lo contrario, podría
ser interesante, pero totalmente erróneo. Cuando se está preparando un relato estadístico, también debes
recordar los Principios Fundamentales de las Estadísticas Oficiales: 1. Imparcialidad; 2. Profesionalidad; 3.
Metadatos; 4. Formular observaciones sobre interpretaciones erróneas; 5. Diversidad de fuentes; 6.
Confidencialidad; 7. Transparencia”.
The International Statistic Institute define una serie de principios éticos a considerar por los estadísticos.
Como expresa Blacona (2011), “… la ética no se incluye formalmente en los planes de estudios. Sin
embargo es un tópico fundamental para el desempeño profesional”, si bien se refiere específicamente a los
estadísticos, podemos extenderlo a todos aquellos profesionales que utilizan estas herramientas en el
ejercicio de su profesión.
7. Actividades de aprendizaje
Actividad 11:
Describa en cada uno de los casos mencionados más abajo:
a) ¿Cuál es la población?
b) ¿Cuál es la muestra?
c) ¿Cuál es la unidad estadística?
d) ¿Cuál es la variable o característica principal de cada estudio y de qué tipo es?
Caso A: Mientras un camión espera para descargar en un silo de granos la producción de trigo de un
campo, se toma una muestra de semillas de trigo. Sobre la base de los resultados se clasifica a la semilla
en excelente, muy buena, buena o mala, y se establece el precio de toda la carga del camión.
Caso B: El Ministerio de Trabajo de la Provincia de Córdoba vigila constantemente las cifras sobre empleo,
salario, movimiento laboral, etc. En base a una muestra de 100 trabajadores, el Ministerio presenta las
siguientes cifras correspondientes a un mes en particular: “2 de cada 100 empleados cambiaron de trabajo
el último mes; el sueldo mensual de los obreros metalúrgicos fue de $ 12480; el número promedio de horas
de trabajo en las empresas alimenticias fue de 40,2”.
Caso C: El departamento de contabilidad de una empresa toma 50 facturas del último mes para analizar si
están correctamente confeccionadas, en base a ello tratar de determinar el porcentaje de facturas “mal
confeccionadas” que tendrá el próximo mes.
Caso D: Un fabricante de cosméticos desea estudiar el grado de satisfacción de sus clientes a los que les
ha regalado su nuevo producto. Está planeando para ello entrevistar a 400 de esos clientes. Además de lo
que se le pide en el encabezado del ejercicio, elaborar un primer borrador de cuestionario, anotando tres
preguntas que generen variables cualitativas y tres preguntas que generen variables cuantitativas, que sean
apropiadas para esta encuesta.
Caso E: El gerente del departamento de atención al cliente de la N.V.C., está interesado en determinar si
los clientes que compraron electrodomésticos en el último año están satisfechos con sus productos.
Utilizando las tarjetas de garantía que envían los clientes después de la compra, el gerente está planeando
encuestar a 600 de esos clientes.
Caso F: En una encuesta política para tratar de pronosticar el resultado de una elección de la Capital
Federal, se seleccionan 1000 personas en condiciones de votar.

49
Actividad 12:
La empresa Nielsen efectúa encuestas semanales a los televidentes residentes en la ciudad de Córdoba.
Sus calificaciones estadísticas indican el tamaño de la audiencia para cada uno de los principales
programas de la televisión local. Las calificaciones de los programas y la parte del mercado para cada canal
se publican semanalmente.
a) ¿Qué trata de medir la empresa Nielsen?
b) ¿Cuál es la población?
c) ¿Usted cree que se utilizará una muestra?
d) ¿Qué tipos de decisiones o acciones cree usted que se basan en las mediciones de Nielsen?
Actividad 13:
Una consultora encargada de efectuar estudios de mercado en Córdoba, pidió a 800 consumidores que
probaran un plato de pastas denominado “ZIA MARIA”, que es de elaboración reciente de un fabricante. De
los 800 consumidores consultados 600 dijeron que comprarían el plato si se pusiera a la venta.
a) ¿Qué informará la consultora al fabricante, respecto a la aceptación del “ZIA MARIA”?
b) ¿Es éste un ejemplo de estadística descriptiva o inferencial? Justifique la respuesta.
c) ¿Cuál es la población, cuál es la muestra y cuál es la unidad estadística?
d) Identifique el parámetro de interés y el estadístico. ¿Se conoce el valor de alguno de ellos?
Actividad 14:
Un diario de Córdoba informó acerca del tipo de medios de comunicación existentes en la ciudad. Los datos
son los siguientes:
Tabla.
MEDIOS DE COMUNICACIÓN CANTIDAD
Diarios 3
Radios A.M. 4
Radios F.M. 49
Canales T.V. por aire 3
Canales T.V. por cable 5
Revistas 27

¿A qué escala de medición responden estos datos? ¿Por qué?


Actividad 15:
Determine si cada una de las variables es categórica o numérica. Si es numérica indique si es discreta o
continua, y cuál es la escala de medición.
A los estudiantes de la Facultad de Ciencias Económicas se les preguntó:
a) Si posee automóvil o no.
b) La cantidad de dinero que gastó en transporte el mes anterior.
c) Si tiene computadora o utiliza el gabinete de computación de la facultad.
d) El tiempo que utiliza una computadora por semana.
e) La cantidad de libros que compró en los últimos 12 meses.
f) La cantidad de dinero que gastó en libros en los últimos 12 meses.
g) Las editoriales preferidas.
h) El número de suscripciones a revistas económicas.

50
Actividad 16:
Para controlar el valor de un inventario, el administrador de una ferretería quiere limitar la cantidad de cada
artículo en el depósito; al mismo tiempo, evitar perder ventas por falta de stock. Para lograr esto, el
administrador desea saber cuáles son las características de la demanda para cada artículo.
a) Describa la población de interés para el administrador.
b) Proporcione un ejemplo de muestra representativa de esta población.¿Qué preguntas tendría que hacer
el administrador? Elabore por lo menos tres.
Actividad 17:
Un periódico realizó una encuesta telefónica a 480 habitantes seleccionados aleatoriamente de distintas
áreas de la capital cordobesa. La siguiente tabla muestra las respuestas acerca de la opinión de los
servicios de seguridad. La pregunta realizada fue: “En su barrio, ¿son adecuados los servicios de policía y
de bomberos?” Las respuestas obtenidas fueron:
Tabla.
OPINIÓN NÚMERO DE CASOS
SI 336
NO 96
NS / NC 48
TOTAL 480
a) Obtenga la distribución de frecuencias relativas.
b) Construya un gráfico de barras y un diagrama de pastel con esta información.
c) ¿Cuál de estos gráficos le parece más informativo y por qué?
Actividad 18:
Los siguientes datos se encuentran disponibles en archivos de una empresa. Explicite el tipo de variable y la
escala de medición.
Tablas.
ARCHIVO DE PERSONAL
Variable Tipo de variable Escala de medición
Barrio donde vive el empleado
Salario
Días de vacaciones
Días de ausencia por enfermedad
Edad
Adelantos de sueldo en un mes
determinado

REGISTRO DE LA PRODUCCIÓN
Variable Tipo de variable Escala de medición
Tipo de producto
Cantidad mensual producida por producto
Costo de la mano de obra
Costo de materiales

REGISTROS DE INVENTARIO
Variable Tipo de variable Escala de medición
Existencia diaria por producto
Existencia diaria por insumo
Descuentos por producto

51
REGISTROS DE VENTAS
Variable Tipo de variable Escala de medición
Ventas mensuales por producto
Ventas mensuales por región geográfica
Ventas mensuales por tipo de cliente
Canales de venta

PERFIL DEL CLIENTE


Variable Tipo de variable Escala de medición
Edad
Sexo
Nivel de ingresos (alto, medio, bajo)
Zona donde vive

Actividad 19:
El área de mercadotecnia de una empresa ha propuesto una nueva bebida dietética que, piensa, captará
una gran parte del mercado de adultos jóvenes.
¿Qué información se debería tener en cuenta al momento de invertir en la incorporación de un nuevo
producto en el mercado? Proponga una forma de recolección de los datos para obtener esa información.
Actividad 20:
Las cotizaciones de un tipo de acciones en la bolsa para los últimos 22 días fue ron las siguientes:
8.4 9.2 11.3 7.8 10.9 10.2 8.0 9.0 10.4 9.7 8.9
11.7 9.7 9.6 10.5 8.5 9.9 8.2 10.3 11.3 8.0 3.0
Elabore una representación de tallo y hoja e interprétela. (Ayuda: los enteros formarán el tallo y los
decimales las hojas).
Actividad 21:
La siguiente tabla muestra datos correspondientes a la enegia anual generada en el país en Gigawatts/hora.
Tabla.
Años Total de energía generada Hidráulica Nuclear
2008 114724 31456 7330
2009 114337 35093 8162
2010 120011 33300 7171
2011 124802 31309 6371
2012 129007 29308 6395
2013 133705 33333 6207
2014 137181 33345 5514
a) Represente gráficamente la información de manera tal que permita analizar la evolución porcentual de la
energía total generada, y comparar la variación interanual de la energía hidráulica y nuclear. Indique la
variación promedio anual de la energía generada total, hidráulica y nuclear.

52
Actividad 22:
Represente gráficamente la siguiente información:
Tabla.
Precio 3 3.9 6 10 4.5
Cantidad ofrecida 1 1.3 2 3.33 1.5
Precio 10 8 7 6 4
Cantidad demandada 2 4 5 6 8
Para elegir el tipo de gráfico, tenga en cuenta que cada uno de ellos debe permitir discutir las siguientes
opiniones:
a) La elasticidad precio de la oferta es constante.
b) La pendiente de la curva de demanda es constante.
Actividad 23:
Para 15 empresas se relevó el precio y el margen de utilidad de un produc to. Los datos obtenidos (en
miles de pesos) se presentan en la siguiente tabla:
PRECIO
UTILIDAD (y)
(x)
15 5,3
15 6,0
14,8 5,2
13 3,9
16 4,8
14 4,2
14,5 4,4
15,5 4,7
13 3,9
15 4,5
13,5 4,7
14,6 5,1
15,5 5,4
14,8 5,9
13,8 4,8
Construya un diagrama de dispersión y analice el tipo de relación entre las variables.
Actividad 24:
Una heladería cuenta con dos sucursales en la Ciudad de Córdoba, una ubicada en la zona Norte y otra
ubicada en la zona Sur. A continuación se presenta in formación sobre el número de pedidos telefónicos
recibidos por día, para una muestra aleatoria de 20 días:
Zona
4 6 7 5 5 6 7 4 8 6 8 5 7 6 7 5 6 6 7 4
Norte
Zona
4 6 5 3 6 3 5 6 5 6 4 4 5 6 6 2 3 4 5 6
Sur

53
8. Para cada sucursal:
a) Construya la tabla de distribución de frecuencias.
b) Represente gráficamente las frecuencias absolutas y las frecuencias relativas acumuladas.
c) Analice la distribución
9. Efectúe comparaciones
Actividad 25:
A continuación se presentan los precios de venta (en miles de $) de 30 casas de dos zonas
residenciales de la Ciudad de Córdoba.
Zona A 90 116 120 95 114 97 121 108 102 91
Zona A 107 99 92 118 100 96 98 110 104 125
Zona A 100 93 105 112 96 113 100 95 105 129
Zona B 100 148 130 118 135 125 110 132 125 115
Zona B 134 116 131 109 126 112 126 105 150 119
Zona B 121 145 128 117 136 122 119 130 125 133
1. Para cada zona:
a) Organice los datos en una distribución de frecuencias tomando 5 intervalos de clase (cerrados por
derecha).
b) Realice los gráficos que correspondan.
c) Analice la distribución
2. Efectúe comparaciones.
Actividad 26:
La tabla siguiente presenta la población total según el ingreso medio individual de los aglomerados urbanos
para el segundo trimestre de 2016.
Número de decil Ingreso medio por decil Variaciones entre deciles
1 1.311
2 3.301 252
3 4.477 136
4 5.111 114
5 6.468 127
6 8.150 126
7 9.749 120
8 12.110 124
9 16.114 133
10 30.374 188
Del análisis de los gráficos siguientes se pide un informe sobre la variación relativa del ingreso medio entre
deciles. (Indique el gráfico que utiliza en el análisis justificando su elección).

54
Imágenes
Actividad 27:
Las ventas diarias (en $) para los últimos 120 días de una empresa de servicios de transporte se
organizaron en la una distribución de frecuencias por interva los que ser muestra en la siguiente tabla:
yi-1 - yi ni
530 - 730 3
730 - 930 7
930 - 1130 11
1130 - 1330 22
1330 - 1530 40
1530 - 1730 24
1730 - 1930 9
1930 - 2130 4
Total 120
Determine:
a) ¿Cuántos días se vendieron entre $ 1130 y $ 1330?
b) ¿Qué porcentaje de días se registraron ventas de entre $ 1130 y $ 1330?
c) Represente mediante un histograma y un polígono de frecuencias, la información dispuesta en la tabla.
d) Aproximadamente ¿cuál es el porcentaje de días que tienen como ingreso $ 1730 o más?
e) ¿Podría describir la forma de la distribución?
8. Casos de discusión y análisis
A continuación se presentan casos de investigación reales.
En cada uno determinar:
 Objetivo de la investigación
 Población
 Unidad estadística

55
 Marco muestral
 Muestra
 Parámetro
 Estadístico
 Variables de interés (clasificarlas por tipo)
 Fuente de recolección de datos
Caso 1
Un equipo de investigación de nuestra Facultad realizó un estudio sobre el desempeño académico de los
estudiantes que ingresaron en los años 2000 y 2003 a las tres carreras de la Facultad de Ciencias
Económicas (UNC), con el objetivo de identificar las principales variables que contribuyen a explicar tanto el
rendimiento como el abandono observados hasta fin del año 2005.
El análisis comprende una descripción general de las características de los estudiantes de ambas cohortes
incluidos en cada muestra, teniendo en cuenta factores como carrera, sexo, lugar de procedencia,
modalidad del establecimiento de nivel secundario del que egresó (público o privado), cantidad de materias
aprobadas en la carrera y nota promedio del secundario.
Los datos utilizados para el estudio fueron extraídos del sistema SIU-Guaraní (Sistema de Información
Universitario Guaraní) y de los legajos individuales de los estudiantes, que obran en la unidad académica.
Para llevar a cabo el estudio se seleccionó un grupo de estudiantes de cada cohorte según el siguiente
detalle:
Número de estudiantes por carrera seleccionados
CARRERA COHORTE 2000 COHORE 2003
Contador 2154 1928
Lic. en Economía 275 252
Lic. en Administración 1157 789
TOTAL 3586 2969
Fuente: Elaboración propia a partir de datos obtenidos del SIU - Guaraní
Caso 2
En nuestra Facultad se realizó un análisis del trabajo informal (también denominado no registrado, o en
negro) en Argentina, utilizando los datos de la Encuesta Permanente de Hogares de INDEC y aplicando los
criterios básicos de las definiciones existentes a nivel internacional. Mediante un enfoque descriptivo se
realizan estimaciones de la cantidad de trabajadores informales durante los últimos 8 años, tanto en el país
como en sus regiones, y se presentan los resultados en aperturas que comprenden principalmente aspectos
como sexo, edad, categoría ocupacional, nivel de estudios, ramas de actividad y número de horas
trabajadas, entre otros.
Nota: La Encuesta Permanente de Hogares es un programa de programa de investigación de la realidad
social del país. Se nutre de información a través de una encuesta realizada a un grupo de hogares
seleccionados, que permite conocer las características demográficas y sociodemográficas de la población,
vinculadas a las fuerza de trabajo.
Caso 3
Un equipo de investigación de nuestra Facultad realizó un trabajo para analizar los niveles de pobreza en la
población de Malvinas Argentinas, Córdoba, y determinar la incidencia de cada atributo en la misma, con la
finalidad de definir una metodología pertinente y actual capaz de ser aplicada en otras comunidades.
Se determinó, en la localidad de Malvinas Argentinas:

56
 La tasa de pobreza de cada hogar.
 La tasa de pobreza de la población de hogares.
 La tasa de pobreza en la población por atributo considerado.
Para aplicar está metodología, se utilizó una encuesta realizada en el año 2004 en la población de Malvinas
Argentinas donde se entrevistaron aproximadamente 700 hogares.
Los atributos que se consideraron son:
1. Ingreso de las familias.
2. Tamaño de la vivienda (en m2).
3. Años de escolaridad del jefe de familia.
5. Tipo de vivienda.
8. Material de las paredes.
9. Cantidad de personas por cuarto.
10. Situación laboral del jefe de familia.
Caso 4
La Universidad de Lomas de Zamora realizó un trabajo para describir algunas características de los
estudiantes universitarios que trabajan y analizar su actitud frente a algunas herramientas tecnológicas,
tales como la computadora personal (PC) e Internet.
Durante año 2003, se realizó una encuesta con el fin de estudiar la penetración de las Tecnologías de la
Información y la Comunicación (TICs) en los estudiantes universitarios, especialmente la incidencia del uso
de Internet. Dicho estudio volvió a realizarse en 2005 y 2007.
El interés está centrado en detectar si los estudiantes trabajadores han percibido algún cambio, durante el
período comprendido entre los años 2003, 2005 y 2007, en su lugar de trabajo, en cuanto a dos indicadores:
nivel de comunicación personal y a cantidad de encuentros cara a cara.
Tanto en al año 2003 como en el 2005 y 2007 se trabajó con un grupo de alumnos seleccionados al azar
entre los inscriptos durante el segundo cuatrimestre del ciclo lectivo de dichos años, en distintas Facultades
de la Universidad Nacional de Lomas de Zamora, sita en la Provincia de Buenos Aires y de la Universidad
de Buenos Aires, sita en la Ciudad Autónoma de Buenos Aires.
La recopilación de los datos se realizó mediante una encuesta directa, estructurada y precodificada que se
entregó a los alumnos seleccionados en dichas oportunidades.
En este estudio se indagó, entre otros, sobre los siguientes aspectos:
 Edad
 Sexo
 Universidad y Facultad
 Nivel de satisfacción que obtiene al realizar actividades con la computadora personal y satisfacción por el
uso de Internet (con las siguientes categorías: nulo, muy bajo, bajo, moderado, alto, muy alto).
 Nivel de uso de Internet (con las siguientes categorías: nulo, muy bajo, bajo, moderado, alto, muy alto).
 Grado de comunicación personal con compañeros de trabajo (aumentó, disminuyó, no varió).
 Cantidad de encuentros personales, cara a cara con compañeros de trabajo, por semana.
(Información adicional)
Sesiones de grupo: grupo de 8 a 10 participantes conducidos por un moderador en una discusión profunda
sobre un determinado tema o concepto.
Entrevista: entrevistadores personales que efectúan sondeos y obtienen respuestas detalladas para las
preguntas, a menudo emplean técnicas no directivas para descubrir motivaciones ocultas
(Fin de información adicional)

57
Caso 5
Nickelodeon se conecta en la red para recabar datos 7
¿Cómo averiguar qué piensan los niños? Este fue el problema que afrontó la vicepresidenta de
investigación de Nickelodeon.
Los programadores y el personal de mercadotecnia de la red de cablevisión para niños deseaban
información sobre los jóvenes televidentes, la cual tradicionalmente se había obtenido mediante sesiones
de grupo que consumen mucho tiempo, y entrevistas personales.
Gracias al advenimiento del e-mail, la vicepresidenta de investigación tuvo la idea de conectarse con los
televidentes en línea. Nickelodeon colocó 70 anuncios en línea mediante Compu Serve. Los niños utilizan
sus computadoras personales y módems para hablar con Nickelodeon y entre ellos, acerca de diversos
temas. Pueden escribir avisos de la computadora y tres veces por semana pueden conectarse en juntas
programadas con anterioridad. Durante esas juntas, los investigadores de la red dirigen sus discusiones
sobre diversos temas, una tercera parte del tiempo se dedica a ciertos programas de la cadena.
Es obvio que los niños participantes son usuarios de CompuServe. Su edad va de los ocho a doce años y
representan hogares con ingresos desde U$S 30.000 a U$S 100.000 anuales. Se estima que el
mantenimiento anual del sistema cuesta 80.000 dólares, lo que constituye tan sólo una fracción del costo de
los métodos de investigación tradicionales.
De este modo, Nickelodeon obtiene datos más detallados, con más rapidez y económicos, que con los
métodos de investigación tradicionales (sesiones de grupo y entrevistas). Los niños dan retroalimentación
instantánea sobre los programas. Otros datos provienen de respuestas a preguntas tipo encuesta. Algunos
consideran este método con escepticismo y señalan que probablemente esté sesgado a favor de niños
locuaces. La vicepresidenta de investigación entiende que este sistema es una herramienta cualitativa y
que, al igual que cualquier investigación de este tipo, los resultados no pueden proyectarse a nivel nacional.

7
Extraído de “Investigación de mercados contemporánea” de Carl Mc Daniel y Roger Gates.
58
Referencias Bibliográficas
 Blaconá Teresa (2001) Ética en Estadística: responsabilidad de las universidades en la formación del
profesional Recuperado de http://www.saberes.fcecon.unr.edu.ar/index.php/revista/article/view/50/99
revisado el 20/06/2015
 Berenson, M y Levine, D (2003) Estadística Básica en Administración. Conceptos y Aplicaciones. 6º
Edición Prentice Hall.
 International Statistic Institute (ISI) (2010) Declaration on professional ethics. Recuperado de
http://www.isi-web.org/index.php/activities/professional-ethics/isi-declaration
 Díaz Margarita [et.al.] (2004) Estadística I: Guía de Estudio. -1ra Ed. Córdoba Asociación Cooperadora
de la Fac. de Cs. de la U.N.C., 2009.338 páginas 27x21 cm ISBN 978-987-1436-21-7.
 Naciones Unidas Comisión Económica para Europa (2009) Cómo hacer comprensibles los datos Parte 2
Una guía para presentar estadísticas. Ginebra. Recuperado de
http://www.unece.org/fileadmin/DAM/stats/documents/writing/MDM_Part2_Spanish.pdf
 Saino Martin (2009). Estadística Descriptiva. Material de estudio y aplicaciones prácticas correspondiente
a los Capítulos I, II del programa de Estadística I. Asoc Coop F.C.E. (U.N.C.). ISBN: 978-987-1436-20-0
 Peña, Daniel (2001) Fundamentos de Estadística. Editorial Alianza.

59
Soluciones y respuestas al Capítulo 1
Guía de Estadística
Actividad 1:
Caso de Descripción Tipo de estudio ()
análisis de la población
1 Todos los hogares de las  Confirmatorio a través de un
principales ciudades del país. relevamiento muestral
2 Todas las baterías producidas  Confirmatorio
por los 3 proveedores de la  Se realiza un experimento
fábrica de tractores (que se (porque se controlan ciertas
están analizando). condiciones de selección )
3 Todos los certificados de  Confirmatorio
defunción emitidos por los  Muestra con información
municipios que se secundaria
seleccionaron para realizar el
estudio.
4 Firmas (empresas), clasificadas  Confirmatorio
su el tamaño de las mismas  Se realiza un relevamiento
según la cantidad de muestral
empleados.
5 Empresas familiares de la  Exploratorio
Ciudad de Córdoba  Se realizan entrevistas en
profundidad
Actividad 2:
1.
a) Variable Cuantitativa Discreta
b) Variable Cualitativa
c) Variable Cuantitativa Discreta
d) Variable Cuantitativa Discreta
e) Variable Cuantitativa Continua
f) Variable Cuantitativa Continua
g) Variable Cualitativa
h) Variable Cuantitativa Continua
2. Variable dicotómica: Si tiene línea telefónica. Variable con escala nominal: Tipo de vivienda
3. Por ejemplo, el Gasto en bienes de consumo por mes, se puede dividir en cuatro niveles que los
denominamos Muy alto, Alto, Medio, Bajo. En este caso la escala que tomamos para medir es ordinal. Lo
mismo se podría hacer con el Ingreso total de las personas que habitan la vivienda (pesos y centavos) y el
Gasto en bienes duraderos por semestre.

60
Actividad 3:
a) Variable de estudio: Nivel de Instrucción. Clasificación: cualitativa. Escala: ordinal.
b) Tabla de distribución de frecuencias (salida Infostat).
Tablas de frecuencias
Variable Clase Categorías FA FR FAA FRA
NIVEL DE 1 Primario 48 0,45 48 0,45
INSTRUCCIÓN
NIVEL DE 2 Secundario 36 0,34 84 0,79
INSTRUCCIÓN
NIVEL DE 3 Terciario 15 0,14 99 0,93
INSTRUCCIÓN
NIVEL DE 4 Universitario 5 0,05 104 0,98
INSTRUCCIÓN
NIVEL DE 5 NS/NC 2 0,02 106 1,00
INSTRUCCIÓN
c) Gráfico de torta:
Distribución del Nivel de instrucción (salida Infostat).

Imagen
Gráfico de barras:
Distribución del Nivel de instrucción

Imagen
Actividad 4:
a) Tablas de frecuencias
Variable Clase Stock FA FR FRA
stock 1300 3 0,10 0,10
stock 2400 5 0,17 0,27
stock 3500 7 0,23 0,50
stock 4600 6 0,20 0,70
stock 5700 5 0,17 0,87
stock 6800 4 0,13 1,00

61
Gráfico de Bastones del Stock de cospeles

Imagen
Diagrama Escalonado del Stock de cospeles

Imagen
Se observa que el stock de cospeles más bajo es de 300, mientras que el más alto alcanza los 800. El stock
más frecuente es de 500 cospeles. Los datos presentan una leve concentración en niveles de stock más
altos (leve asimetría izquierda).
1) 7 kioscos
2) 15 kioscos
3) 13%
4) 50%
Actividad 5:
a. Tabla de distribución de frecuencias
Tablas de frecuencias
Variable Clase MC FA FR FAA FRA
Cantidad de veces 1 1 3 0,12 3 0,12
Cantidad de veces 2 2 4 0,16 7 0,28
Cantidad de veces 3 3 3 0,12 10 0,40
Cantidad de veces 4 4 5 0,20 15 0,60
Cantidad de veces 5 5 3 0,12 18 0,72
Cantidad de veces 6 6 4 0,16 22 0,88
Cantidad de veces 7 7 3 0,12 25 1,00

62
b. Gráfico de Bastones:
Distribución de cantidad de veces que concurrió al negocio

Imagen
c. Cálculo de las frecuencias absolutas acumuladas (ver tabla de distribución de frecuencias)
Gráfico acumulativo de frecuencia:
Cantidad de veces que concurrió al negocio

Imagen
Actividad 6:
Las edades oscilan entre los 18 y los 69 años, con una mayor concentración entre los 20 y 50 años. La
distribución presenta una leve asimetría hacia la derecha, es decir, hay un desplazamiento de datos hacia
las mayores edades.
Actividad 7:
Para poder responder la actividad se completó la tabla de distribución de frecuencias y se confecciono e
grafico correspondiente.

63
Tablas de frecuencias
Variable Clase LI LS MC FA FR FAA FRA
ventas 1 [ 530,00 730,00 ) 630,00 3 0,03 3 0,03
ventas 2 [ 730,00 930,00 ) 830,00 7 0,06 10 0,08
ventas 3 [ 930,00 1130,00 )1030,00 11 0,09 21 0,18
ventas 4 [ 1130,00 1330,00 )1230,00 22 0,18 43 0,36
ventas 5 [ 1330,00 1530,00 )1430,00 40 0,33 83 0,69
ventas 6 [ 1530,00 1730,00 )1630,00 24 0,20 107 0,89
ventas 7 [ 1730,00 1930,00 )1830,00 9 0,08 116 0,97
ventas 8 [ 1930,00 2130,00 ]2030,00 4 0,03 120 1,00
Gráficos:
Histograma y polígono de frecuencia de la distribución de ventas diarias.

Imagen
a. 22 días
b. El 18,33%
c. Ver figura
d. 10,83%
e. La distribución muestra las ventas entre $530 a $2130, presenta una forma aproximadamente simétrica,
observándose un pico en las ventas entre $1330 y $1530.
Actividad 8:
a) Numero de intervalos = 5
Amplitud = $18
Comenzando por el valor 41
Tablas de frecuencias
Variable Clase LI LS MC FA FR FAA FRA
Precios 1 [ 41,00 59,00 ] 50,00 8 0,20 8 0,20
Precios 2 ( 59,00 77,00 ] 68,00 4 0,10 12 0,30
Precios 3 ( 77,00 95,00 ] 86,00 11 0,28 23 0,58
Precios 4 ( 95,00 113,00] 104,00 11 0,28 34 0,85
Precios 5 ( 113,00 131,00] 122,00 6 0,15 40 1,00
b) Gráficos:
Histograma y Ojiva.

64
Imagen
c) 11 casas
d) El 28%
e) Aproximadamente el 70%
Actividad 9:
a) La dirección en la que sería preferible calcular los porcentajes depende del objetivo de investigación. Si
lo que interesa es el estudio de los niveles de producción por zona, entonces se deberá calcular los
porcentajes en columnas. Si se focaliza en el análisis de las zonas por nivel de producción, se deberá
calcular el porcentaje en fila. Es posible también, que interese el estudio de ambas distribuciones.
b) Tabla de frecuencias condicionadas (proporción filas).
NIVEL DE PRODUCCIÓN ZONA “A” ZONA “B” ZONA “C” TOTAL
Alto 49,64 33,81 16,55 100,00
Mediano 27,59 17,24 55,17 100,00
Bajo 35,85 30,19 33,96 100,00
Al analizar los establecimientos agropecuarios de la Provincia de Córdoba (condicionadas a la fila) por nivel
de producción, se observa que del total de establecimientos agropecuarios con un alto nivel de producción,
el 49,64% están ubicados en la zona A, el 33,81% en la zona B y el resto (16,55%) en la zona C.
Del total de establecimientos agropecuarios con niveles de producción bajo, el 35,85% se encuentra en la
zona A, el 30,19% en la zona B y el 33,96% en la zona C.
También podemos concluir que la zona que tienen un mayor porcentaje de establecimientos agropecuarios
con niveles de producción alto, están ubicados en la zona A, mientras que el mayor porcentaje de
establecimientos con niveles de producción medio, se encuentra en la zona C. Además, los
establecimientos con bajos niveles de producción, se distribuyeron con porcentajes similares en todas las
zonas.
c) Zona A: 69/38 = 1,82 Zona B: 47/32 = 1,47 Zona C: 23/36 = 0,64, se puede observar que la razón entre
el número de establecimientos con nivel de producción alto y con respecto al nivel bajo, en la zona A es
mayor que en el resto de las zonas.

65
Actividad 10:
Diagrama de dispersión:
Tasa de Desempleo – Tasa de Renuncia

Imagen
Se puede concluir que hay una relación lineal inversa (o negativa) entre las variables tasa de desempleo y
tasa de renuncia, es decir, a medida que aumenta (disminuye) la tasa de desempleo, disminuye (aumenta)
la tasa de renuncia.
Actividad 11:
Caso Población Muestra Unidad Variable/s y su clasificación
estadística
A Toda la producción de Granos de trigo Cada semilla Clasificación de la semilla (excelente,
trigo dispuesta en el tomados del camión de trigo muy buena, buena o mala): variable
camión. para clasificar la semilla. cualitativa.
B Todos los trabajadores 100 trabajadores Cada ¿Cambió de trabajo el último mes?:
de la provincia de seleccionados. trabajador variable cualitativa
Córdoba. de la Sueldo mensual: variable cuantitativa
provincia continua
Número de horas trabajadas: variable
cuantitativa continua.
C Todas las facturas 50 facturas del último Cada factura Clasificación de la factura (con error o
emitidas por la mes seleccionadas. sin error): variable cualitativa.
empresa en el último
mes.
D Los potenciales 400 clientes a los que Cada cliente Grado de satisfacción con el nuevo
clientes del nuevo se le regaló el producto. producto: variable cualitativa(8)
producto.
E Todos los clientes de 600 clientes de NVC Cada cliente Grado de satisfacción con el producto
NVC que compraron seleccionados de los que adquirieron en NVC: variable
electrodomésticos en que compraron cualitativa.
el último año. electrodomésticos el
último año.
F Todas las personas en 1000 personas en Cada Candidato que votó: variable
condiciones de votar condiciones de votar votante cualitativa
al momento de seleccionadas de
realizarse la elección, Capital Federal.
en la Capital Federal.

8
Por ejemplo, se pueden usar las siguientes categorías: “Muy satisfecho”, “Moderadamente satisfecho” e
“Insatisfecho”. Cuestionario del caso D, a cargo del estudiante.
66
Actividad 12:
La empresa Nielsen trata de medir la cantidad de personas que ve cada uno de los programa de la
televisión local, en la Ciudad de Córdoba. Además desea cuantificar como los televidentes califican a estos
programas.
a) Conjunto de todas las familias de la ciudad de Córdoba que cuentan con un televisor, en un momento
determinado.
b) Es probable que se tome una muestra aleatoria, por limitaciones económicas y de tiempo.
c) A cargo del estudiante.
Actividad 13:
De los 800 consumidores consultados:
 600 manifestaron que les gustó el plato - Proporción = 0,75
 200 manifestaron que no les gustó el plato - Proporción = 0,25
Teniendo en cuenta los resultados obtenidos, la consultora podría sugerir al fabricante que implemente el
nuevo plato de pastas ZIA MARIA ya que será muy aceptado.
a) Es un ejemplo de Estadística Inferencial. El objetivo de la investigación de mercado es generalizar los
resultados obtenidos en la muestra a toda la población de clientes potenciales que consumiría el nuevo
plato de pastas ZIA MARÍA.
b) Población: todos los potenciales consumidores del nuevo plato de pastas ZIA MARÍA.
Muestra: los 800 consumidores consultados.
Unidad estadística: cada consumidor.
c) Parámetro: proporción de clientes potenciales que consumirían el nuevo plato de pastas en la población.
Estadístico: proporción de clientes potenciales que consumirían el nuevo plato de pastas en la muestra de
800 consumidores. El valor del estadístico es 0,75.
Actividad 14:
La escala de medición es nominal, porque los medios de comunicación no tienen implícito un orden lógico.
Actividad 15:
a) Variable Cualitativa – Escala Nominal
b) Variable Cuantitativa Continua – Escala de Razón
c) Variable Cualitativa – Escala Nominal
d) Variable Cuantitativa Continua – Escala de Razón
e) Variable Cuantitativa Discreta – Escala de Razón
f) Variable Cuantitativa Continua – Escala de Razón
g) Variable Cualitativa – Escala Nominal
h) Variable Cuantitativa Discreta – Escala de Razón

67
Actividad 16:
a) Población: Conjunto de todos los compradores potenciales de cada artículo, de la ferretería en un
periodo de tiempo determinado.
b) Seleccionar una muestra aleatoria de compradores de cada producto, del fichero de clientes.
c) A cargo del estudiante.
Actividad 17:
a) Distribución de frecuencias relativas de la opinión de los habitantes.
Tabla.
Variable Clase Categorías FR
Opinión 1 1. SI 0,70
Opinión 2 2. NO 0,20
Opinión 3 3. NS/NC 0,10
b) Gráfico de Barras para la opinión de los habitantes.

Imagen
Gráfico de torta para la opinión de los habitantes.

Imagen
c) Ambos gráficos se pueden utilizar en forma indistinta ya que en este caso son pocas categorías. En
situaciones donde existan muchas categorías es más informativo el gráfico de barras ya que permite una
mejor visualización de las mismas.

68
Actividad 18:
Tablas
ARCHIVO DE PERSONAL
Variable Tipo de variable Escala de medición
Barrio donde vive el empleado Cualitativa Nominal
Salario Cuantitativa continua Razón
Días de vacaciones Cuantitativa discreta Razón
Días de ausencia por enfermedad Cuantitativa discreta Razón
Edad Cuantitativa continua Razón
Adelantos de sueldo en un mes Cuantitativa continua Razón
determinado

REGISTRO DE LA PRODUCCIÓN
Variable Tipo de variable Escala de medición
Tipo de producto Cualitativa Nominal
Cantidad mensual producida por producto Cuantitativa discreta Razón
Costo de la mano de obra Cuantitativa continua Razón
Costo de materiales Cuantitativa continua Razón

REGISTROS DE INVENTARIO
Variable Tipo de variable Escala de medición
Existencia diaria por producto Cuantitativa discreta Razón
Existencia diaria por insumo Cuantitativa discreta Razón
Descuentos por producto Cuantitativa continua Razón

REGISTROS DE VENTAS
Variable Tipo de variable Escala de medición
Ventas mensuales por producto Cuantitativa continua Razón
Ventas mensuales por región geográfica Cuantitativa continua Razón
Ventas mensuales por tipo de cliente Cuantitativa continua Razón
Canales de venta Cualitativa Nominal

PERFIL DEL CLIENTE


Variable Tipo de variable Escala de medición
Edad Cuantitativa continua Razón
Sexo Cualitativa Nominal
Nivel de ingresos (alto - medio - bajo) Cualitativa Ordinal
Zona donde vive Cualitativa Nominal
Actividad 19:
a) Se deberían analizar las principales características de los potenciales clientes (adultos jóvenes) que se
espera consuman la bebida dietética en cuestión; por ejemplo: género, edad, nivel socio económico, si
practica deportes, si realiza algún tipo de dieta, entre otros.
b) La recolección de los datos se podría efectuar a través de una encuesta administrada a una muestra
representativa de adultos jóvenes.
Actividad 20:
Tabla

69
3 0
4
5
6
7 8
8 0 0 2 4 5 9
9 0 2 6 7 7 9
10 2 3 4 5 9
11 3 3 7
Se observa un valor extremo (3,0) que debería investigarse para determinar si se trata de un valor atípico o
es el resultado de un error en el registro o en la carga de los datos. La distribución de las cotizaciones
muestra una asimetría izquierda.
Actividad 21:
Tabla
Años Total de energía Hidráulica Nuclear Log natural. Total de Log natural. Log
generada energía generada Hidráulica natural.
Nuclear
2008 114724 31456 7330 11,65 10,36 8,90
2009 114337 35093 8162 11,65 10,47 9,01
2010 120011 33300 7171 11,70 10,41 8,88
2011 124802 31309 6371 11,73 10,35 8,76
2012 129007 29308 6395 11,77 10,29 8,76
2013 133705 33333 6207 11,80 10,41 8,73
2014 137181 33345 5514 11,83 10,41 8,62
La gráfica a valores aritméticos muestra un crecimiento en valor absoluto de la energía total generada cada
año, pero no se puede analizar esta variación en términos porcentuales o relativos.

Imagen
A continuación se grafican los logaritmos de la variable (se puede hacer también un gráfico
semilogarítmico), en el cual se puede observar que la energía total generada en términos porcentuales tuvo
un descenso en el año 2009, a partir del cual ha tenido un leve crecimiento hasta el año 2014.

Imagen

70
A continuación se presentan los gráficos comparando la evolución anual de la energía Hidráulica y Nuclear.

Imágenes
c) La variación anual promedio de la energía generada total fue de 3,02 % anual. La energía hidráulica no
tuvo variación, esta fue en promedio del 0,97% anual y la Nuclear tuvo un decrecimiento promedio del
4,63% anual.
Actividad 22:

Imagen
En Gráfico a) se representan ambas variables en términos logarítmicos.
En Gráfico b) se representan los valores originales de ambas variables.

71
Actividad 23:
Diagrama de dispersión:
Precio – Margen de Utilidad

Imagen
Se puede concluir que hay una relación lineal directa (o positiva) entre las variables precio y margen de
utilidad de un producto, es decir a mayor (menor) precio mayor (menor) margen de utilidad.
Actividad 24:
1) Distribuciones de frecuencias.
Tablas de frecuencias
Variable Clase MC FA FR FAA FRA
Zona Norte 1 4 3 0,15 3 0,15
Zona Norte 2 5 4 0,20 7 0,35
Zona Norte 3 6 6 0,30 13 0,65
Zona Norte 4 7 5 0,25 18 0,90
Zona Norte 5 8 2 0,10 20 1,00

Variable Clase MC FA FR FAA FRA


Zona Sur 1 2 1 0,05 1 0,05
Zona Sur 2 3 3 0,15 4 0,20
Zona Sur 3 4 4 0,20 8 0,40
Zona Sur 4 5 5 0,25 13 0,65
Zona Sur 5 6 7 0,35 20 1,00
Gráficos con las frecuencias absolutas simples

Imagen

72
Gráficos con las frecuencias relativas acumuladas

Imagen
2) En la zona norte se realizan entre 4 y 8 pedidos telefónicos por día mientras que en la zona sur, entre 2 a
6. La distribución de la cantidad de pedidos de la zona norte es bastante simétrica alrededor de los 6
pedidos, mientras que la de la zona sur presenta una marcada asimetría izquierda con un pico en el mismo
valor.
Actividad 25:
1) Zona A
Tabla de distribución de frecuencias del precio de venta (en miles de $) de casas en Zona A.
Tablas de frecuencias
Variable Clase LI LS MC FA FR FAA FRA
Precio Zona A 1 [ 90,00 98,00 ] 94,00 10 0,33 10 0,33
Precio Zona A 2 ( 98,00 106,00 ] 102,00 8 0,27 18 0,60
Precio Zona A 3 ( 106,00 114,00 ] 110,00 6 0,20 24 0,80
Precio Zona A 4 ( 114,00 122,00 ] 118,00 4 0,13 28 0,93
Precio Zona A 5 ( 122,00 130,00 ] 126,00 2 0,07 30 1,00
Histograma y Polígono de frecuencias del precio de venta (en miles de $) de casas en Zona A.

Imagen
La distribución de precios de venta (en miles de $) de casas en la Zona A se encuentra entre 90 y 130,
presentando una marcada asimetría derecha. Además el 60% de las casas tienen un precio de venta entre
90 y 106.

73
Zona B
Tabla de distribución de frecuencias del precio de venta (en miles de $) de casas en Zona B.
Tablas de frecuencias
Variable Clase LI LS MC FA FR FAA FRA
Precio Zona B 1 [ 100,00 110,00 ] 105,00 4 0,13 4 0,13
Precio Zona B 2 ( 110,00 120,00 ] 115,00 7 0,23 11 0,37
Precio Zona B 3 ( 120,00 130,00 ] 125,00 10 0,33 21 0,70
Precio Zona B 4 ( 130,00 140,00 ] 135,00 6 0,20 27 0,90
Precio Zona B 5 ( 140,00 150,00 ] 145,00 3 0,10 30 1,00
Histograma y Polígono de frecuencias del precio de venta (en miles de $) de casas en Zona B.

Imagen
Los precios de venta (en miles de $) de casas en la Zona B se encuentran entre 100 y 150. La distribución
es casi simétrica. La mayoría de las casas tienen un precio de venta entre 120 y 130.
2) La distribución de precios de venta (en miles de $) de casas en la Zona A es marcadamente asimétrica
derecha, mientras que en la Zona B se advierte una distribución casi simétrica alrededor de valores entre
120 y 130. Además en la Zona A los precios oscilan entre 90 y 130, mientras que en la zona B, entre 100 y
150.
Actividad 26:
Corresponde interpretar el segundo gráfico con escala logarítmica.
Actividad 27:
a) 22 días
b) El 18,33 % de los 120 días
c) Gráficos

74
Imágenes
d) El 10,83% de los días tienen un nivel de ventas de $1730 o más.
e) La distribución es simétrica.

75

Das könnte Ihnen auch gefallen