Sie sind auf Seite 1von 88

Universidad Nacional

Federico Villarreal

GUÍA ACADÉMICA
INTRODUCCIÓN A LA ESTADÍSTICA
PARA ECONOMISTAS

ECONOMÍA III CICLO

ECON. EDWARD HUAMANI ALHUAY

Euded
Escuela Universitaria

Educación a distancia
INDICE

PRESENTACIÓN 04
INTRODUCCIÓN A LA ASIGNATURA 05
ORIENTACIONES GENERALES DE ESTUDIO 06
TUTORÍAS 07
CRONOGRAMA 07
EVALUACIÓN 08
MEDIOS Y RECURSOS DIDÁCTICOS 09
OBJETIVOS GENERALES 10

UNIDAD 1 CONCEPTOS GENERALES Y SISTEMATIZACIÓN DE DATOS 11

Tema 1: Conceptos Generales de Estadística 12


1.1. La estadística 12
1.2. Clases de estadística 12
1.3. Población 13
1.4. Muestra 13
1.5. Parámetro y Estadígrafo 14
1.6. Variables 14
1.7 Sumatorias 16
Tema 2 Sistematización de Datos en Tablas de Frecuencias 17
2.1. Tabla de Distribución de Frecuencias 17
2.2. Tabla de Frecuencias de una Variable Cualitativa 18
2.3. Tabla de Frecuencias de una Variable Cuantitativa Discreta 19
2.4. Tabla de Frecuencias de Variables Cuantitativas agrupadas en intervalos 20
Tema3 Representaciones Gráficas 22
3.1. Gráficos Estadísticos 22
3.2. Partes de un gráfico 22
3.3. Clasificación de los gráficos 22
ACTIVIDADES 25
AUTOEVALUACIÓN N°1 27

UNIDAD2 MEDIDAS DESCRIPTIVAS NUMERICAS 28

Tema 4 Medidas de Tendencia Central 29


4.1. Concepto y Clasificación 29
4.2. Media Aritmética 29
4.3. Moda 30
4.4. Mediana 32
4.5. Comparación entre la media, moda y mediana 34
Tema 5 Medidas de Dispersión 35
5.1. Concepto y Clasificación 35
5.2. Rango 35
5.3. Varianza y Desviación Estándar 36
5.4. Coeficiente de variación 38
ACTIVIDADES 39
AUTOEVALUACIÓN N°2 41

UNIDAD3 DISTRIBUCIONES BIDIMENSIONALES 42

Temas 6 Distribuciones Bidimensionales 43


6.1. Definición 43

2
6.2. Tablas Estadísticas Bidimensionales 44
6.3. Distribuciones Marginales 45
6.4. Frecuencias Relativas 46
6.5. Grafico Bidimensional 48
Tema 7 Medidas Estadísticas Bidimensionales 49
7.1. Mediciones Marginales 49
7.1.1 Medias Marginales de X e Y 49
7.1.2 Varianzas Marginales de X e Y 49
7.1.3 Desviaciones Estándar Marginales de X e Y 50
7.1.4 Covarianza Entre X e Y 50
7.2. Distribuciones condicionadas 52
Tema 8 Análisis de Correlación y Regresión 54
8.1. Análisis de Correlación 54
8.1.1 Tipos de correlación 54
8.1.2 Diagrama de dispersión 54
8.1.3 Coeficiente de Correlación 55
8.1.4 Niveles de correlación 56
8.2. Análisis de regresión 56
8.2.1 Regresión Lineal simple 57
8.2.2 Recta de mínimos cuadrados 57
8.2.3 Coeficiente de Determinación 58
ACTIVIDADES 59
AUTOEVALUACIÓN N°3 61

UNIDAD4 PROBABILIDADES, SERIES DE TIEMPO Y NUMEROS INDICES 62

Tema 9 Introducción a las Probabilidades 63


9.1. Probabilidades y eventos 63
9.2. Experimento aleatorio 63
9.3. Espacio muestral y eventos 64
9.4. Técnicas de conteo 64
9.5. Concepto clásico de probabilidad 65
9.6. Probabilidad Condicional 66
9.7. Teorema de Bayes 68
Tema 10 Análisis de Series Temporales 69
10.1. Definición 69
10.2. Importancia de las Series de Tiempo 70
10.3. Componentes de una serie cronológica 70
10.4. Análisis de Series de Tiempo 72
10.5. Estudio de la Tendencia 72
Tema 11 Números Índices 77
11.1. Definición 77
11.2. Clasificación de Números Índices 77
11.3. Números Índices Simples 78
11.4. Números Índices Compuestos 79
11.5. Índices Compuestos no ponderados 79
11.6. Índices Compuestos ponderados 80
ACTIVIDADES 82
AUTOEVALUACIÓN N°4 84
SOLUCIONARIO DE AUTOEVALUACIONES 85

3
PRESENTACIÓN

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
4
INTRODUCCIÓN A LA ASIGNATURA

El seguimiento de una economía se basa habitualmente en mediciones o indicadores que


recogen distintos aspectos de la actividad económica de un país o región, estos indicadores
permiten hacer comparaciones y análisis más complejos partiendo de un conjunto de datos
bien recolectados y organizados como por ejemplo una encuesta de hogares para conocer el
nivel económico de los habitantes. Ese proceso se logra mediante técnicas estadísticas que
proporcionan justamente herramientas de recolección, clasificación, organización y análisis de
datos que ayudaran en la toma de decisiones por medio de los indicadores hallados.

El contenido del presente manual se caracteriza primero por la exposición del método
estadístico, sus características y alcance de fenómenos a los cuales son factibles de analizar y
segundo la aplicación del método mediante técnicas con el análisis e interpretaciones
correspondientes. Con lo cual se hace una aportación con ejercicios aplicativos usando la
bondad del método estadístico aplicado a la empresa y la economía en general, cuya
transmisión resultará rápida y atractiva para el estudiante.

Para un mejor aprovechamiento se ha dividido la presente guía en 4 unidades: Unidad I trata


sobre Conceptos generales y sistematización de datos mediante tablas y gráficos, en la Unidad
II se calculan Medidas descriptivas de Tendencia Central y Dispersión más utilizadas, en la
Unidad III se analizan distribuciones bidimensionales así como la correlación y regresión entre
dos variables y en la Unidad IV se hará una introducción a las probabilidades y se analizaran
series temporales y números índices.

En general, el análisis estadístico de cualquier problema económico requiere en una primera


etapa determinar los objetivos y el colectivo informante. A lo largo de este manual se
introducirán los conceptos básicos vinculados a esta fase inicial de un estudio estadístico.
Asimismo se ofrecerá una panorámica de los principales organismos y fuentes que
proporcionan información estadística y se estima que resultara de gran ayuda el poder aplicar
los principales métodos estadísticos en el análisis de la economía y los negocios.

Mg. Edward F. Huamani Alhuay


         

5
ORIENTACIONES GENERALES DE ESTUDIO

Estimados participantes:

La razón de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situación geográfica no son compatibles con la formación
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad académica igual o
superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se
apoyan en la más moderna tecnología informática y de comunicaciones (aulas virtuales) que
permiten un alto grado de interacción y orientación del profesor y una elevada interrelación
entre los estudiantes.

En las aulas virtuales de la Escuela Universitaria de Educación a Distancia, nuestros


estudiantes encontrarán, además de la información detallada del programa, los materiales de
estudio, la agenda de actividades propuestas por los profesores y todas las herramientas de
comunicación que permitirán el desarrollo dinámico del curso. Para comprender y asimilar
adecuadamente el material didáctico del curso, se recomienda lo siguiente:

 Leer, estudiar y trabajar el material didáctico diariamente. Es preferible una hora diaria
durante siete días consecutivos, que 10 horas en un solo día. Las claves del éxito son
continuidad y constancia.
 Organizar el tiempo de estudio según las propias condiciones, dificultades y necesidades
de trabajo; en caso contrario el plan de estudios no se cumplirá.
 Leer varias veces el material y después comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resúmenes, cuadros sinópticos, etc.
 Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las
actividades que tiene en su Texto como en su Guía Académica.
 Estudiar en un lugar donde se sienta cómodo para realizar las lecturas y hacer sus tareas.
En lo posible un lugar con claridad y libre de ruido.

 
 

6
TUTORÍAS

Las tutorías se desarrollarán mediante la programación de un calendario de tutorías. La tutoría


será presencial y virtual.

CRONOGRAMA

CANTIDAD DE HORAS ACADÉMICAS


TUTORÍAS PRESENCIALES
Y VIRTUALES HORAS HORAS
PRESENCIALES VIRTUALES
Semana 1 2 2
Semana 2 2 2
PRIMER MES
Semana 3 2 2
Semana 4 2 2
Semana 5 2 2
Semana 6 2 2
SEGUNDO MES
Semana 7 2 2
Semana 8 2 2
Semana 9 2 2
Semana 10 2 2
TERCER MES
Semana 11 2 2
Semana 12 2 2
Semana 13 2 2
Semana 14 2 2
CUARTO MES
Semana 15 2 2
Semana 16 2 2
32 32
TOTAL
64 HORAS ACADÉMICAS

 
 
 
 

7
EVALUACIÓN

El promedio final de la asignatura de Estadística en la Modalidad Presencial – Virtual se


obtiene aplicando los siguientes pasos porcentuales:
 Evaluación de trabajos académicos presenciales (TA): (40%)
 Evaluación de participación en interacción virtual (IV): (20%).
 Evaluación final (EF): (40%).

PF = TA (0,4) + IV (0,2) + EF (0,4)

El promedio final en la Modalidad Virtual se obtiene aplicando la siguiente ponderación


porcentual:

 Evaluación de trabajos académicos virtuales (TA): (40%)


 Evaluación de participación en interacción virtual (IV): (20%)
 Evaluación final en línea (EF): (40%)

El estudiante que abandona la asignatura tendrá promedio 00 (cero) en el acta final,


debiendo registrar nuevamente su matrícula.

Se consideran como parte de criterios de evaluación la aplicación de un examen


parcial virtual en la 8° semana del ciclo, un examen final presencial y la presentación
de un trabajo monográfico en la 16° semana del ciclo.

8
MEDIOS Y RECURSOS DIDÁCTICOS

(Unidad I,II) Consultar los siguientes textos y enlaces:


 PÉREZ, Rigoberto. Introducción a la Estadística Económica,
Universidad de Oviedo. España 2012

 NEWBOLD, Paul. Estadística para Administración y Economía,


Prentice Hall. Universidad de Alcalá 2008

 DIAZ. Estadística Aplicada a la Administración y la Economía.


Editorial Mcgraw-Hill México 2010

 MOYA, Rufino. Estadística Descriptiva. Editorial San Marcos. Perú


2013

 Referencias electrónicas
 http://www2.ulpgc.es/hege/almacen/download/25/25022/estadstica
itemav.pdf
 http://www.fuenterrebollo.com/Economicas2013/unidimensional-
ejercicios.pdf
 http://herzog.economia.unam.mx/profesor/barajas/estadis/parte1.p
df

(Unidad III-IV)  GUJARATI, Damodar. Econometría Básica. Editorial Mcgraw-


Hill Latinoamericana S.A. Brazil 2008

 CASTILLO. Estadística Descriptiva y Cálculo de


Probabilidades. Editorial Pearson. España 2009

 MOYA, Rufino. Probabilidades e Inferencia Estadística.


Editorial San Marcos. Perú 2012

 Referencias electrónicas:
 http://www2.ulpgc.es/hege/almacen/download/25/25022/estad
sticaitemav.pdf
 http://pendientedemigracion.ucm.es/info/amanece/oferdocs/TA
SAS.pdf

Textos
complementarios  IBM. Manual de Usuario del Sistema Básico de IBM SPSS
Statistics 21. IBM Corporation, EE. UU. 2012

 CARRASCAL, Urcisino. Estadística descriptiva con Microsoft


Excel.Editorial Alfaomega. España 2010
 
 
 
Plataforma
virtual Herramientas a emplearse en plataforma virtual:
 Foros, tareas, chat
 Enlaces, videos, examen, páginas entre otros 
 

9
 
 
OBJETIVOS

GENERALES

 Determinar e identificar los instrumentos para el estudio de la estadística


mediante los conceptos previos así como la sistematización y resumen de datos
cualitativos y cuantitativos unidimensionales realizando un análisis crítico
descriptivo e interpretativo de los resultados

 Calcular e interpretar las medidas descriptivas de tendencia central y dispersión


mediante fórmulas establecidas, siendo capaz de resolver problemas aplicados en
economía así como el uso de las propiedades de medidas descriptivas

 Analizar la dependencia y asociación de variables estadísticas mediante el uso de


modelos lineales y de medidas de asociación en el estudio de los fenómenos
económico-financieros.

 Aplicar la teoría de la probabilidad en sucesos y eventos. Analizar Series de


Tiempo aplicados en economía así como la comparación de datos en distintos
momentos del tiempo usando número índices.

 
 
 
   

10
Unidad

1
CONCEPTOS GENERALES Y
SISTEMATIZACIÓN DE DATOS

 
 
 
 
 
 
 

En esta primera unidad se definirá y explicará los primeros conceptos de Estadística y la


representación y resumen de datos cualitativos y cuantitativos unidimensionales realizando un
análisis crítico descriptivo e interpretativo de los resultados.

OBJETIVOS ESPECÍFICOS

 Conocer los conceptos previos de población y muestra para su aplicación en la solución de


problemas así como diferenciar entre variables cualitativas y cuantitativas.
 Sistematizar y organizar los datos en tablas de frecuencias por medio de los diversos
elementos que se utilizan en la distribución de frecuencias en datos no agrupados y datos
agrupados.
 Presentar y analizar adecuadamente un conjunto de datos mediante gráficos estadísticos
con su correspondiente diseño e interpretación.

Contenido Temático
 Tema I: Conceptos generales de estadística
 Tema II: Sistematización de datos en tablas de frecuencia
 Tema III: Representaciones gráficas

11
Conceptos Generales de
Estadística TEMA

1
1.7. La estadística
1.8. Clases de estadística
1.9. Población
1.10. Muestra
1.11. Parámetro y Estadígrafo §
1.12. Variables
1.13. Sumatorias

1.1. La Estadística

La Estadística es una ciencia que tiene por objeto recolectar, organizar, resumir,
presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A
través de la cuantificación y el ordenamiento de los datos intenta explicar los fenómenos
observados, por lo que resulta una herramienta de suma utilidad para la toma de
decisiones

1.2. Clases de Estadística

Estadística Descriptiva. Son métodos y técnicas de recolección, resumen y


presentación para describir apropiadamente las características de un conjunto de datos.
Comprende el uso de gráficos, tablas y criterios para el análisis y únicamente se limita a
realizar deducciones directamente a partir de los datos y parámetros obtenidos.

Estadística Inferencial. Son métodos y técnicas que hacen posible estimar una o más
características de una población o tomar decisiones sobre población basadas en el
resultado de muestras. Estas conclusiones tienen cierto margen de error. Apoyándose en
el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones,
decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.

12
Podríamos por tanto decir que se usa estadística en descriptiva, cuando los resultados del análisis
no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es
derivar las conclusiones obtenidas a un conjunto de datos más amplio.

1.3. Población

Es el conjunto de unidades o elementos que presentan algunas características comunes,


que han sido escogidos para el estudio y que a partir de ellos se desea obtener la
información. El estudio de la población completa se llama censo y es con frecuencia
costoso, lleva mucho tiempo y no es práctico. Tiene las siguientes características:
 Homogeneidad - que todos los miembros de la población tengan las mismas
características.
 Tiempo - se refiere al período de tiempo donde se ubicaría la población de interés.
 Espacio - se refiere al lugar donde se ubica la población de interés. Un estudio no
puede ser muy abarcador, hay que limitarlo a un área o comunidad en específico.
 Cantidad - se refiere al tamaño de la población. La falta de recursos y tiempo también
nos limita la extensión de la población.

Ejemplos
 Total de amas de casa de Lima metropolitana en Abril del 2015
 Total de proveedores de Supermercados Peruanos en el año 2014
 La totalidad de Empresas pesqueras del Perú en el año 2013

1.4. Muestra
Es una pequeña porción representativa y adecuada de la población. Representativa, en el
sentido de reflejar fielmente las características de la población
de la cual procede y diferir de ella sólo en el número de
unidades incluidas.
Las razones para trabajar con muestras son: Ahorro de
tiempo, ahorro de dinero, facilidades operativas y rapidez en la
obtención de resultados.
Ejemplos:
 500 de amas de casa de Lima metropolitana elegidas al azar.
 Un grupo de proveedores de Supermercados peruanos escogidos aleatoriamente.
 15 empresas pesqueras del Perú escogidas en forma aleatoria.

13
Unidad de Análisis. Son cada uno de los elementos de la población que mediante las técnicas de
muestreo van a ser seleccionados para constituir la muestra
Dato. Valor asociado con un elemento de la población o muestra. Puede ser un número, una palabra
o un símbolo.

1.5. Parámetro y Estadígrafo

Parámetro. Es una medida de resumen que para determinar su


valor es necesario utilizar la información de la población
completa y por lo tanto las decisiones se tomaran con
certidumbre total.

Estadígrafo. Es una medida que se calcula con los datos de la


muestra. Los estadígrafos se usan para hacer inferencias
acerca de los parámetros de la población.

Parámetros más conocidos Estadígrafos más conocidos

Media poblacional  Media muestra x


Varianza poblacional  2
Varianza muestral s 2

Proporción poblacional P Proporción muestral p

1.6. Variable

El término variable se utiliza para referirse a cualquier característica, que toma valores
diferentes en un conjunto de observaciones extraídos de una población en estudio. Es
todo aquello que puede ser medido, observado o manipulado durante un estudio. A
las variables se les denota con las letra: x, y, z
Ejemplo: marca de un producto, factura mensual de
electricidad, número de clientes, genero de una
persona, etc.

Los datos son los valores que adoptan


las variables en cada caso particular
Clasificación de las Variables
 Según su naturaleza: Variables Cualitativas y cuantitativas
 Según su posición en una relación causal: dependientes e independientes

14
A. Según su Naturaleza

A1. Variables Cualitativas. Llamadas también no numéricas, son variables cuyos


valores consisten en categorías de clasificación y responde a una cualidad o atributo.
No es posible realizar operaciones algebraicas con ellas.

Ejemplo: género, calidad de un producto, tipo de teléfono celular, etc.

Las variables cualitativas a su vez pueden clasificarse en:

 Variables cualitativas Nominales. Son aquellas que comprenden solo


categorías de clasificación y no llevan ninguna ordenación Ejemplo: tipo de
empleo, marca de un producto, carrera que uno
sigue, partido político al que voto, tipo de crédito
bancario que uno solicita, etc.
 Variables cualitativas Ordinales. Cuando las
características no solo comprenden categorías
de clasificación sino que llevan alguna
ordenación. Ejemplo: satisfacción con el
servicio, grado de instrucción, jerarquía
gerencial, clase social, el nivel de desempeño,
calidad de un material, etc.

A2. Variables Cuantitativas. Son características cuyos valores pueden ser obtenidos
por medición o por conteo y a su vez pueden ser clasificadas en:
 Variables cuantitativas discretas. Cuando las variables toman valores
enteros y son obtenidos por conteo. Ejemplo: Número de tarjetas de crédito
que se posee, cantidad de entidades bancarias por distrito, número de
empleados por área, número de empresas por sector, etc.
 Variables cuantitativas continuas. Son aquellas que
pueden tomar cualquier valor (entero, fraccionario o
irracional) dentro un intervalo. Sus valores se obtienen
principalmente a través de mediciones y están sujetos
a la precisión de los instrumentos de medición.
Ejemplo: la superficie de un terreno, la estatura de un
individuo, los sueldos de los congresistas, el costo
efectivo de un producto, el PBI anual, el monto de
exportaciones e importaciones, etc.

15
B. Según su posición en una Relación Causal

B1. Variable Independiente. Es aquella que no depende de otras y afecta a otras


variables. Son las características controladas por el
investigador y que afecta o influye a la variable
dependiente
B2. Variable Dependiente. Recibe la influencia o efecto de
la variable independiente. También se le llama variable
respuesta y cumple el papel de efecto causa.
Ejemplo: El clima organizacional de una entidad influye en
el rendimiento y desempeño de los gerentes. De este enunciado identifica:
Variable independiente: Clima organizacional
Variable dependiente: rendimiento humano

1.7. Sumatorias

La suma de los valores de la variable X : x1 , x2 ,........., xn se define mediante la


notación  que indica que han de sumarse los elementos de la sucesión desde el
subíndice i  1 hasta el subíndice i  n , esto es:
n

x
i 1
i  x1  x2  .........  xn

Ejemplo: sean los gastos en alimentos de un ama de casa en 6 días de la semana:

i 1 2 3 4 5 6
xi 30 45 36 52 40 50

Calcular la siguiente sumatoria:


5

x
i2
i
 x2  x3  x4  x5  45  36  52  40  173

Propiedades:
n n
a)  cxi c  xi , para todo constante c
i 1 i 1
n n n
b)   x i  yi    x i   yi
i 1 i 1 i 1
n n n
c)   x i  yi    x i   yi
i 1 i 1 i 1

16
Sistematización de Datos en
Tablas de Frecuencias TEMA

2
2.1. Tabla de Distribución de Frecuencias
2.2. Tabla de Frecuencias de una Variable Cualitativa
2.3. Tabla de Frecuencias de una Variable Cuantitativa
Discreta §
2.4. Tabla de Frecuencias de Variables Cuantitativas
agrupadas en intervalos

2.1. Tabla de Distribución de Frecuencias

Efectuados la clasificación y el conteo de los datos, es necesario presentarlos de manera


clara, sintética y significativa para su mejor y fácil entendimiento. Para ello se recurre a la
tabla de distribución de frecuencias. Una Tabla de distribución de frecuencias de una
variable es una descripción del número de veces, es decir, de las frecuencias con que se
presentan las diversas categorías mutuamente excluyentes que corresponden a esa
variable. Es un arreglo de los valores observados x1 , x2 , .....,xk de la variable x con sus
respectivas frecuencias, en una tabla de la forma:

Tabla N° 1
Variable (xi) fi Fi hi Hi

X1 f1 f1 h1=n1/n h1
X2 f2 f1+f2 h2=n2/n h1+h2

… …. …. …. ….

Xk fk f1+f2+….+nk hk=nk/n h1+h2+….+hk

Total k k


i 1
fi  n h
i 1
i 1

 Frecuencia Absoluta Simple ( f i ), es el número de veces que aparece repetido el valor


k PROPIEDAD: la suma de todas las frecuencias
o cualidad x i , y se cumple que: f
i 1
i n absolutas es igual al total de observaciones (n).

 Frecuencia Absoluta Acumulada ( Fi ), Es la que resulta de sumar sucesivamente las


i PROPIEDAD: La última frecuencia acumulada
frecuencias absolutas, así tenemos: Fi   k 1
fk absoluta es igual al total de observaciones.

17
 Frecuencia Relativa Simple ( hi ), es aquella que resulta de dividir cada una de las

frecuencias absolutas entre el número total de datos. Sus valores son números reales
que oscilan entre 0 y 1. Se denota por:
fi PROPIEDAD: la suma de todas las frecuencias
hi  ; 0  hi  1 relativas es igual a la unidad.
n
 Frecuencia Relativa Acumulada ( H i ), es igual al cociente entre la frecuencia absoluta

acumulada y el número de observaciones realizadas ( n ), o también es la que resulta de


sumar sucesivamente las frecuencias relativas. Se denota por:
i
Fi
Hi    hk PROPIEDAD: La última
acumulada es la unidad.
frecuencia relativa
n k 1

2.2. Tabla de Frecuencias de una Variable Cualitativa

Se usa para clasificar variables cualitativas.

Ejemplo: Un grupo de clientes valora la gestión del


departamento de servicio al cliente de un supermercado
catalogándolo como: Excelente (E), Bueno (B), Regular (R) o
Malo (M). Los resultados obtenidos son:

E B B R E B E B
M B E B R B E R
R R M B B E B M
E M E R R R B R
B B E R R M B E

Organice los datos en una tabla de distribución de frecuencias:

Tabla N° 2
Distribución de clientes según su valoración de la Gestión de
Calidad del departamento del servicio al cliente

Preferencia fi Fi hi Hi
Excelente 10 10 0.25 0.25
Buena 14 24 0.35 0.60
Regular 11 35 0.28 0.88
Mala 5 40 0.13 1.00
Total 50 1

18
Interpretación:
f3: 11 clientes opinaron que la gestión del departamento fue regular
F2: 24 clientes opinaron que la gestión del departamento fue de buena a excelente
h1: El 25% de clientes opinaron que la gestión del departamento fue excelente
H3: El 88% de clientes opinaron que la gestión fue de regular a excelente

2.3. Tabla de Frecuencias de una Variable Cuantitativa Discreta

Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes
valores que toman las variables.

Ejemplo: Se preguntó a 40 empleados de una empresa acerca del


número de tarjetas de crédito que tienen afiliadas a un banco. Sus
respuestas se encuentran a continuación

1 3 1 1 1 2 4 2 1 1
2 2 4 1 2 3 1 2 5 1
4 3 5 1 1 1 2 1 2 2
2 4 3 1 2 1 1 2 3 3

Tabla N° 3
Distribución de empleados según el número de tarjetas de crédito que
poseen en el banco

N° de Tarjetas de fi Fi hi Hi
crédito
1 16 16 0.40 0.4
2 12 28 0.30 0.7
3 6 34 0.15 0.85
4 4 38 0.10 0.95
5 2 40 0.05 1
Total 40 1.00

Interpretación:
f3:6 empleados poseen 3 tarjetas de crédito
F2: 28 empleados poseen menos de 3 tarjetas de crédito
H3: 85% de empleados poseen menos de 4 tarjetas de crédito

19
2.4. Tabla de Frecuencias de Variables Cuantitativas agrupadas
en intervalos

Son aquellas que se utilizan para agrupar datos cuantitativos mediante intervalos de
frecuencias llamados intervalos de clase. Para construir la tabla con intervalos de clase se
debe seguir los siguientes pasos:

 Paso1: Rango (R). Llamado también “recorrido de los datos”, es la diferencia entre el
valor máximo y el valor mínimo de la variable. Consideremos las siguientes variables
y1 , y2 , y3 , ......, yn , entonces: R  Ymax  Ymin
Ejemplo: Los siguientes datos corresponden al tiempo en minutos que han necesitado
16 clientes de un banco para llevar a cabo una transacción bancaria:

5.3 2.4 2.1 1.2 1.3 1.4 5.5 1.6


2.0 2.5 1.1 2.8 3.1 2.8 3.6 4.1

Notamos que el tiempo mayor es 5.5 min y el tiempo menor es 1.1 min; El rango es
R= 5.5-1.1= 4.4

 Paso2: Número de intervalos de clase ( m ). Consiste en dividir el rango en un


número conveniente de intervalos de clase. El número de intervalos depende
principalmente del número de observaciones, sin embargo es recomendable que no
sea menor que 5 ni mayor de 15 intervalos. Para determinar el número de intervalos
usaremos la fórmula de Sturges: m  1  3.32 L og n

Si m es decimal, entonces se redondeará al entero superior inmediato.


Ejemplo: Si n  40 entonces m  1  3.32 L og 40  6.32 , redondeando m  7

Si n  100 entonces m  1  3.32 L og 100  7.64 , redondeando m  8

 Paso3: Amplitud de Clase ( c ). Es el tamaño o longitud que deben tener los


intervalos; se recomienda tener intervalos del mismo tamaño. Se calcula mediante la
R
formula: c 
m

Marca de clase ( yi ). Es la semisuma entre el límite superior y el límite inferior del

LI  LS
intervalo de clase. Sea el intervalo LI  LS  entonces yi 
2

20
Ejemplo: El Boston Bank verificó el estado de la cuenta de 42 clientes tomados al azar y
obtuvo los siguientes datos de sus saldos (en dólares)

271 337 319 363 279 177 232


429 235 123 294 227 295 250
205 159 240 310 199 363 285
459 170 320 309 279 434 325
278 41 181 116 297 162 303
188 294 335 266 100 131 200

Construye una tabla de frecuencias adecuada para esta información e interprete.


Pasos:
 Vmin= 41 Vmax=459 
 Rango : R = 459 – 41 =418
 N° de intervalos : m= 1+3.32*log(42)= 6.4= 7
 Amplitud de intervalo: c= 418/7=59.7 =60

Se construirá una tabla de frecuencias con 7 intervalos y amplitud constante de 60.

Tabla N° 4
Distribución de clientes según saldos que tienen en sus cuentas del
Boston Bank

Li - Ls Yi fi Fi hi Hi
41 - 101 71 2 2 0.05 0.05
101 - 161 131 4 6 0.10 0.14
161 - 221 191 8 14 0.19 0.33
221 - 281 251 10 24 0.24 0.57
281 - 341 311 13 37 0.31 0.88
341 - 401 371 2 39 0.05 0.93
401 - 461] 431 3 42 0.07 1.00
Total 42 1

Interpretación:
f3: 8 clientes tienen un saldo mínimo de $161 pero menos de $221
F4: 24 clientes tienen en sus cuentas un saldo menor a $281
h5: 31% de clientes tienen un saldo mínimo $281 pero menos de $341
H3: ___________________________________________________________________

21
Representaciones Gráficas
3.1. Gráficos Estadísticos TEMA
3.2. Partes de un gráfico
3.3. Clasificación de los gráficos
 Gráfico de Barras  Polígono de frecuencias 3
 Gráfico Circular  Gráfico de Ojivas
 Gráfico Lineal  Gráfico Bidimensional §
 Histogramas

3.1. Gráficos Estadísticos

Los gráficos estadísticos son aquellas imágenes que, combinando la utilización de


sombreado, colores, puntos, líneas, símbolos, números, texto y un sistema de
coordenadas permiten presentar información cuantitativa, con el fin de obtener una
impresión visual global del material presentado, que facilite su rápida comprensión.

3.2. Partes de un gráfico

Los gráficos son una herramienta estadística que detecta la variabilidad, consistencia,
control o mejora de un proceso y consta de las siguientes partes:

• El título principal
• Título secundario o subtítulo
• El gráfico propiamente dicho
• Fuente
• Las notas explicativas
• Interpretación

Interpretación: En el Perú la exportación de langostinos tiene una tendencia creciente


desde 2002 hasta el 2013.

3.3. Clasificación de los gráficos


 Gráfico de Barras  Polígono de frecuencias
 Gráfico Circular  Gráfico de Ojivas
 Gráfico Lineal  Gráfico Bidimensional
 Histogramas

22
3.3.1. Gráfico de Barras. Este diagrama
representa los valores de la variable en el
eje de abscisas levantando en cada punto
una barra de longitud igual a la frecuencia
de ese valor. El ancho de las barras ha de
ser el mismo y las divisiones de la escala,
equitativas.

3.3.2 Grafico Circular. Consiste en dividir


un círculo en tantas porciones como clases
existan, de modo que a cada clase le
corresponde un sector circular proporcional
a su frecuencia absoluta o relativa. Se
utiliza para cualquier tipo de variable,
especialmente cuando las frecuencias
están expresadas en porcentajes. Siempre
va acompañado de una leyenda.

3.3.3 Gráfico lineal. Este diagrama es


utilizado frecuentemente para mostrar
los cambios de los valores de una
variable con el paso del tiempo. Conjunto
de puntos unidos por segmentos de
líneas. Por lo general esta gráfica se
utiliza para mostrar una tendencia

3.3.4 Histogramas. Es una representación


gráfica de una distribución de frecuencias
agrupadas en intervalos de clase, mediante una
serie de rectángulos contiguos. Su gráfica se
realiza entre: (Intervalos vs fi) e (Intervalos vs hi)
Ejemplo: En una muestra de 51 restaurantes de
la ciudad a los cuales se les consultó los precios
de sus platos (en nuevos soles), se obtuvo el
histograma respectivo.

23
3.3.5 Polígonos de Frecuencias. Este
diagrama consiste en una serie de
segmentos de recta que unen los puntos
cuyas abscisas son los valores de la
variable, o las marcas de clase, en el
caso de variables continuas, y cuyas
ordenadas son proporcionales a sus
frecuencias respectivas.

3.3.6 Gráfico de Ojivas. Su objetivo, al


igual que el histograma y el polígono de
frecuencias es representar distribuciones de
frecuencias de variables cuantitativas
continuas, pero sólo para frecuencias
acumuladas.

3.3.7 Gráfico Bidimensional. Distribución de los hogares en el área urbana según su


percepción del nivel de vida de los hogares de su
Permiten representar las series de localidad y nivel de pobreza
datos en dos dimensiones o sea los
66.0% 65.2% 68.3%
valores se representan alineados en 70.0%
60.0%
dos ejes perpendiculares: el eje 50.0% Mejoró
horizontal X y el eje vertical Y. Son 40.0%
29.5% 29.1%
25.4%
Está igual
30.0% Empeoró
aplicaciones estadísticas al estudio 20.0%
4.6% 5.6% 6.2%
10.0%
en conjunto de dos variables
0.0%
Pobre Pobre no No pobre
cualitativas. extremo extremo

24
ACTIVIDADES

EJERCICIOS DE APLICACIÓN DE UNIDAD1


1. Una empresa dedicada a la producción de ciertos artefactos eléctricos está conformada por 120
empleados encargados de ventas. El Gerente desea realizar una proyección de las ventas para los
próximos años y para lograr esto considerará la cantidad de artefactos vendidos en los últimos
meses por 34 empleados escogidos de la empresa. Responda lo siguiente:
a) ¿Cuál es la población y cuál es la muestra?
b) Cual es la variable analizada y su tipo
c) Identifique la estadística y proporcione su valor.
c) Identifique el parámetro de interés e indique su valor

2. Clasificar adecuadamente las diversas variables con un aspa (X):

Nº VARIABLE CUALITATIVA CUANTITATIVA


NOMINAL ORDINAL CONTINUA DISCRETA
1 El monto ahorrado de una persona
2 La altura de los edificios bancarios
3 Situación laboral de un individuo
4 El número de personas sin vivienda
5 El municipio de ubicación de una empresa
6 El desempeño de un economista
7 El Nivel socioeconómico alcanzado
8 Número de empleados por empresa
9 El sector industrial de una empresa
10 El costo de las materias primas

3. Considere la siguiente situación. En una gran compañía, se está desarrollando un programa para
ofrecer a los trabajadores una prestación que les permita adquirir un automóvil nuevo a un costo
moderado tanto para el trabajador como para la empresa. Sin embargo, el contrato de arrendamiento
implica decidir qué tipo de automóvil prefieren los trabajadores, pues en función de esto se podrá
seleccionar la mejor empresa arrendadora. El gerente de recursos humanos realiza un muestreo
aleatorio simple en la nómina de la empresa: selecciona 60 trabajadores sin importar los niveles, y les
aplica una encuesta en la cual les pregunta cuál sería la marca de su preferencia. A continuación se
presentan los resultados.
FORD = F CHEVROLET = CH MAZDA = M VOLKSWAGEN = V NISSAN = N
OTROS = O.

F CH CH F M CH F CH CH O
V F N CH CH CH F CH V V
N CH CH N M M O V F F
CH CH N F CH V V V CH V
M V CH CH V N O V F M
CH V V M CH CH CH O V M

a) Construya una tabla de Distribución de Frecuencia para dichos datos.


b) Interprete las siguientes frecuencias: f3 ; F2 ; h4 ; H 3

25
4. Construye la taba de frecuencias en base a la información dada a continuación:
X i  Precio de productos f3  12 H 2  0.40
X 2  10.5 h1  0.08 n i
 50
X 4  18.5 h4  0.36 m4

5. Se desea realizar un estudio acerca de los gastos mensuales que efectúan los docentes de la
Universidad Villarreal al estudiar un doctorado, para lo cual se tienen los siguientes gastos en soles
de 30 docentes elegidos al azar:

567 559 564 570 564 558


551 568 574 558 563 569
560 578 550 572 569 571
559 558 553 557 556 561
575 565 564 558 563 570

a) Construir la correspondiente tabla de distribución de frecuencias por intervalos.


b) Interpretar: f3 ; F4 ; h6 ; H 5
c) ¿Qué porcentaje de docentes gastan más de S/.564?

6. La empresa SILICON.COM es creadora de software a medida para los Bancos. Al igual que en
cualquier negocio, es importante el tiempo que demoran los clientes para pagar sus facturas. A
continuación se presentan los tiempos en días de una muestra de facturas de esa compañía:

X=Tiempo yi fi Fi hi Hi
[ -  23 7
[ -  31 20
[ -  16
[ - 
[ - ] 60 0.15
Total

a) Completar la tabla de frecuencias b) Interpretar: f3 ; H 3

7. Este histograma representa el número de artículos vendidos en una tienda en una semana,
clasificados según su precio en euros…

a) Construye la tabla de frecuencias.


b) ¿Qué grupo de artículos tuvo mayor venta?

26
AUTOEVALUACIÓN N° 1
1. En una encuesta publicada en el diario EL COMERCIO se preguntó a 2013 adultos lectores: “¿Qué
tan satisfecho está usted con la economía peruana en la actualidad?” (El comercio, 12 de diciembre
de 1997). Las categorías de las respuestas eran Insatisfecho, Satisfecho y No estoy seguro.
Determine:
a) Objetivo del problema _____________________________________________________________
b) Variable y tipo ___________________________________________________________________
c) Población _______________________________________________________________________
d) Muestra ________________________________________________________________________
e) Parámetro ______________________________________________________________________

2. Marca un aspa (X) identificando el tipo de variable


Nº VARIABLE CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 Marcas de cerveza de las tiendas
2 N° de pedidos ingresados al sistema
3 Los interés ganados por un préstamo
4 El nivel de audición de un individuo
5 Opinión sobre la economía actual

3. Los productores del programa televisivo PROMOVIENDO hicieron un estudio sobre los puntos de
rating por día que tiene el programa. Como resultado se obtuvo la siguiente tabla para n de días:
Puntos de Rating y f F h H
i i i i i

[ -  0.10
[ -  11
[ - 26  0.16
[ -  15
[ - 
[ - ] 4 50
TOTAL
a) Completar la tabla de distribución si C= 8
b) Interpretar F3 ________________________________________________________________
c) ¿En cuántos días se obtuvieron por lo menos 34 puntos de rating? _______________________
d) Construya un polígono de frecuencias

4. Analiza Interpreta el siguiente gráfico estadístico acerca de la producción nacional:

________________________________________
________________________________________
________________________________________
________________________________________
________________________________________
________________________________________
________________________________________

27
Unidad

2
MEDIDAS DESCRIPTIVAS
NUMERICAS

 
 
 
 
 
 
 

En esta unidad el estudiante calculará las medidas descriptivas de tendencia central y


dispersión mediante fórmulas establecidas, siendo capaz de resolver problemas aplicados en
economía así como el uso de las propiedades de medidas descriptivas.

OBJETIVOS ESPECÍFICOS

 Calcular e interpretar los diferentes tipos de medidas de tendencia central para su


aplicación en distintos problemas de economía según se trate de datos agrupados y no
agrupados.
 Identificar y calcular las medidas de dispersión que más se utilizan en la solución de
problemas con datos que presentan variación así como la interpretación y comparación
de la variabilidad de dos o más distribuciones de datos.

Contenido Temático
 Tema IV: Medidas de Tendencia central
 Tema V: Medidas de Dispersión o Variabilidad

28
Medidas de Tendencia Central
4.1. Concepto y Clasificación TEMA
4.2. Media Aritmética
4.3. Moda
4.4. Mediana 4
4.5. Comparación entre la media, moda y mediana
§

4.1. Concepto y Clasificación

Se denominan también medidas de centralización, son aquellos valores numéricos en


torno a los cuales se agrupan, en mayor medida, los valores de una variable e indican el
centro de la distribución de los datos, es decir es el valor representativo de estos. Las más
comunes son:
 Media Aritmética
 Mediana
 Moda

4.2. Media Aritmética

La Media Aritmética o simplemente media es el estadígrafo de tendencia central mas


importante y comúnmente se le conoce como Promedio. La Media Aritmética se define
como el cociente de la suma de los valores de una variable entre el número de

observaciones o valores. Simbólicamente se denota con X

4.2.1 Calculo de la Media para Datos no Agrupados


Se calculará cuando se tiene un conjunto de “n” observaciones que no estan
agrupados en tablas de frecuencias. Se calcula con la siguiente formula:
n


i 1
Xi
X1  X 2  ...........  X n
X 
n n

Ejemplo: Sea una muestra del precio de 7 libros de economía: 73, 68, 59, 40, 81, 72 y
40. Calcula e interprete la media aritmética.
Interpretación: El precio

73  68  59  40  81  72  40 medio de los libros de


X  61.86
7 economía es de S/. 61.86

29
4.2.2 Calculo de la Media para Datos Agrupados
Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luego
se calcula la media aritmética aplicando la fórmula:
n

fy i i
Donde:
fi= frecuencia absoluta
x i 1
yi= Marca de clase
n n = número de observaciones

Ejemplo: A continuación se muestra la producción anual de caña azúcar en miles de


toneladas en 80 haciendas del departamento Lambayeque. Calcule la media
aritmética e interprete:
Producción
 LI  LS  yi fi fi  yi
[5  12 8.5 10 85
[12  19 15.5 14 217
[19  26 22.5 28 630
[26  33 29.5 20 590
[33  40 36.5 8 292
TOTAL n =80 1814

Aplicando la formula se tiene: x 


fy i i

1814
 22.68
n 80
Interpretación: La producción anual media de caña de azúcar en las haciendas de
Lambayeque es de 22680 toneladas

4.3. Moda (Mo)

La moda es el dato que aparece más veces en un grupo. Es el valor que más se repite o el
que se presenta con mayor frecuencia en un conjunto de datos. La moda puede ser:

30
4.3.1 Calculo de la Moda para Datos no Agrupados
Se ordenan los datos en forma creciente o decreciente y se ubica los valores que más
se repiten.
Ejemplo: Los datos de rendimiento por acción para una muestra de 8 empresas son
los siguientes: (Hallar la moda en los tres casos)

a) 2.2; 3.4; 2.1; 3.4; 2.2; 2.2; 1.8; 2.2 Mo= 2.2

b) 1.2; 2.5; 2.1; 2.4; 2.4; 2.4; 1.2; 1.2 Mo= 1.2 y 2.4

c) 1.9; 2.5; 2.3; 2.4; 1.4; 3.4; 2.2; 1.2 Mo= no existe moda

4.3.2 Calculo de la Moda para Datos Agrupados


Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luego
se calcula la Moda aplicando la fórmula:

 1 
M o  LI  c j  
  2  1 

Donde:

LI : Límite inferior de la clase modal


c j : Amplitud del intervalo de la clase modal
 1  f j  f j 1
 2  f j  f j 1
f j : Frecuencia absoluta modal
f j 1 : Frecuencia absoluta anterior a la frecuencia modal
f j 1 : Frecuencia absoluta posterior a la frecuencia modal

Observaciones:
 La moda se puede determinar en todos los dos tipos de variables cualitativas y
cuantitativas.
 La moda tiene la ventaja de no ser afectada por valores extremos

Ejemplo: Calcule e interprete la moda de la la producción anual de caña azúcar en


miles de toneladas en 80 haciendas del departamento Lambayeque.

31
Producción
 LI  LS  yi fi
[5  12 8.5 10
[12  19 15.5 14
[19  26 22.5 28
[26  33 29.5 20
[33  40 36.5 8
TOTAL n =80

Pasos:
 Ubicamos primero la mayor frecuencia: f j  28

 Luego la moda se encuentra en la clase 19 - 26, por lo tanto


 LI  19 ; f j  28 ; f j 1  14 ; f j 1  20 c j  7

 1  28  14  14 ;  2  28  20  8

 14 
Mo  19  7    23.455
 14  8 
Interpretación: La producción anual que más se repite es 23455 Tm, lo que significa
que la mayoría de las haciendas producen esa cantidad.

4.4. Mediana (Me)

Es el valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma
cantidad de elementos, es decir la media se encuentre exactamente en el centro. La mitad
de los datos son menores que la mediana y la otra mitad son mayores.

4.4.1 Mediana de Datos no Agrupados


Para determinar la Mediana de n observaciones x1 , x2 ,........., xn primero se ordenan

dichas observaciones descendentemente ó ascendentemente luego se ubica o se


calcula la mediana dependiendo de la cantidad de datos “n” si es par o impar:

32
 Ejemplo1. (Cuando el nº de datos es impar)
17, 24, 20, 18, 22, 21, 24; Ordenando: 17, 18, 20, 21, 22, 24, 24 (n=7 impar)
7 1
Posicion  4 Me  21
2
 Ejemplo2. (Cuando el nº de datos es par)
13 , 14, 7, 11, 15, 16, 12, 9 ; ordenando: 7, 9, 11, 12, 13, 14, 15, 16 (n=8 par)
12  13
Me   12.5
2

4.4.2 Mediana para Datos Agrupados


Cuando se trabajan con tablas de frecuencias de intervalos, la fórmula para calcular la
mediana es:

 n 
 2  F j 1 
Me  LI  c j  
 F j  F j 1 
 
Donde:
LI : Límite inferior de la clase mediana

c J : Amplitud del intervalo de la clase mediana


n : número total de observaciones o datos
F j : Frecuencia acumulada de la clase mediana

Fj 1 :Frecuencia acumulada anterior de la clase mediana.

Ejemplo: Calcule e interprete la mediana de la la producción anual de caña azúcar


en miles de toneladas en 80 haciendas del departamento Lambayeque.

Producción
 LI  LS  yi fi Fi
[5  12 8.5 10 10
[12  19 15.5 14 24
[19  26 22.5 28 52
[26  33 29.5 20 72
[33  40 36.5 8 80
TOTAL n =80

33
Pasos:
n 80
i) Calcular   40 y ubicar en los Fi
2 2
ii) Luego la mediana se encuentra en la clase [19  26 , por lo tanto:

LI  19 ; Fj  52 ; Fj 1  24 ; ; c j =7

 40  24   16 
Me  19  7    19  7    23
 52  24   28 

Interpretación: El 50% de las haciendas producen anualmente una cantidad menor


o igual a 23000 toneladas.

4.5. Comparación entre la media, moda y mediana

 Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
 En una distribución con sesgo positivo, la moda se halla en el punto más alto de la
distribución, la mediana está hacia la derecha de la moda y la media más a la derecha.
Es decir Mo < Me < x (a)
 En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está
a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir
x < Me < Mo (b)

Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser
la mejor medida de posición. La mediana no se ve influida por la frecuencia de aparición de
un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores
extremos como la media.

34
Medidas de Dispersión
5.1. Concepto y Clasificación TEMA
5.2. Rango
5.3. Varianza y Desviación Estándar
5.3.1 Para datos no agrupados 5
5.3.2 Para datos agrupados
5.4. Coeficiente de variación §

5.1. Concepto y Clasificación

La dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las
diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor
concentración de los datos en torno a un valor central. Las más comunes son:
 Recorrido o rango
 Varianza
 Desviación Estándar o Típica
 Coeficiente de Variación

Ejemplo: Dados los siguientes histogramas ¿en cuál de los gráficos existe mayor
dispersión?

Según los histogramas el


gráfico (d) presenta mayor
dispersión y el gráfico (a)
menor dispersión o poca
variabilidad.

5.2. Rango o recorrido

El rango es la diferencia entre los datos mayor y menor del conjunto. También se llama
“recorrido”. En un conjunto de datos, mientras mayor sea el rango, mayor será su
dispersión y mientras menor sea su rango, menor su dispersión. Su fórmula es:

R  X max  X min

35
Ejemplo: A continuación se muestran las utilidades de 10 corporaciones industriales
estadounidenses más grandes en millones de dólares. Calcular el rango de los datos.

Utilidades($millones) 242 580 187 258 515 234 213 597 212 268

R  597  187  410 (Millones de dólares)

5.3. Varianza y Desviación Estándar

La Varianza es un valor numérico que cuantifica el grado de dispersión de los valores de


una variable respecto a su media aritmética. La Varianza y la Desviación Estándar son las
medidas de dispersión más importantes. Si se trabaja con la población se calcula la
varianza poblacional (2) y si se toma una muestra se calcula la varianza muestral (s2)

 Para Datos No Agrupados


TIPO VARIANZA DESVIACIÓN
ESTÁNDAR

 Xi  X 
N 2

POBLACIONAL 2

i 1  Xi  N X 2 2

 V(X)     V(X )
N N
n n

  xi  x   xi2  nx
2 2
MUESTRAL
s2  V ( x)  i 1
 i 1
s  V ( x)
n 1 n 1

 Para Datos Agrupados


TIPO VARIANZA DESVIACIÓN
ESTÁNDAR

fi  X i  X 
N 2 N

 
2
fi X i  N X2
POBLACIONAL i 1 i 1
 2 V(X )     V(X)
N N
n n

 f i  xi  x   fi xi2  nx
2 2
MUESTRAL
s2  V ( x)  i 1
 i 1
s  V ( x)
n 1 n1

Observaciones:
 A la desviación estándar también se la llama desviación típica y es la raíz
cuadrada de la varianza. La varianza nunca es negativa.

36
 Cuando la variable toma un único valor; es decir cuando es constante entonces la
varianza es cero.
 Mientras más se aproxima a cero, más concentrados están los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la varianza, más
dispersos están.

5.3.1 Cálculo de la varianza y desviación estándar para datos no agrupados


Ejemplo: en una fábrica ensambladora de autos se desea analizar el tiempo que
demora un empleado en terminar de armar una puerta. A continuación se tienen
los tiempos en minutos de dicho empleado al armar 10 puertas:

39 29 43 52 39
44 40 36 44 35

Calcule e interprete la Varianza y Desviación Típica.

 Hallamos primero la media: x  40.1

 39  40.1   29  40.1  .......   35  40.1


2 2 2

 Varianza : s 2
  38.77
10  1

 Desviación estándar : s  38.77  6.23

Interpretación: Los tiempos que tardan en armar una puerta se alejan de la media
en 6.23 minutos aproximadamente por puerta.

5.3.2 Cálculo de la varianza y desviación estándar para datos agrupados


Ejemplo: A continuación se muestra la producción anual de caña azúcar en miles de
toneladas en 80 haciendas del departamento Lambayeque:
Producción
 LI  LS  yi fi fi  yi fi yi 2
[5  12 8.5 10 85 722.5
[12  19 15.5 14 217 3363.5
[19  26 22.5 28 630 14175
[26  33 29.5 20 590 17405
[33  40 36.5 8 292 10658
TOTAL n =80 1814 46324

37
Calcula la media, varianza y desviación estándar:
fi xi 1814
 Determinando la media: x   n

80
 22.68

46324  80(22.68) 2
La Varianza es: s   65.49
2

80  1

 La Desviación Estándar es s  s 2  65.49  8.09

Interpretación: La cantidad producida por las haciendas se desvían de su media


aritmética en 8.09 toneladas aproximadamente.

5.4. Coeficiente de Variación

Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de
hacer comparaciones entre muestras. No tiene unidades de medida. Siempre se
expresa en porcentajes, no en términos de la unidad de medida de los datos
estudiados. Se calcula mediante la fórmula:

S
C .V %   100 (Coeficiente de variación muestral)
X
Observación:
 Al realizar comparaciones entre dos variables, el C.V. más pequeño será el que
tenga menor dispersión relativa.
 Un C.V. mayor a 30% indica un alto grado de dispersión y pequeña representatividad
de la media, pero cuanto menor sea a 30% la media será más representativa.

Ejemplo: Supongamos que dos empresas repartieron sus beneficios entre sus
principales accionistas, y que el reparto se realiza de la siguiente forma:
Empresa A Empresa B

Media Aritmética 25000 125000


Desviación Estándar 19148.54 12909.94

¿Cuál de los dos repartos es el más equitativo?


Solución: Calculamos el coeficiente de variación para ambas empresas:
Empresa A Empresa B

C.V. 0.766 0.103

Comparando los dos coeficientes se observa que la empresa B tiene el menor


coeficiente, por lo tanto dicho empresa tiene los repartos más equitativos.

38
ACTIVIDADES

EJERCICIOS DE APLICACIÓN DE UNIDAD2

1. Los sueldos de cinco empleados de una empresa son: $4000, $5000, $4500, $6000 y $35000. Calcula
el sueldo medio, la moda, si es que existe, y la mediana e indica cuál representa mejor a los datos.

2. Se desea analizar el precio de las viviendas en el municipio de Villa el Salvador para ello tras un
minucioso estudio en el registro de la propiedad y una agrupación de los datos se obtiene que
durante los primeros 5 meses del presente año los precios vienen reflejados en la tabla siguiente y las
unidades vienen dadas en miles de euros.

Precio yi fi Fi yi fi
[ 12 – 16  3
[ –  14
[ –  33
[ –  21
[ – ] 9
Total

a) Calcule el precio medio, moda y mediana e interprete


b) Calcule e interprete la varianza, desviación estándar y coeficiente de variación
.
3. En el departamento de bienestar de cierto municipio se realiza una encuesta en un condominio para
estimar el monto mínimo diario para cubrir la canasta familiar de los vecinos:

Monto mínimo fi
65 11
66 15
67 9
68 5
69 2
Total

Calcule e interprete las medidas de tendencia central media, moda y mediana

4. En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el siguiente
histograma de frecuencias, entonces la nota promedio del curso y la desviación estándar son:

yi fi yi fi
[ – 
[ – 
[ – 
[ – 
[ – 
[ – ]
Total

39
5. Dado el siguiente cuadro estadístico sobre el número de empleados de un grupo de compañías
azucareras con ancho de clase constante igual a 20. Determine la media, moda y mediana de los
datos e interpreta.
Li  Ls  Yi fi Fi Yi fi
 -  880
 -  1950
 -  35 1800
 -  13
 - 200 
 - ] 4 70
Total

6. Los costos de fabricación, en soles, de siete objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77,
9.00, 9.36 si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5 soles,
calcular la utilidad media por objeto.

7. En una encuesta sobre bienes y raíces en la Urbanización Santa Eulalia, se obtiene entre otras cosas,
información sobre el valor actual de la casa y el tamaño del lote de terreno. Se está interesado en
determinar si el valor de avalúo tiene mayor variabilidad que el tamaño del lote. De la mencionada
encuesta se consigue lo siguiente:

Valor de la casa Tamaño del terreno

Media= S/350.00 Media = 120 m2

Desviación estándar=S/ 50.00 Desviación estándar = 5m2

8. En un estudio comparativo de los rendimientos de ciertos bonos, se elaboró la siguiente distribución


de los rendimientos al vencimiento de una muestra de 50 bonos.
Resumen yi Números de fi  yi fi  yi2
porcentual bonos
6.0 -7.9 4
8.0 -9.9 5
10.0 -11.9 11
12.0 -13.9 21
14.0 -15.9 9
Total

a) Determina la media y la desviación típica


b) Se puede concluir que los rendimientos son uniformes

9. Se realiza un estudio sobre los gastos mensual en alimentación en tres niveles socioeconómicos. Se
cuenta con la siguiente información:

Nivel A Nivel B Nivel C


Gasto promedio 4000 2500 900
Desviación estándar 520 310 120

¿En qué nivel socioeconómico los gastos son más homogéneos?

40
AUTOEVALUACIÓN N° 2
1. Indique si son verdaderas o falsas las siguientes afirmaciones

Afirmación V F
a) El valor de la mediana solo se puede calcular en variables cuantitativas
b) La desviación estándar es siempre menor que la varianza
c) Si las unidades están en minutos, la varianza se expresa en minutos al cuadrado
d) El rango es la diferencia entre el valor máximo y el valor mínimo
e) Dentro de un conjunto de datos puede existir más de una moda

2. La venta semanal en florería el ROSAL es la siguiente:

Precios yi fi Fi fi  yi fi  yi2
(Clientes)
[25 – 35) 25
[35 – 45 ) 40
[ 45 – 55) 13
[55 – 65 ) 38
[65 – 75 ) 15
TOTAL

a) Calcule la media, moda, mediana e interprete


a) Calcula La Varianza, desviación estándar en interpreta
b) ¿Se puede decir que la distribución de precios es uniforme? Justifique su respuesta

3. Se clasifica a los Gerentes de acuerdo a grado de responsabilidad obteniéndose los siguientes


resultados respecto de su sueldo promedio anual:

a) ¿Qué medida me permite comparar la dispersión de sueldos?


b) Calcule el coeficiente de variación para cada grupo y responda ¿Qué grupo es más homogéneo
en sus sueldos?

4. Enseguida, aparecen los números de automóviles vendidos por dos agentes, por arriba y por debajo
de sus cuotas de ventas, en seis períodos semanales:

Vendedor 1 3 5 -1 4 3 4

Vendedor 2 2 5 4 -1 4 2

a) Calcule la desviación estándar de cada una de estas muestras


b) ¿Cuál de las dos muestras es más homogénea?

41
Unidad

3
DISTRIBUCIONES
BIDIMENSIONALES

 
 
 
 
 
 
 
 
 
 
 
 
 
En esta unidad se analizará la dependencia y asociación de variables estadísticas mediante el
uso de modelos lineales y de medidas de asociación en el estudio de los fenómenos
económico-financieros.

OBJETIVOS ESPECÍFICOS
 Clasificar datos cuantitativos bidimensionales en forma sistemática, aplicando las técnicas
de la estadística descriptiva.
 Resumir datos cuantitativos bidimensionales, aplicando medidas estadísticas descriptivas y
realizando un análisis crítico e interpretativo de los resultados.
 Determinar la correlación y regresión lineal existente entre dos variables X e Y. Dominar los
métodos de regresión simple, análisis de correlación y coeficiente de determinación.

Contenido Temático
 Tema VI: Distribuciones Bidimensionales
 Tema VII: Medidas estadísticas bidimensionales
 Tema VIII: Análisis de Correlación y Regresión

42
Distribuciones Bidimensionales
6.1. Definición TEMA

6
6.2. Tablas Estadísticas Bidimensionales
6.3. Distribuciones Marginales
6.4. Frecuencias Relativas
6.5. Grafico Bidimensional
§

6.1. Definición

Las distribuciones bidimensionales son


aquellas en las que se estudian al mismo
tiempo dos variables de cada elemento
de la población. Estas variables pueden
ser cuantitativas o cualitativas. Por
ejemplo: peso y altura de un grupo de
estudiantes; edad y horas de lectura;
usuario y turno de asistencia, etc.
Se desarrollaran un conjunto de técnicas
que permite describir las relaciones que ligan a esas dos variables o a esos dos atributos,
para establecer el grado de dependencia o asociación entre ellos, así como para estimar
una de ellas a partir del comportamiento de la otra.

Ejemplo1: Entre los empleados de una empresa se ha realizado una encuesta sobre el
consumo del tabaco, que ha arrojado los siguientes resultados:

Habito Fumadores No fumadores Totales de


Sexo filas

Varones 49 64 113
Mujeres 43 37 80

Totales de 92 101 193


columnas

Interpretación: 49 empleados son varones y fumadores, 43 empleados son mujeres y


fumadoras, etc.

43
6.2. Tablas Estadísticas Bidimensionales

Consideremos un conjunto de n observaciones para dos variables X e Y en forma


simultánea:

x1 , x2 , x3 , ......, xk las k modalidades o valores de la variable x

y1 , y2 , y3 , ......, ye las l modalidades o valores de la variable y

Una tabla de distribución de frecuencias bidimensional es una tabla de doble entrada que
agrupa en filas las modalidades o valores de X, y en columnas las modalidades o valores
de la característica Y (tabla de kxe, k-filas y e-columnas)

Y y1 y2 y3 .........ye TOTAL
X fi.
x1 f11 f12 f13 .........f1e f1.
x2 f21 f22 f23 .........f2e f2.
x3 f31 f32 f33 .........f3e f3.
. . . . ............ .
. . . . …......... .
. . . . ……..... .
xk fl1 fl2 fl3 .........fke fk.
k e
TOTAL f.j f.1 f.2 f.3 f.e n   f ij
i 1 j 1

Donde:

f ij = número de veces que aparece repetido el par ( xi , y j ) y se llama frecuencia

absoluta.
e
f i .   f ij = Frecuencia marginal de xi . , es el total de cada fila.
j 1

k
f . j   f ij = Frecuencia marginal de y. j , es el total de cada columna.
i 1

k e
n   f ij = número total de pares observados
i 1 j 1

44
Ejemplo 2: Dada la distribución bidimensional:

X 1 2 1 2 3 2 2 2 3 1
Y 3 5 2 3 5 4 3 5 5 3

Su la tabla de frecuencias bidimensional correspondiente es:

Y 2 3 4 5 Frec. absolutas
X marginales de X

1 1 2 0 0 3
2 0 2 1 2 5
3 0 0 0 2 2
Frec. absolutas 1 4 1 4 n=10
marginales de Y

6.3. Distribuciones Marginales

Son tablas que representan a la variable X y sus frecuencias marginales y de igual manera
a la variable Y con sus frecuencias marginales:

Distribución marginal de X Distribución marginal de Y


X fi . Y f. j
x1 f 1. y1 f .1
x2 f 2. y2 f .2
x3 f 3. y3 f .3
. . . .
. . . .
xk fk . Ye f. j
Total k Total e
n   fi . n   f. j
i 1 j 1

45
Ejemplo 3: del ejemplo 2 obtener la distribución marginal de X e Y

Distribución marginal de X Distribución marginal de Y


X fi . Y f. j
1 3 2 1
2 5 3 4
3 2 4 1
Total 10 5 4
Total 10

6.4. Frecuencias Relativas

En muchas situaciones en vez de trabajar con las frecuencias absolutas, podemos


construir tablas con las frecuencias relativas (proporciones), como se hizo en el caso
unidimensional. Sin embargo aquí existen 3 posibilidades de expresar la proporción de
elementos en cada celda:

f ij
i) Con relación al total general y se llama frecuencia relativa hij 
n
f ij
ii) Con relación al total de cada fila hij 
fi .
f ij
iii) Con relación al total de cada columna hij 
f. j

De acuerdo al objetivo de cada investigación, una de estas proporciones será la más


conveniente para ser usada.

Ejemplo 4: Supongamos que queremos analizar el comportamiento conjunto de las


variables: Grado de instrucción (Y), y región de procedencia (X) de los empleados del
Ministerio de Salud. Los datos están agrupados en la siguiente tabla de doble entrada:

46
Y Primaria Secundaria Superior Total
X Completa Completa
Costa 40 30 20 90
Sierra 35 15 10 60
Selva 30 15 5 50
Total 105 60 35 n=200

a) Hallar la distribución conjunta de las proporciones con relación al total general


b) Hallar la distribución conjunta de las proporciones con relación al total de cada fila
c) Hallar la distribución conjunta de las proporciones con relación al total de cada columna.

Tabla A: Distribución conjunta de las proporciones con relación al total

Y Primaria Secundaria Superior Total


X Completa Completa
Costa 20.0% 15.0% 10.0% 45.0%

Sierra 17.5% 7.5% 5.0% 30.0%

Selva 15.0% 7.5% 2.5% 25.0%

Total 52.5% 30.0% 17.5% 100.0%

Interpretación: El 20% de los empleados son de la costa y tienen primaria completa. El


2.5% son de la selva y tienen estudios superiores. El 45% son de la costa, el 52.5% tienen
primaria completa.

Tabla B: Distribución de las proporciones con relación al total de cada fila

Y Primaria Secundaria Superior Total


X Completa Completa
Costa 44.4% 33.3% 22.2% 100.0%

Sierra 58.3% 25.0% 16.7% 100.0%

Selva 60.0% 30.0% 10.0% 100.0%

Total 52.5% 30.0% 17.5% 100.0%

Interpretación: El 44.4% de los empleados de la costa tienen primaria completa, el 16.7%


de los empleados de la sierra tienen estudios superiores.

47
Tabla C: Distribución de las proporciones con relación al total de cada Columna

Y Primaria Secundaria Superior Total


X Completa Completa
Costa 38.1% 50.0% 57.1% 45.0%

Sierra 33.3% 25.0% 28.6% 30.0%

Selva 28.6% 25.0% 14.3% 25.0%

Total 100.0% 100.0% 100.0% 100.0%

Interpretación: El 38.1% de los empleados con primaria completa son de la costa, el 25%
de los empleados con secundaria completa son de la sierra.

6.5. Grafico Bidimensional

Permiten representar las series de datos en dos dimensiones o sea los valores se
representan alineados en dos ejes perpendiculares: el eje horizontal X y el eje vertical Y.
Son aplicaciones estadísticas al estudio en conjunto de dos variables cualitativas.

Ejemplo: tomando en cuenta el ejemplo anterior de la distribución conjunta de las


proporciones del Grado de instrucción (Y), y región de procedencia (X) de los empleados
del Ministerio de Salud con relación al total tenemos el siguiente gráfico:

20.0%
20.0 17.5%
18.0
15.0% 15.0%
16.0
14.0
12.0 10.0%
10.0 7.5%7.5%
8.0 5.0%
6.0
4.0 2.5%
2.0
0.0
Primaria Completa Secundaria Superior
CostaCompleta
Sierra Selva

48
Medidas Estadísticas
Bidimensionales TEMA

7.1. Mediciones Marginales


7.1.1 Medias Marginales de X e Y
7
7.1.2 Varianzas Marginales de X e Y: §
7.1.3 Desviaciones Estándar Marginales de X e Y
7.1.4 Covarianza Entre X e Y
7.2. Distribuciones condicionadas

7.1. Mediciones Marginales

Sabemos que las distribuciones marginal de X son los totales de las filas y la distribución
marginal de Y son los totales de las columnas, dichos totales vendrían a ser sus
frecuencias absolutas. (Ver tema 6)

Distribución marginal de X Distribución marginal de Y


X fi . Y f. j
x1 f 1. y1 f .1
x2 f 2. y2 f .2
x3 f 3. y3 f .3
. . . .
. . . .
xk fk . Ye f. j
Total k Total e
n   fi . n   f. j
i 1 j 1

7.1. 1 Medias Marginales de X e Y:

k e

f i. xi f
j 1
.j yj
x i 1
y
n n
7.1.2 Varianzas Marginales de X e Y:

k e

f i. x  nx
2
i
2
f
j 1
.j y 2j  ny 2
s 2X  i 1
sY2 
n1 n

49
7.1.3 Desviaciones Estándar Marginales de X e Y:
Sabemos por la clase de medidas de dispersión que la desviación estándar es la raíz
cuadrada de las varianzas marginales:

k e

 f i . xi2  nx 2 f
j 1
.j y 2j  ny 2
sX  i 1
sY 
n1 n

7.1.4 Covarianza Entre X e Y


La covarianza es una medida de asociación lineal más simple entre dos variables X e
Y está definida como:

1 k e
s XY   f ij xi yi  x.y
n i 1 j 1

 Si Sxy > 0 hay dependencia directa (positiva), es decir, a grandes valores de x


corresponden grandes valores de y.
 Si Sxy = 0 Una covarianza 0 se interpreta como la no existencia de una relación lineal
entre las dos variables estudiadas.
 Si Sxy < 0 hay dependencia inversa o negativa, es decir, a grandes valores de x
corresponden pequeños valores de y.

Ejemplo1: En una encuesta efectuada en una población se obtuvo la siguiente


información, relativo al número de habitantes (X) y número de dormitorios (Y), en una
muestra de 50 viviendas. Los cuales se agruparon en la siguiente tabla bidimensional.

Y 1 2 3 4 Total
X
2 6 0 0 0 6
3 7 4 0 0 11
4 10 5 1 0 16
5 0 9 0 0 9
6 1 2 2 0 5
8 0 0 1 2 3
Total 24 20 4 2 50

a) Hallar las frecuencias marginales, acumuladas y relativas para X e Y


b) Hallar las medias, varianzas y desviaciones estandar marginales
c) Hallar la covarianza e interpretar

50
Solución:
a) Frecuencias marginales, acumuladas y relativas para X e Y

a1) Distribución Marginal de X


xi fi . Fi . hi .
2 6 6 12%
3 11 17 22%
4 16 33 32%
5 9 42 18%
6 5 47 10%
8 3 50 6%
TOTAL n =50 100%

a2) Distribución Marginal de Y


yj f. j F. j h. j

1 24 24 48%
2 20 44 40%
3 4 48 8%
4 2 50 4%
TOTAL n =50 100%

b) Medias y Varianzas Marginales

xi fi f i . xi . f i . xi2
2 6 12 24
3 11 33 99
4 16 64 256
5 9 45 225
6 5 30 180
8 3 24 192
50 208 976

x
fx i i

208
 4.16 s X2 
976  50(4.16)2
 2.26 s X  1.5
n 50 49
yj f. j
f j . yi . f j . x 2j
1 24 24 24
2 20 40 80
3 4 12 36
4 2 8 32
50 84 172

y
f j yj

84
 1.68 sY2 
172  50(1.68)2
 0.63 sY  0.79
n 50 49

51
a) Covarianza X Y

1 k e 393
s XY   f ij xi yi  x .y   ( 4.16 )( 1.68 )  0.872
n i 1 j 1 50

Interpretación: como 0.872 >0, existe una asociación directa entre el número de
habitantes y numero de dormitorios es decir, a mayor número de habitantes mayor
cantidad de dormitorios por vivienda.

7.2. Distribuciones Condicionadas

Sea (X,Y) una variable estadística bidimensional tal que X presenta k-modalidades y la
variable Y e-modalidades mutuamente excluyentes. La distribución de la variable X
condicionada a que la variable Y tome el valor fijo yi ( j  1, 2, ..., e ) está dado en la tabla:

Tabla 1: Distribución de la variable X condicionada a Y  yj

x1 x2 ........ xk Totales
Frecuencia absoluta de X
condicionada a Y  yj f1 j f2 j ……. f kj f. j
fX Y y
j
Frecuencia relativa de X
condicionada a Y  yj f1 j f2 j ……. f kj 1
hX Y  y f. j f. j f. j
j
 De igual manera la distribución de la variable Y condicionada a que la variable X tome el
valor fijo xi ( i  1, 2, ..., k ) está dado en la tabla:

Tabla 2: Distribución de la variable Y condicionada a X  xi


y1 y2 ........ ye Totales
Frecuencia absoluta de Y
condicionada a X  xi fi1 fi 2 ……. f ie fi .
fY X  xi
Frecuencia relativa de Y
condicionada a X  xi fi1 fi 2 ……. f ie 1
hY X  xi
fi . fi . fi .

52
Ejemplo 2: Tomando la tabla bidimensional del ejemplo 1:
Y 1 2 3 4 Total
X
2 6 0 0 0 6
3 7 4 0 0 11
4 10 5 1 0 16
5 0 9 0 0 9
6 1 2 2 0 5
8 0 0 1 2 3
Total 24 20 4 2 50

a) Hallar la distribución X condicionada a Y=2


b) Hallar la distribución Y condicionada a X=6
c) Hallar la distribución X condicionada a Y=3
d) Hallar la distribución Y condicionada a X=8

Solución:

a)
Valores de X 2 3 4 5 6 8 Totales

f X Y 2 0 4 5 9 2 0 20

hX Y  2 0 0,20 0,25 0,45 0,10 0 1

b)
Valores de Y 1 2 3 4 Totales

fY 1 2 2 0 5
X 6

hY X 6 0,2 0,4 0,4 0 1

c)
Valores de X 2 3 4 5 6 8 Totales

f X Y 3 0 0 1 0 2 1 4

hX Y  3 0 0 0,25 0 0,50 0,25 1

d)
Valores de Y 1 2 3 4 Totales

fY 0 0 1 2 3
X 8

hY X 8 0,00 0,00 0,33 0,67 1

53
Análisis de Correlación y
Regresión TEMA

8.1. Análisis de Correlación


8.1.1 Tipos de correlación
8.1.2 Diagrama de dispersión
8
8.1.3 Coeficiente de Correlación §
8.1.4 Niveles de correlación
8.2. Análisis de regresión
8.2.1 Regresión Lineal simple
8.2.2 Recta de mínimos cuadrados
8.2.3 Coeficiente de Determinación

8.1. Análisis de Correlación

La correlación estadística determina la relación o dependencia que existe entre las dos
variables que intervienen en una distribución bidimensional. Es decir, determinar si los
cambios en una de las variables influyen en los cambios de la otra. En caso de que
suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.
La correlación es la teoría que se encarga de estudiar las posibles relaciones existentes
entre dos variables X e Y estadísticas.

8.1.1 Tipos de Correlación. Según la relación entre las variables X e Y podemos tener:
A. Correlación Directa o Positiva. Cuando las variables X e Y presentan variaciones
en un mismo sentido, esto es, para mayores valores de X, mayores valores de Y.
B. Correlación Inversa o Negativa. Cuando las variaciones de X e Y son en sentidos
contrarios, esto es, para mayores valores de X corresponden menores valores de Y.
C. Sin correlación. Cuando no existe ningún tipo de relacionamiento entre las
variables.

8.1.2 Diagrama de Dispersión. Es la representación gráfica más útil para describir el


comportamiento conjunto de dos variables X e Y, consiste en una nube de puntos que
indicará si existe o no correlación dependiendo de la tendencia de los puntos.

54
Ejemplo1: Una compañía de seguros desea determinar el grado de relación que existe
entre el ingreso familiar y el monto del seguro de vida del jefe de familia. Con base a una
muestra aleatoria de 9 familias, se obtuvo la siguiente información (en miles de dólares)

Ingreso (X) Seguro de


Vida (Y)
45 70
20 50
40 60
40 50
47 90
30 55
25 55
20 35
15 40
Interpretación: Observando el gráfico podemos decir que el
Ingreso familiar y el seguro de Vida tienen correlación positiva

8.1.3 Coeficiente de Correlación. Es un número que indica el grado de asociación entre


las variables y se define del siguiente modo:
n
 xi yi  nxy
r i 1
 n x 2  nx 2   n y2  ny 2 
 i   i 
 i 1   i 1 

Características:
El coeficiente r es un número comprendido entre -1 y +1
1  r   1
 Si r  0 Existe una correlación directa o positiva
 Si r  0 Existe una correlación Inversa o negativa
 Si r  0 No Existe asociación entre las dos variables, no existe asociación lineal.

Ejemplo2: Del ejemplo1 sobre el Ingreso profesional y el seguro de vida hallar el


coeficiente de correlación:

N° Ingreso Seguro de XY X2 Y2
(X) Vida (Y)
1 45 70 3150 2025 4900 
2 20 50 1000  400  2500 
3 40 60 2400 1600 3600 
4 40 50 2000 1600 2500 
5 47 90 4230  2209  8100 

55
6 30 55 1650 900 3025 
7 25 55 1375  625  3025 
8 20 35 700  400  1225 
9 15 40 600  225  1600 
Total 282  505  17105  9984  30475 
∑X ∑Y ∑XY ∑ X2 ∑ Y2

n9 ; x
 x  282  31.3 ; y
505
 56.1
n 9 9
n
 xi yi  nxy
i 1 17105  9(31.3)(56.1)
r   0.818
 x 2  nx 2   y2  ny 2 
n
 i   i
n
  
9984  9(31.3) 2 30475  9(56.1) 2 
 i 1   i 1 

Interpretación: Como r=0.818, existe una correlación positiva fuerte entre el ingreso
profesional y el seguro de vida adquirido.

8.1.4 Niveles de Correlación r


Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando
la correlación tiende a ser lineal directa (mayores valores de X significan mayores
valores de Y), y se aproxima a –1 cuando la correlación tiende a ser lineal inversa. El
siguiente diagrama resume el análisis del coeficiente de correlación entre dos
variables:

8.2. Análisis de Regresión

Este análisis toma como base las observaciones que se realizan para cada una de las
variables X e Y, donde se da a conocer una ecuación matemática que indica la relación de
estas variables; cuando se tiene la ecuación esta se utiliza para poder estimar valores
futuros que pueda tener una variable. En cualquier problema se deben tener muy
identificadas las variables de dicho problema, a estas variables se les conoce como
variable dependiente (Y) y variables independiente (X).

56
8.2.1 Regresión Lineal Simple. Este tipo de regresión se utiliza cuando existe solo una
variable independiente X para una variable dependiente Y. Está definida por la
siguiente ecuación lineal en su forma general:

Y  b0  b1 X  e
Dónde:
Y Es la variable respuesta o valor de la predicción de la variable Y dado un valor X .
b0 ,b1 Coeficientes de la regresión lineal
b0 Es el valor de Y cuando X = 0, es decir, es el valor de Y cuando la línea de
regresión cruza el eje de las Y.
b1 Es la pendiente de la línea, o la variación promedio en Y por cada variación de
una unidad en X.
X Es cualquier valor seleccionado de la variable independiente X.
e Es el error de predicción

8.2.1 Recta de Mínimos Cuadrados. Para poder obtener la recta de regresión Y en X


utilizaremos la siguiente ecuación de estimación:

Ŷ  b0  b1 X

Donde los valores de b0 y b1 en la ecuación de regresión son conocidos como


coeficientes de regresión y las fórmulas para calcularlos son:
n
 xi yi  nxy
b1  i 1
n
b 0  y  b1 x
 xi2  nx 2
i 1

Ejemplo3: Del ejemplo1 sobre el Ingreso profesional y el seguro de vida hallar el


coeficiente de correlación.
a) Estime la ecuación lineal e Interprete el coeficiente de regresión b1.

n
 xi yi  nxy
i 1 17105  9(31.3)(56.1)
b1    1.12
9984  9(31.3) 2
n

 xi2  nx 2
i 1

b0  y  b1 x  56.1  ( 1.12 )31.3  21.13

57
Entonces la ecuación de regresión estimada será:

Ŷ  21.13  1.12 X

Interpretación:

b1  1.12 , El monto promedio del seguro de vida del jefe de familia aumentará en

1.12 ($1120) cuando su ingreso aumente en 1 ($1000)

b) Si un Jefe de Hogar tiene un ingreso de $50000 ¿Qué monto de seguro percibirá?

Ŷ  21.13  1.12( 50 )  77.13


Un Jefe de Hogar con 50000 dólares de ingreso percibirá un seguro de $77130

8.2.2 Coeficiente de Determinación (R2)


Mide el porcentaje de variabilidad en Y que puede explicarse a través del conocimiento
de la variable independiente X. Se calcula con la siguiente fórmula:

  ( x  x )( y  y )
2

R 
2
 r2
  xi  nx   yi  ny 
2 2 2 2

Características:

 Es un valor no negativo ya que se encuentra entre 0 y 1 0  R2  1


 Es un valor muy importante en cualquier análisis de regresión, ya que muestra el
grado hasta el cual están relacionadas la variabilidad de X e Y

Ejemplo4: sobre el Ingreso profesional y el seguro de vida hallar el coeficiente de


determinación.

r  0.818 , por lo cual R   0.818   0.669


2 2
Recordando que

Interpretación: El 66.9% de la variación del monto del seguro (Y) son explicados por
el Ingreso profesional.

58
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD3
1. Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado de
estrés de los trabajadores. Para lo cual se elige una muestra aleatoria de 300 trabajadores y se
clasifican en la tabla siguiente:

Tipo de Trabajo Grado de Estrés (Y)

(X) I II III Total

Oficina 42 24 30 96

Terreno 54 78 72 204

Total 96 102 102 300

a) Hallar la distribución conjunta de las proporciones con relación al total general


b) Hallar la distribución conjunta de las proporciones con relación al total de cada fila
c) Hallar la distribución conjunta de las proporciones con relación al total de cada columna.

2. Una compañía discográfica ha recopilado la siguiente información sobre el número de conciertos


dados, durante el verano, por 15 grupos musicales y las ventas de discos de estos grupos
(expresados en miles de CDs):

Conciertos (Y) 10 - 30 30 - 40 40 - 80
CDs(X)
1–5 3 0 0
5 – 10 1 4 1
10 - 20 0 1 5

a) Calcula el número medio de CDs vendidos


b) Calcula el número medio de Conciertos realizado
c) Hallar la covarianza (X,Y) e interpretar

3. La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente entre la
inversión realizada y el rendimiento obtenido en cientos de miles de euros para explotaciones
agrícolas, se muestra en el siguiente cuadro:

Inversión (X) 11 14 16 15 16 18 20 21 14
Rendimiento (Y) 2 3 5 6 5 3 7 10 6

a) Construya un diagrama de dispersión e interprete


b) Calcule los coeficientes de correlación y determinación e interprete.
c) Estima la recta de regresión del rendimiento respecto de la inversión e interprete sus coeficientes.
d) La previsión del rendimiento que se obtendrá con un inversión de 1 250 000 €.

59
4. Se toma una muestra de 150 pinos, observando en cada árbol su altura “X” (en centímetros) y el
número “Y” de nidos de gorriones que lo habitan.

Y 1 2 3 4 5
X
50 – 150 2 4 6 10 8
150 – 250 1 2 3 5 4
250 – 350 3 6 9 15 12
350 - 450 4 8 12 20 16

a) Calcular la media y desviación estándar de la altura de los pinos.


b) Calcular el promedio de nidos por árbol y su desviación estándar.
c) Hallar la covarianza (X,Y) e interpretar
d) Hallar la distribución Y condicionada a X= [250 – 350)
e) Hallar la distribución X condicionada a Y=4
f) Hallar la distribución proporcional con respecto al total, filas y columnas. Graficar e Interpretar.

5. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el número de


cajas registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes
datos procedentes de otros establecimientos similares acerca del número de cajas registradoras y del
tiempo medio de espera.

Nº de cajas Tiempo medio


registradoras de espera
N° XY X2 Y2
1 10 59
2 12 51
3 14 42
4 12 32
5 18 26

Total

a) Identifique cual es la variable dependiente y cual la independiente.


b) Construya un diagrama de dispersión e interprete
c) Calcule el coeficiente de correlación y Determinación e interprete.
d) Estima la ecuación de regresión lineal e Interpreta los coeficientes estimados.
e) Predecir el tiempo medio de espera de un establecimiento con 25 cajas registradoras.

6. Una casa de empanadas realiza promociones a través de publicidad repartiendo volantes publicitarios.
Se cree que existe relación entre “x“ cantidad de volantes repartidos por semana en cientos e “ y ”
ventas en cientos de pesos. Se tomaron 8 semanas al azar que arrojaron la siguiente información:

a) Determine en qué medida la variable cantidad de volantes explica las variaciones de las ventas.
b) Determine la recta de ajuste e interprete los coeficientes.
c) Pronostique el valor las ventas, cuando se reparten 350 volantes.

60
AUTOEVALUACIÓN N° 3
1. Una institución ambiental hizo un estudio para determinar si el sector industrial se relaciona con el
grado de contaminación por plomo. Una muestra aleatoria de 300 empresas a las que se les examinó
entregó los siguientes resultados:
Grado de Contaminación
Sector Industrial Alto Medio Bajo Total
Villa el Salvador 18 6 12
Chorrillos 42 24 30
Independencia 36 72 60
Total

a) Hallar la distribución conjunta de las proporciones con relación al total general


b) Hallar la distribución conjunta de las proporciones con relación al total de cada fila
c) Hallar la distribución conjunta de las proporciones con relación al total de cada columna.

2. Una empresa del sector cerámico realiza un estudio sobre los metros cuadrados vendidos de sus
productos por agentes de ventas en plantilla y la antigüedad en la empresa de los mismos:

Miles de m2 Años de antigüedad


1 2 3 4 5 6
11-13 1 2
13 -15 5 4 3 3 5 1
15-17 3 5 6 6 2
17-19 2 4

a) Calcular el promedio de años de antigüedad de los agentes de la empresa


b) Calcular la media y desviación estándar de las ventas.
c) Hallar la covarianza (X,Y) e interpretar
d) Hallar la distribución Y condicionada a X=[15 – 17)

3. Una empresa de consumibles de informática asigna diferentes precios a los cartuchos de tinta que
comercializa según el centro comercial donde se ponen a la venta. La tabla adjunta muestra el
número de unidades vendidas y los precios (en soles).
Unidades
Precio XY X2 Y2
vendidas
15 43
20 38
23 36
14 40
12 42
27 31
10 49

a) Identifique cual es la variable dependiente y cual la independiente.


b) Construya un diagrama de dispersión e interprete
c) Calcule el coeficiente de correlación Determinación e interprete.
d) Estima la ecuación de regresión lineal e Interpreta los coeficientes estimados.
e) Si el precio de un cartucho de tinta es de 25 ¿Cuántas unidades se venderán de ese producto?

61
Unidad

4
PROBABILIDADES, SERIES DE
TIEMPO Y NUMEROS INDICES

 
 
 
 
 
 
 

En esta unidad se conocerá y aplicará la teoría de la probabilidad en sucesos y eventos,


además se conocerán Técnicas del Análisis de Series de Tiempo aplicados en economía así
como la comparación de datos en distintos momentos del tiempo usando número índices.

OBJETIVOS ESPECÍFICOS
 Modelar experimentos aleatorios y aplicar correctamente la definición clásica de
probabilidad. Calcular probabilidades condicionales y tomar de decisiones aplicando el
Teorema de Bayes.
 Analizar datos económicos a través del tiempo mediante el análisis de series de tiempo
hechas a una variable aleatoria en épocas sucesivas y en intervalos equidistantes.
 Estudiar las  variaciones de un fenómeno complejo por medio de números índices, los
cuales permiten comparar dos o más situaciones distintas en el tiempo y/ó el espacio.

Contenido Temático
 Tema IX: Introducción a las Probabilidades
 Tema X: Análisis de Series de Tiempo
 Tema XI: Números Índices

62
Introducción a las Probabilidades
9.1. Probabilidades y eventos TEMA
9.2. Experimento aleatorio
9.3. Espacio muestral y eventos
9.4. Técnicas de conteo 9
9.5. Concepto clásico de probabilidad
9.6. Probabilidad Condicional §
9.7. Teorema de Bayes

9.1. Probabilidades y Eventos

El concepto de probabilidad es manejado por mucha gente. Frecuentemente se escuchan


preguntas como las que se mencionan a continuación:
 ¿Cuál es la probabilidad de que me saque la Lotería?
 ¿Qué posibilidad hay de que me pase un accidente
automovilístico?
 ¿Qué posibilidad hay de que hoy llueva? para llevar mi
paraguas o no.
 ¿Existe alguna probabilidad de que repruebe el primer
parcial?

Las preguntas anteriores esperan como respuesta una medida de confianza para conocer
un evento futuro, o bien de una forma sencilla interpretar la probabilidad. El estudio de las
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de
azar, que constituyen la base para la estadística inferencial.

9.2. Experimento Aleatorio

Llamado también No determinístico y tiene las siguientes


características:
a) Cada experimento podrá ser repetido indefinidamente sin
cambiar esencialmente las condiciones. 
b) No se puede determinar un valor “A priori”, sin embargo
es posible describir de antemano todos sus resultados
posibles.
Ejemplo: Todos los juegos de azar

63
9.3. Espacio Muestral y Eventos

A. Espacio Muestral
Es denotado por  , es un conjunto formado por todos los posibles resultados de un
experimento.

Ejemplo1: Consideremos el experimento aleatorio de lanzar un dado y observar el


número que aparece en la cara superior, entonces su espacio muestral será:
  1, 2, 3, 4, 5, 6
B. Evento O Suceso
Un evento es un subconjunto del espacio muestral  y se denota con las letras
mayúsculas A, B, C, etc.

Ejemplo2: Sea el experimento de lanzar un dado y observar el número que aparece


en la cara superior. El espacio muestral asociado a este experimento como ya
sabemos es:
  1, 2, 3, 4, 5, 6
Para este experimento se pueden definir los siguientes eventos:

 A: Observar un número impar. A  1, 3,5

 B: Observar un número menor que 4. B  1, 2, 3

 C: Observar un número mayor que 2. C   3, 4,5,6

9.4. Técnicas de Conteo

Las técnicas de conteo son procedimientos o arreglos de enumeración para determinar


directamente el número de elementos del espacio muestral. Para esto se desarrollará la
técnica de Análisis Combinatorio, que es un procedimiento más sencillo para determinar el
número total de resultados. Con este fin, nos apoyaremos en los conceptos permutaciones
y combinaciones

A. Permutaciones de n elementos
Una permutación de un conjunto de elementos, es un ordenamiento específico de
todos o algunos elementos del conjunto. En una permutación el orden en que se
disponen los elementos del conjunto es importante.

64
Por el principio fundamental del conteo podemos enunciar que el número de
permutaciones de n objetos distintos tomados de n en n, es: Pn = n!
 n! = n (n -1 ) (n -2 )...3 x 2 x 1
 5! = 5 x 4 x 3 x 2 x 1 = 120
 Por definición 0! = 1

Ejemplo3: Cinco personas desean nombrar un Comité Directivo compuesto de un


presidente, un vicepresidente, un secretario, un tesorero y un vocal. ¿Cuántas
maneras hay de constituir el comité? P5 =5! =120

B. Combinaciones
Una combinación es un subconjunto o una disposición de todos los elementos de un
conjunto, sin tener en cuenta el orden de ellos. El número de combinaciones o
subconjuntos no ordenados, cada uno formado por r elementos, que pueden
obtenerse de un conjunto de n elemento es:
n!
nCr 
( n  r )! r !

Ejemplo4: De un club de 20 socios, se van a seleccionar 3 para formar la mesa


directiva. ¿De cuántas formas puede constituirse?
20 ! 6840
20C 3    1140
( 20  3)! 3! 6

9.5. Concepto Clásico de Probabilidad

Dado un evento A, asociado a un experimento aleatorio, se llama probabilidad de A, y se


representa por el símbolo P(A), al cociente que se obtiene dividiendo el número de
resultados favorables para la ocurrencia del evento, entre el número total de posibilidades
ó número de elementos del espacio muestral (  ). Y se denota por:
#( A)
P ( A) 
#( )
Ejemplo5: En el experimento de lanzar un dado,
 Determinar la probabilidad de que en la cara superior aparezca el número 5
  1, 2, 3, 4, 5, 6 , 6 resultados posibles

1
Sea el evento A  5 , un resultado favorable P ( A)   0,167
6

65
 Determinar la probabilidad de que se obtenga un número par
3 1
Sea el evento B   2, 4, 6 , 3 resultados favorables P ( B )    0, 5
6 2

Propiedades de las Probabilidades

Sean los eventos A y B asociados al espacio muestral  . Entonces se cumplen las


siguientes propiedades.
i. 0  P ( A)  1

ii. P ( )  1 es decir, la probabilidad del suceso seguro  , es igual a la unidad.

iii. P    0

iv. P  A  B   P  A   P  B   P  A  B  .

v. P ( A  B )  P ( A)  P ( B ) para todo A y B eventos disjuntos ( A  B   )

Ejemplo 6: En cierta ciudad, la probabilidad que una familia tenga televisor es 0.75, un
refrigerador es 0.60 y que tengan ambos es 0.50 ¿Cuál es la probabilidad que una
familia tenga un refrigerador o un televisor?
Solución: P (T )  0.75 P ( R)  0.60 P (T  R)  0.50
P  T  R   0 .7 5  0 . 6 0  0 .5 0  0 . 8 5

Ejemplo 7: En una entidad bancaria, la probabilidad que un directivo tenga título de


economista es 0.36, que tenga título contable es 0.24 y que tengan alguno de los dos
0.42 ¿Cuál es la probabilidad que un directivo elegido al azar tenga ambos títulos?
P ( E )  _____ P (C )  _____ P ( E  C )  ______ P ( E  C )  ______

9.6. Probabilidad Condicional

Ocurre cuando dos eventos se relacionan de manera tal que la probabilidad de ocurrencia
de uno depende de la ocurrencia del otro.
Definición: Sean A y B dos eventos tal que P( B )  0 , la probabilidad condicional de que
ocurra el evento A dado que ha ocurrido B, se denota:

P( A  B )
P( A / B ) 
P( B )

66
Ejemplo 8: En una ciudad el 55% de los habitantes consume arroz, el 30% consume trigo
y el 20% consume ambos. Se pide: A= Arroz T= Trigo

a) ¿Cuál es la probabilidad de que coma trigo dado que consumió arroz?


P(T  A ) 0.20
P(T / A )    0.364
P( A ) 0.55

b) Sabiendo que un habitante consume trigo, ¿cuál es la probabilidad de que consuma


arroz?.
P(T  A ) 0.20
P( A / T )    0.667
P(T ) 0.30

Ejemplo 9: Para tratar de frenar la crisis económica del País un Ministro desea aplicar dos
medidas económicas A y B en 60 ciudades para observar si mejor o no la economía. La
siguiente tabla refleja los resultados obtenidos.

Mejora No Mejora Total


Medida A 26 12 38
Medida B 14 8 22
Total 40 20 60

Si se elige aleatoriamente una ciudad, calcular la probabilidad que:


a) Se haya mejorado su economía.
b) Haya recibido la medida económica A.
c) haya recibido la medida B y no haya mejorado su economía
d) haya mejorado su economía sabiendo que ha recibido la medida B
e) Haya recibido la medida A sabiendo que ha mejorado en su economía
40
a) P( M )   0.67
60
38
b) P( A )   0.63
60
8
c) P( B  M )   0.13
60
P( M  B ) 14
b) P( M / B )    0.64
P( B ) 22
P( A  M ) 26
d) P( A / M )    0.65
P( M ) 40

67
9.7. Teorema de Bayes

Si los eventos A1 , A2 , ...., An forman una partición del espacio muestral  , y B un evento

cualquiera de  , entonces:
P( Ai )P( B / Ai )
P( Ai / B )  n

 P( A )P( B / A )
i 1
i i

Ejemplo 10: En una industria de acero se estima que hay un 60% de probabilidad de que
las inversiones de capital aumenten el próximo año. Si el próximo año aumentan las
inversiones de capital, la probabilidad de que el acero para construcciones suba de precios
es de 90%. Si no hay incremento en dichas inversiones, la probabilidad de un aumento en
los precios del acero es de 30%.
a) Construya el diagrama del árbol respectivo
b) ¿Cuál es la probabilidad de que suban los precios del acero?
c) ¿Cuál es la probabilidad de que no suban los precios del acero?
d) ¿Cuál es la probabilidad de que haya un aumento de la inversión de capital si es que
no suben los precios del acero para construcciones?
e) ¿Cuál la probabilidad de que no aumente la inversión si es que suben los precios?

Solución: Sean los siguientes eventos:


A : “Aumentan Inversiones” S : “Suben los precios”
A : “No aumentan inversiones” S : “No suben los precios”

a) Diagrama de Árbol

b) P( S )  0.60  0.90  0.4  0.3  0.66

c) P( S )  1  0.66  0.34
P( A  S ) 0.6  0.10
d) P( A / S )    0.176
P( S ) 0.34
P( A  S ) 0.4  0.30
e) P( A / S )    0.182
P( S ) 0.66

68
Análisis de Series Temporales
10.1. Definición TEMA

10
10.2. Importancia de las Series de Tiempo
10.3. Componentes de una serie cronológica
10.4. Análisis de Series de Tiempo
10.5. Estudio de la Tendencia
§

10.1. Definición

Una serie de tiempo es un conjunto de datos numéricos que se obtienen en periodos


regulares a través del tiempo. La unidad de tiempo puede ser: Hora, día, mes, trimestre,
año o cualquier periodo que se pueda considerar de interés. Una serie de tiempo es un
conjunto de observaciones tomadas en instantes específicos, generalmente a intervalos
iguales.
Ejemplo1: Sea la producción mensual de papel en el Perú (en miles de toneladas) en los
años 1985 - 2010
Años(X) 1985 1986 1987 1988 1989 1990 1991 1992 1993 1994 1995 1996 1997
Prod(Y) 170 174 178 185 188 170 201 218 245 269 276 275 285

Años(X) 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Prod(Y) 286 290 250 307 323 317 342 353 396 381 391 419 390

Grafique esta serie en el sistema cartesiano, donde los años son las variables
independientes (X) y la producción la variable dependiente (Y)

69
10.2. Importancia de las Series de tiempo

Son útiles en muchos trabajos en los que el tiempo juega un papel preponderante, lo cual
ocurre en múltiples aspectos de la Administración y Economía. Se utiliza para realizar
pronósticos, predicciones y proyecciones de resultados futuros.

Unidades de Tiempo
Las más usadas son por lo general de un año, un trimestre, un mes, etc. Se elegirán las
más adecuadas para el estudio.
Dentro de estas unidades de tiempo, algunas tienen duración constante (horas, días, etc)
pero otras son variables (meses, años)

10.3. Componentes de una Serie Cronológica

En el gráfico anterior sobre la producción de papel pudimos apreciar que los valores de la
serie (Valores de Y) son distintos en cada periodo de tiempo, de manera que la gráfica
evoluciona al transcurrir el tiempo que se conoce como movimiento o variación de la
serie.
Los movimientos o variaciones de las series temporales se agrupan en cuatro
componentes:
 Tendencia secular
 Componente Estacional
 Componente Cíclica
 Componente Irregular

10.3.1 Tendencia secular


 Es un movimiento suave, regular y
de largo plazo de las series
estadística.
 Con este movimiento se intenta
encontrar la dirección general o
tendencia del gráfico de la serie,
considerando para ello unidades
grandes de tiempo.
 Componente a largo plazo que
representa el crecimiento o disminución de la serie durante un periodo largo.
 Los cambios en la población, ingresos, etc. Influyen en la tendencia.

70
10.3.2 Componente Estacional
 Son fluctuaciones en periodos relativamente cortos que se repiten de manera casi
irregular. Por lo general están asociados a los diferentes meses del año.
 Se puede ver afectada por la climatología, las costumbres, etc.
 Se produce dentro de un periodo anual.
 Se deben a sucesos recurrentes que tienen lugar anualmente tales como el brusco
aumento de precios al consumo antes de navidad, aumento de consumo de
bebidas en verano.

10.3.3 Componente Cíclica


 Son movimientos u oscilaciones de larga duración en torno a una recta o corva de
tendencia.
 Estas oscilaciones puede ser periódicos o no, es decir pueden seguir o no
esquemas repetidos en intervalos iguales de tiempo.
 Un ejemplo característico son los llamados ciclos económicos, que representan
intervalos de prosperidad, recesión, depresión y recuperación.
 Suelen durar de 2 a 10 años
 Se requiere información de por lo menos 15 a 20 años

10.3.4 Componente Irregular


 Son movimientos esporádicos o son «saltos» en la serie causados por un suceso
de azas y situaciones inusuales o imprevistas.
 Ejemplo: Huelgas, inundaciones, elecciones, tornados, corte de energía eléctrica,
etc.
 Aunque estos hechos producen variaciones en la serie de corta duración, las
consecuencias pueden ser tan grandes que podrían originar un nuevo ciclo o variar
la curva de la tendencia.

Fig. Componentes de una Serie Cronológica

71
10.4. Análisis de Series de Tiempo

El Análisis de los componentes o movimientos estudiados es de gran importancia cuando


se trata de predecir situaciones futuras de la serie.
En el caso de movimientos irregulares casi nunca son predecibles sus consecuencias.
E objetivo del análisis es identificar aquellas componentes presentes para identificar sus
causas y predecir valores futuros.
Modelos de descomposición:
 Y= T + C + E + I (Modelo Aditivo)
 Y= T.C.E.I (Modelo Multiplicativo)

10.5. Estudio de la Tendencia

Es el análisis de la tendencia. Este análisis es mucho más útil y confiable cuando el


crecimiento es uniforme y pronunciado y cuando las desviaciones con respecto a la
tendencia de la curva son pequeñas.
La curva de la tendencia muestra la evolución general de la serie y puede tomar diferentes
formas tales como rectilínea, parabólica, exponencial, etc.
Existen varios métodos para lograr la estimación de la tendencia, entre los más utilizados
se encuentran:
 Método de la mano alzada
 Método de los semi-promedios
 Método de los promedios móviles
 Método de los Mínimos cuadrados

10.5.1 Método de la mano alzada


Este método consiste en ajustar una
curva o recta de tendencia por simple
inspección del gráfico.
Consiste en trazar una línea a lo
largo de un gráfico con datos en la
serie en análisis.
Una vez que se traza la línea a mano
alzada, se puede aproximar una
ecuación de tendencia para la línea, utilizando el primer y último periodo de la gráfica.
Tiene la desventaja evidente de depender muy fuertemente del criterio personal de
cada cual.

72
10.5.2 Método de promedios móviles
Es en realidad una suavización de la información de las series cronológicas para
eliminar o atenuar movimientos cíclicos.
Definición: dada una sucesión de valores x1 , x2 , .....xn , se define el promedio móvil

de orden m (m<n) por la secuencia de valores correspondientes a las medias


aritméticas:
x1  x2  ...  xm x2  x3  ...  xm  1 x3  x4  ...  xm  2
, , , ...
m m m
Donde m= número de elementos de cada subconjunto de las serie de valores

Ejemplo2: A continuación se presentan las Ventas Trimestrales en millones de dólares de


una compañía de Alimentos:

Periodos 2002 2003 2004 2005 2006


1 190 280 270 300 320
2 370 420 360 430 440
3 300 310 280 290 320
4 220 180 190 200 220

Construir un gráfico con los datos suavizar la serie con promedio móvil de 3 y 4 periodos y
graficar:
Prom. Prom.
Móvil Móvil
3 4
Años Periodos Ventas periodos periodos
2002 1 190
2 370 286.67 270
3 300 296.67 292.5
4 220 266.67 305
2003 1 280 306.67 307.5
2 420 336.67 297.5
3 310 303.33 295
4 180 253.33 280
2004 1 270 270 272.5
2 360 303.33 275
3 280 276.67 282.5
4 190 256.67 300
2005 1 300 306.67 302.5
2 430 340 305
3 290 306.67 310
4 200 270 312.5
2006 1 320 320 320
2 440 360 325
3 320 326.67
4 220

73
10.5.3 Método de Mínimos Cuadrados

Es la misma técnica que se utilizó en el análisis de


regresión para obtener la mejor recta de tendencia que
se ajuste a los datos
Donde:
X: Es el tiempo T – (Variable independiente)
Y: Es la variable en estudio (Variable dependiente)

Recta de Mínimos Cuadrados. Para poder obtener la recta de regresión Y en X


utilizaremos la siguiente ecuación de estimación:

Ŷ  b0  b1 X

Donde los valores de b0 y b1 en la ecuación de regresión son conocidos como


coeficientes de regresión y las fórmulas para calcularlos son:
n
 xi yi  nxy
b 1  i 1
n
b 0  y  b1 x
x
i 1
2
i
 nx 2

Ejemplo3: A continuación se presentan las Ventas Trimestrales en miles de soles de


dólares de una empresa de textiles:

PERIODOS 2010 2011 2012 2013 2014


1 180 220 280 310 370
2 190 220 290 320 420
3 190 270 300 320 430
4 200 280 300 360 440

a) Hallar la ecuación lineal de estimación que mejor describe la tendencia e interprete los
coeficientes.
b) Comparar las ventas reales (Y) frente a las estimadas
c) Predecir las ventas para el I y II trimestre del 2007

74
a) En primer lugar se debe recodificar los periodos en forma consecutiva en la variable T,
que sería la variable X de nuestra ecuación a estimar:

X Y
XY X2
Ventas
Años Periodos T
2010 1 1 180 180 1
2 2 190 380 4
3 3 190 570 9
4 4 200 800 16
2011 1 5 220 1100 25
2 6 220 1320 36
3 7 270 1890 49
4 8 280 2240 64
2012 1 9 280 2520 81
2 10 290 2900 100
3 11 300 3300 121
4 12 300 3600 144
2013 1 13 310 4030 169
2 14 320 4480 196
3 15 320 4800 225
4 16 360 5760 256
2014 1 17 370 6290 289
2 18 420 7560 324
3 19 430 8170 361
4 20 440 8800 400
      ∑X= 210 ∑Y=5890 ∑XY=70690 ∑ X2=2870

De la tabla anterior aplicando las


fórmulas para calcular los
coeficientes de regresión tenemos la
ecuación lineal que describe a la
serie de datos:

Ŷ  154.84  13.301X

75
b) La siguiente tabla muestra la comparación las ventas reales (Y) frente a las

estimadas Ŷ
T(X) Ventas (Y) Ŷ  154.84  13.301X
1 180 168.14 
2 190 181.44 
3 190 194.74 
4 200 208.04 
5 220 221.35 
6 220 234.65 
7 270 247.95 
8 280 261.25 
9 280 274.55 
10 290 287.85 
11 300 301.15 
12 300 314.45 
13 310 327.75 
14 320 341.05 
15 320 354.36 
16 360 367.66 
17 370 380.96 
18 420 394.26 
19 430 407.56 
20 440 420.86 

c) Predecir las ventas para el I y II trimestre del 2015


X Y
Ŷ  154.84  13.301X
Ventas
Años Periodos T
2014 1 17 370 380.96 
2 18 420 394.26 
3 19 430 407.56 
4 20 440 420.86 
2015 1 21
434.16 
2 22 447.46 

Pronostico para I Trimestre del 2015

X  21 entonces Ŷ  154.84  13.301( 21 )  434.16


Pronostico para I Trimestre del 2015

X  22 entonces Ŷ  154.84  13.301( 22 )  447.46

76
Números Índices
11.1. Definición TEMA
11.2. Clasificación de Números Índices
11.3. Números Índices Simples
11.4. Números Índices Compuestos 11
11.5. Índices Compuestos no ponderados
11.6. Índices Compuestos ponderados §

11.1. Definición

Un número índice es un indicador diseñado para describir los cambios de una variable en
el tiempo, esto es, su evolución a lo largo de un determinado período. Como por ejemplo:
 La evolución en la cantidad de un determinado bien o servicio o de un conjunto de ellos
(por ejemplo cantidades producidas o consumidas).
 La evolución en el precio de un bien o servicio o conjunto de éstos.
 La evolución en el valor de un bien o servicio o de una canasta de bienes y servicios.

El número índice es una razón o un cociente de cada uno de los valores de la variable x
con respecto a un valor que se toma como referencia, expresado en porcentajes.

Ejemplo1: El tipo de cambio del dólar de los Estados Unidos ha pasado de S/.2.196 en
Diciembre de 1994 a S/.3.490 en Diciembre del 2000. El índice de variación del dólar del
2000 respecto a 1994 es:

3.490
I 2000/1994 ( D )   100  158.93
2.196

Es decir hubo una variación de 58.93% (158.93-100), el dólar en el año 2000 aumento en
un 58.93% con respecto al año 1994.

11.2. Clasificación de Números Índices

Los números índices se pueden clasificar de la siguiente manera:


I. Simples

Índices II. Compuestos  No ponderados

 Ponderados

77
11.3. Números Índices Simples

Los números índices simples se refieren a un solo artículo o concepto, lo cual se traduce a
variaciones de una sola variable a través del tiempo. Son simples relaciones o porcentajes
entre los valores de un artículo o concepto correspondientes a dos épocas o lugares que
desean compararse. La comparación se realiza entre el valor correspondiente a un periodo
fijo (periodo base) y el valor alcanzado por la magnitud en cualquier otro momento t . Se
denota de la siguiente manera:
xt
I t / t0 ( x )   100
x0
Dónde:
xt es el l valor de la variable en el momento t.
x0 es el valor de la variable en el momento 0 (Base de referencia)

Ejemplo2: Supongamos por ejemplo, que el precio de un artículo, en julio de 2012 era
S/.250 y en Julio del 2013 es de S/. 320. Calcular el índice de precio del artículo para el
año 2013 respecto a 2012 y el grado de variación.
320
I 2013/2012 ( P )   100  128
250
Es decir hubo una variación de 28% (128-100).

Ejemplo3: Se tiene la evolución del salario mínimo de los empleados entre los años 2007
– 2012. Calcular los índices para cada uno de los seis años usando como año base 2007
Índice de
Año (t) Salario mínimo vital salarios base:
(empleados) Cálculos (base 2007) 2007
2007 S/. 530.00 530/530*100= 100.00

2008 S/. 550.00 550/530*100= 103.77

2009 S/. 580.00 109.43

2010 S/. 600.00 113.21

2011 S/. 675.00 127.36

2012 S/. 750.00 141.51

Nota: Para calcular el grado de variación (aumento o disminución) con respecto al periodo
base, se averigua qué porcentaje representa la variación restando 100 al índice porcentual.
Por ejemplo en el 2010 el salario aumento un 13.21% (113.21-100) con respecto a 2007.

78
11.4. Números Índices Compuestos

Se utilizarán cuando estamos interesados en la variación de más de una serie de valores a


través del tiempo. Los números índices compuestos hacen referencia a varios artículos o
conceptos a la vez (magnitudes complejas) y su evolución en el espacio y/ó el tiempo.
Supongamos que una empresa tiene tres productos A, B y C; cada uno de los cuales tiene
su correspondiente precio (PA, PB y PC). Si nos interesara la evolución de cada precio
individualmente, hallaríamos los índices simples de PA, PB y PC, pero si lo que queremos
analizar es la evolución del precio general de la empresa, tendremos que tener en cuenta
la evolución conjunta de todos ellos. Esto lo podemos hacer de dos formas:

 Suponiendo que cada producto tiene la misma importancia relativa dentro de la


empresa, en este caso calcularíamos los Índices Compuestos Sin Ponderar.
 Suponiendo que cada producto tiene distinta importancia relativa dentro de la
empresa. Calcularíamos los Índices Compuestos Ponderados.

11.5. Índices Compuestos no ponderados

Se denominan así cuando todas las variables que intervienen en su determinación tienen
la misma importancia o el mismo peso. Para es te caso desarrollaremos:

11.5.1 Método de la Media Aritmética simple


Se halla la media aritmética de los números índices simples. Es decir, si hay n
variables que se están estudiando, se tendrá:
n

I  I 2  ...  I n I i
I t / t0  1  i 1
n n

Ejemplo4: Consideremos el precio de 4 diferentes artículos en los años 2013 y 2014.


Calcular el índice compuesto no ponderado para los precios en el año 2014.
Artículo Precios Índices simples
Año 2013 2014 2013 2014
Leche 10 12 100 120.0
Queso 15 20 100 133.3
Mantequilla 80 86 100 107.5

79
El índice compuesto no ponderado más básico es simplemente la media aritmética de
todos los índices:

120  133.3  107.5


I 2014/2013   120.27
3

Lo que indica que los precios para estos productos en 2014 son 20.27% más caros que lo
que fueron en 2013.

11.6. Índices Compuestos ponderados

Su objetivo es solucionar los problemas planteados por los índices complejos sin ponderar.
Los índices complejos ponderados tienen en cuenta la importancia relativa de las distintas
magnitudes simples que lo componen, que denominaremos wi. Por construcción se debe
de cumplir:
k Para todo t, siendo k, el número de
w
i 1
i
t 1 magnitudes simples que forman la
magnitud compleja

¿Qué importancia tiene la ponderación? Si queremos obtener un índice de precios de


consumo deberíamos, 1º Determinamos los elementos que componen el consumo habitual
de una familia, 2º Averiguamos los precios de esos elementos. 3º Averiguamos la
importancia relativa (wi) de cada elemento en el consumo habitual de la familia.

Es evidente que todas las familias consumen alimentos, vestido, vivienda y energía; pero
también es evidente que la importancia de cada uno de estos elementos en el consumo
habitual de una familia es muy distinta. Si diéramos la misma importancia a todos ellos
(índice compuesto sin ponderar) obtendríamos un Índice de Precios de Consumo que poco
tiene que ver con la realidad. En función de la relación entre las ponderaciones wi y los
índices de las componentes It/0 podemos definir los siguientes tipos de índices:

11.6.1 Índice de Precios de Laspeyres o Método del Año Base


La fórmula para calcularlo (en el año t) es el promedio ponderado siguiente:

p q
Dónde:
it i 0 pit= Precio del artículo i en el año dado t
IPL  i 1
n
 100 qi0= Cantidad consumida del artículo i en el año base
p
i 1
i0 i0q pi0= Precio del artículo i en el año base

80
11.6.2 Índice de Precios de Paasche
Se calcula con la siguiente fórmula:

n Dónde:
 pit qit pit= Precio del artículo i en el año considerado t
IPP  i 1
n
 100 qit= Cantidad consumida del artículo i en el año dado t

p
i 1
q
i 0 it
pi0= Precio del artículo i en el año base

Por tanto, la relación de la fórmula de Paashe es entre:


n

p q
i 1
it it = Suma de los valores de las cantidades consumidas en el año considerado

según los precios de dicho año.


n

p
i 1
q = Suma de los valores de las cantidades consumidas en el año considerado
i 0 it

según los precios del año base.

11.6.3 Índice de Precios de Fischer


El índice de Laspeyres tiende a dar mayor peso a los artículos cuyos precios han
aumentado; de manera similar, el índice de Paashe tiende a restarle peso a los
artículos cuyos precios han aumentado. Entonces puede pensarse que el índice de
precios debe estar de alguna forma entre estos dos índices, y esta es la lógica para el
uso del índice ideal de Fisher, la cual se define como la media geométrica de los dos
números índices de Laspeyres y de Paashe:

n n

p q p q
it i 0 it it
IPF  IPL  IPP  100 i 1
n
i 1
n

p
i 1
q
i0 i0 p
i 1
q
i 0 it

81
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD4
1. A un Congreso Internacional de Economía asistieron 75 Banqueros (B) y 35 Asesores comerciales (A)
entre las 200 personas que acudieron al congreso. Calcule la probabilidad de que una persona
seleccionada al azar:
a) sea un banquero. P ( B )  ___________ b) No sea banquero ni Asesor: _______________

2. En una entidad bancaria, la probabilidad que un directivo tenga título de economista es 0.36, que
tenga título contable es 0.24 y que tengan alguno de los dos 0.42 ¿Cuál es la probabilidad que un
directivo elegido al azar tenga ambos títulos?
P ( E )  _____ P (C )  _____ P ( E  C )  ______ P ( E  C )  ______

3. En el refrigerador de una tienda hay 18 envases de refrescos de los cuales 9 son de sabor manzana, 4
de uva y el resto de naranja. En una venta se piden 6 refrescos, si al abrir el refrigerador estos 6 se
escogen al azar: ¿Cuál es la probabilidad que:
a) 3 refrescos sean de sabor manzana, 2 de uva y 1 de naranja?
b) 4 sean refrescos de sabor naranja?
c) Todos los refrescos sean de sabor manzana?

4. En una industria de acero se estima que hay un 60% de probabilidad de que las inversiones de capital
aumenten en el próximo año. Si el próximo año hay un aumento en las inversiones de capital, la
probabilidad de que el acero para construcciones suba de precios es de 90%. Si no hay incremento
en dichas inversiones, la probabilidad de un aumento en los precios del acero es de 40%.

a) ¿Cuál es la probabilidad de que no suban los precios del


acero?

b) ¿Cuál es la probabilidad de que suban los precios?

c) ¿Cuál es la probabilidad de que haya un aumento de la


inversión de capital si es que no suben los precios del
acero para construcciones?
d) Si sabemos que subieron los precios del acero ¿Cuál es
la probabilidad que no aumenten las inversiones?

5. La siguiente tabla muestra la producción de energía eléctrica mensual de consumo no industrial, en


miles de millones de kilovatios-hora en EE.UU, durante los años 1996 – 2001

   Ene  Feb  Mar  Abr May Jun Jul Ago Sep Oct  Nov  Dic
1996  178.2  156.7  164.2  153.2 157.5 172.6 185.9 185.8 165 163.6  169  183.1
1997  196.3  162.8  168.6  156.9 168.2 180.2 197.9 195.9 176 166.4  166.3  183.9
1998  197.3  173.7  173.2  159.7 175.2 187.4 202.6 205.6 185.6 175.6  176.3  191.7
1999  209.5  186.3  183  169.5 178.2 186.1 202.4 204.9 180.6 179.8  177.4  188.9
2000  200  188.7  187.5  168.6 175.7 189 216.1 215.4 191.5 178.5  178.6  195.6
2001  205.2  179.6  185.4  172.4 177.7 202.7 220.2 210.2 186.9 181.4  175.6  195.6

a) Construir un gráfico con los datos y trace la tendencia a mano alzada


b) Suavizar la serie con promedio móvil de 3 meses y 4 meses, graficar
c) Usar el método de mínimos cuadrados para ajustar una recta
d) Predecir la producción de energía eléctrica para el año 2002

82
6. Partiendo de la siguiente serie de salarios mensuales:
Trimestre Trimestre Trimestre Trimestre
Año I II III IV
2010 1078 1140 1121 1248
2011 1124 1192 1173 1303
2012 1171 1236 1207 1342
2013 1205 1264 1232 1370

a) Describe la tendencia por el método a mano alzada, graficar


b) Suavizar la serie con promedio móvil de 4 y 5 periodos, graficar
c) Hallar la ecuación lineal de estimación de la tendencia e interpretar sus coeficientes
d) Comparar los salarios reales (Y) frente a las estimadas
e) Predecir los salarios para el III y IV trimestre del 2014

7. Se ha elaborado la siguiente tabla para los salarios promedio mensual de un obrero de construcción
civil en 1960, 1965, 1970, 1975, 1980 y 1985. Hallar los correspondientes números índices para cada
uno de los seis años, usando como año base 1960:
Año (t) Salario Cálculos Índice de
promedio (base 1960) salarios base:
mensual (x) 1960
1960 25 25/25*100= 100
1965 30
1970 35
1975 40
1980 50
1985 90

Nota: Para calcular el grado de variación (aumento o disminución) con respecto al periodo base, se
averigua qué porcentaje representa la variación restando 100 al índice porcentual.

8. Consideremos que una empresa comercializa tres productos diferentes A, B y C. Calcular los índices
simples de ventas para cada uno de los productos, y el índice compuesto no ponderado usando el
“Método de la Media Aritmética simple” para las ventas en los años 2001 – 2004 tomando como base el
año 2001.
Venta A (miles de
Años unid.) Venta B (miles de unid.) Venta B (miles de unid.)
2001 90 80 40
2002 150 102 56
2003 190 135 68
2004 205 140 80

9. Se tienen tres artículos A, B y C de los cuales conocemos el precio en cada uno de los cuatro años
1986, 1987, 1988 y 1989 y las cantidades consumidas en esos mismos periodos:

Articulo A Articulo B Articulo C


Años Precio Cantidad Precio Cantidad Precio Cantidad
1986 42 12 15 20 62 6
1987 48 8 21 20 68 10
1988 52 10 23 18 73 12
1989 60 12 32 16 80 14
a) Calcular el índice de Laspeyres correspondiente a la variación de los precios de los tres artículos
Tomar como base el año 1986. b) Determinar además el índice de Paasche y Fisher

83
AUTOEVALUACIÓN N° 4
1. El propietario de una tienda de música sabe que el 30% de sus clientes pide ayuda a los dependientes
y que el 20% hace una compra antes de abandonar el local. Además sabe que el 15% de los clientes
pide ayuda y hace una compra. ¿Cuál es la probabilidad de que un cliente realice al menos una de
estas dos cosas?

2. En España se entiende por población activa a todas las personas mayores de 16 años que buscan o
tienen empleo. El 35% de la población activa son mujeres. De las mujeres que forman parte de la
población activa, el 79% tiene trabajo. Entre los hombres que forman parte de la población activa, el
87% tiene trabajo. Si se escoge una persona al azar:

a) ¿Cuál es la probabilidad de la probabilidad de que la


persona escogida tenga trabajo?

b) ¿Cuál es la probabilidad de que no tenga trabajo?

c) ¿Cuál es la probabilidad de que la persona escogida sea


una mujer dado que tiene empleo?

d) Si sabemos que una persona no tiene empleo ¿Cuál es


la probabilidad que sea varón?

3. En la siguiente tabla se muestran los datos de consumo eléctrico (en millones de Kilowatts) de la
compañía “Textiles Peruanos” entre 2000 - 2002
Trimestre Trimestre Trimestre Trimestre
Año I II III IV
2000 1047 667 495 794
2001 1068 625 499 850
2002 1071 648 480 746
a) Construir un gráfico con los datos y trace la tendencia de la serie a mano alzada
b) Suavizar la serie con promedio móvil de 3 periodos y graficar sobre el grafico de a)
c) Hallar la ecuación lineal de estimación de la tendencia y Predecir el consumo eléctrico para el
primer trimestre del 2003.

4. Se está interesado en comparar el costo relativo de combustibles para calefacción para un periodo de
cuatro años. Se obtiene información con base en una muestra de familias que usan electricidad para
calefacción, otras que usan petróleo y otras que usan gas natural, obteniéndose la cantidad promedio
que cada familia utilizó por mes. Los resultados son:
Costo unitario Uso medio mensual
Combustible 1983 1984 1985 1986 1983 1984 1985 1986
Electricidad 1.7 1.85 2.05 2.05 67 75 68 70
Petroleo 0.32 0.39 0.41 0.42 230 241 225 256
Gas 8.2 9.05 9.7 9.9 7.2 6.9 6.8 7

a) Calcular el índice de Laspeyres para el costo promedio de calefacción para los años 1984, 1985
y 1986 usando como año base 1983.
b) Determinar el índice de Paasche para 1984, 1985 y 1986 usando como año base 1983 para el
costo promedio mensual de calefacción
c) Determinar el índice de Fisher

84
SOLUCIONARIO DE AUTOEVALUACIONES

AUTOEVALUACIÓN DE UNIDAD I

1.
a) Objetivo del problema: Determinar la satisfacción de los lectores con la economía peruana
b) Variable y tipo: Nivel de Satisfacción (Cuanlitativa Ordinal)
c) Población: El total el lectores del diario El Comercio
d) Muestra: 2013 adultos lectores
e) Parámetro: Porcentaje de niveles de satisfacción
2.
Nº VARIABLE CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 Marcas de cerveza de las tiendas X
2 N° de pedidos ingresados al sistema X
3 Los interés ganados por un préstamo X
4 El nivel de audición de un individuo X
5 Opinión sobre la economía actual X

3.
Puntos de Rating yi fi Fi hi Hi
[ 02 - 10  6 5 5 0.10 0.10
[ 10 - 18  14 6 11 0.12 0.22
[ 18 - 26  22 8 19 0.16 0.38
[ 26 - 34  30 15 34 0.30 0.68
[ 34 - 42  38 12 46 0.24 0.92
[ 42 - 50 ] 46 4 50 0.08 1.00
TOTAL 50

b) F3 : En 19 días el programa tuvo como mínimo 18 puntos de rating pero menos de 26


c) En 16 días

4. Interpretación: Según el gráfico mostrado en el año 2008 la producción nacional fue mayor con
23098 millones de dólares, lo cual representa el 7.2% del PBI.

AUTOEVALUACIÓN DE UNIDAD 2

1.

Afirmación V F
a) El valor de la mediana solo se puede calcular en variables cuantitativas X
b) La desviación estándar es siempre menor que la varianza X
c) Si las unidades están en minutos, la varianza se expresa en minutos al cuadrado X
d) El rango es la diferencia entre el valor máximo y el valor mínimo X
e) Dentro de un conjunto de datos puede existir más de una moda X

85
2.
Precios yi fi Fi fi  yi fi  yi2
(Clientes)
[25 – 35) 30 25 25 750 22500
[35 – 45 ) 40 40 65 1600 64000
[ 45 – 55) 50 13 78 650 32500
[55 – 65 ) 60 38 116 2280 136800
[65 – 75 ) 70 15 131 1050 73500
TOTAL 131 6330 329300

a) Media aritmética = 48.32 Mo= 38.57 Me= 45.38

b) Varianza S  180.23 , Desviación estándar S  13.43


2

13.43
c) Se calculara el coeficiente de variación: CV   0.278 , como el C.V. es menor de 0.30 la
48.32
distribución de precios es uniforme.

3.
Grado x S C.V
I 6250 1000 0.160
II 7000 1200 0.171
III 8000 800 0.100
IV 9500 950 0.100
V 11500  1100  0.096

a) El coeficiente de variación
b) Comparando los tres coeficientes de variación de la tabla, el Grado V tiene los sueldos más
homogéneos.
4.
x S C.V
Vendedor 1 3.00 2.10 0.70
Vendedor 2 2.67 2.16 0.81

b) Comparando los dos coeficientes de variación el Vendedor1 tiene las cuotas de ventas menos
variables que el otro vendedor (Los dos vendedores tienen las cutos muy heterogéneas)

AUTOEVALUACIÓN DE UNIDAD 3

1. a) Tabla A: Distribución conjunta de las proporciones con relación al total

Grado de Contaminación
Sector Industrial
Alto Medio Bajo Total
Villa el Salvador 6.0% 2.0% 4.0% 12.0%
Chorrillos 14.0% 8.0% 10.0% 32.0%
Independencia 12.0% 24.0% 20.0% 56.0%
Total 32.0% 34.0% 34.0% 100.0%

86
b) Tabla B: Distribución de las proporciones con relación al total de cada fila

Grado de Contaminación
Sector Industrial
Alto Medio Bajo Total
Villa el Salvador 50.0% 16.7% 33.3% 100.0%
Chorrillos 43.8% 25.0% 31.3% 100.0%
Independencia 21.4% 42.9% 35.7% 100.0%
Total 32.0% 34.0% 34.0% 100.0%

c) Tabla C: Distribución de las proporciones con relación al total de cada Columna

Grado de Contaminación
Sector Industrial
Alto Medio Bajo Total
Villa el Salvador 18.8% 5.9% 11.8% 12.0%
Chorrillos 43.8% 23.5% 29.4% 32.0%
Independencia 37.5% 70.6% 58.8% 56.0%
Total 100.0% 100.0% 100.0% 100.0%

2.
Miles de m2 Años de antigüedad
xi yi 1 2 3 4 5 6 Total fi f i . xi f i . xi2
12 11-13 1 2 3  36  432 
14 13 -15 5 4 3 3 5 1 21  294  4116 
16 15-17 3 5 6 6 2 22  352  5632 
18 17-19 2 4 6  108  1944 
Total fj
6  9  8  9  13  7  n=52  790  12124 
f j . yi    
6  18 24  36  65  42  191 

a) Promedio de años de antigüedad de los agentes de la empresa

y
f y j j

191
 3.67
n 52
b) Media y desviación estándar de las ventas.

x
fx i i

790
 15.19 sY2 
12124  52(15.19) 2
 2.39 sY  1.55
n 52 51

c) Covarianza (X,Y)
1 k e 9051
s XY   
n i1 j 1
fij xi yi  x .y 
52
 ( 3.67 )( 15.19 )  118.26

d) Hallar la distribución Y condicionada a X=[15 – 17)

Valores de Y 1 2 3 4 5 6 Totales
fY X [15 17  0 3 5 6 6 2 22
hY X [1517  0 0.14 0.23 0.27 0.27 0.09 1

87
3.

a) Var X: Precio Var Y: Unidades vendidas


b) r= -0.936 R2= 0.876
c) Y= 54.699 – 0.8586X
d) Si X=25 entonces Y= 54.699 - 0.8586(25)=33.23

AUTOEVALUACIÓN DE UNIDAD 4

1. P ( A)  0.30 P (C )  0.20 P ( A  C )  0.15


P ( A  C )  0.35

2. a) P (T )  0.35  0.79  0.65  0.87  0.842

b) P (T )  1  0.842  0.158
0.35  0.79
c) P( M / T )   0.328
0.842
0.65  0.13
d) P( H / T )   0.535
0.158
3. (Ver Unidad 4, Tema 10)

4.
2.05  67  0.42  230  9.9  7.2
a) IPL1986   100  123.8
1.7  67  0.32  230  8.2  7.2

2.05  70  0.42  256  9.9  7


b) IPP1986   100  124
1.7  70  0.32  256  8.2  7

c) IPF1986  123.8  124  100  123.9

88

Das könnte Ihnen auch gefallen