Beruflich Dokumente
Kultur Dokumente
Federico Villarreal
GUÍA ACADÉMICA
INTRODUCCIÓN A LA ESTADÍSTICA
PARA ECONOMISTAS
Euded
Escuela Universitaria
Educación a distancia
INDICE
PRESENTACIÓN 04
INTRODUCCIÓN A LA ASIGNATURA 05
ORIENTACIONES GENERALES DE ESTUDIO 06
TUTORÍAS 07
CRONOGRAMA 07
EVALUACIÓN 08
MEDIOS Y RECURSOS DIDÁCTICOS 09
OBJETIVOS GENERALES 10
2
6.2. Tablas Estadísticas Bidimensionales 44
6.3. Distribuciones Marginales 45
6.4. Frecuencias Relativas 46
6.5. Grafico Bidimensional 48
Tema 7 Medidas Estadísticas Bidimensionales 49
7.1. Mediciones Marginales 49
7.1.1 Medias Marginales de X e Y 49
7.1.2 Varianzas Marginales de X e Y 49
7.1.3 Desviaciones Estándar Marginales de X e Y 50
7.1.4 Covarianza Entre X e Y 50
7.2. Distribuciones condicionadas 52
Tema 8 Análisis de Correlación y Regresión 54
8.1. Análisis de Correlación 54
8.1.1 Tipos de correlación 54
8.1.2 Diagrama de dispersión 54
8.1.3 Coeficiente de Correlación 55
8.1.4 Niveles de correlación 56
8.2. Análisis de regresión 56
8.2.1 Regresión Lineal simple 57
8.2.2 Recta de mínimos cuadrados 57
8.2.3 Coeficiente de Determinación 58
ACTIVIDADES 59
AUTOEVALUACIÓN N°3 61
3
PRESENTACIÓN
4
INTRODUCCIÓN A LA ASIGNATURA
El contenido del presente manual se caracteriza primero por la exposición del método
estadístico, sus características y alcance de fenómenos a los cuales son factibles de analizar y
segundo la aplicación del método mediante técnicas con el análisis e interpretaciones
correspondientes. Con lo cual se hace una aportación con ejercicios aplicativos usando la
bondad del método estadístico aplicado a la empresa y la economía en general, cuya
transmisión resultará rápida y atractiva para el estudiante.
5
ORIENTACIONES GENERALES DE ESTUDIO
Estimados participantes:
La razón de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situación geográfica no son compatibles con la formación
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad académica igual o
superior a la que se brinda en los programas presenciales. Por ello, los programas virtuales se
apoyan en la más moderna tecnología informática y de comunicaciones (aulas virtuales) que
permiten un alto grado de interacción y orientación del profesor y una elevada interrelación
entre los estudiantes.
Leer, estudiar y trabajar el material didáctico diariamente. Es preferible una hora diaria
durante siete días consecutivos, que 10 horas en un solo día. Las claves del éxito son
continuidad y constancia.
Organizar el tiempo de estudio según las propias condiciones, dificultades y necesidades
de trabajo; en caso contrario el plan de estudios no se cumplirá.
Leer varias veces el material y después comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resúmenes, cuadros sinópticos, etc.
Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las
actividades que tiene en su Texto como en su Guía Académica.
Estudiar en un lugar donde se sienta cómodo para realizar las lecturas y hacer sus tareas.
En lo posible un lugar con claridad y libre de ruido.
6
TUTORÍAS
CRONOGRAMA
7
EVALUACIÓN
8
MEDIOS Y RECURSOS DIDÁCTICOS
Referencias electrónicas
http://www2.ulpgc.es/hege/almacen/download/25/25022/estadstica
itemav.pdf
http://www.fuenterrebollo.com/Economicas2013/unidimensional-
ejercicios.pdf
http://herzog.economia.unam.mx/profesor/barajas/estadis/parte1.p
df
Referencias electrónicas:
http://www2.ulpgc.es/hege/almacen/download/25/25022/estad
sticaitemav.pdf
http://pendientedemigracion.ucm.es/info/amanece/oferdocs/TA
SAS.pdf
Textos
complementarios IBM. Manual de Usuario del Sistema Básico de IBM SPSS
Statistics 21. IBM Corporation, EE. UU. 2012
9
OBJETIVOS
GENERALES
10
Unidad
1
CONCEPTOS GENERALES Y
SISTEMATIZACIÓN DE DATOS
OBJETIVOS ESPECÍFICOS
Contenido Temático
Tema I: Conceptos generales de estadística
Tema II: Sistematización de datos en tablas de frecuencia
Tema III: Representaciones gráficas
11
Conceptos Generales de
Estadística TEMA
1
1.7. La estadística
1.8. Clases de estadística
1.9. Población
1.10. Muestra
1.11. Parámetro y Estadígrafo §
1.12. Variables
1.13. Sumatorias
1.1. La Estadística
La Estadística es una ciencia que tiene por objeto recolectar, organizar, resumir,
presentar y analizar datos relativos a un conjunto de objetos, personas, procesos, etc. A
través de la cuantificación y el ordenamiento de los datos intenta explicar los fenómenos
observados, por lo que resulta una herramienta de suma utilidad para la toma de
decisiones
Estadística Inferencial. Son métodos y técnicas que hacen posible estimar una o más
características de una población o tomar decisiones sobre población basadas en el
resultado de muestras. Estas conclusiones tienen cierto margen de error. Apoyándose en
el cálculo de probabilidades y a partir de datos muestrales, efectúa estimaciones,
decisiones, predicciones u otras generalizaciones sobre un conjunto mayor de datos.
12
Podríamos por tanto decir que se usa estadística en descriptiva, cuando los resultados del análisis
no pretenden ir más allá del conjunto de datos, e inferencial cuando el objetivo del estudio es
derivar las conclusiones obtenidas a un conjunto de datos más amplio.
1.3. Población
Ejemplos
Total de amas de casa de Lima metropolitana en Abril del 2015
Total de proveedores de Supermercados Peruanos en el año 2014
La totalidad de Empresas pesqueras del Perú en el año 2013
1.4. Muestra
Es una pequeña porción representativa y adecuada de la población. Representativa, en el
sentido de reflejar fielmente las características de la población
de la cual procede y diferir de ella sólo en el número de
unidades incluidas.
Las razones para trabajar con muestras son: Ahorro de
tiempo, ahorro de dinero, facilidades operativas y rapidez en la
obtención de resultados.
Ejemplos:
500 de amas de casa de Lima metropolitana elegidas al azar.
Un grupo de proveedores de Supermercados peruanos escogidos aleatoriamente.
15 empresas pesqueras del Perú escogidas en forma aleatoria.
13
Unidad de Análisis. Son cada uno de los elementos de la población que mediante las técnicas de
muestreo van a ser seleccionados para constituir la muestra
Dato. Valor asociado con un elemento de la población o muestra. Puede ser un número, una palabra
o un símbolo.
1.6. Variable
El término variable se utiliza para referirse a cualquier característica, que toma valores
diferentes en un conjunto de observaciones extraídos de una población en estudio. Es
todo aquello que puede ser medido, observado o manipulado durante un estudio. A
las variables se les denota con las letra: x, y, z
Ejemplo: marca de un producto, factura mensual de
electricidad, número de clientes, genero de una
persona, etc.
14
A. Según su Naturaleza
A2. Variables Cuantitativas. Son características cuyos valores pueden ser obtenidos
por medición o por conteo y a su vez pueden ser clasificadas en:
Variables cuantitativas discretas. Cuando las variables toman valores
enteros y son obtenidos por conteo. Ejemplo: Número de tarjetas de crédito
que se posee, cantidad de entidades bancarias por distrito, número de
empleados por área, número de empresas por sector, etc.
Variables cuantitativas continuas. Son aquellas que
pueden tomar cualquier valor (entero, fraccionario o
irracional) dentro un intervalo. Sus valores se obtienen
principalmente a través de mediciones y están sujetos
a la precisión de los instrumentos de medición.
Ejemplo: la superficie de un terreno, la estatura de un
individuo, los sueldos de los congresistas, el costo
efectivo de un producto, el PBI anual, el monto de
exportaciones e importaciones, etc.
15
B. Según su posición en una Relación Causal
1.7. Sumatorias
x
i 1
i x1 x2 ......... xn
i 1 2 3 4 5 6
xi 30 45 36 52 40 50
x
i2
i
x2 x3 x4 x5 45 36 52 40 173
Propiedades:
n n
a) cxi c xi , para todo constante c
i 1 i 1
n n n
b) x i yi x i yi
i 1 i 1 i 1
n n n
c) x i yi x i yi
i 1 i 1 i 1
16
Sistematización de Datos en
Tablas de Frecuencias TEMA
2
2.1. Tabla de Distribución de Frecuencias
2.2. Tabla de Frecuencias de una Variable Cualitativa
2.3. Tabla de Frecuencias de una Variable Cuantitativa
Discreta §
2.4. Tabla de Frecuencias de Variables Cuantitativas
agrupadas en intervalos
Tabla N° 1
Variable (xi) fi Fi hi Hi
X1 f1 f1 h1=n1/n h1
X2 f2 f1+f2 h2=n2/n h1+h2
… …. …. …. ….
Total k k
i 1
fi n h
i 1
i 1
17
Frecuencia Relativa Simple ( hi ), es aquella que resulta de dividir cada una de las
frecuencias absolutas entre el número total de datos. Sus valores son números reales
que oscilan entre 0 y 1. Se denota por:
fi PROPIEDAD: la suma de todas las frecuencias
hi ; 0 hi 1 relativas es igual a la unidad.
n
Frecuencia Relativa Acumulada ( H i ), es igual al cociente entre la frecuencia absoluta
E B B R E B E B
M B E B R B E R
R R M B B E B M
E M E R R R B R
B B E R R M B E
Tabla N° 2
Distribución de clientes según su valoración de la Gestión de
Calidad del departamento del servicio al cliente
Preferencia fi Fi hi Hi
Excelente 10 10 0.25 0.25
Buena 14 24 0.35 0.60
Regular 11 35 0.28 0.88
Mala 5 40 0.13 1.00
Total 50 1
18
Interpretación:
f3: 11 clientes opinaron que la gestión del departamento fue regular
F2: 24 clientes opinaron que la gestión del departamento fue de buena a excelente
h1: El 25% de clientes opinaron que la gestión del departamento fue excelente
H3: El 88% de clientes opinaron que la gestión fue de regular a excelente
Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes
valores que toman las variables.
1 3 1 1 1 2 4 2 1 1
2 2 4 1 2 3 1 2 5 1
4 3 5 1 1 1 2 1 2 2
2 4 3 1 2 1 1 2 3 3
Tabla N° 3
Distribución de empleados según el número de tarjetas de crédito que
poseen en el banco
N° de Tarjetas de fi Fi hi Hi
crédito
1 16 16 0.40 0.4
2 12 28 0.30 0.7
3 6 34 0.15 0.85
4 4 38 0.10 0.95
5 2 40 0.05 1
Total 40 1.00
Interpretación:
f3:6 empleados poseen 3 tarjetas de crédito
F2: 28 empleados poseen menos de 3 tarjetas de crédito
H3: 85% de empleados poseen menos de 4 tarjetas de crédito
19
2.4. Tabla de Frecuencias de Variables Cuantitativas agrupadas
en intervalos
Son aquellas que se utilizan para agrupar datos cuantitativos mediante intervalos de
frecuencias llamados intervalos de clase. Para construir la tabla con intervalos de clase se
debe seguir los siguientes pasos:
Paso1: Rango (R). Llamado también “recorrido de los datos”, es la diferencia entre el
valor máximo y el valor mínimo de la variable. Consideremos las siguientes variables
y1 , y2 , y3 , ......, yn , entonces: R Ymax Ymin
Ejemplo: Los siguientes datos corresponden al tiempo en minutos que han necesitado
16 clientes de un banco para llevar a cabo una transacción bancaria:
Notamos que el tiempo mayor es 5.5 min y el tiempo menor es 1.1 min; El rango es
R= 5.5-1.1= 4.4
LI LS
intervalo de clase. Sea el intervalo LI LS entonces yi
2
20
Ejemplo: El Boston Bank verificó el estado de la cuenta de 42 clientes tomados al azar y
obtuvo los siguientes datos de sus saldos (en dólares)
Tabla N° 4
Distribución de clientes según saldos que tienen en sus cuentas del
Boston Bank
Li - Ls Yi fi Fi hi Hi
41 - 101 71 2 2 0.05 0.05
101 - 161 131 4 6 0.10 0.14
161 - 221 191 8 14 0.19 0.33
221 - 281 251 10 24 0.24 0.57
281 - 341 311 13 37 0.31 0.88
341 - 401 371 2 39 0.05 0.93
401 - 461] 431 3 42 0.07 1.00
Total 42 1
Interpretación:
f3: 8 clientes tienen un saldo mínimo de $161 pero menos de $221
F4: 24 clientes tienen en sus cuentas un saldo menor a $281
h5: 31% de clientes tienen un saldo mínimo $281 pero menos de $341
H3: ___________________________________________________________________
21
Representaciones Gráficas
3.1. Gráficos Estadísticos TEMA
3.2. Partes de un gráfico
3.3. Clasificación de los gráficos
Gráfico de Barras Polígono de frecuencias 3
Gráfico Circular Gráfico de Ojivas
Gráfico Lineal Gráfico Bidimensional §
Histogramas
Los gráficos son una herramienta estadística que detecta la variabilidad, consistencia,
control o mejora de un proceso y consta de las siguientes partes:
• El título principal
• Título secundario o subtítulo
• El gráfico propiamente dicho
• Fuente
• Las notas explicativas
• Interpretación
22
3.3.1. Gráfico de Barras. Este diagrama
representa los valores de la variable en el
eje de abscisas levantando en cada punto
una barra de longitud igual a la frecuencia
de ese valor. El ancho de las barras ha de
ser el mismo y las divisiones de la escala,
equitativas.
23
3.3.5 Polígonos de Frecuencias. Este
diagrama consiste en una serie de
segmentos de recta que unen los puntos
cuyas abscisas son los valores de la
variable, o las marcas de clase, en el
caso de variables continuas, y cuyas
ordenadas son proporcionales a sus
frecuencias respectivas.
24
ACTIVIDADES
3. Considere la siguiente situación. En una gran compañía, se está desarrollando un programa para
ofrecer a los trabajadores una prestación que les permita adquirir un automóvil nuevo a un costo
moderado tanto para el trabajador como para la empresa. Sin embargo, el contrato de arrendamiento
implica decidir qué tipo de automóvil prefieren los trabajadores, pues en función de esto se podrá
seleccionar la mejor empresa arrendadora. El gerente de recursos humanos realiza un muestreo
aleatorio simple en la nómina de la empresa: selecciona 60 trabajadores sin importar los niveles, y les
aplica una encuesta en la cual les pregunta cuál sería la marca de su preferencia. A continuación se
presentan los resultados.
FORD = F CHEVROLET = CH MAZDA = M VOLKSWAGEN = V NISSAN = N
OTROS = O.
F CH CH F M CH F CH CH O
V F N CH CH CH F CH V V
N CH CH N M M O V F F
CH CH N F CH V V V CH V
M V CH CH V N O V F M
CH V V M CH CH CH O V M
25
4. Construye la taba de frecuencias en base a la información dada a continuación:
X i Precio de productos f3 12 H 2 0.40
X 2 10.5 h1 0.08 n i
50
X 4 18.5 h4 0.36 m4
5. Se desea realizar un estudio acerca de los gastos mensuales que efectúan los docentes de la
Universidad Villarreal al estudiar un doctorado, para lo cual se tienen los siguientes gastos en soles
de 30 docentes elegidos al azar:
6. La empresa SILICON.COM es creadora de software a medida para los Bancos. Al igual que en
cualquier negocio, es importante el tiempo que demoran los clientes para pagar sus facturas. A
continuación se presentan los tiempos en días de una muestra de facturas de esa compañía:
X=Tiempo yi fi Fi hi Hi
[ - 23 7
[ - 31 20
[ - 16
[ -
[ - ] 60 0.15
Total
7. Este histograma representa el número de artículos vendidos en una tienda en una semana,
clasificados según su precio en euros…
26
AUTOEVALUACIÓN N° 1
1. En una encuesta publicada en el diario EL COMERCIO se preguntó a 2013 adultos lectores: “¿Qué
tan satisfecho está usted con la economía peruana en la actualidad?” (El comercio, 12 de diciembre
de 1997). Las categorías de las respuestas eran Insatisfecho, Satisfecho y No estoy seguro.
Determine:
a) Objetivo del problema _____________________________________________________________
b) Variable y tipo ___________________________________________________________________
c) Población _______________________________________________________________________
d) Muestra ________________________________________________________________________
e) Parámetro ______________________________________________________________________
3. Los productores del programa televisivo PROMOVIENDO hicieron un estudio sobre los puntos de
rating por día que tiene el programa. Como resultado se obtuvo la siguiente tabla para n de días:
Puntos de Rating y f F h H
i i i i i
[ - 0.10
[ - 11
[ - 26 0.16
[ - 15
[ -
[ - ] 4 50
TOTAL
a) Completar la tabla de distribución si C= 8
b) Interpretar F3 ________________________________________________________________
c) ¿En cuántos días se obtuvieron por lo menos 34 puntos de rating? _______________________
d) Construya un polígono de frecuencias
________________________________________
________________________________________
________________________________________
________________________________________
________________________________________
________________________________________
________________________________________
27
Unidad
2
MEDIDAS DESCRIPTIVAS
NUMERICAS
OBJETIVOS ESPECÍFICOS
Contenido Temático
Tema IV: Medidas de Tendencia central
Tema V: Medidas de Dispersión o Variabilidad
28
Medidas de Tendencia Central
4.1. Concepto y Clasificación TEMA
4.2. Media Aritmética
4.3. Moda
4.4. Mediana 4
4.5. Comparación entre la media, moda y mediana
§
i 1
Xi
X1 X 2 ........... X n
X
n n
Ejemplo: Sea una muestra del precio de 7 libros de economía: 73, 68, 59, 40, 81, 72 y
40. Calcula e interprete la media aritmética.
Interpretación: El precio
29
4.2.2 Calculo de la Media para Datos Agrupados
Se Utilizará cuando los datos están distribuidos en una tabla de frecuencias. Luego
se calcula la media aritmética aplicando la fórmula:
n
fy i i
Donde:
fi= frecuencia absoluta
x i 1
yi= Marca de clase
n n = número de observaciones
La moda es el dato que aparece más veces en un grupo. Es el valor que más se repite o el
que se presenta con mayor frecuencia en un conjunto de datos. La moda puede ser:
30
4.3.1 Calculo de la Moda para Datos no Agrupados
Se ordenan los datos en forma creciente o decreciente y se ubica los valores que más
se repiten.
Ejemplo: Los datos de rendimiento por acción para una muestra de 8 empresas son
los siguientes: (Hallar la moda en los tres casos)
a) 2.2; 3.4; 2.1; 3.4; 2.2; 2.2; 1.8; 2.2 Mo= 2.2
b) 1.2; 2.5; 2.1; 2.4; 2.4; 2.4; 1.2; 1.2 Mo= 1.2 y 2.4
c) 1.9; 2.5; 2.3; 2.4; 1.4; 3.4; 2.2; 1.2 Mo= no existe moda
1
M o LI c j
2 1
Donde:
Observaciones:
La moda se puede determinar en todos los dos tipos de variables cualitativas y
cuantitativas.
La moda tiene la ventaja de no ser afectada por valores extremos
31
Producción
LI LS yi fi
[5 12 8.5 10
[12 19 15.5 14
[19 26 22.5 28
[26 33 29.5 20
[33 40 36.5 8
TOTAL n =80
Pasos:
Ubicamos primero la mayor frecuencia: f j 28
1 28 14 14 ; 2 28 20 8
14
Mo 19 7 23.455
14 8
Interpretación: La producción anual que más se repite es 23455 Tm, lo que significa
que la mayoría de las haciendas producen esa cantidad.
Es el valor que divide al conjunto ordenado de datos en dos subconjuntos con la misma
cantidad de elementos, es decir la media se encuentre exactamente en el centro. La mitad
de los datos son menores que la mediana y la otra mitad son mayores.
32
Ejemplo1. (Cuando el nº de datos es impar)
17, 24, 20, 18, 22, 21, 24; Ordenando: 17, 18, 20, 21, 22, 24, 24 (n=7 impar)
7 1
Posicion 4 Me 21
2
Ejemplo2. (Cuando el nº de datos es par)
13 , 14, 7, 11, 15, 16, 12, 9 ; ordenando: 7, 9, 11, 12, 13, 14, 15, 16 (n=8 par)
12 13
Me 12.5
2
n
2 F j 1
Me LI c j
F j F j 1
Donde:
LI : Límite inferior de la clase mediana
Producción
LI LS yi fi Fi
[5 12 8.5 10 10
[12 19 15.5 14 24
[19 26 22.5 28 52
[26 33 29.5 20 72
[33 40 36.5 8 80
TOTAL n =80
33
Pasos:
n 80
i) Calcular 40 y ubicar en los Fi
2 2
ii) Luego la mediana se encuentra en la clase [19 26 , por lo tanto:
LI 19 ; Fj 52 ; Fj 1 24 ; ; c j =7
40 24 16
Me 19 7 19 7 23
52 24 28
Las distribuciones simétricas tienen el mismo valor para la media, la mediana y la moda.
En una distribución con sesgo positivo, la moda se halla en el punto más alto de la
distribución, la mediana está hacia la derecha de la moda y la media más a la derecha.
Es decir Mo < Me < x (a)
En una distribución con sesgo negativo, la moda es el punto más alto, la mediana está
a la izquierda de la moda y la media está a la izquierda de la mediana. Es decir
x < Me < Mo (b)
Cuando la población tiene una distribución sesgada, con frecuencia la mediana resulta ser
la mejor medida de posición. La mediana no se ve influida por la frecuencia de aparición de
un solo valor como es el caso de la moda, ni se distorsiona con la presencia de valores
extremos como la media.
34
Medidas de Dispersión
5.1. Concepto y Clasificación TEMA
5.2. Rango
5.3. Varianza y Desviación Estándar
5.3.1 Para datos no agrupados 5
5.3.2 Para datos agrupados
5.4. Coeficiente de variación §
La dispersión se refiere a la variabilidad entre los valores, es decir, qué tan grandes son las
diferencias entre los valores. La idea de dispersión se relaciona con la mayor o menor
concentración de los datos en torno a un valor central. Las más comunes son:
Recorrido o rango
Varianza
Desviación Estándar o Típica
Coeficiente de Variación
Ejemplo: Dados los siguientes histogramas ¿en cuál de los gráficos existe mayor
dispersión?
El rango es la diferencia entre los datos mayor y menor del conjunto. También se llama
“recorrido”. En un conjunto de datos, mientras mayor sea el rango, mayor será su
dispersión y mientras menor sea su rango, menor su dispersión. Su fórmula es:
R X max X min
35
Ejemplo: A continuación se muestran las utilidades de 10 corporaciones industriales
estadounidenses más grandes en millones de dólares. Calcular el rango de los datos.
Utilidades($millones) 242 580 187 258 515 234 213 597 212 268
Xi X
N 2
POBLACIONAL 2
i 1 Xi N X 2 2
V(X) V(X )
N N
n n
xi x xi2 nx
2 2
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n 1
fi X i X
N 2 N
2
fi X i N X2
POBLACIONAL i 1 i 1
2 V(X ) V(X)
N N
n n
f i xi x fi xi2 nx
2 2
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n1
Observaciones:
A la desviación estándar también se la llama desviación típica y es la raíz
cuadrada de la varianza. La varianza nunca es negativa.
36
Cuando la variable toma un único valor; es decir cuando es constante entonces la
varianza es cero.
Mientras más se aproxima a cero, más concentrados están los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la varianza, más
dispersos están.
39 29 43 52 39
44 40 36 44 35
Varianza : s 2
38.77
10 1
Interpretación: Los tiempos que tardan en armar una puerta se alejan de la media
en 6.23 minutos aproximadamente por puerta.
37
Calcula la media, varianza y desviación estándar:
fi xi 1814
Determinando la media: x n
80
22.68
46324 80(22.68) 2
La Varianza es: s 65.49
2
80 1
Mide la dispersión en los datos con relación a la media .Es más útil cuando se trata de
hacer comparaciones entre muestras. No tiene unidades de medida. Siempre se
expresa en porcentajes, no en términos de la unidad de medida de los datos
estudiados. Se calcula mediante la fórmula:
S
C .V % 100 (Coeficiente de variación muestral)
X
Observación:
Al realizar comparaciones entre dos variables, el C.V. más pequeño será el que
tenga menor dispersión relativa.
Un C.V. mayor a 30% indica un alto grado de dispersión y pequeña representatividad
de la media, pero cuanto menor sea a 30% la media será más representativa.
Ejemplo: Supongamos que dos empresas repartieron sus beneficios entre sus
principales accionistas, y que el reparto se realiza de la siguiente forma:
Empresa A Empresa B
38
ACTIVIDADES
1. Los sueldos de cinco empleados de una empresa son: $4000, $5000, $4500, $6000 y $35000. Calcula
el sueldo medio, la moda, si es que existe, y la mediana e indica cuál representa mejor a los datos.
2. Se desea analizar el precio de las viviendas en el municipio de Villa el Salvador para ello tras un
minucioso estudio en el registro de la propiedad y una agrupación de los datos se obtiene que
durante los primeros 5 meses del presente año los precios vienen reflejados en la tabla siguiente y las
unidades vienen dadas en miles de euros.
Precio yi fi Fi yi fi
[ 12 – 16 3
[ – 14
[ – 33
[ – 21
[ – ] 9
Total
Monto mínimo fi
65 11
66 15
67 9
68 5
69 2
Total
4. En el curso de Estadística I; se tiene las notas de los alumnos distribuidas según el siguiente
histograma de frecuencias, entonces la nota promedio del curso y la desviación estándar son:
yi fi yi fi
[ –
[ –
[ –
[ –
[ –
[ – ]
Total
39
5. Dado el siguiente cuadro estadístico sobre el número de empleados de un grupo de compañías
azucareras con ancho de clase constante igual a 20. Determine la media, moda y mediana de los
datos e interpreta.
Li Ls Yi fi Fi Yi fi
- 880
- 1950
- 35 1800
- 13
- 200
- ] 4 70
Total
6. Los costos de fabricación, en soles, de siete objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77,
9.00, 9.36 si el precio de venta de cada objeto es 3 veces su costo de fabricación menos 5 soles,
calcular la utilidad media por objeto.
7. En una encuesta sobre bienes y raíces en la Urbanización Santa Eulalia, se obtiene entre otras cosas,
información sobre el valor actual de la casa y el tamaño del lote de terreno. Se está interesado en
determinar si el valor de avalúo tiene mayor variabilidad que el tamaño del lote. De la mencionada
encuesta se consigue lo siguiente:
9. Se realiza un estudio sobre los gastos mensual en alimentación en tres niveles socioeconómicos. Se
cuenta con la siguiente información:
40
AUTOEVALUACIÓN N° 2
1. Indique si son verdaderas o falsas las siguientes afirmaciones
Afirmación V F
a) El valor de la mediana solo se puede calcular en variables cuantitativas
b) La desviación estándar es siempre menor que la varianza
c) Si las unidades están en minutos, la varianza se expresa en minutos al cuadrado
d) El rango es la diferencia entre el valor máximo y el valor mínimo
e) Dentro de un conjunto de datos puede existir más de una moda
Precios yi fi Fi fi yi fi yi2
(Clientes)
[25 – 35) 25
[35 – 45 ) 40
[ 45 – 55) 13
[55 – 65 ) 38
[65 – 75 ) 15
TOTAL
4. Enseguida, aparecen los números de automóviles vendidos por dos agentes, por arriba y por debajo
de sus cuotas de ventas, en seis períodos semanales:
Vendedor 1 3 5 -1 4 3 4
Vendedor 2 2 5 4 -1 4 2
41
Unidad
3
DISTRIBUCIONES
BIDIMENSIONALES
En esta unidad se analizará la dependencia y asociación de variables estadísticas mediante el
uso de modelos lineales y de medidas de asociación en el estudio de los fenómenos
económico-financieros.
OBJETIVOS ESPECÍFICOS
Clasificar datos cuantitativos bidimensionales en forma sistemática, aplicando las técnicas
de la estadística descriptiva.
Resumir datos cuantitativos bidimensionales, aplicando medidas estadísticas descriptivas y
realizando un análisis crítico e interpretativo de los resultados.
Determinar la correlación y regresión lineal existente entre dos variables X e Y. Dominar los
métodos de regresión simple, análisis de correlación y coeficiente de determinación.
Contenido Temático
Tema VI: Distribuciones Bidimensionales
Tema VII: Medidas estadísticas bidimensionales
Tema VIII: Análisis de Correlación y Regresión
42
Distribuciones Bidimensionales
6.1. Definición TEMA
6
6.2. Tablas Estadísticas Bidimensionales
6.3. Distribuciones Marginales
6.4. Frecuencias Relativas
6.5. Grafico Bidimensional
§
6.1. Definición
Ejemplo1: Entre los empleados de una empresa se ha realizado una encuesta sobre el
consumo del tabaco, que ha arrojado los siguientes resultados:
Varones 49 64 113
Mujeres 43 37 80
43
6.2. Tablas Estadísticas Bidimensionales
Una tabla de distribución de frecuencias bidimensional es una tabla de doble entrada que
agrupa en filas las modalidades o valores de X, y en columnas las modalidades o valores
de la característica Y (tabla de kxe, k-filas y e-columnas)
Y y1 y2 y3 .........ye TOTAL
X fi.
x1 f11 f12 f13 .........f1e f1.
x2 f21 f22 f23 .........f2e f2.
x3 f31 f32 f33 .........f3e f3.
. . . . ............ .
. . . . …......... .
. . . . ……..... .
xk fl1 fl2 fl3 .........fke fk.
k e
TOTAL f.j f.1 f.2 f.3 f.e n f ij
i 1 j 1
Donde:
absoluta.
e
f i . f ij = Frecuencia marginal de xi . , es el total de cada fila.
j 1
k
f . j f ij = Frecuencia marginal de y. j , es el total de cada columna.
i 1
k e
n f ij = número total de pares observados
i 1 j 1
44
Ejemplo 2: Dada la distribución bidimensional:
X 1 2 1 2 3 2 2 2 3 1
Y 3 5 2 3 5 4 3 5 5 3
Y 2 3 4 5 Frec. absolutas
X marginales de X
1 1 2 0 0 3
2 0 2 1 2 5
3 0 0 0 2 2
Frec. absolutas 1 4 1 4 n=10
marginales de Y
Son tablas que representan a la variable X y sus frecuencias marginales y de igual manera
a la variable Y con sus frecuencias marginales:
45
Ejemplo 3: del ejemplo 2 obtener la distribución marginal de X e Y
f ij
i) Con relación al total general y se llama frecuencia relativa hij
n
f ij
ii) Con relación al total de cada fila hij
fi .
f ij
iii) Con relación al total de cada columna hij
f. j
46
Y Primaria Secundaria Superior Total
X Completa Completa
Costa 40 30 20 90
Sierra 35 15 10 60
Selva 30 15 5 50
Total 105 60 35 n=200
47
Tabla C: Distribución de las proporciones con relación al total de cada Columna
Interpretación: El 38.1% de los empleados con primaria completa son de la costa, el 25%
de los empleados con secundaria completa son de la sierra.
Permiten representar las series de datos en dos dimensiones o sea los valores se
representan alineados en dos ejes perpendiculares: el eje horizontal X y el eje vertical Y.
Son aplicaciones estadísticas al estudio en conjunto de dos variables cualitativas.
20.0%
20.0 17.5%
18.0
15.0% 15.0%
16.0
14.0
12.0 10.0%
10.0 7.5%7.5%
8.0 5.0%
6.0
4.0 2.5%
2.0
0.0
Primaria Completa Secundaria Superior
CostaCompleta
Sierra Selva
48
Medidas Estadísticas
Bidimensionales TEMA
Sabemos que las distribuciones marginal de X son los totales de las filas y la distribución
marginal de Y son los totales de las columnas, dichos totales vendrían a ser sus
frecuencias absolutas. (Ver tema 6)
k e
f i. xi f
j 1
.j yj
x i 1
y
n n
7.1.2 Varianzas Marginales de X e Y:
k e
f i. x nx
2
i
2
f
j 1
.j y 2j ny 2
s 2X i 1
sY2
n1 n
49
7.1.3 Desviaciones Estándar Marginales de X e Y:
Sabemos por la clase de medidas de dispersión que la desviación estándar es la raíz
cuadrada de las varianzas marginales:
k e
f i . xi2 nx 2 f
j 1
.j y 2j ny 2
sX i 1
sY
n1 n
1 k e
s XY f ij xi yi x.y
n i 1 j 1
Y 1 2 3 4 Total
X
2 6 0 0 0 6
3 7 4 0 0 11
4 10 5 1 0 16
5 0 9 0 0 9
6 1 2 2 0 5
8 0 0 1 2 3
Total 24 20 4 2 50
50
Solución:
a) Frecuencias marginales, acumuladas y relativas para X e Y
1 24 24 48%
2 20 44 40%
3 4 48 8%
4 2 50 4%
TOTAL n =50 100%
xi fi f i . xi . f i . xi2
2 6 12 24
3 11 33 99
4 16 64 256
5 9 45 225
6 5 30 180
8 3 24 192
50 208 976
x
fx i i
208
4.16 s X2
976 50(4.16)2
2.26 s X 1.5
n 50 49
yj f. j
f j . yi . f j . x 2j
1 24 24 24
2 20 40 80
3 4 12 36
4 2 8 32
50 84 172
y
f j yj
84
1.68 sY2
172 50(1.68)2
0.63 sY 0.79
n 50 49
51
a) Covarianza X Y
1 k e 393
s XY f ij xi yi x .y ( 4.16 )( 1.68 ) 0.872
n i 1 j 1 50
Interpretación: como 0.872 >0, existe una asociación directa entre el número de
habitantes y numero de dormitorios es decir, a mayor número de habitantes mayor
cantidad de dormitorios por vivienda.
Sea (X,Y) una variable estadística bidimensional tal que X presenta k-modalidades y la
variable Y e-modalidades mutuamente excluyentes. La distribución de la variable X
condicionada a que la variable Y tome el valor fijo yi ( j 1, 2, ..., e ) está dado en la tabla:
x1 x2 ........ xk Totales
Frecuencia absoluta de X
condicionada a Y yj f1 j f2 j ……. f kj f. j
fX Y y
j
Frecuencia relativa de X
condicionada a Y yj f1 j f2 j ……. f kj 1
hX Y y f. j f. j f. j
j
De igual manera la distribución de la variable Y condicionada a que la variable X tome el
valor fijo xi ( i 1, 2, ..., k ) está dado en la tabla:
52
Ejemplo 2: Tomando la tabla bidimensional del ejemplo 1:
Y 1 2 3 4 Total
X
2 6 0 0 0 6
3 7 4 0 0 11
4 10 5 1 0 16
5 0 9 0 0 9
6 1 2 2 0 5
8 0 0 1 2 3
Total 24 20 4 2 50
Solución:
a)
Valores de X 2 3 4 5 6 8 Totales
f X Y 2 0 4 5 9 2 0 20
b)
Valores de Y 1 2 3 4 Totales
fY 1 2 2 0 5
X 6
c)
Valores de X 2 3 4 5 6 8 Totales
f X Y 3 0 0 1 0 2 1 4
d)
Valores de Y 1 2 3 4 Totales
fY 0 0 1 2 3
X 8
53
Análisis de Correlación y
Regresión TEMA
La correlación estadística determina la relación o dependencia que existe entre las dos
variables que intervienen en una distribución bidimensional. Es decir, determinar si los
cambios en una de las variables influyen en los cambios de la otra. En caso de que
suceda, diremos que las variables están correlacionadas o que hay correlación entre ellas.
La correlación es la teoría que se encarga de estudiar las posibles relaciones existentes
entre dos variables X e Y estadísticas.
8.1.1 Tipos de Correlación. Según la relación entre las variables X e Y podemos tener:
A. Correlación Directa o Positiva. Cuando las variables X e Y presentan variaciones
en un mismo sentido, esto es, para mayores valores de X, mayores valores de Y.
B. Correlación Inversa o Negativa. Cuando las variaciones de X e Y son en sentidos
contrarios, esto es, para mayores valores de X corresponden menores valores de Y.
C. Sin correlación. Cuando no existe ningún tipo de relacionamiento entre las
variables.
54
Ejemplo1: Una compañía de seguros desea determinar el grado de relación que existe
entre el ingreso familiar y el monto del seguro de vida del jefe de familia. Con base a una
muestra aleatoria de 9 familias, se obtuvo la siguiente información (en miles de dólares)
Características:
El coeficiente r es un número comprendido entre -1 y +1
1 r 1
Si r 0 Existe una correlación directa o positiva
Si r 0 Existe una correlación Inversa o negativa
Si r 0 No Existe asociación entre las dos variables, no existe asociación lineal.
N° Ingreso Seguro de XY X2 Y2
(X) Vida (Y)
1 45 70 3150 2025 4900
2 20 50 1000 400 2500
3 40 60 2400 1600 3600
4 40 50 2000 1600 2500
5 47 90 4230 2209 8100
55
6 30 55 1650 900 3025
7 25 55 1375 625 3025
8 20 35 700 400 1225
9 15 40 600 225 1600
Total 282 505 17105 9984 30475
∑X ∑Y ∑XY ∑ X2 ∑ Y2
n9 ; x
x 282 31.3 ; y
505
56.1
n 9 9
n
xi yi nxy
i 1 17105 9(31.3)(56.1)
r 0.818
x 2 nx 2 y2 ny 2
n
i i
n
9984 9(31.3) 2 30475 9(56.1) 2
i 1 i 1
Interpretación: Como r=0.818, existe una correlación positiva fuerte entre el ingreso
profesional y el seguro de vida adquirido.
Este análisis toma como base las observaciones que se realizan para cada una de las
variables X e Y, donde se da a conocer una ecuación matemática que indica la relación de
estas variables; cuando se tiene la ecuación esta se utiliza para poder estimar valores
futuros que pueda tener una variable. En cualquier problema se deben tener muy
identificadas las variables de dicho problema, a estas variables se les conoce como
variable dependiente (Y) y variables independiente (X).
56
8.2.1 Regresión Lineal Simple. Este tipo de regresión se utiliza cuando existe solo una
variable independiente X para una variable dependiente Y. Está definida por la
siguiente ecuación lineal en su forma general:
Y b0 b1 X e
Dónde:
Y Es la variable respuesta o valor de la predicción de la variable Y dado un valor X .
b0 ,b1 Coeficientes de la regresión lineal
b0 Es el valor de Y cuando X = 0, es decir, es el valor de Y cuando la línea de
regresión cruza el eje de las Y.
b1 Es la pendiente de la línea, o la variación promedio en Y por cada variación de
una unidad en X.
X Es cualquier valor seleccionado de la variable independiente X.
e Es el error de predicción
Ŷ b0 b1 X
n
xi yi nxy
i 1 17105 9(31.3)(56.1)
b1 1.12
9984 9(31.3) 2
n
xi2 nx 2
i 1
57
Entonces la ecuación de regresión estimada será:
Ŷ 21.13 1.12 X
Interpretación:
b1 1.12 , El monto promedio del seguro de vida del jefe de familia aumentará en
( x x )( y y )
2
R
2
r2
xi nx yi ny
2 2 2 2
Características:
Interpretación: El 66.9% de la variación del monto del seguro (Y) son explicados por
el Ingreso profesional.
58
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD3
1. Una empresa minera hizo un estudio para verificar si el tipo de trabajo se relaciona con el grado de
estrés de los trabajadores. Para lo cual se elige una muestra aleatoria de 300 trabajadores y se
clasifican en la tabla siguiente:
Oficina 42 24 30 96
Terreno 54 78 72 204
Conciertos (Y) 10 - 30 30 - 40 40 - 80
CDs(X)
1–5 3 0 0
5 – 10 1 4 1
10 - 20 0 1 5
3. La información estadística obtenida de una muestra de tamaño 12 sobre la relación existente entre la
inversión realizada y el rendimiento obtenido en cientos de miles de euros para explotaciones
agrícolas, se muestra en el siguiente cuadro:
Inversión (X) 11 14 16 15 16 18 20 21 14
Rendimiento (Y) 2 3 5 6 5 3 7 10 6
59
4. Se toma una muestra de 150 pinos, observando en cada árbol su altura “X” (en centímetros) y el
número “Y” de nidos de gorriones que lo habitan.
Y 1 2 3 4 5
X
50 – 150 2 4 6 10 8
150 – 250 1 2 3 5 4
250 – 350 3 6 9 15 12
350 - 450 4 8 12 20 16
Total
6. Una casa de empanadas realiza promociones a través de publicidad repartiendo volantes publicitarios.
Se cree que existe relación entre “x“ cantidad de volantes repartidos por semana en cientos e “ y ”
ventas en cientos de pesos. Se tomaron 8 semanas al azar que arrojaron la siguiente información:
a) Determine en qué medida la variable cantidad de volantes explica las variaciones de las ventas.
b) Determine la recta de ajuste e interprete los coeficientes.
c) Pronostique el valor las ventas, cuando se reparten 350 volantes.
60
AUTOEVALUACIÓN N° 3
1. Una institución ambiental hizo un estudio para determinar si el sector industrial se relaciona con el
grado de contaminación por plomo. Una muestra aleatoria de 300 empresas a las que se les examinó
entregó los siguientes resultados:
Grado de Contaminación
Sector Industrial Alto Medio Bajo Total
Villa el Salvador 18 6 12
Chorrillos 42 24 30
Independencia 36 72 60
Total
2. Una empresa del sector cerámico realiza un estudio sobre los metros cuadrados vendidos de sus
productos por agentes de ventas en plantilla y la antigüedad en la empresa de los mismos:
3. Una empresa de consumibles de informática asigna diferentes precios a los cartuchos de tinta que
comercializa según el centro comercial donde se ponen a la venta. La tabla adjunta muestra el
número de unidades vendidas y los precios (en soles).
Unidades
Precio XY X2 Y2
vendidas
15 43
20 38
23 36
14 40
12 42
27 31
10 49
61
Unidad
4
PROBABILIDADES, SERIES DE
TIEMPO Y NUMEROS INDICES
OBJETIVOS ESPECÍFICOS
Modelar experimentos aleatorios y aplicar correctamente la definición clásica de
probabilidad. Calcular probabilidades condicionales y tomar de decisiones aplicando el
Teorema de Bayes.
Analizar datos económicos a través del tiempo mediante el análisis de series de tiempo
hechas a una variable aleatoria en épocas sucesivas y en intervalos equidistantes.
Estudiar las variaciones de un fenómeno complejo por medio de números índices, los
cuales permiten comparar dos o más situaciones distintas en el tiempo y/ó el espacio.
Contenido Temático
Tema IX: Introducción a las Probabilidades
Tema X: Análisis de Series de Tiempo
Tema XI: Números Índices
62
Introducción a las Probabilidades
9.1. Probabilidades y eventos TEMA
9.2. Experimento aleatorio
9.3. Espacio muestral y eventos
9.4. Técnicas de conteo 9
9.5. Concepto clásico de probabilidad
9.6. Probabilidad Condicional §
9.7. Teorema de Bayes
Las preguntas anteriores esperan como respuesta una medida de confianza para conocer
un evento futuro, o bien de una forma sencilla interpretar la probabilidad. El estudio de las
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de
azar, que constituyen la base para la estadística inferencial.
63
9.3. Espacio Muestral y Eventos
A. Espacio Muestral
Es denotado por , es un conjunto formado por todos los posibles resultados de un
experimento.
A. Permutaciones de n elementos
Una permutación de un conjunto de elementos, es un ordenamiento específico de
todos o algunos elementos del conjunto. En una permutación el orden en que se
disponen los elementos del conjunto es importante.
64
Por el principio fundamental del conteo podemos enunciar que el número de
permutaciones de n objetos distintos tomados de n en n, es: Pn = n!
n! = n (n -1 ) (n -2 )...3 x 2 x 1
5! = 5 x 4 x 3 x 2 x 1 = 120
Por definición 0! = 1
B. Combinaciones
Una combinación es un subconjunto o una disposición de todos los elementos de un
conjunto, sin tener en cuenta el orden de ellos. El número de combinaciones o
subconjuntos no ordenados, cada uno formado por r elementos, que pueden
obtenerse de un conjunto de n elemento es:
n!
nCr
( n r )! r !
1
Sea el evento A 5 , un resultado favorable P ( A) 0,167
6
65
Determinar la probabilidad de que se obtenga un número par
3 1
Sea el evento B 2, 4, 6 , 3 resultados favorables P ( B ) 0, 5
6 2
iii. P 0
iv. P A B P A P B P A B .
Ejemplo 6: En cierta ciudad, la probabilidad que una familia tenga televisor es 0.75, un
refrigerador es 0.60 y que tengan ambos es 0.50 ¿Cuál es la probabilidad que una
familia tenga un refrigerador o un televisor?
Solución: P (T ) 0.75 P ( R) 0.60 P (T R) 0.50
P T R 0 .7 5 0 . 6 0 0 .5 0 0 . 8 5
Ocurre cuando dos eventos se relacionan de manera tal que la probabilidad de ocurrencia
de uno depende de la ocurrencia del otro.
Definición: Sean A y B dos eventos tal que P( B ) 0 , la probabilidad condicional de que
ocurra el evento A dado que ha ocurrido B, se denota:
P( A B )
P( A / B )
P( B )
66
Ejemplo 8: En una ciudad el 55% de los habitantes consume arroz, el 30% consume trigo
y el 20% consume ambos. Se pide: A= Arroz T= Trigo
Ejemplo 9: Para tratar de frenar la crisis económica del País un Ministro desea aplicar dos
medidas económicas A y B en 60 ciudades para observar si mejor o no la economía. La
siguiente tabla refleja los resultados obtenidos.
67
9.7. Teorema de Bayes
Si los eventos A1 , A2 , ...., An forman una partición del espacio muestral , y B un evento
cualquiera de , entonces:
P( Ai )P( B / Ai )
P( Ai / B ) n
P( A )P( B / A )
i 1
i i
Ejemplo 10: En una industria de acero se estima que hay un 60% de probabilidad de que
las inversiones de capital aumenten el próximo año. Si el próximo año aumentan las
inversiones de capital, la probabilidad de que el acero para construcciones suba de precios
es de 90%. Si no hay incremento en dichas inversiones, la probabilidad de un aumento en
los precios del acero es de 30%.
a) Construya el diagrama del árbol respectivo
b) ¿Cuál es la probabilidad de que suban los precios del acero?
c) ¿Cuál es la probabilidad de que no suban los precios del acero?
d) ¿Cuál es la probabilidad de que haya un aumento de la inversión de capital si es que
no suben los precios del acero para construcciones?
e) ¿Cuál la probabilidad de que no aumente la inversión si es que suben los precios?
a) Diagrama de Árbol
c) P( S ) 1 0.66 0.34
P( A S ) 0.6 0.10
d) P( A / S ) 0.176
P( S ) 0.34
P( A S ) 0.4 0.30
e) P( A / S ) 0.182
P( S ) 0.66
68
Análisis de Series Temporales
10.1. Definición TEMA
10
10.2. Importancia de las Series de Tiempo
10.3. Componentes de una serie cronológica
10.4. Análisis de Series de Tiempo
10.5. Estudio de la Tendencia
§
10.1. Definición
Años(X) 1998 1999 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009 2010
Prod(Y) 286 290 250 307 323 317 342 353 396 381 391 419 390
Grafique esta serie en el sistema cartesiano, donde los años son las variables
independientes (X) y la producción la variable dependiente (Y)
69
10.2. Importancia de las Series de tiempo
Son útiles en muchos trabajos en los que el tiempo juega un papel preponderante, lo cual
ocurre en múltiples aspectos de la Administración y Economía. Se utiliza para realizar
pronósticos, predicciones y proyecciones de resultados futuros.
Unidades de Tiempo
Las más usadas son por lo general de un año, un trimestre, un mes, etc. Se elegirán las
más adecuadas para el estudio.
Dentro de estas unidades de tiempo, algunas tienen duración constante (horas, días, etc)
pero otras son variables (meses, años)
En el gráfico anterior sobre la producción de papel pudimos apreciar que los valores de la
serie (Valores de Y) son distintos en cada periodo de tiempo, de manera que la gráfica
evoluciona al transcurrir el tiempo que se conoce como movimiento o variación de la
serie.
Los movimientos o variaciones de las series temporales se agrupan en cuatro
componentes:
Tendencia secular
Componente Estacional
Componente Cíclica
Componente Irregular
70
10.3.2 Componente Estacional
Son fluctuaciones en periodos relativamente cortos que se repiten de manera casi
irregular. Por lo general están asociados a los diferentes meses del año.
Se puede ver afectada por la climatología, las costumbres, etc.
Se produce dentro de un periodo anual.
Se deben a sucesos recurrentes que tienen lugar anualmente tales como el brusco
aumento de precios al consumo antes de navidad, aumento de consumo de
bebidas en verano.
71
10.4. Análisis de Series de Tiempo
72
10.5.2 Método de promedios móviles
Es en realidad una suavización de la información de las series cronológicas para
eliminar o atenuar movimientos cíclicos.
Definición: dada una sucesión de valores x1 , x2 , .....xn , se define el promedio móvil
Construir un gráfico con los datos suavizar la serie con promedio móvil de 3 y 4 periodos y
graficar:
Prom. Prom.
Móvil Móvil
3 4
Años Periodos Ventas periodos periodos
2002 1 190
2 370 286.67 270
3 300 296.67 292.5
4 220 266.67 305
2003 1 280 306.67 307.5
2 420 336.67 297.5
3 310 303.33 295
4 180 253.33 280
2004 1 270 270 272.5
2 360 303.33 275
3 280 276.67 282.5
4 190 256.67 300
2005 1 300 306.67 302.5
2 430 340 305
3 290 306.67 310
4 200 270 312.5
2006 1 320 320 320
2 440 360 325
3 320 326.67
4 220
73
10.5.3 Método de Mínimos Cuadrados
Ŷ b0 b1 X
a) Hallar la ecuación lineal de estimación que mejor describe la tendencia e interprete los
coeficientes.
b) Comparar las ventas reales (Y) frente a las estimadas
c) Predecir las ventas para el I y II trimestre del 2007
74
a) En primer lugar se debe recodificar los periodos en forma consecutiva en la variable T,
que sería la variable X de nuestra ecuación a estimar:
X Y
XY X2
Ventas
Años Periodos T
2010 1 1 180 180 1
2 2 190 380 4
3 3 190 570 9
4 4 200 800 16
2011 1 5 220 1100 25
2 6 220 1320 36
3 7 270 1890 49
4 8 280 2240 64
2012 1 9 280 2520 81
2 10 290 2900 100
3 11 300 3300 121
4 12 300 3600 144
2013 1 13 310 4030 169
2 14 320 4480 196
3 15 320 4800 225
4 16 360 5760 256
2014 1 17 370 6290 289
2 18 420 7560 324
3 19 430 8170 361
4 20 440 8800 400
∑X= 210 ∑Y=5890 ∑XY=70690 ∑ X2=2870
Ŷ 154.84 13.301X
75
b) La siguiente tabla muestra la comparación las ventas reales (Y) frente a las
estimadas Ŷ
T(X) Ventas (Y) Ŷ 154.84 13.301X
1 180 168.14
2 190 181.44
3 190 194.74
4 200 208.04
5 220 221.35
6 220 234.65
7 270 247.95
8 280 261.25
9 280 274.55
10 290 287.85
11 300 301.15
12 300 314.45
13 310 327.75
14 320 341.05
15 320 354.36
16 360 367.66
17 370 380.96
18 420 394.26
19 430 407.56
20 440 420.86
76
Números Índices
11.1. Definición TEMA
11.2. Clasificación de Números Índices
11.3. Números Índices Simples
11.4. Números Índices Compuestos 11
11.5. Índices Compuestos no ponderados
11.6. Índices Compuestos ponderados §
11.1. Definición
Un número índice es un indicador diseñado para describir los cambios de una variable en
el tiempo, esto es, su evolución a lo largo de un determinado período. Como por ejemplo:
La evolución en la cantidad de un determinado bien o servicio o de un conjunto de ellos
(por ejemplo cantidades producidas o consumidas).
La evolución en el precio de un bien o servicio o conjunto de éstos.
La evolución en el valor de un bien o servicio o de una canasta de bienes y servicios.
El número índice es una razón o un cociente de cada uno de los valores de la variable x
con respecto a un valor que se toma como referencia, expresado en porcentajes.
Ejemplo1: El tipo de cambio del dólar de los Estados Unidos ha pasado de S/.2.196 en
Diciembre de 1994 a S/.3.490 en Diciembre del 2000. El índice de variación del dólar del
2000 respecto a 1994 es:
3.490
I 2000/1994 ( D ) 100 158.93
2.196
Es decir hubo una variación de 58.93% (158.93-100), el dólar en el año 2000 aumento en
un 58.93% con respecto al año 1994.
Ponderados
77
11.3. Números Índices Simples
Los números índices simples se refieren a un solo artículo o concepto, lo cual se traduce a
variaciones de una sola variable a través del tiempo. Son simples relaciones o porcentajes
entre los valores de un artículo o concepto correspondientes a dos épocas o lugares que
desean compararse. La comparación se realiza entre el valor correspondiente a un periodo
fijo (periodo base) y el valor alcanzado por la magnitud en cualquier otro momento t . Se
denota de la siguiente manera:
xt
I t / t0 ( x ) 100
x0
Dónde:
xt es el l valor de la variable en el momento t.
x0 es el valor de la variable en el momento 0 (Base de referencia)
Ejemplo2: Supongamos por ejemplo, que el precio de un artículo, en julio de 2012 era
S/.250 y en Julio del 2013 es de S/. 320. Calcular el índice de precio del artículo para el
año 2013 respecto a 2012 y el grado de variación.
320
I 2013/2012 ( P ) 100 128
250
Es decir hubo una variación de 28% (128-100).
Ejemplo3: Se tiene la evolución del salario mínimo de los empleados entre los años 2007
– 2012. Calcular los índices para cada uno de los seis años usando como año base 2007
Índice de
Año (t) Salario mínimo vital salarios base:
(empleados) Cálculos (base 2007) 2007
2007 S/. 530.00 530/530*100= 100.00
Nota: Para calcular el grado de variación (aumento o disminución) con respecto al periodo
base, se averigua qué porcentaje representa la variación restando 100 al índice porcentual.
Por ejemplo en el 2010 el salario aumento un 13.21% (113.21-100) con respecto a 2007.
78
11.4. Números Índices Compuestos
Se denominan así cuando todas las variables que intervienen en su determinación tienen
la misma importancia o el mismo peso. Para es te caso desarrollaremos:
I I 2 ... I n I i
I t / t0 1 i 1
n n
79
El índice compuesto no ponderado más básico es simplemente la media aritmética de
todos los índices:
Lo que indica que los precios para estos productos en 2014 son 20.27% más caros que lo
que fueron en 2013.
Su objetivo es solucionar los problemas planteados por los índices complejos sin ponderar.
Los índices complejos ponderados tienen en cuenta la importancia relativa de las distintas
magnitudes simples que lo componen, que denominaremos wi. Por construcción se debe
de cumplir:
k Para todo t, siendo k, el número de
w
i 1
i
t 1 magnitudes simples que forman la
magnitud compleja
Es evidente que todas las familias consumen alimentos, vestido, vivienda y energía; pero
también es evidente que la importancia de cada uno de estos elementos en el consumo
habitual de una familia es muy distinta. Si diéramos la misma importancia a todos ellos
(índice compuesto sin ponderar) obtendríamos un Índice de Precios de Consumo que poco
tiene que ver con la realidad. En función de la relación entre las ponderaciones wi y los
índices de las componentes It/0 podemos definir los siguientes tipos de índices:
p q
Dónde:
it i 0 pit= Precio del artículo i en el año dado t
IPL i 1
n
100 qi0= Cantidad consumida del artículo i en el año base
p
i 1
i0 i0q pi0= Precio del artículo i en el año base
80
11.6.2 Índice de Precios de Paasche
Se calcula con la siguiente fórmula:
n Dónde:
pit qit pit= Precio del artículo i en el año considerado t
IPP i 1
n
100 qit= Cantidad consumida del artículo i en el año dado t
p
i 1
q
i 0 it
pi0= Precio del artículo i en el año base
p q
i 1
it it = Suma de los valores de las cantidades consumidas en el año considerado
p
i 1
q = Suma de los valores de las cantidades consumidas en el año considerado
i 0 it
n n
p q p q
it i 0 it it
IPF IPL IPP 100 i 1
n
i 1
n
p
i 1
q
i0 i0 p
i 1
q
i 0 it
81
ACTIVIDADES
EJERCICIOS DE APLICACIÓN DE UNIDAD4
1. A un Congreso Internacional de Economía asistieron 75 Banqueros (B) y 35 Asesores comerciales (A)
entre las 200 personas que acudieron al congreso. Calcule la probabilidad de que una persona
seleccionada al azar:
a) sea un banquero. P ( B ) ___________ b) No sea banquero ni Asesor: _______________
2. En una entidad bancaria, la probabilidad que un directivo tenga título de economista es 0.36, que
tenga título contable es 0.24 y que tengan alguno de los dos 0.42 ¿Cuál es la probabilidad que un
directivo elegido al azar tenga ambos títulos?
P ( E ) _____ P (C ) _____ P ( E C ) ______ P ( E C ) ______
3. En el refrigerador de una tienda hay 18 envases de refrescos de los cuales 9 son de sabor manzana, 4
de uva y el resto de naranja. En una venta se piden 6 refrescos, si al abrir el refrigerador estos 6 se
escogen al azar: ¿Cuál es la probabilidad que:
a) 3 refrescos sean de sabor manzana, 2 de uva y 1 de naranja?
b) 4 sean refrescos de sabor naranja?
c) Todos los refrescos sean de sabor manzana?
4. En una industria de acero se estima que hay un 60% de probabilidad de que las inversiones de capital
aumenten en el próximo año. Si el próximo año hay un aumento en las inversiones de capital, la
probabilidad de que el acero para construcciones suba de precios es de 90%. Si no hay incremento
en dichas inversiones, la probabilidad de un aumento en los precios del acero es de 40%.
Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
1996 178.2 156.7 164.2 153.2 157.5 172.6 185.9 185.8 165 163.6 169 183.1
1997 196.3 162.8 168.6 156.9 168.2 180.2 197.9 195.9 176 166.4 166.3 183.9
1998 197.3 173.7 173.2 159.7 175.2 187.4 202.6 205.6 185.6 175.6 176.3 191.7
1999 209.5 186.3 183 169.5 178.2 186.1 202.4 204.9 180.6 179.8 177.4 188.9
2000 200 188.7 187.5 168.6 175.7 189 216.1 215.4 191.5 178.5 178.6 195.6
2001 205.2 179.6 185.4 172.4 177.7 202.7 220.2 210.2 186.9 181.4 175.6 195.6
82
6. Partiendo de la siguiente serie de salarios mensuales:
Trimestre Trimestre Trimestre Trimestre
Año I II III IV
2010 1078 1140 1121 1248
2011 1124 1192 1173 1303
2012 1171 1236 1207 1342
2013 1205 1264 1232 1370
7. Se ha elaborado la siguiente tabla para los salarios promedio mensual de un obrero de construcción
civil en 1960, 1965, 1970, 1975, 1980 y 1985. Hallar los correspondientes números índices para cada
uno de los seis años, usando como año base 1960:
Año (t) Salario Cálculos Índice de
promedio (base 1960) salarios base:
mensual (x) 1960
1960 25 25/25*100= 100
1965 30
1970 35
1975 40
1980 50
1985 90
Nota: Para calcular el grado de variación (aumento o disminución) con respecto al periodo base, se
averigua qué porcentaje representa la variación restando 100 al índice porcentual.
8. Consideremos que una empresa comercializa tres productos diferentes A, B y C. Calcular los índices
simples de ventas para cada uno de los productos, y el índice compuesto no ponderado usando el
“Método de la Media Aritmética simple” para las ventas en los años 2001 – 2004 tomando como base el
año 2001.
Venta A (miles de
Años unid.) Venta B (miles de unid.) Venta B (miles de unid.)
2001 90 80 40
2002 150 102 56
2003 190 135 68
2004 205 140 80
9. Se tienen tres artículos A, B y C de los cuales conocemos el precio en cada uno de los cuatro años
1986, 1987, 1988 y 1989 y las cantidades consumidas en esos mismos periodos:
83
AUTOEVALUACIÓN N° 4
1. El propietario de una tienda de música sabe que el 30% de sus clientes pide ayuda a los dependientes
y que el 20% hace una compra antes de abandonar el local. Además sabe que el 15% de los clientes
pide ayuda y hace una compra. ¿Cuál es la probabilidad de que un cliente realice al menos una de
estas dos cosas?
2. En España se entiende por población activa a todas las personas mayores de 16 años que buscan o
tienen empleo. El 35% de la población activa son mujeres. De las mujeres que forman parte de la
población activa, el 79% tiene trabajo. Entre los hombres que forman parte de la población activa, el
87% tiene trabajo. Si se escoge una persona al azar:
3. En la siguiente tabla se muestran los datos de consumo eléctrico (en millones de Kilowatts) de la
compañía “Textiles Peruanos” entre 2000 - 2002
Trimestre Trimestre Trimestre Trimestre
Año I II III IV
2000 1047 667 495 794
2001 1068 625 499 850
2002 1071 648 480 746
a) Construir un gráfico con los datos y trace la tendencia de la serie a mano alzada
b) Suavizar la serie con promedio móvil de 3 periodos y graficar sobre el grafico de a)
c) Hallar la ecuación lineal de estimación de la tendencia y Predecir el consumo eléctrico para el
primer trimestre del 2003.
4. Se está interesado en comparar el costo relativo de combustibles para calefacción para un periodo de
cuatro años. Se obtiene información con base en una muestra de familias que usan electricidad para
calefacción, otras que usan petróleo y otras que usan gas natural, obteniéndose la cantidad promedio
que cada familia utilizó por mes. Los resultados son:
Costo unitario Uso medio mensual
Combustible 1983 1984 1985 1986 1983 1984 1985 1986
Electricidad 1.7 1.85 2.05 2.05 67 75 68 70
Petroleo 0.32 0.39 0.41 0.42 230 241 225 256
Gas 8.2 9.05 9.7 9.9 7.2 6.9 6.8 7
a) Calcular el índice de Laspeyres para el costo promedio de calefacción para los años 1984, 1985
y 1986 usando como año base 1983.
b) Determinar el índice de Paasche para 1984, 1985 y 1986 usando como año base 1983 para el
costo promedio mensual de calefacción
c) Determinar el índice de Fisher
84
SOLUCIONARIO DE AUTOEVALUACIONES
AUTOEVALUACIÓN DE UNIDAD I
1.
a) Objetivo del problema: Determinar la satisfacción de los lectores con la economía peruana
b) Variable y tipo: Nivel de Satisfacción (Cuanlitativa Ordinal)
c) Población: El total el lectores del diario El Comercio
d) Muestra: 2013 adultos lectores
e) Parámetro: Porcentaje de niveles de satisfacción
2.
Nº VARIABLE CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 Marcas de cerveza de las tiendas X
2 N° de pedidos ingresados al sistema X
3 Los interés ganados por un préstamo X
4 El nivel de audición de un individuo X
5 Opinión sobre la economía actual X
3.
Puntos de Rating yi fi Fi hi Hi
[ 02 - 10 6 5 5 0.10 0.10
[ 10 - 18 14 6 11 0.12 0.22
[ 18 - 26 22 8 19 0.16 0.38
[ 26 - 34 30 15 34 0.30 0.68
[ 34 - 42 38 12 46 0.24 0.92
[ 42 - 50 ] 46 4 50 0.08 1.00
TOTAL 50
4. Interpretación: Según el gráfico mostrado en el año 2008 la producción nacional fue mayor con
23098 millones de dólares, lo cual representa el 7.2% del PBI.
AUTOEVALUACIÓN DE UNIDAD 2
1.
Afirmación V F
a) El valor de la mediana solo se puede calcular en variables cuantitativas X
b) La desviación estándar es siempre menor que la varianza X
c) Si las unidades están en minutos, la varianza se expresa en minutos al cuadrado X
d) El rango es la diferencia entre el valor máximo y el valor mínimo X
e) Dentro de un conjunto de datos puede existir más de una moda X
85
2.
Precios yi fi Fi fi yi fi yi2
(Clientes)
[25 – 35) 30 25 25 750 22500
[35 – 45 ) 40 40 65 1600 64000
[ 45 – 55) 50 13 78 650 32500
[55 – 65 ) 60 38 116 2280 136800
[65 – 75 ) 70 15 131 1050 73500
TOTAL 131 6330 329300
13.43
c) Se calculara el coeficiente de variación: CV 0.278 , como el C.V. es menor de 0.30 la
48.32
distribución de precios es uniforme.
3.
Grado x S C.V
I 6250 1000 0.160
II 7000 1200 0.171
III 8000 800 0.100
IV 9500 950 0.100
V 11500 1100 0.096
a) El coeficiente de variación
b) Comparando los tres coeficientes de variación de la tabla, el Grado V tiene los sueldos más
homogéneos.
4.
x S C.V
Vendedor 1 3.00 2.10 0.70
Vendedor 2 2.67 2.16 0.81
b) Comparando los dos coeficientes de variación el Vendedor1 tiene las cuotas de ventas menos
variables que el otro vendedor (Los dos vendedores tienen las cutos muy heterogéneas)
AUTOEVALUACIÓN DE UNIDAD 3
Grado de Contaminación
Sector Industrial
Alto Medio Bajo Total
Villa el Salvador 6.0% 2.0% 4.0% 12.0%
Chorrillos 14.0% 8.0% 10.0% 32.0%
Independencia 12.0% 24.0% 20.0% 56.0%
Total 32.0% 34.0% 34.0% 100.0%
86
b) Tabla B: Distribución de las proporciones con relación al total de cada fila
Grado de Contaminación
Sector Industrial
Alto Medio Bajo Total
Villa el Salvador 50.0% 16.7% 33.3% 100.0%
Chorrillos 43.8% 25.0% 31.3% 100.0%
Independencia 21.4% 42.9% 35.7% 100.0%
Total 32.0% 34.0% 34.0% 100.0%
Grado de Contaminación
Sector Industrial
Alto Medio Bajo Total
Villa el Salvador 18.8% 5.9% 11.8% 12.0%
Chorrillos 43.8% 23.5% 29.4% 32.0%
Independencia 37.5% 70.6% 58.8% 56.0%
Total 100.0% 100.0% 100.0% 100.0%
2.
Miles de m2 Años de antigüedad
xi yi 1 2 3 4 5 6 Total fi f i . xi f i . xi2
12 11-13 1 2 3 36 432
14 13 -15 5 4 3 3 5 1 21 294 4116
16 15-17 3 5 6 6 2 22 352 5632
18 17-19 2 4 6 108 1944
Total fj
6 9 8 9 13 7 n=52 790 12124
f j . yi
6 18 24 36 65 42 191
y
f y j j
191
3.67
n 52
b) Media y desviación estándar de las ventas.
x
fx i i
790
15.19 sY2
12124 52(15.19) 2
2.39 sY 1.55
n 52 51
c) Covarianza (X,Y)
1 k e 9051
s XY
n i1 j 1
fij xi yi x .y
52
( 3.67 )( 15.19 ) 118.26
Valores de Y 1 2 3 4 5 6 Totales
fY X [15 17 0 3 5 6 6 2 22
hY X [1517 0 0.14 0.23 0.27 0.27 0.09 1
87
3.
AUTOEVALUACIÓN DE UNIDAD 4
b) P (T ) 1 0.842 0.158
0.35 0.79
c) P( M / T ) 0.328
0.842
0.65 0.13
d) P( H / T ) 0.535
0.158
3. (Ver Unidad 4, Tema 10)
4.
2.05 67 0.42 230 9.9 7.2
a) IPL1986 100 123.8
1.7 67 0.32 230 8.2 7.2
88