Beruflich Dokumente
Kultur Dokumente
Ejercicios resueltos
2
P.VIDALES
3
1.3 ENTORNO DE EXCEL 2013, 2010 Y 2007. LIBROS Y HOJAS DE
CLCULO
1 3.1 Introduccin de datos y frmulas
1 3.2 Series de datos. Autocompletar
1.4 FRMULAS
1.4.1 Barra de frmulas
1.4.2 Rellenar una hoja mediante una frmula
1.5 OPERADORES
1 5.1 Orden de los operandos y preferencia de los operadores en las
frmulas
1 5.2 Tipos de operadores
1 5.3 Frmulas matriciales
1 5.4 Paleta de frmulas
1 5.5 Rangos con nombre
1.6 V NCULACIN DE L BROS
1 6.1 Crear una frmula para calcular datos en otra hoja o en otro libro
1 6.2 Vnculo a una hoja de clculo en otro libro
1.7 MOSTRAR FRMULAS Y VALORES EN UNA HOJA DE CLCULO
1.8 FUNCIONES DE HOJA DE CLCULO
1 8.1 Funciones anidadas dentro de funciones
1 8.2 Categoras de funciones en Excel 2010
1.9 COMPLEMENTOS EN EXCEL Y LA ESTADSTICA
5
2.4 FORMALIZAR LAS DISTR BUCIONES DE FRECUENCIAS
2.5 REPRESENTAR DISTRIBUCIONES DE FRECUENCIAS
2 5.1 Representaciones para variables cualitativas: diagramas de
rectngulos, diagramas de sectores y pictogramas
2 5.2 Representaciones para variables cuantitativas sin agrupar:
diagramas de barras, en escalera y polgonos de frecuencias
2 5.3 Representaciones para variables cuantitativas agrupadas:
histogramas y polgonos de frecuencias simples y acumulados
2.6 GRFICOS EN EXCEL
2.7 EXCEL Y LAS DISTR BUCIONES DE FRECUENCIAS
2.7.1 La funcin FRECUENCIA de Excel
2.7.2 Distribuciones de frecuencias e histogramas con herramientas de
anlisis de Excel
6
4.15 EXCEL Y LA CORRELACIN MLT PLE CON HERRAMIENTAS DE
ANLISIS
4.15.1 Correlacin y matriz de correlaciones
4.15.2 Covarianza y matriz de covarianzas
4.16 EXCEL Y LAS TABLAS DE CONTINGENCIA MEDIANTE TABLAS
D NMICAS
4.16.1 Excel y las tablas de contingencia para dos variables cualitativas
4.16.2 Excel y las tablas de contingencia para dos variables, una
cualitativa y otra cuantitativa
4.16.3 Excel y las tablas de contingencia para ms de dos variables
4.17 EXCEL Y LOS CONTRASTES DE ASOCIACIN E
INDEPENDENCIA
8
5.13 TASAS DE VARIACIN
5.14 MED DAS DE CONCENTRACIN
5.15 NDICE DE CONCENTRACIN DE G NI
5.16 CURVA DE CONCENTRACIN DE LORENTZ
9
1.1 INTRODUCCIN
La estadstica es una materia en alza, en una poca en la que los
datos son un activo muy importante y el anlisis cuantitativo tiene aplicaciones
muy relevantes en diferentes campos de la ciencia como la economa, las
finanzas, la ingeniera, la matemtica en general, la sociologa, la psicologa, la
biologa, la medicina, etc. Es clave para empezar a trabajar en estadstica, sea
cual sea el campo en que se aplique, la comprensin de los propios conceptos
estadsticos, para posteriormente realizar la operatoria matemtica necesaria
para desarrollarlos a travs del software, que facilita obtener los resultados de
los procedimientos estadsticos de forma rpida y con menos errores que cuando
las operaciones se realizaban manualmente.
11
Por otra parte, Excel tambin implementa determinados
complementos para ampliar el campo de trabajo en diferentes reas. Uno de
estos complementos lo constituyen las Herramientas para anlisis que se
insertan en el grupo Anlisis de la ficha Datos de la cinta de opciones de Excel.
Al final de este captulo se muestra la forma de utilizar estos complementos en
Excel.
15
1.3 ENTORNO DE EXCEL 2013, 2010 Y 2007. LIBROS Y
HOJAS DE CLCULO
Al iniciar Excel 2013, 2010 0 2007 se observa un entorno de
trabajo similar. La Figura 1-3 muestra el entorno de Excel 2010, pero las otras
versuiiones presentan un entorno idntico y las posibilidades de rabajo en
Estadstiva Descriptiva son similares. Destacan la Cinta de opciones con sus
fichas y sus grupos de opciones en cada ficha, la barra de herramientas de
acceso rpido y la barra de estado con los botones de visualizacin y el Zoom.
16
funciones, etc.
18
desplazamiento que se pueden utilizar para pasar de una hoja de clculo a la
siguiente o para hacer desplazamientos de un lugar a otro dentro de la hoja de
clculo activa.
19
Un valor numrico puede ser un entero (como 32), un nmero
decimal (como 499,95), una fraccin entera (como 10 3/4), o un nmero en
notacin cientfica (como 4,09 E+13). En los nmeros, se pueden utilizar
smbolos matemticos, como el smbolo de suma (+), el de resta (-), el de tanto
por ciento (%), fracciones (/) y exponenciales (E). Asimismo, es posible utilizar
el smbolo de dlar ($). Si se introduce un nmero demasiado grande como para
ser presentado en una celda, Excel mostrar el nmero en notacin cientfica o
mostrar ####### en la celda, para advertirle de que necesita incrementar el
ancho de la misma.
21
el nmero deseado. Esto no afectar a los datos que haya indicado en las celdas
antes de seleccionar la opcin Nmero fijo de decimales. Para anular
temporalmente la opcin Nmero fijo de decimales, especifique un separador de
decimales al escribir el nmero. Se pueden elegir los caracteres para separar
decimales y miles con las opciones Usar separadores del sistema, Separadores
de decimales y Separadores de miles de la Figura 1-8.
26
Figura 1-8
28
Tambin es posible especificar el tipo de serie de relleno
utilizando el botn secundario del ratn para arrastrar el controlador de relleno
sobre el rango y despus hacer clic en el comando adecuado del men contextual
de la Figura 1-16. Por ejemplo, si el valor inicial es la fecha ENE-2002, haga clic
en Rellenar meses para obtener la serie FEB-2002, MAR-2002, etc. Tambin
puede hacer clic en Rellenar aos para obtener la serie ENE-2003, ENE-2004,
etc.
32
41
49
% Porcentaje
^ Exponente
* y/ Multiplicacin y divisin
+ y- Suma y resta
& Conecta dos cadenas de texto (concatenacin)
= < > <= >= <> Comparacin
51
1.6 VINCULACIN DE LIBROS
Pueden compartirse los datos almacenados en hojas de clculo y
libros diferentes mediante la utilizacin de vnculos o de referencias externas. La
vinculacin resulta especialmente til cuando no conviene conservar grandes
modelos de hoja de clculo en el mismo libro.
61
el nombre de la otra hoja de clculo o del otro libro contiene caracteres no
alfabticos, se deber poner el nombre (o la ruta de acceso) entre comillas
sencillas.
65
funciones de texto (Figura 1-53) y las funciones lgicas (Figura 1-54).
77
79
1.9 COMPLEMENTOS EN EXCEL Y LA ESTADSTICA
Como ya habamos anticipado al principio del cap tulo, Excel 2010
dispone de complementos adicionales (Herramientas para anlisis, Solver, etc.)
que pueden cargarse despus de la instalacin del programa y que incorporan
funcionalidades adicionales para el trabajo en estadstica. Para cargar o
descargar un complemento de Excel, se tendrn en cuenta los pasos siguientes:
87
2.1 VARIABLES ESTADSTICAS
En el trabajo estadstico la informacin se recoge en variables.
Estas variables se organizan de forma ordenada y se almacenan en ficheros.
Posteriormente ser posible operar con estas variables y aplicar funciones a las
mismas para realizar las transformaciones y los anlisis estadsticos que se
desee. Las variables pueden contener datos numricos (variables cuantitativas)
y datos categricos no cuantificables numricamente (variables cualitativas). El
sexo, la profesin y el lugar de origen seran variables cualitativas. La estatura y la
edad seran ejemplos de variables cuantitativas.
92
satisfaccin en el trabajo pueden ordenarse en satisfacin baja (valores entre
0 y 10 segn una determinada escala de puntuacin que vara entre 0 y 30),
satisfacin media (valores entre 10 y 20) y satisfaccin alta (valores entre 30 y
40).
93
2.2 DISTRIBUCIONES DE FRECUENCIAS Y SU
FINALIDAD
Cuando se analiza una caracterstica medida por una variable
cualquiera resultado de un determinado proceso (de produccin, de medida,
econmico, financiero, sociolgico, mdico, biolgico, demogrfico, etc.), los
datos que obtenemos siempre estn dispersos y nunca tienen un nico valor
constante. Una vez que sabemos que los datos relativos a las distintas
caractersticas van a estar dispersos, nos surge el problema de detectar el
patrn en la variabilidad de los datos. Para ayudar a esta tarea existen
herramientas estadsticas bsicas como las distribuciones de frecuencias y los
histogramas, as como tcnicas sencillas de anlisis exploratorio de datos.
94
de los datos. Se construye la ltima clase finalizando con un lmite superior slo
un poco mayor que el valor ms grande de los datos. Para realizar el histograma
se marcan las clases sobre el eje de abscisas, y sobre cada clase se levanta un
rectngulo de altura proporcional al nmero de observaciones de la variable
(frecuencia absoluta) que caen en la clase.
95
variable estudiada.
96
2.3 INTERPRETAR LAS DISTRIBUCIONES DE
FRECUENCIAS
Las distribuciones de frecuencias facilitan que todo el mundo vea y
comprenda intuitivamente la forma de los valores de la variable que representa.
Sin embargo hay que prestar atencin a la interpretacin de las distribuciones.
Cuando se miran las distribuciones de frecuencias, se tiene que prestar atencin
a los puntos siguientes:
97
98
2.5 REPRESENTAR DISTRIBUCIONES DE
FRECUENCIAS
El objetivo esencial de las representaciones grficas de las
distribuciones de frecuencias es obtener una idea general sobre sus
propiedades en un simple vistazo. Observando un histograma de frecuencias
podemos deducir si la variable se aproxima a la normalidad o si es simtrica, as
como otras propiedades que posteriormente pueden ser analizadas de modo
formal utilizando contrastes u otras herramientas adecuadas.
102
frecuencias es el polgono de frecuencias acumuladas, que se utiliza cuando se
trabaja con frecuencias absolutas o relativas acumuladas y que se construye
levantando en el extremo superior de cada intervalo de clase una ordenada igual
a la frecuencia acumulada correspondiente y uniendo a continuacin dichas
ordenadas.
Los puntos que se unen sern (Li+1, Ni). La primera ordenada se une
al extremo inferior del primer intervalo prolongndose el polgono desde este
punto hacia la izquierda sobre el eje X, y prolongndose tambin el polgono a
partir de la ordenada del extremo superior del ltimo intervalo con una paralela
al eje de abscisas. De esta forma, la ordenada correspondiente a cada valor de
la variable X mide el nmero de observaciones para las cuales la variable toma
valores menores o iguales que la abscisa (concepto que aproxima la funcin de
distribucin de la variable X).
116
2.6 GRFICOS EN EXCEL
La forma ms habitual de crear un grfico en Excel consiste en
seleccionar los datos para la construccin del grfico en la hoja de clculo y
utilizar el tipo de grfico que se quiera crear del grupo Grficos de la ficha
Insertar (Figura 2-13) en la que hemos seleccionado el tipo Lnea (grficos de
lneas). Tambin se pueden utilizar los tipos Columna (Figura 2-14), Barra
(Figura 2-15), Circular (Figura 2-16), rea (Figura 2-17), Dispersin (Figura
2-18) y Otros grficos (Figura 2-19). Es posible ver todos los tipos de grfico
disponibles haciendo clic en la opcin Todos los tipos de grfico cualquier
Figura anterior. Se obtiene la Figura 2-20.
119
la Figura 2-21) que contiene las tres fichas Diseo, Presentacin y Formato que
permiten la edicin de un grfico ya existente. La ficha Diseo permite cambiar el
tipo de grfico, los datos del mismo, los diseos a utilizar, los estilos y la
ubicacin. La ficha Presentacin (Figura 2-22) permite trabajar con el rea del
grfico, etiquetas, t tulos, ejes, fondos, lneas de tendencia y todos los elementos
habituales que componen un grfico. La ficha Formato (Figura 2-23) permite
trabajar con estilos de forma, estilos de Word Art, as como con el tamao y la
organizacin del grfico.
128
2.7 EXCEL Y LAS DISTRIBUCIONES DE FRECUENCIAS
Excel permite trabajar con distribuciones de frecuencias por dos vas
distintas. Por un lado, aporta la funcin FRECUENCIA, disponible desde las
primeras versiones del programa. Por otro lado, el complemento de Anlisis de
datos incorpora la opcin Histograma, que permite hallar distribuciones de
frecuencias para variables aleatorias cuantitativas y representarlas mediante los
correspondientes histogramas de frecuencias.
131
2.7.1 La funcin FRECUENCIA de Excel
La funcin FRECUENCIA de Excel calcula las frecuencias
absolutas de los valores de una variable en un rango de intervalos o grupos
cuyos extremos se conocen. Debe introducirse como una frmula de matrices,
debido a que FRECUENCIA devuelve una matriz. Su sintaxis es la siguiente:
FRECUENCIA(datos;grupos)
132
Haga clic en la opcin En una hoja nueva para insertar una hoja
nueva en el libro actual y pegar los resultados comenzando por la celda A1 de la
nueva hoja de clculo. Para asignar un nombre a la nueva hoja de clculo,
escrbalo en el cuadro.
142
Dado que estamos ante una variable cuantitativa con datos sin agrupar
podemos representarla mediante el diagrama de barras o mediante el polgono
de frecuencias (Figura 2-47) obtenidos mediante los mismos pasos del ejercicio
anterior.
161
detectar qu patrn sigue dicha variabilidad para determinar mejor la estructura
de los datos. En primer lugar ser conveniente realizar una ordenacin de los
datos segn su magnitud, es decir, una tabla de frecuencias, que aportar algo
de luz sobre la distribucin de frecuencias subyacente.
170
Figura 2-64
185
Figura 2-65
187
3.1 EXPRESIN CUANTITATIVA DE LAS
DISTRIBUCIONES
En el captulo anterior se han definido los conceptos bsicos en el
estudio de una distribucin de frecuencias de una variable. En el presente
cap tulo estudiaremos las distintas formas de resumir dichas distribuciones
mediante medidas de posicin (o de centralizacin), teniendo presente el error
cometido en el resumen mediante las correspondientes medidas de dispersin. A
su vez, analizaremos la forma de la distribucin mediante las medidas de forma.
El histograma de frecuencias ya nos daba una representacin visual de las tres
propiedades ms importantes de los datos muestrales relativos a variables: la
forma de su distribucin, su tendencia central y su dispersin. Ahora se trata de
cuantificar estos conceptos.
Por otra parte, tambin en este cap tulo se tratan las tcnicas de anlisis
exploratorio de datos, que amplan la informacin ofrecida por las medidas de
concentracin, dispersin y forma de una distribucin. Mediante las tcnicas de
anlisis exploratorio se estudian exhaustivamente las distribuciones de
frecuencias y se detectan las posibles anomalas que presentan las
observaciones.
189
3.2 MEDIDAS DE POSICIN: MEDIA, MEDIANA,
MODA, CUANTILES, PERCENTILES Y
MOMENTOS
La finalidad de las medidas de posicin es encontrar unos valores
que sinteticen las distribuciones de frecuencias. En vez de manejar todos los
datos sobre las caractersticas o variables, tarea que puede ser pesada,
podemos caracterizar su distribucin de frecuencias mediante algunos valores
numricos, eligiendo como resumen de los datos un valor central alrededor del
cual se encuentran distribuidos los valores de la variable. El valor de la variable
elegido para representar a una distribucin se llama promedio o medida de
posicin, y es un valor representativo de todos los valores que toma la variable.
Debe hallarse entre el mayor y el menor valor de la variable.
190
3.3 MEDIDAS DE DISPERSIN
Las medidas de dispersin permiten calcular la representatividad de una
medida de posicin, para lo cual ser preciso cuantificar la distancia de los dife-
rentes valores de la distribucin respecto a dicha medida. A tal distancia es a lo
que, en trminos estadsticos, denominaremos variabilidad o dispersin de la
distribucin. Las medidas de dispersin tienen como finalidad estudiar hasta qu
punto, para una determinada distribucin de frecuencias, las medidas de
tendencia central o de posicin son representativas como sntesis de toda la
informacin de la distribucin. Medir la representatividad de una medida de
posicin equivale a cuantificar la separacin de los valores de la distribucin
respecto a dicha medida. Por ejemplo, si queremos estudiar en qu grado una
media aritmtica nos marca una tendencia central generalizable del
comportamiento de todos los elementos del conjunto estudiado, tendremos que
fijarnos en la separacin o desviacin de cada valor respecto a la media. Si
todos los valores estn cercanos al valor medio, ste ser representativo de
ellos.
199
ndice de dispersin respecto a la mediana: Se usa para resolver el problema de
comparacin de medianas de varias distribuciones, que pueden venir, en general,
en unidades diferentes. Se define como la relacin por cociente entre la
desviacin media respecto de la mediana y la mediana aritmtica VMe = DMe /
M e. Evidentemente, a menor ndice de dispersin mejor es la mediana.
204
3.5 ANLISIS EXPLORATORIO DE DATOS
Los estadsticos descriptivos ms habitualmente utilizados han
sido la media y la desviacin tpica. Sin embargo, el uso automtico de estos
ndices no es muy aconsejable. La media y la desviacin tpica son ndices
convenientes slo cuando la distribucin de datos es aproximadamente normal o,
al menos simtrica y unimodal. Pero las variables objeto de estudio no siempre
cumplen estos requisitos. Por lo tanto es necesario un examen a fondo de la
estructura de los datos.
211
3.6 GRFICO DE SIMETRA
El grfico de simetra (Figura 3-1) es una herramienta que
permite analizar visualmente el grado de simetra de una variable. En el eje de
abscisas se representan las distancias de los valores de la variable a la mediana
que quedan por debajo de ella, y en el eje de ordenadas se representan las
distancias de los valores de la variable a la mediana que quedan por encima de
ella. Si la simetra fuese perfecta, el conjunto de puntos resultante sera la
diagonal principal. Mientras ms se aproxime la grfica a la diagonal ms
simetra existir en la distribucin de la variable.
212
la mediana.
214
del rango de entrada estn organizados en filas o en columnas.
Nivel de confianza para la media: active esta casilla si desea incluir una fila
correspondiente al nivel de confianza de la media en la tabla de resultados. En el
cuadro, escriba el nivel de confianza que desee utilizar. Por ejemplo, un valor de
95% calcular el nivel de confianza de la media con un nivel de importancia del
5%.
Ksimo mayor: active esta casilla si desea incluir una fila correspondiente al
valor k-simo mayor de cada rango de datos en la tabla de resultados. En el
cuadro, escriba el nmero que va a utilizarse para k. Si escribe 1, esta fila
contendr el mximo del conjunto de datos.
Ksimo menor: active esta casilla si desea incluir una fila correspondiente al
valor k-simo menor de cada rango de datos en la tabla de resultados. En el
cuadro, escriba el nmero que va a utilizarse para k. Si escribe 1, esta fila
contendr el mnimo del conjunto de datos.
En una hoja nueva: haga clic en esta opcin para insertar una hoja nueva en el
libro actual y pegar los resultados comenzando por la celda A1 de la nueva hoja
236
de clculo. Para darle un nombre a la nueva hoja de clculo, escr balo en el
cuadro.
En un libro nuevo: haga clic en esta opcin para crear un nuevo libro y pegar los
resultados en una hoja nueva del libro creado.
237
Figura 3-25
251
Dado el valor positivo del coeficiente de asimetra de Pearson, se
concluye que la distribucin es simtrica positiva.
286
Captulo 4
287
4.1 DISTRIBUCIONES BIDIMENSIONALES DE
FRECUENCIAS
Si X e Y son dos variables observadas, la distribucin bidimen-
sional (X,Y) ser (xi,yi,nij). Cada frecuencia corresponde ahora a un par de
valores (variables cuantitativas) o modalidades (variables cualitativas): el primer
elemento del par corresponde al valor de la primera caracterstica observada, el
segundo hace referencia a la segunda de tales caractersticas, y el tercero a la
frecuencia conjunta. Evidentemente, sera posible realizar un estudio por
separado de la distribucin de X e Y, y resumir estos caracteres por medio de
sus medidas de posicin y dispersin descritas en el cap tulo anterior; tales
distribuciones recibirn el nombre de distribuciones marginales. Sin embargo,
nuestro inters en este punto se centra en el anlisis simultneo de ambas
caractersticas; es decir, en la distribucin conjunta de las mismas, con el fin de
establecer si existe relacin entre ellas y en qu grado. Los pares que contienen
los valores de las variables o atributos junto con sus correspondientes
frecuencias, suelen disponerse en una tabla de doble entrada, que recibe el
nombre de tabla de correlacin en el caso de que ambos caracteres sean
cuantitativos, y tabla de contingencia cuando son cualitativos. Estos dos tipos de
tablas sern objeto de nuestra atencin en los apartados siguientes.
288
4.2 TABLA DE CORRELACIN: DISTRIBUCIONES
MARGINALES Y DISTRIBUCIONES
CONDICIONADAS
Queremos estudiar conjuntamente dos caracteres cuantitativos, X e Y,
sobre una poblacin, apareciendo X con h niveles e Y con k. Para ello,
seleccionamos una muestra de tamao N y la sometemos a observacin,
disponiendo los resultados en una tabla de doble entrada, donde x1, ..., xh e y1,
..., yk representan los valores observados para cada variable, y nij la frecuencia
absoluta conjunta, es decir, las veces que aparecen simultneamente el valor i-
simo de X y j-simo de Y.
289
nij = frecuencia absoluta del valor (Xi,Yj) de la distribucin conjunta (X,Y).
290
= frecuencia absoluta del valor Yj de la variable
marginal Y.
Se cumple que:
291
En esta tabla, ni. y n.j nos proporcionan las frecuencias marginales. Es
decir, el nmero de veces que aparece el valor i-simo de X, con independencia
de cul sea el valor de Y, es ni., y el nmero de veces que aparece el valor j-
simo de Y, independientemente de cul sea el valor de X con el que se da
conjuntamente Y, es n.j. De esta forma tenemos que las distribuciones
marginales de X e Y vienen dadas por (xi; ni.) y (yj; n.j ). Estas distribuciones
marginales pueden expresarse como sigue:
292
A partir de la tabla de correlacin es posible formar un nuevo tipo de
distribuciones, que denominaremos distribuciones condicionadas debido a que
para su obtencin es preciso definir previamente una condicin. Esta condicin
har referencia a la fijacin a priori de un valor (o valores) de una de las
variables, para posteriormente calcular la distribucin de la otra variable sujeta a
esa condicin. Si fijamos la variable Y en el valor y2 (podramos fijar ms de un
nico valor), la distribucin de la variable X condicionada a que Y tome el valor
y2 vendr dada por:
Donde X/Y=y2 nos dar los valores que puede tomar la variable X cuando
Y toma el valor y2, y ni/j=2 nos da las frecuencias con que se presenta cada uno
de los valores.
293
Dado que estas distribuciones condicionadas son variables
unidimensionales, es posible calcular todo tipo de medidas de centralizacin,
dispersin y forma, mediante los procedimientos ya vistos en el captulo anterior.
294
Otra relacin importante entre distribuciones condicionadas, marginales y
conjunta es la siguiente:
295
4.3 COVARIANZA
Pero, puesto que no interesan nicamente las distribuciones
marginales, sino tambin la conjunta, es preciso introducir medidas que hagan
referencia a esta ltima distribucin.
296
La covarianza es una medida de gran importancia por su signo, ms que
por el valor que pueda alcanzar; el signo indica el sentido de la variacin
conjunta de las variables que estamos considerando. De esta forma, si la
covarianza es positiva, quiere decir que ambas variables varan en el mismo
sentido alrededor de sus medias, mientras que si la variacin de las mismas
tiene lugar en sentido contrario, la covarianza tomar valores negativos.
297
4.4 VARIABLES INDEPENDIENTES
Cmo podemos detectar la existencia de independencia entre dos
variables? qu instrumentos estadsticos son los que nos permiten sealar la
ausencia de tal relacin? Para detectar la no presencia de asociacin entre dos
caracteres analizados sobre la misma poblacin, se procede a elaborar la tabla
de correlacin (para variables cuantitativas) o de contingencia (para variables
cualitativas), y se calculan las respectivas distribuciones conjuntas, marginales y
condicionadas. Las variables son independientes si se cumple cualquiera de las
dos siguientes condiciones equivalentes:
Las frecuencias relativas condicionadas coinciden con sus respectivas
frecuencias relativas marginales, lo que nos indica que el
condicionamiento, en cuanto tal, no existe. Ha de cumplirse que fi/j = fi.= ni.
/N y fj/i =f.j= n.j /N para todo i,j.
298
4.5 COEFICIENTE DE CORRELACIN LINEAL ENTRE
DOS VARIABLES. REGRESIN SIMPLE
MNIMO CUADRTICA
Se llama correlacin al grado de dependencia mutua entre dos
variables. El coeficiente de correlacin intenta medir la intensidad con que dos
variables estn relacionadas. Este concepto est directamente relacionado con el
concepto de curva de regresin. Mediante la regresin simple mnimo
cuadrtica, se expresa la estructura funcional de la relacin existente entre dos
variables, ajustando la nube de puntos dada por los pares de valores de las dos
variables a una curva de la forma mejor posible (minimizando la varianza del
error). El ajuste ser de la forma Y=f(x)+e o X=f(Y)+e, donde e denota el error
cometido cuya varianza debe ser mnima. El coeficiente de correlacin mide la
calidad de ese ajuste.
, c= yd = .
299
.
300
Y= a+ bX = + x
301
menor a medida que r se acerca ms a cero. Si - 1 < r < 0 la correlacin es
negativa, pero el grado de asociacin entre las dos variables ser mayor a
medida que r se acerca ms a -1, y ser menor a medida que r se acerca ms a
cero.
302
de asociacin (parablica, exponencial, etc.)
303
4.6 REGRESIN PARABLICA
304
de mnimos cuadrados.
305
4.7 REGRESIN POLINMICA
306
normales proporcionan la ecuacin polinmica que mejor ajusta los datos en el
sentido de mnimos cuadrados.
307
4.8 REGRESIN HIPERBLICA, POTENCIAL Y
EXPONENCIAL
Si suponemos el ajuste de la forma Y = a + b / X + e (curva de regresin
hiperblica de Y sobre X), podemos realizar la transformacin Z=1/X, con lo que
la ecuacin a ajustar resulta ser Y = a + b Z + e (curva de regresin lineal de Y
sobre X), regresin que ya sabemos resolver. Una vez realizado el ajuste se
deshace el cambio en la ecuacin resultante.
308
4.9 COEFICIENTE DE CORRELACIN POR RANGOS
Es muy tpico considerar, sobre todo en variables cualitativas, el
coeficiente de correlacin entre los rangos de los valores de las variables. Se
entiende por rango de un valor de una variable el lugar que ocupa dicho valor en
el conjunto total de valores de la variable, suponiendo una ordenacin de menor a
mayor. Sean Ai y Bi las diferentes modalidades de dos variables cualitativas X e
Y. Sean xi e yi los rangos o nmeros de orden que le corresponden a Ai y Bi,
supuestas ordenadas estas modalidades, con la escala que se determine, y de
menor a mayor. Se define el coeficiente de correlacin por rangos de Spearman
para las variables cualitativas X e Y como el coeficiente de correlacin lineal de
las variables cuyos valores son xi e yi.
309
4.10 DISTRIBUCIONES DE MS DE DOS
DIMENSIONES: MATRIZ DE COVARIANZAS Y
MATRIZ DE CORRELACIONES
Cuando se tiene una variable tridimensional (X,Y,Z) o enedimensional
en general, tambin se puede realizar la descripcin y anlisis de las
distribuciones de frecuencias subyacentes. La complejidad crece cuando el
nmero de variables o factores que se analizan simultneamente aumenta, pero
conocido el procedimiento para el caso tridimensional, su gener alizacin al n-
dimensional es inmediata. El anlisis es igualmente vlido cuando los caracteres
analizados son de naturaleza cuantitativa o cualitativa.
310
donde cada sij representa la covarianza entre Xi y Xj para todo i,j.
311
donde cada rij es el coeficiente de correlacin entre Xi y Xj para todo i,j.
Si dada una serie de variables X1, X2, ..., Xn, se trata de estudiar el grado
de dependencia simultnea entre todas ellas (o bien entre grupos de ellas),
puede utilizarse la matriz de correlaciones. Si en base a la intensidad con que
dependen se puede establecer una funcin que explique una variable mediante
todas las dems, que se supone son sus causas influyentes, estamos ante un
problema de regresin mltiple, que ser estudiado en cap tulos posteriores.
312
4.11 VARIABLES CUALITATIVAS: TABLAS DE
CONTINGENCIA Y DISTRIBUCIONES
MARGINALES Y CONDICIONADAS
En los apartados anteriores hemos trabajado con variables cuyos
valores son cuantificables numricamente, es decir, hemos estudiado la
denominada estadstica de variables, que incluye las diferentes tcnicas para
analizar la informacin disponible acerca de un determinado fenmeno colectivo
cuyos sucesos vienen expresados en trminos cuantitativos o numricos (renta,
salarios, precios, etc.). Sin embargo, cuando esos sucesos vienen referidos a
cualidades o caractersticas no medibles del fenmeno estudiado (color,
nacionalidad, enfermedades, etc.), estaremos hablando de lo que definimos como
estadstica de atributos, que se ocupa de las variables cualitativas.
313
individuos que presentan a la vez las modalidades A y Bj. La tabla estadstica
que describe estos N individuos, denominada tabla de contingencia, ser una
tabla de doble entrada como la siguiente:
Al igual que en el caso de las variables cuantitativas, en esta tabla ni. y n.j
nos proporcionan las frecuencias marginales; es decir, el nmero de veces que
aparece la modalidad i-sima de A, con independencia de cul sea la modalidad
de B, es ni., y el nmero de veces que aparece la modalidad j-sima de B,
independientemente de cul sea la modalidad de A con el que se da
314
conjuntamente B, es n.j. De esta forma tenemos que las distribuciones
marginales de A y B vienen dadas por (Ai; ni.) y (Bj; n.j).
Donde A/B2 nos dar los valores que puede tomar la variable A cuando la
B toma el valor B2, y ni/2 nos da las frecuencias con que se presenta cada uno de
los valores (modalidades).
315
Para todas las distribuciones ser posible trabajar con frecuencias
relativas en vez de con frecuencias absolutas.
316
4.12 INDEPENDENCIA Y ASOCIACIN DE VARIABLES
CUALITATIVAS: COEFICIENTES
En cuanto a la independencia de variables cualitativas, ya fue tratada al
hablar de la independencia de variables cuantitativas, aunque este concepto toma
aqu especial relevancia, pues en el caso de variables cualitativas la falta de
independencia suele denominarse asociacin, y el anlisis del grado de
asociacin entre variables cualitativas tiene fuerte incidencia en la estadstica de
atributos. Ya hemos visto que de forma anloga a lo que ocurre en el caso de dos
variables cuantitativas, la observacin simultnea de dos atributos da lugar a una
tabla de doble entrada, en donde nij indica el nmero de objetos o individuos que
poseen conjuntamente las modalidades indicadas en la fila i-sima y en la
columna j-sima de la tabla de contingencia. Tambin hemos visto que las
distribuciones que se refieren a uno solo de los dos atributos o variables
cualitativas se denominan igualmente distribuciones marginales.
317
c2=
c2=
318
c2=
F2 = c 2/N =
319
Coeficiente de contingencia C de K. Pearson: Se trata de un coeficiente
definido como C = (c 2/(N+c 2)) 1/2. El coeficiente C tiene un campo de
variacin entre 0 y 1, de manera que su valor es cero cuando existe una
carencia absoluta de asociacin entre los atributos, o sea, cuando los
atributos son independientes. Cuando los atributos muestran una total
asociacin entre s, el coeficiente se aproxima a uno, pero slo se
alcanzara el valor uno en el caso ideal de infinitas modalidades. Se puede
demostrar que en el caso de una tabla de contingencia cuadrada (h=k), el
lmite superior de C es S=((h-1)/h) 1/2, lo que permitira calcular un nuevo
valor para esta medida, llamado coeficiente ajustado, que vendra dado por
CA=C/S. Este coeficiente ajustado podra resultar de inters, puesto que
proporciona una idea del verdadero grado de asociacin, al evaluar la
discrepancia entre el valor obtenido y el mximo que podra alcanzar para
la tabla dada. La expresin del coeficiente de contingencia C de K. Pearson
ser:
320
Tambin se cumple que:
donde m = min(h-1,k-1)
321
De la misma forma, suponiendo que se ha elegido X como factor
explicado e Y como explicativo, se evala la capacidad de Y para predecir X
mediante el coeficiente lx, cuya expresin es:
322
El valor de l est comprendido entre lx y ly, y presenta como
inconveniente su gran sensibilidad a la presencia de totales marginales
desequilibrados. Si l se aproxima a uno existe asociacin entre X e Y, y si se
aproxima a cero existir independencia.
323
4.13 FUNCIONES DE EXCEL PARA CORRELACIN Y
REGRESIN SIMPLE
Excel dispone de varias funciones que permiten trabajar con
coeficientes de correlacin, regresin y otros conceptos sobre variables
multidimensionales. Ya sabemos que para ver las funciones de la categora
324
325
Figura 4-1 Figura 4-2
326
327
Figura 4-3 Figura 4-4
A continuacin, se presenta una relacin de funciones de Excel
para correlacin, regresin y variables multidimensionales, acompaada de un
ejemplo referido a las variables X e Y de la hoja de clculo de la Figura 4-4
cuyos valores ocupan los rangos A2 A11 y B2:B11.
Devuelve
COVAR(x;y)
COVAR(A2:A11;B2:B11)
Devuelve
328
COEF.DE.CORREL(x;y)
COEF.DE.CORREL(A2:A11;B2:B11)
Da el coe
COEFICIENTE.R2(y;x)
COEFICIENTE.R2(B2:B11;A2:A11)
Da la pen
PENDIENTE(y;x)
PENDIENTE(B2:B11;A2:A11)
INTERSECCION.EJE(y;x) Da la orde
INTERSECCION.EJE(B2:B11;A2:A11)
PRONOSTICO(z;y;x) Halla la p
PRONOSTICO(2;B2:B11;A2:A11) variable in
TENDENCIA(y;x;z;constante) Halla las
TENDENCIA(A2:A8;B2:B8;B9:B11) para los v
Constante
especifica
CRECIMIENTO(y;x;z;constante) Halla las
CRECIMIENTO(A2:A8;B2:B8;B9: B11;0) para los v
Constante
especifica
Devuelve
329
ERROR.TIPICO.XY(y;x) error tpic
ERROR.TIPICO(B2:B11;A2:A11) para un va
Figura 4-5
330
Figura 4-6
331
Figura 4-7
332
Figura 4-8
333
Figura 4-9
334
Figura 4-10
335
a) Justificar si puede aceptarse una dependencia estadstica lineal entre R y H.
b) En caso positivo, hallar la recta de ajuste y representar la nube de puntos
ajustada.
336
Figura 4-11
Figura 4-12
337
Con vistas a realizar un ajuste entre ambas variables, lo lgico es
que el nmero de personas que se van de vacaciones al extranjero dependa de
la renta personal, con lo que hemos de hallar la funcin lineal f tal que H=f(R),
es decir, tenemos que hallar la recta de regresin de H sobre R, cuya pendiente
ha resultado ser b=0,057 y cuya ordenada en el origen ha resultado ser
a=-17,34. Por lo tanto, la recta de regresin de H sobre R es H=-17,34+0,057R,
que nos define la relacin lineal entre el nmero de personas que se van de
vacaciones al extranjero y su renta personal.
338
Figura 4-13
339
Figura 4-14
340
Figura 4-15
341
342
Figura 4-16 Figura 4-17
343
Figura 4-18
Como ejemplo adicional consideramos las variables Q
(produccin en millones de unidades monetarias) y E (exportaciones en
milllones de unidades monetarias), cuyos valores durante cuatro aos para un
determinado sector econmico son los siguientes:
344
a) Si se estima que las producciones en los ejercicios 1988, 1999 y 2000 van a
ser de 640, 690 y 720 millones, respectivamente, y que las condiciones del
mercado internacional no van a variar, cul ser el volumen de exportaciones
previsible para esos aos?
345
Figura 4-19. Los resultados se presentan en la Figura 4-20, e indican que el
ajuste por regresin ha sido bueno, al ser el coeficiente de correlacin muy
prximo a la unidad (0,9493) y el coeficiente de determinacin superior al 90%.
346
predicciones segn la lnea de ajuste exponencial Q = bEx se han calculado
mediante la funcin matricial CREC M ENTO (Figura 4-22), y se han obtenido
previsiones de exportaciones de 576,5, 947,3 y 1 276,1 millones para los aos
1998, 1999 y 2000, respectivamente (lgicamente mayores que para el caso de
la prediccin lineal). Los valores aceptables de los coeficientes de correlacin y
regresin y el valor bajo del error tpico indican que las predicciones realizadas
pueden ser bastante fiables.
347
Figura 4-21 Figura 4-22
348
4.14 EXCEL Y LOS AJUSTES POR REGRESIN
POLINMICA, LOGARTMICA,
EXPONENCIAL Y POTENCIAL
Consideramos la serie de inversiones realizadas por una empresa
en 10 perodos consecutivos que se presenta en la Figura 4-23. Con la finalidad
de predecir correctamente la inversin empresaril futura, se trata de ajustar la
serie a una lnea de tendencia cbica, exponencial, potencial, logartmica y de
media mvil de orden 2 para decidir finalmente cul de los modelos ofrece
mejores prediciones.
349
Figura 4-23
350
Figura 4-24
351
352
Figura 4-25 Figura 4-26
353
354
Figura 4-27 Figura 4-28
355
356
Figura 4-29 Figura 4-30
357
358
Figura 4-31 Figura 4-32
359
360
Figura 4-33 Figura 4-34
361
4.15 EXCEL Y LA CORRELACIN MLTIPLE CON
HERRAMIENTAS DE ANLISIS
Excel proporciona herramientas de anlisis para medir la relacin
entre dos conjuntos de datos. El clculo de la correlacin devuelve la covarianza
de dos conjuntos de datos dividida por el producto de sus desviaciones estndar.
362
4.15.1 Correlacin y m atriz de correlaciones
La opcin Anlisis de datos del grupo Anlisis de la ficha Datos
(Figura 4-35) nos lleva al cuadro de dilogo Anlisis de datos de la Figura 4-36.
Si en la lista Funciones para anlisis elegimos Coeficiente de correlacin, se
obtendr el cuadro de dilogo de la Figura 4-37, que permite calcular la matriz
de correlaciones de las variables especificadas en el campo Rango de entrada.
363
Figura 4-35 Figura 4-36
364
Figura 4-37
365
correspondientes para la tabla de resultados.
Figura 4-38
366
4.15.2 Covarianza y m atriz de covarianzas
La opcin Anlisis de datos del grupo Anlisis de la ficha Datos
(Figura 4-35) nos lleva al cuadro de dilogo Anlisis de datos de la Figura 4-39.
Si en la lista Funciones para anlisis elegimos Covarianza, se obtendr el
cuadro de dilogo de la Figura 4-40, que permite calcular la matriz de
correlaciones de las variables del campo Rango de entrada.
Figura
4-39
367
Figura 4-40 Figura 4-41
368
por haga clic en el botn Filas o Columnas para indicar si los datos del rango de
entrada estn organizados en filas o en columnas.
Si la primera fila del rango de entrada contiene rtulos, active la
casilla de verificacin Rtulos en la primera fila. Si los rtulos estn en la
primera columna del rango de entrada, active la casilla de verificacin Rtulos
en la primera columna. Esta casilla de verificacin estar desactivada si el rango
de entrada carece de rtulos. Excel generar los rtulos de datos
correspondientes para la tabla de resultados.
369
4.16 EXCEL Y LAS TABLAS DE CONTINGENCIA
MEDIANTE TABLAS DINMICAS
En Excel es posible construir tablas de contingencia a travs de
las tablas dinmicas. Una tabla dinmica o informe de tabla dinmica es una
tabla interactiva que se puede utilizar para presentar tablas cruzadas y
distribuciones de frecuencias que resumen rpidamente grandes volmenes de
datos. Podrn elegirse las variables de sus filas y columnas a medida para ver
diferentes resmenes de los datos de origen. Las variables a tabular sern
dinmicas, es decir, a partir de un conjunto extenso de informacin previamente
almacenada de forma bruta en mltiples variables, se cruzarn entre s las
variables que se desee, filtrando los datos y mostrando los detalles de las reas
que consideremos de inters.
370
4.16.1 Excel y las tablas de contingencia para dos
variables cualitativas
La tabla siguiente muestra los datos relativos a los resultados de
una encuesta de opinin (favorable o desfavorable) sobre un determinado
acontecimiento, realizada a un conjunto de hombres y mujeres pertenecientes a
una determinada clase social y con una edad conocida.
371
372
Se trata de crear una tabla de contingencia que cruce las
variables cualitativas sexo y opinin. Posteriormente, se especificar la tabla de
contingencia anterior segn los valores de la variable clase.
373
Figura 4-42 Figura
4-43
374
Figura 4-44
375
valor aqu (o a la zona Valores), se obtiene la tabla dinmica.
376
377
Figura 4-45
378
Figura 4-46
379
4.16.2 Excel y las tablas de contingencia para dos
variables, una cualitativa y otra
cuantitativa
Con los datos del ejemplo anterior, se trata ahora de obtener la
tabla de contingencia que cruza la variable cualitativa OPINION con la variable
cuantitativa EDAD. Ahora se trata de cruzar la OPINION con la EDAD para
tabular el nmero de personas que con las distintas edades tienen las diferentes
opiniones.
380
381
Figura 4-47
382
383
Figura 4-48 Figura 4-49
384
Figura 4-50
385
4.16.3 Excel y las tablas de contingencia para m s
de dos variables
Con los datos del ejemplo anterior realizaremos una tabla de
contingencia tridimensional que cruce la variable EDAD (filas) con las variables
OPININ y SEXO (columnas). Posteriormente, realizar una tabla de
contingencia que cruce la EDAD con OPINION y SEXO para la clase media.
386
Figura 4-51
387
pueden obtenerse tablas que crucen EDAD con OP NION y SEXO para cada
valor de CLASE haciendo clic en el tringulo situado en la parte inferior del
campo Todas (Figura 4-53). Por ejemplo, en la Figura 4-54 se cruza EDAD con
OPINION y SEXO para la clase media.
Figura 4-52
388
Figura 4-53
389
Figura 4-54
390
4.17 EXCEL Y LOS CONTRASTES DE ASOCIACIN E
INDEPENDENCIA
En Excel es muy sencillo calcular el cuadrado de la contingencia
c2 a partir de las frecuencias absolutas Oj de las propias celdas de la tabla de
contingencia y de las frecuencias esperadas Ej = (Total Columna)(Total
Fila)/(Total General). La expresin del estadstico c2 para contrastar la
independencia es:
391
estudiadas en este cap tulo.
392
Figura 4-55
393
Figura 4-56
Figura 4-57
394
A partir de los valores de la tabla de contingencia y de los valores
de la tabla de frecuencias esperadas, podemos calcular el valor del cuadrado de
395
Figura 4-58 Figura 4-59
396
397
Figura 4-60 Figura 4-61
Figura 4-62
398
Figura 4-63
399
Figura 4-64
400
Figura 4-65
401
F2 = c 2/N = =0,030789
=0,172827
=0,175468
402
= 0,175468 donde m = min(h-1,k-1)=1
=-0,44444
EJERCICIOS RESUELTOS
Ejercicio 1. Se han estudiado los pesos en kg y las tallas en cm de 70 individuos
obtenindose los datos de la tabla siguiente:
403
1. Hallar el peso medio y la talla media as como el error cometido al
resumir pesos y tallas por sus valores medios Qu media es mejor?
2. Hallar la distribucin segn las tallas de los individuos que pesan 54 kilos
y la distribucin segn los pesos de los individuos que miden entre 161
cm y 167 cm. Hallar media y varianza de las dos distribuciones
condicionadas.
48 3 2 2 1
51 2 3 4 2
54 1 3 6 8
57 0 0 1 2
404
60 0 0 0 2
n.j 6 8 13 15
n.jyj 960 1296 2132 2490
Figura 4-66
X ni. Y
405
48 8 160
51 14 162
54 24 164
57 14 166
60 10 168
170
Tenemos lo siguiente:
406
Se observa que el menor coeficiente de variacin es el relativo a la talla
media, que resulta ser as un promedio ms adecuado.
48 5 160
51 9 162
54 17 164
57 3 166
60 2 168
170
407
Figura 4-67
408
Ejercicio 2. Se considera la variable bidimensional (X,Y) cuya distribucin de
frecuencias se presenta en la tabla siguiente:
409
Para estudiar la independencia de las dos variables utilizando la
distribucin conjunta y las marginales tenemos que comprobar que fij = fi.f.j "i,j.
La primera tarea ser construir una tabla con la distribucin conjunta (fij
= nij/N) y con las marginales (fi.= ni./N y f.j = n.j/N) como se indica en la
Figura 4-68.
X/Y 15 24
12 3 4
15 6 8
19 9 12
n.j 18 24
fij
0,03571429 0,04761905
0,07142857 0,0952381
0,10714286 0,14285714
f.j 0,21428571 0,28571429
Figura 4-68
0,21428*0,16666 0,28571*0,16666
0,21428*0,33333 0,28571*0,33333
0,21428*0,5 0,28571*0,5
410
Observamos que, una vez realizados estos clculos, se obtiene la
tabla de la distribucin conjunta fij.
0,071428571 0,0952381
0,107142857 0,14285714
0,214285714 0,28571429
411
412
Figura 4-69
Figura 4-70
413
fj/i=3 9/42 12/42 6/42
f.j 18/84 24/84 12/84
Figura 4-71
414
6/18 8/24 4/12
Figura 4-72
Observamos que se cumple fi/j = fi. "i,j ya que:
415
marginales X e Y, que se calcularn con los datos de la tabla de la Figura 4-73
X/Y 15 24
12 3 4
15 6 8
19 9 12
n.j 18 24
Figura 4-73
Figura 4-74
416
La covarianza, que ser cero debido a la independencia, puede calcularse
como sigue:
417
12 3 4 2 5 14 540 1
15 6 8 4 10 28 1350 28
19 9 12 6 15 42 2565 54
n.j 18 24 12 30 84 4455 95
Figura 4-75
418
1. Es simtrica la distribucin del nmero de das de baja de los
trabadores?
2. Cul es la edad ms frecuente de los trabajadores que piden la baja?
3. Ajustar mediante un modelo exponencial los das de baja en funcin de la
edad.
4. Realizar el mismo ajuste considerando un modelo lineal.
5. Cul de los ajustes es el mejor?
X/Y 10 30 50 ni.
24 28 2 0
35 26 15 4
45 6 14 5
n.j 60 31 9
yjn.j 600 930 450
419
yj3n.j 60000 837000 1125000
N.j 60 91 100
Figura 4-76
420
Para estudiar la asimetra del nmero de das de baja de los trabajadores
calculamos el coeficiente de asimetra de Fisher de la variable marginal Y como
sigue:
421
Se observa que hay una ligera asimetra hacia la derecha, pero
muy pequea. Los das de baja se distribuyen casi simtricamente a lo largo del
ao.
aos
422
24 28 2 0 30
35 26 15 4 45
45 6 14 5 25
n.j 60 31 9 100
z jn. j 60 45,790 15,291 121,0811
Figura 4-77
423
El parmetro Log(a) se estima por mnimos cuadrados mediante:
424
El ajuste no es de calidad porque R2 est ms cerca de cero que
de la unidad.
425
Para realizar el clculo de
se utiliza la tabla siguiente:
24 28 2 0 30 6720
35 26 15 4 45 9100
45 6 14 5 25 2700
n.j 60 31 9 100 18520
426
Figura 4-78
427
Para realizar los clculos necesarios elaboramos la tabla
siguiente:
X/Y 2 5 9 10
3 0 2 1 2
4 2 1 0 3
6 3 0 4 2
n.j 5 3 5 7
yjn.j 10 15 45 70
428
Figura 4-79
429
Las distribuciones condicionadas de Y a todos los valores de X, as como
los clculos requeridos se presentan a continuacin:
2 0 0 2 2 4 2 3
5 2 10 5 1 5 5 0
9 1 9 9 0 0 9 4
10 2 20 10 3 30 10 2
5 39 6 39 9
430
Se observa que se cumple:
3 3 9 27
4 1 4 16
6 4 24 144
8 37 187
431
La recta de regresin de X sobre Y tiene como ecuacin
3 0 2 1 2 5 0
4 2 1 0 3 6 16
6 3 0 4 2 9 36
n.j 5 3 5 7 20 52
Figura 4-80
432
La recta de regresin de X sobre Y tiene como ecuacin
C 15 25 35 45
RM
30 10 15
40 5 20 25
50 15 5 5
433
a) Ajustar los datos a una relacin lineal adecuada entre el consumo y la renta.
b) Medir el grado de representatividad de la relacin lineal anterior.
c) Calcular el consumo esperado para una renta de 60*104 unidades monetarias.
d) Obtener las distribuciones marginales de las variables C y RM y sus medias,
varianzas, desviaciones tpicas y coeficientes de asimetra y curtosis.
Una vez introducidos los datos de las variables, utilizamos las funciones
de Excel que permiten calcular el coeficiente de correlacin y la pendiente y
ordenada en el origen de la recta de regresin de C sobre RM (Figura 4-81). La
Figura 4-82 presenta los resultados.
434
Figura 4-81
Figura 4-82
435
No obstante, correlacin dbil no implica independencia, por lo
que puede hallarse la recta de regresin de C sobre RM, pero con la precaucin
de que dicha relacin lineal entre ambas variables puede no ser buena, y sobre
todo pueden no ser fiables las predicciones basadas en dicha relacin de
linealidad. Una vez calculadas la pendiente y la ordenada en el origen de la recta
de regresin, tenemos la relacin C=7,5+0,5RM.
Figura 4-83
436
Para hallar las medias, varianzas, desviaciones tpicas y coeficientes de
variacin, asimetra y curtosis de las distribuciones marginales de C y RM,
seleccionamos la opcin Anlisis de datos del men Herramientas, y elegimos
Estadstica descriptiva en Funciones para anlisis (Figura 4-84). Rellenamos la
pantalla Estadstica descriptiva como se indica en la Figura 4-85. Al pulsar
Aceptar, se obtienen los resultados de la Figura 4-86.
437
Figura 4-84 Figura 4-85
438
Figura 4-86
Para hallar las propias distribuciones marginales de C y RM,
seleccionamos la opcin Anlisis de datos en el grupo Anlisis de la ficha Datos,
y elegimos Histograma en Funciones para anlisis (Figura 4-87). Rellenamos la
pantalla Histograma como se indica en la Figura 4-88. Al pulsar Aceptar, se
obtiene la distribucin e histograma de RM. Repitiendo el proceso para C
(Figura 4-89), se obtiene la marginal de C. Los resultados se observan en la
Figura 4-90.
439
Figura 4-87
440
441
Figura 4-88 Figura 4-89
442
Figura 4-90
Ejercicio 6. Consideramos la distribucin bidimensional de las variables presin
(P) y tiempo de aplicacin de dicha presin (T) sobre determinadas piezas para
el control de su calidad de fabricacin.
T 0 5 10 15 20
443
P
66 1 1 0 1 2
68 3 2 1 0 1
70 0 1 9 1 2
72 1 2 1 2 1
74 3 1 2 1 2
444
Figura 4-91
tal y como se indica en la Figura 4-92 (basta hacer clic en y hacer doble
clic en la funcin).
445
Figura 4-92
446
Figura 4-93
447
Figura 4-94 Figura 4-95
448
449
Figura 4-96
450
Insertar. La pantalla de diseo se rellena llevando la variable P a F LA, y la
variable T a COLUMNA y a VALORES, y utilizando la funcin CUENTA como
funcin de resumen. Al pulsar Aceptar, se obtiene la Figura 4-99, cuyas
columnas son distribuciones de P condicionadas al valor de T que encabeza la
columna (la tercera columna presenta la condicionada de P a T=10).
451
Para hallar la distribuciones condicionadas de T a todos los
valores de P, utilizamos la opcin Informes de tabla y grfico dinmico del men
Datos, rellenando la pantalla de diseo llevando la variable T a FILA y la variable
P a COLUMNA y a VALORES, y utilizando la funcin CUENTA como funcin de
resumen. Al pulsar Aceptar, se obtiene la Figura 4-100, cuyas columnas son
distribuciones de T condicionadas al valor de P que encabeza la columna (la
cuarta columna presenta la condicionada de T a P=72).
Figura 4-101
452
Figura 4-102
453
Figura 4-103
454
Figura 4-104
1. Ajustar los datos anteriores a un modelo lineal que explique los ahorros
familiares en funcin de los ingresos para la regin dada.
455
2. Ajustar los datos anteriores a un modelo lineal parablico que explique
los ahorros familiares en funcin de los ingresos para la regin dada.
3. Qu ajuste es mejor?
4. Qu ahorro se puede prever para una familia de la regin que ingrese
2500 euros mensuales?
Si yi Siyi yi 2 Si
456
Figura 4-105
457
Luego el modelo lineal ajustado ser:
458
La solucin de este sistema ofrece los parmetros del modelo parablico
(b0=85,713, b1= -7,962 y b2 = 0,189). Luego el modelo ajustado ser:
459
La tabla siguiente ordena los clculos para hallar
Si yi (Si-(85,713-7,962yi+0,189
1,9 20,5
1,8 20,8
2 21,2
2,1 21,7
1,9 22,1
2 22,3
2,2 22,2
2,3 22,6
2,7 23,1
3 23,5
460
Figura 4-106
461
donde y es el porcentaje de personas con una renta igual o inferior a x siendo x0
la renta mnima y b un parmetro estructural. Se pide ajustar una ley de Pareto a
los datos siguientes:
462
Luego el modelo lineal ajustado ser:
4 1
463
Para medir la calidad del ajuste lineal utilizamos el coeficiente de
correlacin, o su cuadrado, el coeficiente de determinacin, que se calcula como
sigue:
Figura 4-107
464
de determinacin es alto (el coeficiente de correlacin vale
465
Se trata de un ajuste de tipo potencial. Todo este tipo de ajustes se
resuelve aplicando logaritmos para linealizar de la siguiente forma:
Ki yi Zi = log(yi) xi
466
0,8 3,4 0,53147892
1 4,1 0,61278386
1,4 6 0,77815125
SUMAS 11,213708
467
Figura 4-108
Para medir la calidad del ajuste potencial medimos la del ajuste
lineal al que es equivalente utilizando el coeficiente de correlacin, o su
cuadrado, el coeficiente de determinacin, que se calcula como sigue:
468
, que es un valor muy prximo a 1 indicativo del
alto grado de relacin entre Zi y xi, y por tanto entre xi e yi).
469
Figura 4-109
470
Figura 4-110
471
Figura 4-111
472
Figura 4-112 Figura 4-113
473
Figura 4-114
474
Figura 4-115 Figura 4-116
475
Figura 4-117
476
pronstico y presentar la tabla de contingencia correspondiente.
b) Hallar las distribuciones marginales del atributo profesin y del atributo
pronstico y realizar un diagrama de barras para el atributo F.
c) Hallar la distribucin de la profesin condicionada al valor igual del atributo
pronstico.
d) Existe relacin entre los pronsticos sobre la evolucin del mercado burstil
y la profesin del encuestado?
Figura 4-118
La siguiente tarea ser introducir los datos de los dos atributos como
dos variables en la hoja de clculo. Denominamos P a la variable pronstico, y F
a la variable profesin. P puede tomar los valores B (baja), I (igual) y S (sube). F
puede tomar los valores E (economista), I (Ingeniero) y A (abogado). El valor EB
de la variable bidimensional lo introducimos 20 veces (la E en la columna de la
varible F y la B en la columna de la variable P), el valor EI 20 veces, el valor ES
10 veces, el valor IB 10 veces, el valor II 20 veces, el valor IS 18 veces, el valor
AB 5 veces, y el valor AS 5 veces.
477
contingencia de la Figura 4-119.
Figura 4-119
478
Figura 4-120 Figura 4-121
479
Figura 4-122
480
La distribucin de la Profesin condicionada al valor Igual del atributo
Pronstico, est formada por la zona en negrita de la figura 5-123. Para ver si
existe relacin entre los atributos Pronstico y Profesin, calculamos medidas
de asociacin y realizamos el contraste de independencia de la chi-cuadrado
segn las frmulas de la Figura 4-124. Se obtienen los resultados de la Figura
4-125.
Figura 4-123
481
Figura 4-124
482
Figura 4-125
Se observa que el p-valor del contraste de la chi-cuadrado es menor que
0,05, lo que indica que las variables no son independientes. Adems, el valor del
estadstico de la chi-cuadrado es superior al valor crtico al 95%, lo que
corrobora la dependencia de las variables.
483
asociacin entre las variables.
484
Captulo 5
485
5.1 NMEROS NDICES SIMPLES
En los captulos anteriores se han caracterizado las distribuciones
de una y varias variables por una serie de medidas que intentaban sintetizar el
conjunto de toda la informacin disponible (medidas de posicin), pasando
despus al estudio de la variabilidad (medidas de dispersin) y de las medidas de
forma (asimetra y curtosis). El problema que ahora se nos presenta es la
comparacin de magnitudes simples o complejas referidas a una situacin
inicial, que se fijar previamente de la forma ms adecuada posible a los
objetivos que se persigan y que condiciona la comparacin. En cuanto a las
magnitudes complejas, habr que tener en cuenta la homogeneidad de las
unidades y el problema de la agregacin. Tambin se estudiar en este captulo
la deflactacin de series estadsticas y los ndices o medidas de concentracin.
Sea Xi una magnitud simple y sean xi0 y xit los valores de dicha magnitud
en los perodos base y actual respectivamente. El nmero ndice simple Ii para la
magnitud citada se define como:
que mide la variacin en tanto por uno que ha sufrido la magnitud Xi entre los
dos perodos considerados. Generalmente, estos ndices se suelen expresar en
porcentajes, multiplicndolos por cien.
486
Entre los nmeros ndices simples ms usuales tenemos los ndices de
precios, los ndices de cantidades, de produccin o cunticos, y los ndices de
valor. Un ndice simple de precios, o precio relativo, es la razn entre el precio de
un bien en el perodo actual pit y el precio del mismo en el perodo base pio. Se
puede escribir:
487
5.2 NMEROS NDICES COMPLEJOS NO
PONDERADOS
En la prctica, los nmeros ndices simples no suelen utilizarse
aisladamente. Por lo general, no estamos interesados en comparar precios,
cantidades o valores de bienes individuales, sino en comparar dichas magnitudes
para grandes grupos de bienes. Como consecuencia de ello, la informacin
suministrada por los ndices simples de cada uno de los diferentes bienes debe
ser resumida en un nico ndice al que vamos a denominar complejo.
Un ndice complejo ha de ser sencillo, pero a la vez ha de reunir la
mayor cantidad posible de informacin. As, podemos considerar dos tipos de
ndices complejos, en los que va a primar, en mayor o menor medida, cada una de
las caractersticas anteriores. Si se prefiere sencillez, tendremos los ndices
complejos no ponderados, y si, por el contrario, lo que se desea es que
contengan la mayor cantidad de informacin posible, se utilizarn los ndices
complejos ponderados.
Sea la magnitud compleja X formada por las magnitudes simples X1, X2,
..., Xi, ..., XN que toman los siguientes valores:
488
xi0 xit Ii = xit / xi0
. . .
. . .
xN0 xNt IN = xNt / xN0
489
ndice media agregativa
Este tipo de ndice considera, en vez de las medias entre los diferentes
ndices simples, la relacin por cociente entre las sumas de los diferentes
valores de la magnitud en los dos perodos. Su expresin es:
490
5.3 NMEROS NDICES COMPLEJOS DE PRECIOS NO
PONDERADOS
En los epgrafes siguientes se tratan los ndices complejos de
precios no ponderados ms habituales. Estos indices van a tener la ventaja de su
sencillez de clculo, pero tienen la desventaja de no tener en cuenta la
importancia relativa de cada uno de los diferentes bienes en el conjunto total, ya
que no son ponderados. Tambin es una desventaja el hecho de que las unidades
utilizadas para medir los precios de cada bien afectan al valor de los ndices, con
lo que estos no resultan homogneos.
ndice de Sauerbeck
ndice de Bradstreet-Dtot
491
492
5.4 NMEROS NDICES COMPLEJOS PONDERADOS
Los nmeros ndices complejos ponderados tienen en cuenta la
diferente importancia relativa de cada una de las magnitudes simples dentro del
conjunto de todas ellas. Para ello, es necesario afectar a cada magnitud simple, y
por tanto a sus ndices, de unas ponderaciones que midan su peso relativo dentro
del conjunto en que se consideren.
493
El ndice complejo ponderado media armnica resume los diferentes
ndices simples Ii considerando su media armnica ponderada, con lo que su
expresin ser:
Este tipo de ndice considera, en vez de las medias ponderadas entre los
diferentes ndices simples, la relacin por cociente entre las sumas de los
diferentes valores ponderados de la magnitud en los dos perodos. Su expresin
es:
494
495
5.5 NMEROS NDICES COMPLEJOS DE PRECIOS
PONDERADOS
En el trabajo con los ndices complejos de precios ponderados es
fundamental el tipo de ponderaciones utilizado. Entre los sistemas de
ponderaciones propuestos tradicionalmente, tenemos:
ndice de Laspeyres
496
ndice de Paasche
ndice de Edgeworth
497
Es una media agregativa ponderada de precios cuyo coeficiente de
ponderacin es wi=qi0+qit. Su expresin ser:
498
5.6 NMEROS NDICES COMPLEJOS PONDERADOS
CUNTICOS O DE PRODUCCIN
La evolucin de las magnitudes tambin puede estudiarse a travs
de sus cantidades fsicas. Los nmeros ndices cunticos o de produccin tienen
como objetivo estudiar las variaciones habidas en la produccin fsica de un
conjunto de bienes y servicios, para medir su evolucin en el tiempo. Los ms
importantes se ven en los epgrafes siguientes.
499
ndice ideal de Fisher
500
5.7 PROPIEDADES DE LOS NMEROS NDICES
Existen determinadas propiedades que seran deseables para todo
nmero ndice. Las ms importantes son las siguientes:
501
las unidades de medida.
502
5.8 NDICES EN CADENA
Los ndices en cadena son une serie de ndices en los que la base es
siempre el perodo precedente, con lo que cada uno de ellos ofrece una
comparacin porcentual respecto al perodo anterior. A travs de este
procedimiento, y partiendo de una serie de enlaces relativos, podemos conseguir
una serie de ndices referidos a una base comn aplicando la propiedad circular.
La nueva serie obtenida nos permitir efectuar comparaciones a medio y largo
plazo.
I0,1*I1,2*It-1,t = I0,t
503
5.9 CAMBIO DE BASE Y ENLACES DE NMEROS
NDICES
A medida que pasa el tiempo, mantener el perodo base de un
ndice puede resultar inadecuado. Existe prdida de representatividad de los
ndices al irnos alejando del perodo base, sobre todo cuando para ponderar
magnitudes actuales se utilizan pesos relativos referidos al perodo base. Este
problema se resuelve haciendo un cambio de base a un perodo ms cercano al
actual. Para poder relacionar series de ndices referidos a distintos perodos
base, se utilizan los enlaces tcnicos entre ambas series. Para efectuar el
cambio de base nos basaremos en la propiedad de inversin de los nmeros
ndices.
0 I00 I0h
1 I10 I1h
. . .
. . .
i Ii0 Iih
. . .
. . .
h Ih0 Ihh
. . .
. . .
t It0 Ith
504
Iih = Ii0/Ih0 * Ihh = Ii0 / Ih0
donde Ih0 es el ndice que hace de enlace tcnico entre las dos series.
505
5.10 DEFLACTACIN DE SERIES ESTADSTICAS
506
5.11 PARTICIPACIN Y REPERCUSIN
Supongamos que todas las magnitudes simples que componen un
ndice complejo sufren una variacin que podemos expresar por Dp1t, Dp2t,..,
DpNt. El ndice presentar una variacin total debida a todas estas variaciones, y
cada una de sus componentes contribuir con una variacin particular,
denominada repercusin, a la variacin del ndice general. La suma de todas las
repercusiones individuales de cada componente es igual a la variacin total del
ndice general.
donde
507
La variacin en porcentaje del ndice general se expresa como:
508
La participacin en porcentaje de la componente i en la variacin del
ndice general ser la relacin por cociente entre la repercusin en porcentaje y
la suma de repercusiones en porcentaje de todas las componentes, expresada en
tanto por ciento. Su expresin ser:
509
5.12 NDICES OFICIALES
ndice de precios al consumo
510
para cantidades.
El ndice de precios industriales ( PRI) es un indicador que mide la
evolucin de los precios en el primer paso de comercializacin de los productos,
es decir, en la fase de venta de stos a los precios de produccin, esto es, sin
incluir los impuestos indirectos que los gravan. Se refiere nicamente a
productos industriales de produccin nacional, con exclusin de los servicios,
tales como instalaciones, transportes, comercializacin, reparaciones, etc.
ndices de salarios
Reflejan las variaciones del salario total de los trabajadores por unidad de
tiempo. Suelen ser del tipo media aritmtica ponderada, recogiendo la variacin
de la relacin por cociente entre las remuneraciones en el perodo base y el
actual.
511
del saldo comercial de cada sector. Si llamamos Xi y M i a las exportaciones
e importaciones del sector i, sus expresiones son:
512
ndice de comercio intraindustrial: Se utiliza cuando en los diferentes
sectores se produce simultneamente la exportacin e importacin de un
mismo tipo de productos. Su expresin es:
513
ndices de competitividad: Se utilizan para medir la competitividad de las
economas, y se basan en la evolucin de los precios y los tipos de cambio.
Los ms importantes son el tipo de cambio efectivo nominal (TCEN), que
se utiliza para medir la evolucin de una moneda en un perodo determinado
(marcado por el ao 0 que es el base y el ao t que es en el que se realiza
el clculo) frente a un conjunto de monedas correspondientes a una
agrupacin de pases con los que mantiene intercambios, y el tipo de
cambio efectivo real (TCER), que es un ajuste del anterior introduciendo
un factor que refleja las variaciones de precios relativos entre el pas que
elabora el ndice y los dems a lo largo de un perodo determinado. Sus
expresiones son las siguientes:
514
el total de exportaciones espaolas destinadas al conjunto de pases en
cuestin, y M el total de importaciones espaolas procedentes del conjunto
de pases. Ci0 y Cit representan las cotizaciones oficiales de la peseta
frente a la moneda del pas i en el ao base y en el ao t respectivamente. Pt
y P0 son los ndices de precios de Espaa en los instantes base, y t, y Pi0 y
Pit son los ndices de precios del pas i en el ao base y en el ao t.
Indicadores de la coyuntura
515
5.13 TASAS DE VARIACIN
Expresan el porcentaje que representa la variacin absoluta de
una magnitud, en un intervalo temporal determinado, sobre el valor inicial de
dicha magnitud, que normalmente se corresponde con el del ao anterior. Esto
es:
516
517
5.14 MEDIDAS DE CONCENTRACIN
Las medidas de concentracin tratan de poner de relieve el mayor o menor
grado de igualdad en el reparto del total de los valores de una variable. Son, por
tanto, indicadores del grado de equidistribucin de la variable. Estos indicadores
no deben confundirse con las medidas de dispersin, ya que desde el punto de
vista estadstico la dispersin hace referencia a la variabilidad de los datos, a las
diferencias que entre ellos existen y, por tanto, a la mayor o menor
representatividad de los promedios.
518
5.15 NDICE DE CONCENTRACIN DE GINI
Los productos xi*ni, que nos indicarn la renta total percibida por los ni
rentistas de renta individual xi.
Una medida que expresa cada ui en tantos por ciento de un. A este
porcentaje le llamamos qi. Tendremos que qi = (ui/un) *100.
519
Sabemos que si la concentracin es mnima, es decir, si la renta est
repartida por igual, pi = qi, con lo que IG =0. En el caso de concentracin
mxima, solamente el ltimo trabajador percibe renta, por lo que, q1 = q2 = ... =
qn-1 = 0, con lo que IG =1. El campo de variacin de IG va, pues, de cero a uno, y
su valor responder a una distribucin tanto ms justa de la renta o del salario
cuanto ms prximo est a cero.
520
5.16 CURVA DE CONCENTRACIN DE LORENTZ
La distribucin de salarios, o de rentas, se puede materializar
grficamente, obtenindose la llamada curva de concentracin o curva de
Lorentz. Para construirla, dibujamos un cuadrado cuyos lados estn divididos en
una escala de 1 a 100. En el vrtice inferior izquierdo est el origen de
coordenadas, en el eje de abscisas representamos los valores pi, y en el de
ordenadas los valores qi. A continuacin, representamos los puntos (pi,qi), que,
al unirlos entre s, nos determinan una poligonal llamada curva de Lorentz.
PROBLEMAS RESUELTOS
Ejercicio 1. La evolucin de las ganancias de una empresa del ramo del
automvil desde el ao 1950 hasta 1960 se presenta en la tabla siguiente:
521
Ao Ganancias ndices simples
1950 g0 100
1951 g1 (g1/g0)*100
1952 g2 (g2/g0)*100
1953 g3 (g3/g0)*100
1954 g4 (g4/g0)*100
1955 g5 (g5/g0)*100
1956 g6 (g6/g0)*100
1957 g7 (g7/g0)*100
1958 g8 (g8/g0)*100
1959 g9 (g9/g0)*100
1950 12 100
1951 14 116,6666667
1952 18 150
1953 18 150
1954 19 158,3333333
1955 15 125
522
1956 12 100
1957 16 133,3333333
1958 20 166,6666667
1959 24 200
1960 35 291,6666667
0 0 ( 0/Ii)*
1 I1 (I1/Ii)*
2 I2 (I2/Ii)*
3 I3 (I3/Ii)*
4 I4 (I4/Ii)*
5 I5 (I5/Ii)*
6 6 ( 6/Ii)*
7 I7 (I7/Ii)*
8 I8 (I8/Ii)*
9 I9 (I9/Ii)*
10 I10 (I10/Ii)*
523
Una vez realizados los clculos de la tabla anterior tenemos los
siguientes resultados para los ndices simples en base 1960:
ndices simples
Ao Ganancias
en base 1950
1950 12 100
1951 14 116,6666667
1952 18 150
1953 18 150
1954 19 158,3333333
1955 15 125
1956 12 100
1957 16 133,3333333
1958 20 166,6666667
1959 24 200
1960 35 291,6666667
524
Por las propiedades de los ndices podemos hacer lo siguiente:
Como la base en 1953 es 100 y el ndice de valor en 1960 es 96, dicho ndice de
valor ha disminuido en un 4%.
525
Artculo A Artculo B Artculo C
Aos
Precio Cantidad Precio Cantidad Precio
Cantidad
1980 2 10 5 12
10 3
1981 2 12 6 10
11 2
1982 3 15 6 5
12 3
1983 4 20 7 6
12 1
1984 4 18 8 5
13 2
526
Para hallar el ndice de precios de Laspeyres en el ao 1981 con
base en 1980 (Lp81,80) es necesario hallar (P81*Q80)/ (P80*Q80)*100. De la
misma forma se calculan los ndices de precios de Laspeyres en los aos 1982,
1983 y 1984 con base en 1980 (Lp82,80; Lp83,80 y Lp84,80) usando las
expresiones: (P82*Q80)/(P80*Q80)*100, (P83*Q80)/(P80*Q80)*100 y
(P84*Q80)/(P80*Q80)*100.
527
Figura 5-1
Figura 5-2
528
Figura 5-3
Figura 5-4
529
La Figura 5-5 muestra las frmulas, y la Figura 5-6, los
resultados.
Figura 5-5
Figura 5-6
530
Ejercicio 5. Con los datos del producto interior bruto a precios de mercado
(P Bpm) y del deflactor implcito del P Bpm (D Ppm) de la economa espaola
recogidos en el cuadro presentado a continuacin:
PIBpm D Ppm
P Bpm DIPpm
Aos corriente Base 1980 Aos corriente
Base 1980
531
3. Hallar ndices con base 1974 de la serie P Bpm en pesetas constantes del
ao 1980.
4. Hallar P B a precios del mercado en pesetas constantes del ao 1986
para 1970-1992.
532
533
Figura 5-7 Figura 5-8
534
de modo generalizado, excepto en el ao 1981.
535
Figura 5-9 Figura 5-10
536
Para calcular los nmeros ndices con base en el ao 1974 de la
serie TVPIBpmK80 creamos la columna Ind74 mediante la expresin
(P BpmK80/13715,1)*100, donde 13715,1 es el valor del PIBpm de 1974 en
pesetas constantes de 1980 (Figura 5-11). Se obtiene la nueva serie Ind74, que
contempla la serie de nmeros ndices pedidos (Figura 5-12).
Figura 5-11
537
Figura 5-12
Para hallar la serie del PIBpm a precios constantes del ao 1986,
necesitamos los datos del deflactor del P B en base 1986. Como el enunciado
538
nos proporciona la serie del deflactor en base 1980, ser necesario realizar el
cambio de base. Para ello, creamos la columna llamada D Ppm86 con la
expresin (DIPpm80/192,2)*100 (Figura 5-13), donde192,2 es el deflactor
implcito del PIBpm de 1986 en base 1980. Se obtiene la nueva serie DIPpm86
con los datos del deflactor del PIBpm en base 1986 (Figura 5-14).
539
Figura 5-13
540
Figura 5-14
541
Ahora ya podemos hallar la serie del P Bpm a precios constantes
de 1986. Para ello creamos la columna de nombre P BpmK86 con la expresin
(P BpmC/DIPpm86)*100 (Figura 5-15) para obtener los datos de la Figura 5-16.
542
543
Figura 5-15
544
545
Figura 5-16
Ejercicio 6. Una fbrica de automviles produce cuatro modelos, cuyos precios
de venta, costes de materiales empleados y nmeros de unidades producidas en
los ltimos tres aos fueron los siguientes:
_________1985_______ _________1986________
_________1987________
Modelos Precio N de Precio N de Precio
N de
venta Coste unidades venta Coste unidades venta
Coste unidades
546
Para calcularlo construiremos una tabla con variables (columnas)
que reflejan los precios de venta, costes y cantidades para los cuatro modelos de
automviles. Para calcular el ndice de produccin de Laspeyres en el ao 1986
con base en 1985 usamos la expresin definida como Lq86,85 = (Q86*(P85 -
C85)) /SUM(Q85*(P85 - C85))*100. Se obtiene el valor 93,3. De la misma forma
se calcula el ndice de produccin de Laspeyres en el ao 1987 con base en
1985, utilizando la expresin Lq87,85 = (Q87*(P85 - C85))/SUM(Q85*(P85 -
C85))*100, para obtener el valor 102,1. La Figura 5-17 muestra las frmulas y la
Figura 5-18 los resultados.
Figura 5-17
547
Figura 5-18
548
Figura 5-19
Figura 5-20
549
El ndice de precios de Laspeyres se calcula mediante la siguiente
expresin:
550
Figura 5-21 Figura 5-22
1979 1988
Productos
Precio Cantidad Precio
Cantidad
En este problema suponemos que los precios que nos dan representan
tambin el valor aadido de cada producto, que es tanto como decir que el coste
de las materias primas empleadas es cero. Pueden asimilarse a este caso, en
551
parte, las industrias integrales y las industrias de la primera fase del proceso
productivo.
Figura 5-23
552
Figura 5-24
553
287,477,0 114,6
Portugal 98,96 71,93 410,428,3
263,276,2 190,6
Dinamarca 16,10 16,24 54,288,1
75,441,8 124,1
Irlanda 180,53 167,31 21,658,3
74,245,1 121,4
Grecia 123,43 5 7,09 47,621,1
24,182,1 265,9
554
Para hallar el TCEN basta con hacer el producto de los elementos
de la columna TCENt y multiplicar por 100; es decir, elevaremos a la potencia 10
la media geomtrica de la variable TCENt y multiplicaremos por 100. La Figura
5-25 muestra las frmulas, y la Figura 5-26, los resultados.
Figura 5-25
555
Figura 5-26
Espaa 1989
UE 1989
Sector
X M X M
556
16380 11633
3. Materias primas 1634 4824
31401 65480
4. Productos energticos 1906 7148
34794 86508
5. Aceites y grasas 383 217
4002 4266
6. Productos qumicos 3902 6307
124782 108157
7. Productos manufacturados 9001 8178
197244 194880
8. Maquinaria y material de transporte 15230 24.112
393977 348614
9. Artculos diversos 4514 5996
127949 130465
Total 42680 62941
1018349 1047228
557
Para resolver este problema comenzamos construyendo una tabla
con los datos en las columnas XE (exportaciones espaolas), ME (importaciones
espaolas), XUE (exportaciones de la Unin Europea), y MUE (importaciones de
la Unin Europea). Para hallar el saldo comercial relativo, creamos la columna
llamada SCR con la expresin (XE-ME)/(XE+ME)*100. Sectores con SCR
positivo indican que el pas presenta ventaja comparativa para el sector en
cuestin.
558
El ndice de comercio intraindustrial se utiliza cuando en los
diferentes sectores se produce simultneamente la exportacin e importacin de
un mismo tipo de productos. Su expresin es:
559
Para hallar el ndice de especializacin, que ya es un indicador de
comparacin de la estructura comercial espaola con la de la Unin Europea,
creamos la columna llamada E mediante la frmula ((XE/(XE))/(XUE/
(XUE)))*100. Para sectores con IE superior a 100, sus exportaciones tienen
una representacin mayor en Espaa que en el conjunto de la Unin Europea.
La Figura 7-27 muestra todas las frmulas para la generacin de todas las
series utilizas durante el problema, y la Figura 7-28 presenta los resultados, en
los que pueden analizarse los comentarios realizados a lo largo del problema.
560
Figura 7-27
561
Figura 7-28
562
4. Menaje 100 74,1
131,5
5. Servicios mdicos y sanitarios 100
23,9 123,8
6. Transportes y comunicaciones 100 143,8
121,3
7. Esparcimiento, enseanza y cultura 100 69,6
129,6
8. Otros bienes y servicios 100
85,2 137,9
563
presenta las frmulas, y la Figura 7-30 presenta los resultados.
Figura 7-29
Figura 7-30
Ejercicio 11. Hallar el ndice burstil para 1986, con base 1980=100, de la
564
siguiente cartera de valores (volumen de negocio en 109 pesetas):
1980 1986
565
Figura 7-31 Figura 7-32
El resultado nos indica que desde el ao 1980 al ao 1986, el valor de la
cartera de valores aument en un 238,175 por ciento.
Fbrica A Fbrica B
566
Salario N de trabajadores Salario N de
trabajadores
800 20 800 10
1 000 10 1 000 30
1 200 10 1 200 30
1 500 10 1 500 20
7 500 50 7 500 10
Comenzamos creando una tabla con los datos de las dos distribuciones
de salarios en sus columnas. Para calcular los ndices de Gini relativos a ambas
distribuciones, creamos las columnas de nombres pA, pB, pTnA y pTnB (sumas
acumuladas de nA, nB, T*nA y T*nB respectivamente).
La Figura 7-33 presenta las frmulas para el clculo de los ndices de Gini
de las empresas A y B, y la Figura 7-34 presenta los resultados.
567
Figura 7-33
Figura 7-34
568
opcin Dispersin con lneas suavizadas del grupo Grficos de la ficha Insertar
y obtenemos la curva de Lorenz de la empresa A (Figura 7-36). Realizando
pasos similares para la empresa B, se obtiene su curva de Lorenz (Figura 7-37).
Figura 7-35
569
Figura 7-36 Figura 7-37
La curva de Lorentz de la empresa A est ms alejada de la diagonal que la
de la empresa B, luego la distribucin de la renta es mejor en la empresa B,
siendo la concentracin menor en dicha empresa. No olvidemos que la curva de
Lorentz es ms curvada (se aleja ms de la diagonal) cuanto ms desigual sea
la distribucin y ms fuerte la concentracin.
570
571