Estadisticas Angel Estadistica Angel Borgna Fernandez

Estadstica
Carpeta de trabajo
Estadstica
Mara Eugenia ngel
Mario Enrique Borgna
Graciela Fernandez
Diseo original de maqueta: Hernn Morfese
Procesamiento didctico: Marina Gergich / Bruno De Angelis
Primera edicin: Septiembre de 2009
ISBN: 978-987-1782-08-6
Universidad Virtual de Quilmes, 2009
Roque Senz Pea 352, (B1876BXD) Bernal, Buenos Aires
Telfono: (5411) 4365 7100 | http://www.virtual.unq.edu.ar
La Universidad Virtual de Quilmes de la Universidad Nacional de
Quilmes se reserva la facultad de dis- poner de esta obra, publicarla,
traducirla, adaptarla o autorizar su traduccin y reproduccin en
cualquier forma, total o parcialmente, por medios electrnicos o
mecnicos, incluyendo fotocopias, grabacin magnetofnica y
cualquier sistema de almacenamiento de informacin. Por consi-
guiente, nadie tiene facultad de ejercitar los derechos precitados sin
permiso escrito del editor.
Queda hecho el depsito que establece la ley 11.723
Impreso en Argentina
Lectura obligatoria
Es la bibliografa imprescindible que acompaa el desarrollo de los conteni-
dos. Se trata tanto de textos completos como de captulos de libros, artcu-
los y "papers" que los estudiantes deben leer, en lo posible, en el momento
en que se indica en la Carpeta.
Actividades
Se trata de una amplia gama de propuestas de produccin de diferentes ti-
pos. Incluye ejercicios, estudios de caso, investigaciones, encuestas, elabo-
racin de cuadros, grficos, resolucin de guas de estudio, etctera.
Leer con atencin
Son afirmaciones, conceptos o definiciones destacadas y sustanciales que
aportan claves para la comprensin del tema que se desarrolla.
Para reflexionar
Es una herramienta que propone al estudiante un dilogo con el material, a tra-
vs de preguntas, planteamiento de problemas, confrontaciones del tema con la
realidad, ejemplos o cuestionamientos que alienten la autorreflexin, etctera.
Lectura recomendada
Es la bibliografa que no se considera obligatoria, pero a la cual el estudian-
te puede recurrir para ampliar o profundizar algn tema o contenido.
Pastilla
Se utiliza como reemplazo de la nota al pie, para incorporar informaciones
breves, complementarias o aclaratorias de algn trmino o frase del texto
principal. El subrayado indica los trminos a propsito de los cuales se inclu-
ye esa informacin asociada en el margen.
conos
nd
Introduccin...........................................................................................9
Mapa conceptual ..................................................................................10
Problemtica del campo ........................................................................10
Objetivos del curso ...............................................................................11
1. Estadstica descriptiva.....................................................................13
1.1. Los datos y su organizacin ...........................................................13
1.1.1. Variables estadsticas y su clasificacin................................13
1.1.2. Ordenamiento y tabulacin de los datos................................15
1.1.3. Representaciones grficas ...................................................23
1.2. Medidas estadsticas.....................................................................28
1.2.1. Medidas de posicin............................................................28
1.2.2. Medidas de dispersin.........................................................39
1.2.3. Medidas de intensidad.........................................................43
1.3. Matrices ejemplos .........................................................................51
2. Probabilidad.....................................................................................55
2.1. Elementos de la teora de probabilidad ...........................................55
2.1.1. Experimento aleatorio .................................................................55
2.1.2. Definiciones de probabilidad........................................................62
2.1.3. Axiomatizacin de la probabilidad ................................................63
2.1.4. Tipos de probabilidad..................................................................64
2.2. Variable aleatoria...........................................................................69
2.2.1. Variable aleatoria discreta...........................................................69
2.2.2. Modelos especiales de variables aleatorias discretas ...................71
2.2.3. Variable aleatoria continua ..........................................................76
2.2.4. Modelos especiales de variables aleatorias continuas ..................77
3. Inferencia estadstica.......................................................................87
3.1. Distribucin de estadsticos muestrales..........................................87
3.1.1. Distribucin del estadstico media muestral .................................88
3.1.2. Distribucin del estadstico proporcin muestral ...........................90
3.1.3. Teorema central del lmite ...........................................................91
3.2. Problemas fundamentales de la inferencia estadstica .....................94
3.2.1. Estimacin por intervalo de confianza ..........................................94
3.2.2. Pruebas de hiptesis ................................................................105
4. Elementos bsicos de econometra.................................................113
4.1. Introduccin ................................................................................113
4.2. Anlisis de regresin y de correlacin ...........................................114
4.3. Series de tiempo .........................................................................120
Referencia bibliogrfica......................................................................125
7
ndice
Anexo................................................................................................127
Tabla 1: Percentiles de la distribucin normal estndar .........................127
Tabla 2: Percentiles de la distribucin t de Student ...............................129
8
Universidad Virtual de Quilmes
9
El material de esta carpeta contiene, en su inicio Unidad 1, diversas formas
de organizacin de los conjuntos de datos (apartado 1.1.). En algunos casos
datos de campo y en otros compilados, como preparacin del material de base
para elaborar las medidas estadsticas (apartado 1.2.) tambin denominadas
indicadores estadsticos, y producir informacin til.
La importancia de la organizacin de los datos, en vistas del tratamiento
posterior, reside en que permite establecer distintas lneas de trabajo en pos
de la calidad de la informacin que se busca. Una informacin estadstica de
calidad es primordial para la comprensin de las cualidades o caractersticas
del mundo real con perspectiva de su modelizacin.
A comienzos del siglo XIX el astrnomo Adolfo Quetelet considerado el fun-
dador de la estadstica moderna aplic a las ciencias sociales los mtodos
estadsticos hasta entonces utilizados en las ciencias naturales, contribu-
yendo a la ampliacin del campo de la estadstica. Sin embargo, fue a partir
de mediados de la dcada de 1960 con el Anlisis Exploratorio de Datos (EDA)
desarrollado por J. Tukey y otros que surgi un enfoque ms amplio en el
tratamiento de datos, cimentado en el uso de la informtica, donde el sopor-
te tecnolgico permiti sostener una gran masa de datos y procesarlos en
tiempo real, contribuyendo as al mejoramiento de la calidad de la informacin
resultante.
Luego del tratamiento descriptivo de los datos desarrollado en la Unidad
1, se incorporan nociones sobre la teora de la probabilidad Unidad 2.
A partir del siglo XVII comenz a evolucionar el Clculo de probabilidad
como disciplina cientfica introducindose el uso sistemtico de los concep-
tos de azar, indeterminismo y aleatoriedad. La Estadstica, que a la sazn ya
tena un desarrollo de varios milenios donde el campo de trabajo era exclusi-
vamente las poblaciones o universos, es decir la totalidad de los individuos o
elementos involucrados en el estudio de un problema, se vio enriquecida por
el desarrollo de la teora de la probabilidad la cual le permiti extender su
alcance hacia el interior de dichas poblaciones y ampliar su metodologa al
tratamiento de los subconjuntos de ellas, las muestras.
Los trabajos de Bernoulli, Laplace, Gauss y Galton entre otros, proveyeron
al clculo de probabilidades de recursos matemticos que permitieron dise-
ar modelos probabilsticos aplicables a diversos campos de la ciencia. Los
modelos probabilsticos, cuyo ncleo son las distribuciones de probabilidad
de las variables involucradas en los problemas de estudio (apartado 2.2.),
son la base de la inferencia estadstica.
La inferencia estadstica Unidad 3 es el procedimiento por el cual se
extrapolan o extienden a la poblacin en estudio los resultados de una mues-
tra representativa. A partir de los indicadores o estadsticos muestrales se
estiman (apartado 3.2.) o se someten a prueba (apartado 3.3.) los indicado-
res poblacionales tambin denominados parmetros.
In tro duc cin
Por ltimo, se tratan algunos elementos de econometra Unidad 4, nocio-
nes sobre la relacin entre variables como el anlisis de regresin lineal, el
anlisis de correlacin y un breve estudio sobre las series de tiempo.
El orden y sentido en que se desarrollan los distintos conceptos en el trans-
curso del presente material se sintetiza en el diagrama siguiente.
Mapa conceptual
Problemtica del campo
La estadstica se compone de dos grandes reas, la descriptiva y la inferencial.
Por medio de la estadstica descriptiva se analizan propiedades de un con-
junto de datos referidas al contexto en el que ellos se encuentran inmersos y
no como entidades aisladas. Por ese motivo es muy importante antes del an-
lisis descriptivo, conocer y clarificar el entorno del que provienen los datos.
Cuando hablamos del entorno estamos haciendo referencia a la poblacin en
estudio (o a una parte de ella) y a sus unidades de anlisis, a los atributos
que interesa estudiar y a la calidad del dato que se puede extraer.
Por otro lado, en los estudios de campo se da con frecuencia y por distin-
tas causas la imposibilidad de acceder a toda la poblacin y es en esos casos
donde los datos tienen que extraerse de un subconjunto de ella al que deno-
minamos muestra. Si el objetivo del anlisis de la muestra es realizar infe-
rencias respecto a la poblacin, necesariamente debe ser una muestra repre-
sentativa que comportndose como una imagen reducida de esa poblacin
de estudio refleje sus caractersticas. Estas muestras son obtenidas por
mtodos de muestreo aleatorio.
La estadstica inferencial tiene como objetivo realizar inferencias sobre la
poblacin en un ambiente de incertidumbre producto del azar y la aleatoriedad.
En sntesis, hay dos grandes problemas con los que se encuentra este
campo del saber el conocimiento del contexto de estudio y el tratamiento de
la incertidumbre.
10
Aprehender tcnicas y mtodos estadsticos tanto de la Estadstica des-
criptiva como de la Estadstica inferencial.
Emplear esas tcnicas y mtodos en la formalizacin de modelos esta-
dsticos en el mbito de las ciencias econmicas.
Aplicar el conocimiento estadstico adquirido a la vida cotidiana como parte
de una cultura general.
11
Objetivos del curso
13
Estadstica descriptiva
Ob je ti vos
Determinar y analizar distintos indicadores socioeconmicos.
Construir e interpretar grficos estadsticos diversos.
1.1. Los datos y su organizacin
En este apartado se tratarn algunas de las formas de organizar los datos
recolectados o recopilados y se preparar el material de base para que en los
apartados siguientes puedan elaborarse medidas estadsticas, comnmente
denominadas indicadores estadsticos.
Los datos son tomados de una cierta poblacin o universo objeto de estu-
dio: la poblacin objetivo.
Por ejemplo, todos los empleados de una determinada pyme constituyen
una poblacin objetivo. Y en ese caso, cada individuo de ese universo cada
empleado es lo que se denomina una unidad de observacin.
En el estudio de la poblacin nos pueden interesar determinados atribu-
tos comunes a los individuos como la edad, el salario, la antigedad, etc. Los
archivos de la empresa combinados con entrevistas personales pueden haber
sido los instrumentos con que se relev la informacin.
El paso inicial para organizar toda la informacin primaria obtenida del
grupo de empleados de la pyme y que la presente en su totalidad, es elabo-
rar una tabla denominada matriz de datos. Una matriz de datos es un arreglo
de filas y columnas donde cada fila representa un individuo o unidad de obser-
vacin y cada columna un atributo variable (en el apartado 1.3. figuran cuatro
matrices de datos llamadas a partir de ahora matrices ejemplo ME cada
vez que se haga referencia a ellas).
Cada uno de los atributos variables que se observan en la matriz son pasi-
bles de convertirse en lo que llamamos variables estadsticas.
1.1.1. Variables estadsticas y su clasificacin
Las variables estadsticas se obtienen a partir de los atributos. Por ejemplo,
si el atributo primario hubiese sido la fecha de nacimiento de cada empleado,
para su tratamiento estadstico se disea la variable edad en aos. Por otro
lado, contando con la fecha de nacimiento y la fecha de ingreso podra dise-
1
En el apartado 1.6. figu-
ran varios ejemplos de
poblacin objetivo y de unidad de
observacin.
Otros instrumentos de
recoleccin de datos son:
documentos, encuestas o simple
observacin.
Puede haber atributos
que no varen de un indi-
viduo a otro, como la pertenen-
cia a la empresa, ya que todos
son empleados.
arse la variable edad que tena cuando ingres a la empresa (en este caso
la variable surge de una combinacin de atributos).
Para un primer tratamiento se convertir cada atributo de las matrices ejem-
plo ME en una variable estadstica.
Si se observan detenidamente cada una de las variables se puede notar
que algunas asumen valores numricos y otras valores no numricos.
A las que asumen valores numricos las denominaremos variables cuan-
titativas y a las que asumen valores no numricos, es decir cualidades, varia-
bles cualitativas.
Son ejemplos de variables cuantitativas la antigedad, el salario quince-
nal, la cantidad de personal, la longitud de las piezas de plstico, etc. Son
ejemplos de variables cualitativas el sexo, el tipo de posesin de la vivienda,
el rubro de las pymes, el tipo de materia prima, etctera.
1.
Clasificar como cuantitativas o cualitativas cada una de las variables de
las ME del apartado 1.3.
Si se observan ms detenidamente las variables de las matrices ejemplo se
puede notar que hay variables cuantitativas que asumen valores dentro del
conjunto de los nmeros reales y hay otras cuyos valores son nmeros ente-
ros. A las que asumen valores reales las denominamos cuantitativas conti-
nuas y a las otras cuantitativas discretas. Por ejemplo: la edad civil es por
naturaleza una variable discreta pero eventualmente si se tratara la edad bio-
lgica sta sera por naturaleza una variable cuantitativa continua.
Con respecto a las variables cualitativas se puede notar que en algunas de
ellas sus valores pueden ordenarse y en otras no. Esto justifica tambin sub-
clasificarla en cualitativas ordenables y cualitativas no ordenables. Un ejem-
plo de variable cualitativa ordenable es el nivel de detalle de terminacin de
las piezas plsticas y un ejemplo de no ordenable es el rubro de las pymes.
2.
Completar la actividad 1 con la clasificacin de las variables.
Por qu motivo cree que es necesaria la clasificacin realizada para las
variables y cul ser su utilidad?
14
7
FIN DE LEER ATENTO
COMIENZO DE ACTIVIDAD
Completar la actividad 1 con la clasiIicacion de las variables.

FIN DE ACTIVIDAD
COMIENZO DE PARA REFLEXIONAR
Por que motivo cree que es necesaria la clasiIicacion realizada
para las variables y cual sera su utilidad?
FIN DE PARA REFLEXIONAR
1.1.2. Ordenamiento y tabuIacin de Ios datos
A partir de aqui se seguira la organizacion de los datos centrando la
atencion en cada una de las variables y teniendo en cuenta su
complejidad.
Variable cualitativa no ordenable
Elegimos para esta categoria la variable 'Rubro de la pyme de la
matriz de ejemplo ME 3.
Los rubros relevados en la muestra son: servicios (S), industrial (I),
agricola (A) y comercial (C). Podria interesarnos cuantas empresas hay
de cada rubro, entonces armamos la siguiente tabla denominada tabla de
distribucion de Irecuencias.
RubUo Cantidad de 3\PeV
$ 6
C 5
9
6 4
Total 24
6ARIABLES
#UANTITATIVAS
#UALITATIVAS
$ISCRETAS
#ONTINUAS
/RDENABLES
.OORDENABLES
1.1.2. Ordenamiento y tabulacin de los datos
A partir de aqu se seguir la organizacin de los datos centrando la atencin
en cada una de las variables y teniendo en cuenta su complejidad.
Elegimos para esta categora la variable Rubro de la pyme de la matriz de
ejemplo ME 3.
Los rubros relevados en la muestra son: servicios (S), industrial (I), agr-
cola (A) y comercial (C). Podra interesarnos cuntas empresas hay de cada
rubro, entonces armamos la siguiente tabla denominada tabla de distribucin
de frecuencias.
El conteo realizado para la segunda columna de la tabla constituye lo que lla-
maremos de aqu en ms frecuencia absoluta.
Se denomina frecuencia absoluta a la cantidad de veces que aparece cada
valor de la variable en el grupo de datos estudiado.
Es importante tener en cuenta que la suma de todas las frecuencias abso-
lutas es igual a la cantidad total de datos.
Ampliando el concepto de frecuencia de tal manera de involucrar no slo las
cantidades con que aparece cada rubro sino tambin su incidencia respecto
del total, surgen las denominadas frecuencias porcentuales y relativas.
La frecuencia relativa se calcula dividiendo cada frecuencia absoluta por
el total de datos.
La frecuencia porcentual se calcula multiplicando por 100 la respectiva
frecuencia relativa.
La tabla que sigue, que llamaremos de aqu en adelante tabla de distribucin
de frecuencias o distribucin de frecuencias a secas, incluye a los tres tipos
de frecuencias definidas anteriormente.
15
Estadistica
FIN DE LEER ATENTO
2.
Completar la actividad 1 con la clasicacin de las variables.
FIN DE ACTIVIDAD
Por qu motivo cree que es necesaria la clasicacin realizada para las variables y cul ser su utilidad?
1.1.2. Ordenamiento y tabulacin de los datos
A partir de aqu se seguir la organizacin de los datos centrando la atencin en cada una de las variables y teniendo
en cuenta su complejidad.
Elegimos para esta categora la variable Rubro de la pyme de la matriz de ejemplo ME 3.
Los rubros relevados en la muestra son: servicios (S), industrial (I), agrcola (A) y comercial (C). Podra interesarnos
cuntas empresas hay de cada rubro, entonces armamos la siguiente tabla denominada tabla de distribucin de
frecuencias.
Rubro Cantidad de Pymes
A 6
C 5
I 9
S 4
Total 24
El conteo realizado para la segunda columna de la tabla constituye lo que llamaremos de aqu en ms frecuencia
absoluta.
COMIENZO DE LEER ATENTO
Se denomina frecuencia absoluta a la cantidad de veces que aparece cada valor de la variable en el grupo de
datos estudiado.
Es importante tener en cuenta que la suma de todas las frecuencias absolutas es igual a la cantidad total
de datos.
FIN DE LEER ATENTO
COMIENZO DE PASTILLA ENIUHFXHQFLDDEVROXWD
La notacin usual para la frecuencia absoluta es f y para la cantidad total de datos muestrales n.
FIN DE PASTILLA
COMIENZO DE PASTILLA ENFDQWLGDGWRWDOGHGDWRV
La notacin usual para la fre-
cuencia absoluta es f y para la
cantidad total de datos
muestrales n.
Si el grupo relevado es
una poblacin denota-
remos con N a la cantidad total
de datos.
La frecuencia relativa se abrevia
con f
r
y el total es 1.
La frecuencia porcentual
se abrevia con f
%
y el total
es 100.
Tabla 1.1.
Variable cualitativa ordenable
Como ejemplo para este tipo de variables tomaremos el nivel de detalles de
terminacin de las piezas plsticas de la ME 4.
Tabla 1.2.
Como puede apreciarse, en la tabla de distribucin de frecuencias se consig-
naron los valores o categoras en sentido creciente, acorde con la natura-
leza ordenable de la variable. En la tabla podemos leer, por ejemplo, cuntas
piezas de plstico (o qu porcentaje de ellas) cumplen con un determinado
nivel de detalle de terminacin.
El carcter de ordenables que adquieren las categoras nos habilita a crear lo
que denominaremos un arreglo de datos ordenados:
Donde: Detalle de terminacin Regular: R; Bueno: B; Muy bueno: MB y Exce-
lente: E.
Por una cuestin de economa de espacio hemos elegido representar el arre-
glo mediante una matriz fila, pero puede usarse una matriz columna sin que
ello altere la esencia del ordenamiento.
Aprovechando la propiedad de ordenamiento de las categoras, sometere-
mos las frecuencias de la tabla 1.2. a un mecanismo de acumulacin y defi-
niremos las frecuencias acumuladas absoluta, relativa y porcentual, esto es
cuntas piezas de plstico (o qu porcentaje) cumplen con un nivel mximo
de detalles de terminacin.
16
Rubro f f
r
f
%
A 6 0,25 25
C 5 0,21 21
I 9 0,37 37
S 4 0,17 17
Total 24 1,00 100
Donde: Rubro Agrcola: A; Comercial: C; Industrial: I y Servicios: S.
Tabla 1.2.
Detalle de
terminacin
f f
r
f
%
Regular 5 0,25 25
Bueno 5 0,25 25
Muy bueno 5 0,25 25
Excelente 5 0,25 25
Total 20 1 100
Si el grupo relevado es una poblacin denotaremos con N a la cantidad total de datos.
FIN DE PASTILLA
Ampliando el concepto de frecuencia de tal manera de involucrar no slo las cantidades con que aparece cada rubro
sino tambin su incidencia respecto del total, surgen las denominadas frecuencias porcentuales y relativas.

La frecuencia relativa se calcula dividiendo cada frecuencia absoluta por el total de datos.
La frecuencia porcentual se calcula multiplicando por 100 la respectiva frecuencia relativa.
FIN DE LEER ATENTO
COMIENZO DE PASTILLA EN freouenoia relativa
La freouenoia relativa se abrevia oon f
r
y el total es 1
FIN DE PASTILLA
COMIENZO DE PASTILLA EN freouenoia poroentual
La freouenoia poroentual se abrevia oon f
%
y el total es 100.
FIN DE PASTILLA
La tabla que sigue, que llamaremos de aqu en adelante tabla de distribucin de frecuencias o distribucin de frecuencias
a secas, incluye a los tres tipos de frecuencias denidas anteriormente.
Tabla 1.1.
Rubro f f
r
f
%
A 6 0,25 25
C 5 0,21 21
I 9 0,37 37
S 4 0,17 17
Total 24 1,00 100
Uonde: Rubro Agrioola: A, Comeroial: C, lndustrial: l y 3ervioios: 3.
Variable cualitativa ordenable
Como ejemplo para este tipo de variables tomaremos el nivel de detalles de terminacin de las piezas plsticas de la
ME 4.
Tabla 1.2.
Detalle de
terminacin
f f
r
f
%
Regular 5 0,25 25
Bueno 5 0,25 25
Muy bueno 5 0,25 25
Excelente 5 0,25 25
Total 20 1 100
Como puede apreciarse, en la tabla de distribucin de frecuencias se consignaron los valores o categoras en
sentido creciente, acorde con la naturaleza ordenable de la variable. En la tabla podemos leer, por ejemplo, cuntas
piezas de plstico (o qu porcentaje de ellas) cumplen con un determinado nivel de detalle de terminacin.
El carcter de ordenables que adquieren las categoras nos habilita a crear lo que denominaremos un arreglo de datos
ordenados:
R R R R R B B B B B MB MB MB MB MB E E E E E
Uonde: Uetalle de terminaoion Regular: R, Bueno: B, Muy bueno: MB y Lxoelente: L.
Por una cuestin de economa de espacio hemos elegido representar el arreglo mediante una matriz la, pero puede
usarse una matriz columna sin que ello altere la esencia del ordenamiento.
Aprovechando la propiedad de ordenamiento de las categoras, someteremos las frecuencias de la tabla 1.2. a un
mecanismo de acumulacin y deniremos las frecuencias acumuladas absoluta, relativa y porcentual, esto es cuntas
piezas de plstico (o qu porcentaje) cumplen con un nivel mximo de detalles de terminacin.
La frecuencia absoluta acumulada que denotamos con F hasta una determinada categora de la variable resulta
de sumarle a su frecuencia absoluta todas las frecuencias absolutas de los valores o categoras menores.
La frecuencia relativa acumulada Fr hasta una categora se calcula sumndole a su frecuencia relativa las
frecuencias relativas de las categoras anteriores.
La frecuencia porcentual acumulada F% hasta una determinada categora o valor se calcula sumndole a
su frecuencia porcentual las frecuencias porcentuales anteriores.
FIN DE LEER ATENTO
En la siguiente distribucin se encuentran ya consignadas todas las frecuencias denidas anteriormente.
Tabla 1.3.
Detalle de
terminacin
f f
r
f
%
F F
r
F
%
Regular 5 0,25 25 5 0,25 25
Bueno 5 0,25 25 10 0,50 50
Muy bueno 5 0,25 25 15 0,75 75
Excelente 5 0,25 25 20 1,00 100
Total 20 1 100
Variable cuantitativa discreta
Caso 1. Edad de los trabajadores de una empresa cooperativa, (extrada de la EM 1).
Para el tratamiento de esta variable procederemos como se hizo para la cualitativa ordenable.
Arreglo de datos ordenados
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Distribucin de frecuencias
La frecuencia absoluta acumulada que denotamos con F hasta una deter-
minada categora de la variable resulta de sumarle a su frecuencia absolu-
ta todas las frecuencias absolutas de los valores o categoras menores.
La frecuencia relativa acumulada Fr hasta una categora se calcula sumn-
dole a su frecuencia relativa las frecuencias relativas de las categoras
anteriores.
La frecuencia porcentual acumulada F% hasta una determinada cate-
gora o valor se calcula sumndole a su frecuencia porcentual las fre-
cuencias porcentuales anteriores.
En la siguiente distribucin se encuentran ya consignadas todas las frecuen-
cias definidas anteriormente.
Tabla 1.3.
Caso 1. Edad de los trabajadores de una empresa cooperativa, (extrada de
la EM 1).
Para el tratamiento de esta variable procederemos como se hizo para la cua-
litativa ordenable.
17
Estadistica
FIN DE LEER ATENTO
Tabla 1.3.
Detalle de
terminacin
f f
r
f
%
F F
r
F
%
Regular 5 0,25 25 5 0,25 25
Bueno 5 0,25 25 10 0,50 50
Muy bueno 5 0,25 25 15 0,75 75
Excelente 5 0,25 25 20 1,00 100
Total 20 1 100
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
FIN DE LEER ATENTO
Tabla 1.3.
Detalle de
terminacin
f f
r
f
%
F F
r
F
%
Regular 5 0,25 25 5 0,25 25
Bueno 5 0,25 25 10 0,50 50
Muy bueno 5 0,25 25 15 0,75 75
Excelente 5 0,25 25 20 1,00 100
Total 20 1 100
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Tabla 1.4.
Caso 2. Edad de los empleados de una fbrica automotriz.
A continuacin se transcriben las edades de una muestra de 80 empleados
de una fbrica automotriz.
Si intentramos listar en una tabla de frecuencias los 80 datos nos encon-
traramos con una gran variedad de valores. Adems, sus correspondientes fre-
cuencias son similares. Ante este panorama el sentido comn aconseja orga-
nizar los datos por franjas de edad.
18
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
A continuacin se transcriben las edades de una muestra de 80 empleados de una fbrica automotriz.
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Si intentramos listar en una tabla de frecuencias los 80 datos nos encontraramos con una gran variedad de valores.
Adems, sus correspondientes frecuencias son similares. Ante este panorama el sentido comn aconseja organizar los
datos por franjas de edad.
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Tabla 1.5.
Para poder usar, ms adelante, con comodidad este material llamamos a esas
franjas intervalos de clase y los describimos agregando para el conteo algu-
na convencin.
Tabla 1.6.
La convencin que se us para ajustar los intervalos de clase y hacerlos adya-
centes, fue cerrarlos a izquierda y abrirlos a derecha. Podra haber sido al
revs, abiertos a izquierda y cerrados a derecha, pero una vez elegida una de
las dos convenciones debe mantenrsela para toda la distribucin.
Por qu es necesario mantener la convencin elegida en toda la distri-
bucin? Qu problemas acarreara utilizar las dos convenciones en una
misma tabla?
Caso 3. En la siguiente tabla elaborada por los editores de una revista estu-
diantil universitaria con base en informacin del Nunca Ms (Informe de la
CONADEP, Eudeba, 1984), se presenta la edad de las personas desaparecidas
en la Argentina por la ltima dictadura militar (1976-1983).
19
Estadistica
Tabla 1.4.
Edad f f
r
f
%
F
i
F
r
F
%
21 1 0,05 5 1 0,05 5
25 1 0,05 5 2 0,10 10
28 1 0,05 5 3 0,15 15
30 1 0,05 5 4 0,20 20
34 1 0,05 5 5 0,25 25
36 2 0,1 10 7 0,35 35
37 3 0,15 15 10 0,50 50
38 1 0,05 5 11 0,55 55
39 2 0,1 10 13 0,65 65
40 2 0,1 10 15 0,75 75
42 1 0,05 5 16 0,80 80
48 1 0,05 5 17 0,85 85
51 1 0,05 5 18 0,90 90
57 1 0,05 5 19 0,95 95
63 1 0,05 5 20 1,00 100
Total 20 1 100
40 33 18 33 54 20 42 36 40 39 24 42 38 64 27 48 58 37 29 49
30 31 41 50 32 18 42 53 46 34 34 34 35 35 44 36 21 55 36 15
29 37 62 38 25 39 22 39 49 40 21 41 31 33 25 20 43 43 35 44
45 17 46 27 48 30 49 37 50 32 51 33 54 19 36 56 28 59 38 27
15 17 18 18 19 20 20 21 21 22 24 25 25 27 27 27 28 29 29 30
30 31 31 32 32 33 33 33 33 34 34 34 35 35 35 36 36 36 36 37
37 37 38 38 38 39 39 39 40 40 40 41 41 42 42 42 43 43 44 44
45 46 46 48 48 49 49 49 50 50 51 53 54 54 55 56 58 59 62 64
Tabla 1.5.
Franja de edad f
15 a 19 5
20 a 24 6
25 a 29 8
30 a 34 13
35 a 39 16
40 a 44 12
45 a 49 8
50 a 54 6
55 a 59 4
60 a 64 2
Total 80
Para poder usar, ms adelante, con comodidad este material llamamos a esas franjas intervalos de clase y los describimos
agregando para el conteo alguna convencin.
Tabla 1.6.
Edad F f
r
f
%
F
i
F
r
F
%
[15 - 20) 5 0,0625 6,25 5 0,0625 6,25
[20 - 25) 6 0,0750 7,50 11 0,1375 13,75
[25 - 30) 8 0,1000 10,00 19 0,2375 23,75
[30 - 35) 13 0,1625 16,25 32 0,4000 40,00
[35 - 40) 16 0,2000 20,00 48 0,6000 60,00
[40 - 45) 12 0,1500 15,00 60 0,7500 75,00
[45 - 50) 8 0,1000 10,00 68 0,8500 85,00
[50 - 55) 6 0,0750 7,50 74 0,9250 92,50
[55 - 60) 4 0,0500 5,00 78 0,9750 97,50
[60 - 65) 2 0,0250 2,50 80 1,0000 100,00
Total 80 1,0000 100,00
La convencin que se us para ajustar los intervalos de clase y hacerlos adyacentes, fue cerrarlos a izquierda y abrirlos
a derecha. Podra haber sido al revs, abiertos a izquierda y cerrados a derecha, pero una vez elegida una de las dos
convenciones debe mantenrsela para toda la distribucin.
COMIENZO DE PASTILLA EN intervalos de olase
Ll oonjunto de intervalos debe serexhaustivo -es deoirningun dato puede quedar exoluido- \los intervalos son exoluyentes entre si por eso
deben ser semiabiertos.
FIN DE PASTILLA
Por qu es necesario mantener la convencin elegida en toda la distribucin? Qu problemas acarreara utilizar
Caso 3. En la siguiente tabla elaborada por los editores de una revista estudiantil universitaria con base en informacin
del Nunca Ms (Informe de la CONADEP, Eudeba, 1984), se presenta la edad de las personas desaparecidas en la
Argentina por la ltima dictadura militar (1976-1983).
Tabla 1.7.
Edad al momento de la
desaparicin forzada
f%
0 a 5 0,82
6 a 10 0,25
11 a 15 0,58
16 a 20 10,61
21 a 25 32,62
26 a 30 25,90
31 a 35 12,26
36 a 40 6,73
41 a 45 3,40
46 a 50 2,41
51 a 55 1,84
56 a 60 1,17
61 a 65 0,75
66 a 70 0,41
+ de 70 0,25
Total 100,00
El conjunto de interva-
los debe ser exhaustivo
es decir, ningn dato puede que-
dar excluido y los intervalos son
excluyentes entre s por eso deben
ser semiabiertos.
Tabla 1.7.
Notemos que en este caso no disponemos de los datos de campo y que en con-
secuencia no necesitamos adoptar convencin alguna para el conteo. Para futu-
ros usos retocamos algunos lmites de los intervalos de tal forma que sean
rigurosamente adyacentes en el dominio de los nmeros reales y tengan la
misma amplitud, y agregamos una columna con frecuencias acumuladas:
Tabla 1.8.
20
Para poder usar, ms adelante, con comodidad este material llamamos a esas franjas intervalos de clase y los describimos
agregando para el conteo alguna convencin.
Tabla 1.6.
Edad F f
r
f
%
F
i
F
r
F
%
[15 - 20) 5 0,0625 6,25 5 0,0625 6,25
[20 - 25) 6 0,0750 7,50 11 0,1375 13,75
[25 - 30) 8 0,1000 10,00 19 0,2375 23,75
[30 - 35) 13 0,1625 16,25 32 0,4000 40,00
[35 - 40) 16 0,2000 20,00 48 0,6000 60,00
[40 - 45) 12 0,1500 15,00 60 0,7500 75,00
[45 - 50) 8 0,1000 10,00 68 0,8500 85,00
[50 - 55) 6 0,0750 7,50 74 0,9250 92,50
[55 - 60) 4 0,0500 5,00 78 0,9750 97,50
[60 - 65) 2 0,0250 2,50 80 1,0000 100,00
Total 80 1,0000 100,00
La convencin que se us para ajustar los intervalos de clase y hacerlos adyacentes, fue cerrarlos a izquierda y abrirlos
a derecha. Podra haber sido al revs, abiertos a izquierda y cerrados a derecha, pero una vez elegida una de las dos
convenciones debe mantenrsela para toda la distribucin.
COMIENZO DE PASTILLA EN intervalos de olase
Ll oonjunto de intervalos debe serexhaustivo -es deoirningun dato puede quedar exoluido- \los intervalos son exoluyentes entre si por eso
deben ser semiabiertos.
FIN DE PASTILLA
Por qu es necesario mantener la convencin elegida en toda la distribucin? Qu problemas acarreara utilizar
Caso 3. En la siguiente tabla elaborada por los editores de una revista estudiantil universitaria con base en informacin
del Nunca Ms (Informe de la CONADEP, Eudeba, 1984), se presenta la edad de las personas desaparecidas en la
Argentina por la ltima dictadura militar (1976-1983).
Tabla 1.7.
desaparicin forzada
f%
0 a 5 0,82
6 a 10 0,25
11 a 15 0,58
16 a 20 10,61
21 a 25 32,62
26 a 30 25,90
31 a 35 12,26
36 a 40 6,73
41 a 45 3,40
46 a 50 2,41
51 a 55 1,84
56 a 60 1,17
61 a 65 0,75
66 a 70 0,41
+ de 70 0,25
Total 100,00
Notemos que en este caso no disponemos de los datos de campo y que en consecuencia no necesitamos adoptar
convencin alguna para el conteo.
Para futuros usos retocamos algunos lmites de los intervalos de tal forma que sean rigurosamente adyacentes en el
dominio de los nmeros reales y tengan la misma amplitud, y agregamos una columna con frecuencias acumuladas:
Tabla 1.8.
desaparicin forzada
f% F%
0 - 5 0,82 0,82
5 - 10 0,25 1,07
10 - 15 0,58 1,65
15 - 20 10,61 12,26
20 - 25 32,62 44,88
25 - 30 25,90 70,78
30 - 35 12,26 83,04
35 - 40 6,73 89,77
40 - 45 3,40 93,17
45 - 50 2,41 95,58
50 - 55 1,84 97,42
55 - 60 1,17 98,59
60 - 65 0,75 99,34
65 - 70 0,41 99,75
70 - 75 0,25 100,00
Total 100,00
Variable cuantitativa continua
familia, de 96 familias escogidas al azar de cierta localidad.
40,50 20,65 18,10 30,45 42,70 29,95 23,70 33,10 23,60 30,70
39,40 29,80 39,55 21,90 23,10 53,10 43,70 72,40 58,90 20,27
46,50 47,20 91,00 43,90 33,30 63,90 33,20 43,90 27,85 26,80
51,34 52,90 88,90 33,70 49,30 75,30 45,10 37,90 43,10 31,55
60,00 39,55 69,45 45,95 29,90 53,90 23,10 65,30 33,90 70,80
43,20 72,70 55,50 33,90 34,65 62,65 32,15 43,90 45,30 65,45
57,30 71,10 67,30 39,65 39,90 30,75 52,60 72,65 23,90 45,30
68,40 63,70 39,45 27,99 49,30 43,65 38,75 29,30 32,65 38,10
47,30 58,40 46,00 29,15 63,90 71,00 19,50 37,20 41,20 29,90
29,95 39,65 61,80 37,70 39,65 38,90
Consideremos el siguiente conjunto de datos correspondiente a gastos por
consumo medio diario de alimentos por familia, de 96 familias escogidas al
azar de cierta localidad.
Como se puede apreciar se opt por organizar el arreglo con forma de matriz
columna, la que adems se parti en cinco tramos para economizar espacio.
De forma similar a lo que se hizo anteriormente con la variable discreta del
21
Estadistica
Notemos que en este caso no disponemos de los datos de campo y que en consecuencia no necesitamos adoptar
convencin alguna para el conteo.
Para futuros usos retocamos algunos lmites de los intervalos de tal forma que sean rigurosamente adyacentes en el
dominio de los nmeros reales y tengan la misma amplitud, y agregamos una columna con frecuencias acumuladas:
Tabla 1.8.
desaparicin forzada
f% F%
0 - 5 0,82 0,82
5 - 10 0,25 1,07
10 - 15 0,58 1,65
15 - 20 10,61 12,26
20 - 25 32,62 44,88
25 - 30 25,90 70,78
30 - 35 12,26 83,04
35 - 40 6,73 89,77
40 - 45 3,40 93,17
45 - 50 2,41 95,58
50 - 55 1,84 97,42
55 - 60 1,17 98,59
60 - 65 0,75 99,34
65 - 70 0,41 99,75
70 - 75 0,25 100,00
Total 100,00
familia, de 96 familias escogidas al azar de cierta localidad.
40,50 20,65 18,10 30,45 42,70 29,95 23,70 33,10 23,60 30,70
39,40 29,80 39,55 21,90 23,10 53,10 43,70 72,40 58,90 20,27
46,50 47,20 91,00 43,90 33,30 63,90 33,20 43,90 27,85 26,80
51,34 52,90 88,90 33,70 49,30 75,30 45,10 37,90 43,10 31,55
60,00 39,55 69,45 45,95 29,90 53,90 23,10 65,30 33,90 70,80
43,20 72,70 55,50 33,90 34,65 62,65 32,15 43,90 45,30 65,45
57,30 71,10 67,30 39,65 39,90 30,75 52,60 72,65 23,90 45,30
68,40 63,70 39,45 27,99 49,30 43,65 38,75 29,30 32,65 38,10
47,30 58,40 46,00 29,15 63,90 71,00 19,50 37,20 41,20 29,90
29,95 39,65 61,80 37,70 39,65 38,90
18,10 29,95 39,40 45,95 63,90
19,50 30,45 39,45 46,00 63,90
20,27 30,70 39,55 46,50 65,30
20,65 30,75 39,55 47,20 65,45
21,90 31,55 39,65 47,30 67,30
23,10 32,15 39,65 49,30 68,40
23,10 32,65 39,65 49,30 69,45
23,60 33,10 39,90 51,34 70,80
23,70 33,20 41,20 52,60 71,00
23,90 33,30 42,70 52,90 71,10
24,05 33,70 43,10 53,10 72,40
26,80 33,90 43,20 53,90 72,65
27,85 33,90 43,65 55,50 72,70
27,99 34,65 43,70 57,30 75,30
29,15 37,20 43,90 58,40 88,90
29,30 37,70 43,90 58,90 91,00
29,80 37,90 43,90 60,00
29,90 38,10 45,10 61,80
29,90 38,75 45,30 62,65
29,95 38,90 45,30 63,70
Como se puede apreciar se opt por organizar el arreglo con forma de matriz columna, la que adems se parti en cinco
tramos para economizar espacio.
De forma similar a lo que se hizo anteriormente con la variable discreta del Caso 2, y por idnticos motivos, se
confecciona a continuacin una distribucin de frecuencias agrupando los datos en intervalos de clase:
Tabla 1.9.
Gasto medio
diario
f f
%
F F
%
(15 25] 11 11,45 11 11,45
(25 - 35] 23 23,96 34 35,41
(35 - 45] 23 23,96 57 59,37
(45 55] 15 15,63 72 75,00
(55 65] 10 10,42 82 85,42
(65 - 75] 11 11,46 93 96,88
(75 - 85] 1 1,04 94 97,92
(85 - 95] 2 2,08 96 100,00
Total 96 100,00
Tabla de distribucin conjunta
Para armar la siguiente tabla de doble entrada se consideraron las variables Puesto de trabajo entre 2001 y 2003 y
Rubro, ambas de la ME 3.
Caso 2, y por idnticos motivos, se confecciona a continuacin una distribu-
cin de frecuencias agrupando los datos en intervalos de clase:
Tabla 1.9.
Para armar la siguiente tabla de doble entrada se consideraron las variables
Puesto de trabajo entre 2001 y 2003 y Rubro, ambas de la ME 3.
Tabla 1.10.
Cada uno de los nmeros que figuran en la tabla result del conteo simult-
neo o conjunto de dos categoras, donde cada categora pertenece a una varia-
ble distinta.
Se puede observar que hay cuatro pymes en la muestra que son del rubro
industrial y que aumentaron los puestos de trabajo entre 2001 y 2003.
Tabla 1.11.
Las frecuencias que figuran en la tabla 1.10. se denominan frecuencias abso-
lutas conjuntas y estn sombreadas en la tabla 1.11. En esta ltima se incor-
poraron adems los totales por filas y columnas que son las frecuencias mar-
ginales o totales.
22
18,10 29,95 39,40 45,95 63,90
19,50 30,45 39,45 46,00 63,90
20,27 30,70 39,55 46,50 65,30
20,65 30,75 39,55 47,20 65,45
21,90 31,55 39,65 47,30 67,30
23,10 32,15 39,65 49,30 68,40
23,10 32,65 39,65 49,30 69,45
23,60 33,10 39,90 51,34 70,80
23,70 33,20 41,20 52,60 71,00
23,90 33,30 42,70 52,90 71,10
24,05 33,70 43,10 53,10 72,40
26,80 33,90 43,20 53,90 72,65
27,85 33,90 43,65 55,50 72,70
27,99 34,65 43,70 57,30 75,30
29,15 37,20 43,90 58,40 88,90
29,30 37,70 43,90 58,90 91,00
29,80 37,90 43,90 60,00
29,90 38,10 45,10 61,80
29,90 38,75 45,30 62,65
29,95 38,90 45,30 63,70
Como se puede apreciar se opt por organizar el arreglo con forma de matriz columna, la que adems se parti en cinco
tramos para economizar espacio.
De forma similar a lo que se hizo anteriormente con la variable discreta del Caso 2, y por idnticos motivos, se
confecciona a continuacin una distribucin de frecuencias agrupando los datos en intervalos de clase:
Tabla 1.9.
Gasto medio
diario
f f
%
F F
%
(15 25] 11 11,45 11 11,45
(25 - 35] 23 23,96 34 35,41
(35 - 45] 23 23,96 57 59,37
(45 55] 15 15,63 72 75,00
(55 65] 10 10,42 82 85,42
(65 - 75] 11 11,46 93 96,88
(75 - 85] 1 1,04 94 97,92
(85 - 95] 2 2,08 96 100,00
Total 96 100,00
Para armar la siguiente tabla de doble entrada se consideraron las variables Puesto de trabajo entre 2001 y 2003 y
Rubro, ambas de la ME 3.
Tabla 1.10.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios
Uisminuyo 1 1 3 2
Mantuvo 2 3 3 1
Aumento 2 1 4 1
Cada uno de los nmeros que guran en la tabla result del conteo simultneo o conjunto de dos categoras, donde
cada categora pertenece a una variable distinta.
Se puede observar que hay cuatro pymes en la muestra que son del rubro industrial y que aumentaron los puestos
de trabajo entre 2001 y 2003.
Tabla 1.11.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios Total
Uisminuyo 1 1 3 2 7
Mantuvo 2 3 3 1 9
Aumento 2 1 4 1 8
Total 5 5 10 4 24
Las frecuencias que guran en la tabla 1.10. se denominan frecuencias absolutas conjuntas y estn sombreadas en la
tabla 1.11. En esta ltima se incorporaron adems los totales por las y columnas que son las frecuencias marginales o
totales.
Si bien las palabras valor, categora y clase pueden usarse como sinnimos, en lo sucesivo seremos ms rigurosos
respecto del signicado de cada una. En ese sentido diremos que las variables cualitativas asumen categoras y las
cuantitativas toman valores o se agrupan en clases (de valores).
FIN DE LEER ATENTO
1.1.3. Representaciones grcas
Para visualizar las distribuciones de frecuencias realizadas previamente recurriremos a distintos grcos. Como el
mundo de los grcos es muy amplio y slo limitado por la imaginacin, seleccionaremos aquellos que consideramos
ms convenientes segn su adecuacin con el tipo de variable analizada.
Variables cualitativas
Para la confeccin de los siguientes grcos se utiliz la informacin de las tablas 1.1. y 1.2.
Grco circular o de torta
Insertar Imagen N G.1.2.
G.1.2. G.1.3.
2
Tabla 1.10.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios
Uisminuyo 1 1 3 2
Mantuvo 2 3 3 1
Aumento 2 1 4 1
Cada uno de los nmeros que guran en la tabla result del conteo simultneo o conjunto de dos categoras, donde
cada categora pertenece a una variable distinta.
Se puede observar que hay cuatro pymes en la muestra que son del rubro industrial y que aumentaron los puestos
de trabajo entre 2001 y 2003.
Tabla 1.11.
Puestos de trabajo
2001-2003
Rubro
Agrioola Comeroial lndustrial 3ervioios Total
Uisminuyo 1 1 3 2 7
Mantuvo 2 3 3 1 9
Aumento 2 1 4 1 8
Total 5 5 10 4 24
Las frecuencias que guran en la tabla 1.10. se denominan frecuencias absolutas conjuntas y estn sombreadas en la
tabla 1.11. En esta ltima se incorporaron adems los totales por las y columnas que son las frecuencias marginales o
totales.
Si bien las palabras valor, categora y clase pueden usarse como sinnimos, en lo sucesivo seremos ms rigurosos
respecto del signicado de cada una. En ese sentido diremos que las variables cualitativas asumen categoras y las
cuantitativas toman valores o se agrupan en clases (de valores).
FIN DE LEER ATENTO
1.1.3. Representaciones grcas
Para visualizar las distribuciones de frecuencias realizadas previamente recurriremos a distintos grcos. Como el
mundo de los grcos es muy amplio y slo limitado por la imaginacin, seleccionaremos aquellos que consideramos
Para la confeccin de los siguientes grcos se utiliz la informacin de las tablas 1.1. y 1.2.
Grco circular o de torta
G.1.2. G.1.3.
2
Si bien las palabras valor, categora y clase pueden usarse como sinni-
mos, en lo sucesivo seremos ms rigurosos respecto del significado de
cada una. En ese sentido diremos que las variables cualitativas asumen
categoras y las cuantitativas toman valores o se agrupan en clases (de
valores).
1.1.3. Representaciones grficas
Para visualizar las distribuciones de frecuencias realizadas previamente recu-
rriremos a distintos grficos. Como el mundo de los grficos es muy amplio y
slo limitado por la imaginacin, seleccionaremos aquellos que consideramos
Para la confeccin de los siguientes grficos se utiliz la informacin de las
tablas 1.1. y 1.2.
Grfico circular o de torta
Grfico de barras
23
Estadistica
G.1.2. G.1.3.
Grfico de barras
G.1.4. G.1.5.
Servicios 17%
Servicios
Agrcola 25%
Agrcola
Industrial 37%
Industrial
Comercial 21%
Comercial
0 0,1 0,2 0,3 0,4 fr
Regular
Regular
Bueno
Bueno
Muy bueno
Muy bueno
Excelente
Excelente
Detalle de terminacin
Tabla 1.2.
Tabla 1.2.
Rubro de la PyME
Tabla 1.1.
Rubro de la PyME
Tabla 1.1.
f
6
5
4
3
2
1
0
G.1.2. G.1.3.
Grfico de barras
G.1.4. G.1.5.
Servicios 17%
Servicios
Agrcola 25%
Agrcola
Industrial 37%
Industrial
Comercial 21%
Comercial
0 0,1 0,2 0,3 0,4 fr
Regular
Regular
Bueno
Bueno
Muy bueno
Muy bueno
Excelente
Excelente
Tabla 1.2.
Tabla 1.2.
Rubro de la PyME
Tabla 1.1.
Rubro de la PyME
Tabla 1.1.
f
6
5
4
3
2
1
0
En el grfico circular es necesario explicitar la frecuencia de cada valor
de la variable porque no es un grfico lineal como el de barras.
Variables cuantitativas
Para representar grficamente las variables cuantitativas se utiliz la infor-
macin de las tablas 1.4. a 1.9.
Grfico de bastones
Grfico de escalones
Histogramas de Pearson y polgonos de frecuencias
24
El ojo humano es ms efi-
ciente para reconocer
pequeas diferencias lineales que
para advertir diferencias angulares
o de reas, por lo que un grfico
lineal como el de barras no nece-
sita especificacin adicional.
%DADDELOSEMPLEADOSDE
Tabla 1.4.
LAEMPRESACOOPERATIVA
0
0,01
0,02
0,03
0,04
0,05
0,06
0,07
0,08
0,09
0,1
0,11
0,12
0,13
0,14
0,15
0,16
19 21 23 25 27 29 31 33 35 37 39 41 43 45 47 49 51 53 55 57 59 61 63 65
fr
Grfico de escalones
Insertar Imagen NG
%DADDELOSEMPLEADOSDELAEMPRESACOOPERATIVA
0
20
40
60
80
100
120
17192123252729313335373941434547495153555759616365
)
Tabla 1.4.
Desde la Biometra las contribu-
ciones de Karl Pearson a la teo-
ra estadstica son importantes
y numerosas. Fue cofundador en
1901 de la revista Biometrika que
se convirti en el receptculo de
todos los aportes a la estadsti-
ca provenientes de distintas cien-
cias y que se sigue publi-
cando hast a hoy.
Los grficos 1.8., 1.10. y 1.12. son histogramas, los 1.9. y 1.11. son polgo-
nos de frecuencias y en el 1.13. se combinan ambos.
Tanto el histograma como el polgono de frecuencias encierran la misma
rea, el rea es igual al total de los datos si se grafican las frecuencias
absolutas, uno si se trata de las frecuencias relativas y cien si es la f% la
representada.
Ojiva de Galton
25
Estadistica
Grfico 1.8. Grfico 1.9.
Edad de los empleados
f Tabla 1.6.
Edad al momento de la desaparicin
Tabla 1.8.
Gasto medio diario
Tabla 1.9.
Gasto medio diario
Tabla 1.9.
Edad al momento de la desaparicin
Tabla 1.8.
20
15
10
35
30
25
20
15
10
5
0
35
30
25
20
15
10
5
0
35
30
25
20
15
10
5
0
5
0
f
20
15
10
5
0
Tabla 1.6.
Edad de los empleados
15 20 25 30 35 40 45 50 55 60 65
5 10 15 20 25 30 35 40 45 50 55 60 65 70 75
15 25 35 45 55 65 75 85 95 15 25 35 45 55 65 75 85 95
El grfico de frecuencias acumu-
ladas Ojiva se debe a Francis Galton,
tambin bimetra y maestro de K.
Pearson; cofundador con
l de Biometrika.
Grficos para representar tablas de distribucin conjunta
Los siguientes grficos sirven para representar tablas del tipo de la tabla 1.11
en la que intervienen dos variables.
Grfico de barras adyacentes y grfico de barras segmentadas
Puede observarse que en el grfico de barras segmentadas se incluy
informacin sobre la frecuencia de cada segmento. Esto se debe a que
las comparaciones entre distintos segmentos son areales, no lineales, lo
mismo que ocurre con el grfico circular.
26
19
Edad acumulativa
Tabla 1.6.
Edad acumulativa
Tabla 1.8.
Gasto medio diario acumulativo
Tabla 1.9.
Grfico 1.16.
Rubro y puestos de trabajo de las PyMEs
Tabla 1.11.
Grfico 1.18.
Tabla 1.11.
Grfico 1.17.
100
120
100
80
60
40
20
0
120
100
80
60
40
20
0
15 25 35 45 55 65 75 85 95 105
f %
f %
f %
80
60
40
20
0
15 20 25 30 35 40 45 50 55 60 65 70
0 10 20 30 40 50 60 70
1
2
3
4
5
19
Edad acumulativa
Tabla 1.6.
Edad acumulativa
Tabla 1.8.
Gasto medio diario acumulativo
Tabla 1.9.
Grfico 1.16.
Tabla 1.11.
Grfico 1.18.
Tabla 1.11.
Grfico 1.17.
100
120
100
80
60
40
20
0
120
100
80
60
40
20
0
15 25 35 45 55 65 75 85 95 105
f %
f %
f %
80
60
40
20
0
15 20 25 30 35 40 45 50 55 60 65 70
0 10 20 30 40 50 60 70
1
2
3
4
5
Pirmides de poblacin
Una pirmide de poblacin es un grfico que se aplica a distribuciones bivariadas donde las
variables son sexo y edad, esta ltima organizada generalmente en intervalos.
La siguiente distribucin de frecuencias conjuntas corresponde a un grupo de 1000
personas,
Tabla 1.12.
La correspondiente pirmide de poblacin es
Grfico 1.19.
3.
Representar grficamente las variables de la ME 2.
27
Estadistica
Grco de barras adyacentes y grco de barras segmentadas
Insertar Imagen N G.1.18
Grco 1.17. Grco 1.18.
Puede observarse que en el grco de barras segmentadas se incluy informacin sobre la frecuencia de cada
segmento. Esto se debe a que las comparaciones entre distintos segmentos son areales, no lineales, lo mismo
que ocurre con el grco circular.
FIN DE LEER ATENTO
COMIENZO DE TEXTO APARTE
Pirmides de poblacin
Una pirmide de poblacin es un grco que se aplica a distribuciones bivariadas donde las variables son sexo y edad, esta
ltima organizada generalmente en intervalos.
La siguiente distribucin de frecuencias conjuntas corresponde a un grupo de 1000 personas
Tabla 1.12.
Sexo
Edades F M
[ 0 - 10) 120 90
[10 - 20) 100 90
[20 - 30) 90 70
[30 - 40) 80 50
[40 - 50) 70 30
[50 - 60) 50 30
[60 - 70) 40 20
[70 - 80) 20 10
[80 - 90) 20 7
[90 - 100) 10 3
Uonde lemenino: l y Masoulino: M.
21
FIN DE TEXTO APARTE
Representar graIicamente las variables de la ME 2.

FIN DE ACTIVIDAD
Las construcciones que acabamos de realizar distribucion de
Irecuencias, arreglo de datos ordenados y graIicos sobre el eje
numerico involucran cuatro espacios abstractos bien diIerenciados, el
HVSDFLR GH ORV YDORUHV (primera columna de la tabla de Irecuencias), el
HVSDFLR GH ODV IUHFXHQFLDV (las columnas de Irecuencias de la
distribucion), el HVSDFLRGHORVGDWRVRUGHQDGRV (el arreglo) y el HVSDFLR
GH ORV Q~PHURV UHDOHV (el eje horizontal de los graIicos hechos). Ellos
son los HVSDFLRV GH GHILQLFLyQ de las PHGLGDV HVWDGtVWLFDV, tambien
denominados LQGLFDGRUHV HVWDGtVWLFRV, y a las cuales nos dedicaremos
en el proximo apartado.
Los graIicos elaborados permiten tener una idea de conjunto
del grupo de datos relevados complementando la lectura de la
inIormacion que hacen los indicadores estadisticos. Su objetivo
principal es maximizar la extraccion de la inIormacion
contenida en los datos empiricos.
FIN DE LEER ATENTO
1.2. 0edidas esWadsWicas
Las medidas estadisticas son resumenes o LQGLFDGRUHV que permiten
caracterizar el comportamiento del grupo de datos en estudio.
MUJERES HOMBRES
%$!$
F
Las construcciones que acabamos de realizar distribucin de frecuencias,
arreglo de datos ordenados y grficos sobre el eje numrico involucran cua-
tro espacios abstractos bien diferenciados, el espacio de los valores (prime-
ra columna de la tabla de frecuencias), el espacio de las frecuencias (las
columnas de frecuencias de la distribucin), el espacio de los datos ordena-
dos (el arreglo) y el espacio de los nmeros reales (el eje horizontal de los gr-
ficos hechos). Ellos son los espacios de definicin de las medidas estadsti-
cas, tambin denominados indicadores estadsticos, y a las cuales nos
dedicaremos en el prximo apartado.
Los grficos elaborados permiten tener una idea de conjunto del grupo
de datos relevados complementando la lectura de la informacin que
hacen los indicadores estadsticos. Su objetivo principal es maximizar
la extraccin de la informacin contenida en los datos empricos.
1.2. Medidas estadsticas
Las medidas estadsticas son resmenes o indicadores que permiten carac-
terizar el comportamiento del grupo de datos en estudio. Segn el criterio de
diseo existen distintos tipos de medidas, las de posicin, las de dispersin
y las de intensidad.
1.2.1. Medidas de posicin
Las medidas de posicin determinan, con distintos criterios, ubicaciones un-
vocas en el conjunto de datos.
Moda o modo
Observando las distribuciones tratadas anteriormente notamos que sobresa-
le que predomina algn valor o categora o clase.
La moda o modo que denotaremos como Mo es el valor, categora o
clase que registra la frecuencia mayor en la distribucin de la variable.
En la variable rubro de las pymes (tabla 1.1. y grficos G.1.2. y G.1.4.) obser-
vamos que predomina la categora industrial.
En el nivel de terminacin de las piezas de plstico (tabla 1.2. y grfico
G.1.5.) no predomina ninguna categora de datos, no hay moda.
La edad de los empleados (tabla 1.4 y grfico G.1.7) ms frecuente es 37
aos.
En la tabla 1.6. y en el grfico G.1.8. empleados de una fbrica nota-
mos que la clase de edad franja etaria que tiene mayor frecuencia es [35
40] y repasando los datos sobre el arreglo concluimos que entre los emplea-
dos de la fbrica predominan las edades que van de 35 a 39 aos.
En la distribucin de la tabla 1.10. y en el grfico 1.12. se aprecian dos inter-
28
valos modales [25-35] y [35-45], que interpretamos volviendo nuevamente
a los datos de la siguiente manera: en la muestra predominan las familias
que tienen un gasto medio diario en alimentos de entre $26,80 y $34,65 y
entre $37,20 y $43,90. Como en esta distribucin los intervalos modales
resultaron ser adyacentes, con un criterio prctico puede tambin interpre-
tarse que en la muestra predominan las familias que tienen un gasto diario
medio en alimentos de entre $26,80 y $43,90.
En el caso de la tabla 1.8., la interpretacin del intervalo modal 20-25 no
puede hacerse sobre los datos originales porque no contamos con ellos (desde
la publicacin estudiantil, se entiende). Y decimos entonces que en el uni-
verso de las personas desaparecidas por la dictadura militar 1976-1983 en
la Argentina, la edad predominante al momento de la desaparicin forzada es
de entre 21 y 25 aos (aprovechando la informacin de la tabla 1.7. y los gr-
ficos 1.10. y 1.11.)
Es factible concluir que la moda es aplicable a cualquier tipo de variable?
Tanto en la tabla conjunta 1.11. como en el grfico G.1.17 se ve que en la
muestra de 24 pymes predominan las del rubro industrial que aumentaron los
puestos de trabajo entre 2001 y 2003.
Finalmente, en el caso de la tabla 1.12. predominan las mujeres que tie-
nen hasta 10 aos de edad. Adems, se observa que hay predominio de pobla-
cin joven y eso queda reflejado en el grfico G.1.19. (en las poblaciones
donde predominan las edades mayores la pirmide se vera invertida).
4.
a. Determinar la moda de las variables de la ME 2.
b. Determinar la moda de la distribucin conjunta de edad y sexo de
la tabla 1.12.
Media aritmtica o promedio
La media aritmtica, comnmente conocida como promedio, es una medida
que incumbe slo a las variables cuantitativas.
La media aritmtica representa, en el dominio de los nmeros reales, el
punto de equilibrio del conjunto de datos.
Vemos entonces que la edad promedio de los empleados de una cooperativa
que integran la muestra del caso 1, es de 38,9 aos. O que los 80 emplea-
dos seleccionados al azar entre todos los de una fbrica automotriz (caso 2)
tienen, en promedio, una edad de 37,4 aos.
Tambin, en la muestra de las 96 familias, el gasto medio diario en ali-
mentos es, en promedio, de $44,27 por familia.
29
Estadistica
El promedio se denota
con X si el grupo de datos
es una muestra y con si es toda
la poblacin.
Adems, de la forma ms popular de calcular la media sumando los valo-
res de todos los datos y dividiendo por el total surgen otras formas de cl-
culo ligadas al empleo de las tablas de frecuencias.
A modo de ejemplificacin se explicitan a continuacin dos formas de calcular uno de los
resultados expuestos anteriormente (edad promedio de los empleados de una cooperativa que
integran la muestra):
Si estuviramos en una situacin similar al caso 3, donde no se cuenta con
los datos, se podra calcular igualmente un promedio aproximado aplicando la
misma frmula 1.1. pero considerando como valores de la variable x
i
los pun-
tos medios de cada intervalo denominados a partir de aqu marca de clase.
Si se hace el clculo se tiene que la edad promedio de los desaparecidos
en Argentina por la ltima dictadura militar es de 28,09 aos aproximadamente.
5.
Determinar la media aritmtica de las variables cuantitativas de la ME 2.
Cul es la diferencia de calidad entre una media aritmtica calculada con
los datos y la calculada a partir del agrupamiento en intervalos de clase?
Mediana
Mediana es el lugar geomtrico del arreglo de datos ordenado que lo divide
en dos partes iguales.
30
23

Tanto en la tabla conjunta 1.11. como en el grfico G.1.17 se ve que en
la muestra de 24 pymes predominan las del rubro industrial que
aumentaron los puestos de trabajo entre 2001 y 2003.
Finalmente, en el caso de la Tabla 1.12. predominan las mujeres que
tienen hasta 10 aos de edad. Adems, se observa que hay predominio
de poblacin joven y eso queda reflejado en el grfico G.1.19. (en las
poblaciones donde predominan las edades mayores la pirmide se vera
invertida).

4.
a. Determinar la moda de las variables de la ME 2.
b. Determinar la moda de la distribucin conjunta de edad y sexo
de la Tabla 1.12.
FIN DE ACTIVIDAD

Media aritmtica o promedio

La media aritmtica, comnmente conocida como promedio es una
medida que incumbe slo a las variables cuantitativas.

COMIENZO DE PASTILLA EN
El promedio se denota con si el grupo de datos es una muestra y con si es toda la
poblacin.
FIN DE PASTILLA

La media aritmtica representa, en el dominio de los nmeros
reales, el punto de equilibrio del conjunto de datos.
FIN DE LEER ATENTO

Vemos entonces que la edad promedio de los empleados de una
cooperativa que integran la muestra del caso 1, es de 38,9 aos. O que
los 80 empleados seleccionados al azar entre todos los de una fbrica
automotriz (caso 2) tienen, en promedio, una edad de 37,4 aos.
Tambin, en la muestra de las 96 familias, el gasto medio diario en
alimentos es, en promedio, de $44,27 por familia.
Adems, de la forma ms popular de calcular la media sumando los
valores de todos los datos y dividiendo por el total surgen otras formas
de clculo ligadas al empleo de las tablas de frecuencias.

A modo de ejemplificacin se explicitan a continuacin dos formas de
calcular uno de los resultados expuestos anteriormente (edad promedio
de los empleados de una cooperativa que integran la muestra):

(1.1.)
En el arreglo ordenado de la variable nivel de detalles de terminacin de las
piezas plsticas ubicamos la posicin de la mediana,
y leemos la informacin que ella nos da de la siguiente manera: la mitad (infe-
rior) de las piezas de plstico como mximo tienen un nivel de detalle de ter-
minacin Bueno y la otra mitad (superior) tiene como mnimo un nivel de deta-
lle de terminacin Muy Bueno.
Si ahora determinamos la mediana sobre el arreglo de datos ordenado de
la variable edad de los empleados de la muestra de la empresa cooperativa,
leemos lo siguiente: la mitad de los empleados de la muestra tienen hasta 37
aos y la otra mitad desde 38 aos.
6.
Determinar e interpretar la mediana de todas las variables de la ME 2
que lo permitan.
En el caso de la variable edad de las personas desaparecidas, recordemos que
no se cuenta con los datos originales. Sin embargo, si es necesario contar
con algn valor tentativo que la aproxime y que permita extraer informacin de
forma similar a lo ya realizado, debe elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento de
datos en intervalos, primero debe localizarse el intervalo mediano el inter-
valo donde caera la mediana y luego para ese intervalo se aplica como cri-
terio alguna de las frmulas que siguen.
Donde: a es la amplitud de los intervalos, l
i
es el lmite inferior del intervalo
mediano, el subndice i de las frecuencias simples se refiere al intervalo media-
no y el (i-1) de las frecuencias acumuladas hace referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30] y
reemplazando valores:
31
Estadistica
Cul es la diferencia de calidad entre una media aritmtica calculada con los datos y la calculada a partir del
agrupamiento en intervalos de clase?
Mediana
Mediana es el lugar geomtrico del arreglo de datos ordenado que lo divide en dos partes iguales.
En el arreglo ordenado de la variable nivel de detalles de terminacin de las piezas plsticas ubicamos la posicin
de la mediana,
10 datos
Me
10 datos
y leemos la informacin que ella nos da de la siguiente manera: la mitad (inferior) de las piezas de plstico como
mximo tienen un nivel de detalle de terminacin Bueno y la otra mitad (superior) tiene como mnimo un nivel de
detalle de terminacin Muy Bueno.
Si ahora determinamos la mediana sobre el arreglo de datos ordenado de la variable edad de los empleados de la
muestra de la empresa cooperativa,
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me
leemos lo siguiente: la mitad de los empleados de la muestra tienen hasta 37 aos y la otra mitad desde 38 aos.
6.
Determinar e interpretar la mediana de todas las variables de la ME 2 que lo permitan.
FIN DE ACTIVIDAD
En el caso de la variable edad de las personas desaparecidas, recordemos que no se cuenta con los datos originales. Sin
embargo, si es necesario contar con algn valor tentativo que la aproxime y que permita extraer informacin de forma
similar a lo ya realizado, debe elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento de datos en intervalos, primero debe localizarse
el intervalo mediano el intervalo donde caera la mediana y luego para ese intervalo se aplica como criterio alguna
de las frmulas que siguen.
COMIENZO DE PASTILLA ENfrmulas
Estas frmulas pueden obtenerse rpida y sencillamente mediante interpolacin lineal.
FIN DE PASTILLA
i
es el lmite inferior del intervalo mediano, el subndice i de las frecuencias
simples se reere al intervalo mediano y el (i-1) de las frecuencias acumuladas hace referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30] y reemplazando valores:
El valor obtenido signica que la edad mxima aproximada al momento de la desaparicin forzada de la mitad de las
personas desaparecidas era de 25,99 aos.
EstadisticasU1.indd 22 8/26/09 6:33:19 PM
Cul es la diferencia de calidad entre una media aritmtica calculada con los datos y la calculada a partir del
agrupamiento en intervalos de clase?
Mediana
Mediana es el lugar geomtrico del arreglo de datos ordenado que lo divide en dos partes iguales.
En el arreglo ordenado de la variable nivel de detalles de terminacin de las piezas plsticas ubicamos la posicin
de la mediana,
10 datos
Me
10 datos
y leemos la informacin que ella nos da de la siguiente manera: la mitad (inferior) de las piezas de plstico como
mximo tienen un nivel de detalle de terminacin Bueno y la otra mitad (superior) tiene como mnimo un nivel de
detalle de terminacin Muy Bueno.
Si ahora determinamos la mediana sobre el arreglo de datos ordenado de la variable edad de los empleados de la
muestra de la empresa cooperativa,
21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me
leemos lo siguiente: la mitad de los empleados de la muestra tienen hasta 37 aos y la otra mitad desde 38 aos.
6.
Determinar e interpretar la mediana de todas las variables de la ME 2 que lo permitan.
FIN DE ACTIVIDAD
En el caso de la variable edad de las personas desaparecidas, recordemos que no se cuenta con los datos originales. Sin
embargo, si es necesario contar con algn valor tentativo que la aproxime y que permita extraer informacin de forma
similar a lo ya realizado, debe elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento de datos en intervalos, primero debe localizarse
el intervalo mediano el intervalo donde caera la mediana y luego para ese intervalo se aplica como criterio alguna
de las frmulas que siguen.
COMIENZO DE PASTILLA ENfrmulas
FIN DE PASTILLA
i
es el lmite inferior del intervalo mediano, el subndice i de las frecuencias
simples se reere al intervalo mediano y el (i-1) de las frecuencias acumuladas hace referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30] y reemplazando valores:
El valor obtenido signica que la edad mxima aproximada al momento de la desaparicin forzada de la mitad de las
personas desaparecidas era de 25,99 aos.
EstadisticasU1.indd 22 8/26/09 6:33:19 PM
25
Si ahora determinamos la mediana sobre el arreglo de datos ordenado
de la variable edad de los empleados de la muestra de la empresa
cooperativa,

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me

leemos lo siguiente: la mitad de los empleados de la muestra tienen
hasta 37 aos y la otra mitad desde 38 aos.

6.
Determinar e interpretar la mediana de todas las variables de la
ME 2 que lo permitan.
FIN DE ACTIVIDAD

En el caso de la variable edad de las personas desaparecidas,
recordemos que no se cuenta con los datos originales. Sin embargo, si es
necesario contar con algn valor tentativo que la aproxime y que
permita extraer informacin de forma similar a lo ya realizado, debe
elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento
de datos en intervalos, primero debe localizarse el intervalo mediano el
intervalo donde caera la mediana y luego para ese intervalo se aplica
como criterio alguna de las frmulas que siguen.

COMIENZO DE PASTILLA EN frmulas
FIN DE PASTILLA

Me = l
i
+ a
n
2
F
(i1)
f
i
= l
i
+ a
0, 5Fr
(i1)
fr
i
= l
i
+ a
50 F%
(i1)
f%
i

i
es el lmite inferior del
intervalo mediano, el subndice i de las frecuencias simples se refiere al
intervalo mediano y el (i-1) de las frecuencias acumuladas hace
referencia al intervalo anterior.
El intervalo mediano de las edades de los desaparecidos es [25; 30]
y reemplazando valores:

El valor obtenido significa que la edad mxima aproximada al momento
de la desaparicin forzada de la mitad de las personas desaparecidas era
de 25,99 aos.

Es posible determinar la mediana en cualquier tipo de variable?
25
Si ahora determinamos la mediana sobre el arreglo de datos ordenado
de la variable edad de los empleados de la muestra de la empresa
cooperativa,

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Me

leemos lo siguiente: la mitad de los empleados de la muestra tienen
hasta 37 aos y la otra mitad desde 38 aos.

6.
Determinar e interpretar la mediana de todas las variables de la
ME 2 que lo permitan.
FIN DE ACTIVIDAD

En el caso de la variable edad de las personas desaparecidas,
recordemos que no se cuenta con los datos originales. Sin embargo, si es
necesario contar con algn valor tentativo que la aproxime y que
permita extraer informacin de forma similar a lo ya realizado, debe
elegirse algn criterio para determinarla.
Para obtener la mediana si se cuenta solamente con un agrupamiento
de datos en intervalos, primero debe localizarse el intervalo mediano el
intervalo donde caera la mediana y luego para ese intervalo se aplica
como criterio alguna de las frmulas que siguen.

COMIENZO DE PASTILLA EN frmulas
FIN DE PASTILLA

Me = l
i
+ a
n
2
F
(i1)
f
i
= l
i
+ a
0, 5Fr
(i1)
fr
i
= l
i
+ a
50 F%
(i1)
f%
i

i
intervalo mediano, el subndice i de las frecuencias simples se refiere al
intervalo mediano y el (i-1) de las frecuencias acumuladas hace
El intervalo mediano de las edades de los desaparecidos es [25; 30]
y reemplazando valores:

El valor obtenido significa que la edad mxima aproximada al momento
de la desaparicin forzada de la mitad de las personas desaparecidas era
de 25,99 aos.

Estas frmulas pueden
obtenerse rpida y sen-
cillamente mediante interpolacin
lineal.
El valor obtenido significa que la edad mxima aproximada al momento de
la desaparicin forzada de la mitad de las personas desaparecidas era de
25,99 aos.
En las variables cuantitativas, las tres medidas de posicin vistas hasta
ahora modo, media aritmtica y mediana tambin se denominan medi-
das de tendencia central por su comportamiento en relacin con la zona
central de la distribucin. Si la distribucin de los datos es simtrica estas
tres medidas se posicionan geomtricamente en el mismo punto.
Anlisis de la asimetra estadstica de una distribucin
Los grficos que siguen permiten vizualizar los tipos de asimetras estadsti-
cas y sus denominaciones.
Grfico 1.20.
Observando la forma que adoptan los grficos G.1.6.; G.1.8.; G.1.10. y
G.1.12. de las distribuciones de las variables cuantitativas analizadas, se
puede notar tanto en el G.1.10. como en el G.1.12. que hay una clara asi-
metra en ambos casos hacia la derecha, porque en esa direccin es donde
se registran los valores ms alejados de la regin con mayor densidad de
datos. Sin embargo, no queda muy claro si existen asimetras en G.1.6 y G.1.8.
Las evidentes limitaciones del anlisis grfico obligan a encontrar alguna
forma analtica para el estudio de la asimetra de una distribucin, como la
de comparar las tres medidas de tendencia central aprovechando de ellas
su distinto comportamiento dinmico (concepto ste, que se aclarar ms
adelante).
32
26
En las variables cuantitativas, las tres medidas de posicion
vistas hasta ahora modo, media aritmetica y mediana
tambien se denominan medidas de tendencia central por su
comportamiento en relacion con la zona central de la
distribucion. Si la distribucion de los datos es simetrica estas
tres medidas se posicionan geometricamente en el mismo
punto.
FIN DE LEER ATENTO
Analisis de la asimetra estadstica de una distribucin
Los graIicos que siguen permiten vizualizar los tipos de asimetrias
estadisticas y sus denominaciones.
!SIMTRICAAIZQUIERDA 3IMTRICA !SIMTRICAADERECHA
Observando la 'Iorma que adoptan los graIicos G.1.6.; G.1.8.; G.1.10.
y G.1.12. de las distribuciones de las variables cuantitativas analizadas,
se puede notar tanto en el G.1.10. como en el G.1.12. que hay una clara
asimetria en ambos casos hacia la derecha, porque en esa direccion es
donde se registran los valores mas alejados de la region con mayor
densidad de datos. Sin embargo, no queda muy claro si existen
asimetrias en G.1.6 y G.1.8.
Las evidentes limitaciones del analisis graIico obligan a encontrar
alguna Iorma analitica para el estudio de la asimetria de una
distribucion, como la de comparar las tres medidas de tendencia central
aprovechando de ellas su distinto comportamiento dinamico (concepto
este, que se aclarara mas adelante).
$VLPpWULFDDL]TXLHUGD 6LPpWULFD $VLPpWULFDDGHUHFKD
Grfico 1.21.
Como el anlisis de asimetra se realiza en el dominio de los nmeros
reales se necesita contar con un nmero real para cada una de las tres
medidas de tendencia central.
La media por definicin es un nmero real, pero no as la moda
ni la mediana para las cuales hay que emplear alguna convencin que
permita asignarles un nmero real.
Estudiaremos analticamente la asimetra de la Edad de los empleados de la
empresa cooperativa (grfico G.1.6.).
Al modo puede asignrsele el nmero real 37 directamente porque, para
la variable en tratamiento, su valor es un nmero.
La marca de la mediana qued posicionada entre dos datos cuyos valores
son 37 y 38 y, si bien cualquier nmero real entre esos dos valores podra
representarla en el dominio de los nmeros reales, convenimos en usar de
aqu en ms el promedio entre ambos valores, en este caso 37,5.
Como la media aritmtica es un nmero real tal cual se la determin no
necesitamos aplicarle ninguna convencin para volcarla en el dominio de los
nmeros reales.
Entonces tenemos:
M
o
= 37 aos M
e
= 37,5 aos x = 38,9 aos
Resultando: Mo Me X
Como el valor del promedio es el ms alto, concluimos que hay una asimetra
hacia la derecha.
Las tres medidas de tendencia central tienen en el dominio de los
nmeros reales comportamientos dinmicos diferenciados.
El promedio es, de las tres, la medida ms sensible ante la pre-
sencia de valores muy alejados de la zona de mayor densidad, los cuales
la atraen rpidamente hacia ellos. Por esta particularidad la media es
determinante en el anlisis de la asimetra de una distribucin; si hay
asimetra hacia un lado (derecho o izquierdo), la media consecuente-
mente se desplaza en esa direccin.
La mediana, a la sazn sacada de su dominio natural el arreglo de
33
Estadistica
27
-E -O -O -E -O -E
Como HO DQiOLVLV GH DVLPHWUtD VH UHDOL]D HQ HO GRPLQLR GH ORV
Q~PHURVUHDOHV se necesita contar con un numero real para cada
una de las tres medidas de tendencia central.
La media por deIinicion es un numero real, pero no asi la
moda ni la mediana para las cuales hay que emplear alguna
convencion que permita asignarles un numero real.
FIN DE LEER ATENTO
Estudiaremos analiticamente la asimetria de la 'Edad de los empleados
de la empresa cooperativa (graIico G.1.6.)
Al modo puede asignarsele el numero real 37 directamente porque,
para la variable en tratamiento, su valor es un numero.
La marca de la mediana quedo posicionada entre dos datos cuyos
valores son 37 y 38 y, si bien cualquier numero real entre esos dos
valores podria representarla en el dominio de los numeros reales,
convenimos en usar de aqui en mas el promedio entre ambos valores, en
este caso 37,5.
Como la media aritmetica es un numero real tal cual se la
determino no necesitamos aplicarle ninguna convencion para volcarla
en el dominio de los numeros reales.
Entonces tenemos:
Mo 37 aos Me 37,5 aos 38,9 aos
Resultando:
Como el valor del promedio es el mas alto, concluimos que hay una
asimetria hacia la derecha.
Las tres medidas de tendencia central tienen en el dominio de
los numeros reales comportamientos dinamicos diIerenciados.
El promedio es, de las tres, la medida mas sensible ante la
presencia de valores muy alejados de la zona de mayor
densidad, los cuales la atraen rapidamente hacia ellos. Por esta
particularidad la media es determinante en el analisis de la
asimetria de una distribucion; si hay asimetria hacia un lado
-E-O
-E -O -O-E
!SIMTRICAAIZQUIERDA 3IMTRICA !SIMTRICAADERECHA
datos ordenados y transferida convencin mediante al de los nme-
ros reales, obviamente no tiene la misma sensibilidad que la media. Una
situacin parecida se da con la moda, quien es an ms insensible que
la mediana.
En anlisis de asimetra que presenten situaciones ambiguas o con-
fusas donde la ubicacin relativa de estas medidas no se encuadre en
algunos de los tres casos prescritos anteriormente, conviene descartar la
moda y slo comparar la mediana y la media aritmtica.
7.
a. Verificar analticamente la asimetra de las distribuciones corres-
pondientes a los grficos G.1.8.; G.1.10. y G.1.12.
b. Analizar qu tipo de asimetra presentan las variables cuantitativas
de la ME 2.
Cuartiles
Los cuartiles son tres lugares geomtricos del arreglo de datos ordenado que
lo dividen en cuatro partes iguales
Extendiendo el concepto aplicado para el posicionamiento de la mediana,
en el arreglo ordenado de la variable nivel de detalles de terminacin de las
piezas plsticas ubicamos los tres cuartiles,
y leemos la informacin que nos brindan de la siguiente manera: el cuarto de
las piezas con menor nivel de detalle de terminacin como mximo presenta
un nivel Regular, la mitad de las piezas de plstico a lo sumo posee un nivel
de detalle de terminacin Bueno y las tres cuartas partes de las piezas de
plstico tienen hasta un nivel de detalle de terminacin Muy Bueno.
La mitad central de los niveles de detalle de terminacin de las piezas se
encuentra entre Bueno y Muy Bueno. Esta informacin se extrae combinando
Q
1
y Q
3
.
8.
Determinar e interpretar los cuartiles de la variable Puestos de trabajo
2001-2003, de la matriz EM 3.
Para la variable edad de los empleados de la muestra de la empresa coo-
perativa la posicin de los cuartiles es:
34
28
(derecho o izquierdo), la media consecuentemente se
desplaza en esa direccin.
La mediana, a la sazn sacada de su dominio natural el
arreglo de datos ordenados y transferida convencin
mediante al de los nmeros reales, obviamente no tiene la
misma sensibilidad que la media. Una situacin parecida se da
con la moda, quien es an ms insensible que la mediana.
En anlisis de asimetra que presenten situaciones ambiguas
o confusas donde la ubicacin relativa de estas medidas no se
encuadre en algunos de los tres casos prescritos anteriormente,
conviene descartar la moda y slo comparar la mediana y la
media aritmtica.
FIN DE LEER ATENTO

7.
a. Verificar analticamente la asimetra de las distribuciones
correspondientes a los grficos G.1.8.; G.1.10. y G.1.12.
b. Analizar qu tipo de asimetra presentan las variables
cuantitativas de la ME 2.
FIN DE ACTIVIDAD

Cuartiles

Los cuartiles son tres lugares geomtricos del arreglo de datos ordenado
que lo dividen en cuatro partes iguales
Extendiendo el concepto aplicado para el posicionamiento de la
mediana, en el arreglo ordenado de la variable nivel de detalles de
terminacin de las piezas plsticas ubicamos los tres cuartiles,

5 datos Q
1
5 datos Q
2
= Me 5 datos Q
3
5 datos
1/4 1/4 1/4 1/4

y leemos la informacin que nos brindan de la siguiente manera: el
cuarto de las piezas con menor nivel de detalle de terminacin como
mximo presenta un nivel Regular, la mitad de las piezas de plstico a
lo sumo posee un nivel de detalle de terminacin Bueno y las tres
cuartas partes de las piezas de plstico tienen hasta un nivel de detalle
de terminacin Muy Bueno.
La mitad central de los niveles de detalle de terminacin de las
piezas se encuentra entre Bueno y Muy Bueno. Esta informacin se
extrae combinando Q
1
y Q
3
.

8.
Determinar e interpretar los cuartiles de la variable Puestos de
trabajo 2001-2003 , de la matriz EM 3.
Interpretando la informacin se tiene que el primer cuarto de los empleados
tiene a lo sumo 34 aos y las tres cuartas partes restantes como mnimo 36
aos. La mitad de los empleados de la muestra detenta hasta 37 aos y la
otra mitad desde 38 aos y que las tres cuartas partes de los empleados
ms jvenes como mximo tienen 40 aos y el cuarto de mayor edad como
mnimo cuenta con 42 aos de edad.
En el caso 3, Edad promedio de los desaparecidos en Argentina durante
la ltima dictadura, se procede de la misma manera que para el clculo de
la mediana, con las siguientes frmulas de interpolacin:
i
donde se encuentra el cuartil, el subndice i de las frecuencias simples se
refiere al intervalo del cuartil y el (i-1) de las frecuencias acumuladas hace
9.
Calcular e interpretar los cuartiles de la Edad de los desaparecidos en
Argentina por la ltima dictadura.
Fractiles y percentiles
Continuando con la idea de subdividir a la masa de datos en distintas partes
o fracciones iguales se tienen los fractiles, que pueden expresarse como per-
centiles usando un lenguaje de porcentajes en los casos que sea necesa-
rio hacer ms comprensible la informacin que suministran.
Fractiles son las m-1 marcas del arreglo de datos ordenado que lo dividen
en m partes iguales.
Un fractil determina el mximo de una cierta fraccin del conjunto de los
datos y consecuentemente, el mnimo de la fraccin restante.
Percentiles son los fractiles mismos, pero expresados en un lenguaje ms
amigable como es el de los porcentajes.
35
Estadistica
29
FIN DE ACTIVIDAD

Para la variable edad de los empleados de la muestra de la empresa
cooperativa la posicin de los cuartiles es:

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Q
1
Q
2
= Me Q
3

Interpretando la informacin se tiene que el primer cuarto de los
empleados tiene a lo sumo 34 aos y las tres cuartas partes restantes
como mnimo 36 aos. La mitad de los empleados de la muestra detenta
hasta 37 aos y la otra mitad desde 38 aos y que las tres cuartas partes
de los empleados ms jvenes como mximo tienen 40 aos y el cuarto
de mayor edad como mnimo cuenta con 42 aos de edad.
En el caso 3, Edad promedio de los desaparecidos en Argentina
durante la ltima dictadura , se procede de la misma manera que para el
clculo de la mediana, con las siguientes frmulas de interpolacin:

Q
2
= Me

i
intervalo donde se encuentra el cuartil, el subndice i de las
frecuencias simples se refiere al intervalo del cuartil y el (i-1) de las
frecuencias acumuladas hace referencia al intervalo anterior.

9.
Calcular e interpretar los cuartiles de la Edad de los
desaparecidos en Argentina por la ltima dictadura .
FIN DE ACTIVIDAD


Continuando con la idea de subdividir a la masa de datos en distintas
partes o fracciones iguales se tienen los fractiles, que pueden expresarse
como percentiles usando un lenguaje de porcentajes en los casos que
sea necesario hacer ms comprensible la informacin que suministran.
Fractiles son las m-1 marcas del arreglo de datos ordenado que lo
dividen en m partes iguales.
29
FIN DE ACTIVIDAD

Para la variable edad de los empleados de la muestra de la empresa
cooperativa la posicin de los cuartiles es:

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63
Q
1
Q
2
= Me Q
3

Interpretando la informacin se tiene que el primer cuarto de los
empleados tiene a lo sumo 34 aos y las tres cuartas partes restantes
como mnimo 36 aos. La mitad de los empleados de la muestra detenta
hasta 37 aos y la otra mitad desde 38 aos y que las tres cuartas partes
de los empleados ms jvenes como mximo tienen 40 aos y el cuarto
de mayor edad como mnimo cuenta con 42 aos de edad.
En el caso 3, Edad promedio de los desaparecidos en Argentina
durante la ltima dictadura , se procede de la misma manera que para el
clculo de la mediana, con las siguientes frmulas de interpolacin:

Q
2
= Me

i
intervalo donde se encuentra el cuartil, el subndice i de las
frecuencias simples se refiere al intervalo del cuartil y el (i-1) de las
frecuencias acumuladas hace referencia al intervalo anterior.

9.
Calcular e interpretar los cuartiles de la Edad de los
desaparecidos en Argentina por la ltima dictadura .
FIN DE ACTIVIDAD


Continuando con la idea de subdividir a la masa de datos en distintas
partes o fracciones iguales se tienen los fractiles, que pueden expresarse
como percentiles usando un lenguaje de porcentajes en los casos que
sea necesario hacer ms comprensible la informacin que suministran.
Fractiles son las m-1 marcas del arreglo de datos ordenado que lo
dividen en m partes iguales.
Retomando la variable edad de los trabajadores de la empresa cooperativa:
Explorando los datos observamos que el salto ms grande de edades se da
entre 42 y 48 aos, marcando esa posicin podemos ver que 16 de los 20
empleados tienen una edad mxima de 42 aos y los 4 restantes como mni-
mo 48 aos.
Esa marca que es el fractil 16/20 y se lee: la dieciseis veinteava parte
de los trabajadores tienen a lo sumo 42 aos conviene expresarla como per-
centil 80 (P
80
) y decir que el 80% de los trabajadores tienen hasta 42 aos.
O, que el 20% de los trabajadores tiene como mnimo 48 aos.
Para el mismo caso tambin podramos habernos preguntado cul es la
edad mxima del 80% de los empleados y la respuesta es 42 aos.
El uso de porcentajes, que es el lenguaje de los percentiles, puede intro-
ducir algunas inconsistencias al momento de producir informacin,
sobre todo cuando el conjunto de datos es pequeo.
10.
Determinar e interpretar algunos percentiles de la variable Puestos de
trabajo 2001-2003, de la matriz EM 3.
Si no se contara con los datos originales, como es el caso de la variable edad
de las personas al momento de la desaparicin forzada y se quisiera calcu-
lar algn percentil, en forma anloga a lo hecho con la mediana, se puede uti-
lizar la siguiente frmula de interpolacin:
Donde: k es el % de datos que el percentil deja hacia atrs (valores menores
a l), a es la amplitud de los intervalos, l
i
donde se encuentra el percentil, el subndice i de las frecuencias simples se
refiere al intervalo del percentil y el (i-1) de las frecuencias acumuladas hace
11.
a. Calcular la edad mxima del 90% de los desaparecidos en Argentina.
b. Qu porcentaje de personas tena hasta 32 aos al momento de desa-
parecer?
36
30
Un fractil determina el mximo de una cierta fraccin del conjunto
de los datos y consecuentemente, el mnimo de la fraccin restante.
Percentiles son los fractiles mismos, pero expresados en un lenguaje
ms amigable como es el de los porcentajes.
Retomando la variable edad de los trabajadores de la empresa
cooperativa,

21 25 28 30 34 36 36 37 37 37 38 39 39 40 40 42 48 51 57 63

Explorando los datos observamos que el salto ms grande de edades se
da entre 42 y 48 aos, marcando esa posicin podemos ver que 16 de
los 20 empleados tienen una edad mxima de 42 aos y los 4 restantes
como mnimo 48 aos.
Esa marca que es el fractil 16/20 y se lee: la dieciseis veinteava
parte de los trabajadores tienen a lo sumo 42 aos conviene expresarla
como percentil 80 (P
80
) y decir que el 80% de los trabajadores tienen
hasta 42 aos. O, que el 20% de los trabajadores tiene como mnimo 48
aos.
Para el mismo caso tambin podramos habernos preguntado cul es
la edad mxima del 80% de los empleados y la respuesta es 42 aos.

El uso de porcentajes, que es el lenguaje de los percentiles,
puede introducir algunas inconsistencias al momento de
producir informacin, sobre todo cuando el conjunto de datos
es pequeo.
FIN DE LEER ATENTO

10.
Determinar e interpretar algunos percentiles de la variable
Puestos de trabajo 2001-2003 , de la matriz EM 3.
FIN DE ACTIVIDAD

Si no se contara con los datos originales, como es el caso de la variable
edad de las personas al momento de la desaparicin forzada y se
quisiera calcular algn percentil, en forma anloga a lo hecho con la
mediana, se puede utilizar la siguiente frmula de interpolacin:

Donde: k es el % de datos que el percentil deja hacia atrs
(valores menores a l), a es la amplitud de los intervalos, l
i

es el lmite inferior del intervalo donde se encuentra el
percentil, el subndice i de las frecuencias simples se refiere
al intervalo del percentil y el (i-1) de las frecuencias
acumuladas hace referencia al intervalo anterior.

El grfico de caja y bigotes (box-and-whisker plots)
Este grfico suele llamarse usualmente box-plot, y es aplicable con exclusivi-
dad a los casos de variables cuantitativas en los que se cuenta con los datos.
El box-plot es un grfico delineado en el dominio de los nmeros reales y
que se basa en una caja construida con Q
1
y Q
3
como lmites que contie-
ne nominalmente al 50% central de los datos. El 50% nominal restante se
encuentra distribuido en partes iguales a ambos lados de la caja y los valo-
res comprendidos en l se representan con distintas simbologas.
El siguiente grfico, que corresponde a la edad de los empleados de la coo-
perativa, presenta todos los elementos (algunos auxiliares y otros definitivos)
con los que se construye un box-plot.
Grfico 1.22.
Las lneas continuas (horizontales) que se extienden a partir de Q
1
y Q
3
(con-
vertidos a nmeros reales mediante el mismo procedimiento que se us para
la mediana) son los bigotes y su finalidad es describir al conjunto de valores
llamados adyacentes, sin identificarlos individualmente. Por afuera de ellos
se ubican los valores externos (que aqu los representamos con un crculo) y
los lejanos (cuyo smbolo es un asterisco) ambos denominados tambin valo-
res raros (outliers) o atpicos para el grupo.
Las lneas auxiliares identificadas al pie como Vi y Ve se llaman vallas inte-
riores y exteriores, se encuentran respectivamente a una distancia de la caja
de una vez y media la medida de su base y de tres veces dicha medida, y se
usan como referencia para delimitar las zonas donde se encuentran los valo-
res atpicos.
A continuacin, se presentan los clculos ligados a la construccin del box-plot
de edad de los trabajadores de una cooperativa que integran una muestra.
Q
3
Q
1
= 41 35 = 6
Q
1
1,5(Q
3
Q
1
) = 35 9 = 26 y Q
3
+ 1,5(Q
3
Q
1
) = 41 + 9 = 50
Q
1
3(Q
3
Q
1
) = 35 18 = 17 y Q
3
+ 3(Q
3
Q
1
) = 41 + 18 = 59
El box-plot definitivo, libre de lneas auxiliares, queda como sigue
Grfico 1.23.
37
Estadistica
El box-and-whisker plot
fue diseado por John W.
Tukey y presentado en su libro
Exploratory data analysis de 1977,
aunque ya lo haba usado en papers
anteriores a esa fecha.
Cuando ambos cuartiles
quedan ubicados sobre
datos, no entre dos datos, los por-
centajes no llegan al 50%.
Existen otros criterios para esta-
blecer las distancias de las vallas
a la caja distintos al de Tukey, pero
ste es el ms usado.
Base:
Q
3
Q
1
Vallas interiores:
Q
1
1,5 . (Q
3
Q
1
) y
Q
3
+ 1,5. (Q
3
Q
1
)
Vallas exteriores:
Q
1
3 . (Q
3
Q
1
) y
Q
3
+ 3. (Q
3
Q
1
)
En el grfico G.1.23. puede observarse que en la cooperativa las edades de
21, 25, 51, 57 y, sobre todo, 63 aos son atpicas o raras para el grupo. Si
una distribucin de datos no tuviera valores atpicos entonces todos los que
estn fuera de la caja seran adyacentes por lo que los bigotes llegaran hasta
el mximo y el mnimo y se vera de la siguiente forma.
Grfico 1.24.
El box-plot precedente es el caso de la muestra de empleados de la fbrica
automotriz, en la cual no se detectan edades atpicas.
12.
Confeccionar y analizar los box-plot de las variables cuantitativas de la
EM 2.
En el siguiente grfico se presentan conjuntamente los dos box-plots realiza-
dos anteriormente para ejemplificar la comparacin de dos distribuciones de
datos bajo una misma variable.
Grfico 1.25.
Las siguientes son algunas lecturas que surgen de la comparacin.
En ambas distribuciones la mitad de los empleados tienen como mnimo
prcticamente la misma edad.
El 50% central de las edades de los empleados de la cooperativa es ms
concentrado que el 50% central de las edades de la fbrica automotriz.
Si bien una edad de 63 aos es rara en la muestra de la cooperativa, no
ocurre lo mismo en la muestra de la fbrica automotriz.
13.
Confeccionar en un mismo grfico, analizar y comparar los box-plots de
las variables participacin quincenal actual y participacin quince-
nal anterior de la ME 1.
38
El box-plot, en complemento con los dems grficos vistos, conforma
una herramienta visual que se puede utilizar para ilustrar la distribu-
cin, estudiar asimetras y sus colas, bosquejar supuestos sobre la dis-
tribucin y comparar distintas distribuciones.
1.2.2. Medidas de dispersin
Para describir completamente una distribucin de datos no basta con los indi-
cadores elaborados hasta el momento a travs de las medidas de posicin,
sino que adems es necesario tener una idea del grado de variabilidad de los
valores que esos datos toman.
Ese grado de variabilidad hablar de la variedad, de la diversidad de
valores en el conjunto de datos y para cuantificarlo surgen las medidas de
dispersin que se definen al igual que la media en el dominio de los nme-
ros reales, por lo que se aplican slo a las variables cuantitativas.
Las medidas de dispersin que se tratarn en este curso son el rango o
amplitud total, el rango intercuartlico, la varianza, el desvo estndar y, como
un caso de medida de dispersin relativa, el coeficiente de variacin.
Rango o amplitud total
El rango indica la longitud o extensin total de una distribucin de datos y se
calcula de la siguiente manera:
Rg = A
T
= x
mx
x
mn
Constituye una forma simple de determinar la dispersin de los datos de una
distribucin. Es una medida limitada porque explica la variabilidad a partir de
slo dos valores, sin tener en cuenta todos los valores intermedios entre los
extremos.
En la variable edad de los trabajadores de la muestra de la empresa coo-
perativa, el rango es:
Rg = 63 21 = 42 aos
Quiere decir que en una franja o amplitud de 42 aos se encuentra toda la
diversidad en cuanto a la edad de los trabajadores de la muestra de la coo-
perativa.
Rango intercuartlico
Esta medida expresa algo parecido a lo que representa el rango de toda la
distribucin con sus mismas limitaciones pero se refiere nicamente a los
datos centrales que, como ya se vio, quedan encerrados entre el primero y el
tercer cuartil.
d = Q
3
Q
1
39
Estadistica
Varianza y desvo estndar
La varianza es una medida que fue propuesta por Gauss y tiene en cuenta
todos los valores de los datos de la distribucin. Para su construccin se uti-
liza la media aritmtica como referencia para calcular las desviaciones (Xi )
del valor de cada uno de los datos respecto a ella.
En el grfico G.1.26. se observan algunas magnitudes y sentidos de estos
desvos respecto de la media:
Grfico 1.26.
El objetivo es elaborar una medida que sintetice al conjunto de todos los des-
vos y para calcularla podramos promediarlos contando as con un desvo
promedio.
Pero al momento de realizar ese promedio nos encontraramos con la dificul-
tad de que la suma de las desviaciones siempre da cero, como obvia conse-
cuencia de que la media es el centro de equilibrio de todos los desvos, es decir:
Para salvar este escollo el criterio que utiliz Gauss, y que lo hacemos nues-
tro, es promediar los cuadrados de las desviaciones. La medida as determi-
nada se denomina varianza.
Formalmente la varianza se expresa como
si el grupo de datos es una poblacin o
si el grupo de datos es una muestra.
El divisor N o el n-1, segn el caso, se llama grados de libertad. A este tpi-
co nos arrimaremos con ms detalle en estadstica inferencial.
Para la distribucin del gasto medio mensual en alimentos de la matriz
ME 2, la varianza muestral (recordemos que esas 32 viviendas son una mues-
tra extrada de un universo ms grande de viviendas del barrio) es:
S = 195.607,537 $
Recordando que la media es X= 1.227,25$, se aprecia que la magnitud
de la varianza es el cuadrado de la magnitud de la variable y esto complica las
40
Karl Friedrich Gauss en
Theora motus corporum
clestium, Hamgurgo (1809).
35
d Q
3
Q
1
Varianza y desvo estandar
La varianza es una medida que Iue propuesta por Gauss y tiene en
cuenta todos los valores de los datos de la distribucion. Para su
construccion se utiliza la media aritmetica como reIerencia para calcular
las desviaciones (Xi ) del valor de cada uno de los datos respecto a
ella.
COMENZO DE PASTLLA EN Gauss
Karl Friedrich Gauss en TheoUa PotuV FoUpoUuP FleVtiuP, Hamgurgo (1809).
FN DE PASTLLA
En el graIico G.1.26. se observan algunas magnitudes y sentidos de
estos desvios respecto de la media:
El objetivo es elaborar una medida que sintetice al conjunto de todos los
desvios y para calcularla podriamos promediarlos contando asi con un
desvio promedio.
Pero al momento de realizar ese promedio nos encontrariamos con la
diIicultad de que la suma de las desviaciones siempre da cero, como
obvia consecuencia de que la media es el centro de equilibrio de todos
los desvios, es decir que,
X
I
X
Para salvar este escollo el criterio que utilizo Gauss, y que lo hacemos
nuestro, es promediar los cuadrados de las desviaciones. La medida asi
determinada se denomina YDULDQ]D.
(x
i
X
Ii
N
si el grupo de datos es una poblacion o
3
(x
i
X
Ii
n -1
35
d Q
3
Q
1
Varianza y desvo estandar
La varianza es una medida que Iue propuesta por Gauss y tiene en
cuenta todos los valores de los datos de la distribucion. Para su
construccion se utiliza la media aritmetica como reIerencia para calcular
las desviaciones (Xi ) del valor de cada uno de los datos respecto a
ella.
COMENZO DE PASTLLA EN Gauss
Karl Friedrich Gauss en TheoUa PotuV FoUpoUuP FleVtiuP, Hamgurgo (1809).
FN DE PASTLLA
En el graIico G.1.26. se observan algunas magnitudes y sentidos de
estos desvios respecto de la media:
El objetivo es elaborar una medida que sintetice al conjunto de todos los
desvios y para calcularla podriamos promediarlos contando asi con un
desvio promedio.
Pero al momento de realizar ese promedio nos encontrariamos con la
diIicultad de que la suma de las desviaciones siempre da cero, como
obvia consecuencia de que la media es el centro de equilibrio de todos
los desvios, es decir que,
X
I
X
Para salvar este escollo el criterio que utilizo Gauss, y que lo hacemos
nuestro, es promediar los cuadrados de las desviaciones. La medida asi
determinada se denomina YDULDQ]D.
(x
i
X
Ii
N
si el grupo de datos es una poblacion o
3
(x
i
X
Ii
n -1
La media poblacional es una sola,
como tambin lo es la varianza
poblacional. En cambio hay tantas
medias muestrales como muestras
distintas se puedan extraer de la
poblacin; y tambin hay tantas
varianzas muestrales como medias
muestrales puedan obtenerse. Por
lo que una varianza muestral est
atada a una determinada media,
tiene un (1) condicionamiento que
no tena la poblacional. Ese condi-
cionamiento le resta (1)
un grado de libertad.
cosas al momento de interpretar esta medida de variabilidad. Para poder com-
patibilizar la magnitud de la dispersin con la magnitud de la variable, sim-
plemente le sacamos la raz cuadrada a la varianza, resultando una nueva
medida llamada desvo estndar.
Formalmente, el desvo se expresa como
Para el gasto mensual de los hogares encuestados el desvo estndar mues-
tral es: S = $422,28. Esta lectura absoluta aisladamente no suministra una
informacin muy clara sobre los alcances de la dispersin.
En una distribucin simtrica el desvo estndar describe un entorno
alrededor de la media que contiene aproximadamente las 2/3 partes (~
68%) de los datos.
Si se tuviera que el gasto mensual est distribudo simtricamente, slo podr-
amos hacer una interpretacin en el sentido de lo expuesto diciendo que apro-
ximadamente las dos terceras partes de las viviendas de la muestra tienen un
gasto mensual comprendido entre $804,97 y $1649,53 ($1227,25
$422,28).
Para ampliar el concepto anterior rescatamos los indicadores de los casos
1 y 2 de variables cuantitativas discretas donde, en ambos, la variable es
edad.
41
Estadistica
36

El divisor N o el n-1, segn el caso, se llama grados de libertad. A este
tpico nos arrimaremos con ms detalle en estadstica inferencial.

COMIENZO DE PASTILLA EN divisor
La media poblacional es una sola, como tambin lo es la varianza poblacional. En
cambio hay tantas medias muestrales como muestras distintas se puedan extraer de la
poblacin; y tambin hay tantas varianzas muestrales como medias muestrales
puedan obtenerse. Por lo que una varianza muestral est atada a una determinada
media, tiene un (1) condicionamiento que no tena la poblacional. Ese
condicionamiento le resta (1) un grado de libertad.
FIN DE PASTILLA

Para la distribucin del gasto medio mensual en alimentos de la
matriz ME 2, la varianza muestral (recordemos que esas 32 viviendas
son una muestra extrada de un universo ms grande de viviendas del
barrio) es:
S = 195.607,537 $
Recordando que la media es , se aprecia que la
magnitud de la varianza es el cuadrado de la magnitud de la variable y
esto complica las cosas al momento de interpretar esta medida de
variabilidad. Para poder compatibilizar la magnitud de la dispersin con
la magnitud de la variable, simplemente le sacamos la raz cuadrada a la
varianza, resultando una nueva medida llamada desvo estndar.

Formalmente, el desvo se expresa como

=
(x
i
x )
2
fi
N

S =
(x
i
x )
2
fi
n-1

Para el gasto mensual de los hogares encuestados el desvo estndar
muestral es: S = $422,28. Esta lectura absoluta, aisladamente no
suministra una informacin muy clara sobre los alcances de la
dispersin.

En una distribucin simtrica el desvo estndar describe un
entorno alrededor de la media que contiene aproximadamente las
2/3 partes (~ 68%) de los datos.
FIN DE LEER ATENTO

Si se tuviera que el gasto mensual est distribudo simtricamente, slo
podramos hacer una interpretacin en el sentido de lo expuesto
diciendo que aproximadamente las dos terceras partes de las viviendas
de la muestra tienen un gasto mensual comprendido entre $804,97 y
$1649,53 ($1227,25 $422,28).
donde, en ambos, la variable es edad.
Medidas
Caso 1: Ldad de los
trabajadores de una
empresa oooperativa"
Caso 2: Ldad de los empleados de una fabrioa
automotriz"
X
38,9 aos 37,4 aos
Me 37,5 aos 37 aos
Mo 37 aos 37,5 aos (maroa de olase del intervalo modal)
R 42 aos 49 aos
S
2
100,73 aos
2
127,56 aos
2
S 10,0 aos 11,3 aos
Asimetria a dereoha Casi simtrioa
2/3 de los oasos
aproximadamente
No se puede
Comprende las edades de 27 aos a 48 aos
(valores que oaen dentro del intervalo 37,4 | 11,3)
La utilidad de las medidas de dispersin aparece claramente cuando se comparan distintas distribuciones de datos
referidas a la misma variable.
FIN DE LEER ATENTO
Utilizando la informacin del cuadro anterior para comparar las distribuciones de edades de los grupos analizados,
notamos que todas las medidas de dispersin calculadas son mayores en el caso 2 respecto del caso 1. Esto estara
indicando que las edades de los empleados de la muestra de la fbrica automotriz estn ms dispersas que las edades de
los trabajadores de la muestra de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son similares, caracterstica que permiti comparar
sin problemas las medidas de dispersin. Si los grupos analizados no tuvieren similar promedio entonces la comparacin
de la dispersin de las distribuciones debera intentarse por otro camino.
Otro problema se presenta cuando se quieren comparar las dispersiones de variables distintas surgidas de un mismo
grupo de estudio.
Coeciente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de las distribuciones de variables que tienen
distinta magnitud.
Este coeciente puede utilizarse tambin para comparar variables de igual magnitud pero con promedios
signicativamente distintos.
Medidas
Cantidad de
ambientes
Cantidad de personas
ocupantes
Gasto medio
mensual
mayores con trabajo
S 1,26 amb. 0,94 pers. $421,23 0,98 pers.
3,34 amb. 3,12 pers. $1201,68 2,25 pers.
CV 0,3772 0,3013 0,3505 0,4355
Cv100 38,72 30,13 35,05 43,55
De la comparacin de los CV se concluye que el grupo de viviendas relevadas es ms compacto, ms homogneo,
menos disperso, en cuanto a la cantidad de personas ocupantes, porque tiene el menor de los coecientes calculados.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms heterogneo, ms disperso, menos compacto,
en cuanto a la cantidad de personas mayores con trabajo.
La utilidad de las medidas de dispersin aparece claramente cuando se
comparan distintas distribuciones de datos referidas a la misma variable.
Utilizando la informacin del cuadro anterior, para comparar las distribuciones
de edades de los grupos analizados, notamos que todas las medidas de dis-
persin calculadas son mayores en el caso 2 respecto del caso 1. Esto esta-
ra indicando que las edades de los empleados de la muestra de la fbrica auto-
motriz estn ms dispersas que las edades de los trabajadores de la muestra
de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son
similares, caracterstica que permiti comparar sin problemas las medidas de
dispersin. Si los grupos analizados no tuvieren similar promedio entonces la
comparacin de la dispersin de las distribuciones debera intentarse por otro
camino.
Otro problema se presenta cuando se quieren comparar las dispersiones
de variables distintas surgidas de un mismo grupo de estudio.
Coeficiente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de
las distribuciones de variables que tienen distinta magnitud.
Este coeficiente puede utilizarse tambin para comparar variables de igual
magnitud pero con promedios significativamente distintos.
Es en realidad una dispersin relativa no absoluta como el desvo estn-
dar y se calcula como el cociente entre el desvo estndar y la media.
Tambin se puede expresar en porcentajes
Compararemos todas las variables cuantitativas de la ME 2 calculando todos
los CV.
De la comparacin de los CV se concluye que el grupo de viviendas relevadas
es ms compacto, ms homogneo, menos disperso, en cuanto a la cantidad
de personas ocupantes, porque tiene el menor de los coeficientes calculados.
42
donde, en ambos, la variable es edad.
Medidas
Caso 1: Ldad de los
trabajadores de una
empresa oooperativa"
Caso 2: Ldad de los empleados de una fabrioa
automotriz"
38,9 aos 37,4 aos
Me 37,5 aos 37 aos
Mo 37 aos 37,5 aos (maroa de olase del intervalo modal)
R 42 aos 49 aos
S
2
100,73 aos
2
127,56 aos
2
S 10,0 aos 11,3 aos
Asimetria a dereoha Casi simtrioa
2/3 de los oasos
aproximadamente
No se puede
Comprende las edades de 27 aos a 48 aos
(valores que oaen dentro del intervalo 37,4 | 11,3)
La utilidad de las medidas de dispersin aparece claramente cuando se comparan distintas distribuciones de datos
referidas a la misma variable.
FIN DE LEER ATENTO
Utilizando la informacin del cuadro anterior para comparar las distribuciones de edades de los grupos analizados,
notamos que todas las medidas de dispersin calculadas son mayores en el caso 2 respecto del caso 1. Esto estara
indicando que las edades de los empleados de la muestra de la fbrica automotriz estn ms dispersas que las edades de
los trabajadores de la muestra de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son similares, caracterstica que permiti comparar
sin problemas las medidas de dispersin. Si los grupos analizados no tuvieren similar promedio entonces la comparacin
de la dispersin de las distribuciones debera intentarse por otro camino.
Otro problema se presenta cuando se quieren comparar las dispersiones de variables distintas surgidas de un mismo
grupo de estudio.
Coeciente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de las distribuciones de variables que tienen
distinta magnitud.
Este coeciente puede utilizarse tambin para comparar variables de igual magnitud pero con promedios
signicativamente distintos.
Medidas
Cantidad de
ambientes
ocupantes
Gasto medio
mensual
mayores con trabajo
S 1,26 amb. 0,94 pers. $421,23 0,98 pers.
X
3,34 amb. 3,12 pers. $1201,68 2,25 pers.
CV 0,3772 0,3013 0,3505 0,4355
Cv100 38,72 30,13 35,05 43,55
De la comparacin de los CV se concluye que el grupo de viviendas relevadas es ms compacto, ms homogneo,
menos disperso, en cuanto a la cantidad de personas ocupantes, porque tiene el menor de los coecientes calculados.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms heterogneo, ms disperso, menos compacto,
en cuanto a la cantidad de personas mayores con trabajo.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms
heterogneo, ms disperso, menos compacto, en cuanto a la cantidad de per-
sonas mayores con trabajo.
14.
Calcular las medidas de dispersin para todas las variables cuantitativas
de la ME 1 y hacer todas las comparaciones posibles.
1.2.3. Medidas de intensidad
Cotidianamente se utilizan indicadores socio-econmicos denominados tasas
para mostrar la incidencia relativa de algn valor de la variable o sus cambios
espacio-temporales. Esos indicadores son las medidas estadsticas de inten-
sidad y se expresan como coeficientes o como porcentajes.
Previo al tratamiento de estas medidas leemos el artculo periodstico que
sigue.
04 de Junio de 2005
NO CEDE EL DESEMPLEO DEL CONURBANO
Cordones sin reaccin
La cantidad de desocupados en los 28 centros urbanos encuestados por el Indec result de
1.369.000 personas durante el primer trimestre, de los cuales 677 mil estaban localizados en
los partidos del Gran Buenos Aires. Los datos surgen de la Encuesta Permanente de Hogares
del Indec publicados ayer, dos semanas despus de conocerse la tasa de desocupacin para el
perodo, del 13 por ciento. Los subocupados demandantes, es decir aquellos que no llegan a
completar la jornada laboral y estn buscando otro trabajo, suman otras 948 mil personas con
problemas de empleo. Las zonas urbanas del pas ms afectadas por el problema global de deso-
cupacin y subocupacin demandante resultaron, en el primer trimestre, el conurbano bona-
erense y el ncleo Gran Tucumn (ciudad capital y sus alrededores) Taf Viejo. El primero
sumaba 15,5 por ciento de desocupados ms 10,4 por ciento de subocupados demandantes;
el segundo, 14,2, ms 16,5 por ciento. La desocupacin, en los partidos del Gran Buenos Aires
fue superior a la del cuarto trimestre de 2004 en siete dcimas e idntica a la registrada en el
primer trimestre de ese mismo ao. Es decir que la regin muestra un estancamiento en la
recuperacin del empleo. En tanto, en el Gran Tucumn-Taf Viejo el dato ms preocupante
es el aumento de la subocupacin demandante, del 15,5 por ciento en el primer trimestre, con
un salto de 1,4 punto en la ltima medicin con respecto a la inmediata anterior y 2,3 puntos
cuando se la compara con la de un ao antes. Los otros grandes distritos urbanos (con ms de
500 mil habitantes) que registraron tasas de desocupacin por encima del promedio del pas
fueron el Gran Rosario, 14 por ciento, y el Gran La Plata, con el 13,5 por ciento. Entre los gran-
des aglomerados, la tasa ms baja de desocupacin corresponde al Gran Mendoza, con el 8 por
ciento, y entre las regiones a la Patagonia, con el 7,6 por ciento. Adems, en esta ltima regin,
la tasa de subocupacin demandante reflejada por el Indec es prcticamente insignificante, del
3,4 por ciento, en tanto en el Noroeste se eleva al 11,2 por ciento.
2000-2002 Pagina12/WEB Repblica Argentina
43
Estadistica
Del artculo anterior rescatamos la siguiente informacin referida al 2005:
la tasa de desocupacin para el Gran Rosario es del 14%;
hay 1,44 desocupados por cada subocupado demandante;
la desocupacin en los partidos del Gran Buenos Aires creci un 0,7% entre
el 4to. trimestre del 2004 y el 1er. trimestre de 2005.
Recrearemos las lecturas anteriores de la siguiente manera:
la proporcin de desocupados en el Gran Rosario es del 14%;
la relacin entre desocupacin y subocupacin es a razn de 1,44 deso-
cupados por cada subocupado demandante;
tomando como base de referencia (100%) el 4to. trimestre de 2004, el
ndice de desocupacin para el 1er. trimestre del 2005 es del 100,7%.
Proporcin
De las variables ya tratadas podemos decir, por ejemplo, que la proporcin de
pymes del rubro industrial es del 37,5%, o tambin que la proporcin de pie-
zas de plstico con un nivel de terminacin bueno o muy bueno es del 50%.
La proporcin mide el peso incidencia que tiene una o varias cate-
goras/valores de la variable en el conjunto total de datos.
La proporcin se calcula haciendo el cociente entre la frecuencia correspon-
diente a una categora o valor de la variable y el total de los datos.
En smbolos:
Si bien el resultado es un coeficiente comprendido entre 0 y 1, la proporcin
tambin se expresa en porcentajes (multiplicndola por 100).
Los clculos implcitos en el prrafo inicial son:
El primer ejemplo tiene en cuenta slo una categora de la variable por eso se
lo considera una proporcin simple y el segundo es una proporcin compuesta
porque interviene ms de una categora.
15.
a. Determinar e interpretar la proporcin de viviendas de 4 ambientes
de la ME 2.
b. Qu porcentaje de empleados estn al menos conformes con el fun-
44
cionamiento de la empresa cooperativa (ME 1)?
c. Cul es la proporcin de desaparecidos con una edad de entre 30 y
35 aos?
d. Identificar qu tipo de proporcin (simple o compuesta) es cada una
de las calculadas en los tems anteriores.
Razn
La razn, a diferencia de la proporcin, es un indicador que se obtiene calcu-
lando el cociente entre las frecuencias de valores distintos de una variable.
La razn mide el peso incidencia que tiene una o varias categor-
as/valores de la variable con respecto a otra u otras categoras/valores.
La razn entre A y B se calcula haciendo el cociente entre sus respectivas fre-
cuencias, siendo A y B valores/categoras o grupos de valores/categoras.
En smbolos:
Ejemplos
Por cada 1 vivienda de dos ambientes hay 1,6 viviendas de tres ambientes (o
tambin, en la muestra hay un 60% ms de viviendas con 3 ambientes que con
2 ambientes).
Por cada pieza que se fabrica con un nivel de terminacin regular hay dos pie-
zas con nivel bueno o muy bueno.
El primer ejemplo tiene en cuenta slo una categora de la variable en
ambos factores del cociente, por ello es una razn simple y el segundo es una
razn compuesta porque interviene ms de una categora en por lo menos
uno de los dos factores.
16.
a. Cul es la razn entre los empleados que estn conformes y los que
estn muy conformes con el funcionamiento de la empresa coope-
rativa? (ME 1).
b. Por cada trabajador mayor a 40 aos, cuntos hay de entre 30 y 40
aos? (ME 1).
c. Identificar qu tipo de razn (simple o compuesta) es cada una de las
calculadas en los tems anteriores.
45
Estadistica
Como en el caso de las
proporciones, las razo-
nes pueden ser simples o com-
puestas.
En las distribuciones bivariadas (tablas de doble entrada), son compuestas todas las tasas cal-
culadas a partir de las frecuencias conjuntas.
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo de las pymes
(ver tabla 1.10.) se puede observar que el 16,67% (4/24100) de las pymes de la muestra son
del rubro industrial y aumentaron los puestos de trabajo entre 2001 y 2003, o que por cada
pymes del rubro comercial que mantuvo hay 1,33 (4/3) industrial que aument sus puestos
de trabajo.
Nmeros ndice
Un nmero ndice mide las variaciones relativas de la ocurrencia de los valo-
res/categoras de una variable a travs de distintas situaciones espaciales o
temporales.
En smbolos:
Donde i indica una situacin espacial o temporal cualquiera y o indica la
situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores (ME 1)
que cobran actualmente ms de $750 respecto de los que cobraban tambin
ms de $750 en el perodo anterior, calculamos
El grupo de trabajadores que hoy tienen un salario quincenal superior a los
$750 es el 260% del grupo de trabajadores que en el perodo anterior tenan
tambin ms de $750 de salario quincenal. Es decir, que la cantidad de tra-
bajadores que hoy ganan ms de $750 aument un 160% con respecto a la
situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica automotriz
podemos comparar una determinada franja de edad, por ejemplo empleados
de entre 20 y 30 aos, haciendo
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de los
trabajadores de la fbrica. Es decir que hay un 75% menos de personas de 20
a 30 aos trabajando en la cooperativa que en la fbrica automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices gene-
rales de precios.
46
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE

Nmeros ndice

Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:

Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos

I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60

El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo

I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25

El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.

ndices de precios

Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
42
FIN DE TEXTO APARTE

Nmeros ndice

En smbolos:


I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60


I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25

automotriz.

ndices de precios

42
FIN DE TEXTO APARTE

Nmeros ndice

En smbolos:


I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60


I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25

automotriz.

ndices de precios

Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan redu-
cir a, digamos, tres (A, B y C) y que en dos aos distintos se relevaron los pre-
cios (p) y las cantidades (q) consumidas de cada uno de ellos:
Podemos analizar cmo evolucion el precio de cada uno de los productos,
haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 100 = 120,00%
El precio del producto C subi un 20,00% entre el 2003 y el 2004.
Para medir la evolucin del conjunto de precios de los tres productos necesi-
tamos contar con ndices compuestos.
Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los productos.
Para el ejemplo que estamos viendo, el clculo sera.
Los precios de los productos A, B y C subieron en conjunto un 6,46% entre los
aos 2003 y 2004.
Relativo de agregados no ponderados (o ndice de agregados no ponderados)
Se construye como cociente entre la sumatoria (agregacin) de los precios para
el ao 2004 y la sumatoria (agregacin) de los precios para el ao base 2003.
Los precios de los productos A, B y C bajaron en conjunto un 2,33% entre los
aos 2003 y 2004.
Relativo de agregados ponderados (o ndice de agregados ponderados)
Se construyen no solamente con los precios sino con algn otro elemento de pon-
deracin que permita darle un peso distinto a cada producto. Ese elemento
de ponderacin generalmente es la cantidad consumida de cada producto.
47
Estadistica
En realidad la canasta
familiar est integrada por
muchos productos. En este caso,
como recurso didctico, usamos
tres productos como representati-
vos de todos slo para reducir la
cantidad de clculos.
que hoy ganan ms de $750 aument un 160% con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica automotriz podemos comparar una determinada
franja de edad, por ejemplo empleados de entre 20 y 30 aos, haciendo
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de los trabajadores de la fbrica. Es decir que hay
un 75% menos de personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices generales de precios.
Convengamos que todos los productos de la canasta familiar se puedan reducir a, digamos, tres (A, B y C) y que en dos
aos distintos se relevaron los precios (p) y las cantidades (q) consumidas de cada uno de ellos:
Producto Precio 2003 Cantidad 2003 Precio 2004 Cantidad 2004
A $13 500 $15 550
B $25 280 $21 250
C $5 990 $6 1200
COMIENZO DE PASTILLA EN oanasta familiar
Ln realidad la oanasta familiar esta integrada por muohos produotos. Ln este oaso, oomo reourso didaotioo, usamos tres produotos oomo
representativos de todos solo para reduoir la oantidad de oaloulos.
FIN DE PASTILLA
Podemos analizar cmo evolucion el precio de cada uno de los productos, haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 = 100 = 115,38%
I
2004/2003
(B) = 21 / 25 = 100 = 84,00%
I
2004/2003
(C) = 6 / 5 = 100 = 120,00%
Para medir la evolucin del conjunto de precios de los tres productos necesitamos contar con ndices compuestos.
Es la media aritmtica de todos los ndices simples de todos los productos. Para el ejemplo que estamos viendo, el
clculo sera.
43

Convengamos que todos los productos de la canasta familiar se puedan
reducir a, digamos, tres (A, B y C) y que en dos aos distintos se
relevaron los precios (p) y las cantidades (q) consumidas de cada uno de
ellos:

Producto Precio 2003 Cantidad 2003 Precio 2004 Cantidad 2004
A $13 500 $15 550
B $25 280 $21 250
C $5 990 $6 1200

COMIENZO DE PASTILLA EN canasta familiar
En realidad la canasta familiar est integrada por muchos productos. En este caso,
como recurso didctico, usamos tres productos como representativos de todos slo
para reducir la cantidad de clculos.
FIN DE PASTILLA

Podemos analizar cmo evolucion el precio de cada uno de los
productos, haciendo tres ndices simples de precios.

I
2004/2003
(A) = 15 / 13 100 = 115,38%
I
2004/2003
(B) = 21 / 25 100 = 84,00%
I
2004/2003
(C) = 6 / 5 100 = 120,00%

Para medir la evolucin del conjunto de precios de los tres productos
necesitamos contar con ndices compuestos.

Es la media aritmtica de todos los ndices simples de todos los
productos. Para el ejemplo que estamos viendo, el clculo sera.

I
2004
2003
( A, B, C) =
I
2004
2003
( A) + I
2004
2003
(B) + I
2004
2003
(C)
3
=106, 46%
Los precios de los productos A, B y C subieron en conjunto un
6,46% entre los aos 2003 y 2004.

Relativo de agregados no ponderados (o ndice de agregados no
ponderados)
La cuestin que aparece a continuacin es decidir con qu cantidades
ponderar, las del ao tomado como base o las del ao para el que se hace
el estudio que convenimos en llamar ao dado.
Entre los criterios existentes, el de Laspeyres adopta, para ponderar las can-
tidades consumidas en el ao base, la siguiente manera:
Este es el criterio que utiliza el Sistema Estadstico Nacional (INDEC y Direc-
ciones Provinciales de Estadsticas) para la construccin de todos los ndices
generales de precios: ndice de Precios al consumidor (IPC), Sistema de ndi-
ces de precios mayoristas (SIPM) e ndice de costos de la construccin (ICC).
Para el ejemplo que estamos desarrollando, el clculo del ndice de pre-
cios segn el criterio de Laspeyres para el conjunto de los productos A, B,
C es:
Los precios de los productos A, B, C subieron en conjunto un 4,72% entre los
aos 2003 y 2004. Es decir que en 2004 esos productos fueron en conjunto
un 4,72% ms caros respecto del ao 2003.
Si esos tres productos fueran todos los de la canasta familiar, como esta-
mos simulando, las cantidades consumidas podran entrar en la frmula de Las-
peyres como porcentajes del total:
Esta estructura de ponderacin es la que usa el INDEC para publicar los ndi-
ces Generales de precios. El criterio de Paasche usa para ponderar las canti-
dades del ao dado.
Para los mismos productos y el mismo perodo, un ndice de precios elabora-
do con este criterio es:
48
Fue publicado en 1870
por el economista y esta-
dstico alemn Ernst Louis Etienne
Laspeyres.
La estructura de ponde-
racin actual del IPC asig-
na para Alimentos y bebidas: 31,29%,
Indumentaria: 5,18%, Vivienda:
12,68%, Equipamiento y manteni-
miento del hogar: 6,55%, Atencin
mdica y gastos para la salud:
10,04%, Transporte y comunica-
ciones: 16,96%, Esparcimiento:
8,67%, Educacin: 4,20%, Bienes
y servicios varios: 4,43%.
En este caso hay que contar con la informacin de las cantidades consumi-
das en el ao dado y para la elaboracin de ndices generales eso implica un
serio problema operativo. Este criterio puede usarse en trabajos locales, donde
se tengan planificados y asegurados los recursos y se pueda encarar la moda-
lidad operativa que requiere ese ndice.
Un tercer criterio, el de Fisher, combina las virtudes de los dos anteriores
mediante el empleo de la media geomtrica entre I
L
y I
P
, pero tambin carga
con las mismas limitaciones operativas de P.
Para los tres productos del ejemplo:
Uso de los nmeros ndices
Llamemos i, j a dos aos dados cualesquiera y o al ao base.
En las publicaciones, todos los ndices generales aparecen referidos a un
ao base por lo que se cuenta entonces con los ndices I
i/
o
y I
j/
o
.
Para algn uso especfico en el que necesitramos un ndice I
j/
o
que des-
criba la evolucin entre los aos i y j, utilizaremos las llamadas cadenas o
enlaces relativos.
Supongamos que el ndice compuesto de precios de varios productos fue de
120 en 2000 y de 129 en 2001, calculados ambos con base 1999, y quere-
mos saber cunto aument el nivel de precios entre 2000 y 2001. La res-
puesta es que el nivel de precios aument un 7,50 % (se calcula: 129 / 120
x 100 =107,50 %).
El ndice de precios al consumidor y el promedio de salarios por hora en cier-
tas industrias seleccionadas se encuentran en la tabla siguiente.
Analizaremos cmo evolucion el salario real de un empleado tipo en cada
una de las tres industrias seleccionadas, entre el ao base 1988 y el ao
1991.
Para este anlisis utilizaremos el IPC cuyo rol ser el de mover en el tiem-
po una magnitud econmica en este caso el salario y hacer comparaciones.
49
Estadistica
I
i
o
I
j
i
= I
j
o
I
j
i
=
I
j
o
I
i
o
Por ejemplo: representa el salario del ao 1988
8,67, Lduoaoion: 4,20, Bienes y servioios varios: 4,43.
FIN DE PASTILLA
El criterio de Paasche usa para ponderar las cantidades del ao dado.
Para los mismos productos y el mismo perodo, un ndice de precios elaborado con este criterio es:
En este caso hay que contar con la informacin de las cantidades consumidas en el ao dado y para la elaboracin
de ndices generales eso implica un serio problema operativo. Este criterio puede usarse en trabajos locales, donde se
tengan planicados y asegurados los recursos y se pueda encarar la modalidad operativa que requiere ese ndice.
Un tercer criterio, el de Fisher, combina las virtudes de los dos anteriores mediante el empleo de la media geomtrica
entre I
L
y I
P
, pero tambin carga con las mismas limitaciones operativas de P.

Para los tres productos del ejemplo:

Uso de los nmeros ndices
Llamemos i, j a dos aos dados cualesquiera y o al ao base.
En las publicaciones, todos los ndices generales aparecen referidos a un ao base por lo que se cuenta entonces con
los ndices y .
Para algn uso especco en el que necesitramos un ndice que describa la evolucin entre los aos i y j,
utilizaremos las llamadas cadenas o enlaces relativos.
Supongamos que el ndice compuesto de precios de varios productos fue de 120 en 2000 y de 129 en 2001, calculados
ambos con base 1999, y queremos saber cunto aument el nivel de precios entre 2000 y 2001. La respuesta es que el
nivel de precios aument un 7,50 % (se calcula: 129 / 120 x 100 =107,50 %).
El ndice de precios al consumidor y el promedio de salarios por hora en ciertas industrias seleccionadas se encuentran
en la tabla siguiente.
Salarios por hora (en $)
Ao IPC Servicios Comercio al menudeo Manufactura
1988
1989
1990
1991
100,0
109,6
113,6
117,1
7,17
8,18
8,81
9,49
5,50
5,95
6,06
6,60
8,48
9,37
9,37
10,01
Analizaremos cmo evolucion el salario real de un empleado tipo en cada una de las tres industrias seleccionadas,
entre el ao base 1988 y el ao 1991.
Para este anlisis utilizaremos el IPC cuyo rol ser el de mover en el tiempo una magnitud econmica en este caso
Cualquier ndice general utilizado con esta finalidad recibe el nombre de ndi-
ce deflactor.
trasladado al ao 1991, para un empleado del sector servicios. Este es el
valor del salario del ao 1988 corregido por el costo de la vida en el lapso
1988-1991.
Si comparamos el valor obtenido ($8,40) con el que realmente recibe en 1991
($9,49), vemos que su salario real aument un 12,98% (=9,49/8,40 x 100).
17.
Usando la informacin de la tabla anterior describir la evolucin del
salario del sector servicios entre 1989 y 1990.
Es posible concluir que las medidas de intensidad son aplicables a cual-
quier tipo de variable?
18.
Extraer todas las conclusiones posibles a partir de la lectura del texto
que se transcribe a continuacin y que es parte de un artculo publica-
do en el diario Pgina 12.
Todos los libros el libro
Por Gabriel D. Lerman
[] Segn estimaciones publicadas por el SINCA (Sistema de Infor-
macin Cultural de la Argentina), la cultura argentina constituye un
3% del PBI nacional, cifra que supera, por ejemplo, al sector de la mine-
ra. Ms 9100 millones de pesos producidos y ms 200 mil puestos de
trabajo generados componen un sector diverso, heterogneo, que sin
embargo se caracteriza por una alta concentracin econmica y geo-
grfica, que reproduce el ms feroz centralismo porteo.
La industria editorial ha sido por dcadas uno de los puntales de la cul-
tura argentina, punto de referencia para toda Amrica latina y el mundo
hispanoparlante. Hacia mediados de la dcada del setenta, el pas pro-
duca unos 50 millones de ejemplares al ao, cifra que diez aos ms
tarde haba cado a 17. En 1996 se produjeron 42 millones de libros, en
el 2000 se lleg a 74 millones y en el 2002, tras la crisis, la produccin
cay a la mitad. A partir de la devaluacin, Argentina recuper condi-
ciones favorables e inici una franca recuperacin: de 38 millones de
libros en 2003 se pas a 56 en 2004. En 2007, la industria editorial
argentina tuvo el record histrico de 93 millones de ejemplares impre-
sos []
[] Cerca del 75% de las editoriales se encuentra emplazada en la regin
metropolitana, mientras que el resto se ubica en los principales centros
urbanos. Si bien esto responde a la concentracin de la poblacin, hay
provincias que slo poseen una o dos editoriales que apenas sobreviven
con ayuda oficial.
50
I
i
o
I
j
i
= I
j
o
I
j
i
=
I
j
o
I
i
o
Se puede ver el art-
c u l o c o mp l e t o e n
www. p a g i n a 1 2 . c o m. a r ,
Suplemento Radar libros del
di ari o Pgi na 12, con fecha
22/03/2009.
[...] Tres de cada cuatro libros les corresponden a las grandes editoriales
[...]
[...] Argentina y Colombia lideran el comercio exterior de libros en Am-
rica del Sur.
[...] Segn la publicacin Nosotros y los otros, del Mercosur Cultural,
un 77% de los libros exportados por la regin sudamericana quedan en
el continente. Esto muestra una baja capacidad de penetracin en mer-
cados internacionales ms vigorosos, incluso Espaa, que adquiere slo
el 1,6% del total exportado. Por el contrario, si se miden las importa-
ciones se comprueba que slo el 41% proviene de los mismos pases,
mientras que las compras a Espaa trepan al 29% [...]
1.3. Matrices ejemplos
Las siguientes matrices corresponden a muestras representativas seleccio-
nadas de diferentes poblaciones objetivo de estudio, con distintos tipos de
unidades de observacin.
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada tra-
bajador es una unidad de observacin.
Referencias:
Nivel de especializacin: B: bajo, M: mediano, A: alto.
Conformidad con el funcionamiento de la empresa cooperativa: P: poco con-
forme, C: conforme, M: muy conforme.
Quincena actual: salario quincenal de los trabajadores (participacin quince-
nal en las ganancias de la cooperativa) en el mes en curso despus de haber-
se producido un incremento en las ventas.
Quincena anterior: salario quincenal de los trabajadores previo al incremento
de las ventas.
51
Estadistica
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada trabajador es una unidad de observacin.
ME 1-
Empleado edad sexo
Anti-
gedad
Especia-
lizacin
Confor-
midad
Quincena$
actual
Quincena$
anterior
1 34 M 1 B C 345 310
2 36 F 5 A M 950 810
3 51 M 7 M P 670 570
4 21 F 4 M C 810 730
5 37 F 0 M M 800 680
6 38 M 0 B P 500 450
7 39 F 9 B C 690 580
8 25 F 4 M M 840 715
9 36 M 3 M P 835 750
10 40 F 3 M P 735 660
11 63 F 5 A M 1550 1320
12 40 M 5 A M 850 730
13 39 F 0 B C 505 452
14 37 M 8 A M 1135 965
15 57 F 13 A M 1280 1100
16 30 F 2 M M 820 700
17 28 M 3 B C 480 410
18 48 F 1 M M 830 720
19 42 M 7 A P 1145 970
20 37 F 1 M M 775 698
Vivienda
Cant. de
ambientes
Mantenimiento
Personas
ocupantes
Gasto
medio
mensual
Personas
mayores con
trabajo
Hay nios
que trabajan?
1 3 B 3 780,50 1 N
2 2 M 3 1500,35 1 N
3 5 B 4 1200,05 2 N
4 3 B 2 986,65 1 N
5 4 R 3 2010,90 2 S
6 1 B 3 780 ,10 1 N
7 2 M 3 1452,25 3 N
8 4 E 2 1200,00 2 N
9 5 B 5 900,98 2 N
10 4 R 3 2010,09 3 N
11 3 B 3 891,75 2 N
12 4 M 3 1205,40 3 N
13 3 B 3 909,90 1 S
14 2 B 2 2010,10 2 N
15 4 M 3 899,50 3 N
16 2 B 2 780,00 2 N
17 4 R 5 1505,10 3 N
18 1 B 3 1224,69 3 N
19 2 M 3 890,70 3 N
20 4 E 3 780,50 2 S
21 5 B 3 1312,80 3 N
22 3 R 2 1219,40 2 N
23 4 B 5 986,20 4 N
24 4 R 3 2010,35 3 N
25 3 B 3 890,10 1 S
26 5 B 3 780,09 1 N
27 3 R 3 1510,69 3 N
28 6 B 2 1200,75 2 N
29 4 M 5 942,70 5 N
30 1 E 2 2010,00 1 S
31 4 B 3 890,40 2 N
32 3 R 5 780,80 3 N
Referencias
Matriz 2. Poblacin: viviendas de un determinado barrio donde cada vivienda
es la unidad de anlisis.
Referencias:
Mantenimiento o estado de mantenimiento: M: malo, R: regular, B: bueno, E:
excelente.
Gasto medio mensual en alimentos del grupo que vive en la vivienda en $.
Hay nios que trabajan?: S: s, N: no.
52
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada trabajador es una unidad de observacin.
ME 1-
Empleado edad sexo
Anti-
gedad
Especia-
lizacin
Confor-
midad
Quincena$
actual
Quincena$
anterior
1 34 M 1 B C 345 310
2 36 F 5 A M 950 810
3 51 M 7 M P 670 570
4 21 F 4 M C 810 730
5 37 F 0 M M 800 680
6 38 M 0 B P 500 450
7 39 F 9 B C 690 580
8 25 F 4 M M 840 715
9 36 M 3 M P 835 750
10 40 F 3 M P 735 660
11 63 F 5 A M 1550 1320
12 40 M 5 A M 850 730
13 39 F 0 B C 505 452
14 37 M 8 A M 1135 965
15 57 F 13 A M 1280 1100
16 30 F 2 M M 820 700
17 28 M 3 B C 480 410
18 48 F 1 M M 830 720
19 42 M 7 A P 1145 970
20 37 F 1 M M 775 698
Vivienda
Cant. de
ambientes
Mantenimiento
Personas
ocupantes
Gasto
medio
mensual
Personas
mayores con
trabajo
Hay nios
que trabajan?
1 3 B 3 780,50 1 N
2 2 M 3 1500,35 1 N
3 5 B 4 1200,05 2 N
4 3 B 2 986,65 1 N
5 4 R 3 2010,90 2 S
6 1 B 3 780 ,10 1 N
7 2 M 3 1452,25 3 N
8 4 E 2 1200,00 2 N
9 5 B 5 900,98 2 N
10 4 R 3 2010,09 3 N
11 3 B 3 891,75 2 N
12 4 M 3 1205,40 3 N
13 3 B 3 909,90 1 S
14 2 B 2 2010,10 2 N
15 4 M 3 899,50 3 N
16 2 B 2 780,00 2 N
17 4 R 5 1505,10 3 N
18 1 B 3 1224,69 3 N
19 2 M 3 890,70 3 N
20 4 E 3 780,50 2 S
21 5 B 3 1312,80 3 N
22 3 R 2 1219,40 2 N
23 4 B 5 986,20 4 N
24 4 R 3 2010,35 3 N
25 3 B 3 890,10 1 S
26 5 B 3 780,09 1 N
27 3 R 3 1510,69 3 N
28 6 B 2 1200,75 2 N
29 4 M 5 942,70 5 N
30 1 E 2 2010,00 1 S
31 4 B 3 890,40 2 N
32 3 R 5 780,80 3 N
Referencias
Matriz 3. Poblacin: pymes de la Repblica Argentina ao 2004/2005 donde
cada pyme es la unidad de estudio.
Referencias:
Tipo de pyme: R: recuperada, P: privada.
Rubro: A: agrcola, C: comercial, I: industrial, S: servicios.
Antigedad, en aos, al 2005.
Nivel de endeudamiento: N: ninguno, B: bajo, M: medio, A: alto, MA: muy alto.
Puestos de trabajo durante 2001-2003: D: disminuy, M: mantuvo, A: aument.
53
Estadistica
Mantenimiento o estado de mantenimiento: M: malo, R: regular, B: bueno, E: excelente
Gasto medio mensual en alimentos del grupo que vive em la vivienda em $
Hay nios que trabajan?: S: s, N: no
Matriz 3. Poblacin: pymes de la Repblica Argentina ao 2004/2005 donde cada pyme es la unidad de estudio.
ME 3-
PyME Tipo Rubro Antigedad
Endeu-
damiento
Cantidad de
Personal
Puestos de trabajo
2001-2003
1 P S 1 M 128 M
2 P I 6 M 150 D
3 R A 8 N 19 A
4 R C 4 M 170 M
5 P I 8 MA 112 M
6 P A 3 A 140 D
7 R I 10 B 20 A
8 P S 8 MA 23 D
9 P C 4 M 114 M
10 P A 0 MA 148 A
11 R A 2 M 154 A
12 P I 4 B 100 D
13 P C 5 MA 250 D
14 R I 6 A 142 A
15 P A 7 MA 105 M
16 R I 2 A 160 M
17 p C 9 M 22 M
18 R I 17 B 5 M
19 P S 11 M 120 D
20 R I 6 N 137 A
21 P I 7 M 80 D
22 P A 4 A 109 M
23 P C 25 MA 110 A
24 R S 11 B 144 A
Referencias:
Tipo de pyme: R: recuperada, P: privada.
Rubro: A: agrcola, C: comercial, I: industrial, S: servicios.
Antigedad, en aos, al 2005.
Nivel de endeudamiento: N: ninguno, B: bajo, M: medio, A: alto, MA: muy alto.
Puestos de trabajo durante 2001-2003: D: disminuy, M: mantuvo, A: aument.
Matriz 4. Poblacin: todas las piezas plsticas especiales fabricadas por una
determinada empresa, donde cada pieza es la unidad que se observa para su
estudio y anlisis.
Referencias:
Materia prima: N: nacional, I: importada.
Tiempo de fabricacin: tiempo, en das, que lleva de fabricada la pieza.
Nivel de detalles de terminacin: R: regular, B: bueno, MB: muy bueno, E: exce-
lente.
Tiene alguna caracterstica sealable?: S: s, N: no.
54
Matriz 4. Poblacin: todas las piezas plsticas especiales fabricadas por una determinada empresa, donde cada pieza es
la unidad que se observa para su estudio y anlisis.
ME 4
Pieza
Longitud
[cm]
Materia
prima
Tiempo de
Detalles
de
Peso
[gr]
Caracterstica
sealable
1 5,59 N 261 R 71,1 N
2 5,53 I 145 E 71,9 N
3 5,59 N 137 B 72,0 N
4 5,49 N 168 MB 70,5 S
5 5,50 I 150 MB 70,1 N
6 5,47 N 140 R 71,4 N
7 5,15 I 139 R 70,7 S
8 5,51 N 194 MB 71,5 N
9 5,54 N 93 B 71,7 S
10 5,49 I 39 MB 71,2 N
11 5,56 N 59 E 71,3 S
12 5,49 N 65 B 69,5 N
13 5,64 I 110 R 72,5 S
14 5,59 N 128 E 71,7 N
15 5,57 N 13 E 71,9 S
16 5,45 I 22 MB 70,9 N
17 5,30 N 113 R 64,1 S
18 5,46 I 81 B 70,3 S
19 5,55 N 79 E 67,1 N
20 5,61 N 11 B 72,1 N
Referencias
Materia prima: N: nacional, I: importada.
Tiempo de fabricacin: tiempo, en das, que lleva de fabricada la pieza.
Nivel de detalles de terminacin: R: regular, B: bueno, MB: muy bueno, E: excelente.
Tiene alguna caracterstica sealable?: S: s, N: no.
55
Probabilidad
Ob je ti vos
Desarrollar algunas herramientas bsicas para poder abordar con funda-
mento los problemas de la inferencia estadstica.
Sistematizar, organizar y cimentar los conceptos probabilsticos presentes
en la cultura cotidiana.
2.1. Elementos de la teora de probabilidad
En la presente Unidad trataremos conceptos de la teora de probabilidad por
ser sta la herramienta conceptual necesaria para abordar con fundamento los
problemas de la estadstica inferencial.
2.1.1. Experimento aleatorio
Comenzaremos leyendo el siguiente texto que fue extrado de la novela El jugador
de Fedor Dostoievsky.
[...] Las salas de juego estaban repletas de pblico. Cunta insolencia y cunta avidez! Me
abr paso entre la muchedumbre y me coloqu frente al propio croupier. Empec a jugar tmi-
damente, arriesgando cada vez dos, tres monedas. Entretanto, observaba. Tengo la impresin
de que el clculo previo vale para poco y, desde luego no tiene la importancia que le atribuyen
muchos jugadores: llevan papel rayado, anotan las jugadas, hacen cuentas, deducen las proba-
bilidades, calculan; por fin, apuestan y pierden. Igual que nosotros simples mortales, que juga-
mos sin clculo alguno. He llegado, sin embargo, a una conclusin, al parecer, justa: existe, en
efecto, si no un sistema, por lo menos cierto orden en la sucesin de probabilidades casuales, lo
cual es muy extrao. Suele ocurrir, por ejemplo, que tras las doce cifras centrales salgan las doce
ltimas. Cae, por ejemplo, dos veces en las doce ltimas y pasa a las doce primeras. De las doce
primeras, vuelve a las centrales: sale tres o cuatro veces seguidas y de nuevo pasa a las doce lti-
mas. Tras dos vueltas, cae sobre las primeras, que no salen ms de una vez, y las cifras centrales
salen sucesivamente tres veces. Esto se repite durante hora y media o dos horas. Uno, tres y dos;
uno, tres y dos. Resulta muy divertido. Hay das, maanas, en que el negro alterna con el rojo,
casi en constante desorden, de modo que ni el rojo ni el negro salen ms de dos o tres veces
seguidas. Al da siguiente, o a la misma tarde, sale el rojo hasta veinticinco veces sucesivas, y con-
tina as durante algn tiempo, a veces, durante todo el da [...].
2
Prrafo del captulo IV de
El jugador (1866), una de
las ms clebres y populares nove-
las de Fedor Dostoievsky, en gran
parte un relato autobiogrfico.
La bsqueda de las leyes que, supuestamente, gobiernan el azar no solo atrae
la concentracin de algn jugador empedernido, sino que domina permanen-
temente los clculos de casi todo el espectro cientfico desde en un rango
cronolgico la astronoma hasta la economa.
Lo que aparece claramente en el prrafo seleccionado es la observacin
del fenmeno que interesa estudiar la ruleta mediante series de frecuencias.
Cada vez que se realiza una jugada se est llevando a cabo un experimento
aleatorio o azaroso, por qu aleatorio? Porque no se puede predecir de ante-
mano el resultado que se va a obtener en esa jugada.
Existen muchos experimentos aleatorios fuera del juego, por ejemplo, podr-
amos anotar la edad de cada una de las personas que lee esta carpeta, cada
edad del conjunto de todas las edades anotadas puede ser un resultado del
experimento.
Podemos citar tambin como experimento aleatorio la observacin de la
ocurrencia del robo de un auto realizada por un actuario de seguros. Este
actuario podra anotar en funcin de resultados previos cuntos autos de una
determinada marca y modelo fueron robados entre todos los que existen en
el mercado y a partir de ello inducir si un nuevo auto cualquiera, elegido al
azar de ese modelo y marca, tiene alguna posibilidad de ser robado.
Tanto la jugada nica del jugador, como el aseguramiento de un auto cual-
quiera tomado al azar, constituyen experimentos aleatorios simples porque
involucran tomar un solo elemento al azar de una poblacin.
Tanto la avidez del jugador como la de la compaa de seguros nos llevan
a los experimentos aleatorios compuestos tomar ms de un elemento al
azar donde el jugador hara varias jugadas o la compaa asegurara varios
autos.
El proceso de tomar al azar uno o ms elementos de una determinada
poblacin es un experimento aleatorio.
Si se selecciona un solo elemento, referido a una variable, el experi-
mento es simple y si se seleccionan dos o ms elementos, referidos a esa
variable, el experimento aleatorio es compuesto porque es el resultado
de la repeticin de uno simple.
Por otro lado, si se selecciona un elemento al azar pero referido a dos
o ms variables conjuntamente resulta tambin un experimento aleato-
rio compuesto.
Cuando se seleccionan muestras aleatorias de tamao n de una poblacin se
estn realizando n experimentos aleatorios simples.
Espacio muestral
Denominamos espacio muestral (E) al conjunto de todos los resultados posi-
bles de un experimento aleatorio.
En el ejemplo del actuario nos interesa si al seleccionar un auto de esa
marca y modelo ste puede ser robado o no, entonces los resultados posi-
bles son: ser robado o no ser robado:
56
Experimento aleatorio,
probabilstico o estocs-
tico: es aquel donde no se puede
determinar a priori cul va a ser su
resultado.
E = {robado, no robado}
En una jugada de la ruleta los resultados posibles son:
E = {todos los nmeros de la ruleta} = {0, 1, 2, 3, ......... , 34, 35, 36}
En la siguiente tabla figuran distintos tipos de experimentos aleatorios y espa-
cios muestrales asociados a ellos.
Como puede apreciarse, los experimentos 1 y 3 son simples y el 2 es un expe-
rimento compuesto por repeticin de uno simple.
Para describir los elementos de un espacio muestral de un experimento
compuesto se puede recurrir a un diagrama denominado diagrama de rbol
donde cada una de las ramas representa a cada uno de los elementos com-
puestos del espacio muestral.
El diagrama de rbol (G.2.1.) correspondiente al segundo experimento es
Grfico 2.1. Diagrama de rbol
Suceso o evento aleatorio
Un suceso o evento aleatorio es cualquier subconjunto de un espacio
muestral.
57
Estadistica
Experimento aleatorio Espacio muestral
Si se tomara/n al azar: Se obtendran los siguientes resultados
1- Una pyme del grupo que gura en la matriz
ME 3 de la Unidad anterior y se examinara el
rubro al que pertenece.
E ={ A, C, I, S}
2- Dos empleados de la empresa cooperativa
de la matriz ME 1 y se observara el sexo al
que pertenece cada uno.
E={FF, FM, MF, MM}
3- Una vivienda entre las de la ME 2 y
se reexionara acerca de la cantidad de
ambientes que tiene.
E ={ 1, 2, 3, 4, 5}
Son ejemplos de sucesos aleatorios del Espacio muestral del experimento 3,
que la vivienda seleccionada tenga:
S
1
= {hasta 3 ambientes}
S
1
= {1, 2, 3}
S
2
= {1 ambiente}
S
2
= {1}
S
3
= {8 ambientes}
S
3
= { } =
S
4
= {hasta 5 ambientes}
S
4
= {1, 2, 3, 4, 5} = E
S
5
= {3 o 4 ambientes}
S
5
= {3, 4}
S
6
= {menos de 4 ambientes}
S
6
= {1, 2, 3}
S
7
= {ms de 3 ambientes}
S
7
= {4, 5}
Un suceso ocurrir si el resultado del experimento aleatorio es un ele-
mento de dicho suceso.
Si un suceso tiene un solo elemento (por ejemplo S
2
) se dice que es un suce-
so elemental.
Si los elementos de un suceso son todos los del espacio muestral (el suce-
so coincide con E como el S
4
) al suceso se lo denomina suceso cierto y ocu-
rre siempre al realizar el experimento.
Si un suceso no tiene elementos, es un conjunto vaco como el S
3
y se llama
suceso imposible. Este suceso no podra ocurrir al realizar el experimento.
Relaciones entre sucesos
Las relaciones ms destacables que se pueden establecer entre dos o ms
sucesos son: identidad, exclusin e independencia. Para ejemplificarlas usa-
remos los sucesos S
1
a S
7
.
Identidad
Dos o ms sucesos son idnticos cuando tienen los mismos elementos.
Considerando el suceso S
6
podemos notar claramente que es idntico al suce-
so S
1
.
58
Exclusin
Dos sucesos son mutuamente excluyentes cuando la ocurrencia de uno
excluye la ocurrencia del otro. Es decir, que no tienen elementos en
comn.
Por ejemplo, los sucesos S
2
y S
5
porque si ocurre S
2
no puede ocurrir S
5
y
viceversa, por lo tanto son mutuamente excluyentes.
Dos sucesos aleatorios son no excluyentes, caso S
5
y S
7
, cuando tienen
elementos en comn.
Un suceso est incluido en otro cuando todos sus elementos son parte de los
elementos del otro como en el caso del suceso S
2
que est contenido en S
1
.
El espacio muestral y los sucesos aleatorios pueden representarse median-
te un diagrama de Venn.
En los siguientes diagramas se visualizan las tres formas que puede adop-
tar la relacin de exclusin entre dos sucesos aleatorios.
Grfico 2.2.
Independencia
Dos sucesos son independientes cuando la ocurrencia de uno no condiciona
la ocurrencia del otro.
Observando el primer caso del grfico 2.2. donde los sucesos son mutua-
mente excluyentes si uno ocurriera, el otro nunca podra ocurrir. Eso implica
la total dependencia del segundo suceso respecto del primero, y viceversa.
Si dos sucesos son mutuamente excluyentes entonces son fuertemente
dependientes.
En el tercer diagrama, del mismo grfico, si ocurriese el suceso incluido nece-
sariamente el suceso incluyente ocurrir, por lo que ste tambin es fuerte-
mente dependiente de aqul.
59
Estadistica
Juan Venn (1834-1923).
Filsofo e historiador ingls.
Su obra de lgica ms original es
la Lgica del azar.
Si un suceso incluye a otro entonces es fuertemente dependiente del
suceso incluido.
En el caso de los sucesos no excluyentes, segunda forma del grfico, el an-
lisis de la independencia requiere de otras consideraciones que se irn incor-
porando paulatinamente. Pero s se puede afirmar que:
Si dos sucesos son independientes no son mutuamente excluyentes.
Operaciones entre sucesos
Las operaciones entre sucesos son las tres operaciones de Boole (unin, inter-
seccin y complemento) del lgebra de conjuntos ms la operacin diferencia.
Estas operaciones aplicadas a dos o ms sucesos aleatorios devuelven
siempre un nuevo suceso aleatorio.
Unin
La unin de dos sucesos S
i
y S
j
es un nuevo suceso (S
i
U S
j
) cuyos ele-
mentos pertenecen a alguno de los dos sucesos (a S
i
o a S
j
o a ambos).
Grfico 2.3.
Consideremos las siguientes uniones de sucesos aleatorios:
S
2
U S
5
= {1} U {3, 4} = {1, 3, 4}
S
7
U S
5
= {4, 5} U {3, 4} = {3, 4, 5}
S
1
U S
2
= {1, 2, 3} U {1} = {1, 2, 3}
60
Estudiadas sistemtica-
mente por el lgico irlan-
ds J. Boole (1815-1864) y aplica-
das al diseo de circuitos electrnicos
a partir de 1939 y a la telefona,
control automtico y computado-
ras en general hasta hoy.
Interseccin
La interseccin de dos sucesos S
i
y S
j
i
S
j
) cuyos
elementos pertenecen conjuntamente a ambos sucesos.
Grfico 2.4.
La interseccin de los sucesos S
7
y S
5
, con los que ya operamos, es:
S
7
I S
5
= {4, 5} I {3, 4} = {4}
El suceso S
7
I S
5
ocurrir s y solo s ocurrieran simultneamente los suce-
sos S
7
y S
5
.
1.
a. Realizar la interseccin entre los sucesos S
2
y S
5
.
b. Indicar qu tipo particular de suceso es la interseccin entre dos suce-
sos mutuamente excluyentes.
Complemento
El complemento de un suceso S es otro suceso cuyos elementos son todos
los elementos del espacio muestral que no pertenecen al suceso S.
Grfico 2.5.
El complemento del suceso S
1
es:
S {todos los elementos de E que no estn en S
1
} = {4, 5}
61
Estadistica
Diferencia
La diferencia entre dos sucesos S
i
y S
j
i
S
j
) cuyos
elementos pertenecen slo a S
i
.
Grfico 2.6.
Las siguientes diferencias entre sucesos son:
S
7
S
5
= {4, 5} {3, 4} = {5}
S
1
S
2
= {1, 2, 3} {1} = {2, 3}
2.
a. Determinar la diferencia entre los sucesos S
2
y S
5
.
b. Determinar el suceso resultante de la diferencia entre dos sucesos
mutuamente excluyentes.
2.1.2. Definiciones de probabilidad
Enunciaremos las definiciones de probabilidad teniendo en cuenta su formu-
lacin histrica.
Definicin clsica
La definicin clsica de probabilidad se debe a Pierre Simn de Laplace para
quien la teora del azar consiste en determinar el nmero de casos favorables
al acontecimiento cuya probabilidad se indaga. La razn de este nmero con
la de todos los casos posibles es la medida de la probabilidad, que no es ms
que una fraccin cuyo numerador es el nmero de casos favorables y cuyo
denominador es el nmero total de casos posibles.
Es decir:
cantidad de casos favorables
p =
cantidad de casos posibles
Apliquemos esta definicin a algn suceso en la jugada de la ruleta, por ejem-
plo, si nos interesa que en la prxima tirada de la ruleta salga par.
62
Essai philosophique sur
les probabilits (1814).
Pierre Simn de Laplace (1749-
1827), astrnomo y matemtico
francs. Otras obras: Mecnica
Celeste y El sistema del mundo.
El espacio muestral es:
E = {todos los nmeros de la ruleta}
E = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,
21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31. 32, 33, 34, 35, 36}
y el suceso o evento de inters es:
S = {que salga par}
S = {2, 4, 6, 8, 10, 12, 14, 16, 18 , 20, 22, 24, 26, 28, 30, 32, 34, 36}
P(S) = P(par) = 18 / 37 = 0,4865
Definicin frecuencial
Richard E. von Mises propuso la siguiente definicin de probabilidad frecuen-
cial en 1919.
R TT La probabilidad de un suceso cualquiera es [...] el Valor Lmite de la
Frecuencia Relativa... Esta es la razn del nmero de casos en que el atributo a
sido hallado al nmero total de observaciones [...] TTR
Es decir:
p = f r
Supongamos que el actuario ha recabado informacin sobre una cantidad
grande de autos asegurados y que de ellos el 15% sufri algn robo. El actua-
rio con ese dato puede calcular la probabilidad del suceso S: el auto asegu-
rado no sera robado.
P(S) = P( no robado) = 85/100 = 0,85
2.1.3. Axiomatizacin de la probabilidad
La Teora de la Probabilidad fue estructurada algebraicamente a partir de 1930
por matemticos de la escuela ruso-francesa, dentro de una teora especial
de la medida de conjuntos. Esa teora de la medida nos permitira hablar de
la probabilidad de un suceso aleatorio, como la medida de su ocurrencia.
Su utilidad reside en entregar al clculo de probabilidades una herramien-
ta algebraica, es decir, un conjunto de operaciones y maneras de operar con
probabilidades.
Su cuerpo principal consiste en tres axiomas y un grupo de propiedades
(teoremas).
63
Estadistica
Matemtico y filsofo aus-
traco (1883-1953).
Tomado de su l i bro
Probabilidad, Estadstica
y Verdad (1928).
Los r ef er ent es ms
i mportantes de esta
escuela son: A. N. Kolmogoroff, F.
Cantelli, E. Borel y otros.
Recordar que los axiomas
son proposiciones intui-
tivas aceptadas sin demostracin
y que a partir de ellos pueden dedu-
cirse las propiedades (teoremas).
Supongamos que el actuario ha recabado informacin sobre una cantidad grande de autos asegurados y que de ellos
el 15% sufri algn robo. El actuario con ese dato puede calcular la probabilidad del suceso S: el auto asegurado no
sera robado.
P(S) = P( no robado) = 85/100 = 0,85

La Teora de la Probabilidad fue estructurada algebraicamente a partir de 1930 por matemticos de la escuela ruso-
francesa, dentro de una teora especial de la medida de conjuntos. Esa teora de la medida nos permitira hablar de la
probabilidad de un suceso aleatorio, como la medida de su ocurrencia.
COMIENZO DE PASTILLA EN escuela ruso-francesa
Los referentes ms importantes de esta escuela son: A. N. Kolmogoroff, F. Cantelli, E. Borel y otros.
FIN DE PASTILLA
Su utilidad reside en entregar al clculo de probabilidades una herramienta algebraica, es decir, un conjunto de
operaciones y maneras de operar con probabilidades.
Su cuerpo principal consiste en tres axiomas y un grupo de propiedades (teoremas).
COMIENZO DE PASTILLA EN axiomas
Recordar que los axiomas son proposiciones intuitivas aceptadas sin demostracin y que a partir de ellos pueden deducirse las propiedades
(teoremas).
FIN DE PASTILLA
Axiomas
A.1. P (S) * 0
la probabilidad de un suceso aleatorio S es un
nmero no negativo.
A.2. P(E) = 1
la probabilidad del espacio muestral E es 1.
A.3. S
i
! S
j
= entonces
P(S
i
, S
j
) = P (S
i
) + P(S
j
)
la probabilidad de la unin de dos sucesos
aleatorios S
i
y S
j
mutuamente excluyentes es la
suma de sus respectivas probabilidades.

Propiedades
P.1. 0 ) P(S) ) 1
Se deduce combinando A.1. y A.2.
P.2. P( ) = 1 P(S)
P.3. P() = 0
Se deduce de A.3. y considerando que es el complemento de E
P.4. P(S
i
, S
j
) = P (S
i
) + P(S
j
) P(S
i
! S
j
)
Se deduce de A.3. y de considerar a cada uno de los sucesos como unin de partes
3.
Demostrar la P.4. utilizando la sugerencia dada.
FIN DE ACTIVIDAD
3.
2.1.4. Tipos de probabilidad
Hay tres tipos de probabilidad de que ocurra un suceso aleatorio, a saber: pro-
babilidad total, probabilidad conjunta o compuesta y probabilidad condicional
Probabilidad total
Se denomina probabilidad total a la probabilidad del suceso resultante de la
unin de dos o ms sucesos cualesquiera.
Las probabilidades de los sucesos vistos en el subapartado 2.1.2. que el
auto asegurado no sea robado y que salga un nmero par en la jugada de
la ruleta son ejemplos de probabilidad total.
El suceso que el auto asegurado no sea robado es un suceso elemen-
tal, en cambio el suceso que salga un nmero par en la jugada de la ruleta
resulta de la unin de los sucesos elementales {2}, {4}, {6}, {8},......, {30},
{32},{34},{36} o sea,
P(sea par) = P({2}U{4}U {6}U{8}U......U{30}U{32}U{34}U{36})
P(sea par) = P(2) + P(4) + P(6) + P(8) +...+ P(30) + P(32) + P(34) + P(36) =
1/37 + 1/37 + 1/37 +.+ 1/37 + 1/37 = 18 .1/ 37 = 18/37
El clculo realizado se basa en el tercer axioma y supone la equiprobabilidad
de cada uno de los resultados de la jugada de la ruleta.
Probabilidad condicional
Supongamos que un estudio contable que recin se inicia debe presentar ante
un organismo oficial dos declaraciones juradas (DDJJ) tomadas al azar entre
sus 10 clientes. Entre ellos, tres son grandes contribuyentes (G) y el resto
monotributistas (M).
El espacio muestral E = {GG, GM, MG, MM} puede obtenerse a partir del
diagrama de rbol del grfico 2.7. en el que se incluyen las probabilidades
totales correspondientes a la primera seleccin
64
Supongamos que el actuario ha recabado informacin sobre una cantidad grande de autos asegurados y que de ellos
el 15% sufri algn robo. El actuario con ese dato puede calcular la probabilidad del suceso S: el auto asegurado no
sera robado.
P(S) = P( no robado) = 85/100 = 0,85

La Teora de la Probabilidad fue estructurada algebraicamente a partir de 1930 por matemticos de la escuela ruso-
francesa, dentro de una teora especial de la medida de conjuntos. Esa teora de la medida nos permitira hablar de la
probabilidad de un suceso aleatorio, como la medida de su ocurrencia.
COMIENZO DE PASTILLA EN escuela ruso-francesa
Los referentes ms importantes de esta escuela son: A. N. Kolmogoroff, F. Cantelli, E. Borel y otros.
FIN DE PASTILLA
Su utilidad reside en entregar al clculo de probabilidades una herramienta algebraica, es decir, un conjunto de
operaciones y maneras de operar con probabilidades.
Su cuerpo principal consiste en tres axiomas y un grupo de propiedades (teoremas).
COMIENZO DE PASTILLA EN axiomas
Recordar que los axiomas son proposiciones intuitivas aceptadas sin demostracin y que a partir de ellos pueden deducirse las propiedades
(teoremas).
FIN DE PASTILLA
Axiomas
A.1. P (S) * 0
la probabilidad de un suceso aleatorio S es un
nmero no negativo.
A.2. P(E) = 1
la probabilidad del espacio muestral E es 1.
A.3. S
i
! S
j
= entonces
P(S
i
, S
j
) = P (S
i
) + P(S
j
)
la probabilidad de la unin de dos sucesos
aleatorios S
i
y S
j
mutuamente excluyentes es la
suma de sus respectivas probabilidades.

Propiedades
P.1. 0 ) P(S) ) 1
P.2. P( S ) = 1 P(S)
P.3. P() = 0
Se deduce de A.3. y considerando que es el complemento de E
P.4. P(S
i
, S
j
) = P (S
i
) + P(S
j
) P(S
i
! S
j
)
Se deduce de A.3. y de considerar a cada uno de los sucesos como unin de partes
3.
FIN DE ACTIVIDAD
Se entiende por equipro-
babilidad, en el sentido
expresado por Laplace, a la igual-
dad de oportunidad que tiene cada
uno de los resultados elementales
de una poblacin para ser selec-
cionado durante la realizacin de
un experimento aleatorio.
Es decir, por ejemplo, que hay una probabilidad de 0,3 probabilidad total
de que la primera declaracin jurada seleccionada corresponda a un gran
contribuyente.
A continuacin, completaremos el diagrama agregando las probabilidades
de los resultados de la segunda seleccin de una declaracin teniendo en
cuenta que en la segunda instancia el conjunto de DDJJ va a contar con un ele-
mento menos cambiando tambin su composicin.
Si nos interesara, por ejemplo, la probabilidad de que la segunda declaracin
jurada extrada sea de un monotributista tendramos dos respuestas posibles
(7/9 y 6/9) dependiendo de cul haya sido el resultado de la primera selec-
cin. Es decir, que la segunda seleccin est sujeta o condicionada a lo que
ocurri en la primera. Las probabilidades consignadas al lado de cada resul-
tado de la segunda extraccin son probabilidades condicionales.
La probabilidad condicional mide la ocurrencia de un suceso B si hubie-
ra ocurrido el suceso A y se expresa P(B/A), donde A es el suceso con-
dicin y el smbolo / es una notacin (no una operacin).
Las probabilidades condicionales consignadas en el rbol son:
P(G/G) = 2/9 = 0,2222 P(G/M) = 7/9 = 0,7778
P(M/G) = 3/9 = 0,3333 P(M/M) = 6/9 = 0,6667
65
Estadistica
La notacin P(B/A) se
debe al economista ingls
J. M. Keynes (1883 1946) en su
Tratado sobre las probabilidades
(1933).
La primera se lee: 0,2222 es la probabilidad de que en la segunda seleccin
la Declaracin Jurada sea de un gran contribuyente si (dado que, tal que,
sabiendo que) la primera hubiera sido tambin de un gran contribuyente.
Probabilidad conjunta o compuesta
Las probabilidades de cada uno de los sucesos del espacio muestral se deno-
minan probabilidades compuestas y miden la probabilidad de ocurrencia con-
junta o simultnea de dos resultados particulares en ambas selecciones.
Convenimos en:
P(GG) = P(primero G y segundo G) = P(G
1
I G
2
) = P(G I G)
La probabilidad compuesta o conjunta es la probabilidad de que ocu-
rran simultneamente dos o ms sucesos.
Utilizando la definicin de Laplace (casos favorables/casos posibles) la pro-
babilidad del suceso GG resulta :
donde la cantidad de casos posibles resulta de contar todas las combinacio-
nes de diez DDJJ (al momento de la primera seleccin) por nueve DDJJ (en la
segunda instancia), y la cantidad de casos favorables tambin resulta de la
combinacin de 3 G (primera vez) por 2 G (segunda vez).
Relacionando con las probabilidades del rbol resulta finalmente:
Generalizando para dos sucesos cualesquiera A y B:
P(A I B) = P(A). P(B/A)
La probabilidad compuesta entre dos sucesos A y B resulta de la multi-
plicacin de la probabilidad total del suceso condicin A por la proba-
bilidad condicional de B tal que A.
Conclusiones
Dados dos sucesos A y B de un espacio muestral de un experimento aleato-
rio con probabilidades no nulas, a partir de lo visto, se pueden deducir las
siguientes proposiciones:
66
Los experimentos aleatorios compuestos por repeticin de uno simple son el
mecanismo bsico para la confeccin de muestras en una poblacin.
Otro tipo de experimentos compuestos sirven al estudio de la asociacin
y/o relacin causa efecto entre variables y son los experimentos compuestos
bivariados.
Experimento bivariado
Como ejemplo para el tratamiento de la probabilidad en experimentos biva-
riados analizaremos un caso particular como medio para la generalizacin.
Con la finalidad de pronosticar el estado del trnsito en funcin de la ocu-
rrencia de embotellamiento a partir de la existencia de un accidente en una
autopista en determinada franja horaria, se relevaron datos histricos obte-
nindose la siguiente informacin: el 20% de los automviles que circulan por
esa autopista en el horario estudiado tuvieron algn tipo de accidente; el 95%
de las veces en que ocurri un accidente se produjo un embotellamiento y
cuando no hubo accidente ocurri un embotellamiento el 15% de las veces.
Notamos que podramos identificar la ocurrencia de un accidente como
causa y el embotellamiento como un efecto.
En el diagrama de rbol del grfico 2.9. se ilustra la informacin:
67
Estadistica
Donde las probabilidades que se tienen son:
A partir de estas probabilidades pueden calcularse las probabilidades conjuntas:
Con las probabilidades totales de las causas y las conjuntas armamos una
tabla conjunta de probabilidades o tabla de contingencias.
En la que adems aparecen calculadas las probabilidades totales de los efec-
tos Embotellamiento y No embotellamiento.
Por su ubicacin en la tabla de contingencia, a las probabilidades totales
se las suele denominar tambin probabilidades marginales.
A partir de la tabla de contingencias pueden calcularse las siguientes pro-
babilidades condicionales de las causas a partir de los efectos:
68
Los experimentos aleatorios compuestos por repeticin de uno simple son el mecanismo bsico para la confeccin de
muestras en una poblacin.
Otro tipo de experimentos compuestos sirven al estudio de la asociacin y/o relacin causa efecto entre variables y
son los experimentos compuestos bivariados.
Como ejemplo para el tratamiento de la probabilidad en experimentos bivariados analizaremos un caso particular
como medio para la generalizacin.
Con la nalidad de pronosticar el estado del trnsito en funcin de la ocurrencia de embotellamiento a partir de la
existencia de un accidente en una autopista en determinada franja horaria, se relevaron datos histricos obtenindose
la siguiente informacin: el 20% de los automviles que circulan por esa autopista en el horario estudiado tuvieron
algn tipo de accidente; el 95% de las veces en que ocurri un accidente se produjo un embotellamiento y cuando no
hubo accidente ocurri un embotellamiento el 15% de las veces.
Notamos que podramos identicar la ocurrencia de un accidente como causa y el embotellamiento como un efecto.
En el diagrama de rbol del grco 2.9. se ilustra la informacin:
0,85
total de Accidente P(A) = 0,20
total de No accidente
P( A) = 0,80
condicional de Embotellamiento tal que Accidente P(E/A) = 0,95
condicional de No embotellamiento tal que Accidente
P( E /A) = 0,05
condicional de Embotellamiento tal que No accidente
P(E/ A) = 0,15
condicional de No embotellamiento tal que No accidente
P( E / A) = 0,85
A partir de estas probabilidades pueden calcularse las probabilidades conjuntas
de Accidente y Embotellamiento P(AEE) = 0,19
de Accidente y No embotellamiento
P(AE ) = 0,01
de No accidente y Embotellamiento P( EE) = 0,12
de No accidente y No embotellamiento
P( E ) = 0,68
Los experimentos aleatorios compuestos por repeticin de uno simple son el mecanismo bsico para la confeccin de
muestras en una poblacin.
Otro tipo de experimentos compuestos sirven al estudio de la asociacin y/o relacin causa efecto entre variables y
son los experimentos compuestos bivariados.
Como ejemplo para el tratamiento de la probabilidad en experimentos bivariados analizaremos un caso particular
como medio para la generalizacin.
Con la nalidad de pronosticar el estado del trnsito en funcin de la ocurrencia de embotellamiento a partir de la
existencia de un accidente en una autopista en determinada franja horaria, se relevaron datos histricos obtenindose
la siguiente informacin: el 20% de los automviles que circulan por esa autopista en el horario estudiado tuvieron
algn tipo de accidente; el 95% de las veces en que ocurri un accidente se produjo un embotellamiento y cuando no
hubo accidente ocurri un embotellamiento el 15% de las veces.
Notamos que podramos identicar la ocurrencia de un accidente como causa y el embotellamiento como un efecto.
En el diagrama de rbol del grco 2.9. se ilustra la informacin:
0,85
total de Accidente P(A) = 0,20
total de No accidente
P( ) = 0,80
condicional de Embotellamiento tal que Accidente P(E/A) = 0,95
condicional de No embotellamiento tal que Accidente
P( /A) = 0,05
condicional de Embotellamiento tal que No accidente
P(E/ ) = 0,15
condicional de No embotellamiento tal que No accidente
P( / ) = 0,85
A partir de estas probabilidades pueden calcularse las probabilidades conjuntas
de Accidente y Embotellamiento P(AEE) = 0,19
de Accidente y No embotellamiento
P(AEE ) = 0,01
de No accidente y Embotellamiento P( AEE) = 0,12
de No accidente y No embotellamiento
P( AEE ) = 0,68
Con las probabilidades totales de las causas y las conjuntas armamos una tabla conjunta de probabilidades o tabla de
contingencias.
E
E
Total
A 0,19 0,01 0,20
A
0,12 0,68 0,80
Total 0,31 0,69 1
En la que adems aparecen calculadas las probabilidades totales de los efectos Embotellamiento y No
embotellamiento.
Por su ubicacin en la tabla de contingencia, a las probabilidades totales se las suele denominar tambin probabilidades
marginales.
A partir de la tabla de contingencias pueden calcularse las siguientes probabilidades condicionales de las causas a
partir de los efectos
Accidente tal que Embotellamiento P(A/E) = 0,19/0,31 = 0,6129
Accidente tal que No embotellamiento
P(A/ ) = 0,01/0,69 = 0,0145
No accidente tal que Embotellamiento
P( /E) = 0,12/0,31 = 0,0039
No accidente tal que No embotellamiento
P( / ) = 0,68/0,69 = 0,9855
Las probabilidades calculadas se denominan probabilidades bayesianas o probabilidades condicionales de la causas y se
formalizan mediante el teorema de Bayes
COMIENZO DE PASTILLA EN Bayes
En 1764, despus de la muerte de Thomas Bayes (1702-1761), se public An essay formars solving a problem in the doctrine of chances,
una memoria en la que aparece, por vez primera, la determinacin de la probabilidad de las causas a partir de los efectos que han podido ser
observados.
FIN DE PASTILLA
Dado el suceso B (efecto) de un espacio muestral E y una particin de n sucesos A
i
(causas) de dicho espacio, la
probabilidad de que ocurra el suceso A
i
si ocurriera el suceso B es:
donde P(B) es la probabilidad total del suceso condicin y P(B) & 0.
Para A
j
cualquier suceso del conjunto de los A
i
con i = 1, 2n
4.
Considerando la tabla conjunta 1.11. del subapartado 1.1.2. de la Unidad anterior referida al rubro y evolucin
de los puestos de trabajo de las pymes, calcular una probabilidad de cada uno de los tipos vistos e interpretarla.
FIN DE ACTIVIDAD
Con las probabilidades totales de las causas y las conjuntas armamos una tabla conjunta de probabilidades o tabla de
contingencias.
E Total
A 0,19 0,01 0,20
0,12 0,68 0,80
Total 0,31 0,69 1
En la que adems aparecen calculadas las probabilidades totales de los efectos Embotellamiento y No
embotellamiento.
Por su ubicacin en la tabla de contingencia, a las probabilidades totales se las suele denominar tambin probabilidades
marginales.
A partir de la tabla de contingencias pueden calcularse las siguientes probabilidades condicionales de las causas a
partir de los efectos
Accidente tal que Embotellamiento P(A/E) = 0,19/0,31 = 0,6129
Accidente tal que No embotellamiento
P(A/ E ) = 0,01/0,69 = 0,0145
No accidente tal que Embotellamiento
P( A/E) = 0,12/0,31 = 0,0039
No accidente tal que No embotellamiento
P( A/ E ) = 0,68/0,69 = 0,9855
Las probabilidades calculadas se denominan probabilidades bayesianas o probabilidades condicionales de la causas y se
formalizan mediante el teorema de Bayes
COMIENZO DE PASTILLA EN Bayes
En 1764, despus de la muerte de Thomas Bayes (1702-1761), se public An essay formars solving a problem in the doctrine of chances,
una memoria en la que aparece, por vez primera, la determinacin de la probabilidad de las causas a partir de los efectos que han podido ser
observados.
FIN DE PASTILLA
Dado el suceso B (efecto) de un espacio muestral E y una particin de n sucesos A
i
(causas) de dicho espacio, la
probabilidad de que ocurra el suceso A
i
donde P(B) es la probabilidad total del suceso condicin y P(B) & 0.
Para A
j
i
con i = 1, 2n
4.
Considerando la tabla conjunta 1.11. del subapartado 1.1.2. de la Unidad anterior referida al rubro y evolucin
de los puestos de trabajo de las pymes, calcular una probabilidad de cada uno de los tipos vistos e interpretarla.
FIN DE ACTIVIDAD
Las probabilidades calculadas se denominan probabilidades bayesianas o pro-
babilidades condicionales de la causas y se formalizan mediante el teorema
de Bayes.
Dado el suceso B (efecto) de un espacio muestral E y una particin de n
sucesos A
i
(causas) de dicho espacio, la probabilidad de que ocurra el suce-
so A
i
donde P(B) es la probabilidad total del suceso condicin y P(B) 0.
Para A
j
i
con i = 1, 2n
4.
Considerando la tabla conjunta 1.11. del subapartado 1.1.2. de la Uni-
dad anterior referida al rubro y evolucin de los puestos de trabajo de
las pymes, calcular una probabilidad de cada uno de los tipos vistos e
interpretarla.
2.2. Variable aleatoria
Una variable aleatoria asigna valores numricos, del conjunto de los nmeros
reales, a los sucesos definidos en el espacio muestral asociado a un experi-
mento aleatorio.
En caso de que el espacio muestral de un experimento aleatorio tenga una
cantidad finita o infinita numerable de elementos, es decir, que permite algn
mecanismo de conteo, la variable aleatoria diseada ser una variable alea-
toria discreta.
En caso de que el experimento aleatorio involucre algn tipo de medicin,
cuyos resultados pertenecen a regiones del conjunto de los nmeros reales
donde es clara la imposibilidad de conteo, la variable aleatoria es de natura-
leza continua y por ello se la denomina variable aleatoria continua.
Se denomina variable aleatoria a una funcin del espacio muestral sobre
el espacio de los nmeros reales.
2.2.1. Variable aleatoria discreta
Las variables aleatorias discretas son funciones del espacio muestral sobre
el subconjunto de los enteros.
Disearemos una variable aleatoria discreta para el ejemplo del estudio
contable utilizado en el subapartado 2.1.4. (probabilidad condicional).
69
Estadistica
En 1764, despus de la
muerte de Thomas Bayes
(1702-1761), se public An essay
formars solving a problem in the
doctrine of chances, una memo-
ria en la que aparece, por vez pri-
mera, la determinacin de la pro-
babilidad de las causas a partir
de los efectos que han podido ser
observados.
Recordemos que el espacio muestral es: E = {GG, GM, MG, MM}
La variable aleatoria de diseo que elegimos es:
X: cantidad de DDJJ de clientes monotributistas entre las dos seleccionadas
La variable aleatoria X recorrer los valores enteros entre 0 y 2, donde 0 sig-
nifica que ninguna de las dos DDJJ corresponderan a monotributistas y 2 que
ambas declaraciones sean de monotributistas.
El recorrido de X es R(X) = {0, 1, 2}
Calculamos la probabilidad para cada valor r del recorrido de X obteniendo as
los valores de la denominada funcin de probabilidad h(r). Siendo h(r) = P(X = r)
h (0) = P( X= 0 M) = P(GG) = 6/90
h (1) = P( X= 1 M) = P(G, M) + P(MG) = 21/90 + 21/90 = 42/ 90
h (2) = P( X= 2 M) = P(MM) = 42/90
Confeccionamos a continuacin la tabla (T.2.1.) de distribucin de probabilidades.
T.2.1.
Donde F(r) es la funcin de distribucin acumulativa o simplemente funcin de
distribucin. Siendo F(r) = P(x r).
h(r) es una funcin de probabilidad de una variable aleatoria discre-
ta X s y slo si para todo elemento r del R(X) se cumplen las siguien-
tes propiedades que se desprenden de los dos primeros axiomas de
probabilidad.
h(r) 0
h(r) = 1
Un grfico adecuado para la funcin de probabilidad h(r) es el de bastones y
para la funcin de distribucin es el de escalones, ambos vistos en el suba-
partado 1.1.3. de la Unidad 1.
70
Al momento de disear
una variable aleatoria dis-
creta debe optarse por alguna de
las categoras involucradas en el
problema para la cual la variable
har el conteo. En nuestro caso,
podra haberse optado por otra varia-
ble que contara la cantidad de ddjj
de grandes clientes entre las dos
seleccionadas.
2.2. Variable aleatoria
Una variable aleatoria asigna valores numricos, del conjunto de los nmeros reales, a los sucesos denidos en el
espacio muestral asociado a un experimento aleatorio.
En caso de que el espacio muestral de un experimento aleatorio tenga una cantidad nita o innita numerable de
elementos, es decir, que permite algn mecanismo de conteo, la variable aleatoria diseada ser una variable aleatoria
discreta.
En caso de que el experimento aleatorio involucre algn tipo de medicin, cuyos resultados pertenecen a regiones
del conjunto de los nmeros reales donde es clara la imposibilidad de conteo, la variable aleatoria es de naturaleza
continua y por ello se la denomina variable aleatoria continua.
Se denomina variable aleatoria a una funcin del espacio muestral sobre el espacio de los nmeros reales.
FIN DE LEER ATENTO
2.2.1. Variable aleatoria discreta
Las variables aleatorias discretas son funciones del espacio muestral sobre el subconjunto de los enteros.
Disearemos una variable aleatoria discreta para el ejemplo del estudio contable utilizado en el subapartado 2.1.4.
(probabilidad condicional).
Recordemos que el espacio muestral es: E = {GG, GM, MG, MM}
La variable aleatoria de diseo que elegimos es:
X: cantidad de DDJJ de clientes monotributistas entre las dos seleccionadas
COMIENZO DE PASTILLA EN monotributistas
Al momento de disear una variable aleatoria discreta debe optarse por alguna de las categoras involucradas en el problema para la cual la
variable har el conteo. En nuestro caso, podra haberse optado por otra variable que contara la cantidad de DDJJ de grandes clientes entre las
dos seleccionadas.
FIN DE PASTILLA
La variable aleatoria X recorrer los valores enteros entre 0 y 2, donde 0 signica que ninguna de las dos DDJJ
corresponderan a monotributistas y 2 que ambas declaraciones sean de monotributistas.
X
E A
GG 0
GM
MG
1
MM 2
El recorrido de X es R(X) = {0, 1, 2}
Calculamos la probabilidad para cada valor r del recorrido de X obteniendo as los valores de la denominada funcin
de probabilidad h(r). Siendo h(r) = P(X = r)
h (0) = P( X= 0 M) = P(GG) = 6/90
h (1) = P( X= 1 M) = P(G, M) + P(MG) = 21/90 + 21/90 = 42/ 90
h (2) = P( X= 2 M) = P(MM) = 42/90
Confeccionamos a continuacin la tabla (T.2.1.) de distribucin de probabilidades.
T.2.1.
r h(r) F(r)
0 6/90 6/90
1 42/90 48/90
2 42/90 1
Donde F(r) es la funcin de distribucin acumulativa o simplemente funcin de distribucin. Siendo F(r) = P(x ) r).
h(r) es una funcin de probabilidad de una variable aleatoria discreta X si y slo si para todo elemento r del
R(X) se cumplen las siguientes propiedades que se desprenden de los dos primeros axiomas de probabilidad.
h(r) 1) * 0
- h(r) = 1
FIN DE LEER ATENTO
Un grco adecuado para la funcin de probabilidad h(r) es el de bastones y para la funcin de distribucin es el de
escalones, ambos vistos en el subapartado 1.1.3. de la Unidad 1.
El carcter numrico de la variable aleatoria permite calcular algunas de las medidas media, varianza y desvo
estndar de las aplicadas anteriormente a las variables estadsticas, con la siguiente salvedad: en una variable estadstica
la media corresponde a un promedio observado mientras que en una variable aleatoria la media indica un promedio
esperado, o valor esperado, y se denomina esperanza.
La esperanza E(X), la varianza V(X) y el desvo estndar DS(X) se expresan
E(X) = para todo r del R(X)

DS(X) =
La esperanza de la variable del problema es:
E (X) = 0.6/90 +1.42/90 + 2. 42/90 = 1,4 DDJJ de monotributistas
Es decir, que si se seleccionan al azar dos DDJJ se espera que entre ellas haya 1,4 de clientes monotributistas.
La varianza y el desvo estndar son: V(X) = 0,3733 y DS(X) = 0,611
Propiedades de la esperanza y de la varianza
COMIENZO DE PASTILLA EN al la altura del subttulo
Las propiedades que se enuncian son vlidas en cualquier experimento aleatorio, sea este simple o compuesto.
FIN DE PASTILLA
P.1. E(C) = C
La esperanza de una constante es ella misma.
P.2. E(C + n . X) = C + n . E(X)
C + n.X es una nueva variable aleatoria resultante de una transformacin lineal de X.
El carcter numrico de la variable aleatoria permite calcular algunas de las
medidas media, varianza y desvo estndar de las aplicadas anteriormente
a las variables estadsticas, con la siguiente salvedad: en una variable esta-
dstica la media corresponde a un promedio observado mientras que en una
variable aleatoria la media indica un promedio esperado, o valor esperado, y
se denomina esperanza.
La esperanza E(X), la varianza V(X) y el desvo estndar DS(X) se expresan
La esperanza de la variable del problema es:
E (X) = 0.6/90 +1.42/90 + 2. 42/90 = 1,4 DDJJ de monotributistas
Es decir, que si se seleccionan al azar dos DDJJ se espera que entre ellas haya
1,4 de clientes monotributistas.
La varianza y el desvo estndar son: V(X) = 0,3733 y DS(X) = 0,611
Propiedades de la esperanza y de la varianza
P.1. E(C) = C
La esperanza de una constante es ella misma.
P.2. E(C + n . X) = C + n . E(X)
C + n.X es una nueva variable aleatoria resultante de una transformacin
lineal de X.
P.3. E(n . X) = n . E(X)
Caso particular que se desprende de la propiedad anterior
P.4. E(X + Y) = E(X) + E(Y)
X + Y es una nueva variable aleatoria, resultante de sumar las variables
X e Y.
P.5. V(X + Y) = V(X) + V(Y)
Slo si X e Y son independientes.
P.6. V(n . X) = n
2
. V(x)
Se deduce de la definicin de varianza
2.2.2. Modelos especiales de variables aleatorias discretas
Existen problemas de distinta ndole originados en ramas diversas de la cien-
cia, que al ser vinculados con experimentos aleatorios presentan caracters-
71
Estadistica
Las propiedades que se
enuncian son vlidas en
cualquier experimento aleatorio,
sea este simple o compuesto.
22

COMIENZO DE PASTILLA EN nmero combinatorio
nCr =
n
r

=
n!
r!(n r)!

FIN DE PASTILLA

Ejemplo
De la revisin de los archivos de una empresa de larga trayectoria en un
determinado rubro surge que en el 70% de sus balances semanales se
registraron supervit. En una auditora se propuso realizar una muestra
con los balances de 10 semanas tomadas al azar en forma independiente.
Conceptualizando que esa muestra es un experimento aleatorio y
pasando revista a sus caractersticas comprobamos que responden a un
modelo binomial a saber: hay dos resultados posibles (supervit o no
supervit) cada vez que se seleccione un balance semanal y se toman n
(10) balances en forma independiente.
Ante la futura auditora nos podemos preguntar acerca de la
probabilidad de que se encuentren en la muestra a lo sumo 5 balances
con supervit o entre 3 y 6 balances con supervit o al menos 6 balances
con supervit.
La variable aleatoria asociada al experimento, para responder los
interrogantes del auditor podra ser:

X: cantidad de balances con supervit entre los 10 seleccionados al
azar en forma independiente .

Los parmetros de la distribucin resultan entonces,

n = 10 P = 0,70

y los valores de la funcin de probabilidad h(r) y los de la funcin de
distribucin F(r) = P(X r) se encuentran en la tabla T.2.2.
T.2.2.

r i 0 1 2 3 4 5 6 7 8 9 10
h(r ) 0,000006 0,000138 0,001447 0,009002 0,036757 0,102919 0,200121 0,266828 0,233474 0,121061 0,028248
F(r ) 0,000006 0,000144 0,001591 0,010593 0,047350 0,150268 0,350389 0,617217 0,850691 0,971752 1

La probabilidad de que en la muestra se encuentren a lo sumo 5
balances con supervit ser:

P( X 5) = F(5) = 0,150268
o tambin

P( X 5) = h(r) = h(0) + h(1) + h(2) + h(3) + h(4) + h(5) =
0
5
0,150268
La probabilidad de que en la muestra haya entre 3 y 6 balances con
supervit

ticas similares; esas caractersticas comunes son las que permiten modelar-
los unvocamente.
Para la construccin de un modelo probabilstico, primero deben identifi-
carse exhaustivamente cada una de las caractersticas especficas del expe-
rimento y seguidamente asociarle una variable aleatoria apropiada.
Experimento binomial
El experimento binomial es un experimento compuesto que consiste en n repe-
ticiones independientes de un experimento simple dicotmico.
Por lo tanto las caractersticas que lo identifican son:
El experimento simple tiene slo dos resultados posibles, denominados
xito suceso que interesa seguir y fracaso suceso complementario.
Se repite n veces el experimento simple.
Las repeticiones del experimento simple son independientes entre s.
Vinculadas al experimento binomial pueden definirse ms de una variable ale-
atoria, con sus correspondientes distribuciones de probabilidad, cumpliendo
distintos roles dentro del mismo experimento. Ellas son las variables aleato-
rias binomial, geomtrica y de Pascal (o binomial negativa).
Variable aleatoria binomial
Es una variable discreta que cuenta la cantidad r de xitos en un expe-
rimento binomial.
Llamaremos P a la probabilidad de xito y en consecuencia 1-P a la probabi-
lidad de fracaso.
El modelo binomial queda caracterizado por n (nmero de repeticiones
del experimento simple o de Bernoulli) y P (probabilidad de xito en cada
repeticin) que son sus parmetros. Entonces decimos que la variable ale-
atoria X asociada tiene distribucin binomial con parmetros n y P.
El modelo matemtico para la distribucin binomial permite calcular los valo-
res de la funcin de probabilidad h(r).
h (r) = P(X = r) = nCr . P
r .
(1-P)
n-r
Donde nCr es un nmero combinatorio que cuenta la cantidad de combina-
ciones de n elementos tomados de a r, es decir la cantidad de grupos de r ele-
mentos que pueden formarse a partir de los n.
Ejemplo
De la revisin de los archivos de una empresa de larga trayectoria en un deter-
minado rubro surge que en el 70% de sus balances semanales se registraron
supervit. En una auditora se propuso realizar una muestra con los balances
de 10 semanas tomadas al azar en forma independiente.
72
Si el experimento tiene
ms de dos resultados
posibles hay que dicotomizarlo.
Si las repeticiones del
experimento simple no
fueran independientes, el mode-
lo que se generara se denomina
modelo hipergeomtrico.
En smbolos X ~ B(n,P)
En este experimento, la variable
aleatoria x asociada toma valo-
res 0 y 1. La esperanza de esta
variable resulta ser la probabili-
dad de xito. P. Santiago Jacobo
Bernouilli o Bernoulli (1654-1705)
fue un matemtico suizo de ori-
gen belga. Entre otras cosas fue
quien us por primera vez la pala-
bra integral y escribi el Ars
conjectandi sobre el cl-
culo de probabilidades.
Conceptualizando que esa muestra es un experimento aleatorio y pasan-
do revista a sus caractersticas comprobamos que responden a un modelo
binomial a saber: hay dos resultados posibles (supervit o no supervit) cada
vez que se seleccione un balance semanal y se toman n (10) balances en
forma independiente.
Ante la futura auditora nos podemos preguntar acerca de la probabilidad
de que se encuentren en la muestra a lo sumo 5 balances con supervit o
entre 3 y 6 balances con supervit o al menos 6 balances con supervit.
La variable aleatoria asociada al experimento, para responder los interro-
gantes del auditor, podra ser:
X: cantidad de balances con supervit entre los 10 seleccionados al azar en
forma independiente.
n = 10 P = 0,70
y los valores de la funcin de probabilidad h(r) y los de la funcin de distribu-
cin F(r) = P(X r) se encuentran en la tabla T.2.2.
T.2.2.
La probabilidad de que en la muestra se encuentren a lo sumo 5 balances
con supervit ser:
o tambin
La probabilidad de que en la muestra haya entre 3 y 6 balances con supervit
o tambin
Al menos 6 balances con supervit
73
Estadistica
El modelo binomial queda caracterizado por n (nmero de repeticiones del experimento simple o de Bernoulli)
y P (probabilidad de xito en cada repeticin) que son sus parmetros. Entonces decimos que la variable
aleatoria X asociada tiene distribucin binomial con parmetros n y P.
COMIENZO DE PASTILLA EN Bernoulli
En este experimento, la variable aleatoria x asociada toma valores 0 y 1. La esperanza de esta variable resulta ser la probabilidad de xito P.
Santiago Jacobo Bernouilli o Bernoulli (1654-1705) fue un matemtico suizo de origen belga. Entre otras cosas fue quien us por primera vez
la palabra integral y escribi el Ars conjectandi sobre el clculo de probabilidades.
FIN DE PASTILLA
COMIENZO DE PASTILLA EN parmetros
En smbolos X ~ B(n,P)
FIN DE PASTILLA
FIN DE LEER ATENTO
El modelo matemtico para la distribucin binomial permite calcular los valores de la funcin de probabilidad h(r).
h (r) = P(X = r) = nCr . P
r .
(1-P)
n-r
Donde nCr es un nmero combinatorio que cuenta la cantidad de combinaciones de n elementos tomados de a r,
es decir la cantidad de grupos de r elementos que pueden formarse a partir de los n.

COMIENZO DE PASTILLA EN nmero combinatorio
FIN DE PASTILLA
Ejemplo
De la revisin de los archivos de una empresa de larga trayectoria en un determinado rubro surge que en el 70% de sus
balances semanales se registraron supervit. En una auditora se propuso realizar una muestra con los balances de 10
semanas tomadas al azar en forma independiente.
Conceptualizando que esa muestra es un experimento aleatorio y pasando revista a sus caractersticas comprobamos
que responden a un modelo binomial a saber: hay dos resultados posibles (supervit o no supervit) cada vez que se
seleccione un balance semanal y se toman n (10) balances en forma independiente.
X: cantidad de balances con supervit entre los 10 seleccionados al azar en forma independiente.
n = 10 P = 0,70
y los valores de la funcin de probabilidad h(r) y los de la funcin de distribucin F(r) = P(X ) r) se encuentran en la
tabla T.2.2.
T.2.2.
r
i
0 1 2 3 4 5 6 7 8 9 10
h(r) 0,000006 0,000138 0,001447 0,009002 0,036757 0,102919 0,200121 0,266828 0,233474 0,121061 0,028248
F(r) 0,000006 0,000144 0,001591 0,010593 0,047350 0,150268 0,350389 0,617217 0,850691 0,971752 1
La probabilidad de que en la muestra se encuentren a lo sumo 5 balances con supervit ser:
o tambin
Esperanza y varianza de una distribucin binomial
Como el experimento binomial consiste en n repeticiones independientes de
un ensayo Bernoulli, la variable aleatoria binomial X es una transformacin
lineal de la variable aleatoria Bernoulli x, es decir,
Luego, aplicando las propiedades de la esperanza y varianza P.4. y P.5. enun-
ciadas anteriormente en el presente apartado calculamos la esperanza y la
varianza de una variable aleatoria binomial X.
La esperanza es:
y la varianza resulta:
Volviendo al ejemplo de los balances, la cantidad de balances que se espera
encontrar con supervit entre los 10 seleccionados ser
E(X) = n . p = 10 . 0,70 = 7 balances con supervit
Con una desviacin estndar de
Proceso de Poisson
Un proceso de Poisson es un experimento de naturaleza binomial donde
los xitos ocurren o no a lo largo de un intervalo continuo (el cual puede
estar dado en tiempo, longitud, superficie, volumen, etctera).
Es un proceso donde los xitos ocurren en el transcurso del continuo y a dife-
rencia de un experimento binomial puro los fracasos no pueden ocurrir por-
que representan la ausencia de xito.
Lo que caracteriza unvocamente a un determinado proceso de Poisson es
la intensidad media (a) de ocurrencias de xito en la unidad del continuo.
74
La intensidad media es la canti-
dad de xitos esperada por uni-
dad del continuo, mientras el pro-
ceso sea el mismo.
Por ejemplo, una distribuidora mayorista comprob que, en las primeras
semanas de cada mes, la cantidad media demandada de un determinado pro-
ducto es de 3 toneladas diarias. El fenmeno descrito involucra un proceso
de Poisson donde a = 3 tn/da para esa poca del mes.
Tambin, que en las ltimas semanas de cada mes la demanda media dia-
ria baja a 2 toneladas. En este caso el proceso de Poisson sera otro porque
presenta una intensidad media a = 2 tn/da, diferente a la anterior.
Diferentes a indican procesos poissonianos distintos.
En un proceso aleatorio poissoniano es posible definir variables aleatorias
de distinto tipo. Para procesos de este tipo, en esta carpeta, presentaremos
una variable aleatoria discreta llamada de Poisson (que cuente la cantidad de
xitos en un intervalo continuo) y una variable aleatoria continua denominada
exponencial que veremos en 2.2.4.
Variable aleatoria de Poisson
Es una variable discreta que cuenta la cantidad de xitos que podran ocu-
rrir en un cierto intervalo continuo, durante un proceso de Poisson.
Establecido un intervalo de longitud t en el continuo, la cantidad media espe-
rada de ocurrencia de xitos en ese intervalo es E(X) = . t, donde es la ya
vista intensidad media de ocurrencias de xito en la unidad del continuo.
La esperanza E(x), que simbolizamos con la letra griega es el parmetro
de esta distribucin.
Si una variable aleatoria discreta X sigue una distribucin de Poisson de
parmetro podemos expresarla en smbolos como X ~ P(l) y la probabilidad
P(X= r) de que sucedan r xitos en un intervalo t dado se calcula mediante la
siguiente frmula:
La probabilidad de una variable aleatoria X que se distribuye en forma de
Poisson:
depende nicamente de la longitud (t) del intervalo considerado,
es independiente de lo ocurrido en alguno de los intervalos precedentes.
Para intervalos de diferente longitud t habr distintas distribuciones de pro-
babilidad, cada una con su propio todas dentro de un mismo proceso carac-
terizado por .
Lo particular de esta variable aleatoria es que su varianza tambin es .
Volviendo al ejemplo de la distribuidora mayorista nos planteamos las siguien-
tes inquietudes.
Cul es la probabilidad de que en dos das de la primera semana de un
mes cualquiera se produzca una demanda de 5 toneladas?
Determinamos primero el valor del parmetro para un t = 2 das:
75
Estadistica
La probabilidad de que en esos dos das la demanda sea de 5 toneladas es
de 0,1606.
Con base al calculado podemos decir que en esos dos das se espera que
haya una demanda de 6 toneladas del producto.
Cul es la probabilidad de que en un da y medio de la ltima semana de
un mes cualquiera la demanda sea superior a 2 toneladas.
En este caso, = tn/da . 1,5 das = 3 tn
Luego:
La probabilidad de que en ese da y medio la demanda supere las 2 tn es
0,8009.
Con base al calculado podemos decir que en esos dos das se espera que
haya una demanda de 3 toneladas del producto.
5.
Buscar tres ejemplos de la vida real que pudieran constituir un proceso
de Poisson y para cada uno describir la variable involucrada.
2.2.3. Variable aleatoria continua
Existen fenmenos que no permiten ser tratados con modelos de variables
aleatorias discretas debido a que los resultados del experimento aleatorio
asociado a l slo son medibles en el conjunto de los nmeros reales. En
este caso la variable aleatoria asociada debe ser una variable continua para
la cual no se pueden listar puntualmente cada uno de sus valores pero s con-
siderar su recorrido mediante intervalos.
Al ser las variables aleatorias continuas funciones del espacio muestral
sobre el espacio de los nmeros reales, el tratamiento de la misma deber rea-
lizarse mediante intervalos, los problemas de probabilidad que las involucran
son del tipo P(x a), P(x b) o P(a x b).
En una variable aleatoria continua, el correlato de la funcin h(r) de las
variables aleatorias discretas es la funcin f(x) denominada funcin de densidad
de probabilidad que a diferencia de la h(r) no asigna probabilidades sino que
permite calcularlas en intervalos de nmeros reales.
La funcin de densidad de probabilidad cumple con las siguientes pro-
piedades:
76
Los valores de la funcin f(x) deben ser siempre positivos o 0 para cualquier
valor de la variable X.
El rea encerrada entre la funcin en todo su dominio y el eje de las absci-
sas es 1.
La probabilidad de que la variable aleatoria se encuentre entre dos valores a
y b resulta de integrar la funcin de densidad f(x) entre esos dos lmites.
Grfico 2.10.
En el caso que a coincida con b el rea de la regin sombreada en el G.2.10.
tendra base igual a 0 y el rea es 0, lo que tambin se desprende de la P.3.
cuando a y b coinciden en un mismo punto. Es decir, que en una variable ale-
atoria continua las probabilidades puntuales son cero.
Una funcin de densidad de probabilidad es un modelo terico proba-
bilstico sustentado, en general, por la distribucin de una poblacin.
2.2.4. Modelos especiales de variables aleatorias continuas
Como se hiciera mencin en el subapartado 2.2.2. las caractersticas comunes
de algunos fenmenos aleatorios son las que permiten elaborar modelos.
En el caso de las variables aleatorias continuas desarrollaremos dos mode-
los especiales de distribucin.
77
Estadistica
Como consecuencia de
que las probabilidades
puntuales son cero los sucesos
x < a y x a son idnticos y
por lo tanto sus probabilidades son
iguales.
Distribucin normal
Un fenmeno que genera tpicamente una poblacin con distribucin normal
es la medicin del tiempo requerido para efectuar una misma operacin por
todos los clientes de una determinada entidad bancaria, bajo el supuesto de
que todos deberan tardar el mismo tiempo para realizar dicha operacin.
A la hora de medir efectivamente el fenmeno podemos observar que pre-
dominan los clientes que emplearan para hacer la operacin un tiempo cer-
cano al promedio, sin embargo, algunos son ms rpidos y otros ms lentos
generando una distribucin del tiempo como la siguiente.
Grfico 2.11.
El modelo terico de la distribucin normal de una variable continua x se for-
maliza matemticamente mediante la funcin f(x) cuya expresin
representada grficamente es
Grfico 2.12.
donde la media y el desvo estndar son los parmetros de la distri-
bucin y para cada par de valores de y se tendr una curva diferente.
Caractersticas de la curva normal
La curva que es la representacin grfica de la distribucin normal tiene las
siguientes caractersticas:
78
Es perfectamente simtrica alrededor de .
Es asinttica con el eje de la variable x hacia , es decir que el 100% de
la poblacin queda encerrado entre esos dos lmites.
Como consecuencia de las dos caractersticas anteriores la mitad de la
poblacin se encuentra entre y y la otra mitad entre y + .
Grfico 2.13.
Presenta dos puntos de inflexin a una distancia de un desvo estndar a
ambos lados de la media.
Las proporciones de poblacin que quedan comprendidos en secciones de
un desvo estndar de amplitud a ambos lados de la media aparecen asen-
tadas en el grfico G.2.14.
Grfico 2.14.
El siguiente ejemplo, se refiere a un experimento aleatorio sobre una pobla-
cin con distribucin normal, donde la funcin f(x) que describe esa distribu-
cin poblacional es la funcin de densidad de probabilidad de la variable ale-
atoria involucrada en el experimento.
Ejemplo
Retomando el caso de los clientes de una entidad bancaria que efectan una
operacin determinada, se ha encontrado que el tiempo medio requerido para
realizarla es de 130 segundos con un desvo estndar de 43 segundos.
Si se tomara un cliente al azar experimento aleatorio se podran plante-
ar las siguientes preguntas: a) cul es la probabilidad de que esa persona
emplee menos de 100 seg. para realizar la operacin? o b) cul es la pro-
babilidad de que tarde entre 2 y 3 minutos en realizar la transaccin?
Esquematizamos las dos situaciones planteadas en los grficos 2.15. y
2.16. respectivamente.
79
Estadistica
Grfico 2.15.
Grfico 2.16.
Y las sendas respuestas son:
a. P( x < 100s) = F(100) = 0,2427
b. P(2min< x <3 min) = P(120 s < x < 180 s) = P( x < 180s) P( x < 120s) =
= F(180) F(120) = 0,8775 0,4081 = 0,4694
A los resultados obtenidos puede arribarse por integracin analtica de la fun-
cin de densidad normal entre los extremos que correspondan o bien utili-
zando un programa estadstico (por ejemplo el mdulo estadstico de Excel, o
los programas SPSS, InfoStat u otro).
Si no se contara con las mencionadas herramientas de clculo puede uti-
lizarse como recurso la tabla de probabilidades acumuladas de la denomina-
da distribucin normal estndar que figura en el Anexo I y cuyas caractersti-
cas, adems de las generales descritas anteriormente para cualquier
distribucin normal, son:
nombre de la variable normal estndar : Z
parmetros: m
z
= 0 y s
z
= 1
funcin de densidad normal estndar:
Para convertir un valor cualquiera x correspondiente al problema real (con dis-
tribucin normal) a un valor estandarizado z (con el fin de aprovechar la tabla
del Anexo I) se utiliza la siguiente frmula de estandarizacin:
80
Aplicando la distribucin normal estndar a la resolucin de los tems ante-
riores, resulta
Las diferencias que se detectan al realizar los clculos con la tabla se deben
al redondeo a dos decimales de z que tiene dicha tabla.
6.
a. Calcular el tiempo mximo que, con una probabilidad de 0,90, tar-
dara en hacer dicha operacin un cliente de la entidad bancaria
tomado al azar.
b. En relacin con la poblacin de clientes observada, si se considera-
ran slo los clientes que tardaron menos de 130 segundos qu por-
centaje de ellos tard ms de 100 segundos?
Experimento exponencial
El experimento exponencial se define dentro de un proceso de Poisson y en
consecuencia la variable continua exponencial est ntimamente relacionada
con la variable discreta de Poisson.
Mientras el rol de la variable aleatoria de Poisson es contar la cantidad de
xitos a lo largo de un intervalo continuo, la variable aleatoria exponencial
mide, a partir del ltimo xito ocurrido, la longitud del continuo hasta la ocu-
rrencia del siguiente xito.
Con el ltimo xito concluye el experimento exponencial lo que determina
su carcter de efmero (se desarrolla slo entre dos xitos), por lo que fijado
un cierto intervalo t del continuo a partir del ltimo xito slo podran ocurrir
dos sucesos aleatorios:
que la variable exponencial mida la ocurrencia del siguiente xito antes de
transcurrido t es decir x < t, o
que la variable exponencial mida la ocurrencia del siguiente xito despus
de transcurrido t es decir x > t.
Los sucesos x < t y x > t son los dos nicos sucesos aleatorios que pue-
den imaginarse dentro de un experimento exponencial y por lo tanto son
complementarios y como tales, mutuamente excluyentes.
81
Estadistica
La primera consecuencia de lo expresado anteriormente es que no hay suce-
sos compuestos en un experimento exponencial porque el nico suceso con-
cebible {x < t} I {x > t}
es un suceso imposible {x < t} I {x > t} =
y por lo tanto su probabilidad es nula
P({x < t} I {x > t}) = P( ) = 0
La segunda consecuencia es que no hay probabilidades condicionales pues-
to que no hay posibilidad de particionar la poblacin para definir un suceso ale-
atorio que represente la condicin porque, como razonamos anteriormente, el
experimento es efmero y no hay una coleccin de datos que permita descri-
bir una poblacin, por lo tanto no existen poblaciones exponenciales.
Formalmente, y asignando arbitrariamente a uno de los dos sucesos posi-
bles el rol de condicin, se tiene:
Al no haber poblacin, no podemos contar inicialmente con una funcin de
densidad exponencial procediendo de forma similar a como se obtuvo, por
ejemplo, la funcin de densidad normal.
Usaremos un camino distinto aprovechando el vnculo entre las distribu-
ciones de Poisson y exponencial dentro de un mismo proceso de Poisson
caracterizado por .
Para ello, definiremos un suceso aleatorio S: que transcurra todo un cierto
intervalo t sin que ocurra xito, cuya probabilidad pueda calcularse tanto utili-
zando la variable aleatoria de Poisson como la variable aleatoria exponencial.
P(que no ocurra xito a lo largo de t) = P(X
Poisson
= 0) = P(x
exponencial
> t)
Donde: P(X
Poisson
= 0) = e
-a.t
= P(x
exponencial
> t)
Luego, las probabilidades de los nicos sucesos posibles de un experimento
exponencial resultan:
P(x > t) = e
-.t
y aplicando la propiedad de la probabilidad de sucesos complementarios
P(x < t) = 1 - P(x > t) = 1 - e
-.t
se observa que esta expresin corresponde a la funcin de distribucin acu-
mulada, luego se tiene que
F(t) = 1 - e
-.t
82
y derivndola se obtiene la funcin de densidad de probabilidad f(x)
F (x) = f(x)
La funcin de densidad que sintetiza al modelo es entonces
Cuya representacin grfica es G.2.17.
Grfico 2.17.
El parmetro de la distribucin exponencial es el mismo a que caracte-
riza al proceso de Poisson.
La esperanza de esta variables es:
y la varianza
Aplicaciones de la distribucin exponencial
Caso A. Como distribucin de los tiempos de espera, la exponencial puede
aplicarse a problemas de rotacin de inventario donde el experimento comien-
za a partir de un pedido (xito) y luego la variable recorre los valores aleato-
rios del tiempo en que puede ocurrir el siguiente (xito) pedido. A continuacin
se desarrolla un ejemplo.
Una distribuidora mayorista comprob que cada 5 das hbiles recibe en pro-
medio 3 pedidos de embarque de cierto artculo (a = 3 pedidos/5 das = 0,6
pedidos/da).
83
Estadistica
1- Teniendo en cuenta que el tiempo para reponer un embarque en depsito
es de 1 da, despachado un pedido con qu probabilidad el siguiente lle-
gar despus de ese lapso?
2- Siendo el tiempo medio esperado entre pedidos: E(X) = 1/a = 1,67 das,
con qu probabilidad el siguiente pedido ser antes de lo esperado?
3- Con una probabilidad de 0,90 de cunto tiempo se dispone entre dos
pedidos?
despejando t se tiene t = ln 0,90 / -0,6 = 0,18 das
4- Habiendo despachado un pedido, con qu probabilidad el siguiente lle-
gar entre 1 y 2 das despus?
Caso B. La distribucin exponencial tambin puede aplicarse a problemas de
fiabilidad o plazo de servicio de los artculos en circulacin, vida til de mate-
riales o de mercancas perecederas, donde la variable recorre los valores ale-
atorios de vida til de los mismos hasta quedar fuera de servicio. Aqu no hay
dos xitos pues el experimento comienza con el inicio del servicio y termina
en la falla, que es el nico xito. A continuacin se analiza un ejemplo.
Para ciertas lmparas de bajo consumo, su fabricante midi que la vida
media de funcionamiento sin fallo es de 8.000 horas. Si se instalara una cual-
quiera de esas lmparas.
1- Cunto tiempo se espera que dure?
Dentro del experimento aleatorio, que consiste en tomar al azar una de las
lmparas e instalarla, la media observada con anterioridad se convierte en
un media esperada E(X) = 8.000 h.
2- Con qu probabilidad durar ms de 8.000 h?
= 1/E(X) = 1/8000 = 0,000125
84
3- Cuntas horas de funcionamiento sin falla se puede garantizar, con una
probabilidad de 0,90?
7.
Tomando el ejemplo ya trabajado en la distribucin Poisson, una dis-
tribuidora mayorista comprob que, en las primeras semanas de cada
mes, la cantidad media demandada de un determinado producto es de
3 toneladas diarias. Luego de la ltima tonelada demandada, para la
misma poca del mes
a. Cuntos das se espera que transcurran hasta el siguiente pedido de
una tonelada?
b. Calcular la probabilidad de que el siguiente pedido de una tonelada
ingrese luego de transcurridos 2 das.
c. Calcular la probabilidad de que el pedido se realice antes de que pase
un da y medio.
85
Estadistica
87
Inferencia estadstica
Ob je ti vos
Estudiar las relaciones entre los estadsticos muestrales y los parmetros
poblacionales.
Desarrollar procedimientos relativos a dos de los problemas fundamen-
tales de la inferencia estadstica: estimacin de parmetros y prueba de
hiptesis.
3.1. Distribucin de estadsticos muestrales
En el estudio de una poblacin es factible observar que los individuos que la
conforman presentan diferencias entre s y como reflejo de ello todas las mues-
tras posibles de cierto tamao n, seleccionadas al azar de esa poblacin, tam-
bin presentarn variaciones entre ellas en su conformacin. Tales variacio-
nes se transmiten al compotamiento de las medidas muestrales tambin
denominadas estadsticos muestrales calculados a partir de cada una de las
muestras, dando origen a nuevas poblaciones de naturaleza terica, las pobla-
ciones de los estadsticos muestrales.
La importancia del estudio de la distribucin de los estadsticos muestra-
les radica en el hecho de que ellos son los estimadores de los parmetros
poblacionales.
Dada una poblacin conocida de tamao N con media poblacional y pro-
porcin poblacional P(e) = P de algn valor e elegido como xito, si de ella se
seleccionan aleatoriamente todas las muestras posibles de tamao n y para
cada una de ellas se calcula la media aritmtica X
i
y la proporcin de xito
p
i
(e)= p
i
, se tendrn m muestras y consecuentemente la misma cantidad m de
medias aritmticas y de proporciones muestrales.
3
Las dos ltimas columnas constituyen las poblaciones de las variables alea-
torias media muestral y proporcin muestral. Por su importancia conceptual,
seguidamente trataremos las distribuciones tericas de las poblaciones de
los estadsticos media muestral (como mejor estimador de ) y proporcin
muestral (como mejor estimador de P).
3.1.1. Distribucin del estadstico media muestral
Los grficos que se presentan a continuacin se refieren a la distribucin de
dos poblaciones, la primera corresponde a una poblacin original conformada
por las edades de los 497 empleados de una empresa grfico.3.1 mien-
tras que la segunda grfico 3.2 representa a la distribucin de la poblacin
terica de las edades medias de todas las muestras de tamao 2 que se
extrajeron de la poblacin original.
Grfico 3.1.
Los parmetros de la poblacin original (de edades) son:
= 35 aos y
2
= 82,90 aos
2
Grfico 3.2.
88
El mejor estimador de un
parmetro poblacional
es aquel que cumple con ciertas
cualidades (insesgabilidad, con-
sistencia, eficiencia y suficiencia)
que aqu no se analizarn.
0,17
0,14
0,11
0,08
0,06
0,03
0,00
22 35 48 62
X
Distribucin de la poblacin original
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.1
22
0,20
0,10
0,10
0,05
0,00
35 48 62
Distribucin de la poblacin de las medias
muestrales (muestras de tamao 2)
Medias muestrales
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.2
0,17
0,14
0,11
0,08
0,06
0,03
0,00
22 35 48 62
X
Distribucin de la poblacin original
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.1
22
0,20
0,10
0,10
0,05
0,00
35 48 62
Distribucin de la poblacin de las medias
muestrales (muestras de tamao 2)
Medias muestrales
f
r
e
c
u
e
n
c
i
a

r
e
l
a
t
i
v
a
Grfico.3.2
Los parmetros de la poblacin terica de las medias muestrales de todas
las muestras de tamao 2 son:
Si se tomaran muestras de tamao n=1 el grfico resultante para la pobla-
cin terica de las medias muestrales de todas las muestras de tamao 1
sera exactamente igual que el Grfico.3.1. (porque cada media es el ele-
mento que conforma la muestra) y sus parmetros seran los mismos que los
de la poblacin original.
Como se puede observar, todas las medias de las poblaciones tericas, an
variando n, coinciden con la media de la poblacin de donde se extrajeron las
muestras.
Conclusin:
Y las varianzas disminuyen proporcionalmente al tamao n de la muestra.
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las medias
muestrales resulta Grfico.3.3. aproximadamente normal.
Grfico 3.3.
89
Estadistica
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
3

x
= 35 aos y
x
2
= 41, 45 aos
2

Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.

x
= 35 aos y
x
2
= 82, 90 aos
2

Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.

Conclusin:
x
=

Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.

x
2
=

2
n

(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.

G.3.3.

Propiedades de la variable aleatoria media muestral

Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = < y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3
x
= 35 aos y
x
2
= 41, 45 aos
2


x
= 35 aos y
x
2
= 82, 90 aos
2


Conclusin:
x
=

muestra.

x
2
=

2
n


G.3.3.


1
,
x
2
, x
3 ,, .
x
m,.
2
y se
3
x
= 35 aos y
x
2
= 41, 45 aos
2


x
= 35 aos y
x
2
= 82, 90 aos
2


Conclusin:

x
=

muestra.

x
2
=

2
n


G.3.3.


1
,
x
2
, x
3 ,, .
x
m,.
2
y se
3
x
= 35 aos y
x
2
= 41, 45 aos
2


x
= 35 aos y
x
2
= 82, 90 aos
2


Conclusin:
x
=

muestra.

x
2
=

2
n


G.3.3.


1
,
x
2
, x
3 ,, .
x
m,.
2
y se
1
, x
2
, x
3
,, .
x
m,.
2
y se selecciona slo
una muestra aleatoria de tamao n de dicha poblacin para la cual su media
muestral X es un elemento de la poblacin terica de Xs se verifican las
siguientes propiedades:
El desvo estndar
x
tambin se denomina error estndar de la media mues-
tral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la espe-
ranza y varianza de una variable aleatoria cualquiera como se puede verificar
a continuacin.
3.1.2. Distribucin del estadstico proporcin muestral
En el grfico 3.4. se representa la distribucin de la poblacin terica de las
proporciones de empleados mayores a 45 aos de todas las muestras de un
cierto tamao n superior a 100.
Grfico 3.4.
90
4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.

P.1 E( ) =

X
=

COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA

P.2 V( ) =

X
2
=
2
n
DS( ) =
X
=
n

El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.

P.1

E( X )= E
X
i
1=1
n
n

= E
1
n
. X
i
i=1
n

=
1
n
. E( X
i
) =
1
n
. n .
i=1
n
=

P.2

V( X )= V
X
i
1=1
n
n

= V
1
n
. X
i
i=1
n

=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n
=

2
n

FIN DE TEXTO APARTE


En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.

G.3.4.

4

P.1 E( ) =

X
=

FIN DE PASTILLA

P.2 V( ) =

X
2
=
2
n
DS( ) =

X
=
n


P.1

E( X )= E
X
i
1=1
n
n

= E
1
n
. X
i
i=1
n

=
1
n
. E( X
i
) =
1
n
. n .
i=1
n
=

P.2

V( X )= V
X
i
1=1
n
n

= V
1
n
. X
i
i=1
n

=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n
=

2
n

FIN DE TEXTO APARTE



G.3.4.

4

P.1 E( ) =

X
=

FIN DE PASTILLA

P.2 V( ) =

X
2
=
2
n
DS( ) =
X
=
n


P.1

E( X )= E
X
i
1=1
n
n

= E
1
n
. X
i
i=1
n

=
1
n
. E( X
i
) =
1
n
. n .
i=1
n
=

P.2

V( X )= V
X
i
1=1
n
n

= V
1
n
. X
i
i=1
n

=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n
=

2
n

FIN DE TEXTO APARTE



G.3.4.

Esta propiedad est rela-
cionada con la cualidad
de insesgabilidad del estimador X.
35
Medias muestrales
Grfico.3.3
0,11 1 0
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
En la poblacin original, la proporcin de los empleados mayores a 45 aos es:
P(>45) = 0,11
y los parmetros de la distribucin grfico 3.4. de las proporciones mues-
trales son:
p
=0,11 y
2
p
=0,0002
Conclusin:
p
=P
Y las varianzas disminuyen proporcionalmente al tamao n de la muestra.
Adems, si las muestras extradas de la poblacin fueran chicas, la distribu-
cin de la poblacin de las proporciones muestrales no necesariamente resul-
tara aproximadamente normal.
Propiedades de la variable aleatoria proporcin muestral
Si en una determinada poblacin caracterizada por una variable aleatoria X, se
efecta un experimento binomial con parmetros n y P y en consecuencia con
esperanza = n.P y varianza
2
= n. P. ( 1- P) , se selecciona slo una muestra
aleatoria de tamao n de dicha poblacin para la cual su proporcin muestral
de xito p verifica las siguientes propiedades:
El desvo estndar
p
tambin se denomina error estndar de la proporcin
muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se desprenden
inmediatamente de las enunciadas anteriormente en el apartado 2.2.1. de la
Unidad 2 para la esperanza y varianza de una variable aleatoria cualquiera.
3.1.3. Teorema central del lmite
El teorema central del lmite formaliza el comportamiento asintticamente nor-
mal, bajo determinadas condiciones, de la distribucin de una variable aleato-
ria, en particular el de las variables aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central del lmite
TCL como resultante de una construccin colectiva es factible de enunciar-
se, siguiendo a Meyer (1986) de la siguiente manera.
91
Estadistica
5

En la poblacin original, la proporcin de los empleados mayores a 45
aos es:
P(>45) = 0,11

y los parmetros de la distribucin G.3.4. de las proporciones
muestrales son:

p
= 0,11 y
p
2
= 0, 0002

Conclusin:

p
= P

muestra.

p
2
=
P.(1- P)
n

Adems, si las muestras extradas de la poblacin fueran chicas, la
distribucin de la poblacin de las proporciones muestrales no
necesariamente resultara aproximadamente normal.


Si en una determinada poblacin caracterizada por una variable
aleatoria X, se efecta un experimento binomial con parmetros n y P y
en consecuencia con esperanza < = n.P y varianza
2
= n.P.(1-P), se
para la cual su proporcin muestral de xito p verifica las siguientes
propiedades.

P.1 E(p) = <
P
= P

P.2 V(p) =
p
2
=
P.(1- P)
n
DS(x) =
P
=
P.(1- P)
n

El desvo estndar tambin se denomina error estndar de la
proporcin muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se
desprenden inmediatamente de las enunciadas anteriormente en el
apartado 2.2.1. de la Unidad 2 para la esperanza y varianza de una
variable aleatoria cualquiera.


El teorema central del lmite formaliza el comportamiento
asintticamente normal, bajo determinadas condiciones, de la
5

En la poblacin original, la proporcin de los empleados mayores a 45
aos es:
P(>45) = 0,11

y los parmetros de la distribucin G.3.4. de las proporciones
muestrales son:

p
= 0,11 y
p
2
= 0, 0002

Conclusin:

p
= P

muestra.

p
2
=
P.(1- P)
n

Adems, si las muestras extradas de la poblacin fueran chicas, la
distribucin de la poblacin de las proporciones muestrales no
necesariamente resultara aproximadamente normal.


Si en una determinada poblacin caracterizada por una variable
aleatoria X, se efecta un experimento binomial con parmetros n y P y
en consecuencia con esperanza < = n.P y varianza
2
= n.P.(1-P), se
para la cual su proporcin muestral de xito p verifica las siguientes
propiedades.

P.1 E(p) = <
P
= P

P.2 V(p) =

p
2
=
P.(1- P)
n

DS(x) =
P
=
P.(1- P)
n

El desvo estndar tambin se denomina error estndar de la
proporcin muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se
desprenden inmediatamente de las enunciadas anteriormente en el
apartado 2.2.1. de la Unidad 2 para la esperanza y varianza de una
variable aleatoria cualquiera.


El teorema central del lmite formaliza el comportamiento
asintticamente normal, bajo determinadas condiciones, de la
Teorema Central del
Lmite o Teorema del
Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
Sean X
1
, X
2
,X
n
... una sucesin de variables aleatorias independientes con
E(X
i
) =
i
y V(X
i
) =
i
2
, i = 1, 2,
Sea X = X
1
+ X
2
+ + X
n.
Luego, para n tendiendo a infinito, la X tiene distribucin asintticamente nor-
mal con
Este teorema nos est diciendo que si una variable aleatoria es la suma de
n variables aleatorias independientes entonces esa variable aleatoria suma ten-
dr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen todas
distribucin normal entonces se verifica que su suma tiene distribucin nor-
mal, para cualquier valor de n.
Como corolario, se concluye que bajo determinadas condiciones, las
distribuciones de la media y proporcin muestral son normales.
Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497 emple-
ados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la edad media
poblacional es de 35 aos con un desvo estndar de 9,105 aos y una pro-
porcin de empleados mayores a 45 aos del 11%, si se proyectara abrir un
anexo cercano a la empresa con parte del personal y para ello se van a ele-
gir al azar 119 empleados, podemos formularnos las siguientes preguntas:
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34 aos?
Como n = 119 es una muestra grande entonces
Por lo tanto
92
6
distribucin de una variable aleatoria, en particular el de las variables
aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central
del lmite TCL como resultante de una construccin colectiva es
factible de enunciarse, siguiendo a Meyer (1986) de la siguiente manera.

COMIENZO DE PASTILLA EN Teorema central del lmite
Teorema Central del Lmite o Teorema del Lmite Central de De Moivre (1733)
FIN DE PASTILLA

Sean X
1,
X
2,
X
n
... una sucesin de variables aleatorias independientes
con E(X
i
) = F
i
y V(X
i
) =
,
i = 1, 2,

Sea X = X
1
+ X
2
+ + X
n.

Luego, para n tendiendo a infinito, la X tiene distribucin
asintticamente normal con

=
i
i=1
n
y
2
=
i
2
i=1
n

Este teorema nos est diciendo que si una variable aleatoria es la suma
de n variables aleatorias independientes entonces esa variable aleatoria
suma tendr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen
todas distribucin normal entonces se verifica que su suma tiene
distribucin normal, para cualquier valor de n.

Como corolario, se concluye que bajo determinadas condiciones,
las distribuciones de la media y proporcin muestral son
normales.

FIN DE LEER ATENTO

Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497
empleados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la
edad media poblacional es de 35 aos con un desvo estndar de 9,105
aos y una proporcin de empleados mayores a 45 aos del 11%, si se
proyectara abrir un anexo cercano a la empresa con parte del personal y
para ello se van a elegir al azar 119 empleados, podemos formularnos
las siguientes preguntas:

6
distribucin de una variable aleatoria, en particular el de las variables
aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central
del lmite TCL como resultante de una construccin colectiva es
factible de enunciarse, siguiendo a Meyer (1986) de la siguiente manera.

COMIENZO DE PASTILLA EN Teorema central del lmite
Teorema Central del Lmite o Teorema del Lmite Central de De Moivre (1733)
FIN DE PASTILLA

Sean X
1,
X
2,
X
n
... una sucesin de variables aleatorias independientes
con E(X
i
) = F
i
y V(X
i
) =
,
i = 1, 2,

Sea X = X
1
+ X
2
+ + X
n.

Luego, para n tendiendo a infinito, la X tiene distribucin
asintticamente normal con

=
i
i=1
n
y
2
=
i
2
i=1
n

Este teorema nos est diciendo que si una variable aleatoria es la suma
de n variables aleatorias independientes entonces esa variable aleatoria
suma tendr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen
todas distribucin normal entonces se verifica que su suma tiene
distribucin normal, para cualquier valor de n.

Como corolario, se concluye que bajo determinadas condiciones,
las distribuciones de la media y proporcin muestral son
normales.

FIN DE LEER ATENTO

Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497
empleados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la
edad media poblacional es de 35 aos con un desvo estndar de 9,105
aos y una proporcin de empleados mayores a 45 aos del 11%, si se
proyectara abrir un anexo cercano a la empresa con parte del personal y
para ello se van a elegir al azar 119 empleados, podemos formularnos
las siguientes preguntas:

7
1)
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N

35,
9,105
119

Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119

= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.

b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119

= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.

2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119

= P(z < -0, 35) = F(-0, 35 ) = 0, 3632

La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.

1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.

7
1)
aos?

35,
9,105
119

Por lo tanto

P(X < 34 aos) = P z <
34 - 35
9,105
119

= P(z < 1,198 ) = F (1, 20 ) = 0,1151

supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119

= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
aos es 0,0082.

2)

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119

= P(z < -0, 35) = F(-0, 35 ) = 0, 3632


1.

La probabilidad de que la media de edad de los empleados que trabajaran en
el nuevo anexo sea inferior a 34 aos es 0,1151.
supere los 37 aos?
La probabilidad de que la edad media de los empleados supere los 37 aos
es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados mayores a
45 aos del nuevo anexo sea inferior al 10%?
La probabilidad de que la proporcin de los empleados mayores a 45 aos
del nuevo anexo sea inferior al 10% es 0,3632.
1.
a. Una carpintera recibe peridicamente grandes partidas de postes de
madera de longitud media de 4 metros procedentes de un aserrade-
ro. Sabiendo que la precisin del proceso de cortado de los postes
est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida entre
3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida recibi-
da, cul es la probabilidad de que la longitud media de la muestra
est comprendida entre 3,98 y 4,03 metros?
b. Una inmobiliaria de Quilmes ha cambiado su poltica de alquileres
introduciendo una opcin de alquiler a sola firma. Actualmente el
55% de los departamentos que ofrece son con esta modalidad. Del
archivo de alquileres de la inmobiliaria se tom una muestra aleato-
ria de 180 fichas. Cul es la probabilidad de que la proporcin de
inquilinos sin garante est comprendida entre el 48% y el 60%?
93
Estadistica
7
1)
aos?

35,
9,105
119

Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119

= P(z < 1,198 ) = F (1, 20 ) = 0,1151

supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119

= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
aos es 0,0082.

2)

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119

= P(z < -0, 35) = F(-0, 35 ) = 0, 3632


1.

7
1)
aos?

35,
9,105
119

Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119

= P(z < 1,198 ) = F (1, 20 ) = 0,1151

supere los 37 aos?

P(X > 37 aos) = P z >
37 - 35
9,105
119

= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
aos es 0,0082.

2)

P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119

= P(z < -0, 35) = F(-0, 35 ) = 0, 3632


1.

3.2. Problemas fundamentales de la inferencia
estadstica
En la vida cotidiana, como en el campo cientfico o profesional, surgen situa-
ciones caracterizadas por la incertidumbre pese a lo cual deben tomarse deci-
siones sustentadas usualmente en los modelos tericos elaborados con base
en observaciones previas de fenmenos similares.
Los dos problemas fundamentales que ataen a la inferencia estadstica
son la estimacin de un parmetro desconocido y las pruebas de hiptesis
cuyas soluciones se basan necesariamente en la evidencia muestral.
3.2.1. Estimacin por intervalo de confianza
La estimacin por intervalo de confianza de un parmetro desconoci-
do consiste en construir a partir de la evidencia muestral un interva-
lo o rango continuo de valores que contendra, con una cierta probabi-
lidad asociada, el verdadero valor del parmetro poblacional.
Por ejemplo, toda persona que realiza una rutina diaria de su casa al trabajo
de hecho est colectando evidencia muestral sobre el tiempo que le insume
el viaje. A partir de las veces que anteriormente hizo el recorrido casa-traba-
jo (lo que constituye un muestreo) estima un cierto intervalo de tiempo que
empleara un da cualquiera en llegar a su trabajo (se entiende, siguiendo la
rutina cotidiana), con una cierta probabilidad.
En el relato anterior se pueden identificar casi completamente todos los ele-
mentos necesarios para la construccin de un intervalo de confianza, a saber:
la evidencia muestral, el nivel de confianza la probabilidad de la estimacin
y el parmetro tiempo esperado a estimar.
La construccin de intervalos de confianza se basa en las distribuciones
que tienen los estadsticos muestrales, o estimadores de los parmetros
poblacionales, ya vistas en el apartado 3.1.
Intervalos de confianza para la media poblacional
Antes de abocarnos al clculo de intervalos desarrollaremos los fundamen-
tos de su construccin. Mantengamos por el momento la pauta del apartado
anterior de contar con una poblacin cuyos y son conocidos y que de ella
se extraer una muestra de tamao n.
La distribucin de los X alrededor de bajo las condiciones generales
expuestas en 3.1.3., se representa de la siguiente forma:
94
Grfico 3.5.
Si en vez de interesarnos en preguntas como P(X>a) P(X<b) nos plantera-
mos una del tipo P(a<x<b) con a y b equidistantes de .,el rea sombreada
(denominada 1)ser la respuesta.
Grfico 3.6.
Si 1 es la probabilidad de que x caiga dentro del intervalo [a,b] entonces
ser la probabilidad de que x caiga fuera de l. Como se puede advertir que-
dar partido en dos, porque estamos considerando un intervalo simtrico alre-
dedor de . Y estandarizando segn Z se tiene lo siguiente.
Grfico 3.7.
95
Estadistica
35
Medias muestrales
Grfico.3.3
0,11 1 0
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
35
Medias muestrales
Grfico.3.3
0,11 1 0
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
Los subndices de los Z estn en relacin con el criterio de acumulacin de la

tabla de la distribucin normal estndar. Como el punto a acumula /2 de
probabilidad su estandarizado Z ser Z
/2
y como el punto b acumula 1/2
de probabilidad su estandarizado ser Z
1/2
. En rigor Z
/2
y Z
1-/2
son igua-
les en valor absoluto pero tienen signo contrario.
Grfico 3.8.
Entonces estandarizando la variable X
el clculo de la probabilidad planteada ser:
Luego, despejando de
96
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
10

Los subndices de los Z estn en relacin con el criterio de acumulacin
de la tabla de la distribucin normal estndar. Como el punto a
acumula /2 de probabilidad su estandarizado Z ser Z
/2
y como el
punto b acumula 1/2 de probabilidad su estandarizado ser Z
1/2
.
En rigor Z
/2
y Z
1-/2
son iguales en valor absoluto pero tienen signo
contrario.

G.3.8.

Entonces estandarizando la variable

Z =
x
n


P(a < x < b) = P
a -
n
<
x
n
<
b
n

=1
P(a < x < b) = P Z
2
<
x
n
< Z
1
2

=1
P(a < x < b) = P Z
1
2
<
x
n
< Z
1
2

=1

10

Los subndices de los Z estn en relacin con el criterio de acumulacin
de la tabla de la distribucin normal estndar. Como el punto a
acumula /2 de probabilidad su estandarizado Z ser Z
/2
y como el
punto b acumula 1/2 de probabilidad su estandarizado ser Z
1/2
.
En rigor Z
/2
y Z
1-/2
son iguales en valor absoluto pero tienen signo
contrario.

G.3.8.

Entonces estandarizando la variable

Z =
x
n


P(a < x < b) = P
a -
n
<
x
n
<
b
n

=1
P(a < x < b) = P Z
2
<
x
n
< Z
1
2

=1
P(a < x < b) = P Z
1
2
<
x
n
< Z
1
2

=1

11

P Z
1
2
<
x
n
< Z
1
2

=1

se tiene
P Z
1
2
.

n
< x < Z
1
2
.

n

=1

Como + es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es

mx
= z
1
2
.
n

Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional + de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para +
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.

Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para +, se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:

P(Z
1
2
.

n
< x < Z
1
2
.

n
) =1

y teniendo en cuenta que ahora la incgnita es + la despejamos
obteniendo:

P x z
1
a
2

n
< < x + z
1

2

n

=1

se tiene
Como es conocido, X es la diferencia que podra haber entre la media de
la muestra que se seleccionar y la media conocida de la poblacin. Por su
naturaleza, a esta diferencia la consideramos como error.
X es el error de la media muestral respecto de la media poblacional y 1
es su probabilidad. El mximo valor que puede tomar ese error o error mxi-
mo, en valor absoluto es
Puede observarse que cuando se agranda el tamao de la muestra el error
mximo se achica y lo mismo ocurre cuando disminuye el nivel de confianza.
Como ambos casos tienen distintas connotaciones se analizarn con ms
detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general, no se
conoce el valor de la media poblacional . De ah la necesidad de su estima-
cin y para ello se utiliza la evidencia muestral y la informacin poblacional que
se posea como el tipo de distribucin poblacional (normal o no) y el conoci-
miento de otros parmetros (varianza o desvo estndar).
El clculo de la estimacin por intervalos de confianza para presenta dis-
tintos casos dependiendo de la informacin poblacional con que se cuente.
2
conocido
En este caso particular, para la construccin del intervalo de confianza para
, se parte de la expresin del error de la media muestral respecto de la
media poblacional a la que arribamos anteriormente:
y teniendo en cuenta que ahora la incgnita es la despejamos obteniendo:
Donde ahora 1- es la probabilidad, la confianza que tenemos de que el
intervalo
97
Estadistica
11

P Z
1
2
<
x
n
< Z
1
2

=1

se tiene

P Z
1
2
.

n
< x < Z
1
2
.

n

=1

error.

mx
= z
1
2
.
n

estndar).
que se cuente.

2
conocido

P(Z
1
2
.

n
< x < Z
1
2
.

n
) =1

obteniendo:

P x z
1
a
2

n
< < x + z
1

2

n

=1

11

P Z
1
2
<
x
n
< Z
1
2

=1

se tiene
P Z
1
2
.

n
< x < Z
1
2
.

n

=1

error.

mx
= z
1
2
.
n

estndar).
que se cuente.

2
conocido

P(Z
1
2
.

n
< x < Z
1
2
.

n
) =1

obteniendo:

P x z
1
a
2

n
< < x + z
1

2

n

=1

11

P Z
1
2
<
x
n
< Z
1
2

=1

se tiene
P Z
1
2
.

n
< x < Z
1
2
.

n

=1

error.

mx
= z
1
2
.
n

estndar).
que se cuente.

2
conocido

P(Z
1
2
.

n
< x < Z
1
2
.

n
) =1

obteniendo:

P x z
1
a
2

n
< < x + z
1

2

n

=1

11

P Z
1
2
<
x
n
< Z
1
2

=1

se tiene
P Z
1
2
.

n
< x < Z
1
2
.

n

=1

error.

mx
= z
1
2
.
n

estndar).
que se cuente.

2
conocido

P(Z
1
2
.

n
< x < Z
1
2
.

n
) =1

obteniendo:

P x z
1
a
2

n
< < x + z
1

2

n

=1

contenga al verdadero valor de .
El mismo intervalo (con una probabilidad 1 asociada) que anteriormen-
te se ubicaba alrededor del , ahora se ubica alrededor del X para poder esti-
mar (con una confianza 1) el desconocido.
Ntese adems que, en rigor, lo nico que se trajo del estudio previo es el
segmento que se coloc sobre X y su probabilidad asociada. No hay una dis-
tribucin sobre l (la distribucin de la muestra, en todo caso, no forma parte
de la construccin que hicimos).
En resumen, los lmites del intervalo se obtienen sumando y restando el
error mximo a la media muestral ya que sta es el centro del intervalo.
Grfico 3.9.
Por lo tanto, al intervalo tambin se lo puede expresar del siguiente modo:
Como el error mximo disminuye cuando aumenta el
tamao de la muestra o cuando es menor el nivel de confianza, entonces:
Si aumenta el tamao de la muestra, para un mismo nivel de confianza
el valor de z se mantiene constante se obtiene un intervalo de menor
amplitud que implica mayor precisin en la estimacin.
Si disminuye el nivel de confianza (manteniendo el tamao de la muestra) se
obtiene un intervalo de menor amplitud pero eso no implica mejorar la preci-
sin ya que el intervalo tendr menor probabilidad de contener al parmetro.
Ejemplo
Con el fin de controlar el proceso de llenado de paquetes de galletitas de
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en gramos
de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504; 512; 496;
512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la mqui-
na que la precisin de ella al envasar est dada por un desvo estndar de
= 5 gramos.
98
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
Con base en la muestra de los 16 paquetes estimaremos el peso medio de

todos los paquetes de galletitas envasados por esa mquina, mediante un
intervalo con un nivel de confianza de 0,95.
La informacin con que se cuenta es la siguiente.
Sobre la poblacin:
La distribucin de los pesos de todos los paquetes llenados por la mqui-
na es normal (o aproximadamente normal) porque los procesos de medi-
cin de un mismo valor nominal (medir longitudes, pesar, etc.) entregan
naturalmente poblaciones normales.
El desvo estndar = 5g.
Sobre la muestra:
El tamao de la muestra seleccionada es n = 16.
El peso medio de los paquetes X = 504g.
El desvo estndar S = 6,802g.
Se obtiene el intervalo de confianza para el peso medio m de llenado de los
paquetes, utilizando la expresin:
Sabiendo que el nivel de confianza establecido es 1- = 0,95 calculamos el
valor de 1-/2 y a continuacin buscamos en la tabla el z
1-/2
. Luego z
0,975
=
1,96.
Reemplazando se obtiene:
Concluimos que, con base en una muestra de 16 paquetes y con una con-
fianza del 95%, se estima que el peso medio de todos los paquetes fabrica-
dos se encuentra entre 501,55g y 506,45g.
Supongamos que el error mximo (2,45g) de la estimacin fuera grande para
cumplir con determinadas exigencias del control de calidad. En ese caso sera
necesario mejorar la estimacin achicando el error mximo tomando una mues-
tra de mayor tamao.
La pregunta que surge es de qu tamao deber ser la nueva muestra
para que el error mximo asociado de la futura estimacin sea, por ejemplo
de 1g, obviamente con el mismo nivel de confianza?
99
Estadistica
En la eleccin de un nivel
de confianza, son estn-
dares los valores 0,90; 0,95 o 0,99.
13
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en
gramos de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504;
512; 496; 512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la
mquina que la precisin de ella al envasar est dada por un desvo
estndar de = 5 gramos.
En base a la muestra de los 16 paquetes estimaremos el peso medio
de todos los paquetes de galletitas envasados por esa mquina, mediante
un intervalo con un nivel de confianza de 0,95.

COMIENZO DE PASTILLA EN nivel de confianza
En la eleccin de un nivel de confianza, son estndares los valores 0,90; 0,95 o
0,99.
FIN DE PASTILLA


Sobre la poblacin:

la distribucin de los pesos de todos los paquetes llenados por
la mquina es normal (o aproximadamente normal) porque los
procesos de medicin de un mismo valor nominal (medir
longitudes, pesar, etc.) entregan naturalmente poblaciones
normales.
el desvo estndar = 5g.

Sobre la muestra:

el tamao de la muestra seleccionada es n = 16.
el peso medio de los paquetes = 504g.
el desvo estndar S = 6,802g.

Se obtiene el intervalo de confianza para el peso medio de llenado de
los paquetes, utilizando la expresin:

I
= x z
1

n
, x + z
1

n

Sabiendo que el nivel de confianza establecido es 1- = 0,95
calculamos el valor de 1-/2 y a continuacin buscamos en la tabla el
z
1-/2
. Luego z
0,975
= 1,96.


I
= 504 1,96
5
16
,504 +1,96
5
16

= 501, 55; 506, 45
[ ]

Concluimosque, con baseen una muestra de16 paquetesy con una
confianza del 95%, seestima queel peso medio detodoslospaquetes
fabricadosseencuentra entre501,55g y 506,45g.

13
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en
gramos de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504;
512; 496; 512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la
mquina que la precisin de ella al envasar est dada por un desvo
estndar de = 5 gramos.
En base a la muestra de los 16 paquetes estimaremos el peso medio
de todos los paquetes de galletitas envasados por esa mquina, mediante
un intervalo con un nivel de confianza de 0,95.

COMIENZO DE PASTILLA EN nivel de confianza
En la eleccin de un nivel de confianza, son estndares los valores 0,90; 0,95 o
0,99.
FIN DE PASTILLA


Sobre la poblacin:

la distribucin de los pesos de todos los paquetes llenados por
la mquina es normal (o aproximadamente normal) porque los
procesos de medicin de un mismo valor nominal (medir
longitudes, pesar, etc.) entregan naturalmente poblaciones
normales.
el desvo estndar = 5g.

Sobre la muestra:

el tamao de la muestra seleccionada es n = 16.
el peso medio de los paquetes = 504g.
el desvo estndar S = 6,802g.

Se obtiene el intervalo de confianza para el peso medio de llenado de
los paquetes, utilizando la expresin:
I
= x z
1

n
, x + z
1

Sabiendo que el nivel de confianza establecido es 1- = 0,95
calculamos el valor de 1-/2 y a continuacin buscamos en la tabla el
z
1-/2
. Luego z
0,975
= 1,96.


I
= 504 1,96
5
16
,504 +1,96
5
16

= 501, 55; 506, 45
[ ]

Concluimosque, con baseen una muestra de16 paquetesy con una
confianza del 95%, seestima queel peso medio detodoslospaquetes
fabricadosseencuentra entre501,55g y 506,45g.

De la frmula del
mx.
se despeja n.
Para poder estimar la media de todos los paquetes envasados por esa mqui-
na con un error mximo de 1g y con una confianza del 95% debern selec-
cionarse como mnimo 97 paquetes.
2.
Con base en la muestra de 20 piezas plsticas de la matriz ME4 con-
signada en el apartado 1.3. de la Unidad 1 y sabiendo que la precisin
de la balanza est definida por un desvo estndar de 1g.
a. Estimar, con un nivel de confianza del 95%, el peso medio de todas
las piezas plsticas fabricadas por esa empresa.
b. En qu se fundamenta la normalidad de la distribucin de todos
los pesos de las piezas plsticas?
2
desconocido
Consideremos ahora que la especificacin de la desviacin estndar pobla-
cional dada en el problema anterior no se conoce, porque se perdi el cat-
logo o porque el fabricante de la mquina no lo provey, o por otras razones.
Podemos realizar igualmente la estimacin de la media poblacional?
Si la poblacin es normal, y estamos en ese caso, es posible calcular el
error mximo reemplazando el s desconocido por su mejor estimador que es
el desvo muestral S. Pero en lugar de la distribucin normal estndar se debe-
r utilizar la distribucin t de Student la cual fue diseada especialmente para
el muestreo en poblaciones normales.
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes que son todas normales con media
y desviacin estndar s. Entonces la variable aleatoria tiene una distribucin t
con n-1 grados de libertad.
Caractersticas de la distribucin t de Student
1- Al igual que en la distribucin Normal:
a) El rango de valores de la t de Student vara de - a +
b) Es simtrica respecto de su media.
V(t) siempre mayor a 1 pero si crece el tamao de la muestra, n el desvo tiende a 1 y
la distribucin t es asintticamente normal de parmetros (0, 1)
100
La di st r i buci n t de
Student fue publicada en
1908 por W. S. Gosset bajo el seu-
dnimo de Student.
x
x
3- Es ms aplanada que la Normal por tener mayor dispersin.
4- Hay una familia de curvas de la distribucin t de Student dependiendo de los grados de
libertad que para una variable es n1 como se muestra en el grfico G.3.10.
Grfico 3.10.
5- Las curvas dependen de los grados de libertad, a mayor grado de libertad corresponde
menor dispersin.
Entonces, en este caso el error mximo es
Y el intervalo de confianza para la media poblacional es:
Volviendo al problema:
La informacin con la que contamos es la siguiente.
Sobre la poblacin:
La distribucin de los pesos de todos los paquetes llenados por la mqui-
na es normal (o aproximadamente normal) porque los procesos de medi-
cin de un mismo valor nominal (medir longitudes, pesar, etc.) entregan
naturalmente poblaciones normales.
Sobre la muestra:
El tamao de la muestra seleccionada n = 16.
El peso medio de los paquetes de la muestra X=504g.
El desvo de la muestra S = 6,802g.
Utilizando el mismo nivel de confianza 1 = 0,95 y sabiendo que los grados
de libertad son 15, buscamos en la tabla de la t del Anexo el valor corres-
pondiente a t
n-1;1-/2
. Luego t
15;0,975
= 2,131.
Reemplazando los datos construimos el intervalo de confianza para la media:
101
Estadistica
x
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
x
Finalmente, con base en una muestra de 16 paquetes y con una confianza del
95%, se estima que el peso medio de todos los paquetes fabricados se encuen-
tra entre 500,38g y 507,63g.
Notamos que el intervalo obtenido es menos preciso que el hallado en el
ejemplo anterior, donde se conoca el desvo poblacional, y esto se debe a que
en este segundo caso slo se cuenta con las medidas muestrales. Como
era de esperar al contar con menor informacin se obtuvo menor precisin
en la estimacin.
3.
Con base en la muestra de 20 piezas plsticas de la matriz ME4 con-
signada en el apartado 1.3 de la Unidad 1;
a. Estimar, con un nivel de confianza del 95%, la longitud media de
todas las piezas plsticas fabricadas por esa empresa.
b. Qu supuesto tuvo en cuenta acerca de la distribucin de todas las
longitudes de las piezas de plstico para realizar la estimacin?
Poblacin no normal y
2
conocido
Cuando la poblacin no es normal o se desconoce el tipo de distribucin que
posee y se conoce la varianza poblacional, para poder estimar la media pobla-
cional es necesario que la muestra sea grande para que en virtud del Teorema
central del lmite dicha estimacin pueda realizarse utilizando la misma expre-
sin de la primera situacin tratada.
Por otro lado, si la muestra es chica no se puede llevar a cabo la estimacin
por intervalo de confianza de la media poblacional.
Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas las
transacciones bancarias posibles por la totalidad de los clientes de un deter-
minado banco.
En este problema la distribucin de los tiempos empleados para realizar
todas las transacciones bancarias no necesariamente es normal.
Repasar las caractersticas de la poblacin definida en este ejemplo con
la tratada en la Unidad 2, apartado 2.2.4. para reconocer la distinta natu-
raleza de cada una.
102
Convengamos que la desviacin estndar de todas las operaciones es cono-
cida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar
todas las operaciones y se seleccionara una muestra aleatoria de 60 clientes
que emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minu-
tos, la informacin con la que contaramos sera la siguiente:
Sobre la poblacin:
El desvo = 1,5 min.
Sobre la muestra:
El tiempo medio de las transacciones de la muestra X=3,7min.
El desvo de la muestra S = 2,1 min.
Calcularemos un intervalo para con una confianza del 95%.
Luego, con base en una muestra de 60 transacciones y con una confianza del
95%, se estima que el tiempo medio de todas las operaciones del banco se
encuentra entre 3,31 min y 4,08 min.
Intervalo de confianza para la proporcin poblacional
Toda la lgica empleada para fundamentar la construccin de intervalos de
confianza para la media poblacional puede extenderse a la fundamenta-
cin de la construccin de intervalos de confianza para estimar la proporcin
poblacional P debido a que, en virtud al Teorema central del lmite, la varia-
ble aleatoria proporcin muestral tiene distribucin normal de parmetros

si el tamao n de la muestra es grande.
Para construir un intervalo de confianza para la proporcin poblacional, al
igual que en los casos vistos para la media, el intervalo se centrar en el esta-
dstico muestral y ser simtrico alrededor de l.
En este caso el clculo del error mximo debera ser:
pero al desconocer P se utiliza su mejor estimador p, quedando
103
Estadistica
17

Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas
las transacciones bancarias posibles por la totalidad de los clientes de un
determinado banco.
En este problema la distribucin de los tiempos empleados para
realizar todas las transacciones bancarias no necesariamente es normal.

Repasar las caractersticas de la poblacin definida en este
ejemplo con la tratada en la Unidad 2, apartado 2.2.4. para
reconocer la distinta naturaleza de cada una.

Convengamos que la desviacin estndar de todas las operaciones es
conocida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar todas
las operaciones y se seleccionara una muestra aleatoria de 60 clientes que
emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minutos, la
informacin con la que contaramos sera la siguiente:

Sobre la poblacin:
el desvo = 1,5 min
Sobre la muestra:
el tamaos de la muestra seleccionada n = 60
el tiempo medio de las transacciones de la muestra

el desvo de la muestra S = 2,1 min

Calcularemos un intervalo para ? con una confianza del 95%.

I
= 3, 7 1, 96
1, 5
60
, 3, 7 +1, 96
1, 5
60

= 3, 31 , 4, 08
( )

Luego, con base en una muestra de 60 transacciones y con una
confianza del 95%, se estima que el tiempo medio de todas las
operaciones del banco se encuentra entre 3,31 min y 4,08 min.


Toda la lgica empleada para fundamentar la construccin de intervalos
de confianza para la media poblacional puede extenderse a la
fundamentacin de la construccin de intervalos de confianza para
estimar la proporcin poblacional P debido a que, en virtud al Teorema
central del lmite, la variable aleatoria proporcin muestral tiene
distribucin normal de parmetros ?
p
= P y
p
=
P.(1P)
n
si el tamao
n de la muestra es grande.
17

Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas
las transacciones bancarias posibles por la totalidad de los clientes de un
determinado banco.
En este problema la distribucin de los tiempos empleados para
realizar todas las transacciones bancarias no necesariamente es normal.

Repasar las caractersticas de la poblacin definida en este
ejemplo con la tratada en la Unidad 2, apartado 2.2.4. para
reconocer la distinta naturaleza de cada una.

Convengamos que la desviacin estndar de todas las operaciones es
conocida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar todas
las operaciones y se seleccionara una muestra aleatoria de 60 clientes que
emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minutos, la
informacin con la que contaramos sera la siguiente:

Sobre la poblacin:
el desvo = 1,5 min
Sobre la muestra:
el tamaos de la muestra seleccionada n = 60
el tiempo medio de las transacciones de la muestra

el desvo de la muestra S = 2,1 min

Calcularemos un intervalo para ? con una confianza del 95%.

I
= 3, 7 1, 96
1, 5
60
, 3, 7 +1, 96
1, 5
60

= 3, 31 , 4, 08
( )

Luego, con base en una muestra de 60 transacciones y con una
confianza del 95%, se estima que el tiempo medio de todas las
operaciones del banco se encuentra entre 3,31 min y 4,08 min.


Toda la lgica empleada para fundamentar la construccin de intervalos
de confianza para la media poblacional puede extenderse a la
fundamentacin de la construccin de intervalos de confianza para
estimar la proporcin poblacional P debido a que, en virtud al Teorema
central del lmite, la variable aleatoria proporcin muestral tiene
distribucin normal de parmetros ?
p
= P y
p
=
P.(1P)
n
si el tamao
n de la muestra es grande.
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.

I
P
= p
mx
; p +
mx
[ ]


mx
= z
1
P.(1P)
n


mx
z
1
p.(1 p)
n

Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.

el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396

Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.

Reemplazando se tiene que el intervalo para P es:

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200

I
P
= [0,386; 0,406]

18

I
P
= p
mx
; p +
mx
[ ]


mx
= z
1
P.(1P)
n


mx
z
1
p.(1 p)
n

P resulta

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

Ejemplo
ese programa.

p =
871
2200
= 0, 396

0,975


I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200

I
P
= [0,386; 0,406]

18

I
P
= p
mx
; p +
mx
[ ]


mx
= z
1
P.(1P)
n


mx
z
1
p.(1 p)
n

P resulta

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

Ejemplo
ese programa.

p =
871
2200
= 0, 396

0,975


I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200

I
P
= [0,386; 0,406]

Por tal motivo, el intervalo de confianza para la proporcin poblacional P resulta
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado pro-
grama, se seleccion una muestra de 2200 familias que poseen uno o ms
televisores en una determinada ciudad, y de la muestra se obtuvo que 871
familias ven ese programa. Estimar, utilizando un nivel de confianza de 0,95,
un intervalo para la proporcin de familias que ven ese programa.
La proporcin muestral de familias que ven el programa de TV.
0,975
Con base en una muestra de 2200 familias con el 95% de confianza la verda-
dera proporcin de familias que ven ese programa de TV est comprendida entre
el 38,6% y el 40,6%.
4.
Con base en la muestra de las 96 familias escogidas al azar de cierta loca-
lidad (apartado 1.1.2. de la Unidad 1) con 1 = 0,95 estimar la pro-
porcin de familias en toda la poblacin cuyo gasto medio en alimen-
tos supere los $46.
Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error mximo, que
en su forma original y en su forma aproximada es:
104
18

I
P
= p
mx
; p +
mx
[ ]


mx
= z
1
P.(1P)
n


mx
z
1
p.(1 p)
n

P resulta

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

Ejemplo
ese programa.

p =
871
2200
= 0, 396

0,975


I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200

I
P
= [0,386; 0,406]

18

I
P
= p
mx
; p +
mx
[ ]


mx
= z
1
P.(1P)
n


mx
z
1
p.(1 p)
n

P resulta

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

Ejemplo
ese programa.

p =
871
2200
= 0, 396

0,975


I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200

I
P
= [0,386; 0,406]

18

I
P
= p
mx
; p +
mx
[ ]


mx
= z
1
P.(1P)
n


mx
z
1
p.(1 p)
n

P resulta

I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

Ejemplo
ese programa.

p =
871
2200
= 0, 396

0,975


I
P
= p z
1

2
p.(1 p)
n
, p + z
1

2
p.(1 p)
n

I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200

I
P
= [0,386; 0,406]

19
Con base en una muestra de 2200 familias con el 95% de confianza la
verdadera proporcin de familias que ven ese programa de TV est
comprendida entre el 38,6% y el 40,6%.

4.
Con base en la muestra de las 96 familias escogidas al azar de
cierta localidad (apartado 1.1.2. de la Unidad 1) con 1 =
0,95 estimar la proporcin de familias en toda la poblacin
cuyo gasto medio en alimentos supere los $46.
FIN DE ACTIVIDAD

Como se hizo para la media, se despeja n de la frmula del error
mximo, que en su forma original y en su forma aproximada es:

mx
= z
1
P.(1P)
n

z
1
p.(1 p)
n

Al no conocer P porque es lo que se quiere estimar y al no conocer p
porque an no se tom la muestra (justamente necesitamos calcular de
qu tamao mnimo deber ser), se presenta un problema que debemos
sortear. Para hacerlo se parte de la suposicin terica de que P = 0,50 ,
lo que es lgico porque es el sustento terico de la curva de distribucin
de las proporciones muestrales; aunque luego como es esperable la
realidad difiera del modelo terico.

Reemplazando y despejando n se tiene:
mx
= z
1~
o
2
0, 50.0, 50
n
= z
1~
o
2
.
0, 50
n
=n =
z
1~o
.0, 50
mx
[
\
|
]
j
2

3.2.2. Pruebas de hiptesis

Una prueba test o contraste de hiptesis consiste en un
procedimiento mediante el cual se somete a prueba un
parmetro (u otra caracterstica) poblacional desconocido sobre
el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de
hiptesis debe basarse en la evidencia muestral.
FIN DE LEER ATENTO

Cuando el objetivo de una prueba de hiptesis es testear el valor de un
parmetro (desconocido) a partir de un valor hipottico
o
de dicho
parmetro, surge una primera hiptesis estadstica denominada hiptesis
nula (H
o
) que presupone que no habra una diferencia significativa entre
y
o
y que se expresa
Al no conocer P porque es lo que se quiere estimar y al no conocer p porque
an no se tom la muestra (justamente necesitamos calcular de qu tamao
mnimo deber ser), se presenta un problema que debemos sortear. Para
hacerlo se parte de la suposicin terica de que P = 0,50, lo que es lgico por-
que es el sustento terico de la curva de distribucin de las proporciones
muestrales; aunque luego como es esperable la realidad difiera del mode-
lo terico.
Una prueba test o contraste de hiptesis consiste en un procedimiento
mediante el cual se somete a prueba un parmetro (u otra caractersti-
ca) poblacional desconocido sobre el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de hiptesis
debe basarse en la evidencia muestral.
Cuando el objetivo de una prueba de hiptesis es testear el valor de un par-
metro (desconocido) a partir de un valor hipottico
o
de dicho parmetro,
surge una primera hiptesis estadstica denominada hiptesis nula (H
o
) que
presupone que no habra una diferencia significativa entre y
o
y que se
expresa
H
o
: =
o
Si la evidencia muestral contradijera la afirmacin de H
0
y existiera sospecha
de que la diferencia pudiera ser significativa, surge por oposicin una segun-
da hiptesis estadstica que llamamos hiptesis alternativa (H
A
) la cual sos-
tiene, en contraste con H
0
, que el valor del parmetro diferira significativa-
mente del hipottico
0
.
H
A
puede asumir alguna de las siguientes formas:
H
A
: <
0
H
A
: >
0
En una prueba de hiptesis (PPHH) la hiptesis nula H
0
es en rigor la que se
somete a prueba, y como resultante H
0
puede ser aceptada o rechazada. Si
H
0
resulta ser rechazada la conclusin final de la prueba se inclinara a favor
de H
A
.
Debido al ambiente de incertidumbre en el que se realiza una PPHH, dado
que se basa en la evidencia proporcionada por una muestra, en la decisin final
se pueden cometer dos tipos de errores: rechazar H
0
si en realidad fuere ver-
dadera y aceptar H
0
si en realidad fuere falsa. El primero de ellos se denomina
error de tipo I y tiene asociada una probabilidad , llamada nivel de significa-
cin de la prueba.
105
Estadistica
19
Con base en una muestra de 2200 familias con el 95% de confianza la
verdadera proporcin de familias que ven ese programa de TV est
comprendida entre el 38,6% y el 40,6%.

4.
Con base en la muestra de las 96 familias escogidas al azar de
cierta localidad (apartado 1.1.2. de la Unidad 1) con 1 =
0,95 estimar la proporcin de familias en toda la poblacin
cuyo gasto medio en alimentos supere los $46.
FIN DE ACTIVIDAD

Como se hizo para la media, se despeja n de la frmula del error
mximo, que en su forma original y en su forma aproximada es:

mx
= z
1
P.(1P)
n
z
1
p.(1 p)
n

Al no conocer P porque es lo que se quiere estimar y al no conocer p
porque an no se tom la muestra (justamente necesitamos calcular de
qu tamao mnimo deber ser), se presenta un problema que debemos
sortear. Para hacerlo se parte de la suposicin terica de que P = 0,50 ,
lo que es lgico porque es el sustento terico de la curva de distribucin
de las proporciones muestrales; aunque luego como es esperable la
realidad difiera del modelo terico.


mx
= z
1~
o
2
0, 50.0, 50
n
= z
1~
o
2
.
0, 50
n
=n =
z
1~o
.0, 50
mx
[
\
|

]
j
2


Una prueba test o contraste de hiptesis consiste en un
procedimiento mediante el cual se somete a prueba un
parmetro (u otra caracterstica) poblacional desconocido sobre
el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de
hiptesis debe basarse en la evidencia muestral.
FIN DE LEER ATENTO

Cuando el objetivo de una prueba de hiptesis es testear el valor de un
parmetro (desconocido) a partir de un valor hipottico
o
de dicho
parmetro, surge una primera hiptesis estadstica denominada hiptesis
nula (H
o
) que presupone que no habra una diferencia significativa entre
y
o
y que se expresa
El valor hipottico de un
parmetro es una pre-
suncin o una suposicin que se
realiza sobre l, como por ejem-
plo una especificacin para el con-
trol de calidad, un valor histrico,
un valor de comparacin o un valor
que se elige arbitrariamente.
P(error de tipo I) = P(rechazar H
0
/ H
0
verdadera) = a
El segundo error (aceptar H
0
si en realidad fuere falsa) se llama error de tipo
II y su probabilidad asociada es .
P(error de tipo II) = P(aceptar H
0
/ H
0
falsa) =
En esta carpeta se trabajar slo con la probabilidad a de cometer un error de
tipo I.
Prueba de hiptesis para la media poblacional
La PPHH para la media presenta distintos casos, dependiendo de la infor-
macin poblacional con que se cuente, tal como ocurre en la estimacin por
intervalos de confianza.
2
conocido
Volviendo al ejemplo de controlar el proceso de llenado de paquetes de galle-
titas de medio kilo, abordado en estimacin de la media poblacional por inter-
valo de confianza, cabe preguntarnos si se podra imprimir en todos los paque-
tes el valor nominal de 500g. Para responder a la pregunta debemos realizar
un contraste de hiptesis donde, el parmetro desconocido (que genrica-
mente llambamos ) es el promedio del peso de todos los paquetes enva-
sados, cuyo valor hipottico
0
= 500g es el valor nominal que se quiere impri-
mir. Luego, la hiptesis nula ser H
0
: =
0
, es decir:
H
0
: = 500g
A partir de la evidencia de la muestra de los 16 paquetes donde el peso medio
result X= 504g, se puede plantear la siguiente hiptesis alternativa,
H
A
: > 500g
dado que la evidencia muestral arroj un peso medio (estadstico muestral)
superior al valor nominal (parmetro hipottico).
Entonces el juego de hiptesis para esta PPHH es:
H
0
: = 500g
H
A
: > 500g
Estableceremos ahora un criterio que permita discriminar cundo la diferen-
cia entre el estadstico muestral y el parmetro hipottico no es significativa
(y por extensin no sera significativa la diferencia entre y
0
por lo que se
acepta la H
0
) y cundo esa diferencia s es significativa (y en consecuencia se
rechaza H
0
a favor de H
A
).
Ese criterio est sustentado por el nivel de significacin de la prueba que
determina un valor denominado punto crtico, el cual establece dos regiones:
106
Grfico 3.11.
En particular esta prueba se denomina unilateral derecha porque la zona de
rechazo se encuentra a la derecha del punto crtico.
El desarrollo de la prueba o la contrastacin de las hiptesis se realiza en
el dominio de la normal estndar, por lo que habr que estandarizar tanto
0
y el punto crtico.
Grfico 3.12.
El X estandarizado se denomina estadstico de prueba.
Para el problema que estamos desarrollando, fijaremos un nivel de significacin
o probabilidad de cometer error tipo I de = 0,05.
El punto crtico en Z y el estadstico de prueba resultan:
Grfico 3.13.
107
Estadistica
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico
O
X
1-
O
O
0
0
Z
Z
G.3.13
O
O
1,64
Z
1
0,05
3,2
1-
O
G.3.11
G.3.12
O
Pto.
crtico
O
X
1-
O
O
0
0
Z
Z
G.3.13
O
O
1,64
Z
1
0,05
3,2
1-
O
G.3.11
G.3.12
O
Pto.
crtico
O
X
1-
O
O
0
0
Z
Z
G.3.13
O
O
1,64
Z
1
0,05
3,2
Si el juego de hiptesis
fuera H
0
: = 500g y H
A
:
< 500g, la zona de rechazo del
grfico estara a la izquierda y la
prueba se denominara unilateral
izquierda.
En la eleccin de un nivel
de si gni fi caci n son
estndares los valores 0,10; 0,05
o 0,01, pero puede optarse por
cualquier otro valor intermedio
entre ellos.
Finalmente, comparando el estadstico de prueba calculado Z=3,2 con el punto
crtico Z
*
0,95
=1,64, observamos que aqul cae en la zona de rechazo de la H
0
por lo que, con base en la muestra de 16 paquetes y con un nivel de signifi-
cacin del 5%, rechazamos H
0
a favor de H
A
.
Conclusin estadstica, con base en la muestra de 16 paquetes y con una
probabilidad de cometer error de tipo I de 0,05; habra una diferencia signifi-
cativa entre la media de todos los paquetes envasados y el valor nominal de
500g. O tambin, el peso medio de todos los paquetes envasados podra ser
significativamente superior a 500g, en consecuencia, no estaramos en con-
diciones de imprimir 500g en los paquetes.
Comentario adicional
La conclusin estadstica a la que se arrib est indicando que habra un desa-
juste en el proceso de llenado de los paquetes por lo cual se debera inspec-
cionar el proceso de envasado. Realizar un ajuste, si fuere necesario, y desar-
mar los paquetes ya hechos para volver a llenarlos con la mquina corregida.
Como esta decisin implica costos adicionales en la fabricacin conviene, en
primer lugar, agrandar la muestra y luego, de acuerdo con los nuevos resulta-
dos del test, tomar la decisin.
5.
Un fraccionador de soda custica envasa paquetes utilizando una mqui-
na que tiene una precisin de =8 gramos. Sobre una partida lista para
su distribucin, compuesta de paquetes cuyo valor nominal es de 250g,
seleccion una muestra de 45 bolsas la cual arroj una media de 245
gramos con un desvo de 10 gramos. La evidencia muestral estara indi-
cando que la media de toda la partida no tendra una diferencia signi-
ficativa con el valor nominal impreso en los envases?
2
desconocido
Si en el proceso de llenado de paquetes de galletitas de medio kilo no se
conoce la precisin de la mquina, la prueba se realiza utilizando el desvo de
la muestra s= 6,802g. En este caso, se usa la t de Student y en consecuen-
cia las expresiones del punto crtico y del estadstico de prueba son respec-
tivamente:
Nuevamente el valor calculado del estadstico de prueba es mayor al punto cr-
tico y cae en la zona de rechazo de la H
0
, entonces se rechaza que = 500g
y se llega a la siguiente conclusin estadstica.
Con base en una muestra de 16 paquetes, desconociendo la precisin de
la mquina y con un nivel de significacin del 5%, el peso medio de todos los
108
23
Comentario adicional
La conclusin estadstica a la que se arrib est indicando que habra un
desajuste en el proceso de llenado de los paquetes por lo cual se debera
inspeccionar el proceso de envasado. Realizar un ajuste, si fuere
necesario, y desarmar los paquetes ya hechos para volver a llenarlos con
la mquina corregida. Como esta decisin implica costos adicionales en
la fabricacin conviene, en primer lugar, agrandar la muestra y luego, de
acuerdo con los nuevos resultados del test, tomar la decisin.

5.
Un fraccionador de soda custica envasa paquetes utilizando una
mquina que tiene una precisin de =8 gramos. Sobre una partida lista
para su distribucin, compuesta de paquetes cuyo valor nominal es de
250g, seleccion una muestra de 45 bolsas la cual arroj una media de
245 gramos con un desvo de 10 gramos. La evidencia muestral estara
indicando que la media de toda la partida no tendra una diferencia
significativa con el valor nominal impreso en los envases?
FIN DE ACTIVIDAD

2
desconocido
Si en el proceso de llenado de paquetes de galletitas de medio kilo no se
conoce la precisin de la mquina, la prueba se realiza utilizando el
desvo de la muestra s= 6,802g. En este caso, se usa la t de Student y en
consecuencia las expresiones del punto crtico y del estadstico de
prueba son respectivamente:
t
n1,1
*
y

t =
x
0
S
n

Entonces

t
n1,1
*
= t
15;0,95
*
=1, 75 y

t =
x
0
S
n
=
504 500
6, 802
16
= 2, 35

Nuevamente el valor calculado del estadstico de prueba es mayor al
punto crtico y cae en la zona de rechazo de la H
0
, entonces se rechaza
que B = 500g y se llega a la siguiente conclusin estadstica.
Con base en una muestra de 16 paquetes, desconociendo la precisin
de la mquina y con un nivel de significacin del 5%, el peso medio de
todos los paquetes envasados podra ser significativamente superior a
500g, en consecuencia, no estaramos en condiciones de imprimir 500g
en los paquetes.

Pruebas de hi ptesis bilaterales o a dos col as
Estas pruebas se generan en ciertos problemas donde previamente a la
realizacin de la m uestra , es decir antes de contar con la evidencia
muestral, es necesario tener definida la regin de rechazo.
Son ejemplos de estas pruebas algunas rutinas de control de calidad, en
las que entra en consideracin que se estara en situacin crtica si
paquetes envasados podra ser significativamente superior a 500g, en con-
secuencia, no estaramos en condiciones de imprimir 500g en los paquetes.
Pruebas de hiptesis bilaterales o a dos colas
Estas pruebas se generan en ciertos problemas donde previamente a la realizacin de la mues-
tra, es decir antes de contar con la evidencia muestral, es necesario tener definida la regin
de rechazo.
Son ejemplos de estas pruebas algunas rutinas de control de calidad, en las que entra en con-
sideracin que se estara en situacin crtica si X cayera tanto a la derecha como a la izquierda
de
0
. En este caso la regin de rechazo est definida en dos tramos y hay dos puntos crticos.
Grfico 3.14.
Consecuentemente, el juego de hiptesis es:
H
0
: =
0
H
A
:
0
El desarrollo de la prueba de hiptesis es similar a la anterior, teniendo en cuenta que: si el
estadstico de prueba Z cayera en la zona de aceptacin, se acepta H
0;
si Z cayera dentro de
la regin crtica (zona de rechazo de H
0
) se rechaza H
0
y si estuviera muy prximo a Z* -
Z* es conveniente agrandar la muestra.
Grfico 3.15. Cuadro gua en inferencia estadstica para la media poblacional
109
Estadistica
0
Z
G.3.15
G.3.14
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
O
O
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
0
Z
G.3.15
G.3.14
O
1,64
0,05
0,38
1-
/2 /2
O
O
O
Z* Z* Z 0
G.3.14
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
conocido?
n>30?
hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
Prueba de hiptesis para la proporcin poblacional
En la muestra de 2200 familias del ejemplo utilizado en intervalos de con-
fianza para la proporcin poblacional, las que ven un determinado programa
de TV representan el 39,6%.
Los productores del programa, para decidir los costos de los espacios
comerciales cuentan con un raiting histrico del 40%. La evidencia muestral
estara indicando una disminucin significativa de la posicin del programa
en el raiting?
Para responder a la pregunta se realizar una PPHH con un nivel de signifi-
cacin del 5%.
Entonces, el par de hiptesis para esta PPHH es:
H
0
: P = 0,40
H
A
: P < 0,40
Dado que el tamao de la muestra es grande, el estadstico proporcin mues-
tral tiene distribucin normal. El punto crtico y el estadstico de prueba son,
respectivamente. Resultando,
Grfico.3.16.
que el estadstico de prueba cae en la zona de aceptacin de la H
0
(ya que -
1,64 < -0,38).
Conclusin: con base en una muestra de 2200 familias y con un nivel de sig-
nificacin de 0,05, la proporcin de familias que ven ese programa de TV en
toda la poblacin no habra cambiado significativamente.
6.
Un mtodo de lectura veloz es efectivo en el 70% de los casos. Un nuevo
mtodo intenta mejorar la efectividad y para comprobarlo se toma una
muestra de 205 estudiantes de los cuales 155 mejoraron su lectura. Se puede
concluir que el nuevo mtodo es significativamente mejor que el anterior?
110
25
y
Z
p P
0
P
0
.(1 P
0
)
n
0, 396 0, 40
0, 40.0, 60
2200
0, 38
0
Z
G.3.15
G.3.14
O
1,64
0,05
0,38
1-
/2 /2
O
O
O
Z* Z* Z 0
G.3.14
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
conocido?
n>30?
hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
Procedimiento para realizar una prueba de hiptesis
Cualquiera sea el parmetro que se someta a una PPHH, el procedi-
miento involucra los siguientes pasos:
Formular las hiptesis a contrastar a partir de la comparacin de la
evidencia muestral o del planteo previo a la evidencia (prueba bila-
teral) con el valor hipottico del parmetro.
Elegir el nivel de significacin.
Designar el tipo de distribucin de probabilidades del estimador alre-
dedor del parmetro a probar.
Calcular el o los puntos crticos.
Estandarizar el estadstico muestral para producir el estadstico de
prueba.
Observar la zona en la que se ubica el estadstico de prueba respec-
to del o de los puntos crticos.
Decidir la aceptacin o el rechazo de la hiptesis nula, o si el esta-
dstico de prueba se encuentra en un entorno muy prximo al punto
crtico la realizacin de una nueva prueba seleccionando una mues-
tra ms grande.
Concluir en el marco del problema.
7.
Al aumentar el nivel de significacin en una PPHH, la probabilidad de
rechazar una hiptesis nula que en realidad fuera verdadera: aumenta,
disminuye o permanece inalterada?
111
Estadistica
113
Elementos bsicos de econometra
Ob je ti vos
Especificar algunos modelos de relacin entre variables econmicas.
Predecir el comportamiento de determinados agentes econmicos con base
en los modelos de relacin elaborados.
4.1. Introduccin
No hay error ms comn que el de suponer que, porque se hicieron prolonga-
dos y exactos clculos matemticos, la aplicacin del resultado a algn hecho de
la naturaleza conduce a la certeza absoluta.
A.A. Whitehead
(citado por M. J. Moreney en Hechos y Estadsticas)
Un fenmeno econmico cualquiera puede entenderse como el resultado de
la accin de mltiples variables que inciden sobre l en distinto grado y que
pueden utilizarse como variables potencialmente explicativas del comporta-
miento de dicho fenmeno.
En su forma general, el anlisis economtrico consiste en estudiar un mode-
lo que relacione la variable Y representativa del fenmeno econmico con las
posibles variables explicativas X
1
, X
2
,.....,X
k
. Tal modelo de relacin puede
representarse matemticamente como
Y = f (X
1
, X
2
,.....,X
k
)
Donde la funcin f puede asumir distintas expresiones matemticas a saber:
lineal, logartmica, exponencial, potencial, etctera.
Particularmente un modelo lineal de relacin expresa el comportamiento
medio de la variable Y en funcin del conjunto de variables explicativas X
i
y
tiene la siguiente expresin general,
=
Y = +
1
.X
1
+
2
.X
2
+...+
k
.X
k
en la cual ,
1
,...
k
son los parmetros del modelo.
El anlisis de la relacin funcional entre la variable a explicar y las varia-
bles explicativas se denomina anlisis de regresin.
4
El modelo se completa con el anlisis de correlacin que consiste en estu-
diar el grado o fuerza de la relacin existente entre ambas variables.
Los anlisis de regresin y correlacin lineales (apartado 4.2.) ms simples
corresponden al modelo lineal bivariado en el cual slo interviene una varia-
ble explicativa y cuya expresin matemtica es:
Y = + .X con parmetros y
y es el que desarrollaremos en esta carpeta.
En el caso particular en que la variable explicativa es el tiempo, el mode-
lo corresponde a las denominadas series cronolgicas o series de tiempo
(apartado 4.3).
4.2. Anlisis de regresin y de correlacin
El diagrama de puntos 4.1. es la representacin grfica conjunta de las varia-
bles salario quincenal actual y edad de la poblacin de todos los trabajadores
de la empresa cooperativa, de la cual se extrajo la muestra de 20 empleados
de la ME1 de la Unidad I. Sobre dicho grfico puede observarse tambin la
recta de regresin poblacional que resume el comportamiento medio de la
nube de puntos.
Grfico 4.1.
En este problema partimos de una supuesta poblacin conocida. Sin embar-
go, en la realidad de los trabajos estadsticos suelen desconocerse los datos
de la totalidad de la poblacin y se trabaja con los datos de una muestra repre-
sentativa extrada de aquella.
En el diagrama 4.2. se indentifican los datos que conforman la muestra
ME1 extrados aleatoriamente de la poblacin, que en lo sucesivo considera-
remos desconocida.
114
G.4.2.
Salario quincenal actual y edad
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
G.4.1.
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
Grfico 4.2.
A partir de los datos de la muestra se construye la recta de regresin mues-
tral y =a-b.x la cual ser el mejor estimador de la recta de regresin pobla-
cional Y = + .X desconocida.
Grfico 4.3.
Esta recta representa el comportamiento medio de los datos muestrales y es
la que hace mnimo el conjunto de los desvos entre los valores y de los datos
observados y los valores y de sus correspondientes proyecciones en la recta.
Observando el grfico 4.4. se pueden notar tales desvos d = y y, tambin
llamados residuos.
115
Estadistica
G.4.2.
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
G.4.1.
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
x . b a y + =
regresin poblacional X . Y + = desconocida.
G.4.4.
G.4.3.
Salario quincenal actual y edad muestra
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
a
Grfico 4.4.
En el marco del modelo lineal, un valor y obtenido mediante la ecuacin de
regresin representa una estimacin del comportamiento de la variable Y (sala-
rio quincenal actual) para un cierto x
i
(una determinada edad del trabajador).
La formalizacin matemtica del concepto de que el conjunto de los des-
vos es mnimo puede hacerse a travs de distintos criterios. Uno de ellos,
que visualiza mejor el problema, es el que considera que la sumatoria de los
valores absolutos de los desvos debe ser mnima y se expresa:
Otro es el criterio de cuadrados mnimos, el cual impone como condicin que
la suma de los cuadrados de los desvos debe ser mnima, es decir:
Ecuacin de la regresin lineal
A partir del criterio de los cuadrados mnimos se encuentran las expresio-
nes de a y b con los que se construye la ecuacin de regresin mues-
tral y = a-b.x que es la que mejor estima la ecuacin de regresin poblacional
Y =+.x , cuyos parmetros son y .
Los valores de a y b estn dados por
116
x . b a y + =
regresin poblacional X . Y + = desconocida.
G.4.4.
G.4.3.
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
Edad
Q
u
i
n
c
e
n
a

a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
a
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
El criterio de cuadrados
mnimos fue desarrolla-
do por K. F. Gauss en Theoria
motus corporum coelestium, 1809.
A partir de la idea de que debe ser mnima y reempla-
zando y por su expresin y = a-b.x, resulta que
debe ser mnima por lo que sus primeras derivadas parciales respecto de a y de b
deben ser cero, es decir,
cuya resolucin culmina con las expresiones
En la muestra de los 20 trabajadores, los estadsticos muestrales a y b son,
a = 208,8 y b = 15,89
y la ecuacin de la recta de regresin muestral resulta
La informacin til que puede extraerse de la expresin de la ecuacin obte-
nida es la relacionada con la pendiente b=+$15,89/ao. sta indica que en
la muestra por cada ao de diferencia en la edad de los trabajadores hay una
diferencia de $15,89 en el salario. Ms precisamente, teniendo en cuenta el
signo de la pendiente, cuando se incrementa en un ao la edad de los traba-
jadores, el salario quincenal actual aumenta $15,89.
Por otro lado, la recta de regresin nos permitir estimar el salario quincenal
actual de un trabajador de la poblacin que no estuviese en la muestra y cuya
edad fuera, por ejemplo, 48 aos.
117
Estadistica
Entonces, el salario quincenal actual estimado para un trabajador de 48 aos
ser aproximadamente de $971,52.
Coeficiente de correlacin lineal
Para estudiar el grado o fuerza de la relacin lineal que existe entre dos varia-
bles se utiliza como medida el denominado coeficiente de correlacin.
El coeficiente de correlacin poblacional se denomina y su mejor esti-
mador es el coeficiente de correlacin muestral r que se determina como,
donde S
XY
es la covarianza o varianza conjunta o variacin conjunta entre las
variables aleatorias X e Y, y S
X
y S
Y
son los desvos estndar de X e Y res-
pectivamente.
Cuando la covarianza entre X e Y es nula el coeficiente de correlacin es r = 0.
Cuando hay covariabilidad perfecta entre X e Y y ambas varan en el mismo
sentido, el coeficiente de correlacin es r = +1.
Cuando hay covariabilidad perfecta entre X e Y y ambas varan con sentido
contrario, la correlacin es r = -1.
En cualquier otra situacin, el coeficiente de correlacin puede ser
-1< r <0 0< r <+1.
Grfico 4.5.
Para calcular el coeficiente de correlacin del ejemplo del salario quincenal
actual y la edad de los trabajadores de la empresa cooperativa se puede uti-
lizar la siguiente expresin:
118
Se debe al bimetra ingls
Karl Pearson y es apli-
cable a variables cuantitativas.
G.4.5.
Correlacin lineal directa, r entre 0 y+1 Correlacin lineal directa, r entre 0 y+1
X
X
Y
No hay correlacin, r muy prximo a 0
Y
X
Y
G.4.5.
Correlacin lineal directa, r entre 0 y+1 Correlacin lineal directa, r entre 0 y+1
X
X
Y
No hay correlacin, r muy prximo a 0
Y
X
Y
resultando r = +0,557. Esto estara indicando que ambas variables tienen un
mediano grado de correlacin directa.
Coeficiente de determinacin
Complementariamente a los coeficientes de regresin y de correlacin, se pre-
senta una medida denominada coeficiente de determinacin r
2
que indica
cunto del comportamiento de Y es explicado o puede entenderse por el mode-
lo de regresin.
Su expresin de clculo es:
El coeficiente de determinacin toma valores entre 0 y 1, y se interpreta como
porcentaje.
En el ejemplo que estamos desarrollando, se tiene un r
2
= 0,31. Este resul-
tado indica que en la muestra, el 31% de la variacin de los salarios quince-
nales actuales quedan explicados por las variaciones de las edades de los
trabajadores de la empresa cooperativa.
El anlisis de regresin lineal permite hallar la recta que mejor se ajusta
a los datos muestrales.
La pendiente de la recta b, llamada tambin coeficiente de regresin,
suministra informacin sobre la variacin de y por cada cambio uni-
tario de x y su signo indica el sentido de la relacin.
La estimacin del comportamiento en la poblacin de la variable
explicada Y queda circunscripta a valores de la variable explicativa X
que no estn muy alejados de su rango.
El coeficiente de correlacin r y el coeficiente de regresin b comparten la
misma informacin respecto de si la relacin entre las variables es direc-
ta o inversa (consecuentemente los numeradores de sus respectivas expre-
siones son iguales).
Si la relacin entre las variables es directa, la recta ser creciente, la
pendiente positiva y el coeficiente de regresin tambin positivo
variar entre 0 y +1.
Si la relacin entre las variables es inversa, la recta ser decreciente,
la pendiente negativa y el coeficiente de regresin tambin negativo
variar entre -1 y 0.
El coeficiente de determinacin r
2
es el cuadrado del coeficiente de corre-
lacin r y se interpreta en una escala del 0 al 100.
119
Estadistica
Los coeficientes de regresin, de correlacin y el de determinacin dados son las
herramientas necesarias para estudiar la relacin lineal entre dos variables.
1.
Efectuar un anlisis de regresin y correlacin para las variables:
a. Longitud y peso de la ME4 correspondiente a una muestra de 20
piezas de plstico especiales fabricadas por una determinada empre-
sa.
b. Antigedad y cantidad de empleados de las pymes de la Repblica
Argentina ao 2004/2005.
4.3. Series de tiempo
En el anlisis estadstico de un fenmeno econmico, social, etc. en el que
cada valor de la variable en estudio est vinculado a un momento de tiempo,
el enfoque es el de una serie cronolgica o serie de tiempo.
En una serie de tiempo, la variable estadstica a estudiar es dependiente
de la variable matemtica tiempo, es decir que sus valores varan en el trans-
curso del tiempo.
Son objeto de estudio economtrico, en el marco de una serie cronolgica, la
evolucin en el tiempo del salario de los trabajadores de un determinado rubro,
de las ventas de los negocios de un centro comercial, de la tasa de desem-
pleo en una regin, etctera.
Modelo matemtico de una serie de tiempo
Al estudiar una variable estadstica a travs del tiempo, cada uno de los valo-
res que ella asume es la resultante de los efectos producidos por distintas cau-
sas y esos efectos intervienen en el modelo como componentes del mismo.
Las componentes del modelo son: la tendencia (T) general, las distintas
variaciones cclicas (C) alrededor de la tendencia y el ruido (R) estadstico.
El modelo matemtico genrico usualmente aceptado para las series eco-
nmicas es,
X = T . C . R
Las componentes cclicas pueden presentarse como peridicas (Cp) y como
no peridicas (Cnp), entonces el modelo matemtico finalmente resulta,
X = T . Cp. Cnp . R
120
En las series de tiempo
econmicas, una com-
ponente cclica peridica impor-
tante es la llamada variacin esta-
cional (E), para la cual el ciclo dura
un ao.
donde Cp y Cnp representan, en rigor, familias de componentes con distintas
longitudes de tiempo.
De las componentes sealadas, la nica que aqu veremos ser la ten-
dencia T, que se expresa como una ecuacin lineal obtenida a partir del mto-
do de los cuadrados mnimos.
Ejemplo
La siguiente informacin se extrajo del Anuario Estadstico de la Repblica
Argentina 2000, seccin Economa, del diario Clarn y fue elaborada con base
en datos del INDEC.
Grfico 4.6.
A partir de la tabla se puede analizar por separado la evolucin en el tiempo
de las variables Exportaciones e Importaciones. En el grfico que acompaa
la tabla, los puntos que representan los datos colectados a lo largo del tiem-
po se unen para expresar la cronologa.
Procesaremos la variable Exportaciones analizando su evolucin a lo largo
del tiempo, destacando que dicha variable es la nica variable estadstica en
juego ya que el tiempo es una variable matemtica.
Si bien este es un caso de estadstica univariada, se puede utilizar per-
fectamente el recurso de ajustar por cuadrados mnimos ya empleado ante-
riormente para determinar la recta de la regresin lineal. En una serie de tiem-
po, la recta de ajuste ser la tendencia.
Para calcular la recta que describa la tendencia T de las exportaciones,
codificaremos la variable independiente tiempo considerando: t = 1 para 1984,
t = 2 para 1985 y as sucesivamente.
121
Estadistica
G.4.6.
Millones de u$s
Ao Exportaciones
1 8.107
2 8.396
3 6.852
4 6.360
5 9.135
6 9.579
7 12.353
8 11.978
9 12.235
10 13.118
11 15.839
12 20.963
13 23.811
14 26.431
15 26.441
16 23.333
Exportaciones
Balanza comercial argentina en U$S
Importaciones
35
30
25
20
15
10
5
0
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
8.107
8.396
6.852
6.360
9.135
9.579
12.353
11.978
12.235
13.118
15.839
20.963
23.811
26.432
26.441
23.333
Exporta-
ciones
4.585
3.814
4.724
5.818
5.322
4.203
4.077
8.275
14.672
16.784
21.590
20.122
23.762
30.450
31.404
25.508
Importa-
ciones
Ao
Entonces
T = 2782,55 + 1400,075. t
La pendiente b=1400,075 de la tendencia indica que por cada ao transcu-
rrido (en el perodo tomado), las exportaciones aumentaron en promedio 1400,
075 millones de dlares por ao.
Usando la recta de tendencia calculada se pueden pronosticar las expor-
taciones para:
a) El ao 2000.
2782,55 + 1400,075 . 17 = 26.583,825 (17 es el cdigo para el ao 2000).
Se estima que en el ao 2000 las exportaciones fueron del orden de los
26.583,825 millones de dlares.
b) El ao 1982.
2782,55 + 1400,075 . (-1) = 1.382,475 (-1 es el cdigo para el ao 1982).
c) El ao 2020.
El ao para el que se quiere pronosticar est muy alejado del rango
observado; no es conveniente usar el valor calculado como pronstico
o estimacin.
d) El ao 2007.
2.
Realizar las siguientes actividades:
Para la variable Importaciones: calcular la recta de tendencia, interpre-
tar su pendiente y realizar pronsticos.
122
G.4.6.
Millones de u$s
Ao Exportaciones
1 8.107
2 8.396
3 6.852
4 6.360
5 9.135
6 9.579
7 12.353
8 11.978
9 12.235
10 13.118
11 15.839
12 20.963
13 23.811
14 26.431
15 26.441
16 23.333
Exportaciones
Balanza comercial argentina en U$S
Importaciones
35
30
25
20
15
10
5
0
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
8.107
8.396
6.852
6.360
9.135
9.579
12.353
11.978
12.235
13.118
15.839
20.963
23.811
26.432
26.441
23.333
Exporta-
ciones
4.585
3.814
4.724
5.818
5.322
4.203
4.077
8.275
14.672
16.784
21.590
20.122
23.762
30.450
31.404
25.508
Importa-
ciones
Ao
Una prediccin realiza-
da en el marco de una
serie cronolgica se denomina
pronstico y se realiza en cual-
quier sentido, hacia atrs o hacia
adelante, en el tiempo.
A partir de la informacin de la siguiente tabla, calcular la recta de ten-
dencia, interpretar su pendiente y realizar pronsticos.
Fuente: INDEC, Encuesta Permanente de Hogares.
123
Estadistica
11
1980 2,6
1985 6,1
1986 5,6
1987 5,9
1988 6,3
1989 7,8
1990 7,4
1993 9,6
1994 10,8*
Fuente: INDEC, Encuesta Permanente de Hogares.
Ao Tasa de desempleo
CHOU, Ya-Lun (1992), Anlisis estadstico, McGraw-Hill, Mxico.
MAYER, P. (1986), Probabilidad y aplicaciones estadsticas, Addison Wesley,
Mxico.
MORONEY, M. J. (1965), Hechos y estdsticas, EUDEBA, Buenos Aires.
SPIEGEL, M.R. (2002), Estadstica, McGraw-Hill, Mxico.
TORANZOS, I. F. (1997), Teora Estadstica y Aplicaciones, Macchi, Buenos
Aires.
TUKEY, J. W. (1977), Exploratory Data Analysis, Addison Wesley, U.S.A.
125
Referencias Bibliogrficas
127
Anexo
Anexo
Tabla 1: Percentiles de la distribucin normal estndar
z p z p z p z p z p z p z p z p
-4,00 0,00003 -3,50 0,00023 -3,00 0,00135 -2,50 0,00621 -2,00 0,02275 -1,50 0,06681 -1,00 0,15866 -0,50 0,30854
-3,99 0,00003 -3,49 0,00024 -2,99 0,00139 -2,49 0,00639 -1,99 0,02330 -1,49 0,06811 -0,99 0,16109 -0,49 0,31207
-3,98 0,00003 -3,48 0,00025 -2,98 0,00144 -2,48 0,00657 -1,98 0,02385 -1,48 0,06944 -0,98 0,16354 -0,48 0,31561
-3,97 0,00004 -3,47 0,00026 -2,97 0,00149 -2,47 0,00676 -1,97 0,02442 -1,47 0,07078 -0,97 0,16602 -0,47 0,31918
-3,96 0,00004 -3,46 0,00027 -2,96 0,00154 -2,46 0,00695 -1,96 0,02500 -1,46 0,07215 -0,96 0,16853 -0,46 0,32276
-3,95 0,00004 -3,45 0,00028 -2,95 0,00159 -2,45 0,00714 -1,95 0,02559 -1,45 0,07353 -0,95 0,17106 -0,45 0,32636
-3,94 0,00004 -3,44 0,00029 -2,94 0,00164 -2,44 0,00734 -1,94 0,02619 -1,44 0,07493 -0,94 0,17361 -0,44 0,32997
-3,93 0,00004 -3,43 0,00030 -2,93 0,00169 -2,43 0,00755 -1,93 0,02680 -1,43 0,07636 -0,93 0,17619 -0,43 0,33360
-3,92 0,00004 -3,42 0,00031 -2,92 0,00175 -2,42 0,00776 -1,92 0,02743 -1,42 0,07780 -0,92 0,17879 -0,42 0,33724
-3,91 0,00005 -3,41 0,00032 -2,91 0,00181 -2,41 0,00798 -1,91 0,02807 -1,41 0,07927 -0,91 0,18141 -0,41 0,34090
-3,90 0,00005 -3,40 0,00034 -2,90 0,00187 -2,40 0,00820 -1,90 0,02872 -1,40 0,08076 -0,90 0,18406 -0,40 0,34458
-3,89 0,00005 -3,39 0,00035 -2,89 0,00193 -2,39 0,00842 -1,89 0,02938 -1,39 0,08226 -0,89 0,18673 -0,39 0,34827
-3,88 0,00005 -3,38 0,00036 -2,88 0,00199 -2,38 0,00866 -1,88 0,03005 -1,38 0,08379 -0,88 0,18943 -0,38 0,35197
-3,87 0,00005 -3,37 0,00038 -2,87 0,00205 -2,37 0,00889 -1,87 0,03074 -1,37 0,08534 -0,87 0,19215 -0,37 0,35569
-3,86 0,00006 -3,36 0,00039 -2,86 0,00212 -2,36 0,00914 -1,86 0,03144 -1,36 0,08692 -0,86 0,19489 -0,36 0,35942
-3,85 0,00006 -3,35 0,00040 -2,85 0,00219 -2,35 0,00939 -1,85 0,03216 -1,35 0,08851 -0,85 0,19766 -0,35 0,36317
-3,84 0,00006 -3,34 0,00042 -2,84 0,00226 -2,34 0,00964 -1,84 0,03288 -1,34 0,09012 -0,84 0,20045 -0,34 0,36693
-3,83 0,00006 -3,33 0,00043 -2,83 0,00233 -2,33 0,00990 -1,83 0,03362 -1,33 0,09176 -0,83 0,20327 -0,33 0,37070
-3,82 0,00007 -3,32 0,00045 -2,82 0,00240 -2,32 0,01017 -1,82 0,03438 -1,32 0,09342 -0,82 0,20611 -0,32 0,37448
-3,81 0,00007 -3,31 0,00047 -2,81 0,00248 -2,31 0,01044 -1,81 0,03515 -1,31 0,09510 -0,81 0,20897 -0,31 0,37828
-3,80 0,00007 -3,30 0,00048 -2,80 0,00256 -2,30 0,01072 -1,80 0,03593 -1,30 0,09680 -0,80 0,21186 -0,30 0,38209
-3,79 0,00008 -3,29 0,00050 -2,79 0,00264 -2,29 0,01101 -1,79 0,03673 -1,29 0,09853 -0,79 0,21476 -0,29 0,38591
-3,78 0,00008 -3,28 0,00052 -2,78 0,00272 -2,28 0,01130 -1,78 0,03754 -1,28 0,10027 -0,78 0,21770 -0,28 0,38974
-3,77 0,00008 -3,27 0,00054 -2,77 0,00280 -2,27 0,01160 -1,77 0,03836 -1,27 0,10204 -0,77 0,22065 -0,27 0,39358
-3,76 0,00008 -3,26 0,00056 -2,76 0,00289 -2,26 0,01191 -1,76 0,03920 -1,26 0,10383 -0,76 0,22363 -0,26 0,39743
-3,75 0,00009 -3,25 0,00058 -2,75 0,00298 -2,25 0,01222 -1,75 0,04006 -1,25 0,10565 -0,75 0,22663 -0,25 0,40129
-3,74 0,00009 -3,24 0,00060 -2,74 0,00307 -2,24 0,01255 -1,74 0,04093 -1,24 0,10749 -0,74 0,22965 -0,24 0,40517
-3,73 0,00010 -3,23 0,00062 -2,73 0,00317 -2,23 0,01287 -1,73 0,04182 -1,23 0,10935 -0,73 0,23270 -0,23 0,40905
-3,72 0,00010 -3,22 0,00064 -2,72 0,00326 -2,22 0,01321 -1,72 0,04272 -1,22 0,11123 -0,72 0,23576 -0,22 0,41294
-3,71 0,00010 -3,21 0,00066 -2,71 0,00336 -2,21 0,01355 -1,71 0,04363 -1,21 0,11314 -0,71 0,23885 -0,21 0,41683
-3,70 0,00011 -3,20 0,00069 -2,70 0,00347 -2,20 0,01390 -1,70 0,04457 -1,20 0,11507 -0,70 0,24196 -0,20 0,42074
-3,69 0,00011 -3,19 0,00071 -2,69 0,00357 -2,19 0,01426 -1,69 0,04551 -1,19 0,11702 -0,69 0,24510 -0,19 0,42465
-3,68 0,00012 -3,18 0,00074 -2,68 0,00368 -2,18 0,01463 -1,68 0,04648 -1,18 0,11900 -0,68 0,24825 -0,18 0,42858
-3,67 0,00012 -3,17 0,00076 -2,67 0,00379 -2,17 0,01500 -1,67 0,04746 -1,17 0,12100 -0,67 0,25143 -0,17 0,43251
-3,66 0,00013 -3,16 0,00079 -2,66 0,00391 -2,16 0,01539 -1,66 0,04846 -1,16 0,12302 -0,66 0,25463 -0,16 0,43644
-3,65 0,00013 -3,15 0,00082 -2,65 0,00402 -2,15 0,01578 -1,65 0,04947 -1,15 0,12507 -0,65 0,25785 -0,15 0,44038
-3,64 0,00014 -3,14 0,00084 -2,64 0,00415 -2,14 0,01618 -1,64 0,05050 -1,14 0,12714 -0,64 0,26109 -0,14 0,44433
-3,63 0,00014 -3,13 0,00087 -2,63 0,00427 -2,13 0,01659 -1,63 0,05155 -1,13 0,12924 -0,63 0,26435 -0,13 0,44828
-3,62 0,00015 -3,12 0,00090 -2,62 0,00440 -2,12 0,01700 -1,62 0,05262 -1,12 0,13136 -0,62 0,26763 -0,12 0,45224
-3,61 0,00015 -3,11 0,00094 -2,61 0,00453 -2,11 0,01743 -1,61 0,05370 -1,11 0,13350 -0,61 0,27093 -0,11 0,45620
-3,60 0,00016 -3,10 0,00097 -2,60 0,00466 -2,10 0,01786 -1,60 0,05480 -1,10 0,13567 -0,60 0,27425 -0,10 0,46017
-3,59 0,00017 -3,09 0,00100 -2,59 0,00480 -2,09 0,01831 -1,59 0,05592 -1,09 0,13786 -0,59 0,27760 -0,09 0,46414
-3,58 0,00017 -3,08 0,00104 -2,58 0,00494 -2,08 0,01876 -1,58 0,05705 -1,08 0,14007 -0,58 0,28096 -0,08 0,46812
-3,57 0,00018 -3,07 0,00107 -2,57 0,00508 -2,07 0,01923 -1,57 0,05821 -1,07 0,14231 -0,57 0,28434 -0,07 0,47210
-3,56 0,00019 -3,06 0,00111 -2,56 0,00523 -2,06 0,01970 -1,56 0,05938 -1,06 0,14457 -0,56 0,28774 -0,06 0,47608
-3,55 0,00019 -3,05 0,00114 -2,55 0,00539 -2,05 0,02018 -1,55 0,06057 -1,05 0,14686 -0,55 0,29116 -0,05 0,48006
-3,54 0,00020 -3,04 0,00118 -2,54 0,00554 -2,04 0,02068 -1,54 0,06178 -1,04 0,14917 -0,54 0,29460 -0,04 0,48405
-3,53 0,00021 -3,03 0,00122 -2,53 0,00570 -2,03 0,02118 -1,53 0,06301 -1,03 0,15151 -0,53 0,29806 -0,03 0,48803
-3,52 0,00022 -3,02 0,00126 -2,52 0,00587 -2,02 0,02169 -1,52 0,06426 -1,02 0,15386 -0,52 0,30153 -0,02 0,49202
-3,51 0,00022 -3,01 0,00131 -2,51 0,00604 -2,01 0,02222 -1,51 0,06552 -1,01 0,15625 -0,51 0,30503 -0,01 0,49601
Z
P
Anexo
-4,00 0,00003 -3,50 0,00023 -3,00 0,00135 -2,50 0,00621 -2,00 0,02275 -1,50 0,06681 -1,00 0,15866 -0,50 0,30854
-3,99 0,00003 -3,49 0,00024 -2,99 0,00139 -2,49 0,00639 -1,99 0,02330 -1,49 0,06811 -0,99 0,16109 -0,49 0,31207
-3,98 0,00003 -3,48 0,00025 -2,98 0,00144 -2,48 0,00657 -1,98 0,02385 -1,48 0,06944 -0,98 0,16354 -0,48 0,31561
-3,97 0,00004 -3,47 0,00026 -2,97 0,00149 -2,47 0,00676 -1,97 0,02442 -1,47 0,07078 -0,97 0,16602 -0,47 0,31918
-3,96 0,00004 -3,46 0,00027 -2,96 0,00154 -2,46 0,00695 -1,96 0,02500 -1,46 0,07215 -0,96 0,16853 -0,46 0,32276
-3,95 0,00004 -3,45 0,00028 -2,95 0,00159 -2,45 0,00714 -1,95 0,02559 -1,45 0,07353 -0,95 0,17106 -0,45 0,32636
-3,94 0,00004 -3,44 0,00029 -2,94 0,00164 -2,44 0,00734 -1,94 0,02619 -1,44 0,07493 -0,94 0,17361 -0,44 0,32997
-3,93 0,00004 -3,43 0,00030 -2,93 0,00169 -2,43 0,00755 -1,93 0,02680 -1,43 0,07636 -0,93 0,17619 -0,43 0,33360
-3,92 0,00004 -3,42 0,00031 -2,92 0,00175 -2,42 0,00776 -1,92 0,02743 -1,42 0,07780 -0,92 0,17879 -0,42 0,33724
-3,91 0,00005 -3,41 0,00032 -2,91 0,00181 -2,41 0,00798 -1,91 0,02807 -1,41 0,07927 -0,91 0,18141 -0,41 0,34090
-3,90 0,00005 -3,40 0,00034 -2,90 0,00187 -2,40 0,00820 -1,90 0,02872 -1,40 0,08076 -0,90 0,18406 -0,40 0,34458
-3,89 0,00005 -3,39 0,00035 -2,89 0,00193 -2,39 0,00842 -1,89 0,02938 -1,39 0,08226 -0,89 0,18673 -0,39 0,34827
-3,88 0,00005 -3,38 0,00036 -2,88 0,00199 -2,38 0,00866 -1,88 0,03005 -1,38 0,08379 -0,88 0,18943 -0,38 0,35197
-3,87 0,00005 -3,37 0,00038 -2,87 0,00205 -2,37 0,00889 -1,87 0,03074 -1,37 0,08534 -0,87 0,19215 -0,37 0,35569
-3,86 0,00006 -3,36 0,00039 -2,86 0,00212 -2,36 0,00914 -1,86 0,03144 -1,36 0,08692 -0,86 0,19489 -0,36 0,35942
-3,85 0,00006 -3,35 0,00040 -2,85 0,00219 -2,35 0,00939 -1,85 0,03216 -1,35 0,08851 -0,85 0,19766 -0,35 0,36317
-3,84 0,00006 -3,34 0,00042 -2,84 0,00226 -2,34 0,00964 -1,84 0,03288 -1,34 0,09012 -0,84 0,20045 -0,34 0,36693
-3,83 0,00006 -3,33 0,00043 -2,83 0,00233 -2,33 0,00990 -1,83 0,03362 -1,33 0,09176 -0,83 0,20327 -0,33 0,37070
-3,82 0,00007 -3,32 0,00045 -2,82 0,00240 -2,32 0,01017 -1,82 0,03438 -1,32 0,09342 -0,82 0,20611 -0,32 0,37448
-3,81 0,00007 -3,31 0,00047 -2,81 0,00248 -2,31 0,01044 -1,81 0,03515 -1,31 0,09510 -0,81 0,20897 -0,31 0,37828
-3,80 0,00007 -3,30 0,00048 -2,80 0,00256 -2,30 0,01072 -1,80 0,03593 -1,30 0,09680 -0,80 0,21186 -0,30 0,38209
-3,79 0,00008 -3,29 0,00050 -2,79 0,00264 -2,29 0,01101 -1,79 0,03673 -1,29 0,09853 -0,79 0,21476 -0,29 0,38591
-3,78 0,00008 -3,28 0,00052 -2,78 0,00272 -2,28 0,01130 -1,78 0,03754 -1,28 0,10027 -0,78 0,21770 -0,28 0,38974
-3,77 0,00008 -3,27 0,00054 -2,77 0,00280 -2,27 0,01160 -1,77 0,03836 -1,27 0,10204 -0,77 0,22065 -0,27 0,39358
-3,76 0,00008 -3,26 0,00056 -2,76 0,00289 -2,26 0,01191 -1,76 0,03920 -1,26 0,10383 -0,76 0,22363 -0,26 0,39743
-3,75 0,00009 -3,25 0,00058 -2,75 0,00298 -2,25 0,01222 -1,75 0,04006 -1,25 0,10565 -0,75 0,22663 -0,25 0,40129
-3,74 0,00009 -3,24 0,00060 -2,74 0,00307 -2,24 0,01255 -1,74 0,04093 -1,24 0,10749 -0,74 0,22965 -0,24 0,40517
-3,73 0,00010 -3,23 0,00062 -2,73 0,00317 -2,23 0,01287 -1,73 0,04182 -1,23 0,10935 -0,73 0,23270 -0,23 0,40905
-3,72 0,00010 -3,22 0,00064 -2,72 0,00326 -2,22 0,01321 -1,72 0,04272 -1,22 0,11123 -0,72 0,23576 -0,22 0,41294
-3,71 0,00010 -3,21 0,00066 -2,71 0,00336 -2,21 0,01355 -1,71 0,04363 -1,21 0,11314 -0,71 0,23885 -0,21 0,41683
-3,70 0,00011 -3,20 0,00069 -2,70 0,00347 -2,20 0,01390 -1,70 0,04457 -1,20 0,11507 -0,70 0,24196 -0,20 0,42074
-3,69 0,00011 -3,19 0,00071 -2,69 0,00357 -2,19 0,01426 -1,69 0,04551 -1,19 0,11702 -0,69 0,24510 -0,19 0,42465
-3,68 0,00012 -3,18 0,00074 -2,68 0,00368 -2,18 0,01463 -1,68 0,04648 -1,18 0,11900 -0,68 0,24825 -0,18 0,42858
-3,67 0,00012 -3,17 0,00076 -2,67 0,00379 -2,17 0,01500 -1,67 0,04746 -1,17 0,12100 -0,67 0,25143 -0,17 0,43251
-3,66 0,00013 -3,16 0,00079 -2,66 0,00391 -2,16 0,01539 -1,66 0,04846 -1,16 0,12302 -0,66 0,25463 -0,16 0,43644
-3,65 0,00013 -3,15 0,00082 -2,65 0,00402 -2,15 0,01578 -1,65 0,04947 -1,15 0,12507 -0,65 0,25785 -0,15 0,44038
-3,64 0,00014 -3,14 0,00084 -2,64 0,00415 -2,14 0,01618 -1,64 0,05050 -1,14 0,12714 -0,64 0,26109 -0,14 0,44433
-3,63 0,00014 -3,13 0,00087 -2,63 0,00427 -2,13 0,01659 -1,63 0,05155 -1,13 0,12924 -0,63 0,26435 -0,13 0,44828
-3,62 0,00015 -3,12 0,00090 -2,62 0,00440 -2,12 0,01700 -1,62 0,05262 -1,12 0,13136 -0,62 0,26763 -0,12 0,45224
-3,61 0,00015 -3,11 0,00094 -2,61 0,00453 -2,11 0,01743 -1,61 0,05370 -1,11 0,13350 -0,61 0,27093 -0,11 0,45620
-3,60 0,00016 -3,10 0,00097 -2,60 0,00466 -2,10 0,01786 -1,60 0,05480 -1,10 0,13567 -0,60 0,27425 -0,10 0,46017
-3,59 0,00017 -3,09 0,00100 -2,59 0,00480 -2,09 0,01831 -1,59 0,05592 -1,09 0,13786 -0,59 0,27760 -0,09 0,46414
-3,58 0,00017 -3,08 0,00104 -2,58 0,00494 -2,08 0,01876 -1,58 0,05705 -1,08 0,14007 -0,58 0,28096 -0,08 0,46812
-3,57 0,00018 -3,07 0,00107 -2,57 0,00508 -2,07 0,01923 -1,57 0,05821 -1,07 0,14231 -0,57 0,28434 -0,07 0,47210
-3,56 0,00019 -3,06 0,00111 -2,56 0,00523 -2,06 0,01970 -1,56 0,05938 -1,06 0,14457 -0,56 0,28774 -0,06 0,47608
-3,55 0,00019 -3,05 0,00114 -2,55 0,00539 -2,05 0,02018 -1,55 0,06057 -1,05 0,14686 -0,55 0,29116 -0,05 0,48006
-3,54 0,00020 -3,04 0,00118 -2,54 0,00554 -2,04 0,02068 -1,54 0,06178 -1,04 0,14917 -0,54 0,29460 -0,04 0,48405
-3,53 0,00021 -3,03 0,00122 -2,53 0,00570 -2,03 0,02118 -1,53 0,06301 -1,03 0,15151 -0,53 0,29806 -0,03 0,48803
-3,52 0,00022 -3,02 0,00126 -2,52 0,00587 -2,02 0,02169 -1,52 0,06426 -1,02 0,15386 -0,52 0,30153 -0,02 0,49202
-3,51 0,00022 -3,01 0,00131 -2,51 0,00604 -2,01 0,02222 -1,51 0,06552 -1,01 0,15625 -0,51 0,30503 -0,01 0,49601
Z
P
Anexo
-4,00 0,00003 -3,50 0,00023 -3,00 0,00135 -2,50 0,00621 -2,00 0,02275 -1,50 0,06681 -1,00 0,15866 -0,50 0,30854
-3,99 0,00003 -3,49 0,00024 -2,99 0,00139 -2,49 0,00639 -1,99 0,02330 -1,49 0,06811 -0,99 0,16109 -0,49 0,31207
-3,98 0,00003 -3,48 0,00025 -2,98 0,00144 -2,48 0,00657 -1,98 0,02385 -1,48 0,06944 -0,98 0,16354 -0,48 0,31561
-3,97 0,00004 -3,47 0,00026 -2,97 0,00149 -2,47 0,00676 -1,97 0,02442 -1,47 0,07078 -0,97 0,16602 -0,47 0,31918
-3,96 0,00004 -3,46 0,00027 -2,96 0,00154 -2,46 0,00695 -1,96 0,02500 -1,46 0,07215 -0,96 0,16853 -0,46 0,32276
-3,95 0,00004 -3,45 0,00028 -2,95 0,00159 -2,45 0,00714 -1,95 0,02559 -1,45 0,07353 -0,95 0,17106 -0,45 0,32636
-3,94 0,00004 -3,44 0,00029 -2,94 0,00164 -2,44 0,00734 -1,94 0,02619 -1,44 0,07493 -0,94 0,17361 -0,44 0,32997
-3,93 0,00004 -3,43 0,00030 -2,93 0,00169 -2,43 0,00755 -1,93 0,02680 -1,43 0,07636 -0,93 0,17619 -0,43 0,33360
-3,92 0,00004 -3,42 0,00031 -2,92 0,00175 -2,42 0,00776 -1,92 0,02743 -1,42 0,07780 -0,92 0,17879 -0,42 0,33724
-3,91 0,00005 -3,41 0,00032 -2,91 0,00181 -2,41 0,00798 -1,91 0,02807 -1,41 0,07927 -0,91 0,18141 -0,41 0,34090
-3,90 0,00005 -3,40 0,00034 -2,90 0,00187 -2,40 0,00820 -1,90 0,02872 -1,40 0,08076 -0,90 0,18406 -0,40 0,34458
-3,89 0,00005 -3,39 0,00035 -2,89 0,00193 -2,39 0,00842 -1,89 0,02938 -1,39 0,08226 -0,89 0,18673 -0,39 0,34827
-3,88 0,00005 -3,38 0,00036 -2,88 0,00199 -2,38 0,00866 -1,88 0,03005 -1,38 0,08379 -0,88 0,18943 -0,38 0,35197
-3,87 0,00005 -3,37 0,00038 -2,87 0,00205 -2,37 0,00889 -1,87 0,03074 -1,37 0,08534 -0,87 0,19215 -0,37 0,35569
-3,86 0,00006 -3,36 0,00039 -2,86 0,00212 -2,36 0,00914 -1,86 0,03144 -1,36 0,08692 -0,86 0,19489 -0,36 0,35942
-3,85 0,00006 -3,35 0,00040 -2,85 0,00219 -2,35 0,00939 -1,85 0,03216 -1,35 0,08851 -0,85 0,19766 -0,35 0,36317
-3,84 0,00006 -3,34 0,00042 -2,84 0,00226 -2,34 0,00964 -1,84 0,03288 -1,34 0,09012 -0,84 0,20045 -0,34 0,36693
-3,83 0,00006 -3,33 0,00043 -2,83 0,00233 -2,33 0,00990 -1,83 0,03362 -1,33 0,09176 -0,83 0,20327 -0,33 0,37070
-3,82 0,00007 -3,32 0,00045 -2,82 0,00240 -2,32 0,01017 -1,82 0,03438 -1,32 0,09342 -0,82 0,20611 -0,32 0,37448
-3,81 0,00007 -3,31 0,00047 -2,81 0,00248 -2,31 0,01044 -1,81 0,03515 -1,31 0,09510 -0,81 0,20897 -0,31 0,37828
-3,80 0,00007 -3,30 0,00048 -2,80 0,00256 -2,30 0,01072 -1,80 0,03593 -1,30 0,09680 -0,80 0,21186 -0,30 0,38209
-3,79 0,00008 -3,29 0,00050 -2,79 0,00264 -2,29 0,01101 -1,79 0,03673 -1,29 0,09853 -0,79 0,21476 -0,29 0,38591
-3,78 0,00008 -3,28 0,00052 -2,78 0,00272 -2,28 0,01130 -1,78 0,03754 -1,28 0,10027 -0,78 0,21770 -0,28 0,38974
-3,77 0,00008 -3,27 0,00054 -2,77 0,00280 -2,27 0,01160 -1,77 0,03836 -1,27 0,10204 -0,77 0,22065 -0,27 0,39358
-3,76 0,00008 -3,26 0,00056 -2,76 0,00289 -2,26 0,01191 -1,76 0,03920 -1,26 0,10383 -0,76 0,22363 -0,26 0,39743
-3,75 0,00009 -3,25 0,00058 -2,75 0,00298 -2,25 0,01222 -1,75 0,04006 -1,25 0,10565 -0,75 0,22663 -0,25 0,40129
-3,74 0,00009 -3,24 0,00060 -2,74 0,00307 -2,24 0,01255 -1,74 0,04093 -1,24 0,10749 -0,74 0,22965 -0,24 0,40517
-3,73 0,00010 -3,23 0,00062 -2,73 0,00317 -2,23 0,01287 -1,73 0,04182 -1,23 0,10935 -0,73 0,23270 -0,23 0,40905
-3,72 0,00010 -3,22 0,00064 -2,72 0,00326 -2,22 0,01321 -1,72 0,04272 -1,22 0,11123 -0,72 0,23576 -0,22 0,41294
-3,71 0,00010 -3,21 0,00066 -2,71 0,00336 -2,21 0,01355 -1,71 0,04363 -1,21 0,11314 -0,71 0,23885 -0,21 0,41683
-3,70 0,00011 -3,20 0,00069 -2,70 0,00347 -2,20 0,01390 -1,70 0,04457 -1,20 0,11507 -0,70 0,24196 -0,20 0,42074
-3,69 0,00011 -3,19 0,00071 -2,69 0,00357 -2,19 0,01426 -1,69 0,04551 -1,19 0,11702 -0,69 0,24510 -0,19 0,42465
-3,68 0,00012 -3,18 0,00074 -2,68 0,00368 -2,18 0,01463 -1,68 0,04648 -1,18 0,11900 -0,68 0,24825 -0,18 0,42858
-3,67 0,00012 -3,17 0,00076 -2,67 0,00379 -2,17 0,01500 -1,67 0,04746 -1,17 0,12100 -0,67 0,25143 -0,17 0,43251
-3,66 0,00013 -3,16 0,00079 -2,66 0,00391 -2,16 0,01539 -1,66 0,04846 -1,16 0,12302 -0,66 0,25463 -0,16 0,43644
-3,65 0,00013 -3,15 0,00082 -2,65 0,00402 -2,15 0,01578 -1,65 0,04947 -1,15 0,12507 -0,65 0,25785 -0,15 0,44038
-3,64 0,00014 -3,14 0,00084 -2,64 0,00415 -2,14 0,01618 -1,64 0,05050 -1,14 0,12714 -0,64 0,26109 -0,14 0,44433
-3,63 0,00014 -3,13 0,00087 -2,63 0,00427 -2,13 0,01659 -1,63 0,05155 -1,13 0,12924 -0,63 0,26435 -0,13 0,44828
-3,62 0,00015 -3,12 0,00090 -2,62 0,00440 -2,12 0,01700 -1,62 0,05262 -1,12 0,13136 -0,62 0,26763 -0,12 0,45224
-3,61 0,00015 -3,11 0,00094 -2,61 0,00453 -2,11 0,01743 -1,61 0,05370 -1,11 0,13350 -0,61 0,27093 -0,11 0,45620
-3,60 0,00016 -3,10 0,00097 -2,60 0,00466 -2,10 0,01786 -1,60 0,05480 -1,10 0,13567 -0,60 0,27425 -0,10 0,46017
-3,59 0,00017 -3,09 0,00100 -2,59 0,00480 -2,09 0,01831 -1,59 0,05592 -1,09 0,13786 -0,59 0,27760 -0,09 0,46414
-3,58 0,00017 -3,08 0,00104 -2,58 0,00494 -2,08 0,01876 -1,58 0,05705 -1,08 0,14007 -0,58 0,28096 -0,08 0,46812
-3,57 0,00018 -3,07 0,00107 -2,57 0,00508 -2,07 0,01923 -1,57 0,05821 -1,07 0,14231 -0,57 0,28434 -0,07 0,47210
-3,56 0,00019 -3,06 0,00111 -2,56 0,00523 -2,06 0,01970 -1,56 0,05938 -1,06 0,14457 -0,56 0,28774 -0,06 0,47608
-3,55 0,00019 -3,05 0,00114 -2,55 0,00539 -2,05 0,02018 -1,55 0,06057 -1,05 0,14686 -0,55 0,29116 -0,05 0,48006
-3,54 0,00020 -3,04 0,00118 -2,54 0,00554 -2,04 0,02068 -1,54 0,06178 -1,04 0,14917 -0,54 0,29460 -0,04 0,48405
-3,53 0,00021 -3,03 0,00122 -2,53 0,00570 -2,03 0,02118 -1,53 0,06301 -1,03 0,15151 -0,53 0,29806 -0,03 0,48803
-3,52 0,00022 -3,02 0,00126 -2,52 0,00587 -2,02 0,02169 -1,52 0,06426 -1,02 0,15386 -0,52 0,30153 -0,02 0,49202
-3,51 0,00022 -3,01 0,00131 -2,51 0,00604 -2,01 0,02222 -1,51 0,06552 -1,01 0,15625 -0,51 0,30503 -0,01 0,49601
Z
P
128
0,00 0,50000 0,50 0,69146 1,00 0,84134 1,50 0,93319 2,00 0,97725 2,50 0,99379 3,00 0,99865 3,50 0,99977
0,01 0,50399 0,51 0,69497 1,01 0,84375 1,51 0,93448 2,01 0,97778 2,51 0,99396 3,01 0,99869 3,51 0,99978
0,02 0,50798 0,52 0,69847 1,02 0,84614 1,52 0,93574 2,02 0,97831 2,52 0,99413 3,02 0,99874 3,52 0,99978
0,03 0,51197 0,53 0,70194 1,03 0,84849 1,53 0,93699 2,03 0,97882 2,53 0,99430 3,03 0,99878 3,53 0,99979
0,04 0,51595 0,54 0,70540 1,04 0,85083 1,54 0,93822 2,04 0,97932 2,54 0,99446 3,04 0,99882 3,54 0,99980
0,05 0,51994 0,55 0,70884 1,05 0,85314 1,55 0,93943 2,05 0,97982 2,55 0,99461 3,05 0,99886 3,55 0,99981
0,06 0,52392 0,56 0,71226 1,06 0,85543 1,56 0,94062 2,06 0,98030 2,56 0,99477 3,06 0,99889 3,56 0,99981
0,07 0,52790 0,57 0,71566 1,07 0,85769 1,57 0,94179 2,07 0,98077 2,57 0,99492 3,07 0,99893 3,57 0,99982
0,08 0,53188 0,58 0,71904 1,08 0,85993 1,58 0,94295 2,08 0,98124 2,58 0,99506 3,08 0,99896 3,58 0,99983
0,09 0,53586 0,59 0,72240 1,09 0,86214 1,59 0,94408 2,09 0,98169 2,59 0,99520 3,09 0,99900 3,59 0,99983
0,10 0,53983 0,60 0,72575 1,10 0,86433 1,60 0,94520 2,10 0,98214 2,60 0,99534 3,10 0,99903 3,60 0,99984
0,11 0,54380 0,61 0,72907 1,11 0,86650 1,61 0,94630 2,11 0,98257 2,61 0,99547 3,11 0,99906 3,61 0,99985
0,12 0,54776 0,62 0,73237 1,12 0,86864 1,62 0,94738 2,12 0,98300 2,62 0,99560 3,12 0,99910 3,62 0,99985
0,13 0,55172 0,63 0,73565 1,13 0,87076 1,63 0,94845 2,13 0,98341 2,63 0,99573 3,13 0,99913 3,63 0,99986
0,14 0,55567 0,64 0,73891 1,14 0,87286 1,64 0,94950 2,14 0,98382 2,64 0,99585 3,14 0,99916 3,64 0,99986
0,15 0,55962 0,65 0,74215 1,15 0,87493 1,65 0,95053 2,15 0,98422 2,65 0,99598 3,15 0,99918 3,65 0,99987
0,16 0,56356 0,66 0,74537 1,16 0,87698 1,66 0,95154 2,16 0,98461 2,66 0,99609 3,16 0,99921 3,66 0,99987
0,17 0,56749 0,67 0,74857 1,17 0,87900 1,67 0,95254 2,17 0,98500 2,67 0,99621 3,17 0,99924 3,67 0,99988
0,18 0,57142 0,68 0,75175 1,18 0,88100 1,68 0,95352 2,18 0,98537 2,68 0,99632 3,18 0,99926 3,68 0,99988
0,19 0,57535 0,69 0,75490 1,19 0,88298 1,69 0,95449 2,19 0,98574 2,69 0,99643 3,19 0,99929 3,69 0,99989
0,20 0,57926 0,70 0,75804 1,20 0,88493 1,70 0,95543 2,20 0,98610 2,70 0,99653 3,20 0,99931 3,70 0,99989
0,21 0,58317 0,71 0,76115 1,21 0,88686 1,71 0,95637 2,21 0,98645 2,71 0,99664 3,21 0,99934 3,71 0,99990
0,22 0,58706 0,72 0,76424 1,22 0,88877 1,72 0,95728 2,22 0,98679 2,72 0,99674 3,22 0,99936 3,72 0,99990
0,23 0,59095 0,73 0,76730 1,23 0,89065 1,73 0,95818 2,23 0,98713 2,73 0,99683 3,23 0,99938 3,73 0,99990
0,24 0,59483 0,74 0,77035 1,24 0,89251 1,74 0,95907 2,24 0,98745 2,74 0,99693 3,24 0,99940 3,74 0,99991
0,25 0,59871 0,75 0,77337 1,25 0,89435 1,75 0,95994 2,25 0,98778 2,75 0,99702 3,25 0,99942 3,75 0,99991
0,26 0,60257 0,76 0,77637 1,26 0,89617 1,76 0,96080 2,26 0,98809 2,76 0,99711 3,26 0,99944 3,76 0,99992
0,27 0,60642 0,77 0,77935 1,27 0,89796 1,77 0,96164 2,27 0,98840 2,77 0,99720 3,27 0,99946 3,77 0,99992
0,28 0,61026 0,78 0,78230 1,28 0,89973 1,78 0,96246 2,28 0,98870 2,78 0,99728 3,28 0,99948 3,78 0,99992
0,29 0,61409 0,79 0,78524 1,29 0,90147 1,79 0,96327 2,29 0,98899 2,79 0,99736 3,29 0,99950 3,79 0,99992
0,30 0,61791 0,80 0,78814 1,30 0,90320 1,80 0,96407 2,30 0,98928 2,80 0,99744 3,30 0,99952 3,80 0,99993
0,31 0,62172 0,81 0,79103 1,31 0,90490 1,81 0,96485 2,31 0,98956 2,81 0,99752 3,31 0,99953 3,81 0,99993
0,32 0,62552 0,82 0,79389 1,32 0,90658 1,82 0,96562 2,32 0,98983 2,82 0,99760 3,32 0,99955 3,82 0,99993
0,33 0,62930 0,83 0,79673 1,33 0,90824 1,83 0,96638 2,33 0,99010 2,83 0,99767 3,33 0,99957 3,83 0,99994
0,34 0,63307 0,84 0,79955 1,34 0,90988 1,84 0,96712 2,34 0,99036 2,84 0,99774 3,34 0,99958 3,84 0,99994
0,35 0,63683 0,85 0,80234 1,35 0,91149 1,85 0,96784 2,35 0,99061 2,85 0,99781 3,35 0,99960 3,85 0,99994
0,36 0,64058 0,86 0,80511 1,36 0,91308 1,86 0,96856 2,36 0,99086 2,86 0,99788 3,36 0,99961 3,86 0,99994
0,37 0,64431 0,87 0,80785 1,37 0,91466 1,87 0,96926 2,37 0,99111 2,87 0,99795 3,37 0,99962 3,87 0,99995
0,38 0,64803 0,88 0,81057 1,38 0,91621 1,88 0,96995 2,38 0,99134 2,88 0,99801 3,38 0,99964 3,88 0,99995
0,39 0,65173 0,89 0,81327 1,39 0,91774 1,89 0,97062 2,39 0,99158 2,89 0,99807 3,39 0,99965 3,89 0,99995
0,40 0,65542 0,90 0,81594 1,40 0,91924 1,90 0,97128 2,40 0,99180 2,90 0,99813 3,40 0,99966 3,90 0,99995
0,41 0,65910 0,91 0,81859 1,41 0,92073 1,91 0,97193 2,41 0,99202 2,91 0,99819 3,41 0,99968 3,91 0,99995
0,42 0,66276 0,92 0,82121 1,42 0,92220 1,92 0,97257 2,42 0,99224 2,92 0,99825 3,42 0,99969 3,92 0,99996
0,43 0,66640 0,93 0,82381 1,43 0,92364 1,93 0,97320 2,43 0,99245 2,93 0,99831 3,43 0,99970 3,93 0,99996
0,44 0,67003 0,94 0,82639 1,44 0,92507 1,94 0,97381 2,44 0,99266 2,94 0,99836 3,44 0,99971 3,94 0,99996
0,45 0,67364 0,95 0,82894 1,45 0,92647 1,95 0,97441 2,45 0,99286 2,95 0,99841 3,45 0,99972 3,95 0,99996
0,46 0,67724 0,96 0,83147 1,46 0,92785 1,96 0,97500 2,46 0,99305 2,96 0,99846 3,46 0,99973 3,96 0,99996
0,47 0,68082 0,97 0,83398 1,47 0,92922 1,97 0,97558 2,47 0,99324 2,97 0,99851 3,47 0,99974 3,97 0,99996
0,48 0,68439 0,98 0,83646 1,48 0,93056 1,98 0,97615 2,48 0,99343 2,98 0,99856 3,48 0,99975 3,98 0,99997
0,49 0,68793 0,99 0,83891 1,49 0,93189 1,99 0,97670 2,49 0,99361 2,99 0,99861 3,49 0,99976 3,99 0,99997
Tabla 2: Percentiles de la distribucin t de Student .
gl
t0,001 t0,005 t0,01 t0,02 t0,025 t0,05 t0,10 t0,90 t0,975 t0,98 t0,99 t0,995 t0,999
1 -318,29 -63,66 -31,82 -15,89 -12,71 -6,31 -3,08 3,08 12,71 15,89 31,82 63,66 318,29
2 -22,33 -9,92 -6,96 -4,85 -4,30 -2,92 -1,89 1,89 4,30 4,85 6,96 9,92 22,33
3 -10,21 -5,84 -4,54 -3,48 -3,18 -2,35 -1,64 1,64 3,18 3,48 4,54 5,84 10,21
4 -7,17 -4,60 -3,75 -3,00 -2,78 -2,13 -1,53 1,53 2,78 3,00 3,75 4,60 7,17
5 -5,89 -4,03 -3,36 -2,76 -2,57 -2,02 -1,48 1,48 2,57 2,76 3,36 4,03 5,89
6 -5,21 -3,71 -3,14 -2,61 -2,45 -1,94 -1,44 1,44 2,45 2,61 3,14 3,71 5,21
7 -4,79 -3,50 -3,00 -2,52 -2,36 -1,89 -1,41 1,41 2,36 2,52 3,00 3,50 4,79
8 -4,50 -3,36 -2,90 -2,45 -2,31 -1,86 -1,40 1,40 2,31 2,45 2,90 3,36 4,50
9 -4,30 -3,25 -2,82 -2,40 -2,26 -1,83 -1,38 1,38 2,26 2,40 2,82 3,25 4,30
10 -4,14 -3,17 -2,76 -2,36 -2,23 -1,81 -1,37 1,37 2,23 2,36 2,76 3,17 4,14
11 -4,02 -3,11 -2,72 -2,33 -2,20 -1,80 -1,36 1,36 2,20 2,33 2,72 3,11 4,02
12 -3,93 -3,05 -2,68 -2,30 -2,18 -1,78 -1,36 1,36 2,18 2,30 2,68 3,05 3,93
13 -3,85 -3,01 -2,65 -2,28 -2,16 -1,77 -1,35 1,35 2,16 2,28 2,65 3,01 3,85
14 -3,79 -2,98 -2,62 -2,26 -2,14 -1,76 -1,35 1,35 2,14 2,26 2,62 2,98 3,79
15 -3,73 -2,95 -2,60 -2,25 -2,13 -1,75 -1,34 1,34 2,13 2,25 2,60 2,95 3,73
16 -3,69 -2,92 -2,58 -2,24 -2,12 -1,75 -1,34 1,34 2,12 2,24 2,58 2,92 3,69
17 -3,65 -2,90 -2,57 -2,22 -2,11 -1,74 -1,33 1,33 2,11 2,22 2,57 2,90 3,65
18 -3,61 -2,88 -2,55 -2,21 -2,10 -1,73 -1,33 1,33 2,10 2,21 2,55 2,88 3,61
19 -3,58 -2,86 -2,54 -2,20 -2,09 -1,73 -1,33 1,33 2,09 2,20 2,54 2,86 3,58
20 -3,55 -2,85 -2,53 -2,20 -2,09 -1,72 -1,33 1,33 2,09 2,20 2,53 2,85 3,55
21 -3,53 -2,83 -2,52 -2,19 -2,08 -1,72 -1,32 1,32 2,08 2,19 2,52 2,83 3,53
22 -3,50 -2,82 -2,51 -2,18 -2,07 -1,72 -1,32 1,32 2,07 2,18 2,51 2,82 3,50
23 -3,48 -2,81 -2,50 -2,18 -2,07 -1,71 -1,32 1,32 2,07 2,18 2,50 2,81 3,48
24 -3,47 -2,80 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,80 3,47
25 -3,45 -2,79 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,79 3,45
26 -3,43 -2,78 -2,48 -2,16 -2,06 -1,71 -1,31 1,31 2,06 2,16 2,48 2,78 3,43
27 -3,42 -2,77 -2,47 -2,16 -2,05 -1,70 -1,31 1,31 2,05 2,16 2,47 2,77 3,42
28 -3,41 -2,76 -2,47 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,47 2,76 3,41
29 -3,40 -2,76 -2,46 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,46 2,76 3,40
30 -3,39 -2,75 -2,46 -2,15 -2,04 -1,70 -1,31 1,31 2,04 2,15 2,46 2,75 3,39
31 -3,37 -2,74 -2,45 -2,14 -2,04 -1,70 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
32 -3,37 -2,74 -2,45 -2,14 -2,04 -1,69 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
33 -3,36 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,36
34 -3,35 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,35
35 -3,34 -2,72 -2,44 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,44 2,72 3,34
36 -3,33 -2,72 -2,43 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,43 2,72 3,33
38 -3,32 -2,71 -2,43 -2,13 -2,02 -1,69 -1,30 1,30 2,02 2,13 2,43 2,71 3,32
40 -3,31 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,31
42 -3,30 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,30
44 -3,29 -2,69 -2,41 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,41 2,69 3,29
46 -3,28 -2,69 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,69 3,28
48 -3,27 -2,68 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,68 3,27
50 -3,26 -2,68 -2,40 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,40 2,68 3,26
55 -3,25 -2,67 -2,40 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,40 2,67 3,25
60 -3,23 -2,66 -2,39 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,39 2,66 3,23
65 -3,22 -2,65 -2,39 -2,10 -2,00 -1,67 -1,29 1,29 2,00 2,10 2,39 2,65 3,22
70 -3,21 -2,65 -2,38 -2,09 -1,99 -1,67 -1,29 1,29 1,99 2,09 2,38 2,65 3,21
80 -3,20 -2,64 -2,37 -2,09 -1,99 -1,66 -1,29 1,29 1,99 2,09 2,37 2,64 3,20
90 -3,18 -2,63 -2,37 -2,08 -1,99 -1,66 -1,29 1,29 1,99 2,08 2,37 2,63 3,18
100 -3,17 -2,63 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,63 3,17
110 -3,17 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,17
120 -3,16 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,16
150 -3,15 -2,61 -2,35 -2,07 -1,98 -1,66 -1,29 1,29 1,98 2,07 2,35 2,61 3,15
200 -3,13 -2,60 -2,35 -2,07 -1,97 -1,65 -1,29 1,29 1,97 2,07 2,35 2,60 3,13
250 -3,12 -2,60 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,60 3,12
350 -3,11 -2,59 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,59 3,11
500 -3,11 -2,59 -2,33 -2,06 -1,96 -1,65 -1,28 1,28 1,96 2,06 2,33 2,59 3,11
3000 -3,09 -2,58 -2,33 -2,05 -1,96 -1,65 -1,28 1,28 1,96 2,05 2,33 2,58 3,09
t
129
Estadistica
Tabla 2: Percentiles de la distribucin t de Student .
gl
t0,001 t0,005 t0,01 t0,02 t0,025 t0,05 t0,10 t0,90 t0,975 t0,98 t0,99 t0,995 t0,999
1 -318,29 -63,66 -31,82 -15,89 -12,71 -6,31 -3,08 3,08 12,71 15,89 31,82 63,66 318,29
2 -22,33 -9,92 -6,96 -4,85 -4,30 -2,92 -1,89 1,89 4,30 4,85 6,96 9,92 22,33
3 -10,21 -5,84 -4,54 -3,48 -3,18 -2,35 -1,64 1,64 3,18 3,48 4,54 5,84 10,21
4 -7,17 -4,60 -3,75 -3,00 -2,78 -2,13 -1,53 1,53 2,78 3,00 3,75 4,60 7,17
5 -5,89 -4,03 -3,36 -2,76 -2,57 -2,02 -1,48 1,48 2,57 2,76 3,36 4,03 5,89
6 -5,21 -3,71 -3,14 -2,61 -2,45 -1,94 -1,44 1,44 2,45 2,61 3,14 3,71 5,21
7 -4,79 -3,50 -3,00 -2,52 -2,36 -1,89 -1,41 1,41 2,36 2,52 3,00 3,50 4,79
8 -4,50 -3,36 -2,90 -2,45 -2,31 -1,86 -1,40 1,40 2,31 2,45 2,90 3,36 4,50
9 -4,30 -3,25 -2,82 -2,40 -2,26 -1,83 -1,38 1,38 2,26 2,40 2,82 3,25 4,30
10 -4,14 -3,17 -2,76 -2,36 -2,23 -1,81 -1,37 1,37 2,23 2,36 2,76 3,17 4,14
11 -4,02 -3,11 -2,72 -2,33 -2,20 -1,80 -1,36 1,36 2,20 2,33 2,72 3,11 4,02
12 -3,93 -3,05 -2,68 -2,30 -2,18 -1,78 -1,36 1,36 2,18 2,30 2,68 3,05 3,93
13 -3,85 -3,01 -2,65 -2,28 -2,16 -1,77 -1,35 1,35 2,16 2,28 2,65 3,01 3,85
14 -3,79 -2,98 -2,62 -2,26 -2,14 -1,76 -1,35 1,35 2,14 2,26 2,62 2,98 3,79
15 -3,73 -2,95 -2,60 -2,25 -2,13 -1,75 -1,34 1,34 2,13 2,25 2,60 2,95 3,73
16 -3,69 -2,92 -2,58 -2,24 -2,12 -1,75 -1,34 1,34 2,12 2,24 2,58 2,92 3,69
17 -3,65 -2,90 -2,57 -2,22 -2,11 -1,74 -1,33 1,33 2,11 2,22 2,57 2,90 3,65
18 -3,61 -2,88 -2,55 -2,21 -2,10 -1,73 -1,33 1,33 2,10 2,21 2,55 2,88 3,61
19 -3,58 -2,86 -2,54 -2,20 -2,09 -1,73 -1,33 1,33 2,09 2,20 2,54 2,86 3,58
20 -3,55 -2,85 -2,53 -2,20 -2,09 -1,72 -1,33 1,33 2,09 2,20 2,53 2,85 3,55
21 -3,53 -2,83 -2,52 -2,19 -2,08 -1,72 -1,32 1,32 2,08 2,19 2,52 2,83 3,53
22 -3,50 -2,82 -2,51 -2,18 -2,07 -1,72 -1,32 1,32 2,07 2,18 2,51 2,82 3,50
23 -3,48 -2,81 -2,50 -2,18 -2,07 -1,71 -1,32 1,32 2,07 2,18 2,50 2,81 3,48
24 -3,47 -2,80 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,80 3,47
25 -3,45 -2,79 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,79 3,45
26 -3,43 -2,78 -2,48 -2,16 -2,06 -1,71 -1,31 1,31 2,06 2,16 2,48 2,78 3,43
27 -3,42 -2,77 -2,47 -2,16 -2,05 -1,70 -1,31 1,31 2,05 2,16 2,47 2,77 3,42
28 -3,41 -2,76 -2,47 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,47 2,76 3,41
29 -3,40 -2,76 -2,46 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,46 2,76 3,40
30 -3,39 -2,75 -2,46 -2,15 -2,04 -1,70 -1,31 1,31 2,04 2,15 2,46 2,75 3,39
31 -3,37 -2,74 -2,45 -2,14 -2,04 -1,70 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
32 -3,37 -2,74 -2,45 -2,14 -2,04 -1,69 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
33 -3,36 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,36
34 -3,35 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,35
35 -3,34 -2,72 -2,44 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,44 2,72 3,34
36 -3,33 -2,72 -2,43 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,43 2,72 3,33
38 -3,32 -2,71 -2,43 -2,13 -2,02 -1,69 -1,30 1,30 2,02 2,13 2,43 2,71 3,32
40 -3,31 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,31
42 -3,30 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,30
44 -3,29 -2,69 -2,41 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,41 2,69 3,29
46 -3,28 -2,69 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,69 3,28
48 -3,27 -2,68 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,68 3,27
50 -3,26 -2,68 -2,40 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,40 2,68 3,26
55 -3,25 -2,67 -2,40 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,40 2,67 3,25
60 -3,23 -2,66 -2,39 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,39 2,66 3,23
65 -3,22 -2,65 -2,39 -2,10 -2,00 -1,67 -1,29 1,29 2,00 2,10 2,39 2,65 3,22
70 -3,21 -2,65 -2,38 -2,09 -1,99 -1,67 -1,29 1,29 1,99 2,09 2,38 2,65 3,21
80 -3,20 -2,64 -2,37 -2,09 -1,99 -1,66 -1,29 1,29 1,99 2,09 2,37 2,64 3,20
90 -3,18 -2,63 -2,37 -2,08 -1,99 -1,66 -1,29 1,29 1,99 2,08 2,37 2,63 3,18
100 -3,17 -2,63 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,63 3,17
110 -3,17 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,17
120 -3,16 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,16
150 -3,15 -2,61 -2,35 -2,07 -1,98 -1,66 -1,29 1,29 1,98 2,07 2,35 2,61 3,15
200 -3,13 -2,60 -2,35 -2,07 -1,97 -1,65 -1,29 1,29 1,97 2,07 2,35 2,60 3,13
250 -3,12 -2,60 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,60 3,12
350 -3,11 -2,59 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,59 3,11
500 -3,11 -2,59 -2,33 -2,06 -1,96 -1,65 -1,28 1,28 1,96 2,06 2,33 2,59 3,11
3000 -3,09 -2,58 -2,33 -2,05 -1,96 -1,65 -1,28 1,28 1,96 2,05 2,33 2,58 3,09
t

Estadisticas Angel Estadistica Angel Borgna Fernandez

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Estadisticas Angel Estadistica Angel Borgna Fernandez

Hochgeladen von

Copyright:

Verfügbare Formate

Estadstica

Completar la actividad 1 con la clasiIicacion de las variables.

Representar graIicamente las variables de la ME 2.

Los subndices de los Z estn en relacin con el criterio de acumulacin de la

Con base en la muestra de los 16 paquetes estimaremos el peso medio de

Das könnte Ihnen auch gefallen