Beruflich Dokumente
Kultur Dokumente
Carpeta de trabajo
Estadstica
Mara Eugenia ngel
Mario Enrique Borgna
Graciela Fernandez
Diseo original de maqueta: Hernn Morfese
Procesamiento didctico: Marina Gergich / Bruno De Angelis
Primera edicin: Septiembre de 2009
ISBN: 978-987-1782-08-6
Universidad Virtual de Quilmes, 2009
Roque Senz Pea 352, (B1876BXD) Bernal, Buenos Aires
Telfono: (5411) 4365 7100 | http://www.virtual.unq.edu.ar
La Universidad Virtual de Quilmes de la Universidad Nacional de
Quilmes se reserva la facultad de dis- poner de esta obra, publicarla,
traducirla, adaptarla o autorizar su traduccin y reproduccin en
cualquier forma, total o parcialmente, por medios electrnicos o
mecnicos, incluyendo fotocopias, grabacin magnetofnica y
cualquier sistema de almacenamiento de informacin. Por consi-
guiente, nadie tiene facultad de ejercitar los derechos precitados sin
permiso escrito del editor.
Queda hecho el depsito que establece la ley 11.723
Impreso en Argentina
Lectura obligatoria
Es la bibliografa imprescindible que acompaa el desarrollo de los conteni-
dos. Se trata tanto de textos completos como de captulos de libros, artcu-
los y "papers" que los estudiantes deben leer, en lo posible, en el momento
en que se indica en la Carpeta.
Actividades
Se trata de una amplia gama de propuestas de produccin de diferentes ti-
pos. Incluye ejercicios, estudios de caso, investigaciones, encuestas, elabo-
racin de cuadros, grficos, resolucin de guas de estudio, etctera.
Leer con atencin
Son afirmaciones, conceptos o definiciones destacadas y sustanciales que
aportan claves para la comprensin del tema que se desarrolla.
Para reflexionar
Es una herramienta que propone al estudiante un dilogo con el material, a tra-
vs de preguntas, planteamiento de problemas, confrontaciones del tema con la
realidad, ejemplos o cuestionamientos que alienten la autorreflexin, etctera.
Lectura recomendada
Es la bibliografa que no se considera obligatoria, pero a la cual el estudian-
te puede recurrir para ampliar o profundizar algn tema o contenido.
Pastilla
Se utiliza como reemplazo de la nota al pie, para incorporar informaciones
breves, complementarias o aclaratorias de algn trmino o frase del texto
principal. El subrayado indica los trminos a propsito de los cuales se inclu-
ye esa informacin asociada en el margen.
conos
nd
Introduccin...........................................................................................9
Mapa conceptual ..................................................................................10
Problemtica del campo ........................................................................10
Objetivos del curso ...............................................................................11
1. Estadstica descriptiva.....................................................................13
1.1. Los datos y su organizacin ...........................................................13
1.1.1. Variables estadsticas y su clasificacin................................13
1.1.2. Ordenamiento y tabulacin de los datos................................15
1.1.3. Representaciones grficas ...................................................23
1.2. Medidas estadsticas.....................................................................28
1.2.1. Medidas de posicin............................................................28
1.2.2. Medidas de dispersin.........................................................39
1.2.3. Medidas de intensidad.........................................................43
1.3. Matrices ejemplos .........................................................................51
2. Probabilidad.....................................................................................55
2.1. Elementos de la teora de probabilidad ...........................................55
2.1.1. Experimento aleatorio .................................................................55
2.1.2. Definiciones de probabilidad........................................................62
2.1.3. Axiomatizacin de la probabilidad ................................................63
2.1.4. Tipos de probabilidad..................................................................64
2.2. Variable aleatoria...........................................................................69
2.2.1. Variable aleatoria discreta...........................................................69
2.2.2. Modelos especiales de variables aleatorias discretas ...................71
2.2.3. Variable aleatoria continua ..........................................................76
2.2.4. Modelos especiales de variables aleatorias continuas ..................77
3. Inferencia estadstica.......................................................................87
3.1. Distribucin de estadsticos muestrales..........................................87
3.1.1. Distribucin del estadstico media muestral .................................88
3.1.2. Distribucin del estadstico proporcin muestral ...........................90
3.1.3. Teorema central del lmite ...........................................................91
3.2. Problemas fundamentales de la inferencia estadstica .....................94
3.2.1. Estimacin por intervalo de confianza ..........................................94
3.2.2. Pruebas de hiptesis ................................................................105
4. Elementos bsicos de econometra.................................................113
4.1. Introduccin ................................................................................113
4.2. Anlisis de regresin y de correlacin ...........................................114
4.3. Series de tiempo .........................................................................120
Referencia bibliogrfica......................................................................125
7
ndice
Anexo................................................................................................127
Tabla 1: Percentiles de la distribucin normal estndar .........................127
Tabla 2: Percentiles de la distribucin t de Student ...............................129
8
Universidad Virtual de Quilmes
9
El material de esta carpeta contiene, en su inicio Unidad 1, diversas formas
de organizacin de los conjuntos de datos (apartado 1.1.). En algunos casos
datos de campo y en otros compilados, como preparacin del material de base
para elaborar las medidas estadsticas (apartado 1.2.) tambin denominadas
indicadores estadsticos, y producir informacin til.
La importancia de la organizacin de los datos, en vistas del tratamiento
posterior, reside en que permite establecer distintas lneas de trabajo en pos
de la calidad de la informacin que se busca. Una informacin estadstica de
calidad es primordial para la comprensin de las cualidades o caractersticas
del mundo real con perspectiva de su modelizacin.
A comienzos del siglo XIX el astrnomo Adolfo Quetelet considerado el fun-
dador de la estadstica moderna aplic a las ciencias sociales los mtodos
estadsticos hasta entonces utilizados en las ciencias naturales, contribu-
yendo a la ampliacin del campo de la estadstica. Sin embargo, fue a partir
de mediados de la dcada de 1960 con el Anlisis Exploratorio de Datos (EDA)
desarrollado por J. Tukey y otros que surgi un enfoque ms amplio en el
tratamiento de datos, cimentado en el uso de la informtica, donde el sopor-
te tecnolgico permiti sostener una gran masa de datos y procesarlos en
tiempo real, contribuyendo as al mejoramiento de la calidad de la informacin
resultante.
Luego del tratamiento descriptivo de los datos desarrollado en la Unidad
1, se incorporan nociones sobre la teora de la probabilidad Unidad 2.
A partir del siglo XVII comenz a evolucionar el Clculo de probabilidad
como disciplina cientfica introducindose el uso sistemtico de los concep-
tos de azar, indeterminismo y aleatoriedad. La Estadstica, que a la sazn ya
tena un desarrollo de varios milenios donde el campo de trabajo era exclusi-
vamente las poblaciones o universos, es decir la totalidad de los individuos o
elementos involucrados en el estudio de un problema, se vio enriquecida por
el desarrollo de la teora de la probabilidad la cual le permiti extender su
alcance hacia el interior de dichas poblaciones y ampliar su metodologa al
tratamiento de los subconjuntos de ellas, las muestras.
Los trabajos de Bernoulli, Laplace, Gauss y Galton entre otros, proveyeron
al clculo de probabilidades de recursos matemticos que permitieron dise-
ar modelos probabilsticos aplicables a diversos campos de la ciencia. Los
modelos probabilsticos, cuyo ncleo son las distribuciones de probabilidad
de las variables involucradas en los problemas de estudio (apartado 2.2.),
son la base de la inferencia estadstica.
La inferencia estadstica Unidad 3 es el procedimiento por el cual se
extrapolan o extienden a la poblacin en estudio los resultados de una mues-
tra representativa. A partir de los indicadores o estadsticos muestrales se
estiman (apartado 3.2.) o se someten a prueba (apartado 3.3.) los indicado-
res poblacionales tambin denominados parmetros.
In tro duc cin
Por ltimo, se tratan algunos elementos de econometra Unidad 4, nocio-
nes sobre la relacin entre variables como el anlisis de regresin lineal, el
anlisis de correlacin y un breve estudio sobre las series de tiempo.
El orden y sentido en que se desarrollan los distintos conceptos en el trans-
curso del presente material se sintetiza en el diagrama siguiente.
Mapa conceptual
Problemtica del campo
La estadstica se compone de dos grandes reas, la descriptiva y la inferencial.
Por medio de la estadstica descriptiva se analizan propiedades de un con-
junto de datos referidas al contexto en el que ellos se encuentran inmersos y
no como entidades aisladas. Por ese motivo es muy importante antes del an-
lisis descriptivo, conocer y clarificar el entorno del que provienen los datos.
Cuando hablamos del entorno estamos haciendo referencia a la poblacin en
estudio (o a una parte de ella) y a sus unidades de anlisis, a los atributos
que interesa estudiar y a la calidad del dato que se puede extraer.
Por otro lado, en los estudios de campo se da con frecuencia y por distin-
tas causas la imposibilidad de acceder a toda la poblacin y es en esos casos
donde los datos tienen que extraerse de un subconjunto de ella al que deno-
minamos muestra. Si el objetivo del anlisis de la muestra es realizar infe-
rencias respecto a la poblacin, necesariamente debe ser una muestra repre-
sentativa que comportndose como una imagen reducida de esa poblacin
de estudio refleje sus caractersticas. Estas muestras son obtenidas por
mtodos de muestreo aleatorio.
La estadstica inferencial tiene como objetivo realizar inferencias sobre la
poblacin en un ambiente de incertidumbre producto del azar y la aleatoriedad.
En sntesis, hay dos grandes problemas con los que se encuentra este
campo del saber el conocimiento del contexto de estudio y el tratamiento de
la incertidumbre.
10
Universidad Virtual de Quilmes
Aprehender tcnicas y mtodos estadsticos tanto de la Estadstica des-
criptiva como de la Estadstica inferencial.
Emplear esas tcnicas y mtodos en la formalizacin de modelos esta-
dsticos en el mbito de las ciencias econmicas.
Aplicar el conocimiento estadstico adquirido a la vida cotidiana como parte
de una cultura general.
11
Objetivos del curso
13
Estadstica descriptiva
Ob je ti vos
Determinar y analizar distintos indicadores socioeconmicos.
Construir e interpretar grficos estadsticos diversos.
1.1. Los datos y su organizacin
En este apartado se tratarn algunas de las formas de organizar los datos
recolectados o recopilados y se preparar el material de base para que en los
apartados siguientes puedan elaborarse medidas estadsticas, comnmente
denominadas indicadores estadsticos.
Los datos son tomados de una cierta poblacin o universo objeto de estu-
dio: la poblacin objetivo.
Por ejemplo, todos los empleados de una determinada pyme constituyen
una poblacin objetivo. Y en ese caso, cada individuo de ese universo cada
empleado es lo que se denomina una unidad de observacin.
En el estudio de la poblacin nos pueden interesar determinados atribu-
tos comunes a los individuos como la edad, el salario, la antigedad, etc. Los
archivos de la empresa combinados con entrevistas personales pueden haber
sido los instrumentos con que se relev la informacin.
El paso inicial para organizar toda la informacin primaria obtenida del
grupo de empleados de la pyme y que la presente en su totalidad, es elabo-
rar una tabla denominada matriz de datos. Una matriz de datos es un arreglo
de filas y columnas donde cada fila representa un individuo o unidad de obser-
vacin y cada columna un atributo variable (en el apartado 1.3. figuran cuatro
matrices de datos llamadas a partir de ahora matrices ejemplo ME cada
vez que se haga referencia a ellas).
Cada uno de los atributos variables que se observan en la matriz son pasi-
bles de convertirse en lo que llamamos variables estadsticas.
1.1.1. Variables estadsticas y su clasificacin
Las variables estadsticas se obtienen a partir de los atributos. Por ejemplo,
si el atributo primario hubiese sido la fecha de nacimiento de cada empleado,
para su tratamiento estadstico se disea la variable edad en aos. Por otro
lado, contando con la fecha de nacimiento y la fecha de ingreso podra dise-
1
En el apartado 1.6. figu-
ran varios ejemplos de
poblacin objetivo y de unidad de
observacin.
Otros instrumentos de
recoleccin de datos son:
documentos, encuestas o simple
observacin.
Puede haber atributos
que no varen de un indi-
viduo a otro, como la pertenen-
cia a la empresa, ya que todos
son empleados.
arse la variable edad que tena cuando ingres a la empresa (en este caso
la variable surge de una combinacin de atributos).
Para un primer tratamiento se convertir cada atributo de las matrices ejem-
plo ME en una variable estadstica.
Si se observan detenidamente cada una de las variables se puede notar
que algunas asumen valores numricos y otras valores no numricos.
A las que asumen valores numricos las denominaremos variables cuan-
titativas y a las que asumen valores no numricos, es decir cualidades, varia-
bles cualitativas.
Son ejemplos de variables cuantitativas la antigedad, el salario quince-
nal, la cantidad de personal, la longitud de las piezas de plstico, etc. Son
ejemplos de variables cualitativas el sexo, el tipo de posesin de la vivienda,
el rubro de las pymes, el tipo de materia prima, etctera.
1.
Clasificar como cuantitativas o cualitativas cada una de las variables de
las ME del apartado 1.3.
Si se observan ms detenidamente las variables de las matrices ejemplo se
puede notar que hay variables cuantitativas que asumen valores dentro del
conjunto de los nmeros reales y hay otras cuyos valores son nmeros ente-
ros. A las que asumen valores reales las denominamos cuantitativas conti-
nuas y a las otras cuantitativas discretas. Por ejemplo: la edad civil es por
naturaleza una variable discreta pero eventualmente si se tratara la edad bio-
lgica sta sera por naturaleza una variable cuantitativa continua.
Con respecto a las variables cualitativas se puede notar que en algunas de
ellas sus valores pueden ordenarse y en otras no. Esto justifica tambin sub-
clasificarla en cualitativas ordenables y cualitativas no ordenables. Un ejem-
plo de variable cualitativa ordenable es el nivel de detalle de terminacin de
las piezas plsticas y un ejemplo de no ordenable es el rubro de las pymes.
2.
Completar la actividad 1 con la clasificacin de las variables.
Por qu motivo cree que es necesaria la clasificacin realizada para las
variables y cul ser su utilidad?
14
Universidad Virtual de Quilmes
7
FIN DE LEER ATENTO
COMIENZO DE ACTIVIDAD
(x
i
X
Ii
N
si el grupo de datos es una poblacion o
3
(x
i
X
Ii
n -1
si el grupo de datos es una muestra.
35
d Q
3
Q
1
Varianza y desvo estandar
La varianza es una medida que Iue propuesta por Gauss y tiene en
cuenta todos los valores de los datos de la distribucion. Para su
construccion se utiliza la media aritmetica como reIerencia para calcular
las desviaciones (Xi ) del valor de cada uno de los datos respecto a
ella.
COMENZO DE PASTLLA EN Gauss
Karl Friedrich Gauss en TheoUa PotuV FoUpoUuP FleVtiuP, Hamgurgo (1809).
FN DE PASTLLA
En el graIico G.1.26. se observan algunas magnitudes y sentidos de
estos desvios respecto de la media:
Insertar Imagen N G.1.26.
El objetivo es elaborar una medida que sintetice al conjunto de todos los
desvios y para calcularla podriamos promediarlos contando asi con un
desvio promedio.
Pero al momento de realizar ese promedio nos encontrariamos con la
diIicultad de que la suma de las desviaciones siempre da cero, como
obvia consecuencia de que la media es el centro de equilibrio de todos
los desvios, es decir que,
X
I
X
Para salvar este escollo el criterio que utilizo Gauss, y que lo hacemos
nuestro, es promediar los cuadrados de las desviaciones. La medida asi
determinada se denomina YDULDQ]D.
Formalmente la varianza se expresa como
(x
i
X
Ii
N
si el grupo de datos es una poblacion o
3
(x
i
X
Ii
n -1
si el grupo de datos es una muestra.
La media poblacional es una sola,
como tambin lo es la varianza
poblacional. En cambio hay tantas
medias muestrales como muestras
distintas se puedan extraer de la
poblacin; y tambin hay tantas
varianzas muestrales como medias
muestrales puedan obtenerse. Por
lo que una varianza muestral est
atada a una determinada media,
tiene un (1) condicionamiento que
no tena la poblacional. Ese condi-
cionamiento le resta (1)
un grado de libertad.
cosas al momento de interpretar esta medida de variabilidad. Para poder com-
patibilizar la magnitud de la dispersin con la magnitud de la variable, sim-
plemente le sacamos la raz cuadrada a la varianza, resultando una nueva
medida llamada desvo estndar.
Formalmente, el desvo se expresa como
si el grupo de datos es una poblacin o
si el grupo de datos es una muestra.
Para el gasto mensual de los hogares encuestados el desvo estndar mues-
tral es: S = $422,28. Esta lectura absoluta aisladamente no suministra una
informacin muy clara sobre los alcances de la dispersin.
En una distribucin simtrica el desvo estndar describe un entorno
alrededor de la media que contiene aproximadamente las 2/3 partes (~
68%) de los datos.
Si se tuviera que el gasto mensual est distribudo simtricamente, slo podr-
amos hacer una interpretacin en el sentido de lo expuesto diciendo que apro-
ximadamente las dos terceras partes de las viviendas de la muestra tienen un
gasto mensual comprendido entre $804,97 y $1649,53 ($1227,25
$422,28).
Para ampliar el concepto anterior rescatamos los indicadores de los casos
1 y 2 de variables cuantitativas discretas donde, en ambos, la variable es
edad.
41
Estadistica
36
El divisor N o el n-1, segn el caso, se llama grados de libertad. A este
tpico nos arrimaremos con ms detalle en estadstica inferencial.
COMIENZO DE PASTILLA EN divisor
La media poblacional es una sola, como tambin lo es la varianza poblacional. En
cambio hay tantas medias muestrales como muestras distintas se puedan extraer de la
poblacin; y tambin hay tantas varianzas muestrales como medias muestrales
puedan obtenerse. Por lo que una varianza muestral est atada a una determinada
media, tiene un (1) condicionamiento que no tena la poblacional. Ese
condicionamiento le resta (1) un grado de libertad.
FIN DE PASTILLA
Para la distribucin del gasto medio mensual en alimentos de la
matriz ME 2, la varianza muestral (recordemos que esas 32 viviendas
son una muestra extrada de un universo ms grande de viviendas del
barrio) es:
S = 195.607,537 $
Recordando que la media es , se aprecia que la
magnitud de la varianza es el cuadrado de la magnitud de la variable y
esto complica las cosas al momento de interpretar esta medida de
variabilidad. Para poder compatibilizar la magnitud de la dispersin con
la magnitud de la variable, simplemente le sacamos la raz cuadrada a la
varianza, resultando una nueva medida llamada desvo estndar.
Formalmente, el desvo se expresa como
=
(x
i
x )
2
fi
N
si el grupo de datos es una poblacin o
S =
(x
i
x )
2
fi
n-1
si el grupo de datos es una muestra.
Para el gasto mensual de los hogares encuestados el desvo estndar
muestral es: S = $422,28. Esta lectura absoluta, aisladamente no
suministra una informacin muy clara sobre los alcances de la
dispersin.
COMIENZO DE LEER ATENTO
En una distribucin simtrica el desvo estndar describe un
entorno alrededor de la media que contiene aproximadamente las
2/3 partes (~ 68%) de los datos.
FIN DE LEER ATENTO
Si se tuviera que el gasto mensual est distribudo simtricamente, slo
podramos hacer una interpretacin en el sentido de lo expuesto
diciendo que aproximadamente las dos terceras partes de las viviendas
de la muestra tienen un gasto mensual comprendido entre $804,97 y
$1649,53 ($1227,25 $422,28).
donde, en ambos, la variable es edad.
Medidas
Caso 1: Ldad de los
trabajadores de una
empresa oooperativa"
Caso 2: Ldad de los empleados de una fabrioa
automotriz"
X
38,9 aos 37,4 aos
Me 37,5 aos 37 aos
Mo 37 aos 37,5 aos (maroa de olase del intervalo modal)
R 42 aos 49 aos
S
2
100,73 aos
2
127,56 aos
2
S 10,0 aos 11,3 aos
Asimetria a dereoha Casi simtrioa
2/3 de los oasos
aproximadamente
No se puede
Comprende las edades de 27 aos a 48 aos
(valores que oaen dentro del intervalo 37,4 | 11,3)
COMIENZO DE LEER ATENTO
La utilidad de las medidas de dispersin aparece claramente cuando se comparan distintas distribuciones de datos
referidas a la misma variable.
FIN DE LEER ATENTO
Utilizando la informacin del cuadro anterior para comparar las distribuciones de edades de los grupos analizados,
notamos que todas las medidas de dispersin calculadas son mayores en el caso 2 respecto del caso 1. Esto estara
indicando que las edades de los empleados de la muestra de la fbrica automotriz estn ms dispersas que las edades de
los trabajadores de la muestra de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son similares, caracterstica que permiti comparar
sin problemas las medidas de dispersin. Si los grupos analizados no tuvieren similar promedio entonces la comparacin
de la dispersin de las distribuciones debera intentarse por otro camino.
Otro problema se presenta cuando se quieren comparar las dispersiones de variables distintas surgidas de un mismo
grupo de estudio.
Coeciente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de las distribuciones de variables que tienen
distinta magnitud.
Este coeciente puede utilizarse tambin para comparar variables de igual magnitud pero con promedios
signicativamente distintos.
Medidas
Cantidad de
ambientes
Cantidad de personas
ocupantes
Gasto medio
mensual
Cantidad de personas
mayores con trabajo
S 1,26 amb. 0,94 pers. $421,23 0,98 pers.
3,34 amb. 3,12 pers. $1201,68 2,25 pers.
CV 0,3772 0,3013 0,3505 0,4355
Cv100 38,72 30,13 35,05 43,55
De la comparacin de los CV se concluye que el grupo de viviendas relevadas es ms compacto, ms homogneo,
menos disperso, en cuanto a la cantidad de personas ocupantes, porque tiene el menor de los coecientes calculados.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms heterogneo, ms disperso, menos compacto,
en cuanto a la cantidad de personas mayores con trabajo.
La utilidad de las medidas de dispersin aparece claramente cuando se
comparan distintas distribuciones de datos referidas a la misma variable.
Utilizando la informacin del cuadro anterior, para comparar las distribuciones
de edades de los grupos analizados, notamos que todas las medidas de dis-
persin calculadas son mayores en el caso 2 respecto del caso 1. Esto esta-
ra indicando que las edades de los empleados de la muestra de la fbrica auto-
motriz estn ms dispersas que las edades de los trabajadores de la muestra
de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son
similares, caracterstica que permiti comparar sin problemas las medidas de
dispersin. Si los grupos analizados no tuvieren similar promedio entonces la
comparacin de la dispersin de las distribuciones debera intentarse por otro
camino.
Otro problema se presenta cuando se quieren comparar las dispersiones
de variables distintas surgidas de un mismo grupo de estudio.
Coeficiente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de
las distribuciones de variables que tienen distinta magnitud.
Este coeficiente puede utilizarse tambin para comparar variables de igual
magnitud pero con promedios significativamente distintos.
Es en realidad una dispersin relativa no absoluta como el desvo estn-
dar y se calcula como el cociente entre el desvo estndar y la media.
Tambin se puede expresar en porcentajes
Compararemos todas las variables cuantitativas de la ME 2 calculando todos
los CV.
De la comparacin de los CV se concluye que el grupo de viviendas relevadas
es ms compacto, ms homogneo, menos disperso, en cuanto a la cantidad
de personas ocupantes, porque tiene el menor de los coeficientes calculados.
42
Universidad Virtual de Quilmes
donde, en ambos, la variable es edad.
Medidas
Caso 1: Ldad de los
trabajadores de una
empresa oooperativa"
Caso 2: Ldad de los empleados de una fabrioa
automotriz"
38,9 aos 37,4 aos
Me 37,5 aos 37 aos
Mo 37 aos 37,5 aos (maroa de olase del intervalo modal)
R 42 aos 49 aos
S
2
100,73 aos
2
127,56 aos
2
S 10,0 aos 11,3 aos
Asimetria a dereoha Casi simtrioa
2/3 de los oasos
aproximadamente
No se puede
Comprende las edades de 27 aos a 48 aos
(valores que oaen dentro del intervalo 37,4 | 11,3)
COMIENZO DE LEER ATENTO
La utilidad de las medidas de dispersin aparece claramente cuando se comparan distintas distribuciones de datos
referidas a la misma variable.
FIN DE LEER ATENTO
Utilizando la informacin del cuadro anterior para comparar las distribuciones de edades de los grupos analizados,
notamos que todas las medidas de dispersin calculadas son mayores en el caso 2 respecto del caso 1. Esto estara
indicando que las edades de los empleados de la muestra de la fbrica automotriz estn ms dispersas que las edades de
los trabajadores de la muestra de la cooperativa.
Es importante sealar que las edades promedio de los dos grupos son similares, caracterstica que permiti comparar
sin problemas las medidas de dispersin. Si los grupos analizados no tuvieren similar promedio entonces la comparacin
de la dispersin de las distribuciones debera intentarse por otro camino.
Otro problema se presenta cuando se quieren comparar las dispersiones de variables distintas surgidas de un mismo
grupo de estudio.
Coeciente de variacin
Se debe a K. Pearson y soluciona el problema de comparar la dispersin de las distribuciones de variables que tienen
distinta magnitud.
Este coeciente puede utilizarse tambin para comparar variables de igual magnitud pero con promedios
signicativamente distintos.
Medidas
Cantidad de
ambientes
Cantidad de personas
ocupantes
Gasto medio
mensual
Cantidad de personas
mayores con trabajo
S 1,26 amb. 0,94 pers. $421,23 0,98 pers.
X
3,34 amb. 3,12 pers. $1201,68 2,25 pers.
CV 0,3772 0,3013 0,3505 0,4355
Cv100 38,72 30,13 35,05 43,55
De la comparacin de los CV se concluye que el grupo de viviendas relevadas es ms compacto, ms homogneo,
menos disperso, en cuanto a la cantidad de personas ocupantes, porque tiene el menor de los coecientes calculados.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms heterogneo, ms disperso, menos compacto,
en cuanto a la cantidad de personas mayores con trabajo.
Tambin puede concluirse que el grupo de viviendas de la muestra es ms
heterogneo, ms disperso, menos compacto, en cuanto a la cantidad de per-
sonas mayores con trabajo.
14.
Calcular las medidas de dispersin para todas las variables cuantitativas
de la ME 1 y hacer todas las comparaciones posibles.
1.2.3. Medidas de intensidad
Cotidianamente se utilizan indicadores socio-econmicos denominados tasas
para mostrar la incidencia relativa de algn valor de la variable o sus cambios
espacio-temporales. Esos indicadores son las medidas estadsticas de inten-
sidad y se expresan como coeficientes o como porcentajes.
Previo al tratamiento de estas medidas leemos el artculo periodstico que
sigue.
04 de Junio de 2005
NO CEDE EL DESEMPLEO DEL CONURBANO
Cordones sin reaccin
La cantidad de desocupados en los 28 centros urbanos encuestados por el Indec result de
1.369.000 personas durante el primer trimestre, de los cuales 677 mil estaban localizados en
los partidos del Gran Buenos Aires. Los datos surgen de la Encuesta Permanente de Hogares
del Indec publicados ayer, dos semanas despus de conocerse la tasa de desocupacin para el
perodo, del 13 por ciento. Los subocupados demandantes, es decir aquellos que no llegan a
completar la jornada laboral y estn buscando otro trabajo, suman otras 948 mil personas con
problemas de empleo. Las zonas urbanas del pas ms afectadas por el problema global de deso-
cupacin y subocupacin demandante resultaron, en el primer trimestre, el conurbano bona-
erense y el ncleo Gran Tucumn (ciudad capital y sus alrededores) Taf Viejo. El primero
sumaba 15,5 por ciento de desocupados ms 10,4 por ciento de subocupados demandantes;
el segundo, 14,2, ms 16,5 por ciento. La desocupacin, en los partidos del Gran Buenos Aires
fue superior a la del cuarto trimestre de 2004 en siete dcimas e idntica a la registrada en el
primer trimestre de ese mismo ao. Es decir que la regin muestra un estancamiento en la
recuperacin del empleo. En tanto, en el Gran Tucumn-Taf Viejo el dato ms preocupante
es el aumento de la subocupacin demandante, del 15,5 por ciento en el primer trimestre, con
un salto de 1,4 punto en la ltima medicin con respecto a la inmediata anterior y 2,3 puntos
cuando se la compara con la de un ao antes. Los otros grandes distritos urbanos (con ms de
500 mil habitantes) que registraron tasas de desocupacin por encima del promedio del pas
fueron el Gran Rosario, 14 por ciento, y el Gran La Plata, con el 13,5 por ciento. Entre los gran-
des aglomerados, la tasa ms baja de desocupacin corresponde al Gran Mendoza, con el 8 por
ciento, y entre las regiones a la Patagonia, con el 7,6 por ciento. Adems, en esta ltima regin,
la tasa de subocupacin demandante reflejada por el Indec es prcticamente insignificante, del
3,4 por ciento, en tanto en el Noroeste se eleva al 11,2 por ciento.
2000-2002 Pagina12/WEB Repblica Argentina
43
Estadistica
Del artculo anterior rescatamos la siguiente informacin referida al 2005:
la tasa de desocupacin para el Gran Rosario es del 14%;
hay 1,44 desocupados por cada subocupado demandante;
la desocupacin en los partidos del Gran Buenos Aires creci un 0,7% entre
el 4to. trimestre del 2004 y el 1er. trimestre de 2005.
Recrearemos las lecturas anteriores de la siguiente manera:
la proporcin de desocupados en el Gran Rosario es del 14%;
la relacin entre desocupacin y subocupacin es a razn de 1,44 deso-
cupados por cada subocupado demandante;
tomando como base de referencia (100%) el 4to. trimestre de 2004, el
ndice de desocupacin para el 1er. trimestre del 2005 es del 100,7%.
Proporcin
De las variables ya tratadas podemos decir, por ejemplo, que la proporcin de
pymes del rubro industrial es del 37,5%, o tambin que la proporcin de pie-
zas de plstico con un nivel de terminacin bueno o muy bueno es del 50%.
La proporcin mide el peso incidencia que tiene una o varias cate-
goras/valores de la variable en el conjunto total de datos.
La proporcin se calcula haciendo el cociente entre la frecuencia correspon-
diente a una categora o valor de la variable y el total de los datos.
En smbolos:
Si bien el resultado es un coeficiente comprendido entre 0 y 1, la proporcin
tambin se expresa en porcentajes (multiplicndola por 100).
Los clculos implcitos en el prrafo inicial son:
El primer ejemplo tiene en cuenta slo una categora de la variable por eso se
lo considera una proporcin simple y el segundo es una proporcin compuesta
porque interviene ms de una categora.
15.
a. Determinar e interpretar la proporcin de viviendas de 4 ambientes
de la ME 2.
b. Qu porcentaje de empleados estn al menos conformes con el fun-
44
Universidad Virtual de Quilmes
cionamiento de la empresa cooperativa (ME 1)?
c. Cul es la proporcin de desaparecidos con una edad de entre 30 y
35 aos?
d. Identificar qu tipo de proporcin (simple o compuesta) es cada una
de las calculadas en los tems anteriores.
Razn
La razn, a diferencia de la proporcin, es un indicador que se obtiene calcu-
lando el cociente entre las frecuencias de valores distintos de una variable.
La razn mide el peso incidencia que tiene una o varias categor-
as/valores de la variable con respecto a otra u otras categoras/valores.
La razn entre A y B se calcula haciendo el cociente entre sus respectivas fre-
cuencias, siendo A y B valores/categoras o grupos de valores/categoras.
En smbolos:
Ejemplos
Por cada 1 vivienda de dos ambientes hay 1,6 viviendas de tres ambientes (o
tambin, en la muestra hay un 60% ms de viviendas con 3 ambientes que con
2 ambientes).
Por cada pieza que se fabrica con un nivel de terminacin regular hay dos pie-
zas con nivel bueno o muy bueno.
El primer ejemplo tiene en cuenta slo una categora de la variable en
ambos factores del cociente, por ello es una razn simple y el segundo es una
razn compuesta porque interviene ms de una categora en por lo menos
uno de los dos factores.
16.
a. Cul es la razn entre los empleados que estn conformes y los que
estn muy conformes con el funcionamiento de la empresa coope-
rativa? (ME 1).
b. Por cada trabajador mayor a 40 aos, cuntos hay de entre 30 y 40
aos? (ME 1).
c. Identificar qu tipo de razn (simple o compuesta) es cada una de las
calculadas en los tems anteriores.
45
Estadistica
Como en el caso de las
proporciones, las razo-
nes pueden ser simples o com-
puestas.
En las distribuciones bivariadas (tablas de doble entrada), son compuestas todas las tasas cal-
culadas a partir de las frecuencias conjuntas.
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo de las pymes
(ver tabla 1.10.) se puede observar que el 16,67% (4/24100) de las pymes de la muestra son
del rubro industrial y aumentaron los puestos de trabajo entre 2001 y 2003, o que por cada
pymes del rubro comercial que mantuvo hay 1,33 (4/3) industrial que aument sus puestos
de trabajo.
Nmeros ndice
Un nmero ndice mide las variaciones relativas de la ocurrencia de los valo-
res/categoras de una variable a travs de distintas situaciones espaciales o
temporales.
En smbolos:
Donde i indica una situacin espacial o temporal cualquiera y o indica la
situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores (ME 1)
que cobran actualmente ms de $750 respecto de los que cobraban tambin
ms de $750 en el perodo anterior, calculamos
El grupo de trabajadores que hoy tienen un salario quincenal superior a los
$750 es el 260% del grupo de trabajadores que en el perodo anterior tenan
tambin ms de $750 de salario quincenal. Es decir, que la cantidad de tra-
bajadores que hoy ganan ms de $750 aument un 160% con respecto a la
situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica automotriz
podemos comparar una determinada franja de edad, por ejemplo empleados
de entre 20 y 30 aos, haciendo
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de los
trabajadores de la fbrica. Es decir que hay un 75% menos de personas de 20
a 30 aos trabajando en la cooperativa que en la fbrica automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices gene-
rales de precios.
46
Universidad Virtual de Quilmes
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE
Nmeros ndice
Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:
Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos
I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60
El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo
I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE
Nmeros ndice
Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:
Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos
I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60
El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo
I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
42
Por ejemplo, en la distribucin conjunta entre rubro y puestos de trabajo
de las pymes (ver tabla 1.10) se puede observar que el 16,67% (4/24100) de
las pymes de la muestra son del rubro industrial y aumentaron los puestos de
trabajo entre 2001 y 2003, o que por cada pymes del rubro comercial que
mantuvo hay 1,33 (4/3) industrial que aument sus puestos de trabajo.
FIN DE TEXTO APARTE
Nmeros ndice
Un nmero ndice mide las variaciones relativas de la ocurrencia de los
valores/categoras de una variable a travs de distintas situaciones
espaciales o temporales.
En smbolos:
Donde i indica una situacin espacial o temporal cualquiera y o
indica la situacin de referencia llamada base.
Para estudiar si hubo algn cambio en la cantidad de trabajadores
(ME 1) que cobran actualmente ms de $750 respecto de los que
cobraban tambin ms de $750 en el perodo anterior, calculamos
I
actual/anterior
(msde750) =
f
actual
(> 750)
f
anterior
(> 750)
=
13
5
= 2, 60
El grupo de trabajadores que hoy tienen un salario quincenal superior a
los $750 es el 260% del grupo de trabajadores que en el perodo anterior
tenan tambin ms de $750 de salario quincenal. Es decir, que la
cantidad de trabajadores que hoy ganan ms de $750 aument un 160%
con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica
automotriz podemos comparar una determinada franja de edad, por
ejemplo empleados de entre 20 y 30 aos, haciendo
I
cooperativa/fbrica
(entre20y30aos) =
f
cooperativa
(20 edad 30)
f
fbrica
(20 edad 30)
=
4
16
= 0, 25
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de
los trabajadores de la fbrica. Es decir que hay un 75% menos de
personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica
automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices
generales de precios.
Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan redu-
cir a, digamos, tres (A, B y C) y que en dos aos distintos se relevaron los pre-
cios (p) y las cantidades (q) consumidas de cada uno de ellos:
Podemos analizar cmo evolucion el precio de cada uno de los productos,
haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 100 = 120,00%
El precio del producto C subi un 20,00% entre el 2003 y el 2004.
Para medir la evolucin del conjunto de precios de los tres productos necesi-
tamos contar con ndices compuestos.
Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los productos.
Para el ejemplo que estamos viendo, el clculo sera.
Los precios de los productos A, B y C subieron en conjunto un 6,46% entre los
aos 2003 y 2004.
Relativo de agregados no ponderados (o ndice de agregados no ponderados)
Se construye como cociente entre la sumatoria (agregacin) de los precios para
el ao 2004 y la sumatoria (agregacin) de los precios para el ao base 2003.
Los precios de los productos A, B y C bajaron en conjunto un 2,33% entre los
aos 2003 y 2004.
Relativo de agregados ponderados (o ndice de agregados ponderados)
Se construyen no solamente con los precios sino con algn otro elemento de pon-
deracin que permita darle un peso distinto a cada producto. Ese elemento
de ponderacin generalmente es la cantidad consumida de cada producto.
47
Estadistica
En realidad la canasta
familiar est integrada por
muchos productos. En este caso,
como recurso didctico, usamos
tres productos como representati-
vos de todos slo para reducir la
cantidad de clculos.
que hoy ganan ms de $750 aument un 160% con respecto a la situacin anterior.
En el caso de los trabajadores de la cooperativa y de la fbrica automotriz podemos comparar una determinada
franja de edad, por ejemplo empleados de entre 20 y 30 aos, haciendo
El grupo de empleados de la cooperativa de 20 a 30 aos es el 25% de los trabajadores de la fbrica. Es decir que hay
un 75% menos de personas de 20 a 30 aos trabajando en la cooperativa que en la fbrica automotriz.
ndices de precios
Veremos a continuacin cmo se construyen y cmo se usan los ndices generales de precios.
Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan reducir a, digamos, tres (A, B y C) y que en dos
aos distintos se relevaron los precios (p) y las cantidades (q) consumidas de cada uno de ellos:
Producto Precio 2003 Cantidad 2003 Precio 2004 Cantidad 2004
A $13 500 $15 550
B $25 280 $21 250
C $5 990 $6 1200
COMIENZO DE PASTILLA EN oanasta familiar
Ln realidad la oanasta familiar esta integrada por muohos produotos. Ln este oaso, oomo reourso didaotioo, usamos tres produotos oomo
representativos de todos solo para reduoir la oantidad de oaloulos.
FIN DE PASTILLA
Podemos analizar cmo evolucion el precio de cada uno de los productos, haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 = 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 = 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 = 100 = 120,00%
El precio del producto A subi un 20,00% entre el 2003 y el 2004.
Para medir la evolucin del conjunto de precios de los tres productos necesitamos contar con ndices compuestos.
Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los productos. Para el ejemplo que estamos viendo, el
clculo sera.
43
Construccin de ndices de precios
Convengamos que todos los productos de la canasta familiar se puedan
reducir a, digamos, tres (A, B y C) y que en dos aos distintos se
relevaron los precios (p) y las cantidades (q) consumidas de cada uno de
ellos:
Producto Precio 2003 Cantidad 2003 Precio 2004 Cantidad 2004
A $13 500 $15 550
B $25 280 $21 250
C $5 990 $6 1200
COMIENZO DE PASTILLA EN canasta familiar
En realidad la canasta familiar est integrada por muchos productos. En este caso,
como recurso didctico, usamos tres productos como representativos de todos slo
para reducir la cantidad de clculos.
FIN DE PASTILLA
Podemos analizar cmo evolucion el precio de cada uno de los
productos, haciendo tres ndices simples de precios.
I
2004/2003
(A) = 15 / 13 100 = 115,38%
El precio del producto A subi un 15,38% entre el 2003 y el 2004.
I
2004/2003
(B) = 21 / 25 100 = 84,00%
El precio del producto B baj un 16,00% entre el 2003 y el 2004.
I
2004/2003
(C) = 6 / 5 100 = 120,00%
El precio del producto A subi un 20,00% entre el 2003 y el 2004.
Para medir la evolucin del conjunto de precios de los tres productos
necesitamos contar con ndices compuestos.
Media de relativos simples (o media de ndices simples)
Es la media aritmtica de todos los ndices simples de todos los
productos. Para el ejemplo que estamos viendo, el clculo sera.
I
2004
2003
( A, B, C) =
I
2004
2003
( A) + I
2004
2003
(B) + I
2004
2003
(C)
3
=106, 46%
Los precios de los productos A, B y C subieron en conjunto un
6,46% entre los aos 2003 y 2004.
Relativo de agregados no ponderados (o ndice de agregados no
ponderados)
La cuestin que aparece a continuacin es decidir con qu cantidades
ponderar, las del ao tomado como base o las del ao para el que se hace
el estudio que convenimos en llamar ao dado.
Entre los criterios existentes, el de Laspeyres adopta, para ponderar las can-
tidades consumidas en el ao base, la siguiente manera:
Este es el criterio que utiliza el Sistema Estadstico Nacional (INDEC y Direc-
ciones Provinciales de Estadsticas) para la construccin de todos los ndices
generales de precios: ndice de Precios al consumidor (IPC), Sistema de ndi-
ces de precios mayoristas (SIPM) e ndice de costos de la construccin (ICC).
Para el ejemplo que estamos desarrollando, el clculo del ndice de pre-
cios segn el criterio de Laspeyres para el conjunto de los productos A, B,
C es:
Los precios de los productos A, B, C subieron en conjunto un 4,72% entre los
aos 2003 y 2004. Es decir que en 2004 esos productos fueron en conjunto
un 4,72% ms caros respecto del ao 2003.
Si esos tres productos fueran todos los de la canasta familiar, como esta-
mos simulando, las cantidades consumidas podran entrar en la frmula de Las-
peyres como porcentajes del total:
Esta estructura de ponderacin es la que usa el INDEC para publicar los ndi-
ces Generales de precios. El criterio de Paasche usa para ponderar las canti-
dades del ao dado.
Para los mismos productos y el mismo perodo, un ndice de precios elabora-
do con este criterio es:
48
Universidad Virtual de Quilmes
Fue publicado en 1870
por el economista y esta-
dstico alemn Ernst Louis Etienne
Laspeyres.
La estructura de ponde-
racin actual del IPC asig-
na para Alimentos y bebidas: 31,29%,
Indumentaria: 5,18%, Vivienda:
12,68%, Equipamiento y manteni-
miento del hogar: 6,55%, Atencin
mdica y gastos para la salud:
10,04%, Transporte y comunica-
ciones: 16,96%, Esparcimiento:
8,67%, Educacin: 4,20%, Bienes
y servicios varios: 4,43%.
En este caso hay que contar con la informacin de las cantidades consumi-
das en el ao dado y para la elaboracin de ndices generales eso implica un
serio problema operativo. Este criterio puede usarse en trabajos locales, donde
se tengan planificados y asegurados los recursos y se pueda encarar la moda-
lidad operativa que requiere ese ndice.
Un tercer criterio, el de Fisher, combina las virtudes de los dos anteriores
mediante el empleo de la media geomtrica entre I
L
y I
P
, pero tambin carga
con las mismas limitaciones operativas de P.
Para los tres productos del ejemplo:
Uso de los nmeros ndices
Llamemos i, j a dos aos dados cualesquiera y o al ao base.
En las publicaciones, todos los ndices generales aparecen referidos a un
ao base por lo que se cuenta entonces con los ndices I
i/
o
y I
j/
o
.
Para algn uso especfico en el que necesitramos un ndice I
j/
o
que des-
criba la evolucin entre los aos i y j, utilizaremos las llamadas cadenas o
enlaces relativos.
Supongamos que el ndice compuesto de precios de varios productos fue de
120 en 2000 y de 129 en 2001, calculados ambos con base 1999, y quere-
mos saber cunto aument el nivel de precios entre 2000 y 2001. La res-
puesta es que el nivel de precios aument un 7,50 % (se calcula: 129 / 120
x 100 =107,50 %).
El ndice de precios al consumidor y el promedio de salarios por hora en cier-
tas industrias seleccionadas se encuentran en la tabla siguiente.
Analizaremos cmo evolucion el salario real de un empleado tipo en cada
una de las tres industrias seleccionadas, entre el ao base 1988 y el ao
1991.
Para este anlisis utilizaremos el IPC cuyo rol ser el de mover en el tiem-
po una magnitud econmica en este caso el salario y hacer comparaciones.
49
Estadistica
I
i
o
I
j
i
= I
j
o
I
j
i
=
I
j
o
I
i
o
Por ejemplo: representa el salario del ao 1988
8,67, Lduoaoion: 4,20, Bienes y servioios varios: 4,43.
FIN DE PASTILLA
El criterio de Paasche usa para ponderar las cantidades del ao dado.
Para los mismos productos y el mismo perodo, un ndice de precios elaborado con este criterio es:
En este caso hay que contar con la informacin de las cantidades consumidas en el ao dado y para la elaboracin
de ndices generales eso implica un serio problema operativo. Este criterio puede usarse en trabajos locales, donde se
tengan planicados y asegurados los recursos y se pueda encarar la modalidad operativa que requiere ese ndice.
Un tercer criterio, el de Fisher, combina las virtudes de los dos anteriores mediante el empleo de la media geomtrica
entre I
L
y I
P
, pero tambin carga con las mismas limitaciones operativas de P.
Para los tres productos del ejemplo:
Uso de los nmeros ndices
Llamemos i, j a dos aos dados cualesquiera y o al ao base.
En las publicaciones, todos los ndices generales aparecen referidos a un ao base por lo que se cuenta entonces con
los ndices y .
Para algn uso especco en el que necesitramos un ndice que describa la evolucin entre los aos i y j,
utilizaremos las llamadas cadenas o enlaces relativos.
Supongamos que el ndice compuesto de precios de varios productos fue de 120 en 2000 y de 129 en 2001, calculados
ambos con base 1999, y queremos saber cunto aument el nivel de precios entre 2000 y 2001. La respuesta es que el
nivel de precios aument un 7,50 % (se calcula: 129 / 120 x 100 =107,50 %).
El ndice de precios al consumidor y el promedio de salarios por hora en ciertas industrias seleccionadas se encuentran
en la tabla siguiente.
Salarios por hora (en $)
Ao IPC Servicios Comercio al menudeo Manufactura
1988
1989
1990
1991
100,0
109,6
113,6
117,1
7,17
8,18
8,81
9,49
5,50
5,95
6,06
6,60
8,48
9,37
9,37
10,01
Analizaremos cmo evolucion el salario real de un empleado tipo en cada una de las tres industrias seleccionadas,
entre el ao base 1988 y el ao 1991.
Para este anlisis utilizaremos el IPC cuyo rol ser el de mover en el tiempo una magnitud econmica en este caso
Cualquier ndice general utilizado con esta finalidad recibe el nombre de ndi-
ce deflactor.
Por ejemplo: representa el salario del ao 1988
trasladado al ao 1991, para un empleado del sector servicios. Este es el
valor del salario del ao 1988 corregido por el costo de la vida en el lapso
1988-1991.
Si comparamos el valor obtenido ($8,40) con el que realmente recibe en 1991
($9,49), vemos que su salario real aument un 12,98% (=9,49/8,40 x 100).
17.
Usando la informacin de la tabla anterior describir la evolucin del
salario del sector servicios entre 1989 y 1990.
Es posible concluir que las medidas de intensidad son aplicables a cual-
quier tipo de variable?
18.
Extraer todas las conclusiones posibles a partir de la lectura del texto
que se transcribe a continuacin y que es parte de un artculo publica-
do en el diario Pgina 12.
Todos los libros el libro
Por Gabriel D. Lerman
[] Segn estimaciones publicadas por el SINCA (Sistema de Infor-
macin Cultural de la Argentina), la cultura argentina constituye un
3% del PBI nacional, cifra que supera, por ejemplo, al sector de la mine-
ra. Ms 9100 millones de pesos producidos y ms 200 mil puestos de
trabajo generados componen un sector diverso, heterogneo, que sin
embargo se caracteriza por una alta concentracin econmica y geo-
grfica, que reproduce el ms feroz centralismo porteo.
La industria editorial ha sido por dcadas uno de los puntales de la cul-
tura argentina, punto de referencia para toda Amrica latina y el mundo
hispanoparlante. Hacia mediados de la dcada del setenta, el pas pro-
duca unos 50 millones de ejemplares al ao, cifra que diez aos ms
tarde haba cado a 17. En 1996 se produjeron 42 millones de libros, en
el 2000 se lleg a 74 millones y en el 2002, tras la crisis, la produccin
cay a la mitad. A partir de la devaluacin, Argentina recuper condi-
ciones favorables e inici una franca recuperacin: de 38 millones de
libros en 2003 se pas a 56 en 2004. En 2007, la industria editorial
argentina tuvo el record histrico de 93 millones de ejemplares impre-
sos []
[] Cerca del 75% de las editoriales se encuentra emplazada en la regin
metropolitana, mientras que el resto se ubica en los principales centros
urbanos. Si bien esto responde a la concentracin de la poblacin, hay
provincias que slo poseen una o dos editoriales que apenas sobreviven
con ayuda oficial.
50
Universidad Virtual de Quilmes
I
i
o
I
j
i
= I
j
o
I
j
i
=
I
j
o
I
i
o
Por ejemplo: representa el salario del ao 1988
Se puede ver el art-
c u l o c o mp l e t o e n
www. p a g i n a 1 2 . c o m. a r ,
Suplemento Radar libros del
di ari o Pgi na 12, con fecha
22/03/2009.
[...] Tres de cada cuatro libros les corresponden a las grandes editoriales
[...]
[...] Argentina y Colombia lideran el comercio exterior de libros en Am-
rica del Sur.
[...] Segn la publicacin Nosotros y los otros, del Mercosur Cultural,
un 77% de los libros exportados por la regin sudamericana quedan en
el continente. Esto muestra una baja capacidad de penetracin en mer-
cados internacionales ms vigorosos, incluso Espaa, que adquiere slo
el 1,6% del total exportado. Por el contrario, si se miden las importa-
ciones se comprueba que slo el 41% proviene de los mismos pases,
mientras que las compras a Espaa trepan al 29% [...]
1.3. Matrices ejemplos
Las siguientes matrices corresponden a muestras representativas seleccio-
nadas de diferentes poblaciones objetivo de estudio, con distintos tipos de
unidades de observacin.
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada tra-
bajador es una unidad de observacin.
Referencias:
Nivel de especializacin: B: bajo, M: mediano, A: alto.
Conformidad con el funcionamiento de la empresa cooperativa: P: poco con-
forme, C: conforme, M: muy conforme.
Quincena actual: salario quincenal de los trabajadores (participacin quince-
nal en las ganancias de la cooperativa) en el mes en curso despus de haber-
se producido un incremento en las ventas.
Quincena anterior: salario quincenal de los trabajadores previo al incremento
de las ventas.
51
Estadistica
1.3. Matrices ejemplos
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada trabajador es una unidad de observacin.
ME 1-
Empleado edad sexo
Anti-
gedad
Especia-
lizacin
Confor-
midad
Quincena$
actual
Quincena$
anterior
1 34 M 1 B C 345 310
2 36 F 5 A M 950 810
3 51 M 7 M P 670 570
4 21 F 4 M C 810 730
5 37 F 0 M M 800 680
6 38 M 0 B P 500 450
7 39 F 9 B C 690 580
8 25 F 4 M M 840 715
9 36 M 3 M P 835 750
10 40 F 3 M P 735 660
11 63 F 5 A M 1550 1320
12 40 M 5 A M 850 730
13 39 F 0 B C 505 452
14 37 M 8 A M 1135 965
15 57 F 13 A M 1280 1100
16 30 F 2 M M 820 700
17 28 M 3 B C 480 410
18 48 F 1 M M 830 720
19 42 M 7 A P 1145 970
20 37 F 1 M M 775 698
Vivienda
Cant. de
ambientes
Mantenimiento
Personas
ocupantes
Gasto
medio
mensual
Personas
mayores con
trabajo
Hay nios
que trabajan?
1 3 B 3 780,50 1 N
2 2 M 3 1500,35 1 N
3 5 B 4 1200,05 2 N
4 3 B 2 986,65 1 N
5 4 R 3 2010,90 2 S
6 1 B 3 780 ,10 1 N
7 2 M 3 1452,25 3 N
8 4 E 2 1200,00 2 N
9 5 B 5 900,98 2 N
10 4 R 3 2010,09 3 N
11 3 B 3 891,75 2 N
12 4 M 3 1205,40 3 N
13 3 B 3 909,90 1 S
14 2 B 2 2010,10 2 N
15 4 M 3 899,50 3 N
16 2 B 2 780,00 2 N
17 4 R 5 1505,10 3 N
18 1 B 3 1224,69 3 N
19 2 M 3 890,70 3 N
20 4 E 3 780,50 2 S
21 5 B 3 1312,80 3 N
22 3 R 2 1219,40 2 N
23 4 B 5 986,20 4 N
24 4 R 3 2010,35 3 N
25 3 B 3 890,10 1 S
26 5 B 3 780,09 1 N
27 3 R 3 1510,69 3 N
28 6 B 2 1200,75 2 N
29 4 M 5 942,70 5 N
30 1 E 2 2010,00 1 S
31 4 B 3 890,40 2 N
32 3 R 5 780,80 3 N
Referencias
Matriz 2. Poblacin: viviendas de un determinado barrio donde cada vivienda
es la unidad de anlisis.
Referencias:
Mantenimiento o estado de mantenimiento: M: malo, R: regular, B: bueno, E:
excelente.
Gasto medio mensual en alimentos del grupo que vive en la vivienda en $.
Hay nios que trabajan?: S: s, N: no.
52
Universidad Virtual de Quilmes
1.3. Matrices ejemplos
Matriz 1. Poblacin: trabajadores de una empresa cooperativa donde cada trabajador es una unidad de observacin.
ME 1-
Empleado edad sexo
Anti-
gedad
Especia-
lizacin
Confor-
midad
Quincena$
actual
Quincena$
anterior
1 34 M 1 B C 345 310
2 36 F 5 A M 950 810
3 51 M 7 M P 670 570
4 21 F 4 M C 810 730
5 37 F 0 M M 800 680
6 38 M 0 B P 500 450
7 39 F 9 B C 690 580
8 25 F 4 M M 840 715
9 36 M 3 M P 835 750
10 40 F 3 M P 735 660
11 63 F 5 A M 1550 1320
12 40 M 5 A M 850 730
13 39 F 0 B C 505 452
14 37 M 8 A M 1135 965
15 57 F 13 A M 1280 1100
16 30 F 2 M M 820 700
17 28 M 3 B C 480 410
18 48 F 1 M M 830 720
19 42 M 7 A P 1145 970
20 37 F 1 M M 775 698
Vivienda
Cant. de
ambientes
Mantenimiento
Personas
ocupantes
Gasto
medio
mensual
Personas
mayores con
trabajo
Hay nios
que trabajan?
1 3 B 3 780,50 1 N
2 2 M 3 1500,35 1 N
3 5 B 4 1200,05 2 N
4 3 B 2 986,65 1 N
5 4 R 3 2010,90 2 S
6 1 B 3 780 ,10 1 N
7 2 M 3 1452,25 3 N
8 4 E 2 1200,00 2 N
9 5 B 5 900,98 2 N
10 4 R 3 2010,09 3 N
11 3 B 3 891,75 2 N
12 4 M 3 1205,40 3 N
13 3 B 3 909,90 1 S
14 2 B 2 2010,10 2 N
15 4 M 3 899,50 3 N
16 2 B 2 780,00 2 N
17 4 R 5 1505,10 3 N
18 1 B 3 1224,69 3 N
19 2 M 3 890,70 3 N
20 4 E 3 780,50 2 S
21 5 B 3 1312,80 3 N
22 3 R 2 1219,40 2 N
23 4 B 5 986,20 4 N
24 4 R 3 2010,35 3 N
25 3 B 3 890,10 1 S
26 5 B 3 780,09 1 N
27 3 R 3 1510,69 3 N
28 6 B 2 1200,75 2 N
29 4 M 5 942,70 5 N
30 1 E 2 2010,00 1 S
31 4 B 3 890,40 2 N
32 3 R 5 780,80 3 N
Referencias
Matriz 3. Poblacin: pymes de la Repblica Argentina ao 2004/2005 donde
cada pyme es la unidad de estudio.
Referencias:
Tipo de pyme: R: recuperada, P: privada.
Rubro: A: agrcola, C: comercial, I: industrial, S: servicios.
Antigedad, en aos, al 2005.
Nivel de endeudamiento: N: ninguno, B: bajo, M: medio, A: alto, MA: muy alto.
Puestos de trabajo durante 2001-2003: D: disminuy, M: mantuvo, A: aument.
53
Estadistica
Mantenimiento o estado de mantenimiento: M: malo, R: regular, B: bueno, E: excelente
Gasto medio mensual en alimentos del grupo que vive em la vivienda em $
Hay nios que trabajan?: S: s, N: no
Matriz 3. Poblacin: pymes de la Repblica Argentina ao 2004/2005 donde cada pyme es la unidad de estudio.
ME 3-
PyME Tipo Rubro Antigedad
Endeu-
damiento
Cantidad de
Personal
Puestos de trabajo
2001-2003
1 P S 1 M 128 M
2 P I 6 M 150 D
3 R A 8 N 19 A
4 R C 4 M 170 M
5 P I 8 MA 112 M
6 P A 3 A 140 D
7 R I 10 B 20 A
8 P S 8 MA 23 D
9 P C 4 M 114 M
10 P A 0 MA 148 A
11 R A 2 M 154 A
12 P I 4 B 100 D
13 P C 5 MA 250 D
14 R I 6 A 142 A
15 P A 7 MA 105 M
16 R I 2 A 160 M
17 p C 9 M 22 M
18 R I 17 B 5 M
19 P S 11 M 120 D
20 R I 6 N 137 A
21 P I 7 M 80 D
22 P A 4 A 109 M
23 P C 25 MA 110 A
24 R S 11 B 144 A
Referencias:
Tipo de pyme: R: recuperada, P: privada.
Rubro: A: agrcola, C: comercial, I: industrial, S: servicios.
Antigedad, en aos, al 2005.
Nivel de endeudamiento: N: ninguno, B: bajo, M: medio, A: alto, MA: muy alto.
Puestos de trabajo durante 2001-2003: D: disminuy, M: mantuvo, A: aument.
Matriz 4. Poblacin: todas las piezas plsticas especiales fabricadas por una
determinada empresa, donde cada pieza es la unidad que se observa para su
estudio y anlisis.
Referencias:
Materia prima: N: nacional, I: importada.
Tiempo de fabricacin: tiempo, en das, que lleva de fabricada la pieza.
Nivel de detalles de terminacin: R: regular, B: bueno, MB: muy bueno, E: exce-
lente.
Tiene alguna caracterstica sealable?: S: s, N: no.
54
Universidad Virtual de Quilmes
Matriz 4. Poblacin: todas las piezas plsticas especiales fabricadas por una determinada empresa, donde cada pieza es
la unidad que se observa para su estudio y anlisis.
ME 4
Pieza
Longitud
[cm]
Materia
prima
Tiempo de
Detalles
de
Peso
[gr]
Caracterstica
sealable
1 5,59 N 261 R 71,1 N
2 5,53 I 145 E 71,9 N
3 5,59 N 137 B 72,0 N
4 5,49 N 168 MB 70,5 S
5 5,50 I 150 MB 70,1 N
6 5,47 N 140 R 71,4 N
7 5,15 I 139 R 70,7 S
8 5,51 N 194 MB 71,5 N
9 5,54 N 93 B 71,7 S
10 5,49 I 39 MB 71,2 N
11 5,56 N 59 E 71,3 S
12 5,49 N 65 B 69,5 N
13 5,64 I 110 R 72,5 S
14 5,59 N 128 E 71,7 N
15 5,57 N 13 E 71,9 S
16 5,45 I 22 MB 70,9 N
17 5,30 N 113 R 64,1 S
18 5,46 I 81 B 70,3 S
19 5,55 N 79 E 67,1 N
20 5,61 N 11 B 72,1 N
Referencias
Materia prima: N: nacional, I: importada.
Tiempo de fabricacin: tiempo, en das, que lleva de fabricada la pieza.
Nivel de detalles de terminacin: R: regular, B: bueno, MB: muy bueno, E: excelente.
Tiene alguna caracterstica sealable?: S: s, N: no.
55
Probabilidad
Ob je ti vos
Desarrollar algunas herramientas bsicas para poder abordar con funda-
mento los problemas de la inferencia estadstica.
Sistematizar, organizar y cimentar los conceptos probabilsticos presentes
en la cultura cotidiana.
2.1. Elementos de la teora de probabilidad
En la presente Unidad trataremos conceptos de la teora de probabilidad por
ser sta la herramienta conceptual necesaria para abordar con fundamento los
problemas de la estadstica inferencial.
2.1.1. Experimento aleatorio
Comenzaremos leyendo el siguiente texto que fue extrado de la novela El jugador
de Fedor Dostoievsky.
[...] Las salas de juego estaban repletas de pblico. Cunta insolencia y cunta avidez! Me
abr paso entre la muchedumbre y me coloqu frente al propio croupier. Empec a jugar tmi-
damente, arriesgando cada vez dos, tres monedas. Entretanto, observaba. Tengo la impresin
de que el clculo previo vale para poco y, desde luego no tiene la importancia que le atribuyen
muchos jugadores: llevan papel rayado, anotan las jugadas, hacen cuentas, deducen las proba-
bilidades, calculan; por fin, apuestan y pierden. Igual que nosotros simples mortales, que juga-
mos sin clculo alguno. He llegado, sin embargo, a una conclusin, al parecer, justa: existe, en
efecto, si no un sistema, por lo menos cierto orden en la sucesin de probabilidades casuales, lo
cual es muy extrao. Suele ocurrir, por ejemplo, que tras las doce cifras centrales salgan las doce
ltimas. Cae, por ejemplo, dos veces en las doce ltimas y pasa a las doce primeras. De las doce
primeras, vuelve a las centrales: sale tres o cuatro veces seguidas y de nuevo pasa a las doce lti-
mas. Tras dos vueltas, cae sobre las primeras, que no salen ms de una vez, y las cifras centrales
salen sucesivamente tres veces. Esto se repite durante hora y media o dos horas. Uno, tres y dos;
uno, tres y dos. Resulta muy divertido. Hay das, maanas, en que el negro alterna con el rojo,
casi en constante desorden, de modo que ni el rojo ni el negro salen ms de dos o tres veces
seguidas. Al da siguiente, o a la misma tarde, sale el rojo hasta veinticinco veces sucesivas, y con-
tina as durante algn tiempo, a veces, durante todo el da [...].
2
Prrafo del captulo IV de
El jugador (1866), una de
las ms clebres y populares nove-
las de Fedor Dostoievsky, en gran
parte un relato autobiogrfico.
La bsqueda de las leyes que, supuestamente, gobiernan el azar no solo atrae
la concentracin de algn jugador empedernido, sino que domina permanen-
temente los clculos de casi todo el espectro cientfico desde en un rango
cronolgico la astronoma hasta la economa.
Lo que aparece claramente en el prrafo seleccionado es la observacin
del fenmeno que interesa estudiar la ruleta mediante series de frecuencias.
Cada vez que se realiza una jugada se est llevando a cabo un experimento
aleatorio o azaroso, por qu aleatorio? Porque no se puede predecir de ante-
mano el resultado que se va a obtener en esa jugada.
Existen muchos experimentos aleatorios fuera del juego, por ejemplo, podr-
amos anotar la edad de cada una de las personas que lee esta carpeta, cada
edad del conjunto de todas las edades anotadas puede ser un resultado del
experimento.
Podemos citar tambin como experimento aleatorio la observacin de la
ocurrencia del robo de un auto realizada por un actuario de seguros. Este
actuario podra anotar en funcin de resultados previos cuntos autos de una
determinada marca y modelo fueron robados entre todos los que existen en
el mercado y a partir de ello inducir si un nuevo auto cualquiera, elegido al
azar de ese modelo y marca, tiene alguna posibilidad de ser robado.
Tanto la jugada nica del jugador, como el aseguramiento de un auto cual-
quiera tomado al azar, constituyen experimentos aleatorios simples porque
involucran tomar un solo elemento al azar de una poblacin.
Tanto la avidez del jugador como la de la compaa de seguros nos llevan
a los experimentos aleatorios compuestos tomar ms de un elemento al
azar donde el jugador hara varias jugadas o la compaa asegurara varios
autos.
El proceso de tomar al azar uno o ms elementos de una determinada
poblacin es un experimento aleatorio.
Si se selecciona un solo elemento, referido a una variable, el experi-
mento es simple y si se seleccionan dos o ms elementos, referidos a esa
variable, el experimento aleatorio es compuesto porque es el resultado
de la repeticin de uno simple.
Por otro lado, si se selecciona un elemento al azar pero referido a dos
o ms variables conjuntamente resulta tambin un experimento aleato-
rio compuesto.
Cuando se seleccionan muestras aleatorias de tamao n de una poblacin se
estn realizando n experimentos aleatorios simples.
Espacio muestral
Denominamos espacio muestral (E) al conjunto de todos los resultados posi-
bles de un experimento aleatorio.
En el ejemplo del actuario nos interesa si al seleccionar un auto de esa
marca y modelo ste puede ser robado o no, entonces los resultados posi-
bles son: ser robado o no ser robado:
56
Universidad Virtual de Quilmes
Experimento aleatorio,
probabilstico o estocs-
tico: es aquel donde no se puede
determinar a priori cul va a ser su
resultado.
E = {robado, no robado}
En una jugada de la ruleta los resultados posibles son:
E = {todos los nmeros de la ruleta} = {0, 1, 2, 3, ......... , 34, 35, 36}
En la siguiente tabla figuran distintos tipos de experimentos aleatorios y espa-
cios muestrales asociados a ellos.
Como puede apreciarse, los experimentos 1 y 3 son simples y el 2 es un expe-
rimento compuesto por repeticin de uno simple.
Para describir los elementos de un espacio muestral de un experimento
compuesto se puede recurrir a un diagrama denominado diagrama de rbol
donde cada una de las ramas representa a cada uno de los elementos com-
puestos del espacio muestral.
El diagrama de rbol (G.2.1.) correspondiente al segundo experimento es
Grfico 2.1. Diagrama de rbol
Suceso o evento aleatorio
Un suceso o evento aleatorio es cualquier subconjunto de un espacio
muestral.
57
Estadistica
Experimento aleatorio Espacio muestral
Si se tomara/n al azar: Se obtendran los siguientes resultados
1- Una pyme del grupo que gura en la matriz
ME 3 de la Unidad anterior y se examinara el
rubro al que pertenece.
E ={ A, C, I, S}
2- Dos empleados de la empresa cooperativa
de la matriz ME 1 y se observara el sexo al
que pertenece cada uno.
E={FF, FM, MF, MM}
3- Una vivienda entre las de la ME 2 y
se reexionara acerca de la cantidad de
ambientes que tiene.
E ={ 1, 2, 3, 4, 5}
Son ejemplos de sucesos aleatorios del Espacio muestral del experimento 3,
que la vivienda seleccionada tenga:
S
1
= {hasta 3 ambientes}
S
1
= {1, 2, 3}
S
2
= {1 ambiente}
S
2
= {1}
S
3
= {8 ambientes}
S
3
= { } =
S
4
= {hasta 5 ambientes}
S
4
= {1, 2, 3, 4, 5} = E
S
5
= {3 o 4 ambientes}
S
5
= {3, 4}
S
6
= {menos de 4 ambientes}
S
6
= {1, 2, 3}
S
7
= {ms de 3 ambientes}
S
7
= {4, 5}
Un suceso ocurrir si el resultado del experimento aleatorio es un ele-
mento de dicho suceso.
Si un suceso tiene un solo elemento (por ejemplo S
2
) se dice que es un suce-
so elemental.
Si los elementos de un suceso son todos los del espacio muestral (el suce-
so coincide con E como el S
4
) al suceso se lo denomina suceso cierto y ocu-
rre siempre al realizar el experimento.
Si un suceso no tiene elementos, es un conjunto vaco como el S
3
y se llama
suceso imposible. Este suceso no podra ocurrir al realizar el experimento.
Relaciones entre sucesos
Las relaciones ms destacables que se pueden establecer entre dos o ms
sucesos son: identidad, exclusin e independencia. Para ejemplificarlas usa-
remos los sucesos S
1
a S
7
.
Identidad
Dos o ms sucesos son idnticos cuando tienen los mismos elementos.
Considerando el suceso S
6
podemos notar claramente que es idntico al suce-
so S
1
.
58
Universidad Virtual de Quilmes
Exclusin
Dos sucesos son mutuamente excluyentes cuando la ocurrencia de uno
excluye la ocurrencia del otro. Es decir, que no tienen elementos en
comn.
Por ejemplo, los sucesos S
2
y S
5
porque si ocurre S
2
no puede ocurrir S
5
y
viceversa, por lo tanto son mutuamente excluyentes.
Dos sucesos aleatorios son no excluyentes, caso S
5
y S
7
, cuando tienen
elementos en comn.
Un suceso est incluido en otro cuando todos sus elementos son parte de los
elementos del otro como en el caso del suceso S
2
que est contenido en S
1
.
El espacio muestral y los sucesos aleatorios pueden representarse median-
te un diagrama de Venn.
En los siguientes diagramas se visualizan las tres formas que puede adop-
tar la relacin de exclusin entre dos sucesos aleatorios.
Grfico 2.2.
Independencia
Dos sucesos son independientes cuando la ocurrencia de uno no condiciona
la ocurrencia del otro.
Observando el primer caso del grfico 2.2. donde los sucesos son mutua-
mente excluyentes si uno ocurriera, el otro nunca podra ocurrir. Eso implica
la total dependencia del segundo suceso respecto del primero, y viceversa.
Si dos sucesos son mutuamente excluyentes entonces son fuertemente
dependientes.
En el tercer diagrama, del mismo grfico, si ocurriese el suceso incluido nece-
sariamente el suceso incluyente ocurrir, por lo que ste tambin es fuerte-
mente dependiente de aqul.
59
Estadistica
Juan Venn (1834-1923).
Filsofo e historiador ingls.
Su obra de lgica ms original es
la Lgica del azar.
Si un suceso incluye a otro entonces es fuertemente dependiente del
suceso incluido.
En el caso de los sucesos no excluyentes, segunda forma del grfico, el an-
lisis de la independencia requiere de otras consideraciones que se irn incor-
porando paulatinamente. Pero s se puede afirmar que:
Si dos sucesos son independientes no son mutuamente excluyentes.
Operaciones entre sucesos
Las operaciones entre sucesos son las tres operaciones de Boole (unin, inter-
seccin y complemento) del lgebra de conjuntos ms la operacin diferencia.
Estas operaciones aplicadas a dos o ms sucesos aleatorios devuelven
siempre un nuevo suceso aleatorio.
Unin
La unin de dos sucesos S
i
y S
j
es un nuevo suceso (S
i
U S
j
) cuyos ele-
mentos pertenecen a alguno de los dos sucesos (a S
i
o a S
j
o a ambos).
Grfico 2.3.
Consideremos las siguientes uniones de sucesos aleatorios:
S
2
U S
5
= {1} U {3, 4} = {1, 3, 4}
S
7
U S
5
= {4, 5} U {3, 4} = {3, 4, 5}
S
1
U S
2
= {1, 2, 3} U {1} = {1, 2, 3}
60
Universidad Virtual de Quilmes
Estudiadas sistemtica-
mente por el lgico irlan-
ds J. Boole (1815-1864) y aplica-
das al diseo de circuitos electrnicos
a partir de 1939 y a la telefona,
control automtico y computado-
ras en general hasta hoy.
Interseccin
La interseccin de dos sucesos S
i
y S
j
es un nuevo suceso (S
i
S
j
) cuyos
elementos pertenecen conjuntamente a ambos sucesos.
Grfico 2.4.
La interseccin de los sucesos S
7
y S
5
, con los que ya operamos, es:
S
7
I S
5
= {4, 5} I {3, 4} = {4}
El suceso S
7
I S
5
ocurrir s y solo s ocurrieran simultneamente los suce-
sos S
7
y S
5
.
1.
a. Realizar la interseccin entre los sucesos S
2
y S
5
.
b. Indicar qu tipo particular de suceso es la interseccin entre dos suce-
sos mutuamente excluyentes.
Complemento
El complemento de un suceso S es otro suceso cuyos elementos son todos
los elementos del espacio muestral que no pertenecen al suceso S.
Grfico 2.5.
El complemento del suceso S
1
es:
S {todos los elementos de E que no estn en S
1
} = {4, 5}
61
Estadistica
Diferencia
La diferencia entre dos sucesos S
i
y S
j
es un nuevo suceso (S
i
S
j
) cuyos
elementos pertenecen slo a S
i
.
Grfico 2.6.
Las siguientes diferencias entre sucesos son:
S
7
S
5
= {4, 5} {3, 4} = {5}
S
1
S
2
= {1, 2, 3} {1} = {2, 3}
2.
a. Determinar la diferencia entre los sucesos S
2
y S
5
.
b. Determinar el suceso resultante de la diferencia entre dos sucesos
mutuamente excluyentes.
2.1.2. Definiciones de probabilidad
Enunciaremos las definiciones de probabilidad teniendo en cuenta su formu-
lacin histrica.
Definicin clsica
La definicin clsica de probabilidad se debe a Pierre Simn de Laplace para
quien la teora del azar consiste en determinar el nmero de casos favorables
al acontecimiento cuya probabilidad se indaga. La razn de este nmero con
la de todos los casos posibles es la medida de la probabilidad, que no es ms
que una fraccin cuyo numerador es el nmero de casos favorables y cuyo
denominador es el nmero total de casos posibles.
Es decir:
cantidad de casos favorables
p =
cantidad de casos posibles
Apliquemos esta definicin a algn suceso en la jugada de la ruleta, por ejem-
plo, si nos interesa que en la prxima tirada de la ruleta salga par.
62
Universidad Virtual de Quilmes
Essai philosophique sur
les probabilits (1814).
Pierre Simn de Laplace (1749-
1827), astrnomo y matemtico
francs. Otras obras: Mecnica
Celeste y El sistema del mundo.
El espacio muestral es:
E = {todos los nmeros de la ruleta}
E = {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20,
21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31. 32, 33, 34, 35, 36}
y el suceso o evento de inters es:
S = {que salga par}
S = {2, 4, 6, 8, 10, 12, 14, 16, 18 , 20, 22, 24, 26, 28, 30, 32, 34, 36}
P(S) = P(par) = 18 / 37 = 0,4865
Definicin frecuencial
Richard E. von Mises propuso la siguiente definicin de probabilidad frecuen-
cial en 1919.
R TT La probabilidad de un suceso cualquiera es [...] el Valor Lmite de la
Frecuencia Relativa... Esta es la razn del nmero de casos en que el atributo a
sido hallado al nmero total de observaciones [...] TTR
Es decir:
p = f r
Supongamos que el actuario ha recabado informacin sobre una cantidad
grande de autos asegurados y que de ellos el 15% sufri algn robo. El actua-
rio con ese dato puede calcular la probabilidad del suceso S: el auto asegu-
rado no sera robado.
P(S) = P( no robado) = 85/100 = 0,85
2.1.3. Axiomatizacin de la probabilidad
La Teora de la Probabilidad fue estructurada algebraicamente a partir de 1930
por matemticos de la escuela ruso-francesa, dentro de una teora especial
de la medida de conjuntos. Esa teora de la medida nos permitira hablar de
la probabilidad de un suceso aleatorio, como la medida de su ocurrencia.
Su utilidad reside en entregar al clculo de probabilidades una herramien-
ta algebraica, es decir, un conjunto de operaciones y maneras de operar con
probabilidades.
Su cuerpo principal consiste en tres axiomas y un grupo de propiedades
(teoremas).
63
Estadistica
Matemtico y filsofo aus-
traco (1883-1953).
Tomado de su l i bro
Probabilidad, Estadstica
y Verdad (1928).
Los r ef er ent es ms
i mportantes de esta
escuela son: A. N. Kolmogoroff, F.
Cantelli, E. Borel y otros.
Recordar que los axiomas
son proposiciones intui-
tivas aceptadas sin demostracin
y que a partir de ellos pueden dedu-
cirse las propiedades (teoremas).
Supongamos que el actuario ha recabado informacin sobre una cantidad grande de autos asegurados y que de ellos
el 15% sufri algn robo. El actuario con ese dato puede calcular la probabilidad del suceso S: el auto asegurado no
sera robado.
P(S) = P( no robado) = 85/100 = 0,85
2.1.3. Axiomatizacin de la probabilidad
La Teora de la Probabilidad fue estructurada algebraicamente a partir de 1930 por matemticos de la escuela ruso-
francesa, dentro de una teora especial de la medida de conjuntos. Esa teora de la medida nos permitira hablar de la
probabilidad de un suceso aleatorio, como la medida de su ocurrencia.
COMIENZO DE PASTILLA EN escuela ruso-francesa
Los referentes ms importantes de esta escuela son: A. N. Kolmogoroff, F. Cantelli, E. Borel y otros.
FIN DE PASTILLA
Su utilidad reside en entregar al clculo de probabilidades una herramienta algebraica, es decir, un conjunto de
operaciones y maneras de operar con probabilidades.
Su cuerpo principal consiste en tres axiomas y un grupo de propiedades (teoremas).
COMIENZO DE PASTILLA EN axiomas
Recordar que los axiomas son proposiciones intuitivas aceptadas sin demostracin y que a partir de ellos pueden deducirse las propiedades
(teoremas).
FIN DE PASTILLA
Axiomas
A.1. P (S) * 0
la probabilidad de un suceso aleatorio S es un
nmero no negativo.
A.2. P(E) = 1
la probabilidad del espacio muestral E es 1.
A.3. S
i
! S
j
= entonces
P(S
i
, S
j
) = P (S
i
) + P(S
j
)
la probabilidad de la unin de dos sucesos
aleatorios S
i
y S
j
mutuamente excluyentes es la
suma de sus respectivas probabilidades.
Propiedades
P.1. 0 ) P(S) ) 1
Se deduce combinando A.1. y A.2.
P.2. P( ) = 1 P(S)
Se deduce combinando A.2. y A.3.
P.3. P() = 0
Se deduce de A.3. y considerando que es el complemento de E
P.4. P(S
i
, S
j
) = P (S
i
) + P(S
j
) P(S
i
! S
j
)
Se deduce de A.3. y de considerar a cada uno de los sucesos como unin de partes
mutuamente excluyentes.
COMIENZO DE ACTIVIDAD
3.
Demostrar la P.4. utilizando la sugerencia dada.
FIN DE ACTIVIDAD
3.
Demostrar la P.4. utilizando la sugerencia dada.
2.1.4. Tipos de probabilidad
Hay tres tipos de probabilidad de que ocurra un suceso aleatorio, a saber: pro-
babilidad total, probabilidad conjunta o compuesta y probabilidad condicional
Probabilidad total
Se denomina probabilidad total a la probabilidad del suceso resultante de la
unin de dos o ms sucesos cualesquiera.
Las probabilidades de los sucesos vistos en el subapartado 2.1.2. que el
auto asegurado no sea robado y que salga un nmero par en la jugada de
la ruleta son ejemplos de probabilidad total.
El suceso que el auto asegurado no sea robado es un suceso elemen-
tal, en cambio el suceso que salga un nmero par en la jugada de la ruleta
resulta de la unin de los sucesos elementales {2}, {4}, {6}, {8},......, {30},
{32},{34},{36} o sea,
P(sea par) = P({2}U{4}U {6}U{8}U......U{30}U{32}U{34}U{36})
P(sea par) = P(2) + P(4) + P(6) + P(8) +...+ P(30) + P(32) + P(34) + P(36) =
1/37 + 1/37 + 1/37 +.+ 1/37 + 1/37 = 18 .1/ 37 = 18/37
El clculo realizado se basa en el tercer axioma y supone la equiprobabilidad
de cada uno de los resultados de la jugada de la ruleta.
Probabilidad condicional
Supongamos que un estudio contable que recin se inicia debe presentar ante
un organismo oficial dos declaraciones juradas (DDJJ) tomadas al azar entre
sus 10 clientes. Entre ellos, tres son grandes contribuyentes (G) y el resto
monotributistas (M).
El espacio muestral E = {GG, GM, MG, MM} puede obtenerse a partir del
diagrama de rbol del grfico 2.7. en el que se incluyen las probabilidades
totales correspondientes a la primera seleccin
64
Universidad Virtual de Quilmes
Supongamos que el actuario ha recabado informacin sobre una cantidad grande de autos asegurados y que de ellos
el 15% sufri algn robo. El actuario con ese dato puede calcular la probabilidad del suceso S: el auto asegurado no
sera robado.
P(S) = P( no robado) = 85/100 = 0,85
2.1.3. Axiomatizacin de la probabilidad
La Teora de la Probabilidad fue estructurada algebraicamente a partir de 1930 por matemticos de la escuela ruso-
francesa, dentro de una teora especial de la medida de conjuntos. Esa teora de la medida nos permitira hablar de la
probabilidad de un suceso aleatorio, como la medida de su ocurrencia.
COMIENZO DE PASTILLA EN escuela ruso-francesa
Los referentes ms importantes de esta escuela son: A. N. Kolmogoroff, F. Cantelli, E. Borel y otros.
FIN DE PASTILLA
Su utilidad reside en entregar al clculo de probabilidades una herramienta algebraica, es decir, un conjunto de
operaciones y maneras de operar con probabilidades.
Su cuerpo principal consiste en tres axiomas y un grupo de propiedades (teoremas).
COMIENZO DE PASTILLA EN axiomas
Recordar que los axiomas son proposiciones intuitivas aceptadas sin demostracin y que a partir de ellos pueden deducirse las propiedades
(teoremas).
FIN DE PASTILLA
Axiomas
A.1. P (S) * 0
la probabilidad de un suceso aleatorio S es un
nmero no negativo.
A.2. P(E) = 1
la probabilidad del espacio muestral E es 1.
A.3. S
i
! S
j
= entonces
P(S
i
, S
j
) = P (S
i
) + P(S
j
)
la probabilidad de la unin de dos sucesos
aleatorios S
i
y S
j
mutuamente excluyentes es la
suma de sus respectivas probabilidades.
Propiedades
P.1. 0 ) P(S) ) 1
Se deduce combinando A.1. y A.2.
P.2. P( S ) = 1 P(S)
Se deduce combinando A.2. y A.3.
P.3. P() = 0
Se deduce de A.3. y considerando que es el complemento de E
P.4. P(S
i
, S
j
) = P (S
i
) + P(S
j
) P(S
i
! S
j
)
Se deduce de A.3. y de considerar a cada uno de los sucesos como unin de partes
mutuamente excluyentes.
COMIENZO DE ACTIVIDAD
3.
Demostrar la P.4. utilizando la sugerencia dada.
FIN DE ACTIVIDAD
Se entiende por equipro-
babilidad, en el sentido
expresado por Laplace, a la igual-
dad de oportunidad que tiene cada
uno de los resultados elementales
de una poblacin para ser selec-
cionado durante la realizacin de
un experimento aleatorio.
Grfico 2.7. Diagrama de rbol
Es decir, por ejemplo, que hay una probabilidad de 0,3 probabilidad total
de que la primera declaracin jurada seleccionada corresponda a un gran
contribuyente.
A continuacin, completaremos el diagrama agregando las probabilidades
de los resultados de la segunda seleccin de una declaracin teniendo en
cuenta que en la segunda instancia el conjunto de DDJJ va a contar con un ele-
mento menos cambiando tambin su composicin.
Grfico 2.8. Diagrama de rbol
Si nos interesara, por ejemplo, la probabilidad de que la segunda declaracin
jurada extrada sea de un monotributista tendramos dos respuestas posibles
(7/9 y 6/9) dependiendo de cul haya sido el resultado de la primera selec-
cin. Es decir, que la segunda seleccin est sujeta o condicionada a lo que
ocurri en la primera. Las probabilidades consignadas al lado de cada resul-
tado de la segunda extraccin son probabilidades condicionales.
La probabilidad condicional mide la ocurrencia de un suceso B si hubie-
ra ocurrido el suceso A y se expresa P(B/A), donde A es el suceso con-
dicin y el smbolo / es una notacin (no una operacin).
Las probabilidades condicionales consignadas en el rbol son:
P(G/G) = 2/9 = 0,2222 P(G/M) = 7/9 = 0,7778
P(M/G) = 3/9 = 0,3333 P(M/M) = 6/9 = 0,6667
65
Estadistica
La notacin P(B/A) se
debe al economista ingls
J. M. Keynes (1883 1946) en su
Tratado sobre las probabilidades
(1933).
La primera se lee: 0,2222 es la probabilidad de que en la segunda seleccin
la Declaracin Jurada sea de un gran contribuyente si (dado que, tal que,
sabiendo que) la primera hubiera sido tambin de un gran contribuyente.
Probabilidad conjunta o compuesta
Las probabilidades de cada uno de los sucesos del espacio muestral se deno-
minan probabilidades compuestas y miden la probabilidad de ocurrencia con-
junta o simultnea de dos resultados particulares en ambas selecciones.
Convenimos en:
P(GG) = P(primero G y segundo G) = P(G
1
I G
2
) = P(G I G)
La probabilidad compuesta o conjunta es la probabilidad de que ocu-
rran simultneamente dos o ms sucesos.
Utilizando la definicin de Laplace (casos favorables/casos posibles) la pro-
babilidad del suceso GG resulta :
donde la cantidad de casos posibles resulta de contar todas las combinacio-
nes de diez DDJJ (al momento de la primera seleccin) por nueve DDJJ (en la
segunda instancia), y la cantidad de casos favorables tambin resulta de la
combinacin de 3 G (primera vez) por 2 G (segunda vez).
Relacionando con las probabilidades del rbol resulta finalmente:
Generalizando para dos sucesos cualesquiera A y B:
P(A I B) = P(A). P(B/A)
La probabilidad compuesta entre dos sucesos A y B resulta de la multi-
plicacin de la probabilidad total del suceso condicin A por la proba-
bilidad condicional de B tal que A.
Conclusiones
Dados dos sucesos A y B de un espacio muestral de un experimento aleato-
rio con probabilidades no nulas, a partir de lo visto, se pueden deducir las
siguientes proposiciones:
66
Universidad Virtual de Quilmes
Los experimentos aleatorios compuestos por repeticin de uno simple son el
mecanismo bsico para la confeccin de muestras en una poblacin.
Otro tipo de experimentos compuestos sirven al estudio de la asociacin
y/o relacin causa efecto entre variables y son los experimentos compuestos
bivariados.
Experimento bivariado
Como ejemplo para el tratamiento de la probabilidad en experimentos biva-
riados analizaremos un caso particular como medio para la generalizacin.
Con la finalidad de pronosticar el estado del trnsito en funcin de la ocu-
rrencia de embotellamiento a partir de la existencia de un accidente en una
autopista en determinada franja horaria, se relevaron datos histricos obte-
nindose la siguiente informacin: el 20% de los automviles que circulan por
esa autopista en el horario estudiado tuvieron algn tipo de accidente; el 95%
de las veces en que ocurri un accidente se produjo un embotellamiento y
cuando no hubo accidente ocurri un embotellamiento el 15% de las veces.
Notamos que podramos identificar la ocurrencia de un accidente como
causa y el embotellamiento como un efecto.
En el diagrama de rbol del grfico 2.9. se ilustra la informacin:
Grfico 2.9. Diagrama de rbol
67
Estadistica
Donde las probabilidades que se tienen son:
A partir de estas probabilidades pueden calcularse las probabilidades conjuntas:
Con las probabilidades totales de las causas y las conjuntas armamos una
tabla conjunta de probabilidades o tabla de contingencias.
En la que adems aparecen calculadas las probabilidades totales de los efec-
tos Embotellamiento y No embotellamiento.
Por su ubicacin en la tabla de contingencia, a las probabilidades totales
se las suele denominar tambin probabilidades marginales.
A partir de la tabla de contingencias pueden calcularse las siguientes pro-
babilidades condicionales de las causas a partir de los efectos:
68
Universidad Virtual de Quilmes
Los experimentos aleatorios compuestos por repeticin de uno simple son el mecanismo bsico para la confeccin de
muestras en una poblacin.
Otro tipo de experimentos compuestos sirven al estudio de la asociacin y/o relacin causa efecto entre variables y
son los experimentos compuestos bivariados.
Experimento bivariado
Como ejemplo para el tratamiento de la probabilidad en experimentos bivariados analizaremos un caso particular
como medio para la generalizacin.
Con la nalidad de pronosticar el estado del trnsito en funcin de la ocurrencia de embotellamiento a partir de la
existencia de un accidente en una autopista en determinada franja horaria, se relevaron datos histricos obtenindose
la siguiente informacin: el 20% de los automviles que circulan por esa autopista en el horario estudiado tuvieron
algn tipo de accidente; el 95% de las veces en que ocurri un accidente se produjo un embotellamiento y cuando no
hubo accidente ocurri un embotellamiento el 15% de las veces.
Notamos que podramos identicar la ocurrencia de un accidente como causa y el embotellamiento como un efecto.
En el diagrama de rbol del grco 2.9. se ilustra la informacin:
Insertar Imagen N G.2.9.
0,85
Donde las probabilidades que se tienen son:
total de Accidente P(A) = 0,20
total de No accidente
P( A) = 0,80
condicional de Embotellamiento tal que Accidente P(E/A) = 0,95
condicional de No embotellamiento tal que Accidente
P( E /A) = 0,05
condicional de Embotellamiento tal que No accidente
P(E/ A) = 0,15
condicional de No embotellamiento tal que No accidente
P( E / A) = 0,85
A partir de estas probabilidades pueden calcularse las probabilidades conjuntas
de Accidente y Embotellamiento P(AEE) = 0,19
de Accidente y No embotellamiento
P(AE ) = 0,01
de No accidente y Embotellamiento P( EE) = 0,12
de No accidente y No embotellamiento
P( E ) = 0,68
Los experimentos aleatorios compuestos por repeticin de uno simple son el mecanismo bsico para la confeccin de
muestras en una poblacin.
Otro tipo de experimentos compuestos sirven al estudio de la asociacin y/o relacin causa efecto entre variables y
son los experimentos compuestos bivariados.
Experimento bivariado
Como ejemplo para el tratamiento de la probabilidad en experimentos bivariados analizaremos un caso particular
como medio para la generalizacin.
Con la nalidad de pronosticar el estado del trnsito en funcin de la ocurrencia de embotellamiento a partir de la
existencia de un accidente en una autopista en determinada franja horaria, se relevaron datos histricos obtenindose
la siguiente informacin: el 20% de los automviles que circulan por esa autopista en el horario estudiado tuvieron
algn tipo de accidente; el 95% de las veces en que ocurri un accidente se produjo un embotellamiento y cuando no
hubo accidente ocurri un embotellamiento el 15% de las veces.
Notamos que podramos identicar la ocurrencia de un accidente como causa y el embotellamiento como un efecto.
En el diagrama de rbol del grco 2.9. se ilustra la informacin:
Insertar Imagen N G.2.9.
0,85
Donde las probabilidades que se tienen son:
total de Accidente P(A) = 0,20
total de No accidente
P( ) = 0,80
condicional de Embotellamiento tal que Accidente P(E/A) = 0,95
condicional de No embotellamiento tal que Accidente
P( /A) = 0,05
condicional de Embotellamiento tal que No accidente
P(E/ ) = 0,15
condicional de No embotellamiento tal que No accidente
P( / ) = 0,85
A partir de estas probabilidades pueden calcularse las probabilidades conjuntas
de Accidente y Embotellamiento P(AEE) = 0,19
de Accidente y No embotellamiento
P(AEE ) = 0,01
de No accidente y Embotellamiento P( AEE) = 0,12
de No accidente y No embotellamiento
P( AEE ) = 0,68
Con las probabilidades totales de las causas y las conjuntas armamos una tabla conjunta de probabilidades o tabla de
contingencias.
E
E
Total
A 0,19 0,01 0,20
A
0,12 0,68 0,80
Total 0,31 0,69 1
En la que adems aparecen calculadas las probabilidades totales de los efectos Embotellamiento y No
embotellamiento.
Por su ubicacin en la tabla de contingencia, a las probabilidades totales se las suele denominar tambin probabilidades
marginales.
A partir de la tabla de contingencias pueden calcularse las siguientes probabilidades condicionales de las causas a
partir de los efectos
Accidente tal que Embotellamiento P(A/E) = 0,19/0,31 = 0,6129
Accidente tal que No embotellamiento
P(A/ ) = 0,01/0,69 = 0,0145
No accidente tal que Embotellamiento
P( /E) = 0,12/0,31 = 0,0039
No accidente tal que No embotellamiento
P( / ) = 0,68/0,69 = 0,9855
Las probabilidades calculadas se denominan probabilidades bayesianas o probabilidades condicionales de la causas y se
formalizan mediante el teorema de Bayes
COMIENZO DE PASTILLA EN Bayes
En 1764, despus de la muerte de Thomas Bayes (1702-1761), se public An essay formars solving a problem in the doctrine of chances,
una memoria en la que aparece, por vez primera, la determinacin de la probabilidad de las causas a partir de los efectos que han podido ser
observados.
FIN DE PASTILLA
Dado el suceso B (efecto) de un espacio muestral E y una particin de n sucesos A
i
(causas) de dicho espacio, la
probabilidad de que ocurra el suceso A
i
si ocurriera el suceso B es:
donde P(B) es la probabilidad total del suceso condicin y P(B) & 0.
Para A
j
cualquier suceso del conjunto de los A
i
con i = 1, 2n
COMIENZO DE ACTIVIDAD
4.
Considerando la tabla conjunta 1.11. del subapartado 1.1.2. de la Unidad anterior referida al rubro y evolucin
de los puestos de trabajo de las pymes, calcular una probabilidad de cada uno de los tipos vistos e interpretarla.
FIN DE ACTIVIDAD
Con las probabilidades totales de las causas y las conjuntas armamos una tabla conjunta de probabilidades o tabla de
contingencias.
E Total
A 0,19 0,01 0,20
0,12 0,68 0,80
Total 0,31 0,69 1
En la que adems aparecen calculadas las probabilidades totales de los efectos Embotellamiento y No
embotellamiento.
Por su ubicacin en la tabla de contingencia, a las probabilidades totales se las suele denominar tambin probabilidades
marginales.
A partir de la tabla de contingencias pueden calcularse las siguientes probabilidades condicionales de las causas a
partir de los efectos
Accidente tal que Embotellamiento P(A/E) = 0,19/0,31 = 0,6129
Accidente tal que No embotellamiento
P(A/ E ) = 0,01/0,69 = 0,0145
No accidente tal que Embotellamiento
P( A/E) = 0,12/0,31 = 0,0039
No accidente tal que No embotellamiento
P( A/ E ) = 0,68/0,69 = 0,9855
Las probabilidades calculadas se denominan probabilidades bayesianas o probabilidades condicionales de la causas y se
formalizan mediante el teorema de Bayes
COMIENZO DE PASTILLA EN Bayes
En 1764, despus de la muerte de Thomas Bayes (1702-1761), se public An essay formars solving a problem in the doctrine of chances,
una memoria en la que aparece, por vez primera, la determinacin de la probabilidad de las causas a partir de los efectos que han podido ser
observados.
FIN DE PASTILLA
Dado el suceso B (efecto) de un espacio muestral E y una particin de n sucesos A
i
(causas) de dicho espacio, la
probabilidad de que ocurra el suceso A
i
si ocurriera el suceso B es:
donde P(B) es la probabilidad total del suceso condicin y P(B) & 0.
Para A
j
cualquier suceso del conjunto de los A
i
con i = 1, 2n
COMIENZO DE ACTIVIDAD
4.
Considerando la tabla conjunta 1.11. del subapartado 1.1.2. de la Unidad anterior referida al rubro y evolucin
de los puestos de trabajo de las pymes, calcular una probabilidad de cada uno de los tipos vistos e interpretarla.
FIN DE ACTIVIDAD
Las probabilidades calculadas se denominan probabilidades bayesianas o pro-
babilidades condicionales de la causas y se formalizan mediante el teorema
de Bayes.
Dado el suceso B (efecto) de un espacio muestral E y una particin de n
sucesos A
i
(causas) de dicho espacio, la probabilidad de que ocurra el suce-
so A
i
si ocurriera el suceso B es:
donde P(B) es la probabilidad total del suceso condicin y P(B) 0.
Para A
j
cualquier suceso del conjunto de los A
i
con i = 1, 2n
4.
Considerando la tabla conjunta 1.11. del subapartado 1.1.2. de la Uni-
dad anterior referida al rubro y evolucin de los puestos de trabajo de
las pymes, calcular una probabilidad de cada uno de los tipos vistos e
interpretarla.
2.2. Variable aleatoria
Una variable aleatoria asigna valores numricos, del conjunto de los nmeros
reales, a los sucesos definidos en el espacio muestral asociado a un experi-
mento aleatorio.
En caso de que el espacio muestral de un experimento aleatorio tenga una
cantidad finita o infinita numerable de elementos, es decir, que permite algn
mecanismo de conteo, la variable aleatoria diseada ser una variable alea-
toria discreta.
En caso de que el experimento aleatorio involucre algn tipo de medicin,
cuyos resultados pertenecen a regiones del conjunto de los nmeros reales
donde es clara la imposibilidad de conteo, la variable aleatoria es de natura-
leza continua y por ello se la denomina variable aleatoria continua.
Se denomina variable aleatoria a una funcin del espacio muestral sobre
el espacio de los nmeros reales.
2.2.1. Variable aleatoria discreta
Las variables aleatorias discretas son funciones del espacio muestral sobre
el subconjunto de los enteros.
Disearemos una variable aleatoria discreta para el ejemplo del estudio
contable utilizado en el subapartado 2.1.4. (probabilidad condicional).
69
Estadistica
En 1764, despus de la
muerte de Thomas Bayes
(1702-1761), se public An essay
formars solving a problem in the
doctrine of chances, una memo-
ria en la que aparece, por vez pri-
mera, la determinacin de la pro-
babilidad de las causas a partir
de los efectos que han podido ser
observados.
Recordemos que el espacio muestral es: E = {GG, GM, MG, MM}
La variable aleatoria de diseo que elegimos es:
X: cantidad de DDJJ de clientes monotributistas entre las dos seleccionadas
La variable aleatoria X recorrer los valores enteros entre 0 y 2, donde 0 sig-
nifica que ninguna de las dos DDJJ corresponderan a monotributistas y 2 que
ambas declaraciones sean de monotributistas.
El recorrido de X es R(X) = {0, 1, 2}
Calculamos la probabilidad para cada valor r del recorrido de X obteniendo as
los valores de la denominada funcin de probabilidad h(r). Siendo h(r) = P(X = r)
h (0) = P( X= 0 M) = P(GG) = 6/90
h (1) = P( X= 1 M) = P(G, M) + P(MG) = 21/90 + 21/90 = 42/ 90
h (2) = P( X= 2 M) = P(MM) = 42/90
Confeccionamos a continuacin la tabla (T.2.1.) de distribucin de probabilidades.
T.2.1.
Donde F(r) es la funcin de distribucin acumulativa o simplemente funcin de
distribucin. Siendo F(r) = P(x r).
h(r) es una funcin de probabilidad de una variable aleatoria discre-
ta X s y slo si para todo elemento r del R(X) se cumplen las siguien-
tes propiedades que se desprenden de los dos primeros axiomas de
probabilidad.
h(r) 0
h(r) = 1
Un grfico adecuado para la funcin de probabilidad h(r) es el de bastones y
para la funcin de distribucin es el de escalones, ambos vistos en el suba-
partado 1.1.3. de la Unidad 1.
70
Universidad Virtual de Quilmes
Al momento de disear
una variable aleatoria dis-
creta debe optarse por alguna de
las categoras involucradas en el
problema para la cual la variable
har el conteo. En nuestro caso,
podra haberse optado por otra varia-
ble que contara la cantidad de ddjj
de grandes clientes entre las dos
seleccionadas.
2.2. Variable aleatoria
Una variable aleatoria asigna valores numricos, del conjunto de los nmeros reales, a los sucesos denidos en el
espacio muestral asociado a un experimento aleatorio.
En caso de que el espacio muestral de un experimento aleatorio tenga una cantidad nita o innita numerable de
elementos, es decir, que permite algn mecanismo de conteo, la variable aleatoria diseada ser una variable aleatoria
discreta.
En caso de que el experimento aleatorio involucre algn tipo de medicin, cuyos resultados pertenecen a regiones
del conjunto de los nmeros reales donde es clara la imposibilidad de conteo, la variable aleatoria es de naturaleza
continua y por ello se la denomina variable aleatoria continua.
COMIENZO DE LEER ATENTO
Se denomina variable aleatoria a una funcin del espacio muestral sobre el espacio de los nmeros reales.
FIN DE LEER ATENTO
2.2.1. Variable aleatoria discreta
Las variables aleatorias discretas son funciones del espacio muestral sobre el subconjunto de los enteros.
Disearemos una variable aleatoria discreta para el ejemplo del estudio contable utilizado en el subapartado 2.1.4.
(probabilidad condicional).
Recordemos que el espacio muestral es: E = {GG, GM, MG, MM}
La variable aleatoria de diseo que elegimos es:
X: cantidad de DDJJ de clientes monotributistas entre las dos seleccionadas
COMIENZO DE PASTILLA EN monotributistas
Al momento de disear una variable aleatoria discreta debe optarse por alguna de las categoras involucradas en el problema para la cual la
variable har el conteo. En nuestro caso, podra haberse optado por otra variable que contara la cantidad de DDJJ de grandes clientes entre las
dos seleccionadas.
FIN DE PASTILLA
La variable aleatoria X recorrer los valores enteros entre 0 y 2, donde 0 signica que ninguna de las dos DDJJ
corresponderan a monotributistas y 2 que ambas declaraciones sean de monotributistas.
X
E A
GG 0
GM
MG
1
MM 2
El recorrido de X es R(X) = {0, 1, 2}
Calculamos la probabilidad para cada valor r del recorrido de X obteniendo as los valores de la denominada funcin
de probabilidad h(r). Siendo h(r) = P(X = r)
h (0) = P( X= 0 M) = P(GG) = 6/90
h (1) = P( X= 1 M) = P(G, M) + P(MG) = 21/90 + 21/90 = 42/ 90
h (2) = P( X= 2 M) = P(MM) = 42/90
Confeccionamos a continuacin la tabla (T.2.1.) de distribucin de probabilidades.
T.2.1.
r h(r) F(r)
0 6/90 6/90
1 42/90 48/90
2 42/90 1
Donde F(r) es la funcin de distribucin acumulativa o simplemente funcin de distribucin. Siendo F(r) = P(x ) r).
COMIENZO DE LEER ATENTO
h(r) es una funcin de probabilidad de una variable aleatoria discreta X si y slo si para todo elemento r del
R(X) se cumplen las siguientes propiedades que se desprenden de los dos primeros axiomas de probabilidad.
h(r) 1) * 0
- h(r) = 1
FIN DE LEER ATENTO
Un grco adecuado para la funcin de probabilidad h(r) es el de bastones y para la funcin de distribucin es el de
escalones, ambos vistos en el subapartado 1.1.3. de la Unidad 1.
El carcter numrico de la variable aleatoria permite calcular algunas de las medidas media, varianza y desvo
estndar de las aplicadas anteriormente a las variables estadsticas, con la siguiente salvedad: en una variable estadstica
la media corresponde a un promedio observado mientras que en una variable aleatoria la media indica un promedio
esperado, o valor esperado, y se denomina esperanza.
La esperanza E(X), la varianza V(X) y el desvo estndar DS(X) se expresan
E(X) = para todo r del R(X)
DS(X) =
La esperanza de la variable del problema es:
E (X) = 0.6/90 +1.42/90 + 2. 42/90 = 1,4 DDJJ de monotributistas
Es decir, que si se seleccionan al azar dos DDJJ se espera que entre ellas haya 1,4 de clientes monotributistas.
La varianza y el desvo estndar son: V(X) = 0,3733 y DS(X) = 0,611
Propiedades de la esperanza y de la varianza
COMIENZO DE PASTILLA EN al la altura del subttulo
Las propiedades que se enuncian son vlidas en cualquier experimento aleatorio, sea este simple o compuesto.
FIN DE PASTILLA
P.1. E(C) = C
La esperanza de una constante es ella misma.
P.2. E(C + n . X) = C + n . E(X)
C + n.X es una nueva variable aleatoria resultante de una transformacin lineal de X.
El carcter numrico de la variable aleatoria permite calcular algunas de las
medidas media, varianza y desvo estndar de las aplicadas anteriormente
a las variables estadsticas, con la siguiente salvedad: en una variable esta-
dstica la media corresponde a un promedio observado mientras que en una
variable aleatoria la media indica un promedio esperado, o valor esperado, y
se denomina esperanza.
La esperanza E(X), la varianza V(X) y el desvo estndar DS(X) se expresan
La esperanza de la variable del problema es:
E (X) = 0.6/90 +1.42/90 + 2. 42/90 = 1,4 DDJJ de monotributistas
Es decir, que si se seleccionan al azar dos DDJJ se espera que entre ellas haya
1,4 de clientes monotributistas.
La varianza y el desvo estndar son: V(X) = 0,3733 y DS(X) = 0,611
Propiedades de la esperanza y de la varianza
P.1. E(C) = C
La esperanza de una constante es ella misma.
P.2. E(C + n . X) = C + n . E(X)
C + n.X es una nueva variable aleatoria resultante de una transformacin
lineal de X.
P.3. E(n . X) = n . E(X)
Caso particular que se desprende de la propiedad anterior
P.4. E(X + Y) = E(X) + E(Y)
X + Y es una nueva variable aleatoria, resultante de sumar las variables
X e Y.
P.5. V(X + Y) = V(X) + V(Y)
Slo si X e Y son independientes.
P.6. V(n . X) = n
2
. V(x)
Se deduce de la definicin de varianza
2.2.2. Modelos especiales de variables aleatorias discretas
Existen problemas de distinta ndole originados en ramas diversas de la cien-
cia, que al ser vinculados con experimentos aleatorios presentan caracters-
71
Estadistica
Las propiedades que se
enuncian son vlidas en
cualquier experimento aleatorio,
sea este simple o compuesto.
22
COMIENZO DE PASTILLA EN nmero combinatorio
nCr =
n
r
=
n!
r!(n r)!
FIN DE PASTILLA
Ejemplo
De la revisin de los archivos de una empresa de larga trayectoria en un
determinado rubro surge que en el 70% de sus balances semanales se
registraron supervit. En una auditora se propuso realizar una muestra
con los balances de 10 semanas tomadas al azar en forma independiente.
Conceptualizando que esa muestra es un experimento aleatorio y
pasando revista a sus caractersticas comprobamos que responden a un
modelo binomial a saber: hay dos resultados posibles (supervit o no
supervit) cada vez que se seleccione un balance semanal y se toman n
(10) balances en forma independiente.
Ante la futura auditora nos podemos preguntar acerca de la
probabilidad de que se encuentren en la muestra a lo sumo 5 balances
con supervit o entre 3 y 6 balances con supervit o al menos 6 balances
con supervit.
La variable aleatoria asociada al experimento, para responder los
interrogantes del auditor podra ser:
X: cantidad de balances con supervit entre los 10 seleccionados al
azar en forma independiente .
Los parmetros de la distribucin resultan entonces,
n = 10 P = 0,70
y los valores de la funcin de probabilidad h(r) y los de la funcin de
distribucin F(r) = P(X r) se encuentran en la tabla T.2.2.
T.2.2.
r i 0 1 2 3 4 5 6 7 8 9 10
h(r ) 0,000006 0,000138 0,001447 0,009002 0,036757 0,102919 0,200121 0,266828 0,233474 0,121061 0,028248
F(r ) 0,000006 0,000144 0,001591 0,010593 0,047350 0,150268 0,350389 0,617217 0,850691 0,971752 1
La probabilidad de que en la muestra se encuentren a lo sumo 5
balances con supervit ser:
P( X 5) = F(5) = 0,150268
o tambin
P( X 5) = h(r) = h(0) + h(1) + h(2) + h(3) + h(4) + h(5) =
0
5
0,150268
La probabilidad de que en la muestra haya entre 3 y 6 balances con
supervit
ticas similares; esas caractersticas comunes son las que permiten modelar-
los unvocamente.
Para la construccin de un modelo probabilstico, primero deben identifi-
carse exhaustivamente cada una de las caractersticas especficas del expe-
rimento y seguidamente asociarle una variable aleatoria apropiada.
Experimento binomial
El experimento binomial es un experimento compuesto que consiste en n repe-
ticiones independientes de un experimento simple dicotmico.
Por lo tanto las caractersticas que lo identifican son:
El experimento simple tiene slo dos resultados posibles, denominados
xito suceso que interesa seguir y fracaso suceso complementario.
Se repite n veces el experimento simple.
Las repeticiones del experimento simple son independientes entre s.
Vinculadas al experimento binomial pueden definirse ms de una variable ale-
atoria, con sus correspondientes distribuciones de probabilidad, cumpliendo
distintos roles dentro del mismo experimento. Ellas son las variables aleato-
rias binomial, geomtrica y de Pascal (o binomial negativa).
Variable aleatoria binomial
Es una variable discreta que cuenta la cantidad r de xitos en un expe-
rimento binomial.
Llamaremos P a la probabilidad de xito y en consecuencia 1-P a la probabi-
lidad de fracaso.
El modelo binomial queda caracterizado por n (nmero de repeticiones
del experimento simple o de Bernoulli) y P (probabilidad de xito en cada
repeticin) que son sus parmetros. Entonces decimos que la variable ale-
atoria X asociada tiene distribucin binomial con parmetros n y P.
El modelo matemtico para la distribucin binomial permite calcular los valo-
res de la funcin de probabilidad h(r).
h (r) = P(X = r) = nCr . P
r .
(1-P)
n-r
Donde nCr es un nmero combinatorio que cuenta la cantidad de combina-
ciones de n elementos tomados de a r, es decir la cantidad de grupos de r ele-
mentos que pueden formarse a partir de los n.
Ejemplo
De la revisin de los archivos de una empresa de larga trayectoria en un deter-
minado rubro surge que en el 70% de sus balances semanales se registraron
supervit. En una auditora se propuso realizar una muestra con los balances
de 10 semanas tomadas al azar en forma independiente.
72
Universidad Virtual de Quilmes
Si el experimento tiene
ms de dos resultados
posibles hay que dicotomizarlo.
Si las repeticiones del
experimento simple no
fueran independientes, el mode-
lo que se generara se denomina
modelo hipergeomtrico.
En smbolos X ~ B(n,P)
En este experimento, la variable
aleatoria x asociada toma valo-
res 0 y 1. La esperanza de esta
variable resulta ser la probabili-
dad de xito. P. Santiago Jacobo
Bernouilli o Bernoulli (1654-1705)
fue un matemtico suizo de ori-
gen belga. Entre otras cosas fue
quien us por primera vez la pala-
bra integral y escribi el Ars
conjectandi sobre el cl-
culo de probabilidades.
Conceptualizando que esa muestra es un experimento aleatorio y pasan-
do revista a sus caractersticas comprobamos que responden a un modelo
binomial a saber: hay dos resultados posibles (supervit o no supervit) cada
vez que se seleccione un balance semanal y se toman n (10) balances en
forma independiente.
Ante la futura auditora nos podemos preguntar acerca de la probabilidad
de que se encuentren en la muestra a lo sumo 5 balances con supervit o
entre 3 y 6 balances con supervit o al menos 6 balances con supervit.
La variable aleatoria asociada al experimento, para responder los interro-
gantes del auditor, podra ser:
X: cantidad de balances con supervit entre los 10 seleccionados al azar en
forma independiente.
Los parmetros de la distribucin resultan entonces,
n = 10 P = 0,70
y los valores de la funcin de probabilidad h(r) y los de la funcin de distribu-
cin F(r) = P(X r) se encuentran en la tabla T.2.2.
T.2.2.
La probabilidad de que en la muestra se encuentren a lo sumo 5 balances
con supervit ser:
o tambin
La probabilidad de que en la muestra haya entre 3 y 6 balances con supervit
o tambin
Al menos 6 balances con supervit
73
Estadistica
COMIENZO DE LEER ATENTO
El modelo binomial queda caracterizado por n (nmero de repeticiones del experimento simple o de Bernoulli)
y P (probabilidad de xito en cada repeticin) que son sus parmetros. Entonces decimos que la variable
aleatoria X asociada tiene distribucin binomial con parmetros n y P.
COMIENZO DE PASTILLA EN Bernoulli
En este experimento, la variable aleatoria x asociada toma valores 0 y 1. La esperanza de esta variable resulta ser la probabilidad de xito P.
Santiago Jacobo Bernouilli o Bernoulli (1654-1705) fue un matemtico suizo de origen belga. Entre otras cosas fue quien us por primera vez
la palabra integral y escribi el Ars conjectandi sobre el clculo de probabilidades.
FIN DE PASTILLA
COMIENZO DE PASTILLA EN parmetros
En smbolos X ~ B(n,P)
FIN DE PASTILLA
FIN DE LEER ATENTO
El modelo matemtico para la distribucin binomial permite calcular los valores de la funcin de probabilidad h(r).
h (r) = P(X = r) = nCr . P
r .
(1-P)
n-r
Donde nCr es un nmero combinatorio que cuenta la cantidad de combinaciones de n elementos tomados de a r,
es decir la cantidad de grupos de r elementos que pueden formarse a partir de los n.
COMIENZO DE PASTILLA EN nmero combinatorio
FIN DE PASTILLA
Ejemplo
De la revisin de los archivos de una empresa de larga trayectoria en un determinado rubro surge que en el 70% de sus
balances semanales se registraron supervit. En una auditora se propuso realizar una muestra con los balances de 10
semanas tomadas al azar en forma independiente.
Conceptualizando que esa muestra es un experimento aleatorio y pasando revista a sus caractersticas comprobamos
que responden a un modelo binomial a saber: hay dos resultados posibles (supervit o no supervit) cada vez que se
seleccione un balance semanal y se toman n (10) balances en forma independiente.
X: cantidad de balances con supervit entre los 10 seleccionados al azar en forma independiente.
Los parmetros de la distribucin resultan entonces,
n = 10 P = 0,70
y los valores de la funcin de probabilidad h(r) y los de la funcin de distribucin F(r) = P(X ) r) se encuentran en la
tabla T.2.2.
T.2.2.
r
i
0 1 2 3 4 5 6 7 8 9 10
h(r) 0,000006 0,000138 0,001447 0,009002 0,036757 0,102919 0,200121 0,266828 0,233474 0,121061 0,028248
F(r) 0,000006 0,000144 0,001591 0,010593 0,047350 0,150268 0,350389 0,617217 0,850691 0,971752 1
La probabilidad de que en la muestra se encuentren a lo sumo 5 balances con supervit ser:
o tambin
Esperanza y varianza de una distribucin binomial
Como el experimento binomial consiste en n repeticiones independientes de
un ensayo Bernoulli, la variable aleatoria binomial X es una transformacin
lineal de la variable aleatoria Bernoulli x, es decir,
Luego, aplicando las propiedades de la esperanza y varianza P.4. y P.5. enun-
ciadas anteriormente en el presente apartado calculamos la esperanza y la
varianza de una variable aleatoria binomial X.
La esperanza es:
y la varianza resulta:
Volviendo al ejemplo de los balances, la cantidad de balances que se espera
encontrar con supervit entre los 10 seleccionados ser
E(X) = n . p = 10 . 0,70 = 7 balances con supervit
Con una desviacin estndar de
Proceso de Poisson
Un proceso de Poisson es un experimento de naturaleza binomial donde
los xitos ocurren o no a lo largo de un intervalo continuo (el cual puede
estar dado en tiempo, longitud, superficie, volumen, etctera).
Es un proceso donde los xitos ocurren en el transcurso del continuo y a dife-
rencia de un experimento binomial puro los fracasos no pueden ocurrir por-
que representan la ausencia de xito.
Lo que caracteriza unvocamente a un determinado proceso de Poisson es
la intensidad media (a) de ocurrencias de xito en la unidad del continuo.
74
Universidad Virtual de Quilmes
La intensidad media es la canti-
dad de xitos esperada por uni-
dad del continuo, mientras el pro-
ceso sea el mismo.
Por ejemplo, una distribuidora mayorista comprob que, en las primeras
semanas de cada mes, la cantidad media demandada de un determinado pro-
ducto es de 3 toneladas diarias. El fenmeno descrito involucra un proceso
de Poisson donde a = 3 tn/da para esa poca del mes.
Tambin, que en las ltimas semanas de cada mes la demanda media dia-
ria baja a 2 toneladas. En este caso el proceso de Poisson sera otro porque
presenta una intensidad media a = 2 tn/da, diferente a la anterior.
Diferentes a indican procesos poissonianos distintos.
En un proceso aleatorio poissoniano es posible definir variables aleatorias
de distinto tipo. Para procesos de este tipo, en esta carpeta, presentaremos
una variable aleatoria discreta llamada de Poisson (que cuente la cantidad de
xitos en un intervalo continuo) y una variable aleatoria continua denominada
exponencial que veremos en 2.2.4.
Variable aleatoria de Poisson
Es una variable discreta que cuenta la cantidad de xitos que podran ocu-
rrir en un cierto intervalo continuo, durante un proceso de Poisson.
Establecido un intervalo de longitud t en el continuo, la cantidad media espe-
rada de ocurrencia de xitos en ese intervalo es E(X) = . t, donde es la ya
vista intensidad media de ocurrencias de xito en la unidad del continuo.
La esperanza E(x), que simbolizamos con la letra griega es el parmetro
de esta distribucin.
Si una variable aleatoria discreta X sigue una distribucin de Poisson de
parmetro podemos expresarla en smbolos como X ~ P(l) y la probabilidad
P(X= r) de que sucedan r xitos en un intervalo t dado se calcula mediante la
siguiente frmula:
La probabilidad de una variable aleatoria X que se distribuye en forma de
Poisson:
depende nicamente de la longitud (t) del intervalo considerado,
es independiente de lo ocurrido en alguno de los intervalos precedentes.
Para intervalos de diferente longitud t habr distintas distribuciones de pro-
babilidad, cada una con su propio todas dentro de un mismo proceso carac-
terizado por .
Lo particular de esta variable aleatoria es que su varianza tambin es .
Volviendo al ejemplo de la distribuidora mayorista nos planteamos las siguien-
tes inquietudes.
Cul es la probabilidad de que en dos das de la primera semana de un
mes cualquiera se produzca una demanda de 5 toneladas?
Determinamos primero el valor del parmetro para un t = 2 das:
75
Estadistica
La probabilidad de que en esos dos das la demanda sea de 5 toneladas es
de 0,1606.
Con base al calculado podemos decir que en esos dos das se espera que
haya una demanda de 6 toneladas del producto.
Cul es la probabilidad de que en un da y medio de la ltima semana de
un mes cualquiera la demanda sea superior a 2 toneladas.
En este caso, = tn/da . 1,5 das = 3 tn
Luego:
La probabilidad de que en ese da y medio la demanda supere las 2 tn es
0,8009.
Con base al calculado podemos decir que en esos dos das se espera que
haya una demanda de 3 toneladas del producto.
5.
Buscar tres ejemplos de la vida real que pudieran constituir un proceso
de Poisson y para cada uno describir la variable involucrada.
2.2.3. Variable aleatoria continua
Existen fenmenos que no permiten ser tratados con modelos de variables
aleatorias discretas debido a que los resultados del experimento aleatorio
asociado a l slo son medibles en el conjunto de los nmeros reales. En
este caso la variable aleatoria asociada debe ser una variable continua para
la cual no se pueden listar puntualmente cada uno de sus valores pero s con-
siderar su recorrido mediante intervalos.
Al ser las variables aleatorias continuas funciones del espacio muestral
sobre el espacio de los nmeros reales, el tratamiento de la misma deber rea-
lizarse mediante intervalos, los problemas de probabilidad que las involucran
son del tipo P(x a), P(x b) o P(a x b).
En una variable aleatoria continua, el correlato de la funcin h(r) de las
variables aleatorias discretas es la funcin f(x) denominada funcin de densidad
de probabilidad que a diferencia de la h(r) no asigna probabilidades sino que
permite calcularlas en intervalos de nmeros reales.
La funcin de densidad de probabilidad cumple con las siguientes pro-
piedades:
76
Universidad Virtual de Quilmes
Los valores de la funcin f(x) deben ser siempre positivos o 0 para cualquier
valor de la variable X.
El rea encerrada entre la funcin en todo su dominio y el eje de las absci-
sas es 1.
La probabilidad de que la variable aleatoria se encuentre entre dos valores a
y b resulta de integrar la funcin de densidad f(x) entre esos dos lmites.
Grfico 2.10.
En el caso que a coincida con b el rea de la regin sombreada en el G.2.10.
tendra base igual a 0 y el rea es 0, lo que tambin se desprende de la P.3.
cuando a y b coinciden en un mismo punto. Es decir, que en una variable ale-
atoria continua las probabilidades puntuales son cero.
Una funcin de densidad de probabilidad es un modelo terico proba-
bilstico sustentado, en general, por la distribucin de una poblacin.
2.2.4. Modelos especiales de variables aleatorias continuas
Como se hiciera mencin en el subapartado 2.2.2. las caractersticas comunes
de algunos fenmenos aleatorios son las que permiten elaborar modelos.
En el caso de las variables aleatorias continuas desarrollaremos dos mode-
los especiales de distribucin.
77
Estadistica
Como consecuencia de
que las probabilidades
puntuales son cero los sucesos
x < a y x a son idnticos y
por lo tanto sus probabilidades son
iguales.
Distribucin normal
Un fenmeno que genera tpicamente una poblacin con distribucin normal
es la medicin del tiempo requerido para efectuar una misma operacin por
todos los clientes de una determinada entidad bancaria, bajo el supuesto de
que todos deberan tardar el mismo tiempo para realizar dicha operacin.
A la hora de medir efectivamente el fenmeno podemos observar que pre-
dominan los clientes que emplearan para hacer la operacin un tiempo cer-
cano al promedio, sin embargo, algunos son ms rpidos y otros ms lentos
generando una distribucin del tiempo como la siguiente.
Grfico 2.11.
El modelo terico de la distribucin normal de una variable continua x se for-
maliza matemticamente mediante la funcin f(x) cuya expresin
representada grficamente es
Grfico 2.12.
donde la media y el desvo estndar son los parmetros de la distri-
bucin y para cada par de valores de y se tendr una curva diferente.
Caractersticas de la curva normal
La curva que es la representacin grfica de la distribucin normal tiene las
siguientes caractersticas:
78
Universidad Virtual de Quilmes
Es perfectamente simtrica alrededor de .
Es asinttica con el eje de la variable x hacia , es decir que el 100% de
la poblacin queda encerrado entre esos dos lmites.
Como consecuencia de las dos caractersticas anteriores la mitad de la
poblacin se encuentra entre y y la otra mitad entre y + .
Grfico 2.13.
Presenta dos puntos de inflexin a una distancia de un desvo estndar a
ambos lados de la media.
Las proporciones de poblacin que quedan comprendidos en secciones de
un desvo estndar de amplitud a ambos lados de la media aparecen asen-
tadas en el grfico G.2.14.
Grfico 2.14.
El siguiente ejemplo, se refiere a un experimento aleatorio sobre una pobla-
cin con distribucin normal, donde la funcin f(x) que describe esa distribu-
cin poblacional es la funcin de densidad de probabilidad de la variable ale-
atoria involucrada en el experimento.
Ejemplo
Retomando el caso de los clientes de una entidad bancaria que efectan una
operacin determinada, se ha encontrado que el tiempo medio requerido para
realizarla es de 130 segundos con un desvo estndar de 43 segundos.
Si se tomara un cliente al azar experimento aleatorio se podran plante-
ar las siguientes preguntas: a) cul es la probabilidad de que esa persona
emplee menos de 100 seg. para realizar la operacin? o b) cul es la pro-
babilidad de que tarde entre 2 y 3 minutos en realizar la transaccin?
Esquematizamos las dos situaciones planteadas en los grficos 2.15. y
2.16. respectivamente.
79
Estadistica
Grfico 2.15.
Grfico 2.16.
Y las sendas respuestas son:
a. P( x < 100s) = F(100) = 0,2427
b. P(2min< x <3 min) = P(120 s < x < 180 s) = P( x < 180s) P( x < 120s) =
= F(180) F(120) = 0,8775 0,4081 = 0,4694
A los resultados obtenidos puede arribarse por integracin analtica de la fun-
cin de densidad normal entre los extremos que correspondan o bien utili-
zando un programa estadstico (por ejemplo el mdulo estadstico de Excel, o
los programas SPSS, InfoStat u otro).
Si no se contara con las mencionadas herramientas de clculo puede uti-
lizarse como recurso la tabla de probabilidades acumuladas de la denomina-
da distribucin normal estndar que figura en el Anexo I y cuyas caractersti-
cas, adems de las generales descritas anteriormente para cualquier
distribucin normal, son:
nombre de la variable normal estndar : Z
parmetros: m
z
= 0 y s
z
= 1
funcin de densidad normal estndar:
Para convertir un valor cualquiera x correspondiente al problema real (con dis-
tribucin normal) a un valor estandarizado z (con el fin de aprovechar la tabla
del Anexo I) se utiliza la siguiente frmula de estandarizacin:
80
Universidad Virtual de Quilmes
Aplicando la distribucin normal estndar a la resolucin de los tems ante-
riores, resulta
Las diferencias que se detectan al realizar los clculos con la tabla se deben
al redondeo a dos decimales de z que tiene dicha tabla.
6.
a. Calcular el tiempo mximo que, con una probabilidad de 0,90, tar-
dara en hacer dicha operacin un cliente de la entidad bancaria
tomado al azar.
b. En relacin con la poblacin de clientes observada, si se considera-
ran slo los clientes que tardaron menos de 130 segundos qu por-
centaje de ellos tard ms de 100 segundos?
Experimento exponencial
El experimento exponencial se define dentro de un proceso de Poisson y en
consecuencia la variable continua exponencial est ntimamente relacionada
con la variable discreta de Poisson.
Mientras el rol de la variable aleatoria de Poisson es contar la cantidad de
xitos a lo largo de un intervalo continuo, la variable aleatoria exponencial
mide, a partir del ltimo xito ocurrido, la longitud del continuo hasta la ocu-
rrencia del siguiente xito.
Con el ltimo xito concluye el experimento exponencial lo que determina
su carcter de efmero (se desarrolla slo entre dos xitos), por lo que fijado
un cierto intervalo t del continuo a partir del ltimo xito slo podran ocurrir
dos sucesos aleatorios:
que la variable exponencial mida la ocurrencia del siguiente xito antes de
transcurrido t es decir x < t, o
que la variable exponencial mida la ocurrencia del siguiente xito despus
de transcurrido t es decir x > t.
Los sucesos x < t y x > t son los dos nicos sucesos aleatorios que pue-
den imaginarse dentro de un experimento exponencial y por lo tanto son
complementarios y como tales, mutuamente excluyentes.
81
Estadistica
La primera consecuencia de lo expresado anteriormente es que no hay suce-
sos compuestos en un experimento exponencial porque el nico suceso con-
cebible {x < t} I {x > t}
es un suceso imposible {x < t} I {x > t} =
y por lo tanto su probabilidad es nula
P({x < t} I {x > t}) = P( ) = 0
La segunda consecuencia es que no hay probabilidades condicionales pues-
to que no hay posibilidad de particionar la poblacin para definir un suceso ale-
atorio que represente la condicin porque, como razonamos anteriormente, el
experimento es efmero y no hay una coleccin de datos que permita descri-
bir una poblacin, por lo tanto no existen poblaciones exponenciales.
Formalmente, y asignando arbitrariamente a uno de los dos sucesos posi-
bles el rol de condicin, se tiene:
Al no haber poblacin, no podemos contar inicialmente con una funcin de
densidad exponencial procediendo de forma similar a como se obtuvo, por
ejemplo, la funcin de densidad normal.
Usaremos un camino distinto aprovechando el vnculo entre las distribu-
ciones de Poisson y exponencial dentro de un mismo proceso de Poisson
caracterizado por .
Para ello, definiremos un suceso aleatorio S: que transcurra todo un cierto
intervalo t sin que ocurra xito, cuya probabilidad pueda calcularse tanto utili-
zando la variable aleatoria de Poisson como la variable aleatoria exponencial.
P(que no ocurra xito a lo largo de t) = P(X
Poisson
= 0) = P(x
exponencial
> t)
Donde: P(X
Poisson
= 0) = e
-a.t
= P(x
exponencial
> t)
Luego, las probabilidades de los nicos sucesos posibles de un experimento
exponencial resultan:
P(x > t) = e
-.t
y aplicando la propiedad de la probabilidad de sucesos complementarios
P(x < t) = 1 - P(x > t) = 1 - e
-.t
se observa que esta expresin corresponde a la funcin de distribucin acu-
mulada, luego se tiene que
F(t) = 1 - e
-.t
82
Universidad Virtual de Quilmes
y derivndola se obtiene la funcin de densidad de probabilidad f(x)
F (x) = f(x)
La funcin de densidad que sintetiza al modelo es entonces
Cuya representacin grfica es G.2.17.
Grfico 2.17.
El parmetro de la distribucin exponencial es el mismo a que caracte-
riza al proceso de Poisson.
La esperanza de esta variables es:
y la varianza
Aplicaciones de la distribucin exponencial
Caso A. Como distribucin de los tiempos de espera, la exponencial puede
aplicarse a problemas de rotacin de inventario donde el experimento comien-
za a partir de un pedido (xito) y luego la variable recorre los valores aleato-
rios del tiempo en que puede ocurrir el siguiente (xito) pedido. A continuacin
se desarrolla un ejemplo.
Una distribuidora mayorista comprob que cada 5 das hbiles recibe en pro-
medio 3 pedidos de embarque de cierto artculo (a = 3 pedidos/5 das = 0,6
pedidos/da).
83
Estadistica
1- Teniendo en cuenta que el tiempo para reponer un embarque en depsito
es de 1 da, despachado un pedido con qu probabilidad el siguiente lle-
gar despus de ese lapso?
2- Siendo el tiempo medio esperado entre pedidos: E(X) = 1/a = 1,67 das,
con qu probabilidad el siguiente pedido ser antes de lo esperado?
3- Con una probabilidad de 0,90 de cunto tiempo se dispone entre dos
pedidos?
despejando t se tiene t = ln 0,90 / -0,6 = 0,18 das
4- Habiendo despachado un pedido, con qu probabilidad el siguiente lle-
gar entre 1 y 2 das despus?
Caso B. La distribucin exponencial tambin puede aplicarse a problemas de
fiabilidad o plazo de servicio de los artculos en circulacin, vida til de mate-
riales o de mercancas perecederas, donde la variable recorre los valores ale-
atorios de vida til de los mismos hasta quedar fuera de servicio. Aqu no hay
dos xitos pues el experimento comienza con el inicio del servicio y termina
en la falla, que es el nico xito. A continuacin se analiza un ejemplo.
Para ciertas lmparas de bajo consumo, su fabricante midi que la vida
media de funcionamiento sin fallo es de 8.000 horas. Si se instalara una cual-
quiera de esas lmparas.
1- Cunto tiempo se espera que dure?
Dentro del experimento aleatorio, que consiste en tomar al azar una de las
lmparas e instalarla, la media observada con anterioridad se convierte en
un media esperada E(X) = 8.000 h.
2- Con qu probabilidad durar ms de 8.000 h?
= 1/E(X) = 1/8000 = 0,000125
84
Universidad Virtual de Quilmes
3- Cuntas horas de funcionamiento sin falla se puede garantizar, con una
probabilidad de 0,90?
7.
Tomando el ejemplo ya trabajado en la distribucin Poisson, una dis-
tribuidora mayorista comprob que, en las primeras semanas de cada
mes, la cantidad media demandada de un determinado producto es de
3 toneladas diarias. Luego de la ltima tonelada demandada, para la
misma poca del mes
a. Cuntos das se espera que transcurran hasta el siguiente pedido de
una tonelada?
b. Calcular la probabilidad de que el siguiente pedido de una tonelada
ingrese luego de transcurridos 2 das.
c. Calcular la probabilidad de que el pedido se realice antes de que pase
un da y medio.
85
Estadistica
87
Inferencia estadstica
Ob je ti vos
Estudiar las relaciones entre los estadsticos muestrales y los parmetros
poblacionales.
Desarrollar procedimientos relativos a dos de los problemas fundamen-
tales de la inferencia estadstica: estimacin de parmetros y prueba de
hiptesis.
3.1. Distribucin de estadsticos muestrales
En el estudio de una poblacin es factible observar que los individuos que la
conforman presentan diferencias entre s y como reflejo de ello todas las mues-
tras posibles de cierto tamao n, seleccionadas al azar de esa poblacin, tam-
bin presentarn variaciones entre ellas en su conformacin. Tales variacio-
nes se transmiten al compotamiento de las medidas muestrales tambin
denominadas estadsticos muestrales calculados a partir de cada una de las
muestras, dando origen a nuevas poblaciones de naturaleza terica, las pobla-
ciones de los estadsticos muestrales.
La importancia del estudio de la distribucin de los estadsticos muestra-
les radica en el hecho de que ellos son los estimadores de los parmetros
poblacionales.
Dada una poblacin conocida de tamao N con media poblacional y pro-
porcin poblacional P(e) = P de algn valor e elegido como xito, si de ella se
seleccionan aleatoriamente todas las muestras posibles de tamao n y para
cada una de ellas se calcula la media aritmtica X
i
y la proporcin de xito
p
i
(e)= p
i
, se tendrn m muestras y consecuentemente la misma cantidad m de
medias aritmticas y de proporciones muestrales.
3
Las dos ltimas columnas constituyen las poblaciones de las variables alea-
torias media muestral y proporcin muestral. Por su importancia conceptual,
seguidamente trataremos las distribuciones tericas de las poblaciones de
los estadsticos media muestral (como mejor estimador de ) y proporcin
muestral (como mejor estimador de P).
3.1.1. Distribucin del estadstico media muestral
Los grficos que se presentan a continuacin se refieren a la distribucin de
dos poblaciones, la primera corresponde a una poblacin original conformada
por las edades de los 497 empleados de una empresa grfico.3.1 mien-
tras que la segunda grfico 3.2 representa a la distribucin de la poblacin
terica de las edades medias de todas las muestras de tamao 2 que se
extrajeron de la poblacin original.
Grfico 3.1.
Los parmetros de la poblacin original (de edades) son:
= 35 aos y
2
= 82,90 aos
2
Grfico 3.2.
88
Universidad Virtual de Quilmes
El mejor estimador de un
parmetro poblacional
es aquel que cumple con ciertas
cualidades (insesgabilidad, con-
sistencia, eficiencia y suficiencia)
que aqu no se analizarn.
0,17
0,14
0,11
0,08
0,06
0,03
0,00
22 35 48 62
X
Distribucin de la poblacin original
f
r
e
c
u
e
n
c
i
a
r
e
l
a
t
i
v
a
Grfico.3.1
22
0,20
0,10
0,10
0,05
0,00
35 48 62
Distribucin de la poblacin de las medias
muestrales (muestras de tamao 2)
Medias muestrales
f
r
e
c
u
e
n
c
i
a
r
e
l
a
t
i
v
a
Grfico.3.2
0,17
0,14
0,11
0,08
0,06
0,03
0,00
22 35 48 62
X
Distribucin de la poblacin original
f
r
e
c
u
e
n
c
i
a
r
e
l
a
t
i
v
a
Grfico.3.1
22
0,20
0,10
0,10
0,05
0,00
35 48 62
Distribucin de la poblacin de las medias
muestrales (muestras de tamao 2)
Medias muestrales
f
r
e
c
u
e
n
c
i
a
r
e
l
a
t
i
v
a
Grfico.3.2
Los parmetros de la poblacin terica de las medias muestrales de todas
las muestras de tamao 2 son:
Si se tomaran muestras de tamao n=1 el grfico resultante para la pobla-
cin terica de las medias muestrales de todas las muestras de tamao 1
sera exactamente igual que el Grfico.3.1. (porque cada media es el ele-
mento que conforma la muestra) y sus parmetros seran los mismos que los
de la poblacin original.
Como se puede observar, todas las medias de las poblaciones tericas, an
variando n, coinciden con la media de la poblacin de donde se extrajeron las
muestras.
Conclusin:
Y las varianzas disminuyen proporcionalmente al tamao n de la muestra.
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las medias
muestrales resulta Grfico.3.3. aproximadamente normal.
Grfico 3.3.
89
Estadistica
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
3
x
= 35 aos y
x
2
= 41, 45 aos
2
Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.
x
= 35 aos y
x
2
= 82, 90 aos
2
Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.
Conclusin:
x
=
Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.
x
2
=
2
n
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.
Insertar Imagen N G.3.3.
G.3.3.
Propiedades de la variable aleatoria media muestral
Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = < y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3
x
= 35 aos y
x
2
= 41, 45 aos
2
Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.
x
= 35 aos y
x
2
= 82, 90 aos
2
Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.
Conclusin:
x
=
Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.
x
2
=
2
n
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.
Insertar Imagen N G.3.3.
G.3.3.
Propiedades de la variable aleatoria media muestral
Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = < y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3
x
= 35 aos y
x
2
= 41, 45 aos
2
Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.
x
= 35 aos y
x
2
= 82, 90 aos
2
Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.
Conclusin:
x
=
Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.
x
2
=
2
n
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.
Insertar Imagen N G.3.3.
G.3.3.
Propiedades de la variable aleatoria media muestral
Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = < y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
3
x
= 35 aos y
x
2
= 41, 45 aos
2
Si se tomaran muestras de tamao n=1 el grfico resultante para la
poblacin terica de las medias muestrales de todas las muestras de
tamao 1 sera exactamente igual que el G.3.1. (porque cada media
es el elemento que conforma la muestra) y sus parmetros seran los
mismos que los de la poblacin original.
x
= 35 aos y
x
2
= 82, 90 aos
2
Como se puede observar, todas las medias de las poblaciones tericas,
an variando n, coinciden con la media de la poblacin de donde se
extrajeron las muestras.
Conclusin:
x
=
Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.
x
2
=
2
n
Adems, si las muestras extradas de la poblacin son de tamao grande
(usualmente n > 30), el grfico de la distribucin de la poblacin de las
medias muestrales resulta G.3.3. aproximadamente normal.
Insertar Imagen N G.3.3.
G.3.3.
Propiedades de la variable aleatoria media muestral
Si en una determinada poblacin se define una variable aleatoria X: {x
1
,
x
2
, x
3 ,, .
x
m,.
} con esperanza E(X) = < y varianza V(X) =
2
y se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
Propiedades de la variable aleatoria media muestral
Si en una determinada poblacin se define una variable aleatoria X: {x
1
, x
2
, x
3
,, .
x
m,.
2
y se selecciona slo
una muestra aleatoria de tamao n de dicha poblacin para la cual su media
muestral X es un elemento de la poblacin terica de Xs se verifican las
siguientes propiedades:
El desvo estndar
x
tambin se denomina error estndar de la media mues-
tral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la espe-
ranza y varianza de una variable aleatoria cualquiera como se puede verificar
a continuacin.
3.1.2. Distribucin del estadstico proporcin muestral
En el grfico 3.4. se representa la distribucin de la poblacin terica de las
proporciones de empleados mayores a 45 aos de todas las muestras de un
cierto tamao n superior a 100.
Grfico 3.4.
90
Universidad Virtual de Quilmes
4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.
P.1 E( ) =
X
=
COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA
P.2 V( ) =
X
2
=
2
n
DS( ) =
X
=
n
El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.
COMIENZO DE TEXTO APARTE
P.1
E( X )= E
X
i
1=1
n
n
= E
1
n
. X
i
i=1
n
=
1
n
. E( X
i
) =
1
n
. n .
i=1
n
=
P.2
V( X )= V
X
i
1=1
n
n
= V
1
n
. X
i
i=1
n
=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n
=
2
n
FIN DE TEXTO APARTE
3.1.2. Distribucin del estadstico proporcin muestral
En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.
Insertar Imagen N G.3.4.
G.3.4.
4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.
P.1 E( ) =
X
=
COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA
P.2 V( ) =
X
2
=
2
n
DS( ) =
X
=
n
El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.
COMIENZO DE TEXTO APARTE
P.1
E( X )= E
X
i
1=1
n
n
= E
1
n
. X
i
i=1
n
=
1
n
. E( X
i
) =
1
n
. n .
i=1
n
=
P.2
V( X )= V
X
i
1=1
n
n
= V
1
n
. X
i
i=1
n
=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n
=
2
n
FIN DE TEXTO APARTE
3.1.2. Distribucin del estadstico proporcin muestral
En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.
Insertar Imagen N G.3.4.
G.3.4.
4
para la cual su media muestral es un elemento de la poblacin terica
de se verifican las siguientes propiedades.
P.1 E( ) =
X
=
COMIENZO DE PASTILLA EN P.1
Esta propiedad est relacionada con la cualidad de insesgabilidad del estimador .
FIN DE PASTILLA
P.2 V( ) =
X
2
=
2
n
DS( ) =
X
=
n
El desvo estndar tambin se denomina error estndar de la media
muestral respecto de la media poblacional.
Estas propiedades se desprenden inmediatamente de las propiedades
enunciadas anteriormente en el apartado 2.2.1. de la Unidad 2 para la
esperanza y varianza de una variable aleatoria cualquiera como se puede
verificar a continuacin.
COMIENZO DE TEXTO APARTE
P.1
E( X )= E
X
i
1=1
n
n
= E
1
n
. X
i
i=1
n
=
1
n
. E( X
i
) =
1
n
. n .
i=1
n
=
P.2
V( X )= V
X
i
1=1
n
n
= V
1
n
. X
i
i=1
n
=
1
n
2
. V( X
i
) =
1
n
2
. n .
2
i=1
n
=
2
n
FIN DE TEXTO APARTE
3.1.2. Distribucin del estadstico proporcin muestral
En el grfico G.3.4. se representa la distribucin de la poblacin terica
de las proporciones de empleados mayores a 45 aos de todas las
muestras de un cierto tamao n superior a 100.
Insertar Imagen N G.3.4.
G.3.4.
Esta propiedad est rela-
cionada con la cualidad
de insesgabilidad del estimador X.
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
En la poblacin original, la proporcin de los empleados mayores a 45 aos es:
P(>45) = 0,11
y los parmetros de la distribucin grfico 3.4. de las proporciones mues-
trales son:
p
=0,11 y
2
p
=0,0002
Conclusin:
p
=P
Y las varianzas disminuyen proporcionalmente al tamao n de la muestra.
Adems, si las muestras extradas de la poblacin fueran chicas, la distribu-
cin de la poblacin de las proporciones muestrales no necesariamente resul-
tara aproximadamente normal.
Propiedades de la variable aleatoria proporcin muestral
Si en una determinada poblacin caracterizada por una variable aleatoria X, se
efecta un experimento binomial con parmetros n y P y en consecuencia con
esperanza = n.P y varianza
2
= n. P. ( 1- P) , se selecciona slo una muestra
aleatoria de tamao n de dicha poblacin para la cual su proporcin muestral
de xito p verifica las siguientes propiedades:
El desvo estndar
p
tambin se denomina error estndar de la proporcin
muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se desprenden
inmediatamente de las enunciadas anteriormente en el apartado 2.2.1. de la
Unidad 2 para la esperanza y varianza de una variable aleatoria cualquiera.
3.1.3. Teorema central del lmite
El teorema central del lmite formaliza el comportamiento asintticamente nor-
mal, bajo determinadas condiciones, de la distribucin de una variable aleato-
ria, en particular el de las variables aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central del lmite
TCL como resultante de una construccin colectiva es factible de enunciar-
se, siguiendo a Meyer (1986) de la siguiente manera.
91
Estadistica
5
En la poblacin original, la proporcin de los empleados mayores a 45
aos es:
P(>45) = 0,11
y los parmetros de la distribucin G.3.4. de las proporciones
muestrales son:
p
= 0,11 y
p
2
= 0, 0002
Conclusin:
p
= P
Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.
p
2
=
P.(1- P)
n
Adems, si las muestras extradas de la poblacin fueran chicas, la
distribucin de la poblacin de las proporciones muestrales no
necesariamente resultara aproximadamente normal.
Propiedades de la variable aleatoria proporcin muestral
Si en una determinada poblacin caracterizada por una variable
aleatoria X, se efecta un experimento binomial con parmetros n y P y
en consecuencia con esperanza < = n.P y varianza
2
= n.P.(1-P), se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
para la cual su proporcin muestral de xito p verifica las siguientes
propiedades.
P.1 E(p) = <
P
= P
P.2 V(p) =
p
2
=
P.(1- P)
n
DS(x) =
P
=
P.(1- P)
n
El desvo estndar tambin se denomina error estndar de la
proporcin muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se
desprenden inmediatamente de las enunciadas anteriormente en el
apartado 2.2.1. de la Unidad 2 para la esperanza y varianza de una
variable aleatoria cualquiera.
3.1.3. Teorema central del lmite
El teorema central del lmite formaliza el comportamiento
asintticamente normal, bajo determinadas condiciones, de la
5
En la poblacin original, la proporcin de los empleados mayores a 45
aos es:
P(>45) = 0,11
y los parmetros de la distribucin G.3.4. de las proporciones
muestrales son:
p
= 0,11 y
p
2
= 0, 0002
Conclusin:
p
= P
Y las varianzas disminuyen proporcionalmente al tamao n de la
muestra.
p
2
=
P.(1- P)
n
Adems, si las muestras extradas de la poblacin fueran chicas, la
distribucin de la poblacin de las proporciones muestrales no
necesariamente resultara aproximadamente normal.
Propiedades de la variable aleatoria proporcin muestral
Si en una determinada poblacin caracterizada por una variable
aleatoria X, se efecta un experimento binomial con parmetros n y P y
en consecuencia con esperanza < = n.P y varianza
2
= n.P.(1-P), se
selecciona slo una muestra aleatoria de tamao n de dicha poblacin
para la cual su proporcin muestral de xito p verifica las siguientes
propiedades.
P.1 E(p) = <
P
= P
P.2 V(p) =
p
2
=
P.(1- P)
n
DS(x) =
P
=
P.(1- P)
n
El desvo estndar tambin se denomina error estndar de la
proporcin muestral respecto de la proporcin poblacional.
Estas propiedades, al igual que las de la media muestral, se
desprenden inmediatamente de las enunciadas anteriormente en el
apartado 2.2.1. de la Unidad 2 para la esperanza y varianza de una
variable aleatoria cualquiera.
3.1.3. Teorema central del lmite
El teorema central del lmite formaliza el comportamiento
asintticamente normal, bajo determinadas condiciones, de la
Teorema Central del
Lmite o Teorema del
Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
Sean X
1
, X
2
,X
n
... una sucesin de variables aleatorias independientes con
E(X
i
) =
i
y V(X
i
) =
i
2
, i = 1, 2,
Sea X = X
1
+ X
2
+ + X
n.
Luego, para n tendiendo a infinito, la X tiene distribucin asintticamente nor-
mal con
Este teorema nos est diciendo que si una variable aleatoria es la suma de
n variables aleatorias independientes entonces esa variable aleatoria suma ten-
dr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen todas
distribucin normal entonces se verifica que su suma tiene distribucin nor-
mal, para cualquier valor de n.
Como corolario, se concluye que bajo determinadas condiciones, las
distribuciones de la media y proporcin muestral son normales.
Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497 emple-
ados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la edad media
poblacional es de 35 aos con un desvo estndar de 9,105 aos y una pro-
porcin de empleados mayores a 45 aos del 11%, si se proyectara abrir un
anexo cercano a la empresa con parte del personal y para ello se van a ele-
gir al azar 119 empleados, podemos formularnos las siguientes preguntas:
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34 aos?
Como n = 119 es una muestra grande entonces
Por lo tanto
92
Universidad Virtual de Quilmes
6
distribucin de una variable aleatoria, en particular el de las variables
aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central
del lmite TCL como resultante de una construccin colectiva es
factible de enunciarse, siguiendo a Meyer (1986) de la siguiente manera.
COMIENZO DE PASTILLA EN Teorema central del lmite
Teorema Central del Lmite o Teorema del Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
FIN DE PASTILLA
Sean X
1,
X
2,
X
n
... una sucesin de variables aleatorias independientes
con E(X
i
) = F
i
y V(X
i
) =
,
i = 1, 2,
Sea X = X
1
+ X
2
+ + X
n.
Luego, para n tendiendo a infinito, la X tiene distribucin
asintticamente normal con
=
i
i=1
n
y
2
=
i
2
i=1
n
Este teorema nos est diciendo que si una variable aleatoria es la suma
de n variables aleatorias independientes entonces esa variable aleatoria
suma tendr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen
todas distribucin normal entonces se verifica que su suma tiene
distribucin normal, para cualquier valor de n.
COMIENZO DE LEER ATENTO
Como corolario, se concluye que bajo determinadas condiciones,
las distribuciones de la media y proporcin muestral son
normales.
FIN DE LEER ATENTO
Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497
empleados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la
edad media poblacional es de 35 aos con un desvo estndar de 9,105
aos y una proporcin de empleados mayores a 45 aos del 11%, si se
proyectara abrir un anexo cercano a la empresa con parte del personal y
para ello se van a elegir al azar 119 empleados, podemos formularnos
las siguientes preguntas:
6
distribucin de una variable aleatoria, en particular el de las variables
aleatorias media y proporcin muestrales.
Tambin denominado teorema del lmite central, el Teorema central
del lmite TCL como resultante de una construccin colectiva es
factible de enunciarse, siguiendo a Meyer (1986) de la siguiente manera.
COMIENZO DE PASTILLA EN Teorema central del lmite
Teorema Central del Lmite o Teorema del Lmite Central de De Moivre (1733)
Laplace (~1810) y otros.
FIN DE PASTILLA
Sean X
1,
X
2,
X
n
... una sucesin de variables aleatorias independientes
con E(X
i
) = F
i
y V(X
i
) =
,
i = 1, 2,
Sea X = X
1
+ X
2
+ + X
n.
Luego, para n tendiendo a infinito, la X tiene distribucin
asintticamente normal con
=
i
i=1
n
y
2
=
i
2
i=1
n
Este teorema nos est diciendo que si una variable aleatoria es la suma
de n variables aleatorias independientes entonces esa variable aleatoria
suma tendr distribucin normal, para n grande.
En particular si tales n variables aleatorias independientes tienen
todas distribucin normal entonces se verifica que su suma tiene
distribucin normal, para cualquier valor de n.
COMIENZO DE LEER ATENTO
Como corolario, se concluye que bajo determinadas condiciones,
las distribuciones de la media y proporcin muestral son
normales.
FIN DE LEER ATENTO
Ejemplos
Teniendo en cuenta la informacin poblacional de las edades de los 497
empleados de una empresa (ver apartados 3.1.1. y 3.1.2.) a saber: la
edad media poblacional es de 35 aos con un desvo estndar de 9,105
aos y una proporcin de empleados mayores a 45 aos del 11%, si se
proyectara abrir un anexo cercano a la empresa con parte del personal y
para ello se van a elegir al azar 119 empleados, podemos formularnos
las siguientes preguntas:
7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N
35,
9,105
119
Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119
= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.
b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?
P(X > 37 aos) = P z >
37 - 35
9,105
119
= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.
P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119
= P(z < -0, 35) = F(-0, 35 ) = 0, 3632
La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.
COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.
7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N
35,
9,105
119
Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119
= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.
b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?
P(X > 37 aos) = P z >
37 - 35
9,105
119
= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.
P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119
= P(z < -0, 35) = F(-0, 35 ) = 0, 3632
La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.
COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.
La probabilidad de que la media de edad de los empleados que trabajaran en
el nuevo anexo sea inferior a 34 aos es 0,1151.
b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?
La probabilidad de que la edad media de los empleados supere los 37 aos
es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados mayores a
45 aos del nuevo anexo sea inferior al 10%?
La probabilidad de que la proporcin de los empleados mayores a 45 aos
del nuevo anexo sea inferior al 10% es 0,3632.
1.
a. Una carpintera recibe peridicamente grandes partidas de postes de
madera de longitud media de 4 metros procedentes de un aserrade-
ro. Sabiendo que la precisin del proceso de cortado de los postes
est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida entre
3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida recibi-
da, cul es la probabilidad de que la longitud media de la muestra
est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.
b. Una inmobiliaria de Quilmes ha cambiado su poltica de alquileres
introduciendo una opcin de alquiler a sola firma. Actualmente el
55% de los departamentos que ofrece son con esta modalidad. Del
archivo de alquileres de la inmobiliaria se tom una muestra aleato-
ria de 180 fichas. Cul es la probabilidad de que la proporcin de
inquilinos sin garante est comprendida entre el 48% y el 60%?
93
Estadistica
7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N
35,
9,105
119
Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119
= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.
b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?
P(X > 37 aos) = P z >
37 - 35
9,105
119
= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.
P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119
= P(z < -0, 35) = F(-0, 35 ) = 0, 3632
La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.
COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.
7
1)
a. Cul ser la probabilidad de que la edad media de la muestra de 119
empleados que trabajarn en el nuevo anexo sea inferior a los 34
aos?
Como n = 119 es una muestra grande entonces N
35,
9,105
119
Por lo tanto
P(X < 34 aos) = P z <
34 - 35
9,105
119
= P(z < 1,198 ) = F (1, 20 ) = 0,1151
La probabilidad de que la media de edad de los empleados que
trabajaran en el nuevo anexo sea inferior a 34 aos es 0,1151.
b. Cul ser la probabilidad de que la edad media de los 119 empleados
supere los 37 aos?
P(X > 37 aos) = P z >
37 - 35
9,105
119
= P(z > 2, 40) =1F (2, 40 ) =1 0, 9918 = 0, 0082
La probabilidad de que la edad media de los empleados supere los 37
aos es 0,0082.
2)
Cul ser la probabilidad de que la proporcin de los empleados
mayores a 45 aos del nuevo anexo sea inferior al 10%.
P(p < 0,10) = P z <
0,10 - 0,11
0,11.0, 89
119
= P(z < -0, 35) = F(-0, 35 ) = 0, 3632
La probabilidad de que la proporcin de los empleados mayores a 45
aos del nuevo anexo sea inferior al 10% es 0,3632.
COMIENZO DE ACTIVIDAD
1.
a. Una carpintera recibe peridicamente grandes partidas de
postes de madera de longitud media de 4 metros procedentes de
un aserradero. Sabiendo que la precisin del proceso de cortado
de los postes est dada por un desvo estndar de 3,5 cm.
i. Cul es la probabilidad de que un poste elegido al azar mida
entre 3,98 y 4,03 metros?
ii. Si se elige una muestra de 80 postes de la ltima partida
recibida, cul es la probabilidad de que la longitud media de la
muestra est comprendida entre 3,98 y 4,03 metros?
iii. Cul es la diferencia entre i) y ii) ? Justifique.
3.2. Problemas fundamentales de la inferencia
estadstica
En la vida cotidiana, como en el campo cientfico o profesional, surgen situa-
ciones caracterizadas por la incertidumbre pese a lo cual deben tomarse deci-
siones sustentadas usualmente en los modelos tericos elaborados con base
en observaciones previas de fenmenos similares.
Los dos problemas fundamentales que ataen a la inferencia estadstica
son la estimacin de un parmetro desconocido y las pruebas de hiptesis
cuyas soluciones se basan necesariamente en la evidencia muestral.
3.2.1. Estimacin por intervalo de confianza
La estimacin por intervalo de confianza de un parmetro desconoci-
do consiste en construir a partir de la evidencia muestral un interva-
lo o rango continuo de valores que contendra, con una cierta probabi-
lidad asociada, el verdadero valor del parmetro poblacional.
Por ejemplo, toda persona que realiza una rutina diaria de su casa al trabajo
de hecho est colectando evidencia muestral sobre el tiempo que le insume
el viaje. A partir de las veces que anteriormente hizo el recorrido casa-traba-
jo (lo que constituye un muestreo) estima un cierto intervalo de tiempo que
empleara un da cualquiera en llegar a su trabajo (se entiende, siguiendo la
rutina cotidiana), con una cierta probabilidad.
En el relato anterior se pueden identificar casi completamente todos los ele-
mentos necesarios para la construccin de un intervalo de confianza, a saber:
la evidencia muestral, el nivel de confianza la probabilidad de la estimacin
y el parmetro tiempo esperado a estimar.
La construccin de intervalos de confianza se basa en las distribuciones
que tienen los estadsticos muestrales, o estimadores de los parmetros
poblacionales, ya vistas en el apartado 3.1.
Intervalos de confianza para la media poblacional
Antes de abocarnos al clculo de intervalos desarrollaremos los fundamen-
tos de su construccin. Mantengamos por el momento la pauta del apartado
anterior de contar con una poblacin cuyos y son conocidos y que de ella
se extraer una muestra de tamao n.
La distribucin de los X alrededor de bajo las condiciones generales
expuestas en 3.1.3., se representa de la siguiente forma:
94
Universidad Virtual de Quilmes
Grfico 3.5.
Si en vez de interesarnos en preguntas como P(X>a) P(X<b) nos plantera-
mos una del tipo P(a<x<b) con a y b equidistantes de .,el rea sombreada
(denominada 1)ser la respuesta.
Grfico 3.6.
Si 1 es la probabilidad de que x caiga dentro del intervalo [a,b] entonces
ser la probabilidad de que x caiga fuera de l. Como se puede advertir que-
dar partido en dos, porque estamos considerando un intervalo simtrico alre-
dedor de . Y estandarizando segn Z se tiene lo siguiente.
Grfico 3.7.
95
Estadistica
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
35
Distribucin de la poblacin de las medias muestras (n>30)
Medias muestrales
Grfico.3.3
0,11 1 0
Distribucin de la poblacin de las proporciones muestras (n>100)
Proporciones muestrales
Grfico.3.4
Grfico.3.5
Grfico.3.6
X
a b
1-
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
10
Los subndices de los Z estn en relacin con el criterio de acumulacin
de la tabla de la distribucin normal estndar. Como el punto a
acumula /2 de probabilidad su estandarizado Z ser Z
/2
y como el
punto b acumula 1/2 de probabilidad su estandarizado ser Z
1/2
.
En rigor Z
/2
y Z
1-/2
son iguales en valor absoluto pero tienen signo
contrario.
Insertar Imagen N G.3.8.
G.3.8.
Entonces estandarizando la variable
Z =
x
n
el clculo de la probabilidad planteada ser:
P(a < x < b) = P
a -
n
<
x
n
<
b
n
=1
P(a < x < b) = P Z
2
<
x
n
< Z
1
2
=1
P(a < x < b) = P Z
1
2
<
x
n
< Z
1
2
=1
Luego, despejando de
10
Los subndices de los Z estn en relacin con el criterio de acumulacin
de la tabla de la distribucin normal estndar. Como el punto a
acumula /2 de probabilidad su estandarizado Z ser Z
/2
y como el
punto b acumula 1/2 de probabilidad su estandarizado ser Z
1/2
.
En rigor Z
/2
y Z
1-/2
son iguales en valor absoluto pero tienen signo
contrario.
Insertar Imagen N G.3.8.
G.3.8.
Entonces estandarizando la variable
Z =
x
n
el clculo de la probabilidad planteada ser:
P(a < x < b) = P
a -
n
<
x
n
<
b
n
=1
P(a < x < b) = P Z
2
<
x
n
< Z
1
2
=1
P(a < x < b) = P Z
1
2
<
x
n
< Z
1
2
=1
Luego, despejando de
11
P Z
1
2
<
x
n
< Z
1
2
=1
se tiene
P Z
1
2
.
n
< x < Z
1
2
.
n
=1
Como + es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es
mx
= z
1
2
.
n
Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional + de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para +
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para +, se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:
P(Z
1
2
.
n
< x < Z
1
2
.
n
) =1
y teniendo en cuenta que ahora la incgnita es + la despejamos
obteniendo:
P x z
1
a
2
n
< < x + z
1
2
n
=1
se tiene
Como es conocido, X es la diferencia que podra haber entre la media de
la muestra que se seleccionar y la media conocida de la poblacin. Por su
naturaleza, a esta diferencia la consideramos como error.
X es el error de la media muestral respecto de la media poblacional y 1
es su probabilidad. El mximo valor que puede tomar ese error o error mxi-
mo, en valor absoluto es
Puede observarse que cuando se agranda el tamao de la muestra el error
mximo se achica y lo mismo ocurre cuando disminuye el nivel de confianza.
Como ambos casos tienen distintas connotaciones se analizarn con ms
detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general, no se
conoce el valor de la media poblacional . De ah la necesidad de su estima-
cin y para ello se utiliza la evidencia muestral y la informacin poblacional que
se posea como el tipo de distribucin poblacional (normal o no) y el conoci-
miento de otros parmetros (varianza o desvo estndar).
El clculo de la estimacin por intervalos de confianza para presenta dis-
tintos casos dependiendo de la informacin poblacional con que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza para
, se parte de la expresin del error de la media muestral respecto de la
media poblacional a la que arribamos anteriormente:
y teniendo en cuenta que ahora la incgnita es la despejamos obteniendo:
Donde ahora 1- es la probabilidad, la confianza que tenemos de que el
intervalo
97
Estadistica
11
P Z
1
2
<
x
n
< Z
1
2
=1
se tiene
P Z
1
2
.
n
< x < Z
1
2
.
n
=1
Como + es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es
mx
= z
1
2
.
n
Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional + de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para +
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para +, se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:
P(Z
1
2
.
n
< x < Z
1
2
.
n
) =1
y teniendo en cuenta que ahora la incgnita es + la despejamos
obteniendo:
P x z
1
a
2
n
< < x + z
1
2
n
=1
11
P Z
1
2
<
x
n
< Z
1
2
=1
se tiene
P Z
1
2
.
n
< x < Z
1
2
.
n
=1
Como + es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es
mx
= z
1
2
.
n
Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional + de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para +
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para +, se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:
P(Z
1
2
.
n
< x < Z
1
2
.
n
) =1
y teniendo en cuenta que ahora la incgnita es + la despejamos
obteniendo:
P x z
1
a
2
n
< < x + z
1
2
n
=1
11
P Z
1
2
<
x
n
< Z
1
2
=1
se tiene
P Z
1
2
.
n
< x < Z
1
2
.
n
=1
Como + es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es
mx
= z
1
2
.
n
Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional + de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para +
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para +, se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:
P(Z
1
2
.
n
< x < Z
1
2
.
n
) =1
y teniendo en cuenta que ahora la incgnita es + la despejamos
obteniendo:
P x z
1
a
2
n
< < x + z
1
2
n
=1
11
P Z
1
2
<
x
n
< Z
1
2
=1
se tiene
P Z
1
2
.
n
< x < Z
1
2
.
n
=1
Como + es conocido, es la diferencia que podra haber entre la
media de la muestra que se seleccionar y la media conocida de la
poblacin. Por su naturaleza, a esta diferencia la consideramos como
error.
es el error de la media muestral respecto de la media
poblacional y 1- es su probabilidad. El mximo valor que puede
tomar ese error o error mximo , en valor absoluto es
mx
= z
1
2
.
n
Puede observarse que cuando se agranda el tamao de la muestra el
error mximo se achica y lo mismo ocurre cuando disminuye el nivel de
confianza. Como ambos casos tienen distintas connotaciones se
analizarn con ms detalle al abordar la construccin de los intervalos.
En la realidad concreta de los problemas estadsticos, en general no
se conoce el valor de la media poblacional + de ah la necesidad de su
estimacin y para ello se utiliza la evidencia muestral y la informacin
poblacional que se posea como el tipo de distribucin poblacional
(normal o no) y el conocimiento de otros parmetros (varianza o desvo
estndar).
El clculo de la estimacin por intervalos de confianza para +
presenta distintos casos dependiendo de la informacin poblacional con
que se cuente.
Poblacin normal o aproximadamente normal y
2
conocido
En este caso particular, para la construccin del intervalo de confianza
para +, se parte de la expresin del error de la media muestral respecto
de la media poblacional a la que arribamos anteriormente:
P(Z
1
2
.
n
< x < Z
1
2
.
n
) =1
y teniendo en cuenta que ahora la incgnita es + la despejamos
obteniendo:
P x z
1
a
2
n
< < x + z
1
2
n
=1
contenga al verdadero valor de .
El mismo intervalo (con una probabilidad 1 asociada) que anteriormen-
te se ubicaba alrededor del , ahora se ubica alrededor del X para poder esti-
mar (con una confianza 1) el desconocido.
Ntese adems que, en rigor, lo nico que se trajo del estudio previo es el
segmento que se coloc sobre X y su probabilidad asociada. No hay una dis-
tribucin sobre l (la distribucin de la muestra, en todo caso, no forma parte
de la construccin que hicimos).
En resumen, los lmites del intervalo se obtienen sumando y restando el
error mximo a la media muestral ya que sta es el centro del intervalo.
Grfico 3.9.
Por lo tanto, al intervalo tambin se lo puede expresar del siguiente modo:
Como el error mximo disminuye cuando aumenta el
tamao de la muestra o cuando es menor el nivel de confianza, entonces:
Si aumenta el tamao de la muestra, para un mismo nivel de confianza
el valor de z se mantiene constante se obtiene un intervalo de menor
amplitud que implica mayor precisin en la estimacin.
Si disminuye el nivel de confianza (manteniendo el tamao de la muestra) se
obtiene un intervalo de menor amplitud pero eso no implica mejorar la preci-
sin ya que el intervalo tendr menor probabilidad de contener al parmetro.
Ejemplo
Con el fin de controlar el proceso de llenado de paquetes de galletitas de
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en gramos
de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504; 512; 496;
512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la mqui-
na que la precisin de ella al envasar est dada por un desvo estndar de
= 5 gramos.
98
Universidad Virtual de Quilmes
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
= x z
1
n
, x + z
1
n
Sabiendo que el nivel de confianza establecido es 1- = 0,95
calculamos el valor de 1-/2 y a continuacin buscamos en la tabla el
z
1-/2
. Luego z
0,975
= 1,96.
Reemplazando se obtiene:
I
= 504 1,96
5
16
,504 +1,96
5
16
= 501, 55; 506, 45
[ ]
Concluimosque, con baseen una muestra de16 paquetesy con una
confianza del 95%, seestima queel peso medio detodoslospaquetes
fabricadosseencuentra entre501,55g y 506,45g.
13
Con el fin de controlar el proceso de llenado de paquetes de galletitas de
medio kilo, se seleccionaron al azar 16 de esos paquetes y el peso en
gramos de cada uno de ellos fue el siguiente: 505; 510; 495; 508; 504;
512; 496; 512; 514; 505; 493; 496; 506; 502; 509; 497.
Como informacin adicional se conoce por catlogo de compra de la
mquina que la precisin de ella al envasar est dada por un desvo
estndar de = 5 gramos.
En base a la muestra de los 16 paquetes estimaremos el peso medio
de todos los paquetes de galletitas envasados por esa mquina, mediante
un intervalo con un nivel de confianza de 0,95.
COMIENZO DE PASTILLA EN nivel de confianza
En la eleccin de un nivel de confianza, son estndares los valores 0,90; 0,95 o
0,99.
FIN DE PASTILLA
La informacin con que se cuenta es la siguiente.
Sobre la poblacin:
la distribucin de los pesos de todos los paquetes llenados por
la mquina es normal (o aproximadamente normal) porque los
procesos de medicin de un mismo valor nominal (medir
longitudes, pesar, etc.) entregan naturalmente poblaciones
normales.
el desvo estndar = 5g.
Sobre la muestra:
el tamao de la muestra seleccionada es n = 16.
el peso medio de los paquetes = 504g.
el desvo estndar S = 6,802g.
Se obtiene el intervalo de confianza para el peso medio de llenado de
los paquetes, utilizando la expresin:
I
= x z
1
n
, x + z
1
Sabiendo que el nivel de confianza establecido es 1- = 0,95
calculamos el valor de 1-/2 y a continuacin buscamos en la tabla el
z
1-/2
. Luego z
0,975
= 1,96.
Reemplazando se obtiene:
I
= 504 1,96
5
16
,504 +1,96
5
16
= 501, 55; 506, 45
[ ]
Concluimosque, con baseen una muestra de16 paquetesy con una
confianza del 95%, seestima queel peso medio detodoslospaquetes
fabricadosseencuentra entre501,55g y 506,45g.
De la frmula del
mx.
se despeja n.
Para poder estimar la media de todos los paquetes envasados por esa mqui-
na con un error mximo de 1g y con una confianza del 95% debern selec-
cionarse como mnimo 97 paquetes.
2.
Con base en la muestra de 20 piezas plsticas de la matriz ME4 con-
signada en el apartado 1.3. de la Unidad 1 y sabiendo que la precisin
de la balanza est definida por un desvo estndar de 1g.
a. Estimar, con un nivel de confianza del 95%, el peso medio de todas
las piezas plsticas fabricadas por esa empresa.
b. En qu se fundamenta la normalidad de la distribucin de todos
los pesos de las piezas plsticas?
Poblacin normal o aproximadamente normal y
2
desconocido
Consideremos ahora que la especificacin de la desviacin estndar pobla-
cional dada en el problema anterior no se conoce, porque se perdi el cat-
logo o porque el fabricante de la mquina no lo provey, o por otras razones.
Podemos realizar igualmente la estimacin de la media poblacional?
Si la poblacin es normal, y estamos en ese caso, es posible calcular el
error mximo reemplazando el s desconocido por su mejor estimador que es
el desvo muestral S. Pero en lugar de la distribucin normal estndar se debe-
r utilizar la distribucin t de Student la cual fue diseada especialmente para
el muestreo en poblaciones normales.
Sean X
1
, X
2
, . . . , X
n
variables aleatorias independientes que son todas normales con media
y desviacin estndar s. Entonces la variable aleatoria tiene una distribucin t
con n-1 grados de libertad.
Caractersticas de la distribucin t de Student
1- Al igual que en la distribucin Normal:
a) El rango de valores de la t de Student vara de - a +
b) Es simtrica respecto de su media.
V(t) siempre mayor a 1 pero si crece el tamao de la muestra, n el desvo tiende a 1 y
la distribucin t es asintticamente normal de parmetros (0, 1)
100
Universidad Virtual de Quilmes
La di st r i buci n t de
Student fue publicada en
1908 por W. S. Gosset bajo el seu-
dnimo de Student.
x
x
3- Es ms aplanada que la Normal por tener mayor dispersin.
4- Hay una familia de curvas de la distribucin t de Student dependiendo de los grados de
libertad que para una variable es n1 como se muestra en el grfico G.3.10.
Grfico 3.10.
5- Las curvas dependen de los grados de libertad, a mayor grado de libertad corresponde
menor dispersin.
Entonces, en este caso el error mximo es
Y el intervalo de confianza para la media poblacional es:
Volviendo al problema:
La informacin con la que contamos es la siguiente.
Sobre la poblacin:
La distribucin de los pesos de todos los paquetes llenados por la mqui-
na es normal (o aproximadamente normal) porque los procesos de medi-
cin de un mismo valor nominal (medir longitudes, pesar, etc.) entregan
naturalmente poblaciones normales.
Sobre la muestra:
El tamao de la muestra seleccionada n = 16.
El peso medio de los paquetes de la muestra X=504g.
El desvo de la muestra S = 6,802g.
Utilizando el mismo nivel de confianza 1 = 0,95 y sabiendo que los grados
de libertad son 15, buscamos en la tabla de la t del Anexo el valor corres-
pondiente a t
n-1;1-/2
. Luego t
15;0,975
= 2,131.
Reemplazando los datos construimos el intervalo de confianza para la media:
101
Estadistica
x
X
X
a
Z Z
Z
b
1-
/2
/2 1/2
/2
-Z Z Z
1-
/2
/2 1/2
/2
0
gl grande
gl mediano
gl chico
G.3.7
G.3.8
G.3.10
G.3.9.
Lmite inferior
del intervalo
mx
Lmite superior
del intervalo
mx
x
Finalmente, con base en una muestra de 16 paquetes y con una confianza del
95%, se estima que el peso medio de todos los paquetes fabricados se encuen-
tra entre 500,38g y 507,63g.
Notamos que el intervalo obtenido es menos preciso que el hallado en el
ejemplo anterior, donde se conoca el desvo poblacional, y esto se debe a que
en este segundo caso slo se cuenta con las medidas muestrales. Como
era de esperar al contar con menor informacin se obtuvo menor precisin
en la estimacin.
3.
Con base en la muestra de 20 piezas plsticas de la matriz ME4 con-
signada en el apartado 1.3 de la Unidad 1;
a. Estimar, con un nivel de confianza del 95%, la longitud media de
todas las piezas plsticas fabricadas por esa empresa.
b. Qu supuesto tuvo en cuenta acerca de la distribucin de todas las
longitudes de las piezas de plstico para realizar la estimacin?
Poblacin no normal y
2
conocido
Cuando la poblacin no es normal o se desconoce el tipo de distribucin que
posee y se conoce la varianza poblacional, para poder estimar la media pobla-
cional es necesario que la muestra sea grande para que en virtud del Teorema
central del lmite dicha estimacin pueda realizarse utilizando la misma expre-
sin de la primera situacin tratada.
Por otro lado, si la muestra es chica no se puede llevar a cabo la estimacin
por intervalo de confianza de la media poblacional.
Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas las
transacciones bancarias posibles por la totalidad de los clientes de un deter-
minado banco.
En este problema la distribucin de los tiempos empleados para realizar
todas las transacciones bancarias no necesariamente es normal.
Repasar las caractersticas de la poblacin definida en este ejemplo con
la tratada en la Unidad 2, apartado 2.2.4. para reconocer la distinta natu-
raleza de cada una.
102
Universidad Virtual de Quilmes
Convengamos que la desviacin estndar de todas las operaciones es cono-
cida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar
todas las operaciones y se seleccionara una muestra aleatoria de 60 clientes
que emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minu-
tos, la informacin con la que contaramos sera la siguiente:
Sobre la poblacin:
El desvo = 1,5 min.
Sobre la muestra:
El tamao de la muestra seleccionada n = 60.
El tiempo medio de las transacciones de la muestra X=3,7min.
El desvo de la muestra S = 2,1 min.
Calcularemos un intervalo para con una confianza del 95%.
Luego, con base en una muestra de 60 transacciones y con una confianza del
95%, se estima que el tiempo medio de todas las operaciones del banco se
encuentra entre 3,31 min y 4,08 min.
Intervalo de confianza para la proporcin poblacional
Toda la lgica empleada para fundamentar la construccin de intervalos de
confianza para la media poblacional puede extenderse a la fundamenta-
cin de la construccin de intervalos de confianza para estimar la proporcin
poblacional P debido a que, en virtud al Teorema central del lmite, la varia-
ble aleatoria proporcin muestral tiene distribucin normal de parmetros
si el tamao n de la muestra es grande.
Para construir un intervalo de confianza para la proporcin poblacional, al
igual que en los casos vistos para la media, el intervalo se centrar en el esta-
dstico muestral y ser simtrico alrededor de l.
En este caso el clculo del error mximo debera ser:
pero al desconocer P se utiliza su mejor estimador p, quedando
103
Estadistica
17
Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas
las transacciones bancarias posibles por la totalidad de los clientes de un
determinado banco.
En este problema la distribucin de los tiempos empleados para
realizar todas las transacciones bancarias no necesariamente es normal.
COMIENZO DE PARA REFLEXIONAR
Repasar las caractersticas de la poblacin definida en este
ejemplo con la tratada en la Unidad 2, apartado 2.2.4. para
reconocer la distinta naturaleza de cada una.
FIN DE PARA REFLEXIONAR
Convengamos que la desviacin estndar de todas las operaciones es
conocida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar todas
las operaciones y se seleccionara una muestra aleatoria de 60 clientes que
emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minutos, la
informacin con la que contaramos sera la siguiente:
Sobre la poblacin:
el desvo = 1,5 min
Sobre la muestra:
el tamaos de la muestra seleccionada n = 60
el tiempo medio de las transacciones de la muestra
el desvo de la muestra S = 2,1 min
Calcularemos un intervalo para ? con una confianza del 95%.
I
= 3, 7 1, 96
1, 5
60
, 3, 7 +1, 96
1, 5
60
= 3, 31 , 4, 08
( )
Luego, con base en una muestra de 60 transacciones y con una
confianza del 95%, se estima que el tiempo medio de todas las
operaciones del banco se encuentra entre 3,31 min y 4,08 min.
Intervalo de confianza para la proporcin poblacional
Toda la lgica empleada para fundamentar la construccin de intervalos
de confianza para la media poblacional puede extenderse a la
fundamentacin de la construccin de intervalos de confianza para
estimar la proporcin poblacional P debido a que, en virtud al Teorema
central del lmite, la variable aleatoria proporcin muestral tiene
distribucin normal de parmetros ?
p
= P y
p
=
P.(1P)
n
si el tamao
n de la muestra es grande.
17
Ejemplo
Consideremos la poblacin de los tiempos empleados para realizar todas
las transacciones bancarias posibles por la totalidad de los clientes de un
determinado banco.
En este problema la distribucin de los tiempos empleados para
realizar todas las transacciones bancarias no necesariamente es normal.
COMIENZO DE PARA REFLEXIONAR
Repasar las caractersticas de la poblacin definida en este
ejemplo con la tratada en la Unidad 2, apartado 2.2.4. para
reconocer la distinta naturaleza de cada una.
FIN DE PARA REFLEXIONAR
Convengamos que la desviacin estndar de todas las operaciones es
conocida y es = 1,5 minutos.
Si se deseara estimar el tiempo medio que tardan los clientes en realizar todas
las operaciones y se seleccionara una muestra aleatoria de 60 clientes que
emplearon en promedio 3,7 minutos con un desvo estndar de 2,1 minutos, la
informacin con la que contaramos sera la siguiente:
Sobre la poblacin:
el desvo = 1,5 min
Sobre la muestra:
el tamaos de la muestra seleccionada n = 60
el tiempo medio de las transacciones de la muestra
el desvo de la muestra S = 2,1 min
Calcularemos un intervalo para ? con una confianza del 95%.
I
= 3, 7 1, 96
1, 5
60
, 3, 7 +1, 96
1, 5
60
= 3, 31 , 4, 08
( )
Luego, con base en una muestra de 60 transacciones y con una
confianza del 95%, se estima que el tiempo medio de todas las
operaciones del banco se encuentra entre 3,31 min y 4,08 min.
Intervalo de confianza para la proporcin poblacional
Toda la lgica empleada para fundamentar la construccin de intervalos
de confianza para la media poblacional puede extenderse a la
fundamentacin de la construccin de intervalos de confianza para
estimar la proporcin poblacional P debido a que, en virtud al Teorema
central del lmite, la variable aleatoria proporcin muestral tiene
distribucin normal de parmetros ?
p
= P y
p
=
P.(1P)
n
si el tamao
n de la muestra es grande.
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.
I
P
= p
mx
; p +
mx
[ ]
En este caso el clculo del error mximo debera ser:
mx
= z
1
P.(1P)
n
pero al desconocer P se utiliza su mejor estimador p, quedando
mx
z
1
p.(1 p)
n
Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.
La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200
I
P
= [0,386; 0,406]
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.
I
P
= p
mx
; p +
mx
[ ]
En este caso el clculo del error mximo debera ser:
mx
= z
1
P.(1P)
n
pero al desconocer P se utiliza su mejor estimador p, quedando
mx
z
1
p.(1 p)
n
Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.
La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200
I
P
= [0,386; 0,406]
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.
I
P
= p
mx
; p +
mx
[ ]
En este caso el clculo del error mximo debera ser:
mx
= z
1
P.(1P)
n
pero al desconocer P se utiliza su mejor estimador p, quedando
mx
z
1
p.(1 p)
n
Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.
La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200
I
P
= [0,386; 0,406]
Por tal motivo, el intervalo de confianza para la proporcin poblacional P resulta
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado pro-
grama, se seleccion una muestra de 2200 familias que poseen uno o ms
televisores en una determinada ciudad, y de la muestra se obtuvo que 871
familias ven ese programa. Estimar, utilizando un nivel de confianza de 0,95,
un intervalo para la proporcin de familias que ven ese programa.
La informacin con la que contamos es la siguiente.
El tamao de la muestra seleccionada n = 2200.
La proporcin muestral de familias que ven el programa de TV.
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
Con base en una muestra de 2200 familias con el 95% de confianza la verda-
dera proporcin de familias que ven ese programa de TV est comprendida entre
el 38,6% y el 40,6%.
4.
Con base en la muestra de las 96 familias escogidas al azar de cierta loca-
lidad (apartado 1.1.2. de la Unidad 1) con 1 = 0,95 estimar la pro-
porcin de familias en toda la poblacin cuyo gasto medio en alimen-
tos supere los $46.
Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error mximo, que
en su forma original y en su forma aproximada es:
104
Universidad Virtual de Quilmes
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.
I
P
= p
mx
; p +
mx
[ ]
En este caso el clculo del error mximo debera ser:
mx
= z
1
P.(1P)
n
pero al desconocer P se utiliza su mejor estimador p, quedando
mx
z
1
p.(1 p)
n
Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.
La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200
I
P
= [0,386; 0,406]
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.
I
P
= p
mx
; p +
mx
[ ]
En este caso el clculo del error mximo debera ser:
mx
= z
1
P.(1P)
n
pero al desconocer P se utiliza su mejor estimador p, quedando
mx
z
1
p.(1 p)
n
Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.
La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200
I
P
= [0,386; 0,406]
18
Para construir un intervalo de confianza para la proporcin
poblacional, al igual que en los casos vistos para la media, el intervalo
se centrar en el estadstico muestral y ser simtrico alrededor de l.
I
P
= p
mx
; p +
mx
[ ]
En este caso el clculo del error mximo debera ser:
mx
= z
1
P.(1P)
n
pero al desconocer P se utiliza su mejor estimador p, quedando
mx
z
1
p.(1 p)
n
Por tal motivo, el intervalo de confianza para la proporcin poblacional
P resulta
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
Ejemplo
Para estimar la proporcin de familias que ven por TV un determinado
programa, se seleccion una muestra de 2200 familias que poseen uno o
ms televisores en una determinada ciudad, y de la muestra se obtuvo
que 871 familias ven ese programa. Estimar, utilizando un nivel de
confianza de 0,95, un intervalo para la proporcin de familias que ven
ese programa.
La informacin con la que contamos es la siguiente.
el tamao de la muestra seleccionada n =2200
la proporcin muestral de familias que ven el programa de TV
p =
871
2200
= 0, 396
Para una confianza del 95%, el valor z
0,975
de la tabla es 1,96.
Reemplazando se tiene que el intervalo para P es:
I
P
= p z
1
2
p.(1 p)
n
, p + z
1
2
p.(1 p)
n
I
P
0, 396 1, 96.
0, 396.0, 604
2200
, 0, 396 +1, 96.
0, 396.0, 604
2200
I
P
= [0,386; 0,406]
19
Con base en una muestra de 2200 familias con el 95% de confianza la
verdadera proporcin de familias que ven ese programa de TV est
comprendida entre el 38,6% y el 40,6%.
COMIENZO DE ACTIVIDAD
4.
Con base en la muestra de las 96 familias escogidas al azar de
cierta localidad (apartado 1.1.2. de la Unidad 1) con 1 =
0,95 estimar la proporcin de familias en toda la poblacin
cuyo gasto medio en alimentos supere los $46.
FIN DE ACTIVIDAD
Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error
mximo, que en su forma original y en su forma aproximada es:
mx
= z
1
P.(1P)
n
z
1
p.(1 p)
n
Al no conocer P porque es lo que se quiere estimar y al no conocer p
porque an no se tom la muestra (justamente necesitamos calcular de
qu tamao mnimo deber ser), se presenta un problema que debemos
sortear. Para hacerlo se parte de la suposicin terica de que P = 0,50 ,
lo que es lgico porque es el sustento terico de la curva de distribucin
de las proporciones muestrales; aunque luego como es esperable la
realidad difiera del modelo terico.
Reemplazando y despejando n se tiene:
mx
= z
1~
o
2
0, 50.0, 50
n
= z
1~
o
2
.
0, 50
n
=n =
z
1~o
.0, 50
mx
[
\
|
]
j
2
3.2.2. Pruebas de hiptesis
COMIENZO DE LEER ATENTO
Una prueba test o contraste de hiptesis consiste en un
procedimiento mediante el cual se somete a prueba un
parmetro (u otra caracterstica) poblacional desconocido sobre
el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de
hiptesis debe basarse en la evidencia muestral.
FIN DE LEER ATENTO
Cuando el objetivo de una prueba de hiptesis es testear el valor de un
parmetro (desconocido) a partir de un valor hipottico
o
de dicho
parmetro, surge una primera hiptesis estadstica denominada hiptesis
nula (H
o
) que presupone que no habra una diferencia significativa entre
y
o
y que se expresa
Al no conocer P porque es lo que se quiere estimar y al no conocer p porque
an no se tom la muestra (justamente necesitamos calcular de qu tamao
mnimo deber ser), se presenta un problema que debemos sortear. Para
hacerlo se parte de la suposicin terica de que P = 0,50, lo que es lgico por-
que es el sustento terico de la curva de distribucin de las proporciones
muestrales; aunque luego como es esperable la realidad difiera del mode-
lo terico.
Reemplazando y despejando n se tiene:
3.2.2. Pruebas de hiptesis
Una prueba test o contraste de hiptesis consiste en un procedimiento
mediante el cual se somete a prueba un parmetro (u otra caractersti-
ca) poblacional desconocido sobre el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de hiptesis
debe basarse en la evidencia muestral.
Cuando el objetivo de una prueba de hiptesis es testear el valor de un par-
metro (desconocido) a partir de un valor hipottico
o
de dicho parmetro,
surge una primera hiptesis estadstica denominada hiptesis nula (H
o
) que
presupone que no habra una diferencia significativa entre y
o
y que se
expresa
H
o
: =
o
Si la evidencia muestral contradijera la afirmacin de H
0
y existiera sospecha
de que la diferencia pudiera ser significativa, surge por oposicin una segun-
da hiptesis estadstica que llamamos hiptesis alternativa (H
A
) la cual sos-
tiene, en contraste con H
0
, que el valor del parmetro diferira significativa-
mente del hipottico
0
.
H
A
puede asumir alguna de las siguientes formas:
H
A
: <
0
H
A
: >
0
En una prueba de hiptesis (PPHH) la hiptesis nula H
0
es en rigor la que se
somete a prueba, y como resultante H
0
puede ser aceptada o rechazada. Si
H
0
resulta ser rechazada la conclusin final de la prueba se inclinara a favor
de H
A
.
Debido al ambiente de incertidumbre en el que se realiza una PPHH, dado
que se basa en la evidencia proporcionada por una muestra, en la decisin final
se pueden cometer dos tipos de errores: rechazar H
0
si en realidad fuere ver-
dadera y aceptar H
0
si en realidad fuere falsa. El primero de ellos se denomina
error de tipo I y tiene asociada una probabilidad , llamada nivel de significa-
cin de la prueba.
105
Estadistica
19
Con base en una muestra de 2200 familias con el 95% de confianza la
verdadera proporcin de familias que ven ese programa de TV est
comprendida entre el 38,6% y el 40,6%.
COMIENZO DE ACTIVIDAD
4.
Con base en la muestra de las 96 familias escogidas al azar de
cierta localidad (apartado 1.1.2. de la Unidad 1) con 1 =
0,95 estimar la proporcin de familias en toda la poblacin
cuyo gasto medio en alimentos supere los $46.
FIN DE ACTIVIDAD
Determinacin del tamao de una muestra
Como se hizo para la media, se despeja n de la frmula del error
mximo, que en su forma original y en su forma aproximada es:
mx
= z
1
P.(1P)
n
z
1
p.(1 p)
n
Al no conocer P porque es lo que se quiere estimar y al no conocer p
porque an no se tom la muestra (justamente necesitamos calcular de
qu tamao mnimo deber ser), se presenta un problema que debemos
sortear. Para hacerlo se parte de la suposicin terica de que P = 0,50 ,
lo que es lgico porque es el sustento terico de la curva de distribucin
de las proporciones muestrales; aunque luego como es esperable la
realidad difiera del modelo terico.
Reemplazando y despejando n se tiene:
mx
= z
1~
o
2
0, 50.0, 50
n
= z
1~
o
2
.
0, 50
n
=n =
z
1~o
.0, 50
mx
[
\
|
]
j
2
3.2.2. Pruebas de hiptesis
COMIENZO DE LEER ATENTO
Una prueba test o contraste de hiptesis consiste en un
procedimiento mediante el cual se somete a prueba un
parmetro (u otra caracterstica) poblacional desconocido sobre
el que se tiene alguna suposicin.
Como todo problema de inferencia estadstica la prueba de
hiptesis debe basarse en la evidencia muestral.
FIN DE LEER ATENTO
Cuando el objetivo de una prueba de hiptesis es testear el valor de un
parmetro (desconocido) a partir de un valor hipottico
o
de dicho
parmetro, surge una primera hiptesis estadstica denominada hiptesis
nula (H
o
) que presupone que no habra una diferencia significativa entre
y
o
y que se expresa
El valor hipottico de un
parmetro es una pre-
suncin o una suposicin que se
realiza sobre l, como por ejem-
plo una especificacin para el con-
trol de calidad, un valor histrico,
un valor de comparacin o un valor
que se elige arbitrariamente.
P(error de tipo I) = P(rechazar H
0
/ H
0
verdadera) = a
El segundo error (aceptar H
0
si en realidad fuere falsa) se llama error de tipo
II y su probabilidad asociada es .
P(error de tipo II) = P(aceptar H
0
/ H
0
falsa) =
En esta carpeta se trabajar slo con la probabilidad a de cometer un error de
tipo I.
Prueba de hiptesis para la media poblacional
La PPHH para la media presenta distintos casos, dependiendo de la infor-
macin poblacional con que se cuente, tal como ocurre en la estimacin por
intervalos de confianza.
Poblacin normal o aproximadamente normal y
2
conocido
Volviendo al ejemplo de controlar el proceso de llenado de paquetes de galle-
titas de medio kilo, abordado en estimacin de la media poblacional por inter-
valo de confianza, cabe preguntarnos si se podra imprimir en todos los paque-
tes el valor nominal de 500g. Para responder a la pregunta debemos realizar
un contraste de hiptesis donde, el parmetro desconocido (que genrica-
mente llambamos ) es el promedio del peso de todos los paquetes enva-
sados, cuyo valor hipottico
0
= 500g es el valor nominal que se quiere impri-
mir. Luego, la hiptesis nula ser H
0
: =
0
, es decir:
H
0
: = 500g
A partir de la evidencia de la muestra de los 16 paquetes donde el peso medio
result X= 504g, se puede plantear la siguiente hiptesis alternativa,
H
A
: > 500g
dado que la evidencia muestral arroj un peso medio (estadstico muestral)
superior al valor nominal (parmetro hipottico).
Entonces el juego de hiptesis para esta PPHH es:
H
0
: = 500g
H
A
: > 500g
Estableceremos ahora un criterio que permita discriminar cundo la diferen-
cia entre el estadstico muestral y el parmetro hipottico no es significativa
(y por extensin no sera significativa la diferencia entre y
0
por lo que se
acepta la H
0
) y cundo esa diferencia s es significativa (y en consecuencia se
rechaza H
0
a favor de H
A
).
Ese criterio est sustentado por el nivel de significacin de la prueba que
determina un valor denominado punto crtico, el cual establece dos regiones:
106
Universidad Virtual de Quilmes
Grfico 3.11.
En particular esta prueba se denomina unilateral derecha porque la zona de
rechazo se encuentra a la derecha del punto crtico.
El desarrollo de la prueba o la contrastacin de las hiptesis se realiza en
el dominio de la normal estndar, por lo que habr que estandarizar tanto
0
y el punto crtico.
Grfico 3.12.
El X estandarizado se denomina estadstico de prueba.
Para el problema que estamos desarrollando, fijaremos un nivel de significacin
o probabilidad de cometer error tipo I de = 0,05.
El punto crtico en Z y el estadstico de prueba resultan:
Grfico 3.13.
107
Estadistica
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico
O
X
1-
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
0
0
Z
Z
G.3.13
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
1,64
Z
1
0,05
3,2
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico
O
X
1-
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
0
0
Z
Z
G.3.13
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
1,64
Z
1
0,05
3,2
1-
Zona de Aceptacin de H
O
G.3.11
G.3.12
Zona de Rechazo de H
O
Pto.
crtico
O
X
1-
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
0
0
Z
Z
G.3.13
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
1,64
Z
1
0,05
3,2
Si el juego de hiptesis
fuera H
0
: = 500g y H
A
:
< 500g, la zona de rechazo del
grfico estara a la izquierda y la
prueba se denominara unilateral
izquierda.
En la eleccin de un nivel
de si gni fi caci n son
estndares los valores 0,10; 0,05
o 0,01, pero puede optarse por
cualquier otro valor intermedio
entre ellos.
Finalmente, comparando el estadstico de prueba calculado Z=3,2 con el punto
crtico Z
*
0,95
=1,64, observamos que aqul cae en la zona de rechazo de la H
0
por lo que, con base en la muestra de 16 paquetes y con un nivel de signifi-
cacin del 5%, rechazamos H
0
a favor de H
A
.
Conclusin estadstica, con base en la muestra de 16 paquetes y con una
probabilidad de cometer error de tipo I de 0,05; habra una diferencia signifi-
cativa entre la media de todos los paquetes envasados y el valor nominal de
500g. O tambin, el peso medio de todos los paquetes envasados podra ser
significativamente superior a 500g, en consecuencia, no estaramos en con-
diciones de imprimir 500g en los paquetes.
Comentario adicional
La conclusin estadstica a la que se arrib est indicando que habra un desa-
juste en el proceso de llenado de los paquetes por lo cual se debera inspec-
cionar el proceso de envasado. Realizar un ajuste, si fuere necesario, y desar-
mar los paquetes ya hechos para volver a llenarlos con la mquina corregida.
Como esta decisin implica costos adicionales en la fabricacin conviene, en
primer lugar, agrandar la muestra y luego, de acuerdo con los nuevos resulta-
dos del test, tomar la decisin.
5.
Un fraccionador de soda custica envasa paquetes utilizando una mqui-
na que tiene una precisin de =8 gramos. Sobre una partida lista para
su distribucin, compuesta de paquetes cuyo valor nominal es de 250g,
seleccion una muestra de 45 bolsas la cual arroj una media de 245
gramos con un desvo de 10 gramos. La evidencia muestral estara indi-
cando que la media de toda la partida no tendra una diferencia signi-
ficativa con el valor nominal impreso en los envases?
Poblacin normal o aproximadamente normal y
2
desconocido
Si en el proceso de llenado de paquetes de galletitas de medio kilo no se
conoce la precisin de la mquina, la prueba se realiza utilizando el desvo de
la muestra s= 6,802g. En este caso, se usa la t de Student y en consecuen-
cia las expresiones del punto crtico y del estadstico de prueba son respec-
tivamente:
Nuevamente el valor calculado del estadstico de prueba es mayor al punto cr-
tico y cae en la zona de rechazo de la H
0
, entonces se rechaza que = 500g
y se llega a la siguiente conclusin estadstica.
Con base en una muestra de 16 paquetes, desconociendo la precisin de
la mquina y con un nivel de significacin del 5%, el peso medio de todos los
108
Universidad Virtual de Quilmes
23
Comentario adicional
La conclusin estadstica a la que se arrib est indicando que habra un
desajuste en el proceso de llenado de los paquetes por lo cual se debera
inspeccionar el proceso de envasado. Realizar un ajuste, si fuere
necesario, y desarmar los paquetes ya hechos para volver a llenarlos con
la mquina corregida. Como esta decisin implica costos adicionales en
la fabricacin conviene, en primer lugar, agrandar la muestra y luego, de
acuerdo con los nuevos resultados del test, tomar la decisin.
COMIENZO DE ACTIVIDAD
5.
Un fraccionador de soda custica envasa paquetes utilizando una
mquina que tiene una precisin de =8 gramos. Sobre una partida lista
para su distribucin, compuesta de paquetes cuyo valor nominal es de
250g, seleccion una muestra de 45 bolsas la cual arroj una media de
245 gramos con un desvo de 10 gramos. La evidencia muestral estara
indicando que la media de toda la partida no tendra una diferencia
significativa con el valor nominal impreso en los envases?
FIN DE ACTIVIDAD
Poblacin normal o aproximadamente normal y
2
desconocido
Si en el proceso de llenado de paquetes de galletitas de medio kilo no se
conoce la precisin de la mquina, la prueba se realiza utilizando el
desvo de la muestra s= 6,802g. En este caso, se usa la t de Student y en
consecuencia las expresiones del punto crtico y del estadstico de
prueba son respectivamente:
t
n1,1
*
y
t =
x
0
S
n
Entonces
t
n1,1
*
= t
15;0,95
*
=1, 75 y
t =
x
0
S
n
=
504 500
6, 802
16
= 2, 35
Nuevamente el valor calculado del estadstico de prueba es mayor al
punto crtico y cae en la zona de rechazo de la H
0
, entonces se rechaza
que B = 500g y se llega a la siguiente conclusin estadstica.
Con base en una muestra de 16 paquetes, desconociendo la precisin
de la mquina y con un nivel de significacin del 5%, el peso medio de
todos los paquetes envasados podra ser significativamente superior a
500g, en consecuencia, no estaramos en condiciones de imprimir 500g
en los paquetes.
COMIENZO DE TEXTO APARTE
Pruebas de hi ptesis bilaterales o a dos col as
Estas pruebas se generan en ciertos problemas donde previamente a la
realizacin de la m uestra , es decir antes de contar con la evidencia
muestral, es necesario tener definida la regin de rechazo.
Son ejemplos de estas pruebas algunas rutinas de control de calidad, en
las que entra en consideracin que se estara en situacin crtica si
paquetes envasados podra ser significativamente superior a 500g, en con-
secuencia, no estaramos en condiciones de imprimir 500g en los paquetes.
Pruebas de hiptesis bilaterales o a dos colas
Estas pruebas se generan en ciertos problemas donde previamente a la realizacin de la mues-
tra, es decir antes de contar con la evidencia muestral, es necesario tener definida la regin
de rechazo.
Son ejemplos de estas pruebas algunas rutinas de control de calidad, en las que entra en con-
sideracin que se estara en situacin crtica si X cayera tanto a la derecha como a la izquierda
de
0
. En este caso la regin de rechazo est definida en dos tramos y hay dos puntos crticos.
Grfico 3.14.
Consecuentemente, el juego de hiptesis es:
H
0
: =
0
H
A
:
0
El desarrollo de la prueba de hiptesis es similar a la anterior, teniendo en cuenta que: si el
estadstico de prueba Z cayera en la zona de aceptacin, se acepta H
0;
si Z cayera dentro de
la regin crtica (zona de rechazo de H
0
) se rechaza H
0
y si estuviera muy prximo a Z* -
Z* es conveniente agrandar la muestra.
Grfico 3.15. Cuadro gua en inferencia estadstica para la media poblacional
109
Estadistica
0
Z
G.3.15
G.3.14
Zona de Aceptacin de H
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
Zona de Rechazo de H
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
0
Z
G.3.15
G.3.14
Zona de Aceptacin de H
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
Zona de Rechazo de H
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
Prueba de hiptesis para la proporcin poblacional
En la muestra de 2200 familias del ejemplo utilizado en intervalos de con-
fianza para la proporcin poblacional, las que ven un determinado programa
de TV representan el 39,6%.
Los productores del programa, para decidir los costos de los espacios
comerciales cuentan con un raiting histrico del 40%. La evidencia muestral
estara indicando una disminucin significativa de la posicin del programa
en el raiting?
Para responder a la pregunta se realizar una PPHH con un nivel de signifi-
cacin del 5%.
Entonces, el par de hiptesis para esta PPHH es:
H
0
: P = 0,40
H
A
: P < 0,40
Dado que el tamao de la muestra es grande, el estadstico proporcin mues-
tral tiene distribucin normal. El punto crtico y el estadstico de prueba son,
respectivamente. Resultando,
Grfico.3.16.
que el estadstico de prueba cae en la zona de aceptacin de la H
0
(ya que -
1,64 < -0,38).
Conclusin: con base en una muestra de 2200 familias y con un nivel de sig-
nificacin de 0,05, la proporcin de familias que ven ese programa de TV en
toda la poblacin no habra cambiado significativamente.
6.
Un mtodo de lectura veloz es efectivo en el 70% de los casos. Un nuevo
mtodo intenta mejorar la efectividad y para comprobarlo se toma una
muestra de 205 estudiantes de los cuales 155 mejoraron su lectura. Se puede
concluir que el nuevo mtodo es significativamente mejor que el anterior?
110
Universidad Virtual de Quilmes
25
y
Z
p P
0
P
0
.(1 P
0
)
n
0, 396 0, 40
0, 40.0, 60
2200
0, 38
0
Z
G.3.15
G.3.14
Zona de Aceptacin de H
O Zona de Rechazo de H
O
1,64
0,05
0,38
1-
/2 /2
Zona de Aceptacin de H
O
Zona de Rechazo de H
O
Zona de Rechazo de H
O
Z* Z* Z 0
G.3.14
Usar Z para estimar por
intervalo de confiannza o
para realizar un test de
hiptesis
La poblacin
tiene distribucin
normal?
conocido?
Estas situaciones no se tratan en este curso
conocido?
n>30?
Usar Z (en virtud del teorema central
del lmite) para estimar por intervalo
de confianza o para realizar un test de
hiptesis.
Usar t para estimar por intervalo de confianza
o para realizar un test de hiptesis.
SI SI
SI
NO
NO
NO
NO
SI
Procedimiento para realizar una prueba de hiptesis
Cualquiera sea el parmetro que se someta a una PPHH, el procedi-
miento involucra los siguientes pasos:
Formular las hiptesis a contrastar a partir de la comparacin de la
evidencia muestral o del planteo previo a la evidencia (prueba bila-
teral) con el valor hipottico del parmetro.
Elegir el nivel de significacin.
Designar el tipo de distribucin de probabilidades del estimador alre-
dedor del parmetro a probar.
Calcular el o los puntos crticos.
Estandarizar el estadstico muestral para producir el estadstico de
prueba.
Observar la zona en la que se ubica el estadstico de prueba respec-
to del o de los puntos crticos.
Decidir la aceptacin o el rechazo de la hiptesis nula, o si el esta-
dstico de prueba se encuentra en un entorno muy prximo al punto
crtico la realizacin de una nueva prueba seleccionando una mues-
tra ms grande.
Concluir en el marco del problema.
7.
Al aumentar el nivel de significacin en una PPHH, la probabilidad de
rechazar una hiptesis nula que en realidad fuera verdadera: aumenta,
disminuye o permanece inalterada?
111
Estadistica
113
Elementos bsicos de econometra
Ob je ti vos
Especificar algunos modelos de relacin entre variables econmicas.
Predecir el comportamiento de determinados agentes econmicos con base
en los modelos de relacin elaborados.
4.1. Introduccin
No hay error ms comn que el de suponer que, porque se hicieron prolonga-
dos y exactos clculos matemticos, la aplicacin del resultado a algn hecho de
la naturaleza conduce a la certeza absoluta.
A.A. Whitehead
(citado por M. J. Moreney en Hechos y Estadsticas)
Un fenmeno econmico cualquiera puede entenderse como el resultado de
la accin de mltiples variables que inciden sobre l en distinto grado y que
pueden utilizarse como variables potencialmente explicativas del comporta-
miento de dicho fenmeno.
En su forma general, el anlisis economtrico consiste en estudiar un mode-
lo que relacione la variable Y representativa del fenmeno econmico con las
posibles variables explicativas X
1
, X
2
,.....,X
k
. Tal modelo de relacin puede
representarse matemticamente como
Y = f (X
1
, X
2
,.....,X
k
)
Donde la funcin f puede asumir distintas expresiones matemticas a saber:
lineal, logartmica, exponencial, potencial, etctera.
Particularmente un modelo lineal de relacin expresa el comportamiento
medio de la variable Y en funcin del conjunto de variables explicativas X
i
y
tiene la siguiente expresin general,
=
Y = +
1
.X
1
+
2
.X
2
+...+
k
.X
k
en la cual ,
1
,...
k
son los parmetros del modelo.
El anlisis de la relacin funcional entre la variable a explicar y las varia-
bles explicativas se denomina anlisis de regresin.
4
El modelo se completa con el anlisis de correlacin que consiste en estu-
diar el grado o fuerza de la relacin existente entre ambas variables.
Los anlisis de regresin y correlacin lineales (apartado 4.2.) ms simples
corresponden al modelo lineal bivariado en el cual slo interviene una varia-
ble explicativa y cuya expresin matemtica es:
Y = + .X con parmetros y
y es el que desarrollaremos en esta carpeta.
En el caso particular en que la variable explicativa es el tiempo, el mode-
lo corresponde a las denominadas series cronolgicas o series de tiempo
(apartado 4.3).
4.2. Anlisis de regresin y de correlacin
El diagrama de puntos 4.1. es la representacin grfica conjunta de las varia-
bles salario quincenal actual y edad de la poblacin de todos los trabajadores
de la empresa cooperativa, de la cual se extrajo la muestra de 20 empleados
de la ME1 de la Unidad I. Sobre dicho grfico puede observarse tambin la
recta de regresin poblacional que resume el comportamiento medio de la
nube de puntos.
Grfico 4.1.
En este problema partimos de una supuesta poblacin conocida. Sin embar-
go, en la realidad de los trabajos estadsticos suelen desconocerse los datos
de la totalidad de la poblacin y se trabaja con los datos de una muestra repre-
sentativa extrada de aquella.
En el diagrama 4.2. se indentifican los datos que conforman la muestra
ME1 extrados aleatoriamente de la poblacin, que en lo sucesivo considera-
remos desconocida.
114
Universidad Virtual de Quilmes
G.4.2.
Salario quincenal actual y edad
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
G.4.1.
Salario quincenal actual y edad
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
Grfico 4.2.
A partir de los datos de la muestra se construye la recta de regresin mues-
tral y =a-b.x la cual ser el mejor estimador de la recta de regresin pobla-
cional Y = + .X desconocida.
Grfico 4.3.
Esta recta representa el comportamiento medio de los datos muestrales y es
la que hace mnimo el conjunto de los desvos entre los valores y de los datos
observados y los valores y de sus correspondientes proyecciones en la recta.
Observando el grfico 4.4. se pueden notar tales desvos d = y y, tambin
llamados residuos.
115
Estadistica
G.4.2.
Salario quincenal actual y edad
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
G.4.1.
Salario quincenal actual y edad
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
x . b a y + =
regresin poblacional X . Y + = desconocida.
G.4.4.
G.4.3.
Salario quincenal actual y edad muestra
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
Salario quincenal actual y edad muestra
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
a
Grfico 4.4.
En el marco del modelo lineal, un valor y obtenido mediante la ecuacin de
regresin representa una estimacin del comportamiento de la variable Y (sala-
rio quincenal actual) para un cierto x
i
(una determinada edad del trabajador).
La formalizacin matemtica del concepto de que el conjunto de los des-
vos es mnimo puede hacerse a travs de distintos criterios. Uno de ellos,
que visualiza mejor el problema, es el que considera que la sumatoria de los
valores absolutos de los desvos debe ser mnima y se expresa:
Otro es el criterio de cuadrados mnimos, el cual impone como condicin que
la suma de los cuadrados de los desvos debe ser mnima, es decir:
Ecuacin de la regresin lineal
A partir del criterio de los cuadrados mnimos se encuentran las expresio-
nes de a y b con los que se construye la ecuacin de regresin mues-
tral y = a-b.x que es la que mejor estima la ecuacin de regresin poblacional
Y =+.x , cuyos parmetros son y .
Los valores de a y b estn dados por
116
Universidad Virtual de Quilmes
x . b a y + =
regresin poblacional X . Y + = desconocida.
G.4.4.
G.4.3.
Salario quincenal actual y edad muestra
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
Salario quincenal actual y edad muestra
Edad
Q
u
i
n
c
e
n
a
a
c
t
u
a
l
1600
1400
1200
1000
800
600
400
200
0
18 22 26 30 34 38 42 46 50 54 58 62 66
y =208,8 + 15,89 x
a
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
El criterio de cuadrados
mnimos fue desarrolla-
do por K. F. Gauss en Theoria
motus corporum coelestium, 1809.
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y reempla-
zando y por su expresin y = a-b.x, resulta que
debe ser mnima por lo que sus primeras derivadas parciales respecto de a y de b
deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
cuya resolucin culmina con las expresiones
En la muestra de los 20 trabajadores, los estadsticos muestrales a y b son,
a = 208,8 y b = 15,89
y la ecuacin de la recta de regresin muestral resulta
La informacin til que puede extraerse de la expresin de la ecuacin obte-
nida es la relacionada con la pendiente b=+$15,89/ao. sta indica que en
la muestra por cada ao de diferencia en la edad de los trabajadores hay una
diferencia de $15,89 en el salario. Ms precisamente, teniendo en cuenta el
signo de la pendiente, cuando se incrementa en un ao la edad de los traba-
jadores, el salario quincenal actual aumenta $15,89.
Por otro lado, la recta de regresin nos permitir estimar el salario quincenal
actual de un trabajador de la poblacin que no estuviese en la muestra y cuya
edad fuera, por ejemplo, 48 aos.
117
Estadistica
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
Obtencin de las expresiones de a y b
A partir de la idea de que debe ser mnima y
reemplazando por su expresin , resulta que
debe ser mnima por lo que sus primeras
derivadas parciales respecto de a y de b deben ser cero, es decir,
llegando a determinarse el siguiente sistema de ecuaciones normales
Entonces, el salario quincenal actual estimado para un trabajador de 48 aos
ser aproximadamente de $971,52.
Coeficiente de correlacin lineal
Para estudiar el grado o fuerza de la relacin lineal que existe entre dos varia-
bles se utiliza como medida el denominado coeficiente de correlacin.
El coeficiente de correlacin poblacional se denomina y su mejor esti-
mador es el coeficiente de correlacin muestral r que se determina como,
donde S
XY
es la covarianza o varianza conjunta o variacin conjunta entre las
variables aleatorias X e Y, y S
X
y S
Y
son los desvos estndar de X e Y res-
pectivamente.
Cuando la covarianza entre X e Y es nula el coeficiente de correlacin es r = 0.
Cuando hay covariabilidad perfecta entre X e Y y ambas varan en el mismo
sentido, el coeficiente de correlacin es r = +1.
Cuando hay covariabilidad perfecta entre X e Y y ambas varan con sentido
contrario, la correlacin es r = -1.
En cualquier otra situacin, el coeficiente de correlacin puede ser
-1< r <0 0< r <+1.
Grfico 4.5.
Para calcular el coeficiente de correlacin del ejemplo del salario quincenal
actual y la edad de los trabajadores de la empresa cooperativa se puede uti-
lizar la siguiente expresin:
118
Universidad Virtual de Quilmes
Se debe al bimetra ingls
Karl Pearson y es apli-
cable a variables cuantitativas.
G.4.5.
Correlacin lineal directa, r entre 0 y+1 Correlacin lineal directa, r entre 0 y+1
X
X
Y
No hay correlacin, r muy prximo a 0
Y
X
Y
G.4.5.
Correlacin lineal directa, r entre 0 y+1 Correlacin lineal directa, r entre 0 y+1
X
X
Y
No hay correlacin, r muy prximo a 0
Y
X
Y
resultando r = +0,557. Esto estara indicando que ambas variables tienen un
mediano grado de correlacin directa.
Coeficiente de determinacin
Complementariamente a los coeficientes de regresin y de correlacin, se pre-
senta una medida denominada coeficiente de determinacin r
2
que indica
cunto del comportamiento de Y es explicado o puede entenderse por el mode-
lo de regresin.
Su expresin de clculo es:
El coeficiente de determinacin toma valores entre 0 y 1, y se interpreta como
porcentaje.
En el ejemplo que estamos desarrollando, se tiene un r
2
= 0,31. Este resul-
tado indica que en la muestra, el 31% de la variacin de los salarios quince-
nales actuales quedan explicados por las variaciones de las edades de los
trabajadores de la empresa cooperativa.
El anlisis de regresin lineal permite hallar la recta que mejor se ajusta
a los datos muestrales.
La pendiente de la recta b, llamada tambin coeficiente de regresin,
suministra informacin sobre la variacin de y por cada cambio uni-
tario de x y su signo indica el sentido de la relacin.
La estimacin del comportamiento en la poblacin de la variable
explicada Y queda circunscripta a valores de la variable explicativa X
que no estn muy alejados de su rango.
El coeficiente de correlacin r y el coeficiente de regresin b comparten la
misma informacin respecto de si la relacin entre las variables es direc-
ta o inversa (consecuentemente los numeradores de sus respectivas expre-
siones son iguales).
Si la relacin entre las variables es directa, la recta ser creciente, la
pendiente positiva y el coeficiente de regresin tambin positivo
variar entre 0 y +1.
Si la relacin entre las variables es inversa, la recta ser decreciente,
la pendiente negativa y el coeficiente de regresin tambin negativo
variar entre -1 y 0.
El coeficiente de determinacin r
2
es el cuadrado del coeficiente de corre-
lacin r y se interpreta en una escala del 0 al 100.
119
Estadistica
Los coeficientes de regresin, de correlacin y el de determinacin dados son las
herramientas necesarias para estudiar la relacin lineal entre dos variables.
1.
Efectuar un anlisis de regresin y correlacin para las variables:
a. Longitud y peso de la ME4 correspondiente a una muestra de 20
piezas de plstico especiales fabricadas por una determinada empre-
sa.
b. Antigedad y cantidad de empleados de las pymes de la Repblica
Argentina ao 2004/2005.
4.3. Series de tiempo
En el anlisis estadstico de un fenmeno econmico, social, etc. en el que
cada valor de la variable en estudio est vinculado a un momento de tiempo,
el enfoque es el de una serie cronolgica o serie de tiempo.
En una serie de tiempo, la variable estadstica a estudiar es dependiente
de la variable matemtica tiempo, es decir que sus valores varan en el trans-
curso del tiempo.
Son objeto de estudio economtrico, en el marco de una serie cronolgica, la
evolucin en el tiempo del salario de los trabajadores de un determinado rubro,
de las ventas de los negocios de un centro comercial, de la tasa de desem-
pleo en una regin, etctera.
Modelo matemtico de una serie de tiempo
Al estudiar una variable estadstica a travs del tiempo, cada uno de los valo-
res que ella asume es la resultante de los efectos producidos por distintas cau-
sas y esos efectos intervienen en el modelo como componentes del mismo.
Las componentes del modelo son: la tendencia (T) general, las distintas
variaciones cclicas (C) alrededor de la tendencia y el ruido (R) estadstico.
El modelo matemtico genrico usualmente aceptado para las series eco-
nmicas es,
X = T . C . R
Las componentes cclicas pueden presentarse como peridicas (Cp) y como
no peridicas (Cnp), entonces el modelo matemtico finalmente resulta,
X = T . Cp. Cnp . R
120
Universidad Virtual de Quilmes
En las series de tiempo
econmicas, una com-
ponente cclica peridica impor-
tante es la llamada variacin esta-
cional (E), para la cual el ciclo dura
un ao.
donde Cp y Cnp representan, en rigor, familias de componentes con distintas
longitudes de tiempo.
De las componentes sealadas, la nica que aqu veremos ser la ten-
dencia T, que se expresa como una ecuacin lineal obtenida a partir del mto-
do de los cuadrados mnimos.
Ejemplo
La siguiente informacin se extrajo del Anuario Estadstico de la Repblica
Argentina 2000, seccin Economa, del diario Clarn y fue elaborada con base
en datos del INDEC.
Grfico 4.6.
A partir de la tabla se puede analizar por separado la evolucin en el tiempo
de las variables Exportaciones e Importaciones. En el grfico que acompaa
la tabla, los puntos que representan los datos colectados a lo largo del tiem-
po se unen para expresar la cronologa.
Procesaremos la variable Exportaciones analizando su evolucin a lo largo
del tiempo, destacando que dicha variable es la nica variable estadstica en
juego ya que el tiempo es una variable matemtica.
Si bien este es un caso de estadstica univariada, se puede utilizar per-
fectamente el recurso de ajustar por cuadrados mnimos ya empleado ante-
riormente para determinar la recta de la regresin lineal. En una serie de tiem-
po, la recta de ajuste ser la tendencia.
Para calcular la recta que describa la tendencia T de las exportaciones,
codificaremos la variable independiente tiempo considerando: t = 1 para 1984,
t = 2 para 1985 y as sucesivamente.
121
Estadistica
G.4.6.
Millones de u$s
Ao Exportaciones
1 8.107
2 8.396
3 6.852
4 6.360
5 9.135
6 9.579
7 12.353
8 11.978
9 12.235
10 13.118
11 15.839
12 20.963
13 23.811
14 26.431
15 26.441
16 23.333
Exportaciones
Balanza comercial argentina en U$S
Importaciones
35
30
25
20
15
10
5
0
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
8.107
8.396
6.852
6.360
9.135
9.579
12.353
11.978
12.235
13.118
15.839
20.963
23.811
26.432
26.441
23.333
Exporta-
ciones
4.585
3.814
4.724
5.818
5.322
4.203
4.077
8.275
14.672
16.784
21.590
20.122
23.762
30.450
31.404
25.508
Importa-
ciones
Ao
Entonces
T = 2782,55 + 1400,075. t
La pendiente b=1400,075 de la tendencia indica que por cada ao transcu-
rrido (en el perodo tomado), las exportaciones aumentaron en promedio 1400,
075 millones de dlares por ao.
Usando la recta de tendencia calculada se pueden pronosticar las expor-
taciones para:
a) El ao 2000.
2782,55 + 1400,075 . 17 = 26.583,825 (17 es el cdigo para el ao 2000).
Se estima que en el ao 2000 las exportaciones fueron del orden de los
26.583,825 millones de dlares.
b) El ao 1982.
2782,55 + 1400,075 . (-1) = 1.382,475 (-1 es el cdigo para el ao 1982).
Se estima que en el ao 1982 las exportaciones fueron del orden de los
1.382,475 millones de dlares.
c) El ao 2020.
2782,55 + 1400,075 . 37 = 54.585,325 (37 es el cdigo para el ao 2020).
El ao para el que se quiere pronosticar est muy alejado del rango
observado; no es conveniente usar el valor calculado como pronstico
o estimacin.
d) El ao 2007.
2782,55 + 1400,075 . 24 = 36.384,350 (24 es el cdigo para el ao 2007).
Se estima que en el ao 2000 las exportaciones fueron del orden de los
36.384,350 millones de dlares.
2.
Realizar las siguientes actividades:
Para la variable Importaciones: calcular la recta de tendencia, interpre-
tar su pendiente y realizar pronsticos.
122
Universidad Virtual de Quilmes
G.4.6.
Millones de u$s
Ao Exportaciones
1 8.107
2 8.396
3 6.852
4 6.360
5 9.135
6 9.579
7 12.353
8 11.978
9 12.235
10 13.118
11 15.839
12 20.963
13 23.811
14 26.431
15 26.441
16 23.333
Exportaciones
Balanza comercial argentina en U$S
Importaciones
35
30
25
20
15
10
5
0
84 85 86 87 88 89 90 91 92 93 94 95 96 97 98 99
1984
1985
1986
1987
1988
1989
1990
1991
1992
1993
1994
1995
1996
1997
1998
1999
8.107
8.396
6.852
6.360
9.135
9.579
12.353
11.978
12.235
13.118
15.839
20.963
23.811
26.432
26.441
23.333
Exporta-
ciones
4.585
3.814
4.724
5.818
5.322
4.203
4.077
8.275
14.672
16.784
21.590
20.122
23.762
30.450
31.404
25.508
Importa-
ciones
Ao
Una prediccin realiza-
da en el marco de una
serie cronolgica se denomina
pronstico y se realiza en cual-
quier sentido, hacia atrs o hacia
adelante, en el tiempo.
A partir de la informacin de la siguiente tabla, calcular la recta de ten-
dencia, interpretar su pendiente y realizar pronsticos.
Fuente: INDEC, Encuesta Permanente de Hogares.
123
Estadistica
11
1980 2,6
1985 6,1
1986 5,6
1987 5,9
1988 6,3
1989 7,8
1990 7,4
1993 9,6
1994 10,8*
Fuente: INDEC, Encuesta Permanente de Hogares.
Ao Tasa de desempleo
CHOU, Ya-Lun (1992), Anlisis estadstico, McGraw-Hill, Mxico.
MAYER, P. (1986), Probabilidad y aplicaciones estadsticas, Addison Wesley,
Mxico.
MORONEY, M. J. (1965), Hechos y estdsticas, EUDEBA, Buenos Aires.
SPIEGEL, M.R. (2002), Estadstica, McGraw-Hill, Mxico.
TORANZOS, I. F. (1997), Teora Estadstica y Aplicaciones, Macchi, Buenos
Aires.
TUKEY, J. W. (1977), Exploratory Data Analysis, Addison Wesley, U.S.A.
125
Referencias Bibliogrficas
127
Anexo
Anexo
Tabla 1: Percentiles de la distribucin normal estndar
z p z p z p z p z p z p z p z p
-4,00 0,00003 -3,50 0,00023 -3,00 0,00135 -2,50 0,00621 -2,00 0,02275 -1,50 0,06681 -1,00 0,15866 -0,50 0,30854
-3,99 0,00003 -3,49 0,00024 -2,99 0,00139 -2,49 0,00639 -1,99 0,02330 -1,49 0,06811 -0,99 0,16109 -0,49 0,31207
-3,98 0,00003 -3,48 0,00025 -2,98 0,00144 -2,48 0,00657 -1,98 0,02385 -1,48 0,06944 -0,98 0,16354 -0,48 0,31561
-3,97 0,00004 -3,47 0,00026 -2,97 0,00149 -2,47 0,00676 -1,97 0,02442 -1,47 0,07078 -0,97 0,16602 -0,47 0,31918
-3,96 0,00004 -3,46 0,00027 -2,96 0,00154 -2,46 0,00695 -1,96 0,02500 -1,46 0,07215 -0,96 0,16853 -0,46 0,32276
-3,95 0,00004 -3,45 0,00028 -2,95 0,00159 -2,45 0,00714 -1,95 0,02559 -1,45 0,07353 -0,95 0,17106 -0,45 0,32636
-3,94 0,00004 -3,44 0,00029 -2,94 0,00164 -2,44 0,00734 -1,94 0,02619 -1,44 0,07493 -0,94 0,17361 -0,44 0,32997
-3,93 0,00004 -3,43 0,00030 -2,93 0,00169 -2,43 0,00755 -1,93 0,02680 -1,43 0,07636 -0,93 0,17619 -0,43 0,33360
-3,92 0,00004 -3,42 0,00031 -2,92 0,00175 -2,42 0,00776 -1,92 0,02743 -1,42 0,07780 -0,92 0,17879 -0,42 0,33724
-3,91 0,00005 -3,41 0,00032 -2,91 0,00181 -2,41 0,00798 -1,91 0,02807 -1,41 0,07927 -0,91 0,18141 -0,41 0,34090
-3,90 0,00005 -3,40 0,00034 -2,90 0,00187 -2,40 0,00820 -1,90 0,02872 -1,40 0,08076 -0,90 0,18406 -0,40 0,34458
-3,89 0,00005 -3,39 0,00035 -2,89 0,00193 -2,39 0,00842 -1,89 0,02938 -1,39 0,08226 -0,89 0,18673 -0,39 0,34827
-3,88 0,00005 -3,38 0,00036 -2,88 0,00199 -2,38 0,00866 -1,88 0,03005 -1,38 0,08379 -0,88 0,18943 -0,38 0,35197
-3,87 0,00005 -3,37 0,00038 -2,87 0,00205 -2,37 0,00889 -1,87 0,03074 -1,37 0,08534 -0,87 0,19215 -0,37 0,35569
-3,86 0,00006 -3,36 0,00039 -2,86 0,00212 -2,36 0,00914 -1,86 0,03144 -1,36 0,08692 -0,86 0,19489 -0,36 0,35942
-3,85 0,00006 -3,35 0,00040 -2,85 0,00219 -2,35 0,00939 -1,85 0,03216 -1,35 0,08851 -0,85 0,19766 -0,35 0,36317
-3,84 0,00006 -3,34 0,00042 -2,84 0,00226 -2,34 0,00964 -1,84 0,03288 -1,34 0,09012 -0,84 0,20045 -0,34 0,36693
-3,83 0,00006 -3,33 0,00043 -2,83 0,00233 -2,33 0,00990 -1,83 0,03362 -1,33 0,09176 -0,83 0,20327 -0,33 0,37070
-3,82 0,00007 -3,32 0,00045 -2,82 0,00240 -2,32 0,01017 -1,82 0,03438 -1,32 0,09342 -0,82 0,20611 -0,32 0,37448
-3,81 0,00007 -3,31 0,00047 -2,81 0,00248 -2,31 0,01044 -1,81 0,03515 -1,31 0,09510 -0,81 0,20897 -0,31 0,37828
-3,80 0,00007 -3,30 0,00048 -2,80 0,00256 -2,30 0,01072 -1,80 0,03593 -1,30 0,09680 -0,80 0,21186 -0,30 0,38209
-3,79 0,00008 -3,29 0,00050 -2,79 0,00264 -2,29 0,01101 -1,79 0,03673 -1,29 0,09853 -0,79 0,21476 -0,29 0,38591
-3,78 0,00008 -3,28 0,00052 -2,78 0,00272 -2,28 0,01130 -1,78 0,03754 -1,28 0,10027 -0,78 0,21770 -0,28 0,38974
-3,77 0,00008 -3,27 0,00054 -2,77 0,00280 -2,27 0,01160 -1,77 0,03836 -1,27 0,10204 -0,77 0,22065 -0,27 0,39358
-3,76 0,00008 -3,26 0,00056 -2,76 0,00289 -2,26 0,01191 -1,76 0,03920 -1,26 0,10383 -0,76 0,22363 -0,26 0,39743
-3,75 0,00009 -3,25 0,00058 -2,75 0,00298 -2,25 0,01222 -1,75 0,04006 -1,25 0,10565 -0,75 0,22663 -0,25 0,40129
-3,74 0,00009 -3,24 0,00060 -2,74 0,00307 -2,24 0,01255 -1,74 0,04093 -1,24 0,10749 -0,74 0,22965 -0,24 0,40517
-3,73 0,00010 -3,23 0,00062 -2,73 0,00317 -2,23 0,01287 -1,73 0,04182 -1,23 0,10935 -0,73 0,23270 -0,23 0,40905
-3,72 0,00010 -3,22 0,00064 -2,72 0,00326 -2,22 0,01321 -1,72 0,04272 -1,22 0,11123 -0,72 0,23576 -0,22 0,41294
-3,71 0,00010 -3,21 0,00066 -2,71 0,00336 -2,21 0,01355 -1,71 0,04363 -1,21 0,11314 -0,71 0,23885 -0,21 0,41683
-3,70 0,00011 -3,20 0,00069 -2,70 0,00347 -2,20 0,01390 -1,70 0,04457 -1,20 0,11507 -0,70 0,24196 -0,20 0,42074
-3,69 0,00011 -3,19 0,00071 -2,69 0,00357 -2,19 0,01426 -1,69 0,04551 -1,19 0,11702 -0,69 0,24510 -0,19 0,42465
-3,68 0,00012 -3,18 0,00074 -2,68 0,00368 -2,18 0,01463 -1,68 0,04648 -1,18 0,11900 -0,68 0,24825 -0,18 0,42858
-3,67 0,00012 -3,17 0,00076 -2,67 0,00379 -2,17 0,01500 -1,67 0,04746 -1,17 0,12100 -0,67 0,25143 -0,17 0,43251
-3,66 0,00013 -3,16 0,00079 -2,66 0,00391 -2,16 0,01539 -1,66 0,04846 -1,16 0,12302 -0,66 0,25463 -0,16 0,43644
-3,65 0,00013 -3,15 0,00082 -2,65 0,00402 -2,15 0,01578 -1,65 0,04947 -1,15 0,12507 -0,65 0,25785 -0,15 0,44038
-3,64 0,00014 -3,14 0,00084 -2,64 0,00415 -2,14 0,01618 -1,64 0,05050 -1,14 0,12714 -0,64 0,26109 -0,14 0,44433
-3,63 0,00014 -3,13 0,00087 -2,63 0,00427 -2,13 0,01659 -1,63 0,05155 -1,13 0,12924 -0,63 0,26435 -0,13 0,44828
-3,62 0,00015 -3,12 0,00090 -2,62 0,00440 -2,12 0,01700 -1,62 0,05262 -1,12 0,13136 -0,62 0,26763 -0,12 0,45224
-3,61 0,00015 -3,11 0,00094 -2,61 0,00453 -2,11 0,01743 -1,61 0,05370 -1,11 0,13350 -0,61 0,27093 -0,11 0,45620
-3,60 0,00016 -3,10 0,00097 -2,60 0,00466 -2,10 0,01786 -1,60 0,05480 -1,10 0,13567 -0,60 0,27425 -0,10 0,46017
-3,59 0,00017 -3,09 0,00100 -2,59 0,00480 -2,09 0,01831 -1,59 0,05592 -1,09 0,13786 -0,59 0,27760 -0,09 0,46414
-3,58 0,00017 -3,08 0,00104 -2,58 0,00494 -2,08 0,01876 -1,58 0,05705 -1,08 0,14007 -0,58 0,28096 -0,08 0,46812
-3,57 0,00018 -3,07 0,00107 -2,57 0,00508 -2,07 0,01923 -1,57 0,05821 -1,07 0,14231 -0,57 0,28434 -0,07 0,47210
-3,56 0,00019 -3,06 0,00111 -2,56 0,00523 -2,06 0,01970 -1,56 0,05938 -1,06 0,14457 -0,56 0,28774 -0,06 0,47608
-3,55 0,00019 -3,05 0,00114 -2,55 0,00539 -2,05 0,02018 -1,55 0,06057 -1,05 0,14686 -0,55 0,29116 -0,05 0,48006
-3,54 0,00020 -3,04 0,00118 -2,54 0,00554 -2,04 0,02068 -1,54 0,06178 -1,04 0,14917 -0,54 0,29460 -0,04 0,48405
-3,53 0,00021 -3,03 0,00122 -2,53 0,00570 -2,03 0,02118 -1,53 0,06301 -1,03 0,15151 -0,53 0,29806 -0,03 0,48803
-3,52 0,00022 -3,02 0,00126 -2,52 0,00587 -2,02 0,02169 -1,52 0,06426 -1,02 0,15386 -0,52 0,30153 -0,02 0,49202
-3,51 0,00022 -3,01 0,00131 -2,51 0,00604 -2,01 0,02222 -1,51 0,06552 -1,01 0,15625 -0,51 0,30503 -0,01 0,49601
Z
P
Anexo
Tabla 1: Percentiles de la distribucin normal estndar
z p z p z p z p z p z p z p z p
-4,00 0,00003 -3,50 0,00023 -3,00 0,00135 -2,50 0,00621 -2,00 0,02275 -1,50 0,06681 -1,00 0,15866 -0,50 0,30854
-3,99 0,00003 -3,49 0,00024 -2,99 0,00139 -2,49 0,00639 -1,99 0,02330 -1,49 0,06811 -0,99 0,16109 -0,49 0,31207
-3,98 0,00003 -3,48 0,00025 -2,98 0,00144 -2,48 0,00657 -1,98 0,02385 -1,48 0,06944 -0,98 0,16354 -0,48 0,31561
-3,97 0,00004 -3,47 0,00026 -2,97 0,00149 -2,47 0,00676 -1,97 0,02442 -1,47 0,07078 -0,97 0,16602 -0,47 0,31918
-3,96 0,00004 -3,46 0,00027 -2,96 0,00154 -2,46 0,00695 -1,96 0,02500 -1,46 0,07215 -0,96 0,16853 -0,46 0,32276
-3,95 0,00004 -3,45 0,00028 -2,95 0,00159 -2,45 0,00714 -1,95 0,02559 -1,45 0,07353 -0,95 0,17106 -0,45 0,32636
-3,94 0,00004 -3,44 0,00029 -2,94 0,00164 -2,44 0,00734 -1,94 0,02619 -1,44 0,07493 -0,94 0,17361 -0,44 0,32997
-3,93 0,00004 -3,43 0,00030 -2,93 0,00169 -2,43 0,00755 -1,93 0,02680 -1,43 0,07636 -0,93 0,17619 -0,43 0,33360
-3,92 0,00004 -3,42 0,00031 -2,92 0,00175 -2,42 0,00776 -1,92 0,02743 -1,42 0,07780 -0,92 0,17879 -0,42 0,33724
-3,91 0,00005 -3,41 0,00032 -2,91 0,00181 -2,41 0,00798 -1,91 0,02807 -1,41 0,07927 -0,91 0,18141 -0,41 0,34090
-3,90 0,00005 -3,40 0,00034 -2,90 0,00187 -2,40 0,00820 -1,90 0,02872 -1,40 0,08076 -0,90 0,18406 -0,40 0,34458
-3,89 0,00005 -3,39 0,00035 -2,89 0,00193 -2,39 0,00842 -1,89 0,02938 -1,39 0,08226 -0,89 0,18673 -0,39 0,34827
-3,88 0,00005 -3,38 0,00036 -2,88 0,00199 -2,38 0,00866 -1,88 0,03005 -1,38 0,08379 -0,88 0,18943 -0,38 0,35197
-3,87 0,00005 -3,37 0,00038 -2,87 0,00205 -2,37 0,00889 -1,87 0,03074 -1,37 0,08534 -0,87 0,19215 -0,37 0,35569
-3,86 0,00006 -3,36 0,00039 -2,86 0,00212 -2,36 0,00914 -1,86 0,03144 -1,36 0,08692 -0,86 0,19489 -0,36 0,35942
-3,85 0,00006 -3,35 0,00040 -2,85 0,00219 -2,35 0,00939 -1,85 0,03216 -1,35 0,08851 -0,85 0,19766 -0,35 0,36317
-3,84 0,00006 -3,34 0,00042 -2,84 0,00226 -2,34 0,00964 -1,84 0,03288 -1,34 0,09012 -0,84 0,20045 -0,34 0,36693
-3,83 0,00006 -3,33 0,00043 -2,83 0,00233 -2,33 0,00990 -1,83 0,03362 -1,33 0,09176 -0,83 0,20327 -0,33 0,37070
-3,82 0,00007 -3,32 0,00045 -2,82 0,00240 -2,32 0,01017 -1,82 0,03438 -1,32 0,09342 -0,82 0,20611 -0,32 0,37448
-3,81 0,00007 -3,31 0,00047 -2,81 0,00248 -2,31 0,01044 -1,81 0,03515 -1,31 0,09510 -0,81 0,20897 -0,31 0,37828
-3,80 0,00007 -3,30 0,00048 -2,80 0,00256 -2,30 0,01072 -1,80 0,03593 -1,30 0,09680 -0,80 0,21186 -0,30 0,38209
-3,79 0,00008 -3,29 0,00050 -2,79 0,00264 -2,29 0,01101 -1,79 0,03673 -1,29 0,09853 -0,79 0,21476 -0,29 0,38591
-3,78 0,00008 -3,28 0,00052 -2,78 0,00272 -2,28 0,01130 -1,78 0,03754 -1,28 0,10027 -0,78 0,21770 -0,28 0,38974
-3,77 0,00008 -3,27 0,00054 -2,77 0,00280 -2,27 0,01160 -1,77 0,03836 -1,27 0,10204 -0,77 0,22065 -0,27 0,39358
-3,76 0,00008 -3,26 0,00056 -2,76 0,00289 -2,26 0,01191 -1,76 0,03920 -1,26 0,10383 -0,76 0,22363 -0,26 0,39743
-3,75 0,00009 -3,25 0,00058 -2,75 0,00298 -2,25 0,01222 -1,75 0,04006 -1,25 0,10565 -0,75 0,22663 -0,25 0,40129
-3,74 0,00009 -3,24 0,00060 -2,74 0,00307 -2,24 0,01255 -1,74 0,04093 -1,24 0,10749 -0,74 0,22965 -0,24 0,40517
-3,73 0,00010 -3,23 0,00062 -2,73 0,00317 -2,23 0,01287 -1,73 0,04182 -1,23 0,10935 -0,73 0,23270 -0,23 0,40905
-3,72 0,00010 -3,22 0,00064 -2,72 0,00326 -2,22 0,01321 -1,72 0,04272 -1,22 0,11123 -0,72 0,23576 -0,22 0,41294
-3,71 0,00010 -3,21 0,00066 -2,71 0,00336 -2,21 0,01355 -1,71 0,04363 -1,21 0,11314 -0,71 0,23885 -0,21 0,41683
-3,70 0,00011 -3,20 0,00069 -2,70 0,00347 -2,20 0,01390 -1,70 0,04457 -1,20 0,11507 -0,70 0,24196 -0,20 0,42074
-3,69 0,00011 -3,19 0,00071 -2,69 0,00357 -2,19 0,01426 -1,69 0,04551 -1,19 0,11702 -0,69 0,24510 -0,19 0,42465
-3,68 0,00012 -3,18 0,00074 -2,68 0,00368 -2,18 0,01463 -1,68 0,04648 -1,18 0,11900 -0,68 0,24825 -0,18 0,42858
-3,67 0,00012 -3,17 0,00076 -2,67 0,00379 -2,17 0,01500 -1,67 0,04746 -1,17 0,12100 -0,67 0,25143 -0,17 0,43251
-3,66 0,00013 -3,16 0,00079 -2,66 0,00391 -2,16 0,01539 -1,66 0,04846 -1,16 0,12302 -0,66 0,25463 -0,16 0,43644
-3,65 0,00013 -3,15 0,00082 -2,65 0,00402 -2,15 0,01578 -1,65 0,04947 -1,15 0,12507 -0,65 0,25785 -0,15 0,44038
-3,64 0,00014 -3,14 0,00084 -2,64 0,00415 -2,14 0,01618 -1,64 0,05050 -1,14 0,12714 -0,64 0,26109 -0,14 0,44433
-3,63 0,00014 -3,13 0,00087 -2,63 0,00427 -2,13 0,01659 -1,63 0,05155 -1,13 0,12924 -0,63 0,26435 -0,13 0,44828
-3,62 0,00015 -3,12 0,00090 -2,62 0,00440 -2,12 0,01700 -1,62 0,05262 -1,12 0,13136 -0,62 0,26763 -0,12 0,45224
-3,61 0,00015 -3,11 0,00094 -2,61 0,00453 -2,11 0,01743 -1,61 0,05370 -1,11 0,13350 -0,61 0,27093 -0,11 0,45620
-3,60 0,00016 -3,10 0,00097 -2,60 0,00466 -2,10 0,01786 -1,60 0,05480 -1,10 0,13567 -0,60 0,27425 -0,10 0,46017
-3,59 0,00017 -3,09 0,00100 -2,59 0,00480 -2,09 0,01831 -1,59 0,05592 -1,09 0,13786 -0,59 0,27760 -0,09 0,46414
-3,58 0,00017 -3,08 0,00104 -2,58 0,00494 -2,08 0,01876 -1,58 0,05705 -1,08 0,14007 -0,58 0,28096 -0,08 0,46812
-3,57 0,00018 -3,07 0,00107 -2,57 0,00508 -2,07 0,01923 -1,57 0,05821 -1,07 0,14231 -0,57 0,28434 -0,07 0,47210
-3,56 0,00019 -3,06 0,00111 -2,56 0,00523 -2,06 0,01970 -1,56 0,05938 -1,06 0,14457 -0,56 0,28774 -0,06 0,47608
-3,55 0,00019 -3,05 0,00114 -2,55 0,00539 -2,05 0,02018 -1,55 0,06057 -1,05 0,14686 -0,55 0,29116 -0,05 0,48006
-3,54 0,00020 -3,04 0,00118 -2,54 0,00554 -2,04 0,02068 -1,54 0,06178 -1,04 0,14917 -0,54 0,29460 -0,04 0,48405
-3,53 0,00021 -3,03 0,00122 -2,53 0,00570 -2,03 0,02118 -1,53 0,06301 -1,03 0,15151 -0,53 0,29806 -0,03 0,48803
-3,52 0,00022 -3,02 0,00126 -2,52 0,00587 -2,02 0,02169 -1,52 0,06426 -1,02 0,15386 -0,52 0,30153 -0,02 0,49202
-3,51 0,00022 -3,01 0,00131 -2,51 0,00604 -2,01 0,02222 -1,51 0,06552 -1,01 0,15625 -0,51 0,30503 -0,01 0,49601
Z
P
Anexo
Tabla 1: Percentiles de la distribucin normal estndar
z p z p z p z p z p z p z p z p
-4,00 0,00003 -3,50 0,00023 -3,00 0,00135 -2,50 0,00621 -2,00 0,02275 -1,50 0,06681 -1,00 0,15866 -0,50 0,30854
-3,99 0,00003 -3,49 0,00024 -2,99 0,00139 -2,49 0,00639 -1,99 0,02330 -1,49 0,06811 -0,99 0,16109 -0,49 0,31207
-3,98 0,00003 -3,48 0,00025 -2,98 0,00144 -2,48 0,00657 -1,98 0,02385 -1,48 0,06944 -0,98 0,16354 -0,48 0,31561
-3,97 0,00004 -3,47 0,00026 -2,97 0,00149 -2,47 0,00676 -1,97 0,02442 -1,47 0,07078 -0,97 0,16602 -0,47 0,31918
-3,96 0,00004 -3,46 0,00027 -2,96 0,00154 -2,46 0,00695 -1,96 0,02500 -1,46 0,07215 -0,96 0,16853 -0,46 0,32276
-3,95 0,00004 -3,45 0,00028 -2,95 0,00159 -2,45 0,00714 -1,95 0,02559 -1,45 0,07353 -0,95 0,17106 -0,45 0,32636
-3,94 0,00004 -3,44 0,00029 -2,94 0,00164 -2,44 0,00734 -1,94 0,02619 -1,44 0,07493 -0,94 0,17361 -0,44 0,32997
-3,93 0,00004 -3,43 0,00030 -2,93 0,00169 -2,43 0,00755 -1,93 0,02680 -1,43 0,07636 -0,93 0,17619 -0,43 0,33360
-3,92 0,00004 -3,42 0,00031 -2,92 0,00175 -2,42 0,00776 -1,92 0,02743 -1,42 0,07780 -0,92 0,17879 -0,42 0,33724
-3,91 0,00005 -3,41 0,00032 -2,91 0,00181 -2,41 0,00798 -1,91 0,02807 -1,41 0,07927 -0,91 0,18141 -0,41 0,34090
-3,90 0,00005 -3,40 0,00034 -2,90 0,00187 -2,40 0,00820 -1,90 0,02872 -1,40 0,08076 -0,90 0,18406 -0,40 0,34458
-3,89 0,00005 -3,39 0,00035 -2,89 0,00193 -2,39 0,00842 -1,89 0,02938 -1,39 0,08226 -0,89 0,18673 -0,39 0,34827
-3,88 0,00005 -3,38 0,00036 -2,88 0,00199 -2,38 0,00866 -1,88 0,03005 -1,38 0,08379 -0,88 0,18943 -0,38 0,35197
-3,87 0,00005 -3,37 0,00038 -2,87 0,00205 -2,37 0,00889 -1,87 0,03074 -1,37 0,08534 -0,87 0,19215 -0,37 0,35569
-3,86 0,00006 -3,36 0,00039 -2,86 0,00212 -2,36 0,00914 -1,86 0,03144 -1,36 0,08692 -0,86 0,19489 -0,36 0,35942
-3,85 0,00006 -3,35 0,00040 -2,85 0,00219 -2,35 0,00939 -1,85 0,03216 -1,35 0,08851 -0,85 0,19766 -0,35 0,36317
-3,84 0,00006 -3,34 0,00042 -2,84 0,00226 -2,34 0,00964 -1,84 0,03288 -1,34 0,09012 -0,84 0,20045 -0,34 0,36693
-3,83 0,00006 -3,33 0,00043 -2,83 0,00233 -2,33 0,00990 -1,83 0,03362 -1,33 0,09176 -0,83 0,20327 -0,33 0,37070
-3,82 0,00007 -3,32 0,00045 -2,82 0,00240 -2,32 0,01017 -1,82 0,03438 -1,32 0,09342 -0,82 0,20611 -0,32 0,37448
-3,81 0,00007 -3,31 0,00047 -2,81 0,00248 -2,31 0,01044 -1,81 0,03515 -1,31 0,09510 -0,81 0,20897 -0,31 0,37828
-3,80 0,00007 -3,30 0,00048 -2,80 0,00256 -2,30 0,01072 -1,80 0,03593 -1,30 0,09680 -0,80 0,21186 -0,30 0,38209
-3,79 0,00008 -3,29 0,00050 -2,79 0,00264 -2,29 0,01101 -1,79 0,03673 -1,29 0,09853 -0,79 0,21476 -0,29 0,38591
-3,78 0,00008 -3,28 0,00052 -2,78 0,00272 -2,28 0,01130 -1,78 0,03754 -1,28 0,10027 -0,78 0,21770 -0,28 0,38974
-3,77 0,00008 -3,27 0,00054 -2,77 0,00280 -2,27 0,01160 -1,77 0,03836 -1,27 0,10204 -0,77 0,22065 -0,27 0,39358
-3,76 0,00008 -3,26 0,00056 -2,76 0,00289 -2,26 0,01191 -1,76 0,03920 -1,26 0,10383 -0,76 0,22363 -0,26 0,39743
-3,75 0,00009 -3,25 0,00058 -2,75 0,00298 -2,25 0,01222 -1,75 0,04006 -1,25 0,10565 -0,75 0,22663 -0,25 0,40129
-3,74 0,00009 -3,24 0,00060 -2,74 0,00307 -2,24 0,01255 -1,74 0,04093 -1,24 0,10749 -0,74 0,22965 -0,24 0,40517
-3,73 0,00010 -3,23 0,00062 -2,73 0,00317 -2,23 0,01287 -1,73 0,04182 -1,23 0,10935 -0,73 0,23270 -0,23 0,40905
-3,72 0,00010 -3,22 0,00064 -2,72 0,00326 -2,22 0,01321 -1,72 0,04272 -1,22 0,11123 -0,72 0,23576 -0,22 0,41294
-3,71 0,00010 -3,21 0,00066 -2,71 0,00336 -2,21 0,01355 -1,71 0,04363 -1,21 0,11314 -0,71 0,23885 -0,21 0,41683
-3,70 0,00011 -3,20 0,00069 -2,70 0,00347 -2,20 0,01390 -1,70 0,04457 -1,20 0,11507 -0,70 0,24196 -0,20 0,42074
-3,69 0,00011 -3,19 0,00071 -2,69 0,00357 -2,19 0,01426 -1,69 0,04551 -1,19 0,11702 -0,69 0,24510 -0,19 0,42465
-3,68 0,00012 -3,18 0,00074 -2,68 0,00368 -2,18 0,01463 -1,68 0,04648 -1,18 0,11900 -0,68 0,24825 -0,18 0,42858
-3,67 0,00012 -3,17 0,00076 -2,67 0,00379 -2,17 0,01500 -1,67 0,04746 -1,17 0,12100 -0,67 0,25143 -0,17 0,43251
-3,66 0,00013 -3,16 0,00079 -2,66 0,00391 -2,16 0,01539 -1,66 0,04846 -1,16 0,12302 -0,66 0,25463 -0,16 0,43644
-3,65 0,00013 -3,15 0,00082 -2,65 0,00402 -2,15 0,01578 -1,65 0,04947 -1,15 0,12507 -0,65 0,25785 -0,15 0,44038
-3,64 0,00014 -3,14 0,00084 -2,64 0,00415 -2,14 0,01618 -1,64 0,05050 -1,14 0,12714 -0,64 0,26109 -0,14 0,44433
-3,63 0,00014 -3,13 0,00087 -2,63 0,00427 -2,13 0,01659 -1,63 0,05155 -1,13 0,12924 -0,63 0,26435 -0,13 0,44828
-3,62 0,00015 -3,12 0,00090 -2,62 0,00440 -2,12 0,01700 -1,62 0,05262 -1,12 0,13136 -0,62 0,26763 -0,12 0,45224
-3,61 0,00015 -3,11 0,00094 -2,61 0,00453 -2,11 0,01743 -1,61 0,05370 -1,11 0,13350 -0,61 0,27093 -0,11 0,45620
-3,60 0,00016 -3,10 0,00097 -2,60 0,00466 -2,10 0,01786 -1,60 0,05480 -1,10 0,13567 -0,60 0,27425 -0,10 0,46017
-3,59 0,00017 -3,09 0,00100 -2,59 0,00480 -2,09 0,01831 -1,59 0,05592 -1,09 0,13786 -0,59 0,27760 -0,09 0,46414
-3,58 0,00017 -3,08 0,00104 -2,58 0,00494 -2,08 0,01876 -1,58 0,05705 -1,08 0,14007 -0,58 0,28096 -0,08 0,46812
-3,57 0,00018 -3,07 0,00107 -2,57 0,00508 -2,07 0,01923 -1,57 0,05821 -1,07 0,14231 -0,57 0,28434 -0,07 0,47210
-3,56 0,00019 -3,06 0,00111 -2,56 0,00523 -2,06 0,01970 -1,56 0,05938 -1,06 0,14457 -0,56 0,28774 -0,06 0,47608
-3,55 0,00019 -3,05 0,00114 -2,55 0,00539 -2,05 0,02018 -1,55 0,06057 -1,05 0,14686 -0,55 0,29116 -0,05 0,48006
-3,54 0,00020 -3,04 0,00118 -2,54 0,00554 -2,04 0,02068 -1,54 0,06178 -1,04 0,14917 -0,54 0,29460 -0,04 0,48405
-3,53 0,00021 -3,03 0,00122 -2,53 0,00570 -2,03 0,02118 -1,53 0,06301 -1,03 0,15151 -0,53 0,29806 -0,03 0,48803
-3,52 0,00022 -3,02 0,00126 -2,52 0,00587 -2,02 0,02169 -1,52 0,06426 -1,02 0,15386 -0,52 0,30153 -0,02 0,49202
-3,51 0,00022 -3,01 0,00131 -2,51 0,00604 -2,01 0,02222 -1,51 0,06552 -1,01 0,15625 -0,51 0,30503 -0,01 0,49601
Z
P
128
Universidad Virtual de Quilmes
z p z p z p z p z p z p z p z p
0,00 0,50000 0,50 0,69146 1,00 0,84134 1,50 0,93319 2,00 0,97725 2,50 0,99379 3,00 0,99865 3,50 0,99977
0,01 0,50399 0,51 0,69497 1,01 0,84375 1,51 0,93448 2,01 0,97778 2,51 0,99396 3,01 0,99869 3,51 0,99978
0,02 0,50798 0,52 0,69847 1,02 0,84614 1,52 0,93574 2,02 0,97831 2,52 0,99413 3,02 0,99874 3,52 0,99978
0,03 0,51197 0,53 0,70194 1,03 0,84849 1,53 0,93699 2,03 0,97882 2,53 0,99430 3,03 0,99878 3,53 0,99979
0,04 0,51595 0,54 0,70540 1,04 0,85083 1,54 0,93822 2,04 0,97932 2,54 0,99446 3,04 0,99882 3,54 0,99980
0,05 0,51994 0,55 0,70884 1,05 0,85314 1,55 0,93943 2,05 0,97982 2,55 0,99461 3,05 0,99886 3,55 0,99981
0,06 0,52392 0,56 0,71226 1,06 0,85543 1,56 0,94062 2,06 0,98030 2,56 0,99477 3,06 0,99889 3,56 0,99981
0,07 0,52790 0,57 0,71566 1,07 0,85769 1,57 0,94179 2,07 0,98077 2,57 0,99492 3,07 0,99893 3,57 0,99982
0,08 0,53188 0,58 0,71904 1,08 0,85993 1,58 0,94295 2,08 0,98124 2,58 0,99506 3,08 0,99896 3,58 0,99983
0,09 0,53586 0,59 0,72240 1,09 0,86214 1,59 0,94408 2,09 0,98169 2,59 0,99520 3,09 0,99900 3,59 0,99983
0,10 0,53983 0,60 0,72575 1,10 0,86433 1,60 0,94520 2,10 0,98214 2,60 0,99534 3,10 0,99903 3,60 0,99984
0,11 0,54380 0,61 0,72907 1,11 0,86650 1,61 0,94630 2,11 0,98257 2,61 0,99547 3,11 0,99906 3,61 0,99985
0,12 0,54776 0,62 0,73237 1,12 0,86864 1,62 0,94738 2,12 0,98300 2,62 0,99560 3,12 0,99910 3,62 0,99985
0,13 0,55172 0,63 0,73565 1,13 0,87076 1,63 0,94845 2,13 0,98341 2,63 0,99573 3,13 0,99913 3,63 0,99986
0,14 0,55567 0,64 0,73891 1,14 0,87286 1,64 0,94950 2,14 0,98382 2,64 0,99585 3,14 0,99916 3,64 0,99986
0,15 0,55962 0,65 0,74215 1,15 0,87493 1,65 0,95053 2,15 0,98422 2,65 0,99598 3,15 0,99918 3,65 0,99987
0,16 0,56356 0,66 0,74537 1,16 0,87698 1,66 0,95154 2,16 0,98461 2,66 0,99609 3,16 0,99921 3,66 0,99987
0,17 0,56749 0,67 0,74857 1,17 0,87900 1,67 0,95254 2,17 0,98500 2,67 0,99621 3,17 0,99924 3,67 0,99988
0,18 0,57142 0,68 0,75175 1,18 0,88100 1,68 0,95352 2,18 0,98537 2,68 0,99632 3,18 0,99926 3,68 0,99988
0,19 0,57535 0,69 0,75490 1,19 0,88298 1,69 0,95449 2,19 0,98574 2,69 0,99643 3,19 0,99929 3,69 0,99989
0,20 0,57926 0,70 0,75804 1,20 0,88493 1,70 0,95543 2,20 0,98610 2,70 0,99653 3,20 0,99931 3,70 0,99989
0,21 0,58317 0,71 0,76115 1,21 0,88686 1,71 0,95637 2,21 0,98645 2,71 0,99664 3,21 0,99934 3,71 0,99990
0,22 0,58706 0,72 0,76424 1,22 0,88877 1,72 0,95728 2,22 0,98679 2,72 0,99674 3,22 0,99936 3,72 0,99990
0,23 0,59095 0,73 0,76730 1,23 0,89065 1,73 0,95818 2,23 0,98713 2,73 0,99683 3,23 0,99938 3,73 0,99990
0,24 0,59483 0,74 0,77035 1,24 0,89251 1,74 0,95907 2,24 0,98745 2,74 0,99693 3,24 0,99940 3,74 0,99991
0,25 0,59871 0,75 0,77337 1,25 0,89435 1,75 0,95994 2,25 0,98778 2,75 0,99702 3,25 0,99942 3,75 0,99991
0,26 0,60257 0,76 0,77637 1,26 0,89617 1,76 0,96080 2,26 0,98809 2,76 0,99711 3,26 0,99944 3,76 0,99992
0,27 0,60642 0,77 0,77935 1,27 0,89796 1,77 0,96164 2,27 0,98840 2,77 0,99720 3,27 0,99946 3,77 0,99992
0,28 0,61026 0,78 0,78230 1,28 0,89973 1,78 0,96246 2,28 0,98870 2,78 0,99728 3,28 0,99948 3,78 0,99992
0,29 0,61409 0,79 0,78524 1,29 0,90147 1,79 0,96327 2,29 0,98899 2,79 0,99736 3,29 0,99950 3,79 0,99992
0,30 0,61791 0,80 0,78814 1,30 0,90320 1,80 0,96407 2,30 0,98928 2,80 0,99744 3,30 0,99952 3,80 0,99993
0,31 0,62172 0,81 0,79103 1,31 0,90490 1,81 0,96485 2,31 0,98956 2,81 0,99752 3,31 0,99953 3,81 0,99993
0,32 0,62552 0,82 0,79389 1,32 0,90658 1,82 0,96562 2,32 0,98983 2,82 0,99760 3,32 0,99955 3,82 0,99993
0,33 0,62930 0,83 0,79673 1,33 0,90824 1,83 0,96638 2,33 0,99010 2,83 0,99767 3,33 0,99957 3,83 0,99994
0,34 0,63307 0,84 0,79955 1,34 0,90988 1,84 0,96712 2,34 0,99036 2,84 0,99774 3,34 0,99958 3,84 0,99994
0,35 0,63683 0,85 0,80234 1,35 0,91149 1,85 0,96784 2,35 0,99061 2,85 0,99781 3,35 0,99960 3,85 0,99994
0,36 0,64058 0,86 0,80511 1,36 0,91308 1,86 0,96856 2,36 0,99086 2,86 0,99788 3,36 0,99961 3,86 0,99994
0,37 0,64431 0,87 0,80785 1,37 0,91466 1,87 0,96926 2,37 0,99111 2,87 0,99795 3,37 0,99962 3,87 0,99995
0,38 0,64803 0,88 0,81057 1,38 0,91621 1,88 0,96995 2,38 0,99134 2,88 0,99801 3,38 0,99964 3,88 0,99995
0,39 0,65173 0,89 0,81327 1,39 0,91774 1,89 0,97062 2,39 0,99158 2,89 0,99807 3,39 0,99965 3,89 0,99995
0,40 0,65542 0,90 0,81594 1,40 0,91924 1,90 0,97128 2,40 0,99180 2,90 0,99813 3,40 0,99966 3,90 0,99995
0,41 0,65910 0,91 0,81859 1,41 0,92073 1,91 0,97193 2,41 0,99202 2,91 0,99819 3,41 0,99968 3,91 0,99995
0,42 0,66276 0,92 0,82121 1,42 0,92220 1,92 0,97257 2,42 0,99224 2,92 0,99825 3,42 0,99969 3,92 0,99996
0,43 0,66640 0,93 0,82381 1,43 0,92364 1,93 0,97320 2,43 0,99245 2,93 0,99831 3,43 0,99970 3,93 0,99996
0,44 0,67003 0,94 0,82639 1,44 0,92507 1,94 0,97381 2,44 0,99266 2,94 0,99836 3,44 0,99971 3,94 0,99996
0,45 0,67364 0,95 0,82894 1,45 0,92647 1,95 0,97441 2,45 0,99286 2,95 0,99841 3,45 0,99972 3,95 0,99996
0,46 0,67724 0,96 0,83147 1,46 0,92785 1,96 0,97500 2,46 0,99305 2,96 0,99846 3,46 0,99973 3,96 0,99996
0,47 0,68082 0,97 0,83398 1,47 0,92922 1,97 0,97558 2,47 0,99324 2,97 0,99851 3,47 0,99974 3,97 0,99996
0,48 0,68439 0,98 0,83646 1,48 0,93056 1,98 0,97615 2,48 0,99343 2,98 0,99856 3,48 0,99975 3,98 0,99997
0,49 0,68793 0,99 0,83891 1,49 0,93189 1,99 0,97670 2,49 0,99361 2,99 0,99861 3,49 0,99976 3,99 0,99997
Tabla 2: Percentiles de la distribucin t de Student .
gl
t0,001 t0,005 t0,01 t0,02 t0,025 t0,05 t0,10 t0,90 t0,975 t0,98 t0,99 t0,995 t0,999
1 -318,29 -63,66 -31,82 -15,89 -12,71 -6,31 -3,08 3,08 12,71 15,89 31,82 63,66 318,29
2 -22,33 -9,92 -6,96 -4,85 -4,30 -2,92 -1,89 1,89 4,30 4,85 6,96 9,92 22,33
3 -10,21 -5,84 -4,54 -3,48 -3,18 -2,35 -1,64 1,64 3,18 3,48 4,54 5,84 10,21
4 -7,17 -4,60 -3,75 -3,00 -2,78 -2,13 -1,53 1,53 2,78 3,00 3,75 4,60 7,17
5 -5,89 -4,03 -3,36 -2,76 -2,57 -2,02 -1,48 1,48 2,57 2,76 3,36 4,03 5,89
6 -5,21 -3,71 -3,14 -2,61 -2,45 -1,94 -1,44 1,44 2,45 2,61 3,14 3,71 5,21
7 -4,79 -3,50 -3,00 -2,52 -2,36 -1,89 -1,41 1,41 2,36 2,52 3,00 3,50 4,79
8 -4,50 -3,36 -2,90 -2,45 -2,31 -1,86 -1,40 1,40 2,31 2,45 2,90 3,36 4,50
9 -4,30 -3,25 -2,82 -2,40 -2,26 -1,83 -1,38 1,38 2,26 2,40 2,82 3,25 4,30
10 -4,14 -3,17 -2,76 -2,36 -2,23 -1,81 -1,37 1,37 2,23 2,36 2,76 3,17 4,14
11 -4,02 -3,11 -2,72 -2,33 -2,20 -1,80 -1,36 1,36 2,20 2,33 2,72 3,11 4,02
12 -3,93 -3,05 -2,68 -2,30 -2,18 -1,78 -1,36 1,36 2,18 2,30 2,68 3,05 3,93
13 -3,85 -3,01 -2,65 -2,28 -2,16 -1,77 -1,35 1,35 2,16 2,28 2,65 3,01 3,85
14 -3,79 -2,98 -2,62 -2,26 -2,14 -1,76 -1,35 1,35 2,14 2,26 2,62 2,98 3,79
15 -3,73 -2,95 -2,60 -2,25 -2,13 -1,75 -1,34 1,34 2,13 2,25 2,60 2,95 3,73
16 -3,69 -2,92 -2,58 -2,24 -2,12 -1,75 -1,34 1,34 2,12 2,24 2,58 2,92 3,69
17 -3,65 -2,90 -2,57 -2,22 -2,11 -1,74 -1,33 1,33 2,11 2,22 2,57 2,90 3,65
18 -3,61 -2,88 -2,55 -2,21 -2,10 -1,73 -1,33 1,33 2,10 2,21 2,55 2,88 3,61
19 -3,58 -2,86 -2,54 -2,20 -2,09 -1,73 -1,33 1,33 2,09 2,20 2,54 2,86 3,58
20 -3,55 -2,85 -2,53 -2,20 -2,09 -1,72 -1,33 1,33 2,09 2,20 2,53 2,85 3,55
21 -3,53 -2,83 -2,52 -2,19 -2,08 -1,72 -1,32 1,32 2,08 2,19 2,52 2,83 3,53
22 -3,50 -2,82 -2,51 -2,18 -2,07 -1,72 -1,32 1,32 2,07 2,18 2,51 2,82 3,50
23 -3,48 -2,81 -2,50 -2,18 -2,07 -1,71 -1,32 1,32 2,07 2,18 2,50 2,81 3,48
24 -3,47 -2,80 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,80 3,47
25 -3,45 -2,79 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,79 3,45
26 -3,43 -2,78 -2,48 -2,16 -2,06 -1,71 -1,31 1,31 2,06 2,16 2,48 2,78 3,43
27 -3,42 -2,77 -2,47 -2,16 -2,05 -1,70 -1,31 1,31 2,05 2,16 2,47 2,77 3,42
28 -3,41 -2,76 -2,47 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,47 2,76 3,41
29 -3,40 -2,76 -2,46 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,46 2,76 3,40
30 -3,39 -2,75 -2,46 -2,15 -2,04 -1,70 -1,31 1,31 2,04 2,15 2,46 2,75 3,39
31 -3,37 -2,74 -2,45 -2,14 -2,04 -1,70 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
32 -3,37 -2,74 -2,45 -2,14 -2,04 -1,69 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
33 -3,36 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,36
34 -3,35 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,35
35 -3,34 -2,72 -2,44 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,44 2,72 3,34
36 -3,33 -2,72 -2,43 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,43 2,72 3,33
38 -3,32 -2,71 -2,43 -2,13 -2,02 -1,69 -1,30 1,30 2,02 2,13 2,43 2,71 3,32
40 -3,31 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,31
42 -3,30 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,30
44 -3,29 -2,69 -2,41 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,41 2,69 3,29
46 -3,28 -2,69 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,69 3,28
48 -3,27 -2,68 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,68 3,27
50 -3,26 -2,68 -2,40 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,40 2,68 3,26
55 -3,25 -2,67 -2,40 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,40 2,67 3,25
60 -3,23 -2,66 -2,39 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,39 2,66 3,23
65 -3,22 -2,65 -2,39 -2,10 -2,00 -1,67 -1,29 1,29 2,00 2,10 2,39 2,65 3,22
70 -3,21 -2,65 -2,38 -2,09 -1,99 -1,67 -1,29 1,29 1,99 2,09 2,38 2,65 3,21
80 -3,20 -2,64 -2,37 -2,09 -1,99 -1,66 -1,29 1,29 1,99 2,09 2,37 2,64 3,20
90 -3,18 -2,63 -2,37 -2,08 -1,99 -1,66 -1,29 1,29 1,99 2,08 2,37 2,63 3,18
100 -3,17 -2,63 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,63 3,17
110 -3,17 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,17
120 -3,16 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,16
150 -3,15 -2,61 -2,35 -2,07 -1,98 -1,66 -1,29 1,29 1,98 2,07 2,35 2,61 3,15
200 -3,13 -2,60 -2,35 -2,07 -1,97 -1,65 -1,29 1,29 1,97 2,07 2,35 2,60 3,13
250 -3,12 -2,60 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,60 3,12
350 -3,11 -2,59 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,59 3,11
500 -3,11 -2,59 -2,33 -2,06 -1,96 -1,65 -1,28 1,28 1,96 2,06 2,33 2,59 3,11
3000 -3,09 -2,58 -2,33 -2,05 -1,96 -1,65 -1,28 1,28 1,96 2,05 2,33 2,58 3,09
t
129
Estadistica
Tabla 2: Percentiles de la distribucin t de Student .
gl
t0,001 t0,005 t0,01 t0,02 t0,025 t0,05 t0,10 t0,90 t0,975 t0,98 t0,99 t0,995 t0,999
1 -318,29 -63,66 -31,82 -15,89 -12,71 -6,31 -3,08 3,08 12,71 15,89 31,82 63,66 318,29
2 -22,33 -9,92 -6,96 -4,85 -4,30 -2,92 -1,89 1,89 4,30 4,85 6,96 9,92 22,33
3 -10,21 -5,84 -4,54 -3,48 -3,18 -2,35 -1,64 1,64 3,18 3,48 4,54 5,84 10,21
4 -7,17 -4,60 -3,75 -3,00 -2,78 -2,13 -1,53 1,53 2,78 3,00 3,75 4,60 7,17
5 -5,89 -4,03 -3,36 -2,76 -2,57 -2,02 -1,48 1,48 2,57 2,76 3,36 4,03 5,89
6 -5,21 -3,71 -3,14 -2,61 -2,45 -1,94 -1,44 1,44 2,45 2,61 3,14 3,71 5,21
7 -4,79 -3,50 -3,00 -2,52 -2,36 -1,89 -1,41 1,41 2,36 2,52 3,00 3,50 4,79
8 -4,50 -3,36 -2,90 -2,45 -2,31 -1,86 -1,40 1,40 2,31 2,45 2,90 3,36 4,50
9 -4,30 -3,25 -2,82 -2,40 -2,26 -1,83 -1,38 1,38 2,26 2,40 2,82 3,25 4,30
10 -4,14 -3,17 -2,76 -2,36 -2,23 -1,81 -1,37 1,37 2,23 2,36 2,76 3,17 4,14
11 -4,02 -3,11 -2,72 -2,33 -2,20 -1,80 -1,36 1,36 2,20 2,33 2,72 3,11 4,02
12 -3,93 -3,05 -2,68 -2,30 -2,18 -1,78 -1,36 1,36 2,18 2,30 2,68 3,05 3,93
13 -3,85 -3,01 -2,65 -2,28 -2,16 -1,77 -1,35 1,35 2,16 2,28 2,65 3,01 3,85
14 -3,79 -2,98 -2,62 -2,26 -2,14 -1,76 -1,35 1,35 2,14 2,26 2,62 2,98 3,79
15 -3,73 -2,95 -2,60 -2,25 -2,13 -1,75 -1,34 1,34 2,13 2,25 2,60 2,95 3,73
16 -3,69 -2,92 -2,58 -2,24 -2,12 -1,75 -1,34 1,34 2,12 2,24 2,58 2,92 3,69
17 -3,65 -2,90 -2,57 -2,22 -2,11 -1,74 -1,33 1,33 2,11 2,22 2,57 2,90 3,65
18 -3,61 -2,88 -2,55 -2,21 -2,10 -1,73 -1,33 1,33 2,10 2,21 2,55 2,88 3,61
19 -3,58 -2,86 -2,54 -2,20 -2,09 -1,73 -1,33 1,33 2,09 2,20 2,54 2,86 3,58
20 -3,55 -2,85 -2,53 -2,20 -2,09 -1,72 -1,33 1,33 2,09 2,20 2,53 2,85 3,55
21 -3,53 -2,83 -2,52 -2,19 -2,08 -1,72 -1,32 1,32 2,08 2,19 2,52 2,83 3,53
22 -3,50 -2,82 -2,51 -2,18 -2,07 -1,72 -1,32 1,32 2,07 2,18 2,51 2,82 3,50
23 -3,48 -2,81 -2,50 -2,18 -2,07 -1,71 -1,32 1,32 2,07 2,18 2,50 2,81 3,48
24 -3,47 -2,80 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,80 3,47
25 -3,45 -2,79 -2,49 -2,17 -2,06 -1,71 -1,32 1,32 2,06 2,17 2,49 2,79 3,45
26 -3,43 -2,78 -2,48 -2,16 -2,06 -1,71 -1,31 1,31 2,06 2,16 2,48 2,78 3,43
27 -3,42 -2,77 -2,47 -2,16 -2,05 -1,70 -1,31 1,31 2,05 2,16 2,47 2,77 3,42
28 -3,41 -2,76 -2,47 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,47 2,76 3,41
29 -3,40 -2,76 -2,46 -2,15 -2,05 -1,70 -1,31 1,31 2,05 2,15 2,46 2,76 3,40
30 -3,39 -2,75 -2,46 -2,15 -2,04 -1,70 -1,31 1,31 2,04 2,15 2,46 2,75 3,39
31 -3,37 -2,74 -2,45 -2,14 -2,04 -1,70 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
32 -3,37 -2,74 -2,45 -2,14 -2,04 -1,69 -1,31 1,31 2,04 2,14 2,45 2,74 3,37
33 -3,36 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,36
34 -3,35 -2,73 -2,44 -2,14 -2,03 -1,69 -1,31 1,31 2,03 2,14 2,44 2,73 3,35
35 -3,34 -2,72 -2,44 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,44 2,72 3,34
36 -3,33 -2,72 -2,43 -2,13 -2,03 -1,69 -1,31 1,31 2,03 2,13 2,43 2,72 3,33
38 -3,32 -2,71 -2,43 -2,13 -2,02 -1,69 -1,30 1,30 2,02 2,13 2,43 2,71 3,32
40 -3,31 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,31
42 -3,30 -2,70 -2,42 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,42 2,70 3,30
44 -3,29 -2,69 -2,41 -2,12 -2,02 -1,68 -1,30 1,30 2,02 2,12 2,41 2,69 3,29
46 -3,28 -2,69 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,69 3,28
48 -3,27 -2,68 -2,41 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,41 2,68 3,27
50 -3,26 -2,68 -2,40 -2,11 -2,01 -1,68 -1,30 1,30 2,01 2,11 2,40 2,68 3,26
55 -3,25 -2,67 -2,40 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,40 2,67 3,25
60 -3,23 -2,66 -2,39 -2,10 -2,00 -1,67 -1,30 1,30 2,00 2,10 2,39 2,66 3,23
65 -3,22 -2,65 -2,39 -2,10 -2,00 -1,67 -1,29 1,29 2,00 2,10 2,39 2,65 3,22
70 -3,21 -2,65 -2,38 -2,09 -1,99 -1,67 -1,29 1,29 1,99 2,09 2,38 2,65 3,21
80 -3,20 -2,64 -2,37 -2,09 -1,99 -1,66 -1,29 1,29 1,99 2,09 2,37 2,64 3,20
90 -3,18 -2,63 -2,37 -2,08 -1,99 -1,66 -1,29 1,29 1,99 2,08 2,37 2,63 3,18
100 -3,17 -2,63 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,63 3,17
110 -3,17 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,17
120 -3,16 -2,62 -2,36 -2,08 -1,98 -1,66 -1,29 1,29 1,98 2,08 2,36 2,62 3,16
150 -3,15 -2,61 -2,35 -2,07 -1,98 -1,66 -1,29 1,29 1,98 2,07 2,35 2,61 3,15
200 -3,13 -2,60 -2,35 -2,07 -1,97 -1,65 -1,29 1,29 1,97 2,07 2,35 2,60 3,13
250 -3,12 -2,60 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,60 3,12
350 -3,11 -2,59 -2,34 -2,06 -1,97 -1,65 -1,28 1,28 1,97 2,06 2,34 2,59 3,11
500 -3,11 -2,59 -2,33 -2,06 -1,96 -1,65 -1,28 1,28 1,96 2,06 2,33 2,59 3,11
3000 -3,09 -2,58 -2,33 -2,05 -1,96 -1,65 -1,28 1,28 1,96 2,05 2,33 2,58 3,09
t