Sie sind auf Seite 1von 105

08

Estadstica y Probabilidad
Patricia de Pava Iturralde

1

CENTRO DE ESTUDIOS AVANZADOS DE LAS
AMRICASLICENCIATURA EN NEGOCIOS
INTERNACIONALES
ESTADSTICA Y
PROBABILIDAD
Cuatrimestre
2

ESTADSTICA Y PROBABILIDAD
ANTOLOGA
Esta reproduccin se realiza para uso interno exclusivo como un apoyo a los profesores y alumnos del Centro de Estudios Avanzados de las
Amricas y no persigue fines de lucro, la compilacin est hecha por personal de la institucin y supervisada por el representante legal de la
misma en estricto apego a la Ley Federal de derechos de autor; por ello, y en apego al ttulo 5, captulo 3, artculos 123, 124, 125, 126, 127 y
128 a la pgina ltima en esta compilacin se menciona para dar crdito al autor original de la obra as como a la casa editorial que la ha
publicado, en concordancia con esta idea se sugiere de manera amplia al lector de esta antologa y si as lo considera conveniente adquiera la
obra original pues esta reproduccin solo tiene un fragmento de la misma.

CENTRO DE ESTUDIOS AVANZADOS DE LAS AMRICAS
Ro Tber 12 Col. Cuauhtmoc, Del. Cuauhtmoc c.p. 06500
Mxico D.F. Tel. 52 07 91 01

Mxico, 2008



Tabla de contenido
UNIDAD 1
NOCIONES FUNDAMENTALES DE ESTADSTICA
Clasificacin de Estadstica 2
UNIDAD 2
ESTADSTICA DESCRIPTIVA
Distribucin de Frecuencias 8
U N I D A D 3
MEDIDAS DE TENDENCIA CENTRAL
Estadstica Descriptiva 26
UNIDAD 4
MEDIDAS DE DISPERSIN
Estadstica Descriptiva 35
UNIDAD 5
PRINCIPIOS DE PROBABILIDAD
Probabilidad 42
UNIDAD 6
DISTRIBUCIONES DE PROBABILIDAD
Discreta 55

UNIDAD 7
DISTRIBUCIONES DE PROBABILIDAD 63
Discreta





UNIDAD 8
DISTRIBUCIN NORMAL.
Continua 71

UNIDAD 9
TEORA BSICA DEL MUESTREO.
Muestreo 78

UNIDAD 10
ESTIMACIN E INTERVALOS DE CONFIANZA
Intervalos de confianza 93



BIBLIOGRAFA 101

2



1. NOCIONES FUNDAMENTALES DE
ESTADSTICA
Estadstica descriptiva e inferencial
Concepto de variable
Aplicaciones de la estadstica










UNIDAD
1

3




Introduccin


La palabra "estadstica" suele utilizarse bajo dos significados distintos, a saber:

1 Como coleccin de datos numricos.- Esto es el significado ms vulgar de la
palabra estadstica. Se sobrentiende que dichos datos numricos han de estar
presentados de manera ordenada y sistemtica. Una informacin numrica
cualquiera puede no constituir una estadstica, para merecer este apelativo, los
datos han de constituir un conjunto coherente, establecido de forma sistemtica y
siguiendo un criterio de ordenacin.
Tenemos muchos ejemplos de este tipo de estadsticas. El Anuario Estadstico
publicado por el Instituto Nacional de Estadstica, El Anuario de Estadsticas del
Trabajo,

2 Como ciencia.- La Estadstica es una rama de la matemtica que se refiere a la
recoleccin, estudio e interpretacin de los datos obtenidos en un estudio. Es
aplicable a una amplia variedad de disciplinas, desde la fsica hasta las ciencias
sociales, ciencias de la salud como la Psicologa y la Medicina, y usada en la toma
de decisiones en reas de negocios e instituciones gubernamentales.
En este significado, La Estadstica estudia el comportamiento de los fenmenos
de masas. Como todas las ciencias, busca las caractersticas generales de un
colectivo y prescinde de las particulares de cada elemento. As por ejemplo al
investigar el sexo de los nacimientos, iniciaremos el trabajo tomando un grupo
numeroso de nacimientos para obtener despus la proporcin de varones. Es muy
frecuente enfrentarnos con fenmenos en los que es muy difcil predecir el
resultado; por ejemplo, no podemos dar una lista de las personas que van a morir
ESTADSTICA

4
a una cierta edad, o el sexo de un nuevo ser hasta que transcurra un determinado
tiempo de embarazo,
Por lo tanto, el objetivo de la Estadstica es hallar las regularidades que se
encuentran en los fenmenos de masa.
La Estadstica cuenta con procedimientos para recoger, organizar y presentar
informacin acerca de un problema determinado, y con mtodos para establecer la
validez de las conclusiones obtenidas a partir de la informacin recogida.

CLASIFICACIN DE LA ESTADISTICA

La Estadstica se clasifica en: Estadstica descriptiva y Estadstica Inferencial.
La Estadstica descriptiva, se encarga de los mtodos de recoleccin, descripcin,
visualizacin y resumen de datos originados a partir de los fenmenos en estudio.
Los datos pueden ser resumidos numrica o grficamente. Ejemplos bsicos de
descriptores numricos son: la media y la desviacin estndar. Resmenes
grficos incluyen varios tipos de figuras y grficos.
La Estadstica descriptiva presenta la informacin en forma cmoda, utilizable y
comprensible.
La Estadstica Inferencial se dedica a la generacin de los modelos, deducciones y
predicciones asociadas a los fenmenos en cuestin teniendo en cuenta lo
aleatorio e incertidumbre en las observaciones. Se usa para modelar patrones en
los datos y extraer inferencias acerca de la poblacin de estudio, es decir, se
ocupa de la generalizacin de esa informacin haciendo deducciones acerca de
las poblaciones.

POBLACIN Y DATOS.

Al aplicar estadstica a un problema cientfico, industrial o social, se comienza con
un proceso o poblacin a ser estudiado. Esta puede ser una poblacin de
personas en un pas, de granos cristalizados en una roca o de bienes
manufacturados por una fbrica en particular durante un periodo dado. Tambin

5
podra ser un proceso observado en varios instantes y los datos recogidos de esta
manera constituyen una serie de tiempo.
Por razones prcticas, en lugar de compilar datos de una poblacin entera,
usualmente se estudia un subconjunto seleccionado de la poblacin, llamado
muestra. Datos acerca de la muestra son recogidos de manera observacional o
experimental. Los datos son entonces analizados estadsticamente lo cual sigue
dos propsitos: descripcin e inferencia.
La poblacin puede ser segn su tamao de dos tipos:
Poblacin finita: cuando el nmero de elementos que la forman es finito, por
ejemplo el nmero de alumnos de un centro de enseanza, o grupo clase.
Poblacin infinita: cuando el nmero de elementos que la forman es infinito, o tan
grande que pudiesen considerarse infinitos. Como por ejemplo si se realizase un
estudio sobre los productos que hay en el mercado. Hay tantos y de tantas
calidades que esta poblacin podra considerarse infinita.

CLASIFICACIN DE VARIABLES

Los datos pueden ser de muy diversos tipos, por lo que los podemos clasificar en
dos grandes clases:
Variables Cuantitativas.
Variables Cualitativas, Atributos o nominales.
Las variables cuantitativas son las que se describen por medio de nmeros, como
por ejemplo el peso, Altura, Edad, Nmero de Alumnos
A su vez este tipo de variables se puede dividir en dos subclases:
Cuantitativas discretas. Aquellas a las que se les puede asociar un nmero entero,
es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la
unidad, por ejemplo nmero de hermanos, pginas de un libro, etc.
Cuantitativas continuas: Aquellas que no se pueden expresar mediante un nmero
entero, es decir, aquellas que por su naturaleza admiten que entre dos valores
cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso,
tiempo. etc.

6
No obstante en muchos casos el tratamiento estadstico hace que a variables
discretas las trabajemos como si fuesen continuas y viceversa.
Los atributos son aquellos caracteres que para su definicin precisan de palabras,
es decir, no le podemos asignar un nmero. Por ejemplo Sexo Profesin, Estado
Civil, etc.

NIVELES DE MEDICIN

Hay cuatro tipos de mediciones o escalas de medicin en estadstica. Los cuatro
tipos de niveles de medicin (nominal, ordinal, intervalo y razn) tienen diferentes
grados de uso en la investigacin estadstica. Las medidas de razn, en donde un
valor cero y distancias entre diferentes mediciones son definidas, dan la mayor
flexibilidad en mtodos estadsticos que pueden ser usados para analizar los
datos. Las medidas de intervalo tienen distancias interpretables entre mediciones,
pero un valor cero sin significado (como las mediciones de coeficiente intelectual o
temperatura en grados Celsius). Las medidas ordinales tienen imprecisas
diferencias entre valores consecutivos, pero un orden interpretable para sus
valores. Las medidas nominales no tienen ningn rango interpretable entre sus
valores.
La escala de medida nominal, puede considerarse la escala de nivel ms bajo. Se
trata de agrupar objetos en clases. La escala ordinal, por su parte, recurre a la
propiedad de orden de los nmeros. La escala de intervalos iguales est
caracterizada por una unidad de medida comn y constante. Es importante
destacar que el punto cero en las escalas de intervalos iguales es arbitrario, y no
refleja en ningn momento ausencia de la magnitud que estamos midiendo. Esta
escala, adems de poseer las caractersticas de la escala ordinal, permite
determinar la magnitud de los intervalos (distancia) entre todos los elementos de la
escala. La escala de coeficientes o Razones es el nivel de medida ms elevado y
se diferencia de las escalas de intervalos iguales nicamente por poseer un punto
cero propio como origen; es decir que el valor cero de esta escala significa
ausencia de la magnitud que estamos midiendo. Si se observa una carencia total

7
de propiedad, se dispone de una unidad de medida para el efecto. A iguales
diferencias entre los nmeros asignados corresponden iguales diferencias en el
grado de atributo presente en el objeto de estudio.

APLICACIONES

En la actualidad, Mxico se encuentra en un proceso de apertura e
internacionalizacin, por tal motivo es de suma importancia estar inmerso a travs
de diferentes tratados comerciales con diferentes pases, creando con esto nuevas
oportunidades de negocios. La Estadstica es una rama de la ciencia en pleno
desarrollo y cuya aplicacin en todos los mbitos de la sociedad ampla las
posibilidades de integracin en el mundo laboral. La Estadstica en los negocios
ha tenido crecientes, continuas e innovadoras aplicaciones de sus mtodos en
esta rea y una constante investigacin en Estadstica se lleva a cabo a partir de
problemas que surgen en diversas reas de los Negocios como Investigacin de
Mercados, Finanzas, Administracin de Riesgos, entre otras.
En los negocios y la industria la Estadstica esta presente, por ejemplo, en la
fabricacin de productos ayudando a incrementar la satisfaccin de los clientes
aplicando tcnicas de control de calidad y mejorando los procesos de produccin,
de bienes y servicios o el sustento de toma de decisiones en las empresas de los
ms diversos giros. En el rea de Mercadotecnia permite el diseo de
experimentos para determinar la viabilidad de los productos en el mercado, y
predice la respuesta de los consumidores ante su venta. En el rea de Economa,
se ha logrado el desarrollo de indicadores e ndices economtricos. Estudios de
comportamiento de mercado, de la bolsa y anlisis de inversiones. Empleo de
estadstica actuarial de riesgos y seguros. En consultora trabajando en proyectos
con las ms importantes empresas del pas en diferentes reas. En Ingeniera
utilizando tcnicas de optimizacin que minimicen costos de produccin y
maximicen la eficiencia, detectando posibles problemas de fabricacin.

8








2. ESTADSTICA DESCRIPTIVA
Distribucin de frecuencias
Representaciones grficas












UNIDAD
2

9





Para estudiar el comportamiento de un fenmeno se requiere informacin y
Cmo recopilarla?
1) Por medio de encuestas (interrogatorio oral o escrito que se aplica a varias
personas acerca del problema).
2) Por medio del registro de las observaciones que se hacen de l.

DISTRIBUCIN DE FRECUENCIAS

La informacin obtenida debe presentarse en forma organizada. Cmo?
Se puede utilizar una distribucin de frecuencias (o tambin llamada tabla de
frecuencias), en donde se asocia a cada dato o subgrupo de datos (llamado
intervalo de clase o clase) una frecuencia (nmero de observaciones que
corresponden a cada dato o a cada grupo de datos).
La presentacin de los datos puede hacerse en forma ordenada, si son datos:

Cualitativos Cuantitativos
- Orden alfabtico - Forma creciente (menor al mayor).
- Escribir, primero el que ms
se repite, luego el que sigue y
as sucesivamente.
- Forma decreciente (mayor al
menor)


DESCRIPCIN DE LOS
DATOS

10


EJEMPLO:
A) Se pregunt a un grupo de alumnos de Ingeniera Industrial su materia
preferida.
Distribucin de frecuencia
Respuestas obtenidas
datos frecuencia
Administracin 6
Ingeniera Econmica 5
Ingeniera Industrial 11
Investigacin de operaciones. 6
Matemticas 12
Probabilidad y Estadstica 10
Total N = 50




Observaste que los datos se colocaron en orden alfabtico?

11
B) Se pregunt a un grupo de alumnos su estatura en centmetros.

Distribucin de frecuencia
Respuestas obtenidas datos f
152 163 154 170 164 154 166 151 1
163 162 168 168 172 170 160 152 1
161 158 165 165 151 161 157 154 2
160 155 158 158 170 169 168 155 2
155 156 162 162 166 168 160 156 1
157 1
158 2
160 4
161 2
162 2
163 2
164 1

12
165 2
166 2
168 5
169 1
170 3
172 1
Tot N = 35





Observaste que los datos al ser cuantitativos se ordenaron en forma creciente?
Pero, cundo los datos son cuantitativos y se presentan ms de 15 valores
diferentes, se recomienda resumir la informacin? Y cmo?
Acomodndolos en grupos (llamados clases o intervalos de clase).








13

Grupos
(clases)
Frecuencia
151-155 6
Los grupos deben formarse de
igual tamao.
(tamao de clase : c)
El total de grupos o clases no
deben ser menor a 5 ni mayor
a 15


156-160 8
161-165 9
166-170 11
171-175 1
N = 35



A los lmites extremos de cada clase se les llama lmite Inferior y lmite superior de
clase respectivamente. En la clase 151, ese es el lmite inferior y 155 es el lmite
superior.
Marca de clase es el punto medio de cada clase y se obtiene sumando los lmites
de clase y dividindolos entre dos.
El tamao o anchura de clase es la diferencia entre los lmites de clase.
Por ejemplo:

En la distribucin de frecuencias anterior se tiene:



14
Clases
LI LS
f
Marcas de
Clase X
Tamao de
Clase
151-155 6 153 c = 4
156-160 8 158
161-165 9 163
166-170 11 168
171-175 1 173
N=35

Pero, cmo se calcula el tamao de clase? Cmo saber cuntas clases se
deben manejar?
Para determinar el nmero de clases ptimo, existe una regla que sugiere utilizar
como el nmero de clases el menor nmero (k) tal que k
2
sea mayor que el
nmero de observaciones.
En el ejemplo anterior hay 35 observaciones (N=35).
Dos elevado a la quinta potencia es 32.
Entonces debemos tener al menos 5 clases. Eventualmente utilizaramos 6.
Para determinar el tamao, intervalo o amplitud de clase, que generalmente debe
ser el mismo, y deben cubrir al valor menor y al mayor, se recomienda el uso la
siguiente expresin:



k
L H
i

>

15
En donde H es el valor mayor observado, L es el menor y k es el nmero de
clases.
Para el ejemplo anterior: H= 172, L= 151 y k=5, entonces tenemos:



En el ejemplo se us 4. Si en lugar de 4.2 se hubiese tenido 4.5 o ms se hubiera
redondeado a 5.

Tambin se pueden hallar:
Frecuencias acumuladas.- la suma de cada frecuencia con la frecuencia de la
clase contigua superior.
Frecuencias relativas.- Dividiendo cada frecuencia entre el nmero total de
observaciones y multiplicndolas por l00 para tenerlas en forma de porcentaje.
Frecuencias relativas acumuladas.- La suma de cada frecuencia relativa con la
frecuencia relativa de la clase contigua superior. Tambin se pueden obtener
dividiendo cada frecuencia acumulada entre el total de frecuencias por l00.











Entonces en nuestro ejemplo tenemos:

4.2
5
151 172
=

> i

16
Clases frecuencia
Frecuencia
acumulada
Frecuencia
relativa (%)
Frecuencia
relativa
acumulada (%)
151-155 6 6
(6/35)100=
17.1
(6/35)100=
17.1
156-160 8 14
(8/35)100=
22.9
(14/35)100= 40
161-165 9 23
(9/35)100=
25.7
(23/35)100=
65.7
166-170 11 34
(11/35)100=
31.4
(34/35)100=
97.1
171-175 1 35 (1/35)100= 2.9
(35/35)100=
100

Y para qu nos sirven estas frecuencias?
Para contestar preguntas tales como:
1) Cuntos alumnos tienen estatura entre 156 y 160 centmetros?
R = Se busca en la columna de frecuencia y la respuesta es 8.
2) Cuntos alumnos tienen estatura de l65 o menos?
R = Se busca en la columna de frecuencia acumulada y la respuesta es 23.
3) Qu porcentaje de alumnos tienen estatura entre 166 y 170 centmetros?
R = Se busca en la columna de frecuencia relativa y la respuesta es 31.4%.
4) Qu porcentaje de alumnos tienen estatura menor o igual que l60?

17
R = Se busca en la columna de frecuencia relativa acumulada y la respuesta es
40%.

PRESENTACIN DE LA INFORMACIN A TRAVS DE GRFICAS.

En dos grupos de una escuela se realiz un examen de matemticas y los
resultados se presentaron de la manera siguiente:


Reporte de calificaciones del Grupo1

Calificacin Frecuencia
5 3
6 8
7 14
8 9
9 4
10 2
Total 40




18



Reporte de calificaciones del Grupo2


Cul de los dos reportes te pareci mejor y porqu?

Realmente se observa mejor la grfica, llama ms la atencin y se puede
interpretar mejor y ms rpido. Es por ello que se utilizan las grficas para la
representacin de la informacin. Existen una serie de grficas como son:

-DIAGRAMA DE BARRAS GRFICA DE BARRAS.
-HISTOGRAMA.
-POLGONO DE FRECUENCIAS.
-GRFICA CIRCULAR O GRFICA DE PASTEL.
-PICTOGRAMA.
-OJIVA POLGONO DE FRECUENCIAS ACUMULADAS.
-OJIVA PORCENTUAL POLGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS.




19
DIAGRAMA DE BARRAS

Se utilizan rectngulos separados, que tienen como base a cada uno de los datos
y como altura la frecuencia de ese dato.
Ejemplo: En la siguiente tabla se muestra el total de vacunas aplicadas durante el
verano de l991 en un estado de la Repblica Mexicana.


Datos
(vacunas)
frecuencia (en
miles)
Frecuencia relativa
(%) (redondeado)
BCG 47 17
SABIN 111 41
DPT 73 27
SARAMPION 41 15
TOTAL 272 100




20


El diagrama de barras o grfica de barras suele elaborarse con algunas variantes;
por ejemplo, se pueden utilizar lneas en vez de rectngulos barras, lneas
horizontales en vez de verticales.
Si se tienen datos cuantitativos se grafica en el eje de las x los valores centrales
(marcas de clase), cuyas alturas son proporcionales a sus frecuencias. As en la
distribucin de frecuencias de las alturas de 35 alumnos se tiene:





21
HISTOGRAMA.

Se utiliza para datos cuantitativos representados en distribuciones de frecuencia.
La grfica son rectngulos verticales unidos entre s, en donde sus lados son los
lmites reales inferior y superior de clase y cuya altura es igual ala frecuencia de
clase.
Con la distribucin de frecuencia anterior se tiene:















22
POLGONO DE FRECUENCIAS:

Consiste en una serie de segmentos que unen los puntos cuyas abscisas (valores
de x) son los valores centrales de cada clase y cuyas ordenadas (valores de y)
son proporcionales a sus frecuencias respectivas.




GRFICA CIRCULAR:

Se forma al dividir un crculo en sectores circulares de manera que:
a) Cada sector circular equivale al porcentaje correspondiente al
dato o grupo que representa.
b) La unin de los sectores circulares forma el crculo y la suma de
sus porcentajes es 100.







23
Datos
(vacunas)
Frecuencia en
miles
Frecuencia
relativa(%)
Grados
(redondeados)
BCG 47 17 .17 x 360 = 61
SABIN 111 41 .41 x 360 = 148
DPT 73 27 .27 x 360 = 97
SARAMPION 41 15 .15 x 360 =54
TOTAL 272 100 360







24
PICTOGRAMA:

Se utiliza un dibujo relacionado con el tema, para representar cierta cantidad de
frecuencias.
Este tipo de grfica atrae la atencin por los dibujos, pero la desventaja es que se
lee en forma aproximada.

Ejemplo:
En una biblioteca de una escuela se tienen los siguientes libros:

Libros frecuencia
Biologa 25
Matemticas 30
Fsica 43
Qumica 20
Filosofa 10
Total 128

25



OJIVA O POLGONO DE FRECUENCIAS ACUMULADAS:

Una grfica de distribucin de frecuencias acumuladas es llamada una ojiva. Se
trazan los lmites reales inferiores (lmite inferior menos 0.5) contra las frecuencias
acumuladas.



OJIVA PORCENTUAL POLGONO DE FRECUENCIAS RELATIVAS
ACUMULADAS.
Se trazan los lmites reales superiores contra las frecuencias relativas
acumuladas.

26




3. Medidas de tendencia central
Media
Mediana
Moda












UNIDAD
3

27


MEDIDAS DE TENDENCIA CENTRAL

Al describir grupos de observaciones, con frecuencia se desea describir el grupo
con un solo nmero. Para tal fin, desde luego, no se usar el valor ms elevado ni
el valor ms pequeo como nico representante, ya que solo representan los
extremos ms bien que valores tpicos. Entonces sera ms adecuado buscar un
valor central. Las medidas que describen un valor tpico en un grupo de
observaciones suelen llamarse medidas de tendencia central. Es importante tener
en cuenta que estas medidas se aplican a grupos ms bien que a individuos. Un
promedio es una caracterstica de grupo, no individual.
Entre las medidas de tendencia central tenemos: La media, la mediana, la moda y
los percentiles.

MEDIA

La medida de tendencia central mas ampliamente usada es la media aritmtica,
usualmente abreviada como media promedio.
La media aritmtica de un conjunto de n valores es el resultado de la suma de
todos ellos dividido entre n.
Propiedades de la media aritmtica
1. Puede ser calculada en distribuciones con escala de razn y de intervalo.
2. Todos los valores son incluidos en el cmputo de la media.
3. Una serie de datos solo tiene una media.
4. Es una medida muy til para comparar dos o ms poblaciones.
5. Es la nica medida de tendencia central donde la suma de las desviaciones de
cada valor respecto a la media es igual a cero. Por lo tanto podemos considerar a
la media como el punto de balance de una serie de datos.
Desventajas de la media aritmtica


28
1. Si alguno de los valores es extremadamente grande o extremadamente
pequeo, la media no es el promedio apropiado para representar la serie de datos.
2. No se puede determinar si en una distribucin de frecuencias hay intervalos de
clase abiertos.
Las siguiente expresin es til para el clculo de la media con datos agrupados
(tablas de frecuencia) y datos no agrupados.
xi representa el valor de la variable o en su caso la
marca de clase.
Ejemplo 1: La familia Castro es propietaria de cuatro autos. Los siguientes datos
corresponden al kilometraje de cada uno de ellos:
56,000 23,000 42,000 73,000
Encuentre la media aritmtica del kilometraje de los autos:
= (56,000 + + 73,000)/4 = 48,500
El ejemplo anterior es con datos no agrupados. Para calcular la media se han
utilizado todos los datos, por esta razn se representa a la media con la letra . En
caso de trabajar con una muestra de los datos se representar la media con .
Ejemplo 2: La siguiente tabla muestra los resultados de una muestra de 10 cines
en una gran rea metropolitana, que cont el nmero total de pelculas en
exhibicin la ltima semana. Calcule el nmero medio de pelculas en exhibicin.









29
Pelculas en
cartelera
Frecuencia (f) Marca de clase (X) (f)(X)
1 3 1 2 2
4 6 2 5 10
7 9 3 8 24
10 12 1 11 11
13 15 3 14 42
Total 10
E f x= 89




El anterior es un ejemplo con datos agrupados (distribucin de frecuencia)
Otros mtodos para calcular la media son:
Media geomtrica:
La media geomtrica de N observaciones es la raz de ndice N del producto de
todas las observaciones. La representaremos por G.

Solo se puede calcular si no hay observaciones negativas. Es una medida
estadstica poco o nada usual.
Media armnica:
La media armnica de N observaciones es la inversa de la media de las inversas
de las observaciones y la denotaremos por H

Al igual que en el caso de la media geomtrica su utilizacin es bastante poco
frecuente.

9 . 8
10
89
= =
E
=
n
fX
X

30
MEDIANA

La mediana es el valor central de la variable, es decir, supuesta la muestra
ordenada en orden creciente o decreciente, el valor que divide en dos partes la
muestra.
Para calcular la mediana debemos tener en cuenta si la variable es discreta o
continua.

Clculo de la mediana en el caso discreto:
Tendremos en cuenta el tamao de la muestra.
Si N es Impar hay un trmino central el trmino,

ser el valor de la
mediana.

Si N es Par, hay dos trminos centrales,

la mediana ser la media


de esos dos valores

Veamos un ejemplo.


N par N Impar

1,4,6,7,8,9,12,16,20, 24,25,27 N=12


1,4,6,7,8,9,12,16,20, 24,25,27,30 N=13


Trminos Centrales el 6 y 7= 9 y 12 Trminos Centrales el 7 =12
Me =


Me=12


31
Clculo de la mediana en el caso continuo:
Si la variable es continua, la tabla vendr en intervalos, por lo que se calcula de la
siguiente forma:
Nos vamos a apoyar en un grfico de un histograma de frecuencias acumuladas.


De donde la mediana vale:






c es la amplitud del intervalo


Vemoslo por medio de un ejemplo.
Supongamos los pesos de un grupo de 50 personas se distribuyen de la siguiente
forma:






32
Intervalo de clase Frecuencia Frecuencia acumulada
45 hasta 55 6 6
55 hasta 65 10
16
65 hasta 75
19 35 >25
75 hasta 85 11 46
85 hasta 95 4 50
N=50


Como el tamao de la muestra es N=50, buscamos el intervalo en el que la
Frecuencia acumulada es mayor que 50/2=25, que en este caso es el 3 y
aplicamos la frmula anterior.




c = 75 65 = 10
Luego la Mediana ser



MODA

MODA.- La moda es el valor de la variable que tenga mayor frecuencia absoluta,
la que ms se repite, es la nica medida de centralizacin que tiene sentido
estudiar para una variable cualitativa, pues no precisa la realizacin de ningn
clculo.

33
Por su propia definicin, la moda no es nica, pues puede haber dos o ms
valores de la variable que tengan la misma frecuencia siendo esta mxima. En
cuyo caso tendremos una distribucin bimodal o polimodal segn el caso.
Ejemplo 5: Las calificaciones de 10 estudiantes son: 81, 93, 84, 75, 68, 87, 81, 75,
81, 87
Dado que 81 es el dato que aparece con ms frecuencia, ste es la moda.
Cuando se desea hacer el clculo de la moda para distribuciones cuantitativas
continuas tendremos que:

Apoyndonos en el grfico podemos llegar a la determinacin de una expresin
para la Moda que es:


)(


)



Veamos su clculo mediante un ejemplo, para ello usaremos los datos del
apartado anterior




34

Intervalo de clase Frecuencia Frecuencia acumulada
45 hasta 55 6 6
55 hasta 65
10
16
65 hasta 75 19 35
75 hasta 85
11
46
85 hasta 95 4 50
N=50




c = 75 65 = 10














35







4. Principales medidas de dispersin
Rango
Desviacin media
Varianza
Desviacin estndar









UNIDAD
4

36


MEDIDAS DE DISPERSIN

Hasta el momento hemos estudiado los valores centrales de la distribucin, pero
tambin es importante conocer si los valores en general estn cerca o alejados de
estos valores centrales, es por lo que surge la necesidad de estudiar medidas de
dispersin.

RANGO
Se define como la diferencia existente entre el valor mayor y el menor de la
distribucin. Lo notaremos como R. Realmente no es una medida muy significativa
en la mayora de los casos, pero indudablemente es muy fcil de calcular. Rango.-
Dato mayor menos dato menor.

DESVIACIN

Desviacin: Es la diferencia que se observa entre el valor de la variable y la media
aritmtica. La denotaremos por di .
No es una medida, son muchas medidas, pues cada valor de la variable lleva
asociada su correspondiente desviacin, por lo que precisaremos una medida que
resuma dicha informacin.
La primera solucin puede ser calcular la media de todas las desviaciones, es
decir, si consideramos como muestra la de todas las desviaciones y calculamos su
media. Pero esta solucin no es la adecuada ya que siempre el resultado da cero,
pues las desviaciones positivas se contrarrestan con las negativas.



37


Para resolver este problema, tenemos dos caminos:
Tomar el valor absoluto de las desviaciones. Desviacin media
Elevar al cuadrado las desviaciones. Varianza.

DESVIACIN MEDIA

Es la media de los valores absolutos de las desviaciones, y la denotaremos por
dm.


Ejemplo: Los pesos de una muestra de canastas con libros en una librera (en
libras) son:
103, 97, 101, 106, 103
Encuentre el rango y la desviacin media.
Rango = 106 97 = 9
Para la desviacin media el primer paso es encontrar la media:


La desviacin media es:







102
5
510
= =
E
=
n
X
X
4 . 2
5
5 4 1 5 1
5
102 103 ... 102 103
=
+ + + +
=
+ +
=
E
=
n
X X
MD

38
VARIANZA
Es la media de los cuadrados de las desviaciones, y la denotaremos por o
tambin por .

Aunque tambin es posible calcularlo como:

Este estadstico tiene el inconveniente de ser poco significativo, pues se mide en
el cuadrado de la unidad de la variable, por ejemplo, si la variable viene dada en
cm. La varianza vendr en cm
2
.
Ejemplo:
Las edades de la familia Gonzlez son:
2, 18, 34, 42
Cul es la varianza poblacional?









DESVIACIN TPICA

Es la raz cuadrada de la varianza, se denota por Sx o o x.


24
4
96
= =
E
=
n
X

( ) ( )
236
4
944
4
24 42 ... 24 2 ) (
2 2 2
2
= =
+ +
=
E
=
N
X
o

39
Este estadstico se mide en la misma unidad que la variable por lo que se puede
interpretar mejor.
Ejemplo:
Calcule la desviacin estndar o tpica del ejemplo anterior:


La frmula para la varianza muestral para datos agrupados es:




donde f es la frecuencia de clase y X es la marca de clase.
Ejemplo: Obtn la varianza y la desviacin estndar de la siguiente tabla:

Pelculas en
cartelera
Frecuencia Frecuencia
acumulada
Marca de
clase (x)
E f x
2


1 3 1 1 2 1(2)
2
=4 (1x2)=2
4 6 2 3 5 2(5)
2
=50 (2x5)=10
7 9 3 6 8 3(8)
2
=192 (3x8)=24
10 12 1 7 11 1(11)
2
=121 (1x11)=11
13 15 3 10 14 3(14)
2
=588 (3x14)=42
Total 10 955 (89)
2
/10=792.1

Varianza:
36 . 15 236
2
= = = o o
1
) (
2
2
2

E
E
=
n
n
fX
fX
s
1 . 18
1 10
1 . 792 955
1
) (
2
2
2
=

E
E
=
n
n
fX
fX
s

40

Desviacin estndar:


INTERPRETACIN Y USOS DE LA DESVIACIN ESTNDAR

Regla emprica: Se aplica solamente en una distribucin de frecuencias simtrica,
con forma de campana:
- Aproximadamente 68% de las observaciones estarn entre ms una y
menos una s desde la media;
- Aproximadamente 95% de las observaciones se encontrarn entre ms dos
y menos dos s desde la media;
- Prcticamente todas las observaciones se hallarn entre ms tres y menos
tres s a partir del valor medio.

COEFICIENTE DE VARIACIN

Es un estadstico de dispersin que tiene la ventaja de que no lleva asociada
ninguna unidad, por lo que nos permitir decir entre dos muestras, cual es la que
presenta mayor dispersin. La denotaremos por C.V.

Ejemplo:
Un estudio sobre los bonos pagados y los aos de servicio de varios empleados
se muestra en la siguiente tabla:





41
Bonos pagados Aos de servicio
Media $200.00 20 aos
Desviacin estndar $40.00 2 aos
Coeficiente de variacin


% 20 ) 100 (
200
40
= = CV
% 10 ) 100 (
20
2
= = CV

42




5. PRINCIPIOS DE PROBABILIDAD
Introduccin
Probabilidad clsica de frecuencia relativa
y subjetiva
Reglas para el clculo de probabilidades







UNIDAD
5

43





Introduccin
Muchos de los eventos que ocurren en la vida diaria no pueden ser predichos con
exactitud desde antes por diversas razones, pues la mayora de los hechos estn
influidos por factores externos. Adems, existen aquellos sucesos que estn
directamente influidos por el azar, es decir, por procesos en los que no se est
seguro de lo que va a ocurrir. Sin embargo, la probabilidad nos permite acercarnos
a esos sucesos y estudiarlos, ponderando las posibilidades de su ocurrencia y
proporcionando mtodos para tales ponderaciones.
Precisamente, algunos de esos mtodos proporcionados por la probabilidad nos
llevan a descubrir que algunos sucesos tienen una mayor o menor probabilidad de
ocurrir que la ponderacin asignada a travs del sentido comn. Nuestros
sentidos, la informacin previa que poseemos, nuestras creencias o posturas,
nuestras inclinaciones, son algunos de los factores que intervienen para no
permitirnos hacer ponderaciones reales y sistemticas. La probabilidad nos
permitir estudiar los eventos de una manera sistemtica y ms cercana a la
realidad, retribuyndonos con informacin ms precisa y confiable y, por tanto,
ms til para las disciplinas humanas.

EVENTOS

Cuando se realiza un experimento, que es cualquier proceso que produce un
resultado o una observacin, se van a obtener un conjunto de valores. A este
conjunto de valores que puede tomar una variable se le denomina espacio
muestral.
Por ejemplo: Si se tiene un dado cualquiera, el espacio muestral (EM) es EM =
{1,2,3,4,5,6}.
PROBABILIDAD

44
Si existen ms de una variable, el espacio muestral est formado por las
combinaciones de valores de cada una de las variables.
Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se
denomina un evento, y si ste consta de un solo elemento entonces es un evento
elemental.
Como se puede uno imaginar, existen eventos que siempre, no importa el nmero
de experimentos o su situacin, ocurren, y en cambio existen otros que nunca
ocurren. Los que siempre ocurren son los eventos seguros, y los que nunca son
los eventos imposibles.
Sin embargo, no todos los resultados son al azar, pues si un experimento es
cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor.
Por esta razn, se define como experimento aleatorio al proceso en el que no se
pueden predecir con certeza la ocurrencia de sus eventos, con excepcin del
seguro o del imposible. Hay que hacer la observacin que esta definicin habla en
trminos generales y no especficamente sobre algn experimento en particular.
A aqulla variable que est asociada a un experimento de este tipo se le
denomina variable aleatoria.
En cambio, a un experimento no aleatorio se le denomina experimento
determinstico.

DEFINICIN DE PROBABILIDAD

A travs de la historia se han desarrollado tres enfoques conceptuales diferentes
para definir la probabilidad y determinar los valores de probabilidad:
El enfoque clsico
Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z
posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son
igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo
tiempo), entonces la probabilidad de que ocurra A es:
P(A)=




45
El enfoque clsico de la probabilidad se basa en la suposicin de que cada
resultado sea igualmente posible.
Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda
aplicarse) calcular el valor de probabilidad antes de observar cualquier evento de
muestra.
Ejemplo:
Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de
sacar una piedra roja en un intento es:

El enfoque de frecuencia relativa
Tambin llamado Enfoque Emprico, determina la probabilidad sobre la base de la
proporcin de veces que ocurre un evento favorable en un nmero de
observaciones. En este enfoque no ese utiliza la suposicin previa de
aleatoriedad. Porque la determinacin de los valores de probabilidad se basa en la
observacin y recopilacin de datos.
Ejemplo:
Se ha observado que 9 de cada 50 vehculos que pasan por una esquina no
tienen cinturn de seguridad. Si un vigilante de transito se para en esa misma
esquina un da cualquiera Cul ser la probabilidad de que detenga un vehculo
sin cinturn de seguridad?
La probabilidad es de 9/50=0.18
Tanto el enfoque clsico como el enfoque emprico conducen a valores objetivos
de probabilidad, en el sentido de que los valores de probabilidad indican a largo
plazo la tasa relativa de ocurrencia del evento.
El enfoque subjetivo
Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por
parte de un individuo de que un evento ocurra, basado en toda la evidencia a su
disposicin. Bajo esta premisa se puede decir que este enfoque es adecuado
cuando slo hay una oportunidad de ocurrencia del evento. Es decir, que el evento
ocurrir o no ocurrir esa sola vez. El valor de probabilidad bajo este enfoque es
un juicio personal.

46
Concepto de Probabilidad
Se define como clculo de probabilidad al conjunto de reglas que permiten
determinar si un fenmeno ha de producirse, fundando la suposicin en el clculo,
las estadsticas o la teora.

EL VALOR DE LA PROBABILIDAD

El valor ms pequeo que puede tener la probabilidad de ocurrencia de un evento
es igual a 0, el cual indica que el evento es imposible, y el valor mayor es 1, que
indica que el evento ciertamente ocurrir.

EVENTOS MUTUAMENTE EXCLUYENTES Y EVENTOS NO EXCLUYENTES

Dos o ms eventos son mutuamente excluyentes o disjuntos, si no pueden ocurrir
simultneamente. Es decir, la ocurrencia de un evento impide automticamente la
ocurrencia del otro evento (o eventos).
Ejemplo:
Al lanzar una moneda solo puede ocurrir que salga cara o sello pero no los dos a
la vez, esto quiere decir que estos eventos son excluyentes.
Dos o ms eventos son no excluyentes, o conjuntos, cuando es posible que
ocurran ambos. Esto no indica que necesariamente deban ocurrir estos eventos
en forma simultnea.
Ejemplo:
Si consideramos en un juego de domino sacar al menos un blanco y un seis, estos
eventos son no excluyentes porque puede ocurrir que salga el seis blanco.

REGLAS DE LA ADICIN

Las reglas de la Adicin expresan que la probabilidad de ocurrencia de al menos
dos sucesos A y B es igual a:
P(A o B) = P(A) U P(B) = P(A) + P(B) si A y B son mutuamente excluyente

47
P(A o B) = P(A) + P(B) P(A y B) si A y B son no excluyentes
Siendo: P(A) = probabilidad de ocurrencia del evento A
P(B) = probabilidad de ocurrencia del evento B
P(A y B) = probabilidad de ocurrencia simultanea de los eventos A y B
Ejemplos:
1. Eventos mutuamente excluyentes: Una mquina automtica tiene bolsas de
plstico que contienen frijoles, brcoli y otras verduras. Aunque se procur que
todas las bolsas tuvieran el mismo peso, algunas tienen un peso ligeramente
menor y otras un peso ligeramente mayor. Una revisin de 4 000 bolsas arroj los
siguientes resultados:


PESO EVENTO Nmero de
paquetes
Probabilidad de
ocurrencia
Peso ms bajo A 100 100/4000=0.025
Peso correcto B 3600 3600/4000=0.90
Peso ms alto C 300 300/4000=0.075
4000 1.00


Cul es la probabilidad de que un paquete determinado tenga un peso
ligeramente ms bajo?
P(A o C) = P(A) U P(C) = P(A) + P(C)=0.025+0.075=0.10
2. Eventos no excluyente: Cul es la probabilidad de que una carta escogida al
azar de una baraja americana sea un rey o un corazn?






48
CARTA PROBABILIDAD
DE OCURRENCIA
EXPLICACIN
Rey P(A)=4/52 Hay 4 reyes en una baraja de 52 cartas
Corazn P(B)=13/52 Hay 13 corazones en una baraja de 52
cartas
Rey de corazones P(A y B)=1/52 Hay 1 rey de corazones en una baraja de 52
cartas

P(A o B) = P(A) + P(B) P(A y B)=



Un diagrama de Venn representa estos resultados:









EVENTOS INDEPENDIENTES

Dos o ms eventos son independientes cuando la ocurrencia o no-ocurrencia de
un evento no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o
eventos). Un caso tpico de eventos independiente es el muestreo con reposicin,
es decir, una vez tomada la muestra se regresa de nuevo a la poblacin donde se
obtuvo.
Ejemplo:
Reyes
Corazones
Ambos

49
Lanzar al aire dos veces una moneda son eventos independientes por que el
resultado del primer evento no afecta sobre las probabilidades efectivas de que
ocurra cara o sello, en el segundo lanzamiento.

EVENTOS DEPENDIENTES

Dos o ms eventos sern dependientes cuando la ocurrencia o no-ocurrencia de
uno de ellos afecta la probabilidad de ocurrencia del otro (u otros). Cuando
tenemos este caso, empleamos entonces, el concepto de probabilidad condicional
para denominar la probabilidad del evento relacionado. La expresin P(A|B) indica
la probabilidad de ocurrencia del evento A s el evento B ya ocurri.
Se debe tener claro que A|B no es una fraccin.
P(A|B) = P(A y B)/P(B) o P(B|A) = P(A y B)/P(A)
Ejemplo:
Un estudio de la lealtad hacia una compaa de sus ejecutivos. La pregunta que
se les hizo fue, si otra compaa le ofreciera un puesto igual ligeramente mejor
al que tiene ahora, se quedara en la compaa? Las repuestas de 200 ejecutivos
se clasificaron de acuerdo con su tiempo de servicio en la compaa. Cul es la
probabilidad de seleccionar un ejecutivo de la compaa que sea leal y que tenga
ms de 10 aos de servicio?
TIEMPO DE SERVICIO
LEALTAD Menos de un ao 1-5 aos 6-10 aos Ms de 10 aos Total
Se quedara 10 30 5 75 120
No se quedara 25 15 10 30 80
200

P(A | B) = P(A y B) / P(B) o P(B | A) = P(A y B) / P(A)=
(

) (

) (

)

REGLAS DE MULTIPLICACIN

50

Se relacionan con la determinacin de la ocurrencia conjunta de dos o ms
eventos. Es decir la interseccin entre los conjuntos de los posibles valores de A y
los valores de B, esto quiere decir la probabilidad de que ocurran conjuntamente
los eventos A y B es:
P(A y B) = P(A B) = P(A) P(B) si A y B son independientes
P(A y B) = P(A B) = P(A) P(B|A) si A y B son dependientes
Ejemplos:
1. Eventos independientes: Se lanzaron dos monedas. Cul es la probabilidad de
que las dos monedas caigan en sol?
P(A y B) = P(A B) = P(A) P(B)= (1/2)(1/2)=0.25
2. Eventos dependientes: Suponga que hay diez rollos de pelcula en una caja, se
sabe que tres estn defectuosos. Se toman dos rollos de la caja, uno despus del
otro. Cul es la probabilidad de que ambos sean defectuosos?
P(A y B) = P(A B) = P(A) P(B|A)=(3/10)(2/9)=0.07

TEOREMA DE BAYES

El Teorema de BAYES se apoya en el proceso inverso al que hemos visto en el
Teorema de la Probabilidad Total:
Teorema de la probabilidad total: a partir de las probabilidades del suceso A
(probabilidad de que llueva o de que haga buen tiempo) deducimos la probabilidad
del suceso B (que ocurra un accidente).
Teorema de Bayes: a partir de que ha ocurrido el suceso B (ha ocurrido un
accidente) deducimos las probabilidades del suceso A (estaba lloviendo o haca
buen tiempo?).

La frmula del Teorema de Bayes es:

P(A , B)=



51

Vamos a explicar la frmula con un ejemplo.
El parte meteorolgico ha anunciado tres posibilidades para el fin de semana:
a) Que llueva: probabilidad del 50%.
b) Que nieve: probabilidad del 30%
c) Que haya niebla: probabilidad del 20%.
Segn estos posibles estados meteorolgicos, la posibilidad de que ocurra un
accidente es la siguiente:
a) Si llueve: probabilidad de accidente del 20%.
b) Si nieva: probabilidad de accidente del 10%
c) Si hay niebla: probabilidad de accidente del 5%.
Resulta que efectivamente ocurre un accidente y como no estbamos en la ciudad
no sabemos que tiempo hizo (llovi, nev o hubo niebla). El teorema de Bayes nos
permite calcular estas probabilidades:
Las probabilidades que manejamos antes de conocer que ha ocurrido un
accidente se denominan "probabilidades a priori" (lluvia con el 50%, nieve con el
30% y niebla con el 20%).
Una vez que incorporamos la informacin de que ha ocurrido un accidente, las
probabilidades del suceso A cambian: son probabilidades condicionadas P (A/B),
que se denominan "probabilidades a posteriori".
Vamos a aplicar la frmula:
a) Probabilidad de que estuviera lloviendo:
P(A , B)=

=0.714

La probabilidad de que efectivamente estuviera lloviendo el da del accidente
(probabilidad a posteriori) es del 71,4%.

b) Probabilidad de que estuviera nevando:
P(A , B)=

=0.214

52

La probabilidad de que estuviera nevando es del 21,4%.
c) Probabilidad de que hubiera niebla:
P(A , B)=

=0.071

La probabilidad de que hubiera niebla es del 7,1%
Otro ejemplo.
En una etapa de la produccin de un artculo se aplica soldadura y para eso se
usan tres diferentes robots. La probabilidad de que la soldadura sea defectuosa
vara para cada uno de los tres, as como la proporcin de artculos que cada uno
procesa, de acuerdo a la siguiente tabla.


ROBOT DEFECTUOSOS ART. PROCESADOS

A 0.03 45%
B 0.04 30%
C 0.05 25%

Tomamos al azar una pieza y resulta ser defectuosa, calcula la probabilidad de
que haya sido producida por el robot B?
P(B , D)=

=0.316
Qu robot tiene la mayor probabilidad de haber producido la pieza defectuosa?
P(A , D)=

=0.355
P(C , B)=

=0.329

El robot con mayor probabilidad de haber producido la pieza defectuosa es el
robot A.

53

DIAGRAMA DE RBOL

Supongamos que en el problema de los robots seleccionamos una pieza al azar y
queremos calcular la probabilidad de que sea defectuosa.
Para calcular la probabilidad de que la pieza elegida sea defectuosa, P (D), por la
propiedad de la probabilidad total,
P (D)=P(A) P (D, A)+P (B) P (D, B)+P(C) P (D, C)=
(0.45)(0.03)+ (0.30) (0.04)+ (0.25) (0.05)=0.038
Con un diagrama de rbol tenemos:
0.03 D

A 0.097 N
0.45 0.04 D
0.30 B
0.96 N
0.25 C 0.05 D

0.95 N

AXIOMAS DE LA PROBABILIDAD

Recordemos primero que las frecuencias relativas de una distribucin tenan las
siguientes propiedades:
Las frecuencias relativas son mayores o iguales que cero.
La frecuencia relativa del espacio muestral es igual a la unidad.
Si dos eventos son mutuamente excluyentes, es decir que no ocurren
simultneamente, entonces la frecuencia relativa de su unin es la suma de las
frecuencias relativas de cada uno.

54
Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definicin
ya expuesta, es la frecuencia relativa cuando se aumenta el tamao de la muestra,
se tienen lo siguiente.
Si E es un evento de un espacio muestral S y P(E) es la probabilidad de E,
entonces se satisfacen los axiomas de la probabilidad:
0 s P(E) s 1.
P(S) = 1.
Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces




















55



6. DISTRIBUCIONES DE
PROBABILIDAD: DISCRETAS
Concepto de distribucin de probabilidad
para variables discretas
Media, varianza y desviacin estndar de
una distribucin de probabilidad
Anlisis combinatorio






UNIDAD
6

56





VARIABLES ALEATORIAS

Se denominan variables porque cambian de valor y aleatorias porque su valor
depende del azar, es impredecible. Las variables aleatorias pueden ser discretas y
continuas.
Variable discreta: Es aquella que slo puede tomar valores enteros.
Variable continua: Es aquella que puede tomar cualquier valor en algn intervalo.
Cuando una de estas variables aleatorias toma diversos valores, la probabilidad
asociada a cada uno de tales valores puede ser organizada como una distribucin
de probabilidad.
Las distribuciones de probabilidad pueden representarse a travs de una tabla,
una grfica o una frmula, en donde a la regla de correspondencia se le denomina
funcin de probabilidad.
Consideraremos las distribuciones de probabilidad para variables discretas.
Por ejemplo: Consideremos a la variable aleatoria X como la cantidad de guilas
observadas cuando se lanzan dos volados. El espacio muestral es el conjunto
{AA, AS, SA, SS} y se puede ver que la variable X puede tomar como valores 0, 1
y 2.
Calculando las probabilidades tenemos:
P (de no observar guilas) = P (SS) = P(X=0) =
P (de observar una guila) = P (SA AS) = P (X=1) = 2/4
P (de observar dos guilas) = P (AA) = P(X=2) =
Si ahora se organizan estos resultados con el siguiente formato




DISTRIBUCIONES DE
PROBABILIDAD

57
X P (X=x)
0
1
2

Se podr explicar por qu se usa el nombre "distribucin de probabilidad". E
incluso, con esta informacin se puede construir una grfica de barras o un
histograma como el que sigue:



Las propiedades de las distribuciones de variables discretas son dos:
0 s P(X=x) s 1.
EP(X=x) = 1, o que es lo mismo: la suma de todas las probabilidades de los
eventos posibles de una variable aleatoria es igual a la unidad.
Hay que hacer notar que estas propiedades se enuncian suponiendo que
conocemos el valor de la probabilidad, pero en la realidad esto no ocurre, es decir
que no sabemos la probabilidad y lo que se hace es trabajar con estimaciones.
Precisamente esto nos lleva a modelos tericos que estiman los resultados, los
principales son los que a continuacin se presentan.



58
MODELOS DE DISTRIBUCIONES DE PROBABILIDAD DE VARIABLES
DISCRETAS

Uniforme: Es la distribucin donde todos los eventos elementales tienen la misma
probabilidad. Por ejemplo: tirar un dado, donde la funcin P(X=x)=1/6 para valores
de x=1, 2, 3, 4, 5,6.
Binomial: Es la que maneja la distribucin de la probabilidad de obtener cierta
cantidad de xitos al realizar una cantidad de experimentos con probabilidad de
xito constante y con ensayos independientes.
Geomtrica: Es la distribucin de la probabilidad de realizar cierto nmero de
experimentos antes de obtener un xito.
Hipergeomtrica: Es similar a la binomial, pero con un tamao de muestra grande
en relacin al tamao de la poblacin. La funcin de Excel que proporciona sus
valores es DISTR.HIPERGEOM
De Poisson: Es la distribucin de la probabilidad de que ocurra un evento raro en
un periodo de tiempo, un espacio o un lugar.

MEDIA Y DESVIACIN ESTNDAR DE UNA DISTRIBUCIN DE
PROBABILIDAD PARA VARIABLES DISCRETAS

En una distribucin de frecuencias para datos agrupados se calculaba la media
utilizando la frmula:


Tambin puede expresarse como:


59
Si consideramos que la definicin de probabilidad de un evento P(X) es el cociente
de la frecuencia entre el nmero total de eventos, la media de una distribucin de
probabilidad de una variable discreta es:

Por ejemplo: Consideremos la variable X del ejemplo de guilas observadas en
dos lanzamientos de monedas. Es decir, X tal que su distribucin de probabilidad
sea:

X P (X=x)
0
1
2

Entonces, para calcular su media m se realiza:

Similarmente, la varianza se defini como:

Haciendo un tratamiento anlogo al anterior tenemos que

para que, finalmente, la varianza de una distribucin de probabilidad de una
variable discreta sea:

Consecuentemente, la desviacin estndar de una distribucin de probabilidad de
una variable discreta es:



60
Por ejemplo: Considerando la misma distribucin de probabilidad que en el
ejemplo anterior, su desviacin estndar se calcula:


DISTRIBUCIONES DE PROBABILIDAD PARA VARIABLES CONTINUAS

Hasta el momento se han considerado las distribuciones de probabilidad para
variables discretas, donde se poda asignar el valor que toma la funcin de
probabilidad cuando la variable aleatoria tomaba un valor en concreto. Sin
embargo, al considerar las variables continuas se encuentra uno el problema de
que, lo ms probable, los datos que se puedan recabar no sean completamente
exactos, o dos o ms de ellos no coincidan, por lo que se tienen que trabajar en
intervalos y, en ese momento, modelar una funcin se convierte en un problema
serio.
Sin embargo, se pueden realizar aproximaciones y describir la probabilidad a
travs de modelos tericos de probabilidad cuya grfica es una lnea continua, a
diferencia de las variables discretas que le corresponde un histograma.

ANLISIS COMBINATORIO

En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una
situacin dada se convierte en algo difcil de lograr o, simplemente, tedioso. El
anlisis combinatorio, o clculo combinatorio, permite enumerar tales casos o
sucesos y as obtener la probabilidad de eventos ms complejos.
En el caso de que existan ms de un suceso a observar, habra que contar el
nmero de veces que pueden ocurrir todos los sucesos que se desean observar,
para ello se utiliza el principio fundamental de conteo:

61
Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2
formas, entonces el nmero de formas en que ambos sucesos pueden
presentarse en ese orden es de n1n2.
En otras palabras, basta multiplicar el nmero de formas en que se pueden
presentar cada uno de los sucesos a observar.
En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y
las combinaciones.

PERMUTACIONES (U ORDENACIONES) CON REPETICIN

Las permutaciones son tambin conocidas como ordenaciones, y de hecho toman
este nombre porque son ordenaciones de r objetos de n dados.
Por ejemplo: Sea A = {a, b, c, d}, cuntas "palabras" de dos letras se pueden
obtener?
Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras
es 4. En este caso r =2 y n =4.
Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db,
dc, dd. En total son 16.
En general, si se toman r objetos de n, la cantidad de permutaciones u
ordenaciones con repeticin obtenidas son:
ORn
r
= nORr = n
r


PERMUTACIONES (U ORDENACIONES) SIN REPETICIN

En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos de n
dados atendiendo a la situacin de cada objeto en la ordenacin. Su
representacin ser Pn
r
nPr.
En general, si se toman r objetos de un total de n, la cantidad de permutaciones
Pn
r
= nPr =


62
Por ejemplo: Sea el mismo conjunto A = {a, b, c, d}, cuntas ordenaciones sin
repeticin se pueden obtener?
Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.

COMBINACIONES
Es una seleccin de r objetos de n dados sin atender a la ordenacin de los
mismos. Es decir, es la obtencin de subcojuntos, de r elementos cada uno, a
partir de un conjunto inicial de n elementos. La denotaremos con C n
r
, n C r .
Por ejemplo: Si tomamos el mismo conjunto A = {a, b, c, d}, cuntos
subconjuntos de 2 elementos cada uno se pueden obtener?
Hacindolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los
subconjuntos.
En general, si de n objetos dados se hacen combinaciones de r objetos cada una,
el nmero de combinaciones obtenidas son:
C n
r
= n C r =
o, que es lo mismo,
C n
r
= n C r =
En donde n ! =(n-1)(n-2)8n-3) 1
Ejemplo:
Calcular 5 ! =(5)(4)(3)(2)(1)=120








63







7. DISTRIBUCIONES DE PROBABILIDAD
Distribucin Binomial
Distribucin de Poisson







UNIDAD
7

64

Un modelo es una simplificacin de la realidad. Un modelo probabilstico es un
modelo matemtico que describe el comportamiento de una variable aleatoria. Es
una funcin que depende de los valores de la variable aleatoria, y de otras
cantidades que caracterizan a una poblacin en particular y que se denominan
parmetros del modelo.
En el proceso de modelacin es necesario seguir los siguientes pasos:
1. Seleccionar el modelo ms apropiado.
2. Ajustar el modelo (calcular el valor de sus parmetros).
3. Verificar el modelo.
4. Decidir su aceptacin o volver al paso 1.
Para ejecutar el paso 1, podemos optar por una amplia gama de modelos de
probabilidad, desarrollados para representar distintos tipos de variables y
diferentes fenmenos aleatorios. Por lo tanto, el problema se reduce a elegir el
modelo ms apropiado para el caso en estudio.
Para ejecutar el paso 2, es necesario recopilar una muestra representativa de la
poblacin en estudio y calcular las cantidades necesarias como para evaluar los
parmetros del modelo.

LA DISTRIBUCIN BINOMIAL

Esta distribucin describe una variedad de procesos de inters para los
administradores y describe datos discretos, no continuos, que son resultado de un
experimento conocido como proceso de Bernoulli.
Podemos describir el proceso de Bernoulli de la manera siguiente:
1. Cada intento tiene slo dos resultados posibles.
2. La probabilidad del resultado de cualquier intento permanece fijo con
respecto al tiempo.
3. Los intentos son estadsticamente independientes.
Frmula binomial:

65

P(x)=n C x (p)
x
(1-p)
n-x
Ejemplo: Cada da American Airlines viaja de Pittsburgh a Pensilvania.
Supongamos que la probabilidad de que un vuelo se retrase es de 0.20. Cul es
la probabilidad de que ninguno de los vuelos se retrase el da de hoy? Cul es la
probabilidad de que uno de los vuelos se retrase el da de hoy?
P=0.20
n =5
x se refiere a xito, o sea x = 0 (ningn vuelo se atrase)
P (0) = 5C0 (0.2)
0
(1-0.20)
5-0
= (1)(1)(0.3277)=0.3277
5C0 =

= 1
Nota:
Recuerda que cualquier cantidad elevada a la cero es igual a la unidad.
0! =1
Para:
P=0.20
n =5
x se refiere a xito, o sea x = 1 (un vuelo se atrase)
P (1) = 5 C1 (0.2)
1
(1-0.20)
5-1
= (5)(0.20)(0.4096)=0.4096
5 C 1 =

= 5

Distribucin de probabilidad binomial para P=0.20 y n =5



5 4 3 2 1 0
0.4
0.3
0.2
0.1

66


Generalizaciones:
- Cuando p es pequea (0,1), la distribucin binomial est sesgada hacia la
derecha.
- Cuando p aumenta (0,3 por ejemplo), el sesgo es menos notable.
- Cuando p = 0,5, la distribucin binomial es simtrica.
- Cuando p es mayor que 0,5, la distribucin est sesgada hacia la izquierda.
- Las probabilidades para 0,3, por ejemplo, son las mismas para 0,7, excepto
que los valores de p y q estn invertidos. Esto es cierto para cualquier
pareja de valores p y q complementarios.

MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSIN PARA LA
DISTRIBUCIN BINOMIAL.

La distribucin binomial tiene un valor esperado o media y una desviacin
estndar.
- Valor esperado o media: = nt
- Varianza: o
2
= nt(1t)

CUMPLIMIENTO DE LAS CONDICIONES DEL PROCESO DE BERNOULLI.

Necesitamos ser cuidadosos en el uso de la distribucin binomial de la
probabilidad y asegurar que se cumplen las tres condiciones necesarias, en
particular las condiciones 2 y 3. La condicin 2 requiere que la probabilidad del
resultado de cualquier intento permanezca fija en el tiempo. La condicin 3
requiere que los ensayos o intentos de un proceso de Bernoulli sean
estadsticamente independientes, es decir, que el resultado de un intento no
puede afectar de ningn modo el resultado de cualquier otro intento.


67
LA DISTRIBUCIN DE POISSON.

La distribucin de Poisson se utiliza para describir cierto tipo de procesos, entre
los que se encuentran la distribucin de llamadas telefnicas que llegan a un
conmutador, la demanda (necesidades) de los pacientes que requieren servicio en
una institucin de salud, las llegadas de camiones a una caseta de cobro y el
nmero de accidentes registrados en una cierta interseccin de calles. Estos
ejemplos tienen en comn un elemento: pueden ser descritos mediante una
variable aleatoria discreta que toma valores enteros (0, 1, 2...).


CARACTERSTICAS DE LOS PROCESOS QUE PRODUCEN UNA
DISTRIBUCIN DE PROBABILIDAD DE POISSON.

1. El promedio (la media) del nmero de eventos que se producen por hora,
puede estimarse a partir de datos que se tengan disponibles.
2. Si dividimos la hora pico en periodos (intervalos) de un segundo cada uno,
encontraremos que las siguientes afirmaciones son verdaderas:
- La probabilidad de que exactamente un evento ocurra por segundo es muy
pequea y es constante para cada intervalo de un segundo.
- La probabilidad de que dos o ms eventos ocurran en un intervalo de un
segundo es tan pequea que le podemos asignar un valor cero.
- El nmero de eventos que ocurren en un intervalo de un segundo es
independiente del tiempo en que dicho intervalo se presente en la hora
pico.
- El nmero de eventos en un intervalo de un segundo no depende del
nmero de ocurrencias en cualquier otro intervalo de un segundo.

CLCULO DE LA PROBABILIDAD DE POISSON.


68
La letra X por lo general representa a una variable discreta y puede tomar valores
enteros. Utilizamos la letra X para representar a la variable aleatoria y la letra x
para sealar un valor especfico que esta variable pueda tomar. La probabilidad de
tener exactamente x presentaciones en una distribucin de Poisson se calcula con
la frmula:


es el nmero medio de ocurrencias(xitos) durante un intervalo especfico de
tiempo.
x es el nmero de ocurrencias (xitos)
e es la constante 2.71828
Ejemplo: Supongamos que Mexicana de Aviacin es raro que pierda el equipaje.
Algunos vuelos tienen una maleta perdida; en unos casos se pierden dos maletas
y es muy raro que se pierdan tres o ms. En una muestra aleatoria de 1000
vuelos se perdieron 300 maletas. La media aritmtica de maletas prdidas es de
0.3 (se encuentra dividiendo 300/1000). Si el nmero de maletas perdidas sigue
una distribucin de Poisson con =0.30. Cul es la probabilidad de no perder
ninguna maleta?
P (0)

0.7408
En el 74% de los vuelos no habr maletas perdidas.
En el siguiente cuadro se muestran las probabilidades para diferentes valores de
x.
X P(x)
0 0.7408
1 0.2222
2 0.0333
3 0.0033
4 0.0003
5 0.0000


69


LA DISTRIBUCIN DE POISSON COMO UNA APROXIMACIN A LA
DISTRIBUCIN BINOMIAL.

La distribucin de Poisson puede ser una razonable aproximacin a la binomial,
pero slo bajo ciertas condiciones. Tales condiciones se presentan cuando n es
grande y p es pequea, esto es, cuando el nmero de ensayos es grande y la
probabilidad binomial de tener xito es pequea. La regla que utilizan con ms
frecuencia los estadsticos es que la distribucin de Poisson es una buena
aproximacin de la distribucin binomial cuando n es igual o mayor que 20 y p es
igual o menor que 0,05. En los casos en que se cumplen estas condiciones,
podemos sustituir la media de la distribucin binomial (nt) en lugar de la media de
la distribucin de Poisson ().
El uso de una distribucin para aproximar a otra es una prctica bastante comn
en probabilidad y estadstica. La idea consiste en buscar situaciones en las que
una distribucin (como la de Poisson), cuyas probabilidades son relativamente
fciles de calcular, tiene valores que se encuentran razonablemente cercanos a
las de otra distribucin (como la binomial) cuyas probabilidades implican clculos
ms complicados.

RECOMENDACIONES PRCTICAS:

- Frente a un problema concreto, analice detenidamente todas sus
caractersticas, y al elegir el modelo apropiado, verifique que se cumplan
todos los supuestos del mismo.
- Habitese a utilizar las tablas provistas por la bibliografa para calcular
probabilidades. Ahorrar tiempo y evitar errores de clculo.
- No olvide emplear la distribucin de Poisson a la binomial en aquellos
casos en que p es pequeo y n es grande.

70
- Para calcular probabilidades acumuladas, del tipo P(X > x), P(X < x) o P(x <
X < x), tambin existen valores tabulados en textos especializados.
- En el caso de variables aleatorias discretas, es importante diferenciar si la
probabilidad deseada incluye o no el valor particular de la variable. Es decir,
que P(X > x) no es lo mismo que P(X > x) y P (X < x) es distinto de P(X < x).



















71







8. DISTRIBUCIN NORMAL
Concepto de distribucin continua de
probabilidad
Distribucin normal
Distribucin normal estandarizada,
clculos de reas bajo la curva











72




LA DISTRIBUCIN NORMAL: DISTRIBUCIN DE UNA VARIABLE ALEATORIA
CONTINUA.

La variable puede tomar cualquier valor que est en un intervalo de valores dado,
y la distribucin de probabilidad es continua.
Las razones bsicas de la importancia de la distribucin normal son:
1. Tiene algunas propiedades que la hacen aplicable a un gran nmero de
situaciones en las que es necesario hacer inferencias mediante la toma de
muestras. La distribucin normal es una til distribucin de muestreo.
2. La distribucin normal casi se ajusta a las distribuciones de frecuencias
reales observadas en muchos fenmenos, incluyendo caractersticas
humanas (pesos, alturas), resultados de procesos fsicos (dimensiones y
rendimientos) y muchas otras medidas de inters para los administradores.

CARACTERSTICAS DE LA DISTRIBUCIN NORMAL DE PROBABILIDAD.

1. La curva tiene un solo pico; por tanto, es unimodal. Tiene forma de
campana.
2. La media de una poblacin distribuida normalmente cae en el centro de su
curva normal.
3. Debido a la simetra de la distribucin normal de probabilidad, la mediana y
la moda se encuentran tambin en el centro; en consecuencia, para una
curva normal, la media, la mediana y la moda tienen el mismo valor.
4. Los dos extremos de la distribucin normal de probabilidad se extienden
indefinidamente y nunca tocan el eje horizontal.


DISTRIBUCIN
NORMAL

73



La mayor parte de las poblaciones reales no se extienden de manera indefinida en
ambas direcciones; pero en estas poblaciones, la distribucin normal es una
aproximacin conveniente. No hay una sola distribucin normal, sino una familia
de curvas normales. Para definir una distribucin normal de probabilidad
necesitamos definir slo dos parmetros: la media y la desviacin estndar.
La curva normal puede describir un gran nmero de poblaciones, diferenciadas
solamente por la media, la desviacin estndar o por ambas.

REAS BAJO LA CURVA NORMAL.

No importa cules sean los valores de y o para una distribucin de probabilidad
normal, el rea bajo la curva es 1,00, de manera que podemos pensar en reas
bajo la curva como si fueran probabilidades. Matemticamente:
1. Aproximadamente el 68% de todos los valores de una poblacin
normalmente distribuida se encuentran dentro de + 1 desviacin estndar
de la media.

74
2. Aproximadamente 95,5% de todos los valores de una poblacin
normalmente distribuida se encuentran dentro de + 2 desviaciones estndar
de la media.
3. Aproximadamente 99,7% de todos los valores de una poblacin
normalmente distribuida se encuentran dentro de + 3 desviaciones estndar
de la media.
Las tablas estadsticas indican porciones del rea bajo la curva normal que estn
contenidas dentro de cualquier nmero de desviaciones estndar (ms, menos) a
partir de la media.
No es posible ni necesario tener una tabla distinta para cada curva normal posible.
En lugar de ello, podemos utilizar una distribucin de probabilidad normal estndar
para encontrar reas bajo cualquier curva normal. Con esta tabla podemos
determinar el rea o la probabilidad de que la variable aleatoria distribuida
normalmente est dentro de ciertas distancias a partir de la media. Estas
distancias estn definidas en trminos de desviaciones estndar.

Para cualquier distribucin normal de probabilidad, todos los intervalos que
contienen el mismo nmero de desviaciones estndar a partir de la media
contendrn la misma fraccin del rea total bajo la curva para cualquier
distribucin de probabilidad normal.

REAS BAJO LA CURVA NORMAL.


75

El rea total bajo la curva normal ser de 1.00 por lo cual podemos considerar
que las reas bajo la curva son probabilidades.

DEFECTOS DE LA DISTRIBUCIN NORMAL DE PROBABILIDAD.

Los extremos de la distribucin normal se acercan al eje horizontal, pero nunca
llegan a tocarlo. Esto implica que existe algo de probabilidad (aunque puede ser
muy pequea) de que la variable aleatoria pueda tomar valores demasiado
grandes. No perderemos mucha precisin al ignorar valores tan alejados de la
media. Pero a cambio de la conveniencia del uso de este modelo terico,
debemos aceptar el hecho de que puede asignar valores empricos imposibles.

DISTRIBUCIN DE PROBABILIDD NORMAL ESTNDAR

Existe una familia de distribuciones normales. Cada una de las distribuciones
puede tener una media distinta o una desviacin estndar distinta. Por tanto, el
nmero de distribuciones normales es ilimitado.
Es posible utilizar un solo miembro de la familia de las distribuciones normales
para todos los problemas en los que se aplica la distribucin normal. La que tiene
una media de cero y una desviacin de uno y se le conoce como distribucin

76
normal estndar. Todas las distribuciones pueden convertirse a distribuciones
normal estndar restando la media de cada observacin y dividendo entre la
desviacin estndar.
Primero se convierte o estandariza, la distribucin real a una distribucin normal
utilizando un valor z.
En trminos de una frmula:
z=



Ejemplo:
Los ingresos semanales de los gerentes medios tienen una distribucin
aproximadamente normal con una media de 1000 dlares y una desviacin
estndar de 100 dlares Cul es el valor z para un ingreso x de 1100
dlares?Para uno de 900 dlares?
z=

=1
z=

=-1
El valor de 1 indica que un ingreso semanal de $1100.00 para un gerente medio
est una desviacin estndar arriba de la media. El valor de -1 indica que un
ingreso semanal de $900.00 para un gerente medio est una desviacin estndar
abajo de la media.

LA DISTRIBUCIN NORMAL COMO UNA APROXIMACIN DE LA
DISTRIBUCIN BINOMIAL.

Aunque la distribucin normal es continua, resulta interesante hacer notar que
algunas veces puede utilizarse para aproximar a distribuciones discretas.
La aproximacin normal a la distribucin binomial resulta muy conveniente, pues
nos permite resolver el problema sin tener que consultar grandes tablas de la
distribucin binomial. Pero se necesita tener algo de cuidado al utilizar esta

77
aproximacin, que es bastante buena, siempre que nt y n(t1) sean al menos de
cinco.

IDENTIFICACIN DEL MODELO APROPIADO.

La seleccin depende, entre otros, de los siguientes factores:
- Un adecuado anlisis del problema considerado: qu tipo de variable se
estudia, qu fenmeno se desea modelar, etc.
- Los resultados de la descripcin de los datos disponibles: forma de la
distribucin, propiedades de la variable.
- La disponibilidad y manejo de un buen nmero de modelos de probabilidad
que permitan describir diferentes tipos de situaciones.
Una vez identificado el modelo apropiado, hay que calcular sus parmetros, en
base a las observaciones que se dispongan de la variable en estudio.
Si planeamos utilizar una probabilidad para describir una situacin, debemos
escoger con cuidado la correcta. La distribucin binomial se aplica cuando el
nmero de ensayos est fijo antes de que empiece el experimento, y cada ensayo
es independiente y puede tener slo dos resultados mutuamente excluyentes. Al
igual que la distribucin binomial, se aplica cuando cada ensayo es independiente
de los dems. Pero, aunque la probabilidad de Poisson se aproxima a cero
despus de los primeros valores, el nmero de valores posibles es infinito. No se
conoce el lmite de dos resultados mutuamente excluyentes. En ciertas
condiciones, la distribucin de Poisson se puede utilizar como aproximacin de la
binomial, pero no siempre es posible hacerlo. Todas las suposiciones que
conforman la base de una distribucin deben cumplirse, si la intencin del uso de
dicha distribucin es producir resultados significativos.







78






9. TEORA BSICA DEL MUESTREO

Diferentes tipos de muestreo
Etapas de un estudio por muestreo
Distribuciones muestrales






UNIDAD
9

79










Actividad en la que se toman ciertas muestras de una poblacin de elementos. El
muestreo es importante porque a travs de l podemos hacer anlisis de diversas
situaciones de una empresa o de algn campo de la sociedad.
Un estadstico es una medida usada para describir alguna caracterstica de una
muestra, tal como una media aritmtica, una mediana o una desviacin estndar
de una muestra.
Una parmetro es una medida usada para describir alguna caracterstica de una
poblacin, tal como una media aritmtica, una mediana o una desviacin estndar
de una poblacin. El proceso de estimacin en inferencia estadstica puede ser
descrito como el proceso de estimar un parmetro a partir del estadstico
correspondiente, tal como usar una media muestral
Distribucin en el muestreo: Cuando el tamao de la muestra (n) es ms pequeo
que el tamao de la poblacin (N), dos o ms muestras pueden ser extradas de la
misma poblacin. Un cierto estadstico puede ser calculado para cada una de las
muestras posibles extradas de la poblacin. Una distribucin del estadstico
obtenido de las muestras es llamado la distribucin en el muestreo del estadstico.
Por ejemplo, si la muestra tiene 2 elementos y la poblacin 3 elementos (A, B, C),
es posible extraer 3 muestras ( AB, BC Y AC) de la poblacin. Podemos calcular la
media para cada muestra. Por lo tanto, tenemos 3 medias mustrales para las 3
muestras. Las 3 medias mustrales forman una distribucin. La distribucin de las
medias es llamada la distribucin de las medias mustrales, o la distribucin en el
muestreo de la media. De la misma manera, la distribucin de las proporciones (o
TEORA BSICA
DEL MUESTREO

80
porcentajes) obtenida de todas las muestras posibles del mismo tamao, extradas
de una poblacin, es llamada la distribucin en el muestreo de la proporcin.
Error Estndar: La desviacin estndar de una distribucin, en el muestreo de un
estadstico, es frecuentemente llamada el error estndar del estadstico. Por
ejemplo, la desviacin estndar de las medias de todas la muestras posibles del
mismo tamao, extradas de una poblacin, es llamada el error estndar de la
media. De la misma manera, la desviacin estndar de la poblacin de todas las
muestras posibles del mismo tamao, es llamada el error estndar de la poblacin.
La diferencia entre los trminos "desviacin estndar" y "error de estndar" es que
la primera se refiere a los valores originales, mientras que la ltima est
relacionada con valores calculados. Un estadstico es un valor calculado, obtenido
con los elementos incluidos en una muestra.
Error muestral o error de muestreo La diferencia entre el resultado obtenido de
una muestra (un estadstico) y el resultado que deberamos haber obtenido de la
poblacin (el parmetro correspondiente) se llama el error muestral o error de
muestreo. Un error de muestreo usualmente ocurre cuando no se lleva a cabo la
encuesta completa de la poblacin, sino que se toma una muestra para estimar las
caractersticas de la poblacin. El error muestral es medido por el error estadstico,
en trminos de probabilidad, bajo la curva normal. El resultado de la media indica
la precisin de la estimacin de la poblacin basada en el estudio de la muestra.
Mientras ms pequeo es el error muestral, mayor es la precisin de la
estimacin. Deber hacerse notar que los errores cometidos en una encuesta por
muestreo, tales como respuestas inconsistentes, incompletas o no determinadas,
no son considerados como errores mustrales. Los errores no mustrales pueden
tambin ocurrir en una encuesta completa de la poblacin.

MTODOS DE SELECCIN DE MUESTRAS.

Una muestra debe ser representativa si va a ser usada para estimar las
caractersticas de la poblacin. Los mtodos para seleccionar una muestra
representativa son numerosos, dependiendo del tiempo, dinero y habilidad

81
disponibles para tomar una muestra y la naturaleza de los elementos individuales
de la poblacin. Los mtodos de seleccin de muestras pueden ser clasificados de
acuerdo a:
- El nmero de muestras tomadas de una poblacin dada para un estudio
y
- La manera usada en seleccionar los elementos incluidos en la muestra.
Los mtodos de muestreo basados en los dos tipos de clasificaciones son
expuestos en seguida.

MTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON EL NMERO
DE MUESTRAS TOMADAS DE UNA POBLACIN.

Bajo esta clasificacin, hay tres tipos comunes de mtodos de muestreo. Estos
son, muestreo simple, doble y mltiple.
Muestreo simple
Este tipo de muestreo toma solamente una muestra de una poblacin dada para el
propsito de inferencia estadstica. Puesto que solamente una muestra es tomada,
el tamao de muestra debe ser lo suficientemente grande para extraer una
conclusin. Una muestra grande muchas veces cuesta demasiado dinero y
tiempo.
Muestreo doble
Bajo este tipo de muestreo, cuando el resultado del estudio de la primera muestra
no es decisivo, una segunda muestra es extrada de la misma poblacin. Las dos
muestras son combinadas para analizar los resultados. Este mtodo permite a una
persona principiar con una muestra relativamente pequea para ahorrar costos y
tiempo. Si la primera muestra arroja un resultado definitivo, la segunda muestra
puede no necesitarse.
Por ejemplo, al probar la calidad de un lote de productos manufacturados, si la
primera muestra arroja una calidad muy alta, el lote es aceptado; si arroja una
calidad muy pobre, el lote es rechazado. Solamente si la primera muestra arroja
una calidad intermedia, ser necesaria la segunda muestra. Un plan tpico de

82
muestreo doble puede ser obtenido de la Military Standard Sampling Procedures
and Tables for Inspection by Attributes, publicada por el Departamento de Defensa
y tambin usado por muchas industrias privadas. Al probar la calidad de un lote
consistente de 3,000 unidades manufacturadas, cuando el nmero de defectos
encontrados en la primera muestra de 80 unidades es de 5 o menos, el lote es
considerado bueno y es aceptado; si el nmero de defectos es 9 o ms, el lote es
considerado pobre y es rechazado; si el nmero est entre 5 y 9, no puede
llegarse a una decisin y una segunda muestra de 80 unidades es extrada del
lote. Si el nmero de defectos en las dos muestras combinadas (incluyendo 80 +
80 = 160 unidades) es 12 o menos, el lote es aceptado si el nmero combinado es
13 o ms, el lote es rechazado.
Muestreo mltiple
El procedimiento bajo este mtodo es similar al expuesto en el muestreo doble,
excepto que el nmero de muestras sucesivas requerido para llegar a una
decisin es ms de dos muestras.

MTODOS DE MUESTREO CLASIFICADOS DE ACUERDO CON LAS
MANERAS USADAS EN SELECCIONAR LOS ELEMENTOS DE UNA MUESTRA.

Los elementos de una muestra pueden ser seleccionados de dos maneras
diferentes:
a. Basados en el juicio de una persona.
b. Seleccin aleatoria (al azar)
Muestreo de juicio
Una muestra es llamada muestra de juicio cuando sus elementos son
seleccionados mediante juicio personal. La persona que selecciona los elementos
de la muestra, usualmente es un experto en la medida dada. Una muestra de
juicio es llamada una muestra probabilstica, puesto que este mtodo est basado
en los puntos de vista subjetivos de una persona y la teora de la probabilidad no
puede ser empleada para medir el error de muestreo, Las principales ventajas de

83
una muestra de juicio son la facilidad de obtenerla y que el costo usualmente es
bajo.
Muestreo Aleatorio
Una muestra se dice que es extrada al azar cuando la manera de seleccin es tal,
que cada elemento de la poblacin tiene igual oportunidad de ser seleccionado.
Una muestra aleatoria es tambin llamada una muestra probabilstica. Son
generalmente preferidas por los estadsticos porque la seleccin de las muestras
es objetiva y el error muestral puede ser medido en trminos de probabilidad bajo
la curva normal. Los tipos comunes de muestreo aleatorio son el muestreo
aleatorio simple, muestreo sistemtico, muestreo estratificado y muestreo de
conglomerados.
Muestreo aleatorio simple
Una muestra aleatoria simple es seleccionada de tal manera que cada muestra
posible del mismo tamao tiene igual probabilidad de ser seleccionada de la
poblacin. Para obtener una muestra aleatoria simple cada elemento en la
poblacin debe tener la misma probabilidad de ser seleccionado. El plan de
muestreo puede no conducir a una muestra aleatoria simple. Por conveniencia,
este mtodo pude ser reemplazado por una tabla de nmeros aleatorios. Cuando
una poblacin es infinita, es obvio que la tarea de numerar cada elemento de la
poblacin es imposible. Por lo tanto, ciertas modificaciones del muestreo aleatorio
simple son necesarias. Los tipos ms comunes de muestreo aleatorio modificado
son sistemtico, estratificado y de conglomerados.
Muestreo sistemtico.
Una muestra sistemtica se obtiene cuando los elementos son seleccionados en
una manera ordenada. La manera de la seleccin depende del nmero de
elementos incluidos en la poblacin y el tamao de la muestra. El nmero de
elementos en la poblacin es, primero, dividido por el nmero deseado en la
muestra. El cociente indicar si cada dcimo, cada onceavo, o cada centsimo
elemento en la poblacin va a ser seleccionado.
El primer elemento de la muestra es seleccionado al azar. Por lo tanto, una
muestra sistemtica puede dar la misma precisin de estimacin acerca de la

84
poblacin, que una muestra aleatoria simple cuando los elementos en la poblacin
estn ordenados al azar.
Muestreo Estratificado
Para obtener una muestra aleatoria estratificada, primero se divide la poblacin en
grupos, llamados estratos, que son ms homogneos que la poblacin como un
todo. Los elementos de la muestra son entonces seleccionados al azar o por un
mtodo sistemtico de cada estrato. Las estimaciones de la poblacin, basadas en
la muestra estratificada, usualmente tienen mayor precisin (o menor error
muestral) que si la poblacin entera es muestreada mediante muestreo aleatorio
simple. El nmero de elementos seleccionado de cada estrato puede ser
proporcional o desproporcional al tamao del estrato en relacin con la poblacin.
Muestreo de conglomerados.
Para obtener una muestra de conglomerados, primero se divide la poblacin en
grupos que son convenientes para el muestreo. En seguida, se selecciona una
porcin de los grupos al azar o por un mtodo sistemtico. Finalmente, se toman
todos los elementos o parte de ellos al azar o por un mtodo sistemtico. Bajo
este mtodo, aunque no todos los grupos son muestreados, cada grupo tiene una
igual probabilidad de ser seleccionado. Por lo tanto la muestra es aleatoria.
Una muestra de conglomerados, usualmente produce un mayor error muestral
(por lo tanto, da menor precisin de las estimaciones acerca de la poblacin) que
una muestra aleatoria simple del mismo tamao. Los elementos individuales
dentro de cada "conglomerado" tienden usualmente a ser iguales. Por ejemplo la
gente rica puede vivir en el mismo barrio, mientras que la gente pobre puede vivir
en otra rea. No todas las reas son muestreadas en un muestreo de reas. La
variacin entre los elementos obtenidos de las reas seleccionadas es, por lo
tanto, frecuentemente mayor que la obtenida si la poblacin entera es muestreada
mediante muestreo aleatorio simple. Esta debilidad puede reducirse cuando se
incrementa el tamao de la muestra de rea.
El incremento del tamao de la muestra puede fcilmente ser hecho en el rea.
Los entrevistadores no tienen que caminar demasiado lejos en una pequea rea

85
para entrevistar ms familias. Por lo tanto, una muestra grande puede ser obtenida
dentro de un corto perodo de tiempo y a bajo costo en un rea determinada.
Por otra parte, una muestra de conglomerados puede producir la misma precisin
en la estimacin que una muestra aleatoria simple, si la variacin de los elementos
individuales dentro de cada conglomerado es tan grande como la de la poblacin.
Muestreo aleatorio
Consideremos una poblacin finita, de la que deseamos extraer una muestra.
Cuando el proceso de extraccin es tal que garantiza a cada uno de los elementos
de la poblacin tengan la misma oportunidad de ser incluidos en dicha muestra,
denominamos al proceso de seleccin muestreo aleatorio.
El muestreo aleatorio se puede plantear bajo dos puntos de vista:
- Sin reposicin de los elementos;
- Con reposicin.
Muestreo aleatorio sin reposicin
Consideremos una poblacin E formada por N elementos. Si observamos un
elemento particular, ee E en un muestreo aleatorio sin reposicin se da la
siguiente circunstancia:
- La probabilidad de que e sea elegido en primer lugar es 1/N
- Si no ha sido elegido en primer lugar (lo que ocurre con una probabilidad de
(N-1)/N), la probabilidad de que sea elegido en el segundo intento es de
1/(N-1).
- en el (i+1) simo intento, la poblacin consta de N-i elementos, con lo cual
si e no ha sido seleccionado previamente, la probabilidad de que lo sea en
este momento es de 1/(N-i).
Si consideramos una muestra de n s N elementos, donde el orden en la eleccin
de los mismos tiene importancia, la probabilidad de eleccin de una muestra
cualquiera es

86


Lo que corresponde en el sentido de la definicin de probabilidad de Laplace a un
caso posible entre las VN, n posibles n-uplas de N elementos de la poblacin.

Si el orden no interviene, la probabilidad de que una muestra


sea elegida es la suma de las probabilidades de elegir una cualquiera de sus n-
uplas, tantas veces como permutaciones en el orden de sus elementos sea
posible, es decir




Muestreo aleatorio con reposicin
Sobre una poblacin E de tamao N podemos realizar extracciones de n
elementos, pero de modo que cada vez el elemento extrado es repuesto al total
de la poblacin. De esta forma un elemento puede ser extrado varias veces. Si el

87
orden en la extraccin de la muestra interviene, la probabilidad de una cualquiera
de ellas, formada por n elementos es:




Si el orden no interviene, la probabilidad de una muestra cualquiera, ser la suma
de la anterior, repitindola tantas veces como manera de combinar sus elementos
sea posible. Es decir,
Sea n1 el nmero de veces que se repite cierto elemento e1 en la muestra;
Sea n2 el nmero de veces que se repite cierto elemento e2;
Sea nk el nmero de veces que se repite cierto elemento ek,
de modo que . Entonces la probabilidad de obtener la
muestra es





es decir,




88
El muestreo aleatorio con reposicin es tambin denominado muestreo aleatorio
simple, que como hemos mencionado se caracteriza por que
- cada elemento de la poblacin tiene la misma probabilidad de ser elegido, y
- las observaciones se realizan con reemplaza miento. De este modo, cada
observacin es realizada sobre la misma poblacin (no disminuye con las
extracciones sucesivas).
Sea X una variable aleatoria definida sobre la poblacin E, y f(x) su ley de
probabilidad.




En una muestra aleatoria simple, cada observacin tiene la distribucin de
probabilidad de la poblacin:

Adems todas las observaciones de la variable aleatoria son independientes, es
decir


TABLAS DE NMEROS ALEATORIOS: LOTERA NACIONAL

Un ejemplo de una tabla de nmeros aleatorios consiste en la lista de los nmeros
de Lotera Nacional premiados a lo largo de su historia, pues se caracterizan por
que cada dgito tiene la misma probabilidad de ser elegido, y su eleccin es
independiente de las dems extracciones.
Un modo de hacerlo es el siguiente. Supongamos que tenemos una lista de
nmeros aleatorios de k=5 cifras (00000-99.999), una poblacin de N=600
individuos, y deseamos extraer una muestra de n=6 de ellos. En este caso
ordenamos a toda la poblacin (usando cualquier criterio) de modo que a cada

89
uno de sus elementos le corresponda un nmero del 1 al 600. En segundo lugar
nos dirigimos a la tabla de nmeros aleatorios, y comenzando en cualquier punto
extraemos un nmero t, y tomamos como primer elemento de la muestra al
elemento de la poblacin:




El proceso se repite tomando los siguientes nmeros de la tabla de nmeros
aleatorios, hasta obtener la muestra de 10 individuos.
Las cantidades




pueden ser consideradas como observaciones de una variable aaleatoria U, que
sigue una distribucin uniforme en el intervalo [0,1]



MTODO DE MONTECARLO

El mtodo de Montecarlo es una tcnica para obtener muestras aleatorias simples
de una variable aleatoria X, de la que conocemos su ley de probabilidad (a partir
de su funcin de distribucin F). Con este mtodo, el modo de elegir
aleatoriamente un valor de X es siguiendo su ley de probabilidad:
1. Usando una tabla de nmeros aleatorios se toma un valor u de una variable
aleatoria

90
.
2. Si X es continua, tomar como observacin de X, la cantidad x=F
-1
(u). En el caso
en que X sea discreta se toma x como el percentil de X, es decir el valor
ms pequeo que verifica que
.
Este proceso se debe repetir n veces para obtener una muestra de tamao n.
Ejemplo
Si queremos extraer n=10 muestras de una distribucin N(0, 1) podemos recurrir a
una tabla de nmeros aleatorios de k=5cifras, en las que observamos las
cantidades (por ejemplo)


A partir de ellas podemos obtener una muestra de usando una tabla
de la distribucin normal:















91
Nmeros aleatorios
Muestra Muestra
ti

xi = F
-1
(ui)
76.293 0'76 0'71
31.776 0'32(=1-0'68) -0'47
50.803 0'51 0'03
71.153 0'71 0'55
20.271 0'20(=1-0'80) -0'84
33.717 0'34(=1-0'66) -0'41
17.979 0'18(=1-0'82) -0'92
52.125 0'52 0'05
41.330 0'41(=1-0'59) -0'23
95.141 0'95 1'65
Obsrvese que como era de esperar, las observaciones xi tienden a agruparse
alrededor de la esperanza matemtica de . Por otra parte,
esto no implica que el valor medio de la muestra sea necesariamente . Sin
embargo como sabemos por el teorema de Fisher que




su dispersin con respecto al valor central es pequea, lo que implica que
probablemente el valor medio estar muy prximo a 0, como se puede calcular:



92


Obsrvese que si el problema fuese el inverso, donde nicamente conocisemos
las observaciones xi y que el mecanismo que gener esos datos hubiese sido una
distribucin normal de parmetros desconocidos, con obtenida hubisemos
tenido una buena aproximacin del ``parmetro desconocido'' . Sobre esta
cuestin volveremos ms adelante al abordar el problema de la estimacin puntual
de parmetros.

















93





10. ESTIMACIN E INTERVALOS DE
CONFIANZA
Caractersticas
Determinacin del intervalo de
confianza para la media, el total y la
proporcin
Muestras grandes. Distribucin
normal
Muestras pequeas








UNIDAD
10

94








INTERVALO DE CONFIANZA.

El tema a desarrollar es intervalo de Confianza y haciendo referencia a Richard I.
Levin & David S. Rubin, en su libro de Estadstica para Administradores,
establecen el concepto de Intervalo de Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el valor real
del parmetro de poblacin.
Para entender mas claramente este concepto, es necesario comentar de inicio
otros que al estar relacionados con el, facilitan su comprensin.
Algunos de estos conceptos a revisar son:
- Estimacin.
- Estimacin Puntual.
- Estimacin de intervalo.
- Nivel de confianza.
- Limites de confianza

ESTIMACIN
Aprecio y valor que se da y en que se tasa y considera algo. || 2. Der. La que se
realiza en ciertos tributos para determinar el valor de la base imponible.
Este es el concepto que podemos encontrar en un diccionario. Pero es adems un
concepto que en nuestra vida diaria aplicamos de forma recurrente.
Todo el mundo hace estimaciones. Para cruzar una calle, y vemos venir un auto,
estimamos la velocidad de este y la distancia que hay entre nosotros y el
automvil a fin de decidir si esperamos a cruzar o echaremos a correr para cruzar
la calle.
ESTIMACIN E
INTERVALOS DE
CONFIANZA

95
Implcito esta en este ejemplo una de la razones para hacer estimaciones como
administradores, jefes o lideres de equipo: Tomar decisiones en base a un clculo,
una estimacin.
Los administradores deben hacer estimaciones rpidas, el resultado de estas
incide en la organizacin por medio de la decisin tomada a partir de la
estimacin. Se hacen estimaciones en:

- Una universidad para determinar el nivel de inscripciones ao con ao.
- En un bur de crdito, a fin de determinar si un cliente puede terminar de
pagar su deuda en un determinado tiempo, a partir de sus hbitos de
crdito previos, lo que vendra a ser el historial.
- Para fijar presupuestos, con base a informacin del pasado.

En cada uno de estos casos se esta tratando de inferir, saber algo de una
poblacin a partir de una muestra, como tomadores de decisiones, nos veremos
muchas veces forzados a tomar decisiones confiando en nuestro instinto en
nuestros presentimientos, pero lo ideal cada uno en su posicin, seria que estas
decisiones estuvieran tomadas a partir de la disposicin de informacin y aplicar
conocimientos de estadstica para desempearnos mejor.
Concluimos de inicio para el Concepto de Estimacin que las razones para su
aplicacin son las siguientes:

1. Con el fin de tomar decisiones racionales, para el beneficio de la organizacin.
2. Inferir algo, acerca a partir de la informacin de la muestra., a partir de mtodos
con precisin razonable, todo este proceso debe ser capaz de proveer de
informacin para desempearnos de la mejor manera en la toma de decisiones.

Existen dos tipos de estimacin, en lo que se refiere a una poblacin.
- Estimacin puntual.
- Estimacin de Intervalo.


96
Este ltimo concepto nos ayudara a entender el concepto objetivo de nuestra
exposicin que es Intervalo de Confianza.

ESTIMACIN PUNTUAL
Una estimacin puntual es un solo nmero que se utiliza para estimar un
parmetro (dato) de poblacin desconocido.
Ejemplo: El jefe de una Universidad estara haciendo una estimacin puntual al
afirmar: Para el siguiente ao escolar por nuestros datos actuales se indica que
en la materia de Filosofa y letras tendremos 350 estudiantes.
La afirmacin es similar a lanzar una moneda al aire: o es cierta o es falsa, solo
tiene dos opciones. Por lo tanto una estimacin puntual resulta a menudo
insuficiente, debido a que solo tiene dos opciones: es correcta o esta equivocada.
Adems si se nos dice que el jefe de departamento esta equivocado en su
estimacin, se generarla la siguiente pregunta. Que tan distante esta la
estimacin de la real? Es decir que estimacin de error posee. No es lo mismo
decir que la estimacin esta errada por 10 estudiantes que por 90, la diferencia lo
establece un concepto: CONFIABILIDAD.
Ejemplo de Estimacin Puntual: La media de la muestra es un estimador de la
media de la poblacin confiable, sobre todo cuando la muestra es lo
suficientemente grande. Pero es una estimacin puntual pues solo arroja un
resultado.
Para explicarlo, aun cuando ya es un tema visto, haremos revisin de la formula:



Donde: x, es la sumatoria de todos los elementos de la muestra.
Y n, es el numero de elementos.

Observemos el ejemplo de una compaa de suministros clnicos que produce
jeringas hipodrmicas desechables. Cada jeringa viene en una envoltura estril
que a su vez viene empacada en grandes cajas de cartn corrugado. Debido a la
X = x
n

97
forma en que empacan las jeringas en las cajas de cartn, estn manejan una
cantidad de contenido diferente, debido a que las jeringas se venden por pieza, la
compaa necesita una estimacin del nmero de pieza que hay por caja, para
propsitos de facturacin.
Se tomo la muestra aleatoria de 35 cajas, y se registro el nmero de jeringas
contenido en dicha muestra:
101 103 112 102 98 97 93
105 100 97 107 93 94 97
97 100 110 106 110 103 99
93 98 106 100 112 105 100
114 97 110 102 98 112 99

Utilizando la formula, tendremos: 3570/35=102 jeringas.
As pues al usar la media de la muestra, como nuestro estimador, la estimacin
puntual de la media es de 102 jeringas.
La conclusin a la que llegaramos con el anterior ejemplo seria:
As al usar la media de la muestra como un estimador, la estimacin puntual de la
jeringa hipodrmica desechable es de 102 jeringas por caja. El precio de
fabricacin es bastante bajo (alrededor de 25 centavos), de modo que tanto el
comprador como el vendedor aceptaran esta estimacin puntual como la base
para hacer la facturacin, y el fabricante puede ahorrarse tiempo y el gasto de
contar cada una de las jeringas contenidas en las cajas.
El propsito de tomar muestras es para conocer mas acerca de una poblacin, ya
sea, los estudiantes de ingreso al prximo ciclo escolar, o el total de un embarque
de jeringas hipodrmicas, como en el ejemplo anterior, cuyo anlisis parti de una
muestra de 35 cajas.
Para hacerlo, podemos basarnos en estimaciones puntuales, como lo es la media
de la muestra, o con Estimaciones de intervalo, nuestro siguiente tema.


98
ESTIMACIN DE INTERVALO.-
Una estimacin de Intervalo, describe un intervalo de valores dentro del cual es
posible que este un parmetro de poblacin.
Dentro de sus caractersticas encontramos:
- Dentro de las estimaciones de Intervalo, se maneja un concepto adicional,
que implica la incertidumbre que acompaara dicha estimacin.
- Una afirmacin acerca del intervalo dentro del cual es probable que este la
media de poblacin desconocida.
- Para proporcionar dicha afirmacin, se necesita encontrar el error estndar
de la media.

Para explicarlo mejor nos apoyaremos en el siguiente ejemplo:
Suponga que el director de investigaciones de mercado de una fbrica de
refacciones automotrices necesita hacer una estimacin de la vida promedio de
las bateras para automvil que su compaa produce. Se selecciona una muestra
aleatoria de 200 bateras, se registro en nombre de los propietarios de los
automviles y su direccin, de la misma manera se entrevisto a estas personas
con respecto a la duracin de la batera de su automvil. Despus de realizar la
aplicacin de la formula de la media de la muestra, tenemos como resultado: 36
meses de vida promedio.
Si se utiliza la estimacin puntual de la media de la muestra como el mejor
estimador de la media de la poblacin se informara que la vida media de las
bateras de la empresa es de 36 meses.
Pero supongamos que el director tambin conocer acerca de la incertidumbre que
probablemente acompaara a la estimacin, es decir una afirmacin acerca del
intervalo dentro de lo cual es posible que este la media de la poblacin
desconocida. Eso se determina calculando el error estndar de la media.
Para esto se utiliza la formula de clculo de error estndar de la media:


Donde o es la desviacin estndar y n el nmero de observaciones.

99
Supongamos que previamente se hizo el clculo de la desviacin estndar de las
200 bateras, y se ha determinado que es de 10 meses. Utilizando dicho dato y la
formula que indicamos en el recuadro anterior. Resultara as: o=0.707 meses
Ahora se puede concluir que la estimacin de la vida til de un las bateras de la
compaa es de 36 meses, y el error estndar que acompaa a dicha estimacin
es .707. En otras palabras, la vida til real para todas las bateras puede estar en
alguna parte de esta estimacin de intervalo comprendida entre 35.293 y 36.707
meses.
Nos hemos acercado ya entonces al concepto inicial de la exposicin, Intervalo de
confianza, a fin de entender Estimacin de Intervalo, marcando su diferencia con
Estimacin Puntual.
Recordemos el concepto de Richard I. Levin & David S. Rubin, en su libro de
Estadstica para Administradores, establecen el concepto de Intervalo de
Confianza de la siguiente forma:
Intervalo de valores que tiene designada una probabilidad que incluya el valor real
del parmetro de poblacin.
Porque hacemos esto, para entender el concepto de Nivel de confianza de un
Intervalo, esto es la probabilidad de que el verdadero parmetro de la estimacin
este dentro de la estimacin de intervalo.
Es decir apoyndonos en el ejemplo de las 200 bateras, cuantas de estas caeran
dentro del intervalo en donde se encuentra la media de la muestra., con los limites
que hemos establecidos con la formula de Error estndar de la media.
NIVEL DE CONFIANZA.-
En la estadstica la probabilidad que asociamos o relacionamos con una
estimacin de intervalo es conocida como Nivel de Confianza.
Que tanta confianza tenemos que la estimacin que hicimos de un intervalo,
incluya la mayor parte de la muestra, es decir los casos analizados.
Analicemos un caso prctico:
Considere por ejemplo el caso de un cliente de una tienda de electrodomsticos
que pregunta sobre el tiempo de espera para la entrega de una lavadora de ropa
nueva. En la tabla se aprecia las preguntas que el cliente puede hacer y las

100
probables respuestas. Si se observa se puede ver que existe una relacin directa
entre el nivel de confianza y el intervalo de confianza de cualquier estimacin.

Pregunta del
Cliente
Respuesta del
Empleado.
Nivel de
Confianza
Intervalo de
Confianza
Implicado
Llegara la
lavadora en un
ao?
Tengo la certeza de
ello.
Mayor a
99%
Un ao.
Me entregaran la
lavadora dentro de
un mes?
Estoy casi seguro
de que llegara en
un mes.
Al menos
95%
Un mes
Me entregaran la
lavadora en una
semana?
Estoy bastante
seguro.
Alrededor
de 80%
Una semana
Me entregaran la
lavadora maana?
No tengo la certeza
de poder hacerlo.
Cerca de
40%
Un da
Llegara la
lavadora antes de
que llegue a casa?
Hay una mnima
posibilidad de
poder lograrlo.
Cerca de
1%
Una hora.

- Se nota que cuando el intervalo de confianza es ms amplio o extenso,
como en el caso de la entrega que tarda un ao, la estimacin toma un
valor muy poco real, a pesar de que el administrador le da un nivel de
confianza de 99% a dicha estimacin.
- A medida que el cliente estable un intervalo mas estrecho (el tiempo de
entrega), el administrador de la tienda consiente un nivel de confianza mas
bajo, llegara la lavadora antes que llegue yo a casa?, la estimacin de
confianza tiene un nivel muy bajo (1%).
Encontramos de esta forma el intervalo de confianza del anterior ejemplo:

101

N.C. Intervalo
Mayor a
99%
Un ao.
Al menos
95%
Un mes

LIMITES DE CONFIANZA.-
A menudo el intervalo de confianza se expresa en trminos de errores estndar,
ms que con valores numricos. De la siguiente forma.
x 1.64 x en la que:
x + 1.64 x = limite superior del intervalo.
x - 1.64 x = limite inferior del intervalo.
A estos lmites se les conoce como limites de Confianza del intervalo de
Confianza. (LIC)





BIBLIOGRAFA

- Larios Osorio, Vctor. Probabilidad. Mxico, 1999.
- Lind, Douglas A. Estadstica aplicada a los negocios y la economa.
Mxico, Mc. Graw Gill, 2005
- Lind, Marchal, Mason. Estadstica para administracin y economa. Mxico,
Alfa omega, 2006
- Newbold, P. Estadstica para los negocios y la Economa. Mxico, Pearson,
2005
- Rodas, Olger. Teora bsica del Muestreo. Mxico, 2003.
- Stevenson, J. William Estadstica para administracin y economa. Mxico,
Alfa omega, 2006

102
- Universidad de Mlaga. Muestreo Aleatorio. Mxico, 2002.
- Vega Trujillo, Mara del Pilar. Distribucin de Frecuencias. Mxico, 2005.
- Zadu, Ins. Distribuciones de Probabilidad. Mxico, 2004.

Das könnte Ihnen auch gefallen