Sie sind auf Seite 1von 107

UNIDAD 1

DISTRIBUCIONES DE FRECUENCIA
1.1 CONCEPTO DE ESTADSTICA Y SU CLASIFICACION
Qu es la estadst!a"
Cuando coloquialmente se habla de estadstica, se suele pensar en una relacin
de datos numricos presentada de forma ordenada y sistemtica. Esta idea es la
consecuencia del concepto popular que existe sobre el trmino y que cada vez
est ms extendido debido a la influencia de nuestro entorno, ya que hoy da es
casi imposible que cualquier medio de difusin, peridico, radio, televisin, etc, no
nos aborde diariamente con cualquier tipo de informacin estadstica sobre
accidentes de trfico, ndices de crecimiento de poblacin, turismo, tendencias
polticas, etc.
lo cuando nos adentramos en un mundo ms especfico como es el campo de
la investi!acin de las Ciencias ociales" #edicina, $iolo!a, %sicolo!a, ...
empezamos a percibir que la Estadstica no slo es al!o ms, sino que se
convierte en la &nica herramienta que, hoy por hoy, permite dar luz y obtener
resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos
y relaciones, por su variabilidad intrnseca, no puedan ser abordadas desde la
perspectiva de las leyes deterministas. %odramos, desde un punto de vista ms
amplio, definir la estadstica como la ciencia que estudia cmo debe emplearse la
informacin y cmo dar una !ua de accin en situaciones prcticas que entra'an
incertidumbre.
(a Estadst!a se ocupa de los mtodos y procedimientos para reco!er, clasificar,
resumir, hallar re!ularidades y analizar los datos, siempre y cuando la variabilidad
e incertidumbre sea una causa intrnseca de los mismos) as como de realizar
inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y
en su caso formular predicciones.
%odramos por tanto clasificar la Estadstica en descriptiva, cuando los resultados
del anlisis no pretenden ir ms all del con*unto de datos, e inferencial cuando el
ob*etivo del estudio es derivar las conclusiones obtenidas a un con*unto de datos
ms amplio.
Clas#!a!$% de la Estadst!a
Estadst!a Ciencia que reco!e y or!aniza datos de forma
sistemtica. +atos numricos sistemticamente
recolectados y or!anizados.
Estadst!a des!&'t(a ,r!anizacin de los datos en tablas y !rficas. e
encar!a de establecer los parmetros que definen
una poblacin.
Estadst!a )ate)*t!a Comparacin de medidas calculadas mediante
distribuciones de probabilidades"
Estadst!a %+ 'a&a)t&!a %ruebas estadsticas aplicadas cuando se supone
que los datos -no- se distribuyen normalmente.
Estadst!a 'a&a)t&!a %ruebas estadsticas aplicadas cuando se supone
que los datos se distribuyen normalmente.
1., RECOPILACION DE DATOS
Re!+'la!$% de dat+s- +eber diri!irse al re!istro de aquellos hechos que
permitan conocer y analizar lo que realmente sucede en la unidad o tema que se
investi!a. Esto consiste en la recoleccin, sntesis, or!anizacin y comprensin de
los datos que se requieren.
e conocen dos tipos de fuentes"
%rimarias" que contienen informacin ori!inal no abreviada ni traducida.
ecundarias" obras de referencia que auxilian al proceso de investi!acin.
e conoce otra divisin que se conforma por las si!uientes fuentes
+ocumentales
+e campo.
FIC.AS BIBLIO/R0FICAS1 DE TRABA2O Y .E3ERO/R0FICAS
(as fuentes de recoleccin de datos son todos los re!istros de aquellos hechos
que permitan conocer y analizar lo que realmente sucede en el tema que se
investi!a.
Concluida la parte preparatoria de la investi!acin se inicia la fase de recopilacin
de datos.
%ara recabar la informacin existente sobre el tema, el investi!ador se auxilia de
instrumentos como las fichas de traba*o) hay diversos tipos de fichas de traba*o
como"
.ichas de traba*o para fuentes documentales, fichas de traba*o de una revista,
fichas de traba*o de un peridico, para investi!acin de campo, para observacin,
fichas biblio!rficas y hemero!rficas.
ENCUESTA1 CUESTIONARIO Y ENTRE4ISTA
/Entrevista" esta herramienta consiste bsicamente en reunirse una o varias
personas y cuestionarlas en forma adecuada para obtener informacin.
/Cuestionario" estn constituidos por series de pre!untas escritas,
predefinidas, secuenciadas y separadas por captulos o temtica especfica.
/Encuesta" la recoleccin de informacin se hace a travs de formularios,
los cuales tienen aplicacin en aquellos problemas que se pueden investi!ar
por mtodos de observacin, anlisis de fuentes documentales y dems
sistemas de conocimiento.
AN0LISIS E INTERPRETACI5N DE INFOR3ACI5N
(a interpretacin de los resultados de la inda!acin lleva inmediatamente a la
solucin.
El anlisis del instrumento de recoleccin de informacin de campo 0encuesta1, fue
utilizando el anlisis individual de pre!untas que se realiza con base en los
porcenta*es que alcanzan las distintas respuestas de cada pre!unta.
%ara llevar a cabo este tipo de anlisis se dise'o una forma donde se tabulan las
respuestas en base a la cantidad de personas que contestaron cada respuesta y
el porcenta*e que representa del total de la muestra.
REDACCI5N Y PRESENTACI5N DEL INFOR3E
El ob*etivo del informe es presentar a los lectores el proceso que se realiz para
presentar una solucin al problema planteado, para lo cual es necesario hacer la
presentacin del problema, los mtodos empleados para su estudio, los resultados
obtenidos, las conclusiones a las que se lle!aron y las recomendaciones en base
a estas.
Con respecto a la estructura del informe, sta es sencilla y si!ue fielmente los
pasos fundamentales del dise'o de la investi!acin, ya que el informe debe ser la
respuesta a lo planteado por el dise'o de investi!acin.
1.6 DISTRIBUCION DE FRECUENCIA
Dst&7u!$% de F&e!ue%!as
Cuando la informacin que se tiene es un !ran volumen, resulta muy conveniente
ordenar y a!rupar los datos para mane*arlos de acuerdo a la distribucin de
frecuencias la cual consiste en a!rupar los datos en clases o cate!oras que
estarn definidas por un lmite mnimo y uno mximo de variacin, mostrando en
cada clase el n&mero de elementos que contiene o sea la frecuencia.
1.6.1 .ISTO/RA3AS1 POL/ONOS DE FRECUENCIA1 O2I4A
Representacin Grfica
El patrn de variacin de los datos puede apreciarse me*or representando
!rficamente la informacin contenida en el cuadro.
2eneralmente los !rficos empleados para representar distribuciones de
frecuencias son " los pol!onos de frecuencias, !rficos de barras, histo!ramas,
o*ivas y !rficos de bastones
.st+8&a)a
on !rficos construidos de barras verticales sin
separaciones entre s.
%ara construir un histo!rama, se define una
escala horizontal apropiada y en ella se marcan
los lmites reales de todas las clases de la
distribucin que se quiere representar. (a escala
no necesita comenzar en cero, pero si un
intervalo de clase antes del lmite inferior de la
clase ms ba*a.
(as frecuencias se representan en la escala vertical, la cual si debe comenzar en
cero, no tener cortes o interrupciones y ser lo suficientemente amplia para incluir la
mayor de las frecuencias.
+efinidas las escalas, se procede a trazar el !rfico como en el e*emplo.
P+l8+%+ de #&e!ue%!as
El pol!ono consiste en marcar sobre cada clase un
punto, tomando como occisa el punto medio de la
clase y como ordenada la frecuencia. Esos puntos se
unen lue!o con secciones de rectas y la fi!ura
resultante es el pol!ono.
Las O9(as
Estas son en realidad pol!onos que utilizan las
frecuencias acumuladas con la salvedad de que las
ordenadas no se levanten sobre el punto medio de
la clase, sino sobre el lmite inferior o superior se!&n
se haya acumulado 0ascendente o descendente1.
Esto se hace porque debido al procedimiento de
acumulacin, la frecuencia -menos-, para un cierta
clase, incluye todas las frecuencias menores que el
lmite superior de esa clase) y la acumulada -mas
de-, todas las frecuencias mayores que el lmite
inferior de la clase.
1.: 3EDIDAS DE TENDENCIA CENTRAL PARA UN CON2UNTO DE DATOS Y
DATOS A/RUPADOS
(os fenmenos biol!icos no suelen ser constantes, por lo que ser necesario que
*unto a una medida que indique el valor alrededor del cual se a!rupan los datos,
se asocie una medida que ha!a referencia a la variabilidad que refle*e dicha
fluctuacin.
En este sentido pueden examinarse varias caractersticas, siendo las ms
comunes"
(a tendencia central de los datos)
(a dispersin o variacin con respecto a este centro)
(os datos que ocupan ciertas posiciones.
(a simetra de los datos.
(a forma en la que los datos se a!rupan.

F8u&a- #edidas representativas de un con*unto de datos
estadsticos
3 lo lar!o de este captulo, y si!uiendo este orden, iremos estudiando los
estadsticos que nos van a orientar sobre cada uno de estos niveles de
informacin" valores alrededor de los cuales se a!rupa la muestra, la mayor o
menor fluctuacin alrededor de esos valores, nos interesaremos en ciertos valores
que marcan posiciones caractersticas de una distribucin de frecuencias as como
su simetra y su forma.
1.:.1 3EDIA1 3EDIA PONDERADA
(a )eda a&t)t!a de una variable estadstica es la suma de todos sus posibles
valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de
valores de una variable X es
4 ni fi
x5 n5 f5
... ... ...
xk nk fk
la media es el valor que podemos escribir de las si!uientes formas equivalentes"
i los datos no estn ordenados en una tabla, entonces
(a media tiene las si!uientes caractersticas"
Es el centro de !ravedad de la distribucin y es &nica para cada
distribucin.
Cuando aparecen valores extremos y poco si!nificativos 0demasiado
!randes o demasiado peque'os1, la media puede de*ar de ser representativa.
6o tiene sentido en el caso de una variable cualitativa ni cuando existen
datos a!rupados con al!&n intervalo no acotado.
%ara variables a!rupadas, los xi sern las marcas declase de cada
intervalo.
3dems, la media cumple las si!uientes propiedades"
i se suma una constante a todos los valores, la media aumenta en dicha
constante.
i se multiplican todos los valores de la variable por una constante, la
media queda multiplicada por dicha constante.
O7se&(a!$%
7emos supuesto implcitamente en la definicin de media que tratbamos con una
variable X discreta. i la variable es continua tendremos que cambiar los valores
de xi por las marcas de clase correspondientes. En !eneral, la media aritmtica
obtenida a partir de las marcas de clase ci, diferir de la media obtenida con los
valores reales, xi. Es decir, habr una perdida de precisin que ser tanto mayor
cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o
sea, cuanto mayores sean las lon!itudes ai, de los intervalos.
P&+'+s!$%
(a suma de las diferencias de la variable con respecto a la media es nula, es
decir,
+emostracin
$asta desarrollar la sumatoria para obtener
Este resultado nos indica que el error cometido al aproximar un valor cualquiera de
la variable, por e*emplo x5, mediante el valor central , es compensado por los
dems errores"
i los errores se consideran con si!no positivo, en este caso no pueden
compensarse. Esto ocurre si tomamos como medida de error al!una de las
si!uientes"
que son cantidades estrictamente positivas si al!&n .
E9e)'l+
,btener las desviaciones con respecto a la media en la si!uiente distribucin y
comprobar que su suma es cero.
li85 8 li ni
9 8 59 5
59 8 :9 :
:9 8 ;9 <
;9 8 <9 ;
S+lu!$%-
li85 8 li ni xi xi ni
9 8 59 5 = = 85> 85>
59 8 :9 : 5= ;9 8> 85?
:9 8 ;9 < := 599 @5 @<
;9 8 <9 ; ;= 59= @55 @;;
nA59
(a media aritmtica es"
Como se puede comprobar sumando los elementos de la &ltima columna,
3edas 8e%e&al;adas
En funcin del tipo de problema varias !eneralizaciones de la media pueden ser
consideradas. 7e aqu al!unas de ellas aplicadas a unas observaciones x5, ..., xn"
La )eda 8e+)t&!a
, es la media de los lo!aritmos de los valores de la variable"
(ue!o
i los datos estn a!rupados en una tabla, entonces se tiene"
La )eda a&)$%!a
, se define como el recproco de la media aritmtica de los recprocos, es
decir,
%or tanto,
La )eda !uad&*t!a
, es la raz cuadrada de la media aritmtica de los cuadrados"
1.:., 3EDINA
Consideramos una variable discreta X cuyas observaciones en una tabla
estadstica han sido ordenadas de menor a mayor. (lamaremos )eda%a, Medal
primer valor de la variable que de*a por deba*o de s al de las observaciones.
%or tanto, si n es el n&mero de observaciones, la mediana corresponder a la
observacin BnC:D@5, donde representamos por la parte entera de un n&mero.

En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la
frmula de la mediana se complica un poco ms 0pero no demasiado1" ea 0li85,liD el
intervalo donde hemos encontrado que por deba*o estn el de las
observaciones. Entonces se obtiene la mediana a partir de las frecuencias
absolutas acumuladas, mediante interpolacin lineal 0teorema de Ehales1.
F8u&a- Clculo !eomtrico de la mediana
O7se&(a!$%
(a relacin Corresponde a definir para cada posible observacin, , su
frecuencia relativa acumulada, F0x1, por interpolacin lineal entre los valores F0lj851
A Fj85 y F0lj1 A Fj de forma que
+e este modo, Med es el punto donde . Esto equivale a decir que la
mediana divide al histo!rama en dos partes de reas i!uales a .
O7se&(a!$%
Entre las propiedades de la mediana, vamos a destacar las si!uientes"
Como medida descriptiva, tiene la venta*a de no estar afectada por las
observaciones extremas, ya que no depende de los valores que toma la
variable, sino del orden de las mismas. %or ello es adecuado su uso en
distribuciones asimtricas.
Es de clculo rpido y de interpretacin sencilla.
3 diferencia de la media, la mediana de una variable discreta es siempre un
valor de la variable que estudiamos 0e*. (a mediana de una variable nmero de
hijos toma siempre valores enteros1.
i una poblacin est formada por : subpoblaciones de medianas Med5 y
Med:, slo se puede afirmar que la mediana, Med, de la poblacin est
comprendida entre Med5 y Med:
El mayor defecto de la mediana es que tiene unas propiedades
matemticas complicadas, lo que hace que sea muy difcil de utilizar en
inferencia estadstica.
Es funcin de los intervalos esco!idos.
%uede ser calculada aunque el intervalo inferior o el superior no ten!a
lmites.
(a suma de las diferencias de los valores absolutos de n puntuaciones
respecto a su mediana es menor o i!ual que cualquier otro valor. Este es el
equivalente al teorema de FGni! 0proposicin :.51 con respecto a la media,
pero donde se considera como medida de dispersin a"
E9e)'l+
ea X una variable discreta que ha presentado sobre una muestra las
modalidades
i cambiamos la &ltima observacin por otra anormalmente !rande, esto no afecta
a la mediana, pero si a la media"
En este caso la media no es un posible valor de la variable 0discreta1, y se ha visto
muy afectada por la observacin extrema. Este no ha sido el caso para la
mediana.
E9e)'l+
,btener la media aritmtica y la mediana en la distribucin ad*unta. +eterminar
!rficamente cul de los dos promedios es ms si!nificativo.
li85 8 li ni
9 8 59 H9
59 8 :9 ?9
:9 8 ;9 ;9
;9 8 599 :9
599 8 =99 59
S+lu!$%-
li85 8 li ni ai xi xi ni Ni
9 8 59 H9 59 = ;99 H9 H9
59 8 :9 ?9 59 5= 5.:99 5<9 ?9
:9 8 ;9 ;9 59 := I=9 5I9 ;9
;9 8 599 :9 I9 H= 5.;99 5>9 :,>
599 8 =99 59 <99 ;99 ;.999 :99 9,:=
nA:99
(a media aritmtica es"
(a primera frecuencia absoluta acumulada que supera el valor nC:A599 es NiA5<9.
%or ello el intervalo mediano es B59):91. 3s"
%ara ver la representatividad de ambos promedios, realizamos el histo!rama de la
fi!ura :.;, y observamos que dada la forma de la distribucin, la mediana es ms
representativa que la media.

F8u&a- %ara esta distribucin de frecuencias es ms
representativo usar como estadstico de tendencia central la
mediana que la media.
1.:.6 3ODA
(a moda se suele definir como el valor ms frecuente. En el caso de una variable
no a!rupada, es el valor de la variable que ms se repite. En el caso de una
variable a!rupada por intervalos de i!ual amplitud se busca el intervalo de mayor
frecuencia 0intervalo o clase modal1 y se aproxima la moda por el valor obtenido al
aplicar la frmula
donde"
(i85 es el lmite inferior del intervalo modal.
ni es la frecuencia absoluta del intervalo modal.
ni85 es la frecuencia absoluta del intervalo anterior al intervalo
modal.
ni@5 es la frecuencia absoluta del intervalo posterior al intervalo
modal.
ci es la amplitud del intervalo.
(a moda cumple que
%uede ser que exista ms de una moda. En dicho caso, se dice que la
distribucin es bimodal, trimodal, ..., se!&n el n&mero de valores que presentan
la mayor frecuencia absoluta.
(a moda es menos representativa que la media, a excepcin de las
distribuciones con datos cualitativos.
i los intervalos no tienen la misma amplitud, se busca el intervalo de
mayor densidad de frecuencia 0que es el cociente entre la frecuencia absoluta
y la amplitud del intervalo" 1 y se calcula con la frmula anterior.
(lamaremos )+da a cualquier mximo relativo de la distribucin de frecuencias,
es decir, cualquier valor de la variable que posea una frecuencia mayor que su
anterior y su posterior.

F8u&a- Clculo !eomtrico de la moda
En el caso de variables continuas es ms correcto hablar de intervalos modales.
Jna vez que este intervalo, 0li85, liD, se ha obtenido, se utiliza la si!uiente frmula
para calcular la moda, que est motivada en la fi!ura :.<"
O7se&(a!$%
+e la moda destacamos las si!uientes propiedades"
Es muy fcil de calcular.
%uede no ser &nica.
Es funcin de los intervalos ele!idos a travs de su amplitud, n&mero y
lmites de los mismos.
3unque el primero o el &ltimo de los intervalos no posean extremos inferior
o superior respectivamente, la moda puede ser calculada.
1.:.: RELACION ENTRE 3EDIA1 3EDIANA Y 3ODA
En el caso de distribuciones unimodales, la mediana est con frecuencia
comprendida entre la media y la moda 0incluso ms cerca de la media1.
En distribuciones que presentan cierta inclinacin, es ms aconse*able el uso de la
mediana. in embar!o en estudios relacionados con propsitos estadsticos y de
inferencia suele ser ms apta la media.
Keamos un e*emplo de clculo de estas tres ma!nitudes.
E9e)'l+
Consideramos una tabla estadstica relativa a una variable continua, de la que nos
dan los intervalos, las marcas de clase ci, y las frecuencias absolutas, ni.
Lntervalo
s
ci ni
9 88 : 5 :
: 88 < ; 5
< 88 H = <
H 88 ? I ;
? 8 59 > :
%ara calcular la media podemos a'adir una columna con las cantidades . (a
suma de los trminos de esa columna dividida por nA5: es la media"
Lntervalo
s
ci ni Ni
9 88 : 5 : : :
: 88 < ; 5 ; ;
< 88 H = < < :9
H 88 ? I ; 59 :5
? 8 59 > : 5: 5?
5: H<
(a mediana es el valor de la variable que de*a por deba*o de s a la mitad de las n
observaciones, es decir H. Construimos la tabla de las frecuencias absolutas
acumuladas, Ni, y vemos que eso ocurre en la modalidad tercera, es decir,
%ara el clculo de la , lo primero es encontrar los intervalos modales,
buscando los mximos relativos en la columna de las frecuencias absolutas, ni.
Kemos que hay dos modas, correspondientes a las modalidades iA5, iA;. En el
primer intervalo modal, 0l9,5DA09,:D, la moda se calcula como
El se!undo intervalo modal es 0l:,l;DA0<)HD, siendo la moda el punto perteneciente al
mismo que se obtiene como"
En este caso, como se ve en la fi!ura :.=, la moda no toma un valor &nico, sino el
con*unto
1.= 3EDIDAS DE DISPERSI5N PARA UN CON2UNTO DE DATOS Y DATOS
A/RUPADOS
Lma!ina que tenemos ; con*untos de personas y nos dicen que en todos los
casos, la media del peso es ==. Mi!nifica esto que los tres con*untos de datos
son i!uales o similaresN Conse!uimos los datos ori!inales y nos encontramos con
que las observaciones son las si!uientes"
2rupo 5" == == == == == == ==
2rupo :" <I =5 =< == =H => H;
2rupo ;" ;> <I =; == =I H; I5
vemos que, aunque la media es la misma, los con*untos de datos son muy
diferentes. .*ate si hacemos el dia!rama de tallo y ho*as lo que obtenemos
=
=
=
=
=
=
=
; < = H I


>
H
=
<
I 5 ;
; < = H I




I
=
> I 5 ; 5
; < = H I
Entonces Mcmo podemos detectar esas diferencias entre los con*untos de datosN
%arece que las medidas de centralizacin no nos proporcionan informacin
suficiente en muchas situaciones, as que debemos encontrar al!una otra cantidad
que nos di!a cmo de le*os estn los datos entre ellos y de la media, es decir, nos
sur*e la necesidad de medir la dispersin de los datos. (o primero que vemos es
que en el primer caso todos los datos son i!uales, en el se!undo hay ms
diferencia entre el mayor y el menor, y en el tercero ms a&n que en el se!undo.
Exactamente tenemos que
==8==A9
H;8<IA5H
I58;>A;:
3 esta cantidad la llamamos rango de los datos. in embar!o, aunque es muy fcil
de calcular, no se usa demasiado, porque si hay un slo valor muy !rande o muy
peque'o, el ran!o vara mucho, as que no siempre es una medida &til. MCmo
podramos encontrar un n&mero que nos d una aproximacin de la distancia de
los datos a la mediaN %ues podemos calcular todas las diferencias 0en valor
absoluto1 entre las observaciones y la media y lue!o calcular la media de esas
diferencias. 3 esta cantidad la llamamos desviacin media. Calculemos la
desviacin media del !rupo : de datos, tenemos
in embar!o, habitualmente se usa otra medida de la variabilidad, que responde a
la media de los cuadrados de las desviaciones de los datos respecto a la media,
as conse!uimos que las desviaciones mayores influyan ms que las peque'as.
%ero vamos a ver la definicin ri!urosa de todos estos conceptos.
1.=.1 RAN/O
Ra%8+" mide la amplitud de los valores de la muestra y se calcula por diferencia
entre el valor ms elevado y el valor ms ba*o.
1.=., DES4IACION 3EDIA
1.=.6 4ARIAN>A
4a&a%;a" #ide la distancia existente entre los valores de la serie y la media. e
calcula como sumatoria de las diferencias al cuadrado entre cada valor y la media,
multiplicadas por el n&mero de veces que se ha repetido cada valor. El sumatorio
obtenido se divide por el tama'o de la muestra.
(a varianza siempre ser mayor que cero. #ientras ms se aproxima a cero, ms
concentrados estn los valores de la serie alrededor de la media. %or el contrario,
mientras mayor sea la varianza, ms dispersos estn.
1.=.: DES4IACION ESTANADAR
1.? COEFICIENTE DE 4ARIACI5N
1.< COEFICIENTE DE ASI3ETRA DE PEARSON
+iremos que una distribucin es simtrica cuando su mediana, su moda y su
media aritmtica coincidan. Claramente las distribuciones de los e*emplos de los
niveles de colinesterasa y del n de hijos no son por tanto, simtricas.
+iremos que una distribucin es asim!trica a la derecha si las frecuencias
0absolutas o relativas1 descienden ms lentamente por la derecha que por la
izquierda.
i las frecuencias descienden ms lentamente por la izquierda que por la derecha
diremos que la distribucin es asim!trica a la i"#uierda.
Existen varias medidas de la asimetra de una distribucin de frecuencias. 3qu
estudiaremos dos de ellas.
a. C+e#!e%te de As)et&a de Pea&s+%
e define como"
siendo cero cuando la distribucin es simtrica, positivo cuando existe
asimetra a la derecha y ne!ativo cuando existe asimetra a la izquierda.
En el e*emplo del nmero de hijos 3p es i!ual a
indicando una li!era asimetra a la izquierda en la distribucin de
frecuencias correspondiente.
+e la misma manera, para el e*emplo de los niveles de colinesterasa
tambin se observa una li!era asimetra a la izquierda, al ser
+e la definicin se observa que este coeficiente solo se podr utilizar
cuando la distribucin sea unimodal. (a otra medida de asimetra que
veremos no presenta este inconveniente
UNIDAD ,
INTREODUCCION A LA PROBABILIDAD Y 4ALOR ESPERADO
,.1 INTRODUCCION A LA PROBABILIDAD
En la sociedad francesa de 5H=9 el *ue!o era un entretenimiento corriente, sin
demasiadas restricciones le!ales. En este entretenimiento estn las races de la
teora de la probabilidad , pues cada vez se introducido *ue!os mas complicados
que de*aron de sentir la necesidad de un mtodo para calcularla probabilidad de
!anar en cada *ue!o.
(a probabilidad se obtiene dividiendo el n&mero de casos favorables entre el
n&mero de los casos posibles, por tanto la probabilidad de obtener oros al extraer
al azar una carta de una bara*a es 59C<9 A 5C< y se admitan que al repetir la
fraccin <99 veces, devolviendo la carta a la bara*a tras cada extraccin, sera
muy poco usual que la frecuencia relativa de los oros obtenidos estuviesen
ale*adas de 5C<.
Jn *u!ador apasionado, el caballero +e #r, encontr un desacuerdo entre las
frecuencias relativas de la veces que !anaba 8 valores observados realmente 8 y el
valor de la correspondiente probabilidad de !anar que el mismo haba calculado.
Consult esta discrepancia en %ars con el famoso matemtico y filsofo %ascal,
quien se interes por los problemas que le propona +e #r y comenz una
correspondencia epistolar sobre cuestiones probabilsticas con otros matemticos
ami!os, sobre todo con .ermat. Esta correspondencia puede considerarse el
ori!en de la teora de probabilidades.
%ronto %ascal y .ermat probaron el desacuerdo de +e #r se deba a que era
errneo el calculo de probabilidad que haba hecho, ya que +e #r se haba
equivocado al considerar como equiprobables casos que no le eran, y slo cuando
los casos posibles son equiprobables tiene sentido aplicar la definicin dada de
probabilidad.
El desarrollo de la teora de probabilidades tiene otro punto de referencia en 5I5;,
en que se publica la obra $%rs conjectandi$ 0El arte de la Con*etura1 de O. $ernoulli,
donde estudia la distribucin binominal y su clebre teora que da para esta
distribucin la expresin matemtica de la propiedad de estabilidad de las
frecuencias relativas.
,tro hito es la se!unda edicin de la obra -Ehe +octrine of Chances- 0(a doctrina
de las probabilidades1 aparecidas en 5I;? y debida al hu!onote francs +e
#oivre, que por motivos reli!iosos huy de .rancia refu!indose en Ln!laterra,
donde vivi de la resolucin de problemas de *ue!os de azar. En la obra se'alada
aparecen las primeras indicaciones sobre las distribucin normal de
probabilidades.
En 5?5: (aplace publica su famosa -&heore %nal'ti#ue des probabilit!s$, que
contiene una exposicin completa y sistemtica de la teora matemtica de los
*ue!os de azar, adems de una !ran cantidad de aplicaciones de la teora de la
probabilidad a muchas cuestiones cientficas y prcticas.
Eras la obra de (aplace se extendieron las aplicaciones de su obra otras ramas de
la Ciencia durante el si!lo 4L4, y as, 2auss y (aplace independientemente
aplicaron la teora de la probabilidad al anlisis de los errores de medida en las
observaciones fsicas y astronmicas, #axPell, $oltzmann y 2ibbs aplicaron la
probabilidad en su obra $Mec(nica )stadstica$* que ha sido fundamental en
distintas partes de la .sica moderna. Qa durante nuestro si!lo las aplicaciones de
la teora de la probabilidad se han extendido por los ms variados campos, como
!entica, economa, psicolo!a...
Eambin, y pese al xito de las aplicaciones, se oyeron voces crticas a la
definicin clsica de probabilidad, que exi!a -a priori- saber, o suponer, que todos
los casos posibles eran i!ualmente favorables. 3dems en ciertos casos era
imposible aplicar la definicin clsica de probabilidad, como puede suceder al
intentar calcular la probabilidad de que una chincheta cai!a con la punta hacia
arriba, o de que un hombre de ;9 a'os muera el prximo a'o.
i bien la matemtica cambi profundamente de forma entre las dos !uerras
mundiales, tambin es cierto que buena parte de la matemtica que si!ui a la
e!unda 2uerra #undial consista en el comienzo de al!o radicalmente nuevo
que anunciaba una nueva era. (a teora de con*untos y la teora de la medida han
ido invadiendo a lo lar!o del si!lo 44 una parte cada vez ms extensa de la
matemtica, pero pocas de sus ramas se han visto afectadas tan profundamente
por esta tendencia como la teora de probabilidades, a la que $orel haba
dedicado ya en 5>9> sus $)l!ments de la th!orie des probabilit!s$.
El primer a'o del nuevo si!lo se anunciaba ya propicio para las aplicaciones de la
teora de probabilidades tanto a la fisica como a la !entica, puesto que en 5>95
publicaba 2lbbs su obra )lementar' +rinciples in ,tatistical Mechanics* y el mismo
a'o fue fundada la revista -iometrika por Farl %earson 05?=I85>;H1. .rancis
2alton 05?::85>551 fue muy precoz y un estadstico nato que estudi los
fenmenos de re!resin) en 5>99 %earson en la universidad de (ondres
populariz el criterio de la Rchi8cuadradoS. Jno de los ttulos de %oincar haba
sido el de -profesor de clculo de probabilidades-, lo que indicaba un inters
creciente por el tema.
En Tusia se inici el estudio de las cadenas de sucesos eslabonados,
especialmente en 5>9H85>9I, por obra de 3ndrei 3ndreyevich #arUov 0o #arUoff,
5?=H85>::1, discpulo de Echebycheff y coeditor de las .euvres 0: vols., 5?>>8
5>9<1 de su maestro. En la teora cintica de los !ases y en muchos fenmenos
sociales y biol!icos, la probabilidad de un suceso depende frecuentemente de los
resultados anteriores, y especialmente desde mediados de este si!lo las cadenas
de #arUov de probabilidades eslabonadas se han estudiado muy detalladamente.
En su b&squeda de una fundamentacin matemtica para la teora de
probabilidades en expansin, los estadsticos encontraron a mano las
herramientas necesarias, y hoy no es posible ya dar una exposicin ri!urosa de la
teora de probabilidades sin utilizar los conceptos de funcin medible y de las
teoras de inte!racin modernas.
En Tusia mismo, por e*emplo, A%d&el N!+lae(!@ A+l)+8+&+## hizo importantes
pro!resos en la teora de procesos de #arUov 05>;51 y dio solucin a una parte
del sexto problema de 7ilbert, en el que se peda una fundamentacin axiom(tico
de la teora de probabilidades, utilizando la medida de (ebes!ue.
El anlisis clsico se haba ocupado principalmente de funciones continuas,
mientras que los problemas de probabilidades !eneralmente se refieren a casos
discretos. (a teora de la medida y las sucesivas extensiones del concepto de
inte!ral se adaptaban perfectamente a conse!uir una asociacin ms estrecha
entre el anlisis y la teora de probabilidades, especialmente a partir de mediados
del si!lo, cuando (aurent chPartz 05>5=8 1, de la universidad de %ars, !eneraliz
el concepto de diferenciacin mediante su teora de distribuciones 05>=985>=51.
,.1.1 DEFINICION Y EBPRESI5N
P&+7a7ldad1 rama de las matemticas que se ocupa de medir o
determinar cuantitativamente la posibilidad de que ocurra un determinado
suceso. (a probabilidad est basada en el estudio de la combinatoria y es
fundamento necesario de la estadstica.
(a probabilidad de un resultado se representa con un n&mero entre 9 y 5, ambos
inclusive. (a probabilidad 9 indica que el resultado no ocurrir nunca, y la
probabilidad 5, que el resultado ocurrir siempre.
El clculo matemtico de probabilidades se basa en situaciones tericas en las
cuales puede confi!urarse un espacio muestral cuyos sucesos elementales ten!an
todos la misma probabilidad. %or e*emplo, al lanzar un dado ideal, la probabilidad
de cada una de las caras es 5CH. 3l lanzar dos dados, la probabilidad de cada uno
de los resultados es 5C;H.
En estos casos, la probabilidad de un suceso cualquiera , se calcula mediante la
re!la de (aplace"
%BD A n&mero de sucesos elementales de C n&mero total de sucesos
elementales
(a expresin anterior se suele expresar del si!uiente modo"
%BD A n&mero de casos favorables a C n&mero de casos posibles
(a aplicacin de la re!la de (aplace en casos elementales es muy sencilla. %or
e*emplo, en la experiencia de lanzar un dado"
%BV:, ;, <, =WD A <CH
pues V:, ;, <, =W tiene < sucesos elementales y la experiencia admita, en total,
seis posibilidades.
in embar!o, la aplicacin de esta re!la en experimentos ms comple*os requiere
el uso de la combinatoria. %or e*emplo, al extraer tres cartas de una bara*a y ver la
probabilidad de que las tres sean trboles, el n&mero total de sucesos elementales
es C=:; A 0=:X=5X=91C0;X:X51 A ::.599. (os casos favorables son C5;;A
05;X5:X551C0;X:X51 A :?H. %or tanto, la probabilidad pedida es"
%BETE ETY$,(ED A :?HC::.599 A 5<;C55.9=9
(a resolucin de este tipo de problemas se simplifica notablemente si
consideramos Zsacar tres naipes[ como una experiencia compuesta por tres
experiencias simples" Zsacar un naipe y despus otro y despus otro[.
,., E4ENTOS 3UTUA3ENTE EBCLUYENTES Y NO EBCLUYENTES
Cuando se realiza un experimento, que es cualquier proceso que produce un
resultado o una observacin, se van a obtener un con*unto de valores. 3 este
con*unto de valores que puede tomar una variable se le denomina espacio
muestral.
%or e*emplo" i se tiene un dado cualquiera, el espacio muestral 0)M1 es
)MAV5,:,;,<,=,HW.
i existen ms de una variable, el espacio muestral est formado por las
combinaciones de valores de cada una de las variables.
i tomamos un subcon*unto cualquiera del espacio muestral tenemos lo que se
denomina un evento, y si ste consta de un solo elemento entonces es un evento
elemental.
Como se puede uno ima!inar, existen eventos que siempre, no importa el n&mero
de experimentos o su situacin, ocurren, y en cambio existen otros que nunca
ocurren. (os que siempre ocurren son los eventos se!uros, y los que nunca son
los eventos imposibles.
in embar!o, no todos los resultados son al azar, pues si un experimento es
cualquier proceso entonces los resultados pueden tomar cualquier tipo de valor.
%or esta razn, se define como experimento aleatorio al proceso en el que se
pueden predecir con certeza la ocurrencia de sus eventos, con excepcin del
se!uro o del imposible. 7ay que hacer la observacin que esta definicin habla en
trminos !enerales y no especficamente sobre al!&n experimento en particular.
3 aqulla variable que est asociada a un experimento de este tipo se le
denomina variable aleatoria.
En cambio, a un experimento no aleatorio se le denomina experimento
determinstico.
Cuando hablamos de varios eventos dentro del mismo experimento se pueden dar
varios casos.
i dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos
mutuamente excluyentes, es decir, que la interseccin de ambos eventos es vaca.
%or otro lado, en ocasiones un evento o ms eventos dependen de otro evento
previo, es decir, un evento % ocurre dado que ocurri un evento -. i existe este
tipo de relacin entre eventos se dice que son eventos dependientes o
condicionados 0el evento % depende del evento -, o el resultado del evento % est
condicionado al resultado del evento -1. %or otro lado, si no existe tal relacin
entre eventos se dice que son eventos independientes. (os criterios de
dependencia o de independencia se definirn ms adelante, en trminos de
probabilidad condicional.
,.6 RE/LAS DE ADICION
P&%!'+ de ad!$% -
upon!amos que un evento 3 se puede realizar de -m- maneras y otro evento $
se puede realizar de -n- maneras diferentes, adems, no es posible que ambos
eventos se realicen *untos 03\ $ A \ 1, entonces el evento 3 o el evento $ se
realizarn de 0 m @ n1 maneras.
E9e)'l+ 1-
Jn repuesto de automvil se venden en H tiendas en la Kictoria o en ? tiendas de
$re'a.M+e cuntas formas se puede adquirir el repuestoN
S+lu!$% -
%or el principio de adicin"
Kictoria $re'a
H formas @ ? formas A 5< formas
E9e)'l+ ,-
e desea cruzar un ro, para ello se dispone de ; botes, : lanchas y 5 deslizador.
M+e cuantas formas se puede cruzar el ro utilizando los medios de transporte
se'aladosN
S+lu!$% -
3plicando el principio de adicin se tiene"
$ote , lancha , deslizador
; : 5
] maneras A ; @ : @ 5 A H
,.: E4ENTOS INDEPENDIENTES 1 DEPEDIENTES 1 PROBABILIDAD
CONDICIONAL
Eventos independientes" dos eventos 3 y $ son independientes sis la ocurrencia
o no ocurrencia afecta la probabilidad asi!nada a la ocurrencia del otro.
3l!unas veces es sencillo determinar la independencia por e*emplo los dos
eventos considerados se refieren a ensayos no relacionados tales como el
lanzamiento de dos monedas de diferente denominacin en consecuencia los
resultados con ambas monedas son independientes. (a falta de independencia o
sea la dependencia es demostrada por la si!uiente ilustracin considrese el
experimento donde se lanzan dos dados y se observa los dos eventos la suma es
i!ual a 59 y n&mero doble que se establece %0591A;C;HA5C5:, %0doble1AHC;HA5CH
Mla ocurrencia de 59 afecta la probabilidad de dobleN Considrese esta pre!unta
de la manera si!uiente" a ocurrido una suma i!ual a 59 debe de ser uno de los
resultados si!uientes B0<,H1,0=,=1,0H,<1D una de estas tres posibilidades es n&mero
doble.
En consecuencia debe concluirse que -%- 0doble sabiendo que ha ocurrido un
diez1, escrita
%0dobleC591, es i!ual a 5C; ya que un tercio es distinta a la probabilidad de un
doble puede concluirse que el evento 59 afecta la probabilidad de un n&mero
doble as un doble y 59 son eventos dependientes. El smbolo %03C$1A%0$C31A%$.
Considrese la probabilidad condicional. Emese, por e*emplo, el experimento
donde se lanza un dado" AB5,:,;,<,=,HD en este experimento pueden definirse dos
eventos como 3 A-ocurre un <-, y $A-ocurre un n&mero par-. Entonces %031A5CH,
el evento 3 se satisface
exactamente por uno de los seis mustrales i!ualmente probables en . (a
probabilidad condicional de 3 dado $, %03C$1, se encuentra de manera similar,
pero ya no es este caso el espacio muestral. Esto puede verse de la manera
si!uiente" se lanza un dado sin que se pueda ver, aunque recibe la informacin de
que el n&mero obtenido sea par, es decir que ha ocurrido el evento $. Esta es la
condicin dada, conocindola a uno se la pide asi!nar la probabilidad del evento
-ocurre un <-. lo haqy tres posibilidades en el nuevo espacio muestral
0reducido1, B:,<,HD. Cada uno de los tres resultados es i!ualmente probable" en
consecuencia %03 $1A5C;.
,.= RE/LAS DE 3ULTIPLICACI5N
Te!la de la multiplicacin C3, 2E6ET3(
ean 3 y $ dos eventos definidos en el espacio muestral . Entonces "
%03 y $1A%031.%0$C31
o bien
%03 y $1A%0$1.%03C$1
i los eventos 3 y $ son independientes, el caso !eneral de la re!la de la
multiplicacin 0la frmula anterior1.
Te!la de la multiplicacin C3, E%ECL3(
ean 3 y $ dos eventos definidos en el espacio muestral . i 3 y $ son eventos
independientes entonces"
%03 y $1A%031.%0$1
Esta frmula puede ser !eneralizada. i 3,$,C)...)! son eventos independientes,
entonces"
%03 y $ y C y ... y 21A%031.%0$1.%0C1...%02A
7ay al!unos problemas, o parte de al!unos problemas en los que la respuesta
tiene que ver con multiplicar probabilidades.
Keamos un e*emplo. El producto que nos surte el proveedor 3 tiene un =^ de
probabilidad de estar defectuoso, mientras que el que nos surte el proveedor $
tiene un 5=^ de probabilidad de estar defectuoso. +ebido al empaque, es
imposible distin!uir entre el producto del proveedor 3 y el del $. En el almacn hay
599 unidades del producto y vamos a seleccionar una al azar. abiendo que <9^
de las unidades nos las surti 3 y el resto $, Mqu probabilidad hay de que la
unidad seleccionada sea defectuosaN
%ara calcular la probabilidad, es conveniente ver que lo que estamos haciendo
tiene dos etapas que se van a cubrir de manera secuencial"
%rimero se esco!e una unidad que puede ser del proveedor 3 o del $.
Jna vez esco!ida la unidad sta puede ser defectuosa o n.
,btener una unidad defectuosa se puede hacer por cualquiera de estos dos
caminos"
En la primera etapa esco!emos un producto del proveedor 3 y en la
se!unda etapa resulta defectuoso.
%rimero esco!emos del $ y lue!o resulta defectuoso.
Esta particin del problema se ve me*or en lo que se llama un dia!rama de rbol.
+etalles en el pizarrn.
(a probabilidad de obtener un producto defectuoso es la suma de las
probabilidades de los dos eventos se'alados.
%ara calcular la probabilidad del primer evento necesitamos combinar las
probabilidades de ambas etapas" %0proveedor 31 A 9.<9 y %0defect._provedor 31 A
9.9=. (a manera correcta de combinarlas es multiplicndolas. 3hora vamos a ver
por qu) de los cien productos, <9 son del proveedor 3 y de ellos el =^ es
defectuoso. Esto nos da : artculos, del total de 599, que son defectuosos y
surtidos por el proveedor 3.
+e la misma manera, la probabilidad de la se!unda posibilidad es" %0proveedor $1
A 9.H9 multiplicada por %0defect._proveedor $1 A 9.5= lo cual nos da >^.
(a probabilidad que necesitbamos" %0defect.1 A 9.9: @ 9.9> A 9.55
En la solucin de este problema usamos la re!la de que para calcular la
probabilidad de un evento que se hace en dos etapas hay que multiplicar la
probabilidad de la primera etapa por la condicional de la se!unda etapa dado el
resultado de la primera.
,tro e*emplo es el si!uiente) una mecan!rafa muy eficiente tiene una
probabilidad de 9.95 de producir al!&n error por cada p!ina que escribe y cada
p!ina es independiente. i nos escribe un documento de ; p!inas, que
probabilidad hay de que no ten!a nin!&n error. 3qu nuestro resultado involucra ;
etapas 0no nada ms dos1" 5a., :a. y ;a. p!inas. (a probabilidad de un
documento perfecto es"
%05a.bien1%0:a.bien_5a.bien1%0;a.bien_5a.y:a.bien1
y, por la independencia de la p!inas, las ; probabilidades son i!uales a 9.>>.
Esto da 9.>I.
Cuando los eventos en sucesin, son independientes, el clculo de la probabilidad
`se simplificaa
,.? DIA/RA3A DEL ARBOL
Da8&a)as de *&7+l
Tepresenta !rficamente la re!la de la multiplicacin. +e un punto a la izquierda
salen n5 rectas de 5
ra
!eneracin. +e cada una de estas ramas salen n: de :
da
!eneracin y asi sucesivamente. (a re!la de la multiplicacin muestra el numero
total de ramas que tiene el rbol.
En los problemas de probabilidad y en especial en los de probabilidad
condicionada, resulta interesante y prctico or!anizar la informacin en una tabla
de contin!encia o en un dia!rama de rbol.
(as tablas de contin!encia y los dia!ramas de rbol estn ntimamente
relacionados, dado uno de ellos podemos construir el otro. Jnas veces, los datos
del problema permiten construir fcilmente uno de ellos y a partir de l podemos
construir el otro, que nos ayudar en la resolucin del problema.
Conversin de una tabla en dia!rama de rbol
(as tablas de contin!encia estn referidas a dos caractersticas que presentan
cada una dos o ms sucesos.
En el caso de los sucesos %* * - y
, expresados en frecuencias
absolutas, relativas o probabilidades
la tabla, adopta la forma ad*unta.
+icha tabla adopta la forma del dia!rama de rbol del dibu*o. En ste, a cada
uno de los sucesos % y se les ha asociado los sucesos - y .
obre las ramas del dia!rama de rbol se han anotado las probabilidades
condicionadas correspondientes, deducidas de las relaciones anlo!as a"
,.< CO3BINACIONES Y PER3UTACIONES
C+)7%a!+%es
Es una seleccin de r ob*etos de n dados sin atender a la ordenacin de los
mismos. Es decir, es la obtencin de subco*untos, de r elementos cada uno, a
partir de un con*unto inicial de n elementos. (a denotaremos con /n
r
, n/r .
P+& e9e)'l+- i tomamos el mismo con*unto %AVa,b,c,dW, Mcuntos subcon*untos de
: elementos cada uno se pueden obtenerN
7acindolos se obtienen" Va,bW, Va,cW, Va,dW, Vb,cW, Vb,dW, Vc,dW. on seis los
subcon*untos.
% E,E3(
- +0 % - 1
+0 - 1
+0 - 1
+0 % 1 +0 1 +0 1
E,E3( +0 % 1
+0 1
5
En !eneral, si de n ob*etos dados se hacen combinaciones de r ob*etos cada una,
el n&mero de combinaciones obtenidas son"
/n
r
A n/r A
o, que es lo mismo,
/n
r
A n/r A
En )xcel la funcin C,#$L63E0n ,r1 calcula las combinaciones de n ob*etos
tomando r de ellos.
Es cada uno de los diferentes arre!los que se pueden hacer con parte o todos los
elementos de un con*unto dado sin considerar el orden en su ubicacin
El n&mero de combinaciones de -%- elementos diferentes tomados de CDC e% CDC ,
con DE % ,est dada por"
E9e)'l+ 1-
i disponemos de = puntos no colineales ,Mcul es el mximo n&mero de
trin!ulos que se podrn formarN
S+lu!$% -
%ara dibu*ar un trin!ulo solo es necesario ; puntos en el plano, lue!o se
esco!ern ; puntos 0U A ;1 de un total de ? puntos 0n A =1. 3dems no importa
el orden, ya que el trian!ulo 3$C es i!ual al C$3) por lo tanto se trata de una
combinacin.
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
E9e)'l+ ,-
Jna se'ora tiene ; frutas " manzana, fresa y pi'a. MCuntos sabores diferentes de
*u!o podr preparar con estas frutas N
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
.resa 0.1 , %i'a 0%1 , #anzana 0#1
S+lu!$%-
3t+d+ 1 - Fe% #+&)a 8&*#!aG
Cuando se esco!e una fruta de las tres, los sabores son ;" F1 P 13
Cuando se esco!e : de las tres frutas, los sabores son ;" FP1 F31 P3
Cuando se esco!e las ; frutas los sabores son 5" FP3
T+tal de sa7+&es d#e&e%tes - 6 H 6 H 1 I <
3t+d+ , - FE)'lea%d+ !+)7%a!+%esG
e puede esco!er una fruta de las tres $ : frutas de las tres $ las tres frutas
de las tres, adems en este caso no importa el orden) por lo tanto usamos el
principio de adicin aplicado a la combinacin"
] maneras diferentes A
] maneras diferentes A
T+tal de sa7+&es d#e&e%tes - 6 H 6 H 1 I <
E9e)'l+ 6-
e desea formar un comit de I seleccionando < fsicos y ; matemticos de un
!rupo de ? fsicos y H matemticos.M+e cuantas maneras podr seleccionarseN
S+lu!$%-
5 eleccionamos < fsicos entre ? en
formas
:
o
eleccionamos ; matemticos entre H en
3plico el principio de multiplicacin
x A I9 x :9 A 5<99
Pe&)uta!$%
Es un arre!lo de todos o parte de un con*unto de ob*etos considerando el orden en
su ubicacin) cuando en el arre!lo solo entran parte de los elementos del con*unto
se llama (a&a!$% . Es importante resaltar que el orden es una caracterstica
importante en la permutacin, cuando variamos el orden de los elementos se dice
que permutamos dichos elementos.
E9e)'l+ -
+eterminar los diferentes arre!los o permutaciones que se pueden hacer con las
letras a, b y c tomadas de dos en dos
S+lu!$% -
3t+d+ 1-
ea el con*unto " Va, b, cW , entonces los arre!los pueden ser" a71 7a. a!1 !a1
7!1 !7
6&mero de arre!los A H
3t+d+ ,- F'&%!'+ de )ult'l!a!$%G
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
] arre!los A ; x : A H
Te+&e)a 1- FPe&)uta!$% l%eal !+% ele)e%t+s d#e&e%tesG
-El n&mero de permutaciones de -%- ob*etos diferentes, tomados en !rupos de D
elementos 0siendo U \ n1 y denotado por , estar dado por"
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
) donde" n, U 6 y 9 \ U \ n
Estas permutaciones son llamados lineales , porque los ob*etos son ordenados en
una lnea recta de referencia
E9e)'l+-
En una carrera de <99metros participan 5: atletas. M+e cuantas formas distintas
podrn ser premiados los tres primeros lu!ares con medalla de oro , plata y
bronceN
S+lu!$% -
3t+d+ 1 - E)'lea%d+ el '&%!'+ de )ult'l!a!$%
,ro %lata $ronce
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
59 x > x ?
] maneras A I:9
3t+d+ ,- Fusa%d+ la #$&)ula de 'e&)uta!$% l%ealG
e busca las diferentes ternas 0U A ;1 que se pueden formar con los 59
atletas 0n A 591
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
Te+&e)a ,- FPe&)uta!$% l%eal !+% ele)e%t+s &e'etd+sG
El n&mero de permutaciones 0%1 distintas de -n- elementos tomados de -n- en -n-
en donde hay un primer !rupo de n5 ob*etos i!uales entre si) n: ob*etos i!uales
entre si de un se!undo tipo y as sucesivamente hasta nU ob*etos i!uales entre si
de un &ltimo tipo, entonces"
E9e)'l+ -
M+e cuntas maneras distintas se podrn ordenar las si!uientes fi!urasN
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
S+lu!$%-
Como entran todos los elementos del con*unto y estos se repiten, se trata
de una permutacin con repeticin, donde n5 A ; 0tres crculos1, n: A : 0dos
cuadrados1 , n; A 5 0un trin!ulo1, n< A 50 un rombo1, lue!o"
A
Pe&)uta!$% C&!ula&
on a!rupaciones donde no hay primero ni &ltimo elemento, por hallarse todos en
una lnea cerrada. %ara hallar el n&mero de permutaciones circulares que se
pueden formar con -n- ob*etos distintos de un con*unto, hay que considerar fi*a la
posicin de un elemento, los n c 5 restantes podrn cambiar de lu!ar de 0n c 51a
.ormas diferentes tomando todas las posiciones sobre la circunferencia relativa al
primer punto.
El n&mero de permutaciones circulares ser"
E9e)'l+1 -
M+e cuntas formas diferentes puede sentarse al rededor de una mesa circular un
padre y sus = hi*osN
S+lu!$% -
e trata de una permutacin circular "
E9e)'l+ ,-
M+e cuntas maneras diferentes se podrn ubicar las cifras del 5 al I en la
si!uiente fi!uraN
%ara ver el !rfico seleccione la opcin b$a*ar traba*ob del men& superior
S+lu!$% -
Este problema se puede resolver como la con*uncin de dos eventos"
'&)e&+ ubico una cifra en el centro 0I posibilidades1 J se8u%d+ las otras H
cifras, las cuales por ordenarse en una circunferencia se podrn permutar de 0H
c5 1a .ormas , por lo tanto"
] de maneras A I x =a A I x 5:9 A ?<9
,.K ANALISIS CO3BINATORIO
En ocasiones el traba*o de enumerar los posibles sucesos que ocurren en una
situacin dada se convierte en al!o difcil de lo!rar o, simplemente, tedioso. El
anlisis combinatorio, o clculo combinatorio, permite enumerar tales casos o
sucesos y as obtener la probabilidad de eventos ms comple*os.
En el caso de que existan ms de un suceso a observar, habra que contar el
n&mero de veces que pueden ocurrir todos los sucesos que se desean observar,
para ello se utiliza el '&%!'+ #u%da)e%tal de !+%te+"
i un suceso se puede presentar de n5 formas, y otro se puede presentar de n:
formas, entonces el n&mero de formas en que ambos sucesos pueden
presentarse en ese orden es de n5Xn:.
En otras palabras, basta multiplicar el n&mero de formas en que se pueden
presentar cada uno de los sucesos a observar.
Este principio nos remite automticamente al #a!t+&al de un n&mero natural, que
se puede pensar como una funcin con dominio los n&meros naturales *unto con el
cero y codominio los n&meros naturales. El factorial de un n&mero n, denotado na,
se define como"
3hora, n es muy !rande el proceso de clculo se vuelve tedioso y muy car!ado,
incluso para una computadora, por lo que se utiliza la a'&+L)a!$% de St&l%8 a
nM"
donde e2:.I5?:?..., que es la base de los lo!aritmos neperianos.
En )xcel existe la funcin .3CE0n 1 que calcula el factorial de un n&mero entero no
ne!ativo n.
En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y
las combinaciones.
,.N TEORE3A DE BAYES
En el a'o 5IH;, dos a'os despus de la muerte de &homas -a'es 05I9:85IH51,
se public una memoria en la que aparece, por vez primera, la determinacin de la
probabilidad de las causas a partir de los efectos que han podido ser observados.
El clculo de dichas probabilidades recibe el nombre de teorema de $ayes.
Te+&e)a de BaJes
ea %3* %4* ...*%n un sistema completo de sucesos, tales que la probabilidad de
cada uno de ellos es distinta de cero, y sea - un suceso cualquier del que se
conocen las probabilidades condicionales +0-5%i1. entonces la probabilidad +0%i5-1
viene dada por la expresin"
En los problemas relacionados con la probabilidad, y en particular con la
probabilidad condicionada, as como con la probabilidad total y el teorema de
$ayes, es aconse*able que, con la informacin del problema, construyas una tabla
de contin!encia o un dia!rama de rbol.
El Te+&e)a de BaJes viene a se!uir el proceso inverso al que hemos visto en el
Eeorema de la probabilidad total"
Eeorema de la probabilidad total" a partir de las probabilidades del suceso 3
0probabilidad de que llueva o de que ha!a buen tiempo1 deducimos la probabilidad
del suceso $ 0que ocurra un accidente1.
Eeorema de $ayes" a partir de que ha ocurrido el suceso $ 0ha ocurrido un
accidente1 deducimos las probabilidades del suceso 3 0Mestaba lloviendo o haca
buen tiempoN1.
(a frmula del Eeorema de $ayes es"
Eratar de explicar estar frmula con palabras es un !alimatas, as que vamos a
intentar explicarla con un e*emplo. +e todos modos, antes de entrar en el e*ercicio,
recordar que este teorema tambin exi!e que el suceso 3 forme un sistema
completo.

E*ercicio 5d" El parte meteorol!ico ha anunciado tres posibilidades para el fin de
semana"
a1 eue llueva" probabilidad del =9^.
b1 eue nieve" probabilidad del ;9^
c1 eue haya niebla" probabilidad del :9^.
e!&n estos posibles estados meteorol!icos, la posibilidad de que ocurra un
accidente es la si!uiente"
a1 i llueve" probabilidad de accidente del 59^.
b1 i nieva" probabilidad de accidente del :9^
c1 i hay niebla" probabilidad de accidente del =^.
Tesulta que efectivamente ocurre un accidente y como no estabamos en la ciudad
no sabemos que tiempo hizo 0nev, llovo o hubo niebla1. El teorema de $ayes nos
permite calcular estas probabilidades"
(as probabilidades que mane*amos antes de conocer que ha ocurrido un
accidente se denominan -probabilidades a priori- 0lluvia con el H9^, nieve con el
;9^ y niebla con el 59^1.
Jna vez que incorporamos la informacin de que ha ocurrido un accidente, las
probabilidades del suceso 3 cambian" son probabilidades condicionadas % 03C$1,
que se denominan -probabilidades a posteriori-.
Kamos a aplicar la frmula"
a1 %robabilidad de que estuviera lloviendo"
(a probabilidad de que efectivamente estuviera lloviendo el da del accidente
0probabilidad a posteriori1 es del I5,<^.
b1 %robabilidad de que estuviera nevando"
(a probabilidad de que estuviera nevando es del :5,<^.
c1 %robabilidad de que hubiera niebla"
(a probabilidad de que hubiera niebla es del I,5^.
,.1O 4ALOR ESPERADO O ESPERAN>A 3ATE30TICA
ea X una v.a. discreta. e denomina es'e&a%;a )ate)*t!a de X o (al+&
es'e&ad+, y se denota bien o bien , a la cantidad que se expresa como"
donde es el con*unto numerable de ndices de los valores que puede tomar la
variable 0por e*emplo para un n&mero finito de valores de la v.a. o
bien para una cantidad infinita numerable de los mismos.
i X es una v.a. continua, se define su esperanza a partir de la funcin de
densidad como si!ue"
O7se&(a!$%
Tecordamos que si
y por tanto tiene sentido calcular su esperanza matemtica"
%or las analo!as existente entre la definicin de media aritmtica y esperanza
matemtica, las propiedades de linealidad de la primera se trasladan a la se!unda,
como es inmediato comprobar"

UNIDAD 6
TIPOS DE DISTRIBUCIONES 4ARIABLES ALEATORIAS DISCRETAS
Y CONTINUAS
6.1 BINO3IAL
e dice que una v.a. X si!ue una leJ 7%+)al de parmetros n y p, ,
si es la suma de n v.a. independientes de $ernouilli con el mismo parmetro, p"

Esta definicin puede interpretarse en el si!uiente sentido" upon!amos que
realizamos n pruebas de $ernouilli, Xi, donde en todas ellas, la probabilidad de
xito es la misma 0p1, y queremos calcular el n&mero de xitos, X, obtenidos el el
total de las n pruebas. u ley de probabilidad es
H.5
.
6.11 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR
upon!amos que un experimento aleatorio tiene las si!uientes caractersticas"
En cada prueba del experimento slo son posibles dos resultados" el
suceso 3 0xito1 y su contrario 0fracaso1.
El resultado obtenido en cada prueba es independiente de los resultados
obtenidos anteriormente.
(a probabilidad del suceso 3 es constante, la representamos por p, y no
vara de una prueba a otra. (a probabilidad de es 58 p y la representamos
por # .
El experimento consta de un n&mero n de pruebas.
Eodo experimento que ten!a estas caractersticas diremos que si!ue el modelo de
la distribucin $inomial. 3 la variable X que expresa el n&mero de xitos
obtenidos en cada prueba del experimento, la llamaremos variable aleatoria
binomial.
(a variable binomial es una variable aleatoria discreta, slo puede tomar los
valores 9, 5, :, ;, <, ..., n suponiendo que se han realizado n pruebas. Como hay
que considerar todas las maneras posibles de obtener U8xitos y 0n8U1 fracasos
debemos calcular stas por combinaciones 0n&mero combinatorio n sobre U1.
(a distribucin $inomial se suele representar por -0n*p1 siendo n y p los
parmetros de dicha distribucin.
.uncin de %robabilidad de la v.a. $inomial
.uncin de probabilidad de la distribucin $inomial o tambin denominada funcin
de la distribucin de $ernoulli 0para nA51. Kerificndose" 9 \ p \ 5
Como el clculo de estas probabilidades puede resultar al!o tedioso se han
construido tablas para al!unos valores de n y p que nos facilitan el traba*o.
%armetros de la +istribucin $inomial
.uncin de +istribucin de la v.a. $inomial
siendo U el mayor n&mero entero menor o i!ual a xi.
Esta funcin de distribucin proporciona, para cada n&mero real xi, la probabilidad
de que la variable 4 tome valores menores o i!uales que xi.
El clculo de las .0x1 A p0 4 \x1 puede resultar laborioso, por ello se han
construido tablas para al!unos valores de n y p que nos facilitan el traba*o.
ea 4 una variable aleatoria discreta correspondiente a una distribucin binomial.
%or tanto, su funcin de distribucin es
El modo ms simple de calcular la funcin afirma que la funcin caracterstica de
la suma de variables independientes es el producto de las funciones
caractersticas de estas"
(os principales momentos de X los calculamos ms fcilmente a partir de
0prop. p!ina =1 que de su propia definicin"
E9e)'l+
Jn mdico aplica un Ees. a 59 alumnos de un cole!io para detectar una
enfermedad cuya incidencia sobre una poblacin de ni'os es del . (a
sensibilidad del test es del y la especificidad del . MCual es la
probabilidad de que exactamente a cuatro personas le de un resultado positivoN i
en la muestra hay cuatro personas a las que el test le da positivo, Mcul es la
probabilidad de que entre estas, exactamente dos estn sanasN Calcular la
probabilidad de que el test suministre un resultado incorrecto para dos personas.
Calcular la probabilidad de que el resultado sea correcto para ms de I personas.
S+lu!$%-
(os datos de que disponemos son"
donde ), &
@
, y &
8
tienen el sentido que es obvio. i queremos saber a cuantas
personas el test le dar un resultado positivo, tendremos que calcular , para
lo que podemos usar el teorema de la probabilidad total 0estar enfermo y no
estarlo forman una coleccin exhaustiva y excluyente de sucesos1"
ea X5 la v.a. que contabiliza el n&mero de resultados positivos. Es claro que
llamando , se tiene que X si!ue una distribucin binomial
%or ello la probabilidad de que a cuatro personas le de el resultado del test
positivo es"
i queremos calcular a cuantas personas les dar el test un resultado positivo
aunque en realidad estn sanas, hemos de calcular previamente , o sea,
el ndice predictivo de falsos positivos"
Es importante observar este resultado. 3ntes de hacer los clculos no era
previsible que si a una persona el test le da positivo, en realidad tiene una
probabilidad aproximadamente del de estar sana. ea X: la variable aleatoria
que contabiliza al n&mero de personas al que el test le da positivo, pero que estn
sanas en realidad. Entonces
J
%or &ltimo vamos a calcular la probabilidad p; de que el test de un resultado
errneo, que es"
(a variable aleatoria que contabiliza el n&mero de resultados errneos del test es
Como la probabilidad de que el test sea correcto para ms de siete personas, es la
de que sea incorrecto para menos de ;, se tiene
6.1., /RAFICA
F8u&a- .uncin de probabilidad de una variable binomial
cundo n es peque'o.
F8u&a- .uncin de probabilidad de una variable binomial
cuando n es !rande.
6., POISSON
(a +istribucin de %oisson se llama as en honor a imen +ennis %oisson
05I?585?<91, francs que desarroll esta distribucin basndose en estudios
efectuados en la &ltima parte de su vida.

(a distribucin de %oisson se emplea para describir varios procesos, entre
otros la distribucin de las llamadas telefnicas que lla!an a un conmutador, la
demanda 0necesidades1 de servicios en una institucin asistencial por parte de
los pacientes, los arribos de los camiones y automviles a la caseta de cobro y
el n&mero de accidentes en un cruce. (os e*emplos citados tienen un elemento
en com&n, pueden ser descritos por una variable aleatoria discreta que asume
valores enteros 09,5,:,;,<,= y as sucesivamente1.
6.,.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR
El n&mero de enfermos que lle!an a un consultorio en cierto intervalo de
tiempo ser de 9,5,:,;,<,= o al!&n otro n&mero entero. +e manera anlo!a, si
se cuenta el n&mero de automviles que lle!an a una caseta de cobro durante
un periodo de diez minutos, el n&mero ser entero.
Caractersticas de los procesos que producen una distribucin de la
probabilidad de %oisson.

El n&mero de vehculos que pasan por una caseta de cobro en las horas de
mayor trfico sirve como e*emplo para mostrar las caractersticas de una
distribucin de probabilidad de %oisson.

El promedio 0media1 de los arribos de vehculos por hora de !ran trfico puede
estimarse a partir de los datos anteriores del trfico.

i dividimos las horas de !ran trfico en periodos 0intervalos1 de un se!undo
cada uno, encontraremos que los si!uientes enunciados son verdaderos"

a1 (a probabilidad de que exactamente un vehculo lle!ue por se!undo
a una caseta individual es un n&mero muy peque'o y es constante para
que cada intervalo de un se!undo.
b1 (a probabilidad de que dos o ms vehculos lle!uen en un intervalo
de un se!undo es tan reducida que podemos asi!narle un valor cero.
c1 El n&mero de vehculos que lle!an en determinado intervalo de un
se!undo es independiente del momento en que el intervalo de un se!undo
ocurre durante la hora de !ran trfico.
d1 El n&mero de lle!adas en cualquier intervalo de un se!undo no
depende del n&mero de arribos de cualquier otro intervalo de un se!undo.

3hora bien, podemos !eneralizar partiendo de las cuatro condiciones que
hemos descrito en este e*emplo, si estas condiciones se cumplen nos
apoyaremos en una distribucin de probabilidad de %oisson para describirlos.

C*l!ul+ de '&+7a7ldades )eda%te la dst&7u!$% de P+ss+%.

(a distribucin de %oisson, se!&n hemos se'alado, se refiere a ciertos
procesos que pueden ser descritos con una variable aleatoria discreta. (a letra
4 suele representar esa variable y puede adems asumir valores enteros
09,5,:,; etc..1 . Jtilizamos la letra 4 may&scula para representar la variable
aleatoria y la x min&scula para desi!nar un valor especfico que puede asumir
la 4 may&scula. (a probabilidad de exactamente x ocurrencias en una
distribucin de %oisson se calcula mediante la frmula"

%0x1 A
x
/ e8

C xa

x
A (ambda
0n&mero medio de ocurrencias por intervalo de tiempo1 elevada a la potencia x.

e8

A eA :.I5?:? elevado a la potencia de lambda ne!ativa.

xa A x factorial.

E*emplo "
upn!ase que estamos investi!ando la se!uridad de un crucero muy
peli!roso. (os archivos de la polica indican una media de cinco accidentes por
mes en l. El n&mero de accidentes est distribuido conforme a la distribucin
de %oisson, y la divisin de se!uridad en carreteras quiere calcular la
probabilidad de exactamente 9,5,:,; y < accidentes en un mes determinado.

3plicando la frmula anterior"

%091 A 0=1
9
0e
8=1
C9a A 9.99HI<
%051 A 0=1
5
0e
8=1
C5a A 9.9;;I9
%0:1 A 0=1
:
0e
8=1
C:a A 9.9?<:=
%0;1 A 0=1
;
0e
8=1
C;a A 9.5<9<:
%0<1 A 0=1
<
0e
8=1
C<a A 9.5I==:

%ara saber cual es la probabilidad en ; o menos, sumaremos las
probabilidades de 9,5,:,; lo que ser i!ual a "
%091 A 9.99HI<
%051 A 9.9;;I9
%0:1 A 9.9?<:=
%0;1 A 9.5<9<:
%0; o menos1 A 9.:H=55
+ado que la probabilidad de que haya ; o menos accidentes es de 9.:H=55
entonces la probabilidad de que ocurran ms de tres debe ser A 5 c9.:H=55 A
9.I;<?>.

(a distribucin de %oisson como una aproximacin a la distribucin binomial.

3l!unas veces, si se desea evitar el tedioso traba*o de calcular las
distribuciones binomiales, se puede usar a cambio la de %oisson, pero debe
cumplir con ciertas condiciones como "

nAf:9
pAg9.9=

En los casos en que se satisfacen tales condiciones, podemos sustituir la
media de la distribucin binomial en lu!ar de la media de la distribucin de
%oisson de modo que la frmula quedara as"

%0x1 A 0np1
4
/ e
8np
Cxa
6.,., /RAFICA
6.6 .IPER/EO3ETRICA
(os experimentos que tienen este tipo de distribucin tienen las si!uientes
caractersticas"
a1 3l realizar un experimento con este tipo de distribucin, se esperan
dos tipos de resultados.
b1 (as probabilidades asociadas a cada uno de los resultados no son
constantes.
c1 Cada ensayo o repeticin del experimento no es independiente de
los dems.
d1 El n&mero de repeticiones del experimento 0n1 es constante.

6.6.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR
E*emplo"
En una urna o recipiente hay un total de N ob*etos, entre los cuales hay una
cantidad a de ob*etos que son defectuosos, si se seleccionan de esta urna n
ob*etos al azar, y sin reemplazo, Mcul es la probabilidad de obtener x ob*etos
defectuososN
olucin"

(ue!o)



n N
x n a N x a
C
C * C
) n , x ( p

=

donde"
p0x,n1 A probabilidad de obtener x ob*etos defectuosos de entre n seleccionados

=
x n a N x a
C * C
muestras de n ob*etos en donde hay x que son defectuosos y n6x
buenos

= =
n N
C
todas las muestras posibles de seleccionar de n ob*etos tomadas de
entre N ob*etos en total A espacio muestral


Considerando que en la urna hay un total de 59 ob*etos, ; de los cuales son
defectuosos, si de seleccionan < ob*etos al azar, Mcul es la probabilidad de que :
sean defectuososN

olucin"

6 A 59 ob*etos en total
a A ; ob*etos defectuosos
n A < ob*etos seleccionados en muestra
x A : ob*etos defectuosos deseados en la muestra
=


= = = = =

! )! (
!
! )! (
!
*
! )! (
!
C
C * C
C
C * C
) n , x ( p
4 4 10
10
2 2 7
7
2 2 3
3
4 2
4 10
2 7 2 3
4 10
2 4 3 10 2 3


= = = =
! !
!
*
x x x
x x x
! !
! x x x x
! !
! x x
*
! !
! x x
! !
!
! !
!
*
! !
!
2 2
4
7 8 9 10
6 7 2 3
4 6
6 7 8 9 10
2 5
5 6 7
2 1
1 2 3
4 6
10
2 5
7
2 1
3


donde"

=
7 8 9 10
6 7 2 3
x x x
x x x
probabilidad asociada a cada muestra de < ob*etos que se
seleccionaron, con lo que se demuestra que las probabilidades no son
constantes

=
! !
!
2 2
4
formas o maneras de obtener : ob*etos defectuosos entre los <
seleccionados A muestras de < ob*etos entre los que : son defectuosos


Como se observa en el desarrollo de la solucin del problema, la pretensin es
demostrar que las probabilidades asociadas a cada uno de los resultados no
son constantes.

(ue!o la probabilidad de obtener : ob*etos defectuosos entre los <
seleccionados al azar sera"


30 0
20160
6048
4
24
5040
252
2 2
4
7 8 9 10
6 7 2 3
. *
! !
!
*
x x x
x x x
= = = =


E9e)'l+s-
5. %ara evitar que lo descubran en la aduana, un via*ero ha colocado H
tabletas de narctico en una botella que contiene > pldoras de vitamina
que son similares en apariencia. i el oficial de la aduana selecciona ;
tabletas aleatoriamente para analizarlas, a1 MCul es la probabilidad de que
el via*ero sea arrestado por posesin de narcticosN, b1 MCul es la
probabilidad de que no sea arrestado por posesin de narcticosN.

olucin"
a1 6 A >@H A5= total de tabletas
a A H tabletas de narctico
n A ; tabletas seleccionadas
x A 9, 5, :, o ; tabletas de narctico A variable que nos indica el n&mero de
tabletas de narctico que se puede encontrar al seleccionar las ; tabletas

p0via*ero sea arrestado por posesin de narcticos1 A p0de que entre las ;
tabletas seleccionadas haya 5 o ms tabletas de narctico1

= + + = = = =
3 15
0 9 3 6
3 15
1 9 2 6
3 15
2 9 1 6
3 3 2 1
C
C * C
C
C * C
C
C * C
) n ; tabletas , x ( p

81538 0
455
371
455
20 135 216
455
1 20
455
9 15
455
36 6
.
) )( ( ) )( ( ) )( (
= =
+ +
= + + =

otra forma de resolver)

p0el via*ero sea arrestado por posesin de narcticos1 A 5 c p0de que entre las
tabletas seleccionadas no haya una sola de narctico1

= = = = =
3 15
3 9 0 6
1 3 0 1
C
C * C
) n ; x ( p

815385 0 184615 0
455
84 1
1 . .
) )( (
= = =
b1 p0no sea arrestado por posesin de narcticos1

= = = = =
3 15
3 9 0 6
3 0
C
C * C
) n ; x ( p

184615 0
455
84 1
.
) )( (
= =


:. +e un lote de 59 proyectiles, < se seleccionan al azar y se disparan. i el
lote contiene ; proyectiles defectuosos que no explotarn, Mcul es la
probabilidad de que , a1 los < explotenN, b1 al menos : no explotenN

olucin"
a1 6 A 59 proyectiles en total
a A I proyectiles que explotan
n A < proyectiles seleccionados
x A 9, 5, :, ; o < proyectiles que explotan A variable que nos define el n&mero
de proyectiles que explotan entre la muestra que se dispara

16667 0
210
35
210
1 35
4 4
4 10
0 3 4 7
.
) )( (
C
C * C
) n ; x ( p = = = = = =

b1 6 A 59 proyectiles en total
a A ; proyectiles que no explotan
n A < proyectiles seleccionados
x A 9, 5, : o ; proyectiles que no explotan

p0al menos : no exploten1 A p0 : o ms proyectiles no exploten1 A p0x A : o ;) nA<1
A

333333 0
210
70
210
7 63
210
7 1 21 3
4 10
1 7 3 3 2 7 2 3
.
) )( ( ) )( (
C
C * C C * C
= =
+
=
+
=
+
=


;. a1 MCul es la probabilidad de que una mesera se reh&se a servir bebidas
alcohlicas &nicamente a dos menores de edad si verifica aleatoriamente solo
= identificaciones de entre > estudiantes, de los cuales < no tienen la edad
suficienteN, b1 MCual es la probabilidad de que como mximo : de las
identificaciones pertenezcan a menores de edadN
olucin"

a1 6 A > total de estudiantes
a A < estudiantes menores de edad
n A = identificaciones seleccionadas
x A variable que nos define el n&mero de identificaciones que pertenecen a
personas menores de edad
x A 9, 5, :, ; o < identificaciones de personas menores de edad

238095 0
126
10 3
5 2
5 9
3 5 2 4
.
) )( (
C
C * C
) n , x ( p = = = = =

7G 6 A > total de estudiantes
a A < estudiantes menores de edad
n A = identificaciones seleccionadas
x A variable que nos define el n&mero de identificaciones que
pertenecen a personas menores de edad
x A 9, 5, :, ; o < identificaciones de personas menores de edad


=
+ +
=
+ +
= = =
126
10 6 5 4 1 1
5 2 1 0
5 9
3 5 2 4 4 5 1 4 5 5 0 4
) )( ( ) )( ( ) )( (
C
C * C C * C C * C
) n ; , , x ( p

64286 0
126
81
126
60 20 1
. = =
+ +
=

6.6., /RAFICA
6.: NOR3AL
En otras ocasiones, al considerar distribuciones binomiales, tipo $0n,p1, para un
mismo valor de p y valores de n cada vez mayores, se ve que sus pol!onos de
frecuencias se aproximan a una curva en -forma de campana-.
6.:.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR
DISTRIBUCI5N NOR3AL
+ !a)'a%a de /aussPLa'la!e
En resumen, la importancia de la distribucin normal se debe principalmente a que
hay muchas variables asociadas a fenmenos naturales que si!uen el modelo de
la normal
/aracteres morfolgicos de individuos 0personas, animales, plantas,...1 de
una especie, p.e*m. tallas, pesos, enver!aduras, dimetros, permetros,...
/aracteres fisiolgicos, por e*emplo" efecto de una misma dosis de un
frmaco, o de una misma cantidad de abono.
/aracteres sociolgicos, por e*emplo" consumo de cierto producto por un
mismo !rupo de individuos, puntuaciones de examen.
/aracteres psicolgicos, por e*emplo" cociente intelectual, !rado de
adaptacin a un medio,...
)rrores cometidos al medir ciertas ma!nitudes.
7alores estadsticos muestrales, por e*emplo " la media.
.tras distribuciones como la binomial o la de %oisson son aproximaciones
normales, ...
Q en !eneral cualquier caracterstica que se obten!a como suma de muchos
factores.
FUNCI5N DE DENSIDAD
Empleando clculos bastante laboriosos, puede demostrarse que el modelo de la
#u%!$% de de%sdad que corresponde a tales distribuciones viene dado por la
frmula
(a distribucin normal queda definida por dos 'a&*)et&+s, su media y su
desviacin tpica y la representamos as
FUNCI5N DE DISTRIBUCI5N
%uede tomar cualquier valor 08 \, @ \1
on ms probables los valores cercanos a uno central que llamamos
media
Conforme nos separamos de ese valor , la probabilidad va decreciendo
de i!ual forma a derecha e izquierda 0es simtrica1.
Conforme nos separamos de ese valor , la probabilidad va decreciendo
de forma ms o menos rpida dependiendo de un parmetro , que es la
desviacin tpica.
TIPIFICACI5N
%or tanto su funcin de densidad es
y su funcin de distribucin es
siendo la representacin !rfica de esta funcin
a la variable h se la denomina variable tipificada de X, y a la curva de su funcin
de densidad curva normal tipificada.
Ca&a!te&st!a de la dst&7u!$% %+&)al t'#!ada F&edu!da1 est*%da&G
6o depende de nin!&n parmetro
u media es 9, su varianza es 5 y su desviacin tpica es 5.
(a curva f0x1 es simtrica respecto del e*e ,Q
Eiene un mximo en este e*e
Eiene dos puntos de inflexin en z A5 y z A 85
6.:., /RAFICA
FUNCION DE DENSIDAD
Representacin grfica de esta funcin de densidad
FUNCION DE DISTRIBUCI5N

.0x1 es el rea sombreada de esta !rfica
TIPIFICACI5N
3 la variable h se la denomina variable tipificada de X, y a la curva de su funcin
de densidad curva normal tipificada.
6.= APROBI3ACION DE LO NOR3AL A LA BINO3IAL
A'&+L)a!$% de la dst&7u!$% 7%+)al '+& la %+&)al
Jna dstribucin binomial -0n*p1 se puede aproximar por una distribucin normal,
siempre que n sea !rande y p no est muy prxima a 8 o a 3. (a aproximacin
consiste en utilizar una distribucin normal con la misma media y desviacin tpica
que la distribucin binomial.
En la practica se utiliza la aproximacin cuando "
En cuyo caso "
Q tipificando se obtiene la normal estndar correspondiente"
6.=.1 PROPIEDADES- 3EDIA1 4ARIAN>A Y DES4IACI5N ESTANDAR
A'&+L)a!$% de la B%+)al '+& la N+&)al FTe+&e)a de De Moivre) -
+emostr que ba*o determinadas condiciones 0para n !rande y tanto p como # no
estn prximos a cero1 la distribucin $inomial $0n, p1 se puede aproximar
mediante una distribucin normal
+ebemos tener en cuenta que cuanto mayor sea el valor de n, y cuanto ms
prximo sea p a 9.=, tanto me*or ser la aproximacin realizada. Es decir, basta
con que se verifique
!racias a esta aproximacin es fcil hallar probabilidades binomiales, que para
valores !randes de n resulten muy laboriosos de calcular.
7ay que tener en cuenta que para realizar correctamente esta transformacin de
una variable discreta 0binomial1 en una variable continua 0normal1 es necesario
hacer una correccin de continuidad.
6.=., /RAFICA
A'&+L)a!$% de la dst&7u!$% 7%+)al '+& la %+&)al
Kamos a representar en un sistema de referencia distribuciones binomiales para
distintos valores de n y pA9,;.
eueremos aproximar estas distribuciones a una distribucin normal estndar "
e puede apreciar en los !rficos anteriores como a medida que aumenta n
me*ora el parecido de las !rficas de barras de las distribuciones binomiales
0discretas1 a la !rfica de la distribucin normal estndar 0continua1, pero con el
inconveniente de que se produce un desplazamiento hacia la derecha de la
distribucin binomial a medida que aumenta n.
Este inconveniente se evita, corri!iendo la variable aleatoria, j, restando la media
0para corre!ir el desplazamiento1 y dividiendo por la desviacin tpica0para a*ustar
la dispersin1 "
3 la nueva variable, xj le asi!namos b0n,p,*1. (a representacin, para el caso, n A
:I9 y pA9,; , del dia!rama de barras de la binomial corre!ida y de la funcin de
densidad de la distribucin normal estndar es "
Cuando n aumenta, la lon!itud de las barras disminuye, cosa l!ica, porque la
suma de las lon!itudes de todas las barras es 5 0funcin de probabilidad definida
sobre una variable aleatoria discreta1 ) mientras que el rea ba*o la funcin de
densidad 0definida sobre una variable aleatoria continua1 de la distribucin normal
estandar, tambin es 5.
%ara a*ustar ambas funciones, tendramos que conse!uir que la suma de las reas
de los rectn!ulos que forman el dia!rama de barras fuera 5. Como la distancia
entre las barras es constante y la suma de las alturas de todas las barras es 5, el
rea ba*o los rectn!ulos del dia!rama de barras es i!ual a la distancia entre
barras consecutivas.
:.1 DEFINICION DE 3UESTREO
C+%!e't+ de )uest&e+
El muestreo es una herramienta de la investi!acin cientfica. u funcin bsica es
determinar que parte de una realidad en estudio 0poblacin o universo1 debe
examinarse con la finalidad de hacer inferencias sobre dicha poblacin. El error
que se comete debido a hecho de que se obtienen conclusiones sobre cierta
realidad a partir de la observacin de slo una parte de ella, se denomina error de
muestreo. ,btener una muestra adecuada si!nifica lo!rar una versin simplificada
de la poblacin, que reproduzca de al!&n modo sus ras!os bsicos.
:.1.1 TIPOS DE 3UESTREOS ALEATORIO1 SISTE3ATI>ADOS1
ESTRATIFICADO Y CON/LO3ERADO
3uest&e+ aleat+&+ s)'le
El procedimiento empleado es el si!uiente"
51 e asi!na un n&mero a cada individuo de la poblacin.
:1 3 travs de al!&n medio mecnico 0bolas dentro de una bolsa, tablas de
n&meros aleatorios, n&meros aleatorios !enerados con una calculadora u
ordenador, etc.1 se eli!en tantos su*etos como sea necesario para
completar el tama'o de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad prctica
cuando la poblacin que estamos mane*ando es muy !rande.
Empezaremos definiendo Poblacin, como un con*unto de individuos que se
pueden identificar por separado. e puede pensar en una poblacin concreta que
realmente existe, como en una conceptual que no exista ni que existir *ams. En
ambos casos, el inters se centrar casi exclusivamente en las poblaciones
n&meros. Jna poblacin puede ser discreta o continua, dependiendo de que el
con*unto de n&meros referidos sea discreto o continuo.
Jna poblacin es discreta si consta de un n&mero finito o fi*o de elementos,
medidas u observaciones. %or e*emplo los pesos netos de :9 latas de at&n.
3 diferencia de las poblaciones discretas, las poblaciones continuas contienen una
infinidad de elementos. Este es el caso de cuando observamos una variable
continua y hay una infinidad de resultados distintos. Eambin es el caso de las
alturas de los estudiantes de la Jniversidad.
Jn mtodo para obtener una muestra sencilla aleatoria de una poblacin es el
si!uiente" el empleo de una tabla de n&meros aleatorios. Estas tablas son listas de
cifras del 9 al >, colocados de tal manera que si se eli!e al azar una posicin
cualquiera de la tabla, cada d!ito tiene una posibilidad i!ual de aparecer en dicha
posicin. Es fcil seleccionar una muestra al azar de un con*unto de n&meros,
empleando estas tablas como se muestra en el si!uiente e*emplo"
.btener una muestra sencilla aleatoria de tama9o : de una clase de ;8
estudiantes. ,uponer #ue los estudiantes est(n numerados del 3 al ;8 en la listad
de la clase.
olucin " vamos a una tabla de n&meros aleatorios, y esco!emos un punto de
comienzo. Entonces leemos a lo lar!o de la fila desde este punto, tomando las
cifras por pare*as 0o de una columna de dos cifras hacia aba*o1, obteniendo los
n&meros as"
O1, =;, ,=, I;, <>, ?:, ;=, 1=, 1O, ;:, >I, OK
En la serie ele!imos slo los n&meros comprendidos entre el 5 y el ;9, i!norando
los otros
////
%ara ver la idea de muestreo aleatorio en una poblacin finita de tama'o 6,
primero veamos cuantas muestras distintas se pueden tomar de tama'o n. El
n&mero de muestras distintas es

%or e*emplo si 6A5: y nA :

muestras distintas.
Con base en el resultado de que hay
muestras distintas de tama'o n de una poblacin finita de tama'o 6, podemos
definir como muestra aleatoria o muestra aleatoria simple de una poblacin
finita"
<=na muestra de tama9o n de una poblacin finita de tama9o N es una variable
aleatoria si se selecciona de manera tal #ue cada una de las
muestras posibles tienen la misma probabilidad
de ser seleccionada.
%or e*emplo si una poblacin consistente en lo 6A = elementos a*e*i* o* u 0que
podran ser los in!resos anuales de cinco personas, los pesos de = vacas,.....1 hay
muestras posibles de tama'o n A ; . estas constan de los elementos"
aei aeo aeu aio aiu aou eio eiu eou iou
si seleccionamos una de esas muestras de forma que esta muestra ten!a
probabilidad 5C59 de ser ele!ida, decimos que dicha muestra es aleatoria.
En la prctica el describir todas las posibles muestras seria complicado si 6 y n
son !randes. %or e*emplo si n A < y 6 A :99 tendramos H<,H?<,>=9 muestras
distintas.
%or suerte podemos realizar una muestra aleatoria, sin necesidad de describirlas
todas. $asta con numerar los 6 elementos de la poblacin y retirar una a una
hasta completar los n8 elementos de la muestra. Este procedimiento tambin da
una probabilidad de

de ser seleccionada la muestra por los que sera aleatoria.
3hora bien si la poblacin es infinita" diremos que"
=na muestra de tama9o n de una poblacin infinita es aleatoria si consta de
valores de variables aleatorias independientes #ue tienen la misma distribucin.
%or e*emplo si lanzamos un dado 5: veces y obtenemos :, =, =, ;, ;, ;, =, 5, H,
5,<, 5. Estos n&meros constituyen una variable aleatoria si son valores aleatoria
independientes que tienen la misma distribucin de probabilidad f0x1 A 5CH para xA
5,:,;,<,=,H
3uest&e+ aleat+&+ sste)*t!+
Este procedimiento exi!e, como el anterior, numerar todos los elementos de la
poblacin, pero en lu!ar de extraer n n&meros aleatorios slo se extrae uno. e
parte de ese n&mero aleatorio i, que es un n&mero ele!ido al azar, y los elementos
que inte!ran la muestra son los que ocupa los lu!ares i, i@U, i@:U, i@;U,...,i@0n851U,
es decir se toman los individuos de U en U, siendo U el resultado de dividir el
tama'o de la poblacin entre el tama'o de la muestra" UA 6Cn. El n&mero i que
empleamos como punto de partida ser un n&mero al azar entre 5 y U.
El ries!o este tipo de muestreo est en los casos en que se dan periodicidades en
la poblacin ya que al ele!ir a los miembros de la muestra con una periodicidad
constante 0U1 podemos introducir una homo!eneidad que no se da en la poblacin.
Lma!inemos que estamos seleccionando una muestra sobre listas de 59 individuos
en los que los = primeros son varones y los = &ltimos mu*eres, si empleamos un
muestreo aleatorio sistemtico con UA59 siempre seleccionaramos o slo
hombres o slo mu*eres, no podra haber una representacin de los dos sexos.
3uest&e+ aleat+&+ est&at#!ad+
Erata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tama'o dado de la muestra.
Consiste en considerar cate!oras tpicas diferentes entre s 0estratos1 que poseen
!ran homo!eneidad respecto a al!una caracterstica 0se puede estratificar, por
e*emplo, se!&n la profesin, el municipio de residencia, el sexo, el estado civil,
etc.1. (o que se pretende con este tipo de muestreo es ase!urarse de que todos
los estratos de inters estarn representados adecuadamente en la muestra. Cada
estrato funciona independientemente, pudiendo aplicarse dentro de ellos el
muestreo aleatorio simple o el estratificado para ele!ir los elementos concretos
que formarn parte de la muestra. En ocasiones las dificultades que plantean son
demasiado !randes, pues exi!e un conocimiento detallado de la poblacin.
0Eama'o !eo!rfico, sexos, edades,...1.
(a distribucin de la muestra en funcin de los diferentes estratos se denomina
afi*acin, y puede ser de diferentes tipos"
3fi*acin imple" 3 cada estrato le corresponde i!ual n&mero de elementos
mustrales.
3fi*acin %roporcional" (a distribucin se hace de acuerdo con el peso
0tama'o1 de la poblacin en cada estrato.
3fi*acin ,ptima" e tiene en cuenta la previsible dispersin de los
resultados, de modo que se considera la proporcin y la desviacin tpica.
Eiene poca aplicacin ya que no se suele conocer la desviacin.
i tenemos informacin a cerca de una poblacin 0es decir de su composicin1 y
esta es importante para nuestra investi!acin, podemos me*orar el muestreo
aleatorio por medio de la estratificacin. Este es un procedimiento que consiste en
estratificar o dividir la poblacin en un numero de subpoblaciones o estratos. Q
seleccionamos de cada estrato una muestra aleatoria.
Este procedimiento se conoce como muestreo aleatorio 0simple1 estratificado.
upon!amos una poblacin de tama'o 6 que se divide en U estratos cuyos
tama'os son"
65, 6:, .....,6U 065 @6: @.....@6U A61 %ara obtener una distribucin proporcional
hemos de tener en cuenta que "
de donde se obtiene que
para yA5,:,;,<,.... U donde nA tama'o de la muestra.
Esta seria una distribucin proporcional, pero hay otras formas de distribuir
porciones de una muestra entre los distintos estratos, que seran"
8 +istribucin ptima.
8 Estratificacin cruzada.
8 #uestreo por cuotas.
Dst&7u!$% $'t)a-
En la +istribucin optima, no slo se mane*a el tama'o del estrato, como en la
distribucin proporcional, sino que tambin se mane*a la variabilidad 0o cualquier
otra caracterstica pertinente1 del estrato.
(a idea de la +istribucin ptima, trata de *u!ar no slo con el tama'o del estrato,
sino que tambin pretende *u!ar con la variabilidad del mismo, de forma que
parece l!ico que los estratos de mayor variabilidad le correspondan muestras
mayores. i 5, :, ;, ...., U son las desviaciones tpicas de los U8estratos podemos
explicar tanto los tama'os de los estratos, as como su variabilidad.
de donde se obtienen los tama'os muestrales de la distribucin ptima o
+istribucin de 6eyman 0su inventor1 que se obtienen por la frmula"
para yA5,:,...., U
nA n5@n:@.......@nU
Est&at#!a!$% !&u;ada-
(a estratificacin no se limita a una variable &nica de clasificacin o una
caracterstica y las poblaciones a menudo se estratifican atendiendo a diversos
criterios de ordenacin o clasificacin. 3s por e*emplo si queremos realizar un
estudio entre los alumnos de distintos centros de EE. ##. podramos estratificar la
muestra atendiendo al nivel de estudios, al sexo, a la especialidad,.... 3s parte de
la muestra se dedicara a los alumnos de sexo femenino del 5d de $achillerato
tcnico, otra parte a los alumnos de sexo masculino de 5d $achillerato artstico, y
as sucesivamente. 3s y hasta cierto punto una estratificacin de este tipo,
llamada estratificacin cruzada, incrementar la precisin de las estimaciones y
otras !eneralizaciones que se usan com&nmente en el muestreo de opinin y las
investi!aciones de mercado.
3uest&e+ '+& !u+tas-
En el muestreo estratificado, el costo de la toma de muestras aleatorias de los
estratos individuales es tan alto, que a los encuestadores slo se les dan cuotas
que deben cubrir de los diferentes estratos, con al!una restricciones 0si no es que
nin!una1 %or e*emplo si se quiere hacer un sondeo sobre la me*ora de los
servicios de salud, por e*emplo se le pide que encueste a 59 mu*eres de entre ;= y
<= a'os que sean asalariadas, :9 hombres de entre ;9 y <= a'os que vivan en
pisos de ; o < habitaciones, a ; hombres de mas de H9 a'os que estn
*ubilados.... esto es lo que se determina un muestreo por cuotas y es relativamente
econmico, lo &nico es que las muestras resultantes no cumplen las
caractersticas esenciales de las muestras aleatorias. %or tanto estos muestreos,
por cuotas en esencia son muestras de opinin, pero no son vlidos para realizar
un estudio estadstico formal.
3uest&e+ aleat+&+ '+& !+%8l+)e&ad+s
(os mtodos presentados hasta ahora estn pensados para seleccionar
directamente los elementos de la poblacin, es decir, que las unidades mustrales
son los elementos de la poblacin.
En el muestreo por con!lomerados la unidad muestral es un !rupo de elementos
de la poblacin que forman una unidad, a la que llamamos con!lomerado. (as
unidades hospitalarias, los departamentos universitarios, una ca*a de determinado
producto, etc., son con!lomerados naturales. En otras ocasiones se pueden
utilizar con!lomerados no naturales como, por e*emplo, las urnas electorales.
Cuando los con!lomerados son reas !eo!rficas suele hablarse de -muestreo
por reas-.
El muestreo por con!lomerados consiste en seleccionar aleatoriamente un cierto
numero de con!lomerados 0el necesario para alcanzar el tama'o muestral
establecido1 y en investi!ar despus todos los elementos pertenecientes a los
con!lomerados ele!idos.
%ara ilustrar esta clase de muestreo, supon!amos que una !ran empresa quiere
estudiar los patrones variables de los !astos familiares de una ciudad como
$uenos 3ires. 3l intentar elaborar los pro!ramas de !astos de una muestra de
5:99 familias, nos encontramos con la dificultad de realizar un muestreo aleatorio
simple, 0es complicado tener una lista actualizada de todos los habitantes de una
ciudad1. Jna manera de tomar una muestra en esta situacin es dividir el rea
total 0$uenos 3ires en este caso1 en reas ms peque'as que no se solapen 0%or
e*emplo cdi!o postal, barrios, manzanas etc..1 En este caso seleccionaramos
al!unas reas al azar y todas las familias 0o muestras de stas1 que residen en
estos cdi!os postales, barrios o manzanas, constituiran la muestra definitiva.
En este tipo de muestreo, llamado )uest&e+ '+& !+%8l+)e&ad+s, se divide la
poblacin total en un n&mero determinado de subdivisiones relativamente
peque'as y se seleccionan al azar al!unas de estas subdivisiones o
con!lomerados, para incluirlos en la muestra total. i estos con!lomerados
coinciden con reas !eo!rficas, este muestreo se llama tambin )uest&e+ '+&
*&eas.
3unque las estimaciones basadas en el muestreo por con!lomerados, por lo
!eneral no son tan fiables como las obtenidas por muestreos aleatorios simples
del mismo tama'o, son ms baratas. Kolviendo al e*emplo anterior, es mucho ms
econmico visitar a familias que viven en el mismo vecindario, que ir visitando a
familias que viven en un rea muy extensa.
En la prctica se pueden combinar el uso de varios de los mtodos de muestreo
que hemos analizados para un mismo estudio.
4e%ta9as e %!+%(e%e%tes de l+s dst%t+s t'+s de )uest&e+ '&+7a7lst!+
C3T3CEETLELC3 KE6E3O3
L6C,6KE6LE6EE

Aleat+&+
s)'le
e selecciona una
muestra de tama'o n de
una poblacin de 6
unidades, cada
elemento tiene una
probabilidad de
inclusin i!ual y
conocida de nC6.
encillo y de
fcil
comprensin.
Clculo rpido
de medias y
varianzas.
e basa en la
teora
estadstica, y
por tanto
existen
paquetes
informticos
para analizar
los datos
Tequiere que se
posea de antemano
un listado completo
de toda la
poblacin. Cuando
se traba*a con
muestras peque'as
es posible que no
represente a la
poblacin
adecuadamente.
Sste)*t!+
Conse!uir un listado de
los 6 elementos de la
poblacin
+eterminar tama'o
muestral n.
+efinir un intervalo UA
6Cn.
Ele!ir un n&mero
aleatorio, r, entre 5 y U
.cil de aplicar.
6o siempre es
necesario tener
un listado de
toda la
poblacin.
Cuando la
poblacin est
ordenada
si!uiendo una
i la constante de
muestreo est
asociada con el
fenmeno de
inters, las
estimaciones
obtenidas a partir
de la muestra
pueden contener
ses!o de seleccin
0rA arranque aleatorio1.
eleccionar los
elementos de la lista.
tendencia
conocida,
ase!ura una
cobertura de
unidades de
todos los tipos.
Est&at#!ad+
En ciertas ocasiones
resultar conveniente
estratificar la muestra
se!&n ciertas variables
de inters. %ara ello
debemos conocer la
composicin
estratificada de la
poblacin ob*etivo a
hacer un muestreo. Jna
vez calculado el tama'o
muestral apropiado,
este se reparte de
manera proporcional
entre los distintos
estratos definidos en la
poblacin usando una
simple re!la de tres.
Eiende a
ase!urar que la
muestra
represente
adecuadamente
a la poblacin
en funcin de
unas variables
seleccionadas.
e obtienen
estimaciones
ms precisa
u ob*etivo es
conse!uir una
muestra lo ms
seme*ante
posible a la
poblacin en lo
que a la o las
variables
estratificadoras
se refiere.
e ha de
conocer la
distribucin
en la
poblacin de
las variables
utilizadas
para la
estratificaci
n.
C+%8l+)e&ad+
s
e realizan varias fases
de muestreo sucesivas
0polietpico1
(a necesidad de
listados de las unidades
de una etapa se limita a
aquellas unidades de
muestreo seleccionadas
en la etapa anterior.
Es muy
eficiente
cuando la
poblacin es
muy !rande y
dispersa.
6o es preciso
tener un listado
de toda la
poblacin, slo
de las unidades
primarias de
muestreo.
El error
estndar es
mayor que
en el
muestreo
aleatorio
simple o
estratificado.
El clculo
del error
estndar es
comple*o.
UNIDAD :
3UESTREO Y ESTI3ACIONES
:., CONCEPTO DE DISTRIBUCI5N DE 3UESTREO DE LA 3EDIA
:.,.1 DISTRIBUCION 3UESTRAL DE LA 3EDIA CON DES4IACI5N ESTANDAR
CONOCIDA Y DESCONOCIDAD
i tenemos una muestra aleatoria de una poblacin 60 , 1, se sabe 0Eeorema
del lmite central1 que la fdp de la media muestral es tambin normal con media
y varianza
:
Cn. Esto es exacto para poblaciones normales y aproximado 0buena
aproximacin con nf;91 para poblaciones cualesquiera. Es decir es el error
tpico, o error estndar de la media.
MCmo usamos esto en nuestro problema de estimacinN
5d problema" 6o hay tablas para cualquier normal, slo para la normal A9 y A5
0la llamada z1) pero haciendo la transformacin 0llamada tipificacin1
una normal de media y desviacin se transforma en una z.
(lamando z al valor de una
variable normal tipificada que
de*a a su derecha un rea ba*o
la curva de , es decir, que la
probabilidad que la variable sea
mayor que ese valor es 0estos
son los valores que ofrece la
tabla de la normal1
podremos construir intervalos de
la forma
para los que la probabilidad es 5
8 .
Eeniendo en cuenta la simetra de la normal y manipulando al!ebracamente
que tambin se puede escribir
o, haciendo nfasis en que es el error estndar de la media,
Tecurdese que la probabilidad de que est en este intervalo es 5 8 . 3 un
intervalo de este tipo se le denomina intervalo de confianza con un nivel de
confianza del 59905 8 1^, o nivel de si!nificacin de 599 ^. El nivel de confianza
habitual es el >=^, en cuyo caso A9,9= y z C:A5,>H. 3l valor se le denomina
estimacin puntual y se dice que es un estimador de .
E*emplo" i de una poblacin normal con varianza < se extrae una muestra
aleatoria de tama'o :9 en la que se calcula se puede decir que tiene
una probabilidad de 9,>= de estar comprendida en el intervalo
que sera el intervalo de confianza al >=^ para
En !eneral esto es poco &til, en los casos en que no se conoce tampoco suele
conocerse
:
) en el caso ms realista de
:
desconocida los intervalos de
confianza se construyen con la t de tudent 0otra fdp continua para la que hay
tablas1 en lu!ar de la z.
o, haciendo nfasis en que es el error estndar estimado de la media,
Este manera de construir los intervalos de confianza slo es vlido si la variable es
normal. Cuando n es !rande 0f;91 se puede sustituir t por z sin mucho error.
:.,., DISTRIBUCION 3UESTRAL DE LA DIFERENCIA ENTRE DOS 3EDIAS
CON
DES4IACI5N ESTANDAR CONOCIDAD Y DESCONOCIDA
Dst&7u!$% 3uest&al de D#e&e%!a de 3edas
upon!a que se tienen dos poblaciones distintas, la primera con media 5 y
desviacin estndar 5, y la se!unda con media : y desviacin estndar :. #s a&n,
se eli!e una muestra aleatoria de tama'o n5 de la primera poblacin y una
muestra independiente aleatoria de tama'o n: de la se!unda poblacin) se calcula
la media muestral para cada muestra y la diferencia entre dichas medias. (a
coleccin de todas esas diferencias se llama distribucin muestral de las
diferencias entre medias o la distribucin muestral del estadstico
(a distribucin es aproximadamente normal para n5 ;9 y n: ;9. i las
poblaciones son normales, entonces la distribucin muestral de medias es normal
sin importar los tama'os de las muestras.
E*emplo"
En un estudio para comparar los pesos promedio de ni'os y ni'as de sexto !rado
en una escuela primaria se usar una muestra aleatoria de :9 ni'os y otra de :=
ni'as. e sabe que tanto para ni'os como para ni'as los pesos si!uen una
distribucin normal. El promedio de los pesos de todos los ni'os de sexto !rado de
esa escuela es de 599 libras y su desviacin estndar es de 5<.5<:, mientras que
el promedio de los pesos de todas las ni'as del sexto !rado de esa escuela es de
?= libras y su desviacin estndar es de 5:.:<I libras. i representa el promedio
de los pesos de :9 ni'os y es el promedio de los pesos de una muestra de :=
ni'as, encuentre la probabilidad de que el promedio de los pesos de los :9 ni'os
sea al menos :9 libras ms !rande que el de las := ni'as.
,olucin>
+atos"
5 A 599 libras
: A ?= libras
5 A 5<.5<: libras
: A 5:.:<I libras
n5 A :9 ni'os
n: A := ni'as
%or lo tanto, la probabilidad de que el promedio de los pesos de la muestra de
ni'os sea al menos :9 libras ms !rande que el de la muestra de las ni'as es
9.59=H.
E*emplo"
Jno de los principales fabricantes de televisores compra los tubos de rayos
catdicos a dos compa'as. (os tubos de la compa'a 3 tienen una vida media de
I.: a'os con una desviacin estndar de 9.? a'os, mientras que los de la $ tienen
una vida media de H.I a'os con una desviacin estndar de 9.I. +etermine la
probabilidad de que una muestra aleatoria de ;< tubos de la compa'a 3 ten!a
una vida promedio de al menos un a'o ms que la de una muestra aleatoria de <9
tubos de la compa'a $.
,olucin>
+atos"
3 A I.: a'os
$ A H.I a'os
3 A 9.? a'os
$ A 9.I a'os
n3 A ;< tubos
n$ A <9 tubos
E*emplo"
e prueba el rendimiento en UmC( de : tipos de !asolina, encontrndose una
desviacin estndar de 5.:;UmC( para la primera !asolina y una desviacin
estndar de 5.;IUmC( para la se!unda !asolina) se prueba la primera !asolina en
;= autos y la se!unda en <: autos.
a. MCul es la probabilidad de que la primera !asolina de un rendimiento
promedio mayor de 9.<=UmC( que la se!unda !asolinaN
b. MCul es la probabilidad de que la diferencia en rendimientos promedio se
encuentre entre 9.H= y 9.?;UmC( a favor de la !asolina 5N.
,olucin>
En este e*ercicio no se cuenta con los parmetros de las medias en nin!una de las
dos poblaciones, por lo que se supondrn que son i!uales.
+atos"
5 A 5.:; FmC(to
: A 5.;I FmC(to
n5 A ;= autos
n: A <: autos
(a probabilidad de que la diferencia en rendimientos promedio en las muestras se
encuentre entre 9.H= y 9.?; FmC(to a favor de la !asolina 5 es de 9.955I.
:.,.6 DISTRIBUCION 3UESTRAL DE LA PROPORCION
Dst&7u!$% )uest&al de P&+'+&!+%es
Existen ocasiones en las cuales no estamos interesados en la media de la
muestra, sino que queremos investi!ar la proporcin de artculos defectuosos o la
proporcin de alumnos reprobados en la muestra. (a distribucin muestral de
proporciones es la adecuada para dar respuesta a estas situaciones. Esta
distribucin se !enera de i!ual manera que la distribucin muestral de medias, a
excepcin de que al extraer las muestras de la poblacin se calcula el estadstico
proporcin 0pAxCn en donde -x- es el n&mero de xitos u observaciones de inters
y -n- el tama'o de la muestra1 en lu!ar del estadsitico media.
Jna poblacin binomial est estrechamente relacionada con la distribucin
muestral de proporciones) una poblacin binomial es una coleccin de xitos y
fracasos, mientras que una distribucin muestral de proporciones contiene las
posibilidades o proporciones de todos los n&meros posibles de xitos en un
experimento binomial, y como consecuencia de esta relacin, las afirmaciones
probabilsticas referentes a la proporcin muestral pueden evaluarse usando la
aproximacin normal a la binomial, siempre que np = y
n058p1 =. Cualquier evento se puede convertir en una proporcin si se divide el
n&mero obtenido entre el n&mero de intentos.
/e%e&a!$% de la Dst&7u!$% 3uest&al de P&+'+&!+%es
upon!a que se cuenta con un lote de 5: piezas, el cual tiene < artculos
defectuosos. e van a seleccionar = artculos al azar de ese lote sin reemplazo.
2enere la distribucin muestral de proporciones para el n&mero de piezas
defectuosas.
Como se puede observar en este e*ercicio la %roporcin de artculos defectuosos
de esta poblacin es <C5:A5C;. %or lo que podemos decir que el ;;^ de las piezas
de este lote estn defectuosas.
El n&mero posible de muestras de tama'o = a extraer de una poblacin de 5:
elementos es 5:C=AI>:, las cuales se pueden des!losar de la si!uiente manera"
A&t!ul+s
Bue%+s
A&t!ul+s
3al+s
P&+'+&!$%
de a&t!ul+s
de#e!tu+s+
NQ)e&+ de
)a%e&as e% las
Rue se 'uede
+7te%e& la
)uest&a
5 < <C=A9.? ?C5/<C<A?
: ; ;C=A9.H ?C:/<C;A55:
; : :C=A9.< ?C;/<C:A;;H
< 5 5C=A9.: ?C</<C5A:?9
= 9 9C=A9 ?C=/<C9A=H
T+tal <N,
%ara calcular la media de la distribucin muestral de proporciones se tendra que
hacer la sumatoria de la frecuencia por el valor de la proporcin muestral y dividirla
entre el n&mero total de muestras.
Como podemos observar la media de la distribucin muestral de proporciones es
i!ual a la %roporcin de la poblacin.
'
I P
Eambin se puede calcular la desviacin estndar de la distribucin muestral de
proporciones"
(a varianza de la distribucin binomial es
:
A npq, por lo que la varianza de la
distribucin muestral de proporciones es
:
p A0%q1Cn. i se sustituten los valores
en esta frmula tenemos que , este valor no coincide con el de 9.5H?5, ya que nos
falta a!re!ar el factor de correccin para una poblacin finita y un muestreo sin
reemplazo"
(a frmula que se utilizar para el clculo de probabilidad en una distribucin
muestral de proporciones est basada en la aproximacin de la distribucin normal
a la binomial . Esta frmula nos servir para calcular la probabilidad del
comportamiento de la proporcin en la muestra.
E*emplo"
e ha determinado que H9^ de los estudiantes de una universidad !rande fuman
ci!arrillos. e toma una muestra aleatoria de ?99 estudiantes. Calcule la
probabilidad de que la proporcin de la muestra de la !ente que fuma ci!arrillos
sea menor que 9.==.
olucin"
Este e*ercicio se puede solucionar por dos mtodos. El primero puede ser con la
aproximacin de la distribucin normal a la binomial y el se!undo utilizando la
frmula de la distribucin muestral de proporciones.
3proximacin de la distribucin normal a la binomial"
+atos"
nA?99 estudiantes
pA9.H9
xA 0.==10?991 A <<9 estudiantes
p0x <<91 A N
#ediaA npA 0?99109.H91A <?9
p0x <<91 A 9.995I. Este valor si!nifica que existe una probabilidad del 9.5I^ de
que al extraer una muestra de ?99 estudiantes, menos de <<9 fuman ci!arrillos.

Dst&7u!$% 3uest&al de P&+'+&!+%es
+atos"
nA?99 estudiantes
%A9.H9
pA 9.==
p0p 9.==1 A N
:.,.: DISTRIBUCION 3UESTRAL DE LA DIFERENCIA DE DOS
PROPORCIONES
Dst&7u!$% 3uest&al de D#e&e%!a de P&+'+&!+%es
#uchas aplicaciones involucran poblaciones de datos cualitativos que deben
compararse utilizando proporciones o porcenta*es. 3 continuacin se citan al!unos
e*emplos"
Educacin.8 MEs mayor la proporcin de los estudiantes que aprueban
matemticas que las de los que aprueban in!lsN
#edicina.8 MEs menor el porcenta*e de los usuarios del medicamento 3
que presentan una reaccin adversa que el de los usuarios del frmaco $
que tambin presentan una reaccin de ese tipoN
3dministracin.8 M7ay diferencia entre los porcenta*es de hombres y
mu*eres en posiciones !erenciales.
Ln!eniera.8 MExiste diferencia entre la proporcin de artculos
defectuosos que !enera la mquina 3 a los que !enera la mquina $N
Cuando el muestreo procede de dos poblaciones binomiales y se traba*a con dos
proporciones muestrales, la distribucin muestral de diferencia de proporciones es
aproximadamente normal para tama'os de muestra !rande 0n5p5 =, n5q5 =,n:p:
= y n:q: =1. Entonces p5 y p: tienen distribuciones muestrales aproximadamente
normales, as que su diferencia p58p: tambin tiene una distribucin muestral
aproximadamente normal.
E*emplo"
(os hombres y mu*eres adultos radicados en una ciudad !rande del norte difieren
en sus opiniones sobre la promul!acin de la pena de muerte para personas
culpables de asesinato. e cree que el 5:^ de los hombres adultos estn a favor
de la pena de muerte, mientras que slo 59^ de las mu*eres adultas lo estn. i
se pre!unta a dos muestras aleatorias de 599 hombres y 599 mu*eres su opinin
sobre la promul!acin de la pena de muerte, determine la probabilidad de que el
porcenta*e de hombres a favor sea al menos ;^ mayor que el de las mu*eres.
,olucin>
+atos"
%7 A 9.5:
%# A 9.59
n7 A 599
n# A 599
p0p78p# 9.9;1 A N
e recuerda que se est incluyendo el factor de correccin de 9.= por ser una
distribucin binomial y se est utilizando la distribucin normal.
e concluye que la probabilidad de que el porcenta*e de hombres a favor de la
pena de muerte, al menos ;^ mayor que el de mu*eres es de 9.<=H:.
E*emplo"
Jna encuesta del $oston Colle!e const de ;:9 traba*adores de #ichi!an que
fueron despedidos entre 5>I> y 5>?<, encontr que :9^ haban estado sin traba*o
durante por lo menos dos a'os. upn!ase que tuviera que seleccionar otra
muestra aleatoria de ;:9 traba*adores de entre todos los empleados despedidos
entre 5>I> y 5>?<. MCul sera la probabilidad de que su porcenta*e muestral de
traba*adores sin empleo durante por lo menos dos a'os, difiera del porcenta*e
obtenido en la encuesta de $oston Colle!e, en =^ o msN
olucin"
En este e*ercicio se cuenta &nicamente con una poblacin, de la cual se estn
extrayendo dos muestras y se quiere saber la probabilidad de la diferencia de los
porcenta*es en esas dos muestras, por lo que se debe de utilizar la distribucin
muestral de proporciones con %5A %:, ya que es una misma poblacin.
,tra de las situaciones con la cual nos topamos es que desconocemos la
proporcin de traba*adores despedidos entre 5>I> y 5>?< que estuvieron
desempleados por un perodo de por lo menos dos a'os, slo se conoce la p5A
9.:9 ya que al tomar una muestra de ;:9 traba*adores se observ esa proporcin.
En la frmula de la distribucin muestral de proporciones para el clculo de
probabilidad se necesita saber las proporciones de las poblaciones, las cuales en
este e*ercicio las desconocemos, por lo que se utilizar el valor de 9.:9 como una
estimacin puntual de %. En el si!uiente tema se abordar el tema de estimacin
estadstica y se comprender el porque estamos utilizando de esa manera el dato.
Eambin debe de comprenderse la pre!unta que nos hace este problema, Mcul
sera la probabilidad de que su porcenta*e muestral de traba*adores sin empleo
durante por lo menos dos a'os, difiera del porcenta*e obtenido en la encuesta de
$oston Colle!e, en =^ o msN, la palabra difiera quiere decir que puede existir
una diferencia a favor de la muestra uno, o a favor de la muestra dos, por lo que
se tendrn que calcular dos reas en la distribucin y al final sumarlas.
+atos"
p5 A 9.:9
n5 A ;:9 traba*adores
n: A ;:9 traba*adores
%5 A %:
(a probabilidad de que su proporcion muestral de traba*adores sin empleo durante
por lo menos dos a'os, difiera del porcenta*e obtenido en la encuesta de $oston
Colle!e, en 9.9= o ms es de 9.5:H9.
E*emplo"
e sabe que ; de cada H productos fabricados por la mquina 5 son defectuosos y
que : de cada = ob*etos fabricados por la mquina : son defectuosos) se toman
muestras de 5:9 ob*etos de cada mquina"
a. Mcul es la probabilidad de que la proporcin de artculos defectuosos de la
mquina : rebase a la mquina 5 en por lo menos 9.59N
b. Mcul es la probabilidad de que la proporcin de artculos defectuosos de la
mquina 5 rebase a la mquina : en por lo menos 9.5=N
,olucin>
+atos"
%5 A ;CH A 9.=
%: A :C= A 9.<
n5 A 5:9 ob*etos
n: A 5:9 ob*etos
a. p0p:8p5 9.591 A N
,tra manera de hacer este e*ercicio es poner %58%:"
(a probabilidad de que exista una diferencia de proporciones de artculos
defectuosos de por lo menos 59^ a favor de la mquina : es de 9.9955.
b. p0p58p: 9.5=1AN
(a probabilidad de que exista una diferencia de proporciones de artculos
defectuosos de por lo menos 5=^ a favor de la mquina 5 es de 9.:;=I.
:.6 TEORE3A DEL L3ITE CENTRAL
%ara muestras !randes, se puede obtener una aproximacin cercana de la
distribucin muestral de la media con una distribucin normal.
Eeniendo en cuenta que ya sabemos la media y desviacin tpica de la distribucin
muestral, podemos decir que"
x A y
para muestras aleatorias infinitas con media y desviacin tpica y n !rande,
entonces"
es un valor de una variable 609,51
Este teorema es muy importante, puesto que *ustifica el uso de los mtodos de la
curva normal en una !ran cantidad de problemas. se utiliza para poblaciones
infinitas y para poblaciones finitas cuando n a pesar de ser !rande representa una
porcin muy peque'a de la poblacin.
Es difcil se'alar con precisin qu tan !rande debe ser n de modo que podamos
aplicar el Eeorema Central del lmite, pero a no ser que la distribucin sea muy
Lnusual, por lo !eneral se considera que n A;9 es lo suficientemente alto.
Keamos el mismo e*emplo anterior aplicando el Eeorema Central del (mite.
(a probabilidad se obtiene por medio del rea marcada de la zona !ris,
especficamente por medio del rea de la 609,51 entre"
lo que consultando en las tablas da una probabilidad de 9,>=<<. 3s sustituimos la
afirmacin de que la probabilidad es Zcomo mnimo 9,I=[ por una aseveracin ms
firme de que la probabilidad es aproximadamente de 9,>= 0 de que la muestra
aleatoria de tama'o nAH< de la poblacin de referencia difiera de la de la
poblacin menos de = unidades1
Eambin se puede usar el teorema Central del lmite para poblaciones finitas, pero
una descripcin precisa de las situaciones en que se puede hacer esto, sera ms
bien complicada. El uso apropiado ms com&n es en el caso en que n es !rande y
nC6 es peque'a. Este es el caso de la mayora de las encuestas polticas.
:.:. TIPOS DE ESTI3ACI5N Y SUS CARACTERSTICAS
ESTI3ACION
El ob*etivo principal de la estadstica inferencial es la est)a!$%, esto es que
mediante el estudio de una muestra de una poblacin se quiere !eneralizar las
conclusiones al total de la misma. Como vimos en la seccin anterior, los
estadsticos varan mucho dentro de sus distribuciones mustrales, y mientras
menor sea el error estndar de un estadstico, ms cercanos sern unos de otros
sus valores.
Existen dos tipos de estimaciones para parmetros) puntuales y por intervalo. Jna
est)a!$% 'u%tual es un &nico valor estadstico y se usa para estimar un
parmetro. El estadstico usado se denomina est)ad+&.
Jna est)a!$% '+& %te&(al+ es un ran!o, !eneralmente de ancho finito, que se
espera que conten!a el parmetro.
Est)a!$% Pu%tual
(a inferencia estadstica est casi siempre concentrada en obtener al!&n tipo de
conclusin acerca de uno o ms parmetros 0caractersticas poblacionales1. %ara
hacerlo, se requiere que un investi!ador obten!a datos muestrales de cada una de
las poblaciones en estudio. Entonces, las conclusiones pueden estar basadas en
los valores calculados de varias cantidades muestrales . %o e*emplo,
representamos con 0parmetro1 el verdadero promedio de resistencia a la
ruptura de conexiones de alambres utilizados para unir obleas de
semiconductores. %odra tomarse una muestra aleatoria de 59 conexiones para
determinar la resistencia a la ruptura de cada una, y la media muestral de la
resistencia a la ruptura se poda emplear para sacar una conclusin acerca del
valor de . +e forma similar, si es la varianza de la distribucin de resistencia
a la ruptura, el valor de la varianza muestral s
:
se podra utilizar pra inferir al!o
acerca de .
Cuando se analizan conceptos !enerales y mtodos de inferencia es conveniente
tener un smbolo !enrico para el parmetro de inters. e utilizar la letra !rie!a
para este propsito. )l objetivo de la estimacin puntual es seleccionar slo un
nmero* basados en datos de la muestra* #ue represente el valor m(s ra"onable
de .
Jna muestra aleatoria de ; bateras para calculadora podra presentar duraciones
observadas en horas de x5A=.9, x:AH.< y x;A=.>. El valor calculado de la duracin
media muestral es A =.II, y es razonable considerar =.II como el valor ms
adecuado de .
Jna est)a!$% 'u%tual de un parmetro es un slo n&mero que se puede
considerar como el valor ms razonable de . (a estimacin puntual se obtiene al
seleccionar una estadstica apropiada y calcular su valor a partir de datos de la
muestra dada. (a estadstica seleccionada se llama est)ad+& 'u%tual de .

El smbolo 0theta sombrero1 suele utilizarse para representar el estimador de y
la estimacin puntual resultante de una muestra dada. Entonces se lee como
-el estimador puntual de es la media muestral -. El enunciado -la estimacin
puntual de es =.II- se puede escribir en forma abreviada .
E*emplo"
En el futuro habr cada vez ms inters en desarrollar aleaciones de #! de ba*o
costo, para varios procesos de fundicin. En consecuencia, es importante contar
con mtodos prcticos para determinar varias propiedades mecnicas de esas
aleaciones. Examine la si!uiente muestra de mediciones del mdulo de elasticidad
obtenidos de un proceso de fundicin a presin"
<<.: <;.> <<.I <<.: <<.9 <;.? <<.H <;.5
upon!a que esas observaciones son el resultado de una muestra aleatoria. e
desea estimar la varianza poblacional . Jn estimador natural es la varianza
muestral"
En el me*or de los casos, se encontrar un estimador para el cual siempre.
in embar!o, es una funcin de las 4i muestrales, por lo que en s misma una
variable aleatoria.
Entonces el estimador preciso sera uno que produzca slo peque'as diferencias
de estimacin, de modo que los valores estimados se acerquen al valor verdadero.
%ropiedades de un $uen Estimador
I%ses8ad+.P e dice que un estimador puntual es un estimador inses!ado de si
, para todo valor posible de . En otras palabras, un estimador inses!ado
es aquel para el cual la media de la distribucin muestral es el parmetro
estimado. i se usa la media muestral para estimar la media poblacional , se
sabe que la , por lo tanto la media es un estimador inses!ado.
E#!e%te + !+% (a&a%;a )%)a.P upon!a que 5 y : son dos estimadores
inses!ados de . Entonces, aun cuando la distribucin de cada estimador est
centrada en el valor verdadero de , las dispersiones de las distribuciones
alrededor del valor verdadero pueden ser diferentes.
Entre todos los estimadores de que son inses!ados, seleccione al que ten!a
varianza mnima. El resultante recibe el nombre de est)ad+& %ses8ad+ !+%
(a&a%;a )%)a 0#KJE, minimum variance unbiased estimator1 de .
En otras palabras, la eficiencia se refiere al tama'o de error estndar de la
estadstica. i comparamos dos estaisticas de una muestra del mismo tama'o y
tratamos de decidir cual de ellas es un estimador mas eficiente, esco!eramos la
estadstica que tuviera el menor error estndar, o la menor desviacin estndar de
la distribucin de muestreo.
Eiene sentido pensar que un estimador con un error estndar menor tendr una
mayor oportunidad de producir una estimacin mas cercana al parmetro de
poblacin que se esta considerando.
Como se puede observar las dos distribuciones tienen un mismo valor en el
parmetro slo que la distribucin muestral de medias tiene una menor varianza,
por lo que la media se convierte en un estimador eficiente e inses!ado.
C+@e&e%!a.P Jna estadstica es un estimador coherente de un parmetro de
poblacin, si al aumentar el tama'o de la muestra se tiene casi la certeza de que
el valor de la estadstica se aproxima bastante al valor del parmetro de la
poblacin. i un estimador es coherente se vuelve mas confiable si tenemos
tama'os de muestras mas !randes.
Su#!e%!a.P Jn estimador es suficiente si utiliza una cantidad de la informacin
contenida de la muestra que nin!&n otro estimador podra extraer informacin
adicional de la muestra sobre el parmetro de la poblacin que se esta estimando.
Es decir se pretende que al extraer la muestra el estadstico calculado conten!a
toda la informacin de esa muestra. %or e*emplo, cuando se calcula la media de la
muestra, se necesitan todos los datos. Cuando se calcula la mediana de una
muestra slo se utiliza a un dato o a dos. Esto es solo el dato o los datos del
centro son los que van a representar la muestra. Con esto se deduce que si
utilizamos a todos los datos de la muestra como es en el caso de la media, la
varianza, desviacin estndar, etc) se tendr un estimador suficiente.
Est)a!$% '+& I%te&(al+s
Jn estimado puntual, por ser un slo n&mero, no proporciona por s mismo
informacin al!una sobre la precisin y confiabilidad de la estimacin. %or
e*emplo, ima!ine que se usa el estadstico para calcular un estimado puntual de
la resistencia real a la ruptura de toallas de papel de cierta marca, y supon!a que
A >;::.I. +ebido a la variabilidad de la muestra, nunca se tendr el caso de que
A . El estimado puntual nada dice sobre lo cercano que esta de . Jna
alternativa para reportar un solo valor del parmetro que se est estimando es
calcular e informar todo un intervalo de valores factibles, un estimado de intervalo
o intervalo de confian"a 0?/1. Jn intervalo de confianza se calcula siempre
seleccionando primero un nivel de confianza, que es una medida de el !rado de
fiabilidad en el intervalo. Jn intervalo de confianza con un nivel de confianza de
>=^ de la resistencia real promedio a la ruptura podra tener un lmite inferior de
>5H:.= y uno superior de ><?:.>. Entonces, en un nivel de confianza de >=^, es
posible tener cualquier valor de entre >5H:.= y ><?:.>. Jn nivel de confianza de
>=^ implica que >=^ de todas las muestras dara lu!ar a un intervalo que incluye
o cualquier otro parmetro que se est estimando, y slo =^ de las muestras
producir un intervalo errneo. Cuanto mayor sea el nivel de confianza podremos
creer que el valor del parmetro que se estima est dentro del intervalo.
Jna interpretacin correcta de la -confianza de >=^- radica en la interpretacin
frecuente de probabilidad a lar!o plazo" decir que un evento 3 tiene una
probabilidad de 9.>=, es decir que si el experimento donde 3 est definido re
realiza una y otra vez, a lar!o plazo 3 ocurrir >=^ de las veces. %ara este caso
el >=^ de los intervalos de confianza calculados contendrn a .
Esta es una construccin repetida de intervalos de confianza de >=^ y se puede
observar que de los 55 intervalos calculados slo el tercero y el &ltimo no
contienen el valor de .
+e acuerdo con esta interpretacin, el nivel de confianza de >=^ no es tanto un
enunciado sobre cualquier intervalo en particular, ms bien se refiere a lo que
sucedera si se tuvieran que construir un !ran n&mero de intervalos seme*antes.
E%!+%t&a& ; a 'a&t& de u% %(el de !+%#a%;a
Existen varias tablas en las cuales podemos encontrar el valor de z, se!&n sea el
rea proporcionada por la misma. En esta seccin se realizar un e*emplo para
encontrar el valor de z utilizando tres tablas diferentes.
E*emplo"
Encuentre el valor de z para un nivel de confianza del >=^.
,olucin 3>
e utilizar la tabla que tiene el rea ba*o la curva de 8 hasta z. i lo vemos
!rficamente sera"
El nivel de confianza bilateral est dividido en partes i!uales ba*o la curva"
En base a la tabla que se esta utilizando, se tendr que buscar el rea de 9.>I=,
ya que cada extremo o cola de la curva tiene un valor de 9.9:=.
%or lo que el valor de z es de 5.>H.
,olucin 4>
i se utiliza una tabla en donde el rea ba*o la curva es de 9 a z"
En este caso slo se tendr que buscar adentro de la tabla el rea de 9.<I= y el
resultado del valor de z ser el mismo, para este e*emplo 5.>H.

,olucin ;>
%ara la tabla en donde el rea ba*o la curva va desde z hasta "
e busca el valor de 9.9:= para encontrar z de 5.>H.
Lndependientemente del valor del 6ivel de Confianza este ser el procedimiento a
se!uir para localizar a z. En el caso de que no se encuentre el valor exacto se
tendr que interpolar.
Est)a!$% 'a&a la 3eda
Es conocido de nosotros durante este curso, que en base a la distribucin
muestral de medias que se !ener en el tema anterior, la formula para el calculo
de probabilidad es la si!uiente" . Como en este caso no conocemos
el parmetro y lo queremos estimar por medio de la media de la muestra, slo se
despe*ar de la formula anterior, quedando lo si!uiente"
+e esta formula se puede observar que tanto el tama'o de la
muestra como el valor de z se conocern. h se puede obtener de la tabla de la
distribucin normal a partir del nivel de confianza establecido. %ero en ocasiones
se desconoce por lo que en esos casos lo correcto es utilizar otra distribucin
llamada -t- de student si la poblacin de donde provienen los datos es normal.
%ara el caso de tama'os de muestra !rande se puede utilizar una estimacin
puntual de la desviacin estndar, es decir i!ualar la desviacin estndar de la
muestra a la de la poblacin 0sA 1.
E*emplos"
5. e encuentra que la concentracin promedio de zinc que se saca del a!ua
a partir de una muestra de mediciones de zinc en ;H sitios diferentes es de
:.H !ramos por mililitro. Encuentre los intervalos de confianza de >=^ y
>>^ para la concentracin media de zinc en el ro. upon!a que la
desviacin estndar de la poblacin es 9.;.
,olucin>
(a estimacin puntual de es A :.H. El valor de z para un nivel de
confianza del >=^ es 5.>H, por lo tanto"
%ara un nivel de confianza de >>^ el valor de z es de :.=I= por lo que el
intervalo ser ms amplio"
El intervalo de confianza proporciona una estimacin de la presicin de
nuestra estimacin puntual. i es realmente el valor central de intervalo,
entonces estima sin error. (a mayor parte de las veces, sin embar!o,
no ser exactamente i!ual a y la estimacin puntual es errnea. (a
ma!nitud de este error ser el valor absoluto de la diferencia entre y , y
podemos tener el nivel de confianza de que esta diferencia no exceder
.
Como se puede observar en los resultados del e*ercicio se tiene un error de
estimacin mayor cuando el nivel de confianza es del >>^ y ms peque'o
cuando se reduce a un nivel de confianza del >=^.
:. Jna empresa elctrica fabrica focos que tienen una duracin
aproximadamente distribuida de forma normal con una desviacin estndar
de <9 horas. i una muestra de ;9 focos tiene una duracin promedio de
I?9 horas, encuentre un intervalos de confianza de >H^ para la media de la
poblacin de todos los focos que produce esta empresa.
,olucin>
Con un nivel de confianza del >H^ se sabe que la duracin media de los
focos que produce la empresa est entre IH= y IH= horas.
;. (a prueba de corte ses!ado es el procedimiento ms aceptado para evaluar
la calidad de una unin entre un material de reparacin y su sustrato de
concreto. El artculo -Eestin! the $ond $etPeen Tepair #aterials and
Concrete ubstrate- informa que, en cierta investi!acin, se obtuvo una
resistencia promedio muestral de 5I.5I 6Cmm
:
, con una muestra de <?
observaciones de resistencia al corte, y la desviacin estndar muestral fue
;.:? 6Cmm
:
. Jtilice un nivel de confianza inferior del >=^ para estimar la
media real de la resistencia al corte.
,olucin>
En este e*ercicio se nos presentan dos situaciones diferentes a los e*ercicios
anteriores. (a primera que desconoce la desviacin estndar de la poblacin y la
se!unda que nos piden un intervalo de confianza unilateral.
El primer caso ya se haba comentado y se solucionar utilizando la desviacin
estndar de la muestra como estimacin puntual de si!ma.
%ara el intervalo de confianza unilateral, se car!ar el rea ba*o la curva hacia un
solo lado como si!ue"
Esto quiere decir que con un nivel de confianza de >=^, el valor de la media est
en el intervalo 05H.;>, 1.
UNIDAD =
CONTROL ESTADSTICO DE PROCESO
=., CONTROL ESTADSTICO
(a idea tradicional de inspeccionar el producto final y eliminar las unidades que no
cumplen con las especificaciones una vez terminado el proceso, se reemplaza por
una estrate!ia ms econmica de prevencin antes y durante del proceso
industrial con el fin de lo!rar que precisamente estos productos lle!uen al
consumidor sin defectos.
3s las variaciones de calidad producidas antes y durante el proceso pueden ser
detectadas y corre!idas !racias al empleo masivo de 2rficas de Control.
e!&n este nuevo enfoque, existen dos tipos de variabilidad. El primer tipo es una
variabilidad aleatoria debido a -causas al azar- o tambin conocida como -causas
comunes-. El se!undo tipo de variabilidad, en cambio, representa un cambio real
en el proceso atribuible a -causas especiales-, las cuales, por lo menos
tericamente, pueden ser identificadas y eliminadas.
(os !rficos de control ayudan en la deteccin de modelos no naturales de
variacin en los datos que resultan de procesos repetitivos y dan criterios para
detectar una falta de control estadstico. Jn proceso se encuentra ba*o control
estadstico cuando la variabilidad se debe slo a -causas comunes-.
(os !rficos de control de hePart son bsicamente de dos tipos) !rficos de
control por variables y !rficos de control por atributos. %ara cada uno de los
!rficos de control, existen dos situaciones diferentes) a1 cuando no existen
valores especificados y b1 cuando existen valores especificados.
e denominan -por variables- cuando las medidas pueden adoptar un intervalo
continuo de valores) por e*emplo, la lon!itud, el peso, la concentracin, etc. e
denomina -por atributos- cuando las medidas adoptadas no son continuas)
e*emplo, tres tornillos defectuosos cada cien, ; paradas en un mes en la fbrica,
seis personas cada ;99, etc.
3ntes de utilizar las 2rficas de Control por variables, debe tenerse en
consideracin lo si!uiente"
a.8 El proceso debe ser estable
b.8 (os datos del proceso deben obedecer a una distribucin normal
c.8 El n&mero de datos a considerar debe ser de aproximadamente :9 a :=
sub!rupos con un tama'o de muestras de < a =, para que las muestras
consideradas sean representativas de la poblacin.
d.8 (os datos deben ser clasificados teniendo en cuenta que, la dispersin debe
ser mnima dentro de cada sub!rupo y mxima entre sub!rupos
e.8 e deben disponer de tablas estadsticas
(as etapas que deben tomarse en cuenta para me*orar el proceso estn
esquematizadas en la si!uiente fi!ura"
El si!uiente e*emplo ense'a cmo utilizar estas !rficas
2rficas de Control 4 y T, por variables 0sin valores especificados1
En la si!uiente tabla se muestran los pesos de los sobres de un determinado
alimento. Cada media hora se realizan < mediciones por muestra, sumando un
total de :9 muestras. (os lmites de tolerancia son 9,=;H9 0(E1 y 9,<=?9 0(LE1
Con esto se pretende evaluar el comportamiento del proceso y hacer un control
del mismo respecto a su localizacin y dispersin, con el ob*eto que el proceso
cumpla con las especificaciones preestablecidas.
%rimero debemos calcular las medias tanto de la media de cada muestra 04 doble
raya1 como la de su amplitud o recorrido 0T1
%ara ello utilizamos las si!uientes frmulas"

donde 4 0doble raya1 A 9,<>I9 y T 0raya1 A 9,9::<
%ara construir los 2rficos de Control por variables, se tiene que tener en cuenta
que al determinar si un proceso est ba*o -control estadstico-, siempre se debe
analizar primero la !rfica T. Como los lmites de control en la !rfica 4
0raya1dependen de la amplitud promedio, podran haber causas especiales en la
!rfica T que produzcan comportamientos anmalos en la !rfica 4 0raya1, a&n
cuando el centrado del proceso est ba*o control.
%ara el !rfico T, se tiene que"
(mite Central 0(C1 A T 0raya1A 9,9::<
(mite uperior de Control 0(C1
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
donde (C A 9,9=55, el valor de + se consi!ue en una tabla estadstica 0para este
caso es :,:?: con un tama'o de !rupo n A <1.
(mite Lnferior de Control 0(LC1
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
donde (LC A 9, porque para todo proceso en que se considera un n g I, el (LC no
se indica en la !rfica.
El !rfico T es el si!uiente"
Como se puede apreciar, el !rfico T no presenta variaciones fuera del lmite
superior,por lo tanto la dispersin de los datos es aceptable para calcular el !rfico
4 0raya1.
%ara el !rfico 4 0raya1, se tiene que"
(mite Central 0(C1 A 4 0doble raya1A 9,<>I9
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
(mite uperior de Control 0(C1
donde (C A 9,=5;;, el valor de 3: se consi!ue en una tabla estadstica 0para
este casoel valor es 9,I:> con un tama'o n A<1.
(mite Lnferior de Control 0(LC1
donde (LC A 9,<?9I
El !rfico 4 0raya1es el si!uiente"
Como se puede apreciar un punto queda fuera del ran!o calculado, por lo tanto el
proceso se encuentra fuera de control estadstico.
En este caso, habra que investi!ar y eliminar la causa asi!nable, que podra
haberse debido al uso de al!&n material defectuoso o una mala lectura del
instrumento. Este dato debe eliminarse de la !rfica y recalcular todo de nuevo
pero sin considerar el sub!rupo ?.
6ota.8 Esto no siempre es as, si los puntos fuera de control son de tal ma!nitud,
entonces no queda ms remedio que una vez encontrada y eliminadas las causas
en la prctica, habra que repetir el proceso, reco!iendo nuevos datos.
+espus de la correccin, los resultados son"
2rfico T corre!ido
T 0raya1 A (C A 9,9:;5
(C A 9,9=:I y (LC A 9
2rfico 4 0raya1 corre!ido
4 0doble raya1 A (C A 9,<>I>
(C A 9,=5<I y (LC A 9,<?55
(os !rficos son los si!uientes"
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
Como se puede apreciar en ambos !rficos, ahora el proceso se encuentra en
-control estadstico-.
Clculo de la Capacidad del %roceso
(a capacidad del proceso slo puede ser evaluada en el caso de que el proceso
se encuentre ba*o control estadstico. y se puede definir como aquellos lmites
dentro de los cuales la &nica fuente de variacin son las causas comunes o
aleatorias del sistema.
%or lo tanto, es un estado ideal para el buen funcionamiento de todo el sistema
lo!rar que todos sus procesos sean estables.
LC% A Cp A Lndice de Capacidad del %roceso
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
donde (E es el lmite superior de tolerancia y (LE el lmite inferior de tolerancia.
i!ma sombrero es la desviacin estndar estimada, y es i!ual a"
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
El valor de la constante d: se obtiene a partir de tablas estadsticas. En este caso
d: A :,9=> para n A <.
i!ma sombrero A 9,955: y Cp A 5,5=>
e!&n el convenio, un proceso"
Es capaz si Cp f A 5
6o es capaz si Cp g 5
%or lo tanto, el %T,CE, E C3%3h
(o que se debe conse!uir para lo!rar una me*ora sustancial es que el Cp sea
mayor que 5,;;. 3l!unos autores se'alan incluso que un Cp f 5,= es ms fiable
para dar -se!uridad- acerca de la estabilidad del proceso. in embar!o, antes de
cualquier me*ora debemos primero calcular el centramiento del proceso.
Centramiento del %roceso
Es evidente que el valor de Cp no depende del promedio del proceso, ya que este
promedio puede ser el resultado de un error sistemtico en el sistema, es decir,
que los datos obtenidos estn ms ba*o o ms alto de la media poblacional real o
del valor que hemos fi*ado como centro.
%ara determinar si el proceso est o no centrado existen diversas frmulas para
resolverlo, una de ellas, a*usta el valor de Cp con un factor 05 c F1, como si!ue"
CpU A Cp 05 c U1,en la cual"
%ara ver la frmula seleccione la opcin b$a*ar traba*ob del men& superior
F A _9,=;H9 @ 9,<=?9 c 0: x 9,<>I>1_ C 09,=;H9 c 9<=?91
F A 9,599
CpU A Cp 05 c U1
CpU A 5,5=> x 05 c 9,5991
CpU A 5,:?
(a frmula para obtener F se entiende me*or si la rescribimos de otra manera"
F A : _ promedio c ob*etivo _ C tolerancia
3qu podemos apreciar que si el promedio es i!ual al ob*etivo, que es lo ideal, el
proceso queda totalmente centrado, ya
que U A 9, y por tanto CpU A Cp.

Das könnte Ihnen auch gefallen