Beruflich Dokumente
Kultur Dokumente
Estadística 1 3
Índice
2. INTRODUCCIÓN
Estadística
(colecciona, describe, visualiza y resume datos (genera modelos, infiere y hace predicciones
originados a partir de los fenómenos en asociadas a los fenómenos en cuestión)
estudio)
DEFINICIONES
La teoría del muestreo se ocupa de que las muestras sean extraídas con
cierta garantía.
la permite formular y responder preguntas
Si se conoce la
probabilidad de la
Población Muestra
la
GUÍA DOCENTE
1
El diagrama puede verse en dos partes, no es un ciclo cerrado
Estadística 1 9
Nominales
(no cuantificables
numéricamente). Describen las
categorías
Ordinales
Cuantitativas
(infinidad no numerables de
valores, i.e. toman cualquier
valor real -estatura, peso, etc.)
Variables ratio Variables por
intervalos
(toman
(tomanvalores puntuales)
valores
(toman valores por
intervalos)
sussus valores
valores se
se
representan
x1 , x2 ..., xN ; xi (i = 1, 2, ⋅ ⋅⋅, N ) : valor de la variable para el elemento i-
ésimo de la población
Datos desagrupados
(se consideran todos los valores de la variable, cada uno con el
valor que tenga)
Organización
Datos agrupados
(Normalmente se agrupan los datos de variables continuas, y por
lo general cuando la variable aleatoria toma valores diferentes
en todos los elementos de la muestra)
Datos desagrupados.
Ejemplo 1.1.
19, 18, 20, 18, 20, 23, 18, 20, 22, 19, 19, 23, 21, 22, 24, 27, 23, 19, 20, 22
Muestra ordenada:
18, 18, 18, 19, 19, 19, 19, 20, 20, 20, 20, 21, 22, 22, 22, 23, 23, 23, 24, 27
frec. frec.
frec. frec. absolutas relativas Porcentajes
absolutas relativas acumuladas acumulada Porcentajes acumulados
i
n Ni
xi ni fi = i Ni = ∑ n j Fi = pi = f i ·100 Pi = Fi ·100
n j =1 n
n = 20 100%
Datos agrupados
Procedimiento:
3. considerar todos los valores de la variable que caigan dentro del intervalo
como si fueran ese elemento representativo
Existen varios criterios para determinar el número de clases, sin embargo ninguno
de ellos es exacto. Algunos autores recomiendan de cinco a quince clases,
dependiendo de como estén los datos y cuántos sean. Un criterio usado
frecuentemente es que el número de clases debe ser aproximadamente la
raíz cuadrada del número de datos, por ejemplo, la raíz cuadrada de 30 es
mayor que cinco, por lo que se seleccionan seis clases.
OBSERVACIONES (intervalos de clase)
La marca de clase es el punto medio de cada uno de los intervalos de clase. Hay
tantas marcas de clase como intervalos de clase.
x
La marca de clase se denota con i , porque al trabajar con datos agrupados, se
utilizará como el valor de la variable estadística cuando los datos nos son
agrupados.
i
ni Ni
Intervalos xi ni fi = Ni = ∑ n j Fi = pi = f i ·100 Pi = Fi ·100
n j =1 n
n=16
Nota. Para definir una distribución de frecuencia se necesita conocer todos los
valores de la variable y una de las frecuencias que hemos visto en las tablas
anteriores pues el paso de una a otra es inmediato. Observe además que es posible
distinguir dos tipos: agrupadas y desagrupadas.
Una representación gráfica nos permite de una simple mirada tener una idea rápida
de las propiedades principales. Como veremos, podemos tener idea si es simétrica o
se aproxima a la normalidad u otras propiedades que se pueden analizar
formalmente utilizando contrastes, etcétera.
Hay que considerar:
Histogramas de frecuencia
Datos
agrupados Polígonos de frecuencia
Polígonos de frecuencia
acumuladas
Cuantitativas
Diagrama de barras
Diagrama escalonado
Datos sin
agrupar
Variables Polígonos de frecuencias
Polígonos de frecuencias
acumuladas
Diagramas de sectores
Pictogramas
El polígono de frecuencias se puede hacer para datos no agrupados sin pasar por la
agrupación previa de ellos.
0,25
Frecuencias relativas
0,2
0,15
0,1
0,05
0
18 19 20 21 22 23 24 27
Valores de la variable estadística
Ejemplo 1.4.
11, 12, 13, 12, 13, 14, 14, 15, 11, 12, 13, 12, 14, 15, 11, 12, 16, 14, 13, 14, 14, 13,
15, 15, 15
PASOS:
1. El rango es 16-11=5
4. [11, 12) [12, 13) [13, 14) [14, 15) [15, 16]
Estadística 1 17
25 1,00
Estos puntos nos servirán para analizarlos con las medidas que daremos más
adelante.
Variables cualitativas
Frecuencia
absoluta
Los diagramas de rectángulo se asignan a cada
modalidad de la variable cualitativa un rectángulo
con igual (o proporcional) a su frecuencia absoluta
comercio
pesca
industria
ni
αi = 360 = f i ⋅ 360
N
Estadística 1 19
Existen otras formas gráficas de representar las variables que no hemos explicitado,
¿cómo serán?
Bibliografía
6. ¿Tiene ud. idea de cómo son los otros gráficos que hemos señalado en
clases? Analícelos.
EJERCICIOS PROPUESTOS
Calificaciones 0 1 2 3 4 5 6 7 8 9 10
Número de Estudiantes 4 2 6 15 5 16 20 6 4 2 2
d. Si hubiera que otorgar 8 becas erasmus, ¿en cuánto hay que subir el
aprobado?
No de 18 37 11 19 20 12 5 3 2
Facultades
122 (W) 117 (W) 117 (W) 167 (M) 114 (W)
195 (M) 145 (M) 158 (M) 158 (M) 190 (M)
110 (W) 134 (W) 165 (M) 104 (W) 132 (W)
107 (W) 105 (W) 181 (M) 142 (W) 123 (W)
155 (M) 155 (M) 172 (M) 149 (M) 120 (W)
140 (W) 163 (M) 125 (W) 130 (W) 150 (M)
187 (M) 147 (M) 118 (W) 159 (M) 160 (M)
115 (W) 175 (M) 125 (W) 177 (M) 121 (W)
a. Construir un cuadro de tallos y hojas con los datos, tomando las decenas
como tallos y las unidades como hojas.
b. Construir un cuadro de tallos y hojas con los datos como el apartado a, pero
poniendo las hojas de los pesos de los hombres a la derecha del tallo y las
de las mujeres a la izquierda.
3. ANALISIS DE LOS DATOS
Análisis de datos
Cuartiles
Media Rango Asimetría
Momentos
potenciales
Unidades
tipificadas
Coeficiente
de variación
2
Nosotros por conveniencia vamos a considerar las medidas de tendencia central y de posición en grupos
separados. En algunos textos ambas se consideran como medidas de posición.
Estadística 1 23
Medias
Media aritmética
n
xi k
xi ⋅ ni k
Media muestral: x = ∑
i =1 n
= ∑
i =1 n
= ∑
i =1
xi ⋅ f i
k N
xi ·ni x
Media poblacional: µ = ∑
i =1 N
=∑ i
i =1 N
La media aritmética es muy sensible a los valores extremos de la variable pues una
observación extrema, hará que la media se desplace en esa dirección. Por tanto, no
es recomendable su uso en distribuciones muy asimétricas. Por otro lado, con
variables discretas puede ocurrir que su valor no se corresponda con el conjunto de
valores al que pertenece la variable (ejemplo: la media de las placas base de
ordenadores elaborados en cuatro días es x = 158,2 placas base).
∑w
i =1
i
x1 , x2 ,...xn son los datos; w1 , w2 ,...wn , sus respectivos ‘pesos’.
Así, xg = n x1 x2 ⋅ ⋅ ⋅ xn .
La media geométrica es útil en los casos en que las variables presentan variaciones
acumulativas (para promediar variables tales como porcentajes, tasas, números
índices, etcétera). Se debe tener cuidado con la presencia de la raíz.
n
Media armónica: xa = n
1
∑x
i =1 i
n
Para valores que se repiten: xa = k
.
1
∑
i =1 xi
ni
Mediana
Estadística 1 25
x n +1 n, impar
~ 2
x = xn + xn
+1
2 2
n, par
2
n Sí, entonces ~
x coincidirá con la abscisa correspondiente.
¿Coincide con el valor de
2
una frecuencia absoluta
acumulada? No, entonces ~
x se determina a través de semejanza de
triángulos en el histograma o polígono de frecuencias
n 2 − N i −1
La mediana se puede expresar como ~
x = li −1 + (li − li −1 ) . Si denominamos
N i − N i −1
ai = li − li −1 (amplitud del intervalo); entonces, la expresión anterior queda:
~ n 2 − N i −1
x = li −1 + ai
Ni
Moda
{ }
Valor de la variable que más se repite: Md = xi , Si ni = max f j , j ∈ {1, 2,..., k}
Si la distribución de datos tiene dos moda se llama bimodal; tres modas, trimodal.
Si todas las variables tienen la misma frecuencia diremos que no hay moda.
ni +1
Md = li −1 + ai
ni −1 + ni +1
d i +1
Md = li −1 + ai
d i −1 + d i +1
ni
siendo d i = (densidad de frecuencia).
ai
Estadística 1 27
MEDIDAS DE POSICIÓN
rN
− N i −1
Qr , k = li −1 + k ai
ni
< N i y [li −1 , li ] es el intervalo siguiente que contiene a
rN rN
siendo N i −1 < y cuya
k k
amplitud es ai .
Cuartiles
Q2 = ~
x
Deciles
Ordenados los datos en orden creciente, x1 , x2 ,..., xn , los deciles son los valores
que dividen a la distribución en diez partes iguales.
Estadística 1 29
Percentiles
A veces es útil indicar los valores máximos ( H ) y mínimos ( L ) que toma la variable
estadística en una muestra o población.
r r
mr = a r − a r −1a1 + a r − 2 a12 − ⋅ ⋅ ⋅ + (− 1) a1r
r
1 2
con lo cual
M (−1) = xa , M (0 ) = x g , M (1) = x y M ( 2 ) = xc .
MEDIDAS DE DISPERSIÓN
Los estadísticos de tendencia central o posición sólo nos indican donde se sitúa un
grupo de puntuaciones. Sin embargo, las medidas de dispersión muestran la
variabilidad de una distribución, indicando por medio de un número o estadístico, si
las diferentes puntuaciones de una variable están o no muy alejadas de la media.
Cuanto mayores son los valores de esos estadísticos más variabilidad habrá. Cuanto
menores son, más homogéneas son las puntuaciones respecto a la media. De este
modo se puede saber si todos los casos son parecidos o hay grandes diferencias
entre ellos.
{ } {
Rango o recorrido R = max xi , i ∈ {1, 2,..., k } − min xi , i ∈ {1, 2,..., k} }
Esencialmente, el cálculo de esta magnitud es sencillo, las unidades se
corresponden con el de la variable estadística, intervienen dos valores en su
determinación, es sensible a valores extremos y aumenta o permanece igual con el
incremento del número de observaciones.
Recorrido intercuartílico RI = Q3 − Q1
mayor valor
Coeficientes de apertura CA = de la distribución.
menor valor
recorrido
Recorrido relativo Rr = .
media
RI
Recorrido semintercuartílico Rs = .
Q1 + Q3
∑ (x − P )n
1
Desviación respecto al promedio: D = i i
N i =1
k
1
Desviación media con respecto a la media aritmética: Dm =
N
∑x
i =1
j − x ni .
k
1
Desviación media con respecto a la mediana: D~x =
N
∑x
i =1
j −~
x ni .
Varianza
1 n 1 n 2
Varianza muestral: s 2 = ∑ ( x − x )2
= ∑ xi −
n 2
x (demuéstrelo)
n − 1 i =1 n − 1 i =1 n −1
i
N N
∑ (xi − µ )
1 1
Varianza poblacional: σ 2 = = ∑x − µ 2 (demuéstrelo)
2 2
i
N i =1 N i =1
Desviación típica
1 n
Desviación típica muestral: s = ∑ (xi − x )2
n − 1 i =1 ¿A qué se debe la diferencia
entre ambas expresiones?
N
∑ (x − µ)
1
Desviación típica poblacional: σ =
2
i
N i =1
s
Error estándar e = .
n
Las medidas de centralización y dispersión nos dan información sobre una muestra.
Sin embargo, si queremos comparar dos magnitudes de una misma población (la
resistencia eléctrica y la diferencia de potencial de un elemento ohmico), comparar
una desviación respecto a la media no tiene sentido. El mismo problema se plantea
si medimos cierta cantidad de dos poblaciones con distintas unidades (la masa del
ADN y la de un sólido cristalino –unidades en uma y en kg puede resultar que la
dispersión en uma sea despreciable).
xi − x
zi = , es el valor tipificado o z-score de la muestra. La nueva variable
s
tiene z i = 0 y s zi = 1 .
xi − µ
zi = , es el valor tipificado o z-score de la población. La nueva variable
σ
tiene z i = 0 y σ zi = 1 .
Coeficiente de variación
Para resolver los inconvenientes que presenta la desviación típica se define una
medida adimensional de la variabilidad: coeficiente de variación. Nos sirve para
comparar tablas en las que se utilicen unidades diferentes de medida.
s
Coeficiente de variación muestral: CV =
x
σ
Coeficiente de variación poblacional: CV =
µ
A veces este cociente se expresa en tanto por ciento y nos dará un porcentaje de
variabilidad de los datos respecto a la media. El coeficiente no es invariante ante
cambios de origen pero si es invariante a cambios de escala. Como en su cálculo
intervienen todos los miembros de la muestra o población (ver quiénes lo forman)
nos da mucha garantía ante otros coeficientes. El único inconveniente se presenta
cuando x = 0 .
D~
Índice de dispersión respecto a la mediana V~x = ~x
x
MEDIDAS DE FORMA
Estadística 1 35
Ahora nos interesa si los datos se distribuyen de forma simétrica con respecto a un
valor central, o si bien la gráfica que representa la distribución de frecuencias es de
una forma diferente del lado derecho que del lado izquierdo. Si la simetría ha sido
determinada, podemos preguntarnos si la curva es más o menos apuntada.
Las medidas de forma tratan de comparar las distribuciones de los datos con los de
una población normal en la que la moda y la media coinciden y su distribución de
frecuencias relativas es simétrica respecto de la media. Esta medida de comparación
es muy útil con variables discretas. Sólo se utilizarán estas medidas para
distribuciones de datos unimodales. Cuando las distribuciones son continuas se
recomienda la mediana por cuanto ésta divide al histograma de frecuencias en dos
partes de áreas iguales.
Simetría
Distribución normal
Asimetría
Asimétrica a la derecha o
asimétrica positiva si las Asimétrica a la izquierda o
frecuencias más altas se asimétrica negativa si la cola
encuentran en el lado izquierdo de está a la izquierda Md > x
la media, mientras que en
derecho hay frecuencias más
pequeñas (cola)
Md < x
m3
1 k
∑
N i =1
(x j − x ) ni
3
> 0 asimétrica positiva
g1 = 3 = ⇒ = 0 simétrica
σ 3
< 0 asimétrica negativa
∑ (x j − x ) ni
1 k 2 2
i =1
N
Curtosis o aplastamiento
1.
2.
3.
4.
5.
Presenta
6. un grado de Presenta un elevado grado de Presenta un reducido grado
concentración medio alrededor de concentración alrededor de los de concentración alrededor
los valores centrales de la variable
7. valores centrales de la variable de los valores centrales de
∑ (x − x ) ni
1 4
g 2 > 0 Leptocúrtica
i
m4 N
g2 = −3 = i =1
⇒ g 2 = 0 Mesocúrtica
σ4 1 k
2
g < 0 Platicúrtica
∑ (x − x)
2
i ni 2
N i =1
g2
g ks = . El coeficiente es asintóticamente normal (0, 1).
6
N
DESIGUALDAD DE CHEVYSHOV
{ }
frecuencia relativa xi ; X − xi ≤ K ·S ≥ 1 −
1
K2
.
{x ;
i X − xi ≤ K ·S } ≥ 1− 1
.
n K2
1 1 3
Ejemplo: Sea K = 2 , 1 − 2
= 1 − = = 0, 75 , lo que indica que más del 75% de
K 4 4
los datos, cualquiera que sea la distribución, se encuentran en un intervalo de la
forma X − K ·S , X + K ·S .
1. Iniciar el análisis con datos que permitan visualizar su estructura. Para datos
cuantitativos se debe empezar por gráficos de tallos y hojas o como se
denominan también histogramas digitales.
Pasos:
1. Calcular la mediana.
6. Se grafican (− ni , pi ) .
Bibliografía
EJERCICIOS PROPUESTOS
a. la media
b. la mediana
c. la moda
d. el medio rango
e. la varianza
f. la desviación típica
Estadística 1 41
Salarios No de trabajadores
0 - 10000 2000
Calcular:
10000 - 20000 1500
a. el salario medio por trabajador.
20000 - 30000 900 b. el salario más frecuente.
c. el salario tal que la mitad de los restantes sea
30000 - 40000 1000
inferior a él.
70000 - 80000 10
Meses Dic Ene Feb Mar Abr May Jun Jul Ago Sep Oct Nov Dic
. . . . . . . . . . . . .
5. En un experimento controlado una partícula recorre una distancia 100 Km. a una
velocidad de 150 km/h y 60 Km. a una velocidad de 120 km/h Determine ¿cuál es la
velocidad media de la partícula en todo el recorrido?
Universidad 1 Universidad 2
8. En el laboratorio se ha medido una magnitud física de tal manera que para varios
valores de la misma se han realizados varias mediciones según se reporta en la
siguiente tabla:
xi 1 3 4 6 10
ni 5 12 20 8 5
a. Estudie analítica y gráficamente la simetría de esta distribución.
INTRODUCCIÓN
Datos bidimensionales
Recta de regresión
DATOS BIDIMENSIONALES
Datos bidimensionales: aquellos que tienen la forma (x1, y1), (x2, y2),…, (xn, yn).
(Altura)
61-70 kg 1 1 2
71-80 kg 2 4 6
81-90 kg 2 1 3
90-100kg 1 1
Frecuencia
marginal 1 3 6 1 1 12
(Peso)
1. Lineal
y = mx + p
2. Polinómica
y = a0 + a1 x + a1 x 2 + ... + a1 x n
Linealización
3. Hiperbólica y = 1 (a + bx ) 1 y = a + bx
5. Geométrica
CASO LINEAL
Coeficiente de correlación
1 n
s xy = ∑ (xi − x )( yi − y )
n − 1 i =1
Propiedades
− ∞ ≤ s xy ≤ ∞
Alternativamente
n n
1 n n
sxy ∑(x − x)( y − y)
i i ∑
i=1
xi yi − ∑xi ∑yi
n i=1 i=1
rxy = = i=1
=
sxsy n n
n 2 = 1 n n 2 1 n 2
∑(xi − x) ∑( yi − y)
2
2 2
∑xi − ∑xi ∑yi − ∑yi
i=1 i=1 n i=1 n i=1
i=1 i=1
Propiedades:
−1 ≤ rxy ≤ 1
Interpretación:
Interpretación gráfica:
Si rxy > 0 los puntos (x, y) forman una nube ascendente más cercana a una
recta cuanto más cercano sea este valor a 1.
Si rxy < 0 los puntos (x, y) forman una nube descendente más cercana a una
recta cuanto más cercano sea este valor a -1.
Hemos visto que los datos bidimensionales pueden estar correlacionados y esa
relación puede ser lineal. Entonces el diagrama de puntos se aproximaría a una
recta de la forma y = mx + p . Tanto m y p se deben determinar.
( xi , yi ) .
y = mx + p y el punto ( xi , yi ) .
3
Se puede determinar también la recta de regresión de x sobre y
Para considerar todas las distancias (la de todos los puntos ( xi , yi ) con
i ∈ {1, 2,..., n} ), consideramos la suma de todos los d i . Para no trabajar con raíces
tomaremos la suma de las distancias verticales al cuadrado
n
∑d
i =1
i
2
= d12 + d 22 + ... + d n2 (error cuadrático entre la recta de regresión de y sobre
n n
n n
n p + m ∑
i =1
xi = ∑
i =1
yi
n n n
∑ i + ∑ = ∑
2
p x m x i xi yi
i=1 i =1 i =1 ,
p = y − mx
r s
Resolviendo este sistema obtendríamos que
m = xy y
sx
Observaciones:
(
2. El punto de la forma x + s x , y + rxy s y ) pertenece a
la recta de regresión. Demuéstrelo.
Con lo visto hasta ahora podemos indicar un procedimiento de trabajo para hallar la
recta de regresión. Para este fin podemos seguir los siguientes pasos:
4
No es correcto representar la recta en el diagrama de dispersión pues usted no sabe aún cuál es la verdadera
recta o la que más se le aproxime.
5
Es evidente que si la nube de puntos me muestra que no hay correlación lineal, entonces no hace falta seguir el
procedimiento.
x 4 2 10 5 8 ¿Puede ajustarse esta distribución de puntos con una recta?
y 8 12 4 10 5
1
162 − 29 36 10 4 100 16 40
rxy = 5 = −0,8833
1 2 1 2
209 − 29 328 − 36 5 10 25 100 50
5 5
8 2 64 4 16
Paso 3. Determinar m y p
1 n 2 1 n
2
1 1
sx = ∑ xi − ∑ xi = 209 − 292 = 3,1937
n i =1 n i =1 4 5
Estadística 1 53
1 n 2 1 n
2
1 1
sy = ∑ yi − ∑ yi = 328 − 36 2 = 4,1473
n i =1 n i =1 4 5
− (− 1,1470) = 13,8526
36 29
p = y − mx =
5 5
Algunas veces no existe una relación lineal entre las variables estadísticas
consideradas, pero eso no indica que no haya relación matemática o funcional entre
ellas. Para determinar numéricamente la relación existente entre las variables
estadísticas a tratar, podemos utilizar los siguientes argumentos (vea pág. 2):
x 1 2 3 4 5 6
y 6 12 24 50 95 190
Bibliografía
A 1,9 1,8 2,0 2,1 1,9 2,0 2,2 2,3 2,7 3,0
I 20,5 20,8 21,2 21,7 22,1 22,3 22,2 22,6 23,1 23,5
a. ajuste los datos a un modelo lineal que explique los ahorros de los grupos en
función de los ingresos para el departamento universitario.
b. ajuste los datos a un modelo parabólico que explique los ahorros de los
grupos en función de los ingresos para el departamento universitario.
yi 2,6 2,9 3,4 4,1 5,1 6,0 7,2 9,2 11,2 13,1 15,2 17,3 19,9
Ki 0,6 0,6 0,8 1,0 1,3 1,4 1,6 1,9 2,2 2,5 2,9 3,5 3,9
a. parabólica
b. polinómica
5. TÉCNICAS DE CONTEO
INTRODUCCIÓN
En la vida, interesan los fenómenos aleatorios –no tienen una relación de causa-
efecto.
Solución.
a) Hay n = 3 + 4 + 2 = 9 opciones.
En los tópicos que se tratan más adelante se utilizan conceptos tales como factorial
de un número y coeficientes binomiales. A continuación se tratan estos conceptos.
Factorial
Se define 0! = 1
Ejemplo 2. Calcule:
7! 7! 7 ⋅ 6 ⋅ 5 ⋅ 4 ⋅ 3!
b) Solución = = 840
3! 3! 3!
a) n (n − 1)(n − 2 ) ⋅ ⋅ ⋅ (n − r + 1) =
n!
.
(n − r )!
n (n − 1)(n − 2 ) ⋅ ⋅ ⋅ (n − r − 1) n!
b) =
1 ⋅ 2 ⋅ 3 ⋅ ... ⋅ (r − 1) r r!(n − r )!
Solución.
n(n − 1) ⋅ ⋅ ⋅ (n − r + 1) (n − r )(n − r − 1) ⋅ ⋅ ⋅ 3 ⋅ 2 ⋅ 1
a) n(n − 1) ⋅ ⋅ ⋅ (n − r + 1) =
n!
=
1 (n − r )(n − r − 1) ⋅ ⋅ ⋅ 3 ⋅ 2 ⋅ 1 (n − r )!
n(n − 1) ⋅ ⋅ ⋅ (n − r + 1)
= n(n − 1) ⋅ ⋅ ⋅ (n − r + 1) =
1 n!
b) . Observe el apartado a).
1 ⋅ 2 ⋅ 3 ⋅ ... ⋅ (r − 1)r r! r!(n − r ) !
6
Evidentemente, el factorial puede definirse en orden inverso al mostrado.
Estos resultados serán empleados después en la combinatoria.
Aproximación de Stirling a n!
Cuando los números son muy grandes para el cálculo del factorial se emplea la
fórmula de Stirling:
Coeficientes binomiales
n
El símbolo , donde n y r son números enteros positivos ( r ≤ n ), se denomina
r
coeficiente binomial y se define como:
n n (n − 1)(n − 2 ) ⋅ ⋅ ⋅ (n − r + 1)
= . (3)
r 1 ⋅ 2 ⋅ 3 ⋅ ... ⋅ (r − 1) r
n n!
= (4)
r r!(n − r ) !
n n! n! n! n
= = = = ;
r r!(n − r ) ! (n − (n − r )) !(n − r ) ! (n − r ) !(n − (n − r )) ! n − r
n n
Por tanto, se cumple la siguiente propiedad: = ; (5)
r n − r
Ejemplo 4. Calcule:
7 10
a) a) , b) .
4 3
Solución
7 7 ⋅ 6 ⋅ 5 ⋅ 4!
a) Aplicando (4), se tiene: = = 35
4 4!⋅3!
Estadística 1 61
10 10 10 ⋅ 9 ⋅ 8 ⋅ 7!
b) Aplicando (5), se tiene7: = = = 120
7
3 7!⋅3!
(x + y )n = ∑
n n n−k k
x y (6)
k =0 k
(x + 2 y )3 = ∑
3 3 3−k
x (2 y ) =
k
k =0
k
3 3 3 3
= x 3−0 (2 y ) + x 3−1 (2 y ) + x 3−2 (2 y ) + x 3−3 (2 y )
0 1 2 3
0 1 2 3
3 3! 3! 3 3 3! 3! 3 ⋅ 2! 3
= = = 1 = ; = = = = 3 = ;
0 0!(3 − 0 )! 1 ⋅ 3! 3 1 1!(3 − 1)! 1 ⋅ 2! 1 ⋅ 2! 2
(x + 2 y )3 = x3 + 3x 2 (2 y ) + 3x(2 y )2 + (2 y )3 = x3 + 6 x 2 y + 12 xy 2 + 8 y 3
7
Si aplica la fórmula (2.4) calcula más. Esto indica la ventaja de conocer esta propiedad.
8
De ahí el nombre de coeficientes binomiales.
1
Si se hace una comparación con el triángulo de
1 1
Pascal vemos que los coeficientes binomiales 2
(x+y)
corresponden con los números que aparecen en el
1 2 1
triángulo de Pascal (ver figura 1). 1 3 3 1
(x+y)4
1 4 6 4 1
1 5 10 10 5 1
Figura 1
PERMUTACIONES
Solución.
9
La terminología objeto o elementos se usan indistintamente.
Estadística 1 63
Se puede dar una idea de cómo se busca una expresión que permita calcular el
número de permutaciones de n elementos tomados de r en r (r ≤ n). En el ejemplo
6 se plantearon diferentes alternativas, pero no se indicó cómo se podía hacer.
Obsérvese el siguiente ejemplo:
Solución. Por ahora interesa buscar el número de palabras de tres letras usando
las cuatros letras sin repetirlas. Pasos a seguir:
P(n; n1 , n2 ,..., nr ) =
n!
, (9)
n1!n2!...nr !
donde n = n1 + n2 + ... + nr
a) JESUS
b) STATEMENT
Solución.
a) Con JESUS, hay 5! = 120 permutaciones posibles de las letras. La S se repite dos
veces y da lugar a 2!= 2 formas distintas de colocar la letra S produciendo la misma
9! 9 ⋅ 8 ⋅ 7 ⋅ 6 ⋅ 5 ⋅ 4 ⋅ 3!
b) P (9;3,2 ) = = = 30240
3! 2! 3! 2!
Nota. Es evidente que los elementos que se repiten una vez, su factorial es uno y
por tal motivo no se expresan en la fórmula.
Estadística 1 65
Muestras ordenadas
⋅ n2
n14 ⋅ n43n = n
... r
(10)
r veces
Ejemplo 10
Una bolsa contiene tres bolas de diferentes colores: una blanca (b), una negra (n) y
una azul (a) ¿Cuántas extracciones de tres bolas podemos hacer?
Solución
a) P(3,3) = P3 = 3!= 3 ⋅ 2 ⋅ 1 = 6
10
Observe la equivalencia que tiene con (2.7)
1a Extracción 2a Extracción 3a Extracción
n a ( b, n, a )
b a n ( b, a, n )
b a ( n, b, a )
n
a b ( n, a, b )
b n ( a, b, n )
a
n b ( a, n, b )
3 . 2 . 1 = 6
3a Extracción
1a Extracción 2a Extracción
( n, b, a )
a
n ( n, b, n )
b
b ( n, b, b )
( n, n, n )
n
n n a ( n, n, a )
b ( n, n, b )
a ( n, a, a )
( n, a, b )
a b
n ( n, a, n )
. . . . .
. . . . .
. . . . .
3 . 3 . 3 = 27
Estadística 1 67
Sin repeticiones.
Con repeticiones.
VARIACIONES
Ejemplo 11
Una bolsa contiene 4 bolas de diferentes colores: una blanca (b), una negra (n),
una azul (a) y una roja (r) ¿Cuántas extracciones diferentes de tres bolas se pueden
hacer si cuando se saca una bola no se vuelve a meter en la bolsa?
Solución
11
El contenido restante lleva el mismo estilo aunque se presente de manera más concisa.
Diagrama de árbol:
n
( b, n, r )
r
a ( b, r, a )
r
b
n ( b, r, n )
n ( b, a, n )
r ( b, a, r )
a ( n, b, a )
( n, b, r )
r
a
( n, r, a )
n r
b
( n, r, b )
b ( n, a, b )
r ( n, a, r )
( a, b, n )
n
b
( a, b, r )
r
( a, n, b )
b
a n
r ( a, n, r )
b ( a, r, b )
n
( a, r, n )
n ( r, b, n )
a ( r, b, a )
b
( r, n, b )
r n
a ( r, n, a )
b ( r, a, b )
a
n ( r, a, n )
4 . 3 . 2 =4 24
Ejemplo 12
Una bolsa contiene 3 bolas de distintos colores: una blanca (b), una negra (n) y
una azul (a) ¿Cuántas extracciones diferentes de dos bolas se pueden hacer si se
saca una bola y se vuelve a meter en la bolsa antes de la próxima extracción?
Solución
VR3, 2 = 32 = 9
Diagrama de árbol
1a Extracción 2a Extracción
b ( b, b )
b n ( b, n )
a ( b, a )
b ( n, b )
n n ( n, n )
a ( n, a )
b ( a, b )
a n ( a, n )
a ( a, a )
3 . 3 = 9
Sin repeticiones.
Con repeticiones.
COMBINACIONES
{a, b, c}, {a, b, d}, {a, c, d}, {b, c, d}, o también se escribe: abc, abd, acd, bcd
Las siguientes combinaciones son iguales: abc, acb, bac, bca, cab, cba. Cada
una representa al mismo conjunto {a, b, c}.
P(4,3) 4 ⋅ 3!
C (4,3) ⋅ 3!= P(4,3) ⇒ C (4,3) = = =4
3! 3!
P(n, r )
C (n, r ) =
n!
= (13)
r! r!(n − r ) !
Observaciones
n! n
Al número = Cn, r = se le llama número combinatorio12.
r!(n − r )! r
n! V
Cn , r = = n,r (14)
r!(n − r ) ! Pr
Ejemplo 15
Una bolsa contiene 4 bolas de diferentes colores: una blanca (b), una negra (n),
una azul (a) y una roja (r) ¿Cuántas extracciones diferentes de tres bolas podemos
hacer si al sacar una bola no se vuelve a meter en la bolsa y no importa el orden en
que salen?
Diagrama de árbol:
n
r
( b, n, r )
b
a r ( b, a, r )
n a r
( n, a, r )
12
Lo empleamos anteriormente para el desarrollo del binomio
Combinaciones con repetición de n elementos tomados de r en r: son el
número de agrupaciones que se pueden hacer con n elementos tomados de r en r
sin que importe su orden y pudiendo repetir los elementos. Se representan
por CR (n, r ) = CRn , r .
n + r − 1 (n + r − 1) !
CR(n, r ) = CRn , r = = (15)
r r!(n − 1) !
Ejemplo 16
Una bolsa contiene 4 bolas de diferentes colores: una blanca (b), una negra (n),
una azul (a) y una roja (r) ¿Cuántas extracciones diferentes de tres bolas se pueden
hacer si al sacar una bola se vuelve a meter en la bolsa y no importa el orden en el
que salgan las bolas?
4 + 3 − 1 6 6! 6 ⋅ 5 ⋅ 4 ⋅ 3!
CR4,3 = = = = = 20
3 3 3! 3! 3! 3!
Diagrama de árbol:
Estadística 1 75
b b b (b, b, b) 1
n (b, b, n) 2
a (b, b, a) 3
r (b, b, r) 4
n n (b, n, n) 5
a (b, n, a) 6
r (b, n, r) 7
a a (b, a, a) 8
r (b, a, r) 9
r r (b, r, r) 10
n n (n, n, n) 11
n
a (n, n, a) 12
r (n, n, r) 13
a a (n, a, a) 14
r (n, a, r) 15
r r (n, r, r) 16
a
a a (a, a, a) 17
r (a, a, r) 18
r r (a, r, r) 19
r r r (r, r, r) 20
Sin repeticiones.
Con repeticiones.
2. No interviene toda la muestra en el agrupamiento.
CONCLUSIÓN
Muestra
Ordenada No ordenada
muestra
n! Pn; n1 , n2 ,...,nk =
Pn , r =
(n − r )! = n!
muestra
n1!n2!...nk !
Si n=r:
Pn = n!
Bibliografía
Estadística 1 77
1. Hallar:
a) 6!, 7!
b) 100!
12!
c)
15!
2. Hallar:
8
a)
6
100
b)
2
n + 1 n n
3. Demostrar que: = +
r r − 1 r
a) un delegado
c) un presidente y un vicepresidente
a) PADRE
b) UNUSUAL
c) SOCIOLOGICAL
13
Principio de cálculo
Estadística 1 79
a) con reemplazamiento
b) sin reemplazamiento
9. Una caja contiene catorce lápices azules y diez verdes. Hallar el número de
posibilidades de que dos lápices se puedan sacar de la caja si:
4 4 4 4 4
10. Demostrar: + + + + =16
0 1 2 3 4
Solución.
1.
2.
a. 28, b. 4950
4.
5.
6.
a. 512, b. 336
7.
n=5
8.
9.
a. 276, b. 136
Estadística 1 81
6. PROBABILIDAD
1. Con las mismas condiciones iniciales los resultados finales pueden ser
diferentes.
14
Cualquier situación u operación en la cual se pueden presentar uno o varios resultados de un conjunto bien
definido de posibles resultados.
El enfoque moderno de la teoría de la Probabilidad es axiomático15 –usa la
teoría de conjuntos.
4. etcétera.
15
Asigna arbitrariamente probabilidades a los sucesos.
Estadística 1 83
Ejemplo 1
AXIOMAS DE PROBABILIDAD
Sea S el espacio muestral; ℘ , la clase de todos los sucesos; P, una función con
valores reales definida en ℘ . Entonces, P es la función de probabilidad (P(A) es la
probabilidad del suceso A) si se satisface los siguientes axiomas:
P1. ∀A, P( A) ≥ 0 .
∞ ∞
P U Ai = ∑ P( Ai )
i =1 i =1
Cuando P cumple los axiomas anteriores, S, se llama espacio probabilístico, (S, A,
P).
n( A )
P ( A) =
n(S )
16
No presentamos los teoremas con el rigor que habitualmente lo hace la matemática, nos hemos limitado a ver
qué nos proporcionan.
Estadística 1 85
Ejemplo 2.
1. Cada pi ≥ 0 .
n
2. ∑p
i =1
i =1.
Resultado a1 a2 … an
Probabilidad p1 p2 … pn
Teorema 9. La función anterior cumple los axiomas P1, P2, P3.
Ejemplo 3.
Experimento: lanzar tres monedas y observar el número de veces que sale cara.
Resultado 0 1 2 3
Por definición
1. pi ≥ 0 .
∞
2. ∑p
i =1
i =1
Estadística 1 87
Ejemplo 4.
Considere S = {a1, a2, a3,…,∞} del experimento de tirar una moneda hasta que
salga cara; aquí, n indica el número de veces que se tira la moneda. El espacio
probabilístico se obtiene:
Entonces,
P(B) = P(2, 4, 6, 8, …) = ¼ + ¼2 + ¼3 + …
P (B ) =
a 1 1
= 4
=
1− r 3
4 3
Espacios incontables
m ( A)
P ( A) =
m(S )
A17 puede representar una longitud, área, etcétera. El espacio probabilístico se dice
que es uniforme.
17
Se consideran los espacios que pueden ser medidos geométricamente.
PROBABILIDAD CONDICIONADA E INDEPENDENCIA
Ejemplo 5
• Para que el estudiante además de primer año sea mujer, la selección tiene
que pertenecer a A y B (A∩B).
PROBABILIDAD CONDICIONADA
P( A ∩ E )
P( A | E ) = .
P (E )
n( A ∩ E ) n( E )
P( A ∩ E ) = , P (E ) = , de modo que:
n (S ) n (S )
P ( A ∩ E ) n( A ∩ E )
P( A | E ) = = .
P(E ) n(E )
Formalmente,
P ( A ∩ E ) n( A ∩ E )
P( A | E ) = = .
P(E ) n(E )
Ejemplo 6
b. P(A)
De E dos pares pertenecen a A: A∩E = {(2, 4), (4, 2)}. Así, P (A|E) = 2/5.
P( A ∩ B )
P (B | A) = , si multiplicamos por P(A), se obtiene un resultado útil:
P ( A)
Es útil porque por lo común se desea P(A∩B) ya que P(A) y P(B|A) se pueden
concretar a partir de la especificación del problema.
Así,
Ejemplo 8
Se escoge una caja al azar y, luego de ella, una bombilla al azar. Hallar la
probabilidad de que la bombilla no sea defectuosa.
Ejemplo 9
P( Ak )P(E | Ak )
P( Ak | E ) = n
∑ P( A )P(E | A )
k =1
k k
Estadística 1 93
Ejemplo 10
Por la fórmula de Bayes: P (D) = P(X) P (D|X) + P (Y) P (D|Y) + P (Z) P (D|Z)
P (E A1 )
A1 E
P ( A1 )
El primer paso del árbol corresponde a los sucesos
SUCESOS INDEPENDIENTES
Ejemplo 11
18
Ser independiente dos a dos no implica independencia, es decir, (1) no implica (2) y (2) no implica (1)
Estadística 1 95
Ejemplo 12
Cada vez que tres caballos a, b, c corren juntos sus probabilidades de ganar son
1/2, 1/3 y 1/6. Si los caballos corren dos veces: S2 = {aa, ab, ac, ba, bb, bc, ca, cb,
cc}.
P (ba) = 1/6
P (bb) = 1/9
P (bc) = 1/18
P (ca) = 1/12
P (cb) = 1/18
P (cc) = 1/36
Bibliografía
EJERCICIOS PROPUESTOS
5
R/ p =
36
5
R/ p =
36
Estadística 1 97
6 1
R/ p = =
120 20
Ejercicio 4. Una urna contiene 15 bolas blancas y 12 negras. Se extraen dos bolas
sin reintegrarlas ¿Cuál es la probabilidad de sacar dos bolas negras?
66 22
R/ p = =
351 117
Ejercicio 5. Una urna contiene 12 bolas blancas y 8 negras. Si se sacan dos bolas
al azar. ¿Cuál es la probabilidad de que sean del mismo color?
47
R/
95
4
R/
25
1 2
R/ Con reintegro . Sin reintegro
100 195
65
R/
81
1 4
R/ a. b.
50 195
Ejercicio 10. Una urna contiene 8 bolas blancas, 5 negras y 2 rojas. Se extraen
tres bolas al azar y se desea saber:
56 8 140 28 4
R/ a. p = = b. p= = =
455 65 455 91 13
1 8 4
R/ a. b. c.
2470 1235 3705
Ejercicio 12. Una urna contiene dos bolas blancas y tres negras; otra, seis blancas
y cuatro negras. Extraemos una bola de cada urna ¿Cuál es la probabilidad de que
sean las dos negras?
6
R/
25
Ejercicio 13. Al lanzar dos veces un dado ¿Cuál es la probabilidad de que la suma
de puntos sea divisible por tres?
12 1
R/ p = =
36 3
Ejercicio 14. Con las cifras 1, 2, 3, 4 y 5 se escriben todos los números posibles de
tres cifras, sin repetir cifras en cada número. Si se señala un número al azar:
1 2
R/ a. b.
5 5
Ejercicio 15. Una caja contiene 8 bolas rojas, 4 azules y 6 verdes. Se extraen 3
bolas al azar y se desea saber:
7 7 7 4 5
R/ a. b. c. d. e.
102 34 68 17 51
Ejercicio 16. Se lanza un dado 6 veces ¿Cuál es la probabilidad de que salga algún
1 en los 6 lanzamientos?
31031
R/
46656
Ejercicio 17. Una caja contiene 2 bolas blancas, 3 negras y 4 rojas. Otra contiene
3 blancas, 5 negras y 4 rojas. Se toma una bola al azar de cada caja ¿Qué
probabilidad hay de que sean del mismo color?
37
R/
108
Ejercicio 18. En una urna hay 50 bolas, aparentemente iguales, numeradas del 1
al 50 ¿Qué probabilidad hay de sacar, una a una, las 50 bolas en el orden natural?
1
R/
50!
R/ 0,36
R/ 0,657
R/ 1/2
Ejercicio 22. A un congreso asisten 80 congresistas. De ellos 70 hablan inglés y 50
francés. Se eligen dos congresistas al azar y se desea saber:
143 89 52 39
R/ a. b. c. d.
158 632 79 158
Ejercicio 23. En una bolsa hay 8 bolas rojas, 10 negras y 6 blancas. Tres niños
sacan, sucesivamente, dos bolas cada uno, sin reintegrar ninguna. Hallar la
probabilidad de que el primero saque las dos rojas, el segundo las dos negras y el
tercero las dos blancas.
7 15 3 15
R/ , , ,
69 77 88 9614
R/ a. 15/16 b. 3/8
Ejercicio 26. Una pieza de artillería dispone de 7 obuses para alcanzar un objetivo.
En cada disparo la probabilidad de alcanzarlo es 1/7 ¿Cuál es la probabilidad de
alcanzar el objetivo en los 7 disparos?
7
6
R/ 1 −
7
4 36 10 30 24
⋅ ⋅
R/ a. b. 4 ⋅ c.
2 2 3 1 4
40 40 40
4 4 4
Se desea saber:
a. Si A y B son incompatibles.
b. Si A y B son independientes.
c. Si A y C son incompatibles.
d. Si A y C son independientes
R/ 12/21
Ejercicio 32. En una encuesta realizada entre 24 alumnos resulta que 18 fuman
ducados, 12 celtas y 8 de las dos clases. Se eligen tres alumnos al azar y se desea
saber:
R/ a. 35/46 b. 459/1012
Ejercicio 33. Si de 800 piezas fabricadas por una máquina salieron 25 defectuosas
y se eligen 5 de aquéllas al azar ¿Cuál es la probabilidad de que haya alguna
defectuosa entre las cinco elegidas?
Estadística 1 103
775
5
R/ 1 −
800
5
Ejercicio 34. Se tiene tres urnas de igual aspecto. En la primera hay 3 bolas
blancas y 4 negras; en la segunda hay 5 negras y en la tercera hay 2 blancas y 3
negras. Se desea saber:
R/ a. 76/105 b. 35/76
R/ 0,455
R/ a. 0,0262 b. 0,0756
Ejercicio 37. La probabilidad de que un artículo provenga de una fábrica A1 es 0,7,
y la probabilidad de que provenga de otra A2 es 0,3. Se sabe que la fábrica A1
produce un 4 por mil de artículos defectuosos y la A2 un 8 por mil.
R/ a. 0,153 b. 0,218
Ejercicio 39. En una clase mixta hay 30 alumnas, 15 estudiantes que repiten
curso, de los que 10 son alumnos, y hay 15 alumnos que no repiten curso. Se pide:
7. VARIABLES ALEATORIAS
X: S → R
19
Se asigna un valor numérico a cada resultado de S.
20
H es cara y T es cruz.
Sea X la asignación a cada punto de S del mayor número de caras sucesivas que
van saliendo:
Una v.a X discreta toma cada uno de sus valores con cierta probabilidad. Con
frecuencia conviene representar todas las probabilidades de la v.a mediante una
fórmula. Necesariamente, la fórmula es una función.
Entonces, X nos conduce a una función f que asigna probabilidades a los puntos de
Rx por21
a. f (xk) ≥ 0
b. ∑k f (xk) = 1
21
Se puede representar en una tabla
Teorema1. Sea S un espacio equiprobable finito y f la distribución de una v.a X con
Rx = {x1, x2,…, xn}. Entonces:
f ( xk ) =
número de puntos de S con imagen xk
número de puntos de S
Sea X la v.a que asigna a cada punto de S el mayor valor de la sucesión de caras. El
espacio de valores es Rx = {x1, x2,…, xn}. Existirán:
Solución.
x 0 1 2 3
P (HHH) = 2/3 x 2/3 x 2/3 = 8/27 P (THH) = 1/3 x 2/3 x 2/3 = 4/27
P (HHT) = 2/3 x 2/3 x 1/3 = 4/27 P (THT) = 1/3 x 2/3 x 1/3 = 2/27
P (HTH) = 2/3 x 1/3 x 2/3 = 4/27 P (THT) = 1/3 x 1/3 x 2/3 = 2/27
P (HTT) = 2/3 x 1/3 x 1/3 = 2/27 P (TTT) = 1/3 x 1/3 x 1/3 = 1/27
f (1) = P ({HTH, HTT, THT, TTH}) = 4/27 + 2/27 + 2/27 + 2/27 = 10/27
Así, la distribución f de X
x 0 1 2 3
Solución. Sea X la v.a cuyos valores x son los números posibles de pizarras
digitales defectuosas que pueda comprar la facultad ( x = 0, 1, 2 ). Por tanto,
3 6
f (0) = P( X = 0 ) = =
0 2 30
9 72
2
3 6
f (1) = P( X = 1) = =
1 1 36
9 72
2
3 6
f (2 ) = P( X = 2 ) = =
2 0 6
9 72
2
La distribución de probabilidad de X es
x 0 1 2
f (x ) 30 72 36 72 6 72
x -2 1 2 4
Halle la:
a) probabilidad de que el valor observado de una v.a X sea menor o igual que 1,5.
Solución.
F (− 2 ) = f (− 2 ) =
1 2
=
4 8
F (1) = f (− 2 ) + f (1) =
2 1 3
+ =
8 8 8
F (2 ) = f (− 2 ) + f (1) + f (2 ) =
3 1 3 4 7
+ = + =
8 2 8 8 8
F (4 ) = f (− 2 ) + f (1) + f (2 ) + f (4 ) =
7 1
+ =1
8 8
Por tanto,
0 para x < −2
2 8 para - 2 ≤ x < 1
F ( x ) = 3 8 para 1 ≤ x < 2
7 8 para 1 ≤ x < 2
1 para x ≥ 4
La función acumulada F de X se muestra a continuación. Observe que X tiene
escalón en xi con altura f(xi)
F(x)
1/2
Figura 1
x
-2 1 2 4
Una v.a continua tiene una probabilidad cero de tomar exactamente cualquiera de
sus valores. Por tanto, su distribución de probabilidad no se puede dar en forma
tabular (tiene más sentido hablar del valor en un intervalo que dar un valor
puntual). Sin embargo, podemos dar una fórmula para la distribución de
probabilidad de la v.a. La fórmula será función de los valores numéricos de la
variable continua X. Se representa por f(x) y se llama
entonces se dice que X es una v.a continua. f(x) se llama función de densidad de
probabilidad o función de densidad de X.
Propiedades de f
a. f (x ) ≥ 0
Estadística 1 113
∞
b. ∫ f (x )dx ≡ ∫ f (x )dx = 1
−∞ R
12 x si 0 ≤ x ≤ 2
f (x ) =
0 cualquier otra parte
a. Verifique la propiedad 2
b. Encuentre P (1≤X≤1,5)
Solución.
∞ 0 ∞ 2 2
1, 5 1, 5
b. P (1 ≤ X ≤ 1,5) = ∫ xdx = x
1 1 2 225 100 125 5
= − = =
1
2 4 1 400 400 400 16
x
F ( x ) = P( X ≤ x ) = ∫ f (t )dt para −∞ < x < ∞.
−∞
Solución.
x x x
t2 x2
F ( x ) = P ( X ≤ x ) = ∫ f (t )dt = ∫ dt =
t
=
−∞ −∞
2 40 4
Así,
0, x≤0
x 2
F (x ) = , 0 ≤ x ≤ 2
4
1, x≥2
a. f ( x, y ) ≥ 0 ∀ ( x, y ) ,
b. ∑∑ f (x, y ) = 1 ,
x y
c. P ( X = x, Y = y ) = f ( x, y )
Solución.
a. El espacio muestral es
S = ({ 0,0 ),({
0,1),({
1,0 ),({
1,1),({
0,2 ),({
2,0 )
2 deC 1deB , 1deA, 1deA, 2 deB 2 deA
1deC 1deC 1deB
Luego,
3 3 3 2
f (0,0 ) = = f (1,0 ) = = f (0,2 ) = =
2 3 1 1 9 2 1
8 28 8 28 8 28
2 2 2
2 3 3 2 3
f (0,1) = = f (1,1) = = f (2,0 ) = =
1 1 6 1 1 6 2 3
8 28 8 28 8 28
2 2 2
3 2 3
x y 2 − x − y
f ( x, y ) =
8
2
Si construimos la tabla
f ( x, y ) 0 1 2 Total por
fila
0 3 28 9 28 3 28 15 28
y
1 6 28 6 28 12 28
2 1 28 1 28
Total por 10 28 15 28 3 28 1
columna
a. f ( x, y ) ≥ 0 ∀ ( x, y ) ,
∞ ∞
b. ∫ ∫ f (x, y )dxdy = 1 ,
−∞ −∞
4 x + y , 0 ≤ x ≤ 1, 0 ≤ y ≤ 1
f ( x, y ) = .
0, en cualquier otro caso
1
P[( X , Y ) ∈ A] , estando A en la región ( x, y ) 0 < x < , < y <
1 1
Encuentre
2 4 2
Solución.
1
P[( X , Y ) ∈ A] = P 0 < X < , < Y <
1 1
2 4 2
12 12
∫ ∫ (4 x + y )dxdy = ∫ (2 x )
1 21 2 12 12
1 y y y2 11
= 2
+ xy dy = ∫ + dy = + =
1 4
140 14 0
2 2 2 4 1 4 64
Dada la distribución conjunta f ( x, y ) se pueden definir las distribuciones marginales
g ( x ) y h( y ) como:
discreto: g ( x ) = ∑ f ( x, y ) y h( y ) = ∑ f ( x, y )
y x
∞ ∞
continuo: g ( x ) = ∫ f (x, y ) dy y h( y ) = ∫ f (x, y ) dx
−∞ −∞
Y y1 y2 ... yn Total
fila
X
x1 f ( x1 , y1 ) f ( x1 , y2 ) ... f ( x1 , yn ) g ( x1 )
x2 f ( x2 , y1 ) f ( x2 , y 2 ) ... f ( x2 , y n ) g ( x2 )
... … … ... … …
xn f ( xn , y1 ) f ( xn , y 2 ) ... f ( xn , y n ) g ( xn )
Total h( y1 ) h ( y2 ) ... h( y n )
columna
Estadística 1 119
Solución.
Para la v.a Y :
2
P (Y = 0 ) = h(0 ) = ∑ f ( x,0 ) = f (0,0) + f (1,0 ) + f (2,0 ) =
3 6 1 10
+ + =
x =0 28 28 28 28
2
P (Y = 1) = h(1) = ∑ f ( x,1) = f (0,1) + f (1,1) + f (2,1) =
9 6 15
+ +0=
x=0 28 28 28
2
P (Y = 2 ) = h(2 ) = ∑ f (x,2 ) = f (0,2 ) + f (1,2 ) + f (2,2 ) =
3 3
+0+0=
x =0 28 28
Solución.
∞ 1 y =1
1
g ( x ) = ∫ f ( x, y ) dy = ∫ (4 x + y )dy = 4 xy + y 2
1
= 4x + , para 0 ≤ x ≤1 y
−∞ 0 2 y =0 2
∫ f (x, y ) dy = ∫ (4 x + y ) dx = (2 x )
1
h( y ) = = 2 + y , para 0 ≤ y ≤ 1 y h( y ) = 0
x =1
2
+ xy
x =0
−∞ 0
f ( x, y )
f (y x) = , g (x ) > 0 .
g (x )
f ( x, y )
f (x y ) = , h( y ) > 0 .
h( y )
b
P(a < X < b | Y = y ) = ∫ f ( x | y ) dx ; (para v.a continuas)
a
Solución.
( )
Hay que buscar f x y , donde y = 1 :
2
h(1) = ∑ f ( x,1) =
6 6 12 3
+ +0= =
x =0 28 28 28 14
Tenemos que
f ( x,1) 7
f ( x | 1) = = f ( x,1) , x = 0, 1, 2.
h(1) 3
Por tanto,
Estadística 1 121
f (0 | 1) = f (0, 1) =
7 7 3 1
= ,
3 3 14 2
f (1 | 1) = f (1, 1) =
7 7 3 1
= ,
3 3 14 2
f (2 | 1) = f (0, 1) = 0 = 0 ,
7 7
3 3
x 0 1 2
f (x 1) 12 12 0
P ( X = 0 | Y = 1) = f (0 | 1) =
1
.
2
1 1
g ( x ) , h( y ) , f ( x | y ) , y evalúe P < X < | Y = .
1
encuentre
4 2 2
Solución.
∫ f (x, y ) dy = ∫ (x )
1
g (x ) =
1
2
+ y 2 dy = x 2 + , 0 < x <1.
−∞ 0
3
∞
∫ f (x, y ) dy = ∫ (x )
1
h( y ) =
1
2
+ y 2 dx = y 2 + , 0 < y < 1.
−∞ 0
3
Por tanto,
f ( x, y ) x 2 + y 2
f (x y ) = = , 0 < x <1, 0 < y <1
h( y ) y +
2 1
3
1 1 1
2 x2 + 2
1 1 1 4 dx = 12 x 2 + 1 dx = 19
P < X < | Y = = ∫
4 2 2 1 1 1
+ 7 ∫1 4 112
4 4 3 4
f ( x, y ) = g ( x ) h ( y )
f (0, 1) =
6
28
Estadística 1 123
2
g (0) = ∑ f (0, y ) =
3 6 1 10
+ + =
y =0 28 28 28 28
2
h(1) = ∑ f ( x, 1) =
6 6 12
+ +0=
x =0 28 28 28
Multiplicando, obtenemos:
X 1 , X 2 , ..., X n .
f ( x1 , x2 , ..., xn )
f ( x1 , x2 , x3 | x4 , x5 , ..., xn ) = ,
g ( x4 , x5 , ..., xn )
f ( x1 , x2 , ..., xn ) = f ( x1 ) f ( x2 ) ⋅ ⋅ ⋅ f ( xn )
e −2 x , x>0
f (x ) = .
0, en cualquier otro caso
Si X 1 , X 2 y X 3 son los tiempos de vida para tres de estos recipientes plásticos que se
escogen de forma independiente: encuentre el valor de P ( X 1 < 1, 1 < X 2 < 2, X 3 > 1) .
f ( x1 , x2 , x3 ) = f ( x1 ) f ( x2 ) f ( x3 ) = e −2 x1 e −2 x 2 e −2 x3 = e −2( x1 + x 2 + x3 ) ,
para
Estadística 1 125
∞2 1
− 1 −2
P( X 1 < 1, 1 < X 2 < 2, X 3 > 1) = ∫ ∫∫ e − 2 ( x1 + x 2 + x3 )dx1 dx2 dx3 =
2 3
( )( )(
e − 1 e− 4 − e− 2 − e− 2 )
1 1 0
=
1
2 3
( )2
1 − e − 2 e − 4 = 1,7 × 10 − 3 .
ESPERANZA MATEMÁTICA
∑ x f ( x ) si X es discreta
x
µ = E(X ) = ∞ .
∫ x f ( x ) dx si X es continua
- ∞
Ejemplo 15. Se tira una moneda tres veces. Halle el valor esperado o
esperanza matemática de obtener el número mayor de caras sucesivas si:
Solución.
20000
x > 100
f (x ) = x3
,
.
0, en cualquier otro caso
Solución.
∞
µ = E(X ) =
20000
∫x
100
x3
dx = 200 .
µ g ( X ) = E [g ( X )] = ∑ g ( x ) f (x ) si X es discreta, y
∞
µ g ( X ) = E [g ( X )] = ∫ g (x ) f (x ) dx si X es continua
−∞
x 10 11 12 13 14
P( X = x ) 18 14 18 14 14
Si la cantidad de euros que se le paga al dependiente por las ventas de las cajas se
puede representar por la v.a g ( X ) = X + 2 ¿Se espera que el dependiente tenga
ganancias en el intervalo de ventas?
Solución.
e − x , 0< x<2
f (x ) =
0, en cualquier otro caso ,
∞ ∞
µ g ( X , Y ) = E [g ( X , Y )] = ∫ ∫ g (x, y ) f (x, y ) dx dy para v.a continuas
-∞ −∞
Y
Ejemplo 19. Halle E para la función de densidad
X
1∞ 1
Y
E [g ( X , Y )] = E = ∫∫ x y e − x dx dy = ∫ y 2 dy = .
y 1
X 00 x 0
3
VARIANZA Y COVARIANZA
[ 2
]
σ 2 = E ( X − µ ) = ∑ (x − µ ) f (x )
2
para X discreta
x
[ ] ∫ (x − µ )
∞
σ = E (X − µ ) = f ( x ) dx
2 2 2
para X continua
-∞
σ 2 = E (X 2 ) − µ 2 .
Demuéstrelo.
Interpretación física:
{[
σ g2( X ) = E g ( X ) − µ g ( X ) ] }= ∑ [g ( X ) − µ ( ) ] f (x )
2
g X
2
para X discreta.
x
{[ ] }= ∫ [g ( X ) − µ ( ) ] f (x )
∞
σ = E g (X ) − µg (X )
2 2 2
g(X ) g X para X continua.
−∞
σ XY = E [( X − µ X )(Y − µY )] = ∑∑ ( x − µ X ) ( y − µ y ) f ( x, y ) si X y Y son
x y
discretas.
∞ ∞
σ XY = E [( X − µ X )(Y − µY )] = ∫ ∫ ( x − µ ) ( y − µ ) f ( x, y )
−∞ −∞
X y X y Y son
continuas.
σ XY = E ( XY ) − µ X µY .
Demuéstrelo.
La covarianza entre dos v.a nos da información de la relación que hay entre ellas.
Sin embargo, la covarianza no indica nada sobre la fuerza de la relación ya que σ XY
depende de la escala (depende de las unidades que se miden para X y Y ).
σ XY
ρ XY = .
σ X σY
Compruébelo.
E [g ( X ) ± h( X )] = E [g ( X )] ± E [h( X )] .
Compruébelo.
E [g ( X , Y ) ± h( X , Y )] = E[g ( X , Y )] ± E[h( X , Y )] .
Compruébelo.
Compruébelo.
σ aX
2
+ bY = a σ X + b σ Y + 2 abσ XY .
2 2 2 2
Compruébelo.
P (µ − kσ < X < µ + kσ ) ≥ 1 −
1
k2
Demostración.
[ ] ∫ (x − µ )
∞
σ = E (X − µ ) =
2 2 2
f ( x ) dx
−∞
µ − kσ µ + kσ ∞
= ∫ (x − µ ) f (x ) dx + ∫ (x − µ ) f (x ) dx + ∫ (x − µ ) f (x ) dx
2 2 2
−∞ µ − kσ µ + kσ
µ − kσ ∞
≥ ∫ (x − µ ) f (x ) dx + µ ∫ σ(x − µ ) f (x ) dx ,
2 2
−∞ +k
Estadística 1 133
µ − kσ ∞
σ2 ≥ ∫ k σ f (x ) dx + ∫ k σ f (x ) dx
2 2 2 2
−∞ µ σ +k
µ − kσ ∞
f ( x ) dx + ∫ f (x ) dx ≤ k
1
∫
−∞ µ σ
+k
2
.
De aquí
µ + kσ
P (µ − kσ < X < µ + kσ ) = f ( x ) dx ≥ 1 −
1
∫
µ σ −k
k 2
,
l.q.q.d.
Solución.
a. µ - k σ = 75-2(5)=65 y µ + k σ =85
Sea X v.a de media µ, entonces el resultado numérico de cada prueba es una v.a
con la misma media que X. El valor medio de todos los resultados n es también una
v.a, X n , que se llama media muestral, i.e.
X1 + X 2 + ⋅ ⋅ ⋅ + X n
Xn =
n
La ley de los grandes números dice que, a medida que aumenta n, la probabilidad
de que la X n se aproxime a µ está cerca de 1.
3 + 4 + 6 +1+ 4
El valor correspondiente de la media muestral: X 5 = = 3,6
5
En un dado no trucado la media µ=3,5. La ley de los grandes números dice que, a
medida que aumenta n, hay posibilidades de que X n se aproxime a 3,5.
Bibliografía
EJERCICIOS PROPUESTOS
1. El número total de horas, medidas en unidades de 100 horas, que una familia
utiliza una aspiradora en un período de un año es una v.a continua X que tiene la
función de densidad
x, 0 < x <1
f ( x ) = 2 − x, 1≤ x < 2 .
0, en cualquier otro caso
R/ a. 0.68 b. 0.375
2. Un embarque de siete televisores contiene dos unidades defectuosas. Un hotel
hace una compra al azar de tres de los televisores. Si x es el número de unidades
defectuosas que compra el hotel, encuentre la distribución de probabilidad de X .
Exprese los resultados con el histograma de probabilidad.
R/
x 0 1 2
x 0 1 2 3 4
R/
0, x<0
0.41, 0 ≤ x < 1
0.78, 1 ≤ x < 2
F (X ) =
0.94, 2 ≤ x < 3
0.99, 3 ≤ x < 4
1, x≥4 .
4. Una v.a continua X que puede tomar valores entre x = 1 y x = 3 tiene una
función dada por f ( x ) = 1 2 . Encuentre:
b. P( X ≤ 1.6)
Estadística 1 137
R/ a. 1/4 b. 0.3
k x , 0 < x <1
f (x ) =
0, en cualquier otro caso
a. Evalúe k.
3
R/ a. 3/2 b. F ( X ) = x 2 ; 0.3004
6. De un costal de frutas que contiene tres naranjas, dos manzanas y tres plátanos
se selecciona una muestra aleatoria de cuatro frutas. Si X es el número de naranjas; y
Y , el de manzanas en la muestra, encuentre:
f ( x, y ) 0 1 2 3
0 3 70 9 70 3 70
y
1 2 70 18 70 18 70 2 70
2 3 70 9 70 3 70
b. 1/2
Encuentre:
1 1 1
a. P 0 ≤ X ≤ y ≤Y ≤ ;
2 4 2
b. P( X < Y ) .
R/ a. 3/64 b. 1/2 .
1 1 3
b. Encuentre P < X < | Y = .
4 2 4
R/ a. Dependiente b. 1/3.
f ( x, y ) x 1 2 3
3 0 0.2 0.1
c. Encuentre P (Y = 3 | X = 2 ) .
R/
a.
x 1 2 3
b.
y 1 2 3
c. 0.2.
10. Un dado balanceado se lanza dos veces. Sean X y Y el número de cuatro y de
cinco que se obtienen en los dos lanzamientos, respectivamente. Halle:
f ( x, y ) 0 1 2
0 16 36 8 36 1 36
y
1 8 36 2 36
2 1 36
b. 11/12
R/ 3/4
a. encuentre k .
Estadística 1 141
1 1
b. encuentre P X < , Y > , 1 < Z < 2 .
4 2
R/ a. 3 b. 21/512
Esperanza matemática
4
0 < x <1
(
f (x ) = π 1 + x 2
,
) .
0, en cualquier otro caso
R/ ln 4 π .
x -3 6 9
Halle µ g ( X ) , donde g ( X ) = (2 X + 1) .
2
R/ 209.
1 0.10 0.15
y
3 0.20 0.30
5 0.10 0.15
b. Encuentre µX y µY .
Varianza y covarianza
R/ 118.9
R/ σ XY = 0.005
x 0 1 2 3 4 5
( ) [
Halle E ( X ) y E X 2 y luego evalúe E (2 X + 1) .
2
]
Estadística 1 143
R/ 209
[
19. Si una v.a X se define tal que E ( X − 1) = 10 y
2
] [ ]
E ( X − 2 ) = 6 . Halle µ y
2
σ2.
7 15
R/ µ= σ2 =
2 4
a. P( X − 10 ≥ 3) ;
b. P( X − 10 < 3) ;
b. Al menos 5/9 d. 10
21. Considere que las v.a X y Y representan el número que ocurre cuando se lanza un
dado rojo y uno verde, respectivamente. Encuentre:
a. E(X + Y ) ;
b. E(X − Y );
c. E(X Y ).
R/ a. 7; b. 0; c. 12.25.
g(X , Y ) =
X
Encuentre el valor esperado de + X 2Y .
Y3
R/ 1.
f ( x; k ) =
1
, x = x1 , x2 , ..., xk .
k
∑x ∑ (x − µ)
2
i i
µ= i =1
y σ2 = i =1
.
k k
Demuéstrelo.
b. La media y la varianza.
a.
f ( x;6 ) = ,
1
x = 1, 2, 3, 4, 5, 6 .
6
b.
1+ 2 + 3 + 4 + 5 + 6
µ= = 3 .5
6
σ2 =
(1 − 3.5)2 + (2 − 3.5)2 + (3 − 3.5)2 + (4 − 3.5)2 + (5 − 3.5)2 + (6 − 3.5)2 =
35
.
6 12
EXPERIMENTOS DE BERNOULLI. DISTRIBUCIÓN BINOMIAL
n
b( x; n, p ) = p x q n − x x = 0, 1, 2, ... , n .
x
n
P ( x ) = P( x éxitos ) = p x q n − x
x
Observaciones:
4 2 5 6
6 1 1 6 1 1 6 1 11
b. P(4) + P(5) + P(6) = + + = ≈ 0.34
4 2 2 5 2 2 6 2 34
6
1 1
c. q6 = =
2 64
1 63
d. 1 − qn = 1 − = ≈ 0.98
64 64
x 0 1 2 … n
P(x) qn n n −1 n n−2 2 … pn
q p q p
1 2
22
Son sus propiedades
Media o número esperados de éxitos es µ = np .
Varianza es σ 2 = npq .
Observaciones
DISTRIBUCIÓN MULTINOMIAL
n x1 x2
f ( x1 , x2 , ..., xk ; p1 , p2 , ..., pk , n ) =
n!
p1 p2 ⋅ ⋅ ⋅ pkxk = p1x1 p2x2 ⋅ ⋅ ⋅ pkxk
x1 , x2 ,⋅ ⋅ ⋅xk x1! x2 !⋅ ⋅ ⋅xk !
Estadística 1 149
k k
donde ∑ xi = n
i =1
y ∑p
i =1
i = 1.
Solución.
2 2
1 1 1 1 1 1 8! 1 1 1 1 1 1 35
p = f 2, 2, 1, 1, 1, 1; , , , , , , 8 = = ≈ 0,006
6 6 6 6 6 6 2!⋅2!⋅1!⋅1!⋅1!⋅1! 6 6 6 6 6 6 5832
DISTRIBUCIÓN HIPERGEOMÉTRICA
M N − M
x n − x
P ( X = x ) = h(x; n, M , N ) = ; x = 0, 1, 2, ... , n , (1)
N
n
M N −n M M
µ = n⋅ y σ2 = ⋅ n ⋅ ⋅ 1 − .
N N −1 N N
µ = n⋅ p ,
(2)
N −n
σ = ⋅ n ⋅ p ⋅ (1 − p ) .
2
N −1
Estadística 1 151
Solución.
3 40 − 3
1 5 − 1
P ( X = 1) = h(1; 5, 3, 40 ) = = 0.3011
40
5
5⋅3 40 − 5 3 3
µ= = 0.375 y σ2 = 5 1 − = 0.3113 .
40 39 40 40
x − 1 r
nb( x; r , p ) = p (1 − p ) ;
x−r
x = k , k + 1, k + 2,... (3)
r − 1
r (1 − p ) r (1 − p )
µ= y σ2 =
p p2
Estadística 1 153
Solución.
1 5 + 2 − 1 1 1
2 3
27
nb 5; 2, = 1 − = .
4 2 − 1 4 4 256
1 1
2 1 − 2 1 −
µ=
4
σ 2 = 2 = 24
4
b. =6 y
1 1
4
4
g ( x; p ) = pq x −1 , x = 1,2,3,...
Teorema 6. Sea X la v.a. geométrica con función de distribución g ( x; p ) , entonces, la
media y la varianza vienen dadas por:
µ=
1
y σ2 =
(1 − p ) .
p p2
DISTRIBUCIÓN DE POISSON
Proceso de Poisson. Para tipo de eventos particulares con el tiempo. Ejemplo, los
relacionados con los impulsos. También se emplean en los fenómenos por unidad
de área, volumen, de tiempo, etc.
p (x; λt ) = f ( x; λt ) =
(λt )x e − λt
, x = 0,1,2,...
x!
Varianza es σ 2 = λt .
Desviación típica es σ = λt .
Compruébelo.
Demostración.
n
b( x; n, p ) = p x q n − x =
n!
p xqn− x
x x!(n − x )!
n(n − 1) ⋅ ⋅ ⋅ (n − x + 1) x n(n − 1) ⋅ ⋅ ⋅ (n − x + 1) µ µ
x n− x
p (1 − p ) =
n− x
= 1 −
x! x! n n
−x
1 x −1 µ µ µ
x n
= 11 − ⋅ ⋅ ⋅ 1 − 1 − 1 − .
n n x! n n
23
Son sus propiedades
−n µ −µ
µx µ
n
µx 1 µx
lím b( x; n, p ) = lím 1 − = lím 1 + = e − µ = p x; λ
{t .
n →∞ x! n → ∞ n x! n → ∞ (− n ) µ x! µ
Por tanto, b( x; n, p ) → p( x; λt ) ;
l.q.q.d
a. Ninguna errata
b. Una errata
c. Dos erratas
d. 2 o más erratas
Solución.
1
Probabilidad de que salga una errata en una pág. Dada: p= .
200
P ( X = x ) = p ( x; λt ) =
(λt )x e−λt
x!
a. P (0 ) = p(0;1.1) =
(1.1)0 e−1.1 = 0.333
0!
Estadística 1 157
b. P (1) = p (1;1.1) =
(1.1) e −1.1
1
= 0.366
1!
c. P (2 ) = p (2;1.1) =
(1.1) e −1.1
2
= 0.201
2!
Bibliografía
EJERCICIOS PROPUESTOS
R/
a.
b. 1/2
21 35
c. µX = , σ X2 =
6 12
d. 1/2
R/
10
b.
13
3 30
c. µX = , σX =
13 13
Estadística 1 159
R/
0.3125
c. µ X = 2 , σ X2 = 1
d. 0.6875
e. 0.875
f. 0.6875
4.
R/
1)
b. µ X = 3.68 , σ X = 1.92
c. 0.025
d. 0.21
e. 0.714
2)
b. 0.9
5. Se lanza al aire una moneda trucada 8 veces, de tal manera que la probabilidad
de que aparezca cara es de 2/3, mientras que la probabilidad de que aparezca cruz
es de 1/3.
R/
b. µX = 3 , σ X2 = 6
c. 0.36
Y ≡ G ( 2 / 3)
3 −1
1 2
P (Y = 3) = pY (3) = = 0.07
3 3
R/
b. µX = 6 , σX = 2 6
c.
En este caso la variable aleatoria será una Pascal, que en el mismo experimento que
la anterior lo que mide son el número de lanzamientos hasta el segundo éxito.
i
Y : Ω = {0,1} → {0,1, 2,K , 60} ⊆ , ω → Y (ω = (ω1 , ω2 ,K) ) = min i,
∞
∑ω
k =i
k = 2
Estadística 1 163
y − 1 2 y −2
Función de masa pY ( y ) = P (Y = y ) = p q , y ∈ DX = {2,3, 4,...}
y − 2
y
k − 1 2 y−2
Función de distribución FY ( y ) = P (Y ≤ y ) = ∑ p q ,y≥2
k =0 k − 2
n·q 2·3 / 4
µY = E [Y ] = E [ X + n ] = E [ X ] + n = +n = + 2 = 6 + 2 = 8 será el número
p 1/ 4
esperado de lanzamientos que tendremos que realizar hasta obtener dos caras.
n·q 2·3 / 4/
σ Y2 = V [Y ] = V [ X + n ] = V [ X ] = = = 24 ⇒ σ Y = 2 6
p 2 1/ 4 2/
Para calcular esta probabilidad podemos utilizar cualquiera de las dos variables
aleatorias.
2 − 1 2 2 − 2 3 − 1 2 3− 2 4 − 1 2 4 − 2
P ( Y ≤ 4 ) = pY ( 2 ) + pY ( 3) + pY ( 4 ) = p q + 3 − 2 p q + 4 − 2 p q =
2 − 2
2 2 2 2
1 1 2 1 3 3 1 3
= + + =
0 4 1 4 4 2 4 4
1 3 9 16 + 24 + 27 67
= + 2· + 3 = = 0.26
16 64 256 256 256
Para calcular esta probabilidad podemos utilizar cualquiera de las dos variables
aleatorias.
P (1 ≤ X ≤ 4 ) = p X (1) + p X ( 2 ) + p X ( 3) + p X ( 4 ) =
2 + 1 − 1 2 1 2 + 2 − 1 2 2 2 + 3 − 1 2 3 2 + 4 − 1 2 4
= p q + p q + p q + p q +=
1 2 3 4
2 2 2 2 3 2 4
2 1 3 3 1 3 4 1 3 5 1 3
= + + + =
1 4 4 2 4 4 3 4 4 4 4 4
3 32 33 34 6·43 + 27·42 + 27·42 + 5·81 1653
= 2· 3 + 3 4 + 4· 5 + 5· 6 = = 0.40
4 4 4 4 46 4096
Estadística 1 165
P ( 3 ≤ Y ≤ 6 ) = pY ( 3) + pY ( 4 ) + pY ( 5 ) + pY ( 6 ) =
3 − 1 2 3− 2 4 − 1 2 4 − 2 5 − 1 2 5 − 2 6 − 1 2 6 − 2
= p q + 4 − 2 p q + 5 − 2 p q + 6 − 2 p q =
3− 2
2 2 2 2 3 2 4
2 1 3 3 1 3 4 1 3 5 1 3
= + + + =
1 4 4 2 4 4 3 4 4 4 4 4
3 32 33 34 6·43 + 27·4 2 + 27·4 2 + 5·81 1653
= 2· 3 + 3 4 + 4· 5 + 5· 6 = = 0.40
4 4 4 4 46 4096
9. DISTRIBUCIONES DE PROBABILIDAD CONTINUA
1
A≤ x≤ B
f ( x; A, B ) = B − A
,
.
0, en cualquier otro caso
µ=
A+ B
y σ 2
=
( B − A)
2
.
2 12
Demuéstrelo.
DISTRIBUCIÓN NORMAL
1 x−µ
2
−
f ( x; µ , σ ) =
1 2 σ
e , −∞ < x < ∞ .
2π σ
Varianza es σ 2 .
Desviación típica es σ .
X −µ
X sea cualquier N (µ, σ2). La v.a tipificada es Z = .
σ
z2
1 −2
φ (z ) = e
2π
Sabemos que:
b
P(a ≤ X ≤ b ) = ∫ f ( x )dx,
a
Ejemplo 1. Hallar:
24
Son sus propiedades
25
El procedimiento depende del formato de la tabla. En el Devore se hace algo diferente pero la esencia de
búsqueda obedece al conocimiento de propiedades.
c. φ (4,2) . ∀z ≥ 3,99 el valor es 0,5000
Φ ( z2 ) + Φ ( z1 ) es z1 ≤ 0 ≤ z2
P( z1 ≤ Z ≤ z2 ) = Φ ( z2 ) − Φ ( z1 ) es 0 ≤ z1 ≤ z2
Φ (z ) − Φ ( z ) es z ≤ z ≤ 0
1 2 1 2
0,5000 + Φ( z1 ) es 0 ≤ z1
P(Z ≤ z1 ) =
0,5000 − Φ( z1 ) es z1 ≤ 0
0,5000 − Φ( z1 ) es 0 ≤ z1
P(Z ≥ z1 ) =
0,5000 + Φ ( z1 ) es z1 ≤ 0
Ejemplo 2. Hallar:
b. P(0,2 ≤ Z ≤ 1,4)
d. P(Z ≥ 1,6)
a−µ b−µ
z1 = y z2 = . Entonces, P(a ≤ X ≤ b ) = P( z1 ≤ Z ≤ z2 ) que es la curva
σ σ
normal tipificada.
a. P(68 ≤ X ≤ 74)
b. P(72 ≤ X ≤ 75)
c. P(63 ≤ X ≤ 68)
d. P( X ≥ 73)
68 − 70 74 − 70
z1 = = −1 , z 2 = =2
2 2
P(68 ≤ X ≤ 74) = P(− 1 ≤ Z ≤ 2) = Φ(2) + Φ(1) = 0,4772 + 0,3413 = 0,8184
Para np ≥ 5 y nq ≥ 5 , el histograma de
B(n, p) es casi simétrico respecto a µ = np
sobre el [µ − 3σ , µ + 3σ ] , donde
Teorema 3. (Central del Límite) Sean X1, X2, X3,… una sucesión de v.a
independientes e idénticamente distribuidas, con media µ y varianza σ2. Sea
Xn − µ
Zn = . Entonces, para n grande y ∀ {a ≤ x ≤ b} ,
σ n
P(a ≤ Z n ≤ b ) ≈ P(a ≤ φ ≤ b )
∞
Γ(α ) = ∫ xα −1e − x dx . (4)
0
Propiedades:
1
3. Γ = π .
2
Compruébelo.
x α −1 e − x
x≥0
Γ (α )
f (x ; α ) = , (5)
0 x<0
∞
entonces f ( x; α ) ≥ 0 y ∫ f (x; α ) dx = 1 .
0
Por tanto, f ( x; α ) cumple con las
1 α −1
−
x
β
α x e x≥0
f ( x ; α , β ) = β Γ (α )
, (6)
0 x<0
Densidad Gamma
yα −1e − y
x
F ( x;α ) = ∫ dy ; x > 0, (7)
0
Γ(α )
26
En ocasiones se refiere a la expresión anterior sin el término Γ (a ) .
Estadística 1 173
x
P( X ≤ x ) = F ( x;α , β ) = F ;α .
β
Distribución exponencial
λ e − λ x x ≥ 0
f ( x; λ ) = (8)
0 x<0
Nota. Caso particular de la función gamma con α =1 y
1
1. µ = αβ = ,
λ
1
2. σ 2 = αβ 2 =
λ2
0 x<0
F ( x; λ ) =
1 − e − λ x x ≥ 0
Utilidades. Se usa:
Distribución ji-cuadrada
1
ν
−1 − x
e 2 x≥0
2
ν x
f ( x;ν ) = 2 2 Γ(ν 2 )
.
x<0
0
(9)
µ =ν y σ 2 = 2ν .
27
Se verá que hay otras distribuciones que proporcionan modelos de vida útil más generales.
28
Veremos aplicaciones de ellas en la ingerencia estadística.
Estadística 1 175
Ejemplo 4. Un sistema tiene componentes cuyo tiempo de falla en años está dado
por T . Considere que la v.a T se modela bien con una distribución exponencial con tiempo
medio para la falla β = 5. Si se instalan cinco de estos componentes en diferentes
sistemas, ¿qué probabilidad hay de que al menos dos aún funcionen al final de ocho años?
∞ t
1 −5
P(T > 8) =
5 ∫8
e dt ≈ 0.2
Considere que X es el número de componentes que funcionan después de ocho años. Con
el uso de la distribución binomial
5 1
P( X ≥ 2 ) = ∑ b( x;5,0.2 ) = 1 − ∑ b( x;5,0.2 ) = 1 − 0.7373 = 0.2627 .
x=2 x=0
Consideremos la v.a X el tiempo en minutos que transcurre antes de que lleguen dos
llamadas. La probabilidad se determina por
x x
−
P( X ≤ x ) = ∫
1 β
xe dx
0
β2
1
P( X ≤ 1) = 25∫ xe − 5 x dx = 0.96 .
0
Solución.
∞ −
x
P( X ≤ x ) = ∫ α
1
xα −1e β dx
( )
0 β Γ α
60 x
1 α −1 − β
P( X ≤ 60 ) =
1
5 ∫
x e dx
β 0 Γ(5)
60
P( X ≤ 60 ) = dx = F (6; 5) = 0.715
1 4 −y
∫ Γ(5) x e
0
Distribución de Weibull
x α
α −
α −1 β
βα x e x≥0
f ( x; α , β ) = .
x<0
0
Observaciones
1 1 1 2
µ = β Γ 1 + y σ = β Γ1 + − Γ1 + .
2 2
α α α
0 x<0
F ( x; α , β ) = x
−
α
(10)
β
1 − e
x≥0
Densidad de Weibull
Distribución logonormal
1 −
[ln ( x )− µ ]
2
, x≥0.
f ( x; µ , σ ) = 2π σx e
2σ 2
x<0
0,
( )
σ2
µ+
E(X ) = e V ( X ) = e 2 µ +σ eσ − 1 .
2 2
2
y
ln ( x ) − µ ln ( x ) − µ
F ( x; µ ,σ ) = P( X ≤ x ) = P(ln X ≤ ln x ) = P Z ≤ = Φ .
σ σ
Distribución beta
Γ(α + β ) x − A B − x
α −1 β −1
1
A≤ x≤ B
f ( x;α , β , A, B ) = B − A Γ(α ) ⋅ Γ(β ) B − A B − A
0 en cualquier otro caso
La integración de la fdp es difícil, salvo que α y β sean enteros. Por tal motivo se
utiliza la tabla de la función beta incompleta.
Teorema 9. Si X es una v.a. con distribución beta, entonces su media y varianza son:
µ = A + (B − A)
α
y σ =
2 ( B − A) α β
2
.
α +β (α + β )2 (α + β + 1)
Estadística 1 181
Resumen
Hemos trabajado algunas funciones de distribución. Ahora conviene dar una idea
estructurada de las mismas. En todas interesa su soporte, la función de masa
(discreta) o densidad (continuas), la función de distribución y valores de análisis de
datos (esperanza, varianza y desviación típica). Lo importante es destacar cuando
seleccionarlas de forma conveniente.
Distribuciones
Normal
Beta
Binomial
Gamma
T-student
Poisson
F de Fisher-
Hipergeométri Gamma Exponencial Ji-Cuadrado Snedecor
ca Incompleta
Binomial
negativa o de
Pascal
Bibliografía
EJERCICIOS PROPUESTOS
Distribución uniforme
1. La cantidad diaria de café, en litros, que sirve una máquina es una v.a X que
tiene una distribución continua uniforme con A = 7 y B = 10. Halle la probabilidad
de que en un día dado la cantidad de café que sirve la máquina sea:
Estadística 1 183
R/
Distribución normal
2. En una distribución normal estándar, determine el área bajo la curva que está:
a. a la izquierda de z = 1.43;
b. a la derecha de z = -0.89;
d. a la izquierda de z = -1.39;
e. a la derecha de z = 1.96;
R/
a. 0.9236
b. 0.8133
c. 0.2424
d. 0.0823
e. 0.0250
f. 0.6435
a. P (Z < k ) = 0.0427 ;
R/
a. P( X < 15) ;
R/
a. tablas
R/
a. 0.8006; b. 0.7803
b. la probabilidad de que el proceso continúe aun si éste está mal (es decir, si la
frecuencia de componentes defectuosos cambia a 5.0 % de defectuosos).
R/
a. 0.1574; b. 0.0108
Estadística 1 185
R/
a. 0.1171; b. 0.2049
R/
R/
10. la magnitud de tiempo para que una persona sea atendido en una cafetería es
una v.a que tiene una distribución exponencial con una media de cuatro minutos
¿Cuál es la probabilidad de que una persona sea atendida en menos de tres minutos
en al menos cuatro de los siguientes seis días?
R/
x 6− x
6
6 −
3
− 34
∑ 1 − e
x = 4 x
4 e
= 0.3968
R/
a. π 2 = 1.2533; b. e −2 .
R/
e −4
R/
a. 0.1889; b. 0.357.
Estadística 1 187
14. Los porcentajes siguen a menudo una distribución logarítmica normal. S estudia
el uso promedio de potencia (dB por hora) para una compañía y se sabe que tiene
la distribución citada con parámetros µ = 4 y σ = 2 .
b. ¿Cuál es la varianza?
R/
(
a. e6 ; b. e12 e 4 − 1 )
15. El número de automóviles que llega a una intersección por minutos tiene una
distribución de Poisson con una media de 10. El interés se centra alrededor del
tiempo que transcurre antes de que 15 automóviles aparezcan en la intersección.
R/
a. e −10 ; b. β = 0.10 .
10. INFERENCIA ESTADÍSTICA
conclusiones
Población Muestra
la
Sobre cada individuo medimos una o varias características –variables-. Por tanto, a
cada población le corresponde una variable aleatoria ( X ). De esta forma,
quedan identificadas población y variable aleatoria asociada. Así, en la Inferencia,
población es el conjunto de individuos a estudiar, pero también la variable aleatoria
asociada a la característica que medimos sobre los individuos.
La teoría del muestreo tiene por objetivo estudiar las relaciones existentes entre la
distribución de un carácter en una población y las distribuciones de dicho carácter
en todas sus muestras.
Como las muestras aleatorias escogidas para un estudio son diferentes y por
consiguiente, dan estimaciones distintas, se necesita el conocimiento de la
variación de todas las posibles estimaciones derivadas de muestreos aleatorios para
llegar a conclusiones razonables.
= N ( N − 1) ⋅ ⋅ ⋅ ( N − n + 1)
N!
VN , n =
entonces hay (N − n)! diferentes posibles muestras
29
Llamaremos muestra de tamaño n a un subconjunto de tamaño n de la población (ver apuntes iniciales del
curso).
Estadística 1 191
VRN , n = N n
ordenadas diferentes sin reemplazamiento y diferentes posibles
muestras ordenadas con reemplazamiento.
VN , n N ( N − 1) ⋅ ⋅ ⋅ ( N − n + 1)
p= =
VRN , n Nn
A partir de ahora supondremos que las muestras que consideramos serán con
reemplazamiento. Se harán observaciones cuando los resultados para la muestra
con reemplazamiento difieran de los obtenidos.
30
Consulte esto en los apuntes del tema correspondiente
La distribución de probabilidad de una variable aleatoria (v.a) definida en un espacio
de v.a se llama distribución muestral.
MEDIA MUESTRAL
1 n
X = ∑ Xi
n i =1 X
; con reemplazamiento. Media muestral de las i .
Si no consideramos la reposición,
1 n
X = ∑ xi
n i =1 ; sin reemplazamiento. Media muestral de las xi .
µX = µ
σ
σX =
n con reemplazamiento.
Estadística 1 193
µX = µ
σ N −n
σX = ⋅
n N − 1 sin reemplazamiento; (n < N )
La distribución muestral de X
σ N −n
X = N µ = µ X , σ X = ⋅
n N − 1 ; sin reemplazamiento.
Observaciones:
Existen ocasiones en las cuales no interesa la media muestral de una población, sino
alguna proporción de ella.
El conjunto de todos los posibles valores que puede tomar p̂ forman la variable
aleatoria P̂ , llamada proporción muestral.
media p
y
desviación típica p(1 − p ) n
; con reemplazamiento y,
media p
y
desviación típica
p(1 − p ) n ⋅ (N − n ) (N − 1) ; sin reemplazamiento.
Estadística 1 195
p ( p − 1)
Pˆ ≡ N p,
n ; con reemplazamiento,
p( p − 1) N − n
Pˆ ≡ N p,
n N − 1
; sin reemplazamiento.
Observaciones:
VARIANZA MUESTRAL
∑ (X − X)
n
2
i
S2 = i =1
Nota:
• X 2 (0,1) ∀i .
desviación típica 2n .
2
y por tanto la desviación típica de S es
2(n − 1)σ 2 2
σ= = ⋅σ 2
n −1 n −1 .
Con reemplazamiento
Muestras aleatorias
Sin reemplazamiento
Si O Si Si
n ≥ 30 X es normal n ≥ 30 n ≥ 30 y N >> n
Si
Como No se necesita
Si
N >> n
distinguir entre
ESTIMACIÓN PUNTUAL
PARÁMETROS Y ESTADÍSTICOS
En estadística en general:
Definiciones:
(estimador insesgado)
(EIVM)
Estimador eficaz: cuando es insensible a los valores extremos que pueda tomar la
muestra.
x1 = 19 , x2 = 17 , x3 = 18 , x4 = 20 , x5 = 16 .
Tomar de esta forma una muestra de cinco elementos es como tomar cinco
31
Esto significa que si tomamos el valor que nos proporciona el estimador para estimar el parámetro tendrá mayor
probabilidad de producir una estimación más cercana al parámetro. Se ha supuesto como principio que se ha
elegido el estimador insesgado de varianza mínima (EIVM).
Estadística 1 201
1 n 1 5 17 + 18 + 19 + 20 + 16
µ= ∑
n i =1
X i = ∑ xi =
n = 5 5 i =1 5
= 18
X i = xi
1 n
(X i − X i )2 n==5 1 ∑ (xi − 18)2 =
5
σ 2 = S2 = ∑
n i =1 5 i =1
X i = xi
X =18
=
(17 − 18) + (18 − 18) + (19 − 18) + (20 − 18)2 + (16 − 18)2
2 2 2
=2
5
Por tanto una estimación puntual para la desviación típica será la raíz cuadrada de
este valor
σ = 2 = 1.41
X 1 , ..., X n
Teorema 9. Sea una muestra aleatoria de una distribución normal con
X 1 , ..., X n
Definición. Sea una muestra aleatoria de una fmp o fdp
f ( x;θ1 ,θ 2 ,⋅ ⋅ ⋅,θ m ) θ1 ,θ 2 ,⋅ ⋅ ⋅,θ m son parámetros cuyos valores se desconocen.
, donde
X , ..., X
Ejemplo 4. 1 n es una muestra aleatoria de tiempos de
respuesta de n peticiones de una central de control. Suponiendo que la distribución
es exponencial con parámetro λ , determine el estimador de momento.
E(X ) =
1 1 1
=X λ=
En la distribución exponencial λ , con lo cual λ o X .
1
λˆ =
El estimador de momento de λ es X .
X 1 , ..., X n
Ejemplo 5. es una muestra aleatoria cuya distribución tiene
forma de campana asimétrica con parámetros α y β , determine los estimadores
de momento.
X = αβ
X i2 = β 2 (α + 1)α
1
n
∑
.
1
∑ X i2 = X 2 + β 2α
Luego se resuelven ambas ecuaciones: X = α β ,
2 2 2
n . Divida
esta ecuación con la primera ecuación de momento, se obtiene que
2
1 X
∑ X i2 − X 2 αˆ =
1
β̂ = n
X n
∑ X i2 − X 2
. Luego, .
X 1 , ..., X n
Definición. Sea una muestra aleatoria de una fmp o fdp conjunta
f ( x1 , x2 ,...xn ;θ1 ,θ 2 ,⋅ ⋅ ⋅,θ m ) θ1 ,θ 2 ,⋅ ⋅ ⋅,θ m son parámetros cuyos valores se
, donde
x1 , x2 ,...xn
desconocen. Cuando son los valores muestrales observados y f es
Las emv
θˆ1 ,θˆ2 ,⋅ ⋅ ⋅,θˆm son los valores de i que maximizan la función de θˆ
∀ θ1 ,θ 2 ,⋅ ⋅ ⋅,θ m .
Xi xi
Cuando las se sustituyen en lugar de las , resultan estimadores de máxima
verosimilitud.
X 1 , ..., X n
Ejemplo 6. es una muestra aleatoria de una distribución
exponencial con parámetro λ . La función de verosimilitud es un producto de fdp
( ) (
f ( x1 , x2 ,...xn ; λ ) = λe − λx1 ⋅ ⋅ ⋅ λe − λxn = λn e ∑ i
−λ x
)
ln[ f ( x1 , x2 ,...xn ; λ )] = n ln (λ ) − λ ∑ xi
.
n 1
n
− ∑ xi = 0 λ= =
λ o ∑x i x
.
1
λˆ =
El estimador de probabilidad máxima es X . Observe que es idéntico al método
1 1
E ≠
de los momentos; sin embargo, no es un estimador insesgado X E ( X ) .
X , ..., X
n es una muestra aleatoria de una distribución
Ejemplo 7. 1
( x1 −µ )2 ( xn − µ )2
n n
( xi − µ )2
1 2 −∑
( ) 1 − 1 −
2σ 2
f x1 , x2 ,...xn ; µ , σ 2 = 2σ
⋅⋅⋅ 2σ
=
2 2
2
e e e i =1
2π σ 2 2π σ 2 2 π σ
Así,
[(
ln f x1 , x2 ,...xn ; µ , σ 2 =)] n
2
( 1 n
2σ =
)
ln 2 π σ 2 − 2 ∑ ( xi − µ )
2
i 1 .
(X − X)
=∑
2
σˆ 2 i
X 1 , ..., X n
Ejemplo 8. es una muestra aleatoria de una fdp de Weibull
x α
α −
α −1 β
βα x e x≥0
f ( x; α , β ) =
x<0
0
fórmulas generales para las emv α̂ y β̂ . Sin embargo, para cada muestra
x1 , x2 ,...xn
, las ecuaciones se resuelven por procedimiento numérico iterativo. Los
procedimiento de determinación de momento pares de α y β son complicados.
¿Cómo estimar funciones de parámetros?
función
( )
h θˆ1 ,θˆ2 ,⋅ ⋅ ⋅,θˆm de las emv.
σˆ 2 =
1
∑ (X i − X )2 ( )
. Para conseguir la emv de la función h µ , σ = σ = σ , se
2 2
y n
sustituye la emv en la función:
1
σˆ = σ = ∑ ( X i − X )
12 22
n
1
µˆ = βˆΓ1 +
Así, la emv de µ es αˆ . α̂ y β̂ son las emv de α y β . X no es la
aproximadamente insesgado E θ ≈ θ
ˆ ( ( ) ) y tiene varianza que es casi tan pequeña
Estadística 1 207
aproximadamente el EIVM de θ .
Bibliografía
PROBLEMAS PROPUESTOS
Muestreo
Ejercicio 2.
S = {2,3, 4}
Ejercicio 4. Sea . Un espacio equiprobable
S = {1,5, 6,8}
Ejercicio 5. Sea .
a. Con reemplazamiento
b. Sin reemplazamiento
a. Con reemplazamiento
b. Sin reemplazamiento
Ejercicio 9. Se toman muestras de tamaño 20 sin reemplazamiento
correspondientes a una variable aleatoria X de una población. La variable aleatoria
Estimadores insesgados
Ejercicio 10. Sea X una v.a. binomial con parámetros n y p . Demuestre que la
proporción muestral pˆ = X n es un estimador insesgado de p .
X 1 , X 2 , ..., X n
Ejercicio 12. Sea una muestra aleatoria de una distribución con
∑ (X − X)
2
σˆ = Sˆ 2 =
2 i
5,9 7,2 7,3 6,3 8,1 6,8 7,0 7,6 6,8 6,5 7,0
6,3 7,9 9,0 8,2
8,7 7,8 9,7 7,4 7,7 9,7 7,8 7,7 11,6 11,3 11,8
10,7
b. del valor de resistencia que separa el 50% más débil de las vigas del
50% más fuerte.
X , ..., X
n es una muestra aleatoria cuya distribución se corresponde
Ejercicio 14. 1
con un número de éxitos fijo y un número de ensayos aleatorios con
parámetros r y p . Determine:
goles 0 1 2 3 4 5 6 7 8 9 10
frecuencia 29 71 82 89 65 45 24 7 4 1 3
X 1 , ..., X n
Ejercicio 15. es una muestra aleatoria de una distribución Gamma con
parámetros α y β .
Para informar un solo valor sensible del parámetro que está siendo estimado,
alternativamente, se calcula e informa un intervalo completo de valores posibles,
una estimación de intervalo o intervalo de confianza (IC).
INTERVALOS DE CONFIANZA
Esto último es muy útil cuando queremos calcular el tamaño mínimo de la muestra
para que el error no exceda cierta cantidad.
En general, el IC dependerá de la
distribución muestral del estadístico.
− zα 2 zα 2
simétricas respecto de la media de la distribución en cuestión, un valor crítico es
el valor de la abscisa en una determinada distribución que deja a su derecha un
área igual a α 2 o a su izquierda un valor 1 − α 2 . Aquí, 1 − α es el nivel de
confianza.
* z
En general se representa por z o α 2 , si Z es el nombre de la v.a utilizada para
calcular el intervalo.
x1 , x2 ,..., x25
Solución. Las observaciones muestrales reales son el resultado de una
X 1 , X 2 ,..., X 25
muestra aleatoria de una distribución normal. Como X es normal, lo
es también X .
(
El margen de error, E , satisface la ecuación P µ − E ≤ X ≤ µ + E = 0.95 . )
Tipifiquemos la variable X :
µ−E−µ X −µ µ+E−µ
P ≤ ≤
σ σ σ
n
12n3 n
P(µ − E ≤ X ≤ µ + E ) =
Z
−E E −E E
= P ≤ Z ≤ = P ≤Z≤ = 0.95
2 2 0.4 0.4
5 5 .
Estadística 1 215
P(0 ≤ Z ≤ 1.96 ) =
0.95
= 0.475
P(− 1.96 ≤ Z ≤ 1.96) = 0.95 ⇔ 2 .
Tenemos una confianza del 95% de que la media µ de X es algún valor de ese
intervalo, lo que significa que a medida que x toma todos los posibles valores de
X , el 95% de todos los intervalos [x − 0.784, x + 0.784] contendrán a µ . Aunque
las diferentes muestras aleatorias de tamaño 25 puedan dar valores diferentes de
x , el valor de E , para cada muestra, es el mismo.
Los intervalos pueden tener diferentes formas y obtenerse por diferentes métodos.
El objetivo de este tema es estudiar algunos de los IC más utilizados para estimar
los parámetros más comunes de una población, media proporción y desviación
típica. Daremos reglas para determinar el IC.
Los intervalos de confianza para µ requieren que la media muestral esté distribuida
aproximadamente como una normal.
z *σ
E=
2. Calcular: n
Figura 2
Solución.
P(− zα 2 ≤ Z ≤ zα 2 ) = 0,95 = 1 − α
1. Como el intervalo de confianza es del 95%, .
z =z
Por tanto, α = 0,5 y el valor crítico, α 2
*
, que deja un área de 0,025 a su
zα 2 = z * = 1,96
derecha es (se busca con una tabla o programa informático).
z *σ 1,96 ⋅ 0,3
E= = = 0,098
2. El error es n 36 .
Por tanto, el intervalo del 95% es aquel para el cual la media poblacional está en el
intervalo 2.50 < µ < 2.70 . Así, un 95% de muestras que se hubieran realizado
aportarían una concentración media de Zn en el intervalo reportado.
Haga usted el mismo análisis para un IC del 99%. En ese caso 2.47 < µ < 2.73 .
¿Qué cree usted acerca del uso del IC del 95% y el 99%?
32
Se debe tener cuidado a la hora de usar las tablas porque para calcular lo mismo emplean diferentes formas.
Definición. Sea Z la v.a normal tipificada, y χ la v.a chi cuadrado con k grados
2
Figura 3
Teorema 1. Sea X v.a que tiene como media µ . Sea X la media muestral
correspondiente a muestras aleatorias de tamaño n , y S la correspondiente
X −µ
t=
desviación típica. Si X está normalmente distribuida, entonces la v.a S n
tiene distribución t con k − 1 grados de libertad.
x=
1
∑ xi s=
1
∑ (xi − x )2
muestra n y n −1 , luego se siguen los siguientes
pasos:
t * = tα 2
1. Hallar el valor crítico de t , , de la v.a t con n − 1 grados de libertad
γ
( ) ( )
P 0 ≤ t ≤ t* =
que satisfaga P − t ≤ t ≤ t = γ
* *
⇔ 2
t *s
E=
2. Calcular n
3. Determinar el IC
Figura 4
Estadística 1 219
Solución.
(
0.95
)
P 0 ≤ t ≤ t* =
2
= 0.475
Equivalentemente, . Si buscamos en una tabla la
probabilidad correspondiente a 6 grados de libertad t ≈ 2.45 .
*
t *s 2.45 ⋅ 0.283
E= = = 0.26
2. El error, n 7
t *s t *s
x − , x + = [10 − 0.26, 10 + 0.26] = [9.74, 10.26]
3. El IC: n n
pˆ (1 − p )
E = z*
2. Calcular: n
3. Determinar el [ pˆ − E , pˆ + E ]
Solución. El grupo de científicos se divide en los que desean aplicar la técnica y los
que no. La proporción p de éxitos en la población se desconoce. Como el tamaño
de la muestra es grande ( 1000 ≥ 30 ) y hacemos p = 0.60 , podemos aplicar la regla
ˆ
3:
(
P 0 ≤ Z ≤ z* =) 0.90
= 0.45
. En este caso z = 1.65
*
crítico que satisface 2
pˆ (1 − p ) 0.60 ⋅ (1 − 0.60)
E = z* = 1.65 ≈ 0.03
2. n 1000
Las inferencias con relación a una varianza poblacional son de menor interés que las
anteriores. No obstante, en determinadas situaciones es necesaria su utilización.
x=
1
∑ xi s2 =
1
∑ (xi − x )2
la muestra n y n −1 . Se siguen los pasos:
(n − 1)s 2 , (n − 1)s 2
b a
Bibliografía
EJERCICIOS PROPUESTOS
Ejercicio 4. Una muestra aleatoria para los tipos de en los préstamos personales
cargados por un banco es de 12.8%, 12,2%, 13,4%, 11,9% y 13%. Considerando
que los tipos de interés están normalmente distribuidos con una desviación típica
del 0.9%, calcula en intervalo de confianza del 90% para la media de tipos de
interés.
Ejercicio 10. Se sospecha que el número de unidades que contiene cada dosis de
una vacuna no llega a las 10000 unidades que se indica en los envases. El
laboratorio que la fabrica afirma que ese es su contenido medio. Para comprobarlo,
se toman al azar 100 dosis y se determina el número de unidades de cada una,
obteniéndose una media de 9940 unidades y una desviación típica de 120 unidades.
Suponiendo que la distribución del número de unidades en cada dosis se distribuye
como una normal, ¿Qué podemos decir acerca de la información del laboratorio
para un nivel de confianza del 99%?
Ejercicio 11. Queremos analizar la desviación típica del nivel de benzocaína por
cápsula en cierto medicamento. Su distribución sigue una normal. Tomamos una
muestra de 16 cápsulas y nos da un contenido medio de benzocaína de 2.8
unidades por gramo y una desviación de 0.4 unidades por gramo. Obtén los
intervalos de confianza par ala desviación típica de niveles 95% y 99%.
Ejercicio 12. ¿Cuál debe ser el tamaño de una muestra para obtener un intervalo
de confianza del 95% para una proporción poblacional con un margen de error
máximo de 0.04?
Existen test de hipótesis paramétricos, en los que las hipótesis que consideramos
hacen referencia a parámetros de la población y test no paramétricos, donde la
hipótesis hace referencia a la distribución de determinada población. Presentamos
los test paramétricos.
CONCEPTOS PREVIOS
H
En ocasiones a a se le denomina hipótesis del investigador pues refleja la
aseveración que a éste le gustaría validar. La palabra nula significa de ningún valor,
H
efecto o consecuencia. Por tanto, 0 da una idea que debe estar asociada a la idea
de ningún cambio, ninguna mejoría o diferencia, etcétera con respecto a la opinión
actual.
H0
Por lo general, los contrastes de hipótesis no tiene un carácter imparcial frene a
Ha
y , en general no se trata de ver, a la luz de la muestra, cual de ambas hipótesis
H
es más verosímil, en realidad se favorece a 0 y se intenta descubrir si los datos
obtenidos por la muestra dan evidencias suficientes para rechazarla, en cuyo caso
se aceptaría la hipótesis alternativa.
H 0 : θ = θ0
H : θ = θ1 Θ = {θ 0 ,θ1}
Simple sería: a y en este caso .
H 0 : θ ≤ θ0
H : θ > θ 0 θ ,θ 0 ∈ Θ
Compuesta podría ser: a , .
Ambos tipos de hipótesis se pueden combinar en un mismo test, por ejemplo que la
hipótesis nula sea simple y la alternativa compuesta.
Ejemplo 1.
H 0 : θ = θ0
H a : θ ≠ θ0 ,
θ ,θ0 ∈ Θ = [− 3,9] .
de la forma
θ ≠ θ i ⇔ θ > θi ∨ θ < θi .
H 0 : θ ∈ Θ0
H a : θ ∈ Θ1
El siguiente cuadro muestra las diferentes situaciones que nos podemos encontrar a
la hora de realizar un test de hipótesis:
Lo que puede pasar
H0 H0
Cierta Falsa
Tabla 1
Los mejores tests son aquellos en los que la probabilidad de cometer alguno de
estos errores es mínima.
Tipos de test
H0 Ha
Sea X una población donde consideramos hipótesis nula y la hipótesis
x1 , x2, ..., xn
alternativa. Sea una muestra aleatoria simple. El resultado del test será
H0
aceptar o rechazar .
rechaza
H0
y si
(x , x
1 2, ..., xn )∈ C c
se acepta
H0
.
Estadística 1 229
1 si ( x1 , x2 ,..., xn ) ∈ C
ψ ( x1 , x2 ,..., xn ) = γ si ( x1 , x2 ,..., xn ) ∈ C '
0 si ( x1 , x2 ,..., xn ) ∈ ( C ∪ C ')
c
Observa que podríamos considerar los test no aleatorizados como casos particulares
de un test aleatorizado tomando la siguiente función crítica:
1 si ( x1 , x2 ,..., xn ) ∈ C
ψ ( x1 , x2 ,..., xn ) =
0 si ( x1 , x2 ,..., xn ) ∈ C
c
Estadístico de contraste
forma:
{
C = (x , x ..., x ) ∈ X n , T (x , x ..., x ) ≤ c ∈ R
1 2, n 1 2, n } o definida a partir de cualquier
otra condición del estadístico sobre la muestra.
Diseño de un test
3. Del resto de test nos quedaremos con aquel cuyo error de tipo II sea menor.
Observaciones:
El nivel de significación que tomemos marcará la imparcialidad del test con respecto
a la hipótesis nula. En general α toma valores bastante pequeños
( α = 0.001, 0.01, 0.05 ).
H0 Ha
Para contrastar la hipótesis frente a , se utiliza la función de potencia de
β (θ ) = P (θ ∈ C )
En los test no aleatorizados .
α ∈ [ 0,1]
Diremos que un test paramétrico tiene nivel de significación si
β (θ ) ≤ α ∀θ ∈ Θ0
.
Estadística 1 231
Observaciones:
β (θ ) = P (θ ∈ C ) = 1 − P (θ ∈ C c ) = 1 − P ( error de tipo II )
.
P ( error de tipo II ) = 1 − β (θ )
Por tanto, .
Por tanto, para elegir un test lo que se hace es tomar aquellos cuyo tamaño
sea igual a α (nivel de significación) y de éstos elegir el que tenga
uniformemente más potencia, es decir cuya función de potencia sea mayor en
los valores del parámetro de la hipótesis alternativa.
H0 H0
Cierta Falsa
Tabla 2
CONTRASTE DE HIPÓTESIS PARA LA MEDIA POBLACIONAL
conocida
σ X y verificándose las condiciones del teorema central del límite, era
( )
X ≡ N µ X , σ X n . Por tanto, si utilizamos la media muestral tipificada como
X − µX
Z= ≡ N (0,1)
estadístico, tendremos que: σ X n .
Cuando se desconoce
σ X , la media muestral con ciertos ajustes se distribuye según
X − µX
≡ tn −1
una T- de student con n − 1 grados de libertad: S/ n ; siendo
n
1
S2 = ∑ ( X i − X )2
n − 1 i =1 la varianza muestral, X la media muestral, n el tamaño de
la muestra y
µ X la media poblacional. En este caso ya estamos utilizando un el
X − µX
T= ≡ tn −1
estadístico tipificado S/ n .
H 0 : µ X = µ0 Ha
1. Plantear la hipótesis nula y la alternativa .
Estadística 1 233
H0
2. Cálculo del estadístico de contraste: Si es cierta; entonces,
σ
X ≡ N µ0 , X
X ≡ N ( µ0 , σ X ) n , es decir que tipificando
y por tanto
X − µ0
Z= ≡ N ( 0,1)
σX
obtendríamos que la media muestral tipificada n es el
estadístico de contraste. Su valor, sobre la muestra bajo la hipótesis nula, es
x − µ0
z=
σX
n ; donde hemos considerado a µ0 el valor de la media poblacional
1 n
x = ∑ xi
y n i =1 .
H a : µ X ≠ µ0 P P(Z ≤ − z ) + P(Z ≥ z )
Para , el valor de es o
2 P(Z ≥ z )
equivalentemente .
H a : µ X < µ0 z ≤ zα 2
, la región crítica está formada por los valores , donde
zα 2 < 0 P(Z ≤ zα 2 ) = α
es valor que satisface .
z ≥ zα 2
H a : µ X > µ0 , la región crítica está formada por los valores , donde
zα 2 > 0 P(Z ≥ zα 2 ) = α
es valor que satisface .
z ≤ − zα 2
H a : µ X ≠ µ0 , la región crítica está formada por los valores o
z ≥ zα 2 zα 2 > 0
, donde es valor que satisface
P(Z ≤ − zα 2 ) + P(Z ≥ zα 2 ) = α P (Z ≥ zα 2 ) = α 2
o equivalentemente .
C c = {( x1 , x2 ,..., xn ) , − zα / 2 ≤ z ≤ zα / 2 }
Para el contraste bilateral con nivel de significación α,
y siendo zα / 2 tal que:
α
P ( Z ≥ zα / 2 ) = P ( − zα / 2 ≤ z ≤ zα / 2 ) = 1 −
2
la región crítica es C y la de aceptación Cc
Región crítica
Figura 1
Estadística 1 235
s=
1
∑ (xi − x )2
n −1 . Hacemos el siguiente procedimiento:
H 0 : µ X = µ0 Ha
1. Plantear la hipótesis nula y la alternativa .
X ≡ N ( µ0 , σ X )
2. Cálculo del estadístico de contraste: Si de desviación típica
X − µ0
T= ≡ tn −1
H S/ n
desconocida y 0 es cierta; entonces, , es decir el
estimador del contraste bajo la hipótesis nula se distribuye como una t de
student con n − 1 grados de libertad. Su valor, sobre la muestra bajo la
x − µ0
t= ≡ tn −1
hipótesis nula, es s/ n ; donde hemos considerado a
µ0 el valor
de la media poblacional.
Para H a : µ X ≠ µ0
, el valor de P es
( ) (
P t ≤ − tˆ + P t ≥ tˆ ) o
equivalentemente
(
2 P t ≥ tˆ ).
4. Establecer una conclusión: Si el valor P ≤ α , entonces, tˆ y x son
H a : µ X < µ0 t ≤ tα 2
, la región crítica está formada por los valores , donde
tα 2 < 0 P (t ≤ tα 2 ) = α
es valor que satisface .
H a : µ X > µ0 t ≥ tα 2
, la región crítica está formada por los valores , donde
tα 2 > 0 P (t ≥ tα 2 ) = α
es valor que satisface .
H a : µ X ≠ µ0
, la región crítica está formada por los valores de tˆ , donde
tα 2 > 0 P(t ≤ −tα 2 ) + P(t ≥ tα 2 ) = α
es valor que satisface o
P(t ≥ tα 2 ) = α 2
equivalentemente .
C c = {( x1 , x2 ,..., xn ) , − tα / 2 ≤ t ≤ tα / 2 }
Para el contraste bilateral con nivel de significación α,
y siendo tα / 2 tal que:
α
P ( tn −1 ≥ tα / 2 ) = P ( −tα / 2 ≤ tn−1 ≤ tα / 2 ) = 1 − α
2
la región crítica es C y la de aceptación Cc
Región crítica
Figura 2
H 0 : p = p0 Ha
1. Plantear la hipótesis nula y la alternativa .
H0
2. Cálculo del estadístico de contraste: Si es cierta; entonces, el estadístico
Pˆ − p0
Z= ≡ N ( 0,1)
p0 (1 − p0 )
de contraste es la proporción muestral tipificada . n
Su valor, sobre la muestra bajo la hipótesis nula, es z, es decir
Pˆ − p0
pˆ =
p0 (1 − p0 )
n .
, el valor de P es P (Z ≤ z ) .
H a : p < p0
Para
H a : p ≠ p0 P P(Z ≤ − z ) + P(Z ≥ z )
Para , el valor de es o
2 P(Z ≥ z )
equivalentemente .
H a : µ X < µ0 z ≤ zα 2
, la región crítica está formada por los valores , donde
zα 2 < 0 P(Z ≤ zα 2 ) = α
es valor que satisface .
z ≥ zα 2
H a : µ X > µ0 , la región crítica está formada por los valores , donde
zα 2 > 0 P(Z ≥ zα 2 ) = α
es valor que satisface .
z ≤ − zα 2
H a : µ X ≠ µ0 , la región crítica está formada por los valores o
z ≥ zα 2 zα 2 > 0
, donde es valor que satisface
P(Z ≤ − zα 2 ) + P(Z ≥ zα 2 ) = α P (Z ≥ zα 2 ) = α 2
o equivalentemente .
nivel α , y no rechazamos 0 .
H
Sea X una población que se distribuye como una normal de media y varianza
x1 , x2 ,...xn
desconocida y sea una muestra aleatoria simple sobre la población.
∑(X i − X )2
S2 = i =1
s2 =
1
∑ (xi − x )2
n −1 . Hacemos el siguiente procedimiento:
H 0 : σ X2 = σ 02 Ha
1. Plantear la hipótesis nula y la alternativa .
H0
2. Cálculo del estadístico de contraste: Si es cierta; entonces, el estadístico
( n − 1) S 2 ≡ χ 2
n −1
de contraste es 0 σ 2
, el cual es una v.a chi cuadrado con n − 1
grados de libertad. Su valor, sobre la muestra bajo la hipótesis nula, es
χˆ n2−1 =
(n − 1)s 2
σ 02 .
(
2 P χ n2−1 ≤ χˆ n2−1 , s 2 < σ 02 )
Para
H a : σ X2 ≠ σ 02
, el valor de P
es
(
2 P χ n2−1 ≥ χˆ n2−1 , s 2 > σ 02
.
)
Estadística 1 241
χˆ 2
4. Establecer una conclusión: Si el valor P ≤ α , entonces, n −1 y s son
2
α , y no rechazamos
H0
.
desconocida)
y α para:
Ha
correspondiente a
χˆ 2 ≤ χ1−α 2
H a : σ X < σ 0 , la región crítica está formada por los valores n −1
2 2
,
χ1−α 2 < 0 P(χ n −1 ≤ χˆ n −1 ) = α
2 2
donde es valor que satisface .
χˆ 2 ≤ χ1−α 2
H a : σ X ≠ σ 0 , la región crítica está formada por los valores n −1
2 2
o
χˆ n −1 ≥ χα 2
2
χ
, donde 1−α 2
>0
es valor que satisface
P χ n −1 ≤ χ1−α = α 2
2
y
( )
χα 2 > 0 P (χ n2−1 ≤ χˆ n2−1 ) = α 2
es valor que satisface .
H0
y no rechazamos .
EJERCICIOS PROPUESTOS
Ejercicio 3. La vida útil de una pila de 1,5 voltios es una variable aleatoria
normalmente distribuida con media 40 horas y desviación típica 4 horas. Se
introduce un nuevo compuesto químico para que la producción de pilas sea más
eficaz. La empresa quiere saber si la vida útil de las pilas se verá afectada por este
cambio. Para ello se asume que la desviación típica se mantiene en 4 horas y se
toma una muestra de 100 pilas para realizar el contraste, obteniéndose una vida útil
media de 39.1 horas.
d. ¿Se puede decir que la vida media de las pilas no ha cambiado con
un grado de confianza del 95%? ¿Y del 99%?
pertenece al intervalo
[39.5, 40,5] ?
Estadística 1 243
Ejercicio 6. Una noticia del periódico afirma que en ninguna facultad el número de
los alumnos becados es mayor o igual al 50%. En la facultad de bellas artes afirman
que en su facultad el número de alumnos becados si es mayor o igual al de la
mitad. Para refutar la afirmación de la universidad se toma una muestra aleatoria de
25 alumnos y se comprueba que 17 de ellos están becados.
Ejercicio 8. Las regulaciones del mercado de agua mineral exigen que cierta
botella contenga, en promedio, 333 mililitros con una desviación típica menor de 3
ml. Se toma una muestra de 50 botellas de cierta marca de agua, recogiéndose los
resultados de la capacidad obteniéndose una media de 333.682 ml y una desviación
típica de 3.069 ml. Realiza los contrastes que consideres oportuno sobre la siguiente
muestra para verificar que se cumplen las especificaciones propuestas por el
mercado.
Estadística 1 245
Permiten con la
Intervalos de confianza sacar
¿Cómo?
Estableciendo los
mediante
X
Fundamentos de la Inferencia Reglas Pˆ
Sˆ
la aplicación de
Población 1
Permiten con la
Intervalos de confianza sacar
y
Muestras y
Inferencia por conclusiones
Población 2
¿Cómo?
Reglas
Estableciendo los mediante
X −Y
ˆ
PX − PˆY
Fundamentos de la Inferencia Sˆ 2 − Sˆ 2
X Y
la aplicación de
Como observamos del esquema, las reglas, se expresan mediante las diferencias de
los datos muestrales.
σ X2 σ Y2
E = z* +
5. Calcular: m n
Nota: Observe las analogías y diferencias que hay con la estimación por IC de una
población.
Cuando se desconocen
σ X y σ Y , podemos asumir dos situaciones: las desviaciones
típicas
1. son iguales
Sp =
(m − 1)S X2 + (n − 1)SY2
Primera situación: el estadístico m+n−2 , donde
S X2 =
1
∑ (X i − X )2 SY2 = 1 ∑ (Yi − Y )2
m −1 y n −1 , se llama estimador conjunto de la
desviación típica común de X e Y . Si X e Y tienen v.a normales e
X − Y − (µ X − µY )
t=
1 1
Sp +
independientes, se puede demostrar que la v.a m n tiene una
distribución t con m + n − 2 grados de libertad.
t * = tα 2
4. Hallar el valor crítico de t , , de la v.a t con m + n − 2 grados de
(
libertad que satisfaga P − t ≤ t ≤ t = γ
* *
)
1 1
E = t *s p +
5. Calcular m n
6. Determinar el IC para µ X − µY : [x − y − E , x − y + E ]
H 0 : µ X = µ0 Ha
5. Plantear la hipótesis nula y la alternativa .
H0
6. Cálculo del estadístico de contraste: Si es cierta; el estadístico de
X −Y
Z=
σ X2 σ Y2
+
contraste m n es aproximadamente la v.a normal tipificada cuyo
x−y
z=
σ X2 σ Y2
+
valor de contraste es m n .
P(Z ≤ − z ) + P(Z ≥ z )
H a : µ X − µY ≠ 0 ⇔ H a : µ X ≠ µY , el valor de P es
2 P(Z ≥ z )
o equivalentemente .
z ≤ zα 2
H a : µ X < µY , la región crítica está formada por los valores , donde
zα 2 < 0 P(Z ≤ zα 2 ) = α
es valor que satisface .
z ≥ zα 2
H a : µ X > µY , la región crítica está formada por los valores , donde
zα 2 > 0 P(Z ≥ zα 2 ) = α
es valor que satisface .
z ≤ − zα 2
H a : µ X ≠ µY , la región crítica está formada por los valores o
z ≥ zα 2 zα 2 > 0
, donde es valor que satisface
P(Z ≤ − zα 2 ) + P(Z ≥ zα 2 ) = α P (Z ≥ zα 2 ) = α 2
o equivalentemente .
x=
1
∑
1
xi y = ∑ yi s X2 =
1
∑ (xi − x )2 sY2 = 1 ∑ ( yi − y )2
muestra: m , n , m −1 , n −1 y
sp =
(m − 1)s X2 + (n − 1)sY2
m+n−2 . Hacemos el siguiente procedimiento:
H 0 : µ X = µY Ha
5. Plantear la hipótesis nula y la alternativa .
H0
6. Cálculo del estadístico de contraste: Si es cierta; entonces, el estadístico
X −Y
t=
1 1
Sp +
de contraste m n , es aproximadamente la v.a. t con m + n − 2
x−y
tˆ =
1 1
sp +
grados de libertad cuyo valor del contraste es m n .
H a : µ X ≠ µY , el valor de P es
(
P t ≤ − tˆ + P t ≥ tˆ ) ( ) o equivalentemente
(
2 P t ≥ tˆ ).
8. Establecer una conclusión: Si el valor P ≤ α , entonces, tˆ y x − y son
t ≤ tα 2
H a : µ X < µY , la región crítica está formada por los valores , donde
tα 2 < 0 P (t ≤ tα 2 ) = α
es valor que satisface .
t ≥ tα 2
H a : µ X > µY , la región crítica está formada por los valores , donde
tα 2 > 0 P (t ≥ tα 2 ) = α
es valor que satisface .
ni
experimentos. El conjunto de todas las posibles proporciones de éxitos en las (en
pi (1 − pi ) ni µ ˆ ˆ = p1 − p2
. Así, la media de P1 − P2 es P1 − P2
ˆ ˆ
y teniendo en cuenta la
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
σ2 = +
independencia, la varianza de P1 − P2 es
ˆ ˆ Pˆ1 − Pˆ2
n1 n2 p̂
. Los i son
P̂
los valores muestrales de los i que se obtienen muestras aleatorias grandes e
independientes de las poblacionales binomiales.
H : p − p =0
En los contrastes de hipótesis, a diferencia de los IC, donde 0 1 2 , se
combinan datos muestrales con el fin de obtener una proporción muestral conjunta
p̂ , que en términos de valores muestrales p̂i , se puede calcular como una media,
n pˆ + n pˆ
pˆ = 1 1 2 2
n
ponderada según los valores i :
n1 + n2 .
z = z*
1. Hallar el valor crítico Z : se halla α 2 de la v.a normal tipificada Z en
γ
P(0 ≤ Z ≤ z * ) =
(
la que P − z ≤ Z ≤ z = γ ⇔
* *
) 2
pˆ1 (1 − pˆ1 ) pˆ 2 (1 − pˆ 2 )
E = z* +
n1 n2
2. Calcular:
H 0 : p1 − p2 = 0 Ha
1. Plantear la hipótesis nula y la alternativa .
H0
2. Cálculo del estadístico de contraste: Si es cierta; entonces, el estadístico
Pˆ1 − Pˆ2
Z=
1 1
pˆ (1 − pˆ ) +
de contraste n1 n2 , es aproximadamente la v.a.
pˆ1 − pˆ 2
z=
1 1
pˆ (1 − pˆ ) +
tipificada. El valor del contraste es n1 n2 .
P(Z ≤ − z ) + P(Z ≥ z )
H a : p1 ≠ p2 , el valor de P es o equivalentemente
2 P(Z ≥ z )
.
Estadística 1 255
nivelα H0
, y no rechazamos .
y α
Ha
programa informático hallamos la región crítica correspondiente a
para:
z ≤ zα 2 = z *
H a : p1 < p2 , la región crítica está formada por los valores ,
zα 2 < 0 P(Z ≤ zα 2 ) = α
donde es valor que satisface .
H a : p1 > p2 z ≥ zα 2
, la región crítica está formada por los valores , donde
zα 2 > 0 P(Z ≥ zα 2 ) = α
es valor que satisface .
z ≤ − zα 2
H a : p1 ≠ p2 , la región crítica está formada por los valores o
z ≥ zα 2 zα 2 > 0
, donde es valor que satisface
P(Z ≤ − zα 2 ) + P(Z ≥ zα 2 ) = α P (Z ≥ zα 2 ) = α 2
o equivalentemente .
De la misma manera que hemos hecho en los casos anteriores, podemos definir la
complicada que nos puede dar información acerca de dos poblaciones cuando
interese el trabajo con la v.a de la varianza.
y=
1
∑ yi s X2 =
1
∑ (xi − x )2 sY2 =
1
∑ ( yi − y )
2
n , m − 1 , y n − 1 . Entonces, se pueden
aplicar los siguientes pasos:
* *
1. Hallar los valores críticos de F : Hallar los valores de F1 y F2 que cumplan
1+ γ 1+ γ
[ ]
P F (m − 1, n − 1) ≤ F1* =
2 y
[ ]
P F (n − 1, m − 1) ≤ F2* =
2
1 s X2 1 s X2
F * × s2 , F * × s2
2. Determinar el IC 1 Y 2 Y
.
desconocidas)
y=
1
∑ yi s X2 =
1
∑ (xi − x )2 sY2 =
1
∑ ( yi − y )2
n , m −1 , y n −1 . Entonces, se pueden
aplicar los siguientes pasos:
Estadística 1 257
H0 : σ X = σY Ha
1. Plantear la hipótesis nula y la alternativa .
H0
2. Cálculo del estadístico de contraste: Si es cierta; el estadístico de
2
S X
s X2
s2
contraste es Y .
σ X2 s X2
< P F (m − 1, n − 1) ≤
sY2
Ha : 1
σ Y2 ⇔ H a : σ X < σ Y , el valor de P es
2 2
.
σ X2 s X2
Ha : 2 > 1 P F (m − 1, n − 1) ≥ 2
σ ⇔ H a : σ X2 > σ Y2 sY
Y , el valor de P es .
σ X2
Ha : ≠1
σ Y2 ⇔ Ha :σ X ≠ σY ,
2 2
el valor es
s X2 s X2
2 P F (m − 1, n − 1) ≤ , si <1
sY2 sY2
2 P F (m − 1, n − 1) ≥ s X2
, si
s X2
>1
sY2 sY2
.
µY desconocidas)
y α
Ha
programa informático hallamos la región crítica correspondiente a
para:
H a : σ X2 < σ Y2
, la región crítica está formada por todos los valores muestrales
2
sY
2
≥ F*
sX , donde F* es el valor de F que cumple
[
P F (n − 1, m − 1) ≤ F = 1 − α .
*
]
H a : σ X < σ Y , la región crítica está formada por todos los valores muestrales
2 2
sY2
2
≥ F*
sX , donde F* es el valor de F que cumple
[
P F (n − 1, m − 1) ≤ F = 1 − α .
*
]
H a : σ X2 < σ Y2
, la región crítica está formada por todos los valores muestrales
2
sY
2
≥ F*
sX , donde F* es el valor de F que cumple
[
P F (n − 1, m − 1) ≤ F = 1 − α .
*
]
4. Establecer una conclusión: Si el valor de la muestra z del estadístico de
contraste, está en la región crítica, entonces z y pˆ1 − pˆ 2 son
Bibliografía
Estudiar la teoría del capítulo 10 del texto citado. Observará la similitud y diferencias
que tiene la inferencia de dos poblaciones con el caso de una población. Las reglas
que se utilizan lo evidencian.
Los esquemas que se presentan arriba tienen la función de orientarlo a que se está
haciendo lo mismo. Desde luego, se deben observar matices.
Estadística 1 259
Además del uso de este tipo de test con el estadístico χ , el mismo se puede
2
emplear en contraste de
ai (i = 1,2,..., k )
Teorema 1. Sean los resultados posibles de un experimento con
pi
sus respectivas probabilidades y para cada realización de n pruebas
npi ai
independientes de un experimento, es el número esperado de que salga ,
k
∑f i =n
np ≥ 5
donde i =1 . Entonces, para grandes valores de n ( i ), la v.a
χ =∑
2
k
( fi − npi )2
i =1 npi
p
Se debe tener en cuenta que al aplicar el teorema 1, las i son desconocidas pero
podemos hacer conjeturas de sus valores con un modelo de probabilidad. La
hipótesis nula es
iguales a los valores esperados supuestos. Por tanto, cuanto más pequeño sea χ̂ ,
2
hay más aceptación de la hipótesis nula; en caso contrario, menos aceptación tiene
la hipótesis nula.
ai ∑f
i =1
i =n
frecuencias de los resultados , / .
( )
El valor de P del contraste es P χ ≥ χ̂ , si la hipótesis nula fuera cierta.
2 2
EQUIVALENTEMENTE
satisfacen P χ ≥ χ = α
2 *
( )
H 0 se rechaza si χ̂ está en la región crítica; en caso contrario, se acepta.
2
H a : P(ai ) ≠ pi
Nota: es multidireccional en términos de las k probabilidades
P(ai ) Ha ⇔
. No obstante, el contraste es unilateral en la v.a chi cuadrado ( a la
hipótesis
χ ≥ χ = χ crítico )
2 *
Cara 1 2 3 4 5 6
fj 20 22 17 18 19 24
Frecuencia ( )
Solución.
H
Se asume que el dado no está trucado ( 0 ). Asumimos un contraste chi cuadrado
de bondad de ajuste al nivel de significación.
1 1
pi = npi = 120 × = 20 ≥ 5
Si el dado no está trucado, 6 . El número esperado es 6
(muestra grande). El valor del contraste es
χ =∑
2
6
( f i − npi )2 = (20 − 20)2 + (22 − 20)2 + (17 − 20 )2 + (18 − 20)2 + (19 − 20)2 + (24 − 20)2 = 1,7
i =1 npi 20 20 20 20 20 20
Con una tabla, para 5 grados de libertad, encontramos que el valor crítico es
χ 02, 05 = 11,070 H0
. Como 1,7<11,070; entonces, no se rechaza . Hay suficiente
evidencia de que el dado no está trucado.
Límite de clases fi
1.45 - 1.95 2
1.95 - 2.45
17
2.45 - 2.95 4
2.95-3.45 15
3.45-3.95 10
3.95 - 4.45 5
8
4.45 - 4.95 3
Estadística 1 263
H
Si tomamos como 0 : que la distribución de la duración es normal, entonces las
probabilidades las determinamos tipificando la v.a y los valores límites de clase. Por
ejemplo, elegimos los límites de la quinta clase:
donde
P( z1 < Z < z2 ) = P(− 0.07 < Z ) + P(Z < 0,64) = 0,0279 + 0,2389 = 0,2668
¿Cómo usted calcula los otros valores de frecuencias esperadas? Compruebe que
estos valores son los que se muestran en la tabla siguiente:
2.95-3.45 15 10,3
3.45-3.95 10 10,7
χ =∑
2
4 (f i − f i −esp )
2
=
(7 − 8,5)2 + (15 − 10,3)2 + (10 − 10,7 )2 + (8 − 10,5)2 = 3,05
i =1 f i−esp 8,5 10,3 10,7 10,5
χ 02, 05 = 7,815
Para 3 grados de libertad, el valor crítico es , el cual es mayor que el
Tabla de contingencia 2 × 3
Nivel de rendimiento
Frecuencia marginal
Cambio de tecnología Alto Medio Bajo
Total
Frecuencia marginal
H :
Solución. Sea 0 independencia entre la opinión de un técnico con respecto a la
tecnología implementada y el nivel de rendimiento de los dispositivos.
Seleccionemos un nivel de significación α = 0,05 .
H
La aceptación o no de 0 depende del buen ajuste entre los valores de frecuencias
observados y esperados.
a la implementación de la tecnología
H0
Si es verdadera y las dos variables son independientes, se debe tener:
P( A ∩ P ) = P( A)P(P ) =
310 597
1000 1000 ,
P( A ∩ D ) = P( A)P(P ) =
310 403
1000 1000 ,
f esp =
(total de la columna ) × (total de la fila )
gran total
Nivel de rendimiento
f (f ) esp f (f )
esp f (f ) esp
χ =∑
2
(f i − f i −esp )
2
H0 i f i−esp
La prueba de independencia la hacemos con . La suma se
χ2 =
(210 − 185,1)2 + (217 − 215,0)2 + (170 − 197,0 )2 + (100 − 125,0)2
185,1 215,0 197,0 125,0
+
(143 − 145,1) (160 − 133,0 )
2
+
2
≈ 17,6
145,1 133,0
Con una tabla, teniendo en cuenta que hay 2 grados de libertad, encontramos que
χ 02, 05 = 5,991 χ2 > χ2
0 , 05 H
. Como , se rechaza 0 . Entonces, se concluye que la
esta última porque el número de grados de libertad es mayor que 1. En una tabla
de contingencia de 2 × 2 se aplica la corrección de Yates para continuidad:
χ2 = ∑
(f − f
i i −esp − 0,5 )
2
i f i−esp
.
Son grandes, los resultados corregidos y sin corregir son los mismos.
Están entre 5 y 10 se debe usar la corrección de Yates.
Hemos usado la v.a chi cuadrado para contrastar si los datos de un experimento
estaban de acuerdo con una hipotética distribución de probabilidad. Además, es
posible usarla también para contrastar si dos o más v.a independientes
multinomiales con los mismos resultados tienen las mismas distribuciones de
probabilidad.
Ejemplo 4.
Categoría
Mujeres 28 50 77 35 20 210
Estadística 1 269
Utilice la v.a chi cuadrado, al nivel de significación del 0,05, para contrastar que la
distribución de las categorías es la misma.
Solución.
Con las frecuencias conjuntas de los m = 250 hombres y n = 210 mujeres en cada
categoría, se obtienen las estimaciones de las probabilidades:
p̂P =
ANÁLISIS DE VARIANZAS
X = factor ± error
Éste análisis se centra en la comparación de más de dos medias poblacionales o
tratamiento.
µ
Consideremos a I el número de poblaciones o tratamientos que se comparan y i
la media de la población i o la respuesta promedio real cuando se aplica el
tratamiento i ; donde i = 1, 2, ..., I .
H 0 = µ1 = µ 2 = ⋅ ⋅ ⋅ = µ I
Ha :
Por lo menos dos
µi son diferentes
Ejemplo 1.
Solución.