Beruflich Dokumente
Kultur Dokumente
2. SEMESTRE INGENIERIAS
DEPARTAMENTO DE FISICO-MATEMATICAS
UIA
Contenido
Contenido............................................................................................................ 2
INTRODUCCION
Este cuaderno tiene como finalidad proporcionar un espacio para conocer el examen departamental y lo que se espera que resuelva. Encontrar ejemplos resueltos de los problemas del tipo de los que aparecen en el examen departamental. Los ejercicios se basan en la tabla de especificaciones o matriz de conducta y contenido, elaborada para el diseo del examen. Los problemas evalan una parte esencial de los conceptos y tcnicas bsicas de la estadstica y de ninguna manera evalan todo el curso.
El trabajo en la resolucin de los ejercicios lo familiarizar con los temas que se evalan en el examen departamental y con el grado de dificultad que debe dominar. El trabajo continuo le permitir ganar confianza hasta que la naturaleza y lenguaje de las preguntas se le haga familiar. Podr darse cuenta en qu puntos o reas se encuentra ms dbil y en cuales ms fuerte para as enfocar sus esfuerzos en los puntos ms dbiles, ahorrndole tiempo en la preparacin de su examen. Recuerde que si algo no se vio en el curso no es pretexto para no resolverlo ya que cuenta con sta gua y con las asesoras que se imparten en el Departamento de Fsico Matemticas. Durante el curso de Probabilidad y Estadstica tendr la oportunidad de conocer conceptos y tcnicas de la estadstica y de la probabilidad para llevar un control de procedimientos y/o procesos. En el examen departamental, se evala en forma general:
1. Estadstica Descriptiva. Debe manejar los conceptos de: medidas de
tendencia central (media, mediana, moda), de dispersin (varianza, desviacin estndar y rango), frecuencia relativa y frecuencia relativa acumulada. Debe de identificar un histograma y sus caractersticas.
2. Debe conocer tcnicas de conteo y estar capacitado para encontrar
probabilidades de variables aleatorias discretas como la Binomial, Poisson e Hipergeomtrica y de variables aleatorias continuas como la normal, t de Student y ji - cuadrado (uso de tablas). Debe manejar las reglas de suma y producto para probabilidades y la probabilidad condicional,
3. Estadstica Inferencial. Debe manejar los conceptos de: distribucin
muestral, valor esperado, intervalo de confianza y prueba de hiptesis y tomar decisiones con stas tcnicas en diferentes casos.
de correlacin y de determinacin.
5. Debe distinguir las pruebas en casos de Estadstica No Paramtrica.
El xito en el examen depender de: Su competencia en la materia Entendimiento de la naturaleza del examen y de las condiciones en que lo presentar Actitud emocional o grado de confianza
RECOMENDACIONES
Lea con cuidado cada problema para que lo ubique en el tema que le corresponde e identifique la pregunta que hace el problema.
Vuelva leer el problema para identificar las cantidades y relacionarlas con las ecuaciones pertinentes para resolverlo.
para aclarar el
Aprenda a leer el formulario y el significado de las letras que aparecen en las frmulas.
4
Resuelva, primero, los problemas que crea le son ms fciles. Relacione correctamente los datos y las incgnitas con las letras que aparecen en las ecuaciones. Verifique sus clculos.
Resuelva el examen de prctica del cuaderno. Trate de resolver sus asuntos pendientes antes de entrar al examen y hacer todas las llamadas por telfono que tenga que hacer.
No coma mucho antes del examen y acuda al bao si es necesario. Lleve consigo lpiz y calculadora (No graficadora o programable). Al estudiar en el cuaderno, recuerde que si algo no le queda claro: o Consulte las referencias o Consulte a su profesor o
o
EJEMPLOS RESUELTOS
Estadstica descriptiva
Frecuencia Relativa y Relativa Acumulada Los datos o mediciones en un experimento: primero se organizan de tal manera que podamos observar la frecuencia con que se repite cada uno de los posibles resultados del experimento; segundo, observamos si tienden a agruparse
alrededor de algn valor y tercero, que tanto se dispersan alrededor del valor central La frecuencia absoluta o frecuencia es simplemente el nmero de veces que se repite el valor de cada dato. Si dividimos el nmero de veces que se repite el valor de un dato entre el nmero total de datos se tiene la frecuencia relativa, (relativa al total de datos). La frecuencia relativa siempre ser un nmero entre cero y uno y se relaciona con el concepto de probabilidad. Distinguimos dos casos para representar la frecuencia: valores discretos o datos enteros y valores o datos continuos. En cualquier caso el concepto de frecuencia absoluta y relativa es el mismo.
Valores discretos. En la siguiente tabla se muestran los resultados de un estudio de calidad de un servicio:
Frecuencia Absoluta Muy Bueno Bueno Regular Malo Muy Malo TOTAL 24 38 16 9 5 92
Porcentaje
Observe que la frecuencia relativa se obtiene dividiendo el valor de la frecuencia absoluta para cada categora entre el total de mediciones, en este caso entre 92. El porcentaje es, simplemente, la frecuencia relativa multiplicada por 100 La frecuencia relativa acumulada se refiere a la suma de frecuencias relativas en diferentes intervalos de los resultados posibles. En general se habla de al menos (cota inferior), cuando mucho (cota superior) o entre, suma de frecuencias entre dos valores.
frecuencias relativas de muy malo, malo y regular, 0.1739 + 0.0978 + 0.0543 = 0.3261.
Valores continuos La tabla representa la variacin en la temperatura de un horno industrial Temperatura en un horno (C) 500 525 525.5 - 550 550.5 - 575 575.5 - 600 600.5 - 625 0.08 0.14 0.32 0.26 0.2
7
Frecuencia relativa
Observe que la tabla reporta la frecuencia relativa y al menos es el lmite inferior, por lo que se deben sumar las frecuencias relativas del cuarto y quinto intervalo. 0.26 + 0.2 = 0.28. Como se pide porcentaje, multiplicamos por 100 y la respuesta es 28 %
d) La frecuencia relativa acumulada de cuando mucho 550C, es:
Cuando mucho, es cota superior por lo que se suman las frecuencias relativas del primero y segundo intervalo 0.08 + 0.14 = 0.22 Medidas de tendencia central Las medidas de tendencia central son: Moda, valor de los datos que se repite ms veces, puede haber ms de uno o ninguno;
Mediana, valor de los datos que se encuentra a la mitad una vez que se han ordenado los datos o el promedio de los dos valores que se encuentran a la mitad;
x .
n
Donde
Sean los siguientes datos: 22, 21, 26, 24, 22, 25, 26, 23, 27, 29. Determine la moda, mediana y media. a) Tiene dos modas, el nmero 22 y el 26
b) Mediana. Ordenamos los datos: 21, 22, 22, 23, 24, 25, 26, 26, 27, 29.
Los valores de los datos que se encuentran a la mitad son el 24 y el 25, la mediana es (24 + 25)/2 = 24.5 c) La media o promedio es:
x=
x
i =1
10
10
21 + 22 + 22 + 23 + 24 + 25 + 26 + 26 + 27 + 29 223 = = 22.3 10 10
Varianza, promedio de las desviaciones respecto del valor central; Desviacin estndar, raz cuadrada de la varianza, tiene la ventaja de tener las mismas unidades de la variable;
( x x )
n 1
Ejemplo 3 (Tema 3.2): Determine la varianza, la desviacin estndar y el rango para los datos anteriores.
9
a) Varianza:
s2 =
( x x )
n 1
s2 =
b) Desviacin estndar:
s=
s 2 = 11 .87 = 3.45
c) Rango, diferencia entre los valores extremos. El rango para los datos anteriores es: 29 21 = 8 Nota. Se recomienda aprender a usar su calculadora en el clculo del promedio y de la varianza o desviacin estndar. En particular el clculo de la varianza (o de la desviacin estndar) puede ser bastante laborioso y consumirle un tiempo valioso para resolver el examen.
Ejemplo 4 (Tema 4.3): En un lugar se encuentran 30 personas 18 mujeres y 12 hombres. 2 mujeres son mayores de 40 aos y 3 hombres son mayores de 40 aos. Si se escoge una
10
persona al azar, la probabilidad de que sea hombre o que sea mayor de 40 aos es: Sean las probabilidades de los eventos hombre (H), mayor de 40 (G) y de ambos (H y G): P(H) = 12/30 = 0.4; P(G) = 5/30 = 0.1667; P(H y G) = 3/30 = 0.1
Probabilidad Condicional Para resolver un problema de este tipo: Primero traduzca la pregunta a la frmula de probabilidad condicional La probabilidad condicional es: P( A / B ) =
P( A B) P ( B)
Se lee como la probabilidad de A dado que ocurri B. Segundo, a partir de la tabla de datos, calcule solo las probabilidades de inters, esto es, la probabilidad de la interseccin y la probabilidad del evento B
En una agencia de autos, las ventas de un mes, reportaron los siguientes datos.
11
Blancos 8 18
Encuentre las siguientes probabilidades. a) Comprar un auto mediano y blanco b) Dado que se compr un auto blanco que sea grande c) Dado que el auto es mediano que sea Rojo Para encontrar las tres probabilidades que se piden, conviene hacer una tabla de probabilidades.
Nota. En el examen, no tiene que hacer toda la tabla, slo tiene que calcular las probabilidades que se requieran Rojos Medianos Grandes Total 14 10 24 Blancos 8 18 26 Total 22 28 50
Dividimos cada celda entre el total y se obtiene la probabilidad correspondiente a cada evento.
Total
0.48
0.52
El cruce de cada fila y columna nos da la probabilidad de que ocurra uno y otro evento. Por ejemplo, la probabilidad de que sean medianos y rojos
P ( M y R ) = P ( M R ) = 0.28
es:
Al final de cada columna se tienen las probabilidades de que sean rojos o que sean blancos. Por ejemplo, probabilidad de que sean blancos = P ( B ) = 0.52 Al final de cada fila se tienen las probabilidades de que sean medianos o grandes. Por ejemplo, probabilidad de grandes, P (G ) = 0.56 Con estos resultados se puede calcular probabilidad condicional. Se debe de hacer la traduccin del lenguaje oral al de probabilidades, esto es, escribir la probabilidad condicional en forma de ecuacin:
a) P ( M B ) = 0.16
b) P (G / B) =
c) P( R / M ) =
Nota. Si la pregunta fuera la 3, solo hace falta calcular la probabilidad de la interseccin y la del evento que ocurri primero, no hace falta hacer toda la tabla
Teorema de Bayes.
P(H/A) P(A) P(B) 13 P(H/B)
P ( A H ) P ( B H )
P(C)
P(H/C)
P (C H )
En el diagrama se tienen las probabilidades de 3 resultados posibles en un primer evento y despus las probabilidades de otro evento dado que ya ocurri el primero. Al final se reportan las probabilidades de que ocurran uno y otro evento. El teorema de Bayes permite calcular la probabilidad siguiendo el proceso inverso. Si ya ocurri el evento H cul es la probabilidad de que venga de A, B o C? Ejemplo 6 (Tema 4.5): Sean A, B y C enfermedades y H un sntoma que aparece con cualquiera de las 3 enfermedades. Las enfermedades son excluyentes y un estudio indica: P(A) = 0.02, P(B) = 0.01, P(C) = 0.005 y P(H/A) = 0.75, P(H/B) = 0.8 y P(H/C) = 0.95. Dado que ocurri el sntoma H, la probabilidad de que provenga de la enfermedad B es: El teorema de Bayes nos dice que dicha probabilidad se obtiene dividiendo la probabilidad de B y H entre las suma de las probabilidades de las intersecciones. Esto es:
P( B / H ) = P( B H ) .008 = P ( A H ) + P ( B H ) + P (C H ) 0.015 + 0.008 + 0.00475
Observe que las intersecciones corresponden a las ramas finales del rbol y que cada interseccin es el producto de las probabilidades de las ramas anteriores, de la forma:
P ( A H ) = P ( A) P( H / A)
14
Si se hubiera pedido la probabilidad de que dado H viniera de C, cambiamos el numerador por la probabilidad de C y H
P (C / H ) = P (C H ) P ( A H ) + P ( B H ) + P (C H )
Variables Aleatorias Discretas. Son aquellas variables que en un experimento solo pueden tener resultados con nmeros enteros. Por ejemplo, la respuesta es xito o fracaso (binomial) o la respuesta es el nmero de veces (frecuencia) que ocurre un evento en un intervalo de tiempo o espacio (Poisson). En los casos de variables aleatorias discretas se puede encontrar una frmula que permite calcular la probabilidad de que ocurra exactamente un valor posible de las respuestas. Ejemplos: Experimento de tipo Binomial. Las respuestas posibles son: si o no, xito o fracaso, etc. Slo hay dos respuestas posibles. En este caso, la probabilidad de que la variable tome exactamente el valor x cuando hay n ensayos est dada por la frmula
P ( X = x) =n C x p x (1 p ) n x
Recuerde que debe distinguir en los casos de probabilidad acumulada cuando se dice al menos o cuando se dice cuando mucho. En el primer caso, al menos es el lmite inferior y el segundo, cuando mucho, es lmite superior.
b) Encuentre la probabilidad de que cuando mucho 2 tengan gripe. Se
P(X = 0) =
20
C 0 p 0 (1 p ) 20 0 = 0.00079
c) La probabilidad de que un equipo funcione es de 0.9. Si se prueban 16 equipos, la probabilidad de que al menos14 funcionen es: El equipo funciona o no funciona, esto indica un experimento de tipo binomial. Al menos 14 significa que deben funcionar, 14, 15 y 16, por lo que la probabilidad es:
P ( X 14 ) = P ( X =14 ) + P ( X =15 ) + P ( X =16 )
P(X = 14) =
16
Experimento Poisson. Se tiene un parmetro que es el valor esperado de ocurrencias en el intervalo de tiempo o espacio. La probabilidad de que ocurran
16
x e x!
=
2 =
Ejemplo 8 (Tema 5.10): Encuentre la probabilidad de que se atiendan a 12 personas en una hora si el valor esperado es de 10 personas atendidas por hora.
P ( X = 12 ) = 10 12 e 10 = 0.09478 12!
Se debe tener cuidado de manejar el valor esperado en las unidades adecuadas. Nota. Se puede dar el valor esperado de 10 atenciones por hora pero, pedir la probabilidad de atenciones en ocho horas, en este caso el valor esperado de atenciones en ocho horas es de = (10)(8) = 80 atenciones en la ocho horas. Si se pide la probabilidad de 70 atenciones en las ocho horas se calcula as:
P ( X = 70 ) = 80 70 e 80 = 0.02479. 70!
Otro caso de variable discreta, en donde se aplican las tcnicas de conteo. Se tiene un total de N objetos con diferentes caractersticas, n1, n2, n3. Se toma una muestra de tamao n y se pide la probabilidad de ocurrencia de alguno de los posibles resultados del evento. Dado que la probabilidad es el nmero de formas en que puede ocurrir el evento entre el total de casos posibles se usa la combinatoria y la regla del producto para encontrar dichas cantidades
17
Ejemplo 9 (Tema 4.4): Se tienen 20 resistencias de 100 ohms, 15 resistencias de 200 ohms y 10 resistencias de 300 ohms. Si se toman aleatoriamente 6 resistencias, determine las siguientes probabilidades, escoger: a) Dos de cada de cada tipo b) 3 de 100 ohms , dos de 200 y una de 300 c) Las 6 de 200 ohms. d) Las 6 de un mismo tipo La probabilidad es el nmero de casos favorables entre el total de casos posibles. Se tienen 45 resistencias en total. El nmero total de formas que se pueden escoger 6 objetos de 45, sin importar el orden, es:
45 C6 =
hay, de las resistencias de 200 ohms se pueden tomar dos de las 15 y de las de 300 se pueden tomar dos de las 10. Ahora, como se toman dos de un tipo, dos del otro y dos del tercer tipo, el nmero de formas que podemos hacer esto es:
20 15 10 C 2 C 2 C 2 = 190 105 45 = 897750
resistencias de las 15 que hay de 200 ohms y una de las 10 que hay de 300 ohms.
20 15 10 C3 C 2 C1 = 1140 105 10 = 1197000
18
La probabilidad es: 38760/8145060 = 0.00476 d) Se pueden tomar 6 de las 20 de 100 ohms o 6 de las 15 de 200 ohms o 6 de las 10 de 300 ohms.
15 10 C620 + C6 + C6 = 38760 + 5005 + 210 = 43975
Observe que en el clculo de resultados posibles cuando es o se suma y cuando es y se multiplica En el examen solo le preguntan un caso parecido a uno de los anteriores
Variable Aleatoria Continua Entre las variables de este tipo se encuentran variables que siguen una distribucin de probabilidades normal, la normal estndar (z), la t de Student y la ji - cuadrado. Aunque hay otras variables aleatorias continuas, no se incluyen en el examen departamental. La probabilidad de ocurrencia de un evento para una variable aleatoria continua se determina integrando la funcin de densidad de probabilidad correspondiente en el intervalo de inters (rea bajo la curva de la funcin de densidad vs los valores de
19
la variable aleatoria). Dado que las integrales son muy complicadas, se han elaborado tablas para facilitar encontrar el rea bajo la curva correspondiente.
Distribucin Normal. La probabilidad se tiene que dar en un intervalo, no se puede encontrar la probabilidad de exactamente un valor. Veremos con algunos ejemplos como se determina e interpreta la probabilidad. Ejemplo 10 (Tema 5.11): Una lata se debe llenar con un litro de producto. Un estudio en 36 latas proporciona una media de 0.98 litros con una desviacin estndar de 0.1 litros.
a) La probabilidad de que una lata se llene con 1.1 litros es:
b) La probabilidad de que la lata se llene con menos de 0.96 litros es: c) La probabilidad de que se llene con ms 1.1 litros es: Las tablas de la normal, con el fin de ser generales, se estandarizan por medio de
z= x x s
Las tablas proporcionan el valor del rea desde menos infinito hasta el valor para el cual se busca la probabilidad. Conociendo esto, se pueden usar para encontrar las probabilidades pedidas.
20
a)
P(X = 1.1) = P(1.05< X < 1.15), recuerde que no existe el rea para una lnea o punto por lo que, se calcula el rea en un intervalo prximo al valor pedido.
0.98
Estandarizando la variable z = (1.1 0.98)/0.1 = 1.2 P(X = 1.1) = P(z = 1.2) = P(0.7 < z < 1.7) Por medio de la tabla de la normal estndar se encuentra: rea o probabilidad entre los dos valores: 9554 - 0.7580 = 0.1974 La probabilidad de que se llene con 1.1 litros es de 0.1974 Se determina, por medio de las tablas el rea desde menos infinito hasta 1.15, el rea desde menos infinito hasta 1.05 y se restan para tener el rea en el intervalo que incluye 1.1 b) Probabilidad de que se llene con menos de 0.96, es el rea desde menos infinito hasta el valor de 0.96
0.96
z = (0.96 - .98)/0.1 = - 0.2 La probabilidad de que se llene con menos de 0.96 litros es 0.42074
21
Este resultado, tambin se puede interpretar como el porcentaje de latas producidas que se llenarn con menos de 0.96 litros. El 42% de las latas se habrn llenado con menos de 0.96 litros. Esto puede significar que no le compren las latas ya que son muchas con menos de 0.96 litros cuando debera ser 1 litro el llenado.
c) Probabilidad de que se llene con ms de 1.1 es el rea que queda por
delante de 1.1. Debido a que esta rea no la proporciona la tabla usamos el complemento, tomando en cuenta que el rea o probabilidad total es igual a uno. P(X > 1.1) = 1- P(X 1.1)
1.1
z = (1.1 - .98)/.1 = 1.2 P(z > 1.2) = 1- P(z < 1.2) = 1 0.88493 = 0.11507 La probabilidad de que una lata sea llenada con ms de 1.1 litros es de 0.11507. Tambin, se puede interpretar como que el 11.5% de las latas se llenarn con ms de 1.1 litros.
Distribuciones Muestrales. Valor Esperado. Variable Aleatoria Discreta. El valor esperado de una variable aleatoria discreta se determina como: E [ X ] = xi P ( xi )
i =1 n
22
Ejemplo 11 (Tema 5.3): Sea x una variable discreta cuyos valores y probabilidades correspondientes se representan en la siguiente tabla:
x P(x )
10 0.05
15 0.15
20 0.25
25 0.35
30 0.2
Variable Aleatoria Continua. Conocida la funcin de densidad de probabilidad de la variable, el valor esperado se determina por medio de:
E [ X ] = xf ( x) dx
23
La integral se evala en el intervalo en que est definida la funcin de densidad Ejemplo 12 (Tema 5.4): Suponga que el error de medicin de un instrumento es una variable aleatoria continua con una funcin de densidad de probabilidad dada por:
f ( x) = 0.09375 (4 x) 2 , en 2 x 2
x(0.09375 (4 x)
2 2
=0
Intervalos de Confianza. Intervalo en donde se espera con cierta probabilidad que se encuentre el valor del parmetro bajo estudio. En cada problema, se debe determinar el tipo de distribucin correspondiente, para esto, tome en cuenta, el parmetro bajo estudio y el tamao de la muestra.
24
La resistencia a la presin en una muestra de 36 cilindros para gas, presentan una media de 998 kg/m2 y una desviacin estndar de 25. El intervalo de confianza del 99% para la presin media de estos cilindros es: El problema corresponde a intervalo de media con muestra grande, entonces, en el formulario se encuentra:
x E < < x +E .
Donde E = z / 2
( conocida o n>30) n
x z
s s x + z 2 n n
Observe que dado que la muestra es tamao mayor a 30 podemos usar la desviacin estndar de la muestra s como aproximacin de la desviacin de la poblacin.
= 0.01
Usando las tablas de la normal estndar para encontrar la z que le corresponde a un rea de 0.005, se obtiene z = 2.57, por lo que el intervalo pedido es:
998 (2.57 ) 25 25 998 + ( 2.57 ) 36 36
Un estudio en 16 muestras de papel presenta una resistencia a la tensin media de 32 N con una desviacin estndar de 3. El intervalo de confianza del 95% para la resistencia a la tensin de ste tipo de papel es:
25
Identificamos del formulario, para un intervalo de confianza de media con muestra pequea.
x t
s s x + t 2 n n
32 t 0.05
3 3 32 + t 0.05 ,15 2 16 16
Para encontrar el valor correspondiente de la t tomamos en cuenta los grados de libertad (n -1), que en este caso son 16 1 = 15 grados de libertad. A partir de las tablas se encuentra: t 0.025
30 .4 33 .58
,1 5
= 2.131
Ejemplo 14 (Tema 6.4): Intervalo para proporciones En una muestra de 90 personas, 65 contestaron a favor de un producto. Encuentre un intervalo de confianza del 90 % para la proporcin de personas que estn a favor del producto. Dado que es un problema de proporcin, de acuerdo al formulario:
p z
p(1 p ) p p + z 2 n
p(1 p ) n
26
Ejemplo 15 (Tema 6.25): Intervalo para la desviacin estndar Un fabricante desea conocer, con un 95% de confianza, la variacin en la tenacidad de una fibra de rayn. Se toman 14 muestras de un tipo de fibra y se obtiene una tenacidad media de 2.83 con una desviacin estndar de 0.341 g/denier. Identificamos, del formulario, para el intervalo de confianza de la desviacin estndar:
(n 1) (n 1) s 2 ,n1 12 ,n1
2 2
0.341
0.247 0.549
27
Muestras grandes, suponiendo las varianzas conocidas (los otros casos los ver en el curso). Una muestra de resistencia al esfuerzo de 36 metales de un tipo proporcion una media de 248 N/m2 con una desviacin de 20 N/m2 y otra muestra de 38 metales de otro tipo proporcion una media de 252 N/m 2 con una desviacin de 28 N/m2. El intervalo de confianza para la diferencia de medias con el 95% de confianza es: En el formulario, identificamos
(x
x 2 ) E < ( 1 2 ) < ( x1 x 2 ) + E ,
Sustituyendo los datos:
E = z 0.025
con
E = z / 2
12 22 + . n1 n2
20 2 28 2 + = 1.96 5.93 11 36 38
15 < ( 1 2 ) < 7
Antes de una mejora, 120 personas de 200 dijeron que un servicio era bueno, despus de la mejora, 150 de 220 dijeron que eran bueno. Encuentre el intervalo de confianza del 90% para la diferencia de proporciones.
( p1 p2 ) E < ( p1 p2 ) < ( p1 p2 ) + E
120 = 0.6 200 150 p2 = = 0.682 210 p1 =
28
E = z / 2
Tamao de Muestra
El error que determina el intervalo depende de la desviacin estndar, de la distribucin muestral correspondiente y a un valor de la variable aleatoria de dicha distribucin, para un nivel de confianza dado. Fijando un error particular podemos determinar el tamao de muestra necesario para tener dicho error o tamao del intervalo en el cual queremos que se encuentre el parmetro (media, desviacin, etc.) De qu tamao debe ser una muestra para tener un error de 0.2 para una variable con distribucin normal con media 2.5 y desviacin estndar de 0.3 y con una confianza del 95%? En el formulario se encuentra que, en estas condiciones, el error est dado por:
E = z / 2
Mismo procedimiento que en el caso anterior, solo se debe reconocer y aplicar la frmula correspondiente para el error en stas condiciones.
Pruebas de Hiptesis. Prueba para probar, con una probabilidad especificada, que cierto parmetro tiene un determinado valor. Dependiendo del parmetro que se pruebe y del tamao de la muestra, debe identificar el estadstico de prueba correspondiente y manejar el concepto del valor p. Ejemplo17 (Tema 6.9): Prueba de Media, muestra grande. La verdadera media del peso de un costal de harina debe ser de 50 kg. Se pesan 36 costales obteniendo una media de 49.5 kg con una desviacin de 1.2 kg. Haga una prueba de hiptesis, con el 95% de confianza, para verificar si el contenido de los costales es diferente a 50 kg. 1. Planteamiento de las hiptesis nula y alterna
H 0 : = 50 H A : 50
Z=
x 49.5 50 = = 2.5 s 1. 2 n 36
30
a)
(tablas) de 0.006 Para z = - 2.5, se tiene un rea, desde menos infinito, de 0.006, el valor p es sta rea 4. Comparar y rechazar o no la hiptesis nula
a) El valor de z del estadstico es menor al valor de z correspondiente
para el nivel de confianza (- 2.5 < - 1.96), por lo que se rechaza la hiptesis nula.
b) El valor p es menor que el valor del nivel de confianza alfa (0.006 <
los costales respecto de la especificacin de 50 kg. Nota. Si usted observa con cuidado las respuestas, en ste y otros problemas de toma de decisiones con pruebas de hiptesis, ya le estn dando el valor del estadstico de prueba (no tiene que identificarlo y calcularlo). Lo que si debe saber es como se plantea la hiptesis nula, calcular el valor del estadstico de prueba y saber como tomar decisiones al comparar los dos estadsticos.
Ejemplo 18 (Tema 6.13): Prueba de proporcin. Un fabricante dice que su producto tiene el 65% del mercado. Un estudio, muestra que de 300 productos 160 son del fabricante. Con un 95% de confianza pruebe la hiptesis del fabricante.
31
1.
H 0 : p = 0.65 H A : p 0.65
2. La prueba es sobre una proporcin de una poblacin con muestra grande, del formulario
p p z= = pq n
3. a)
(180300) 0.65 =
(0.6)(1 0.6) 300
estndar) es de - 1.96 b) Para z = -1.77, se tiene un valor p o rea desde menos infinito de 0.384
4. Por cualquiera de las dos comparaciones, se observa, para el nivel de
confianza establecido, que no hay suficiente evidencia estadstica para rechazar H0. 5. Se concluye que el fabricante tiene razn
Prueba de diferencia de medias Ejemplo 19 (Tema 6.17): Se tienen dos tipos de concretos. Se toma una muestra de tamao 42 de cada uno y se obtiene un promedio muestral de la conductividad trmica para el primero de 0.486 con una desviacin estndar de 0.187 y un promedio de 0.359 de conductividad trmica con una desviacin estndar de 0.158 para el segundo. Esta informacin sugiere que el promedio verdadero de conductividad trmica del primer concreto es mayor que la del segundo, con = 0.01 .
32
Hiptesis.
H o : 1 2 = 0 H 1 : 1 2 > 0
z=
(x
x 2 ) ( 1 2 )
12 22 + n1 n2
z=
( 0.486 0.359 ) 0
(0.187 ) 2 (0.158 ) 2 + 42 42
= 3.3
Para el nivel de confianza dado y tomando en cuenta que es una prueba de una cola la z que le corresponde (tablas) es: z = 2.33 La z de prueba es mayor que la z correspondiente al nivel de confianza, por lo tanto cae en la regin de rechazo de la hiptesis nula. (El valor p es 0.0005 menor al valor alfa, se rechaza la hiptesis nula). Se puede concluir que el primer acero tiene una conductividad trmica mayor.
Prueba de diferencia de proporciones Ejemplo 20 (Tema 6.21): De 300 residentes de la ciudad 63 estn a favor de un aumento en la velocidad permitida en las carreteras, mientras que de 180 residentes del campo 75 estn a favor del cambio. La informacin indica que la percepcin es diferente en los dos grupos. Hiptesis:
H o : p1 p 2 = 0 H 1 : p1 p2 0
33
z=
( p1 p2 ) ( p1 p 2 )
p1 q1 pq + n1 n2
63 = 0.21, 300 p2 = 52 = 0.29 180
p1 =
z=
( 0.21 0.29 ) 0
(0.21)(1 0.21) (0.29 )(1 0.29 ) + 300 180
= 1.94
Tomamos un nivel de confianza = 0.05 De la tablas para alfa medios se tiene z = -1.96 Comparando los valores de z de prueba y de significancia, z de prueba es menor, (valor p = 0.2499, mayor que alfa) por lo que no hay evidencia para rechazar la hiptesis nula. Nota, si cambiamos el nivel de confianza a 0.1, z = -1.65. En este caso la z de prueba si cae en la regin de rechazo.
Anlisis de Regresin.
En los problemas que aparecen, encontrar una tabla de datos en donde aparecen los valores de las variables dependiente e independiente, as como los valores que se requieren para hacer los clculos de los coeficientes que caracterizan a la recta de regresin y al coeficiente de correlacin.
b1 =
b0 =
( y )( x ) ( x )( xy ) n( x ) ( x )
2 2 2
n es el nmero de datos
Coeficiente de correlacin
r=
El coeficiente de determinacin es el coeficiente de correlacin elevado al cuadrado, r2 Tiene que leer con cuidado lo que se le pregunta y sustituir correctamente los datos.
Ejemplo 21 (Tema 6.27): De acuerdo a la siguiente tabla encuentre la recta de regresin y los coeficientes de correlacin y de determinacin.
35
b1 =
n( xy ) ( x )( y ) n x 2 ( x)
b0
36
r=
n x 2 ( x)
r = 0.9759
n( xy ) ( x )( y )
n y 2 ( y )
c) El coeficiente de determinacin es :
r2 = (0.9759)2 = 0.9405
Pruebas No Paramtricas. Las pruebas son sobre la mediana y no se ponen restricciones sobre la normalidad o no de la distribucin de la variable bajo estudio. Algunas de las pruebas son de: Rangos con Signo de Wilcoxon, Suma de Rangos de Wilcoxon, Mann Whitney y Kruskal Wallis. Prueba de Rangos con Signos de Wilcoxon. Prueba el valor de la mediana de la poblacin, la distribucin de la poblacin debe ser simtrica y no importa el tamao de la muestra. Prueba de Suma de Rangos de Wilcoxon. Muestras dependientes de muestras aleatorias en poblaciones que tienen distribuciones similares no normales. Muestras independientes, en muestras aleatorias de poblaciones que tienen distribuciones similares, simtricas, no normales. Prueba de U Mann Whitney.
37
Muestras
independientes
de
muestras
aleatorias
de
poblaciones
con
distribuciones similares, no normales. Es equivalente a la prueba de Suma de Rangos de Wilcoxon. Las dos se pueden aproximar por una distribucin normal con misma media y varianza cuando el tamao de cada muestra es mayor o igual a 10 y no se requiere que el tamao de cada muestra sea el mismo. Prueba de Kruskall Wallis. Es el equivalente a una prueba ANOVA de un factor. Muestras de una distribucin que no sea normal. Se recomienda cuando no se puede asegurar normalidad y varianzas iguales.
Ejemplo 22 (tema 7): Se desea investigar si un proceso de manufactura es mejor que otro. Se toman 5 muestras de uno y 8 del otro. La prueba adecuada para verificar si hay o no diferencia entre las medianas es: Se trata de un caso en donde no tenemos informacin sobre la distribucin de las poblaciones. Se puede usar la prueba de Suma de Rangos con Signo de Wilcoxon o la prueba U de Mann Whitney con H 0 : m1 = m2 Si las muestras son dependientes o pareadas solo se puede usar la prueba de suma de rangos de Wilcoxon.
38
EXAMEN PRCTICA Pregunta 1. La siguiente tabla representa las ventas (en millones) de bolsas de papa por semana que vende La papa feliz Intervalo 0.1 < x 0.3 0.3 < x 0.5 0.5 < x 0.7 0.7 < x 0.9 0.9 < x 1.1 Frecuencia relativa 0.085 0.045 0.290 0.404 0.176
39
El porcentaje de ventas de cuando mucho 0.7 millones de ventas es: Pregunta 2: La siguiente tabla muestra una lista de varios indicadores del crecimiento econmico a largo plazo en Filipinas. Las proyecciones son hasta el ao 2010 Indicador Econmico Inflacin Exportaciones Importaciones Ingreso Real disponible Consumo PNB real Inversin (residencial) Productividad (fabricacin) Cambio Porcentual 5.3 3.7 2.8 3.9 2.4 2.9 3.2 5.1
La mediana del cambio porcentual es: Pregunta 3: Una muestra de 10 baleros presentan los siguientes dimetros en cm: 9.5 11 11 10 10.5 9 10.5 10.5 10.5 9.5
La desviacin estndar es: Pregunta 4: La siguiente tabla, se refiere a la prueba de un medicamento contra el dolor que realizo Smith&Smith Pharmaceuticals, Inc. Calcula la probabilidad de que una persona haya usado el medicamento o que estuviera en el grupo de control
40
Pregunta 5: En una lnea de produccin se tienen dos dispositivos A y B en paralelo, el sistema funciona si alguno de los dos funciona. La probabilidad de que funcione A es de 0.92 y la de que funcione B es de 0.87. La probabilidad de que el sistema funcione es: Pregunta 6: Se tienen 5 camisas rojas, 8 azules y 9 blancas. Se escogen aleatoriamente 4 camisas. La probabilidad de que sean 1 roja, una azul y 2 blancas es: Pregunta 7: Un estudio tiene como resultado la siguiente tabla de la relacin de compra de corbatas por categora y tamao. Grande Vestir Sport Lujo Total 27 18 6 51 Mediana 79 92 7 178 Chica 17 38 6 61 Total 123 148 19 290
41
S se escoge aleatoriamente a una camisa, qu probabilidad hay de que la corbata sea mediana dado que es de vestir? Pregunta 8: Un examen tiene las siguientes probabilidades de contestar correctamente las preguntas Pregunta 0 1 2 3 4 5 Probabilidad 0 .05 0.18 0.33 0.30 0.12 0.02
Pregunta 9: La funcin de densidad de probabilidad para la emisin de partculas alfa est dada por f(x) = 0.25 e(-0.25x), en el intervalo x > 0 y f(x) = 0, para cualquier otro valor de x. El valor esperado de x es: Pregunta 10: Una compaa que produce llantas para camin sabe por experiencia que 16% de sus llantas tienen imperfecciones y se deben clasificar como de segunda. Entre 20 llantas seleccionadas al azar, cul es la probabilidad de que 2 sean de segunda? Pregunta 11:
42
Sea X la cantidad de fracturas en la superficie de una caldera de cierto tipo, una muestra, seleccionada al azar, presenta un promedio de 3 fracturas por caldera. Calcula la probabilidad de que en una caldera existan exactamente 4 fracturas. Pregunta 12: Una fbrica tiene una torre con carbn activado para absorber contaminantes. Una muestra de 38 mediciones report una media de 145 kg de contaminantes removidos con una desviacin estndar de 18. El intervalo de confianza del 95% para la cantidad de contaminantes removidos es:
Pregunta 13: En respuesta a muchas quejas respecto a la variacin en el voltaje en una zona Industrial, el director general del servicio postal inicia una investigacin preliminar. Una muestra de 14 mediciones tiene como resultado una desviacin estndar de 18 volts. El intervalo de confianza del 95% para la desviacin poblacional es: Pregunta 14: Una empresa desea estimar la proporcin de hogares en los que se comprara su producto. Se seleccion una muestra de aleatoria de 800 hogares. Los resultados indican que, 172 de los hogares compraran el producto. El intervalo de confianza del 90% de la proporcin poblacional de hogares que compraran el producto es: Pregunta 15:
43
Se registra la produccin diaria promedio de cierto producto en una planta. El registro se llevo a cabo durante 54 das y se obtuvo una media de 1350 litros con una desviacin estndar de 260 litros. Prueba la hiptesis a un nivel de significacin de 5%, de que la produccin media diaria sea de 1400 litros. H: = 2500, estadstica de prueba z = -1.12 Pregunta 16: En una temporada de vacaciones, se asegura que los hoteles estarn ocupados a un 88%. Se encuentra que en 34 hoteles se tuvo un lleno del 84%. Qu conclusin puede usted obtener acerca de la capacidad de ocupacin? realiza la prueba a un nivel de significancia del 5%
o o
No Rechazo H*
No Rechazo H* Rechazo H*
Pregunta 17: Se estudia el rendimiento de dos tipos de valores, el valor tipo A y el valor tipo B. El rendimiento de estos slo se conoce hasta despus de la venta. Se tienen registradas 30 tasas de rendimiento anterior para valores tipo A y 36 para valores tipo B. De estas muestras se obtuvieron las estadsticas en la tabla siguiente:
44
Presentan estos datos suficiente evidencia de que existe una diferencia en el rendimiento de ambos valores? Utiliza un nivel de confianza de 0.1
o H: -0, o H: -= 0, o H: -<0,
Pregunta 18:
El administrador de un hospital conjetura que el porcentaje de cuentas hospitalarias no pagadas aument durante el ao anterior. Los registros del hospital muestran que 52 cuentas de 1148 personas admitidas en abril no haban sido liquidadas despus de 90 das. Este nmero es similar a las 36 cuentas de 1102 personas admitidas durante el mismo mes del ao anterior. Con estos datos hay evidencia suficiente que indique un incremento en dicho porcentaje? realiza la prueba con alfa =0.05
Pregunta 19: Se requiere, para asegurar un funcionamiento uniforme, que la verdadera desviacin estndar del punto de ablandamiento de cierto tipo de asfalto sea a lo sumo de 0.4C. Una muestra de 8 especmenes reporta una desviacin estndar de 0.52C. Se puede pensar que la desviacin es >0.58 con alfa =0.1
45
No Rechazo H* Rechazo H*
Pregunta 20:
Un estudio sobre la carga de masa (x) de DBO (kg/ha/d) y la eliminacin de masa (y) de DBO (kg/ha/d) presentan los siguientes resultados:
46
Pregunta 21: En el caso de comparacin de varios niveles para un factor, en el que no se puede suponer normalidad ni varianzas iguales, la prueba adecuada para ver si hay diferencias es:
o o o o
Kruskall Wallis* Prueba de Rangos con Signo de Wilcoxon* Prueba de suma de Rangos de Wilcoxon* Mann Whitney*
47
REFERENCIAS.
W. W. Hines, D. C. Montgomery, D. M. Goldsman y C. M. Borror; Probabilidad y Estadstica para Ingeniera; Cuarta edicin; Ed. CECSA; Mxico, 2005.
R.E. Walpole, R. H. Myers y S. L. Myers; Probabilidad y Estadstica para Ingeniera y Ciencias; Octava edicin; Ed. Pearson; Mxico, 2007.
W. Mendenhall, R. J. Berner, B. M. Berner, Introduccin a la Probabilidad y Estadstica; Ed. Thompson; Mxico, 2002.
48
TABLA DE ESPECIFICACIONES
CLA VE TEMA RESULTADOS DE APRENDIZAJE (objetivos) 1.0 1.1 1.2 1.3 1.4 1.5 1.6 1.7 Anlisis de datos Introduccin a la Estadstica Concepto de Variable CON COM A P L 5 % Definir Variables y Medidas Comprender Tipos de Variables: Cualitativas y Cuantitativas Definir Escalas de Medicin Defnir el Anlisis Exploratorio de Datos Conocer las fuentes de informacin Conocer las diferencias entre poblacin y muestra Distinguir datos agrupados de no agrupados Determinar las Frecuencias Absolutas, Relativas, Absolutas Acumuladas y Relativas Acumuladas Elaborar Histogramas, Polgono de Frecuencias, Ojiva, Diagramas de Tallo y Hoja, Diagramas de Pastel, Diagrama de Caja y Bigote. % TOT AL
Escala de Medicin
1.8
Distibucin de Frecuencias
1.9 2.0
5 %
49
Calcular la media, mediana y moda para datos no agrupados. Calcular la media, mediana y moda para datos agrupados. Calcular Cuartiles, deciles y percentiles
3.0 3.1
Medidas de dispersin Definir qu es dispersin o variabilidad Calcular las medidas de dispersin: rango, desviacin media, desviacin estndar, varianza, dispersin relativa, coeficiente de variacin, recorrido intercuartlico Interpretacin conjunta de las medidas de tendencias central y de dispersin Interpretar las distribuciones de los datos con respecto a su Coeficiente de Asimetra utilizando la Regla Emprica y el Teorema de Tchebychev
5 %
3.2 3.3
3.4
4.0 4.1
Teora de la Probabilidad Fundamentos bsicos de la probabilidad Conocer los enfoques de probabilidad (clsica, frecuencial, subjetiva) Distinguir qu es espacio muestral, evento(simple o compuesto), punto muestral Aplicar las reglas de Adicin para eventos excluyentes, no excluyentes o complementarios Aplicar las reglas de Multiplicacin para eventos dependientes e independientes Calcular la probabilidad condicional Calcular probabilidades con Teorema de Bayes
5 %
4.2
Experimento Aleatorio
4.3
Reglas de Probabilidad
Reglas de Probabilidad
x x x 5 %
1 1 1
5.0
Mtodos de Conteo
50
5.1
Calcular el nmero de eventos utilizando ordenaciones con repeticin, permutaciones, combinaciones o Diagrama de Arbol
Distibuciones de probabilidad 5.2 Panorama general de las distribuciones de probabilidad Clasificar las distribuciones de probabilidad (discretas y continuas) Calcular la media, la varianza y la desviacin estndar de una distribucin de probabilidad discreta Calcular la media, la varianza y la desviacin estndar de una distribucin de probabilidad continua Calcular la Probabilidad Acumulada para los casos de Distribuciones Discretas y Continuas. Identificar las propiedades de una distribucin de probabilidad conjunta, marginal y condicional Calcular la esperanza conjunta, covarianza y coeficiente de correlacin de variables aleatorias independientes as como valores esperados condicionales x
10 %
5.3
5.4
5.5
5.6
10 % Calcular la probabilidad distinguiendo las caractersticas de las distribuciones de probabilidad Binomial Poisson Aproximacin a la Binomial con la de Poisson Normal
x x
1 1
51
5.13 5.14 5.15 5.16 5.17 6.0 6.1 6.2 Estimacin estadstica (Muestras Grandes y Chicas, Varianza Conocida y Desconocida) Muestreo
Aproximacin a la Binomial con la de normal T-student Ji-cuadrada Distribucin F Comprender aplicacin de la Normal, Ji-Cuadrada, F, TStudent
x 20 %
Definicin de muestreo Clasificar los tipos de Muestreo (cuota, aleatorio simple, estratificado)
6.3
6.4
6.5
Calcular media, desviacin estndar, probabilidad, tamao de muestra, error muestral, intervalo de confianza para la distribucin muestral de medias. Calcular: media, desviacin estndar, probabilidad, tamao de muestra , error muestral, intervalo de confianza para la distribucin muestral de proporciones. Calcular: media, desviacin estndar, probabilidad, tamao de muestra , error muestral, intervalo de confianza para la distribucin muestral de diferencia de medias. Calcular: media, desviacin estndar, probabilidad, tamao de muestra , error muestral, intervalo de confianza para la distribucin muestral de diferencia de proporciones. Plantear hiptesis nula y alternativas (prueba de 1 y 2 colas) Identificar los niveles de significacin, error tipo I y tipo II
x 25 % x
52
6.9 6.10 6.11 6.12 6.13 6.14 6.15 6.16 6.17 6.18 6.19 6.20 6.21 6.22 6.23 6.24 6.25 6.26
Calcular Estadstico de Prueba y Regla de Decisin. Calcular el valor p Plantear hiptesis nula y Prueba Estadstica de alternativas (prueba de 1 y 2 proporciones colas) Identificar los niveles de significacin, error tipo I y tipo II Calcular Estadstico de Prueba y Regla de Decisin. Calcular el valor p Plantear hiptesis nula y Prueba Estadstica de diferencia alternativas (prueba de 1 y 2 de medias colas) Identificar los niveles de significacin, error tipo I y tipo II Calcular Estadstico de Prueba y Regla de Decisin. Calcular el valor p Plantear hiptesis nula y Prueba Estadstica de diferencia alternativas (prueba de 1 y 2 de proporciones colas) Identificar los niveles de significacin, error tipo I y tipo II Calcular Estadstico de Prueba y Regla de Decisin. Calcular el valor de p Prueba Estadstica para la Plantear hiptesis nula y varianza de una y dos alternativas (prueba de 1 y 2 poblaciones colas) Identificar los niveles de significacin, error tipo I y tipo II Calcular Estadstico de Prueba y Regla de Decisin. Calcular el valor p Conocer las condiciones en las que el modelo es vlido Calcular: ecuacin, estimacin, anlisis de correlacin, recta de mnimos cuadrados Calcular: ecuacin, estimacin, anlisis de correlacin, recta de
x x x 1
x x x 1
x x x 1
x x x x x x 5 % 1
Regresin y correlacin
53
mnimos cuadrados Elaborar casos de aplicacin; Prueba de Signo Prueba U de Mann Whitney Prueba de Rangos de Wilcoxon Prueba de correlacin de Rangos Anlisis de Varianza de Rangos de Friedman Coeficiente de Correlacin de Rango de Spearman Coeficiente de correlacin de Rango de Kendall 5 % x x x x x x x 10 0 %
Estimacin no paramtrica
Total
24
54