Sie sind auf Seite 1von 50

BIOESTADISTICA GUIA DE TRABAJOS PRACTICOS 2012 PERSONAL DE LA CATEDRA

Prof. Teora: Lic. Adriana del C. Elias Prof. Prctica: Lic. Myriam Edith Gargiulo Lic. Fabiana del Valle Snchez Estudiantes Agregados: Srta. Gabriela Brito (Est. Carrera Lic. BT) Sr. Ricardo A. Diaz ( Est. Carrera Lic. BT ) Sr. Fernando Villafae (Est. Carrera Lic. BT) 1

TRABAJOS PRCTICOS N 1

En los trabajos prcticos 1 y 2 se desarrollan los temas del programa curricular:

1.- Poblacin y Muestra Definicin e ideas bsicas referentes a la poblacin y muestra. Fenmenos aleatorios. Poblacin estadstica. Muestras aleatorias y no aleatorias. Variables: su clasificacin. 2.- Presentacin y Procesamiento de datos Registro de datos. Distribucin de frecuencias para datos agrupados y sin agrupar. Intervalos de clases para variables medibles discretas, 2

continuas y derivadas. Distribucin de frecuencias acumuladas. Grficos: Diagrama de barras, Histograma ordinario y de reas, polgono de frecuencias y de frecuencias acumuladas. Procesamiento de datos. Anlisis exploratorio de datos: Diagrama de Tallo y hoja, Box-Plot. Uso de Programas Excel y SPSS. 3.- Estadstica Descriptiva Medidas de posicin: Media aritmtica, Mediana, Modo, Cuartiles, Deciles, Percentiles. Propiedades y relaciones. Medidas de dispersin: Rango, Rango Intercuartil, Desviacin Media, Desviacin Mediana, Varianza, Desviacin Estndar. Coeficiente de Variacin Relativa. Propiedades y clculos. Distribuciones Simtricas, Distribuciones Asimtricas. Coeficientes de Asimetra.

TRABAJO PRCTICO N 1
PROBLEMA N 1: Considere los siguientes casos e identifique: 1) Poblacin Fsica, 2) Poblacin Estadstica, 3) Variables involucradas y clasificacin a) En el Instituto Miguel Lillo, se realiz en febrero de 1990 un estudio sobre individuos del genero Heterpteros, analizando la familia a la que pertenecen y su presencia como insectos en 100 hojas estivales. b) En el criadero xx durante enero de 1996, se estudio el N de cras que tuvieron 110 parejas de conejos teniendo en cuenta tipo de hbitat, dieta y temperatura a la que fueron sometidos. c) Un grupo de investigadores desea estudiar si el nivel de glucosa en sangre afecta a la presin sistlica (Comunicacin Biomdica pag. 537-548, 1998). Para ello considera la presin arterial de 20 diabticos y 20 no diabticos del Centro de Especializacin xx en abril de 2003. d) Se desea conocer la influencia de la temperatura de lavado de cscara de limn sobre el contenido de pectina que puede ser extrado de la misma. Para ello se selecciona un lote con 2000 cscaras y se separan en dos grupos de igual cantidad. El primer grupo se lava en un bao a temperatura ambiente y para el segundo grupo se incrementa la temperatura del bao en 20 oC. El estudio se realiza en la Citrcola XX, durante el mes de Enero de 2005. PROBLEMA N 2: En cada caso, clasifique la variable bajo estudio: a) Sexo de cras de ratones del Laboratorio de Biologa de la UNT.

b) Porcentaje de alumnos aprobados en la ltima mesa de examen. c) Longitud de la radcula de plntulas de arroz. d) Concentracin de soluciones estndares (g/l), preparadas en la ctedra de Qumica analtica de la UNT. e) Proporcin de artculos que cumplen con las normas de calidad ISO f) Nmero de pacientes internados en el Centro de Salud durante agosto de 2008. g) Grado de mejoramiento de un paciente afectado neumona (regular, bueno, muy bueno). h) Casas Proveedoras de repuestos para una determinada fbrica.

PROBLEMA N 3: 4

Una empresa exportadora de manzanas Delicious ordinaire necesita clasificar la produccin obtenida durante el Verano de 2012, segn su calidad de acuerdo al dimetro de la manzana en cm (D), segn el nmero de manchas y segn el color de recubrimiento. Para el estudio se tiene en cuenta las siguientes clasificaciones de calidad: Calidad segn el dimetro (CD) se identifican 3 categoras: Categora I: manzanas cuyo dimetro es menor de 5 cm Categora II: manzanas cuyo dimetro est comprendido entre 5 y 7 cm Categora III: manzanas cuyo dimetro es Mayor que 7 cm Las frutas de mayor calidad son las correspondientes a la categora II por su tamao y homogeneidad. Calidad segn el nmero de manchas (NM) CC: Calidad segn coloracin mixta-roja (coloracin viva de la parte roja o de recubrimiento).

Categora Extra (CE): por lo menos 1/2 del recubrimiento del fruto de coloracin Categora adecuada (A): menos de 3 manchas roja. en la superficie del fruto Categora I: entre 1/10 y un 1/2 del Categora inadecuada(I): 3 o ms manchas en recubrimiento del fruto de coloracin roja. la superficie del fruto Categora II: menos del 1/10 del recubrimiento del fruto de coloracin roja. Las frutas de mayor calidad son las que corresponden a la categora Extra segn la coloracin Las condiciones que deben presentar las manzanas para ser exportadas son: Calidad II segn el dimetro, Calidad adecuada segn el nmero de manchas y Calidad Extra segn la coloracin del recubrimiento. Para el estudio se consideraron 48 manzanas de la produccin y se registraron: Nmero de Manchas (NM), el dimetro en cm (D) y la Coloracin del recubrimiento en proporcin (CC) NM 2 2 3 2 1 0 5 4 2 2 1 0 D CC 5,03 0,20 NM 1 D 5,44 CC 0,20 NM 0 D CC 2,73 0,56 5,35 3,54 4,93 6,50 5,35 3,88 4,18 4,80 7,96 4,54 4,65 0,50 0,45 0,56 0,34 0,68 0,65 0,53 0,50 0,45 0,35 0,55 NM 0 1 2 3 4 1 0 1 2 3 4 2 D 5,08 6,99 5,17 5,14 4,20 5,31 7,67 5,01 4,46 5,10 6,74 5,31 CC 0,55 0,60 0,55 0,50 0,49 0,30 0,48 0,70 0,56 0,45 0,50 0,65

4,91 0,30 1 5,21 0,05 1 5,20 0,60 3 3 ,98 0,65 2 5,04 0,35 2 3,56 0,35 3 3,54 0,66 1 3,01 0,56 4 4,78 0,45 0 6,96 0,57 1 5,56 0,70 2 7,55 0,36 0 6,69 0,56 1 3,81 0,69 1 3,54 0,55 3 4,82 0,12 2 3,37 0,67 2 6,03 0,52 3 3,15 0,54 1 2,65 0,55 4 3,15 0,60 0 2,20 0,45 2 a) Indique cual es la poblacin bajo estudio b) Indique cual es el objetivo del estudio c) Clasifique la/s variable/s bajo estudio.

d) Seleccione todas las variables cualitativas y Construya todas las Distribuciones de Frecuencias correspondientes-Determine Mayora e interprete. e) Seleccione todas las variables cuantitativas y Construya todas las Distribuciones de Frecuencias correspondientes Determine Mayora e interprete. f) Para todos los casos que sea posible Construya el/los Diagramas de Barras interprete. g) Para todos los casos que sea posible Construya el Ciclograma - interprete. h) Para todos los casos que sea posible Construya un diagrama de Pareto interprete. i) Para todos los casos que sea posible Construya Grficos de puntos, grficos de bastones y grficos de escalones. Interprete. j) Para todos los casos que sea posible Construya Histogramas, Polgonos de frecuencias y grficos de Ojivas. Interprete. PROBLEMA N 3: El ANMAT es un organismo dedicado a la habilitacin de Laboratorios y Drogueras, para que los mismos puedan ser habilitados deben reunir ciertos requisitos. Durante el mes de diciembre de 2009 dicho organismo llevo a cabo un estudio con la finalidad de detectar la falla ms frecuente, motivo de la no aprobacin de 89 de 2000 solicitudes de habilitacin. Los resultados se presentan a continuacin: Tipo de falla Falta de Documentacin Ambientes Inadecuados Falta de personal capacitado total fi 4 5 2 9 1 5 8 9 % F ac % ac

a) Cul es el objetivo del estudio? b) Cual es la variable bajo estudio? Clasifquela segn su naturaleza. c) Complete la tabla y analice la mayora. d) Proponga y realice un grfico que considere adecuado para el estudio. Interprete.

TRABAJO PRCTICO N 2
Tenga en cuenta el PROBLEMA N 3 del TPN1. Para todas las variables Cuantitativas medibles discretas: A partir de la distribucin de frecuencias en clases y/o de la distribucin de frecuencias en categoras calcule todas las medidas de posicin y de variabilidad. Interprete cada uno de los valores encontrados. Analice la existencia de datos anmalos. A partir del grfico de barras y del grfico de frecuencias acumuladas responda en los casos que tenga sentido: a) Valor que toma la mayora a partir de los Grficos. b) A lo sumo el valor del 40% c) Por lo menos el 50% c) El valor del 50% de datos centrales Para todas las variables Cuantitativas medibles continuas: A partir de la distribucin de frecuencias en clases y/o del Diagrama de Tallo y hoja calcule todas las medidas de posicin y de variabilidad. Interprete cada uno de los valores encontrados. Analice la existencia de datos anmalos. Calcule los coeficientes de variabilidad y de forma adecuados para cada lote de datos. Interprete. A partir del Diagrama de Tallo y Hojas, del Histograma, del Polgono de Frecuencias, de las Ojivas y de los Box-Plot responda: a) Valor que toma la mayora. b) A lo sumo el valor del 40% c) El valor del 50% de datos centrales d) Valor que toman por lo menos el 25% de los datos

TRABAJO PRCTICO N 3
Se desarrollan los temas del programa curricular: 4.- Probabilidades Espacio muestral. Variable aleatoria. Tipos de variables aleatorias. Distribucin de probabilidad, Distribucin de probabilidad acumulada. Esperanza Matemtica, Varianza. Propiedades. Distribuciones para variables discretas: Binomial (parmetros, momentos y aplicaciones de la distribucin binomial), Distribucin de Poisson (parmetros, momentos y aplicaciones).Distribuciones para variables aleatorias continuas: Uniforme (parmetros y momentos), distribucin Normal (caractersticas, ejemplos de aplicacin), distribucin Normal Estandar. Distribucin Exponencial (parmetros y momentos). Distribucin de Probabilidad Conjunta, Distribuciones de Probabilidad Marginal. Distribucin de Probabilidad Condicional. Independencia Estadstica. Covarianza, propiedades.

PROBLEMA N 1
Para cada uno de los siguientes experimentos estadsticos indique si el Espacio Muestral es: finito, infinito numerable o infinito continuo: a) Se selecciona un estudiante entre 20. b) Mediciones realizadas para determinar la cantidad de uranio de un cierto mineral. c) 3 ratas son seleccionadas entre 15 para realizar un estudio experimental de los efectos que produce una vacuna contra la gripe. d) Se mide la cantidad de radiacin csmica a la que estn expuestos los pasajeros de un vuelo intercontinental. e) Se cuentan las hojas de todos los rboles de limn que se encuentran en una hectrea. f) Para la regulacin hormonal de una lnea metablica, se inyecta un frmaco que inhibe la sntesis de protenas, a dos ratas albinas de 4 ratas numeradas.

PROBLEMA N 2

Se desea medir el calor de vaporizacin del agua, para ello se realizan 5 experimentos en los que se registran las mediciones del calor de vaporizacin del agua. Luego se selecciona una de ellas. a)Qu tipo de seleccin aleatoria debera realizarse?. Marque algunas de las siguientes posibilidades:

Con reposicin

Sin reposicin

Con orden

Sin orden

b) Describa el espacio muestral, e indique qu cantidad de puntos muestrales contiene el mismo. c) Proponga y realice algn mtodo de conteo matemtico para calcular la cantidad de puntos muestrales del espacio. Coincide el valor encontrado con el valor del apartado b?. PROBLEMA N 3 Un tcnico en semillas desea inspeccionar el funcionamiento de 20 cmaras de cra. Para esto toma dos cmaras al azar y registra la temperatura de las mismas. a)Qu tipo de seleccin aleatoria debera realizarse?. Marque algunas de las siguientes posibilidades:

Con reposicin

Sin reposicin

Con orden

Sin orden

b) Describa el espacio muestral, e indique qu cantidad de puntos muestrales contiene el mismo. c) Proponga y realice algn mtodo de conteo matemtico para calcular la cantidad de puntos muestrales del espacio. Coincide el valor encontrado con el valor del apartado b?. PROBLEMA N 4 a) b) c) d) Enuncie la definicin de Probabilidad a Priori segn Laplace. Enuncie los axiomas de Probabilidad. Enuncie y demuestre todos los Teoremas de probabilidad que Defina variable aleatoria e indique la diferencia que existe

Indique cual es el supuesto que se realiza en esta definicin.

se presentaron en clases tericas. entre una variable aleatoria discreta y una variable aleatoria continua. 9

e) f) g) h)

Defina funcin de distribucin de probabilidad (fdp) para una Defina funcin de distribucin de probabilidad acumulada Defina Esperanza Matemtica y Varianza. Presente todas las propiedades de Esperanza Matemtica y

variable aleatoria discreta. (fdpa) para una variable aleatoria continua.

de Varianza con sus respectivas demostraciones. PROBLEMA N 5 En cada una de las siguientes afirmaciones detecte el error. Indique porque considera usted que es un error. a) La probabilidad de que un estudiante obtenga 10 en bioestadstica es igual a -0,90 b) La probabilidad que dos conejos sean vacunados es igual a 0,67; que un conejo sea vacunado 0,38 y que ningn conejo sea vacunado 0,19. (X v.a. que indica el nmero de conejos vacunados). c) La probabilidad de que una muestra de mineral contenga plata es de 0,70 y de que no la contenga 0,40. d) La probabilidad de que una operacin tenga xito es de 0,66 y de que no lo tenga es de 0,34. e) Un tcnico de laboratorio desea conocer la probabilidad de seleccionar 1 de 2 balanzas electrnicas conociendo que la probabilidad de que falle la primera balanza es de 0,35 de que falle la segunda de 0,45 y de que fallen ambas 0,50. (Se recomienda realizar un diagrama de Venn)

10

PROBLEMA N 6 En un estudio realizado para conocer las costumbres de cierta ave, se han examinado 95 rboles, dando los siguientes resultados experimentales: Nidos por rbol Nmero de rboles 0 13 1 27 2 22 3 16 4 12 5 5

a) Encuentre la probabilidad A posteriori asociada al experimento. b) Indique cual es la variable bajo estudio y si esta es discreta o continua. Justifique su respuesta. c) Cul es la probabilidad de encontrar 2 nidos?. d) Cul es la probabilidad de encontrar por lo menos 2 nidos?. e) Cul es la probabilidad de encontrar a lo sumo 3 nidos?. f) P[X<3]; P[2 < X 4]; P[X> 1] g) Encuentre la distribucin de probabilidad acumulada, a partir de la misma calcule nuevamente todas las probabilidades pedidas. h) Encuentre la Esperanza Matemtica y la Varianza. Interprete

PROBLEMA N 7 En una fbrica, el 7% de las piezas que se fabrican son defectuosas. Se toma una muestra con reposicin de tamao 11. Hallar: a) la probabilidad de que no haya ninguna defectuosa en la muestra. b) la probabilidad de que haya ms sanas que defectuosas. c) la probabilidad de que haya al menos 2 defectuosas. d) el nmero promedio esperado de defectuosas. PROBLEMA N 8 En un experimento, el error cometido en determinar la densidad de una substancia es una variable aleatoria con distribucin uniforme continua, con = -0.015 y = 0.015. Hallar las probabilidades que: a) El error est entre 0.01 y 0.02; b) El error exceda 0.005. PROBLEMA N 9 11

Un Ingeniero Agrnomo del Servicio de Alerta contra Fitftora de una regin viatera afirma que 2 de cada 10 lotes afectados por la enfermedad se deben al mal manejo de los mismos. Cul es la probabilidad que: a) de 100 lotes, a lo sumo 10, sean afectados por la enfermedad, por problemas de mal manejo? b) de 100 lotes, ninguno presente la enfermedad por problemas de mal manejo?

PROBLEMA N 10 Por medio de un tamiz de malla de 8 mm de dimetro se zarandean 8000 granos de maz. El dimetro del grano de maz sigue una distribucin normal con esperanza igual a 9 mm y una desviacin estndar de 1.2 mm. a) Qu proporcin de granos sern retenidos por el tamiz? b) Qu proporcin de granos no retenidos, sern retenidos por un tamiz de dimetro de malla igual a 7.5 mm? c) Qu proporcin de granos pasar a travs de los dos tamices?

PROBLEMA N 11 Si X es una variable aleatoria distribuida normalmente con = 10 y 2 = 4. a) Cul es la probabilidad de que X tome valores menores que 9? b) Cul es la probabilidad de que X tome valores entre 9 y 11?

PROBLEMA N 12 Si la variable espesor de un sedimento en un sustrato de suelo, se distribuye normalmente con media = 15 micrones y desviacin estndar = 3 micrones. a) Cul es el cuantil 0.75 de la distribucin de la variable? b) Cmo se interpreta este valor? PROBLEMA N 13 (realizar una tabla de doble entrada) Al tirar un par de dados se obtienen realizaciones de dos variables aleatorias discretas independientes con valores posibles: {1,2,3,4,5,6}, cada uno de los cuales tiene probabilidad de 1/6. a) Cul es la distribucin de probabilidades conjunta de la variables X= nmero de puntos obtenidos en el primer dado e Y= nmero de puntos obtenidos en el segundo dado. Para responder, defina primero el conjunto de los resultados posibles de este experimento. b) Encuentre las distribuciones de probabilidades marginales para X e Y. c) Encuentre Esperanza y Varianza para X y para Y. d) Encuentre la Covarianza de X e Y. e) Es posible afirmar que X e Y son independientes?. 12

PROBLEMA N 14 Se desea evaluar la efectividad de una nueva vacuna antigripal. Para ello se decide suministrar dicha vacuna, de manera voluntaria y gratuita, a una pequea comunidad. La vacuna se administra en dos dosis, separadas por un periodo de dos semanas, de forma que algunas personas han recibido una sola dosis, otras han recibido las dos y otras personas no han recibido ninguna. La siguiente tabla indica los resultados que se registraron durante la siguiente primavera en 1000 habitantes de la comunidad elegidos al azar. N Dosis Gripe Con Sin 0 249 28 1 9 100 2 13 565

a) Cul es la distribucin de probabilidades conjunta de la variables X= Adquiere la enfermedad e Y= nmero de dosis administrada. Para responder, tenga en cuenta la definicin de probabilidad conjunta. b) Encuentre las distribuciones de probabilidades marginales para X e Y. c) Encuentre todas las distribuciones condicionales. d) Es posible encontrar Esperanza de X, Varianza de Y y Covarianza de X e Y? e) Es posible afirmar que X e Y son independientes?. Es posible afirmar que la vacuna brinda proteccin contra la gripe?

13

TRABAJO PRCTICO N 4
Se desarrollan los temas del programa curricular: 5.- Inferencia Estadstica Estadsticos, Estimadores y estimacin. Propiedades de un estimador. Estimacin por intervalos de confianza. Comparacin de medias para muestras relacionadas (Intervalos de confianza para datos apareados). Comparacin de medias para muestras independientes. Comparacin de Varianzas para muestras independientes. PROBLEMA N 1 a) Defina Estadstico b) Defina Estimador; Defina Estimador Insesgado; Defina Estimador Eficiente. c) Defina Estimador Puntual d) Defina intervalo de confianza e) Enuncie las propiedades los supuestos que se deben cumplir para que un intervalo de confianza sea vlido. f) Defina nivel de confianza g) Enuncie el Intervalo de confianza para la media de una poblacin con varianza conocida h) Enuncie el Intervalo de confianza para la media de una poblacin con varianza desconocida i) Enuncie el Intervalo de confianza para la comparacin de varianzas de dos poblaciones independientes j) Enuncie el Intervalo de confianza para la comparacin de las medias de dos poblaciones independientes con varianzas conocidas. k) Enuncie el Intervalo de confianza para la comparacin de las medias de dos poblaciones independientes con varianzas desconocidas iguales. l) Enuncie el Intervalo de confianza para la comparacin de las medias de dos poblaciones independientes con varianzas desconocidas distintas. m) Enuncie el Intervalo de confianza para la proporcin de una poblacin. n) Enuncie el Intervalo de confianza para la comparacin de las proporciones de dos poblaciones independientes. o) En todos los intervalos de confianza enunciados indique cmo los interpretara.

14

PROBLEMA N 2. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Sea X1, X2, X3 y X4 una muestra aleatoria de una poblacin con distribucin exponencial con parmetro desconocido. De los siguientes estadsticos cules son estimadores insesgados de ?

1 1 ( X1 + X 2 ) + ( X 3 + X 4 ) 6 3 T2 = ( X 1 + 2 X 2 + 3 X 3 + 4 X 4 ) / 5 T3 = ( X 1 + X 2 + X 3 + X 4 ) / 4
T1 = PROBLEMA N 2. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Un proceso produce cierta clase de tapas de plstico cuyo dimetro interior es de 3 cm. Se seleccionan de forma aleatoria, 12 de estas tapas y se miden sus dimetros internos, que resultan ser 3,01 3,05 2,99 2,99 3,00 3,02 2,98 2,99 2,97 3,02 2,97 3,01

Suponiendo que el dimetro es una variable aleatoria normalmente distribuida, encontrar los estimadores puntuales de media aritmtica y varianza y el Intervalo del 99% de confianza para: a) Varianza y b) Media aritmtica. Interprete.

PROBLEMA N 3 Una empresa que provee mscaras antivirales para Avian Flu, dise el modelo 3M-8612F realiz un estudio piloto para detectar la cantidad promedio de una sustancia antiviral, para ello selecciona aleatoriamente 100 mscaras, y registr la cantidad de antiviral en cada mscara en microgramos. 10,3 12,8 8,3 6,9 10,2 11,1 11,9 8,7 9,5 6,9 7,8 8,1 6,4 16,0 12,9 8,6 10,6 9,3 14,1 12,8 11,6 8,7 7,9 8,6 8,9 6,8 7,9 11,6 10,3 11,8 9,7 12,8 13,1 6,3 8,4 8,9 10,6 11,3 7,8 14,6 8,7 8,5 9,3 10,6 11,4 13,7 8,5 9,7 10,1 10,8 6,9 7,5 15,0 9,3 10,0 10,6 11,3 11,4 9,9 7,8 10,6 11,8 10,5 10,7 10,6 14,9 13,2 10,9 10,6 11,1 9,9 6,7 7,8 10,9 10,6 11,3 9,8 9,6 15,0 11,0 12,3 12,6 9,5 6,3 8,7 10,5 14,0 13,6 10,1 6,9 8,6 7,0 6,8 11,4 13,2 6,9 7,9 10,3 10,9 11,3 Encontrar los estimadores puntuales de media aritmtica y varianza y el Intervalo del 98% de confianza para: a) Varianza y b) Media aritmtica. c)Bajo qu supuestos los intervalos anteriores son vlidos?, d) Si se considera que las mscaras cumplen con los controles de calidad requeridos por la FDA cuando la cantidad de antiviral no es menor a 5 microgramos y no es mayor a 8 microgramos con una varianza que no supere el 5% del valor del promedio puede usted asegurar que las mscaras cumplen con las condiciones requeridas por la FDA? 15

PROBLEMA N 4. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Un fabricante asegura, a una compaa que le compra un producto en forma regular, que el porcentaje de productos defectuosos no es mayor del 5%. La compaa decide comprobar la afirmacin del fabricante seleccionando, de su inventario, 200 unidades de este producto y probndolas. Deber sospechar la compaa de la afirmacin del fabricante si se descubren un total de 19 unidades defectuosas en la muestra? PROBLEMA N 5. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Cierto metal se produce, por lo comn, mediante un proceso estndar. Se desarrolla un nuevo proceso en el que se aade una aleacin a la produccin del metal. Los fabricantes se encuentran interesados en estimar la verdadera diferencia entre las tensiones de ruptura de los metales producidos por los dos procesos. Para cada metal se seleccionan 12 especmenes y cada uno de stos se somete a una tensin hasta que se rompe. La siguiente tabla muestra las tensiones de ruptura de los especmenes en kilogramos por centmetro cuadrado Proceso Estndar Proceso Nuevo 428 419 458 439 441 456 463 429 438 445 441 463 462 448 435 564 429 472 453 459 427 468 452 447

Si se supone que el muestreo se llev a cabo sobre dos distribuciones normales e independientes con varianzas iguales, obtener los intervalos de confianza estimados del 95% para la diferencia de las medias. Con base en los resultados, se estara inclinado a concluir que existe una diferencia significativa entre los dos procesos?. Proponga, realice e interprete un grfico que sea representativo. PROBLEMA N 6. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Suponiendo que los siguientes datos de tiempos en minutos constituyen muestras aleatorias de una misma poblacin con distribucin normal con varianza desconocida, en dos momentos diferentes existe alguna razn para creer que en el segundo momento el tiempo es mayor en 2 minutos que el primero? Realice el estudio para el 95% de confianza. Primer 14 12 15 15 11 16 17 12 14 13 18 13 18 15 16 11 Segundo 20 22 18 18 19 15 18 15 22 18 19 15 21 22 18 16 PROBLEMA N 7. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Una agencia estatal tiene la responsabilidad de vigilar la calidad de agua para la cra de peces con fines comerciales. Esta agencia se encuentra interesada en comparar la variacin de cierta sustancia txica en dos estuarios cuyas aguas se encuentran contaminadas por desperdicios industriales provenientes de una zona industrial cercana. En el primer estuario se seleccionan 11 muestras y en el segundo 8, las cuales se enviaron a un laboratorio para su anlisis. Las mediciones en ppm que se observaron en cada muestra se exponen en la 16

tabla. Si se supone que el muestreo se hizo sobre dos poblaciones independientes distribuidas normales, obtener un intervalo de confianza estimado del 95% para la diferencia de las medias y para el cociente de las varianzas. Con base a los resultados se podra concluir que las dos varianzas son distintas?, Qu las dos medias son distintas?, Qu intervalo elegira para responder al objetivo del estudio? Estuario I Estuario II 10 11 10 8 12 9 13 7 9 10 8 8 12 8 12 10 10 14 8

PROBLEMA N 8. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) En un estudio de los hbitos de fumador para personas zurdas y derechas, una muestra aleatoria de 400 zurdos revel que 190 de stos fuman, y en una muestra aleatoria de 800 derechos, 300 de stos fuman. Con base en esta evidencia, construir un intervalo de confianza del 98% para la diferencia real entre las proporciones.

17

TRABAJO PRCTICO N 5
Se desarrollan los temas del programa curricular: 5.- Inferencia Estadstica Test de Hiptesis: Introduccin y conceptos bsicos. Tipos de hiptesis. Test unilaterales y bilaterales. Procedimiento estndar del test de hiptesis. Relacin de los dos tipos de errores. Aplicaciones: comparacin de medias para muestras independientes (test paramtricos). Comparacin de medias para muestras relacionadas (test paramtricos y no paramtricos). Test de homogeneidad de varianzas. Comparacin de k medias para muestras independientes: Test paramtricos y no paramtricos, comparacin mltiple. Test de homogeneidad e independencia para tablas r x k. PROBLEMA N 1 a) Defina Hiptesis nula b) Defina nivel de significacin c) Defina Error de tipo I d) Defina Error de tipo II e) Defina Potencia de un test f) Enuncie el test de hiptesis para la media de una poblacin con varianza conocida g) Enuncie el test de hiptesis para media de una poblacin con varianza desconocida h) Enuncie el test de hiptesis para comparacin de varianzas de dos poblaciones independientes i) Enuncie el test de hiptesis para comparaciones medias de dos poblaciones independientes con varianzas conocidas. j) Enuncie el test de hiptesis para comparaciones medias de dos poblaciones independientes con varianzas desconocidas iguales. k) Enuncie el test de hiptesis para comparaciones medias de dos poblaciones independientes con varianzas desconocidas distintas. l) Enuncie el test de hiptesis para la proporcin de una poblacin. m) Enuncie el test de hiptesis para la comparacin de las proporciones de dos poblaciones independientes.

18

PROBLEMA N 2. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Se espera tener una cierta variacin aleatoria nominal en el espesor de lminas de plstico que una mquina produce. Para determinar cundo la variacin en el espesor se encuentra dentro de ciertos lmites, cada da se seleccionan en forma aleatoria 12 lminas de plstico y se mide en milmetros su espesor. Los datos que se obtuvieron son los siguientes: 12,6 11,9 12,3 12,8 11,8 11,7 12,4 12,1 12,3 12,0 12,5 12,9 Si se supone que el espesor es una variable aleatoria distribuida normal, realizar los test de hiptesis con 10%, 5% y 2% de significacin para decidir si: a) la media es igual a 12 mm y si b) la varianza del espesor es igual a 0,9 mm; c) Si no es aceptable una varianza mayor de 0,9 mm, existe alguna razn para preocuparse con base a esta evidencia?. Para responder realice un test de hiptesis que considere adecuado. PROBLEMA N 3. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Se recibe un lote muy grande de artculos proveniente de un fabricante que asegura que el porcentaje de artculos defectuosos en la produccin es del 1%. Al seleccionar una muestra aleatoria de 200 artculos y despus de inspeccionarlos, se descubren 8 defectuosos. Realizar los test de hiptesis del 10% y del 5% de significacin para la verdadera proporcin de artculos defectuosos en el proceso de manufactura del fabricante. Con base en estos resultados qu se puede concluir con respecto a la afirmacin del fabricante? PROBLEMA N 4. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) La investigacin ha desarrollado variedades superiores de maz que proporcionarn cantidades ms grandes de ste por unidad de tierra. Un investigador ha desarrollado una nueva variedad hbrida de este grano y piensa que es superior a la mejor variedad disponible. Tambin cree que esta nueva variedad rebasar con mucho la produccin estndar en varias localidades geogrficas. Para verificar lo anterior, el investigador disea el siguiente experimento: se seleccionan 10 parcelas de igual tamao cada una en distinta localidad geogrfica. Cada parcela se divide en dos secciones iguales, de manera tal que puedan cultivarse las dos variedades en cada localidad. En el momento de recoger la cosecha, se anotan las toneladas por unidad de rea. Supngase que los datos se muestran en la tabla son los que se observaron. Con base en estos datos, realice un test de hiptesis para la diferencia de las medias en la produccin de las variedades X e Y

Variedad (estndar) Variedad (nueva)

X 23 Y 26

45 39

29 35

42 40

33 38

19 24

37 36

24 27

35 41

26 27

19

PROBLEMA N 5. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Suponiendo que los siguientes datos de tiempos en minutos constituyen muestras aleatorias de una misma poblacin con distribucin normal con varianza desconocida, en dos momentos diferentes existe alguna razn para creer que en el segundo momento el tiempo es mayor en 2 minutos que el primero? Para responder realice el test de hiptesis que considere adecuado. Interprete. Primer 14 12 15 15 11 16 17 12 14 13 18 13 18 15 16 11 Segundo 20 22 18 18 19 15 18 15 22 18 19 15 21 22 18 16 PROBLEMA N 6. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) A finales de la dcada de los setenta se descubri que la sustancia carcinognica nitrosodimetilamina (NDMA) se formaba durante el secado de la malta verde, la cual se empleaba para fabricar cerveza. A principios de los ochenta se desarroll un nuevo proceso para el secado de la malta, el cual minimizaba la formacin de NDMA. Se tomaron muestras aleatorias de una cerveza domstica que se fabric empleando ambos procesos de secado, y se tomaron los niveles de NDMA en partes por billn. Se obtuvieron los siguientes resultados: Proceso 6 anterior Proceso 2 propuesto 4 1 5 2 5 2 6 1 5 0 5 3 6 2 4 1 6 0 7 1 4 3

Si se supone que se muestrearon dos distribuciones normales independientes con varianzas iguales, existe alguna razn para creer, a un nivel del 5% de significacin, que ha disminuido la cantidad promedio de NDMA en ms de dos partes por billn con el empleo del nuevo proceso? PROBLEMA N 7. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) En un estudio reciente que abarc 25 aos, se investig la posible proteccin que proporciona la ingestin de una forma de vitamina A llamada caroteno contra el desarrollo del cncer pulmonar. Se encontr que de 488 hombres que haban ingerido una baja cantidad de esta sustancia durante este tiempo, 14 desarrollaron cncer pulmonar, pero en un grupo del mismo tamao en el que el consumo de caroteno era mayor, slo dos personas desarrollaron cncer. Bajo las suposiciones apropiadas, puede concluirse que la ingestin de caroteno reduce el riesgo de desarrollar cncer pulmonar en los hombres?. Emplese un nivel de significacin del 1%. Cul es el valor de p? Desde un punto de vista estadstico 20

qu consejo se podra dar al investigador mdico que se interesa en un proyecto como ste?

PROBLEMA N 8. (Fuente: Canavos G.C. Probabilidad y Estadstica. Aplicaciones y Mtodos) Un proceso de produccin emplea cinco mquinas en sus tres operaciones de desplazamiento. Se clasific una muestra aleatoria de 164 fallas de acuerdo con la mquina y la operacin de desplazamiento en la que ocurri la falla, y los resultados se muestran en la tabla. Con base en esta informacin existe alguna razn para dudar acerca de la independencia entre la operacin de desplazamiento y la falla de la mquina?. Usese un nivel del 1% de significacin. Desplazamiento 1 2 3 Total Maq. A 10 15 12 Maq. B 12 8 9 Maq. C 8 13 14 Maq. D 14 8 12 Maq. E 8 11 10 Total

PROBLEMA N 9 Considere los siguientes datos, proponga y realice un test de hiptesis para verificar si los mismos provienen de una poblacin con distribucin normal 10,3 7,8 11,6 9,7 8,7 6,9 10,6 9,9 12,3 8,6 12,8 8,1 8,7 12,8 8,5 7,5 11,8 6,7 12,6 7,0 8,3 6,4 7,9 13,1 9,3 15,0 10,5 7,8 9,5 6,8 6,9 16,0 8,6 6,3 10,6 9,3 10,7 10,9 6,3 11,4 10,2 12,9 8,9 8,4 11,4 10,0 10,6 10,6 8,7 13,2 11,1 8,6 6,8 8,9 13,7 10,6 14,9 11,3 10,5 6,9 11,9 10,6 7,9 10,6 8,5 11,3 13,2 9,8 14,0 7,9 8,7 9,3 11,6 11,3 9,7 11,4 10,9 9,6 13,6 10,3 9,5 14,1 10,3 7,8 10,1 9,9 10,6 15,0 10,1 10,9 6,9 12,8 11,8 14,6 10,8 7,8 11,1 11,0 6,9 11,3

21

PROBLEMA N 10 Para comprobar que el fertilizante XX mejora el porcentaje de germinacin, se llev a cabo un experimento que consisti en sembrar 500 bandejas con 8 semillas de Carex flaca cada una. Despus de 120 hs. se agreg el fertilizante bajo estudio. Al cabo de 288 hs. se observ cuntas plantas haban crecido en cada bandeja. Los Resultados fueron: N de plantas 0 1 2 3 4 5 6 7 8 Nro. de bandejas 181 118 97 54 32 9 5 3 1 500

Es posible afirmar con el nmero de plantas presenta una distribucin binomial?

22

TRABAJO PRCTICO N 6
Se desarrollan los temas del programa curricular: 6.- Regresin lineal y correlacin Diagrama de dispersin. Modelo de regresin. Curva de regresin. Supuestos y estimacin. Intervalos de confianza para la pendiente y la ordenada al origen. Test de hiptesis para los coeficientes de la recta de regresin. Banda de confianza para la lnea de regresin. Correlacin: coeficiente de correlacin de Pearson (r). Test de significacin basado en r. Distincin entre un problema de regresin y un problema de correlacin. Procedimiento del anlisis de la Varianza. Prueba de linealidad de la regresin. Concepto de falta de ajuste. Grficas y transformaciones de datos. PROBLEMA N 1 a) Defina Covarianza muestral b) Defina Coeficiente de Correlacin de Pearson, indique que valores puede tomar y cmo se interpretan. c) Defina Estimador del Coeficiente de Correlacin de Pearson. d) Qu relacin se presenta entre los posibles valores que puede tomar el Coeficiente de Correlacin de Pearson y el grfico de dispersin? e) Indique las diferencias y similitudes que presentan los problemas de Correlacin con los problemas de Regresin. f) En un estudio de Correlacin plante los test de hiptesis que deberan realizarse. g) En un estudio de Regresin lineal, defina Coeficiente de Determinacin, indique que valores puede tomar y cmo se interpretan. h) En un estudio de Regresin lineal cuntos modelos matemticos conoce usted que pueden ser linealizados mediante transformaciones logartmicas o recprocas?, exprselos mediante ecuaciones y transfrmelos. i) En un estudio de Regresin lineal, cules son los parmetros del modelo terico?, cmo se estiman? j) En un estudio de Regresin lineal qu test de hiptesis deben realizarse sobre los parmetros del modelo? k) En un estudio de Regresin lineal, defina los intervalos de confianza que estiman los parmetros poblacionales l) En un estudio de Regresin lineal, defina el intervalo de confianza para y m)En un estudio de Regresin lineal, defina el intervalo de prediccin para y

23

PROBLEMA N 1 La tabla muestra el Coeficiente Intelectual (CI) de un grupo de personas y su capacidad lectora (HL)
CI HL 109 31, 8 138 24, 5 86 11, 8 153 18, 8 156 17, 3 40 11, 0 70 12, 2 126 20, 6 68 10, 8 99 5, 3 112 29, 3 13 8 8,0 103 35, 8 127 19, 6 63 21, 4

a) Realice un grfico de dispersin. Interprete. Qu valor de esperara usted encontrar? b) Encuentre la estimacin puntual de , interprete, coincide este valor con el que usted esperaba? c) Plantee y realice todos los test de hiptesis que usted considere importantes. PROBLEMA N 2 Los datos que se presentan corresponden a la presin sangunea y la edad de un grupo de personas que concurrieron al Hospital Centro de Salud luego de sufrir un accidente de transito Presin 15 16 0 0

Edad (aos) Menos de 20 20 a menos de 30 30 a menos de 40 40 a menos de 50 50 a menos de 80 Total

xi

100 1 7 2 2

11 0 7 26 13 3 1

12 0 20 62 65 14 4

13 0 9 51 47 11 4

14 0 2 14 18 20 6

17 0

18 0

19 0

20 0

21 0

Total

2 5 6

3 7 5

3 2 3

4 1 10 1 1 2

a) Presente la tabla de manera adecuada para poder realizar un estudio de correlacin b) Realice un grfico de dispersin. Interprete. Qu valor de esperara usted encontrar? c) Encuentre la estimacin puntual de , interprete, coincide este valor con el que usted esperaba? d) Plantee y realice todos los test de hiptesis que usted considere importantes.

24

PROBLEMA N 3 Una compaa local de energa selecciono una residencia tpica para desarrollar un modelo emprico para el consumo de energa (en kilowatts por da) como una funcin de la temperatura promedio diaria durante los meses de invierno. Se obtuvo la siguiente informacin durante un perodo de 15 das Temp. (C) Consum o 0 7 0 8 5 7 7, 13, 5 5 60 63 1 4 5 7 8, 4, -11 1, 0, 2 5 5 7,5 8,5 5 5 66 67 10 96 88 80 64 7 7 9 -6 -4 8 2 9 7

a) Qu estudio propondra usted realizar? b) Realice un grfico de dispersin. Interprete. Qu valor de esperara usted encontrar? c) Encuentre la estimacin puntual de , interprete, coincide este valor con el que usted esperaba? d) Si el estudio fuera de regresin que modelo matemtico propondra ajustar a los datos?, realcelo y calcule las estimaciones puntuales de los parmetros del modelo, del coeficiente de determinacin y Plantee y realice todos los test de hiptesis que usted considere importantes. e) Encuentre los intervalos de confianza para los parmetros del modelo f) Encuentre el intervalo de confianza para y g) Encuentre el intervalo de de prediccin para y PROBLEMA N 4 Para estudiar el efecto de la temperatura sobre el vigor durante la germinacin, se dispusieron semillas de alfalfa en germinadores a distintas temperaturas. A los 6 das se midi la longitud de las plntulas, obtenindose los siguientes datos: T (oC) 10 15 20 25 Longitud de Plantas (mm) 13 20 22 24 18 24 27 25 15 15 31 28 19 17 21 23 11 26 17

25

a) Qu diferencia hay en los datos de este ejercicio con respecto a los anteriores? b) Construir el diagrama de dispersin entre longitud de plntula y temperatura; qu valor de esperara obtener? es posible considerar que existe una tendencia lineal? c) Qu modelo propondra porque? d) Realizar un anlisis de regresin lineal, proponga diferentes modelos y aplquelos, trabaje con = 0.05 e) Encuentre los intervalos de Confianza y de Prediccin para y f) Qu temperatura permite obtener mayor vigor?

26

PROBLEMA N 5 Se ha diseado un experimento para estudiar la resistencia de un material plstico que es sometido a un proceso de calentamiento constante durante un perodo de tiempo. Para ello se han realizado pruebas en las que se ha sometido al material a una temperatura T constante durante t perodos de tiempo predeterminados. A continuacin se somete el material a unas pruebas de resistencia que se miden segn la variable Y. Los resultados de estas pruebas son los de la tabla adjunta.

A partir de todo lo estudiado en Regresin y en Correlacin proponga y realice un estudio adecuado para analizar el efecto que produce la temperatura en la resistencia del material.

27

EJERCICIOS ADICIONALES (No obligatorios) (Corresponden a prcticos de guas de trabajos prcticos de aos anteriores)

TRABAJO PRACTICO N1

TEMAS: Programa Excel. Definicin e ideas bsicas referentes a la poblacin y muestra. Fenmenos aleatorios. Poblacin estadstica. Muestras aleatorias y no aleatorias. Variables: clasificacin. Registro de datos. Distribucin de frecuencias para datos cualitativos y cuantitativos discretos. Representaciones Grficas: Diagrama de barras. Ciclograma. Grfico de Pareto. Grfico de frecuencias acumuladas. OBJETIVOS: A partir de las definiciones formales el estudiante debe ser capaz de reconocer en todos los problemas: poblacin, elemento unitario, muestra, variables (clasificacin). Debe ser capaz de construir distribuciones de frecuencias como as tambin realizar e interpretar los grficos adecuados para cada variable. NOTA1: PRACTIQUE EL USO DEL PROGRAMA EXCEL COMO CALCULADORA. LECTURAS RECOMENDADAS: SESION NOTA2: En todos los problemas se recomienda leer los enunciados y realizar las siguientes preguntas: El problema est claramente planteado? A partir de la informacin brindada es posible resolver el problema? Qu informacin obtiene del problema bajo estudio? Es posible generalizar los resultados?, Bajo qu condiciones los resultados del problema son vlidos? PROBLEMA N 1 La pinturera "Aeropuerto" de Av. Gobernador Gutirrez 1330 de nuestra ciudad hace un inventario de las latas de pintura para ubicarlas segn el color en diferentes estantes en febrero de 2003. El encargado realiza el siguiente registro: B N R V B B C B N B B B R V B C N C B B B B B B R B V R V N B C N N B B

Codificacin de los colores: B: blanco V: verde C: celeste R: rojo N: negro

1) Identifique poblacin fsica y poblacin estadstica. Variables involucradas y clasifquelas. 2) Una vez ingresados los datos en Excel obtenga la distribucin de frecuencias considerando: a) Los niveles de colores ordenados alfabticamente, b) considerando las frecuencias observadas en orden decreciente. Compare ambos casos e indique cul de ellos considera que es el adecuado para el estudio. Analice "mayora". Realice todos los grficos que este tipo de variable admite. Interprtelos. 3) A partir del grfico de Pareto responda cul o cules colores corresponden a la mayora de las latas.

28

4) A partir del grfico de Pareto, ingrese por el 75% del porcentaje acumulado responda a cul o cules colores corresponden este porcentaje. 5) El color ms frecuente es el color de la mayora de las latas? PROBLEMA N 2 Un fabricante de heladeras desea analizar cuales son los defectos ms frecuentes que aparecen en las unidades al salir de la lnea de produccin durante el mes de Enero de 2007. Para esto, empez por clasificar todos los defectos posibles en sus diversos tipos: Tipo de Defecto Otros problemas No enfra Burlete defectuoso Mala nivelacin No arranca Puerta no cierra Rayas externas Motor no detiene Total Nmero de veces que ocurre 12 39 35 2 8 3 3 44

1) Identifique poblacin fsica y poblacin estadstica. Variables involucradas y clasifquelas. 2) Una vez ingresados los datos obtenga la distribucin de frecuencias considerando para ello las frecuencias observadas en orden decreciente. Analice "mayora". Realice todos los grficos que este tipo de variable admite. Interprtelos. 3) A partir del grfico de Pareto responda cul o cules problemas corresponden a la mayora de los defectos. PROBLEMA N 3 Los siguientes datos corresponden al nmero de plantas de malezas por m2 observadas en una muestra de tamao n. Considere que cada una de las observaciones corresponde a 1 m2. 5 4 3 5 4 8 7 4 5 7 9 5 8 3 4 5 7 0 4 0 5 0 0 1 2 2 3 5 6 7

1) Identifique poblacin fsica y poblacin estadstica. Variables involucradas y clasifquelas. 2) Una vez ingresados los datos obtenga la distribucin de frecuencias. Analice "mayora". Realice todos los grficos que este tipo de variable admite. Interprtelos. 3) A partir de la distribucin de frecuencias responda: a) Qu cantidad de plantas de maleza presentan el 30% de las muestras?

29

b) Qu cantidad de plantas de maleza presentan la mayora de las muestras? c) Qu cantidad de plantas de maleza presentan a lo sumo el 40% de las muestras? d) Qu cantidad de plantas de maleza presentan a lo sumo el 85% de las muestras? e) Qu cantidad de plantas de maleza presentan por lo menos el 30% de las muestras? 4) A partir del grfico de frecuencias acumuladas responda: a) Qu cantidad de plantas de maleza presentan el 50% de datos centrales? b) Qu cantidad de plantas de maleza presentan la mayora de las muestras? PROBLEMA N4 Los siguientes datos corresponden al nmero de dientes por hoja en bulbos de ajo: 4 1 2 3 3 2 4 3 4 2 2 2 3 1 2 2 2 2 2 2 3 3 2 3 3

1) Identifique poblacin fsica y poblacin estadstica. Variables involucradas y clasifquelas. 2) Una vez ingresados los datos obtenga la distribucin de frecuencias. Analice "mayora". Realice todos los grficos que este tipo de variable admite. Interprtelos. 3) A partir de la distribucin de frecuencias responda: a) Qu cantidad de dientes presentan el 50% de los bulbos? b) Qu cantidad de dientes presentan la mayora de los bulbos? c) Qu cantidad de dientes presentan a lo sumo el 25% de los bulbos? d) Qu cantidad de dientes presentan a lo sumo el 75% de los bulbos? 4) A partir del grfico de frecuencias acumuladas responda: a) Qu cantidad de dientes presentan a lo sumo el 25% de los bulbos? b) Qu cantidad de dientes presentan a lo sumo el 80% de los bulbos?

TRABAJO PRACTICO N2
TEMAS: Distribucin de frecuencias para datos cuantitativos continuos. Histograma, polgono de frecuencias, grfico de frecuencias acumuladas. Anlisis exploratorio de datos: Diagrama de Tallo y hoja. Box-Plot.

30

Medidas de posicin para datos cuantitativos discretos y continuos: media aritmtica, mediana, modo, cuantiles. Medidas de dispersin para datos cuantitativos discretos y continuos: rango, varianza, desviacin estndar. Coeficiente de Variacin Relativa. Distribuciones simtricas y asimtricas. Coeficientes de Asimetra. OBJETIVOS: A partir de las definiciones formales el estudiante debe ser capaz de reconocer en todos los problemas: poblacin, elemento unitario, muestra, variables (clasificacin) y ser capaz de construir distribuciones de frecuencias, diagramas de tallo y hojas, calcular e interpretar medidas de posicin y de variabilidad como as tambin realizar e interpretar grficos adecuados para cada estudio. PROBLEMA N 1 Los siguientes datos corresponden al nmero de plantas de malezas por m2 observadas en una muestra de tamao n = 30. Considere que cada una de las observaciones corresponde a 1 m2. 5 4 3 5 4 8 7 4 5 7 9 5 8 3 4 5 7 0 4 0 5 0 0 1 2 2 3 5 6 7

Obtenga la distribucin de frecuencias y todos los valores de medidas de posicin y dispersin que el programa le permita. Interprete cada valor obtenido. PROBLEMA N 2 A continuacin se muestran los valores observados de la longitud del fololo en 30 hojas de garbanzo en mm. 3,0 3,1 2,6 2,7 2,3 2,6 2,9 2,9 3,1 3,5 2,9 2,8 2,8 3,0 3,1 3,3 2,7 2,5 3,4 3,3 2,8 2,9 3,1 3,2 3,2 3,1 2,5 3,0 3,4 3,1

1) Identifique: poblacin fsica y estadstica, variables y d su clasificacin. 2) Construya la distribucin de frecuencias, analice "mayora. Analice la existencia de datos anmalos.

Construya un Box-Plot. En caso de existir datos anmalos seprelos del lote de datos originales. Realice los Diagramas de Tallo y Hojas ms apropiados. Indique cualitativamente la simetra de la distribucin. Obtenga medidas de posicin y variabilidad. Calcule los Coeficientes de asimetra adecuados. 3) Interprete toda la informacin.

PROBLEMA N 3 Los pesos en mg de 96 larvas en cada estadio de una polilla forestal son: ESTADIO 1 0,47 0,05 0,25 0,46 0,31 0,84 ESTADIO 2 2,40 3,48 3,69 5,31 9,54 7,55 ESTADIO 3 22,74 3,63 8,17 8,56 3,93 23,12

31

1,43 0,49 4,52 2,92 0,14 1,76 0,18 0,69 0,00 0,20 0,75 3,02 0,29 1,68 0,37 0,06 0,72 0,09 0,10 0,69 0,00 0,77 0,10 0,14 0,90 0,00 1,25 2,50 2,05 1,82 1,76 2,87

0,91 0,23 0,06 0,27 1,87 1,26 0,82 0,00 0,00 1,57 0,04 0,36 0,01 0,20 0,00 0,05 0,53 0,86 0,00 0,04 0,00 0,47 0,12 0,07 2,94 0,92 0,03 0,01 0,05 0,76 0,39 1,06

5,35 3,01 1,98 1,88 12,47 11,24 5,43 7,29 3,88 4,19 3,34 11,69 2,98 1,36 2,97 1,93 3,84 2,33 3,02 5,02 5,25 9,29 2,83 6,31 1,61 5,89 6,49 8,35 4,22 2,95 2,61 4,85

8,33 2,89 4,64 9,59 7,13 3,29 7,16 0,35 2,81 9,33 3,01 6,65 6,44 5,94 5,43 3,09 9,22 5,28 2,25 2,19 3,97 4,15 2,81 3,75 0,73 2,59 3,83 2,92 6,40 5,50 7,22 5,60

9,82 7,59 8,33 12,49 7,74 23,73 6,79 8,28 6,46 11,99 14,52 18,25 13,62 8,74 8,53 9,61 2,83 13,69 10,83 8,10 9,49 3,16 10,64 5,13 10,18 4,18 6,04 17,87 5,97 5,18 10,19 7,96

5,44 14,41 2,63 6,52 17,35 10,24 12,34 6,81 4,17 8,38 4,87 5,46 10,45 17,90 3,44 10,03 4,54 10,88 4,68 5,32 14,40 10,83 5,54 9,75 6,51 9,93 9,10 11,80 15,05 12,49 5,48 6,68

32

0,24 0,00 0,00 0,28 0,39 1,06 0,11 1,00 0,01 0,37 0,56 1,20 0,40

0,84 0,12 0,51 1,87 0,75 0,03 1,80 0,56 0,85 0,05 0,05 0,53 0,02

4,46 10,67 1,75 0,92 1,46 4,51 2,35 5,47 4,07 14,67 1,40 5,07 3,43

4,29 4,68 2,32 3,93 5,11 3,03 3,46 2,05 1,67 4,45 3,47 5,76 1,75

11,19 15,34 5,14 11,01 7,48 10,19 10,95 12,87 13,67 7,56 9,12 10,93 22,87

10,45 11,35 9,58 5,56 8,52 7,73 7,02 5,56 16,14 10,95 5,22 11,05 20,70

1) Identifique: poblacin fsica y estadstica, variables y d su clasificacin. 2) Realice las distribuciones de frecuencias para cada estadio. 3) Grafique: Histogramas polgonos de frecuencias para cada estadio. 4) En un solo grfico grafique los polgonos de frecuencias para cada estadio Interprete. 5)En cada estadio: analice "mayora. Analice la existencia de datos anmalos a partir del Box-Plot. En caso de existir seprelos del lote de datos originales y realice los Diagramas de Tallo y Hojas ms apropiados. Indique cualitativamente la simetra de la distribucin. Obtenga medidas de posicin y variabilidad. Calcule los Coeficientes de asimetra adecuados. 6) Interprete toda la informacin. SUGERENCIA: INGRESE LOS DATOS EN EL PROGRAMA EXCEL

TRABAJO PRCTICO No 3

TEMAS: Espacio muestral. Variable aleatoria. Tipos de variables aleatorias. Distribucin de probabilidad, Distribucin de probabilidad acumulada. Esperanza Matemtica, Varianza. Propiedades. Desigualdad de Chebyshev. Distribuciones para variables discretas: Binomial (parmetros, momentos y aplicaciones de la distribucin binomial), Distribucin de Poisson (parmetros, momentos y aplicaciones). Distribuciones para variables aleatorias continuas: Uniforme (parmetros y momentos), distribucin Normal (caractersticas, ejemplos de aplicacin), distribucin Normal Estndar. Distribucin Exponencial (parmetros y momentos). Distribucin de Probabilidad Conjunta, Distribuciones de Probabilidad Marginal. Distribucin de Probabilidad Condicional. Independencia Estadstica. Covarianza, propiedades. PROBLEMA N 1

33

Para la regulacin hormonal de una lnea metablica, se inyecta un frmaco que inhibe la sntesis de protenas, a dos ratas albinas de 4 ratas numeradas. a)Qu tipo de seleccin aleatoria debera realizarse?. Marque algunas de las siguientes posibilidades:

Con reposicin

Sin reposicin

Con orden

Sin orden

b)Describa el espacio muestral, e indique qu cantidad de puntos muestrales contiene el mismo. c)Proponga y realice algn mtodo de conteo matemtico para calcular la cantidad de puntos muestrales del espacio. Coincide el valor encontrado con el valor del apartado b?. PROBLEMA N 2 En cierta especie de aves, se ha detectado una contaminacin apreciable de mercurio (Hg) en sangre. Para estudiar este problema se disea un estudio en el cual se consideran 10 muestras de sangre obtenidas de 10 aves distintas, numeradas y conservadas en heladera, y que consiste en seleccionar pares de muestras para el estudio, para la determinacin de mercurio se utilizan dos mtodos diferentes, aplicndose a la primera seleccin el primer mtodo y a la segunda seleccin el segundo mtodo. a)Qu tipo de seleccin aleatoria debera realizarse?. Marque algunas de las siguientes posibilidades:

Con reposicin

Sin reposicin

Con orden

Sin orden

b)Describa el espacio muestral, e indique qu cantidad de puntos muestrales contiene el mismo. c)Proponga y realice algn mtodo de conteo matemtico para calcular la cantidad de puntos muestrales del espacio. Coincide el valor encontrado con el valor del apartado b?.

PROBLEMA N 3 Para estudiar la produccin de semillas de abetos, se realiza el siguiente diseo: en cada abeto, se seleccionan siete ramas semejantes; cada rama recibe -al azar- uno exactamente de entre cuatro tratamientos, (A, B, C D), la variable medida es la cantidad de almidn obtenida de cada semilla de cada rama. I)Si se tienen en cuenta la rama seleccionada y el tratamiento que recibe: a)Qu tipo de seleccin aleatoria debera realizarse?. Marque algunas de las siguientes posibilidades:

Con reposicin

Sin reposicin

Con orden

Sin orden

34

b) Describa el espacio muestral, e indique qu cantidad de puntos muestrales contiene el mismo. c) Proponga y realice algn mtodo de conteo matemtico para calcular la cantidad de puntos muestrales del espacio. Coincide el valor encontrado con el valor del apartado b?. II)Si se tiene en cuenta el nmero de semillas de cada rama y la cantidad de almidn que contiene cada semilla, Cmo sera el espacio muestral?. Qu diferencia observa usted entre el espacio muestral propuesto en I) con el propuesto en II?. PROBLEMA N 4

i) j) PROBLEMA N 5

Enuncie la definicin de Probabilidad a Priori segn Laplace. Indique cual es el supuesto que se realiza en esta definicin. Enuncie los axiomas de Probabilidad.

En un lago, se censan 50 ejemplares de truchas juveniles. De ellos 40 son marcados con una pequea incisin en la aleta dorsal. Con el fin de estudiar la movilidad de la poblacin, se seleccionan -al azar- ejemplares en un ro situado a 150 km. Realice los clculos correspondientes a las siguientes situaciones: A) la probabilidad de seleccionar una trucha al azar- y que esta est marcada. B) se seleccionan -al azar- 20 ejemplares. Cul es la probabilidad de que la mitad estn marcados?. PROBLEMA N 6 En un estudio costero, se ha establecido que la probabilidad de que cierta especie de alga desarrolle una toxina es del 35%. Tambin se ha determinado que podra estar relacionada con la propiedad de Hiper-crecer de tal forma que el 30% desarrolla la toxina y presenta Hiper-crecimiento adems se observ que el 52% no presentaba la toxina y no Hiper-creca. Presente la informacin en una tabla de doble entrada y responda las siguientes preguntas: a) b) Cul es la probabilidad de seleccionar al azar un ejemplar y que este Hiper-crezca? Cul es la probabilidad de seleccionar al azar un ejemplar y que este no desarrolle la toxina y no presente Hiper-crecimiento?

c) Encuentre las probabilidades condicionales Horizontales y Verticales. Interprete todas y cada una de las
probabilidades encontradas. d) Es posible confirmar la hiptesis de que el desarrollo de la toxina esta relacionada con la propiedad de Hiper-crecer?. PROBLEMA N 7 a) b) c) d) e) Defina variable aleatoria e indique la diferencia que existe entre una variable aleatoria discreta y una variable aleatoria continua. Defina funcin de distribucin de probabilidad (fdp) para una variable aleatoria discreta. Defina funcin de distribucin de probabilidad acumulada (fdpa) para una variable aleatoria continua. Defina Esperanza Matemtica y Varianza. Presente todas las propiedades de la Esperanza Matemtica y de la Varianza con sus respectivas demostraciones. PROBLEMA N 8

35

En un estudio realizado para conocer las costumbres de cierta ave, se han examinado 95 rboles, dando los siguientes resultados experimentales: Nidos por rbol Nmero de rboles 0 13 1 27 2 22 3 16 4 12 5 5

i)

Encuentre la probabilidad A posteriori asociada al experimento.

j) Indique cual es la variable bajo estudio y si esta es discreta o continua. Justifique su respuesta.
k) l) Cul es la probabilidad de encontrar 2 nidos?. Cul es la probabilidad de encontrar por lo menos 2 nidos?.

m) Cul es la probabilidad de encontrar a lo sumo 3 nidos?.

n) P[X<3]; P[2 < X 4]; P[X> 1]


o) p) Encuentre la distribucin de probabilidad acumulada, a partir de la misma calcule nuevamente todas las probabilidades pedidas. Encuentre la Esperanza Matemtica y la Varianza. Interprete PROBLEMA N 9 Para estudiar la regulacin hormonal de una lnea metablica, se inyecta un frmaco que inhibe la sntesis de protenas, en ratas albinas. En general 6 de cada 20 ratas mueren a causa del frmaco. Qu distribucin de probabilidad regula la accin del frmaco?. Si se inyectan a 10 ratas con el frmaco: a) Presente en dos tablas diferentes las funciones de distribuciones de probabilidad y las funciones de distribuciones de probabilidad acumuladas, correspondientes a las variables aleatorias que indiquen Nmero de ratas vivas,y Nmero de ratas muertas. Qu particularidad observa en las mismas?. b)Cul es la probabilidad de que al menos 8 sigan vivas? b)Cul es la probabilidad de que a lo sumo 3 mueran? c)P[2 X < 8]; P[ X < 9]; P[X 4]; P[ 3< X 5 ] en el caso de que X indique el nmero de ratas vivas. d)P[2 X < 8]; P[ X < 9]; P[X 4]; P[ 3< X 5 ] en el caso de que X indique el nmero de ratas muertas. e) Encuentre las Esperanzas Matemticas y las Varianzas para ambos casos. Interprete dichos valores. f) Calcule nuevamente todas las probabilidades pedidas a partir de las tablas correspondientes a distribucin binomial. PROBLEMA N 10 Para verificar si se cumplen las normas establecidas para arrojar residuos al ro XX, un inspector visita al azar 10 de las 50 industrias establecidas en las mrgenes de dicho ro. Si en realidad 35 industrias no cumplen con algunas de las normas, cul es la funcin de probabilidad de la v. a. X = nmero de industrias que estn en infraccin?. Cul es la probabilidad de que a lo sumo 5 industrias cumplan con las normas?. Cul es la probabilidad de que por lo menos 7 industrias no cumplan con las normas?. Cul es el promedio esperado de industrias que cumplan con las normas?.

36

PROBLEMA N 11 En Drosophila Melanogaster (mosca de la fruta), 40 de cada 1000 espermatozoides presentan mutacin de rojo a blanco, respecto al color de los ojos. Qu distribucin regula la variable que indica el nmero de espermatozoides que presentan esta mutacin?. Cul es la probabilidad de que se observen mutaciones en por lo menos 10 de 100000 espermatozoides?. Cul es la probabilidad de que se observen mutaciones en a lo sumo 15 de 10000 espermatozoides?. Cul es el promedio esperado de espermatozoides con mutaciones en 200000? PROBLEMA N 12 Sea Z una v.a. con distribucin N(0,1), calcular: a) P (0 Z 2) b) P (|Z| 2,5) c) P (Z -1,3) d) c tal que P(Z < c) = 0,98 e) c tal que P(|Z| < c) = 0,90 f)el valor Z, para = 0,05; 0,01 y 0,001. PROBLEMA N 13 En cierta especie de aves, se ha detectado una contaminacin apreciable de mercurio (Hg) en sangre, que est distribuida normalmente con media 0,25 ppm en plasma y desviacin estndar de 0,08 ppm. Qu porcentaje de la poblacin total tendra un nivel de mercurio en sangre superior a 0,40 ppm?. Cuntos ejemplares, de 100, se espera que tengan un nivel de mercurio en sangre entre 0,20 y 0,40 ppm? Ejercicio No 14 En una fbrica, el 7% de las piezas que se fabrican son defectuosas. Se toma una muestra con reposicin de tamao 11. Hallar: a) la probabilidad de que no haya ninguna defectuosa en la muestra. b) la probabilidad de que haya ms sanas que defectuosas. c) la probabilidad de que haya al menos 2 defectuosas. a) el nmero promedio esperado de defectuosas. Ejercicio No 15 Una v.a. est uniformemente distribuida en el intervalo [0,10]. Utilizar la desigualdad de Chebyshev para acotar superiormente P(|X - 5| 4). Calcula exactamente esta misma probabilidad. Ejercicio No 16 Se sabe que 10 es el nmero promedio de pacientes que llegan por da al consultorio de un homepata. El horario de atencin del mdico cubre como mximo 15 pacientes por da. Cul es la probabilidad de que en un determinado da se deben rechazar pacientes para su atencin?.

37

Ejercicio No 17 Dada la variable X (X = volumen de sangre extrado), distribuida normalmente con media 5 ml y desviacin estndar 0,5, encuentre: a) P (X < 4,8). b) el valor de k tal que P (X < k) = 0,2236. c) el valor de k tal que P (X > k) = 0,1814. d) P (4,7 < X < 5,7). Ejercicio No 18 El tiempo que transcurre antes de que una persona sea atendida en un hospital es una variable aleatoria que tiene una distribucin exponencial con una media de 14 minutos. Cul es la probabilidad de que una persona sea atendida antes de que transcurran 12 minutos?. Ejercicio No 19 Se selecciona una probeta al azar de una caja que contiene 4 probetas: una de 10 ml, una de 50 ml, una de 100 ml y una de 250 ml. Cul es la probabilidad de que la capacidad de la probeta seleccionada sea de a lo sumo 100 ml?. Ejercicio No 20 El tiempo de vida til de un interruptor tiene una distribucin exponencial con = 2. a) Cul es la probabilidad de que el interruptor falle antes de los 3 primeros meses?. b) Cul es la probabilidad de que el interruptor falle a los 18 meses?. a) Cul es la probabilidad de que el interruptor falle a los 6 meses?.

PROBLEMA N 21 a) b) c) Defina funcin de distribucin de probabilidad conjunta, distribuciones de probabilidad marginales y condicionales. Defina E[XY], Cov(X,Y). Bajo que condiciones se consideran dos variables aleatorias independientes?

PROBLEMA N 22 Un Neurgolo esta interesado en analizar si existe alguna relacin entre el valor que toma el ndice de Hoehn y Yahr y la presencia de fatiga o no. Para ello realiza un estudio sobre 138 pacientes encontrando: Indice 1 1.5 2 2.5 Presencia de Fatiga Si 1 1 6 38 15 Ausencia de Fatiga No 2 5 4 19 8 Total 6 10 57 23

38

3 4 Total a) b) c) d) e)

24 9 93

8 1 45

32 10 138

Encuentre las funciones de distribucin de probabilidad: Conjunta, Marginales, Condicionales. Cul es la probabilidad de seleccionar al azar- un paciente y que este no presente fatiga y tenga un ndice mayor o igual a 2.5?. Cul es la probabilidad de seleccionar al azar- un paciente y que este tenga fatiga y un ndice de a lo sumo 2?. Cul es la probabilidad de seleccionar un paciente que tenga fatiga y presente un ndice de a lo sumo 2?. Proponga y realice un estudio adecuado para analizar si se observa relacin entre las variables bajo estudio.

39

TRABAJO PRACTICO NO 4
TEMAS: Inferencia Estadstica: Estadsticos, Estimadores y estimacin. Propiedades de un estimador. Estimacin por intervalos de confianza. Uso de Intervalos de confianza para comparaciones de grupos. PROBLEMA 1 Una mquina de refrescos est ajustada de tal manera que la cantidad de liquido despachada se distribuye aproximadamente en forma Normal, con = 0.15 decilitros. Encontrar el Intervalo de Confianza del 95% para la media de todos los refrescos que sirve esta mquina, si una muestra aleatoria de 36 refrescos tiene un contenido promedio de 2.25 decilitros. Indique los supuestos que realiza y exprese adecuadamente la expresin analtica del intervalo de confianza que utiliz. PROBLEMA 2 Una maquina produce piezas metlicas en forma cilndrica con una media requerida = 1,00 cm y un desvo = 0,02 se toma una muestra de tales piezas y se encuentra que sus dimetros son: 1,01 ab0,97 1,03 0,99 0,98 0,99 1,01 1,03 1,04

Encuentre la estimacin puntual de la media y la varianza para los dimetros. Si estos dimetros se encuentran normalmente distribuidos, determine si la media de stos difiere del valor requerido, para ello encuentre un intervalo del 95% de confianza para su estudio. Indique el Teorema que utiliza y exprese adecuadamente la expresin analtica del intervalo de confianza que utiliz. c- Encuentre el intervalo del 95% de confianza para la varianza, a partir del mismo es posible afirmar que la muestra cumple con las especificaciones requeridas?. Indique el Teorema que utiliza y exprese adecuadamente la expresin analtica del intervalo de confianza que utiliz. d- Represente grficamente el IC encontrado, en el mismo grafico represente media desvo, media 2desvo, media 3desvo. Qu concluye?. PROBLEMA 3 El tabaco es un producto que afecta al ser humano en distintas formas: insuficiencia cardiaca, cncer de pulmn, afecciones respiratorias y en el caso de mujeres embarazadas puede afectar al nio en distintas maneras. A tal efecto se llevo a cabo un estudio sobre 2 grupos de mujeres embarazadas unas FUMADORAS y otras NO FUMADORAS y se obtuvieron datos de los pesos de los nios al nacer, los resultados fueron: MADRES NO FUMADORAS n1= 35 MADRES FUMADORAS n2= 27

x1 = 3.6 kg
S1= 0.5 kg

x2

= 3.2 kg

S2 = 0.8 kg

En ambos grupos los pesos de los nios al nacer se consideran con distribucin Normal, calcular cuanto influye que la madre sea fumadora sobre el peso de su hijo. Realice un estudio adecuado. Indique el Teorema que utiliza y exprese adecuadamente la expresin analtica del /los intervalo /s de confianza que utiliz. PROBLEMA 4 Se realizo un estudio para determinar si un determinado tratamiento metlico tena algn efecto en la cantidad de metal eliminado en una operacin de inmersin en cido. Para ello una muestra de 9 piezas se sumergi en un bao durante 24 hs. A continuacin se presenta el peso en mg de metal removido de cada pieza: SIN TRATAMIENTO: 0,450 0,453 0,454 0,451 0,460 0,462 0,461 0,458 0,455 CON TRATAMIENTO: 0,400 0,402 0,408 0,409 0,405 0,404 0,407

a-

Encuentre los estimadores puntuales para la media y la varianza para ambos grupos.

40

b-

Encuentre los intervalos de confianza del 90%, 95 % y 96% de confianza para los parmetros de ambos grupos y compare. Indique el Teorema que utiliza y exprese adecuadamente la expresin analtica del /los intervalo /s de confianza que utiliz. Encuentre los intervalos de confianza para la diferencias de las medias y el intervalo de confianza para el cociente de las varianzas. Indique el Teorema que utiliza y exprese adecuadamente la expresin analtica del /los intervalo /s de confianza que utiliz. Indique cul es el Mtodo correcto que se debera aplicar en este estudio y porqu.

e-

c-

PROBLEMA N 5 Se lleva a cabo una prueba clnica para determinar si determinada inoculacin afecta la incidencia de una enfermedad. Para ello se conserv una muestra de 1000 ratas en un ambiente controlado durante un ao, 500 de las cuales fueron inoculadas. En el grupo al que no se le aplic la droga hubo 120 casos de esta enfermedad, mientras que en el grupo tratado con la droga 98 la contrajeron. Si p1 es la probabilidad de incidencia de la enfermedad en las ratas no tratadas y p2 la probabilidad de incidencia despus de que reciben la droga, calcule el IC de p1 p2. PROBLEMA N 6 El consumo regular de cereales preendulzados contribuye a la cada de los dientes, enfermedades del corazn y otros procesos degenerativos de acuerdo con estudios realizados por el Dr. J. Judben en Inglaterra. En una muestra de 20 porciones de cereales sencillos por un determinado mtodo se determin la cantidad de azcar presente en cada porcin. A continuacin se expresan los resultados obtenidos en mg. 11,5 12,6 ab19,0 12,8 20,0 18,0 11,0 16,2 20,7 16,5 21,0 17,8 17,3 12,3 20,7 14,6 11,5 15,2 11,0 15,6

Encuentre los estimadores puntuales para la media y la varianza. Asumiendo que la distribucin de la poblacin es normal y considerando una varianza conocida de 6.00, encuentre un Intervalo del 98% de Confianza para la media. c- Asumiendo que la distribucin de la poblacin es normal y considerando una varianza desconocida, encuentre un Intervalo del 98% de Confianza para la media. d- Encuentre un Intervalo del 98% de confianza para la varianza. e- Indique si el tamao de la muestra es el adecuado, asuma que la distribucin es normal y la varianza desconocida para e = 1% de la media y e = 10 % de la media. f- Sin realizar el supuesto de Normalidad, encuentre el Intervalo de Chevyshev y compare con b. PROBLEMA N 7 Un muestra de 8 cigarrillos de una marca determinada tiene un contenido promedio de nicotina de 2,6 miligramos y un desviacin estndar de 0,9 miligramos. Determine un intervalo del 99% de confianza para el contenido promedio real de nicotina de esta marca de cigarrillos en particular, asumiendo que la distribucin de los contenidos de nicotina son aproximadamente normales. PROBLEMA N 8 Se registraron los siguientes datos en das que representan los tiempos de recuperacin de pacientes tratados con dos medicamentos para aliviarlos de graves afecciones de la vescula: MEDICAMENTO 1 n1 = 14 X1 = 17 S21= 1,5 MEDICAMENTO 2 n2 = 116 X2= 19 S22=1,8

Proponga y realice un estudio adecuado con la finalidad de analizar si ambos medicamentos difieren significativamente en el tratamiento de dicha afeccin. PROBLEMA N 9

41

En una muestra aleatoria de n = 500 personas adultas y fumadoras cuyas edades oscilanentre 35 y 40 aos en la ciudad de Hamilton - Canad, se encontr que 340 de ellas haban dejado de fumar debido a que sufrieron afecciones de tipo respiratorios graves. abcEncuentre el Intervalo del 95 % de Confianza para la proporcin de personas que dejaron de fumar. Determine el error al estimar p. Se puede afirmar que el tamao de muestra es el adecuado?.

PROBLEMA N 10 Una firma productora de cigarrillos asegura que su marca A de cigarrillo sobrepasa en venta a la marca B en 8%. Si se encuentra que 42 de 200 fumadores prefieren la marca A y 18 de 150 la marca B, encuentre el Intervalo de un 98% de confianza para la diferencia entre las proporciones de ventas de las 2 marcas, indicando cual presupone usted que tiene mayor venta. PROBLEMA N 11 Una muestra aleatoria de 12 alumnas graduadas de una escuela de mecanografa presentaban un promedio de 79.3 palabras por minuto con una desviacin de 7.8 palabras por minuto. Suponiendo una distribucin normal, encuentre un Intervalo del 95% de Confianza para el nmero promedio de palabras escritas por minuto por las alumnas graduadas de esta escuela. PROBLEMA N 12 El gobierno otorg fondos a los departamentos de agricultura de 2 universidades para que probaran las capacidades de rendimiento de una nueva variedad de trigo. Dicha variedad se plant en 9 parcelas de igual superficie, pero el tratamiento a cada parcela fue de acuerdo al criterio de cada universidad, posteriormente se analizaron los rendimientos en kilogramos por parcela: Universidad A Universidad B

n1= 9 X1= 29 S21= 1,4

n2=9 X2= 38 S22= 1,7

Proponga y realice un estudio con la finalidad de analizar si el criterio para verificar el rendimiento de la nueva variedad de trigo por parte de ambas universidades difiere significativamente.

42

Trabajo Prctico N 5
TEMAS: Test de Hiptesis: Introduccin y conceptos bsicos. Tipos de hiptesis. Test unilaterales y bilaterales. Procedimiento estndar del test de hiptesis. Relacin de los dos tipos de errores. Aplicaciones: comparacin de medias para muestras independientes (test paramtricos). Comparacin de medias para muestras relacionadas. Test de homogeneidad de varianzas. Test de Bondad de Ajuste. Test de homogeneidad e independencia para tablas r x k. PROBLEMA No 1 Un agricultor desea probar un nuevo fertilizante, basndose en la propaganda de una revista de horticultura. Con este fin, en la siguiente cosecha utiliza el nuevo fertilizante en una de las plantas, en la que obtiene 12,5 Kg. de tomates. Utilice un test del 5% de significacin para saber si el rendimiento en esta planta mejoro. Utilice la siguiente informacin: a) produccin anterior 11.6 b)Produccin optima esperada por planta 12,8 Kg. c) Varianza conocida igual a 1,6 Kg2. d) n = 299 PROBLEMA No 2 Un mismo producto alimenticio se somete a diferentes tratamientos con la finalidad de aumentar el tiempo de vencimiento (das). Los resultados se presentan en la siguiente tabla: Tratamiento 1 62 60 63 59 55 Tratamiento 2 63 67 71 64 65 66 70 Tratamiento 3 68 66 71 67 68 68 74 Tratamiento 4 56 60 60 61 29 58 56

En cada uno de los siguientes apartados exprese bajo qu condiciones es posible realizar los clculos requeridos

a) Para cada tratamiento encuentre los estimadores puntuales de y 2. b) Para cada tratamiento realice los siguientes test de hiptesis (considere = 0,05)

Ho : 2 = 9 2 H1 : 9
c) d)

Ho : = 66das Ho : 66das

e)
f) g) h)

En aquellos casos en que no exista evidencia suficiente para rechazar Ho calcule el error de tipo II. Inteprete el valor encontrado. En aquellos casos en los que se rechaza Ho calcule los intervalos de confianza para decidir si los parmetros bajo estudio presentan valores mayores o menores que los propuestos en los test de hiptesis. Para cada tratamiento encuentre los tamaos de muestras ptimos, si prefijamos un

= 0,10. X

Indique cuantas comparaciones de a pares de grupos se pueden realizar Proponga y realice algn mtodo para comparar los grupos de a pares, utilice un nivel del 10% de significacin. Qu tratamiento seleccionara?. Porqu?.

PROBLEMA No 3

43

En un barrio de una ciudad que presenta altos niveles de contaminacin se quiere analizar su efecto sobre la salud. Se estudia si la contaminacin afecta por igual a nios adultos y ancianos. Se realiza un control mdico exhaustivo a personas que pertenecan a cada grupo y se propone un ndice que indica el grado de contaminacin, en el cul valores ms bajos indican mayor contaminacin. Los resultados se presentan a continuacin: Nios Adultos Ancianos 8,4 8,0 7,4 7,6 8,1 8,0 7,9 7,9 7,9 8,0 8,2 7,3 8,1 7,9 7,2 8,0 8,3 7,1 7,9 8,4 6,9 8,5 7,0 8,6 6,9 7,2 8,0

Para cada estudio pedido indique los supuestos que se deben cumplir para que los mismos sean vlidos. I) a)Para cada grupo encuentre los estimadores puntuales de media y varianza. b)Proponga y realice algn mtodo para responder la siguiente pregunta: Afecta la contaminacin de la misma manera a los tres grupos de edad?. Utilice =0,05. II)Si por estudios previos se conoce que el valor de 7,9 del ndice podra indicar riesgo de salud: i)Estime la proporcin de individuos de cada grupo que presentan valores iguales o inferiores a 7,9.

ii) para cada grupo realice el siguiente test de Hiptesis

Ho : p = 0,80 Ho : p 0,80

iii) compare las proporciones de nios y adultos respecto al de ancianos. Utilice un nivel del 5% de significacin. iv) Es posible considerar que la edad es un factor de riesgo?. Problema No 4 En una investigacin de laboratorio se emplean cmaras de crecimiento para estudiar el desarrollo de ciertos microorganismos cuando se varan las concentraciones de CO2 (baja y alta), y la temperatura (baja, media y alta). En distintas cmaras se cruzan todos los niveles de los dos factores y se obtienen tres replicas completas del experimento. La siguiente tabla muestra los crecimientos medios que se obtienen para cada combinacin de los dos factores: Temperatura baja media alta

CO2-baja CO2-alta

51 59

54 46

42 48

Con esta informacin, conteste a las siguientes preguntas a)Existe evidencia estadstica de que la concentracin de CO2 influye en el crecimiento?. = 0,05. b) si su respuesta es positiva estudie las distribuciones condicionales. Interprete. Problema No 5

44

Considere que los siguientes valores corresponden a la cantidad de mazorcas recolectadas por hectarea en una finca. Los datos se muestran en la siguiente tabla: N de mazorcas 30 a 40 41 a 51 52 a 62 63 a 73 74 a 84 85 a 95 Total frecuencia observada 6 17 76 68 22 9 198

Es posible afirmar a un nivel del 2% de significacin que la distribucin corresponde a una funcin de distribucin binomial?. Problema No 6 Como paso previo a la elaboracin de un Protocolo se quiere enviar un cuestionario a toda la poblacin sobre preocupacin por los problemas medioambientales locales. Para organizar el estudio se enva primero el cuestionario a una muestra de 70 vecinos y para cada vecino se registra el valor de X = Nmero de das transcurridos hasta la entrega de las respuestas". Los datos obtenidos se resumen en la siguiente tabla: Nmero de das transcurridos Nmero de cuestionarios recibidos 1 14 2 23 3 12 4X 6 12 X 7 9

b) a) Se ajusta la variable a una distribucin binomial con p= 0,37 y n=9?


c) Se ajusta la variable a una distribucin Poisson con media 3.3? Utilice un nivel de significacin 0,01. Problema No 7 Por un contador de partculas radiactivas pasan 0, 229, 211, 93, 35 y 7 partculas en 0, 1, 2, 3, 4, 5 milisegundos respectivamente. Obedecen los datos de los milisegundos a una distribucin Poisson? Utilice un nivel de 1% de significacin. PROBLEMA 8 En el Hospital de Santa Ana de nuestra provincia un medico hizo un estudio con la finalidad de determinar si existe alguna relacin entre el habito de fumar y la hipertensin arterial , a tal efecto se estudiaron 300 pacientes obtenindose los siguientes resultados: no fumadores fumadores moderados fumadores en exceso

con hipertensin sin hipertensin

0 10

60 140

90 0

1.- Realice un test de Independencia al 10% de significancia e interprete. 2.-En caso que tenga sentido realice un estudio de distribuciones condicionales e interprete. 3.-Es posible concluir que el estudio es efectivo?.

45

TRABAJO PRACTICO N 6
TEMAS: 6.- Regresin lineal y correlacin .Diagrama de dispersin. Modelo de regresin. Curva de regresin. Supuestos y estimacin. Intervalos de confianza para la pendiente y la ordenada al origen. Test de hiptesis para los coeficientes de la recta de regresin. Banda de confianza para la lnea de regresin. Correlacin: coeficiente de correlacin de Pearson (r). Test de significacin basado en r. Distincin entre un problema de regresin y un problema de correlacin. Procedimiento del anlisis de la Varianza. Prueba de linealidad de la regresin. Concepto de falta de ajuste. Grficas y transformaciones de datos. En los problemas que se presentan a continuacin, se pide: a) Encontrar el diagrama de dispersin. Indicar el valor del coeficiente de correlacin de Pearson que esperara encontrar. b) Analizar si el problema es de Regresin o de Correlacin. Justificar adecuadamente. c) Si el problema es de Correlacin, encontrar: i) Estimador del coeficiente de Correlacin de Pearson. Interprete. ii) Utilizando un nivel del 5% de significacin, realice los tests de Hiptesis que usted considere importantes. d) Si el problema es de Regresin: i) A partir del grfico de dispersin, proponga un modelo matemtico que considere adecuado. ii) Identifique los parmetros del modelo. Encuentre los estimadores puntuales de los mismos. iii) Encuentre los intervalos del 95% y 98% de confianza para los parmetros del modelo. Interprete. iv) Proponga y realice los tests de Hiptesis que considere importantes. Interprete. v) A partir de dos mtodos distintos encuentre el coeficiente de determinacin. Interprete. vi) Teniendo en cuenta los apartados anteriores, proponga el modelo estimado y el coeficiente de determinacin estimado. A continuacin realice las estimaciones solicitadas en cada problema.

46

1) En el siguiente cuadro se muestra la longitud del perodo embrionario (en das) del saltamontes de la patata Empoasca fabae, desde huevo hasta adulto a diversas temperaturas constantes controladas (Kouskolekas y Decker, 1966). Temperatura, F Longitud media del perodo embrionario en das, Y1 57,9 27,6 29,0 26,6 18,9 18,8 16,7 16,0 15,2 14,0 14,6 14,4 15,1 Longitud media del perodo embrionario en das, Y2

Promedio de Y

60,0 68,0 70,0 71,0 74,0 75,0 78,8 80,0 81,0 83,0 88,0 92,0 93,0

58,3 27,0 24,6 26,0 19,3 19,2 16,3 15,8 14,4 14,4 14,2 14,8 15,5

Analizar e interpretar Estimar puntualmente y por intervalo del 98% de confianza el valor de la longitud media del perodo embrionario.

47

2) Los valores de la tabla representan medias de localidad basadas en tamaos de muestreo idnticos para 23 localidades del este de Norteamrica. Las variables, obtenidas de Sokal y Thomas (1965) se expresan en milmetros: Y1 = longitud de la tibia, Y2 = longitud del tarso. Nmero de cdigo de localidad 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 Y1 Y2

3) La siguiente tabla de datos es de un estudio morfomtrico no publicado del chopo de La Carolina Populus deltoides, realizado por T.J. Crovello. Se midieron 26 hojas de un rbol cuando estaban frescas y despus de secarse. Las variables representadas son: ancho de la hoja fresca (Y1) y ancho de la hoja seca (Y2), ambas en milmetros.
Y1 Y2 88 87 52 95 83 88 77 75 109 95 105 78 71 97 105 90 98 100 92 82 106 97 98 91 76 97

0,631 0,140 0,644 0,139 0,612 0,140 0,632 0,141 0,675 0,155 0,653 0,148 0,655 0,146 0,615 0,136 0,712 0,159 0,626 0,140 0,597 0,133 0,625 0,144 0,657 0,147 0,586 0,134 0,574 0,134 0,551 0,127 0,556 0,130 0,665 0,147 0,585 0,138 0,629 0,150 0,671 0,148 0,703 0,151 0,662 0,142

90 88 55 100 86 90 82 78 115 100 110 84 76 100 110 95 99 104 92 80 110 105 101 95 80 103

48

4) En un estudio acerca de la cantidad de precipitacin pluvial y la cantidad de contaminacin de aire eliminada, se obtuvieron los siguientes datos:

Lluvia diaria, x (0,01 cm) 4,3 4,5 5,9 5,6 6,1 5,2 3,8 2,1 7,5

Partculas eliminadas, y (mg / m3) 126 121 116 118 114 118 132 141 108

Estime la cantidad de partculas removidas cuando la precipitacin pluvial diaria es x = 4,8 unidades.

5) La presin P de un gas correspondiente a diferentes volmenes V se registr de la siguiente manera:

V (cm3) P (kg/cm2)

50 64,7

60 51,3

70 40,5

90 25,9

100 7,8

La ley de los gases ideales la da la ecuacin PV = C, donde y C son constantes.

Estime puntualmente y con intervalos del 95% de confianza P cuando V = 80 centmetros cbicos.

6) El Department of Materials Engineering en la Virginia Polytechnic Institute and State University dise un experimento para estudiar las propiedades del hidrgeno con base en las mediciones de la presin electroltica.

49

La solucin utilizada fue NaOH 0,1 N, un tipo de acero inoxidable. La densidad de corriente de carga catdica se control y se modific en cuatro niveles. Se observ la presin efectiva de hidrgeno como respuesta. Los datos son los siguientes: Densidad de corriente de carga, x (mA/cm2) 0,5 1,0 1,5 2,5 3,5 Presin efectiva Presin efectiva Presin efectiva Presin efectiva de hidrgeno, y1 de hidrgeno, y2 de hidrgeno, y3 de hidrgeno, y4 (atm) (atm) (atm) (atm) Promedio(y)

86,1 174,3 223,6 413,5 493,7

92,1 152,4 202,1 231,5 382,3

64,7 87,3 132,9 466,7 447,2

74,7 81,2 129,8 365,3 563,8

Analizar e interpretar. Estimar puntualmente y por intervalo del 98% de confianza para una densidad de corriente de carga de 1,80. 7) Los siguientes datos representan las calificaciones de qumica para una muestra aleatoria de 12 estudiantes de primer ao de determinada institucin de enseanza superior, junto con sus calificaciones en un examen de inteligencia aplicado cuando an cursaban el ltimo ao de secundaria:

Estudiante 1 2 3 4 5 6 7 8 9 10 11 12

Calif. Examen, x 65 50 55 65 55 70 65 70 55 70 50 55

Calif. Qumica, y 85 74 76 90 85 87 94 98 81 91 76 74

tYtYt

50