Sie sind auf Seite 1von 138

Vicerrectora Acadmica Cuaderno de Apuntes 2010

CUADERNO DE APUNTES DEL ESTUDIANTE

Inferencia Estadstica
Tampoco es inescrutable el azar, tambin est regido por un orden.

PRESENTACIN Este cuaderno corresponde al mdulo Inferencia estadstica, que debe llevar al estudiante a ser capaz de: Realizar pruebas de hiptesis estadsticas en el mbito de los fenmenos econmicos, financieros, comerciales, administrativos y sociales, demostrando capacidad para analizar e interpretar resultados numricos estadsticos en contextos especficos. El cuaderno est organizado en 14 CLASES. En cada una de ella se trata un tema relevante del programa y por eso, todas se inician con la descripcin de los aprendizajes esperados que debe lograr el estudiante. Cada se clase se estructura en las siguientes secciones: 1: Sntesis: es un resumen de los conceptos centrales involucrados en los aprendizajes de la clase. Asimismo, se encuentran las principales frmulas y relaciones numricas que sustentan la Estadstica. 2: Ejercicios resueltos: en esta seccin se plantean ejercicios, problemas y casos representativos de la clase y se resuelven en detalle. 3: Ejercicios propuestos: se plantean problemas aplicados en forma de preguntas de seleccin mltiple. A final de cada clase se encuentran las claves correctas. Esta seccin le permitir al estudiante ejercitar los aprendizajes de la clase y podr autoevaluar su desempeo. 4: Fuentes complementarias: en esta parte se sugieren fuentes de informacin alternativos, donde el estudiante podr encontrar informacin y ejercicios. En esta misma, adems, se sugieren actividades de aprendizaje complementarias para quienes se interesen. Problemas de recapitulacin: Al final del cuaderno se presentan una coleccin de casos para su resolucin, orientados a la preparacin del examen de mdulo. Uso de calculadora: Para trabajar con el presente cuaderno, el o la estudiante debe usar calculadora cientfica. En este apunte se considera una calculadora Casio fx-350MS, cuyo uso debe serle familiar. Inferencia estadstica: Inferir es sacar una conclusin a partir de algunas premisas iniciales. Por eso es posible distinguir dos clases de inferencia; la deductiva, que va desde lo general a lo particular y la inductiva, que procede desde lo particular a lo general. Como la inferencia estadstica se concretiza a travs de hacer afirmaciones acerca de una poblacin a partir de datos de una muestra, esta constituye, en concreto, un caso de inferencia inductiva. En una inferencia inductiva, la conclusin se apoya en las premisas obtenidas de casos particulares, pero stas, en el mejor de los casos, solo la hacen probable. De aqu que la teora de la probabilidad se erija en el pilar de la inferencia estadstica. Por este motivo, en este cuaderno, primero se establecen las bases del clculo de probabilidades y luego, en una segunda unidad, se desarrollan las aplicaciones bsicas de los mtodos de inferencia ms usuales en la estadstica.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

ndice
PROGRAMA CLASE 1: Introduccin al clculo de probabilidades CLASE 2: Probabilidad de sucesos condicionales CLASE 3: El modelo de probabilidad binomial CLASE 4: El modelo de probabilidad de Poisson CLASE 5: El modelo de probabilidad normal CLASE 6: Conceptos bsicos de inferencia estadstica CLASE 7: Intervalos de confianza para la media CLASE 8: Intervalos de confianza para la proporcin CLASE 9: Clculo del tamao de la muestra CLASE 10: Introduccin al contraste de hiptesis CLASE 11: Contraste de hiptesis de proporciones CLASE 12: Contraste de la diferencia de proporciones CLASE 13: Contraste de hiptesis de la media CLASE 14: Contraste de la diferencia de medias PROBLEMAS DE RECAPITULACIN TABLA 1: Probabilidad inferior en distribucin Z TABLA 2: Probabilidad superior en distribucin Z TABLA 3: Percentil de distribucin t TABLA 4: Probabilidad superior de distribucin t 3 5 16 25 31 37 47 55 63 71 80 89 98 107 118 127 133 134 135 136

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

I: IDENTIFICACIN NOMBRE DEL MDULO: UNIDAD DE COMPETENCIA: INFERENCIA ESTADSTICA Al finalizar el mdulo los participantes sern capaces de: Realizar pruebas de hiptesis estadsticas en el mbito de los fenmenos econmicos, financieros, comerciales, administrativos y sociales, demostrando capacidad para analizar e interpretar resultados numricos estadsticos en contextos especficos. 72 horas pedaggicas

DURACIN:

II: DESCRIPCIN POR REA DE FORMACIN Y PRERREQUISITO rea de formacin: general diferenciada Ubicacin: depende de la carrera Prerrequisito: depende de la carrera III: UNIDADES DE APRENDIZAJE 1 UNIDAD: Fundamentos del clculo de probabilidades DURACIN: 24 horas pedaggicas Aprendizajes Esperados -Explican el concepto de probabilidad y suceso aleatorio. -Aplican la definicin clsica de probabilidad al clculo de probabilidad simple en casos sencillos. -Identifican los axiomas y teoremas bsicos de las probabilidades. -Traducen eventos del lenguaje corriente al lenguaje algebraico y viceversa, en el contexto de problemas de aplicacin. -Resuelven problemas que involucran el clculo de probabilidad simple. -Resuelven problemas que involucran el clculo de probabilidad de sucesos contrarios. -Resuelven problemas que involucran el clculo de probabilidad de sucesos mutuamente excluyentes. -Resuelven problemas que involucran el clculo de probabilidad de sucesos independientes. -Resuelven problemas que involucran el clculo de probabilidad de sucesos condicionales. -Calculan el valor esperado y la varianza de una distribucin de probabilidad. -Identifican el modelo de probabilidad binomial y los parmetros que lo definen. -Resuelven problemas que involucran operar con el modelo de probabilidad binomial. -Identifican el modelo de probabilidad de Poisson y los parmetros que lo definen. -Resuelven problemas que involucran operar con el modelo de Poisson. -Identifican el modelo de probabilidad normal y los parmetros que lo definen. - Identifican el modelo de probabilidad normal estndar y los parmetros que lo definen. -Calculan rea bajo la curva normal utilizando tablas de la curva normal estndar. -Calculan percentiles de la distribucin normal estndar mediante tabla. Contenidos -Sucesos aleatorios y concepto de probabilidad -Definicin clsica de la probabilidad -Axiomtica de probabilidades -lgebra de eventos -Clculo de probabilidad de sucesos: simples contrarios mutuamente excluyentes independientes condicionales

-Concepto de valor esperado y varianza. -Modelos de probabilidad discreta: binomial Poisson.

-Modelos de probabilidad continua: curva normal. curva normal estndar. -Clculo de probabilidades y percentiles con la curva normal estndar.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2 UNIDAD: Teora elemental de muestreo e intervalos de confianza DURACIN: 16 horas pedaggicas Aprendizajes Esperados -Explican el concepto de muestreo. -Identifican distribucin muestral de medias y su relacin con la normal. -Explican el concepto de error y confianza. -Explican el concepto de error muestral. -Identifican el concepto de estimacin, demostrando conocimiento de los distintos parmetros y sus respectivos estadgrafos. -Calculan el error estndar para la media con datos muestrales dados. -Explican la influencia del tamao de la muestra en el error. -Calculan intervalos de confianza para la media con varianza conocida. -Calculan el error estndar de proporciones con datos muestrales dados. -Calculan intervalos de confianza para la proporcin poblacional con muestra grande. -Calculan el tamao de muestra para un intervalo de confianza con error dado. Contenidos -Concepto de muestreo y los estadsticos muestrales como variable aleatoria. -Concepto de confianza y error. -Concepto de error muestral o estndar. -Concepto de estimacin y de estimacin por intervalos. -Clculo del error muestral para la media con varianza conocida. -Clculo de intervalos de confianza para la media con varianza conocida. -Clculo del error muestral para una proporcin. -Clculo de intervalos de confianza para una proporcin. -Tamao de la muestra

3 UNIDAD: Dcimas de hiptesis DURACIN: 32 horas pedaggicas Aprendizajes Esperados -Identifican concepto de hiptesis estadstica. -Explican los errores de tipo I y de tipo II presentes en una decisin. -Identifican hiptesis nula y alternativa en casos dados. -Plantean correctamente hiptesis estadsticas (H0 y H1). -Identifican los pasos de la metodologa clsica de docimasia de hiptesis. -Identifican ensayos de cola izquierda, cola derecha y de dos colas en situaciones dadas. -Realizan pruebas de hiptesis para proporciones. -Analizan e interpretan los resultados de la dcimas de hiptesis de proporciones en el contexto de casos dados. -Realizan pruebas de hiptesis para la diferencia de proporciones. -Analizan e interpretan los resultados de la dcimas de hiptesis de diferencia de proporciones en el contexto de casos dados. -Realizan pruebas de hiptesis para la media con varianza conocida. -Realizan pruebas de hiptesis para la media con varianza desconocida. -Analizan e interpretan los resultados de la dcimas de hiptesis de medias en el contexto de casos dados. -Realizan pruebas de hiptesis para la diferencia media con varianzas iguales y desconocidas. -Analizan e interpretan los resultados de la dcimas de hiptesis para la diferencia media con varianzas iguales y desconocidas en el contexto de casos dados. Contenidos -Hiptesis. -Error tipo I y tipo II. -Concepto de nivel de significacin. -Planteamiento de hiptesis estadsticas -Metodologa general para la prueba de hiptesis.

-Pruebas de hiptesis para proporciones. -Pruebas de hiptesis para la diferencia de proporciones. -Prueba de hiptesis para la media con varianza conocida. -Prueba de hiptesis para la media con varianza desconocida. -Prueba de hiptesis para la diferencia media con varianzas iguales y desconocidas.

IV: BIBLIOGRAFA -Mendenhall/Beaver/Beaver. Introduccin a la probabilidad y estadstica. Edit. Thomson, 2002. ISBN: 970-686-195-5. -Ross, Sheldon M. Introduccin a la estadstica. Revert, 2007. ISBN: 8429150390.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1 UNIDAD: FUNDAMENTOS DEL CLCULO DE PROBABILIDADES CLASE 1

Introduccin al clculo de probabilidades


Dios juega a los dados y... Adems los tiene trucados!. I. Prigogine 1

APRENDIZAJES ESPERADOS
-Explican el concepto de probabilidad y suceso aleatorio. -Aplican la definicin clsica de probabilidad al clculo de probabilidad simple en casos sencillos. -Identifican los axiomas y teoremas bsicos de las probabilidades. -Traducen eventos del lenguaje corriente al lenguaje algebraico y viceversa, en el contexto de problemas de aplicacin. -Resuelven problemas que involucran el clculo de probabilidad simple. -Resuelven problemas que involucran el clculo de probabilidad de sucesos contrarios. -Resuelven problemas que involucran el clculo de probabilidad de sucesos mutuamente excluyentes. -Resuelven problemas que involucran el clculo de probabilidad de sucesos independientes.

CONTENIDOS
-Sucesos aleatorios y concepto de probabilidad -Definicin clsica de la probabilidad -Axiomtica de probabilidades -lgebra de eventos -Probabilidad simple -Clculo de probabilidad de sucesos: simples contrarios mutuamente excluyentes independientes

II.

DESARROLLO

1. Concepto de probabilidad 1.1. Probablemente: Segn Max Black 2, la palabra `probablemente implica posiblemente y excluye seguramente. Lo que es probable ni es seguro, ni imposible. Todo el que dice que probablemente extraer una bola negra de una urna, implica que es posible que se extraiga tal bola y tambin que no es seguro que vaya a ser as. 1.2. Probabilidad: Es el grado de verosimilitud que se le atribuye a un enunciado, o el grado de certeza o confianza que pueden tener nuestras creencias acerca de sucesos futuros. La probabilidad tambin puede expresarse mediante un valor numrico y, en ese caso, la probabilidad es una medida de la posibilidad de un acontecimiento, expresada mediante un nmero real que va entre cero y uno. 2. Experimento aleatorio Un experimento aleatorio es una accin que da origen a un fenmeno en cuyos resultados interviene el azar. En estos fenmenos, se pueden conocer todos los resultados posibles, pero no se puede predecir cul de ellos ocurrir. Un experimento aleatorio se puede repetir todas las veces que se desee, pero sus resultados particulares no se pueden predecir. Los experimentos aleatorios suele representarse por la letra E.
1 Con esta frase, Ilya Prigogine, premio Nbel de qumica 1977, responde a Einstein la clebre frase Dios no juega a los dados. La idea de Einstein es dar a entender que el azar y la incertidumbre del mundo, no es sino prueba de la limitacin del hombre para comprender el mundo natural regido por leyes inflexibles. Prigogine, sin embargo, aboga por la concepcin de un mundo azaroso, movedizo, impredecible. Sus ideas han sido centrales en la elaboracin de la llamada Teora del Caos. 2 Induccin y probabilidad, Ctedra, Madrid 1984.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Por ejemplo, en el lanzamiento de un dado para observar qu nmero resulta, se puede determinar el conjunto de resultados posibles (1, 2, 3, 4, 5, 6), pero no es posible predecir cul de ellos resultar en determinado lanzamiento. 3. Espacio muestral () Es el conjunto de todos los resultados posibles de un experimento aleatorio. Se representa por la letra griega . Ejemplo: Experimento: E = lanzamiento de un dado Espacio muestral: 4. Suceso aleatorio Un suceso o evento es cualquier subconjunto del espacio muestral . Generalmente se representan mediante las primeras letras maysculas: A, B, C, etc. Ejemplo: Experimento: E = lanzamiento de un dado. Espacio muestral: Suceso A: = {1, 2, 3, 4, 5, 6} A = se obtiene nmero par. A = {2, 4, 6} = {1, 2, 3, 4, 5, 6}

5. Tipos de sucesos 5.1. Sucesos simples y compuestos: Sucesos simples: Cuando un evento puede ocurrir de una sola forma. Sucesos compuestos: Cuando un suceso puede ocurrir de diversas formas. Un suceso compuesto, a su vez, puede dividirse en varios eventos simples. Ejemplo: Lanzar un dado y observar si resulta un nmero par: Este suceso est compuesto por los siguientes sucesos simples: Resulta el 2. Resulta el 4. Resulta el 6. Entonces: Resulta nmero par = Resulta el 2 o resulta el 4 o resulta el 6. 5.2. Suceso seguro: Es aquel que siempre se verifica como resultado de un experimento aleatorio. A = Obtener un nmero entero del 1 al 6 al lanzar un dado normal. A es un suceso seguro. 5.3. Suceso imposible: Es aquel que nunca se verifica como resultado de un experimento aleatorio. A = Obtener un nmero mayor que 6 al lanzar un dado normal. A es un suceso imposible. 5.4. Suceso complementario o contrario: Dos sucesos son contrarios si uno es la negacin lgica del otro. A = Obtener N6 al lanzar un dado. B = No obtener N6 al lanzar un dado. Ay B son sucesos contrarios. Suelen representarse por A y A, respectivamente.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3.5. Sucesos mutuamente excluyentes: Dos o ms sucesos son mutuamente excluyentes si no pueden ocurrir en forma simultnea. A = Se obtiene N3 al lanzar un dado. B = Se obtiene N4 al lanzar un dado. A y B son sucesos mutuamente excluyentes. No pueden ocurrir ambos a la vez en el mismo experimento. OBSERVACIN: Los sucesos contrarios son mutuamente excluyentes, pero, no todos los sucesos mutuamente excluyentes son contrarios. 5.6. Sucesos independientes: Dos o ms sucesos son independientes si la ocurrencia de uno de ellos no afecta la probabilidad de ocurrencia del otro. A = Se obtiene N3 al lanzar un dado. B = Se obtiene sello al lanzar una moneda. A y B son sucesos independientes. 5.7. Sucesos condicionales: Dos sucesos A y B son condicionales si la probabilidad de ocurrencia del suceso B est condicionada a la ocurrencia de un suceso anterior A.

6. Probabilidad de sucesos 6.1. Probabilidad de Laplace: La probabilidad de que ocurra un suceso A se cuantifica a travs de la razn entre el nmero de casos favorables al suceso A y el nmero total de casos posibles. Numricamente puede expresarse como fraccin, como decimal o como tanto por ciento.
P( A ) = N de casos favorables al suceso A N de casos posibles

6.2. Enfoque de la probabilidad a priori: Consiste en determinar la probabilidad de un suceso que an no ha sucedido. Ejemplo: Cul es la probabilidad de obtener un nmero impar al lanzar una vez un dado normal? Casos favorables: 3. Casos totales: 6. Entonces, aplicando la frmula de Laplace: 3 1 P(N impar) = = . 6 2

6.3. Enfoque de la probabilidad emprica: Consiste en determinar la probabilidad de un suceso con los datos histricos de casos sucedidos. Es decir, se cuenta con antecedentes empricos.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Ejemplo: Se han lanzado dos monedas 25 veces, registrando los siguientes resultados: Suceso Cara Cara Sello Cara Cara Sello Sello Sello Total Cul es la probabilidad de obtener dos sellos? Casos favorables: 6 Casos totales: 25 Entonces, aplicando la frmula de Laplace: P(2 sellos) =
6 = 0,24. 25

N de observaciones 4 7 8 6 25

7. lgebra de sucesos 7.1. Notacin: Si A y B son sucesos en el espacio muestral . Entonces, hay sucesos bsicos cuya representacin algebraica es la que se presenta en el siguiente cuadro. Suceso A A (A o B) (A y B) (A B) (B / A) No ocurre A. Ocurre A o B. Ocurren A y B, ambos. Ocurre A y no ocurre B. Ocurre B, dado que ocurri A Significado Ocurre el suceso A.

7.2. Diagramas de sucesos: Si A y B son sucesos en el espacio muestral , con el espacio muestral representado por un rectngulo y los sucesos por crculos. Entonces, la representacin grfica de los sucesos bsicos es:

Lo sombreado

Significado Ocurre el suceso A.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Lo sombreado

Significado NO ocurre el suceso A.

Lo sombreado

Significado Ocurre el suceso A o el B

AoB

Lo sombreado

Significado Ocurren A y B, ambos.

B
AyB

Lo sombreado

Significado Ocurre A, pero no ocurre B

A-B

7. Axiomas y teoremas de la probabilidad Si A y B son sucesos en el espacio muestral y P(A) y P(B) sus respectivas probabilidades, entonces se verifican los siguientes axiomas y propiedades: 7.1. Valores extremos de P:
0 P( A ) 1

La probabilidad de un suceso es un nmero real con un valor entre cero y 1, ambos valores inclusive. 7.2. Probabilidad del suceso imposible y del suceso seguro: P(A) = 0 A = suceso imposible P(A) = 1 A = suceso seguro Mientas ms cercana a 1 es la probabilidad de un suceso, mayor grado de confianza de que ocurrir. Mientas ms cercana a 0 es la probabilidad de un suceso, mayor grado de confianza de que NO ocurrir. 7.3. Probabilidad de dos sucesos contrarios: Si A y A son sucesos contrarios, entonces: P(A')= 1 P(A)

P(A) + P(A') = 1 9

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Se suele llamar p a la probabilidad de un suceso y q a la probabilidad del suceso contrario, entonces: q=1p p+q=1 Ejemplo: Cierto da, la probabilidad de que llueva es 0,35. Por lo tanto, la probabilidad de que no llueva es: P(No lluvia) = 1 P(Lluvia) = 1 0,35 = 0,65. Si: p = probabilidad de lluvia; q = probabilidad de NO lluvia.

p = 0,35; q = 0,65; p + q = 0,35 + 0,65 = 1

7.4. Probabilidad de sucesos mutuamente excluyentes: P(A o B) = p(A) + p(B) A y B son sucesos mutuamente excluyentes. Esta propiedad es llamada tambin regla de la suma de probabilidades. Solo es vlida para sucesos mutuamente excluyentes. Esta regla se aplica cuando entre los sucesos hay un conectivo o. Ejemplo: En una empresa trabajan 3 ejecutivos, 4 administrativos y 6 operarios. Si se selecciona una persona al azar, la probabilidad de que sea un operario o un administrativo es: Si O = selecciona un operario y A = selecciona un administrativo. Entonces: 6 4 10 + = = 0,7692 P(O o A) = p(O) + P(A) = 13 13 13 7.5. Probabilidad de sucesos independientes: A y B son sucesos independientes. P(A y B) = P(A) P(B) Esta propiedad es llamada tambin regla del producto de probabilidades. Solo es vlida para sucesos independientes. Esta regla se aplica cuando entre los sucesos hay un conectivo y. Ejemplo: Si la probabilidad de lluvia es P(Ll) = 0,4 y la probabilidad de que corra viento es P(V) = 0,15, entonces, si ambos fenmenos son independientes, la probabilidad de que llueva con viento es: P(V y Ll) = 0,15 0,4 = 0,06. 7.6. Probabilidad de diferencia de sucesos: P(A B) = P(A) P(A y B) Lo siguiente es equivalente: P(A B) = P(A y B). Luego: P(A y B) = P(A) P(A y B) Ejemplo: Si la probabilidad de lluvia es P(Ll) = 0,4 y la probabilidad de que corra viento es P(V) = 0,15, entonces, si ambos fenmenos son independientes, cul es la probabilidad de que llueva, pero no corra viento? P(Ll V) = P(Ll) P(Ll y V) = 0,4 0,06 = 0,34
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

10

Vicerrectora Acadmica Cuaderno de Apuntes 2010

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Trabajo y estudio Interesa estudiar la actividad de los jvenes egresados de Educacin Media, en cuanto su estudio y su trabajo. Se definen los sucesos E y T como: E = estudia; T = trabaja. 1.1. Indique en lenguaje corriente el significado del suceso: (T E) 1.2. Escriba algebraicamente el suceso: trabaja, dado que no estudia. 1.3. Dibuje un diagrama para el suceso: Ni trabaja, ni estudia. 1.4. Indique, en lenguaje corriente y en lenguaje algebraico el suceso representado en el diagrama siguiente:

B T

Solucin: 1.1. Del diagrama de lgebra de sucesos, se deduce que: (T E) = trabaja, pero no estudia. Tambin es: trabaja y no estudia. 1.2. Del cuadro de lgebra de sucesos, se deduce que: Trabaja, dado que no estudia = (T / E) 1.3. Diagrama para el suceso: Ni trabaja, ni estudia.

EE

1.4. Lo sombreado corresponde a: (E T) = Estudia, pero no trabaja. O bien: (E y T) = Estudia y no trabaja.

2. Accidentes laborales Para el estudio de ciertos accidentes laborales, se han definido los sucesos siguientes: A = el accidente se produce por Accin insegura por parte del trabajador. C = el accidente se produce por Condicin insegura en el lugar de trabajo. Se sabe que: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

11

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.1. Calcule P(A C) 2.2. Calcule la probabilidad de accidente por Condicin insegura, pero no por Accin insegura. 2.3. Cul es la probabilidad de que ocurra solo una de estas dos causas? Solucin: Es conveniente trazar un diagrama, con las cantidades dadas:
A 0,44 0,12

C 0,36

0,08

2.1. P(A C) Esta es la probabilidad de accidente por Accin insegura, pero no por Condicin insegura. En el diagrama esta probabilidad es 0,44. Aplicando el teorema correspondiente: P(A C) = P(A) P(A y C) P(A C) = 0,56 0,12 = 0,44

2.2. P(C A) Aplicando el teorema correspondiente: P(C A) = P(C) P(A y C) = 0,48 0,12 = 0,36 Este resultado es consistente con la cifra del diagrama.

2.3. P(solo una de las causas) P(solo una de las causas) = P(solo A o solo C) En el diagrama, la probabilidad de solo A es 0,44, mientras que de solo C es 0,36. Como los sucesos son mutuamente excluyentes, entonces la probabilidad: P(solo una de las causas) = 0,44 + 0,36 = 0,8.

3. Medicamento Se sabe que de los clientes que entran a una farmacia a consultar por cierto medicamento, el 70% lo compra. 3.1. Si 3 clientes, independientes unos de otros, preguntan por el medicamento, cul es la probabilidad de que los tres lo compren? 3.2. Si 2 clientes, independientes entre s, preguntan por el medicamento, cul es la probabilidad que solo uno de ellos lo compre? 3.3. Si 4 clientes, independientes unos de otros, entran a preguntar por el medicamento, cul es la probabilidad de que solo el cuarto lo compre?

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

12

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin: Sea: C = compra el medicamento; P(C) = 0,7. Luego, P(C) = 0,3 3.1. Debe ocurrir el siguiente suceso: CyCyC

Aplicando la regla del producto, tenemos que: P(los 3 compran) = 0,7 x 0,7 x 0,7 = 0,343 3.2. Debe ocurrir el siguiente suceso: C y C o C y C Aplicando la regla del producto y de la suma, tenemos que: P(solo uno compra) = 0,7 x 0,3 + 0,3 x 0,7 = 0,42 3.3. Debe ocurrir el siguiente suceso: C y C y C y C Aplicando la regla del producto, tenemos: P(solo el 4 compra) = 0,3 x 0,3 x 0,3 x 0,7 = 0,0189

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Virus informtico Se ha constatado que el 32% de los computadores PC estn infectados con virus del tipo Spyware y que el 14% tiene virus del tipo Troyano, pero sin Spyware. Estas dos infecciones son independientes una de otra. Si S representa el suceso Tiene Spyware y T el suceso Tiene Troyano, entonces: 1.1. Calcule P(T S) = A) 0,14 B) 0,18

C) 0,46

D) 0,54

E) 0,72

1.2. La probabilidad de que un computador no tenga ninguno de estos dos tipos de virus es: A) 0,86 B) 0,54 C) 0,14 D) 0,46 E) 0, 68 1.3. La probabilidad de que un computador est infectado de Troyano, pero no de Spyware, se escribe: A) P(T y S) B) P(T S) C) P(S y T) D) P(T y S) E) P(T o S)

2. Venta de automviles En la tabla adjunta, la variable aleatoria X = N de automviles mensuales vendidos por vendedor (con x >2) y P(x) su probabilidad: X P(x) 3 0,07 4 0,21 5 p 6 0,19 7 0,11 8 o ms 0,09

2.1. La probabilidad de que un vendedor venda ms de 4 automviles en un mes es: A) 0,33 B) 0,72 C) 0,28 D) 0,39 E) Faltan datos
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

13

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2. Cul es la probabilidad de que un vendedor venta en un mes, a lo ms 4 automviles? A) 0,72 B) 0,39 C) 0,28 D) 0,21 E) 0,07

3. Sistema productivo Cierto sistema productivo del rubro alimentos, funciona con 2 motores independientes entre s. La probabilidad de falla en cada uno de los motores es 0,05. El sistema funciona correctamente siempre y cuando haya, al menos, un motor funcionando. 3.1. Cul es la probabilidad de que solo uno de los motores funcione? A) 0,0425 B) 0, 0475 C) 0,2815 D) 0,95 3.2. Cul es la probabilidad de que el sistema funcione? A) 0, 9975 B) 0, 9025 C) 0,4275 D) 0,095

E) 0,095

E) 0,0475

4. Accidentes laborales mortales Se han investigado 1.476 accidentes laborales mortales, que, clasificados segn sector de la actividad econmica y sexo del afectado, se distribuyen de acuerdo a la siguiente tabla: Accidentes laborales mortales segn sector de actividad econmica.
Sector de actividad Servicios Agrario Industria Construccin TOTAL N de casos 331 136 325 684 1.476 Hombre 187 112 213 668 1.180 Mujer 144 24 112 16 296

4.1. De acuerdo a la tabla, en la muestra estudiada cul es la probabilidad de accidente mortal en el sector agrario? A) 0,824 B) 0,4561 C) 0,1765 D) 0,0949 E) 0,0921 4.2. De acuerdo a la tabla, en la muestra estudiada, cul es la probabilidad de que la vctima sea mujer del sector servicio o agrario? A) 0,1765 B) 0,4350 C) 0,5676 D) 0,1138 E) 0,3164 4.3. En la muestra estudiada, cul es la probabilidad de que la vctima sea un hombre del sector construccin? A) 0,9766 B) 0,5661 C) 0,4526 D) 0,4634 E) 0,3721

Solucin a problemas propuestos:


1.1. A 2.1. B 3.1. E 4.1. E 1.2. B 2.2. C 3.2. A 4.2. D 1.3. D

4.3. C

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

14

Vicerrectora Acadmica Cuaderno de Apuntes 2010

V.

RECURSOS COMPLEMENTARIOS

1. Bibliografa para conceptos bsicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadstica. McGraw Hill, 2003. ISBN: 9584101331. Captulo I. 2. Sitio Web: AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 16. Clculo de probabilidades CLASE 17. Probabilidad de sucesos 3. Sitio Web: SECTOR MATEMTICA http://www.sectormatematica.cl/educmedia.htm Para descargar teora y ejercicios de Probabilidades

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

15

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1 UNIDAD: FUNDAMENTOS DEL CLCULO DE PROBABILIDADES CLASE 2

Probabilidad de sucesos condicionales


El hombre tiene mil planes para s mismo. El azar, slo uno para cada uno. Mencio

APRENDIZAJES ESPERADOS
-Resuelven problemas que involucran el clculo de probabilidad de sucesos condicionales.

CONTENIDOS
-Clculo de probabilidad de sucesos condicionales

II.

DESARROLLO

1. Sucesos independientes Si A y B son sucesos en el espacio muestral y P(A) y P(B) sus respectivas probabilidades, entonces se pueden definir los siguientes conceptos: Se dice que el suceso A es independiente de suceso B, si P(A / B) = P(A) Esto es, que la probabilidad de que ocurra A, dado que ocurri B, es simplemente P(A). En otras palabras, la ocurrencia de B no afecta, no interviene en la probabilidad de ocurrencia de A. En otro caso, se dir que A y B son condicionales o dependientes. Para dos sucesos A y B, independientes, se verifica que: P(A y B) = P(A) P(B) (Ver teorema y ejemplos en la clase 1).

2. Probabilidad de sucesos condicionales Sean A y B dos sucesos en el espacio muestral y P(A) y P(B) sus respectivas probabilidades. Si la ocurrencia de A est condicionada a la ocurrencia del suceso B, entonces, la probabilidad de que ocurra B, dado que ocurri A est dada por: P(B / A) =
P( A y B ) P( A )

(1)

De la relacin (1), despejando, se obtiene que: (P y B) = P(A) P(B/A). (2) 16

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Ejemplo: Si P(A) = 0,4; P(B) = 0,3 y P(A y B) = 0,14; entonces:


0,14 = 0,4667 0,3

P(A / B) = P(B / A) =

0,14 = 0,35 0,4

3. Teorema de la probabilidad total Si un suceso A debe resultar en uno de los sucesos mutuamente excluyentes A 1 , A 2 , etc, entonces, la probabilidad de A es igual a: P(A) = P( A 1 ) P(A / A 1 ) + P( A 2 ) P(A / A 2 ) + = P( A i ) P( A / A i ) ; con i = 1, 2, Este es el llamado teorema de la probabilidad total.

4. Teorema de Bayes De la relacin de la probabilidad condicional (1): P(B / A) = Es posible hacerse la pregunta: Cul es la probabilidad de que haya ocurrido A, dado que ya ocurri B? Esta probabilidad est dado por: P(A / B) =
P( A ) P( B / A ) P( B ) P( A y B ) P( A )

Este es el caso particular del teorema de Bayes, para dos sucesos. Caso general: Si A 1 , A 2 , etc, son sucesos mutuamente excluyentes cuya unin es el espacio muestral , entonces, si B es cualquier suceso, es posible calcular la probabilidad de los sucesos A 1 , A 2 , etc, que pueden causar la ocurrencia de B, mediante: P( A i / B) = Este es el llamado teorema de Bayes. 3
P( A i ) P( B / A i ) ; con i = 1, 2, P( A i ) P( B / Ai )

3 El teorema de Bayes, es un mtodo adecuado para calcular la probabilidad de las hiptesis que se confirman mediante la induccin. Este teorema fundamenta una prediccin o generalizacin basada en la observacin de hechos, mediante el clculo de probabilidades. Se da tambin el nombre de bayesiana a la decisin racional de maximizar la utilidad esperada o el valor estimado. Por este motivo, el teorema de Bayes tiene frecuentes aplicaciones en la teora de las decisiones.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

17

Vicerrectora Acadmica Cuaderno de Apuntes 2010

5. Diagrama de rbol Un diagrama de rbol es un esquema grfico que ayuda a analizar una situacin de probabilidad condicional, cuando se deben producir dos o ms sucesos, uno despus del otro. En este caso se muestran solo dos. SUCESO 1

SUCESO 2

P(C)

P(A y C) = P(A) P(C/A)

A
P(A)

P(D)

P(A y D) = P(A) P(D/A)

P(B)

P(E)

P(B y E) = P(B) P(E/B)

P(F)

P(B y F) = P(B) P(F/B)

Este diagrama se desarrolla de izquierda a derecha (rbol horizontal), siguiendo las siguientes directrices: 1: Cada suceso se representa por una rama, con bifurcaciones sealadas por las distintas posibilidades del suceso. En el diagrama, se definen dos ramas, pero pueden ser ms. 2: Cada rama parcial lleva especificada su respectiva probabilidad. En cada suceso, la suma de las probabilidades de sus ramas es 1. En el esquema, P(A) + P(B) = 1; P(C) + P(D) = 1; etc. 3: El final de cada rama parcial se constituye en un nudo del cual parten nuevas ramas, segn las posibilidades del siguiente suceso. 4: Cada secuencia de ramas constituye un suceso. Su probabilidad est dada por la regla del producto. 5: La suma de las probabilidades al final de cada secuencia de ramas es 1 (probabilidad total). En el diagrama, P(A y C) + P(A y D) + (B y E) + P(B y F)= 1

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Accidentes laborales: Para el estudio de ciertos accidentes laborales, se definen los sucesos siguientes: A = el accidente se produce por accin insegura por parte del trabajador. C = el accidente se produce por condicin insegura en el lugar de trabajo. Se sabe que: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12 1.1. Calcule P(A / C) 1.2. Calcule la probabilidad de accidente por Condicin insegura, dado que hubo Accin insegura. 1.3. Son A y C, sucesos independientes?

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

18

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin: 1.1. P(A / C). Esta es la probabilidad de accidente por Accin insegura, dado que hubo Condicin insegura. Aplicando el teorema correspondiente: P(A / C) =
P( A y C ) 0,12 = = 0,25 P( C ) 0,48

1.2. P(C / A): Esta es la probabilidad de accidente por Condicin insegura, dado que hubo Accin insegura. Aplicando el teorema correspondiente: P(C / A) =
P( A y C ) 0,12 = 0,2143 = P( A ) 0,56

1.3. Para que A y C sean independientes debe verificarse lo siguiente:

P(A) P(C) = P(A y C) Remplazando los valores dados: P(A) = 0,56; P(C) = 0,48 y P(A y C) = 0,12 0,56 0,48 = 0,12
0,2688 0,12

Por lo tanto, A y C no son independientes.

2. Muestreo sin reposicin En una urna hay 4 fichas blancas y 5 negras de igual peso y tamao. De esta caja, se extrae al azar y sin reposicin, dos fichas. Cul es la probabilidad de que ambas resulten negras? Solucin: Mtodo 1: Se trata de una situacin de sucesos condicionales. Al no haber reposicin, una vez que se extrae la primera ficha, para la segunda extraccin el espacio muestral se ha modificado, dependiendo del resultado de la primera. En la primera extraccin hay 5 negras de un total de 9. Por lo tanto: 5 P( N1 ) = 9

Para la segunda extraccin hay solo 8 fichas (ya se extrajo una), de las cuales 4 son negras (ya sali una negra en la primera extraccin). Entonces: P( N 2 / N1 ) =
4 1 = 8 2

Para que ocurran ambos sucesos, se usa la regla del producto: 5 5 1 P( N1 y N 2 / N1 ) = = = 0,2778 9 2 18

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

19

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Mtodo 2: Extraer una a una dos fichas sin reposicin, es igual a extraer dos fichas simultneamente. Entonces, es posible aplicar el concepto de combinatoria 4. 5 9 Las dos fichas negras se pueden combinar de ( ) maneras distintas, de un total de ( ) casos posibles. 2 2 Aplicando la ecuacin de Laplace:
5 ( ) 2 P(2 negras) = = 0,2778 9 ( ) 2

3. Faltas a la calidad Una empresa que arma lavadoras automticas tiene dos plantas A y B, que producen el 40% y el 60% de estos artefactos, respectivamente. Suponga que el 8% de los artefactos de la planta A y el 12% de los de la planta B presentan la misma falta de calidad (falla). Si se est frente a una lavadora con esta falla, interesa calcular la probabilidad de que el artefacto haya sido armado en la planta B. 3.1. Cul es la probabilidad de que esta empresa produzca artefactos con falla? 3.2. Si se est frente a una lavadora con esta falla, cul es la probabilidad de que el artefacto haya sido armado en la planta B? Solucin: Para comprender mejor la situacin, de realizar un diagrama de rbol.
F = Con falla 0,08 A = Planta A 0,92 0,4 F =Sin falla P(F/A) = 0,4 0,92 = 0,368 P(F/A) = 0,4 0,08 = 0,032

(1) (2) (3) (4)

F =Con falla 0,6 B = Planta B 0,88 F =Sin falla 0,12

P(F/B) = 0,6 0,12 = 0,072

P(F/B) = 0,6 0,88 = 0,528

3.1. Se pide P(F): Sumando los resultados del diagrama de rbol, de las secuencias que terminan en (1) y (3::

P(F) = 0,032 + 0,072 = 0,104 (Esto es, el 10,4% de los artefactos). Aplicando directamente el teorema de la probabilidad total: P(F) = P(A) P(F/A) + P(B) P(F/B) = 0,4 0,08 + 0,6 0,12 = 0,104

Ver al final de la clase, actividades complementarias.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

20

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3.2. Si se est frente a una lavadora con esta falla, cul es la probabilidad de que el artefacto haya sido armado en la planta B?

Se pide determinar: P(B / F) Aplicando el teorema de la probabilidad condicional, y sacando los valores de las respectivas ramas del rbol y el resultado anterior: P(B / F) =
P(B y F) 0,072 = = 0,6923 P(F) 0,104

Aplicando directamente el teorema de Bayes:


P( B ) P( F / B ) 0,6 0,12 = = 0,6923 P( F ) 0,104

P(B / F) =

4. Casados, urbanos y rurales En cierta regin, el 35% de los hombres mayores de 18 aos vive en zonas rurales y el 65% en zonas urbanas. En las zonas rurales, el 80% de los hombres mayores de 18 aos est casado, mientras que en las zonas urbanas ese % es solo del 60%. 4.1. Cul es la probabilidad de que en esta regin un hombre de esta poblacin est casado? 4.2. Si se encuentra en esta poblacin un hombre casado, cul es la probabilidad de que provenga de la zona rural? Solucin: Sean los siguientes sucesos: R = hombre mayor de 18 aos de zonas rurales. U = hombre mayor de 18 aos de zonas urbanas.

Ntese que, tal como est planteado el problema, U y R son complementarios. C/R = casado, dado que es de zona rural C/U = casado, dado que es de zona urbana C = hombre de la regin, mayor de 18 aos, casado. Ntese que el suceso C es condicional, ya que este estado civil depende de la zona U o R de donde provenga el hombre. Trasladando los datos dados en %, a probabilidad, se tiene: P(R) = 0,35 y P(U) = 0,65 P(C/R) = 0,8 y P(C/U) = 0,6 Para una mejor comprensin y clculo, es posible trazar un diagrama de rbol como el siguiente:
0,8 Rural 0,35 0,65 Urbana 0,2 0,6 0,4 NO casado / R Casado / U NO casado / U Casado / R

Rural y Casado =

0,35 x 0,8 = 0,28

Urbano y Casado =

0,65 x 0,6 = 0,39

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

21

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3.1. Los casados pueden ser de la zona R o de la zona U, siendo aplicable la regla de la suma de probabilidades: Entonces, con los datos del diagrama:

P(C) = P(C/R) + P(C/U) = 0,28 + 0,39 = 0,67. Tambin puede ser calculada esta probabilidad, aplicando directamente el teorema de la probabilidad total.

3.2. Se pide: P(R / C) =

Desarrollando, con los datos del diagrama:

P(R / C) =

P(R y C' ) 0,35 0,2 = = 0,2121 P(C' ) 1- 0,67

Tambin puede ser calculada esta probabilidad, aplicando directamente el teorema de Bayes.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Agricultores En cierto sector agrcola, el 60% de los agricultores siembra trigo. De estos, el 75% usa semilla seleccionada. Si se selecciona al azar un agricultor de este sector, cul es la probabilidad de que haya sembrado trigo sin semilla seleccionada? A) 0,125 B) 0,15 C) 0,25 D) 0,40 E) 0,45 2. Gripe En una comuna donde el 60% de sus habitantes son mujeres, se produce una epidemia de gripe que afecta al 15% de los hombres y al 5% de las mujeres. Cul es la probabilidad de que un habitante de esta comuna tenga gripe? A) 0,40 B) 0,20 C) 0,24 D) 0,09 E) 0,06 3. Estudio del mercado de refrescos Segn un estudio, se prueban tres sabores de refresco A, B y C, entre hombres (H) y mujeres (M). El estudio permiti construir la siguiente tabla de probabilidades de preferencias:
REFRESCO A 0,1 0,15 B 0,05 0,3 C 0,25 0,15

SEXO HOMBRE MUJER

De acuerdo a estos datos: 3.1. Calcule P(B o C) A) 0,75 B) 0,4


3.2. La probabilidad P(H A) = A) 0,4 B) 0,3

C) 0,35

D) 0,3

E) 0,25

C) 0,2

D) 0,05

E) 0,1

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

22

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3.3. Calcule P(B / H) = A) 0,4 B) 0,125

C) 0,05

D) 0,15

E) 0,25

3.4. Si se selecciona a una persona que gusta del refresco B, cul es la probabilidad de que sea mujer? A) 0,35 B) 0,3 C) 0,857 D) 0,782 E) 0,627

4. Parceleros Se ha comprobado que en la regin de Aysn, el 75% de los parceleros son propietarios de las tierras que habitan. De ellos, el 60% son mujeres. Entre los no propietarios, el 55% son hombres. Si esto es as: 4.1. La probabilidad de que un parcelero de esta regin sea mujer es: A) 0,5625 B) 0,525 C) 0,6 D) 0,135

E) 0,45

4.2. La probabilidad de que un parcelero de esta regin sea hombre y propietario, es: A) 0,125 B) 0,47 C) 0,135 D) 0,3 E) 0,45 4.3. Cul es la probabilidad de que un parcelero de esta regin sea propietario, dado que es mujer? A) 0,75 B) 0,45 C) 0,656 D) 0,812 E) 0,8 4.4. Cul es la probabilidad de que un parcelero de esta regin sea hombre, dado que es no es propietario? A) 0,435 B) 0,565 C) 0,55 D) 0,75 E) 0,25

Solucin a problemas propuestos:


1. B 3.1. A 4.1. A 2. D 3.2. E 4.4. D 3.3. B 4.3. E 3.4. C 4.4. C

V.

RECURSOS COMPLEMENTARIOS

1. Bibliografa para conceptos bsicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadstica. McGraw Hill, 2003. ISBN: 9584101331. Captulo I. 2. Sitio Web: AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 24. Teorema de la probabilidad total CLASE 25. Teorema de Bayes 3. Sitio Web: SECTOR MATEMTICA http://www.sectormatematica.cl/educmedia.htm Para descargar teora y ejercicios de Combinatoria 4. Combinatoria Los distintos grupos que se generan al seleccionar r elementos desde un conjunto de n elementos (con r n), est dado por la combinatoria:

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

23

Vicerrectora Acadmica Cuaderno de Apuntes 2010

n n! nCr = ( ) = r r !( n r )!

Siendo n! el factorial de n. Ejemplo: De un curso de 32 estudiantes se debe elegir una comisin de 5 estudiantes. Cuntas distintas comisiones podran formarse? 32 Esto corresponde a la combinatoria 32C5, que tambin se puede escribir como ( ) y se lee 32 sobre 5. 5 Ingresando los valores a la calculadora:

32

nCr

201376
Ejercicios complementarios:
5 ( ) 3 = Ejercicio 1: Calcule 8 ( ) 3 5 4 ( )( ) 3 2 Ejercicio 2: Calcule = 9 ( ) 5

Ejercicio 3: Calcule de cuntas maneras diferentes pueden elegirse al azar 3 personas desde un grupo de 7. Ejercicio 4: Cuntas combinaciones son posibles en un juego de azar El Loto?

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

24

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1 UNIDAD: FUNDAMENTOS DEL CLCULO DE PROBABILIDADES CLASE 3

El modelo de probabilidad binomial


Los dioses nos dan muchas sorpresas: lo esperado no se cumple y para lo inesperado un dios abre la puerta. Eurpides

APRENDIZAJES ESPERADOS
-Identifican el modelo de probabilidad binomial y los parmetros que lo definen. -Calculan el valor esperado y la varianza de una distribucin de probabilidad binomial. -Resuelven problemas que involucran operar con el modelo de probabilidad binomial.

CONTENIDOS
-Concepto de valor esperado y varianza. -Modelos de probabilidad discreta: binomial

II.

DESARROLLO

1. El experimento El experimento binomial es el siguiente: Se tiene una poblacin grande en la cual se conoce la probabilidad p de un suceso A, o de encontrar un individuo con una caracterstica A. 5 Se extrae desde esta poblacin una muestra aleatoria de tamao n . Interesa saber cul es la probabilidad de que resulten 0, 1, 2, ... n sujetos con la caracterstica A en la muestra. 2. El modelo binomial Esta probabilidad est dada por la funcin:
n P( x ) = ( ) p x q n x ; con x = 0, 1, 2,...n x

Siendo: n = tamao de la muestra


p = probabilidad en la poblacin; q = 1 p

x = Nmero de xitos en la muestra


P( x ) = Probabilidad de obtener x xitos en la muestra de tamao n.

Importante:

Como el dominio de la funcin son solo nmeros enteros, esta es una funcin de probabilidad discreta. La probabilidad de un valor x cualquiera est dada por el valor de la funcin para esa x.
Pi = 1 . La suma de todas probabilidades parciales es 1.

Se le llama binomial a una poblacin en la cual un experimento solo puede ocurrir de dos maneras mutuamente excluyentes.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

25

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Ejemplo: En la empresa Alka S. A., el 12,7% de las ausencias de trabajadores tiene como causa accidentes de trayecto. Si se extrae una muestra de 25 trabajadores ausentes de esta empresa, cul es la probabilidad de que en 10 de ellos haya sido por accidente de trayecto? En este caso se dan las condiciones para aplicar el modelo binomial:
p = 0,127 es la probabilidad conocida en la poblacin.

n = 25. Es la muestra X = N de ausencias por accidente de trayecto, con x = 0, 1, 2, , 25.

3. Parmetros del modelo binomial Los parmetros que definen el modelo son n y p.

En el ejemplo anterior: n = 25 y p = 0,32 Entonces, para el ejemplo, la funcin de probabilidad queda definida por:
P( x ) = ( 25 x

) 0,127 x 0,873 25 x ; con x = 0, 1, 2,...25

Siendo X = nmero de ausencias por accidente de trayecto en una muestra de 25. Vale decir, que solamente se requieren n y p para establecer un modelo binomial, siempre y cuando se cumplan las condiciones especificadas.

4. Caractersticas del modelo binomial Valor esperado: E(x) = n p Varianza: V(x) = n p q

Desviacin estndar: En el caso de ejemplo dado: Valor esperado: Varianza: Desviacin estndar:

( x ) = n p q

E(x) = 25 0,32 = 8 V(x) = 25 0,32 0,68 = 5,44


( x ) = 5,44 = 2,3324

5. Supuestos, aplicaciones y requisitos del modelo

Se trata de una poblacin binomial. Se conoce el valor poblacional p . Esta p es constante. El muestreo se hace con reposicin o desde una poblacin muy grande. La muestra es independiente. El modelo funciona muy bien para p cercano a 0,5. El modelo no funciona bien para p < 0,1 o para p > 0,9. No es necesario conocer el tamao de la poblacin. 26

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Empresa de turismo Una empresa de turismo sabe que el 26% de los adultos pensionados est dispuestos a realizar un viaje de placer. Esta empresa visita a estos clientes potenciales, seleccionndolos en forma aleatoria. 1.1. Si un vendedor visita a 12 pensionados, independientes unos de otros, cul es la probabilidad de que 5 de ellos estn dispuestos a realizar un viaje de placer? 1.2. Si un vendedor visita a 10 pensionados, cul es la probabilidad de que 3 o 4 de ellos estn dispuestos a realizar un viaje de placer? 1.3. Si un vendedor visita a 6 pensionados, cul es la probabilidad de que a lo menos uno de ellos est dispuestos a realizar un viaje de placer? Solucin: Es una situacin modelable a travs del modelo binomial. 1.1. n = 12; p = 0,26 y x = 5

El modelo es el siguiente: 12 P( x ) = ( ) 0,26 x 0,7412 x ; con x = 0, 1, 2,...12 x Valorando la funcin para x = 5:


P( x = 5 ) = ( 12 ) 0,26 5 0,74125 = 0,1143 5

1.2. n = 10; p = 0,26 y x = 3 o 4

El modelo es el siguiente: 10 P( x ) = ( ) 0,26 x 0,7410 x ; con x = 0, 1, 2,...10 x Valorando la funcin para x = 3 y para x = 4:
P( x = 3 ) = ( 10 ) 0,26 3 0,74 7 = 0,2563 3 10 ) 0,26 4 0,74 6 = 0,1576 4

P( x = 4 ) = (

P( 3 4 ) = 0,2563 + 0,1576 = 0,4139

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

27

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.3. n = 6; p = 0,26 y x 1
p( x 1) = P( x = 1) + P( x = 2 ) + ... + P( x = 6 )

En este caso es preferible calcular la probabilidad del suceso contrario:


p( x 1) = 1 P( x = 0 ) 6 P( x = 0 ) = ( ) 0,26 0 0,74 6 = 0,1642 0 p( x 1) = 1 0,1642 = 0,8358

2. Reclamos Una empresa de servicios ha detectado que el 57% de los e-mails recibidos es por reclamos del servicio que prestan. Se realiza un estudio especial con 40 correos seleccionadas al azar de entre todos los recibidos. 2.1. Indique el modelo de probabilidad para el nmero de correos de reclamo en la muestra de 40. 2.2. Calcule el valor esperado y desviacin estndar de las correos de reclamo. 2.3. Calcule la probabilidad de que hayan 25 correos de reclamo en los 40 seleccionados. Solucin: 2.1. El modelo de probabilidad binomial es: 40 P( x ) = ( ) 0,57 x 0,43 40 x ; x = 0, 1, 2, 3... 40 x

Con X = nmero de correos de reclamo en la muestra de tamao 40.


2.2. Valor esperado = 40 0,57 = 22,8 correos de reclamo

Desviacin estndar =

40 0,57 0,43 = 3,13 correos de reclamo


40 ) 0,57 25 0,4315 = 0, 1008 25

2.3.

P( x = 25 ) = (

R: La probabilidad es 0, 1008. Corresponde al 10,08%.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Funcin de probabilidad: Se tiene la funcin de probabilidad siguiente:


P( x ) = ( 30 ) 0,6 x 0,4 30 x ; con x = 0, 1, 2, 3... x

1.1. El mayor valor que puede tomar x es: A) 5 B) 24 C) 30

D) 100

E)
28

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.2. Calcular P(x = 13) A) 0,0269 B) 0,2654

C) 0,8451

D) 0,1245

E) 0,1478

1.3. El valor esperado y la desviacin estndar de la distribucin es, respectivamente: A) 12 y 0,24 B) 12 y 7,2 C) 18 y 0,24 D) 18 y 7,2 E) 18 y 2,68

2. Modelo binomial Acerca del modelo binomial se afirma que:

I: Est definido por dos parmetros solamente II: Se puede aplicar efectivamente con cualquier valor de p III: Se puede usar aun si se desconoce el tamao de la poblacin Es (son) correcta(s): A) Solo I B) Solo I y II

C) Solo II y III

D) Solo I y III

E) I, II y III

3. Compra-venta de automviles Se ha constatado que en 3 de cada 5 ventas de automviles a matrimonios, la decisin de compra es de la mujer. En una seleccin de 10 ventas a matrimonios tomadas al azar se desea saber la probabilidad de que en 7 de ellas la decisin de compra haya sido de la mujer. 3.1. Si se aplica el modelo binomial el parmetro p es igual a: A) 0,3 B) 0,4 C) 0,5 D) 0,6 3.2. Si se aplica el modelo binomial el parmetro n es igual a: A) 15 B) 10 C) 7 D) 5 3.3. Si se aplica el modelo binomial el valor de x es igual a: A) 3 B) 5 C) 7 D) 8

E) 0,7

E) 3

E) 10

4. Servicio de Internet Una empresa de servicios de informacin y comunicaciones ha diagnosticado que en cierto sector residencial, solo 4 de cada 25 hogares tiene conexin a Internet. 4.1. Si se visita un hogar al azar, la probabilidad de que no tenga conexin a Internet es: A) 0,16 B) 0,32 C) 0,64 D) 0,72 E) 0,84 4.2. Si se visitan 8 hogares al azar, cul es la probabilidad de que 5 no tengan conexin a Internet? A) 0,0959 B) 0,1681 C) 0,6250 D) 0,0721 E) 0,0840 4.3. Si se visitan 6 hogares al azar, cul es la probabilidad de que ninguno de ellos tenga conexin a Internet? A) 0,1651 B) 0,3513 C) 0,3281 D) 0,4172 E) 0,2184

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

29

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin a problemas propuestos:


1.1. C 2.1. D 3.1. D 4.1. E 1.2. A 3.2. B 4.2. A 1.3. E 3.3. C 4.3. B

V.

RECURSOS COMPLEMENTARIOS

1. Sitio Web: AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 28. Distribuciones discretas: Binomial 2. Aula virtual de Bioestadstica: ver modelos de probabilidad http://e-stadistica.bio.ucm.es/index.html

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

30

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1 UNIDAD: FUNDAMENTOS DEL CLCULO DE PROBABILIDADES CLASE 4

El modelo de probabilidad de Poisson


Son distintas las aguas que cubren a los que entran en el mismo ro. Herclito.

APRENDIZAJES ESPERADOS
-Identifican el modelo de probabilidad de Poisson y los parmetros que lo definen. -Calculan el valor esperado y la varianza de una distribucin de probabilidad de Poisson. -Resuelven problemas que involucran operar con el modelo de Poisson.

CONTENIDOS
-Concepto de valor esperado y varianza. -Modelos de probabilidad discreta: Poisson.

II.

DESARROLLO

1. El experimento Se tiene una poblacin en la que se conoce el promedio de ocurrencia de un suceso por unidad de espacio, o de tiempo, volumen, etc. Si X representa el nmero de ocurrencias del suceso (0, 1, 2, ), e interesa saber cul es probabilidad de que este resulte 0, 1, 2, ... veces, es aplicable el modelo de Poisson. 2. El modelo de Poisson Esta probabilidad est dada por la funcin de Poisson:
e x ; con x = 0, 1, 2, ... x!

P( x ) =

Siendo: = promedio de xitos por unidad de medida ( > 0 ).


P( x ) = Probabilidad de que se produzcan x xitos.

X = nmero de xitos por unidad de medida. Adems: e = 2,71828... 6 Ejemplo de situaciones donde es aplicable el modelo de Poisson:

El nmero de llamadas telefnicas que entran a una central telefnica es de 12 por minuto. Un promedio de 6,5 pacientes llegan a una central de urgencia, por cada hora. Llegan 3,4 clientes a un cajero automtico, por cada 10 minutos.

Se da un promedio de 2,5 fallas en la tela por cada 100 metros de tela. En cada uno de estos casos existe un promedio de ocurrencia por cierta unidad de tiempo, espacio, volumen, etc. Este promedio es el parmetro de la funcin de Poisson.

Este e es un nmero irracional que surge de la expresin

(1 + 1 ) x x

cuando x tiende a infinito. Es, adems, la base de los logaritmos naturales.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

31

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Importante:

Como el dominio de la funcin son enteros, esta es una funcin de probabilidad discreta. La probabilidad de un valor x cualquiera est dada por el valor de la funcin para esa x.
Pi = 1 . La suma de todas probabilidades parciales es 1.

Ejemplo: Una empresa comercial del rubro retail ha constatado que, en promedio, 3,4 clientes de cada 10, pagan con dinero en efectivo. En este caso se dan las condiciones para aplicar el modelo binomial: = 3,4 clientes de cada 10. X = N de clientes que pagan con efectivo.

3. Parmetros del modelo binomial El parmetro que define el modelo de Poisson es solamente .

En el ejemplo: = 3,4 Entonces, para el ejemplo, la funcin de probabilidad queda definida por:
e 3,4 3,4 x ; con x = 0, 1, 2, ... x! Siendo X: nmero de clientes que pagan en efectivo, por cada 10 clientes. P( x ) =

Vale decir, que solamente se requiere para establecer un modelo de Poisson, siempre y cuando se cumplan las condiciones definidas.
4. Caractersticas del modelo de Poisson Valor esperado: E(x) =

Varianza: Desviacin estndar: En el caso del ejemplo: Valor esperado: Varianza: Desviacin estndar:

V(x) =
( x ) =

E(x) = 3,4 clientes/por cada 10 V(x) = 3,4


( x ) = 3,4 = 1,8439 clientes/por cada 10

5. Relacin entre el modelo binomial y el modelo de Poisson

Es posible probar que entre el parmetro que caracteriza al modelo de Poisson, y los parmetros n y p de la binomial se puede establecer la relacin:

= n p
Esto hace que ambos modelos tengan cosas en comn, pero tambin diferencias: En el modelo Poisson, la probabilidad p es pequea (menor que 0,1). Tanto es as, que el modelo es frecuentemente identificado como el modelo de los sucesos extraos (poco frecuentes). 32

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

6. Supuestos, aplicaciones y requisitos del modelo

Se conoce el valor poblacional o se tienen datos para calcularlo. Esta es constante. El modelo funciona bien para entre 0,1 y 7. El modelo funciona muy bien cuando p < 0,1, es decir, para casos extraos y n > 50. El modelo funciona bien para p muy pequeo y n grande, tales que n p < 7. Una vez establecido el modelo, no se requiere conocer el tamao de la muestra.

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Cajero automtico El nmero de personas que llegan cada 5 minutos a un cajero automtico est dado por la funcin de probabilidad:
e 4,6 4,6 x , con x = 0, 1, 2, x!

f( x ) =

1.1. Calcule la probabilidad de que en el lapso de 5 minutos lleguen 7 personas a ese cajero. 1.2. Calcule la probabilidad de que en el lapso de 5 minutos lleguen 2 o 3 personas a ese cajero. 1.3. Calcule la probabilidad de que en el lapso de 4 minutos lleguen 6 personas a ese cajero. Solucin: 1.1. Calculando f(x=7) en la funcin:
e 4,6 4,6 7 = 0,0869 7!

f( x = 7 ) =

1.2. La probabilidad f(2 o 3) = f(x=2) + f(x=3), por la propiedad de la suma de sucesos mutuamente excluyentes.
e 4,6 4,6 2 = 0,1063 2! e 4,6 4,6 3 = 0,1631 3!

f( x = 2 ) =

f( x = 3 ) =

Entonces: f(2 o 3) = 0,1063 + 0,1631 = 0,2694


1.3. Primero hay que transformar el parmetro , desde clientes cada 5 minutos a clientes cada 4 minutos.

Aplicando proporciones:
4,6 clientes clientes = 5 min utos 4 min utos

Despejando: = 3,68 clientes por cada 4 minutos.


Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

33

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Ahora s se puede proceder a valorar la funcin para x = 6.


e 3,68 3,68 6 = 0,0670 6!

f( x = 6 ) =

2. Servicio de GPS Una empresa de servicio de GPS tiene instalados 1.560 equipos en los vehculos de carga de cierta empresa. La probabilidad de que cualquiera de los equipos falle durante un mes es 0,003: 2.1. Plantee el modelo de probabilidad para el nmero de equipos que falla al mes. 2.2. Determine la probabilidad de que 4 equipos GPS fallen durante un mes; 2.3. Calcule la probabilidad de que ms de un equipo falle durante un mes. 2.4. Calcule el valor esperado y desviacin estndar de los equipos que fallan durante un mes. Solucin: 2.1. Se dan las condiciones para aplicar el modelo de Poisson: n = 1.560 equipos p = 0,003; probabilidad de que un equipo falle durante un mes.

= n p = 1.560 x 0,003 = 4,68 equipos, en promedio, fallan en un mes.

Es decir, se cumple un n grande y un p pequeo, tales que n p < 5 Entonces, el modelo es:
e 4,68 4,68 x , con x = 0, 1, 2, , 1.560. x! X = nmero de equipos que pueden fallar en un mes, x = 0, 1, 2, 3,....,1.560 equipos. f( x ) =

2.2. f ( x = 4 ) =

e 4 ,68 4,68 4 = 0,1855 4!

2.3. f ( x 2 ) = 1 f ( x 1) = 1 [f(x = 0) + f(x = 1)]


e 4,68 4,68 0 e 4,68 4,68 1 + ) = 1- (0,009279 + 0,04343) = 0,9473 0! 1!

f(x 2) = 1 (

2.4.

E(x) = = 4,68 equipos

(x) = = 4,68 = 2,16 equipos

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

34

Vicerrectora Acadmica Cuaderno de Apuntes 2010

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Servidor Cierto servidor se cae, en promedio, 2,4 veces por cada 500 horas de funcionamiento continuado. 1.1. La probabilidad de que este servidor se caiga 2 veces en 500 horas de funcionamiento continuado es igual a: A) 0,3512 B) 0,4322 C) 0,1673 D) 0,2831 E) 0,2613 1.2. La probabilidad de que el servidor no se caiga en ese lapso de tiempo, es igual a: A) 0,0 B) 0,0122 C) 0,0907 D) 0,2003 E) 0,1027 1.3. La probabilidad de que este servidor se caiga a lo ms 2 veces en 500 horas, es: A) 0,2613 B) 0,5697 C) 0,3917 D) 0,4790 E) 0,2177 1.4. El valor esperado y la varianza de esta distribucin de probabilidades, respectivamente, son:

A) 2,4 y 2,4

B) 2,4 y 2,42

C) 2,4 y

2,4

D)

2,4 y 2,4

E)

2,4 y 2,42

2. Proceso industrial Cierto proceso industrial produce una falla con probabilidad 0,0035 por cada hora de trabajo. Este proceso funciona las 24 horas del da, todos los das, sin detencin. 2.1. Cul es el valor del parmetro de Poisson, para las fallas en una semana de funcionamiento de este proceso? A) 0,0035 B) 0,0245 C) 0,0840 D) 0,5880 E) 0,6542 2.2. Cul es la probabilidad de que el proceso genere 3 fallas en 4 semanas de funcionamiento? A) 0,2352 B) 0,2064 C) 0,3764 D) 0,1329 E) 0,0349

3. Obras viales En ciertas faenas de obras viales, la probabilidad de accidente laboral por mes sigue una distribucin de Poisson con parmetro 1,8. 3.1. La probabilidad de que en un mes no se produzcan accidentes laborales es: A) 0,18 B) 0,6049 C) 0,1653 D) 0,3365 E) 0,1347 3.2. La probabilidad de que en un mes se produzca al menos 1 accidente laboral, es: A) 0,2138 B) 0,4567 C) 0,5653 D) 0,8347 E) 0,7070 3.3. La probabilidad de que en un mes se produzca ms de un accidente laboral es: A) 0,2975 B) 0,4628 C) 0,8347 D) 0,7025 E) 0,5372 3.4. La probabilidad de que en un mes se produzcan 2 o 3 accidentes laborales es: A) 0,4285 B) 0,2678 C) 0,1607 D) 0,2523 E) 0, 7227

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

35

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin a problemas propuestos:


1.1. E 2.1. D 3.1. C 1.2. C 2.2. B 3.2. D 1.3. B 3.3. E 1.4. A 3.4. A

V.

RECURSOS COMPLEMENTARIOS

1. Bibliografa para conceptos bsicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadstica. McGraw Hill, 2003. ISBN: 9584101331. Captulo I. 2. Sitio Web: AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm
CLASE 29. Distribuciones discretas: Poisson

3. Aula virtual de Bioestadstica: ver modelos de probabilidad http://e-stadistica.bio.ucm.es/index.html

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

36

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1 UNIDAD: FUNDAMENTOS DEL CLCULO DE PROBABILIDADES CLASE 5

El modelo de probabilidad normal


Por perder un clavo, el caballo perdi la herradura, el jinete perdi al caballo, el jinete no combati, la batalla se perdi, y con ella perdimos el reino . (Efecto mariposa)

APRENDIZAJES ESPERADOS
-Identifican el modelo de probabilidad normal y los parmetros que lo definen. - Identifican el modelo de probabilidad normal estndar y los parmetros que lo definen. -Calculan rea bajo la curva normal utilizando tablas de la curva normal estndar. -Calculan percentiles de la distribucin normal estndar mediante tabla.

CONTENIDOS
-Modelos de probabilidad continua: curva normal. curva normal estndar. -Clculo de probabilidades y percentiles con la curva normal estndar.

II.

DESARROLLO

1. El modelo normal Si X es una variable normal, entonces su funcin de densidad de probabilidad est dada por:
1 2
1(
2 x 2 )

f( x ) =

; con < x < +

En esta funcin, x es variable aleatoria, que puede tomar cualquier valor real entre menos infinito e infinito. Este es, por lo tanto, un modelo de probabilidad continua.

2. Parmetros del modelo Los parmetros del modelo son los valores y :

Media aritmtica: Desviacin estndar:

Fig 5.1: Curva normal

Por esto, cada curva normal queda definida por su y su . El grfico tpico de esta curva es el de una campana.

Si una variable se distribuye normalmente con media y varianza 2 , se escribe de la siguiente manera: X ~ N( ; 2 )

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

37

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. Principales propiedades de la curva normal La curva normal tiene interesantes propiedades matemticas. Sin embargo, para fines prcticos, las principales son:

La curva es asinttica respecto del eje x. Esto es, la curva no llega a intersectar al eje x por ms que se prolongue. La curva es simtrica respecto de la media . El rea total bajo la curva equivale al 100% de n. Casi el 100% del rea bajo la curva se halla entre comprendida en el intervalo: x 3 y x + 3 . Ver figura 5.2. La probabilidad en un punto x cualquiera es cero 7. La probabilidad entre dos valores de x es igual al rea bajo la curva entre esos dos valores. Ver figura 5.3.
X ~ N(25; 4 ) Normal con media 25 y desv. St 4
2

P(a

b)

x
13 17 21 25 29 33 37

100%
Fig 5.2:

Probabilidad en la curva normal Fig 5.3:

4. LA CURVA NORMAL ESTNDAR Si en una distribucin de probabilidad X, normal con media y desviacin estndar , a cada valor de x se le resta la media y se divide el resultado por la desviacin estndar, se obtiene una nueva variable Z.
Z= x

Cuando x es mayor que la media, z es positivo Cuando x es menor que la media, z es negativo Cuando x es igual a la media, z es cero

Este puntaje Z, describe la distancia, medida en unidades , a que se encuentra un valor x respecto de la media. Por ejemplo, Z = -2,3 indica, por el signo -, que x se ubica a 2,3 por debajo de la media. Un puntaje Z = 1,6 indica, por el signo +, que x est a 1,6 sobre la media. Esta variable Z, llamada tambin puntaje estndar, tiene muy interesantes propiedades.

Es una variable aleatoria Se distribuye normalmente Tiene media aritmtica cero Su desviacin estndar es 1 No tiene unidades

En una funcin de probabilidad discreta, el valor de la probabilidad en un punto es igual al valor de la funcin en ese punto.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

38

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Adems, conserva las propiedades de toda curva normal:


Es simtrica respecto del cero El rea total bajo la curva es 1. Prcticamente el total del rea bajo la curva se halla entre z = -3 y z = 3.
Fig 5.4:

Z
-3 -2 -1 0 1 2 3

Curva normal estndar ( = 0 y = 1)

5. Uso de la tabla Z 5.1. La tabla Z El rea bajo la curva normal se encuentra tabulada. Ver Tabla z en el anexo 1. La tabla es cuestin:

Sirve para calcular el rea bajo la curva desde hasta cualquier valor positivo de z. Tal como lo indica el rea achurada del esquema grfico. Por tal motivo esta tabla es denominada de probabilidad inferior o de integral inferior. Figura 5.5. Los valores de z se expresan con 2 decimales. La columna z indica el valor del entero, ms 1 decimal. El segundo decimal (centsima) se busca en la primera fila.
0

Fig 5.5:

zi

0,01

0,02

0,03

0,04

1,6

0,9452

0,9463

0,9474

0,9484

0,9495

Por ejemplo, para calcular la probabilidad de que z 1,63:


Fig 5.6:

1: Se busca en la primera columna el valor 1,6. 2: Se busca en la primera fila el valor 0,03, que corresponde al segundo decimal de 1,63. 3: En el cruce de la fila con la columna est la probabilidad buscada. P (z 1,63) = 0,9484 Nota: Para efectuar estos clculos es conveniente trazar un esquema grfico como el de la figura 5.6.
0

1,63

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

39

Vicerrectora Acadmica Cuaderno de Apuntes 2010

5.2. Clculo de probabilidades en la normal estndar El clculo de probabilidades en la normal se reduce al clculo de reas bajo la curva. Para ello es fundamental la tabla Z.

Ejemplo: Calcular P( z 1,72) Esta probabilidad corresponde al rea bajo la curva desde z = 1,72 hasta infinito. Ver regin achurada en esquema. De acuerdo a la tabla, el rea bajo la curva situado en la cola inferior o a la izquierda de 1,72, es 0,9573. Por lo tanto, lo que est en la cola superior es igual a: 1 0,9573 = 0,0427; que es la probabilidad pedida.
0,9573 Fig 5.7: 0,0427

1,72

Entonces: P( z 1,72) = 0,0427

5.3. Clculo del percentil de Z Consiste en calcular el valor de Z que deja bajo l, cierta probabilidad dada.

Ejemplo: Calcular Z 0,85


0,85 Fig 5.8:

Z=?

El percentil 85 de Z es un valor de Z que est sobre el 85% del rea. Esto corresponde a una probabilidad 0,85. 1: Se busca en la tabla Z, la probabilidad ms cercana a 0,85. En este caso es 0,8508. 2: En esa fila, en la columna Z, est el valor de z con un decimal. En este caso 1,0 3: En la columna donde est el 0,8508 est el segundo decimal de Z. En este caso, 4. Entonces, Z 0,85 = 1,04

0,02

0,03

0,04

0,05

0,9
1,0

0,8212 0,8461

0,8238 0,8485

0,8264
0,8508

0,8289 0,8531

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

40

Vicerrectora Acadmica Cuaderno de Apuntes 2010

6. Estandarizacin

Se llama estandarizar una variable x normal, el convertir sus valores x por valores Z, aplicando la transformacin Z = Esta operacin tiene variadas aplicaciones, de las cuales en este apunte se vern solo algunas.

x .

3
-3

2
-2

1
-1

+ 1
1

+ 2
2

+ 3
3

X Z

Fig 5.9: Curva normal y normal estndar

Ejemplo: Se ha determinado que el ingreso mensual per cpita de los hogares de cierto barrio se distribuye normalmente con media $58.820 y desviacin estndar $14.250. Si esto es as, cul sera la ubicacin relativa de un hogar con un ingreso mensual per cpita de $50 mil? Solucin:

1: estandarizando mediante Z =

Z=

50.000 58.820 = -0,62 14.250

2: Se calcula, con la tabla Z, la probabilidad: P(z -0,62) P(z -0,62) = 0,7324


26,76% 73,24% X($) Fig 5.10:

50000 58820

Respuesta: El ingreso de este hogar se ubica sobre el 26,76% de su poblacin y por debajo el 73,24% de la misma.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

41

Vicerrectora Acadmica Cuaderno de Apuntes 2010

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Calcular P( z -0,78) Solucin: Esta probabilidad corresponde al rea bajo la curva desde z = -0,78, hasta . Ver regin achurada en esquema.
? Fig 5.11:

-0,78

Como la tabla no tiene reas para Z negativos, se debe aprovechar la propiedad de simetra de la curva normal. Esto significa que para valores negativos de Z se cumple lo mismo que para valores positivos.

0,7823 0,2177 Fig 5.12:

0,78

Segn tabla Z, la probabilidad por debajo de Z = 0,78 es 0,7823. Por lo tanto, P( z -0,78) = 0,2177

2. Calcular P(-1,43 z 0,81) Solucin: Para los efectos, es conveniente trazar primero un esquema grfico.
0,0764 0,2090

Fig 5.13:

-1,43

0,81

Segn tabla, P(Z 0,81) = 1 0,7910 = 0,2090 Y, adems: P(Z -1,43) = 1 0,9236 = 0,0764 Ya determinado el valor de las dos colas, que suman 0,2854, se determina el valor de la probabilidad pedida, correspondiente a la regin achurada en el grfico. Como el rea total de la curva es 1, entonces: P(-1,43 z 0,81) = 1 - 0,2854 = 0,7146

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

42

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. Calcular el valor del percentil 35 de Z. Solucin: Para facilitar la resolucin, se realiza un esquema grfico de la situacin:
35% Fig 5.14:

Observando el esquema de la figura 5.14, se puede establecer que el Z es negativo. Adems, en la tabla no aparecer la probabilidad p = 0,3500, ya que es una tabla que solo da los valores para z positivo. Se aprovecha, entonces, la propiedad simtrica de la curva normal, buscando el valor para p = 0,65. Buscando en la tabla el valor p = 0,65. El valor ms cercano es 0,6517, que corresponde a Z = 0,39. Como Z buscado es negativo, entonces Z 0,35 = -0,39.
4. Consumo de electricidad Se ha verificado que en cierto barrio, el consumo mensual de electricidad por hogar sigue una curva normal con media $19.820 y desviacin estndar $4.250. Qu % de los hogares consumen ms de $25 mil al mes en electricidad? Solucin: Primero se esquematizar la situacin en el siguiente grfico:
Fig 5.15:

%? X($)

19820 25000

En segundo lugar, se estandarizar el consumo de $25.000, mediante Z =

x .

Z=

25.000 19.820 = 1,22 4.250

Con esto, el problema se reduce al clculo de la probabilidad sobre Z = 1,22.


Fig 5.16:

p? Z

1,22

Tercero: se calcula el valor de la probabilidad, mediante la tabla z. P(z 1,22) = 0,1112 Finalmente, se convierte esta probabilidad en %. P = 11,12%. Respuesta: el 11,12% de los hogares consumen ms de $25 mil al mes en electricidad.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

43

Vicerrectora Acadmica Cuaderno de Apuntes 2010

5. Precio de mercado Una empresa desea entrar al mercado con un producto cuyo precio en el mercado sigue una curva normal con media $8.400 y desviacin estndar $1.250. Si la empresa se desea ubicar sobre el 25% de los precios de mercado, En cunto tendra que fijar el precio de su producto? Solucin: Primero se esquematizar la situacin en el siguiente grfico (Fig 5.17):
Fig 5.17: 25% X($)

8400

En segundo lugar, se determinar el percentil 25 de Z. Mediante tabla, se obtiene que Z 0,25 = -0,67
x =-0,67

En tercer lugar se plantea que: Reemplazando los valores:

Z=

x 8.400 = 0,67 1.250

Despejando x:
x 8.400 = 0,67 1.250 x 8.400 = 837,5
x = 8.400 837,5

x = $7.564

Por lo tanto, si esta empresa desea ubicarse sobre al 25% de los precios de mercado, debera fijar su producto en $7.564.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Uso de tabla Z 1.1. Calcular P(-2 Z -1) A) 0,9772 B) 0,8413 1.2. El valor aproximado de Z 0,12 es:

C) 0,1587

D) 0,0228

E) 0,1359

A) 1,19

B) 1,38

C) 1,62

D) -1,18

E) -3,03

2. Variable aleatoria normal Se tiene una variable aleatoria X que se distribuye normalmente, con media 15 y desviacin estndar 4. 2.1. La probabilidad de que X < 10 es: A) 0,1056 B) 0,1524 C) 0,3944

D) 0,4256

E) 0,8944

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

44

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2. Cul es el valor del percentil 97,5 de X? A) 7,2 B) 22,8 C) 15,6

D) 18,2

E) 2,5

3. Estudio de mercado Un estudio de mercado determin que la edad de los televidentes de cierto programa de TV se distribuye normalmente, con media 42 aos y desviacin estndar 5 aos. 3.1. Cul es la probabilidad de que un televidente del programa tenga ms de 40 aos? A) 0,1554 B) 0,3346 C) 0,6554 D) 0,7228 E) 0,8446 3.2. Qu % de los televidentes de este programa tiene menos de 30 aos? A) Menos del 1% B) Entre el 1% y el 2% C) Aproximadamente el 5% D) Aproximadamente el 8% E) Ms del 10% 3.3. Cul es la edad mnima que tiene el segmento del 15% de televidentes de este programa de mayor edad? A) 43 aos B) 44 aos C) 45 aos D) 47 aos E) 49 aos

4. Duracin de repuesto Una empresa provee un repuesto para un equipo audiovisual, especificando una duracin que se distribuye normalmente con media de 480 horas de uso y desviacin estndar 60 horas. 4.1. Qu % de los repuestos dura menos de 400 horas de uso? A) 5,1% B) 7,4% C) 9,2% D) 11,8%

E) 13,6%

4.2. Cunto dura, como mnimo, el segmento del 25% de los repuestos de mayor duracin? A) 420 horas B) 440 horas C) 500 horas D) 515 horas E) 520 horas 4.3. Cul es la probabilidad de que un repuesto dure ms de 500 horas de uso? A) 0,1293 B) 0,3707 C) 0,3944 D) 0,3333 E) 0,6293

Solucin a problemas propuestos:


1.1. E 2.1. A 3.1. C 4.1. C 1.2. D 2.2. B 3.2. A 4.2. E

3.3. D 4.3. B

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

45

Vicerrectora Acadmica Cuaderno de Apuntes 2010

V.

RECURSOS COMPLEMENTARIOS

1. Bibliografa para conceptos bsicos de probabilidad: -Spiegel, Murray. Probabilidad y Estadstica. McGraw Hill, 2003. ISBN: 9584101331. Captulo I. 2. Sitio Web: AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm

CLASE 34. Distribuciones continuas: Normal (I) CLASE 35. Distribuciones continuas: Normal (II) CLASE 36. Distribuciones continuas: Normal (III): Ejercicios CLASE 37. Distribuciones continuas: Normal (IV): Ejercicios

3. Sitio Web: Fisterra. Metodologa de la investigacin http://www.fisterra.com/mbe/investiga/index.asp La Distribucin Normal

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

46

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2 UNIDAD: TEORA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 6

Conceptos bsicos de inferencia estadstica


Todo conocimiento conlleva el riesgo del error y de la ilusin. E. Morin.

APRENDIZAJES ESPERADOS
-Explican el concepto de muestreo. -Identifican distribucin muestral de medias y su relacin con la normal. -Explican el concepto de error muestral. -Identifican el concepto de estimacin, demostrando conocimiento de los distintos parmetros y sus respectivos estadgrafos.

CONTENIDOS
-Concepto de muestreo y los estadsticos muestrales como variable aleatoria. -Concepto de error muestral o estndar.

II.

DESARROLLO

1. Inferencia estadstica 1.1. Concepto de inferencia Inferir es sacar una conclusin a partir de algunas premisas iniciales. Por eso, es posible distinguir dos clases de inferencia; la deductiva, que va desde lo general a lo particular y la inductiva, que procede desde lo particular a lo general. Como la inferencia estadstica consiste en hacer afirmaciones acerca de una poblacin a partir de los datos de una muestra, esta constituye un caso de inferencia inductiva. Ver esquema de la figura 6.1. Por ejemplo, sobre la base de una encuesta telefnica aplicada a 845 clientes, un banco comercial puede obtener una estimacin del % de sus clientes que no est satisfecho con los servicios del banco.

Poblacin INFERENCIA RESULTADOS MUESTRALES

muestra

Fig 6.1: Esquema del proceso inferencial

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

47

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.2. Estadgrafos y parmetros Una de las formas de caracterizar y describir una muestra es a travs de estadgrafos como el rango, la media, la desviacin estndar, la mediana, etc. Todos estos son resultados muestrales y tienen tambin un valor en la poblacin. Esto significa que existe una media poblacional, una varianza poblacional, etc. Algunos ejemplos son los siguientes:

MEDIDA Media Varianza Desviacin estndar


Estadgrafo (muestral)
x S2

Parmetro (poblacional)
2

Estadgrafo: es una medida muestral Parmetro: es una medida poblacional

Como los parmetros son desconocidos, se recurre a los estadgrafos para inferir sobre aquellos.
1.3. Dos clases de inferencia Ya planteado el problema central de la inferencia estadstica, esto es, cmo hacer afirmaciones acerca de los parmetros a partir de resultados muestrales, se pueden distinguir dos trabajos que enfrentan los mtodos estadsticos de inferencia:

Estimacin de parmetros: a partir de los resultados de la muestra se puede establecer el valor numrico de los parmetros. Ejemplo: a partir de los datos de una muestra, se desea saber qu % de las empresas chilenas tienen deudas morosas con bancos. Contraste de hiptesis: a partir de los resultados de la muestra se puede establecer si ciertas hiptesis acerca de los parmetros poblacionales son verdaderos o no. Ejemplo: a partir de los datos de una muestra, se desea saber si el ingreso mensual promedio de los trabajadores chilenos es o no menor a $215.000.

2. Muestreo 2.1. Concepto de muestreo: Se denomina muestreo a la operacin de seleccionar la muestra de la poblacin a investigar. El principio fundamenta que gua el muestreo estadstico es que todos los sujetos de la poblacin tengan la misma probabilidad de salir seleccionados. De este modo se logra una muestra estadstica, que es la que funda la posibilidad de hacer inferencias vlidas. 2.2. Trabajo con muestras: 2.2.1. Algunas ventajas de trabajar con muestras:

Es ms rpido, ya que se estudian menos sujetos. Es ms barato, ya que al ser menos sujetos en estudio se requieren menos recursos. Si la muestra es representativa, se obtienen resultados muy cercanos a la realidad poblacional. Al ser menos los objetos de estudio, se les puede estudiar detalladamente.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

48

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2.2. Algunas desventajas de trabajar con muestras:

Todo trabajo con muestras est sujeto a incertidumbre (error). Es imposible escapar de este fenmeno. El trabajo con muestras requiere personal especializado. Si la muestra no est bien seleccionada, se puede llegar a resultados errneos. El trabajo con muestras requiere tcnicas estadsticas muy especializadas.

2.3. Importancia del muestreo: Para los efectos de inferencia, es imprescindible que la muestra sea aleatoria, de otra manera no hay posibilidad de inferir en forma vlida. Dicho de otro modo, solo es posible realizar inferencias vlidas sobre la base de muestras aleatorias. Este tipo de muestra tambin se suele llamar muestra estadstica. Esta exigencia se debe a que todo el proceso de inferencia est basado en el clculo de probabilidades.

2.4. Algunos tipos de muestreo: Ejemplo: se ha de estudiar un total de 15 mujeres y 25 hombres que trabajan en cinco departamentos distintos de una empresa de exportaciones. Para los efectos, se requiere seleccionar al azar un grupo de 8 personas. 2.4.1. Muestreo aleatorio simple: Consiste en asignar una identidad, generalmente un nmero, a cada uno de los elementos de la poblacin. Se sortean los seleccionados mediante un mecanismo aleatorio, es decir, a travs de un mtodo independiente del operador. En el caso planteado: A: Se puede colocar el nombre de cada uno de ellos en papelitos en una caja y luego extraer 8 papelitos. B: Tambin puede otorgarse un nmero entero del 1 al 40 a cada uno de ellos. Los seleccionados se pueden obtener de papelitos dentro de una caja, con una tmbola o empleando nmeros al azar originados en una calculadora o programa computacional. 2.4.2. Muestreo estratificado: consiste en seleccionar la muestra con una composicin referida a una caracterstica conocida en la poblacin. En el caso anterior, se puede estratificar respecto del gnero. Como los hombres representan el 62,5% del total, se calcula la proporcin de la muestra que les corresponde. En este caso, el 62,5% de 8 es 5. Por lo tanto, se seleccionaran 5 hombres y 3 mujeres. 2.4.3. Muestreo por conglomerados: cuando los elementos a seleccionar estn distribuidos en grupos ms o menos homogneos (conglomerados), se puede seleccionar a algunos de ellos y luego elegir la muestra solo de los conglomerados seleccionados. En este caso se pueden seleccionar aleatoriamente algunos de los cinco departamentos, por ejemplo, tres. Luego se selecciona dentro de ellos a los ocho trabajadores requeridos, en forma proporcional al tamao de cada conglomerado, independiente del gnero. 2.5. Empleo de nmeros aleatorios en la calculadora Las calculadoras cientficas tienen una funcin denominada RANDOM, que genera nmeros al azar. La calculadora Casio fx350MS (y similares) entrega nmero aleatorios que fluctan entre 0,000 y 0,999. Operacin Resultado

SHIFT Ran#

0,561

Este nmero 0,569 es aleatorio. Se puede usar la primera dcima (el 5) o los dos ltimos (el 61), etc. segn las necesidades. 49

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Hay una forma ms elegante de obtener nmeros aleatorios segn requerimientos. Por ejemplo, para generar tres nmeros aleatorios del 1 al 10, se opera as: 10 SHIFT Ran# + 1 La multiplicacin por 10 convierte al nmero aleatorio en cifras que van del 0,00 al 9,99. Al sumarle 1 se convierten en nmeros aleatorios del 1,00 al 10,99. Para los tres nmeros requeridos se usa solo la parte entera de los nmeros que resulten.
Operacin Resultado

10 SHIFT Ran# + 1 = = = Etc. De los resultados, se toman los enteros: el 5, el 2 y el 1.


Nota: 1) Cuando el estudiante realice esta operacin, lo ms probable es que resulten otros nmeros. 2) Si se requieren nmeros del 1 al 50 se hace: 50 SHIFT Ran# + 1, etc.

5,43 2,76 1,33

3. Distribucin muestral de medias 3.1. El experimento:

Se tiene una poblacin con una variable numrica X, con media y varianza 2 . Se extraen muestras de tamao n1 , n 2 , n 3 , etc. En cada una de las muestras se calcula la media aritmtica: x 1 , x 2 , x 3 , etc. El sentido comn dice que estas medias no tienen por qu ser iguales, aunque provengan de la misma poblacin. En efecto, si se extraen todas las muestras posibles de una poblacin, se verifica que las medias muestrales son diferentes. Entonces, es posible establecer lo siguiente:

Las medias muestrales constituyen una variable. Las medias muestrales constituyen una variable aleatoria. Como la media muestral es una variable aleatoria entonces tiene un valor esperado y una varianza.

3.2. Distribucin de medias muestrales: Las medias muestrales se distribuyen normalmente. Esto ltimo puede resultar inesperado, pero el teorema central del lmite as lo establece:

En una poblacin con una variable numrica X, con media y varianza 2 : Las medias muestrales se distribuyen normalmente, con media y varianza
2 . n

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

50

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Es decir:

La media de todas las medias muestrales es igual a la media poblacional de la variable X. La varianza es la ene-sima parte de la varianza de la variable X.

3.3. Error muestral o estndar de la media:

Se llama error estndar o error muestral a la desviacin estndar de la distribucin de medias muestrales y se simboliza x .
2 . Este error estndar se suele expresar as: n x = n

x =

(1)

3.4. Significado del error estndar de la media:

Fig 6.2: Distribucin muestral de medias

Como la media muestral es una variable, el error estndar corresponde a la variabilidad de la media. Esto significa que al extraer la media de una sola muestra, ese valor x estar ms o menos lejos del valor real . No se sabe cunto, pero es posible establecer ciertos mrgenes de confianza a travs del clculo de probabilidades. El significado ms profundo que deja el concepto de error muestral, es que, a partir de una muestra, es imposible determinar con exactitud el valor de la media poblacional. Toda estimacin estar afecta a un error o incertidumbre, de lo cual no podemos escapar.

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Se tiene una variable numrica X, que se distribuye normalmente con desviacin estndar 10,8 Kg. Una muestra aleatoria de tamao 158 dio una media aritmtica 32 Kg. 1.1. Calcule el error estndar de la media muestral: 1.2. Cmo se distribuye la media muestral en esta variable? Solucin: 1.1. El error muestral de la media es igual a: x =
n

Reemplazando:
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

51

Vicerrectora Acadmica Cuaderno de Apuntes 2010

x =

10,8 158

= 0,8592

El error muestral de la media es igual a 0,8592 Kg. Ntese que el error muestral conserva las unidades de la variable original.
1.2. La distribucin muestral de la media siempre se distribuye normalmente. En este caso se distribuye normalmente con media 31 Kg y desviacin estndar 0,8592 Kg.

2. Por qu se dice que la inferencia estadstica es inductiva? Solucin: Es inductiva porque aplica un razonamiento que va desde lo particular (lo que ocurre en una muestra) hacia lo general (lo que ocurre en la poblacin). 3. Cul es la diferencia entre un estadgrafo y un parmetro? Solucin: El estadgrafo es el valor muestral, mientras que el parmetro es su valor poblacional. 4. Cul es la importancia del muestreo para la inferencia estadstica? Solucin: Si el muestreo es aleatorio, las inferencias son vlidas. 5. Cul es la condicin fundamental para obtener una muestra estadstica? Solucin: Que todos los elementos de la poblacin tengan la misma probabilidad de salir seleccionados, a travs de mtodos independientes de la voluntad del investigador.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Respecto de la inferencia estadstica, se afirma que: I: Es un proceso que va de lo general a lo particular II: Entrega resultados exactos de lo que ocurre en la poblacin III: Toma como referencia resultados de una muestra

Es (son) correcta(s): A) Solo II B) Solo III

C) Solo I y II

D) Solo II y III

E) Solo I y III

2. Segn el texto, los mtodos de inferencia estadstica tienen por objeto: A) Establecer la verdad de lo que ocurre en la poblacin B) Conocer en detalle las caractersticas de la muestra C) Seleccionar las mejores muestras que sea posible D) Hacer afirmaciones acerca de los parmetros en la poblacin E) Elegir entre los mejores parmetros poblacionales

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

52

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. En estadstica, el trabajo con muestras de una poblacin, en vez de trabajar con toda la poblacin, se fundamenta en que: I: Muchas veces es imposible acceder a toda la poblacin II: Se desconoce lo que ocurre en la poblacin III: El trabajo con muestras tiene un menor costo

Es (son) correcta(s): A) Solo III B) Solo I y II

C) Solo II y III

D) Solo I y III

E) I, II y III

4. De los siguientes, es (son) trabajo(s) de la inferencia estadstica: I: Decidir si ciertas hiptesis son verdaderas o no. II: Hacer una estimacin del valor de un parmetro III: Organizar censos para determinar el valor de los parmetros

A) Solo I

B) Solo II

C) Solo I y II

D) Solo II y III

E) Solo I y III

5. El llamado teorema central del lmite, en trminos generales establece que: A) Es imposible determinar el valor numrico de la media muestral B) La varianza poblacional jams podr ser conocida C) Los parmetros poblacionales son difciles de determinar D) Las medias son variables aleatorias E) Las medias muestrales se distribuyen normalmente 6. Si una variable numrica tiene en la poblacin media y varianza 2 , entonces el error muestral de la distribucin de medias muestrales:

I: Se distribuye normalmente. Es (son) correcta(s): A) Ninguna B) Solo I y II

II: Tiene media aritmtica .

III: Tiene varianza

2 n

C) Solo II y III

D) Solo I y III

E) Solo I, II y III

7. Tiempo de rehabilitacin

El tiempo de rehabilitacin de una muestra de trabajadores accidentados se distribuye normalmente con varianza 67 das 2 . Investigando una muestra aleatoria de 71 casos dio un tiempo medio de rehabilitacin de 23 das.
7.1. La desviacin estndar poblacional del tiempo de rehabilitacin es igual a:

A) 8,19

B) 67

C) 23

D) 71

E) No se puede saber

7.2. La media aritmtica de la distribucin de medias muestrales es igual a:

A) 71

B)

67

C) 23

D) 8,2

E) No se puede saber

7.3. El error muestral de la distribucin de medias muestrales es igual a: A) 0,971 B) 2,73 C) 7,95 D) 1,71

E) 0,884

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

53

Vicerrectora Acadmica Cuaderno de Apuntes 2010

8. La existencia del error estndar de la media muestral deja de manifiesto que: A) Es posible determinar con exactitud la media poblacional a partir de una muestra B) Los mtodos de inferencia estadstica son errneos C) No se deben utilizar muestras en los mtodos estadsticos de inferencia D) Es probable que la muestra no se haya elegido aleatoriamente E) La media poblacional se puede conocer, pero con cierto grado de incertidumbre

Solucin a problemas propuestos:


1. B 6. B 2. D 7.1. A 3. D 7.2. C 4. C 7.3. A 5. E 8. E

V.

RECURSOS COMPLEMENTARIOS

1. Teora del muestreo http://www.uaq.mx/matematicas/estadisticas/xstad02.html

Unidad 6. Teora de Muestreo Tamao y obtencin de muestras, el teorema central del lmite, errores, estimaciones, variacin muestral e intervalo de confianza.
2. Teora del muestreo http://www.bioestadistica.freeservers.com/temas.html Tema 10. Teora de muestras: Introduccin. Muestras aleatorias y no aleatorias. Aplicaciones en Medicina. Distribuciones de probabilidad en el muestreo: medias, proporciones, diferencia de dos medias y de dos proporciones. Ejemplos de aplicacin. 3. Teora del muestreo http://ftp.medprev.uma.es/libro/html.htm 7.4 Tcnicas de muestreo sobre una poblacin 4. AULAFACIL http://www.aulafacil.com/CursoEstadistica/CursoEstadistica.htm CLASE 38. Teorema Central del Lmite CLASE 39. Teorema Central del Lmite: Ejercicios (I)

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

54

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2 UNIDAD: TEORA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 7

Intervalos de confianza para la media


Todo conocimiento conlleva el riesgo del error y de la ilusin. E. Morin.

APRENDIZAJES ESPERADOS
-Calculan el error estndar para la media con datos muestrales dados. -Explican la influencia del tamao de la muestra en el error. -Calculan intervalos de confianza para la media con varianza conocida.

CONTENIDOS
-Concepto de estimacin y de estimacin por intervalos. -Clculo del error muestral para la media con varianza conocida. -Clculo de intervalos de confianza para la media con varianza conocida.

II.

DESARROLLO

1. Fundamentos de la estimacin La estimacin de parmetros es uno de los objetivos de la inferencia estadstica. En el caso de la media, consiste en estimar el valor numrico de la media poblacional a partir de los resultados muestrales. El mtodo ms confiable es aquel que hace la estimacin de un intervalo de confianza, dentro del cual se puede encontrar la media poblacional, con cierta probabilidad conocida. Como la media muestral se distribuye normalmente con media y desviacin estndar (error estndar) , es posible usar el n modelo normal para establecer un intervalo de confianza (IC), dentro del cual se encuentre la media poblacional.

% Confianza

Fig 7.1: Intervalo de confianza para la media

2. Confianza y significacin 2.1. Nivel de significacin ( ):

El nivel de significacin es el riesgo de error que asume el investigador para hacer una inferencia. Este error es la incertidumbre que est presente en toda investigacin. Los niveles de significacin usuales son 0,10; 0,05 y 0,01, lo que en porcentaje corresponde al 10%, al 5% y al 1%, respectivamente. 55

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2. Nivel de confianza ( 1 ):

Es el grado de certidumbre o confianza que el investigador quiere dar a su estimacin. Se expresa en probabilidad o en porcentaje. Son usuales en investigacin: ( 1 ) = 0,90 o 90% ( 1 ) = 0,95 o 95% ( 1 ) = 0,99 o 99%

% Confianza

Fig 7.2: Intervalo de confianza (1- ) de la media

En la figura, la confianza ( 1 ) est dada por el rea achurada bajo la curva, mientras que la significacin se divide en partes iguales en la cola superior e inferior de la curva normal. El intervalo de confianza est dado por los valores de la variable que quedan en el centro de la distribucin, +/- cierto margen e, cuya longitud depende de la confianza que decide el investigador y del error estndar de la media. Ntese lo siguiente en el grfico:

Al disminuir la confianza el intervalo se hace ms preciso (menor longitud), pero aumenta la probabilidad de error . Se tiene ms precisin, pero menos confianza. Al aumentar a confianza, el intervalo se hace menos preciso (mayor longitud), pero disminuye la probabilidad de error . Se tiene ms confianza, pero menos precisin.

Como se ver ms adelante, la nica manera de aumentar la precisin sin disminuir la confianza es aumentando el tamao de la muestra.
3. Clculo del intervalo de confianza para la media 3.1. Intervalo de confianza (IC): El mtodo consiste en determinar la media muestral y obtener un intervalo de confianza, sumndole y restndole a la media un cierto margen denominado error e, tambin llamado error de investigacin.
= x e

Este error e est presente en toda investigacin. El investigador fija este error como parte de su diseo de investigacin. El error de investigacin e depende de dos factores: 1) La confianza que se desea tener (90%, 95%, 99%); y 2) El error muestral de la media ( x ) De este modo, se tiene que:
e = Z 1 / 2 x

Reemplazando, se obtiene que el intervalo de confianza para la media poblacional est dado por:
= x Z 1 / 2 x

(1) 56

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

De acuerdo a la relacin (1), para determinar un intervalo de confianza (IC) se requiere:


1 : El nivel de confianza que se da el investigador. x : La media muestral, que se calcula con los datos de la muestra. Z 1 / 2 : Es el percentil de la distribucin Z, que depende de la confianza elegida.
x : El error estndar o muestral, que se calcula con los valores muestrales.

3.2. Niveles de confianza usuales: Los niveles de confianza ms usuales son 90%, 95% y 99%.

Valores usuales de Z 1 / 2 :

Para un intervalo de confianza del 90%: Z 1 / 2 = 1,645 Para un intervalo de confianza del 95%: Z 1 / 2 = 1,96 Para un intervalo de confianza del 99%: Z 1 / 2 = 2,58

3.3. Varianza conocida o desconocida:

La varianza de la distribucin de medias muestrales 2 es importante para calcular el error estndar.


3.3.1. Cuando se conoce 2 :

Cuando se conoce el parmetro , se usa el siguiente error estndar:


x =

Donde es la desviacin estndar de la poblacin.


3.3.2. Cuando se desconoce 2 :

Cuando se desconoce el parmetro , se puede usar la siguiente estimacin:


x =

S n 1

Donde S es la desviacin estndar de la muestra. (En la calculadora, x n ).

3.4. Error estndar y tamao de la muestra: Como ya se ha visto, la variabilidad de las medias muestrales se refleja en el error muestral:
x =

De este modo, por aparecer el tamao de muestra en el denominador, se deduce que:


A menor tamao de muestra, mayor es el error estndar. A mayor tamao de muestra, menor es el error estndar.

Consecuencias: La nica manera de disminuir el error es aumentando el tamao de la muestra. Este error nunca va a desaparecer, por grande o chica que sea la muestra, siempre estar en la frmula.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

57

Vicerrectora Acadmica Cuaderno de Apuntes 2010

4. Condiciones para determinar el IC de la media El clculo de un intervalo de confianza para la media poblacional mediante la frmula (1) requiere que se cumplan algunas condiciones:

Cuando se conoce la varianza poblacional y la variable X es normal, se puede usar la frmula, sin importar el tamao de la muestra. Cuando se desconoce la varianza poblacional y la variable X es normal, se puede usar la frmula, para un tamao de muestra n > 30, haciendo la estimacin de la varianza poblacional a partir de la muestral, tal como se especifica. Cuando se desconoce la varianza poblacional y la variable X es aproximadamente normal, se puede usar la frmula, para muestras con n > 30, haciendo la estimacin de la varianza poblacional a partir de la muestral, tal como se especifica. Cuando se desconoce la varianza poblacional y la muestra es chica (n < 30) no se puede usar esta frmula, ya que se basa en el modelo de la normal Z. En rigor, se debe usar el modelo de la t de Student, caso que est fuera del alcance de este curso.

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Tiempo de rescate Se sabe que el tiempo de llegada de una unidad de rescate hasta el lugar de un accidente se distribuye normalmente con desviacin estndar 3,5 minutos. Un muestra de 18 llamados dio una media aritmtica de 8,2 minutos. Con estos datos: 1.1. Calcule el error muestral de la media. 1.2. Calcule un intervalo de confianza del 95% para la media poblacional del tiempo de llegada. 1.3. Qu significa este intervalo de confianza? 1.4. Por qu es posible usar el modelo con el estadstico Z en este caso? 1.5. Cul es la probabilidad de que el tiempo medio poblacional sea de ms de 9 minutos? Solucin: 1.1. Error muestral: En este caso la desviacin estndar poblacional es conocida: Por lo tanto: x = n
x =

3,5 18

= 0,825 minutos.

1.2. Intervalo de confianza:


1 = 95% x = 8,2 minutos

Z 0,975 = 1,96 (es el valor de Z para un 95% de confianza).


x = 0,825 minutos

Por lo tanto:
= x Z 1 / 2 x = 8,2 1,96 0,825
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

58

Vicerrectora Acadmica Cuaderno de Apuntes 2010

= 8,2 1,617 , con un 95% de confianza.

Sumando y restando el error e, queda: 6,58 9,82 minutos, con un 95% de probabilidades. R: El tiempo medio poblacional de llegada est entre 6,58 y 9,82 minutos, con un 95% de probabilidades.
1.3. Significado: Este IC significa que media aritmtica poblacional se encuentra entre 6,58 y 9,82 minutos, con un 95% de probabilidades. Implica que, de cada 100 muestras, 95 medias caen dentro de este intervalo. En 5 casos la media muestral quedara fuera. Este es el riesgo de error que debe enfrentar y asumir toda investigacin. 1.4. Modelo En este caso se puede usar el modelo con la normal Z porque, aunque la muestra es chica, se conoce la varianza poblacional. Est dada, y es (3,5 minutos) 2 . 1.5. Tenemos que:
= 8,2 minutos; x = 0,825 minutos

x i = 9 minutos

Estandarizando 8:
Z= 9 8,2 = 0,97 0,825

Calculando, en la tabla z, la probabilidad P(Z 0,97) = 0,1660 R: la probabilidad de que el tiempo medio poblacional sea de ms de 9 minutos es de 0,1660, lo que equivale al 16,6%.

2. Horas extra La siguiente tabla muestra las horas extra realizadas por trabajadores en una empresa en un mes:

Horas 10 20 20 30 30 40 40 50

N de casos 9 23 18 3

2.1. Calcule las horas extra promedio en esta muestra. 2.2. Calcule el error muestral de la media. 2.3. Calcule un intervalo de confianza del 99% para las horas extra poblacional. 2.4. Calcule la probabilidad de que el promedio poblacional de horas extra por trabajador sea mayor a 30 horas al mes.

Para estandarizar se usa, en este caso, la distribucin Z. El uso del modelo normal estndar es posible debido a que se conoce el valor de la desviacin estndar poblacional.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

59

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin: Ingresando los datos a la calculadora, se obtiene:


n = 53 ; x = 27,83 horas; xn = 8,10 horas.

2.1. Media x = 27,83 horas

R: El promedio de horas extra al mes es de 27,83 horas por trabajador.


2.2. Error muestral Como se desconoce la desviacin estndar poblacional, se usa la muestral:
x = x =

S n 1 8,1

; = 1,123 horas

53 1

R: El error estndar de la media es 1,123 horas extra al mes.

2.3. Intervalo de confianza:


1 = 99% x = 27,8 horas Z 0,995 = 2,58 (es el valor de z para un 99% de confianza) 9.
x = 1,123 horas

Entonces, el intervalo de confianza es igual a:


= 27,8 2,58 1,123 = 27,8 2,9 , con un 99% de confianza.

Sumando y restando el error e, queda: 24,9 30,7 horas, con un 99% de probabilidades. R: La media poblacional de horas extra se encuentra entre 24,9 y 30,7 horas por trabajador, con un 99% de probabilidades.
2.4. Estandarizando 10: 30 27,8 Z= = 1,96 1,123

Calculando, en la tabla z, la probabilidad P(Z 1,96) = 0,0250. R: La probabilidad de que la media poblacional de horas extra sea ms de 30 horas al mes es 0,025, lo que equivale al 2,5%.

9 En trminos rigurosos, no es propio usar la distribucin Z, ya que se desconoce la varianza poblacional. Pero cuando n > 30 el uso de la Z da excelentes aproximaciones. Cuando se desconoce la varianza poblacional se debe usar la distribucin t de Student, en especial cuando se trata de muestra chica (n < 30). 10 Para estandarizar se us la distribucin Z. El uso del modelo normal estndar es posible debido a que no se conoce el valor de la desviacin estndar poblacional, pero n > 30.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

60

Vicerrectora Acadmica Cuaderno de Apuntes 2010

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Velocidad de infiltracin Se mide en forma experimental la velocidad de infiltracin del agua en un terreno arcilloso, obteniendo en un total de 43 mediciones las siguientes velocidades, en metros/hora.

Vel (m/hr) 67 78 89 9 10 10 11

N de casos 5 11 15 9 3

1.1. La velocidad media de infiltracin del agua en este terreno es: A) 8, 50 m/hr. B) 8,41m/hr. C) 8, 36 m/hr. D) 7,83 m/hr. 1.2. El error estndar de la media es igual a: A) 1,682 m/hr. B) 0,168 m/hr. C) 0,166 m/hr.

E) 7,58 m/hr.

D) 0,183 m/hr.

E) 0,153 m/hr.

1.3. El intervalo del 95% de confianza para la velocidad media de infiltracin del terreno, en m/hr. es igual a: A) 8,4 8,9 B) 8,3 8,8 C) 8,2 8,6 D) 8,1 8,9 E) 8,0 8,7

2. Ventas diarias Las ventas diarias de una empresa forestal se distribuyen normalmente. Una muestra de ventas correspondientes a 40 das, alcanz una media de 67,5 $millones, con desviacin estndar 16,1 $millones. 2.1. El error estndar de la media, en $millones, es igual a: A) 2,58 B) 2,53 C) 2,46 D) 2,41

E) 2,33

2.2. Un intervalo de confianza del 90% para las ventas medias de la empresa, en $millones, tiene como lmite superior: A) 74,9 B) 73,2 C) 72,1 D) 71,7 E) 71,1 2.3. La aplicacin del modelo normal para tratar este caso se justifica porque: I: Las ventas diarias se distribuyen normalmente II: Las medias muestrales de las ventas diarias se distribuyen normalmente III: El tamao de la muestra es adecuada para el modelo

Es (son) correcta(s): A) Solo I B) Solo I y II

C) Solo I y III

D) Solo I y III

E) I, II y III

3. Prdidas por detenciones Una empresa textil ha investigado las prdidas de material en una muestra de 122 detenciones de cierto proceso productivo. Se lleg a establecer, con un 95% de confianza, que las prdidas medias oscilan entre 22,8 y 42,4 $mil pesos por detencin. Se encontr, adems, una distribucin normal de las prdidas.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

61

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3.1. La media muestral de las prdidas alcanz a: A) 32,6 $mil B) 33,4 $mil C) 33,7 $mil

D) 34,4 $mil

E) 35,6 $mil

3.2. El error de investigacin de las prdidas por detencin alcanz a: A) 8,8 $mil B) 9,8 $mil C) 10,1 $mil D) 10,4 $mil 3.3. El error estndar de la media de las prdidas alcanz a: A) 4,5 $mil B) 4,8 $mil C) 5 $mil D) 6 $mil

D) 11,2 $mil

E) 6,5 $mil

3.4. Para mejorar la precisin de esta estimacin manteniendo la confianza, se debe: A) Hacer todo el estudio de nuevo, desechando lo que ya est hecho B) Aumentar el tamao de la muestra, agregando ms casos a los ya estudiados C) Elegir un nivel de significacin ms pequeo, por ejemplo, el 1% D) Optando por un nivel de significacin ms grande, por ejemplo, el 10% E) Lo que ms conviene es hacer un estudio censal

Solucin a problemas propuestos:


1.1. C 2.1. A 3.1. A 1.2. B 2.2. D 3.2. B 1.3. E 2.3. E 3.3. C

3.4. B

V.

RECURSOS COMPLEMENTARIOS

1. Teora del muestreo http://www.uaq.mx/matematicas/estadisticas/xstad02.html Unidad 6. Teora de Muestreo Tamao y obtencin de muestras, el teorema central del lmite, errores, estimaciones, variacin muestral e intervalo de confianza. 2. Teora y problemas de estimacin http://ftp.medprev.uma.es/libro/html.htm 8. Estimacin confidencial 3. Intervalos de confianza para la media http://ftp.medprev.uma.es/libro/html.htm 8.4 Intervalos de confianza para la distribucin normal

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

62

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2 UNIDAD: TEORA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 8

Intervalos de confianza para la proporcin


Mi optimismo se funda en lo improbable. E. Morin

APRENDIZAJES ESPERADOS
-Calculan el error estndar de proporciones con datos muestrales dados. -Calculan intervalos de confianza para la proporcin poblacional con muestra grande.

CONTENIDOS
-Clculo del error muestral para una proporcin. -Clculo de intervalos de confianza para una proporcin.

II.

DESARROLLO

1. Distribucin muestral de las proporciones 1.1. El experimento

Se tiene una poblacin binomial en la cual hay una probabilidad p de que ocurra un suceso y una probabilidad q = 1 p de que no ocurra. Se extraen de esta poblacin, muestras aleatorias de tamaos n1 , n 2 , n 3 , etc. En cada una de las muestras se calcula la proporcin muestral: P1 , P2 , P3 , etc. Entonces, se da que la proporcin muestral Pi es una variable. La variable Pi es aleatoria y, por lo tanto, tiene un valor esperado y una varianza.
1.2. El teorema central del lmite: El teorema central del lmite establece que:

La distribucin de proporciones muestrales se distribuye normalmente; La media o valor esperado de esta distribucin es n p ; y: La varianza de esta distribucin es
p q . n

La desviacin estndar de esta distribucin es el error estndar de la proporcin y est dado por:
p q n

p =

(1)

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

63

Vicerrectora Acadmica Cuaderno de Apuntes 2010

% Confianza

p
Fig 8.1: Intervalo de confianza para la proporcin

2. Clculo del intervalo de confianza para la proporcin Para calcular un intervalo de confianza (1 - ) para la media se aplica lo siguiente:
p = P e

Siendo: p = proporcin poblacional. P = proporcin muestral. e = error (de investigacin) El error e, es igual a: e = Z1 / 2 p

Por lo tanto, el intervalo de confianza (1 - ) de la proporcin poblacional es igual a:


p = P Z 1 / 2 p

(2)

En donde: P=
x , es la proporcin muestral, siendo x los casos favorables y n el tamao de la muestra. n

Z1 / 2 = Percentil de la distribucin Z, dado por el nivel de confianza elegido.

p = Es el error estndar muestral de la proporcin.

Para calcular un IC para la proporcin poblacional se requiere, por lo tanto: 1 : El nivel de confianza que se da el investigador.
P : La proporcin muestral, que se calcula con los datos de la muestra. Z 1 / 2 : Es el percentil de la distribucin Z, que depende de la confianza elegida.

p : Es el error estndar o muestral, que se calcula con los valores de la muestra.


Valores de Z: Confianza Percentil
Z 0,995 Z 0,975 Z 0,95

Valor de Z

99% 95% 90%

2,58 1,96 1,645

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

64

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Ejemplo: Se investiga una muestra aleatoria de 247 microempresas, encontrando que 57 de ellas han incorporado las TICs a su gestin. Con estos datos: 1. Calcule el error muestral de la proporcin. 2. Calcule un intervalo de confianza del 90% para la proporcin poblacional de microempresas que han incorporado las TICs a su gestin. Solucin: 1. Error muestral: n = 247 ; x = 57 . Entonces: P =
57 = 0,231 ; siendo q = 1 0,231 = 0,769 247

El error estndar es igual a: p =


p =

p q n 0,231 0,769 = 0,0268 247

R: El error muestral es 0,0268, que equivale a un 2,68%. 2. Intervalo de confianza:


1 = 90% P = 0,231 Z 0,95 = 1,645 p = 0,0268

Por lo tanto:
p = 0,231 1,645 0,0268 p = 0,231 0,044 , con un 90% de confianza.

Sumando y restando el error, queda: 0,187 p 0,275, con un 90% de probabilidades. R: De acuerdo a los datos entre el 18,7% y el 27,5% de las microempresas han incorporado las TICs a su gestin, con un 90% de probabilidades.

5% 18,7

90 % Confianza
23,1 27,5

5%

Fig 8.2: Intervalo de confianza para la proporcin

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

65

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. Consideraciones generales

La muestra es independiente, y proviene de una poblacin binomial. El modelo funciona muy bien para tamaos de muestra con n > 100. Para muestras de tamao entre 30 y 100 el modelo funciona, pero con un error mayor. Poca precisin. El modelo no es aplicable para muestra chica (n < 30). El modelo funciona muy bien para p cercano a 0,5. El modelo no es aplicable para p menor que 0,1 o mayor que 0,9.

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Discriminacin de gnero En una muestra de 865 mujeres trabajadoras, 179 declararon haber sido vctimas de discriminacin de gnero en su lugar de trabajo en el curso de los ltimos 6 meses. 1.1. Calcular un intervalo de confianza del 95% para la proporcin poblacional de mujeres que habra sufrido tal discriminacin. 1.2. Calcular la probabilidad de que la proporcin poblacional de mujeres discriminadas en su lugar de trabajo supere el 23%. Solucin: 1.1. Intervalo de confianza Clculo de p muestral: 179 = 0,207 p= 865

Clculo del error muestral:


p = 0,207 0,793 = 0,0138 865

Clculo del intervalo de confianza del 95%: El valor de z para un IC del 95% es 1,96. Ver en tabla Z el valor de z 0,975 . Entonces el intervalo para p es igual a:
p = 0,207 1,96 0,0138 p = 0,207 0,027 , con un 95% de confianza.

Sumando y restando el error y transformando a %, este intervalo se expresa como:


18,0% p 23,4% , con un 95% de confianza.

O bien:

p = [18,0; 23,4]% , con un 95% de confianza.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

66

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Esto significa que en la poblacin hay un 95% de probabilidades de que la proporcin de mujeres que sufren discriminacin de gnero est entre el 18% y el 23,4%. Esto es que, en 95 de cada 100 muestras de esta poblacin, la proporcin de mujeres que sufren discriminacin de gnero se ubicar entre el 18,0% y el 23,4%.
Comentario: por lo general se usa una sola muestra para determinar la proporcin por intervalo. Debe dejarse de manifiesto que existe una cierta probabilidad de que la proporcin sea otra. En el ejemplo, tenemos un 95% de probabilidades de que la proporcin de mujeres que sufren discriminacin de gnero est en el intervalo sealado, pero tambin tenemos un 5% de probabilidades de que no sea as. 1.2. Probabilidad de que la proporcin poblacional de mujeres discriminadas en su lugar de trabajo supere el 23%. Por el clculo anterior, se tiene: p = 0,207; y, adems: p = 0,0138

El 23% se expresa como probabilidad p i = 0,23 Estandarizando: 0,23 0,207 = 1,67 Z= 0,0138 Segn la tabla Z, la probabilidad P(Z >1,67) = 0,0475 R: La probabilidad de que la proporcin poblacional de mujeres discriminadas en su lugar de trabajo supere el 23% es igual a 0,0475.

2. Victimizacin en Mendoza Un estudio de realizado en Argentina declar la siguiente ficha tcnica de investigacin:

TIPO DE INVESTIGACIN: Encuesta por Muestreo. UNIVERSO: Poblacin general residente en la Ciudad de Mendoza y Gran Mendoza, mayor de 15 aos. DISEO DE LA MUESTRA: Probabilstica, con seleccin de la unidad final de acuerdo a cuotas de sexo y edad. CUESTIONARIO: Semi-estructurado y pre-codificado. Realizacin adems de preguntas abiertas para cuestiones de inters cualitativo y de anlisis de contenido. Aplicacin domiciliaria. TAMAO DISTRIBUCIN DE LA MUESTRA: 799 casos. Distrito Cantidad de casos Error de investigacin Mendoza Capital 141 +/-8,4% Godoy Cruz 223 +/-6,7% Guaymalln 255 +/-6,3% Las Heras 180 +/-7,5% Total 799 +/-3,5%

Respecto de los errores de investigacin: 2.1. Si esta ficha tcnica no declar el nivel de confianza, con los datos dados, es posible estimarla?
Solucin: S, es posible estimar el nivel de confianza, aplicando la definicin de error e .
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

67

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Por definicin: e = Z p En esta igualdad se conoce el error del total de la investigacin: e = 0,035 Se puede determinar, adems, p , ya que p =
p q n

Como no se conoce p , se toma el mximo p = 0,5. Entonces:


p = 0,5 0,5 = 0,0177 799

Entonces, como: Reemplazando: Despejando Z:

e = Z p 0,035 = Z 0,0177 0,035 = 1,98 0,0177

Z=

Este Z es cercano a 1,96, que es el Z usado para un 95% de confianza. R: Considerando las aproximaciones de la ficha tcnica, el nivel de confianza utilizado por el estudio en cuestin es del 95%. En ciertos estudios se emplea para el 95% de confianza el valor Z = 2, que es un modo de simplificar los clculos, que asegura un 95% de confianza. Tal es este caso, en que lo ms probable es que el error 3,5% haya sido calculado con Z = 2.
0,5 0,5 = 0,035 799

En efecto, si se calcula el valor del error: e = 2

3. Proporciones 3.1. Qu es una poblacin binomial? 3.2. Cul es la diferencia entre incidencia y prevalencia? 3.3. Cul es la diferencia entre un estadstico y un parmetro? Solucin: 3.1: Una poblacin binomial es una poblacin en la cual se define un suceso que tiene solo dos resultados posibles, mutuamente excluyentes. 3.2: Se conoce como prevalencia a la proporcin de sujetos de una poblacin, que en un momento dado, presenta cierta caracterstica en estudio. Por ejemplo el % de trabajadores que en este momento trabajan por cuenta propia. La incidencia, por su parte, es la proporcin de sujetos que, en el curso de un perodo de tiempo, presenta cierta caracterstica en estudio. Por ejemplo, el % de trabajadores que durante el ao 2009 optaron por trabajar por cuenta propia. La diferencia es, por lo tanto, el tiempo. La prevalencia se da en el presente, mientras que la incidencia son los nuevos casos que se producen en un perodo. 3.3: Un estadstico es un valor muestral de una caracterstica en estudio, mientras que el parmetro es el valor poblacional. La diferencia es, entonces, que el estadstico es muestral y el parmetro es poblacional.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

68

Vicerrectora Acadmica Cuaderno de Apuntes 2010

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

Caso 1: Impacto de la crisis econmica en la empresa Se realiza un estudio con 285 empresarios para determinar el nivel de impacto de la recesin econmica en su empresa. Los resultados se muestran en la tabla siguiente:

Cul ha sido el nivel de impacto de la crisis econmica en su empresa? Nivel de impacto N casos Muy afectada 83 Medianamente afectada 110 Poco afectada 53 Nada afectada 39 TOTAL 285
1.1. La variable en estudio est medida en una escala de tipo: A) Continua B) Discreta C) Ordinal D) Multinomial

E) Dicotmica

1.2. La probabilidad de que en la muestra un empresario se sienta Poco afectado o Nada afectado por la crisis econmica es: A) 0,137 B) 0,186 C) 0,291 D) 0,323 E) 0,677 1.3. El error estndar de la proporcin poblacional de empresarios que se sienten Muy afectado por la recesin econmica es igual a: A) 0,0245 B) 0,0269 C) 0,0288 D) 0,0527 E) 0,0532 1.4. Un intervalo de confianza del 90% para la proporcin de empresas que se siente Medianamente o Muy afectada por la recesin econmica es: A) 58,5%68,2% B) 59,1%70,3% C) 60,7%70,7% D) 61,3%71,3% E) 63,1%-72,3%

2. Caso ELECCIONES A causa de cierto proceso eleccionario presidencial que se acerca, se realiza una encuesta para conocer la intencin de voto en una muestra de 750 votantes, respecto de los dos nicos candidatos, construyndose la siguiente tabla de resultados.

VOTARA: Por candidato A Por candidato B Nulo o en blanco TOTAL Sobre la base de estos datos:

Sexo Hombres 148 168 14 330 Mujeres 194 159 67 420

TOTAL 342 327 81 750

2.1. Haga una estimacin por intervalo del % poblacional de votacin Nulo o en blanco, con una confianza del 95%. A) Entre el 8,1 y el 12,4% B) Entre el 8,6 y el 13,0% C) Entre el 9,4 y el 13,8% D) Entre el 9,6 y el 14,3% E) Entre el 11,2 y el 14,7%

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

69

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2. Construya un intervalo de confianza del 90% para la proporcin poblacional de mujeres que votara por el candidato A. A) Entre 42,2 y el 50,2% B) Entre 43,1 y el 51,3% C) Entre 44,3 y el 50,4% D) Entre 45,2 y el 52,5% E) Entre 46,2 y el 56,2% 2.3. En la poblacin de votantes del candidato B, calcule un intervalo de confianza del 95% para la proporcin de hombres. A) Entre el 44,0 y el 54,0% B) Entre el 45,3 y el 56,3% C) Entre el 46,0 y el 56,8% D) Entre el 47,1 y el 55,7% E) Entre el 48,0 y el 56,0% 3. Satisfaccin con el lugar de trabajo La empresa Alka-SA, que se dedica a hacer investigacin en el mbito de la economa en el trabajo, est interesada en determinar qu % de trabajadoras y trabajadores chilenos se encuentra satisfecho o muy satisfecho en su lugar de trabajo. Con una muestra de tamao 400, estim, con un 95% de confianza, que la proporcin poblacional en esta situacin fluctuaba entre el 59,3 y 68,7%. Con estos datos, determine: 3.1. La proporcin muestral de trabajadoras y trabajadores chilenos que se encuentra satisfecho o muy satisfecho con su lugar de trabajo es igual a: A) 5% B) 9,4% C) 59,3% D) 64,0% E) 68,7% 3.2. El error muestral en esta investigacin, en %, alcanza al: A) 9,4% B) 6,2% C) 4,8% D) 4,7% 3.3. El error de investigacin lleg al: A) 4,7% B) 5,0% C) 2,4%

E) 2,4%

D) 9,4%

E) 6,4%

Solucin a problemas propuestos:


1.1. C 2.1. B 3.1. D 1.2. D 2.2. A 3.2. E 1.3. B 2.3. C 3.3. A 1.4. E

V.

RECURSOS COMPLEMENTARIOS

1. Teora y problemas de estimacin http://www.bioestadistica.freeservers.com/temas.html Tema 11. Teora de la inferencia estadstica: Introduccin. Estimas por puntos y por intervalos. Intervalos de medias, de proporciones, del desvo estndar y de la varianza. Propiedades de un estimador. Intervalos para dos muestras. Intervalos para el cociente de dos proporciones. Ejemplos. 2. Teora y problemas de estimacin http://ftp.medprev.uma.es/libro/html.htm 8. Estimacin confidencial 3. Intervalos de confianza para la proporcin http://ftp.medprev.uma.es/libro/html.htm 8.6 Intervalos de confianza para variables dicotmicas
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

70

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2 UNIDAD: TEORA ELEMENTAL DEL MUESTREO E INTERVALOS DE CONFIANZA CLASE 9

Clculo del tamao de la muestra


Es el azar, no la prudencia lo que rige la vida. Cicern

APRENDIZAJES ESPERADOS
-Calculan el tamao de muestra para un intervalo de confianza con error dado.

CONTENIDOS
-Tamao de la muestra

II.

DESARROLLO

1. Tamao de la muestra para proporciones 1.1. La situacin Como ya vimos, un intervalo de confianza para la proporcin poblacional se obtiene sumando y restando a la proporcin muestral un cierto error e .

Esto es:

p =Pe

Este error e depende de la confianza ( 1 ) adoptada por el investigador y del error estndar p . El error e se expresa como: e = Z p El error estndar p depende, a su vez, de p y n, ya que:
e = Z p q n

(1)

Aqu participan 4 variables, e, Z , p y n . El valor de q no interviene directamente, ya que q = 1 - p. Elevando al cuadrado la igualdad (1):
e2 = Z2 p q n

Despejando n:
n= Z 2 p q e2

(2)

Esta es la expresin general del tamao de la muestra para estudios con proporciones. El investigador fija z (fijando la confianza) y e (fijando el error que est dispuesto a aceptar). Solo falta el valor de p.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

71

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Todo estudio en el que intervienen proporciones, debe comenzar fijando el error e que el investigador (o su cliente) est dispuesto a aceptar y del cual no puede prescindir. Generalmente ese error es menor al 10%, pudiendo ser, 1%, 2%, 2,5%, etc. Obviamente, cuanto menor sea este error, ms preciso ser el estudio, pero necesitar un tamao de muestra mayor. Esto no es trivial, puesto que en una investigacin hay implicados costos, tiempo, dificultades tcnicas, climticas, geogrficas, etc. Por eso se debe utilizar siempre el nmero mnimo de muestras.
1.2. Tamao de la muestra para proporciones cuando p es conocido Si se conoce p, se fija e y z. De la relacin (2) se llega que el tamao de la muestra es igual a:

n=

Z 2 p q e2

Este tamao muestral se usa cuando se tiene algn dato del valor de p. Nota: el error e debe estar expresado como probabilidad. Ejemplo: se desea hacer un estudio con un 95% de confianza para saber qu % de la poblacin cree realmente en los noticieros de la TV. Se tiene como dato, por un estudio previo, que ese % llega al 67,8% Cul es el tamao ms adecuado de la muestra para este estudio, si se desea un error de no ms del 8%? Solucin: Se tiene: Z = 1,96 (valor de z para un 95% de confianza). P = 0,678 y q = 0,322 e = 0,08 Reemplazando:
n= 1,96 2 0,678 0,322 = 131,0 131 sujetos. 0,08 2

R: se requiere una muestra de tamao 131.

1.3. Tamao de la muestra para p desconocido Si se fija Z y e, pero se desconoce p, el tamao de la muestra es igual a:
Z 2 0,25 e2

n=

Este tamao muestral se usa cuando no se tiene ningn dato del valor de p. Esta forma asume que p = 0,5 y que q = 0,5. Nota: el error e debe estar expresado como probabilidad. Ejemplo: se desea hacer un estudio exploratorio para saber, con un 95% de confianza, qu % de la poblacin cree realmente en los noticieros de la TV. Cul es el tamao ms adecuado para la muestra para un error de no ms del 8%? Solucin: Se tiene: Z = 1,96 (valor de z para un 95% de confianza). e = 0,08
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

72

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Reemplazando:
1,96 2 0,25 0,08 2

n=

= 150,1 151 sujetos.

R: se requiere una muestra de tamao 151.

1.4. Tamao de la muestra conociendo solo el error e Si se fija solamente el error de investigacin e , el tamao de la muestra es igual a:
n= 1 e2

Este tamao muestral asegura al menos un 95% de confianza y asume que p = 0,5. Nota: el error e debe estar expresado como probabilidad. Ejemplo: se desea hacer un estudio exploratorio para saber, qu % de la poblacin cree realmente en los noticieros de la TV. Cul es el tamao ms adecuado para la muestra para un error de no ms del 8%? Solucin: Como no se especifican datos de confianza ni se conoce p: 1 = 156,25 157 sujetos. n= 0,08 2 R: se requiere un tamao de muestra igual a 157, tamao que segura al menos un 95% de confianza en la estimacin.

1.5. Tamao de la muestra cuando se conoce el tamao de la poblacin 1: Se calcula el tamao n1 segn casos anteriores.

2: Se multiplica este tamao por un factor de correccin k. 1 k= n1 1 1+ N Siendo N = tamao de la poblacin y n1 tamao de la muestra sin correccin.

Ejemplo: En la comuna de Quilleco, con un universo de 5.422 votantes, un candidato a Alcalde encarga una encuesta para determinar, con una confianza del 95% y un error no superior al 4%, el porcentaje de votantes que apoyan su candidatura. Un estudio exploratorio indic que esa cifra llega al 28,5%. Cul es el tamao adecuado de la muestra? Solucin: N = 5.422 IC(95%) Z 0,975 = 1,96
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

73

Vicerrectora Acadmica Cuaderno de Apuntes 2010

e = 4%
p = 0,285

e = 0,04 q = 0,715

n1 =

1,96 2 0,285 0,715 = 489, 3 490 0,04 2

Factor de correccin: 1 = 0,9173 k= 489 1+ 5422 Entonces, finalmente: n = 490 0,9173 = 450 personas R: el estudio requiere una muestra aleatoria de 450 personas.

1.6. Tamao de la muestra para encontrar al menos un caso favorable En ocasiones se requiere una muestra que asegure con cierta confianza (1 - ), obtener al menos un sujeto con una caracterstica especial, cuya probabilidad p se conoce en la poblacin.

El tamao de la muestra es: n= log ( ) log(1 p ) o bien: n = ln ( ) ln( 1 p )

Siendo: = 1 confianza, expresado como probabilidad.

Ejemplo: En cierto sector industrial, el 18,5% de las empresas tienen sus cotizaciones provisionales impagas. Se desea seleccionar una muestra aleatoria de esta poblacin para tener, con una confianza del 99%, al menos una empresa en esta situacin. Cul ser el tamao adecuado de la muestra? Solucin: Confianza del 99% = 1 0,99 = 0,01
p = 0,185 1 p = 0,815

Luego:

n=

log 0,01 = 22,5 23 empresas seleccionadas al azar. log 0,815

R: se tiene un 99% de probabilidades de que resulte al menos una empresa con cotizaciones impagas, en una muestra aleatoria de tamao 23.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

74

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Tamao de la muestra para medias 2.1. La situacin Un intervalo de confianza para la media poblacional se obtiene sumando y restando a la media muestral un cierto error e .

Esto es:

= xe

Este error e , llamado tambin error de investigacin, depende de la confianza ( 1 ) adoptada por el investigador y del error muestral x . El error e se expresa como:
e = Z x

El error estndar x depende, a su vez, de y n, ya que x =


e=Z n

. Entonces:

(1)

Elevando al cuadrado la igualdad (1):


e2 = Z2 2 n

Despejando n: n= O bien: Z 2 2 e2
2

(2.1) (2.2)

Z n= e

Si se desconoce , se estima a partir de la muestra, utilizando S . (En la calculadora: x n1 ).

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Reforma laboral Un estudio realizado con 385 trabajadores dependientes revel 258 a favor de cierta reforma laboral. 1.1. Cul es el error muestral en este estudio? 1.2. Cul es la probabilidad de que la proporcin de personas que opinan as sea mayor al 70%? 1.3. Calcule un intervalo de confianza del 95% para la proporcin poblacional de trabajadores a favor de la reforma laboral. 1.4. Si se quiere un intervalo de confianza del 99% para la proporcin poblacional de trabajadores a favor de la reforma laboral con un error inferior al 3%, cul debera ser el tamao adecuado de la muestra? Solucin: Es un problema de proporciones, con n = 385 y x = 258. 1.1. Error muestral: La proporcin muestral es: p = 258/385 = 0,670

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

75

Vicerrectora Acadmica Cuaderno de Apuntes 2010

El error muestral es:

p =

0,67 0,33 = 0,0240. 385

R: El error muestral en este estudio es 0,024, lo que equivale al 2,4%.


1.2. Probabilidad:

Estandarizando: Segn tabla z:

z=

0,7 0,67 = 1,25 0,024

p(z 1,25) = 0,1057.

R: La probabilidad de que los trabajadores que piensan as sean ms del 70% es 0,1057.
1.3. Intervalo de confianza:

Tenemos que: Entonces:

p = 0,024

y que: z0,975 = 1,96

IC(95) p = 0,67 1,96 0,024 = 0,67 0,047

R: la proporcin poblacional est entre el 62,3 y el 71,7%, con un 95% de probabilidades.

1.4. Tamao de la muestra: De los resultados anteriores se tiene: p = 0,67.

Para un 99% de confianza se requiere z 0,995 = 2,58 Entonces:


n= 2,582 0,67 0,33 = 1.635 trabajadores 0,032

R: El tamao de la muestra tendra que ser de 1.635 trabajadores.

2: Mobbing Se desea estudiar la proporcin de la poblacin de trabajadores que ha sido objeto de mobbing en el curso del ltimo ao. 2.1. Seale el tamao de la muestra para un error no superior al 6%. Indique las condiciones en que se dara ese error. 2.2. Calcule el tamao de la muestra para un 95% de confianza con un error no superior al 4%. Solucin: 2.1. Se tiene como dato que e = 0,06. Entonces:
n= 1 0,06 2

= 277,7 278 trabajadores.

Con esta muestra se lograra una confianza de al menos 95%, asumiendo que p = 0,5.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

76

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2. Se tiene como dato que e = 0,04 y que z = 1,96. Entonces:


1,96 2 0,25 0,04 2

n=

= 600,25 601 trabajadores.

3. Precio de acciones Se estableci con una muestra de tamao 40, que el precio medio de ciertas acciones en el mercado es de $1.640, con desviacin estndar $100. A partir de esta informacin se desea establecer, con un 99% de confianza, un intervalo para el precio medio poblacional, con un error de no ms de $35. Cul es el tamao adecuado de la muestra? Solucin:

El tamao de muestra est dado por: n = Para este caso: Entonces:

Z 2 2 e2
2,58 2 100 2 35 2

Z = 2,58; = 100 y e = 35 .
n=

= 54,3 55 muestras.

R: Se requiere una muestra de tamao 55.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Accidentes laborales Una investigacin exploratoria con una muestra aleatoria de 282 accidentes laborales dio origen a la siguiente tabla: Actividad econmica Minera Industria Construccin Comercio Transporte Servicios Total Casos 21 35 86 16 73 51 282

1.1. Se desea establecer, con un 90% de confianza, el porcentaje de accidentes laborales que se producen en el sector construccin. Para este caso, el error de investigacin, en %, alcanza a: A) 2,74% B) 4,51% C) 4,63% D) 5,37% E) 5,48% 1.2. Si se desea calcular, con una confianza del 95%, con un error del 4%, la proporcin poblacional de accidentes laborales en el sector transporte, el tamao mnimo de la muestra deber ser: A) 236 B) 254 C) 366 D) 413 E) 461 1.3. Si se desea calcular, con una confianza del 99%, con un error del 3%, la proporcin poblacional de accidentes laborales en el sector Servicios, el tamao mnimo de la muestra deber ser: A) 13 B) 33 C) 425 D) 1.097 E) 1.112
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

77

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Estudio de mercado Se desea saber qu % de la poblacin C2-C3 se interesa por contratar un seguro de vida. Para los efectos se debe determinar el tamao de la muestra. 2.1. Si no se tiene ningn dato, el tamao de la muestra que asegure, a lo ms un 2,5% de error, sera: A) 7 B) 16 C) 40 D) 1.250 E) 1.600 2.2. Si se quiere un error no superior al 4% y una confianza del 99%, el tamao de la muestra sera: A) 166 B) 840 C) 1.040 D) 1.250 E) 4.160 2.3. Si se sabe que, aproximadamente el 12% de esta poblacin estara interesada en un seguro de vida, se quiere un error no superior al 4% y un nivel de confianza del 95%, el tamao mnimo de la muestra sera: A) 254 B) 285 C) 324 D) 400 E) 1.250 2.4. Si se cuenta con recursos para encuestar una muestra de solo 800 personas de la poblacin y no se tiene ningn otro dato, este tamao de muestra, con un 95% de confianza asegura un error de no ms de: A) 2,54% B) 3,46% C) 4,32% D) 4,68% E) 5,16%

3. Transporte escolar De una poblacin de 34.565 estudiantes de EGB de los primeros niveles en colegios de cierta comuna, se desea extraer una muestra aleatoria para determinar el % de la poblacin que usa transporte escolar pagado, con un error no mayor al 4%. 3.1. Si no se tienen otros datos al respecto, se requiere una muestra de un mnimo de: A) 400 B) 546 C) 614 D) 625 E) 3.2. Si, adems, se requiere un 99% de confianza, se requiere una muestra de un tamao mnimo de: A) 1.010 B) 1.250 C) 1.312 D) 1.401 E) 1.521 4. Espesor de la madera Una industria de muebles de madera sabe que el espesor de las piezas de madera (tablas) que utiliza como insumo, se distribuye normalmente con desviacin estndar 5 mm. Esta empresa quiere establecer un intervalo de confianza del 99% para el espesor medio de este insumo, con un error que no vaya ms all de 2 mm. El tamao mnimo de la muestra adecuado es: A) 7 B) 17 C) 25 D) 42 E) 50

Solucin a problemas propuestos:


1.1. B 2.1. E 3.1. C 4. D 1.2. E 2.2. C 3.2. A 1.3. D 2.3. A 2.4. B

V.

RECURSOS COMPLEMENTARIOS

1. Tamao de la muestra Fisterra: Metodologa de la investigacin http://www.fisterra.com/mbe/investiga/index.asp Determinacin del tamao muestral
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

78

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Teora del muestreo http://www.uaq.mx/matematicas/estadisticas/xstad02.html Unidad 6. Teora de Muestreo Tamao y obtencin de muestras, el teorema central del lmite, errores, estimaciones, variacin muestral e intervalo de confianza.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

79

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3 UNIDAD: DCIMAS DE HIPTESIS CLASE 10

Introduccin al contraste de hiptesis


El mayor error sera subestimar el problema del error; la mayor ilusin sera subestimar el problema de la ilusin. E. Morin.

APRENDIZAJES ESPERADOS
-Identifican concepto de hiptesis estadstica. -Explican los errores de tipo I y de tipo II presentes en una decisin. -Identifican hiptesis nula y alternativa en casos dados. -Plantean correctamente hiptesis estadsticas (H0 y H1). -Identifican los pasos de la metodologa clsica de docimasia de hiptesis. -Identifican ensayos de cola izquierda, cola derecha y de dos colas en situaciones dadas.

CONTENIDOS
-Hiptesis. -Error tipo I y tipo II. -Concepto de nivel de significacin. -Planteamiento de hiptesis estadsticas -Metodologa general para la prueba de hiptesis.

II.

DESARROLLO

1. Conceptos bsicos de dcimas de hiptesis 1.1. Hiptesis Afirmacin acerca del mundo sensible, posible de verificar empricamente. Ejemplos:

En Santiago de Chile, el agua hierve a 97C A mayor satisfaccin laboral, mayor productividad.

1.2. Hiptesis estadstica Afirmacin acerca de los parmetros de una poblacin, fundada en una distribucin de frecuencias obtenida de una muestra (observaciones). 1.3. Dcima de hiptesis Docimar, probar, testear o contrastar una hiptesis estadstica, consiste en someterla a un mecanismo estadstico para decidir si se rechaza o no se rechaza. 1.4. Posibilidad de error Cada vez que se decide acerca del rechazo o no de una hiptesis, existe el riesgo de error. 1.4.1. Error de tipo I: es aquel que se comete al rechazar una hiptesis (como si fuese falsa) siendo que en realidad es verdadera. 1.4.2. Error de tipo II: es el error que se comete cuando no se rechaza una hiptesis (como si fuese verdadera) siendo que en realidad es falsa. Ejemplo: Hiptesis: El 18% de las prendas de vestir del mercado, estn mal etiquetadas. Error de tipo I: Rechazar que el 18% de las prendas de vestir del mercado estn mal etiquetadas, siendo que es verdadero. Error de tipo II: No rechazar que el 18% de las prendas de vestir del mercado estn mal etiquetadas, siendo que es falso.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

80

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.5. Error y decisin estadstica


La hiptesis es: Decisin Rechazar No-rechazar Verdadera Error tipo I decisin correcta Falsa decisin correcta Error tipo II

Los errores I y II estn relacionados inversamente. Al disminuir uno, aumenta el otro. La nica manera de disminuirlos es aumentando la cantidad de datos, aumentando el tamao de la muestra. Ejemplo: Hoy va a llover, por lo tanto, llevo paraguas. Si llueve: la decisin de llevar paraguas es acertada. Si no llueve: se comete error de tipo II, al aceptar una hiptesis que result ser falsa. Hoy no va a llover, por lo tanto, no llevo paraguas. Si no llueve: la decisin es acertada. Si llueve: se comete error de tipo I, al rechazar la hiptesis de lluvia, que result ser verdadera.
Consideraciones interesantes: -Para disminuir el error de tipo I, se podra llevar paraguas todos los das. En efecto, con esto disminuye el error de tipo I, pero aumenta el error de tipo II. Por lo tanto, esa no es una buena medida. -Para disminuir el error de tipo II, mejor sera no llevar nunca paraguas. Con esta medida disminuye, en efecto, el error de tipo II, pero aumenta el error de tipo I. Por lo tanto, tampoco es una buena medida. -No hay manera de escapar a estos dos tipos de errores. -No es lo mismo cometer error de tipo I que cometer error de tipo II, porque tiene distintos efectos.

1.6. Nivel de significacin ( )

Es el riesgo de cometer error del tipo I, que el investigador asume para tomar una decisin acerca de una hiptesis. Este error se representa con la letra y se expresa como probabilidad o como tanto por ciento. Los niveles de significacin ms usuales son: = 0,1 (10%); = 0,05 (5%); y

= 0,01 (1%)
En rigor, el nivel de significacin lo declara el investigador antes de comenzar su investigacin.
2. Contrastes de hiptesis Las hiptesis estadsticas a contrastar consisten, principalmente, en afirmaciones acerca de los parmetros de una poblacin. Un parmetro es una medida que caracteriza a una poblacin. Por ejemplo, la media aritmtica poblacional. Generalmente los parmetros son desconocidos y se estiman a travs de los estadgrafos, que son los valores muestrales. Por ejemplo, la media poblacional , se estima a travs de la media muestral x . La proporcin poblacional p , a travs de la proporcin muestral P. Y as sucesivamente. En este apunte se vern las hiptesis relacionadas con , p y las diferencias entre esos parmetros.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

81

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.1. Hiptesis usuales: Las hiptesis estadsticas ms usuales son las siguientes: 2.1.1. Hiptesis de la media:
= 0 .

Esto es, que la media poblacional tiene un valor determinado 0 . Ejemplo: En promedio, un obrero gana $2.845 por hora de trabajo. Hiptesis: = 2.845
2.1.2. Hiptesis de la diferencia de medias:
A B

Esto es, que la diferencia de medias poblacionales entre A y B tiene un valor determinado. Ejemplo: El monto promedio de ventas de las vendedoras mujeres es mayor que el de los vendedores hombres. Hiptesis: M H > 0
2.1.3. Hiptesis de la proporcin:
p = p0

Esto es, que la proporcin poblacional tiene un valor determinado p 0 . Ejemplo: El 4,5% de los trabajadores chilenos est sindicalizado. Hiptesis: p = 4,5 %
2.1.4. Hiptesis de la diferencia de proporciones:
p A pB

Se plantea la hiptesis de que la diferencia de proporciones poblacionales tiene un valor determinado. Ejemplo: El % de mujeres que vot por el candidato A es menor que el de hombres. Hiptesis: p M p H < 0
2.2. Hiptesis nula y alternativa: Para realizar una dcima de hiptesis se plantean dos tipos de hiptesis: 2.2.1. Hiptesis Nula (H0) Esta es una hiptesis instrumental, que se plantea como oposicin o complemento a la hiptesis que interesa. 2.2.2. Hiptesis alternativa (H1): Es la hiptesis que se desea someter a contraste. Esta est respaldada por datos empricos.

Por ejemplo, si se desea contrastar la hiptesis de que ms del 15% de los estudiantes ha consumido alguna droga prohibida en el curso del ltimo ao, se plantean las hiptesis siguientes: H0: El 15% de los estudiantes ha consumido alguna droga prohibida en el curso del ltimo ao. Versus la hiptesis alternativa: H1: Ms del 15% de los estudiantes ha consumido alguna droga prohibida en el curso del ltimo ao Utilizando simbologa estadstica, este contraste se expresa as: H0: p = 0,15 H1: p > 0,15 En este caso los porcentajes se plantean como probabilidad.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

82

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. Mecanismo de un contraste de hiptesis El esquema general de un contraste de hiptesis se resume a continuacin. Sin embargo hay que aclarar que los distintos tipos de contrastes de hiptesis obedecen a un mismo esquema general, dndose diferencias en los modelos de probabilidad que sirven de base. 1: Se elije un nivel de significacin .

El nivel de significacin es elegido por el investigador, basndose en los siguientes criterios generales: En investigacin social, que se centra en aspectos cualitativos, es usual elegir, preferentemente, entre el 5% y el 10%. Son frecuentes en este tipo de estudios, las variables cualitativas. Por ese motivo se puede aceptar un % de probabilidad de error mayor. En investigacin con variables numricas (cuantitativas), se elige, preferentemente, entre el 1% y el 5%. Por tratarse de variables numricas, se puede aceptar una probabilidad de error menor.
2: Se plantea la hiptesis nula y su hiptesis alternativa, segn contexto de la investigacin. La hiptesis nula es central en todo el procedimiento. El mtodo se basa en el supuesto de que esta hiptesis es VERDADERA y que est fundada en un modelo de probabilidad conocido, por ejemplo, en el modelo normal. 3: Se generan los datos empricos y se calcula un estadstico de prueba, que sirve para decidir si la hiptesis nula ha de ser rechazada o no. Los datos empricos dan origen a un estadstico (nmero) de prueba. El mtodo consiste en COMPARAR este estadstico, que est respaldado con los datos, con el modelo terico. 4: Se toma la decisin de rechazar o no la hiptesis nula, sobre la base de los resultados numricos. Si el modelo terico se ajusta a los datos empricos representado por el estadstico de prueba, entonces se confirma que la hiptesis nula es verdadera y no se podra rechazar. Si el estadstico de prueba no se ajusta a lo ideal, entonces la hiptesis nula es falsa y habra que rechazarla. 5: Se analiza y se construye una conclusin acerca de la hiptesis planteada, cerrando as en crculo del proceso. La conclusin debe apuntar a validar o no la afirmacin (hiptesis) que dio origen al estudio. 4. Planteamiento de hiptesis estadsticas 4.1. Planteamiento algebraico

Sea un parmetro, y 0 el valor que se postula como el valor poblacional. Entonces, se pueden dar tres situaciones en el planteamiento de hiptesis estadsticas: Caso 1: Caso 2: Caso 3:

H0: = 0
H1 : > 0

H0: = 0
H1 : < 0

H0: = 0
H1 : 0

Ntese que la hiptesis nula se caracteriza por el signo igual.

4.2. Tipos de contraste, pruebas o ensayos Dependiendo de la hiptesis alternativa que se elija, se producen tres tipos de ensayo o de prueba. Ntese los signos >, <, , que caracterizan a las hiptesis alternativas.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

83

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Caso 1:

Fig 10.1:

Para H1 : > 0

Prueba de cola derecha:

En este tipo de ensayo, toda la probabilidad de error tipo I queda en la cola superior de la curva de probabilidad usada como modelo. Figura 10.1.
Fig 10.2:

Caso 2:

Para H1 : < 0

Prueba de cola izquierda:

En el ensayo de cola izquierda, toda la probabilidad de error tipo I queda en la cola inferior de la curva de probabilidad usada como modelo. Figura 10.2.
Fig 10.3:

Caso 3:

Para H1 : 0

/2 Prueba bilateral o de dos colas:

/2

En el ensayo de dos colas, la probabilidad de error tipo I queda repartida en la cola inferior y superior de la curva de probabilidad usada como modelo. Figura 10.3.

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Sexo e ingreso Se realiza un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una poblacin de trabajadores dependientes, del sector comercio, con similares condiciones de trabajo, jerarqua, edad, ciudad y estado civil. Las interrogantes que el estudio desea esclarecer, con un 5% de significacin, tienen que ver con las siguientes afirmaciones: A) Los hombres de esta poblacin representan el 60%. B) El sueldo promedio de las mujeres de esta poblacin es $250.000 al mes. 1.1. Para la afirmacin A, plantee en lenguaje corriente la hiptesis nula y sus correspondientes alternativas de cola derecha, cola izquierda y de dos colas. 1.2. Para la afirmacin B, plantee en lenguaje algebraico la hiptesis nula y sus correspondientes alternativas de cola derecha, cola izquierda y de dos colas. Solucin: 1.1. Afirmacin A. Se trata de una hiptesis de proporciones. H0: Los hombres de esta poblacin representan el 60%.

H1: Los hombres de esta poblacin representan ms del 60%. (ensayo de cola derecha). H1: Los hombres de esta poblacin representan menos del 60%. (ensayo de cola izquierda). H1: Los hombres de esta poblacin no representan el 60%. (ensayo de dos colas).
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

84

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.2. Afirmacin B. Se trata de una hiptesis de media. H0: El sueldo promedio de las mujeres de esta poblacin es $250.000 al mes.

H1: El sueldo promedio de las mujeres de esta poblacin es ms $250.000 al mes. (ensayo de cola derecha). H1: El sueldo promedio de las mujeres de esta poblacin es menos de $250.000 al mes. (ensayo de cola izquierda). H1: El sueldo promedio de las mujeres de esta poblacin no es $250.000 al mes. (ensayo de dos colas). Algebraicamente esto se escribe:
H 0 : = $250.000 H1 : > $250.000 H1 : < $250.000 H1 : $250.000

2. Ingreso y gnero Un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una poblacin de trabajadores del sector frutcola, con similares condiciones de trabajo, jerarqua, edad, ciudad y estado civil, lleg a la siguiente conclusin, a un nivel de significacin del 1%: En este sector laboral, los hombres, en promedio, ganan ms que las mujeres. 2.1. Exprese, en lenguaje corriente, cul es la hiptesis nula en este caso. 2.2. Identifique el tipo de ensayo en este contraste. 2.3. Cul es la probabilidad de cometer error de tipo I en este estudio? 2.4. En qu consiste el error de tipo II en el contexto de este caso? Solucin: 2.1. En estos casos, la hiptesis nula se reconoce por el signo igual. Por lo tanto, es:

H0: En este sector laboral, los hombres, en promedio, ganan igual que las mujeres.
2.2. Si H representa a los hombres y M a las mujeres y se plantea la hiptesis nula como H M = 0, entonces el ensayo

debe ser de cola derecha, ya que: H1: H B > 0. Si H representa a los hombres y M a las mujeres y se plantea la hiptesis nula como M H = 0, entonces el ensayo debera ser de cola izquierda, ya que: H1: M H < 0.
2.3. De acuerdo al enunciado del problema, la probabilidad de error de tipo I es el 1%, ya que corresponde al nivel de significacin. 2.4. El error de tipo II es no rechazar la hiptesis (nula) siendo que es falsa. En este caso, el error de tipo II consiste en no rechazar que los hombres ganan igual que las mujeres, siendo que es falso.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

85

Vicerrectora Acadmica Cuaderno de Apuntes 2010

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Accidentes laborales Se presenta la siguiente afirmacin, en el mbito de la prevencin de riesgos: Ms del 23% de los accidentes laborales se producen por condiciones inseguras de los ambientes de trabajo 1.1. La expresin algebraica de la hiptesis nula es:

A) H 0 : = 23% B) H 0 : p > 23% C) H 0 : p < 23% D) H 0 : p 23% E) H 0 : p = 23%


1.2. La expresin algebraica de la hiptesis alternativa es:

E) H 0 : p = 23% B) H 0 : p > 23% C) H 0 : p < 23% D) H 0 : p 23% E) H 0 : p = 0%


1.3. El error de tipo I en esta hiptesis consiste en: A) Aceptar que ms del 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es verdadero. B) Aceptar que menos del 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es falso. C) Rechazar que el 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es verdadero. D) Rechazar que el 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es falso. E) Rechazar que ms del 23% de los accidentes laborales se producen por condiciones inseguras, siendo que es verdadero. 1.4. Respecto de la hiptesis nula: I: Se asume que es verdadera II: Se basa en un modelo de probabilidad conocido III: Su aceptacin o rechazo est afecta a error

Es (son) correcta(s): A Solo I B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III

2. Licencias mdicas en hombres y mujeres En cierta empresa se desea comprobar si los trabajadores hombres tienen, en promedio, menor nmero de das de licencia mdica en el curso de un ao que los trabajadores mujeres, excluyendo los pre y pos natales.. 2.1. La hiptesis nula es, en este caso: A) Hombres y mujeres tienen, en promedio, iguales das de licencia mdica en el curso de un ao. B) Los hombres tienen, en promedio, ms das de licencia mdica que las mujeres en el curso de un ao. C) Las mujeres tienen, en promedio, ms das de licencia mdica que los hombres en el curso de un ao. D) Las mujeres tienen, en promedio, distintos das de licencia mdica que los hombres en el curso de un ao. E) El problema planteado no es traducible a la forma de hiptesis estadstica en lenguaje corriente 2.2. Algebraicamente, con M = mujer y H = hombre, la hiptesis alternativa se escribe:

A) H M = 0 B) H M > 0 C) H M < 0 D) H M 0 E) El problema no es traducible algebraicamente


Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

86

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.3. En el marco del caso, cometer error de tipo II en esta hiptesis consiste en: A) Aceptar que, en promedio, las mujeres tienen ms das de licencia que los hombres, dado que es falso. B) Aceptar que, en promedio, las mujeres tienen ms das de licencia que los hombres, dado que es verdadero. C) Aceptar que, en promedio, hombres y mujeres tienen igual das de licencia, dado que es verdadero. D) Aceptar que, en promedio, hombres y mujeres tienen igual das de licencia, dado que es falso. E) Rechazar que, en promedio, hombres y mujeres tienen igual das de licencia, dado que es verdadero.

3. Hiptesis, error y significacin 3.1. Segn el texto de esta clase, una hiptesis estadstica: I: Es un enunciado que afirma algo verificable II: Es una afirmacin que siempre es verdadera III: Se sustenta en las observaciones empricas

Es (son) correcta(s): A) Solo I B) Solo III

C) Solo I y II

D) Solo I y III

E) Solo II y III

3.2. En un contraste de hiptesis, respecto del error de tipo II se afirma que: I: Se hace cero cuando se aumenta el tamao de la muestra II: Se relaciona inversamente con el error de tipo I III: Siempre est presente

Es (son) correcta(s): A) Solo I y III B) Solo II y III

C) Solo I y II

D) Solo II

E) Solo III

3.3. En un contraste de hiptesis, el nivel de significacin: I: Corresponde al error de tipo I II: Lo elige el investigador III: Ms usual es el 1%, el 5% y el 10%

Es (son) correcta(s): A) I, II y III B) Solo I y III

C) Solo II y III

D) Solo II y III

E) Solo III

Solucin a problemas propuestos:


1.1. E 2.1. A 3.1. D 1.2. B 2.2. C 3.2. B 1.3. C 2.3. D 5. A 1.4. E

V.

RECURSOS COMPLEMENTARIOS

1. Test de hiptesis http://www.bioestadistica.freeservers.com/temas.html Sitio muy completo, que presenta desde los mtodos estadsticos bsicos hasta los mtodos de inferencia ms complejos. Tambin incluye una gran variedad de Tablas estadsticas usuales.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

87

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Test de hiptesis Tema 12. Teora de la decisin estadstica: Hiptesis estadsticas. Validaciones estadsticas: uso del test de hiptesis. Modelo de Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones de medias y proporciones. Intervalos de confianza versus tests de hiptesis. Ejemplos. 3. Introduccin al contraste de hiptesis http://ftp.medprev.uma.es/libro/html.htm 9. Contrastes de hiptesis 9.2 Introduccin 9.2.0.1 Ejemplo 9.2.2 Observaciones

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

88

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3 UNIDAD: DCIMAS DE HIPTESIS CLASE 11

Contraste de hiptesis de proporciones


Slo el azar est en el origen de toda novedad, de toda creacin en la biosfera. J. Monod.

APRENDIZAJES ESPERADOS
-Realizan pruebas de hiptesis para proporciones. -Analizan e interpretan los resultados de la dcimas de hiptesis de proporciones en el contexto de casos dados.

CONTENIDOS
-Pruebas de hiptesis para proporciones.

II.

DESARROLLO

1. La situacin Cuando se afirma o conjetura que en la poblacin hay un cierto % de elementos que presenta cierta caracterstica o atributo, se est haciendo una afirmacin de un valor de una proporcin poblacional. Estas se constituyen o dan pie a autnticas hiptesis estadsticas. Por ejemplo:

El 45% de los consumidores de bebidas gaseosas prefiere marcas alternativas. La proporcin de trabajadores que sufren acoso laboral en Chile, alcanza al 20%?

Como toda hiptesis estadstica, estas deben contrastarse o ponerse a prueba a travs de un procedimiento vlido en el mundo de las ciencias. Para este caso hablamos de contraste de la proporcin. Empricamente se tiene: n : Una muestra aleatoria x : Casos favorables
P= x : proporcin muestral n

2. Hiptesis 2.1. Hiptesis nula:


H 0 : p = p0

Esta hiptesis indica que la proporcin poblacional es una cantidad p 0 , siendo p 0 un nmero real. Es usual expresar este nmero como probabilidad, aunque tambin puede expresarse en %.
2.2. Hiptesis alternativas: Dependiendo de la situacin, se pueden plantear tres tipos de hiptesis alternativas:
H1 : p > p0 . Conduce a un ensayo de cola derecha.

Esta hiptesis expresa que la proporcin poblacional es mayor que el valor que se postula en la hiptesis nula. 89

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

H1 : p < p0 . Conduce a un ensayo de cola izquierda.

Esta hiptesis expresa que la proporcin poblacional es menor que el valor que se postula en la hiptesis nula.
H1 : p p0 . Conduce a un ensayo de 2 colas.

Esta hiptesis expresa que la proporcin poblacional es distinta que el valor postulado por la hiptesis nula.
Ejemplo: Una encuesta realizada en una comuna a una muestra de 1.450 vecinos, arroj como resultado que el 78,5% de estos se manifestaron en contra de un proyecto de modificacin del plano regulador. Este hecho llev a ciertos dirigentes sociales a afirmar que ms del 80% de los vecinos est en contra de la modificacin del plano regulador.

Para docimar esta hiptesis, se plantea: H0: p = 0,80 La hiptesis nula afirma que el 80% de la poblacin est en desacuerdo con dicha modificacin. H1: p > 0,80 La hiptesis alternativa afirma que ese % es mayor a 80% y da origen a un ensayo de cola derecha.

3. Error muestral de la proporcin El error muestral de la proporcin para realizar el contraste de hiptesis es igual a:
p0 = p0 q0 n

Se agrega a p y q el subndice cero para sealar que se trata de la p que postula la hiptesis nula.

4. Estadstico de prueba Para contrastar la hiptesis se usa el estadstico:


Z= P p0 ; siendo: p0

P = Proporcin muestral
p 0 = Proporcin que postula la hiptesis nula

p0 = error estndar de la proporcin, bajo H0 verdadera


Cuando H0 es cierta, este estadstico se comporta como una distribucin Z (normal estndar).

5. Valor p de la prueba ( * )

El criterio de decisin basado en el valor p es el mtodo ms utilizado en la actualidad para el contraste de todo tipo de hiptesis. De hecho, los programas computacionales estadsticos entregan este valor para que el operador decida respecto de las hiptesis en juego. El valor p, llamado tambin p-value o simplemente * , es la probabilidad que queda sobre el Z de prueba o bajo este segn sea el caso. Se determina con la tabla Z.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

90

Vicerrectora Acadmica Cuaderno de Apuntes 2010

6. Clculo del valor p de la prueba

Ensayo de cola derecha: Ensayo de cola izquierda:

* = P( z > Z prueba ) . Ver figura 11.1. * = P( z < Z prueba ) . Ver figura 11.2.

Ensayo de 2 colas: * = P( z > Z prueba ) + P( z < Z prueba ) = 2 * = P( z > Z prueba ) . Ver figura 11.3.
Fig. 11.1: Fig 11.2: Fig 11.3:
*

*
z

Z prueba

Z prueba

- Z prueba

Z prueba

7. Criterio de decisin acerca de H0 Con un nivel de significacin :

Se rechaza H0 si * < No se rechaza H0 en caso contrario Nota: toda decisin se refiriere exclusivamente a la hiptesis nula.
8. Conclusin Sobre la base de la decisin, se construye una conclusin que debe apuntar directamente a la pregunta o conjetura planteada. La conclusin es una afirmacin que suele ir acompaada por el valor p de la prueba en parntesis, como modo de sustentar dicha afirmacin. Ejemplo: Menos del 8% de los televidentes ve programas culturales en TV (p = 0,2341)

En este caso, el valor p en parntesis indica que la prueba de hiptesis dio un valor p = 0,2341 y que, por lo tanto, la hiptesis nula fue rechazada a favor de la hiptesis alternativa de cola izquierda.
9. Condiciones y restricciones de la prueba -Poblacin: la poblacin en estudio debe ser planteada como binomial. -Tamao de la muestra: el modelo funciona muy bien para muestras mayores que 100. -Para muestras entre 30 y 100 el mtodo es aplicable y funciona bien cuando P es cercano a 0,5. -Para muestras chicas (n < 30) esta prueba no es aplicable, siendo preferible utilizar el modelo de Clopper y Pearson.

-Proporcin: el modelo funciona bien para P entre 0,10 y 0,90. Para valores menores a 0,1 o mayores a 0,9, es preferible utilizar otra dcima, por ejemplo, Clopper y Pearson.
9. Resumen En resumen, para contrastar una hiptesis de proporciones se siguen los siguientes pasos: 1: Plantear las hiptesis: esto es, traducir las hiptesis al lenguaje algebraico, planteando H0 y H1. 2: Calcular el estadstico de prueba: esto es, calcular P muestral, el error muestral p y Z de prueba. 3: Calcular el valor p: Con Z de prueba se calcula * , segn ensayo de cola izquierda, cola derecha o dos colas. 4: Aplicar la regla de decisin: comparando * con , se decide rechazar o no H0 con significacin . 5: Construir la conclusin: conectando la decisin con las hiptesis, se da respuesta a la cuestin planteada.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

91

Vicerrectora Acadmica Cuaderno de Apuntes 2010

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Crisis econmica Se realiza un estudio con una muestra aleatoria de 657 familias del Gran Santiago, de las cuales 278 han debido pedir prstamos para enfrentar las dificultades originadas por la crisis econmica. 1.1. Es suficiente esta informacin para asegurar con un 10% de significacin que en la poblacin del Gran Santiago, ms de un 40% de las familias ha debido recurrir a prstamos para enfrentar la crisis? 1.2. En el contexto del caso, en qu consiste cometer error de tipo II en el contraste anterior? Solucin: 1.1. Contraste 1: Planteamiento de las hiptesis: La hiptesis nula es: H0: p = 0,40 Hiptesis alternativa: H1: p > 0,40; ensayo de cola derecha.

Ntese que las hiptesis planteadas con consistentes con el enunciado del problema.
2: Clculos: La proporcin muestral es igual a:
P= 278 = 0,423 657

Si H0 es verdadera, entonces el error muestral es igual a:


p = 0,40 0,60 = 0,0191 657

Importante: Ntese que se usa p = 0,40, tal como lo expresa la hiptesis nula y no la P muestral 0,423. Esto es porque el mtodo asume que la hiptesis nula es verdadera hasta que los datos prueben lo contrario.

El estadstico de prueba es igual a: 0,423 0,40 z= = 1,20 0,0191


3: Clculo del valor-p: En este caso, el valor-p es la probabilidad de que Z sea mayor a 1,21. Se toma el lado mayor que porque el ensayo es de cola derecha.

Valor p:

* = P(z > 1,20) = 0,1151 (segn tabla)


Fig 11.4:

* = 0,115
Z 0

1,20

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

92

Vicerrectora Acadmica Cuaderno de Apuntes 2010

4: Decisin:

Para decidir se compara el valor-p ( * ) con el nivel de significacin ( ) Como * > 0,10; NO se rechaza la hiptesis nula, al 10%.
5: Conclusin: De acuerdo a los datos, es posible afirmar que el % de familias del Gran Santiago que han debido recurrir a prstamos para enfrentar la crisis no supera el 40% (p = 0,1151). 1.2. Error El error de tipo II es aceptar la hiptesis nula sendo que es falsa. En este caso es aceptar que en la poblacin del Gran Santiago el 40% de las familias ha debido recurrir a prstamos para enfrentar la crisis, siendo que es falso.

2. Estrs laboral Se encontr, en una muestra de 136 trabajadores del nivel ejecutivo de una empresa de venta de intangibles, un total de 25 que presentan sntomas emocionales, con ansiedad y nimo depresivo, expresados como desnimo y hasto por el trabajo. Los directivos de la empresa declararon, que si bien estos corresponden a sntomas de estrs laboral, el fenmeno no alcanza a afectar al 20% de sus ejecutivos, proporcin considerada como normal para el tipo de trabajo que desarrollan. Con una significacin del 1%, es posible con estos resultados refutar la declaracin de los directivos de la empresa? Solucin: Se trata de un contraste de proporciones, en donde los directivos desean probar que el fenmeno descrito afecta a menos del 20% de sus ejecutivos. Como la proporcin muestral es 18,4% resulta atractivo realizar dicho contraste. 1: Hiptesis
H0 : H1 :

p = 0,20 p < 0,20 (ensayo de cola izquierda).

2: Datos y clculos: Nivel de significacin: Proporcin muestral:

0,01 (est dado) P = 25/136 = 0,1838


p = Z= 0,20 0,80 = 0,0343 136

Error muestral: Estadstico de prueba: Clculo del valor-p:


3: Decisin:

0,1838 0,20 = -0,47 0,0343

* = P(Z < -0,47) = 0,3192 (segn tabla)

Como * > , ya que 0,3192 > 0,01; entonces, no se puede rechazar H0, al 1%.
4: Conclusin: La proporcin de afectados por los sntomas del estrs laboral no es menor al 20% (p = 0,3192). Por lo tanto, con los datos con que se cuenta, es posible refutar la declaracin de los directivos.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

93

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Comentario: (1) El hecho de que el % muestral (18,4%) sea menor que el planteado en la hiptesis nula (20%), no lleva necesariamente a inferir que en la poblacin ocurre lo mismo. Como sabemos, la proporcin muestral tiene cierta variabilidad (error muestral) y, por lo tanto, el 18,4% perfectamente cae dentro de los valores posibles del 20% poblacional. (2) El mtodo de contraste de hiptesis protege a la hiptesis nula. Es ms, la considera verdadera hasta que los datos empricos demuestren que la diferencia es significativa, tal que no hay ms remedio que rechazarla. Esta situacin se ve reforzada por el hecho de que la probabilidad de rechazar la hiptesis nula es de solo un 1%, correspondiente al nivel de significacin empleado en la prueba.

3. Televisores en el hogar Cierta publicacin afirma que el 60% de los hogares chilenos tiene ms de un televisor en casa. Para verificar esta afirmacin se hace un muestreo en 340 hogares, resultando 184 que, efectivamente, tienen ms de un televisor. 3.1. Es suficiente este dato numrico para apoyar la afirmacin de la publicacin? Use un 5% de significacin. 3.2. En qu consiste el error de tipo I en la dcima anterior? Solucin: Se trata de una prueba de hiptesis de proporciones en diseo de dos colas. 1: Hiptesis
H0 : H1 :

p = 0,60 p 0,60(ensayo de dos colas).

2: Datos y clculos: Nivel de significacin: Proporcin muestral:

0,10 (est dado al principio) P = 184/340 = 0,541


p = Z= 0,60 0,40 = 0,0266 340

Error muestral: Estadstico de prueba:

0,541 0,60 = -2,22 0,0266

3: Valor-p:

Clculo del valor-p:

* = 2 P(Z < -2,21) = 2 0,0132 = 0,0264

Ntese que el valor-p de una cola se multiplica por dos, porque el ensayo es bilateral (de dos colas).
4: Decisin:

Como * < 0,05; entonces, se rechaza H0 con un 5% de significacin.


5: Conclusin: Al 5%, la proporcin de hogares con ms de un televisor NO es el 60% (p = 0,0264) La informacin presentada no resulta suficiente para apoyar la afirmacin publicada. 3.2. El error de tipo I es rechazar una hiptesis (nula) siendo que es verdadera. En este caso consiste en rechazar que el 60% de los hogares chilenos tiene ms de un televisor en casa, siendo que es verdadero.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

94

Vicerrectora Acadmica Cuaderno de Apuntes 2010

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Usuarios de Internet Una investigacin sobre los usuarios de Internet consider dentro del estudio, la determinacin de la proporcin de hombres y de mujeres usuarios habituales de Internet, en cualquiera de sus servicios. (H = hombres; M = mujeres) El estudio lleg a las siguientes conclusiones: C1: La proporcin de hombres usuarios habituales de los servicios de Internet supera el 30% (p = 0,0345). C2: El 25% de las mujeres son usuarias habituales de los servicios de Internet (p = 0,0745). 1.1. Para la conclusin C1, la hiptesis nula fue:

A) p H = 0,30

B) p H > 0,30

C) p H < 0,30

D) p H 0,30

E) p H > p M

1.2. Para la conclusin C1, de las siguientes afirmaciones:

I: Se rechaz H 0 al 1% II: Se rechaz H 0 al 5% II: No se comete error de tipo I Es (son) correcta(s): A) Solo I B) Solo II C) Solo I o II D) Solo II o III E)

1.3. Para la conclusin C1, de los niveles de significacin siguientes: I: 1% II: 5% III: 10%

Cul(es) permite(n) llegar a la conclusin? A) Solo I B) Solo II C) Solo I y II


1.4. De las siguientes hiptesis para la conclusin C2: I: p M > 0,25

D) Solo II y III

E) Cualquiera de los tres

II: p M < 0,25

III: p M 0,25

Corresponde(n) a posible(s) hiptesis alternativa(s) para la conclusin C2: A) Solo II B) Solo I y II C) Solo I y III D) Solo II y III
1.5. Para la conclusin C2, se afirma que:

E) I, II y III

I: La hiptesis nula fue p M = 0,25 II: La hiptesis nula fue rechazada III: Es posible rechazar la hiptesis nula al 10% Es (son) correcta(s): A) Solo I B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

95

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Estudio de mercado Un estudio de mercado testea un nuevo producto lcteo, con una muestra aleatoria de 420 nios de ambos sexos, encontrando que a 95 de ellos no les gust el envase del producto. 2.1. Un intervalo de confianza del 90% de la proporcin poblacional de nios que no les gusta el envase es: A) Entre 22,6 y 26,0% B) Entre 19,2 y 26,0% C) Entre 18,3 y 25,1% D) Entre 17,5 y 25,5% E) Entre 17,0 y 25,0% 2.2. Si la empresa decide que hara modificaciones al envase si el % de rechazo de los nios(as) es mayor al 20%, cul es la hiptesis nula en la correspondiente dcima de hiptesis? A) p = 0,20 B) p > 0,20 C) p < 0,20 D) p 0,20 E) p = 0,226 2.3. Si la empresa decide que hara modificaciones al envase si el % de rechazo de los nios(as) es mayor al 20%, cul es el valor-p de la prueba en la correspondiente dcima de hiptesis? A) 0,1408 B) 0,8907 C) 0,050 D) 0,0214 E) 0,1020 2.4. Si la empresa afirma que hara modificaciones al envase si el % de rechazo de los nios(as) es mayor al 20%, cul o cules de las siguientes conclusiones son correctas al 5% de significacin?

I: El rechazo del envase por parte de los nios(as) de la poblacin es mayor al 20%. II: No tienen que cambiar el envase, ya que no hay pruebas para afirmar que el rechazo es mayor al 20%. III: Al 5% de significacin, el rechazo del envase por parte de los nios(as) no es mayor al 20% A) Solo I B) Solo I y II C) Solo I y III D) Solo II y III E) I, II y III

3. Consumo de tranquilizantes Ciertos estudios hacen pensar que ms de un quinto de los trabajadores del sector transporte pblico consumen tranquilizantes en alguna de sus formas. Con datos empricos se contrasta la hiptesis correspondiente, al 5%, llegando a un valor-p = 0,00276. Entonces, con un 5% de significacin se puede concluir que:

A) El 20% de los trabajadores del sector transporte pblico consume tranquilizantes B) Menos de un quinto de los trabajadores del sector transporte pblico consume tranquilizantes C) Ms de un quinto de los trabajadores del sector transporte pblico consume tranquilizantes D) El 5% de los trabajadores del sector transporte pblico consume tranquilizantes E) Cuando ms, el 20% de los trabajadores consume tranquilizantes

Solucin a problemas propuestos:


1.1. A 2.1. B 3. C 1.2. B 2.2. A 1.3. D 2.3. E 1.4. E 2.4. D 1.5. C

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

96

Vicerrectora Acadmica Cuaderno de Apuntes 2010

V.

RECURSOS COMPLEMENTARIOS

1. Texto: captulo 9 Mendenhall Beaver Beaver. Introduccin a la probabilidad y estadstica. Thomson Learning, 2008. ISBN-13: 978-970-686794-0. Ver ejercicios en captulo 9 2. Test de hiptesis: conceptos generales. http://www.bioestadistica.freeservers.com/temas.html Sitio muy completo, que presenta desde los mtodos estadsticos bsicos hasta los mtodos de inferencia ms complejos. Tambin incluye una gran variedad de Tablas estadsticas usuales. Tema 12. Teora de la decisin estadstica: Hiptesis estadsticas. Validaciones estadsticas: uso del test de hiptesis. Modelo de Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones de medias y proporciones. Intervalos de confianza versus tests de hiptesis. Ejemplos. 3. Contraste de hiptesis de proporciones http://ftp.medprev.uma.es/libro/html.htm 9.6 Contrastes de una proporcin 9.6.0.1 Contraste bilateral 9.6.0.2 Contrastes unilaterales

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

97

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3 UNIDAD: DCIMAS DE HIPTESIS CLASE 12

Contraste de la diferencia de proporciones


El sol cada da es nuevo. Herclito.

APRENDIZAJES ESPERADOS
-Realizan pruebas de hiptesis para la diferencia de proporciones. -Analizan e interpretan los resultados de la dcimas de hiptesis de diferencia de proporciones en el contexto de casos dados.

CONTENIDOS
-Pruebas de hiptesis para la diferencia de proporciones.

II.

DESARROLLO

1. La situacin En ocasiones, una investigacin requiere establecer comparaciones entre las proporciones de dos segmentos. En estos casos, se debe realizar un contraste de diferencia de proporciones.

Ejemplos: El % de hombres que fuman es igual al % de mujeres que fuman. El % de matrimonios que se divorcian es mayor en zonas urbanas que en zonas rurales.

La situacin se ilustra en el siguiente esquema.

Poblacin A
pA

Poblacin B
pB

PA

PB

p A pB = ?
Fig 12.1: Esquema del contraste de la diferencia de proporciones

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

98

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. El contraste de la diferencia de proporciones

Se tienen dos muestras de tamaos n A y n B , provenientes poblaciones binomiales A y B, con proporciones p A y p B , respectivamente. Se desea saber si las diferencias entre PA y PB son significativas o simplemente es producto de la aleatoriedad (error) propia de los fenmenos estadsticos. Se tiene, para cada muestra: Muestra de A: Muestra de B:
nA ; nB ; x A ; x B ;

PA PB

3. Hiptesis Para realizar el contraste de hiptesis se plantean las siguientes hiptesis: 3.1. Hiptesis nula:
H0 : pA pB = 0

La hiptesis nula postula que las proporciones son iguales en la poblacin A y en la B, de modo que no hay diferencia entre ellas. Esto significara que ambas muestras provienen de una misma poblacin.
3.2. Hiptesis alternativas:
H1 : pA pB > 0

Esta hiptesis alternativa indica que la proporcin es mayor en la poblacin A que en la B, de modo que la diferencia pA pB entre ellas es mayor que cero.
H1 : pA pB < 0

Esta hiptesis alternativa indica que la proporcin es mayor en la poblacin B que en la A, de modo que la diferencia pA pB es menor que cero.
H1 : pA pB 0

Esta hiptesis alternativa indica que la proporcin es distinta en la poblacin B que en la A, de modo que la diferencia pA pB es distinta de cero. No especifica cul proporcin es mayor.

4. Error muestral de la diferencia de proporciones En cada muestra se tiene lo siguiente: nA ; x A ; pA


nB ; x B ; pB

Asumiendo que la H0 es verdadera, el mejor estimador de la proporcin poblacional es p :

p=

x A + x B ; n A + nB

O bien:

p=

n A p A + nB p B n A + nB

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

99

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Es importante aclarar que, asumiendo verdadera la hiptesis nula de que no hay diferencia entre las proporciones poblacionales, ambas muestras, A y B, pertenecen a una misma poblacin, con una misma proporcin poblacional. De este modo, sumando los datos muestrales de ambos segmentos, se tiene una muestra de mayor tamao, lo que ayuda a minimizar el error. El error estndar para la diferencia de proporciones muestrales es igual a:
1 1 p A pB = p q n + n B A

5. Estadstico de prueba Se usa el estadstico siguiente:


Z= PA PB p A pB

Cuando H0 es cierta, este estadstico se comporta como una distribucin Z (normal estndar).

6. Valor p de la prueba

Ensayo de cola derecha: Ensayo de cola izquierda: Ensayo de 2 colas:


7. Criterio de decisin A un nivel de significacin :

* = P( z > z prueba ) * = P( z < z prueba ) * = 2 P( z > z prueba )

Rechazar H0 si * < No rechazar en caso contrario

Nota: toda decisin se refiriere exclusivamente a la hiptesis nula.


8. Condiciones y restricciones de la prueba -Poblacin: la poblacin en estudio debe ser planteada como binomial para ambas muestras. -Tamao de la muestra: el modelo funciona muy bien cuando ambas muestras son mayores que 50. -Para muestras chicas (n < 30) esta prueba no es aplicable. -Las muestras deben ser independientes entre s. 9. Resumen Para contrastar una hiptesis de diferencia de proporciones se siguen los siguientes pasos: 1: Plantear las hiptesis: esto es, traducir las hiptesis al lenguaje algebraico, planteando H0 y H1. 2: Calcular el estadstico de prueba: esto es, calcular los P muestrales, el error muestral p A pB y Z de prueba. 3: Calcular el valor p: Con Z de prueba, se calcula * , segn ensayo de cola izquierda, cola derecha o dos colas. 4: Aplicar la regla de decisin: comparando * con , se decide rechazar o no H0 con significacin . 5: Construir la conclusin: conectando la decisin con las hiptesis, se da respuesta a la cuestin planteada.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

100

Vicerrectora Acadmica Cuaderno de Apuntes 2010

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Consumo cultural En el marco de un estudio sobre hbitos de consumo cultural, se consult a los encuestados si escuchaban msica a diario. De un total de 425 mujeres y 560 hombres encuestados, 148 mujeres y 160 hombres declararon que s escuchaban msica diariamente. La proporcin de personas que escuchan msica a diario, es mayor en las mujeres que en los hombres? Use un 5% de significacin. Solucin: 1: Planteamiento de hiptesis:

H0: p M p H = 0 H1: p M p H > 0


2: Datos muestrales:

Mujeres (M) Muestra Casos favorables P muestral Error muestral de la diferencia de proporciones:
1 1 pM pH = 0,313 0,687 + = 0,0298 425 560

Hombres (H) 560 160 160/560=0,286

TOTAL 985 308 308/985=0,313

425 148 148/425=0,348

Clculo del estadstico de prueba:


z obs = 0,348 0,286 = 2,08 0,0298

Ntese que en el numerado se ordenaron las proporciones muestrales tal cual lo expresa la hiptesis nula p M p H .
3: Valor p de la prueba: * = P(z > 2,08) = 0,0188 (segn tabla) 4: Decisin: Como * < 0,05, se rechaza H0, al 5%. 5: Conclusin: la proporcin de mujeres que diariamente escuchan msica es mayor que la proporcin de hombres que lo hacen (p=0,0188).

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

101

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Nutricin y tabaquismo en la tercera edad En el marco de una investigacin de salud y nutricin en la tercera edad, se investiga el hbito de fumar y el estado nutricional en una muestra de 125 personas que presentan desnutricin y 250 que presentan un estado de nutricin normal. Los datos generados permitieron construir la tabla siguiente:

Estado nutricional Normal Desnutricin Total

Fuma S 55 40 95 No 195 85 280

Total 250 125 375

2.1. Calcular un intervalo de confianza del 95% para la proporcin de la tercera edad en estado normal de nutricin que fuma. 2.2. Contraste al 5% la hiptesis relacionada con la afirmacin: Menos del 30% de las personas de la tercera edad en estado de desnutricin, fuman. 2.3. Realice, al 5%, el test correspondiente para contestar la pregunta de investigacin: Las personas de la tercera edad en estado de desnutricin fuman en mayor proporcin que los de estado normal de nutricin?. 2.4. Cuntas personas ms de la poblacin de personas con desnutricin se requieren encuestar para trabajar con un 95% de confianza y un error de no ms del 5%?

Solucin: 2.1. Con los datos de la fila normal de la tabla se obtiene:


n = 250;

x = 55 fuman;

p=

55 = 0,22 250

Entonces, el error muestral de la proporcin es:


p =

0,22 0,78 = 0,0262 250

Luego, el intervalo del 95% confianza para la proporcin poblacional es igual a: P = 0,22 1,96 0,0262 P = 0,22 0,051 ; con un 95% de confianza. R: La proporcin poblacional de personas de la tercera edad en estado normal de nutricin que fuma flucta entre el 19,9% y el 27,1%, con un 95% de confianza.
2.2. Contraste: se trata de una dcima de la proporcin, de cola izquierda. Planteando las hiptesis: H0: p = 0,30 H1: p < 0,3 (ensayo de cola izquierda)
n = 125; x = 40 fuman;

p=

40 = 0,32 125

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

102

Vicerrectora Acadmica Cuaderno de Apuntes 2010

p =

0,3 0,7 = 0,0410 125

Estadstico de prueba: 0,32 0,3 = 0,49 z= 0,0410 Valor p: * = P(z < 0,49) = 0,6879 No se rechaza la hiptesis nula, al 5%. Conclusin: El % de personas de la tercera edad en estado de desnutricin que fuman no es menor al 30% (p = 0,6879)

2.3. Contraste: se trata de un test de diferencia de proporciones. El tipo de ensayo cola derecha o cola izquierda depender de cmo se plantee la hiptesis nula. Hiptesis: Haciendo: D = Desnutricin; N = Normal

H0: p D p N = 0 H0: p D p N > 0; (conduce a un ensayo de cola derecha) Datos muestrales: Normal (N): Desnutricin (D): Total (T):
n = 250; n = 125; n = 375;

x = 55 fuman;
x = 40 fuman; x = 95 fuman;

PN =

55 = 0,22 250 40 = 0,32 PD = 125 95 = 0,253 p= 375

Error muestral de la diferencia de proporciones:


1 1 pD pN = 0,253 0,747 + = 0,0476 250 125

Clculo del estadstico de prueba:


zobs =

0,32 0,22 = 2,10 0,0476

Valor p de la prueba: * = P(z > 2,08) = 0,0188 (segn tabla). Como el valor p es menor a la significacin, se rechaza H0 al 5%. Conclusin: Las personas de la tercera edad en estado de desnutricin, fuman en mayor proporcin que los de estado normal de nutricin (p = 0,0188). 103
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.4. Tamao de la muestra

Para el segmento con desnutricin se tiene: Para el 5% de confianza, el valor de Z: El error del 5% es: Entonces:
n= 0,052

p=

40 = 0,32 125

Z 0,975 = 1,96

e= 0,05
1,962 0,32 0,68

= 335 personas

Por lo tanto, se necesitan 335 125 = 207 persona ms con desnutricin.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Participacin econmica Se estudia, con un 5% de significacin, la tasa de participacin econmica en determinada regin de Chile de la poblacin de 60 aos y ms, por sexo, teniendo como orientacin inicial las siguientes preguntas de investigacin:

P1: La tasa de participacin econmica de los hombres en este grupo etario y regin, es mayor al 28%? P2: En este grupo etario y regin, la tasa de participacin econmica de las mujeres es del 40%? P3: Los datos empricos, permiten afirmar que en esta regin y segmento etario la tasa de participacin econmica es mayor en los hombres que en las mujeres? Los datos empricos generados por la investigacin son los siguientes: Mayores de 60 aos, por participacin econmica y sexo. Mujer (M) Sexo Hombre (H) Participacin S 86 137 No 178 189

1.1. Cul de las siguientes corresponde a la hiptesis nula en el contraste de la pregunta P1?

A) p H = 0,28

B) p H > 0,28

C) p H < 0,28

D) p H 0,28

E) p H = p M

1.2. Respecto de la conjetura P2, se afirma lo siguiente: I: La probabilidad de error de tipo I en la dcima es igual al 5% II: Conduce a un contraste de dos colas

III: La hiptesis alternativa es p M 0,40 Es (son) correcta(s): A) Solo II B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

104

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.3. Respecto de la conjetura P3, se afirma que: I: Conduce a un contraste de diferencia de proporciones II: Se puede contrastar con un ensayo de cola izquierda o de cola derecha III: El riesgo de error tipo II es del 5%

Es (son) correcta(s): A) Solo II B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III

1.4. En el contraste para responder la pregunta P3, el error estndar es igual a: A) 0,0235 B) 0,0354 C) 0,0401 D) 0,0488 E) 0,0506 1.5. En el contraste para responder la pregunta P3, el p-value es aproximadamente: A) 0,0096 B) 0,0126 C) 0,0192 D) 0,05 E) 0,99 1.6. Una vez realizado el contraste para la pregunta P3, la conclusin, respecto de la participacin econmica en esta regin y segmento etario, es: A) Hombres y mujeres trabajan por igual B) Los hombres trabajan hasta una mayor edad que las mujeres C) Se da en mayor proporcin en las mujeres que en los hombres D) Las mujeres participan en menor proporcin que los hombres E) Hombres y mujeres participan en igual proporcin

2. Fenmeno burnout Cierta empresa multinacional, que da empleo en Chile a ms de 1.400 personas de ambos sexos, est preocupada por un supuesto crecimiento del estrs laboral en su personal. Para evaluar la situacin, la empresa encarga a un equipo de profesionales de la prevencin de riesgos, administradores y psiclogos laborales, la realizacin de una investigacin bajo el enfoque del llamado fenmeno Burnout. Para los efectos, se le aplica a una muestra de trabajadores, mujeres y hombres, un cuestionario que permite evaluar a cada trabajador y clasificarlo en una de tres categoras: Sano, fronterizo y burnout, siendo el segmento fronterizo, de riesgo, mientras que los burnout se les considera realmente enfermos de cierta gravedad.

Los trabajadores encuestados son segmentados de la siguiente manera: Por sexo: H = hombre, M = mujer Por segmento etario: J = joven y adulto joven; A = adulto y adulto mayor A continuacin se mencionan dos conclusiones a las que lleg el estudio: C1: Las mujeres se ven afectadas por el burnout en igual proporcin que los hombres (p = 0,2256). C2: En el segmento joven y adulto joven, se da una mayor proporcin de burnout que en el segmento adulto y adulto mayor (p = 0,0133).
2.1. En la conclusin C1, se plantea como hiptesis nula:

A) p H p M > 0

B) p H p M < 0

C) p H p M 0 D) p H p M = 0

E) p H p M = 0,05

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

105

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2.2. En el contraste de la conclusin C1, el error de tipo I consiste en: A) Rechazar que las mujeres se ven afectadas en igual % que los hombres, siendo que es falso B) Rechazar que las mujeres se ven afectadas en igual % que los hombres, siendo que es verdadero C) Rechazar que las mujeres se ven afectadas en menor % que los hombres, siendo que es verdadero D) Aceptar que las mujeres se ven afectadas en igual % que los hombres, siendo que es falso E) Aceptar que las mujeres se ven afectadas en menor % que los hombres, siendo que es falso 2.3. En el contraste de la conclusin C2, de las afirmaciones siguientes: I: Se rechaz la hiptesis nula II: El error de tipo II alcanza a 0,0133

III: la hiptesis alternativa es p J > p A Es (son) correcta(s): A) Solo I B) Solo II

C) Solo III

D) Solo I y II

E) Solo I y III

2.4. En el contraste de la conclusin C2, la hiptesis nula se expresa como: A) En el segmento joven y adulto joven, se da un mayor % de burnout que en el segmento adulto y adulto mayor B) En el segmento joven y adulto joven, se da un menor % de burnout que en el segmento adulto y adulto mayor C) En el segmento joven y adulto joven, se da un % igual de burnout que en el segmento adulto y adulto mayor D) En el segmento joven y adulto joven, se da un % distinto de burnout que en el segmento adulto y adulto mayor E) Hay diferencias en el % de burnout entre el joven y adulto joven y el adulto y adulto mayor

Solucin a problemas propuestos:


1.1. A 2.1. D 1.2. E 2.2. B 1.3. B 2.3. E 1.4. C 2.4. C 1.5. A 1.6. D

V.

RECURSOS COMPLEMENTARIOS

1. Test de hiptesis http://www.bioestadistica.freeservers.com/temas.html Sitio muy completo, que presenta desde los mtodos estadsticos bsicos hasta los mtodos de inferencia ms complejos. Tambin incluye una gran variedad de Tablas estadsticas usuales. Tema 12. Teora de la decisin estadstica: Hiptesis estadsticas. Validaciones estadsticas: uso del test de hiptesis. Modelo de Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones de medias y proporciones. Intervalos de confianza versus tests de hiptesis. Ejemplos. 2. Contraste de diferencia de proporciones http://ftp.medprev.uma.es/libro/html.htm 9.12 Contrastes sobre la diferencia de proporciones 9.12.0.1 Contraste bilateral 9.12.0.2 Contrastes unilaterales 9.14 Problemas 3. Texto: Mendenhall Beaver Beaver. Introduccin a la probabilidad y estadstica. Thomson Learning, 2008. ISBN-13: 978970-686-794-0. Complementar conceptos y ver ejercicios en captulo 9.5 y 9.6. Prueba de hiptesis con muestra grande para una poblacin binomial y para diferencia de proporciones.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

106

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3 UNIDAD: DCIMAS DE HIPTESIS CLASE 13

Contraste de hiptesis de la media


No ha de maravillarnos que el azar pueda tanto sobre nosotros, partiendo de que vivimos por azar. Novalis.

APRENDIZAJES ESPERADOS
-Realizan pruebas de hiptesis para la media con varianza conocida. -Realizan pruebas de hiptesis para la media con varianza desconocida. -Analizan e interpretan los resultados de la dcimas de hiptesis de medias en el contexto de casos dados.

CONTENIDOS
-Prueba de hiptesis para la media con varianza desconocida.

II.

DESARROLLO

1. La situacin Cuando se afirma o conjetura que en la poblacin hay una variable numrica que presenta un cierto promedio (media aritmtica), se est haciendo una afirmacin de un valor de una media poblacional. Por ejemplo:

Los hogares chilenos consumen mensualmente un promedio de $95.000 en mercaderas.

Las carreras universitarias chilenas duran, en promedio, 13,5 semestres. Como toda hiptesis estadstica, estas deben contar con un referente emprico y contrastarse o ponerse a prueba a travs de un procedimiento vlido en el mundo de las ciencias. Para este caso hablamos de contraste de la media. La situacin es: se tiene una muestra de tamao n, con una media x y una varianza S 2 , proveniente de una poblacin normal o aproximadamente normal, con media y varianza 2 desconocida.
2. Hiptesis 2.1. Hiptesis nula:
H0 : = 0

Esta hiptesis indica que la media poblacional es una cantidad 0 , siendo 0 un nmero real.
2.2. Hiptesis alternativas: Dependiendo de la situacin, se pueden plantear tres tipos de hiptesis alternativas:
H1 : > 0 . Conduce a un ensayo de cola derecha.

Esta hiptesis expresa que la media poblacional es mayor que el valor que postula la hiptesis nula.
H1 : < 0 . Conduce a un ensayo de cola izquierda.

Esta hiptesis expresa que la media poblacional es menor que el valor postulado por la hiptesis nula.
H1 : 0 . Conduce a un ensayo de 2 colas.

Esta hiptesis expresa que la media poblacional es distinta que el valor postulado por la hiptesis nula.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

107

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. Error muestral de la media Ya se plante en clases anteriores que el error muestral de la media es igual a:
x =

En la generalidad de los casos, el valor de la desviacin estndar poblacional es desconocido y, por lo tanto debe estimarse a partir de la desviacin estndar muestral S. De este modo, el error estndar de la media es igual a:
x =

S n 1

Siendo S la desviacin estndar de la muestra de tamao n (en la calculadora: x n ). Tambin puede definirse como: S x = ; n
Siendo S la desviacin estndar insesgada (en la calculadora: x n1 ).

Cualquiera de las dos ltimas frmulas entrega el mismo resultado.


4. Estadstico de prueba Se deben separar aqu dos casos: 4.1. Para muestra grande (n 30) El estadstico de prueba es:
Z= x 0 ; x

Siendo x la media muestral, 0 es valor de la media que seala la hiptesis nula y x el error muestral de la media. El estadstico Z, cuando la hiptesis nula es verdadera, se distribuye como una Z normal estndar.
4.2. Para muestra chica (n < 30) El estadstico de prueba es:
t= x 0 ; x

Siendo x la media muestral, 0 es valor de la media que seala la hiptesis nula y x el error muestral de la media. Cuando la hiptesis nula es verdadera, este estadstico t se distribuye como una t con (n 1) grados de libertad. 11
5. Valor p de la prueba ( * )

Como el criterio del valor p es el mtodo ms utilizado en la actualidad para el contraste de todo tipo de hiptesis, se aplicar para esta dcima. El valor p, llamado tambin p-value o * , es la probabilidad que queda sobre el Z o t de prueba o bajo este, segn el tipo de ensayo (cola derecha, cola izquierda o dos colas). Se determina con la tabla Z o t, segn corresponda.

11

Ver 11: La distribucin de probabilidad t de Student

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

108

Vicerrectora Acadmica Cuaderno de Apuntes 2010

6. Clculo del valor p de la prueba

Para ensayo de cola derecha: Para ensayo de cola izquierda: Para ensayo de dos colas:

* = P( z > z prueba ). * = P( z < z prueba ). * = 2 P( z > z prueba ).

Para el caso de usar t, se reemplaza z prueba por el t prueba , con (n 1) grados de libertad.
7. Criterio de decisin Con un nivel de significacin :

Se rechaza H0 si * < No se rechaza H0 en caso contrario Nota: toda decisin se refiriere exclusivamente a la hiptesis nula.
8. Conclusin Tomando como base la decisin de rechazar o no la hiptesis nula, se construye una conclusin que debe apuntar directamente a la pregunta o conjetura planteada. La conclusin es una afirmacin que suele ir acompaada por el valor p de la prueba entre parntesis, como modo de sustentar dicha afirmacin.

Ejemplo: El promedio de aos de estudio de la poblacin es menor a 5 aos (p = 0,0344) En este ejemplo, el valor p entre parntesis indica que la prueba de hiptesis dio un valor p = 0,0344. El texto de la conclusin hace ver que la hiptesis nula fue rechazada a favor de la hiptesis alternativa de cola izquierda. En este caso el nivel de significacin, que si bien no se expresa, puede ser 5% o 10%, ya que en ambos casos la H0 se rechaza, no as si fuera 1%.
9. Supuestos, condiciones y restricciones de la prueba

Poblacin: la poblacin en estudio debe ser una variable numrica normal o aproximadamente normal. Tamao de la muestra: el modelo Z funciona muy bien para muestras mayores que 30. Para muestras menores a 30, usar el modelo de la t de Student. La varianza poblacional es desconocida. La muestra es aleatoria e independiente.

10. Resumen En resumen, para contrastar una hiptesis de la media se siguen los siguientes pasos: 1: Plantear las hiptesis: esto es, traducir las hiptesis al lenguaje algebraico, planteando H0 y H1. 2: Calcular el estadstico de prueba: calcular Z o t de prueba. 3: Calcular el valor p: Con Z o t de prueba se calcula * , segn ensayo de cola izquierda, cola derecha o dos colas. 4: Aplicar la regla de decisin: comparando * con , se decide rechazar o no H0 con significacin . 5: Construir la conclusin: conectando la decisin con las hiptesis, se da respuesta a la cuestin planteada.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

109

Vicerrectora Acadmica Cuaderno de Apuntes 2010

11. La distribucin de probabilidad t de Student 11.1. La distribucin t: La distribucin t es una curva de probabilidad continua muy similar a la curva normal, pero ms aplastada y un poco ms abierta. Tiene propiedades semejantes a la normal en cuanto eje simetra en t = 0, con valores negativos y positivos, siendo el rea total bajo la curva igual a 1. Sus percentiles dependen de un parmetro llamado grados de libertad (gl), que es una funcin de la cantidad de datos con se cuenta. Los grados de libertad, que se simbolizan con la letra griega , son nmeros enteros que van desde 1, 2, 3, etc.

La distribucin t se caracteriza por: Media aritmtica: Varianza: Desviacin Estndar:


= 0 2 = = ; con > 2 2 ; con > 2 2

La curva t es, en realidad, una familia de curvas, cada una de las cuales depende de los grados de libertad. A medida que aumentan los grados de libertad, la curva t se va pareciendo ms a la normal Z, coincidiendo con esta cuando los grados de libertad son infinitos.

=2 =1

Fig 13.1: La distribucin t

11.2. Percentiles de la distribucin t:

Los percentiles de la distribucin t se escriben t p ; , en donde p indica la probabilidad que queda bajo el valor de t y son los grados de libertad, que pueden ser 1, 2, 3, etc. Por ejemplo: t 0,675 ; 8 indica el valor de t que deja bajo l el 67,5% de la distribucin y tiene 8 gl. Use la tabla de percentiles t. Figura 13.2. =8 gl
Fig 13.2:

0,675
0

0,325 t
t 0,675 ; 8

Como la tabla indica en la fila superior el valor de p a la derecha (probabilidad superior), se debe buscar la columna con en el valor 1 0,675 = 0,325 y la fila 8, que indica los grados de libertad.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

110

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Fig 13.3:

gl

Segn la tabla t ese valor es: 0,471. Entonces: t 0,675 ; 8 = 0,471


11.3. Clculo de la probabilidad en la tabla t Para este caso se debe tener el valor de t y los grados de libertad. Use la tabla t de probabilidad superior.

Por ejemplo, P( t p ; 18 0,7) = Esto es; Cul es la probabilidad superior de t = 0,7 con 18 grados de libertad? Grficamente esto es: =18 gl
Fig 13.4:

p=? t
0

0,7
gl

Fig 13.5: t

Con la tabla se determina que P( t p ; 18 0,7) = 0,246

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

111

Vicerrectora Acadmica Cuaderno de Apuntes 2010

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Uso de la tabla t 1.1. Calcular t 0,95 ; 15 = 1.2. Calcular t 0,15 ; 4 = 1.3. Calcular P( t p ; 9 1,2) 1.4. Calcular P( t p ; 25 1,5) 1.5. Calcular P( t p ; 8 -0,6) Solucin: 1.1. Es el valor de t con 15 grados libertad, que deja bajo l el 95% de la distribucin.

Segn tabla: t 0,95 ; 15 = 1,753


1.2. Es el valor de t con 4 grados libertad, que deja bajo l el 15% de la distribucin. Como es un percentil menor al 50%, significa que queda bajo el valor t = 0 y, por lo tanto, t es negativo.

De la tabla se obtiene que t 0,85 ; 4 = 1,190 Por lo tanto: t 0,15 ; 4 = 1,190


1.3. Se trata de la probabilidad superior cuando t = 1,2 con 9 gl.

Segn tabla: P( t p ; 9 1,2) = 0,130


1.4. Corresponde a la probabilidad inferior, cuando t = 1,5 con 25 gl. La tabla entrega una probabilidad superior igual a: 0,073. Por lo tanto, la probabilidad inferior es 1 0,073 = 0,927.

Luego: P( t p ; 25 1,5) = 0,927.


1.5. Corresponde a la probabilidad inferior, cuando t = -0,6 con 8 gl.

Es equivalente calcular P( t p ; 8 0,6). La tabla entrega una probabilidad superior igual a:. Por lo tanto, P( t p ; 8 -0,6)= 0,283
2. Clculo del valor p Se han realizado una serie de pruebas de hiptesis de la media, encontrando los siguientes valores del estadstico de prueba. Complete el cuadro con e valor p de la prueba. N Tipo de ensayo 2.1. 2.2. 2.3. 2.4. 2.5. Valor del estadstico de prueba n Valor p

Cola izquierda Dos colas Cola izquierda Cola derecha Dos colas

Z = -2,32 Z = 1,24 Z = 0,78 t = 1,2 t = 2,1

80 40 125 7 9 112

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin: 2.1. El valor p para ensayo de cola izquierda es la probabilidad a la izquierda del Z de prueba. Ver Fig 13.6.
Fig. 13.6: 0,0102
Z

Luego, valor p = 0,0102 En la distribucin Z no interviene el tamao de la muestra.

-2,32

2.2. El valor p para ensayo de dos colas es igual a 2 veces la probabilidad sobre el valor del estadstico de prueba. Ver Fig 13.7.
Fig 13.7: 0,1075

Luego, valor p = 2 x 0,1075 = 0,215

1,24

2.3. El valor p para ensayo de cola izquierda es la probabilidad a la izquierda del Z de prueba. Ver Fig 13.8.
0,7823 Fig 13.8:

0,78

Luego, valor p = 0,7823


2.4. El valor p para ensayo de cola derecha es la probabilidad a la derecha del t de prueba, con 7 1 = 6 grados de libertad. Ver Fig 13.9.
Fig 13.9: 6 gl 0,138

Luego, valor p = 0,138

1,2

2.5. El valor p para ensayo de dos colas es igual a 2 veces la probabilidad sobre el valor de prueba. Ver Fig 13.10.
Fig 13.10: 8 gl 0,034

Luego, valor p = 2 x 0,034 = 0,068


0

2,1

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

113

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3. Tiempo de ejecucin Se analiza el tiempo probable de ejecucin de un total de 152 actividades de la malla PERT de un proyecto, dando un tiempo medio de 72 das por actividad, con desviacin estndar 20 das. Se adopta como supuesto que los tiempos de las actividades se distribuyen en forma aproximadamente normal. Se desea probar al 1% la hiptesis de que el tiempo medio por actividad es menor a 70 das. 3.1. Identifique el tipo de contraste y de ensayo 3.2. Indique qu modelo de probabilidad utilizara para el contraste. Fundamente. 3.3. Realice la dcima correspondiente y construya la conclusin. Solucin: 3.1. Se trata de un contraste de hiptesis de la media con varianza desconocida y muestra grande, a realizar con un ensayo de cola izquierda. 3.2. Se utilizar el modelo Z, ya que, aunque se desconoce la varianza, la muestra es lo suficientemente grande como para obtener una muy buena aproximacin. 3.3. Contraste Hiptesis: H0: = 70 versus H1: < 70 (ensayo de cola izquierda)

Clculo de estadsticos: Error muestral de la media: x = Estadstico de prueba: Valor-p: Decisin: No se rechaza Ho, al 1%. Conclusin: El tiempo medio por actividad no es menor a 70 das (p = 0,8907).
Z= S n 1

20 151

= 1,628 das.

x 0 72 70 = = 1,23 1,628 x

* = P(Z < 1,23) = 0,8907 (segn tabla)

4. Lluvia cida Se ha afirmado que la acidez de la lluvia en cierta ciudad llega a un peligroso promedio de pH = 4. Para estudiar el caso con un nivel de significacin del 1%, se han obtenido muestras de lluvia de 8 partes distintas de una ciudad. Estas son llevadas al laboratorio en donde se les determin su pH, dando las siguientes medidas:

muestra pH

1 4,8

2 3,7

3 5,1

4 4,2

5 3,8

6 5,4

7 3,8

8 4,0

Solucin: 1: Hiptesis: H0: = 4

H1: 4

(ensayo de dos colas) 114

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2: Datos muestrales
x = 4,35 S = 0,6164414 0,6164414 8 1

Error muestral: x =

= 0,233

Estadstico de prueba: Se usar el estadstico t porque se trata de una muestra chica y la varianza es desconocida.
t= t= x 0 x 4,35 4 = 1,5 0,233

Este es un valor de t con 8 1 = 7 grados de libertad.


3: Valor p = 2 P( t p ; 7 > 1,5) = 2 0,089 = 0,178 4: Como * > 0,01; no se rechaza H0, al 1%. 5: Conclusin: El pH promedio de la lluvia es 4 (p = 0,178).

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Condiciones ambientales Una industria requiere para el funcionamiento de su lnea de produccin una temperatura de 22C y 40% de humedad relativa. Una medicin de la temperatura ambiental de la sala de produccin cada 2 horas dio el siguiente resultado:

Medicin Temperatura (C)

1 18

2 20

3 23

4 20

5 23

6 22

7 22

8 22

9 18

10 21

11 20

12 19

1.1. La temperatura media muestral llega a: A) 18,6C B) 20,7C C) 21,4C

D) 22,7C

E) 23,1C

1.2. El error estndar de la temperatura media es igual a: A) 0,396C B) 0,491C C) 0,513C D) 1,699C

E) 1,775

1.3. Respecto del contraste al 5% de la hiptesis de que la temperatura media es 22C, se afirma que: I: La hiptesis nula es: 22

II: Se contrasta con el modelo t III: La probabilidad de error de tipo I es 0,05 Es (son) correcta(s): A) Solo II B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III 115

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.4. Si se contrasta la hiptesis de que la temperatura media es 22C con un ensayo de dos colas, el valor p es, aproximadamente, igual a: A) 0,015 B) 0,018 C) 0,042 D) 0,055 E) 0,03 1.5. Si se contrasta la hiptesis de que la temperatura media es 22C con un ensayo de dos colas, al 5% se concluye que: A) La temperatura media no es 22C B) La temperatura media es ms de 22C C) La temperatura media es menor a 22C D) La temperatura media es de 20,7C E) La temperatura media es menor a 20,7C

2. Contraste de la media Se realiza un contraste de hiptesis de la media con ensayo de cola izquierda en una muestra de tamao 10. El estadstico de prueba dio un valor -1,9. 2.1. El valor p de la prueba es: A) 0,045 B) 0,043

C) 0,0287

D) 0,086

E) 0,090

2.2. Respecto de este test de hiptesis, de las afirmaciones siguientes: I: No se rechaza la hiptesis nula al 1% II: Se rechaza la hiptesis nula al 5% III: Se rechaza la hiptesis nula al 10%

Es (son) correcta(s): A) Solo II B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III

3. Tiempo de operacin Se toma el tiempo en que una muestra de 104 operarios del sector servicios elctricos emplea individualmente en realizar una tarea que requiere seguir un protocolo especfico. La conclusin del estudio fue que: El tiempo medio de ejecucin de la tarea es menor a 20 minutos (p = 0,0314) 3.1. La hiptesis nula en el contraste es: A) = 20 B) > 20 C) < 20 3.2. Respecto del contraste, de las afirmaciones: I: Se realiz con ensayo de cola izquierda II: Se rechaz la hiptesis nula III: Se utiliz un 1% de significacin

D) 20

E) = 23,7

Es (son) correcta(s): A) Solo II B) Solo I y II

C) Solo I y III

D) Solo II y III

E) I, II y III

3.3. En el contraste, el valor del estadstico de prueba fue: A) 1,96 B) 1,87 C) 3,1 D) -1,87

E) -1,96 116

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Solucin a problemas propuestos:


1.1. B 2.1. A 3.1. A 1.2. C 2.2. E 3.2. B 1.3. D 3.3. D 1.4. E 1.5. A

V.

RECURSOS COMPLEMENTARIOS

1. Test de hiptesis http://www.bioestadistica.freeservers.com/temas.html Tema 12. Teora de la decisin estadstica: Hiptesis estadsticas. Validaciones estadsticas: uso del test de hiptesis. Modelo de Gauss para una muestra aplicado a: medias, varianzas y proporciones. Comparaciones de dos muestras: comparaciones de medias y proporciones. Intervalos de confianza versus tests de hiptesis. Ejemplos. 2. Contraste de la media 9.4 Contrastes paramtricos en una poblacin normal 9.4.2 Contrastes para la media

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

117

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3 UNIDAD: DCIMAS DE HIPTESIS CLASE 14

Contraste de la diferencia de medias


Los descubrimientos ya logrados se deben al azar y a la experiencia vulgar ms que a la ciencia. Sir F. Bacon

APRENDIZAJES ESPERADOS
-Realizan pruebas de hiptesis para la diferencia media con varianzas iguales y desconocidas. -Analizan e interpretan los resultados de la dcimas de hiptesis para la diferencia media con varianzas iguales y desconocidas en el contexto de casos dados.

CONTENIDOS
-Prueba de hiptesis para la diferencia media con varianzas iguales y desconocidas.

II.

DESARROLLO

1. La situacin En ocasiones, una investigacin requiere establecer comparaciones entre los promedios de dos segmentos. En estos casos, se debe realizar un contraste de diferencia de medias. Ejemplos:

En promedio, los matrimonios de zonas rurales duran ms aos que los de zonas urbanas. Los hombres consumen diariamente, en promedio, ms caloras que las mujeres.

La situacin se ilustra en el siguiente esquema:

Poblacin A
A

Poblacin B
B

xA

xB

A B = ?
Fig 12.1: Esquema del contraste de la diferencia de medias.

La comparacin entre dos medias puede darse en tres situaciones distintas. Sin embargo se abordar la comparacin de dos medias con varianza desconocida y muestras chicas a travs de la prueba t, que sirve de caso general. De este caso general se pueden derivar simplificaciones cuando las muestras son mayores de 30. 118

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. El problema de la varianza desconocida Uno de los problemas ms complicado es que generalmente, por no decir siempre, se desconocen las varianzas poblacionales y deben ser estimadas a partir de las muestras. Una simplificacin conveniente de adoptar es el supuesto de que las varianzas de ambas poblaciones son iguales. Con esto se alivia el problema, pero no se soluciona. Se pueden distinguir en una variable numrica tres varianzas: Varianza Smbolo
2

Frmula
( x i )2 N ( x i x )2 n ( xi x )2 n 1

Descripcin

Poblacional Sesgada Insesgada

Es la varianza poblacional. Es un parmetro desconocido. Es la varianza muestral. Describe la variabilidad al interior de la muestra. Es una varianza muestral, con denominador n-1. Sirve como el mejor estimador de la varianza poblacional.

S2
S2

Cuando la muestra es grande (n > 30) la diferencia entre la varianza sesgada y la insesgada es irrelevante, pero cuando se trabaja con muestras chicas, la diferencia puede llegar a ser decisiva.
Desviacin estndar Smbolo Descripcin Calculadora

Poblacional Sesgada Insesgada

S
S

Es la desviacin estndar poblacional. Es un parmetro desconocido. Es la desviacin estndar sesgada. Describe la variabilidad al interior de la muestra. Es la desviacin estndar insesgada. Es el mejor estimador de la desviacin estndar poblacional.

x n xn1

3. El contraste con la prueba t

Se tienen dos muestras de tamaos n A y n B , provenientes de poblaciones normales A y B, con medias x A y x B , respectivamente. Ambas varianzas son iguales. Se desea saber si las diferencias entre x A y x B son significativas o simplemente son producto de la aleatoriedad de los fenmenos estadsticos y el error muestral.
4. Hiptesis 4.1. Hiptesis nula:

H0: A B = 0 Esta hiptesis dice que la diferencia entre la media de A y B es cero. Por lo tanto, no hay diferencia y las muestras provienen de una misma poblacin de media .
4.2. Hiptesis alternativas: Segn el caso, se pueden plantear una de las siguientes hiptesis alternativas:

H1: A B > 0 Esta hiptesis afirma que la media de la poblacin A es mayor que la de B, y, por lo tanto, la diferencia es positiva.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

119

Vicerrectora Acadmica Cuaderno de Apuntes 2010

H1: A B < 0 Esta hiptesis alternativa afirma que la media de la poblacin A es menor que la de B, y, por lo tanto, la diferencia es negativa. H1: A B 0 Esta hiptesis alternativa afirma que la media de la poblacin A es distinta que la de B.

5. Error muestral de la diferencia de medias Se tiene para cada muestra:

Muestra de A: Muestra de B:

nA ; nB ;

xA ; xB ;

S2 A
2 SB

(Varianza sesgada) (Varianza sesgada)

El error muestral de la diferencia de medias para muestra chica y varianzas desconocidas e iguales, es:
2 n A S 2 + nB S B 1 1 A ( + ) n A + nB 2 n A nB

x A xB =

6. Estadstico de prueba Se usa el estadstico siguiente:


t= x A xB x A xB

Cuando la hiptesis nula es verdadera, este estadstico tiene una distribucin t con ( n A + n B 2 ) grados de libertad.

7. Valor p de la prueba

Ensayo de cola derecha: Ensayo de cola izquierda: Ensayo de 2 colas:

* = P( t p ; > t prueba ) * = P( t p ; > t prueba ) * = 2 P( t p ; > t prueba )

Siendo = ( n A + n B 2 ) grados de libertad.

8. Criterio de decisin A un nivel de significacin :

Rechazar H0 si * < No rechazar en caso contrario

Nota: toda decisin se refiriere exclusivamente a la hiptesis nula.


Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

120

Vicerrectora Acadmica Cuaderno de Apuntes 2010

9. Condiciones, supuestos y restricciones de la prueba -Poblaciones: las poblaciones en estudio deben ser normales o aproximadamente normales. -Tamao de la muestra: el modelo funciona muy bien para cualquier tamao de muestra. -Las muestras deben ser independientes. -Las varianzas son iguales. 10. Resumen Para contrastar una hiptesis de diferencia de medias se siguen los siguientes pasos: 1: Plantear las hiptesis: esto es, traducir las hiptesis al lenguaje algebraico, planteando H0 y su H1. 2: Calcular el estadstico de prueba: esto es, calcular medias, varianzas, error muestral x A xB y t de prueba. 3: Calcular el valor p: Con t de prueba, se calcula * , segn ensayo de cola izquierda, cola derecha o dos colas. 4: Aplicar la regla de decisin: comparando * con , se decide rechazar o no H0 con una significacin . 5: Construir la conclusin: conectando la decisin con las hiptesis, se da respuesta a la cuestin planteada.

III.

EJERCICIOS, PROBLEMAS Y CASOS RESUELTOS

1. Edad del personal Se afirma que, en promedio, la empresa A contrata personal de menor edad que la empresa B. Una muestra aleatoria del ltimo personal contratado en ambas empresas dio el siguiente resultado de edades:

Empresa A: 27 36 21 30 28 41 aos. Empresa B: 38 39 25 32 27 aos. Si las edades se distribuyen en forma aproximadamente normal y las muestras son independientes: 1.1. Calcule medias y varianzas para las edades de cada empresa. 1.2. A un nivel del 5%, contraste la hiptesis de que la afirmacin carece de fundamento. 1.3. Docime, al 5%, la hiptesis de que las contrataciones de la empresa B tienen un promedio mayor a 30 aos.
Solucin: 1.1. Clculo de estadgrafos Introduciendo los datos a la calculadora, se obtiene:

Media

Desv. St. Sesgada (S)


xn

Desv. St. Insesgada ( S )


xn1

Varianza sesgada

Varianza insesgada

Empresa A Empresa B

6 5

30,5 aos 32,2 aos

6,449 aos 5,636 aos

7,064 aos 6,301 aos

41,583 31,760

49,9 39,7

1.2. Se trata de un contraste de diferencia de medias con muestras chicas y varianza desconocida: 1: Hiptesis:

H0: B A = 0 H1: B A > 0 Se plantea la hiptesis nula como B A para que quede un ensayo de cola derecha.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

121

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2: Clculo del estadstico de prueba Clculo del error estndar de la diferencia media:
6 41,583 + 5 31,76 1 1 ( + ) = 4,08 aos. 6+52 6 5

x A xB =

t=

32,2 30,5 = 0,42 4,08

Este es una t con 6 + 5 2 = 9 gl.


3: Clculo del valor-p:

P( t p ; 9 0,42) 0,349 (segn tabla t de probabilidad superior)


4: Decisin:

Como * > 0,05 no se rechaza la hiptesis nula.


5: Conclusin: Con los datos con que se cuenta, no se puede afirmar que, en promedio, la empresa A contrata personal de menor edad que la empresa B (p = 0,349). 1.3. Contraste de la media de B: Se trata de un contraste de la media, con muestra chica y varianza desconocida 1: Hiptesis

H0: B = 30 H1: B > 30


2: Clculo del estadgrafo de prueba Error estndar de la media de B:
xB =

5,636 5 1

= 2,818 aos (Equivalente es: xB =

6,301 5

Entonces:
t= 32,2 30 = 0,78 2,818

Esta es una t con 5 1 = 4 gl.


3: Clculo del valor-p:

P( t p ; 4 0,78) 0,234 (segn tabla t de probabilidad superior)


4: Decisin:

Como * > 0,05 no se rechaza la hiptesis nula.


5: Conclusin: La edad promedio de las ltimas contrataciones de la empresa B no es mayor a 30 aos (p = 0,234).
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

122

Vicerrectora Acadmica Cuaderno de Apuntes 2010

2. Sexo e ingreso mensual Se realiza un estudio de los sueldos de mujeres y hombres seleccionados al azar desde una poblacin de trabajadores dependientes de distintas empresas pero de igual sector econmico, trabajo, jerarqua, edad, ciudad y estado civil.

Las interrogantes que el estudio desea esclarecer, con un 1% de significacin, tienen que ver con las siguientes afirmaciones y conjeturas que se plantearon inicialmente: P: Las mujeres de esta poblacin ganan, en promedio, $2.100 la hora de trabajo. Q: El sueldo promedio de los hombres de esta poblacin es mayor a $450.000 al mes. R: En este sector laboral, en promedio, los hombres ganan ms que las mujeres. En los contrastes de las respectivas hiptesis, los clculos dieron los siguientes valores p:
* = 0,021; * = 0,036; * = 0,007. P Q R

2.1. Indique, en lenguaje corriente, las hiptesis nulas en cada uno de los casos. 2.2. Para la conjetura R, identifique: a) Tipo de ensayo: cola derecha, cola izquierda o de dos colas. b) Decisin correcta: c) Probabilidad de error de tipo I 2.3. En la dcima de la afirmacin Q En qu consiste cometer el error de tipo I? 2.4. En el test para validar la afirmacin R En qu consiste cometer el error de tipo II? 2.5. Construya una conclusin para cada una de las afirmaciones dadas. 2.6. En qu consiste el error de tipo I en la afirmacin R? Solucin: 2.1. Indique, en lenguaje corriente, las hiptesis nulas en cada uno de los casos. Para P. H0: Las mujeres de esta poblacin ganan, en promedio, $2.100 la hora de trabajo. Para Q: H0: El sueldo promedio de los hombres de esta poblacin es mayor a $450.000 al mes. Para R: H0: En este sector laboral, en promedio, los hombres ganan igual que las mujeres. 2.2. Para la conjetura R, identifique: a) La hiptesis se puede contrastar con un ensayo de cola derecha o de cola izquierda, dependiendo de cmo se plantea la hiptesis nula.

Si H0: H M = 0, entonces, H1 debe ser: H M > 0, lo que lleva a ensayo de cola derecha. Si H0: M H = 0, entonces, H1 debe ser: M H < 0, lo que lleva a ensayo de cola izquierda. b) En este caso: * = 0,007. Como * < 0,01, se rechaza la hiptesis nula al 1%. R c) En un test de hiptesis, el error de tipo I corresponde al nivel de significacin . Entonces, la probabilidad de error de tipo I es igual al 0,001 (1%).
2.3. En la dcima de la afirmacin Q En qu consiste cometer el error de tipo I? El error de tipo I es rechazar a hiptesis nula siendo que es verdadera. En este caso consiste en rechazar que el sueldo promedio de los hombres es de $450.000 al mes, siendo que es verdadero. 2.4. En el test para validar la afirmacin R En qu consiste cometer el error de tipo II?
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

123

Vicerrectora Acadmica Cuaderno de Apuntes 2010

El error de tipo II es aceptar la hiptesis nula cuando en realidad es falsa. En este caso significa aceptar la igualdad de sueldos cuando en realidad eso es falso.
2.5. Construya una conclusin para cada una de las afirmaciones dadas.

Para P: * = 0,021. No se rechaza la hiptesis nula, al 1%. P Conclusin: Las mujeres de esta poblacin ganan, en promedio, $2.100 la hora de trabajo. Para Q: * = 0,036. No se rechaza la hiptesis nula, al 1%. Q Conclusin: El sueldo promedio de los hombres de esta poblacin NO es mayor a $450.000 al mes. Para R: * = 0,007. Se rechaza la hiptesis nula, al 1%. R Conclusin: En este sector laboral, en promedio, los hombres ganan ms que las mujeres.
2.6. Error tipo I Rechazar que en este sector laboral, en promedio, los hombres ganan igual que las mujeres, siendo que es verdadero.

IV.

EJERCICIOS, PROBLEMAS Y CASOS PROPUESTOS

1. Ingreso mensual segn gnero Se realiza un estudio de los sueldos de 9 mujeres y 13 hombres seleccionados al azar desde una poblacin de trabajadores dependientes de distintas empresas pero de igual sector econmico, trabajo, jerarqua, edad, ciudad y estado civil. El sueldo mensual es medido en miles de pesos, en cada uno de los seleccionados, comprobado con la liquidacin de sueldo. El estudio lleg a establecer, con un 5% de significacin, las siguientes conclusiones:

P: Los hombres de esta poblacin ganan, en promedio, $1.800 la hora de trabajo (p= 0,382) Q: El sueldo promedio de las mujeres de esta poblacin es menor a $250.000 al mes (p= 0,026). R: En este sector laboral, en promedio, los hombres ganan ms que las mujeres (p= 0,004).
1.1. Respecto de las decisiones, se rechaz la hiptesis nula: A) Solo en P B) Solo en R C) Solo en Q y en R

D) Solo en P y en Q

E) Solo en Q y en R

1.2. Respecto de los tipos de ensayo, corresponde a contraste de dos colas: A) Solo en P B) Solo en R C) Solo en Q y en R D) Solo en P y en Q 1.3. Para la conclusin R, el contraste que corresponde es: A) De la diferencia de proporciones con muestra chica B) De la diferencia de medias, con varianza conocida y muestra grande C) De la diferencia de medias, con muestra chica y varianza conocida D) De la diferencia de medias, con muestra chica y varianza desconocida E) De la media, con muestra chica y varianza desconocida

E) Solo en Q y en R

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

124

Vicerrectora Acadmica Cuaderno de Apuntes 2010

1.4. El contraste de hiptesis de la conjetura R permite afirmar que en este sector laboral: A) Los hombres ganan, en promedio, menos que las mujeres B) Los hombres ganan, en promedio, ms que las mujeres C) Las mujeres ganan, en promedio, igual que los hombres D) No hay diferencias en el sueldo de hombres y mujeres E) Faltan datos para construir una conclusin al respecto 1.5. En el test de hiptesis para validar la afirmacin R En qu consiste cometer el error de tipo I? A) Aceptar que, en promedio, los hombres ganan ms que las mujeres, siendo que es falso B) Rechazar que, en promedio, los hombres ganan ms que las mujeres, siendo que es falso C) Rechazar que, en promedio, los hombres ganan igual que las mujeres, siendo que es falso D) Rechazar que, en promedio, los hombres ganan ms que las mujeres, siendo que es verdadero E) Rechazar que, en promedio, los hombres ganan igual que las mujeres, siendo que es verdadero

2. Talla de bebs de madres fumadoras Una muestra de mujeres es controlada durante su embarazo para determinar la talla del recin nacido, segn si fum o no durante el embarazo. Para ello se midi la talla de recin nacidos varones, hijos de madres comparables en su estado general de salud y contextura fsica, encontrndose los siguientes datos:

Tipo de Madre Fumadora No fumadora

n 9 13

Talla promedio (cm.) 48,1 50,4

Desviacin estndar (cm.) 2,5 2,2

Con el supuesto de independencia de la muestra, normalidad de la talla e igualdad de varianzas, al 5% de significacin, se desea contrastar la hiptesis de que la talla media de los nios de madres fumadoras es menor a la de los nios de madres no fumadoras.
2.1. El error estndar de la diferencia de medias es igual a: A) 1,058 cm. B) 2,31 cm. C) 0,05 cm. D) 0,85 cm.

E) 3,88 cm.

2.2. El test de hiptesis permite concluir, al 5% que, en promedio: A) La talla de los nios de madres fumadoras es mayor a la de los nios de madres no fumadoras B) La talla de los nios de madres fumadoras es menor a la de los nios de madres no fumadoras C) La talla de los nios de madres fumadoras es igual a la de los nios de madres no fumadoras D) No hay diferencia de tallas entre nios de madres fumadores y no fumadoras E) Hay diferencia de tallas entre madres fumadores y no fumadoras

3. Salud y nutricin Considere el siguiente texto, extrado de un informe de investigacin en el mbito de la salud y nutricin. El caso se dio en un consultorio de una comuna del Sur de Santiago, con madres que dieron a luz bebs con sobrepeso y con peso normal. Las madres de los nios nacidos con sobrepeso presentaron algunas cifras significativamente ms altas que el grupo de madres de nios nacidos con peso normal, en cuanto a (1) mayor promedio de edad (p = 0,027) y (2) mayor peso al inicio de la gestacin (p = 0,006); (3) no encontrndose diferencias en los aos promedio de escolaridad (p = 0,324).

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

125

Vicerrectora Acadmica Cuaderno de Apuntes 2010

3.1. En la dcima para la conclusin (2), la hiptesis alternativa, es que, al inicio de la gestacin, las madres de nios nacidos con sobrepeso, en promedio: A) Pesan igual que las de nios nacidos con peso normal B) Pesan distinto que las de nios nacidos con peso normal C) Pesan menos que las de nios nacidos con peso normal D) Pesan ms que las de nios nacidos con peso normal E) No se diferencian de las de nios nacidos con peso normal 3.2. Las tres hiptesis fueron testeadas al mismo nivel de significacin. De los siguientes: I: 0,01 II: 0,05 III: 0,10

Cul(es) puede(n) haber sido utilizado(s)? A) Solo I B) Solo I y II C) Solo II y III

D) Solo I y III

E) Cualquiera de los tres

3.3. En cul de los tres contrastes no se rechaz la hiptesis nula? A) Solo (1) y (2) B) Solo (1) y (3) C) (2) y (3) D) Solo (2)

E) Solo (3)

Solucin a problemas propuestos:


1.1. C 2.1. A 3.1. D 1.2. A 2.2. B 3.2. C 1.3. D 3.3. E 1.4. B 1.5. E

V.

RECURSOS COMPLEMENTARIOS

1. Test de hiptesis para muestras pequeas Tema 13. Teora de pequeas muestras: Modelo de Student para una muestra: aplicacin para medias muestrales y proporciones. Student para dos muestras independientes: comparaciones de medias y proporciones. Test de equivalencia biolgica. Comparacin de dos muestras apareadas. Modelo de la Chi-cuadrado. Modelo de Fisher. Significacin clnica versus estadstica. Ejemplos. 2. La prueba t. Fisterra: Metodologa de la investigacin http://www.fisterra.com/mbe/investiga/index.asp Mtodos paramtricos para la comparacin de dos medias. t de Student 3. Contraste de la media http://ftp.medprev.uma.es/libro/html.htm 9.10 Contrastes de dos distribuciones normales independientes 9.10.2 Contraste de medias con varianzas conocidas

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

126

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Ejercicios de recapitulacin
CON AYUDA DE FORMULARIO, TABLAS Y CALCULADORA, CONSTRUYA UNA RESPUESTA A LAS PREGUNTAS FORMULADAS SOBRE LA BASE DE LOS SIGUIENTES CASOS.

Caso 1: Economa en comunidad tnica En cierta comunidad tnica, las familias practican la ganadera y la agricultura. Se sabe de las familias, lo siguiente:

El 28% se dedica a la ganadera y a la agricultura El 67% se dedica a la agricultura El 15% se dedica a la ganadera pero no a la agricultura

Segn estos datos: 1.1. Cul es la probabilidad de que una familia se dedique a la agricultura, pero no a la ganadera? 1.2. Calcule la probabilidad que una familia no se dedique a la agricultura, ya que se dedica a la ganadera. 1.3. Calcule la probabilidad de que en esta comunidad una familia que se dedica a la agricultura se dedique tambin a la ganadera. 1.4. Son las actividades Ganadera y Agricultura, independientes?
Caso 2. Accidentes laborales y antigedad En cierta empresa, el 36% de los trabajadores tiene ms de 5 aos de experiencia laboral. La probabilidad de accidente laboral en el curso de un ao en la empresa es de 0,04. Si estos fenmenos son independientes: 2.1. Cul es la probabilidad de que se accidente un trabajador con menos de 5 aos de experiencia laboral? 2.2. Si ocurre un accidente laboral, cul es la probabilidad de que sea de un trabajador de ms de 5 aos de experiencia? Puede explicar el porqu del resultado?

Caso 3. Poblacin bilinge Canad tiene dos lenguas oficiales: el ingls y el francs. Sin embargo, en la provincia de Qubec la lengua predominante es el francs, dado que el 45% de la poblacin habla ingls y francs, el 20% habla ingls pero no francs, y el 5% no habla ninguna de estos dos lenguas, sino otras, producto de la inmigracin y la existencia de grupos autctonos. 3.1. Cul es la probabilidad de que un sujeto de esta provincia hable francs? 3.2. Cul es la probabilidad de que un sujeto de esta provincia hable ingls ya que no habla francs? Caso 4. El Loco Bielsa En una reciente publicacin se cita un dato estadstico que ha servido de base para la estrategia de Bielsa con la seleccin chilena de ftbol. Refirindose a los goles, dice: De cada diez, uno se hace desde media distancia, tres de pelota detenida, dos de jugadas que parten del centro del campo y cuatro de avances que parten por los costados que finalizan en el medio del rea. 12 Si esto es as: 4.1. Si se eligen al azar dos goles de las eliminatorias para el mundial de Sudfrica, cul es la probabilidad de que uno de ellos haya sido de jugadas que parten del centro del campo y el otro de pelota detenida? 4.2. Si se eligen al azar dos goles de las eliminatorias para el mundial de Sudfrica, cul es la probabilidad de que solo uno de ellos haya sido de jugadas que parten del centro del campo? 4.3. Si se seleccionan al azar ocho goles de las eliminatorias para el mundial de Sudfrica, cul es la probabilidad de que 5 de ellos hayan sido de pelota detenida?

12

Carcuro, Pedro Abarza, Esteban. Me pongo de pie. Aguilar, 2009.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

127

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Caso 5. Economa informal Se sabe lo siguiente de las familias que habitan cierta regin geogrfica del sur de Chile:

El 71% de las familias se dedica a la alfarera. El 8% de las familias tiene alguna actividad econmica formal.

Si se seleccionan al azar 30 familias de esta regin: 5.1. Cul es la probabilidad de que 20 de ellas se dediquen a la alfarera? 5.2. Cul es la probabilidad de que solo 3 de ellas tengan una actividad econmica formal?
Caso 6. Accidentes fatales Segn estudios realizados en Chile por la empresa Alka-Stat, al ao se producen, en promedio, 3,87 accidentes fatales por cada 50 mil trabajadores. Se desea calcular la probabilidad de que en un ao se produzcan en Chile cinco accidentes fatales por cada 50 mil trabajadores. 6.1. Es aplicable el modelo Poisson? Fundamente. 6.2. Si la respuesta para 6.1 es s, cul sera e modelo especfico para el caso? Caso 7. Edad de accidentados En cierto sector industrial, se ha constatado que la edad de los trabajadores afectados por accidentes de trabajo, se distribuye normalmente, con media 32,3 aos y desviacin estndar 5,7 aos. Si esto es as: 7.1. Qu % de los trabajadores accidentados tienen menos de 30 aos? 7.2. Qu % de los trabajadores accidentados tienen entre 25 y 40 aos? Caso 8. Ascensor dudoso En cierto edificio hay un ascensor que falla, en promedio 1,7 veces por semana. Es razonable pensar que el nmero de fallas por semana es abordable mediante el modelo de Poisson. 8.1. Cul es la probabilidad de que este ascensor falle 3 veces en una misma semana? 8.2. Cul es la probabilidad de que este ascensor falle ms de 2 veces en una misma semana? 8.3. Cul es la probabilidad de que el ascensor falle en la semana? Caso 9. Duracin del empleo Se ha constatado que la duracin de la relacin laboral con un mismo empleador en una muestra de trabajadores, sigue una curva normal con media 7,4 aos y desviacin estndar 2,5 aos. 9.1. Qu % de ellos ha durado ms de 10 aos con el mismo empleador? 9.2. Cul es la duracin mxima del 20% de menor duracin de la relacin laboral? 9.3. Cul es la ubicacin relativa de una persona que ha durado 12 aos con el mismo empleador? 9.4. Cul es la probabilidad de que un trabajador dure menos de 5 aos con el mismo empleador? Caso 10. Cuestionario burnout El cuestionario breve de burnout (CBB) tiene por objeto diagnosticar el fenmeno burnout en trabajadores. En su versin breve, divide en tres las dimensiones del fenmeno. Uno de ellos es el sndrome burnout, cuya escala de puntajes va de 9 a 36 puntos. Se adopta como supuesto que los puntajes del cuestionario pueden ser tratados como variable continua y que se distribuyen normalmente. A efectos de diagnstico del sndrome, se considera Bajo nivel de burnout hasta 19 puntos, medio, desde 19 a 25, y alto grado de burnout desde 25 puntos hacia arriba. Es decir, a partir de 25 puntos puede considerarse que una persona est afectada claramente por el sndrome del burnout. Este cuestionario es aplicado a los 258 trabajadores de una empresa de servicios financieros, llegando a obtenerse una media de 19,8 puntos con desviacin estndar 4,6 puntos. 10.1. Cuntos trabajadores de esta empresa estaran afectados por el sndrome de burnout en un alto grado? 10.2. Qu % de trabajadores de esta empresa estaran medianamente afectados por el sndrome de burnout?
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

128

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Caso 11. Penetracin del celular en Chile Se estudia la penetracin del celular en Chile con una muestra aleatoria e independiente de hombres y mujeres. En estos, el uso del telfono celular se muestra el siguiente grfico:
28,6% 25,0%

Hombre Mujer Uso de celular por sexo 458 hombres 360 mujeres
Fuente: ALKA-Stat, 2010.

Sobre la base de estos datos: 11.1. Construya un intervalo de confianza del 99% para la proporcin de hombres que usan celular. 11.2. Con un 1% de significacin contraste las hiptesis correspondientes para validar o refutar las siguientes afirmaciones: A1: Ms del 20% de las mujeres usan celular A2: El uso del celular se da en menos del 30% de los hombres A3: El uso del celular se da en mayor proporcin en los hombres

Caso 12. Contaminacin de aguas de un lago Se realiza un muestreo de las aguas en un lago tras la bsqueda de ciertas bacterias que se reproducen cuando hay contaminacin por productos derivados del petrleo. Se hace un conteo del nmero de bacterias por muestra de 100 ml de agua en un total de 72 ensayos, arrojando el siguiente resultado:

Bacterias (/100 ml) 30 35 35 40 40 45 45 50 50 55 55 60

N de casos 4 8 14 10 6 8

12.1. Calcule un IC del 95 % para la cantidad de bacterias por cada 100 ml de agua. 12.2. Con un 5% de significacin contraste la hiptesis que, en promedio, las aguas contienen menos de 42 bacterias por cada 100 ml de agua. Caso 13. Sodio en el queso Se realiza la medicin de la cantidad de sodio por rebanada (50 g) en una muestra de quesos. La muestra de 65 rebanadas arroj una media de 384 mg de sodio, con desviacin estndar 40 mg. 13.1. Calcule un IC del 90 % para la cantidad de sodio por rebanada de 50 gramos de queso. 13.2. Si se desea construir un IC del 99% para la cantidad media poblacional de sodio por rebanada con un error de no ms de 6 mg, calcule el tamao de la muestra. 13.3. Con un 5% de significacin contraste la hiptesis que el contenido medio de sodio en este queso est por sobre los 370 mg por rebanada de 50 gramos.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

129

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Caso 14. Outsourcing Dentro de las caractersticas del empleo actual est la progresiva disolucin de las relaciones laborales empleado-empleador. Uno de sus aspectos materiales lo constituye el outsourcing (externalizacin) de servicios. Esto es, la entrega de ciertos servicios a empresas externas, tales como jardinera, seguridad, transporte, etc. Cierta investigacin que estudia el fenmeno, se inicia asumiendo como hiptesis, que hoy en Chile, ms del 30% de las empresas medianas y grandes, han incorporado a su gestin la externalizacin de servicios. El estudio declara un nivel de significacin del 5%. En una muestra aleatoria de 450 empresas, se verific un total de 144 con servicios externalizados. 14.1. Construya una estimacin del 95% de confianza para el % de empresas han incorporado el outsourcing a su gestin. 14.2. Si se quisiera calcular un intervalo de confianza del 95% para el porcentaje de empresas que han incorporado el outsourcing a su gestin, con un error no mayor al 2%, calcule el tamao de la muestra mnima requerida. 14.3. Contraste al 5% la hiptesis de que en Chile, ms del 30% de las empresas medianas y grandes, han incorporado a su gestin la externalizacin de servicios.

Caso 15. Condiciones ambientales Una industria requiere para el funcionamiento de su lnea de produccin, mantener constantes una temperatura de 22C y una humedad relativa del 40%. Se realizan ms de 50 mediciones independientes de temperatura y humedad, llegando a las siguientes conclusiones:

C1. La temperatura media flucta entre 18,4C y 21,6C (p = 0,95). C2. La temperatura media es menor a la requerida (p = 0,0073). C3. La humedad media cumple con el estndar requerido (p = 0,245)

15.1. Determine la temperatura media de la muestra y su error muestral. 15.2. Para la conclusin C1, indique cul fue la hiptesis alternativa y cul fue la decisin en el contraste. 15.3. Para la conclusin C2 indique cul fue la hiptesis nula en el contraste y en qu consiste el error de tipo I. Caso 16. Das perdidos por accidente o enfermedad Se investiga los das perdidos por accidentes laborales y enfermedades profesionales en una muestra de 10 empresas constructoras y 8 del sector industria. Los estadsticos de las muestras se dan en la tabla siguiente:

Sector

n 10 8

Media (das) 122 134

Desv. Estndar (S) (das) 48 40

Error muestral de la diferencia de medias (das) 22,45

Construccin Industria

16.1. Construya un intervalo de confianza del 95% para el promedio de das perdidos por accidentes laborales o enfermedades profesionales en el sector construccin. 16.2. Calcule cuntas empresas ms habra que investigar en el sector construccin para trabajar un intervalo de confianza con un 95% de confianza y un error no superior a 15 das. 16.3. Con un 5% de significacin, ponga a prueba la hiptesis de que en el sector industria los das perdidos por accidentes laborales y enfermedades profesionales estn por sobre los 120 das. 16.4. Con un 5% de significacin, contraste la hiptesis de que en el sector construccin se pierden ms das por accidentes laborales y enfermedades profesionales que en sector industria.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

130

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Caso 17. Ficha tcnica de investigacin Cierta investigacin realizada en Espaa, declar la siguiente ficha tcnica de investigacin:

Ficha tcnica
AMBITO DE LA ENCUESTA: Segovia capital. UNIVERSO: Poblacin segoviana de ambos sexos de 18 aos y ms TAMAO DE LA MUESTRA: Diseada: 300 entrevistas. Realizada: 322 entrevistas. TCNICA DE INVESTIGACIN: Encuestas telefnicas y presenciales asistidas por programa informtico. FECHAS TRABAJO DE CAMPO: 24 y 25 de febrero de 2003 PROCEDIMIENTO MUESTREO: Muestreo aleatorio estratificado, con seleccin de unidades finales por muestreo aleatorio simple. Los estratos se forman atendiendo a categoras de edad, sexo y situacin laboral. ERROR ESPERADO: +/- 2.5% para un nivel de confianza del 95%.

17.1. Est correcto el error y confianza declarados en esta ficha tcnica? Fundamente.

Caso 18. Uso de los elementos de proteccin personal Se desea investigar qu % de trabajadores de la industria metal-mecnica se resiste al uso de los elementos de proteccin personal. 18.1. Indique el tamao de muestra adecuado, especificando el error de investigacin y confianza. 18.2. Si se puede encuestar solo a 580 trabajadores, indique la confianza de trabajo y el % de error de investigacin.

Caso 19. Intencin de siembra de trigo Una encuesta realizada a 140 agricultores de una sector A y 125 de un sector B, acerca de la Intencin de Siembra de Trigo para el ao prximo, gener la siguiente informacin para tres de las variables estudiadas:

W: rea a sembrar: Sector A: w A = 84 h; Sector B: w B = 92 h;


S w A = 28 h.

S wB = 34 h.

X: % de agricultores que utilizara semilla de alto rendimiento: Sector A: 57% Sector B: 64% Y: N de agricultores con dificultades de financiamiento para su prxima siembra: Sector A: 108 de los 140 Sector B: 91 de los 125 Con esta informacin, con = 5% y los supuestos adecuados, realice el test de las siguientes afirmaciones:
19.1. El rea media a sembrar en sector A es menor a 90 hectreas. 19.2. Los agricultores del sector A estn dispuestos a sembrar ms rea que los del sector A. 19.3. Ms del 60% de los agricultores estn dispuestos a utilizar semilla de trigo de alto rendimiento para su prxima siembra.
Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

131

Vicerrectora Acadmica Cuaderno de Apuntes 2010

19.4. Una proporcin mayor de agricultores del sector B que del sector A estn dispuestos a utilizar semilla de trigo de alto rendimiento para su prxima siembra. 19.5. El 80% de los agricultores del sector A tiene dificultades de financiamiento para su prxima siembra. 19.6. Menos agricultores del sector B tienen problemas de financiamiento para su prxima siembra que del sector A.

Caso 20. Estudio del mercado de las hamburguesas en oferta Cierta institucin ha hecho un estudio de las hamburguesas en locales de comida rpida en Santiago, donde el producto est en oferta. Una muestra aleatoria de locales y productos arroj la siguiente informacin en las tres variables que se indican:

X: Materia grasa en hamburguesas. Gramos por cada 100 gramos de producto. Xi = 26, 34, 30, 27, 20, 22, 26, 23, 30, 35, 28, 22, 26, 20 gramos. Y: Peso, en gramos, de la racin de hamburguesa. Yi: 275, 320, 315, 220, 285, 370, 330, 325 gramos. Z: % de hamburguesas con dficit de hidratos de carbono y fibra. Zi: 143 unidades, de una muestra de 175. Sobre la base de estos datos, con los supuestos adecuados y con un 5% de significacin, contraste las hiptesis para validar o no las siguientes afirmaciones:
20.1. El contenido graso promedio en las hamburguesas es mayor a 25 gramos por cada 100 gramos de producto. 20.2. La racin media de hamburguesa pesa 320 gramos. 20.3. Ms del 75% de las hamburguesas presentan dficit de hidratos de carbono y fibra.

Caso 21. Tiempo de proceso y capacitacin Una industria produce cierta pieza en acero fundido que, luego de fundida debe mecanizarse (tornearse). El departamento de produccin ha calculado que si el tiempo medio de mecanizado excede los 45 minutos, resulta ms conveniente externalizar ese servicio. 21.1. Una muestra aleatoria del tiempo de mecanizado dio el siguiente resultado: t = 42 50 48 54 36 60 45 53 minutos. A un nivel de significacin del 5% docime la hiptesis correspondiente y evale la decisin de externalizar. 21.2. Con el propsito de reducir el tiempo de proceso, se realiza una capacitacin a los trabajadores y se toma una nueva muestra aleatoria del tiempo de mecanizado, con el siguiente resultado: t = 45 39 52 50 37 42 34 46 42 minutos. A un nivel del 5% pruebe si la capacitacin dio los frutos esperados.

Supuestos: -Las muestras son independientes. -El tiempo de mecanizado se distribuye normalmente. -Las varianzas son iguales, antes y despus de la capacitacin.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

132

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Tabla 1: Distribucin normal estndar Z~N(0, 1)


Valores de la probabilidad p inferior, por debajo de z
0

zi
0,08 0,5319 0,5714 0,6103 0,6480 0,6844 0,7190 0,7517 0,7823 0,8106 0,8365 0,8599 0,8810 0,8997 0,9162 0,9306 0,9429 0,9535 0,9625 0,9699 0,9761 0,9812 0,9854 0,9887 0,9913 0,9934 0,9951 0,9963 0,9973 0,9980 0,9986 0,9990 0,9993 0,9995 0,9996 0,9997 0,9998

Z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5

0,00 0,5000 0,5398 0,5793 0,6179 0,6554 0,6915 0,7257 0,7580 0,7881 0,8159 0,8413 0,8643 0,8849 0,9032 0,9192 0,9332 0,9452 0,9554 0,9641 0,9713 0,9772 0,9821 0,9861 0,9893 0,9918 0,9938 0,9953 0,9965 0,9974 0,9981 0,9987 0,9990 0,9993 0,9995 0,9997 0,9998

0,01 0,5040 0,5438 0,5832 0,6217 0,6591 0,6950 0,7291 0,7611 0,7910 0,8186 0,8438 0,8665 0,8869 0,9049 0,9207 0,9345 0,9463 0,9564 0,9649 0,9719 0,9778 0,9826 0,9864 0,9896 0,9920 0,9940 0,9955 0,9966 0,9975 0,9982 0,9987 0,9991 0,9993 0,9995 0,9997 0,9998

0,02 0,5080 0,5478 0,5871 0,6255 0,6628 0,6985 0,7324 0,7642 0,7939 0,8212 0,8461 0,8686 0,8888 0,9066 0,9222 0,9357 0,9474 0,9573 0,9656 0,9726 0,9783 0,9830 0,9868 0,9898 0,9922 0,9941 0,9956 0,9967 0,9976 0,9982 0,9987 0,9991 0,9994 0,9995 0,9997 0,9998

0,03 0,5120 0,5517 0,5910 0,6293 0,6664 0,7019 0,7357 0,7673 0,7967 0,8238 0,8485 0,8708 0,8907 0,9082 0,9236 0,9370 0,9484 0,9582 0,9664 0,9732 0,9788 0,9834 0,9871 0,9901 0,9925 0,9943 0,9957 0,9968 0,9977 0,9983 0,9988 0,9991 0,9994 0,9996 0,9997 0,9998

0,04 0,5160 0,5557 0,5948 0,6331 0,6700 0,7054 0,7389 0,7704 0,7995 0,8264 0,8508 0,8729 0,8925 0,9099 0,9251 0,9382 0,9495 0,9591 0,9671 0,9738 0,9793 0,9838 0,9875 0,9904 0,9927 0,9945 0,9959 0,9969 0,9977 0,9984 0,9988 0,9992 0,9994 0,9996 0,9997 0,9998

0,05 0,5199 0,5596 0,5987 0,6368 0,6736 0,7088 0,7422 0,7734 0,8023 0,8289 0,8531 0,8749 0,8944 0,9115 0,9265 0,9394 0,9505 0,9599 0,9678 0,9744 0,9798 0,9842 0,9878 0,9906 0,9929 0,9946 0,9960 0,9970 0,9978 0,9984 0,9989 0,9992 0,9994 0,9996 0,9997 0,9998

0,06 0,5239 0,5636 0,6026 0,6406 0,6772 0,7123 0,7454 0,7764 0,8051 0,8315 0,8554 0,8770 0,8962 0,9131 0,9279 0,9406 0,9515 0,9608 0,9686 0,9750 0,9803 0,9846 0,9881 0,9909 0,9931 0,9948 0,9961 0,9971 0,9979 0,9985 0,9989 0,9992 0,9994 0,9996 0,9997 0,9998

0,07 0,5279 0,5675 0,6064 0,6443 0,6808 0,7157 0,7486 0,7794 0,8078 0,8340 0,8577 0,8790 0,8980 0,9147 0,9292 0,9418 0,9525 0,9616 0,9693 0,9756 0,9808 0,9850 0,9884 0,9911 0,9932 0,9949 0,9962 0,9972 0,9979 0,9985 0,9989 0,9992 0,9995 0,9996 0,9997 0,9998

0,09 0,5359 0,5753 0,6141 0,6517 0,6879 0,7224 0,7549 0,7852 0,8133 0,8389 0,8621 0,8830 0,9015 0,9177 0,9319 0,9441 0,9545 0,9633 0,9706 0,9767 0,9817 0,9857 0,9890 0,9916 0,9936 0,9952 0,9964 0,9974 0,9981 0,9986 0,9990 0,9993 0,9995 0,9997 0,9998 0,9998

Valores calculados con la funcin DISTR.NORM.ESTAND(z) de Excel. Gentileza de ALKA S. A. DERECHOS RESERVADOS.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

133

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Tabla 2: Distribucin normal estndar Z~N(0, 1)


Valores de la probabilidad p superior por sobre Z
0

p z

zi
0,08 0,4681 0,4286 0,3897 0,3520 0,3156 0,2810 0,2483 0,2177 0,1894 0,1635 0,1401 0,1190 0,1003 0,0838 0,0694 0,0571 0,0465 0,0375 0,0301 0,0239 0,0188 0,0146 0,0113 0,0087 0,0066 0,0049 0,0037 0,0027 0,0020 0,0014 0,0010 0,0007 0,0005 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

Z 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9

0,00 0,5000 0,4602 0,4207 0,3821 0,3446 0,3085 0,2743 0,2420 0,2119 0,1841 0,1587 0,1357 0,1151 0,0968 0,0808 0,0668 0,0548 0,0446 0,0359 0,0287 0,0228 0,0179 0,0139 0,0107 0,0082 0,0062 0,0047 0,0035 0,0026 0,0019 0,0013 0,0010 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000

0,01 0,4960 0,4562 0,4168 0,3783 0,3409 0,3050 0,2709 0,2389 0,2090 0,1814 0,1562 0,1335 0,1131 0,0951 0,0793 0,0655 0,0537 0,0436 0,0351 0,0281 0,0222 0,0174 0,0136 0,0104 0,0080 0,0060 0,0045 0,0034 0,0025 0,0018 0,0013 0,0009 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0000

0,02 0,4920 0,4522 0,4129 0,3745 0,3372 0,3015 0,2676 0,2358 0,2061 0,1788 0,1539 0,1314 0,1112 0,0934 0,0778 0,0643 0,0526 0,0427 0,0344 0,0274 0,0217 0,0170 0,0132 0,0102 0,0078 0,0059 0,0044 0,0033 0,0024 0,0018 0,0013 0,0009 0,0006 0,0005 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

0,03 0,4880 0,4483 0,4090 0,3707 0,3336 0,2981 0,2643 0,2327 0,2033 0,1762 0,1515 0,1292 0,1093 0,0918 0,0764 0,0630 0,0516 0,0418 0,0336 0,0268 0,0212 0,0166 0,0129 0,0099 0,0075 0,0057 0,0043 0,0032 0,0023 0,0017 0,0012 0,0009 0,0006 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

0,04 0,4840 0,4443 0,4052 0,3669 0,3300 0,2946 0,2611 0,2296 0,2005 0,1736 0,1492 0,1271 0,1075 0,0901 0,0749 0,0618 0,0505 0,0409 0,0329 0,0262 0,0207 0,0162 0,0125 0,0096 0,0073 0,0055 0,0041 0,0031 0,0023 0,0016 0,0012 0,0008 0,0006 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

0,05 0,4801 0,4404 0,4013 0,3632 0,3264 0,2912 0,2578 0,2266 0,1977 0,1711 0,1469 0,1251 0,1056 0,0885 0,0735 0,0606 0,0495 0,0401 0,0322 0,0256 0,0202 0,0158 0,0122 0,0094 0,0071 0,0054 0,0040 0,0030 0,0022 0,0016 0,0011 0,0008 0,0006 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

0,06 0,4761 0,4364 0,3974 0,3594 0,3228 0,2877 0,2546 0,2236 0,1949 0,1685 0,1446 0,1230 0,1038 0,0869 0,0721 0,0594 0,0485 0,0392 0,0314 0,0250 0,0197 0,0154 0,0119 0,0091 0,0069 0,0052 0,0039 0,0029 0,0021 0,0015 0,0011 0,0008 0,0006 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

0,07 0,4721 0,4325 0,3936 0,3557 0,3192 0,2843 0,2514 0,2206 0,1922 0,1660 0,1423 0,1210 0,1020 0,0853 0,0708 0,0582 0,0475 0,0384 0,0307 0,0244 0,0192 0,0150 0,0116 0,0089 0,0068 0,0051 0,0038 0,0028 0,0021 0,0015 0,0011 0,0008 0,0005 0,0004 0,0003 0,0002 0,0001 0,0001 0,0001 0,0000

0,09 0,4641 0,4247 0,3859 0,3483 0,3121 0,2776 0,2451 0,2148 0,1867 0,1611 0,1379 0,1170 0,0985 0,0823 0,0681 0,0559 0,0455 0,0367 0,0294 0,0233 0,0183 0,0143 0,0110 0,0084 0,0064 0,0048 0,0036 0,0026 0,0019 0,0014 0,0010 0,0007 0,0005 0,0003 0,0002 0,0002 0,0001 0,0001 0,0001 0,0000

Valores calculados con la funcin DISTR.NORM.ESTAND(z) de Excel. Gentileza de ALKA S. A. DERECHOS RESERVADOS.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

134

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Tabla 3: Distribucin t (Student)


Percentiles de t con grados de libertad, bajo la probabilidad p superior
gl
0

ti

Probabilidad p a la derecha del valor de t dado en la tabla (rea de la cola derecha) 0,45
0,158 0,142 0,137 0,134 0,132 0,131 0,130 0,130 0,129 0,129 0,129 0,128 0,128 0,128 0,128 0,128 0,128 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,127 0,126

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 > 30

0,40
0,325 0,289 0,277 0,271 0,267 0,265 0,263 0,262 0,261 0,260 0,260 0,259 0,259 0,258 0,258 0,258 0,257 0,257 0,257 0,257 0,257 0,256 0,256 0,256 0,256 0,253

0,35
0,510 0,445 0,424 0,414 0,408 0,404 0,402 0,399 0,398 0,397 0,396 0,395 0,394 0,393 0,393 0,392 0,392 0,392 0,391 0,391 0,391 0,390 0,390 0,390 0,390 0,386

0,325
0,613 0,528 0,502 0,490 0,482 0,477 0,474 0,471 0,469 0,468 0,466 0,465 0,464 0,464 0,463 0,462 0,462 0,461 0,461 0,461 0,460 0,460 0,460 0,460 0,459 0,454

0,30
0,727 0,617 0,584 0,569 0,559 0,553 0,549 0,546 0,543 0,542 0,540 0,539 0,538 0,537 0,536 0,535 0,534 0,534 0,533 0,533 0,532 0,532 0,532 0,531 0,531 0,524

0,275
0,854 0,713 0,671 0,652 0,641 0,633 0,628 0,624 0,621 0,619 0,617 0,615 0,614 0,613 0,612 0,611 0,610 0,609 0,609 0,608 0,608 0,607 0,607 0,606 0,606 0,599

0,25
1,000 0,816 0,765 0,741 0,727 0,718 0,711 0,706 0,703 0,700 0,697 0,695 0,694 0,692 0,691 0,690 0,689 0,688 0,688 0,687 0,686 0,686 0,685 0,685 0,684 0,676

0,225
1,171 0,931 0,866 0,836 0,819 0,808 0,800 0,794 0,790 0,786 0,783 0,781 0,779 0,777 0,776 0,774 0,773 0,772 0,771 0,771 0,770 0,769 0,769 0,768 0,767 0,757

0,20
1,376 1,061 0,978 0,941 0,920 0,906 0,896 0,889 0,883 0,879 0,876 0,873 0,870 0,868 0,866 0,865 0,863 0,862 0,861 0,860 0,859 0,858 0,858 0,857 0,856 0,842

0,175
1,632 1,210 1,105 1,057 1,031 1,013 1,001 0,993 0,986 0,980 0,976 0,972 0,969 0,967 0,965 0,963 0,961 0,960 0,958 0,957 0,956 0,955 0,954 0,953 0,952 0,937

0,15
1,963 1,386 1,250 1,190 1,156 1,134 1,119 1,108 1,100 1,093 1,088 1,083 1,079 1,076 1,074 1,071 1,069 1,067 1,066 1,064 1,063 1,061 1,060 1,059 1,058 1,036

0,125
2,414 1,604 1,423 1,344 1,301 1,273 1,254 1,240 1,230 1,221 1,214 1,209 1,204 1,200 1,197 1,194 1,191 1,189 1,187 1,185 1,183 1,182 1,180 1,179 1,178 1,154

0,10
3,078 1,886 1,638 1,533 1,476 1,440 1,415 1,397 1,383 1,372 1,363 1,356 1,350 1,345 1,341 1,337 1,333 1,330 1,328 1,325 1,323 1,321 1,319 1,318 1,316 1,282

0,075
4,165 2,282 1,924 1,778 1,699 1,650 1,617 1,592 1,574 1,559 1,548 1,538 1,530 1,523 1,517 1,512 1,508 1,504 1,500 1,497 1,494 1,492 1,489 1,487 1,485 1,440

0,05
6,314 2,920 2,353 2,132 2,015 1,943 1,895 1,860 1,833 1,812 1,796 1,782 1,771 1,761 1,753 1,746 1,740 1,734 1,729 1,725 1,721 1,717 1,714 1,711 1,708 1,645

0,0375
8,449 3,443 2,681 2,392 2,242 2,151 2,090 2,046 2,013 1,987 1,966 1,949 1,935 1,923 1,913 1,904 1,897 1,890 1,884 1,878 1,873 1,869 1,865 1,861 1,858 1,790

0,025
12,706 4,303 3,182 2,776 2,571 2,447 2,365 2,306 2,262 2,228 2,201 2,179 2,160 2,145 2,131 2,120 2,110 2,101 2,093 2,086 2,080 2,074 2,069 2,064 2,060 1,960

0,0175
18,171 5,204 3,670 3,135 2,870 2,712 2,608 2,535 2,480 2,437 2,404 2,376 2,353 2,334 2,318 2,304 2,291 2,280 2,271 2,262 2,254 2,247 2,241 2,235 2,229 2,123

0,01
31,82 6,965 4,541 3,747 3,365 3,143 2,998 2,896 2,821 2,764 2,718 2,681 2,650 2,624 2,602 2,583 2,567 2,552 2,539 2,528 2,518 2,508 2,500 2,492 2,485 2,326

0,005
63,66 9,925 5,841 4,604 4,032 3,707 3,499 3,355 3,250 3,169 3,106 3,055 3,012 2,977 2,947 2,921 2,898 2,878 2,861 2,845 2,831 2,819 2,807 2,797 2,787 2,576

Valores calculados con la funcin DISTR.T.INV(probabilidad; grados_de_libertad) de Excel. Gentileza de ALKA S. A. DERECHOS RESERVADOS.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

135

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Tabla 4: Distribucin t (Student)


Probabilidad superior de valores de t con grados de libertad de 1 a 15
0

t
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0

1
0,468 0,437 0,407 0,379 0,352 0,328 0,306 0,285 0,267 0,250 0,235 0,221 0,209 0,197 0,187 0,178 0,169 0,161 0,154 0,148 0,141 0,136 0,131 0,126 0,121 0,117 0,113 0,109 0,106 0,102 0,099 0,096 0,094 0,091 0,089 0,086 0,084 0,082 0,080 0,078 0,076 0,074 0,073 0,071 0,070 0,068 0,067 0,065 0,064 0,063

2
0,465 0,430 0,396 0,364 0,333 0,305 0,278 0,254 0,232 0,211 0,193 0,177 0,162 0,148 0,136 0,125 0,116 0,107 0,099 0,092 0,085 0,079 0,074 0,069 0,065 0,061 0,057 0,054 0,051 0,048 0,045 0,043 0,040 0,038 0,036 0,035 0,033 0,031 0,030 0,029 0,027 0,026 0,025 0,024 0,023 0,022 0,021 0,020 0,020 0,019

3
0,463 0,427 0,392 0,358 0,326 0,295 0,267 0,241 0,217 0,196 0,176 0,158 0,142 0,128 0,115 0,104 0,094 0,085 0,077 0,070 0,063 0,058 0,052 0,048 0,044 0,040 0,037 0,034 0,031 0,029 0,027 0,025 0,023 0,021 0,020 0,018 0,017 0,016 0,015 0,014 0,013 0,012 0,012 0,011 0,010 0,010 0,009 0,009 0,008 0,008

4
0,463 0,426 0,390 0,355 0,322 0,290 0,261 0,234 0,210 0,187 0,167 0,148 0,132 0,117 0,104 0,092 0,082 0,073 0,065 0,058 0,052 0,046 0,041 0,037 0,033 0,030 0,027 0,024 0,022 0,020 0,018 0,016 0,015 0,014 0,012 0,011 0,010 0,010 0,009 0,008 0,007 0,007 0,006 0,006 0,005 0,005 0,005 0,004 0,004 0,004

5
0,462 0,425 0,388 0,353 0,319 0,287 0,258 0,230 0,205 0,182 0,161 0,142 0,125 0,110 0,097 0,085 0,075 0,066 0,058 0,051 0,045 0,040 0,035 0,031 0,027 0,024 0,021 0,019 0,017 0,015 0,013 0,012 0,011 0,010 0,009 0,008 0,007 0,006 0,006 0,005 0,005 0,004 0,004 0,004 0,003 0,003 0,003 0,002 0,002 0,002

GRADOS DE LIBERTAD 7 8 9 10
0,462 0,424 0,386 0,351 0,316 0,284 0,253 0,225 0,199 0,175 0,154 0,135 0,117 0,102 0,089 0,077 0,066 0,057 0,050 0,043 0,037 0,032 0,027 0,024 0,020 0,018 0,015 0,013 0,011 0,010 0,009 0,008 0,007 0,006 0,005 0,004 0,004 0,003 0,003 0,003 0,002 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,461 0,423 0,386 0,350 0,315 0,283 0,252 0,223 0,197 0,173 0,152 0,132 0,115 0,100 0,086 0,074 0,064 0,055 0,047 0,040 0,034 0,029 0,025 0,022 0,018 0,016 0,014 0,012 0,010 0,009 0,007 0,006 0,005 0,005 0,004 0,003 0,003 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,461 0,423 0,385 0,349 0,315 0,282 0,251 0,222 0,196 0,172 0,150 0,130 0,113 0,098 0,084 0,072 0,062 0,053 0,045 0,038 0,033 0,028 0,023 0,020 0,017 0,014 0,012 0,010 0,009 0,007 0,006 0,005 0,005 0,004 0,003 0,003 0,002 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,461 0,423 0,385 0,349 0,314 0,281 0,250 0,221 0,195 0,170 0,149 0,129 0,111 0,096 0,082 0,070 0,060 0,051 0,043 0,037 0,031 0,026 0,022 0,019 0,016 0,013 0,011 0,009 0,008 0,007 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000

ti
13
0,461 0,422 0,384 0,348 0,313 0,279 0,248 0,219 0,192 0,168 0,146 0,126 0,108 0,092 0,079 0,067 0,056 0,048 0,040 0,033 0,028 0,023 0,019 0,016 0,013 0,011 0,009 0,008 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

11
0,461 0,423 0,385 0,348 0,313 0,280 0,249 0,220 0,194 0,169 0,147 0,128 0,110 0,095 0,081 0,069 0,059 0,050 0,042 0,035 0,030 0,025 0,021 0,018 0,015 0,012 0,010 0,009 0,007 0,006 0,005 0,004 0,004 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000

12
0,461 0,422 0,385 0,348 0,313 0,280 0,249 0,220 0,193 0,169 0,146 0,127 0,109 0,093 0,080 0,068 0,057 0,049 0,041 0,034 0,029 0,024 0,020 0,017 0,014 0,012 0,010 0,008 0,007 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000

14
0,461 0,422 0,384 0,348 0,312 0,279 0,248 0,219 0,192 0,167 0,145 0,125 0,107 0,092 0,078 0,066 0,056 0,047 0,039 0,033 0,027 0,023 0,019 0,015 0,013 0,010 0,009 0,007 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

15
0,461 0,422 0,384 0,347 0,312 0,279 0,247 0,218 0,191 0,167 0,144 0,124 0,107 0,091 0,077 0,065 0,055 0,046 0,038 0,032 0,027 0,022 0,018 0,015 0,012 0,010 0,008 0,007 0,005 0,004 0,004 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

0,462 0,424 0,387 0,352 0,317 0,285 0,255 0,227 0,201 0,178 0,157 0,138 0,121 0,106 0,092 0,080 0,070 0,061 0,053 0,046 0,040 0,035 0,031 0,027 0,023 0,020 0,018 0,016 0,014 0,012 0,011 0,009 0,008 0,007 0,006 0,006 0,005 0,004 0,004 0,004 0,003 0,003 0,003 0,002 0,002 0,002 0,002 0,002 0,001 0,001

Valores calculados con la funcin DISTR.T(x; grados_de_libertad; colas) de Excel. Gentileza de ALKA S. A. DERECHOS RESERVADOS.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

136

Vicerrectora Acadmica Cuaderno de Apuntes 2010

Tabla 5: Distribucin t (Student)


Probabilidad superior de valores de t con grados de libertad de 16 a 30
0

t
0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 1,1 1,2 1,3 1,4 1,5 1,6 1,7 1,8 1,9 2,0 2,1 2,2 2,3 2,4 2,5 2,6 2,7 2,8 2,9 3,0 3,1 3,2 3,3 3,4 3,5 3,6 3,7 3,8 3,9 4,0 4,1 4,2 4,3 4,4 4,5 4,6 4,7 4,8 4,9 5,0

16
0,461 0,422 0,384 0,347 0,312 0,278 0,247 0,218 0,191 0,166 0,144 0,124 0,106 0,090 0,077 0,065 0,054 0,045 0,038 0,031 0,026 0,021 0,018 0,014 0,012 0,010 0,008 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

17
0,461 0,422 0,384 0,347 0,312 0,278 0,247 0,217 0,190 0,166 0,143 0,123 0,105 0,090 0,076 0,064 0,054 0,045 0,037 0,031 0,025 0,021 0,017 0,014 0,011 0,009 0,008 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

18
0,461 0,422 0,384 0,347 0,312 0,278 0,246 0,217 0,190 0,165 0,143 0,123 0,105 0,089 0,075 0,064 0,053 0,044 0,037 0,030 0,025 0,021 0,017 0,014 0,011 0,009 0,007 0,006 0,005 0,004 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

19
0,461 0,422 0,384 0,347 0,311 0,278 0,246 0,217 0,190 0,165 0,143 0,122 0,105 0,089 0,075 0,063 0,053 0,044 0,036 0,030 0,025 0,020 0,016 0,013 0,011 0,009 0,007 0,006 0,005 0,004 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

20
0,461 0,422 0,384 0,347 0,311 0,278 0,246 0,217 0,189 0,165 0,142 0,122 0,104 0,088 0,075 0,063 0,052 0,043 0,036 0,030 0,024 0,020 0,016 0,013 0,011 0,009 0,007 0,006 0,004 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

21

GRADOS DE LIBERTAD 22 23 24 25
0,461 0,422 0,383 0,347 0,311 0,277 0,246 0,216 0,189 0,164 0,142 0,121 0,104 0,088 0,074 0,062 0,052 0,043 0,035 0,029 0,024 0,019 0,016 0,013 0,010 0,008 0,007 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,461 0,422 0,383 0,346 0,311 0,277 0,245 0,216 0,189 0,164 0,141 0,121 0,103 0,087 0,074 0,062 0,051 0,042 0,035 0,029 0,023 0,019 0,015 0,012 0,010 0,008 0,006 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,461 0,422 0,383 0,346 0,311 0,277 0,245 0,216 0,189 0,164 0,141 0,121 0,103 0,087 0,073 0,061 0,051 0,042 0,035 0,028 0,023 0,019 0,015 0,012 0,010 0,008 0,006 0,005 0,004 0,003 0,002 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,461 0,422 0,383 0,346 0,311 0,277 0,245 0,216 0,188 0,163 0,141 0,121 0,103 0,087 0,073 0,061 0,051 0,042 0,035 0,028 0,023 0,019 0,015 0,012 0,010 0,008 0,006 0,005 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

ti
28
0,461 0,421 0,383 0,346 0,310 0,277 0,245 0,215 0,188 0,163 0,140 0,120 0,102 0,086 0,072 0,060 0,050 0,041 0,034 0,028 0,022 0,018 0,015 0,012 0,009 0,007 0,006 0,005 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

26
0,461 0,422 0,383 0,346 0,311 0,277 0,245 0,215 0,188 0,163 0,141 0,120 0,103 0,087 0,073 0,061 0,051 0,042 0,034 0,028 0,023 0,018 0,015 0,012 0,010 0,008 0,006 0,005 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

27
0,461 0,421 0,383 0,346 0,311 0,277 0,245 0,215 0,188 0,163 0,141 0,120 0,102 0,086 0,073 0,061 0,050 0,042 0,034 0,028 0,023 0,018 0,015 0,012 0,009 0,007 0,006 0,005 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

29
0,461 0,421 0,383 0,346 0,310 0,277 0,245 0,215 0,188 0,163 0,140 0,120 0,102 0,086 0,072 0,060 0,050 0,041 0,034 0,027 0,022 0,018 0,014 0,012 0,009 0,007 0,006 0,004 0,004 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

30
0,461 0,421 0,383 0,346 0,310 0,277 0,245 0,215 0,188 0,163 0,140 0,120 0,102 0,086 0,072 0,060 0,050 0,041 0,034 0,027 0,022 0,018 0,014 0,011 0,009 0,007 0,006 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

0,461 0,422 0,384 0,347 0,311 0,277 0,246 0,216 0,189 0,164 0,142 0,122 0,104 0,088 0,074 0,062 0,052 0,043 0,036 0,029 0,024 0,020 0,016 0,013 0,010 0,008 0,007 0,005 0,004 0,003 0,003 0,002 0,002 0,001 0,001 0,001 0,001 0,001 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000 0,000

Valores calculados con la funcin DISTR.T(x; grados_de_libertad; colas) de Excel. Gentileza de ALKA S. A. DERECHOS RESERVADOS.

Cuadernos de Apuntes de uso exclusivo estudiantes del Instituto Profesional AIEP: Prohibida su reproduccin. Derechos reservados AIEP.

137