Sie sind auf Seite 1von 181

DEPARTAMENTO DE CIENCIAS EXACTAS

GUÍA METODOLÓGICA

DE

PROBABILIDAD Y ESTADISTICA

SEPTIEMBRE 2015 – FEBRERO 2016


ASIGNATURA: PROBABILIDAD Y ESTADISTICA
NIVEL: CUARTO
CREDITOS: CUATRO
PRERREQUISITOS: Cálculo Diferencial
Cálculo Integral
CORREQUISITOS: Manejo de Tablas, uso de graficadores,

DESCRIPCIÓN DE LA ASIGNATURA

El proceso de enseñanza-aprendizaje de la Probabilidad y Estadística proporciona a


los y las estudiantes sólidos conocimientos de los principios fundamentales de la
asignatura como son: recolección, organización, presentación, análisis e
interpretación de datos; cálculo de medidas de tendencia central, dispersión,
localización, probabilidades, estimaciones de intervalos, pruebas de hipótesis y
regresión lineal; herramientas fundamentales para la investigación científica y para
la toma de decisiones de una manera inteligente y precisa, en la resolución de
problemas.

OBJETIVO GENERAL DE LA ASIGNATURA O MÓDULO


Aplicar las técnicas y modelos estadísticos para la recopilación, organización
presentación, interpretación de la información y toma de decisiones en una
investigación científica a través de la resolución de problemas.

CAPÍTULOS:
I. INTRODUCCION A LA ESTADISTICA
II. ORGANIZACIÓN Y TABULACION DE DATOS
III. MEDIDAS ESTADÍSTICAS PARA DATOS NO AGRUPADOS Y
AGRUPADOS.
IV. PROBABILIDADES
V. DISTRIBUCIONES DE PROBABILIDAD
VI. DISTRIBUCIONES DE MUESTREO.
VII. ESTIMACIONES
VIII. PRUEBAS DE HIPÓTESIS CON UNA Y DOS MUESTRAS.
IX. REGRESIÓN Y CORRELACIÓN LINEAL

TOTAL DE HORAS: 60 h

TEXTO GUÍA:
Walpole, R. Myers, R. Myers, S. Ye, K. (2012). Probabilidad y Estadística para
Ingeniería y Ciencias. Novena edición, PEA
RSON Prentice Hall, (México).

Milton, J. Arnold J. (2004). Probabilidad y estadística: con aplicaciones para


ingeniería y ciencias computacionales. Cuarta edición, MCGRAW-HILL,
(México)
CAPÍTULO I. INTRODUCCION A LA ESTADISTICA
OBJETIVOS ESPECÍFICOS:

 Presentar los conceptos básicos de estadística


 Diferenciar entre estadística descriptiva e inferencial
 Aplicar los conceptos de datos cualitativos y cuantitativos

CONOCIMIENTOS PREVIOS:
 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

1.1 Definiciones y conceptos.


1.2 Dato, tipo de datos.
1.3 Simbología y terminología a estudiar.
.
HORAS: 2 h

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS

1. Complete el siguiente cuadro con un ejemplo de cada una de las posibles variables que
se pueden obtener a partir de los diferentes tipos de población señalados. En la última fila
proponga usted un ejemplo.

Población CUANTITATIVAS CAUALITATIVAS


Variable Variable Variable Variable
Continua Discreta Nominales Ordinales
Habitantes del Distrito Metropolitano de
Quito

Docentes de la UTE

Usuarios de los parqueaderos de la UTE

Estudiantes de Ingeniería

2. En una encuesta reciente se pidió al profesorado de una universidad que respondiera


a varias preguntas. Indique el tipo de datos de cada pregunta.

a) Indique su nivel de satisfacción con la carga docente


b) ¿Cuántos artículos ha publicado en revistas durante el último año?
c) ¿Ha asistido a la última reunión del consejo de departamento?
d) ¿Cree usted que el proceso de evaluación de la docencia debe revisarse?

3. Se ha formulado una serie de preguntas a una muestra de clientes de una tienda de


helados. Identifique el tipo de datos que se pide en cada pregunta.
a) ¿Cuántos años tiene?
b) ¿Cuál es su sabor de helado preferido?
c) ¿Cuántas veces al mes toma helado?
d) ¿Tiene hijos de menos de 10 años que vivan en casa?
e) ¿Ha probado el último sabor de helado?

4. Se va aplicar una encuesta de opinión ciudadana acerca de la gestión del Presidente


Rafael Correa y del Alcalde Mauricio Rodas. Indique el tipo de datos del siguiente grupo de
preguntas que son parte del cuestionario:
a) Edad
b) Nivel de instrucción
c) ¿Cómo calificaría usted a la gestión que realiza el presidente Rafael Correa?
(Muy buena, buena…)
d) ¿Está o no de acuerdo con la gestión que realiza el Alcalde Mauricio Rodas?
e) ¿Según usted cuál es el mayor problema que afecta a la ciudad de Quito?
CAPÍTULO II. ORGANIZACIÓN Y TABULACION DE DATOS
OBJETIVOS ESPECÍFICOS:
 Calcular las Medidas de Tendencia Central y de Dispersión utilizando los modelos
matemáticos

CONOCIMIENTOS PREVIOS:
 Dominio de matemática básica, operaciones fundamentales
 Leyes de sumatoria

CONTENIDO:
2.1 Datos cualitativos.
2.1.1 Tablas o cuadros de frecuencia.
2.1.2 Representación Gráfica.
2.1.2.1 Barras.
2.1.2.2 Lineal.
2.1.2.3 Circular o pastel.

2.2 .Datos cuantitativos.


2.2.1 Tablas o cuadros de frecuencia de clases.
2.2.2 Tablas o cuadros de frecuencias de intervalos de clase.
2.2.3 Representación Gráfica.
2.2.3.1. Histograma.
2.2.3.2 Polígono.
2.2.3.3 Ojiva.
2.2.3.4 Circular o pastel.
2.2.3.5 Diagrama de Pareto

2. ORDENAMIENTO DE DATOS

La forma más sencilla es la de presentarlos en orden ascendente o descendente

Ejemplo 1. Datos ordenados ascendentemente

Datos originales

15,4
15,7
16,2
16,4
16,4
15,8
16,0
15,2
15,7
16,6
Datos ordenados

15,4
15,2
15,7
15,7
15,8
16,0
16,2
16,4
16,4
16,6

2.1 DISTRIBUCION DE FRECUENCIA

Una distribución de frecuencia es un agrupamiento de datos en clases o intervalos,


que muestra el número o porcentaje de observaciones de cada una de ellas.

Ejemplo 2 : Arreglo de datos sobre existencia promedio (en días) para 20 tiendas de
autoservicio

2,0 3,4 3,4 3,8 3,8 3,8


4,0 4,1 4,1 4,1 4,1 4,2
4,3 4,7 4,7 4,7 4,8 4,9
4,9 5,5 5,5 5,5 5,5 5,5

Distribución de frecuencia de las existencias promedio (en días) para 20 tiendas de


autoservicio

Frecuencia (
clase (grupo de
Número de
valores parecidos
observaciones que
de punto de dato
hay en cada clase)
2,0 a 2,5 1
2,6 a 3,1 0
3,2 a 3,7 2
3,8 a 4,3 8
4,4 a 4,9 5
5,0 a 5,5 4

2.2. DISTRIBUCION DE FRECUENCIA RELATIVA

Se puede expresar la frecuencia como una fracción o porcentaje del número total de
observaciones, para obtener este valor se divide la frecuencia de la clase para el
número total de observaciones

Ejemplo 3: Distribución de frecuencias relativas sobre existencia promedio (en días)


para 20 tiendas de autoservicio
Frecuencia
relativa: fracción de
Clase Frecuencia
observaciones de
cada clase
2,0 a 2,5 1 0,05 1/20 = 0,05*
2,6 a 3,1 0 0
3,2 a 3,7 2 0,1
3,8 a 4,3 8 0,4
4,4 a 4,9 5 0,25
5,0 a 5,5 4 0,2
suma de la frecuencias
total 20 1 relativas de todas las
clases

2.3 CONSTRUCCION DE UNA DISTRIBUCION DE FRECUENCIA

1.- Se define el número de intervalos de clase (Nc)

La primera, la más conocida, establece el número de intervalos al obtener la raíz


cuadrada del total de elementos considerados en el estudio.

Nc  n

Cuando se trabajan con muestras mayores a 225, la formula obtiene un Nc superior


a 15, por tanto, se recomienda para estos casos la siguiente formula:

Si en ambas fórmulas obtenemos un Nc mayor a 15, simplemente tomaremos 15


intervalos. Se podrá omitir los resultados de las formulas y seleccionar el numero de
intervalos que crea son los mas adecuados, de acuerdo al objeto del estudio o las
características que desea mostrar de la variable.

Se recomienda utilizar número de intervalos entre 5 y 15

2.- Se define el Rango o amplitud de variación de los datos el cual se calcula restando
el mayor valor de los datos del menor valor de los datos
R = Valor mayor – Valor menor

3.- Calculo del ancho o intervalo de clase


Ancho del intervalo de Clase (A): Equivale a la diferencia entre el Limite superior
(Ls) y el Limite inferior (Lm) de cada intervalo.
Matemáticamente se expresa:
A = Ls – Lm

Su cálculo resulta de la división del Rango (R) entre el Número de Intervalos (Nc)
A = R / Nc

Ejemplo 4: tablas de frecuencia


Un sondeo realizado en la Universidad de Cartagena sobre 30 alumnos del sexto
semestre de Administración, pretende mostrar que edad es la más representativa.
Las edades de los alumnos fueron:
17 17 19 19 31
21 18 27 21 22
24 19 25 24 24
23 20 29 21 19
21 22 21 20 20
19 19 23 20 21
Elabore una tabla de frecuencia que resuma los resultados.

SOLUCIÓN
PASO 1: Determinar el numero de intervalos (Nc).
Optaremos por utilizar la primera formula expuesta:

Se debe siempre aproximar el número de intervalos al entero más próximo,


recordando que este valor no será menor a 5, ni un valor mayor a 15. Nuestra tabla
estará constituida por seis intervalos.

Paso 2: Determinar el ancho de cada intervalo.


Antes de hallar el ancho de los intervalos de clase, debemos calcular el rango (R)
como primera medida.
R = 31-17 = 14

Con el Rango y el número de intervalos, podremos hallar el ancho:

El ancho se debe ajustar para trabajar con el mismo número de decimales que en el
conjunto de datos tratados. Como los datos son valores enteros (variable discreta),
aproximamos al entero superior.

El ajuste del Ancho no podrá ser menor al valor obtenido inicialmente.


Paso 3: Determinar el nuevo Rango (R’).
En el momento de realizar el ajuste del ancho del intervalo, el rango se incrementa
automáticamente. Este “Nuevo Rango” lo denotaremos como R’:

Nuevo Rango (R’): Rango que es convenido por el Ancho de los intervalos a los
decimales que son manejados en los datos objeto del estudio. Su cálculo se realiza
multiplicando el Ancho ajustado por el Número de Intervalos:

El rango se incremento en cuatro años. El incremento se le sumará al valor


Máximo (Xmax’) o restará al valor Mínimo (Xmin’). En este caso optaremos por
aumentar el valor Máximo y reducir el valor Mínimo en dos.
El alumno podrá repartir el incremento de la forma que crea más conveniente.
El ajuste del Ancho no podrá ser menor al valor obtenido inicialmente.
Este procedimiento permite encontrar los valores máximos y mínimos cuya resta
sea igual al nuevo Rango (R’)

Paso 4: Determinar los intervalos de clases iniciales.


Con los valores máximos y mínimos, y el ancho, podremos armar cada intervalo de
clase. El primer intervalo parte del valor mínimo, al cual le agregamos el ancho.

El segundo intervalo parte del límite superior del intervalo anterior.

Seguimos realizando este proceso hasta alcanzar el valor máximo:

Esta primera distribución presenta algunos inconvenientes al momento de repartir las


frecuencias a cada intervalo de clase, por ejemplo, existen 6 personas del total de
encuestados que tienen una edad de 21 años, los cuales podrían ser clasificados en
el intervalo dos o en el tres.

Este caso se le conoce como el “Problema de la Ambigüedad”, y el cual debe ser


solucionado antes de terminar la tabla de frecuencia
Primera Solución
Se trabajan con intervalos cuyos límites Superiores e Inferiores tendrán un decimal
adicional sobre el número de decimales manejados en los datos.
Por ejemplo, si el Limite Superior del primer intervalo es 21 y los datos trabajados
son valores enteros, el nuevo límite superior será 21,1. Si los datos trabajan con un
decimal, el nuevo Limite Superior sería 21,01.
El primer límite Inferior (Valor Mínimo) y el último límite Superior (Valor Máximo) se
mantendrán sin modificación.
El problema quedaría solucionado de la siguiente manera:
Las seis personas que tienen 21 años quedarían registradas en el intervalo número
2.
Segunda Solución
Se convierten los Limites Superior e Inferior en Límites Abiertos y Cerrados. Se
considera como Límite Abierto aquel que admite un número superior, más no igual,
al valor indicado. El Límite Cerrado puede admitirse así mismo.
Los límites que son abiertos se identifican con el Paréntesis y los Límites Cerrados
con el Corchete.
La solución a nuestro problema quedaría:

El valor 21 se ubica en el intervalo dos. Otra forma de colocar los intervalos es:

El valor 21 se ubica ahora en el intervalo número tres.


Continuando con el ejemplo anterior:

Paso 5: Determinar los intervalos de clases reales.

Paso 6: Determinar las frecuencias absolutas, frecuencias relativas y marcas de


clases.
Un valor representativo de los intervalos en las tablas de frecuencia son las
“Marcas de Clase”.
Marcas de Clase (Mc): Se define como el punto medio de un intervalo de clase.

2
Las marcas de clase son muy utilizadas en algunas gráficas estadísticas y en cálculos

Ni Lm Ls f F FR=h FRA=H Mc
1 15 18 3 3 0,1 0,1 16,6
2 18 21 16 19 0,53 0,63 19,6
3 21 24 7 26 0,23 0,87 22,6
4 24 27 2 28 0,07 0,93 25,6
5 27 30 1 29 0,03 0,97 28,6
6 30 33 1 30 0,03 1,00 31,6
total 30 1

Ejemplo 5:
Crear una tabla de frecuencia que resuma los siguientes datos:
Paso 1: Determinar el número de intervalos (Nc).
Aplicamos la primera fórmula para determinar el número de intervalos de clase.

Paso 2: Determinar el ancho de cada intervalo. Se determina el rango como primera


medida.

Con el Rango y el número de intervalos, podremos hallar el ancho:

El ancho se debe ajustar para trabajar con el mismo número de decimales que en el
conjunto de datos tratados.

Paso 3: Determinar el nuevo Rango (R’).


Como el ancho fue ajustado, se procede a hallar el nuevo rango (R’).

El incremento entre el nuevo rango (R’) y el rango inicial (R), se reparte entre el valor
mínimo y el valor máximo

Paso 4: Determinar los intervalos de clases iniciales.

Paso 5: Determinar los intervalos de clases reales.


Paso 6: Determinar las frecuencias absolutas, frecuencias relativas y marcas
de clases.

Ni Lm Ls f F FR=h FRA=H Mc
1 72,040 187,091 14 14 0,26 0,26 129,57
2 187,091 302,141 7 21 0,13 0,39 244,62
3 302,141 417,191 3 24 0,06 0,44 359,67
4 417,191 532,241 4 28 0,07 0,52 474,72
5 532,241 647,291 2 30 0,04 0,56 589,77
6 647,291 762,341 7 37 0,13 0,69 704,82
7 762,341 877,391 9 46 0,17 0,85 819,87
8 877,391 992,440 8 54 0,15 1,00 934,92
total 54 1

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

1.- Realice una tabla de frecuencia que resuma los siguientes datos:
1, 6, 8, 4, 5, 3, 4, 1, 1, 5, 3, 8, 7, 4, 6, 2, 8, 9, 3, 4, 10, 2.
a. ¿Cuál es el dato que más se repite?
b. ¿Cuál es el dato que menos se repite?
c. ¿Cuál es el Rango?
d. ¿Qué tipo de tabla sería la más conveniente para agrupar estos datos?

2. Crear una tabla de frecuencia que permita agrupar los siguientes datos
cualitativos
Rojo Verde Azul Verde
Negro Amarillo Azul Rojo
Rojo Verde Negro Azul
Blanco Negro Verde Rojo
Negro Rojo Blanco Azul
Rojo Verde Verde Negro

3. Un grupo de personas valora la gestión del departamento de servicio al cliente de


un supermercado catalogándolo como: Excelente (E), Bueno (B),
Regular (R) o Malo (M). Los resultados obtenidos son:
a) Elabore una tabla de frecuencia que permita resumir los datos
b) ¿Que porcentaje de personas valoró la Gestión del Departamento como
Buena?
c) ¿Cuantas personas valoraron la gestión como Excelente y Buena?
d) Interprete f3, F3, fr3 y frac33.

4. Agrupe los siguientes datos en una Tabla de Frecuencia

5. Agrupe los siguientes datos en una tabla de frecuencia

6. Los siguientes datos representan el diámetro interno en cm. de 30 tubos para


acueducto tomados como muestra dentro de un programa de calidad estatal.

a) Elabore una tabla de frecuencia que agrupe los datos. Justifique la elección del
Tipo de Tabla usada.
b) Interprete F2, F4 - F2, F4 - f3, f3 + f2.
c) Interprete h1 + h2, H3 - H2, H3 - h2
Donde h = frecuencia relativa
H = frecuencia relativa acumulada

7. Elabore una tabla de frecuencia que agrupe los siguientes datos.

8. A continuación se muestran los ingresos registrados en 50 familias seleccionadas


al azar de estrato 3 en una importante ciudad:
Construya una tabla de frecuencia que agrupe los datos en 10 intervalos de clase.

9. A partir de la siguiente tabla de frecuencias con datos parciales:

a) Calcule las frecuencias faltantes (f, h y H)


b) Modifique la tabla de frecuencia para que incluya los siguientes datos: 14, 22,26,
27y 28.
h = frecuencia relativa
H = frecuencia relativa acumulada

10. Debido a un grave accidente, el gerente de una compañía consultora perdió


información de un estudio de mercado que realizó a una importante compañía a
nivel nacional de gaseosas. Solo se conoce algunos datos parciales sobre una
entrevista que se elaboró a 150 personas.

Reconstruya la tabla de frecuencia.


¿Cuantas personas toman menos de 4 gaseosas por semana?
¿Cuantas personas toman al menos 3 gaseosas por semana?
CUESTIONARIO DE REPASO

Selección Múltiple con Única Respuesta: Marque con una X la respuesta correcta.

1. Las Tablas de Frecuencia Tipo A se caracterizan por:


A. Trabajan solo con datos cualitativos.
B. Agrupan datos cuyo Rango es bajo.
C. Agrupan datos cuyo Rango es alto.
D. Presentan más intervalos que en las Tablas Tipo B.

2. Las frecuencias relativas se diferencian de las frecuencias absolutas porque:


A. Las frecuencias relativas se establecen de acuerdo a una base.
B. Las frecuencias relativas se expresan como porcentaje.
C. La suma de las frecuencias relativas es igual a 1.
D. La A y B.

3. En una tabla de frecuencia, F4 - F2 es lo mismo que:


A. F4 - f3
B. F2 + f3
C. F3
D. f3 + f4

4. En una tabla de frecuencia, h3 + H2 es lo mismo que:


A. H3
B. H4
C. h3
D. h3 - h4
h = frecuencia relativa
H = frecuencia relativa acumulada

5. En el proceso de elaboración de las Tablas de frecuencia, suele determinarse un


nuevo Rango (R') para luego hacer los intervalos de clase. ¿Cuándo es necesario
hallar R'?
A. Cuando se desea agregar nuevos intervalos.
B. En el momento en que aproximamos el Ancho de los Intervalos.
C. Cuando se aumenta el tamaño de la muestra.
D. Ninguna de las anteriores.

2.4. GRÁFICOS ESTADÍSTICOS

La ventaja de los gráficos con respecto a las tablas de frecuencia, es que permite
una fácil interpretación y análisis de los datos, al mostrar las frecuencias mediante
símbolos, barras, polígonos y sectores.
CAPITULO
Gráficos Estadísticos: Son representaciones visuales que emplean símbolos,
barras, polígonos y sectores, de los datos contenidos en tablas de frecuencias.
Trataremos siete tipos de gráficos estadísticos:
• Gráfico de sectores
• Gráficos de columnas
• Histograma
• Polígonos de frecuencias
• Curvas suavizadas o curvas de frecuencias
• Ojivas
• Pictogramas
GRÁFICOS DE SECTORES

Este tipo de diagramas consideran una figura geométrica en que la distribución de


frecuencias se reparte dentro de la figura como puede ser una dona, pastel, círculo
o anillo, en el que cada porción dentro de la figura representa la información
porcentual del total de datos.

Ejemplo6: de gráficos de sectores


Realizar un diagrama de sectores a partir de la siguiente tabla de frecuencia que
resume las preferencias de un grupo de encuestados hacia cinco candidatos a
elecciones locales:

SOLUCIÓN
Para crear un gráfico de sectores, hay que tener en cuenta los siguientes pasos:
PASO 1: Determinar las frecuencias relativas para cada clase.

PASO 2: Determinar los ángulos que representan las porciones dentro de la figura
para cada clase.
Un círculo esta formado por un ángulo de 360º. La porción correspondiente al
Candidato 1 equivale a un 17,86% de esos 360º, es decir, 64,296º.

Gráficamente tendríamos (se parte desde el eje vertical superior, y se comienza a


graficar cada clase en sentido de las manecillas del reloj):

La tabla final con los ángulos repartidos para cada clase quedaría:
El gráfico definitivo se muestra a continuación (nótese que cada sector se identifica
con un color diferente):

Características de los gráficos de sectores


- No muestran frecuencias acumuladas.
- Se prefiere para el tratamiento de datos cualitativos o cuasicualitativos.
- La mayor área (o porción de la figura) representa la mayor frecuencia.
- Son muy fáciles de elaborar.
- Suelen utilizarse para representar tablas tipo A.
- La figura completa equivale al 100% de los datos (360º).

GRÁFICOS DE COLUMNAS

Los gráficos de barras representan las frecuencias mediante columnas (o barras), a


través de la altura de las mismas en un plano cartesiano.

Ejemplo 7: de gráficos de columnas

Realizar un gráfico de barras a partir de la siguiente tabla de frecuencia:

SOLUCIÓN
Para crear un gráfico de barras, seguiremos 2 sencillos pasos:
PASO 1: Representar las escalas en los ejes horizontal y vertical del primer cuadrante
de un plano de cartesiano. En el eje vertical colocaremos las frecuencias y en el eje
horizontal las clases.
Para establecer la escala en eje vertical, nos guiaremos por la frecuencia máxima,
siendo ese el punto más elevado. Puede trabajarse también con frecuencias relativas.
El plano resultante quedaría:

PASO 2: A cada clase se representa con una columna (o barra) cuya altura
concuerda con su frecuencia expuesta en el eje vertical. Para la clase A con
frecuencia 5, tenemos:
El gráfico final se muestra a continuación:

f
Puede observar que las columnas se encuentran separadas una de otras.

También podríamos realizar el gráfico de forma horizontal (conocido como gráfico


de barras):
Características de los gráficos de columnas
- No muestran frecuencias acumuladas.
- Se prefiere para el tratamiento de datos cualitativos o cuasicualitativos.
- La columna (o barra) con mayor altura representa la mayor frecuencia.
- Son fáciles de elaborar.
- Suelen utilizarse para representar tablas tipo A.
- La sumatoria de las alturas de las columnas equivalen al 100% de los datos.

HISTOGRAMA
Se puede considerar como un gráfico de columnas especial. Se realiza sobre el
primer cuadrante del plano cartesiano. La diferencia radica en que el histograma se
utiliza más a menudo para representar tablas de frecuencia, donde el ancho de la
columna equivale al ancho del intervalo de clase.
Las frecuencias absolutas se colocan en el eje vertical y también puede emplearse
las frecuencias relativas. Otra diferencia importante es que no existe espacio entre
las barras.

Ejemplo 8: de histogramas
Realizar un histograma a partir de la siguiente tabla de frecuencia:

SOLUCIÓN
Al igual que en gráfico de sectores y el gráfico de columnas, seguiremos 2 pasos
para la construcción del histograma.
PASO 1: Representar las escalas en los ejes horizontal y vertical del primer
cuadrante de un plano de cartesiano. En el eje vertical colocaremos las frecuencias
y en el eje horizontal las marcas de clases.
Para diferenciar este paso del anterior, trabajaremos con un ancho de columna
único, y dejaremos la mitad de ese espacio entre el vertical y la primera columna, y
el final del eje horizontal y la última columna.

PASO 2: A cada clase se representa con una columna cuya altura concuerda con su
frecuencia expuesta en el eje vertical. Podemos decir que la marca de clase 4.1 es
representada por una frecuencia 12:
Las barras estarán pegadas una junto a la otra, es decir, ocupando el total del ancho
de cada intervalo de clase dispuesto en el gráfico.

El gráfico final quedaría así


Características de los histogramas

- No muestran frecuencias acumuladas.


- Se prefiere para el tratamiento de datos cuantitativos.
- La columna (o barra) con mayor altura representa la mayor frecuencia.
- Suelen utilizarse para representar tablas tipo B.
- La sumatoria de las alturas de las columnas equivalen al 100% de los datos.

POLÍGONOS DE FRECUENCIAS

Este gráfico se utiliza para el caso de variables cuantitativas, tanto discretas como
continuas, partiendo del diagrama de columnas, barras o histograma, según el tipo
de tabla de frecuencia manejada.

Ejemplo 9: de polígonos de frecuencias


Realizar un polígono de frecuencia a partir de la tabla de frecuencia dada en el
ejemplo anterior:

SOLUCIÓN
PASO 1: Crear un histograma, o gráfico de columnas

PASO 2: Trazar líneas rectas entre los puntos medios de los techos de columnas
contiguas, partiendo desde el punto de origen (0,0) hasta el punto final definido en el
eje horizontal.

24
Nuestro polígono de frecuencias sin el histograma quedaría de la siguiente forma:

Características de los polígonos de frecuencias


- No muestran frecuencias acumuladas.
- Se prefiere para el tratamiento de datos cuantitativos.
- El punto con mayor altura representa la mayor frecuencia.
- Suelen utilizarse para representar tablas tipo B.
- El área bajo la curva representa el 100% de los datos. El polígono de frecuencia
esta diseñado para mantener la misma área de las columnas.

Analicemos una porción de nuestro gráfico para probar esta afirmación:

Observe que cada línea corta una porción de la columna, pero a su vez, agrega una
porción adicional. Ambas porciones son iguales (triangulo rectángulos iguales),
manteniendo el área global en el gráfico.

OJIVAS
En este gráfico se emplea un polígono de frecuencia o curva suavizada con una
característica muy particular: muestra las frecuencias absolutas o relativas
acumuladas.
Ejemplo 10 de ojivas
Los ingresos de 50 trabajadores de una empresa se resumen en la siguiente tabla
de frecuencia:

SOLUCIÓN
PASO 1: En un plano cartesiano (primer cuadrante), procedemos a establecer
la escala de ambos ejes:
• En el eje vertical se colocaran las frecuencias, partiendo desde 0 hasta la última
frecuencia acumulada (absoluta o relativa).
• En el eje horizontal se ubicaran los límites superiores, partiendo desde el primer
límite menor.

50.0
PASO 2: A cada límite superior le corresponde su frecuencia acumulada. El punto
inicial será 0 (no existen datos por debajo de 100). Por ejemplo:
• Hasta un valor cercano a 150.000 existen acumulado 3 datos.
• Hasta un valor cercano a 200.000 existen acumulado 5 datos.
Gráficamente tenemos:

Podremos cambiar la escala del eje vertical para que trabaje con las frecuencias
relativas acumuladas sin afectar el gráfico:
Características de las ojivas
- Muestran frecuencias acumuladas.
- Se prefiere para el tratamiento de datos cuantitativos.
- El punto de inicio equivale a una frecuencia de 0.
- Suelen utilizarse para representar tablas tipo B.
- El punto final equivale al 100% de los datos.

Interpretando la información en las ojivas


Dada su ventaja de representar frecuencias acumuladas, las ojivas se convierten en
una herramienta vital para el análisis estadístico.
Partiendo de la información del ejemplo, se desea conocer que porcentaje de los
trabajadores ganan más $225.000.
Para conocer esta información, debemos ubicar primero el valor de $225.000 en el
gráfico y luego, proyectar este punto en el eje vertical:

La proporción de empleados equivale a aproximadamente a un 80%. El


inconveniente de este método es que los cálculos se harán gráficamente (valores
aproximados) y no de forma aritmética (valores exactos).

PICTOGRAMAS
Los pictogramas utilizan símbolos para representar un conjunto de datos. La mayor
frecuencia se identifica por la mayor acumulación de símbolos.
Los pictogramas se emplean sobre todo, para hacer más amigables e entendibles
los informes estadísticos.

Ejemplo 11: de pictogramas


La demanda anual de un tipo particular de vehículos en algunos países de
Suramérica se muestra a continuación:
Realizar un pictograma para la tabla anterior.

SOLUCIÓN
El símbolo que emplearemos tendrá forma de vehículo, asiendo referencia al tema
del informe. Cada símbolo tendrá una equivalencia de 20.000
unidadesdemandadas.

En un eje cartesiano colocamos los países en el eje vertical y las demandas en el


horizontal.

En el caso de Chile, la demanda equivale a 7 y ½ vehículos (140.000 + 10.000


unidades). Este tipo de pictogramas tiene forma a un gráfico de barras.

Características de los pictogramas


- Su formato es libre.
- Emplean una secuencia de símbolos para representar frecuencias.
- Se emplean para el tratamiento de datos tanto cualitativos como cuantitativos.

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

11. Realice un gráfico de sectores a la tabla de frecuencia que aparece en el


ejercicio 2.
12 Realice un gráfico de columnas a la tabla de frecuencia que aparece en el
ejercicio 3.
13. Realice un histograma a la tabla de frecuencia que aparece en el ejercicio 5.
14. Una muestra de 100 estudiantes del programa de ingeniería de una universidad,
mostraron sus preferencias respecto a la creación de un nuevo laboratorio en una
encuesta para el diario estudiantil:
Muestre los datos gráficamente empleando:
a. Un gráfico de columna
b. Un gráfico de barras
c. Un gráfico de sectores
15 A partir de los siguientes datos, cree la correspondiente tabla de frecuencia y
grafique:

a. Un histograma
b. Un polígono de frecuencia
c. Una OJIVA

16 A partir del gráfico de ojiva, responda las siguientes preguntas (Tamaño de


la muestra es 500):

a. ¿Que cantidad de datos hay acumulado hasta 260.5?


b. ¿Sirve este tipo de gráfico para mostrar la frecuencia absoluta (f)?
c. Diseñe la tabla de frecuencia respectiva

17 Cree una tabla de frecuencia que contenga 7 intervalos de clase, para los
siguientes datos:
Construya el histograma respectivo.

18 El cuadro que figura más abajo da los caudales mensuales del río Magdalena
observados durante los meses del abril y mayo, desde 1988 a 2005 (la unidad de
medida no se precisa).

Se desea ordenar estos datos y efectuar el análisis siguiente:


a. Dar una representación global de los caudales de abril y mayo. Graficar
mediante dos histogramas los datos resumidos.
b. ¿Qué comportamiento puede observar en las frecuencias en ambos meses?

19 Determine los ángulos de las porciones y complete la tabla de frecuencia a partir


del siguiente gráfico de sectores, si el total de datos es de 99:
20 Complete la tabla de frecuencia a partir del siguiente histograma, si el total
de datos es de 200:

CUESTIONARIO DE REPASO

Selección Múltiple con Única Respuesta: Marque con una X la respuesta correcta.
Para las preguntas 1 y 2: A partir del siguiente gráfico de Ojiva.

INGRESOS
Frecuencia Relativa
1. Se puede concluir:
a. El 60% de la población gana más de $400.000
b. El 50% equivale a un ingreso de $200.000
c. El 80% de la población gana más de $100.000
d. Todas las anteriores

2. Se puede concluir:
a. El 50% de la población gana más de $300.000
b. El 30% de la población gana menos de $200.000
c. El sueldo máximo registrado fue de $600.000
d. Todas las anteriores
3. Los gráficos de sectores son usados para:
a. Mostrar frecuencias acumuladas
b. Mostrar las marcas de clase de una tabla de frecuencia tipo B
c. Mostrar solo las frecuencias absolutas
d. Mostrar frecuencias no acumuladas

4. Cual de las tablas de frecuencia corresponde al siguiente histograma:

d. Ninguna de las anteriores


CAPITULO III. MEDIDAS ESTADÍSTICAS PARA DATOS NO
AGRUPADOS Y AGRUPADOS.

OBJETIVOS ESPECÍFICOS:

 Mostrar en qué lugar se ubica un dato promedio o típico del grupo de datos.
 Comparar o interpretar cualquier posición en relación con las posiciones centrales
o típicas.
 Comparar la posición obtenida por un mismo parámetro en dos diferentes
ocasiones.
 Sirve como un método para comparar los resultados medios obtenidos por dos o
más grupos.
 Las medidas de dispersión son parámetros estadísticos que nos informan sobre
la variabilidad de los datos, es decir, si la distribución de los datos es más o menos
homogénea y por tanto nos dan una medida sobre la representatividad de los
parámetros de centralización (moda, mediana o media)

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

3.1 Medidas de tendencia central.


3.1.1 Media aritmética.
3.1.2 Mediana.
3.1.3 Moda.
3.1.4 Media Geométrica

3.2Medidas de localización.
3.2.1Deciles, Cuartiles y Percentiles.

3.3 Medidas de dispersión.


3.3.1 Rango y Rango Intercuartil
3.3.2 Varianza.
3.3.3 Desviación típica o estándar.
3.3.4 Coeficiente de variación.

3.4 Asimetría y Curtosis.

3.1. MEDIDAS DE TENDENCIA CENTRAL

La estadística descriptiva en su función básica de reducir datos, propone una serie


de indicadores que permiten tener una percepción rápida de lo que ocurre en un
fenómeno.
La primera gama de indicadores corresponde a las “Medidas de Tendencia Central”.
Existen varios procedimientos para expresar matemáticamente las medidas de
tendencia central, de los cuales, los más conocidos son: la media aritmética, la moda
y la mediana.
CAPITULO
Medidas de tendencia central: Son indicadores estadísticos que muestran hacia
qué valor (o valores) se agrupan los datos.
Se analizará las tres medidas de tendencia central:
• La media aritmética
• La moda
• La mediana

3.1.1. La media aritmética

Equivale al cálculo del promedio simple de un conjunto de datos. Para diferenciar


datos muestrales de datos poblacionales, la media aritmética se representa con un
símbolo para cada uno de ellos: si trabajamos con la población, este indicador será
µ; en el caso de que estemos trabajando con una muestra, el símbolo será X.
Media aritmética (µ o X): Es el valor resultante que se obtiene al dividir la
sumatoria de un conjunto de datos sobre el número total de datos. Solo es aplicable
para el tratamiento de datos cuantitativos.
Hay que entender que existen dos formas distintas de trabajar con los datos tanto
poblacionales como muestrales: sin agruparlos o agrupándolos en tablas de
frecuencias. Esta apreciación nos sugiere dos formas de representar la media
aritmética.

3.1.1.1. Media aritmética para datos no agrupados


Podemos diferenciar la fórmula del promedio simple para datos poblaciones y

Observe que la variación de ambas fórmulas radica en el tamaño de los datos (N


identifica el tamaño de la población, mientras que n el de la muestra).

Ejemplo12: la media aritmética para datos no agrupados

El profesor de la materia de estadística desea conocer el promedio de las notas


finales de los 10 alumnos de la clase. Las notas de los alumnos son:

¿Cuál es el promedio de notas de los alumnos de la clase?

SOLUCIÓN
Aplicando la fórmula para datos no agrupados tenemos:

Cabe anotar que en el ejemplo estamos hablando de una población correspondiente


a todos los alumnos de la clase (10 alumnos en total). El promedio de las notas es
de 3,47.
Modifiquemos la primera nota por 0,0 y calculemos nuevamente la media aritmética.
En este caso la media pasa de 3,47 a 3,15. Esta variación notoria se debió a que la
media aritmética es sensible a los valores extremos cuando tratamos con pocos
datos. El 0,0 es una nota atípica comparada con las demás, que están
ubicadasentre 3,0 y 4,2.

3.1.1.2. Media aritmética para datos agrupados


Cuando los datos se agrupan en tablas de frecuencia donde no se tiene intervalos,
la media aritmética es igual a la división de la sumatoria del producto de las clases
por la frecuencia sobre el número de datos.

La sumatoria parte desde el primer intervalo de clase (i = 1) hasta el último (Nc),


siendo Xi la clase del intervalo i.
Cuando los datos se agrupan en tablas de frecuencias, el cálculo de la media varía
un poco, ya que existe una pérdida de información en el momento en que se trabaja
con intervalos de frecuencia y no con los datos directamente (los datos se agrupan
por intervalo, desconociendo el valor exacto de cada uno de ellos).

Las marcas de clases (Mc) cumple la función de representar los intervalos de clase.

Ejemplo1: media aritmética para datos agrupados sin intervalos de clase


La siguiente tabla de frecuencia muestra el número de preguntas de 81 encuestados
sobre un Test que consta de solo seis preguntas.

SOLUCIÓN

PASO 1: Realizar la sumatoria del producto resultante de las clases por su


frecuencia absoluta. Para efectos del cálculo de la media, deberíamos sumar 15
veces el valor 1, 13 veces el valor 2, 8 veces el valor 3, hasta llegar a la últimaclase:

PASO 2: Dividir la sumatoria sobre el número total de datos.


En promedio los encuestados contestaron aproximadamente 3 (el valor exacto es
3,41) preguntas buenas.

Ejemplo 2 : media aritmética para datos agrupados en tablas con intervalos de


clase

Calcular la media para los datos distribuidos en la siguiente tabla de frecuencia:

SOLUCIÓN
Las marcas de clase representan a los intervalos de clase, por ejemplo, suponemos
que la marca de clase para el primer intervalo (44,1) se repite 3 veces, al
desconocer los 3 valores exactos que están dentro de dicho intervalo.

PASO 1: Realizar la sumatoria del producto resultante entre las marcas de clase por
su frecuencia absoluta.

PASO 2: Dividir la sumatoria sobre el número total de datos.

Ejemplo 3: comparativa entre el cálculo de la media aritmética para datos no


agrupados y datos agrupados en intervalos de clase

Calcular la media aritmética a los siguientes datos sin agrupar y agrupándolos en


una tabla de frecuencia tipo B (suponga que los datos son poblacionales):
SOLUCIÓN
Calculemos la media para los datos sin agrupar:

Luego construyamos la tabla de frecuencia y calculemos su media aritmética con el


fin de comparar ambos resultados:

PASO 1: Realizar la sumatoria del producto resultante entre las marcas de


clase por su frecuencia absoluta.

PASO 2: Dividir la sumatoria sobre el número total de datos.

Podemos ver claramente una diferencia entre ambas medias: 27,74 para los datos
no agrupados y 28,29 para los datos agrupados. Esta diferencia radica que en la
tabla de frecuencia existe una perdida de información, al agrupar los datos en los
intervalos de clase. El valor de la media exacta es el calculado para los datos no
agrupados, pero dada la proximidad de la media para los datos agrupados, se toma
esta última como cierta.

Ventajas

• Es la medida de tendencia central más usada.


• El promedio es estable en el muestreo.
• Es sensible a cualquier cambio en los datos (puede ser usado como un detector de
variaciones en los datos).
• Se emplea a menudo en cálculos estadísticos posteriores.
• Presenta rigor matemático.
• En la gráfica de frecuencia representa el centro de gravedad.

Desventajas

• Es sensible a los valores extremos.


• No es recomendable emplearla en distribuciones muy asimétricas.
• Si se emplean variables discretas o cuasi-cualitativas, la media aritmética puede
no pertenecer al conjunto de valores de la variable.

3.1.2. La mediana

Mediana (Me): Valor que divide una serie de datos en dos partes iguales. La
cantidad de datos que queda por debajo y por arriba de la mediana son iguales.
La definición de geométrica se refiere al punto que divide en dos partes a un
segmento. Por ejemplo, la mediana del segmento AB es el punto C.

Existen entonces dos segmentos iguales:

Ejemplo 4: mediana para datos no agrupados (cantidad de datos impar)


Encontrar la mediana para los siguientes datos:

SOLUCIÓN
PASO 1: Ordenar los datos.

PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.

La mediana es 3, dejando 5 datos a cada lado.


Me = 3

Ejemplo17: mediana para datos no agrupados (cantidad de datos par)


Modifiquemos el ejemplo anterior, eliminando el último dato. Encontrar la mediana:

SOLUCIÓN
PASO 1: Ordenar los datos.

PASO 2: Localizar el valor que divide en dos parte iguales el número de datos.
El punto medio se encuentra entre dos valores: 2 y 3, por tanto, el valor de la
mediana será 2,5.
Me = 2.5

Ejemplo 5 : mediana para datos agrupados en tablas sin intervalos de clase

Calcular la mediana a partir de la siguiente tabla de frecuencia:

SOLUCIÓN
PASO 1: Localizar entre que clases se encuentra la mediana. Observe que la
mediana se encuentra entre las clases 3 y 4, donde podremos encontrar una
frecuencia relativa acumulada del 50%.

PASO 2: Interpolar los datos para encontrar la mediana.


En el paso anterior habíamos dicho que el punto que divide el 2 parte iguales se
encuentra entre 30 y 40.

La diferencia entre las frecuencias relativas nos indica que existe entre las clases
27,1% de los datos. Para llegar al 50% de los datos, debemos incrementar en 4,2%
datos partiendo desde la clase 30.

Con una regla de tres sencilla hallaremos el incremento en unidades dada en la


clase para ese 4,2%.
Para llegar al 50% de los datos, a la clase 30 debemos incrementarle 1,55.
Me = 55.31

Ejemplo 6: mediana para datos agrupados con intervalos de clase

Determinar la mediana de la siguiente tabla de frecuencia:

SOLUCIÓN

PASO 1: Localizar entre que intervalos de clase se encuentra la mediana.


Podemos observar que el punto que divide el 50% de los datos esta entre el
intervalo de clase 3 y 5, para ser más preciso, entre los valores 45,21 y 53,21(hasta
45,21 hay agrupados el 42,50% de los datos, y hasta 53,21 se resume el 60,00% de
los datos).

PASO 2: Interpolar los datos para encontrar la mediana. En resumen tenemos que:

Entre los dos límites superiores abarcan un total de 17,50% de los datos. Se debe
aumentar en 7,50% los datos desde límite superior del tercer intervalo de clase.

Para llegar al 50% de los datos, 45,21 se aumenta en 3,43 unidades.


La fórmula para calcular la mediana

De este último ejemplo podemos determinar la fórmula para calcular la mediana.


Observe que la mediana parte del límite superior del intervalo de clase anterior, la
cual simbolizaremos por Lsi-1, siendo i igual a 4 (cuarto intervalo de clase). A este
valor se le suma el incremento para llegar al 50% de los datos:

El incremento resulta de multiplicar el incremento para llevar la frecuencia al 50%


(50% - Hi-1) por el ancho de la clase (A) sobre la diferencia porcentual entre los
límites superiores (Hi – Hi-1):

Simplificando aún más la fórmula, recordemos que Hi – Hi-1 es lo mismo la


frecuencia relativa del intervalo de clase i (hi).

Para expresar la fórmula en frecuencias absolutas tenemos que:

i
Ventajas
• Es estable a los valores extremos.
• Es recomendable para distribuciones muy asimétricas.

Desventajas
• No presenta todo el rigor matemático.
• Se emplea solo en variables cuantitativas.

3.1.3 La moda

Moda (Mo): indica el valor que más se repite, o la clase que posee mayor
frecuencia.
En el caso de que dos valores presenten la misma frecuencia, decimos que existe
un conjunto de datos bimodal. Para más de dos modas hablaremos de un conjunto
de datos multimodal.

Ejemplo 7: moda para datos no agrupados

Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la


marca de gaseosa que más consume a la semana:
SOLUCIÓN
PASO 1: Determinar las frecuencias de cada valor de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces

PASO 2: la moda representa el valor que más se repite. En este caso es la marca 1.
Mo = Marca 1

Ejemplo: moda para datos agrupados


Calcular la moda a partir de la siguiente tabla de frecuencia:

SOLUCIÓN
Las marcas de clase que más frecuencias tienen son 11 y 13, por tanto decimos que
es un caso donde aparecen dos modas (bimodal).

Calculo de la moda mediante fórmula

Algunos autores suelen aplicar una fórmula para determinar la moda para tablas de
frecuencia.

Donde LS-1 equivale al límite superior del intervalo anterior donde se encuentra la
moda.

Ventajas
• Es estable a los valores extremos.
• Es recomendable para el tratamiento de variables cualitativas.

Desventajas
• Pueda que no se presente.
• Puede existir más de una moda.
• En distribuciones muy asimétricas suele ser un dato muy poco representativo.
• Carece de rigor matemático.
3.1.4. Media geométrica

Existen otras definiciones de media que pueden tener su utilidad en algunos casos.
La primera de estas es la media geométrica XG

En el caso de distribución de frecuencia sin intervalos, se define como la raíz


enésima (N es el tamaño de la muestra) del producto de los valores de la variable

Para distribución de frecuencia con intervalos

= …

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

1. Calcular la media, mediana y moda para los siguientes datos:

2. Determinar la media, mediana y moda a la siguiente tabla de frecuencia:

3. Para que un producto sea aceptado por su cliente principal, debe cumplir con
ciertas especificaciones de calidad. Una de ellas, radica en que el promedio de
longitud de los 20 primeros productos este entre 20,0 y 20,9 centímetros. Si las
medidas son:

¿Cumple en el proveedor con las especificaciones del cliente?

4. Calcular la media, mediana y moda para los siguientes datos (agrúpelos en una
tabla de frecuencia):
CUESTIONARIO DE REPASO

Para las preguntas 1 a 4: Se muestran los histogramas como resultado de


mediciones realizadas a 10 ciudades de un país. El primer histograma muestra las
poblaciones de las ciudades (unidades dadas en millones), indicando que solo una
ciudad alcanza los 3’000.000 de habitantes. El histograma siguiente muestra el
porcentaje de analfabetismo de las ciudades objeto del estudio.

2. Que significado tiene la moda para el estudio del analfabetismo


a. Cuatro de las ciudades no presentan analfabetismo
b. La mayoría de las ciudades no presentan analfabetismo
c. Seis ciudades presentan problemas de analfabetismo
d. Ninguna de las anteriores

3. El porcentaje promedio de analfabetismo que arroja el estudio es de:


a. 0,4%
b. 1,0%
c. 1,4%
d. 2,0%
4. El estudio arrojado al número de habitante por ciudad indica que:
a. El promedio de habitantes por ciudad es de 0,5 millones.
b. El promedio de habitantes por ciudad es de 1,0 millón.
c. El promedio de habitantes por ciudad es de 1,45 millones.
d. El promedio de habitantes por ciudad es de 2,0 millones.
3.2. MEDIDAS DE LOCALIZACION

Cuartiles

Medida de localización que divide la población o muestra en cuatro partes iguales.

 Q1= Valor de la variable que deja a la izquierda el 25% de la distribución.


 Q2= Valor de la variable que deja a la izquierda el 50% de la distribución =
mediana.
 Q3= Valor de la variable que deja a la izquierda el 75% de la distribución.

Al igual que ocurre con el cálculo de la mediana, el cálculo de estos estadísticos,


depende del tipo de variable.

Caso I: Variable cuantitativa discreta:


En este caso tendremos que observar el tamaño de la muestra: N y para
calcular Q1 o Q3 procederemos como si tuviésemos que calcular la mediana
de la correspondiente mitad de la muestra.
Caso II: Variable cuantitativa continua:
En este caso el cálculo es más simple:, sea la distribución que sigue:
[Li-2 -- Li-1) ni-1 Ni-1
[Li-1 -- Li) ni Ni
Siendo el intervalo coloreado donde se encuentra
el Cuartil correspondiente:

Deciles

Medida de localización que divide la población o muestra en 10 partes iguales

No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que
lo vamos a ver sólo para las variables continuas.

dk = Decil k-simo es aquel valor de la variable que deja a su izquierda el k·10 % de la


distribución.

[Li-2 -- Li-1) ni-1 Ni-1


[Li-1 -- Li) ni Ni
Intervalo donde se encuentra el Decil
correspondiente:

k = 1 .. 9

Percentiles:
Medida de localización que divide la población o muestra en 100 partes iguales

No tiene mucho sentido calcularlas para variables cualitativas discretas. Por lo que
lo vamos a ver sólo para las variables continuas.

Pk = Percentil k-esimo es aquel valor de la variable que deja a su izquierda el k % de


la distribución.

[Li-2 -- Li-1) ni-1 Ni-1


[Li-1 -- Li) ni Ni
Intervalo donde se encuentra el percentil
correspondiente:

k=1 .. 99

Ejemplo 8:

Como se puede observar la forma de calcular estas medidas es muy similar a la del
cálculo de la mediana.

Veamos el cálculo de algunas de estas medidas en el ejemplo que estamos


estudiando.

Vamos a calcular Q1,Q3, d3, y p45

Li-1 Li ni Ni
45 55 6 6
55 65 10 16
65 75 19 35
75 85 11 46
85 95 4 50

Cálculo de Q1: Buscamos en la columna de las frecuencias Acumuladas el valor que


supere al 25% de N=50, corresponde al 2º intervalo.(50/4=12.5)

Análogamente calculemos Q3, Buscamos ahora en la misma columna el


correspondiente al 75 %de N que en este caso es el 4º intervalo (3.50/4=37.5)

Veamos ahora el decil 3º. (Corresponde al 30 % 3 · 50 / 10 = 15) sería el 2º


intervalo.
Por último veamos el percentil 45 (45·50/100 = 22.5) Corresponde al intervalo 3º.

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

1. Determinación del primer cuartil, el segundo quintil, el séptimo decil y el 30


percentil, de la siguiente tabla:

3.3. MEDIDAS DE DISPERSIÓN

No solo basta con determinar las medidas de tendencia central para comprender el
comportamiento de una serie de datos, es importante además, conocer que tan
alejados están esos datos respecto a ese punto de concentración.
Las medidas de dispersión nos indican la distancia promedio de los datos respecto a
las medidas de tendencia central. Así podremos diferenciar dos conjuntos de datos
que poseen iguales medias, siendo los datos de uno más dispersos del otro.
CAPITULO
Medidas de dispersión: Son indicadores estadísticos que muestran la distancia
promedio que existe entre los datos y la media aritmética.
En el estudio de las medidas de dispersión daremos un vistazo a cuatro indicadores
básicos:
_ Desviación media
_ Varianza
_ Desviación estándar
_ Coeficiente de variación
El cálculo de cada uno de ellos se toma basado en la media aritmética.

3.3.1 Desviación media


Para conocer con un solo indicador que tan disperso se encuentran un conjunto de
datos a un punto de concentración, debemos como primera medida, calcular la
distancia de cada dato respecto a una medida de tendencia central. Por ejemplo:

Tenemos que la media aritmética es de aproximadamente 3,0667 (indicador de


tendencia central por excelencia). El primer dato (4), se aleja de la media en 0,9333
hacia la derecha. Gráficamente tendríamos:

Para el segundo dato (5) la distancia es de 1,9333 respecto a la media aritmética:

Note que el tercer dato (3) posee una distancia de 0,0667 hacia la izquierda de la
media. Para indicar las distancias de estos puntos, agregaremos el signo negativo,
por tanto, la distancia del tercer dato sería –0,0667. La representación gráfica de
todos los puntos quedaría:
El total de las distancias de los puntos que están a la izquierda respecto a la media
es de -8,6 (empleando todos los decimales), que es igual a la sumatoria de las
distancias de los puntos que están a la derecha respecto a la media 8,6.
Concluimos que la sumatoria de todas las distancias de cada punto respecto a la
media aritmética es igual a cero (las distancias se anulan):

Para responder a la pregunta de ¿qué tan disperso están los datos respecto a la
media aritmética?, recurriremos nuevamente al promedio simple. Para llegar a una
fórmula básica de dispersión, en que las distancias positivas y negativas no se
eliminen, modificaremos la fórmula anterior para trabajar solo con distancias
positivas mediante el valor absoluto:

La distancia promedio sería de aproximadamente 1,15 (resultado de la división


entre la distancia total absoluta y el total de datos). A esta distancia promedio se
le conoce con el nombre de desviación media y significa que en promedio, los
datos se separan de la media en 1,15.
Desviación media (Dm): Equivale a la división de la sumatoria del valor absoluto de
las distancias existentes entre cada dato y su media aritmética y el número total de
datos.

n
Se debe hacer la distinción que para datos poblacionales (no agrupados), la
fórmula quedaría:

La variación para los datos agrupados en tablas de intervalos de clase radica en


cambiar el valor
de Xi por la marca de clase correspondiente, multiplicando esa distancia por su
frecuencia:

Para las tablas sin intervalo de clase solo cambiaremos la marca de clase por su
respectivo valor
de clase (representada por Xi):
Ejemplo21: Desviación media para datos no agrupados
Tres alumnos son sometidos a una competencia para probar sus conocimientos
en 10 materias diferentes, cada una sustentada con 10 preguntas. La idea del
concurso es encontrar al alumno más idóneo para representar al colegio en un
torneo a nivel nacional.
El número de preguntas buenas por materia se muestra a continuación:

SOLUCIÓN
Lo primero que analizaremos es la media de los puntajes para cada uno de los
alumnos, con el fin de determinar el alumno con mayor promedio de preguntas
buenas.

Las medias para los resultados de los alumnos coinciden: los tres alumnos tienen
responden en promedio 5 preguntas correctas por prueba. ¿Cuál sería entonces el
indicador diferenciador entre los alumnos?.
Complementemos el análisis anterior calculando la desviación media:
Carlos muestra una desviación media de 3,9 indicando que los datos se alejan en
promedio de la media en 3,9 preguntas buenas. Pedro disminuye su variación (2,9),
siendo Juan el que menos variación presenta con 0,9 preguntas tanto por arriba
como por debajo de la media aritmética. Se recomienda al colegio elegir como
ganador en este caso a Juan, presenta resultados más constantes que los otros dos
alumnos, Juan en promedio acierta 5 preguntas buenas con una
variación muy baja (rondando entre 4 y 6).

Ejemplo22: Desviación media para datos agrupados

Una maquina dispensadora de gaseosas esta programada para llenar un envase


con 350 c.c. de un refresco popular. A partir de una muestra de prueba realizada
sobre 30 envases se realizó la siguiente tabla de frecuencia:

Calcular e interpretar la desviación media.

SOLUCIÓN
PASO 1: Calcular la media aritmética.

PASO 2: Calcular la desviación media.

La desviación media es de aproximadamente 8,8 c.c. Concluimos que con datos


suministrados de una muestra, el dispensador llenó los 30 envases con un promedio
de 157,095 c.c. con una desviación media de 8,8 c.c.
La desviación media describe un rango de dispersión promedio de llenado del
dispensador, ubicándolo entre 148,295 c.c. (equivale a restar la media a la desviación
media) y 165,895 c.c. (sumar una desviación media a la media aritmética).

3.3.2 La varianza

Otra forma para asegurar que las diferencias entre la media y los puntos de un valor
positivo, es elevándola al cuadrado. Al promedio de estas distancias al cuadrado se
le conoce como varianza.
Distinguimos dos símbolos para identificar la varianza: S 2 para datos muestrales, y
s2 para datos poblacionales. Note que la fórmula para la varianza muestral presenta
en su denominador al tamaño de la muestra menos uno, tendencia adoptada por los
estadísticos para denotar una varianza más conservadora.
Al igual que ocurre con la desviación media, podemos definir las fórmulas para
datos agrupados en tablas con y sin intervalos de clase. Para las tablas sin
intervalos de clase tenemos:

Para las tablas con intervalo de clase, la clase cambia por la marca de clase del
intervalo:

Una advertencia en el uso de esta medida, es que al elevar las distancias al cuadrado,
automáticamente se elevan las unidades. Por ejemplo, si unidad trabajada en los
datos es centímetros, la varianza da como resultados centímetros al cuadrado.

Ejemplo23: Varianza para datos no agrupados


La siguiente muestra representa las edades de 25 personan sometidas a un
análisis de preferencias para un estudio de mercado.

Determinar la varianza.

SOLUCIÓN
PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza


En este punto, la varianza es identificada por S 2.
La varianza equivale a 51,8567. Por elevar las unidades al cuadrado, carece de
un significado contextual dentro del análisis descriptivo del caso.

Ejemplo24: Varianza para datos agrupados


Calcular la varianza a partir de la siguiente tabla de frecuencia (suponga que los
datos son poblacionales).

SOLUCIÓN
PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza


En este punto, la varianza es identificada por s 2.

3.3.3 Desviación estándar

Habíamos visto que la varianza transforma todas las distancias a valores positivos
elevándolas al cuadrado, con el inconveniente de elevar consigo las unidades delos
datos originales.
La desviación estándar soluciona el problema obteniendo la raíz cuadrada de la
varianza, consiguiendo así, un valor similar a la desviación media.

La S representa la desviación estándar de una muestra, mientras que s la desviación


para todos los datos de una población. Ampliando las fórmulas tenemos:
Aplicamos el mismo procedimiento a las fórmulas para las tablas de frecuencias sin
intervalo de clase:

Y para las tablas de frecuencias con intervalo de clase:

Ejemplo25: Desviación estándar para datos no agrupados


Calcular la desviación estándar al siguiente conjunto de datos muestrales.

PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza


En este punto, la varianza es identificada por S 2.
PASO 3: Calcular la desviación estándar a partir de la raíz cuadrada de la varianza.

Los datos se alejan en promedio de la media aritmética en 6,5516 puntos.

Ejemplo26: Desviación estándar para datos agrupados

Calcular la desviación estándar a partir de la siguiente tabla de frecuencia.


Considere los datos como poblacionales.

PASO 1: Calcular la media aritmética.

PASO 2: Calcular la varianza


En este punto, la varianza es identificada por s 2

PASO 3: Calcular la desviación estándar a partir de la raíz cuadrada de la varianza.

3.3.4 Coeficiente de variación

El coeficiente de variación permite comparar la dispersión entre dos poblaciones


distintas e incluso, comparar la variación producto de dos variables diferentes (que
pueden provenir de una misma población).

Estas variables podrían tener unidades diferentes, por ejemplo, podremos determinar
si los datos tomados al medir el volumen de llenado de un envase de cierto líquido
varían más que los datos tomados al medir la temperatura del líquido contenido en el
envase al salir al consumidor. El volumen los mediremos en centímetros cúbicos y la
temperatura en grados centígrados.
El coeficiente de variación elimina la dimensionalidad de las variables y tiene en
cuenta la proporción existente entre una medida de tendencia y la desviación típica o
estándar.

Este índice solo se debe calcular para variables con todo los valores positivos, para
dar seguridad de un X o µ mayores a cero (un coeficiente de variación positivo).

Ejemplo27: Desviación estándar para datos no agrupados


En un juego de tiro al blanco con escopeta de perdigones por dos participantes a un
tablero, obtienen el siguiente registro después de 15 disparos cada uno.
Determinar el coeficiente de variación para ambos casos.

PASO 1: Calcular las medias aritméticas:

PASO 2: Calcular las varianzas


En este punto, la varianza es identificada por S2.
PASO 3: Calcular la desviación estándar a partir de la raíz cuadrada de la varianza.

La puntuación de los disparos se aleja en promedio de la media aritmética en


aproximadamente 1,6818 para el jugador 1 y 0,6325 para el jugador 2.

PASO 4: Calcular el coeficiente de variación.

El menor coeficiente de variación indica que el jugador 2 presento una dispersión


menor de sus puntuaciones respecto a la media, caso contrario al jugador 1 donde
la dispersión fue mayor.

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

25. Calcular la desviación media a partir del registro de las siguientes edades de
una muestra de 36 personas.

26. Calcular la desviación media a partir de la siguiente tabla de frecuencia.

27. Calcule la desviación media, varianza y desviación estándar a partir de los


siguientes datos sin agrupar y agrupándolos en una tabla de frecuencia con
intervalos de clase
(notar la variación de las medidas de dispersión en ambos casos).
CAPITULO IV. PROBABILIDADES.
OBJETIVOS ESPECÍFICOS:

Establecer y desarrollar modelos matemáticos adaptados al estudio de situaciones


que presentan cierto grado de incertidumbre, utilizando conceptos y leyes de
probabilidades.

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

4.1 Definición de términos.


4.1.1 Terminología
4.1.2 Experimento.
4.1.3 Espacio muestral.
4.1.4 Evento o Suceso.
4.2 Enfoques de las probabilidades.
4.2.1 Probabilidad Clásica.
4.2.2 Frecuencias Relativas o empíricas
4.2.3 Probabilidad Subjetiva.
4.3 Análisis Combinatorio.
4.3.1 Permutaciones.
4.3.2 Variaciones.
4.3.3 Combinaciones.
4.4 Reglas de las probabilidades.

4.4.1 Regla de la Adición, para eventos mutuamente excluyentes y no


mutuamente excluyentes.
4.4.2 Regla del Complemento
4.4.3 Probabilidad Condicional.
4.4.4 Regla de Multiplicación e Independencia estadística.
4.4.5 Tablas de contingencia.
4.4.6 Diagrama de árbol

4.5 El Teorema de Bayes.

4.5.1 Formulación.
4.5.2 Probabilidad total.
4.5.3 Pasos para calcular la probabilidad.
4.5.4 Problemas.

El concepto de probabilidad nace con el deseo del hombre de conocer con certeza
los eventos futuros. Es por ello que el estudio de probabilidades surge como una
herramienta utilizada por los nobles para ganar en los juegos y pasatiempos de la
época. El desarrollo de estas herramientas fue asignado a los matemáticos de la
corte.
Con el tiempo estas técnicas matemáticas se perfeccionaron y encontraron otros usos
muy diferentes para la que fueron creadas. Actualmente se continuó con el estudio
de nuevas metodologías que permitan maximizar el uso de la computación en el
estudio de las probabilidades disminuyendo, de este modo, los márgenes de error en
los cálculos.
A través de la historia se han desarrollado tres enfoques conceptuales diferentes para
definir la probabilidad y determinar los valores de probabilidades

4.1. EXPERIMENTO, ESPACIO MUESTRAL, EVENTO

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

Resolver los ejercicios del Texto guía pag. 42 ejercicios 2.1 al 2.20 impares
EVENTOS MUTUAMENTE EXCLUYENTES
Dos o más eventos son mutuamente excluyentes si no tienen nada en común

EVENTOS NO MUTUAMENTE EXCLUYENTES


Dos o más eventos no son mutuamente excluyentes si tienen algo en común

EVENTOS INDEPENDIENTES
Dos o más eventos no son independientes si su ocurrencia no altera la ocurrencia
del otro evento

EVENTOS EXHAUSTIVOS
Dos o más eventos son exhaustivos si su unión conforma el espacio muestral, es
decir, que reúnen todos los posibles resultados de un experimento.
4.2 ENFOQUE DE PROBABILIDADES

El enfoque clásico

Dice que si hay x posibles resultados favorables a la ocurrencia de un evento A y z


posibles resultados desfavorables a la ocurrencia de A, y todos los resultados son
igualmente posibles y mutuamente excluyente (no pueden ocurrir los dos al mismo
tiempo), entonces la probabilidad de que ocurra A es:
x n
P(A) = =
(x + z) N

n= resultado deseado (x)


N= numero total de resultados (x+z)

El enfoque clásico de la probabilidad se basa en la suposición de que cada resultado


sea igualmente posible.
Este enfoque es llamado enfoque a priori porque permite, (en caso de que pueda
aplicarse) calcular el valor de probabilidad antes de observar cualquier evento
de muestra.

Ejemplo 1:
Si tenemos en una caja 15 piedras verdes y 9 piedras rojas. La probabilidad de
sacar una piedra roja en un intento es:

El enfoque de frecuencia relativa

También llamado Enfoque Empírico, determina la probabilidad sobre la base de la


proporción de veces que ocurre un evento favorable en un número de
observaciones. En este enfoque no se utiliza la suposición previa de aleatoriedad.
Porque la determinación de los valores de probabilidad se basa en la observación y
recopilación de datos.

Ejemplo 3:

Se ha observado que 9 de cada 50 vehículos que pasan por una esquina no tienen
cinturón de seguridad. Si un vigilante de transito se para en esa misma esquina un
ida cualquiera ¿Cuál será la probabilidad de que detenga un vehículo sin cinturón de
seguridad?

Tanto el enfoque clásico como el enfoque empírico conducen a valores objetivos de


probabilidad, en el sentido de que los valores de probabilidad indican al largo plazo la
tasa relativa de ocurrencia del evento.

El enfoque subjetivo

Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte


de un individuo de que un evento ocurra, basado en toda la evidencia a su disposición.
Bajo esta premisa se puede decir que este enfoque es adecuado cuando solo hay
una oportunidad de ocurrencia del evento. Es decir, que el evento ocurrirá o no
ocurrirá esa sola vez. El valor de probabilidad bajo este enfoque es un juicio personal.

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA
1. Llene los siguientes cuadros

2. Un experimento con tres resultados se ha repetido 50 veces y se vio que E1


sucedió 20 veces, E2 ocurrió 13 y E3 ocurrió 17 veces. Asigna probabilidades a
estos eventos. ¿Qué enfoque se está usando?

3. Un ingeniero ha asignado subjetivamente las siguientes probabilidades a los


cuatro resultados de un experimento: P(E1)=0.10;P(E2=0.15; P(E3)=0.40;
P(E4)=0.20. ¿Es una asignación válida de probabilidades?

4. Cuando se le preguntó a una persona acerca de la probabilidad de obtener 0,1 ó 2


caras, al lanzar dos veces una moneda, ésta contestó que, como parece razonable
considerar los resultados como igualmente posibles, la probabilidad de cada evento
es un tercio. ¿Está de acuerdo con esta respuesta? ¿Por qué?
5. La posibilidad de que llueva el día de hoy es de 80% ¿Cuál de las siguientes
proposiciones explica mejor lo que se afirma?
a) Lloverá 80% del día de hoy
b) Lloverá en 80% del área en la cual se aplica la predicción del día de hoy
c) En el pasado, las condiciones del clima de este tipo han producido lluvia en esta
área, 80% de las veces
6. “Existe una probabilidad de 0,25 de que un negocio quiebre en el presente año”.
Cuando los investigadores hacen este tipo de afirmaciones ¿Cómo es que llegaron a
sus conclusiones?

4.3 ANÁLISIS COMBINATORIO

Es parte de la matemática que estudia sistemáticamente las distintas ordenaciones


de los diferentes elementos de un conjunto dado cundo se forman grupos de un grado
determinado.

4.3.1 Conteo de puntos muestrales

Si cierta selección de ordenación de objetivos puede realizarse de “ m ”maneras


diferentes y otra selección puede efectuarse de “ n “ maneras distintas , ambas
selecciones , se pueden producir de “ m x n “ maneras diferentes.

Ejemplo 1 :
Si un partido político tiene 3 candidatos a la presidencia y 5 candidatos a la
vicepresidencia El número de parejas distintas de candidatos para ambos cargos se
formaran de 3 x 5 = 15 formas.

Ejemplo 2 :
Si Carlos tiene 3 camisas de vestir y 4 pantalones ¿ Cuáles y cuántos serían
las diferentes formas que tendrá para vestirse con dichas prendas?

4.3.2. Permutaciones

Sea “ n ” el número de elementos de un conjunto A y “ r ” un número natural donde


0< r  n; las permutaciones se definen como el número de ordenaciones
diferentes que se pueden formar con los elementos del conjunto A , tomando
en grupos de “ n ” en “ n ” o de “ r ” en “ r ” pueden ser sin repetición o con repetición.
Las permutaciones se caracterizan porque intervienen todos los elementos, y los
grupos difieren solo en el orden en que están agrupados.

4.3.2.1. Permutaciones sin repetición


a) De “ n ” elementos diferentes tomados todos a la vez :

Si “ n ” es el número de elementos de un conjunto A; el número de permutaciones


que pueden hacerse con todos los “ n ” elementos se obtiene así:
P(n, n)  n!
Ejemplo 3:
De un conjunto A = { x ,y , z}. Hallar el número de permutaciones que pueden
formarse con todo los elementos de A.
Solución:
Como n = 3 , el número de permutaciones sin repetición será:

xyz yxz zxy xzy yzx zyx

P(3,3)  3! 3 x 2 x 1  6

b) De “ n ” elementos diferentes tomados de “r” en “r” con r < n

De “ n ” elementos diferentes , el número de permutaciones diferentes sin repetición


tomados de “ r ” en “ r ” está dado por:

n!
P(n, r) 
(n - r)!
Ejemplo 4:
Si A = { a , b, c, d} . Cuantas ordenaciones diferentes pueden formarse tomando
grupos de a 2?
Solución:

ab ba ca da

ac bc cb db

ad bd cd dc

Ejemplo 5:
Supongamos que Alberto (A) , Beatriz (B) , Carlos ( C ) y Daniel (D) se quieren
sentar en dos sillas disponibles. ¿de cuántas maneras diferentes se puede ubicar ?
12 maneras diferentes

Ejemplo 6:
De un conjunto de 5 libros , ¿Cuántos grupos de a 3 se podrán formar?
Solución:
m=5
n=3

Ejemplo 7:
Se tiene 5 libros de distintas materias. ¿De cuántos modos diferentes podrán
disponerse?
m=5
n=3
5!
 P5  (5  5)!  5 x 4 x 3 x 2 x 1  120
5

4.3.2.2 Permutaciones con repetición


a) De “ n ” elementos diferentes tomados todos a la vez

Ejemplo
Cuantas permutaciones diferentes se pueden formar con los elementos de { x ,
y , z} tomados todos a la vez y con repetición.

Solución:
xxx yyy zzz
xxy yyx zzx
xxz yyz zzy
xyz yxy zxz
xzx yzy zyz
yxx xyy xzz
zxx zyy yzz
xyz yxz zxy
xzy yzx zyx

A = { x , y , z} ; n = 3
P(3,3)  33  27

b) De “ n ” elementos diferentes tomados de “ r ” en “ r ” ( r < n ) y con repetición.


Esta dado por:

P(n, r)  n r
Ejemplo:
Cuántos números diferentes de 2 cifras pueden formarse con los dígitos 1 , 2 , 3 , 4 ,
si se permite la repetición.
Solución:
n=4
r=2
11 21 31 41
12 22 32 42
13 23 33 43
14 24 34 44

4.3.3. Combinaciones

Las combinaciones son las diferentes grupos de “n” elementos que se pueden
formar tomándolos de “ r ” en “ r ” , donde 0 < r  n ; de modo que cada grupo
difiere del otro en por lo menos un elemento.

En las combinaciones sólo se tiene en cuenta los elementos que intervienen


en ellas y no en el orden en que están agrupados la fórmula correspondiente es:
n!
C(n, r) 
r!(n  r)!
También se denota así:

   C(n, r)  r!(nn! r)!


n
r

Ejemplo 8:
De un grupo de 10 libros ¿Cuántas selecciones de 4 libros se pueden hacer?
Solución:
n = 10
r=4

Ejemplo 9:
Un estudiante tiene que contestar 8 de 10 preguntas en un examen.
a. ¿ De cuántas maneras puede el estudiante escoger las 8 preguntas ?
b. Si las 3 primeras son obligatorias, ¿ de cuantas maneras puede escoger
las preguntas?
c. Si tiene que contestar 4 de las 5 primeras ¿ de cuántas formas puede
hacerlo?

Solución:
a. Como interesa subconjuntos de 8 preguntas de un conjunto de 10 preguntas
sin importar el orden estaría dado por:
n!
C(n, r) 
r!(n  r)!
10! 10! 10 x 9x 8!
C(10,8)     45 formas
8!(10  8)! 8! 2! 8! x 2x1
b. Puesto que las 3 primeras son obligatorias; las 5 restantes tendrá que
escoger de las 7 preguntas sobrantes.

c. Si tiene que contestar 4 de las 5 primeras lo haría:

Las 4 preguntas restantes seleccionará de las 5 preguntas finales.

Luego : C(5 , 4) . C(5 , 4) = 5 x 5 = 25

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

7. En una carrera de caballos, participan 6 de estos ejemplares. ¿De cuántas


maneras podrán ocupar los primeros 3 puestos ?. R: 120

8. Un entrenador de fútbol tiene 16 jugadores. De cuántas maneras podrá formar su


equipo. Si cualquiera de los jugadores, puede desempeñarse en cualquier puesto?
Además se sabe que un jugador no puede jugar por estar lesionado. R: 1365

9. En un mercado venden 6 tipos diferentes de frutas y 8 tipos diferentes de


verduras. ¿ De cuántas maneras una señora podrá comprar 3 tipos diferentes de
frutas y dos tipos de verduras? R: 560

10. Se debe formar una comisión de tres profesionales : un abogado , un ingeniero y


un médico ¿ Cuántas posibilidades de formar dicha comisión hay ? . Si se
cuentan con tres abogados, cuatro ingenieros y seis médicos. R: 72

11. Un equipo de Investigación consta de 10 integrantes; de ellos , 4 son ingenieros.


¿Cuántos grupos de 3 miembros se pueden formar de manera que se considere
a por lo menos un Biólogo? R: 100

12. Determina el número de formas en que es posible que clasifiquen 3 de 12


vendedores de bienes raíces en 1°, 2° y 3° lugar.
13. ¿En cuántas formas puede acomodar un juez a 6 corredores en la línea de
partida?

14. Determina el n° de formas en que una persona puede seleccionar 4 productos de


una lista de 8?

15. ¿En cuántas formas pueden escogerse 4 interruptores buenos y 2 defectuosos de


un lote que contiene 2 interruptores buenos y 5 defectuosos?

16. Un constructor puede terminar 0,1 ó 2 casas en un mes. Construya un diagrama


de árbol para indicar las formas en la que el constructor puede terminar
exactamente 2 casas en tres meses. En un estudio de mercado los jefes de familia
se clasifican en 6 categorías de acuerdo con su ingreso, 5 categorías según su
grado de educación y 4 categorías según su lugar de residencia ¿Cuántas formas
diferentes hay para clasificar un jefe de familia?

17. Un examen consta de 10 preguntas con 4 opciones cada una. ¿En cuántas formas
puede un alumno marcar las respuestas a estas preguntas, si señala una
respuesta para cada una de las 10 preguntas?. ¿De cuántas maneras puede
obtener una calificación perfecta?

18. De 10 valores más negociados un inversionista desea elaborar una lista de tres
de estos títulos en orden de importancia, para la posible compra. ¿Cuántas
permutaciones habrá con 3 de los 10 títulos?

19. El representante de un sindicato desea hablar con 3 de 10 trabajadores. a) Si es


importante el orden de las visitas, en cuántas formas puede planear las 3
entrevistas? b)Si no importa el orden ¡de cuántas maneras puede hacerlas?
Calcule el número de formas en la cual un capataz puede escoger a 12 de 18
trabajadores para asignarle trabajo extra.

20. Resolver los ejercicios del Texto guía pag. 51 ejercicios 2.21 al 2.48 impares

4.4. REGLAS DE LAS PROBABILIDADES.

4.4.1 Axiomas de probabilidad

1. La probabilidad de un suceso A , toma valores entre 0 y 1 ; es decir 0 


P(A)  1
2. La probabilidad de un suceso seguro  es 1 P( ) = 1
3. Si un suceso A =  , A es un suceso imposible P(A) = 0
4. Si A y B son sucesos de  ; donde A  B =  ; entonces , la probabilidad
de ocurrencia del suceso A  B es : P (A  B) = P(A) + P(B)

4.4.2 Teoremas sobre probabilidad

1. Si  (Suceso imposible ) ; entonces P( ) = 0


2. Si A’ es un suceso complementario de A ; entonces P(A’) = 1 – P(A)
Esto se deduce de la siguiente relación: Como A  A’ =  A y A’ son sucesos
excluyentes, por lo tanto:
P(A)  P(A' )  PΩ 
P(A)  P(A' )  1  P(A' )  1  P(A)
4.4.2. Regla Aditiva

4.4.2.1. Regla para eventos mutuamente excluyentes

Si A y B son dos eventos mutuamente excluyentes (eventos no intersecantes, no


tienen nada en común), es decir, si la ocurrencia de cualquiera de ellos excluye la del
otro, no pueden ocurrir a la vez, o cuando no tienen ningún punto muestral en común
(A ∩ B = ᴓ), entonces se aplica la siguiente regla para calcular dicha probabilidad.

En donde:
El conectivo lógico "o" corresponde a la "unión" en la teoría de conjuntos (U)
El espacio muestral (S) corresponde al conjunto universo en la teoría de conjuntos

Extendiendo para tres conjuntos no comparables. Se tiene que:


P(A  B  C)  P(A)  P(B)  P(C) - P(A  B) - P(A  C) - P(B  C)  P(A  B  C)

4.4.2.2. Regla general para eventos no mutuamente excluyentes

Si A y B son dos eventos no mutuamente excluyentes (eventos intersecantes), es


decir, de modo que ocurra A o bien B o ambos a la vez (al mismo tiempo), entonces
se aplica la siguiente regla para calcular dicha probabilidad:

En donde:
El conectivo "y" corresponde a la "intersección" en la teoría de conjuntos (∩)
El espacio muestral (S) corresponde al conjunto universo en la teoría de conjuntos

4.4.2. Regla Multiplicativa

4.2.2.1. Regla particular o especial para eventos independientes

Si A y B son dos eventos independientes, es decir, si el conocimiento de la


incidencia de uno de ellos no tiene efecto en la probabilidad de ocurrencia del otro,
entonces, para calcular la probabilidad de dichos eventos se aplica la siguiente
regla:
En general P(A1  A 2  A 3  ........  A n )  P(A1 ).P(A 2 ).P(A 3 )........P(A n )

4.4.2.2. Regla general para eventos dependientes


Si A y B son dos eventos dependientes, es decir, si la ocurrencia de A afecta la
probabilidad de ocurrencia de B, entonces, dicha probabilidad de calcula empleando
la siguiente regla:

El conectivo "y" corresponde a la "intersección" en la teoría de conjuntos (∩)


El espacio muestral (S) corresponde al conjunto universo en la teoría de conjuntos
P(B/A) = Probabilidad condicional de B dado A

Ejemplos

10.- Una bolsa contiene tres caramelos rojos, siete blancos y nueve verdes. Si se
retiran dos caramelos de manera aleatoria y con reemplazo, encuentre la probabilidad
de que del mismo color.

E.M = {3 Rojas, 7 blancas, 9 verdes}

P= Sean del mismo color

3 3 7 7 9 9 139
{ }= . + . + . = = 38.50%
19 19 19 19 19 19 361

11.- De un grupo de 5 hombres y 3 mujeres se selecciono, sin reposición, dos


personas al azar. Calcule la probabilidad de que resulten:
-Dos mujeres.
-Dos hombres.

Dos Mujeres
3
( 1) =
8
2
( 2/ 1) =
7
3 2 3
( )= . = = 10.71%
8 7 28

HOMBRES
5 4 5
( ℎ )= . = = 35.71%
8 7 14

12.- La clase de estadística tiene 35 estudiantes: 20 cursan la clase de matemática;


18 cursan la clase de economía y 10 cursan ambas materias. Encuentre la
probabilidad de que, al seleccionar un estudiante al azar, el estudiante:
a) Curse economía o Matemáticas
b) Ni curse matemáticas ni curse economía

( )= ( í )=

10
P(Matemáticas y Economía) =
35

a) ( ∪ )= = = 0.80

b) ( ′ ∩ ′) = = = 0.20

13.- La probabilidad de que un avión con varias escalas llegue a Denver a tiempo es
de 0.30. La probabilidad de que este avión llegue a Houston es de 0.40 y la
probabilidad de que ni llegue a Houston ni llegue a Denver a tiempo es de 0.40. ¿Cuál
es la probabilidad de que el avión:

a) ¿llegue a tiempo a Denver pero no a Houston?


b) ¿llegue a Houston o a Denver a tiempo pero no ambos?

( ) = 0.30 ( ) = 0.40 ′
∩ ′
= 0.40

a) ( ∩ )= 1− ( ∩ ) = 1 − 0.40 = 60% = 0.60

b) ( ′ ∩ ′) = 0.30 + 0.40 − 0.60 = 0.10 = 10%

14.- Las probabilidades de que una persona que se detiene en una estación de
servicio pida que se revisen las llantas de su auto es de 0.14, la probabilidad de que
pida que se revise el aceite de su auto es de 0.27 y la probabilidad de que pida uno u
otro servicio es de 0.32

a) pida que revisen las llantas pero no el aceite


c) No pida estos dos servicios.

( ) = 0.14 ( ) = 0.27 ( ∪ ) = 0.32

a) ( ∩ ) = ( ) + ( ) − ( ∪ ) = 0.14 + 0.27 − 0.32 = 0.09


b) ( ′ ∩ ′) = 0.32 − 0.27 = 0.05

15.- Una caja contiene 4 tubos malos y 6 buenos. Se sacan dos a la vez. Se prueba
uno de ellos y se prueba que es bueno. ¿Cuál es la probabilidad de que el otro
también sea bueno?
E.M= {4 T Malos, 6 T Buenos}
E= Sea bueno
6 6 36 9
( )= . = = = 0.36 = 36%
10 10 100 25

16.- Se lanza un dado no cargado, dado que el resultado es un número par, ¿Cuál es
la probabilidad de que sea mayor q 3?
E.M= {1, 2, 3, 4, 5,6}
A= Pares= {2, 4, 6}
B= Mas de 3= {4, 5, 6}

P{A} = = = 0.5 = 50% P{A ∩ B} =

= = = = 0.666 = 66.67%
17.- En una clase hay 12 alumnos y 16 alumnas. El profesor saca a 4 a la pizarra.
a) ¿Cuál es la probabilidad de que todas sean alumnas?
b) ¿Cuál es la probabilidad de que todos sean alumnos?
E.M= {12 alumnos, 16 alumnas}

,
a) ( )= . . . = = 8.89%
,
,
b) ( )= . . . = = 2.42%
,

18.-La probabilidad de que un niño, sea mayor, estudie una carrera universitaria es
1/6 y en el caso de una niña es 1/10. Si se toman al azar un niño y una niña, calcula
las siguientes probabilidades.
a) Que los dos estudien una carrera universitaria
b) Que ninguna de ellos estudien una carrera universitaria

A= {una niña} P(A) =


B= {un niño} P(B) =

a) P(A ∩ B) = P(A). P(B) = . = = 1.67%


b) 1 − P(A ∪ B) = 1 − [P(A) + P(B) − P(A ∩ B)] = 1 − + − = = 75%

19.- Juan y Pedro lanzan una pelota a un blanco. La probabilidad de que Juan dé en
el blanco es 1/3 y la probabilidad de que dé Pedro es 1/4. Supóngase que Juan lanza
primero y que los dos chicos se van turnando para lanzar:
a) Calcula la probabilidad de que el primer lanzamiento que dé en el blanco sea el
segundo de Juan.
b) ¿Cuál es la probabilidad de que Juan dé en el blanco antes de que lo haga Pedro?

A = {Juan da en el blanco} P(A) =


B = {Pedro da en el blanco} P(B) =

a) (A ∩ B ∩ A) = P(A). P(B). P(A) = . . = = = 16.67%


b) (Juan da en el blanco antes que pedro) = . 2 =

20.- Una caja de cartón contiene 6 bolas blancas y 4 negras. Se extraen 2 bolas
sucesivamente y sin reemplazamiento.
a) Sea blanca y negra
6 4 24 4
( . )= . = = = 26.67%
10 9 90 15

b) Ambas sean negras


4 3 12 2
( . )= . = = = 13.33%
10 9 90 15

21.- Estudiando un determinado colectivo de personas resulta que: 2 de cada 5 son


morenas, y 3 de cada 9 tienen los ojos azules, teniendo el resto los ojos de distinto
color al azul. Calcula las siguientes probabilidades:

a) Que una persona sea morena y tenga los ojos azules.


b) Que una persona sea morena o no tenga los ojos azules
c) Que tres personas sean morenas.
M = {ser morena} ( )=
A = {tener los ojos azules} ( )=

a) ( ∩ ) = ( ). ( ) = . = = 13.33%
b) ∩à = ( )+ à − ∩à = ( )+ à − ( ). à = + −
. = = = 80%
c) ( ∩ ∩ ) = ( ). ( ). ( ) = . . = = 6.4%

22.- Una caja contiene 15 bolas rojas, 2 bolas negras y 4 bolas verdes. Calcule la
probabilidad de que una bolsa seleccionada al azar sea roja o verde.
E1= Bola roja
E2= Bola verde
15 4 0 19
{ ∪ }= + − = = 90.47%
21 21 21 21

23.- Para la señalización de emergencia de un hospital se han instalado dos


indicadores que funcionan independientemente. La probabilidad de que el indicador
A se accione durante la avería es de 0’99, mientras que para el indicador B, la
probabilidad es de 0’95:

a) Calcula la probabilidad de que durante una avería se accione un solo indicador.


b) Calcula la probabilidad de que durante una avería no se accione ninguno de los
dos indicadores.

a) [( ∩ ) ∪ ( ∩ )] = ( ∩ ) + ( ∩ ̅ ) = ( − ) + ( − ) = ( ) −
( ∩ ) + ( ) − ( ∩ ) = ( ) + ( ) − 2. ( ∩ ) = 0.99 + 0.95 −
2(0.99 ∗ 0.95) = 0.99 + 0.95 − 1.881 = 0.059

b) ( ̅ ∩ ) = 1 − ( ∪ ) = 1 − [ ( ) + ( ) − ( ∩ )] = 1 − (0.99 + 0.95 −
0.99 ∗ 0.95) = 1 − 0.9995 = 0.0005

24.- El despertador de Javier no funciona muy bien, pues el 20% de las veces no
suena.
Cuando suena, Javier llega tarde a clase con probabilidad 0,20, pero si no suena, la
probabilidad de que llegue tarde es 0,90.

a) Determina la probabilidad de que llegue tarde a clase y haya sonado el


despertador.
b) Determina la probabilidad de que llegue temprano.
c) Javier ha llegado tarde a clase, ¿cuál es la probabilidad de que haya sonado el
despertador?

S = {el despertador de Javier suena} ( ) = 0.80


T = {Javier llega tarde a clase} = 0.20 ̅ = 0.90

a) ∩ )= ( . ( ) = 0.20 ∗ 0.80 = 0.16


b) ( ) = [( ∩ ) ∪ ( ∩ ̅ )] = ( ∩ ) + ( ∩ ̅ ) = ( . ( )+

̅ . ( ) = 0.20 ∗ 0.80 + 0.90 ∗ 0.20 = 0.16 + 0.18 = 0.34


Entonces la probabilidad de que llego temprano es:
( ) = 1 − ( ) = 1 − 0.34 = 0.66

( ∩ ) .
c) = = = 0.47
( ) .

25.- Se seleccionan tres cartas de manera aleatoria y con re emplazo de una baraja
de 52 cartas.
a) La probabilidad de escoger en orden, un 10, una carta de espada y una sota negra.
E1= 10
E2= Espada
E3= Sota negra
4 12 4 2 18
{ 1 ∪ 3} = . + − = = 35%
52 52 52 52 52
b) Escoger exactamente 3 reyes
E= 3 Reyes

4 4 4 4 8
{ ∪ }= + + − = = 15.38%
52 52 52 52 52

26.- Se saca 1 carta de un naipe, calcular la probabilidad de que la carta sea un As


o carta roja.
A: As
R: Roja
P(A) = P(R) = P(A ∩ R) =

4 26 2 28 7
( ∪ )= + − = = = 53.85%
52 52 52 52 13

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

21. Una caja tiene 75 metras: 35 Azules y el resto Rojas. De las azules hay 25
Brillantes y el resto son Opacas. De las Rojas sólo hay 30 Brillantes. ¿Cuál es la
probabilidad de sacar...
a. Una metra azul
b. Una metra roja
c. Una metra azul brillante
d. Una metra brillante
e. Una metra roja o azul
f. Una metra azul o brillante

22. La compañía NASACA que produce combustible nuclear debe revisar con rayos
X y hacer una inspección meticulosa de cada barra antes de entregarla. El
inspector de control de calidad detectó que de cada 1000 barras que revisa, 10
tienen defectos internos, 8 tienen defectos en su carcasa y 5 tienen ambos tipos
de defecto. ¿Cuál es la probabilidad de que al revisar una barra, ésta sea
defectuosa?
23. Un estudiante está cursando Matemática II y Probabilidad y Estadística. La
probabilidad de que apruebe Matemática es de 0.60. La probabilidad de que
apruebe Estadística es de 0.70. La probabilidad de pasar las dos materias es de
0.50. ¿Cuál es la probabilidad de que apruebe al menos una materia?

24. Determina la probabilidad de obtener un As, un Rey o un Dos cuando se extrae


una carta de un mazo de 52.

25. De 300 estudiantes, 100 están inscritos en Física y 80 en Estadística. Estas cifras
incluyen 30 estudiantes que están inscritos en ambos cursos. ¿Cuál es la
probabilidad de que un estudiante elegido al azar esté inscrito únicamente en
Contabilidad o únicamente en Estadística

26. A Weil PC desea mejorar la resistencia de sus computadoras clon que arma, con
respecto a fallas en la unidad de disco y el teclado. En la actualidad, el diseño de
sus computadoras es tal que las fallas de la unidad de disco significan un tercio
de las fallas en el teclado. La probabilidad de que se presente una falla conjunta
en la unidad de disco y en el teclado es de 0,05.
a. Si la computadora es 80% resistente a fallas en la unidad de disco y/o en el
teclado, qué tan baja debe ser la probabilidad de que se presente una falla en
la unidad de disco?
b. Si el teclado se mejoró de tal modo que solo falla el doble de veces que la
unidad de disco, (y la probabilidad de falla conjunta sigue siendo 0,05). ¿La
probabilidad de falla de la unidad de disco del inciso (a) producirá una
resistencia a fallas en la unidad de disco duro, en el teclado o en ambos, mayor
o menor que 90%?

27. Un banco reporta que 80% de sus clientes tiene una cuenta de cheques, 60%
tiene una cuenta de ahorros y 50% tiene ambas. Si se toma un cliente al azar
¿Cuál es la probabilidad de que el cliente tenga una cuenta de ahorros o una
cuenta de cheques?. ¿Cuál es la probabilidad de que el cliente no tenga ni cuenta
de ahorros ni cuenta de cheques?

28. De los estudiantes de Ingeniería Industrial, el 15% es usuario regular del Comedor
de la UTE, el 30% es usuario regular del Transporte de la UTE y el 10% son
usuarios regulares de ambos servicios.
a. Diagrama de Venn o diagrama de árbol o tabla de contingencia
b. ¿Son independientes los eventos “usuario del Comedor UTE” y “usuario del
Transporte UTE”?. Demuéstrelo con las reglas de la probabilidad
c. Si del grupo se elige un estudiante al azar, calcule la probabilidad de que no
sea usuario del Comedor

29. Resolver los ejercicios del Texto guía pag. 59 ejercicios 2.49 al 2.72 impares

30. Resolver los ejercicios del Texto guía pag. 69 ejercicios 2.73 al 2.94 impares

4.5 TEOREMA DE BAYES

El reverendo Bayes fue un ministro presbiteriano, interesado en la Matemática, que


trataba de encontrar una fórmula para poder obtener la probabilidad de que Dios
exista con base a las evidencias que se tienen en la Tierra. Se dice que "...las
implicaciones teológicas de sus hallazgos lo alarmaron tanto que durante su vida se
rehusó a permitir la publicación de su trabajo. Sin embargo, su obra trascendió y la
teoría moderna de decisiones a menudo se conoce en su honor como teoría de
decisiones bayesiana." (Levin/Rubin).

Si los eventos B1, B2,..., Bk constituyen una particion del espacio muestral S, donde
P(Bi) ≠ 0 para i = 1, 2,...,k, entonces, para cualquier evento A en S, tal que P(A) ≠ 0,

Ejemplos:
27. El 20% de los empleados de una empresa son ingenieros y otro 20% son
economistas. El 75% de los ingenieros ocupan un puesto directivo y el 50% de los
economistas también, mientras que los no ingenieros y los no economistas
solamente el 20% ocupa un puesto directivo. ¿Cuál es la probabilidad de que un
empleado directivo elegido al azar sea ingeniero?
0.2 ∗ 0.75
= = 40.54%
0.2 ∗ 0.75 + 0.2 ∗ 0.5 + 0.6 ∗ 0.20

28. La probabilidad de que haya un accidente en una fábrica que dispone de alarma
es 0.1. La probabilidad de que suene esta sí se ha producido algún incidente es de
0.97 y la probabilidad de que suene si no ha sucedido ningún incidente es 0.02.
En el supuesto de que haya funcionado la alarma, ¿cuál es la probabilidad de que
no haya habido ningún incidente?
Sean los sucesos:
I = Producirse incidente.
A = Sonar la alarma.

0.9 ∗ 0.02
= = 15.65%
0.1 ∗ 0.97 + 0.9 ∗ 0.02

29. Tres máquinas, A, B y C, producen el 45%, 30% y 25%, respectivamente, del total
de las piezas producidas en una fábrica. Los porcentajes de producción defectuosa
de estas máquinas son del 3%, 4% y 5%.

a. Seleccionamos una pieza al azar; calcula la probabilidad de que sea defectuosa.


b. Tomamos, al azar, una pieza y resulta ser defectuosa; calcula la probabilidad de
haber sido producida por la máquina B.
c. ¿Qué máquina tiene la mayor probabilidad de haber producido la citada pieza
defectuosa?

D= "la pieza es defectuosa"


N= "la pieza no es defectuosa"

a) ( ) = ( ). + ( ). + ( ). = 0.45 ∗ 0.03 + 0.30 ∗ 0.04 +


0.25 ∗ 0.05 = 0.038
b) Debemos calcular P(B/D) Por el teorema de Bayes
( ). ( ) 0.30 ∗ 0.04 12
( / )= = =
( ). + ( ). ( ) 0.45 ∗ 0.03 + 0.30 ∗ 0.04 + 0.25 ∗ 0.05 . 8
= 0.316

c) Calculamos P(A/D) y P(C/D), comparándolas con el valor de P(B/D) ya calculado.


Aplicando el teorema de Bayes, obtenemos:

0.45 ∗ 0.03 135


= = = 0.355
0.45 ∗ 0.03 + 0.30 ∗ 0.04 + 0.25 ∗ 0.05 380
0.25 ∗ 0.05 125
= = = 0.325
0.45 ∗ 0.03 + 0.30 ∗ 0.04 + 0.25 ∗ 0.05 380

La máquina con mayor probabilidad de haber producido la pieza defectuosa es A

30. Tenemos tres urnas: A con 3 bolas rojas y 5 negras, B con 2 bolas rojas y 1
negra y C con 2 bolas rojas y 3 negras. Escogemos una urna al azar y extraemos
una bola. Si la bola ha sido roja, ¿cuál es la probabilidad de haber sido extraída de
la urna A?
R= "sacar bola roja"
N= "sacar bola negra"
1 3
( ). ( ) . 45
= = 3 8 = = 0.260
( ). + ( ). ( ) 1 . 3 + 1 . 2 + 1 . 2 173
3 8 3 3 3 5

31. En la sala de pediatría de un hospital, el 60% de los pacientes son niñas. De los
niños el 35% son menores de 24 meses. El 20% de las niñas tienen menos de 24
meses. Un pediatra que ingresa a la sala selecciona un infante al azar.
a. Determine el valor de la probabilidad de que sea menor de 24 meses.
b. Si el infante resulta ser menor de 24 meses. Determine la probabilidad que sea
una niña.
H: seleccionar una niña.
V: seleccionar un niño.
M: infante menor de 24 meses.
a) ( ) = ( ). + ( ). = 0.6 ∗ 0.2 + 0.4 ∗ 0.35 = 0.26 = 26%

( ). . ∗ . .
b) = ( ). ( ).
= . ∗ . . ∗ .
= .
= 46%

32. Un médico cirujano se especializa en cirugías estéticas. Entre sus pacientes, el


20% se realizan correcciones faciales, un 35% implantes mamarios y el restante en
otras cirugías correctivas. Se sabe además, que son de genero masculino el 25% de
los que se realizan correcciones faciales, 15% implantes mamarios y 40% otras
cirugías correctivas. Si se selecciona un paciente al azar, determine:
a. Determine la probabilidad de que sea de género masculino
b. Si resulta que es de género masculino, determine la probabilidad que se haya
realizado una cirugía de implantes mamarios.

F: pacientes que se realizan cirugías faciales


M: pacientes que se realizan implantes mamarios
O: pacientes que se realizan otras cirugías correctivas
H: pacientes de género masculino

a) ( ) = ( ). + ( ). + ( ). = 0.20 ∗ 0.25 + 0.35 ∗


0.15 + 0.45 ∗ 0.40 = 0.28 = 28%

( ).
b) P M H =
. ∗ . .
( ). ( ). ( ). (
= = =
) . ∗ . . ∗ . . ∗ . .

0.19 = 19%

33. Un Ingeniero Ambiental dispone de tres equipos electrónicos para realizar


mediciones de contaminación. El uso que le da a cada equipo es de 25% al primero,
35% el segundo en y 40% el tercero. Se sabe que los aparatos tienen probabilidades
de error de 1%, 2% y 3% respectivamente. Un técnico en control ambiental busca el
resultado de contaminación y observa que tiene un error. Determine la probabilidad
de que se ha usado el primer aparato.
P: seleccionar el primer aparato
S: seleccionar el segundo aparato
T: seleccionar el tercer aparato
E: seleccionar un resultado con error

( ).
=
( ). + ( ). + ( ).
0.25 ∗ 0.01 0.0025
= = = 0.12 = 12%
0.25 ∗ 0.01 + 0.35 ∗ 0.02 + 0.4 ∗ 0.03 0.0215

34. Un almacén está considerando cambiar su política de otorgamiento de créditos


para reducir el número de clientes que finalmente no pagan sus cuentas.
El gerente de crédito sugiere que en lo futuro el crédito le sea cancelado a cualquier
cliente que se demore una semana o más en sus pagos en 2 ocasiones distintas. La
sugerencia del gerente se basa en el hecho de que en el pasado, el 90% de todos los
clientes que finalmente no pagaron sus cuentas, se habían demorado en sus pagos
en por lo menos 2 ocasiones.
Suponga que de una investigación independiente encontramos que el 2% de todos
los clientes finalmente no pagan sus cuentas y que de aquellos que finalmente si los
pagan el 45% se han demorado en por lo menos 2 ocasiones.
Encontrar la probabilidad de que un cliente que ya se demoró por lo menos en 2
ocasiones finalmente no pague su cuenta y con la información obtenida analice la
política que ha sugerido el gerente de ventas.
( ∩ ) = ( ). = 0.98 ∗ 0.45 = 0.441

( ∩ ) = ( ). ′ = 0.02 ∗ 0.90 = 0.018

( ∩ ) ( ). ( ) 0.441
′ = = = = 96%
( ) ( ). + ( ). ( ) 0.441 + 0.018

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

31. En una fábrica de pernos, las máquinas A, B y C fabrican el 25%, 35% y 40%
de la producción total, respectivamente. De lo que producen 5%, 4% y 2%
respectivamente son pernos defectuosos. Se escoge un perno al azar y se
encuentra que es defectuoso ¿Cuál es la probabilidad de que el perno
provenga de la máquina A?. ¿de la máquina B? ¿de la máquina C?

32. La secretaria de un ejecutivo renunció a su trabajo. Al asesor se le pide su


opinión acerca de la razón de la renuncia. Él toma los siguientes datos: Entre
todas las secretarias insatisfechas,
a. el 20% lo están porque les desagrada su trabajo,
b. el 50% porque sienten que están mal pagadas y
c. el 30% porque les desagrada su jefe. Además, las probabilidades de que
renuncien son respectivamente: a) 0.60 b)0.40 c) 0.90. Con base a estas cifras
¿Cuáles son las probabilidades de que la secretaria haya renunciado debido a
que no le gusta su trabajo?

33. La probabilidad de que una aspiradora tenga fallas de operación debido a un


cable eléctrico en mal estado es 0,06. La probabilidad de que su falla de
operación se atribuya correctamente a un cable eléctrico en mal estado es de
0,80 y la probabilidad de que su falla se atribuya incorrectamente a un cable
eléctrico en mal estado es de 0,10. ¿Cuál es la probabilidad de que la falla de
operación de una aspiradora que se atribuyó a un cable eléctrico en mal estado
se deba en realidad a esta causa?
34. Supongamos que Venalum recibe alúmina como materia prima de dos sitios
distintos: 65% proviene de Bauxilum y el 35% restante es importada. El 98%
de la alúmina que proviene de Bauxilum cumple con las normas de calidad. El
95% de la alúmina importada cumple con las normas de calidad. Si se toma
una muestra de alúmina (sin saber la procedencia) y no cumple con las normas
de calidad ¿Cuál es la probabilidad de que ésta provenga de Bauxilum?

35. Un médico ha decidido recetar dos nuevos medicamentos a 200 pacientes


enfermos del corazón, de la manera siguiente: 50 pacientes tomarán el
medicamento A, otros 50 tomarán el medicamento B y el resto tomarán ambos.
El medicamento A reduce la probabilidad de infarto en un 35% , el B la reduce
en un 20% y los dos medicamentos cuando se toman juntos actúan de manera
independiente. Si un paciente elegido al azar sufre un infarto ¿Cuál es la
probabilidad de que haya tomado ambos medicamentos?

36. El profesor Coronel ha estado enseñando Estadística básica por muchos años.
Ya sabe que el 80% de sus alumnos hace toda la tarea. También sabe que el
90% de los que hacen toda la tarea aprueba el curso. De los estudiantes que
no hacen la tarea el 60% aprueba. Pedro Pérez cursó Estadística el semestre
pasado con este profesor y aprobó. ¿Cuál es la probabilidad de que haya
hecho todas sus tareas?

37. Resolver los ejercicios del Texto guía pag. 76 ejercicios 2.95 al 2.102 pares

CAPITULO V. DISTRIBUCIONES DE PROBABILIDADES.


OBJETIVOS ESPECÍFICOS:

 Identificar los conceptos de función de probabilidad y función de densidad para


variables aleatorias discretas y continuas, respectivamente.
 Reconocer la distribución discreta y continua
 Identificar cuándo se utiliza distribución discreta y continua
 Resolver problemas de distribución discreta y continua

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

5.1 Variables aleatorias.


5.2 Distribución de Probabilidad de Variable Aleatoria Discreta
5.2.1 Función de Probabilidad Discreta
5.2.2 Distribución Acumulativa Discreta
5.2.3 Media o Valor Esperado de una variable aleatoria discreta.
5.2.4 Varianza y desviación estándar de una variable aleatoria discreta.
5.2.5 Distribución de Probabilidad Binomial
5.2.6 Distribución de Probabilidad Multinomial
5.2.7 Distribución de Probabilidad Hipergeométrica
5.2.8 Distribución de Probabilidad Binomial Negativa
5.2.9 Distribución de Probabilidad Geométrica.
5.2.10 Distribución de Probabilidad de Poisson
5.3 Distribución de Probabilidad de Variable
Aleatoria Continua
5.3.1 Densidad de Probabilidad Continua
5.3.2 Distribución Acumulativa Continua
5.3.3 Esperanza Matemática
5.3.4 Varianza Desviación Estándar
5.3.5 Distribución de Probabilidad Uniforme
5.3.6 Distribución de Probabilidad Gamma
5.3.7 Distribución de Probabilidad Exponencial
5.3.8 Distribución de Probabilidad Ji Cuadrada
5.4 Distribución de Probabilidad Normal.
5.4.1 Características
5.4.2 Gráficos y familias de distribuciones normales
5.4.3 Cálculo de la distribución normal estándar
5.4.4 Determinación del área bajo la curva
5.5 Aproximación Normal de la Distribución Binomial
5.6 Aproximación Normal de la Distribución de Poisson.

5.1 VARIABLES ALEATORIAS


Una variable aleatoria es una variable estadística cuyos valores se obtienen de
mediciones en algún tipo de experimento aleatorio. Formalmente, una variable
aleatoria es una función, que asigna eventos.

Toda distribución de probabilidad es generada por una variable aleatoria x, la que


puede ser de dos tipos:

Variable aleatoria discreta (x).


Se le denomina variable porque puede tomar diferentes valores, aleatoria, porque el
valor tomado es totalmente al azar y discreta porque solo puede tomar valores enteros
y un número finito de ellos.

Ejemplo 1:
x→ Variable que nos define el número de burbujas por envase de vidrio que son
generadas en un proceso dado.
x→ 0, 1, 2, 3, 4, 5, etc. burbujas por envase
x→ Variable que nos define el número de productos defectuosos en un lote de 25
productos.
x→0, 1, 2, 3,....,25 productos defectuosos en el lote

x→ Variable que nos define el número de alumnos aprobados en la materia de


probabilidad en un grupo de 40 alumnos.
x→0, 1, 2, 3, 4, 5,....,40 alumnos aprobados en probabilidad

Con los ejemplos anteriores es importante tomar en cuenta que los valores de la
variable x siempre serán enteros, nunca fraccionarios.

Variable aleatoria continua (x).


Se le denomina variable porque puede tomar diferentes valores, aleatoria, porque los
valores que toma son totalmente al azar y continua porque puede tomar tanto valores
enteros como fraccionarios y un número infinito de ellos.

Ejemplos 2:
x→ Variable que nos define el diámetro de un engrane en pulgadas
x→ 5.0”, 4.99, 4.98, 5.0, 5.01, 5.0, 4.96
x→ Variable que nos define la longitud de un cable o circuito utilizado en un arnés de
auto
x→20.5 cm, 20.1, 20.0, 19.8, 20,6, 20.0, 20.0

x→ Variable que nos define la concentración en gramos de plata de algunas muestras


de mineral
x→14.8gramos, 12.0, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8

Una variable continua puede tomar cualquier valor, entero o fraccionario, una forma
de distinguir cuando se trata de una variable continua es que esta variable permite
medirla o evaluarla, mientras que una variable discreta no es medible, es una variable
de tipo atributo, cuando se inspecciona un producto este puede ser defectuoso o no,
blanco o negro, cumple con las especificaciones o no cumple, etc.

Las variables descritas anteriormente nos generan una distribución de probabilidad,


las que pueden ser.
Distribución de probabilidad discreta.
Distribución de probabilidad contínua.
5.2 DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLE ALEATORIA DISCRETA

5.2.1. Función de Probabilidad

A cada valor de la variable aleatoria discreta X se le asigna la probabilidad de que la


variable tome dicho valor:

p(x) = f(x)

El conjunto de pares ordenados (x, f (x)) es una función de probabilidad, una


función de masa de probabilidad o una distribución de probabilidad de la variable
aleatoria discreta X si, para cada resultado x posible,

Ejemplo 1:
Se lanza dos monedas y se define la variable aleatoria X, número de caras
obtenidas. Siendo C obtener cara y X obtener cruz, como el espacio muestral es =
{CC,CX, XC, XX} entonces se tiene
X: Ω→R
CC → 2
CX → 1
XC → 1
XX → 0

Ejemplo 2:
Lanzamos una moneda, si sacamos cara C recibimos 1 dólar y si sacamos cruz X
pagamos 1 dólar. ¿Cómo es la variable aleatoria X que mide la ganancia?

El espacio muestral es Ω = {C, X} entonces se tiene


X: Ω→R
C →1
X → -1

Ejemplo 3:
Lanzamos dos monedas y definimos la variable aleatoria X, número de caras
obtenidas. Siendo C obtener cara y X obtener cruz. La función de probabilidad de X
es
Es habitual expresar la función de probabilidad en una tabla de la forma

Se cumple con

Ejemplo 4:
Lanzamos una moneda, si sacamos cara C recibimos 1 dólar y si sacamos cruz X
pagamos 1 dólar. Describir la función de probabilidad de la variable aleatoria X que
mide la ganancia.
Solución:

Ejemplo 1.5. La función de probabilidad de la variable aleatoria X viene dada por la


tabla.

Hallar el valor de:

P(X=1), P(X≥1) y P(X≤-1)

Solución:

5.2.2. Distribución acumulada (Función de Distribución)

Es la aplicación FX(xi) que asigna a cada valor xi de la variable aleatoria discreta X la


probabilidad de que la variable tome valores menores o iguales que xi
Ejemplo 6:
La función de probabilidad de la variable aleatoria X viene dada por la tabla.

Hallar la función de distribución de X.


Solución:

Ejemplo 7:
La función de probabilidad de la variable aleatoria X viene dada por la tabla.

Representar la función de probabilidad y la función de distribución de X


Solución:
Se junta en una tabla la función de probabilidad y la función de distribución de X

5.2.3 Media o Valor Esperado de una variable aleatoria discreta.

Se llama media o esperanza de una variable aleatoria X y se representa por μ al


valor
E(X) =

Ejemplo 8.
Lanzamos dos monedas. Si salen dos caras recibimos 3 dólares, si sale una cara
recibimos 1 dólar y si no sale ninguna cara pagamos 5 dólares. ¿cuál es la
ganancia media del juego?

Solución:
Se determina la función de probabilidad de la ganancia X en euros:

La ganancia media del juego es la media o esperanza de X


μ = x1 · p(x1) + x2 · p(x2) + x3 · p(x3)

1 1 1
= 3. + 1. + 5. = 0
4 2 4

Cuando en un juego la ganancia esperada μ = 0 se llama juego justo. Si μ > 0 es un


juego con ventaja y si μ < 0 es un juego en desventaja.

Ejemplo 9:
Hallar la media de la variable aleatoria X, dada por la función de probabilidad.

Solución:

Sea X una variable aleatoria con distribución de probabilidad f (x). El valor esperado
de la variable aleatoria g(X) es

Ejemplo 10:
Suponga que el número de automóviles X que pasa por un local de lavado de autos
entre las 4:00 p.m. y las 5:00 p.m. de cualquier viernes soleado tiene la siguiente
distribución de probabilidad:

Sea g(X) = 2X – 1 la cantidad de dinero en dólares que el administrador paga al


operador.
Calcule las ganancias esperadas del operador en este periodo específico.

Solución:

5.2.4. Varianza y desviación estándar de una variable aleatoria discreta

Se llama varianza de una variable aleatoria X y se representa por σ2 al valor

Ejemplo 11:
Suponga que la variable aleatoria X representa el número de automóviles que se
utilizan con propósitos de negocios oficiales en un día de trabajo dado. La
distribución de probabilidad para la empresa A

Calcule la varianza de la distribución de probabilidad

Solución:

Una fórmula alternativa que se prefiere para calcular σ2 , que a menudo simplifica los
cálculos, se establece en el siguiente teorema.
Ejemplo 12:
Resuelva el ejemplo 11 con la fórmula que simplifica el cálculo

Solución:

E(X2) = (1)2(0.3) + (2)2(0.4) + (3)2(0.3) = 4.6

σA2 = 4.6 – (2)2 = 0.6

σA2 = 0.6

Sea X una variable aleatoria con distribucion de probabilidad f (x). La varianza de la


variable aleatoria g(X) es:

Ejemplo 13:
Calcule la varianza de g(X) = 2X + 3, donde X es una variable aleatoria con la
siguiente distribución de probabilidad

Solución:

σ2X+32 = (4(0)2-12(0)+9)(1/4) + (4(1)2-12(1)+9)(1/8) + (4(2)2-12(2)+9)(1/2)


+ (4(3)2-12(3)+9)(1/4)
2
σ2X+3 = 4
EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL
AULA

1. La función de probabilidad de una variable aleatoria discreta X es:

Sabiendo que P(X ≤ 2) = 0.75 y que P(X ≥ 2) = 0.75, halla su esperanza matemática
y su desviación típica.

2. Una persona en un juego recibe 15 cts cuando saca una sota o un caballo y recibe
5 cts si saca un rey o un as de una baraja española de 40 cartas. Si saca cualquier
otra carta paga 4 ctvs. ¿Cuál es la ganancia esperada en este juego?

3. Se tienen tres urnas: la A que contiene dos bolas negras y cuatro rojas, la B tres
negras y tres rojas; y la C con una negra y cinco rojas.
UA = {2N; 4R} UB = {3N; 3R} UC = {1N; 5R}
Se elige una urna al azar y se extrae una bola de ella. Si se saca roja se reciben 3
euros y si se saca negra no se recibe nada. ¿cuál es la ganancia esperada?

4. Según estadísticas la probabilidad de que el motor de un auto nuevo, de cierto


modelo, y marca sufra de algún desperfecto en los primeros 12 meses de uso es de
0.02, si se prueban tres automóviles de esta marca y modelo, encuentre el número
esperado de autos que no sufren de algún desperfecto en los primeros doce meses
de uso y su desviación estándar.

5. Se ha detectado en una línea de producción que 1 de cada 10 artículos fabricados


es defectuoso; se toman de esa línea tres artículos uno tras otro, a) obtenga la
distribución de probabilidad del experimento, b) encuentre el número esperado de
artículos defectuosos en esa muestra y su desviación estándar.

6. Según estadísticas, la probabilidad de que un pozo petrolero que se perfore en


cierta región pueda ser beneficiado es de 0.30. Se perforan tres pozos en esa región,
encuentre el número esperado de pozos que pueden ser beneficiados y su desviación
estándar.

7. La distribución de probabilidad de x , el número de defectos por cada 10 metros de


una tela sintética en rollos continuos de ancho uniforme , es

x 0 1 2 3 4
p(x) 0.41 0.37 0.16 0.05 0.01

a. Determine la distribución de probabilidad acumulada de x; P(x).


b. Determine el número esperado de defectos por cada 10 metros de tela
sintética en rollos continuos de ancho uniforme y la desviación estándar
del número de defectos por cada 10 metros de tela .....
c. Determine la probabilidad de que en 10 metros de tela sintética se
encuentren como máximo 2 defectos.
d. Determine la probabilidad de que en 10 metros de tela sintética se
encuentren por lo menos 2 defectos.
8. Resolver los ejercicios del Texto guía pag. 91 ejercicios 3.1 al 3.36 pares,
relacionados con distribución discreta de probabilidades

9. Resolver los ejercicios del Texto guía pag. 117 ejercicios 4.1 al 4.32 pares,
relacionados con distribución discreta de probabilidades

10. Resolver los ejercicios del Texto guía pag. 127 ejercicios 4.33 al 4.52 pares,
relacionados con distribución discreta de probabilidades

5.2.5. Distribución de Probabilidad Binomial

Toda experiencia aleatoria que presenta dos resultados posibles, uno que fijamos
como “éxito” y lo contrario como “fracaso” se suele denominar de tipo Bernoulli.

Por ejemplo las siguientes experiencias son de tipo Bernoulli:


• Jugar a cara o cruz.
• El nacimiento de un niño (varón o mujer)
• Obtener un “4” en el lanzamiento de un dado.
• Obtener un número “par” en el lanzamiento de un dado.
• Obtener “copas” al extraer una carta de la baraja española.
• La fabricación de una pieza en una fábrica (aceptable o defectuosa).
• El resultado de una operación (éxito o fracaso).
• El lanzamiento a una canasta (encestar o fallar).
• Aprobar o suspender un examen.

En términos estrictos el proceso de Bernoulli se caracteriza por lo siguiente:

1. El experimento consta de ensayos repetidos.


2. Cada ensayo produce un resultado que se puede clasificar como éxito o fracaso.
3. La probabilidad de un éxito, que se denota con p, permanece constante de un
ensayo a otro.
4. Los ensayos repetidos son independientes.

Distribución Binomial
Una variable aleatoria X se llama binomial si su valor en igual al número de éxitos
que ocurren en n pruebas independientes, teniendo todas ellas la misma
probabilidad de éxito, que designamos por p. Su función de probabilidad es

Si una variable X sigue la distribución binomial de parámetros n y p suele designarse


como

X → B(n; p)

Las constantes n y p son los parámetros de la distribución; obviamente, n > 0 es un


número entero y 0 ≤ p ≤ 1. La probabilidad de obtener fracaso es 1−p y se designa
con la letra q de forma que p + q = 1.

El cálculo de la media, la varianza y la desviación típica es algo laborioso y resulta


Ejemplo 14:
Tiramos una moneda 6 veces y contamos el número de caras X. Hallar la función de
probabilidad y representarla.
Solución:

Ejemplo 14:
Se extraen cinco bolas con reemplazamiento de una urna que tiene 6 bolas rojas y 8
negras. ¿Qué es más probable, sacar 2 rojas o 3 rojas?
Ejemplo 15:

Un ingeniero que labora en el departamento de control de calidad de una empresa


eléctrica, inspecciona una muestra al azar de 10 alternadores de un lote. Si el 20%
de los alternadores del lote están defectuosos. Cuál es la probabilidad de que en la
muestra, a) ninguno esté defectuoso, b) uno salga defectuoso, c) al menos dos salgan
defectuosos d) más de tres estén con defectos e) no más de tres estén con defectos.

Solución usando tablas binomiales:


a) P(x=0)= b(x=0; n=10,p=0.20)= 0.1074
b) P(x=1)= b(x=1 ;n=10,p=0.20)= 0.2684
c) P(x≥2)=1-P(x≤1)=1-B(x≤1; n=10,p=0.20)=1-[0.1074+0.2684]=1-0.3758=0.6242
d) P(x≥3)=1-P(x≤2)= 1-B(x≤2;n=10,p=0.20)= 1 - [0.1074+0.2684+0.3020]=1-
0.6778=0.3222
e) P(x≤3)= B(x≤3;n=10,p=0.20)= 0.1074 + 0.2684 + 0.3020 + 0.2013=0.8791

Solución usando Excel 13, obtenemos los resultados siguientes:


a) DISTR.BINOM.N(0,10,0.20,FALSO)=0.10737≡ 0.1074
b) DISTR.BINOM.N(1,10,0.20,FALSO)=0.26844≡ 0.2684
c) 1- DISTR.BINOM.N(1,10,0.20,VERDADERO)=1- 0.3758=0.6242
d) 1 - DISTR.BINOM.N(2,10,0.20,VERDADERO)= 1 – 0.6778=0.3222
e) DISTR.BINOM.N(3,10,0.20,VERDADERO)=0.8791

Ejemplo 16:

Un 10% de empleados de producción de la empresa NomecStal están ausentes del


trabajo en un determinado día de verano. Supóngase que se selecciona al azar 10
trabajadores de producción para un estudio riguroso del ausentismo.
a.) ¿Cuál es la variable aleatoria?
b.) ¿Tal variable es discreta o continua?
c.) ¿Cuál es la probabilidad de que ninguno de los 10 empleados seleccionados
esté ausente
d.) Desarrolle una distribución probabilística binomial para el experimento.
e.) Calcule la media, la varianza y la desviación típica de la distribución.

a) La variable aleatoria es el ausentismo.

b) La variable es discreta porque no se puede fraccionar los valores empleados.

c) P = 10%
Q = 90% P(0)  10C 0 0.10 0 0.9010
n = 10 P (0)  0.3487  100  34.87%
x = 0

P(1)  10C1 0.101 0.90 9  0.3874


P(2)  10C 2 0.10 2 0.90 8  0.1937
P(3)  10C 3 0.10 3 0.90 7  0.0574
P(4)  10C 4 0.10 4 0.90 6  0.0112
P(5)  10C 5 0.10 5 0.90 5  0.0015
d)
P(6)  10C 6 0.10 6 0.90 4  0.00014
P(7)  10C 7 0.10 7 0.90 3  0.0000087
P(8)  10C 8 0.10 8 0.90 2  0.00000036
P(9)  10C 9 0.10 9 0.901  0.000000009
P(10)  10C10 0.1010 0.90 0  0.0000000001

e) P = 10%
Q = 90%
n = 10
Media u  np ; u  10(0.10)  1
Desviación Típica   npq ;   10  0.10  0.90  0.9987
Varianza   npq
2
;  2  10  0.10  0.90  0.9

5.2.6. Distribución de Probabilidad Multinomial

Si un ensayo dado puede producir los k resultados E1, E2,..., Ek con probabilidades
p1,
p2,…, pk, entonces la distribución de probabilidad de las variables aleatorias X1,
X2,..., Xk, que representa el número de ocurrencias para E1, E2,..., Ek en n ensayos
independientes, es:
Ejemplo 17:
A ciertas elecciones se presentaron 4 partidos políticos: el POPO obtuvo un 40% de
los votos, el JEJE el 30%, el MUMU el 20% y el LALA el 10% restante. ¿Cuál es la
probabilidad de que al elegir 5 ciudadanos al azar, 3 hayan votado al POPO, 1 al
MUMU y 1 al LALA?
p1= 0.4 x1 = 3
p2 = 0.3 x2 = 0
p3 = 0.2 x3= 1
p4 = 0.1 x4 = 1

P = 0,0256

Ejemplo 18:
En una fiesta, el 20% de los asistentes son españoles, el 30% franceses, el 40%
italiano y el 10% portugueses. En un pequeño grupo se han reunido 4 invitados:
¿cuál es la probabilidad de que 2 sean españoles y 2 italianos?
p1= 0.2 x1 = 2
p2 = 0.3 x2 = 0
p3 = 0.4 x3= 2
p4 = 0.1 x4 = 0

P = 0,0384

Por lo tanto, la probabilidad de que el grupo esté formado por personas de estos
países es tan sólo del 3,84%.

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

11. La probabilidad de que cierto jugador de baloncesto enceste una canasta de 3


puntos es 0.3. ¿Cuál es la probabilidad de que enceste, exactamente dos canastas
de cinco lanzamientos?

12. La probabilidad de que un estudiante que ingresa en la Universidad se licencie en


5 años es de 0.4. Se eligen al azar 10 estudiantes. Calcular la probabilidad de que:
a) ninguno se licencie en 5 años.
b) todos se licencien en 5 años.
c) un único estudiante se licencie en 5 años.

13. Una maquina produce 12 piezas defectuosas de cada mil que fabrica. Hallar la
probabilidad de que al examinar 40 piezas
a) sólo haya una defectuosa.
b) no haya ninguna defectuosa.

14. En un grupo de 20 estudiantes de un instituto se ha comprobado que cada alumno


falta a clase el 4% de los días. Calcular la probabilidad de que en un día determinado:
a) no se registre ninguna falta.
b) falten a clase menos de tres estudiantes.
c) falte a clase un único estudiante.

15. En una determinada ciudad, la probabilidad del nacimiento de una niña es del
56%. Seleccionamos una familia de cinco hijos. Calcular la probabilidad de que
a) tenga exactamente tres niñas.
b) tenga al menos dos niñas.
c) ¿cuál es el número medio de hijas en las familias con cinco hijos?

16. A una fiesta han sido invitadas 8 personas. Cada persona puede acudir o no con
independencia de que lo hagan las demás. Si la probabilidad de que acuda cada
una es 0.85, calcular:
a) la probabilidad de asistan todas.
b) la probabilidad de asistan más de 6 personas.
c) la probabilidad de asista al menos la mitad.

17. Si el 20% de las piezas producidas por una máquina son defectuosas, ¿cuál es
la probabilidad de que entre cuatro piezas elegidas al azar, a lo sumo 2 sean
defectuosas?

18. La probabilidad de que un esquiador debutante se caiga en la pista es 0,4. Si lo


intenta 5 veces, calcula la probabilidad de que se caiga al menos 3 veces.

19. Un jugador marca el 85% de los penaltis que intenta. Si lanza 8 penaltis calcular
la probabilidad de
a) Marque más de 6 penaltis
b) Marque al menos 6 penaltis

20. Una partícula se desplaza por el eje de OX sobre los puntos -3, -2, -1, 0, 1, 2, 3
de la siguiente manera: cada segundo salta una unidad hacia la derecha o la
izquierda, con probabilidades respectivas p y q=1-p. Se trata, por tanto, de un
recorrido aleatorio sobre el conjunto Z de los números enteros. Si sale del origen en
el momento cero y suponemos que p=q=0.5,
a) ¿Cuál es la probabilidad de que a los 5 segundos se encuentre en +5?
b) ¿Cuál es la probabilidad de que a los 11 segundos se encuentre en +3?
c) ¿Cuál es la probabilidad de que a los 11 segundos se encuentre
nuevamente en el origen de coordenadas?

21. Se sabe que las bombas de gasolina para autos existentes en el mercado se
pueden clasificar en:
a) 40% de rendimiento excelente (Ex)
b) 20% de rendimiento bueno (B)
c) 30% de rendimiento regular (R)
d) 10% de rendimiento malo (M)
Se selecciona una muestra de 9 bombas mediante proceso aleatorio. ¿Cuál será la
probabilidad de que quede conformada por: 3Ex, 3B, 1R y 2M ?

22. Resolver los ejercicios del Texto guía pag. 150 ejercicios 5.1 al 5.28 pares,

5.2.7. Distribución de Probabilidad Hipergeométrica


La manera más simple de ver la diferencia entre la distribución binomial y la
distribución Hipergeométrica consisten en observar la forma en que se realiza el
muestreo. Los tipos de aplicaciones de la distribución Hipergeométrica son muy
similares a los de la distribución binomial. Nos interesa el cálculo de probabilidades
para el número de observaciones que caen en una categoría específica. Sin embargo,
la distribución binomial requiere que los ensayos sean independientes. Por
consiguiente, si se aplica esta distribución, digamos, tomando muestras de un lote de
artículos (barajas, lotes de artículos producidos), el muestreo se debe efectuar
reemplazando cada artículo después de observarlo. Por otro lado, la distribución
Hipergeométrica no requiere independencia y se basa en el muestreo que se realiza
sin reemplazo.
Las aplicaciones de la distribución Hipergeométrica se encuentran en muchos
campos, sobre todo en el muestreo de aceptación, las pruebas electrónicas y los
controles de calidad. Evidentemente, en muchos de estos campos el muestreo se
realiza a expensas del artículo que se prueba; es decir, el artículo se destruye, por lo
que no se puede

En general, nos interesa la probabilidad de seleccionar x éxitos de los k artículos


considerados éxitos y n – x fracasos de los N – k artículos que se consideran fracasos
cuando una muestra aleatoria de tamaño n se selecciona de N artículos. Esto se
conoce como un experimento Hipergeométrica; es decir, aquel que posee las
siguientes dos propiedades:
1. De un lote de N artículos se selecciona una muestra aleatoria de tamaño n sin
reemplazo.
2. k de los N artículos se pueden clasificar como éxitos y N – k se clasifican como
fracasos.
El número X de éxitos de un experimento Hipergeométrico se denomina variable
aleatoria hipergeométrica. En consecuencia, la distribución de probabilidad de la
variable hipergeométrica se conoce como distribución hipergeométrica, y sus
valores se denotan con h(x; N, n, k), ya que dependen del número de éxitos k en el
conjunto N del que seleccionamos n artículos.
La distribución de probabilidad de la variable aleatoria hipergeométrica X, el número
de éxitos en una muestra aleatoria de tamaño n que se selecciona de N artículos, en
los que k se denomina éxito y N – k fracaso, es

La media y la varianza de la distribución hipergeometrica h(x; N, n, k) son

Ejemplo 19:
Considerando que en la urna hay un total de 10 objetos, 3 de los cuales son
defectuosos, si de seleccionan 4 objetos al azar, ¿cuál es la probabilidad de que 2
sean defectuosos?
Solución:
N = 10 objetos en total
a = k objetos defectuosos
n = 4 objetos seleccionados en muestra
x = 2 objetos defectuosos deseados en la muestra
p(x=2, n=4) = 0.30

Ejemplo 20:
De un lote de 10 proyectiles, 4 se seleccionan al azar y se disparan. Si el lote contiene
3 proyectiles defectuosos que no explotarán, ¿cuál es la probabilidad de que , a) los
4 exploten?, b) al menos 2 no exploten?
Solución:
a) N = 10 proyectiles en total
a = 7 proyectiles que explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2, 3 o 4 proyectiles que explotan = variable que nos define el número de
proyectiles que explotan entre la muestra que se dispara

b) N = 10 proyectiles en total
a = 3 proyectiles que no explotan
n = 4 proyectiles seleccionados
x = 0, 1, 2 o 3 proyectiles que no explotan

p(al menos 2 no exploten) = p( 2 o más proyectiles no exploten) = p(x = 2 o 3; n=4)


p(x = 2) +p(x= 3)

5.2.7.1. Relación con la distribución Binomial

Como se esperaría, si n es pequeña comparada con N, la naturaleza de los N


artículos cambia muy poco en cada prueba. Así, cuando n es pequeña en
comparación con N, se puede utilizar una distribución binomial para aproximar la
distribución hipergeometrica. De hecho, por regla general la aproximación es buena
cuando n/N ≤ 0.05.

Ejemplo 21:
Se estima que 4000 de 10000 votantes residentes en la ciudad están en contra d
e un nuevo impuesto a las ventas. Si se seleccionan al azar 15 votantes y se l
es pide la opinión. ¿Cuál es la probabilidad de que por lo menos 7 estén a favor del
nuevo impuesto?
Sea X= número de votantes en contra de un nuevo impuesto a las ventas
x: 0,1,2,3,...., 15

Solución:
Analizando los parámetros, es una distribución hipergeométrica
X~ h(x;10000,15,4000) Como N>>n, es decir, 10000>>15
se puede aproximar a una binomial
h(x;10000,15,4000) b(x;15,0.4) p=k/N
p=4000/10000 p=0.4 constante
X= número de votantes a favor de un nuevo impuesto a las ventas
x=0,1,2,....,15 p=0.60 y ~ b(y;15,0.6)

P (x≥7) = 1 – P(x≤6) → por complemento


P (x≥7) = 1 - ∑ ( ; 15,0.60) → Tabla binomial acumulada
P (x≥7) = 1 – 0.0951 = 0.9049

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

23. Una compañía manufacturera utiliza un esquema para la aceptación de los


artículos producidos antes de ser embarcados. El plan es de dos etapas. Se preparan
cajas de 25 para embarque y se selecciona una muestra de 3 para verificar si tienen
algún artículo defectuoso. Si se encuentra uno, la caja entera se regresa para
verificarla al 100%. Si no se encuentra ningún artículo defectuoso, la caja se embarca.
a) ¿Cuál es la probabilidad de que se embarque una caja que tiene tres artículos
defectuosos?,
b) ¿Cuál es la probabilidad de que una caja que contiene solo un artículo defectuoso
se regresa para verificación?

24. a)¿Cuál es la probabilidad de que una mesera se rehúse a servir bebidas


alcohólicas únicamente a dos menores de edad si verifica aleatoriamente solo 5
identificaciones de entre 9 estudiantes, de los cuales 4 no tienen la edad suficiente?,
b) ¿Cúal es la probabilidad de que como máximo 2 de las identificaciones pertenezcan
a menores de edad?

25. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de


narcótico en una botella que contiene 9 píldoras de vitamina que son similares en
apariencia. Si el oficial de la aduana selecciona 3 tabletas aleatoriamente para
analizarlas, a) ¿Cuál es la probabilidad de que el viajero sea arrestado por posesión
de narcóticos?,
b) ¿Cuál es la probabilidad de que no sea arrestado por posesión de narcóticos?

26. Keith’s Florists tiene 15 camiones de entrega, que emplea sobre todo para
entregar flores y arreglos florales en la zona de Greenville, Carolina del Sur. De
estos 15 camiones, 6 presentan problemas con los frenos. En forma aleatoria se
seleccionó una muestra de 5 camiones. ¿Cuál es la probabilidad de que 2 de los
camiones probados presenten frenos defectuosos?

27. Una población consta de 15 elementos, 4 de los cuales son aceptables. En una
muestra de 4 elementos, ¿cuál es la probabilidad de que exactamente 3 sean
aceptables? Suponga que las muestras se toman sin reemplazo.

28. Kolzak Appliance Outlet acaba de recibir un cargamento de 10 reproductores de


DVD. Poco después de recibirlo, el fabricante se comunicó para reportar un envío de
tres unidades defectuosas. La señorita Kolzac, propietaria de la tienda, decidió probar
2 de los 10 reproductores de DVD que recibió. ¿Cuál es la probabilidad de que
ninguno de los 2 reproductores de DVD que se probaron esté defectuoso? Suponga
que las muestras no tienen reemplazo.

29. El departamento de sistemas de computación cuenta con ocho profesores, de los


cuales seis son titulares. La doctora Vonder, presidenta, desea formar un comité de
tres profesores del departamento con el fin de que revisen el plan de estudios. Si
selecciona el comité al azar:
a) ¿Cuál es la probabilidad de que todos los miembros del comité sean titulares?
b) ¿Cuál es la probabilidad de que por lo menos un miembro del comité no sea titular?
(Sugerencia: aplique la regla del complemento para responder esta pregunta.)

30. Resolver los ejercicios del Texto guía pag. 157 ejercicios 5.29 al 5.48 pares,

5.2.8. Distribución de Probabilidad Binomial Negativa

La distribución binomial negativa está basada en un experimento que satisface las


siguientes condiciones.
1) El experimento consta de una secuencia de ensayos independientes.
2) Cada ensayo puede resultar en un éxito (p) o fracaso (q)
3) La probabilidad de éxito o fracaso permanece la misma para cada prueba
4) El experimento continua hasta que un total de r éxitos se haya observado,
donde r es un entero positivo especifico

p =probabilidad de éxitos
q = probabilidad de fracasos
k= cantidad de ensayos realizados hasta obtener de éxitos
x= ensayos

Media y Varianza de una distribución de probabilidad negativa

Ejemplo 22:
Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación
excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos dispositivos
de medición sometidos a prueba sea el tercero en mostrar una desviación excesiva?,
b) el séptimo de estos dispositivos de medición sometidos a prueba, sea el cuarto que
no muestre una desviación excesiva?.
Solución:
a) x = 6 dispositivos de medición
k = 3 dispositivos que muestran desviación excesiva
p = (dispositivo muestre una desviación excesiva) = 0.05
q = (dispositivo no muestre una desviación excesiva) = 0.95
b) x = 7 dispositivos de medición
k = 4 dispositivos que no muestran una desviación excesiva
p = (dispositivo no muestre una desviación excesiva) = 0.95
q = (dispositivo muestre una desviación excesiva) = 0.05

Ejemplo 23:
Los registros de una compañía constructora de pozos, indican que la probabilidad de
que uno de sus pozos nuevos, requiera de reparaciones en el término de un año es
de 0.20. a) ¿Cuál es la probabilidad de que el sexto pozo construido por esta
compañía en un año dado sea el segundo en requerir reparaciones en un año?
b) ¿Cuál es la probabilidad de que el octavo pozo construido por esta compañía en
un año dado sea el tercero en requerir reparaciones en un año?
Solución:
a) x = 6 pozos
k = 2 pozos que requieren reparaciones en un año
p = (pozo requiera reparaciones en un año) = 0.20
q = (pozo no requiera reparaciones en un año) = 0.80

b) x = 8 pozos
k = 3 pozos que requieren reparaciones en un año
p = p (pozo requiera reparaciones en un año) = 0.20
q = p (pozo no requiera reparaciones en un año) = 0.80

5.2.9. Distribución de Probabilidad Geométrica.

Es un caso particular de la distribución binomial negativa cunado k = 1. Es decir


interesa conocer la probabilidad respecto a la cantidad de ensayos que se realizan
hasta obtener el primer “éxito”.

p =probabilidad de éxitos
q = probabilidad de fracasos
x= ensayos
Media y Varianza de una distribución de probabilidad negativa

Ejemplo 24:
Calcular la probabilidad de que salga el No. 5 a la tercera vez que lanzamos un
dado.
Definir éxito: sale No. 5
x=3
p = 1/6 = 0. 1666
q = (1 - 0.16660) = 0.8333
P(X=3) = (0.8333)2(0.1666) =0.1156

Ejemplo 25:
Calcular la probabilidad de que salga águila la 6ta ocasión que lanzamos una
moneda.
Definir éxito: salga águila.
x=6
p = 1/2= 0.5
q = 0.5
P(X=6) = (0.5)5(0.5)= 0.0156

Ejemplo 26:
En el salón hay 8 alumnos de ojos cafés, 9 de ojos azules, 7 de ojos negros, y 10 de
ojos verdes; si extraemos 6 alumnos, calcular la probabilidad de que este ultimo
tenga los ojos claros.
Definir éxito: tenga ojos claros.
X=6
p = 0.5588
q = 1- 0.5588 = 0.4412
P(X=6) = (0.4412)5(0.5588) = 0.0093 = 9.3418 x 10

Ejemplo 27:

Una maquina detecta fallas en los productos que elabora una fábrica. Si los productos
tienen una probabilidad de falla del 5%, calcular la probabilidad de que la maquina
encuentre su primer producto defectuoso en la octava ocasión que selecciona un
producto para su inspección.
Definir éxito: salga defectuoso el producto.
X=8
p = 0.05
q = 1 - 0.05 = 0.95
P(X=8) = (0.95)7(0.05) = 0.0349

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

31. Se lanza al aire una moneda cargada 8 veces, de tal manera que la probabilidad
de que aparezca cara es de 2/3, mientras que la probabilidad de que aparezca
sello es de 1/3, Determine la probabilidad de que en el último lanzamiento
aparezca una cara.
32. Sí la probabilidad de que un cierto dispositivo de medición muestre una desviación
excesiva es de 0.05, ¿cuál es la probabilidad de que; a) el sexto de estos
dispositivos de medición sometidos a prueba sea el primero en mostrar una
desviación excesiva?, b) el séptimo de estos dispositivos de medición sometidos
a prueba, sea el primero que no muestre una desviación excesiva?

33. La probabilidad que una persona expuesta a cierta enfermedad la contraiga es


0.3. Calcule la probabilidad que la quinta persona expuesta a esta enfermedad
sea la segunda en contraerla

34. Suponga que en dos de cada diez intentos, un vendedor realiza una venta.
Calcule la probabilidad que en el sexto intento realice la primera venta.

35. Suponga que la probabilidad de tener un hijo varón o mujer son iguales a 0.5.
Calcule la probabilidad que en una familia
a) El cuarto hijo sea el primer varón
b) El tercer hijo sea la segunda mujer
c) El quinto hijo sea el tercer varón o sea la cuarta mujer

36. Si la probabilidad de que un estudiante es una escuela de conducción obtenga u


licencia de conducir es 0.8, encuentre la probabilidad de que uno de estos
estudiantes apruebe el examen
a) En el segundo intento
b) En el tercer intento

37. Resolver los ejercicios del Texto guía pag. 157 ejercicios 5.29 al 5.48 pares,

5.2.10 Distribución de Probabilidad de Poisson

Propiedades del proceso de Poisson

1. El número de resultados que ocurren en un intervalo o región específica es


independiente del número que ocurre en cualquier otro intervalo de tiempo o región
del espacio disjunto. De esta forma vemos que el proceso de Poisson no tiene
memoria.
2. La probabilidad de que ocurra un solo resultado durante un intervalo de tiempo muy
corto o en una región pequeña es proporcional a la longitud del intervalo o al tamaño
de la región, y no depende del número de resultados que ocurren fuera de este
intervalo de tiempo o región.
3. La probabilidad de que ocurra más de un resultado en tal intervalo de tiempo corto
o que caiga en tal región pequeña es insignificante.

El número X de resultados que ocurren durante un experimento de Poisson se llama


variable aleatoria de Poisson y su distribución de probabilidad se llama
distribución de Poisson. El número medio de resultados se calcula a partir de
µ = λt, donde t es el “tiempo”, la “distancia”, el “área” o el “volumen” específicos de
interés. Como las probabilidades dependen de λ, denotaremos la tasa de ocurrencia
de los resultados con
p(x; λt).
Media y Varianza de una distribución de probabilidad de Poisson

APROXIMACIÓN DE LA DISTRIBUCIÓN BINOMIAL CON


LA DISTRIBUCIÓN DE POISSON

En la Distribución Binomial cuando n es grande no es práctico el uso de la fórmula.


Para entender esto, suponga que n=100, p=0.05 y se quiere calcular la probabilidad
que la variable aleatoria X tome el valor 4:

100
( = 4) = (4) = = 0.05 0.95
4

En esta situación se puede calcular aproximadamente la probabilidad mediante otro


modelo, en este caso, con la Distribución de Poisson.

Del desarrollo algebraico, que lo omitimos, se obtiene el siguiente resultado para la


Distribución Binomial:
( ; , )→ , = 0,1,2 … ….
!
cuando n → ∞
Este modelo corresponde a la distribución de Poisson, siendo = np
Las referencias bibliográficas indican que esta aproximación es aceptable si n ≥ 20
y
p ≤ 0.05.

Otro criterio utilizado establece que la aproximación es aceptable si n ≥ 100 y np


≤10

Ejemplo 28:

La cantidad de errores de transmisión de datos en una hora es 5 en promedio.


Suponiendo que es una variable con distribución de Poisson, determine la
probabilidad que:
a) En cualquier hora ocurra solamente 1 error.
b) En cualquier hora ocurran al menos 3 errores
c) En dos horas cualesquiera ocurran no más de 2 errores.
Ejemplo 29:

En promedio, cada rollo de 400 metros de aluminio laminado tiene tres defectos
¿Cuál es la probabilidad de que un espacio de 100 metros no tenga ningún defecto?
Solución:
Sea
X el número de defectos que puede tener el laminado por espacio.
Ya que el promedio por cada 400 metros es 3, entonces por 100 metros será
100(3)
=
400
= 0,75
Utilizando la fórmula

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

37. Cierto tipo de tela usada en tapicería tiene, en promedio, dos defectos por metro
cuadrado.
Si se supone una distribución de Poisson, calcule la probabilidad que
a) Un rollo de 30 m2 tenga no más de 5 defectos
b) Un rollo de 30 m2 tenga al menos 6 defectos
c) Un rollo de 60 m2 tenga exactamente 10 defectos

38. Un cargamento grande de libros contiene 3% de ellos con encuadernación


defectuosa.
Utilice la aproximación de Poisson para determinar la probabilidad que entre 400
libros seleccionados al azar del cargamento,
a) Exactamente 10 libros estén defectuosos
b) Al menos 10 tengan defectos

39. Un bar prepara un batido especial que contiene en promedio 4 frutas diferentes,
encuentre la probabilidad de que el batido contenga más de 4 frutas:
a) En un determinado día,
b) En tres de los siguientes 5 días,

40. En un proceso de fabricación de botellas para refrescos presentan defectos de


rajaduras que no son aceptadas por los compradores. Se sabe que en promedio 1 de
cada 1000 de estos artículos tienen 2 o más rajaduras ¿Cuál es la probabilidad de
que en una muestra de 9000 botellas se encuentren a lo sumo 8 botellas con
defectos?
41. Resolver los ejercicios del Texto guía pag. 164 ejercicios 5.49 al 5.76 pares,

5.3 DISTRIBUCIÓN DE PROBABILIDAD DE VARIABLE ALEATORIA CONTINUA

5.3.1. Densidad de Probabilidad Continua

La probabilidad de una variable aleatoria continua puede especificarse si existe una


función denominada función de densidad de probabilidad (o simplemente función
de densidad), tal que el área debajo del gráfico de esta función cumpla los requisitos
para que sea una medida del valor de probabilidad. Para variables aleatorias
discretas, la probabilidad se obtiene de la sumatoria de f(x). En el límite, esta
sumatoria se transforma en un integral.

Representación gráfica

Ejemplo 30:

Suponga que el tiempo de atención de cada cliente en una estación de servicio es


una variable aleatoria continua con la siguiente función de densidad de probabilidad:

( + 2), 0 ≤ ≤1
( )=
0,

a) Verifique que cumple las propiedades de una función de densidad


Sea X: variable aleatoria continua (duración en horas)
b) Calcule la probabilidad que el tiempo de atención esté entre 15 y 30 minutos

5.3.2. Distribución Acumulativa Continua

Al igual que en el caso discreto se puede definir una función de probabilidad


acumulada, la cual en el caso continuo se denomina función de distribución

Propiedades de la Función de Distribución

Ejemplo 31:

Encuentre la función de distribución para el ejemplo 30


Ejemplo 32:

La duración de sardinas empaquetadas en un almacén (en horas) es una variable


aleatoria continua, cuya función de densidad viene expresada por:

1) Verifique que cumple las propiedades de una función de densidad


2) Determine la probabilidad de que uno de estos paquetes durará en el almacén:
a) cuando menos 150 horas.
b) a lo más 90 horas.
c) entre 70 y 110 horas
Solución

Ejemplo 33:

El tiempo de espera (en horas) entre dos conductores de vehículo, de manera


sucesiva, que rebasan la velocidad máxima, es una variable aleatoria continua, cuya
distribución acumulada es:
Encuentre la probabilidad de esperar menos de 10 minutos entre dos infractores
sucesivos, utilizando la distribución acumulada de X.
Solución:

Ejemplo 34:

La función de densidad de una variable aleatoria viene dada por:

1. Halle el valor de k.
2. Encuentre F(x) y utilícela para hallar P(0,3<x<0,6).

5.3.3 Esperanza Matemática variable aleatoria contínua

Se llama media o esperanza de una variable aleatoria X y se representa por μ al


valor
Ejemplo 35:
La duración de sardinas empaquetadas, en un almacén (en horas) es una variable
aleatoria continua, cuya función de densidad viene expresada por:

Halle la media de la variable aleatoria.

Solución:

Esperanza Matemática (la media) de una función relacionada con una variable
aleatoria.
Sea X una variable aleatoria cuya distribución de probabilidad es f(x). La esperanza
matemática de la variable aleatoria g(X) viene dada por:

Ejemplo 36:

Sea X la variable aleatoria definida por la fracción de tiempo que un torno está en
operación durante una semana de trabajo de 30 horas; la función de densidad viene
dada por:

La ganancia semanal en dólares está dada por g(x) = 20000x + 60000


Halle la media de la variable aleatoria.
Solución:

5.3.4. Varianza y desviación estándar de una variable aleatoria continua

Se llama varianza de una variable aleatoria X y se representa por σ2 al valor


Ejemplo 37:

Se tiene la siguiente función de densidad

Calcule la varianza y la desviación estándar.


Solución:

Sea X una variable aleatoria con distribución de probabilidad f (x). La varianza de la


variable aleatoria g(X) es:

Ejemplo 38:
Utilizando los datos del ejemplo 37; halle la varianza y la desviación estándar de la
variable g(X)
Solución:

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

42. El desgaste del dibujo (en miles de kilómetros) de los cauchos para camiones es
una variable aleatoria cuya función de densidad de probabilidad está dada por:
Halle la probabilidad de que los cauchos se desgastarán:
a) Cuando más a 20000 km
b) Entre 28000 y 35000 km.
c) Cuando menos a 45000 km.
d) Exactamente a los 15000 km.

43. El desgaste del dibujo (en miles de kilómetros) de los cauchos para camiones es
una variable aleatoria cuya función de densidad de probabilidad está dada por:

Halle la probabilidad de que los cauchos se desgastarán:


a) Cuando más a 20000 km
b) Entre 28000 y 35000 km.
c) Cuando menos a 45000 km.
d) Exactamente a los 15000 km.

44. Supóngase que el error de fase de un dispositivo de rastreo es una variable


aleatoria con función de densidad:

Halle la probabilidad de que el error de esta fase esté:


a) Entre 0 y π/4
b) Mayor que π/6.

45. La proporción de impurezas X de determinadas muestras de mineral de oro es


una variable aleatoria cuya función de densidad está dada por:

Si se selecciona 5 muestras de ellas en formas independientes, calcular la


probabilidad de que:

a) Exactamente una de ellas tenga una proporción de impurezas mayor que 0,8.
b) Por lo menos una de ellas tenga una proporción de impurezas mayor que 0,8.

46. Utilizando la definición de la función de densidad del problema 44; halle la


función de distribución acumulada.

47. El funcionamiento hasta su primera falla (en ciertos de horas) para cierta
resistencia es una variable aleatoria continua con función de densidad dada por:

Halle la media, varianza y desviación estándar.


48. El porcentaje de impurezas por unidad de producción en cierto producto químico
es una variable aleatoria continua con función de densidad dada por

49. Halle la media, la varianza y la desviación estándar de la variable aleatoria g(X)


= 60X2 + 39X donde g(X) representa el número de kilovatios/hora consumidos
semestralmente.

50. Resolver los ejercicios del Texto guía pag. 91 ejercicios 3.1 al 3.36 pares,
relacionados con distribución contínua de probabilidades

51. Resolver los ejercicios del Texto guía pag. 117 ejercicios 4.1 al 4.32 pares,
relacionados con distribución contínua de probabilidades

52. Resolver los ejercicios del Texto guía pag. 127 ejercicios 4.33 al 4.52 pares,
relacionados con distribución contínua de probabilidades

5.3.5 Distribución de Probabilidad Uniforme

Este modelo corresponde a una variable aleatoria continua cuyos valores tienen
igual valor de probabilidad en un intervalo especificado para la variable

Representación gráfica de la distribución Uniforme Continua

Media y varianza de la distribución uniforme continua

Definición: Media y Varianza de la Distribución Uniforme Continua

Función de distribución de probabilidad


De acuerdo a la definición establecida:
Ejemplo 39:
Cuando falla cierto componente de una máquina, esta debe detenerse hasta que sea
reparado. Suponiendo que el tiempo de reparación puede tomar cualquier valor entre
1 y 5 horas.
a) Calcule la probabilidad que la duración tome al menos 2 horas

Solución
X: Variable aleatoria Continua (duración de la reparación)
Tiene distribución Uniforme, por lo tanto, su función de densidad es

b) Calcule el valor esperado de la duración de la reparación


Solución

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

53. Se elige un punto C sobre una recta AB cuya longitud es k. Si la distancia entre
C y A es una variable aleatoria X con distribución uniforme continua, calcule la
probabilidad que la diferencia de longitud entre los segmentos AC y BC no exceda en
más de 10% de k.

54. En un negocio de hamburguesas se despacha el refresco en vasos. La cantidad


es una variable aleatoria con una distribución uniforme entre 130 y 160 ml. (mililitros)
a) Calcule la probabilidad de obtener un vaso que contenga a lo más 140 ml.
b) ¿Cuántos ml. contiene en promedio un vaso?
c) Obtenga la varianza para la variable aleatoria

55. Una resistencia eléctrica se comporta de acuerdo a una distribución continua con
valores entre 900 y 1100 ohms. Encuentre la probabilidad que la resistencia,
a) Aguante a lo más 950 ohms antes de quemarse
b) Tenga un valor entre 950 y 1050 ohms.

5.3.6 Distribución de Probabilidad Gamma

Es un modelo básico en la Teoría de la Probabilidad y corresponde a la siguiente


definición
Gráfico de la Distribución Gamma

Son gráficos asimétricos con sesgo positivo y su dominio es R+

Media y varianza para la distribución gamma

Ejemplo 40:

El tiempo en horas que semanalmente requiere una máquina para mantenimiento es


una variable aleatoria con distribución gamma con parámetros
α=3, β=2
a) Encuentre la probabilidad que en alguna semana el tiempo de mantenimiento sea
mayor a 8 horas
b) Si el costo de mantenimiento en dólares es C = 30X + 2X2, siendo X el tiempo de
mantenimiento, encuentre el costo promedio de mantenimiento.

Gráfico
5.3.7 Distribución de Probabilidad Exponencial

Es un caso particular de la distribución Gamma y tiene aplicaciones de interés


práctico.
Se obtiene con  = 1 en la distribución Gamma
Gráfico de la Distribución Exponencial

El gráfico de la densidad de probabilidad de la distribución Exponencial tiene la


forma típica decreciente y su dominio es R+

Media y varianza para la distribución exponencial

Ejemplo 41:

Un sistema usa un componente cuya duración en años es una variable aleatoria con
distribución Exponencial con media de 4 años. Si se instalan 3 de estos
componentes y trabajan independientemente, determine la probabilidad que al cabo
de 6 años, dos de ellos sigan funcionando.

Solución
Sea Y: Variable aleatoria continua (duración de un componente en años)
Y tiene distribución Exponencial con µ = β = 4
5.3.8 Distribución de Probabilidad Ji Cuadrada

Este modelo es importante en el estudio de la Estadística Inferencial. Se obtiene de


la distribución Gamma con a = v/2, β = 2

Esta distribución tiene un parámetro: v > 0 y se denomina número de grados de


libertad

Gráfico de la distribución ji-cuadrado

Media y varianza de la distribución ji-cuadrado

Se obtienen directamente de la distribución Gamma con α = v/2, β = 2

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA
56. En cierta ciudad, el consumo diario de energía eléctrica en millones de Kw-hora
puede considerarse como una variable aleatoria con distribución Gamma con
α=3 y β=2. Si la planta de energía tiene una capacidad de producción diaria de doce
millones de Kw-hora, calcule la probabilidad que en un día cualquiera, el suministro
de energía sea insuficiente.

57. La duración en miles de Km. de cierto tipo de llantas, es una variable aleatoria
con distribución exponencial con media 40 mil Km. Calcule la probabilidad que una
de estas llantas dure
a) Al menos 20 mil Km.
b) No más de 30 mil Km.

58. El tiempo que transcurre antes de que una persona sea atendida en un bar es una
variable aleatoria que se puede modelar col la distribución exponencial con una media
de 5 minutos.
Calcule la probabilidad de que una persona sea atendida antes de que transcurran 3
minutos en al menos 4 de los 7 días siguientes.

59. Se conoce que la cantidad de reparaciones que cierto tipo de electrodoméstico


necesita, tiene distribución de Poisson con una media de una vez cada dos años.
Suponiendo que los intervalos entre reparaciones tienen distribución exponencial.
Calcule la probabilidad que este artículo funcione por lo menos tres años sin requerir
reparación.

5.7 DISTRIBUCIÓN DE PROBABILIDAD NORMAL.

La Distribución Normal es la piedra angular de la teoría estadística moderna.


Conocida y estudiada desde hace mucho tiempo, es utilizada para describir el
comportamiento aleatorio de muchos procesos que ocurren en la naturaleza y
también realizados por los humanos.

La gráfica de f es similar al perfil del corte vertical de una campana y tiene las
siguientes
características:
1) Es simétrica alrededor de 
2) Su asíntota es el eje horizontal
3) Sus puntos de inflexión están ubicados en µ –  y µ + 
Distribución normal estándar

Para generalizar y facilitar el cálculo de probabilidad con la distribución Normal, es


conveniente definir la Distribución Normal Estándar que se obtiene haciendo
µ= 0, y s2 = 1 en la función de densidad de la Distribución Normal

Definición: Función de densidad de la distribución Normal Estándar

Ejemplo 42:

Usando la Tabla de la Distribución Normal Estándar calcule:


a) P(Z ≤ 1.45)
P(Z≤1.45) = F(1.45)0.9265
El resultado se toma directamente de la Tabla de la Distribución Normal Estándar:
b) P(Z ≥1.45)
P(Z ≥ 1.45) = 1 – P(Z<1.45) = 1 – F(1.45) = 1 – 0.9264 = 0.0735

c) P(Z ≤ –1.45)
P(Z ≤ –1.45) = F(–1.45) =0.0735 (Directamente de la Tabla)
F(–1.45) = 1 – F(1.45) = 1 – 0.9265 = 0.0735 (Usando la relación para valores
negativos)

d) P(1.25 ≤ Z ≤ 1.45)
P(1.25 ≤ Z ≤ 1.45) = F(1.45) – F(1.25) = 0.9265 – 0.8944 = 0.0321

e) Encuentre z tal que P(Z ≤ z) = 0.64


P(Z ≤ z) = F(z) = 0.64

En la Tabla, el valor de z más cercano a F(z) = 0.64 corresponde a z = 0.36

Estandarización de la distribución normal


Si una variable tiene distribución Normal, mediante una sustitución se la puede
transformar a otra variable con distribución Normal Estándar. Este cambio de variable
facilita el cálculo de probabilidad y se denomina estandarización de la distribución de
la variable.
Ejemplo 43:

La duración de un evento tiene distribución Normal con media 10 y varianza 4.


Encuentre la probabilidad que el evento dure,

a) Menos de 9 horas
b) Entre 11 y 12 horas

Solución:

Ejemplo 44:

Sea X ~ N(10, s). Encuentre  tal que P(X = 9) = 0.025


Ejemplo 45:

Sea X ~ N(300, 50). Encuentre el valor de k tal que P(X>k) = 0.1075

Valores referenciales de la distribución normal

Hay ciertos valores de la distribución Normal de uso frecuente.


Si X es una variable aleatoria con distribución Normal, la probabilidad que tome
valores en un intervalo centrado en µ, hasta una distancia de una desviación estándar
s es aproximadamente 68%, hasta una distancia de 2s es aproximadamente 95%
y hasta una distancia de 3s es cercano a 100% como se demuestra a continuación:
.

5.4.2. Aproximación de la distribución binomial con la distribución normal


estándar
Sea X una variable aleatoria discreta con distribución Binomial con media µ = np, y
varianza 2 = np(1-p)

Entonces, el límite de la distribución de la variable aleatoria

− −
= = , ⟶∞
( − )

La aproximación es aceptable aún con valores pequeños de n, siempre que p esté


cerca de 0.5, o si simultáneamente:
np > 5 y n(1-p) > 5

Ejemplo 46:

En una fábrica, el 20% de los artículos salen defectuosos. Calcule la probabilidad


que en un lote de 100 artículos elegidos al azar, 15 sean defectuosos.
Solución:
EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL
AULA

60. Suponga que Z es una variable aleatoria con distribución Normal Estándar. Use
la tabla para calcular:
a) P(Z<1.45)
b) P(Z>2.01)
c) P(Z<-1.24)
d) P(Z>1.78)
e) P(-1.25<Z<2.31)

61. Suponga que X es una variable aleatoria con distribución Normal, con media 25 y
desviación estándar 5. Use la tabla para calcular
a) P(X<18)
b) P(X>30)
c) P(24<X<27)
62. Si X ~ N(10, 2) determine el valor de la varianza si P(X<9)=0.025

63. El peso de los artículos producidos por una fábrica tiene distribución Normal con
una media de 50 gr. y una desviación estándar de 5 gr.
a) Calcule la probabilidad que un artículo elegido al azar tenga un peso de más de
60 gr.
b) Calcule la proporción de los paquetes que tendrían un peso entre 46 y 54 gr.

64. El tiempo necesario para llenar un frasco de un producto es una variable aleatoria
que sigue una distribución Normal con una media de 10 segundos y una desviación
estándar de dos segundos.
a) Calcule la probabilidad que el tiempo de llenado exceda a 11 segundos
b) Encuentre el tiempo de llenado del frasco tal que la probabilidad de excederlo tenga
una probabilidad de 3%

65. Una fábrica de tornillos produce un tipo de tornillo con un diámetro promedio de
6.5 mm. y una desviación estándar de 1.5 mm. Suponiendo que la distribución es
Normal calcule la probabilidad de encontrar tornillos con diámetro,
a) mayor que 7mm.
b) entre 6 y 7 mm.

66. El pH de un químico tiene una distribución N(µ, 0.102)Durante la elaboración del


producto se ordena suspender la producción si el pH supera el valor 7.20 o es inferior
a 6.80.
a) Calcule la probabilidad que la producción no sea suspendida si µ=7.0
b) Calcule la probabilidad que la producción no sea suspendida si µ=7.05
c) Cual debe ser µ para que la probabilidad de que se suspenda la producción sea
0.85

67. La tolerancia especificada para aceptar los ejes producidos por una fábrica es que
el diámetro sea 0.45± 0.005 cm. Si los ejes producidos por la fábrica tienen
distribución Normal con media 0.452 y desviación estándar 0.003 cm., determine
cuantos ejes serán rechazados de cada lote de 500 ejes producidos.

68. Resolver los ejercicios del Texto guía pag. 185 ejercicios 6.1 al 6.23 pares,
relacionados con distribución contínua de probabilidades

69. Resolver los ejercicios del Texto guía pag. 193 ejercicios 6.24 al 6.38 pares,
relacionados con distribución contínua de probabilidades
CAPITULO VI. DISTRIBUCIONES DE MUESTREO.

OBJETIVOS ESPECÍFICOS:

 Tratar con muestras aleatorias y distribución muestral en ejemplos


 Resolver problemas de aplicación de distribuciones de muestreo

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

6.1 Muestreo: Definición, técnicas de muestreo.

6.2 Distribuciones de muestreo:


6.2.1 Teorema del límite central.
6.2.2 Distribución muestral para el promedio y proporciones.
6.2.3 Desviación estándar de la distribución de muestreo.

El propósito de un estudio estadístico suele ser, extraer conclusiones acerca de la


naturaleza de una población. Al ser la población grande y no poder ser estudiada en
su integridad en la mayoría de los casos, las conclusiones obtenidas deben basarse
en el examen de solamente una parte de ésta, lo que nos lleva, en primer lugar a la
justificación, necesidad y definición de las diferentes técnicas de muestreo.

6.1 CONCEPTOS PREVIOS

Nivel de confianza: Probabilidad de que la estimación efectuada se ajuste a la


realidad. Cualquier información que queremos recoger está distribuida según una ley
de probabilidad (Gauss o Student), así llamamos nivel de confianza a la probabilidad
de que el intervalo construido en torno a un estadístico capte el verdadero valor del
parámetro.

TIPOS DE MUESTREO
Muestreos No Probabilísticos

• de Conveniencia
• de Juicios
• por Cuotas
• de Bola de Nieve
• Discrecional

Muestreo por cuotas

También denominado en ocasiones "accidental". Se asienta generalmente sobre la


base de un buen conocimiento de los estratos de la población y/o de los individuos
más "representativos" o "adecuados" para los fines de la investigación. Mantiene, por
tanto, semejanzas con el muestreo aleatorio estratificado, pero no tiene el carácter de
aleatoriedad de aquél.

En este tipo de muestreo se fijan unas "cuotas" que consisten en un número de


individuos que reúnen unas determinadas condiciones, por ejemplo: 20 individuos de
25 a 40 años, de sexo femenino y residentes en Quito. Una vez determinada la cuota
se eligen los primeros que se encuentren que cumplan esas características. Este
método se utiliza mucho en las encuestas de opinión.

Muestreo casual o intencional


Se trata de un proceso en el que el investigador selecciona directa e
intencionadamente los individuos de la población. El caso más frecuente de este
procedimiento el utilizar como muestra los individuos a los que se tienen fácil acceso.
Un caso particular es el de los voluntarios.

Muestreo discrecional
A criterio del investigador los elementos son elegidos sobre lo que él cree que pueden
aportar al estudio. (muestreo por juicios)

Bola de nieve
Se localiza a algunos individuos, los cuales conducen a otros, y estos a otros, y así
hasta conseguir una muestra suficiente. Este tipo se emplea muy frecuentemente
cuando se hacen estudios con poblaciones "marginales", delincuentes, sectas,
determinados tipos de enfermos, etc.

Muestreos Probabilísticos

• Aleatorio Simple
• Aleatorio Sistemático
• Estratificado
• por Conglomerados
• Polietápico
• por Ruta Aleatoria

Los métodos de muestreo probabilísticos son aquellos que se basan en el principio


de equiprobabilidad. Es decir, aquellos en los que todos los individuos tienen la misma
probabilidad de ser elegidos para formar parte de una muestra y, consiguientemente,
todas las posibles muestras de tamaño n tienen la misma probabilidad de ser
elegidas. Sólo estos métodos de muestreo probabilísticos nos aseguran la
representatividad de la muestra extraída y son, por tanto, los más recomendables.
Muestreo aleatorio simple
El procedimiento empleado es el siguiente:
1) se asigna un número a cada individuo de la población; y
2) a través de algún medio mecánico (bolas dentro de una bolsa, tablas de
números aleatorios, números aleatorios generados con una calculadora u
ordenador, etc.) se eligen tantos sujetos como sea necesario para completar
el tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica
cuando la población que estamos manejando es muy grande

Muestreo aleatorio sistemático


Este procedimiento exige, como el anterior, numerar todos los elementos de la
población, pero en lugar de extraer n números aleatorios sólo se extrae uno. Se parte
de ese número aleatorio i, que es un número elegido al azar, y los elementos que
integran la muestra son los que ocupan los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es
decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de
la población entre el tamaño de la muestra: k=N/n. El número i que empleamos como
punto de partida será un número al azar entre 1 y k.
El riesgo se este tipo de muestreo está en los casos en que se dan periodicidades en
la población ya que al elegir a los miembros de la muestra con una periodicidad
constante (k) podemos introducir una homogeneidad que no se da en la población.

Muestreo estratificado
Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamaño dado de la muestra.
Consiste en considerar categorías típicas diferentes entre sí (estratos) que poseen
gran homogeneidad respecto a alguna característica (se puede estratificar, por
ejemplo, según la profesión, el sexo, el estado civil, etc). Lo que se pretende con este
tipo de muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona
independientemente, pudiendo aplicarse dentro de ellos el muestreo aleatorio simple
o el estratificado para elegir los elementos concretos que formarán parte de la
muestra. En ocasiones las dificultades que plantean son demasiado grandes, pues
exige un conocimiento detallado de la población. (N.S.E., sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina


afijación, y puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos
muestrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de
la población en cada estrato.

Muestreo por conglomerados

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de


la población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto,
etc, son conglomerados naturales. En otras ocasiones se pueden utilizar
conglomerados no naturales como, por ejemplo, las urnas electorales. Cuando los
conglomerados son área geográfica suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
número de conglomerados (el necesario para alcanzar el tamaño muestral
establecido) y en investigar después todos los elementos pertenecientes a los
conglomerados elegidos.

Muestreo Polietápico

Ante lo compleja que puede llegar a ser la situación real de muestreo con la que nos
enfrentemos es muy común emplear lo que se denomina muestreo polietápico. Este
tipo de muestreo se caracteriza por operar en sucesivas etapas, empleando en cada
una de ellas el método de muestreo probabilístico más adecuado (aleatorio simple,
estratificado, conglomerados, etc.). Según el número de etapas del muestreo, éste
puede denominarse bietápico, trietápico, etc.

Muestreo por rutas aleatorias

La selección de los miembros de la muestra se realiza como parte del trabajo de


campo.
• Establecida un área de muestreo, se define un punto de partida, sobre el que
se aplica una ruta predefinida en la que se van seleccionan-do los miembros
de la muestra con arreglo a un procedimiento heurístico.
• Busca asegurar una cobertura geográfica de la muestra y/o suplir la falta de
censo.
• No es aconsejable en planos no lineales o poco homogéneos en manzanas y
edificación.

6.2 DISTRIBUCIONES DE MUESTREO

Supóngase que se selecciona una muestra aleatoria de n mediciones de una


población con media µ y desviación estándar σ, la distribución de muestreo de la
media muestral tiene:
Media y desviación estándar
Ejemplo 1:

datos población
1 μ = 3,4
3 σ = 1,36
4
4
5

muestra n = 2
combinaciones

5
= = 10
2

MEDIA 2,5

1
muestra
3
MUESTRAL
2
2 distribución de muestreo
1 4 2,5 1,5
1 4 2,5 1
1 5 3 0,5
3 4 3,5
0
3 4 3,5
2 2,5 3 3,5 4 4,5
3 5 4
4 4 4
4 5 4,5
4 5 4,5

distribución
x f p(x) f*x
2 1 0,1 2
2,5 2 0,2 5
3 1 0,1 3
3,5 2 0,2 7
4 2 0,2 8
4,5 2 0,2 9
10 1 34

μ = 3,4
σx= 0,9591663

Distribución muestral de la media, es una distribución de probabilidad

Para el caso que se tenga una población conocida


̅ =
√ −1
Ejemplo 2:

Un fabricante especifica que la duración de sus baterías tiene Distribución Normal con
media 36 meses y desviación estándar 8 meses. Calcule la probabilidad que una
muestra aleatoria de 9 baterías tenga una duración media menor o igual que 30
meses.

6.2.1. Teorema del Límite Central

El siguiente enunciado es uno de los más importantes teoremas de la Estadística


Inferencial

Si es la media de una muestra aleatoria de tamaño n tomado de una población


con media µ y desviación estándar σ, entonces:


=
̅

̅ =

Representa el valor de una variable aleatoria Z, cuya función de distribución se
aproxima a la distribución normal estándar, cuando n →∞
.
La aproximación normal para será aceptable cuando n≥30 y si n< 30 esta
aproximación es aceptable si la población está distribuida normalmente.

6.2.2 Distribución de muestreo de proporciones

Existen ocasiones en las cuales no estamos interesados en la media de la muestra,


sino que queremos investigar la proporción de artículo s defectuosos o la proporción
de personas con teléfono, etc. en la muestra. La distribución muestral de proporciones
es la adecuada para dar respuesta a estas situaciones. Esta distribución se genera
de igual manera que la distribución muestral de medias, a excepción de que al extraer
las muestras de la población se calcula el estadístico proporción (p=x/n en donde “ x
” es el número de éxitos u observaciones de interés y “ n ” el tamaño de la muestra)
en lugar de la media de cada muestra que era lo que calculamos antes.

El siguiente diagrama sirve para explicar el concepto de distribución muestral de


proporciones.

La distribución muestral de proporciones está estrechamente relacionada con la


distribución binomial; una distribución binomial es una distribución del total de éxitos
en las muestras, mientras que una distribución de proporciones es la distribución de
un promedio (media) de los éxitos. Como consecuencia de esta relación, las
afirmaciones probabilísticas referentes a la proporción muestral pueden evaluarse
usando la aproximación normal a la binomial, siempre que: np ≥ 5 y n(1-p) ≥ 5

Generación de la Distribución Muestral de Proporciones


Ejemplo 3:

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos.
Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Vamos a generar
la distribución muestral de proporciones para el número de piezas defectuosas. Como
se puede observar en este ejercicio la proporción de artículos defectuosos de esta
población es P = 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de
este lote están defectuosas. El número posible de muestras de tamaño 5 a extraer de
una población de 12 elementos es 12 C 5=792, las cuales se pueden desglosar de la
siguiente manera:

Para calcular la media de la distribución muestral de proporciones se tendría que


hacer la sumatoria de la frecuencia por el valor de la proporción muestral y dividirla
entre el número total de muestras. Esto es:

Como podemos observar la media de la distribución muestral de proporciones es igual


a la proporción de la población.

La desviación estándar de la distribución muestral de proporciones del ejemplo se


puede calcular directamente con los datos:

Desviación Estándar para proporciones

Fórmula para la desviación estándar de la distribución muestral de proporciones:

Notar que P es la proporción de la población pero n es el tamaño de la muestra

Cuando, como vimos antes, si contamos con una población finita y un muestreo sin
reemplazo, para calcular la desviación estándar usamos la corrección (Como regla
aproximada, si el muestreo se hace sin reemplazo y el tamaño de la población es al
menos 20 veces el tamaño de la muestra, entonces se puede usar la fórmula).

Ejemplo 4:
Para el ejemplo anterior tendríamos la siguiente distribución de probabilidades:
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral
de proporciones está basada en la aproximación de la distribución binomial a la
normal. Esta fórmula nos servirá para calcular la probabilidad del comportamiento de
la proporción en la muestra.

A la fórmula anterior se le puede agregar el factor de corrección (en el


denominador):

Ejemplo 5:

Se ha determinado que 85.1% de los estudiantes de una universidad fuman


cigarrillos. Se toma una muestra aleatoria de 200 estudiantes. Calcular la
probabilidad de que no más de 80% de alumnos de la muestra fume.
Solución:
La media o valor esperado de la proporción muestral es de P=0.851, por lo que:

Usando las tablas de valor z, para z = -2.02 encontramos que la probabilidad de que
no más de 80% de los alumnos de la muestra fumen es de 0.0214 o sea 2.14%
EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL
AULA

1. Un fabricante especifica que cada paquete de su producto tiene un peso promedio


22.5 gr. Con una desviación estándar de 2.5 gr. Calcule la probabilidad que una
muestra aleatoria de 40 paquetes de este producto tenga un peso promedio menor o
igual que 20 gr.

2. Una máquina envasadora de refrescos está programada para que la cantidad de


líquido sea una variable aleatoria con distribución normal, con media 200 mililitros y
una desviación estándar de 10 mililitros. Calcule la probabilidad que una muestra
aleatoria de 20 envases tenga una media menor que 185 mililitros

3. La altura media de los alumnos de un plantel secundario es 1.50 m. con una


desviación estándar de 0.25 m. Calcule la probabilidad que en una muestra aleatoria
de 36 alumnos, la media sea superior a 1.60 m.

4. Resolver los ejercicios del Texto guía pag. 229 ejercicios 8.1 al 8.15 pares,
relacionados con distribución contínua de probabilidades

5. Resolver los ejercicios del Texto guía pag. 242 ejercicios 8.16 al 8. pares,
relacionados con distribución contínua de probabilidades
CAPITULO VI. ESTIMACIONES

OBJETIVOS ESPECÍFICOS:

 Utilizar una muestra que realmente sea representativa de la población y de un


tamaño suficiente
 Determinar el tamaño de la muestra para grupos de datos pequeños y grandes

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

7.1 Tamaño de la muestra.


7.2 Estimaciones: Definición, estimación puntual y de intervalo.
7.3 Estimación puntual y de intervalo de promedios para muestras grandes y
pequeñas.
7.4 Estimación puntual y de intervalo de proporciones para muestras grandes y
pequeñas.

7.1 TAMAÑO DE LA MUESTRA.

La estimación puntual está referida a la elección de un estadístico, es decir, un


número calculado a partir de datos muestrales que proporcione un valor que este
cerca del parámetro que se quiere estimar. El estadístico que se emplea para
obtener una estimación puntual se denomina estimador. Se debe tratar de lograr
un estimador insesgado; es decir, que la media de la distribución muestral sea igual
al parámetro a estimar. En la práctica nos podemos encontrar con varios
estimadores, y se tendría queescoger el más adecuado; para ello se puede aplicar
el siguiente criterio:
Si se tiene dos estimadores θ1 y θ2 insesgados del parámetro θ (estimador insesgado
significa que su media o valor esperado coincide con el parámetro θ) se dice que θ1
es más eficiente que θ2 si:
θ1 y θ2 son estimadores insesgados de θ .
La varianza de la distribución muestral de θ1 es menor que la de θ2.
El problema que se presenta con el estimador puntual es que el más eficiente es
improbable que estime con exactitud el valor del parámetro de la población. Por lo
tanto, es preferible determinar un intervalo dentro del cual se esperaría hallar
el valor del parámetro. Es donde aparecen lo que se conoce como intervalos
de confianza y es el tema que se desarrollará a continuación.
7.2 ESTIMACIÓN POR INTERVALOS.
La estimación por intervalo es la referente a los parámetros: media, proporción,
varianza y razón de varianzas.

7.3 ESTIMACIÓN PUNTUAL Y DE INTERVALO DE PROMEDIOS PARA


MUESTRAS GRANDES Y PEQUEÑAS.

7.3.1. Intervalo de confianza para µ con σ conocida.


La utilización de este tipo de estimación requiere la aclaratoria de varios puntos.
El intervalo proporciona dos extremos entre los cuales se debe encontrar la
media poblacional, con nivel de confianza o certeza de (1-α)100%; para hallar
estos extremos se utiliza la media de una muestra de la población, el valor de z se
delimita un área α/2 a su derecha en la distribución normal estándar; la varianza de
la población y el tamaño de la muestra. Es de hacer nota que este tipo de intervalos
cuando n≥30. En el caso de no conocer la desviación poblacional σ se puede
utilizar la desviación s, estimada de la muestra

Si ̅ es la media de una muestra aleatoria de tamaño n de una población con


varianza conocida, un intervalo de confianza de (1 − α) 100% para µ está dado
por

Donde zα/2 es el valor z que delimita en área de α/2 a su derecha

El teorema siguiente se refiere al error muestral, el cual acota la diferencia entre


la media muestral y la poblacional.
Si se utiliza ̅ como una estimación de µ , se puede tener entonces una confianza
de (1-α)100% de que el error e muestral esta dado por:

Ejemplo 1:
En una semana determinada se elige al azar una muestra de 200 empleados de una
población de que se dedica al trabajo a destajo, y se encuentra que el promedio de
pago por pieza trabajada es 1700 dólares, con una desviación estándar muestral de
140 dólares.
a) Halle el intervalo de confianza del 95% para el promedio poblacional de pago
por pieza trabajada.
b) Calcular el error muestral.
Solución:
µ : Promedio poblacional de pago por pieza trabajada

Para hallar el valor de zα/2 se procede así: El nivel de confianza es (1-α)100% = 95%
; ya que la tabla (Distribución Normal Estándar anexo texto guía) da el área a la
izquierda, esta será de 1 - 0,025 = 0,975, y por tanto el valor de zα/2 = z0.025 = 1,96. Este
valor se encuentra, ubicando el área 0,975 en la tabla de probabilidades (tabla
3) y luego relacionando la primera columna con la primera fila.
De la definición 8.6 se tiene que el intervalo de confianza esta dado por:

Interpretación: Se espera que el promedio poblacional de pago por pieza trabajada,


este entre 1680,6 dólares y 1719,4 dólares, con un nivel de confianza del 95%, se
tiene que el error muestral esta dado por:

Interpretación: El nivel de error muestral no excederá de 19,4. Es decir que la


diferencia, en valor absoluto, entre la media muestral y la poblacional no excederá
de 19,4 dólares.

Con frecuencia se desea saber qué tan grande deberá ser la muestra, para
asegurar que el error al estimar el parámetro µ será menor que una cantidad
específica e.

Si se utiliza ̅ como una estimación de µ , se puede tener entonces una confianza


de (1-α)100% de que el error será menor que una cantidad específica “e” cuando
el tamaño de la muestra n, según sea el caso, venga dado por la respectiva fórmula
a) Si el tamaño poblacional N es desconocido

b) Si el tamaño poblacional N (población grande) es conocido

c) Si el tamaño poblacional N (población pequeña) es conocido.

A medida que N/N-1 se aproxime a 1, se considera población grande


UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Ejemplo 2:
Un gerente quiere determinar el tiempo que un mecánico tarda en intercambiar los
neumáticos de un automóvil, y además desea poder asegurar con un nivel de
confianza del 95% que la media de su muestra sea a lo sumo de 0,4 minutos. Se
sabe que la desviación estándar es de 1,4 minutos.
a) ¿Qué tan grande debe ser el tamaño de la muestra si se desconoce el
tamaño poblacional?
b) ¿Qué tan grande debe ser el tamaño de la muestra si el tamaño poblacional es
de 40 horas?
Solución:
µ : Promedio poblacional del tiempo que un mecánico tarda en intercambiar los
neumáticos de un automóvil.
Utilizando la tabla de distribución normal, se tiene que:
(1-α)100% = 95% → zα/2 = 1,96
e = 0,4
σ = 1,4

Interpretación: Se requiere de una muestra de 47 horas para estimar el promedio


poblacional del tiempo que un mecánico tarda en intercambiar los neumáticos de
un automóvil, con un nivel de confianza de 95% y un error muestral de 0,4
horas. Sin conocer el tamaño poblacional.

b) si se conoce la población, se tiene que:

Interpretación: Se requiere de una muestra de 21,873 horas para estimar el


promedio poblacional del tiempo que un mecánico tarda en intercambiar los
neumáticos de un automóvil, con un nivel de confianza de 95% y un error muestral
de 0,4 horas. Si se sabe que el tamaño poblacional es de 40 horas

141
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

7.3.2. Intervalo de confianza para muestras pequeñas para µ; con σ


desconocido.

En el caso de que el tamaño muestral sea n<30, se recomienda utilizar la


distribución t de Student para establecer el intervalo de confianza. Suponiendo que la
población está distribuida normalmente.
Si la ̅ y s son la media y la desviación estándar de una muestra aleatoria de tamaño
n < 30, tomada de una población aproximadamente normal con varianza
desconocida σ2, un intervalo de confianza (1 − α)100% para µ estará dada por:

Donde tα/2 es el valor de t, con v = n-1 grados de libertad, que delimitaran el área de
α/2 a la derecha
Ejemplo 3:
La vida útil promedio de una muestra aleatoria de 20 focos es 4500 horas, con una
desviación estándar muestral de 250 horas. Se supone que la vida útil de los focos
tiene una distribución aproximadamente normal. Halle el intervalo de confianza del
95%; para el promedio poblacional de vida de los focos
Solución:
µ: Promedio poblacional de vida de los focos
̅ = 4500 s= 250 n=20
Utilizando la tabla del anexo texto guía

Calculando el intervalo de confianza

142
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Interpretación: Se espera que el promedio poblacional de vida de los focos, este


entre 4383 horas y 4617 horas, con un nivel de confianza del 95%.

7.4. ESTIMACIÓN PUNTUAL Y DE INTERVALO DE PROPORCIONES PARA


MUESTRAS GRANDES Y PEQUEÑAS.

En muchas aplicaciones interesa conocer el valor de un índice, tasa, etc., la cual


representa la proporción de datos que consideramos “favorables” del total de datos
en la población.

En estas situaciones el modelo de probabilidad es la distribución binomial. Este


modelo requiere conocer el valor de probabilidad de "exito" p en cada ensayo. Por lo
tanto, es de interés práctico determinar o al menos estimar el valor de este parámetro
poblacional p.

Sea una variable aleatoria X con distribución binomial, con media µ=np y varianza
σ2= npq.

De esta población se toma una muestra de tamaño n y se obtienen x datos


favorables. La relación x/n se denomina proporción muestral p y es un estimador
para el parámetro p.

143
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Ejemplo 4:

144
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Cuadro resumen de las estimaciones

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

1. Encuestas anteriores revelaron que 30% de los turistas que van a jugar (casino),
durante un fin de semana gastaron más de $1000. La gerencia desea actualizar ese
porcentaje.
a) Utilizando el grado de confianza de 0.90, la gerencia desea estimar el
porcentaje de turistas que gastan más de $1000 dentro de 1%. ¿Qué tamaño
de muestra debe emplearse?
b) La gerencia mencionó que el tamaño de la muestra señalado en la parte (a)
es demasiado grande. Sugiera algo que pueda hacerse para reducir la
145
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

magnitud muestral. Con base en su sugerencia, calcule una vez más el


tamaño de la muestra.

2. La estimación de la proporción poblacional se encuentra entre ±10, con un nivel


de confianza de 99%. El mejor cálculo de la proporción de la población es 0.45.
¿Qué tamaño necesita tener la muestra?

3. Un procesador de zanahorias corta la parte superior verde de cada una, las lava
luego y coloca seis por paquete. Se colocan veinte paquetes en una caja para su
envío. Se revisan algunas cajas para determinar su peso. El peso promedio fue de
20.4 libras, y la desviación estándar 0.5 libras. ¿Cuántas cajas debe muestrear el
procesador para tener un 95% de seguridad de que la media muestral no difiera de
la media poblacional en más de 0.2 libras?

4. A través de una encuesta realizada a 800 personas sobre la elección de alcalde


de una ciudad, se estimó que la proporción de votantes al canditato A estaba entre
el 54% y el 59%. ¿Con qué nivel de confianza se realizó la estimación?

5. Para estimar la proporción de las familias de una determinada ciudad que poseen
microondas, se va a tomar una muestra aleatoria de tamaño n. Calcula el mínimo
valor de n para garantizar que, con un nivel de confianza del 95%, el error en la
estimación sea menor que 0,05. (Ya que se desconoce la proporción, se tiene que
tomar el caso más desfavorable de que sea 0,5).

6. Una moneda está trucada de manera que 40 de cada 100 veces que se lanza
sale cara. ¿Cuántas veces se ha de lanzar esta moneda, como mínimo, para que la
proporción de caras obtenidas no difiera de la proporción verdadera en más de un
2%, con un nivel de confianza del 90%? .

7. Queremos estimar, con un nivel de confianza del 99%, la proporción de alumnos


de cierto instituto que tienen dos o más hermanos. ¿De qué tamaño mínimo
tendremos que seleccionar la muestra si admitimos un error máximo de 0,1? (En
otro estudio reciente se obtuvo que esta proporción era de 0,4).

8. Una muestra de 300 cerrojos producidos por una máquina mostró que 20 eran
defectuosos, mientras que de 150 cerrojos de otra máquina 17 eran defectuosos.
Estimar la diferencia de las proporciones de los cerrojos defectuosos producidos por
las dos máquinas; con un nivel de confianza del 95%.

9. Se está considerando un cambio en un procedimiento de fabricación de


determinadas partes componentes. Se seleccionan muestras utilizando el
procedimiento existente y el procedimiento nuevo, a fin de tomar una decisión si el
nuevo procedimiento da mejores resultados. Si 95 de 1800 partes
manufacturadas con el procedimiento existente y 90 de 2300 fabricados con el
nuevo, resultaron con defectos, estime el intervalo de confianza para la diferencia
de las proporciones de partes defectuosas producidas por los dos procedimientos.
146
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

10. El gerente de una fábrica de baterías afirma que éstas durarán en promedio 2
años, con una varianza de un año. Si 6 de estas baterías tienen tiempos de duración
de 1,9,2,5, 3,1 y 4,5 años, estime el intervalo de confianza del 95% para la varianza
y decida si es válida la afirmación del gerente. Supóngase la población distribuida
normalmente.

147
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

CAPITULO VIII. PRUEBAS DE HIPOTESIS CON UNA Y DOS


MUESTRAS
OBJETIVOS ESPECÍFICOS:
 Aplicar correctamente la Prueba de Hipótesis en la estadística inferencial
 Resolver problemas de comercio exterior y problema del contexto
 Conocer correctamente el procedimiento de la Prueba de Hipótesis y cómo
influye en diversos problemas planteados los cuales pueden ser solucionados.

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

8.1 Prueba de hipótesis: Definición, métodos de las pruebas de hipótesis.


8.2 Prueba de hipótesis para el promedio, muestras grandes y pequeñas.
8.3 Pruebas de hipótesis para proporciones, muestras grandes y pequeñas.

8.1 PRUEBA DE HIPÓTESIS: DEFINICIÓN, MÉTODOS DE LAS PRUEBAS DE


HIPÓTESIS

Esta técnica estadística es muy utilizada como soporte a la investigación sistemática


y científica. Consiste en suponer algún valor para el parámetro de interés y usar los
datos de la muestra para aceptar o rechazar esta afirmación.

Es importante entender las diferentes situaciones que pueden ocurrir al probar


estadísticamente una hipótesis.

Sea Ho: alguna hipótesis que se propone para el parámetro de interés

Suponer que se dispone de datos y que se realiza una prueba estadística para
verificar la hipótesis. Entonces pueden ocurrir las siguientes situaciones al tomar una
decisión:

148
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Suponer que la hipótesis propuesta Ho es verdadera, pero la prueba estadística dice


que Ho es falsa, entonces al rechazar la hipótesis propuesta cometemos el Error
Tipo I
Suponer que la hipótesis propuesta Ho es falsa, pero la prueba estadística dice que
Ho es verdadera, entonces al aceptar la hipótesis propuesta cometemos el Error
Tipo II.

Ambos errores pueden tener consecuencias importantes al tomar una decisión en una
situación real. Por lo tanto es necesario cuantificar la probabilidad de cometer cada
tipo de error.

El valor α se denomina nivel de significancia de la prueba y puede darse como un


dato para realizar la prueba.
Algunos valores típicos para α son: 10%, 5%, 2%, 1%

TIPOS DE PRUEBAS
Sean θ: Parámetro de interés
θ0: Algún valor que se propone para el parámetro
Pruebas de una cola
1) Ho: θ = θ0: (Hipótesis nula)
Ha: θ < θ0: (Hipótesis alterna)

2) Ho: θ = θ0: (Hipótesis nula)


Ha: θ > θ0: (Hipótesis alterna)

Prueba de dos colas


3) Ho: θ = θ0: (Hipótesis nula)
Ha: θ < θ0 ∨ θ > θ0: (Hipótesis alterna)

8.2 PRUEBA DE HIPÓTESIS PARA EL PROMEDIO, MUESTRAS GRANDES Y


PEQUEÑAS

Prueba de Hipótesis relacionada con la media


149
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Caso n ≥ 30 (Muestra grande)


Parámetro: μ (media poblacional)
Población con varianza σ2, distribución desconocida,
Estimador: ̅ (media muestral)
Valor propuesto para el parámetro: μ0

Procedimiento
Paso 1. Formular la hipótesis nula: Ho: μ = μ0

Paso 2. Formular una hipótesis alterna, la cual es de interés probar. Elegir una entre:
1) Ha: μ > μ0
2) Ha: μ < μ0
3) Ha: μ < μ0 ∨ μ > μ0

Paso 3. Especificar el nivel de significancia de la prueba: α

Paso 4. Seleccionar el estadístico de prueba y definir la región de rechazo de Ho


En este caso, por el Teorema del Límite Central, el estadístico

= , tiene Distribución Normal Estándar aproximadamente


/√
La región de rechazo depende de la hipótesis alterna elegida Ha y está determinada
por el valor de α especificado. Se analiza la primera situación: 1) Ha: μ > μ0

150
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Paso 5. Calcular el valor del estadístico de prueba con los datos de la muestra

Paso 6. Tomar una decisión


Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es
rechazar Ho en favor de Ha. Pero, si el valor no cae en esta región crítica, se dice
que no hay evidencia suficiente para rechazar Ho. En este caso es preferible
abstenerse de aceptar como verdadera Ho pues esto puede introducir el Error tipo
II

Ejemplo 1:

Una muestra aleatoria de 100 paquetes mostró un peso promedio de 71.8 gr. con una
desviación estándar de 8.9 gr.
Pruebe, con un nivel de significancia de 5%, que el peso promedio de todos los
paquetes (población) es mayor a 70 gr.
Seguimos los pasos indicados en el procedimiento básico indicado anteriormente:

151
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

El análisis anterior permite interpretar las otras dos situaciones para la hipótesis
alterna:

152
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Caso n<30 (Muestras pequeñas)


Parámetro: μ (Es la medida poblacional cuyo valor se desea estimar)
Población con distribución normal, varianza σ2 desconocida
Estimador T (Variable aleatoria con distribución T, con ν = n-1 )
Valor propuesto para el parámetro: μ0

Para realizar inferencias se usa una variable aleatoria con distribución T


= con ν = n –1 grados de libertad Xs/n−μ
/√

PROCEDIMIENTO BÁSICO

PASOS
1. Formular la hipótesis nula: Ho: μ = μ0

2. Formular una hipótesis alterna. Elegir una entre:


Ha: μ < μ0
Ha: μ > μ0
Ha: μ ≠ μ0

3. Especificar el nivel de significancia de la prueba: α

4. Seleccionar el estadístico de prueba y definir la región de rechazo de Ho


153
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

= , tiene distribución t con ν = n–1 grados de libertad oXts/n−μ=


/√
Ha Región de rechazo de Ho en favor de Ha
μ < μ0 t < -tα
μ > μ0 t > tα
μ ≠< μ0 t <-tα/2 ∨ t > tα/2

5. Con los datos de la muestra calcular el valor del estadístico

6. Si el valor del estadístico de prueba cae en la región de rechazo, la decisión es


rechazar Ho en favor de Ha. Pero, si el valor no cae en esta región crítica, se dice
que no hay evidencia suficiente para rechazar Ho. En este caso es preferible
abstenerse de aceptar Ho como verdadera pues esto puede introducir el error tipo II

Ejemplo 2:

De una población normal se tomó una muestra aleatoria y se obtuvieron los


siguientes resultados: 15, 17, 23, 18, 20. Probar con una significancia de 10% que la
media de la población es mayor a 18
Solución
1. Ho: μ = 18

2. Ha: μ >18

3. Nivel de significancia de la prueba α = 0.10

4. Estadístico de prueba
= /√
, tiene distribución T con ν = n – 1 grados de libertad
̅ = 1/5 (15+17+23+18+20)=18.6
S2 = ((15-18.6)2 + (17-18.6)2 + ... ) = 9.3 ⇒ S = 3.05 14

Región de rechazo de Ho

α = 0.1 , ν = 5 – 1 = 4 ⇒ t0.1 = 1.53 con la Tabla T

Rechazar Ho si t > 1.53


.
5. = . /√ = = 0.44 ⇒ 0.44 no cae en la región de rechazo 18.6183.05/5−

6. Decisión

No hay evidencia suficiente para rechazar que la media poblacional es 18.

154
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

8.3 PRUEBAS DE HIPÓTESIS PARA PROPORCIONES, MUESTRAS GRANDES Y


PEQUEÑAS

El Valor–p de una prueba de hipótesis, o Probabilidad de Cola, es el valor de


probabilidad correspondiente al área de la cola (o colas), a partir del valor observado
y representa el nivel de significancia obtenido con la muestra.

Si esta probabilidad es pequeña, es un indicativo de que los datos de la muestra no


apoyan a la hipótesis nula propuesta pues el valor del estadístico de prueba se ubica
lejos del valor propuesto para el parámetro. Pero si esta probabilidad es grande,
significa que los datos de la muestra favorecen a la hipótesis nula pues el valor del
estadístico se ubica cerca del valor especificado para el parámetro

Ejemplo 3:

Una muestra aleatoria de 100 paquetes mostró un peso promedio de 71.8 gr. con una
desviación estándar de 8.9 gr. Pruebe que el peso promedio de todos los paquetes
(población) es mayor a 70 gr. Exprese la respuesta mediante el Valor p de la prueba

155
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

1. Una muestra de 64 observaciones se selecciona de una población normal. La


media muestral es 215 y la desviación estándar 15: Realice la siguiente prueba de
hipótesis utilizando un nivel de significancia de 0.03

: ≥ 220
: < 220

2. Cuando Isabel Benítez fue contratada como camarera en un restaurante, se le dijo:


”Puedes obtener, en promedio, más de $20 al día por propinas”. A los primeros 35
días de su trabajo en el restaurante, el importe medio diario de las propinas recibidas
fue de $24.85, con una desviación estándar de $3.24. Al nivel de significancia de 0.01,
¿puede la señorita Benítez concluir que está ganando más de $20 por las propinas?

3. Una muestra de 65 observaciones se seleccionó de una población. La media de la


muestra es 2.67 y la desviación estándar 0.75. Una muestra de 50 observaciones se
tomó de una segunda población. La media de la muestra es 2.59 y la desviación
estándar 0.66. Efectúe la siguiente prueba de hipótesis utilizando el nivel de
significancia de 0.08

: =
: ≠

4. Un estudio se realiza comparando el costo de alquilar o rentar un departamento


de una recamara en Cuenca, con el correspondiente costo de hacerlo en Quito. Una
muestra de 35 departamentos en Cuenca mostró el valor medio de las rentas era de
$370, con una desviación estándar de $30. Una muestra de 40 departamentos en
Quito señaló que la renta media es de $380, con una desviación estándar de $26. Al
nivel de significancia de 0.05, ¿existe una diferencia en las rentas medias entre
Cuenca y Quito?

5. Un estudio estipula que 52% de los automovilistas que usan las autopistas son
varones. Una muestra de 300 autos que ayer viajaron hacia el este por una
autopista, reveló que 170 fueron conducidos por hombres. Al nivel de significancia
de 0.01, ¿se puede concluir que una mayor proporción de varones conducían por la
autopista, que lo que indican las estadísticas del estudio?

6. Una muestra aleatoria de n=40 observaciones tomada de una población en


estudio, produjo una media =2.4 y una desviación estándar S=0.28. Suponga que se
desea demostrar que la media poblacional μ es mayor a 2.3 X
a) Enuncie la hipótesis nula para la prueba
b) Enuncie la hipótesis alterna para la prueba

156
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

c) Use su intuición para predecir si el valor de la media muestral = 2.4 es suficiente


evidencia para afirmar que la media poblacional μ es mayor que el valor propuesto
2.3 X
d) Realice la prueba de hipótesis con un nivel de significancia de α=0.05 y determine
si los datos son evidencia suficiente para rechazar la hipótesis nula en favor de la
hipótesis alterna.

7. Repita el ejercicio 6) con los mismos datos, pero suponiendo que se desea
demostrar que la media poblacional es menor que 2.7

8. Repita el ejercicio 6) con los mismos datos, pero suponiendo que se desea
demostrar que la media poblacional es diferente que 2.7

9. Una muestra aleatoria de 10 observaciones tomada de una población con


distribución normal produjo una media 2.5 y una desviación estándar 0.28. Suponga
que se desea demostrar que la media poblacional es mayor a 2.3
a) Enuncie la hipótesis nula para la prueba
b) Enuncie la hipótesis alterna para la prueba
c) Use su intuición para predecir si el valor de la media muestral es suficiente
evidencia para afirmar que la media poblacional es mayor que el valor propuesto
d) Realice la prueba de hipótesis con un nivel de significancia de 5% y determine si
los datos son evidencia suficiente para rechazar la hipótesis nula en favor de la
hipótesis alterna.

10. El peso de seis artículos de una muestra aleatoria tomada de la producción de


una fábrica fueron: 0.51, 0.59, 0.52, 0.47, 0.53, 0.49 kg. Pruebe si estos datos
constituyen una evidencia suficiente para afirmar que el peso promedio de todos los
artículos producidos por la fábrica es mayor a 0.5 Kg. Encuentre el valor p o nivel de
significancia de la prueba. Suponga distribución normal.

157
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

CAPITULO IX. REGRESIÓN Y CORRELACIÓN LINEAL


OBJETIVOS ESPECÍFICOS:

 Desarrollar el modelo de regresión lineal


 Aplicar el modelo de regresión lineal en problemas prácticos

CONOCIMIENTOS PREVIOS:

 Dominio de matemática básica, operaciones fundamentales

CONTENIDO:

9.1 Regresión lineal: Definiciones, diagrama de dispersión.


9.2 Modelo de regresión lineal simple.
9.3 Modelo de regresión y ecuación de regresión.
9.4 Ecuación de regresión estimada.
9.5 Método de los mínimos cuadrados.
9.6 Coeficiente de determinación.
9.7 Coeficiente de correlación.
9.8 Uso de la ecuación de regresión para evaluar y predecir.
9.9 Aplicación con software estadístico.

REGRESIÓN LINEAL: DEFINICIONES

El propósito de este estudio es proporcionar los conceptos y técnicas para construir


modelos matemáticos que describan de manera apropiada a un conjunto de datos,
cuando la relación es de tipo lineal. Estos modelos son útiles para realizar pronósticos.
Este estudio se denomina análisis de regresión y el objetivo es estimar la ecuación
de regresión la cual es la recta teórica poblacional (desconocida) de la cual provienen
los datos.
Suponer que se tiene un conjunto de n mediciones u observaciones (x1, y1), (x2,
y2),...,(xn, yn)
Estas observaciones provienen de las variables X y Y. La variable X se denomina
variable de predicción mientras que la variable Y se denomina variable de
respuesta.

Se supondrá que existe una correspondencia de X a Y y el objetivo es modelar esta


relación.

Cada valor yi es una observación o el resultado de una medición, por lo tanto pudiesen
haber otros valores yi para el mismo valor de xi. Esto permite entender que yi es uno
de los posibles resultados de la variable aleatoria Yi. Una variable aleatoria debe tener
una distribución de probabilidad. El siguiente gráfico permite visualizar esta
suposición:

158
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Si la relación entre X y Y tiene “tendencia lineal”, lo cual puede reconocerse graficando


los puntos en una representación que se denomina gráfico de dispersión, entonces
es razonable proponer un modelo lineal para describir la relación y que tome en
cuenta la aleatoriedad de Y

Definición: Modelo de regresión lineal probabilista (modelo poblacional desconocido)

En donde β0 y β1 son los parámetros del modelo y ε es el componente aleatorio de Y

Se supondrá que para cada variable aleatoria Yi el componente aleatorio εi tiene la


misma distribución de probabilidad y que además estos componentes son variables
independientes:

εi ∼ N(0, σ2) (distribución normal con media 0 y varianza desconocida σ2)

Con este planteamiento, el valor esperado de este modelo constituye la recta teórica
que describe al modelo poblacional desconocido.

E[Y] = β0 + β1 x

El modelo poblacional teórico tiene dos parámetros β0 (intercepción) y β1 (pendiente)

159
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Ejemplo 2:

Se desea construir un modelo de regresión para relacionar las calificaciones parcial y


final en cierta materia, utilizando una muestra aleatoria de 10 estudiantes que han
tomado esta materia:

RECTA DE MÍNIMOS CUADRADOS


160
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

El siguiente procedimiento matemático permite usar los datos dados para construir
una recta de la cual se obtienen estimadores para los parámetros β0 y β1 de la recta
de regresión poblacional β0 + β1 x,

Se trata de colocar una recta entre los puntos dados, de la forma mejor balanceada
con el criterio de hacer que la suma de las distancias de la recta a los puntos sea la
menor posible. Esta recta se denomina recta de mínimos cuadrados.

Suma de los cuadrados del error

Ejemplo 3:
Obtener la recta de mínimos cuadrados para el ejemplo

161
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

COEFICIENTE DE CORRELACIÓN

Para determinar el tipo de relación lineal entre las variables x y y del modelo de
regresión lineal se usa el coeficiente de correlación lineal que se define a
continuación:
Para simplificar la escritura se establecen las siguientes definiciones

Coeficiente de correlación

El signo de r es igual al signo de la pendiente de la recta de regresión lineal 1β


Si el valor de r es cercano a 1 significa que hay una fuerte relación lineal positiva ente
xyy
Si el valor de r es cercano a -1 significa que hay una fuerte relación lineal negativa
ente x y y
162
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

Si el valor de r es cercano a 0 significa que hay poca relación lineal ente x y y

Ejemplo 3:
Calcular el coeficiente de correlación para el ejemplo

163
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

EJERCICIOS Y PROBLEMAS PROPUESTOS PARA SER RESUELTOS EN EL


AULA

1. La tabla adjunta muestra las puntuaciones finales en Álgebra y Física de 10


estudiantes elegidos al azar entre un gran número de ellos. a) Representar los
datos. b) Hallar la recta de mínimos cuadrados que se ajuste a los datos, tomando X
como variable independiente. c) Si un estudiante tiene una puntuación de 75 en
Álgebra, ¿cuál es la puntuación de Física esperada?

Álgebra X 75 80 93 65 87 71 98 68 84 77

Física Y 82 78 86 72 91 80 95 72 89 74

2. El número Y de bacterias por unidad de volumen presentes en un cultivo después


de X horas esta dado en la tabla adjunta.

a) Representar los datos (gráfico)


b) Ajustar una curva de mínimos cuadrados de la forma Y  ab X a los datos y
explicar por qué esta ecuación particular da buenos resultados.
c) Comparar los valores de Y obtenidos de esta ecuación con los valores reales.
d) Estimar Y cuando X=7

Número de horas X 0 1 2 3 4 5 6

Número de bacterias Y 32 47 65 92 132 190 275

3. Los siguientes datos, en miles de dólares, representan los ingresos por ventas vs.
los gastos de promoción de un producto:
Gastos: 0.5 1.0 1.5 2.0 2.5 3.0
Ingresos: 3.5 4.1 5.5 7.2 8.7 9.5

Suponga que la variable de predicción (X) corresponde a los gastos, y la variable de


respuesta (Y) se refiere a los ingresos.
a) Construya un diagrama de dispersión de los datos
b) Encuentre la recta de mínimos cuadrados
c) Calcule el coeficiente de correlación e interprete el resultado

164
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

BIBLIOGRAFIA:

Walpole, R. Myers, R. Myers, S. Ye, K. (2012). Probabilidad y Estadística para


Ingeniería y Ciencias. Novena edición, PEARSON Prentice Hall, (México).

Galindo E. (2010). Estadística métodos y aplicaciones. Segunda edición. Prociencia


Editores, Ecuador.

Triola M. (2009). Estadística. Décima edición. Pearson Educación, México

Milton, J. Arnold J. (2004). Probabilidad y estadística: con aplicaciones para


ingeniería y ciencias computacionales. Cuarta edición, MCGRAW-HILL, (México).

Montgomery, D. Runger, G. (2003). Probabilidad y estadística aplicadas a la


ingeniería. Segunda Edición. Editorial Limusa. Ecuador

Rodriguez L. (2007). Probabilidad y Estadística Básica para Ingenieros. Primera


Edición. Editorial ESPOL. Ecuador

Depool, R. Monaterio. D. (2013). Probabilidad y estadística aplicaciones a la


ingeniería. Primera edición. Unexpo. Venezuela

DIRECCIONES ELECTRÓNICAS:

http://www.dm.uba.ar/materias/probabilidades_estadistica_C/2006/2/
http://www.bdigital.unal.edu.co/2010/1/hugogomezgiraldo.2009.pdf
http://www.vitutor.com/estadistica.html
http://www.vitutor.com/ejercicios/ejercicios_estadistica.html
http://www.educatina.com/probabilidad-y-estadistica/ejercicios
2007
http://estagrarias.blogspot.com/2011/08/material-de-interes.html

165
UNIVERSIDAD TECNOLÓGICA EQUINOCCIAL
Departamento de Ciencias Exactas

ANEXOS

166
726 Apéndice A Tablas y demostraciones estadísticas

r
Tabla A.1 Sumas de probabilidad binomial ∑ b(x; n, p)
x= 0

p
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90
1 0 0.9000 0.8000 0.7500 0.7000 0.6000 0.5000 0.4000 0.3000 0.2000 0.1000
1 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
2 0 0.8100 0.6400 0.5625 0.4900 0.3600 0.2500 0.1600 0.0900 0.0400 0.0100
1 0.9900 0.9600 0.9375 0.9100 0.8400 0.7500 0.6400 0.5100 0.3600 0.1900
2 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
3 0 0.7290 0.5120 0.4219 0.3430 0.2160 0.1250 0.0640 0.0270 0.0080 0.0010
1 0.9720 0.8960 0.8438 0.7840 0.6480 0.5000 0.3520 0.2160 0.1040 0.0280
2 0.9990 0.9920 0.9844 0.9730 0.9360 0.8750 0.7840 0.6570 0.4880 0.2710
3 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
4 0 0.6561 0.4096 0.3164 0.2401 0.1296 0.0625 0.0256 0.0081 0.0016 0.0001
1 0.9477 0.8192 0.7383 0.6517 0.4752 0.3125 0.1792 0.0837 0.0272 0.0037
2 0.9963 0.9728 0.9492 0.9163 0.8208 0.6875 0.5248 0.3483 0.1808 0.0523
3 0.9999 0.9984 0.9961 0.9919 0.9744 0.9375 0.8704 0.7599 0.5904 0.3439
4 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
5 0 0.5905 0.3277 0.2373 0.1681 0.0778 0.0313 0.0102 0.0024 0.0003 0.0000
1 0.9185 0.7373 0.6328 0.5282 0.3370 0.1875 0.0870 0.0308 0.0067 0.0005
2 0.9914 0.9421 0.8965 0.8369 0.6826 0.5000 0.3174 0.1631 0.0579 0.0086
3 0.9995 0.9933 0.9844 0.9692 0.9130 0.8125 0.6630 0.4718 0.2627 0.0815
4 1.0000 0.9997 0.9990 0.9976 0.9898 0.9688 0.9222 0.8319 0.6723 0.4095
5 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
6 0 0.5314 0.2621 0.1780 0.1176 0.0467 0.0156 0.0041 0.0007 0.0001 0.0000
1 0.8857 0.6554 0.5339 0.4202 0.2333 0.1094 0.0410 0.0109 0.0016 0.0001
2 0.9842 0.9011 0.8306 0.7443 0.5443 0.3438 0.1792 0.0705 0.0170 0.0013
3 0.9987 0.9830 0.9624 0.9295 0.8208 0.6563 0.4557 0.2557 0.0989 0.0159
4 0.9999 0.9984 0.9954 0.9891 0.9590 0.8906 0.7667 0.5798 0.3446 0.1143
5 1.0000 0.9999 0.9998 0.9993 0.9959 0.9844 0.9533 0.8824 0.7379 0.4686
6 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
7 0 0.4783 0.2097 0.1335 0.0824 0.0280 0.0078 0.0016 0.0002 0.0000
1 0.8503 0.5767 0.4449 0.3294 0.1586 0.0625 0.0188 0.0038 0.0004 0.0000
2 0.9743 0.8520 0.7564 0.6471 0.4199 0.2266 0.0963 0.0288 0.0047 0.0002
3 0.9973 0.9667 0.9294 0.8740 0.7102 0.5000 0.2898 0.1260 0.0333 0.0027
4 0.9998 0.9953 0.9871 0.9712 0.9037 0.7734 0.5801 0.3529 0.1480 0.0257
5 1.0000 0.9996 0.9987 0.9962 0.9812 0.9375 0.8414 0.6706 0.4233 0.1497
6 1.0000 0.9999 0.9998 0.9984 0.9922 0.9720 0.9176 0.7903 0.5217
7 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
Tabla A.1 Sumas de probabilidad binomial 727

r
Tabla A.1 (continuación) Sumas de probabilidad binomial ∑ b(x; n, p)
x= 0

p
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90
8 0 0.4305 0.1678 0.1001 0.0576 0.0168 0.0039 0.0007 0.0001 0.0000
1 0.8131 0.5033 0.3671 0.2553 0.1064 0.0352 0.0085 0.0013 0.0001
2 0.9619 0.7969 0.6785 0.5518 0.3154 0.1445 0.0498 0.0113 0.0012 0.0000
3 0.9950 0.9437 0.8862 0.8059 0.5941 0.3633 0.1737 0.0580 0.0104 0.0004
4 0.9996 0.9896 0.9727 0.9420 0.8263 0.6367 0.4059 0.1941 0.0563 0.0050
5 1.0000 0.9988 0.9958 0.9887 0.9502 0.8555 0.6846 0.4482 0.2031 0.0381
6 0.9999 0.9996 0.9987 0.9915 0.9648 0.8936 0.7447 0.4967 0.1869
7 1.0000 1.0000 0.9999 0.9993 0.9961 0.9832 0.9424 0.8322 0.5695
8 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
9 0 0.3874 0.1342 0.0751 0.0404 0.0101 0.0020 0.0003 0.0000
1 0.7748 0.4362 0.3003 0.1960 0.0705 0.0195 0.0038 0.0004 0.0000
2 0.9470 0.7382 0.6007 0.4628 0.2318 0.0898 0.0250 0.0043 0.0003 0.0000
3 0.9917 0.9144 0.8343 0.7297 0.4826 0.2539 0.0994 0.0253 0.0031 0.0001
4 0.9991 0.9804 0.9511 0.9012 0.7334 0.5000 0.2666 0.0988 0.0196 0.0009
5 0.9999 0.9969 0.9900 0.9747 0.9006 0.7461 0.5174 0.2703 0.0856 0.0083
6 1.0000 0.9997 0.9987 0.9957 0.9750 0.9102 0.7682 0.5372 0.2618 0.0530
7 1.0000 0.9999 0.9996 0.9962 0.9805 0.9295 0.8040 0.5638 0.2252
8 1.0000 1.0000 0.9997 0.9980 0.9899 0.9596 0.8658 0.6126
9 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
10 0 0.3487 0.1074 0.0563 0.0282 0.0060 0.0010 0.0001 0.0000
1 0.7361 0.3758 0.2440 0.1493 0.0464 0.0107 0.0017 0.0001 0.0000
2 0.9298 0.6778 0.5256 0.3828 0.1673 0.0547 0.0123 0.0016 0.0001
3 0.9872 0.8791 0.7759 0.6496 0.3823 0.1719 0.0548 0.0106 0.0009 0.0000
4 0.9984 0.9672 0.9219 0.8497 0.6331 0.3770 0.1662 0.0473 0.0064 0.0001
5 0.9999 0.9936 0.9803 0.9527 0.8338 0.6230 0.3669 0.1503 0.0328 0.0016
6 1.0000 0.9991 0.9965 0.9894 0.9452 0.8281 0.6177 0.3504 0.1209 0.0128
7 0.9999 0.9996 0.9984 0.9877 0.9453 0.8327 0.6172 0.3222 0.0702
8 1.0000 1.0000 0.9999 0.9983 0.9893 0.9536 0.8507 0.6242 0.2639
9 1.0000 0.9999 0.9990 0.9940 0.9718 0.8926 0.6513
10 1.0000 1.0000 1.0000 1.0000 1.0000 1.0000
11 0 0.3138 0.0859 0.0422 0.0198 0.0036 0.0005 0.0000
1 0.6974 0.3221 0.1971 0.1130 0.0302 0.0059 0.0007 0.0000
2 0.9104 0.6174 0.4552 0.3127 0.1189 0.0327 0.0059 0.0006 0.0000
3 0.9815 0.8389 0.7133 0.5696 0.2963 0.1133 0.0293 0.0043 0.0002
4 0.9972 0.9496 0.8854 0.7897 0.5328 0.2744 0.0994 0.0216 0.0020 0.0000
5 0.9997 0.9883 0.9657 0.9218 0.7535 0.5000 0.2465 0.0782 0.0117 0.0003
6 1.0000 0.9980 0.9924 0.9784 0.9006 0.7256 0.4672 0.2103 0.0504 0.0028
7 0.9998 0.9988 0.9957 0.9707 0.8867 0.7037 0.4304 0.1611 0.0185
8 1.0000 0.9999 0.9994 0.9941 0.9673 0.8811 0.6873 0.3826 0.0896
9 1.0000 1.0000 0.9993 0.9941 0.9698 0.8870 0.6779 0.3026
10 1.0000 0.9995 0.9964 0.9802 0.9141 0.6862
11 1.0000 1.0000 1.0000 1.0000 1.0000
728 Apéndice A Tablas y demostraciones estadísticas

r
Tabla A.1 (continuación) Sumas de probabilidad binomial ∑ b(x; n, p)
x= 0

p
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90
12 0 0.2824 0.0687 0.0317 0.0138 0.0022 0.0002 0.0000
1 0.6590 0.2749 0.1584 0.0850 0.0196 0.0032 0.0003 0.0000
2 0.8891 0.5583 0.3907 0.2528 0.0834 0.0193 0.0028 0.0002 0.0000
3 0.9744 0.7946 0.6488 0.4925 0.2253 0.0730 0.0153 0.0017 0.0001
4 0.9957 0.9274 0.8424 0.7237 0.4382 0.1938 0.0573 0.0095 0.0006 0.0000
5 0.9995 0.9806 0.9456 0.8822 0.6652 0.3872 0.1582 0.0386 0.0039 0.0001
6 0.9999 0.9961 0.9857 0.9614 0.8418 0.6128 0.3348 0.1178 0.0194 0.0005
7 1.0000 0.9994 0.9972 0.9905 0.9427 0.8062 0.5618 0.2763 0.0726 0.0043
8 0.9999 0.9996 0.9983 0.9847 0.9270 0.7747 0.5075 0.2054 0.0256
9 1.0000 1.0000 0.9998 0.9972 0.9807 0.9166 0.7472 0.4417 0.1109
10 1.0000 0.9997 0.9968 0.9804 0.9150 0.7251 0.3410
11 1.0000 0.9998 0.9978 0.9862 0.9313 0.7176
12 1.0000 1.0000 1.0000 1.0000 1.0000
13 0 0.2542 0.0550 0.0238 0.0097 0.0013 0.0001 0.0000
1 0.6213 0.2336 0.1267 0.0637 0.0126 0.0017 0.0001 0.0000
2 0.8661 0.5017 0.3326 0.2025 0.0579 0.0112 0.0013 0.0001
3 0.9658 0.7473 0.5843 0.4206 0.1686 0.0461 0.0078 0.0007 0.0000
4 0.9935 0.9009 0.7940 0.6543 0.3530 0.1334 0.0321 0.0040 0.0002
5 0.9991 0.9700 0.9198 0.8346 0.5744 0.2905 0.0977 0.0182 0.0012 0.0000
6 0.9999 0.9930 0.9757 0.9376 0.7712 0.5000 0.2288 0.0624 0.0070 0.0001
7 1.0000 0.9988 0.9944 0.9818 0.9023 0.7095 0.4256 0.1654 0.0300 0.0009
8 0.9998 0.9990 0.9960 0.9679 0.8666 0.6470 0.3457 0.0991 0.0065
9 1.0000 0.9999 0.9993 0.9922 0.9539 0.8314 0.5794 0.2527 0.0342
10 1.0000 0.9999 0.9987 0.9888 0.9421 0.7975 0.4983 0.1339
11 1.0000 0.9999 0.9983 0.9874 0.9363 0.7664 0.3787
12 1.0000 0.9999 0.9987 0.9903 0.9450 0.7458
13 1.0000 1.0000 1.0000 1.0000 1.0000
14 0 0.2288 0.0440 0.0178 0.0068 0.0008 0.0001 0.0000
1 0.5846 0.1979 0.1010 0.0475 0.0081 0.0009 0.0001
2 0.8416 0.4481 0.2811 0.1608 0.0398 0.0065 0.0006 0.0000
3 0.9559 0.6982 0.5213 0.3552 0.1243 0.0287 0.0039 0.0002
4 0.9908 0.8702 0.7415 0.5842 0.2793 0.0898 0.0175 0.0017 0.0000
5 0.9985 0.9561 0.8883 0.7805 0.4859 0.2120 0.0583 0.0083 0.0004
6 0.9998 0.9884 0.9617 0.9067 0.6925 0.3953 0.1501 0.0315 0.0024 0.0000
7 1.0000 0.9976 0.9897 0.9685 0.8499 0.6047 0.3075 0.0933 0.0116 0.0002
8 0.9996 0.9978 0.9917 0.9417 0.7880 0.5141 0.2195 0.0439 0.0015
9 1.0000 0.9997 0.9983 0.9825 0.9102 0.7207 0.4158 0.1298 0.0092
10 1.0000 0.9998 0.9961 0.9713 0.8757 0.6448 0.3018 0.0441
11 1.0000 0.9994 0.9935 0.9602 0.8392 0.5519 0.1584
12 0.9999 0.9991 0.9919 0.9525 0.8021 0.4154
13 1.0000 0.9999 0.9992 0.9932 0.9560 0.7712
14 1.0000 1.0000 1.0000 1.0000 1.0000
Tabla A.1 Sumas de probabilidad binomial 729

r
Tabla A.1 (continuación) Sumas de probabilidad binomial ∑ b(x; n, p)
x= 0

p
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90
15 0 0.2059 0.0352 0.0134 0.0047 0.0005 0.0000
1 0.5490 0.1671 0.0802 0.0353 0.0052 0.0005 0.0000
2 0.8159 0.3980 0.2361 0.1268 0.0271 0.0037 0.0003 0.0000
3 0.9444 0.6482 0.4613 0.2969 0.0905 0.0176 0.0019 0.0001
4 0.9873 0.8358 0.6865 0.5155 0.2173 0.0592 0.0093 0.0007 0.0000
5 0.9978 0.9389 0.8516 0.7216 0.4032 0.1509 0.0338 0.0037 0.0001
6 0.9997 0.9819 0.9434 0.8689 0.6098 0.3036 0.0950 0.0152 0.0008
7 1.0000 0.9958 0.9827 0.9500 0.7869 0.5000 0.2131 0.0500 0.0042 0.0000
8 0.9992 0.9958 0.9848 0.9050 0.6964 0.3902 0.1311 0.0181 0.0003
9 0.9999 0.9992 0.9963 0.9662 0.8491 0.5968 0.2784 0.0611 0.0022
10 1.0000 0.9999 0.9993 0.9907 0.9408 0.7827 0.4845 0.1642 0.0127
11 1.0000 0.9999 0.9981 0.9824 0.9095 0.7031 0.3518 0.0556
12 1.0000 0.9997 0.9963 0.9729 0.8732 0.6020 0.1841
13 1.0000 0.9995 0.9948 0.9647 0.8329 0.4510
14 1.0000 0.9995 0.9953 0.9648 0.7941
15 1.0000 1.0000 1.0000 1.0000

16 0 0.1853 0.0281 0.0100 0.0033 0.0003 0.0000


1 0.5147 0.1407 0.0635 0.0261 0.0033 0.0003 0.0000
2 0.7892 0.3518 0.1971 0.0994 0.0183 0.0021 0.0001
3 0.9316 0.5981 0.4050 0.2459 0.0651 0.0106 0.0009 0.0000
4 0.9830 0.7982 0.6302 0.4499 0.1666 0.0384 0.0049 0.0003
5 0.9967 0.9183 0.8103 0.6598 0.3288 0.1051 0.0191 0.0016 0.0000
6 0.9995 0.9733 0.9204 0.8247 0.5272 0.2272 0.0583 0.0071 0.0002
7 0.9999 0.9930 0.9729 0.9256 0.7161 0.4018 0.1423 0.0257 0.0015 0.0000
8 1.0000 0.9985 0.9925 0.9743 0.8577 0.5982 0.2839 0.0744 0.0070 0.0001
9 0.9998 0.9984 0.9929 0.9417 0.7728 0.4728 0.1753 0.0267 0.0005
10 1.0000 0.9997 0.9984 0.9809 0.8949 0.6712 0.3402 0.0817 0.0033
11 1.0000 0.9997 0.9951 0.9616 0.8334 0.5501 0.2018 0.0170
12 1.0000 0.9991 0.9894 0.9349 0.7541 0.4019 0.0684
13 0.9999 0.9979 0.9817 0.9006 0.6482 0.2108
14 1.0000 0.9997 0.9967 0.9739 0.8593 0.4853
15 1.0000 0.9997 0.9967 0.9719 0.8147
16 1.0000 1.0000 1.0000 1.0000
730 Apéndice A Tablas y demostraciones estadísticas

r
Tabla A.1 (continuación) Sumas de probabilidad binomial ∑ b(x; n, p)
x= 0

p
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90
17 0 0.1668 0.0225 0.0075 0.0023 0.0002 0.0000
1 0.4818 0.1182 0.0501 0.0193 0.0021 0.0001 0.0000
2 0.7618 0.3096 0.1637 0.0774 0.0123 0.0012 0.0001
3 0.9174 0.5489 0.3530 0.2019 0.0464 0.0064 0.0005 0.0000
4 0.9779 0.7582 0.5739 0.3887 0.1260 0.0245 0.0025 0.0001
5 0.9953 0.8943 0.7653 0.5968 0.2639 0.0717 0.0106 0.0007 0.0000
6 0.9992 0.9623 0.8929 0.7752 0.4478 0.1662 0.0348 0.0032 0.0001
7 0.9999 0.9891 0.9598 0.8954 0.6405 0.3145 0.0919 0.0127 0.0005
8 1.0000 0.9974 0.9876 0.9597 0.8011 0.5000 0.1989 0.0403 0.0026 0.0000
9 0.9995 0.9969 0.9873 0.9081 0.6855 0.3595 0.1046 0.0109 0.0001
10 0.9999 0.9994 0.9968 0.9652 0.8338 0.5522 0.2248 0.0377 0.0008
11 1.0000 0.9999 0.9993 0.9894 0.9283 0.7361 0.4032 0.1057 0.0047
12 1.0000 0.9999 0.9975 0.9755 0.8740 0.6113 0.2418 0.0221
13 1.0000 0.9995 0.9936 0.9536 0.7981 0.4511 0.0826
14 0.9999 0.9988 0.9877 0.9226 0.6904 0.2382
15 1.0000 0.9999 0.9979 0.9807 0.8818 0.5182
16 1.0000 0.9998 0.9977 0.9775 0.8332
17 1.0000 1.0000 1.0000 1.0000
18 0 0.1501 0.0180 0.0056 0.0016 0.0001 0.0000
1 0.4503 0.0991 0.0395 0.0142 0.0013 0.0001
2 0.7338 0.2713 0.1353 0.0600 0.0082 0.0007 0.0000
3 0.9018 0.5010 0.3057 0.1646 0.0328 0.0038 0.0002
4 0.9718 0.7164 0.5187 0.3327 0.0942 0.0154 0.0013 0.0000
5 0.9936 0.8671 0.7175 0.5344 0.2088 0.0481 0.0058 0.0003
6 0.9988 0.9487 0.8610 0.7217 0.3743 0.1189 0.0203 0.0014 0.0000
7 0.9998 0.9837 0.9431 0.8593 0.5634 0.2403 0.0576 0.0061 0.0002
8 1.0000 0.9957 0.9807 0.9404 0.7368 0.4073 0.1347 0.0210 0.0009
9 0.9991 0.9946 0.9790 0.8653 0.5927 0.2632 0.0596 0.0043 0.0000
10 0.9998 0.9988 0.9939 0.9424 0.7597 0.4366 0.1407 0.0163 0.0002
11 1.0000 0.9998 0.9986 0.9797 0.8811 0.6257 0.2783 0.0513 0.0012
12 1.0000 0.9997 0.9942 0.9519 0.7912 0.4656 0.1329 0.0064
13 1.0000 0.9987 0.9846 0.9058 0.6673 0.2836 0.0282
14 0.9998 0.9962 0.9672 0.8354 0.4990 0.0982
15 1.0000 0.9993 0.9918 0.9400 0.7287 0.2662
16 0.9999 0.9987 0.9858 0.9009 0.5497
17 1.0000 0.9999 0.9984 0.9820 0.8499
18 1.0000 1.0000 1.0000 1.0000
Tabla A.1 Sumas de probabilidad binomial 731

r
Tabla A.1 (continuación) Sumas de probabilidad binomial ∑ b(x; n, p)
x= 0

p
n r 0.10 0.20 0.25 0.30 0.40 0.50 0.60 0.70 0.80 0.90
19 0 0.1351 0.0144 0.0042 0.0011 0.0001
1 0.4203 0.0829 0.0310 0.0104 0.0008 0.0000
2 0.7054 0.2369 0.1113 0.0462 0.0055 0.0004 0.0000
3 0.8850 0.4551 0.2631 0.1332 0.0230 0.0022 0.0001
4 0.9648 0.6733 0.4654 0.2822 0.0696 0.0096 0.0006 0.0000
5 0.9914 0.8369 0.6678 0.4739 0.1629 0.0318 0.0031 0.0001
6 0.9983 0.9324 0.8251 0.6655 0.3081 0.0835 0.0116 0.0006
7 0.9997 0.9767 0.9225 0.8180 0.4878 0.1796 0.0352 0.0028 0.0000
8 1.0000 0.9933 0.9713 0.9161 0.6675 0.3238 0.0885 0.0105 0.0003
9 0.9984 0.9911 0.9674 0.8139 0.5000 0.1861 0.0326 0.0016
10 0.9997 0.9977 0.9895 0.9115 0.6762 0.3325 0.0839 0.0067 0.0000
11 1.0000 0.9995 0.9972 0.9648 0.8204 0.5122 0.1820 0.0233 0.0003
12 0.9999 0.9994 0.9884 0.9165 0.6919 0.3345 0.0676 0.0017
13 1.0000 0.9999 0.9969 0.9682 0.8371 0.5261 0.1631 0.0086
14 1.0000 0.9994 0.9904 0.9304 0.7178 0.3267 0.0352
15 0.9999 0.9978 0.9770 0.8668 0.5449 0.1150
16 1.0000 0.9996 0.9945 0.9538 0.7631 0.2946
17 1.0000 0.9992 0.9896 0.9171 0.5797
18 0.9999 0.9989 0.9856 0.8649
19 1.0000 1.0000 1.0000 1.0000
20 0 0.1216 0.0115 0.0032 0.0008 0.0000
1 0.3917 0.0692 0.0243 0.0076 0.0005 0.0000
2 0.6769 0.2061 0.0913 0.0355 0.0036 0.0002
3 0.8670 0.4114 0.2252 0.1071 0.0160 0.0013 0.0000
4 0.9568 0.6296 0.4148 0.2375 0.0510 0.0059 0.0003
5 0.9887 0.8042 0.6172 0.4164 0.1256 0.0207 0.0016 0.0000
6 0.9976 0.9133 0.7858 0.6080 0.2500 0.0577 0.0065 0.0003
7 0.9996 0.9679 0.8982 0.7723 0.4159 0.1316 0.0210 0.0013 0.0000
8 0.9999 0.9900 0.9591 0.8867 0.5956 0.2517 0.0565 0.0051 0.0001
9 1.0000 0.9974 0.9861 0.9520 0.7553 0.4119 0.1275 0.0171 0.0006
10 0.9994 0.9961 0.9829 0.8725 0.5881 0.2447 0.0480 0.0026 0.0000
11 0.9999 0.9991 0.9949 0.9435 0.7483 0.4044 0.1133 0.0100 0.0001
12 1.0000 0.9998 0.9987 0.9790 0.8684 0.5841 0.2277 0.0321 0.0004
13 1.0000 0.9997 0.9935 0.9423 0.7500 0.3920 0.0867 0.0024
14 1.0000 0.9984 0.9793 0.8744 0.5836 0.1958 0.0113
15 0.9997 0.9941 0.9490 0.7625 0.3704 0.0432
16 1.0000 0.9987 0.9840 0.8929 0.5886 0.1330
17 0.9998 0.9964 0.9645 0.7939 0.3231
18 1.0000 0.9995 0.9924 0.9308 0.6083
19 1.0000 0.9992 0.9885 0.8784
20 1.0000 1.0000 1.0000
732 Apéndice A Tablas y demostraciones estadísticas

r
Tabla A.2 Sumas de probabilidad de Poisson ∑ p(x; μ)
x=0

μ
r 0.1 0.2 0.30 0.4 0.5 0.6 0.7 0.8 0.9
0 0.9048 0.8187 0.7408 0.6703 0.6065 0.5488 0.4966 0.4493 0.4066
1 0.9953 0.9825 0.9631 0.9384 0.9098 0.8781 0.8442 0.8088 0.7725
2 0.9998 0.9989 0.9964 0.9921 0.9856 0.9769 0.9659 0.9526 0.9371
3 1.0000 0.9999 0.9997 0.9992 0.9982 0.9966 0.9942 0.9909 0.9865
4 1.0000 1.0000 0.9999 0.9998 0.9996 0.9992 0.9986 0.9977
5 1.0000 1.0000 1.0000 0.9999 0.9998 0.9997
6 1.0000 1.0000 1.0000

μ
r 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0
0 0.3679 0.2231 0.1353 0.0821 0.0498 0.0302 0.0183 0.0111 0.0067
1 0.7358 0.5578 0.4060 0.2873 0.1991 0.1359 0.0916 0.0611 0.0404
2 0.9197 0.8088 0.6767 0.5438 0.4232 0.3208 0.2381 0.1736 0.1247
3 0.9810 0.9344 0.8571 0.7576 0.6472 0.5366 0.4335 0.3423 0.2650
4 0.9963 0.9814 0.9473 0.8912 0.8153 0.7254 0.6288 0.5321 0.4405
5 0.9994 0.9955 0.9834 0.9580 0.9161 0.8576 0.7851 0.7029 0.6160
6 0.9999 0.9991 0.9955 0.9858 0.9665 0.9347 0.8893 0.8311 0.7622
7 1.0000 0.9998 0.9989 0.9958 0.9881 0.9733 0.9489 0.9134 0.8666
8 1.0000 0.9998 0.9989 0.9962 0.9901 0.9786 0.9597 0.9319
9 1.0000 0.9997 0.9989 0.9967 0.9919 0.9829 0.9682
10 0.9999 0.9997 0.9990 0.9972 0.9933 0.9863
11 1.0000 0.9999 0.9997 0.9991 0.9976 0.9945
12 1.0000 0.9999 0.9997 0.9992 0.9980
13 1.0000 0.9999 0.9997 0.9993
14 1.0000 0.9999 0.9998
15 1.0000 0.9999
16 1.0000
Tabla A.2 Sumas de probabilidad de Poisson 733

r
Tabla A.2 (continuación) Sumas de probabilidad de Poisson ∑ p(x; μ)
x=0

μ
r 5.5 6.0 6.5 7.0 7.5 8.0 8.5 9.0 9.5
0 0.0041 0.0025 0.0015 0.0009 0.0006 0.0003 0.0002 0.0001 0.0001
1 0.0266 0.0174 0.0113 0.0073 0.0047 0.0030 0.0019 0.0012 0.0008
2 0.0884 0.0620 0.0430 0.0296 0.0203 0.0138 0.0093 0.0062 0.0042
3 0.2017 0.1512 0.1118 0.0818 0.0591 0.0424 0.0301 0.0212 0.0149
4 0.3575 0.2851 0.2237 0.1730 0.1321 0.0996 0.0744 0.0550 0.0403
5 0.5289 0.4457 0.3690 0.3007 0.2414 0.1912 0.1496 0.1157 0.0885
6 0.6860 0.6063 0.5265 0.4497 0.3782 0.3134 0.2562 0.2068 0.1649
7 0.8095 0.7440 0.6728 0.5987 0.5246 0.4530 0.3856 0.3239 0.2687
8 0.8944 0.8472 0.7916 0.7291 0.6620 0.5925 0.5231 0.4557 0.3918
9 0.9462 0.9161 0.8774 0.8305 0.7764 0.7166 0.6530 0.5874 0.5218
10 0.9747 0.9574 0.9332 0.9015 0.8622 0.8159 0.7634 0.7060 0.6453
11 0.9890 0.9799 0.9661 0.9467 0.9208 0.8881 0.8487 0.8030 0.7520
12 0.9955 0.9912 0.9840 0.9730 0.9573 0.9362 0.9091 0.8758 0.8364
13 0.9983 0.9964 0.9929 0.9872 0.9784 0.9658 0.9486 0.9261 0.8981
14 0.9994 0.9986 0.9970 0.9943 0.9897 0.9827 0.9726 0.9585 0.9400
15 0.9998 0.9995 0.9988 0.9976 0.9954 0.9918 0.9862 0.9780 0.9665
16 0.9999 0.9998 0.9996 0.9990 0.9980 0.9963 0.9934 0.9889 0.9823
17 1.0000 0.9999 0.9998 0.9996 0.9992 0.9984 0.9970 0.9947 0.9911
18 1.0000 0.9999 0.9999 0.9997 0.9993 0.9987 0.9976 0.9957
19 1.0000 1.0000 0.9999 0.9997 0.9995 0.9989 0.9980
20 0.9999 0.9998 0.9996 0.9991
21 1.0000 0.9999 0.9998 0.9996
22 1.0000 0.9999 0.9999
23 1.0000 0.9999
24 1.0000
734 Apéndice A Tablas y demostraciones estadísticas

r
Tabla A.2 (continuación) Sumas de probabilidad de Poisson ∑ p(x; μ)
x=0

μ
r 10.0 11.0 12.0 13.0 14.0 15.0 16.0 17.0 18.0
0 0.0000 0.0000 0.0000
1 0.0005 0.0002 0.0001 0.0000 0.0000
2 0.0028 0.0012 0.0005 0.0002 0.0001 0.0000 0.0000
3 0.0103 0.0049 0.0023 0.0011 0.0005 0.0002 0.0001 0.0000 0.0000
4 0.0293 0.0151 0.0076 0.0037 0.0018 0.0009 0.0004 0.0002 0.0001
5 0.0671 0.0375 0.0203 0.0107 0.0055 0.0028 0.0014 0.0007 0.0003
6 0.1301 0.0786 0.0458 0.0259 0.0142 0.0076 0.0040 0.0021 0.0010
7 0.2202 0.1432 0.0895 0.0540 0.0316 0.0180 0.0100 0.0054 0.0029
8 0.3328 0.2320 0.1550 0.0998 0.0621 0.0374 0.0220 0.0126 0.0071
9 0.4579 0.3405 0.2424 0.1658 0.1094 0.0699 0.0433 0.0261 0.0154
10 0.5830 0.4599 0.3472 0.2517 0.1757 0.1185 0.0774 0.0491 0.0304
11 0.6968 0.5793 0.4616 0.3532 0.2600 0.1848 0.1270 0.0847 0.0549
12 0.7916 0.6887 0.5760 0.4631 0.3585 0.2676 0.1931 0.1350 0.0917
13 0.8645 0.7813 0.6815 0.5730 0.4644 0.3632 0.2745 0.2009 0.1426
14 0.9165 0.8540 0.7720 0.6751 0.5704 0.4657 0.3675 0.2808 0.2081
15 0.9513 0.9074 0.8444 0.7636 0.6694 0.5681 0.4667 0.3715 0.2867
16 0.9730 0.9441 0.8987 0.8355 0.7559 0.6641 0.5660 0.4677 0.3751
17 0.9857 0.9678 0.9370 0.8905 0.8272 0.7489 0.6593 0.5640 0.4686
18 0.9928 0.9823 0.9626 0.9302 0.8826 0.8195 0.7423 0.6550 0.5622
19 0.9965 0.9907 0.9787 0.9573 0.9235 0.8752 0.8122 0.7363 0.6509
20 0.9984 0.9953 0.9884 0.9750 0.9521 0.9170 0.8682 0.8055 0.7307
21 0.9993 0.9977 0.9939 0.9859 0.9712 0.9469 0.9108 0.8615 0.7991
22 0.9997 0.9990 0.9970 0.9924 0.9833 0.9673 0.9418 0.9047 0.8551
23 0.9999 0.9995 0.9985 0.9960 0.9907 0.9805 0.9633 0.9367 0.8989
24 1.0000 0.9998 0.9993 0.9980 0.9950 0.9888 0.9777 0.9594 0.9317
25 0.9999 0.9997 0.9990 0.9974 0.9938 0.9869 0.9748 0.9554
26 1.0000 0.9999 0.9995 0.9987 0.9967 0.9925 0.9848 0.9718
27 0.9999 0.9998 0.9994 0.9983 0.9959 0.9912 0.9827
28 1.0000 0.9999 0.9997 0.9991 0.9978 0.9950 0.9897
29 1.0000 0.9999 0.9996 0.9989 0.9973 0.9941
30 0.9999 0.9998 0.9994 0.9986 0.9967
31 1.0000 0.9999 0.9997 0.9993 0.9982
32 1.0000 0.9999 0.9996 0.9990
33 0.9999 0.9998 0.9995
34 1.0000 0.9999 0.9998
35 1.0000 0.9999
36 0.9999
37 1.0000
Tabla A.3 Áreas bajo la curva normal 735

Área

Tabla A.3 Áreas bajo la curva normal 0 z

z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
−3.4 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0003 0.0002
−3.3 0.0005 0.0005 0.0005 0.0004 0.0004 0.0004 0.0004 0.0004 0.0004 0.0003
−3.2 0.0007 0.0007 0.0006 0.0006 0.0006 0.0006 0.0006 0.0005 0.0005 0.0005
−3.1 0.0010 0.0009 0.0009 0.0009 0.0008 0.0008 0.0008 0.0008 0.0007 0.0007
−3.0 0.0013 0.0013 0.0013 0.0012 0.0012 0.0011 0.0011 0.0011 0.0010 0.0010
−2.9 0.0019 0.0018 0.0018 0.0017 0.0016 0.0016 0.0015 0.0015 0.0014 0.0014
−2.8 0.0026 0.0025 0.0024 0.0023 0.0023 0.0022 0.0021 0.0021 0.0020 0.0019
−2.7 0.0035 0.0034 0.0033 0.0032 0.0031 0.0030 0.0029 0.0028 0.0027 0.0026
−2.6 0.0047 0.0045 0.0044 0.0043 0.0041 0.0040 0.0039 0.0038 0.0037 0.0036
−2.5 0.0062 0.0060 0.0059 0.0057 0.0055 0.0054 0.0052 0.0051 0.0049 0.0048
−2.4 0.0082 0.0080 0.0078 0.0075 0.0073 0.0071 0.0069 0.0068 0.0066 0.0064
−2.3 0.0107 0.0104 0.0102 0.0099 0.0096 0.0094 0.0091 0.0089 0.0087 0.0084
−2.2 0.0139 0.0136 0.0132 0.0129 0.0125 0.0122 0.0119 0.0116 0.0113 0.0110
−2.1 0.0179 0.0174 0.0170 0.0166 0.0162 0.0158 0.0154 0.0150 0.0146 0.0143
−2.0 0.0228 0.0222 0.0217 0.0212 0.0207 0.0202 0.0197 0.0192 0.0188 0.0183
−1.9 0.0287 0.0281 0.0274 0.0268 0.0262 0.0256 0.0250 0.0244 0.0239 0.0233
−1.8 0.0359 0.0351 0.0344 0.0336 0.0329 0.0322 0.0314 0.0307 0.0301 0.0294
−1.7 0.0446 0.0436 0.0427 0.0418 0.0409 0.0401 0.0392 0.0384 0.0375 0.0367
−1.6 0.0548 0.0537 0.0526 0.0516 0.0505 0.0495 0.0485 0.0475 0.0465 0.0455
−1.5 0.0668 0.0655 0.0643 0.0630 0.0618 0.0606 0.0594 0.0582 0.0571 0.0559
−1.4 0.0808 0.0793 0.0778 0.0764 0.0749 0.0735 0.0721 0.0708 0.0694 0.0681
−1.3 0.0968 0.0951 0.0934 0.0918 0.0901 0.0885 0.0869 0.0853 0.0838 0.0823
−1.2 0.1151 0.1131 0.1112 0.1093 0.1075 0.1056 0.1038 0.1020 0.1003 0.0985
−1.1 0.1357 0.1335 0.1314 0.1292 0.1271 0.1251 0.1230 0.1210 0.1190 0.1170
−1.0 0.1587 0.1562 0.1539 0.1515 0.1492 0.1469 0.1446 0.1423 0.1401 0.1379
−0.9 0.1841 0.1814 0.1788 0.1762 0.1736 0.1711 0.1685 0.1660 0.1635 0.1611
−0.8 0.2119 0.2090 0.2061 0.2033 0.2005 0.1977 0.1949 0.1922 0.1894 0.1867
−0.7 0.2420 0.2389 0.2358 0.2327 0.2296 0.2266 0.2236 0.2206 0.2177 0.2148
−0.6 0.2743 0.2709 0.2676 0.2643 0.2611 0.2578 0.2546 0.2514 0.2483 0.2451
−0.5 0.3085 0.3050 0.3015 0.2981 0.2946 0.2912 0.2877 0.2843 0.2810 0.2776
−0.4 0.3446 0.3409 0.3372 0.3336 0.3300 0.3264 0.3228 0.3192 0.3156 0.3121
−0.3 0.3821 0.3783 0.3745 0.3707 0.3669 0.3632 0.3594 0.3557 0.3520 0.3483
−0.2 0.4207 0.4168 0.4129 0.4090 0.4052 0.4013 0.3974 0.3936 0.3897 0.3859
−0.1 0.4602 0.4562 0.4522 0.4483 0.4443 0.4404 0.4364 0.4325 0.4286 0.4247
−0.0 0.5000 0.4960 0.4920 0.4880 0.4840 0.4801 0.4761 0.4721 0.4681 0.4641
736 Apéndice A Tablas y demostraciones estadísticas

Tabla A.3 (continuación) Áreas bajo la curva normal


z .00 .01 .02 .03 .04 .05 .06 .07 .08 .09
0.0 0.5000 0.5040 0.5080 0.5120 0.5160 0.5199 0.5239 0.5279 0.5319 0.5359
0.1 0.5398 0.5438 0.5478 0.5517 0.5557 0.5596 0.5636 0.5675 0.5714 0.5753
0.2 0.5793 0.5832 0.5871 0.5910 0.5948 0.5987 0.6026 0.6064 0.6103 0.6141
0.3 0.6179 0.6217 0.6255 0.6293 0.6331 0.6368 0.6406 0.6443 0.6480 0.6517
0.4 0.6554 0.6591 0.6628 0.6664 0.6700 0.6736 0.6772 0.6808 0.6844 0.6879
0.5 0.6915 0.6950 0.6985 0.7019 0.7054 0.7088 0.7123 0.7157 0.7190 0.7224
0.6 0.7257 0.7291 0.7324 0.7357 0.7389 0.7422 0.7454 0.7486 0.7517 0.7549
0.7 0.7580 0.7611 0.7642 0.7673 0.7704 0.7734 0.7764 0.7794 0.7823 0.7852
0.8 0.7881 0.7910 0.7939 0.7967 0.7995 0.8023 0.8051 0.8078 0.8106 0.8133
0.9 0.8159 0.8186 0.8212 0.8238 0.8264 0.8289 0.8315 0.8340 0.8365 0.8389
1.0 0.8413 0.8438 0.8461 0.8485 0.8508 0.8531 0.8554 0.8577 0.8599 0.8621
1.1 0.8643 0.8665 0.8686 0.8708 0.8729 0.8749 0.8770 0.8790 0.8810 0.8830
1.2 0.8849 0.8869 0.8888 0.8907 0.8925 0.8944 0.8962 0.8980 0.8997 0.9015
1.3 0.9032 0.9049 0.9066 0.9082 0.9099 0.9115 0.9131 0.9147 0.9162 0.9177
1.4 0.9192 0.9207 0.9222 0.9236 0.9251 0.9265 0.9279 0.9292 0.9306 0.9319
1.5 0.9332 0.9345 0.9357 0.9370 0.9382 0.9394 0.9406 0.9418 0.9429 0.9441
1.6 0.9452 0.9463 0.9474 0.9484 0.9495 0.9505 0.9515 0.9525 0.9535 0.9545
1.7 0.9554 0.9564 0.9573 0.9582 0.9591 0.9599 0.9608 0.9616 0.9625 0.9633
1.8 0.9641 0.9649 0.9656 0.9664 0.9671 0.9678 0.9686 0.9693 0.9699 0.9706
1.9 0.9713 0.9719 0.9726 0.9732 0.9738 0.9744 0.9750 0.9756 0.9761 0.9767
2.0 0.9772 0.9778 0.9783 0.9788 0.9793 0.9798 0.9803 0.9808 0.9812 0.9817
2.1 0.9821 0.9826 0.9830 0.9834 0.9838 0.9842 0.9846 0.9850 0.9854 0.9857
2.2 0.9861 0.9864 0.9868 0.9871 0.9875 0.9878 0.9881 0.9884 0.9887 0.9890
2.3 0.9893 0.9896 0.9898 0.9901 0.9904 0.9906 0.9909 0.9911 0.9913 0.9916
2.4 0.9918 0.9920 0.9922 0.9925 0.9927 0.9929 0.9931 0.9932 0.9934 0.9936
2.5 0.9938 0.9940 0.9941 0.9943 0.9945 0.9946 0.9948 0.9949 0.9951 0.9952
2.6 0.9953 0.9955 0.9956 0.9957 0.9959 0.9960 0.9961 0.9962 0.9963 0.9964
2.7 0.9965 0.9966 0.9967 0.9968 0.9969 0.9970 0.9971 0.9972 0.9973 0.9974
2.8 0.9974 0.9975 0.9976 0.9977 0.9977 0.9978 0.9979 0.9979 0.9980 0.9981
2.9 0.9981 0.9982 0.9982 0.9983 0.9984 0.9984 0.9985 0.9985 0.9986 0.9986
3.0 0.9987 0.9987 0.9987 0.9988 0.9988 0.9989 0.9989 0.9989 0.9990 0.9990
3.1 0.9990 0.9991 0.9991 0.9991 0.9992 0.9992 0.9992 0.9992 0.9993 0.9993
3.2 0.9993 0.9993 0.9994 0.9994 0.9994 0.9994 0.9994 0.9995 0.9995 0.9995
3.3 0.9995 0.9995 0.9995 0.9996 0.9996 0.9996 0.9996 0.9996 0.9996 0.9997
3.4 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9997 0.9998
Tabla A.4 Valores críticos de la distribución t 737

α
Tabla A.4 Valores críticos de la distribución t 0 tα

α
v 0.40 0.30 0.20 0.15 0.10 0.05 0.025
1 0.325 0.727 1.376 1.963 3.078 6.314 12.706
2 0.289 0.617 1.061 1.386 1.886 2.920 4.303
3 0.277 0.584 0.978 1.250 1.638 2.353 3.182
4 0.271 0.569 0.941 1.190 1.533 2.132 2.776
5 0.267 0.559 0.920 1.156 1.476 2.015 2.571
6 0.265 0.553 0.906 1.134 1.440 1.943 2.447
7 0.263 0.549 0.896 1.119 1.415 1.895 2.365
8 0.262 0.546 0.889 1.108 1.397 1.860 2.306
9 0.261 0.543 0.883 1.100 1.383 1.833 2.262
10 0.260 0.542 0.879 1.093 1.372 1.812 2.228
11 0.260 0.540 0.876 1.088 1.363 1.796 2.201
12 0.259 0.539 0.873 1.083 1.356 1.782 2.179
13 0.259 0.538 0.870 1.079 1.350 1.771 2.160
14 0.258 0.537 0.868 1.076 1.345 1.761 2.145
15 0.258 0.536 0.866 1.074 1.341 1.753 2.131
16 0.258 0.535 0.865 1.071 1.337 1.746 2.120
17 0.257 0.534 0.863 1.069 1.333 1.740 2.110
18 0.257 0.534 0.862 1.067 1.330 1.734 2.101
19 0.257 0.533 0.861 1.066 1.328 1.729 2.093
20 0.257 0.533 0.860 1.064 1.325 1.725 2.086
21 0.257 0.532 0.859 1.063 1.323 1.721 2.080
22 0.256 0.532 0.858 1.061 1.321 1.717 2.074
23 0.256 0.532 0.858 1.060 1.319 1.714 2.069
24 0.256 0.531 0.857 1.059 1.318 1.711 2.064
25 0.256 0.531 0.856 1.058 1.316 1.708 2.060
26 0.256 0.531 0.856 1.058 1.315 1.706 2.056
27 0.256 0.531 0.855 1.057 1.314 1.703 2.052
28 0.256 0.530 0.855 1.056 1.313 1.701 2.048
29 0.256 0.530 0.854 1.055 1.311 1.699 2.045
30 0.256 0.530 0.854 1.055 1.310 1.697 2.042
40 0.255 0.529 0.851 1.050 1.303 1.684 2.021
60 0.254 0.527 0.848 1.045 1.296 1.671 2.000
120 0.254 0.526 0.845 1.041 1.289 1.658 1.980
∞ 0.253 0.524 0.842 1.036 1.282 1.645 1.960
738 Apéndice A Tablas y demostraciones estadísticas

Tabla A.4 (continuación) Valores críticos de la distribución t


α
v 0.02 0.015 0.01 0.0075 0.005 0.0025 0.0005
1 15.894 21.205 31.821 42.433 63.656 127.321 636.578
2 4.849 5.643 6.965 8.073 9.925 14.089 31.600
3 3.482 3.896 4.541 5.047 5.841 7.453 12.924
4 2.999 3.298 3.747 4.088 4.604 5.598 8.610
5 2.757 3.003 3.365 3.634 4.032 4.773 6.869
6 2.612 2.829 3.143 3.372 3.707 4.317 5.959
7 2.517 2.715 2.998 3.203 3.499 4.029 5.408
8 2.449 2.634 2.896 3.085 3.355 3.833 5.041
9 2.398 2.574 2.821 2.998 3.250 3.690 4.781
10 2.359 2.527 2.764 2.932 3.169 3.581 4.587
11 2.328 2.491 2.718 2.879 3.106 3.497 4.437
12 2.303 2.461 2.681 2.836 3.055 3.428 4.318
13 2.282 2.436 2.650 2.801 3.012 3.372 4.221
14 2.264 2.415 2.624 2.771 2.977 3.326 4.140
15 2.249 2.397 2.602 2.746 2.947 3.286 4.073
16 2.235 2.382 2.583 2.724 2.921 3.252 4.015
17 2.224 2.368 2.567 2.706 2.898 3.222 3.965
18 2.214 2.356 2.552 2.689 2.878 3.197 3.922
19 2.205 2.346 2.539 2.674 2.861 3.174 3.883
20 2.197 2.336 2.528 2.661 2.845 3.153 3.850
21 2.189 2.328 2.518 2.649 2.831 3.135 3.819
22 2.183 2.320 2.508 2.639 2.819 3.119 3.792
23 2.177 2.313 2.500 2.629 2.807 3.104 3.768
24 2.172 2.307 2.492 2.620 2.797 3.091 3.745
25 2.167 2.301 2.485 2.612 2.787 3.078 3.725
26 2.162 2.296 2.479 2.605 2.779 3.067 3.707
27 2.158 2.291 2.473 2.598 2.771 3.057 3.689
28 2.154 2.286 2.467 2.592 2.763 3.047 3.674
29 2.150 2.282 2.462 2.586 2.756 3.038 3.660
30 2.147 2.278 2.457 2.581 2.750 3.030 3.646
40 2.123 2.250 2.423 2.542 2.704 2.971 3.551
60 2.099 2.223 2.390 2.504 2.660 2.915 3.460
120 2.076 2.196 2.358 2.468 2.617 2.860 3.373
∞ 2.054 2.170 2.326 2.432 2.576 2.807 3.290
Tabla A.5 Valores críticos de la distribución chi cuadrada 739

Tabla A.5 Valores críticos de la distribución chi cuadrada 0 χ α2

α
v 0.995 0.99 0.98 0.975 0.95 0.90 0.80 0.75 0.70 0.50
1 0.04393 0.03157 0.03628 0.03982 0.00393 0.0158 0.0642 0.102 0.148 0.455
2 0.0100 0.0201 0.0404 0.0506 0.103 0.211 0.446 0.575 0.713 1.386
3 0.0717 0.115 0.185 0.216 0.352 0.584 1.005 1.213 1.424 2.366
4 0.207 0.297 0.429 0.484 0.711 1.064 1.649 1.923 2.195 3.357
5 0.412 0.554 0.752 0.831 1.145 1.610 2.343 2.675 3.000 4.351
6 0.676 0.872 1.134 1.237 1.635 2.204 3.070 3.455 3.828 5.348
7 0.989 1.239 1.564 1.690 2.167 2.833 3.822 4.255 4.671 6.346
8 1.344 1.647 2.032 2.180 2.733 3.490 4.594 5.071 5.527 7.344
9 1.735 2.088 2.532 2.700 3.325 4.168 5.380 5.899 6.393 8.343
10 2.156 2.558 3.059 3.247 3.940 4.865 6.179 6.737 7.267 9.342
11 2.603 3.053 3.609 3.816 4.575 5.578 6.989 7.584 8.148 10.341
12 3.074 3.571 4.178 4.404 5.226 6.304 7.807 8.438 9.034 11.340
13 3.565 4.107 4.765 5.009 5.892 7.041 8.634 9.299 9.926 12.340
14 4.075 4.660 5.368 5.629 6.571 7.790 9.467 10.165 10.821 13.339
15 4.601 5.229 5.985 6.262 7.261 8.547 10.307 11.037 11.721 14.339
16 5.142 5.812 6.614 6.908 7.962 9.312 11.152 11.912 12.624 15.338
17 5.697 6.408 7.255 7.564 8.672 10.085 12.002 12.792 13.531 16.338
18 6.265 7.015 7.906 8.231 9.390 10.865 12.857 13.675 14.440 17.338
19 6.844 7.633 8.567 8.907 10.117 11.651 13.716 14.562 15.352 18.338
20 7.434 8.260 9.237 9.591 10.851 12.443 14.578 15.452 16.266 19.337
21 8.034 8.897 9.915 10.283 11.591 13.240 15.445 16.344 17.182 20.337
22 8.643 9.542 10.600 10.982 12.338 14.041 16.314 17.240 18.101 21.337
23 9.260 10.196 11.293 11.689 13.091 14.848 17.187 18.137 19.021 22.337
24 9.886 10.856 11.992 12.401 13.848 15.659 18.062 19.037 19.943 23.337
25 10.520 11.524 12.697 13.120 14.611 16.473 18.940 19.939 20.867 24.337
26 11.160 12.198 13.409 13.844 15.379 17.292 19.820 20.843 21.792 25.336
27 11.808 12.878 14.125 14.573 16.151 18.114 20.703 21.749 22.719 26.336
28 12.461 13.565 14.847 15.308 16.928 18.939 21.588 22.657 23.647 27.336
29 13.121 14.256 15.574 16.047 17.708 19.768 22.475 23.567 24.577 28.336
30 13.787 14.953 16.306 16.791 18.493 20.599 23.364 24.478 25.508 29.336
40 20.707 22.164 23.838 24.433 26.509 29.051 32.345 33.66 34.872 39.335
50 27.991 29.707 31.664 32.357 34.764 37.689 41.449 42.942 44.313 49.335
60 35.534 37.485 39.699 40.482 43.188 46.459 50.641 52.294 53.809 59.335
740 Apéndice A Tablas y demostraciones estadísticas

Tabla A.5 (continuación) Valores críticos de la distribución chi cuadrada


α
v 0.30 0.25 0.20 0.10 0.05 0.025 0.02 0.01 0.005 0.001
1 1.074 1.323 1.642 2.706 3.841 5.024 5.412 6.635 7.879 10.827
2 2.408 2.773 3.219 4.605 5.991 7.378 7.824 9.210 10.597 13.815
3 3.665 4.108 4.642 6.251 7.815 9.348 9.837 11.345 12.838 16.266
4 4.878 5.385 5.989 7.779 9.488 11.143 11.668 13.277 14.860 18.466
5 6.064 6.626 7.289 9.236 11.070 12.832 13.388 15.086 16.750 20.515
6 7.231 7.841 8.558 10.645 12.592 14.449 15.033 16.812 18.548 22.457
7 8.383 9.037 9.803 12.017 14.067 16.013 16.622 18.475 20.278 24.321
8 9.524 10.219 11.030 13.362 15.507 17.535 18.168 20.090 21.955 26.124
9 10.656 11.389 12.242 14.684 16.919 19.023 19.679 21.666 23.589 27.877
10 11.781 12.549 13.442 15.987 18.307 20.483 21.161 23.209 25.188 29.588
11 12.899 13.701 14.631 17.275 19.675 21.920 22.618 24.725 26.757 31.264
12 14.011 14.845 15.812 18.549 21.026 23.337 24.054 26.217 28.300 32.909
13 15.119 15.984 16.985 19.812 22.362 24.736 25.471 27.688 29.819 34.527
14 16.222 17.117 18.151 21.064 23.685 26.119 26.873 29.141 31.319 36.124
15 17.322 18.245 19.311 22.307 24.996 27.488 28.259 30.578 32.801 37.698
16 18.418 19.369 20.465 23.542 26.296 28.845 29.633 32.000 34.267 39.252
17 19.511 20.489 21.615 24.769 27.587 30.191 30.995 33.409 35.718 40.791
18 20.601 21.605 22.760 25.989 28.869 31.526 32.346 34.805 37.156 42.312
19 21.689 22.718 23.900 27.204 30.144 32.852 33.687 36.191 38.582 43.819
20 22.775 23.828 25.038 28.412 31.410 34.170 35.020 37.566 39.997 45.314
21 23.858 24.935 26.171 29.615 32.671 35.479 36.343 38.932 41.401 46.796
22 24.939 26.039 27.301 30.813 33.924 36.781 37.659 40.289 42.796 48.268
23 26.018 27.141 28.429 32.007 35.172 38.076 38.968 41.638 44.181 49.728
24 27.096 28.241 29.553 33.196 36.415 39.364 40.270 42.980 45.558 51.179
25 28.172 29.339 30.675 34.382 37.652 40.646 41.566 44.314 46.928 52.619
26 29.246 30.435 31.795 35.563 38.885 41.923 42.856 45.642 48.290 54.051
27 30.319 31.528 32.912 36.741 40.113 43.195 44.140 46.963 49.645 55.475
28 31.391 32.620 34.027 37.916 41.337 44.461 45.419 48.278 50.994 56.892
29 32.461 33.711 35.139 39.087 42.557 45.722 46.693 49.588 52.335 58.301
30 33.530 34.800 36.250 40.256 43.773 46.979 47.962 50.892 53.672 59.702
40 44.165 45.616 47.269 51.805 55.758 59.342 60.436 63.691 66.766 73.403
50 54.723 56.334 58.164 63.167 67.505 71.420 72.613 76.154 79.490 86.660
60 65.226 66.981 68.972 74.397 79.082 83.298 84.58 88.379 91.952 99.608

Das könnte Ihnen auch gefallen