Sie sind auf Seite 1von 62

ESTADÍSTICA INFERENCIAL

CARTILLA DIDÁCTICA DIGITAL

Vicerrectoría Académica
Oficina de Educación Virtual y TIC
Unidades Tecnológicas de Santander
2018
CARTILLA DIDÁCTICA DIGITAL ESTADÍSTICA INFERENCIAL
Licenciado en Matemáticas: Mg. German Andrés Bautista Obregón

GRUPO EDUCACIÓN VIRTUAL Y TIC:


Coordinador: Ing. Juan Carlos Díaz Díaz
Asesoría Pedagógica: Miguel Javier Hernandez Rozo
Diagramación: Dg. Caro Méndez Mantilla
Corrector de Estilo: Mg. Jaime Zafra Bueno
UTS VIRTUAL 2018
computer-767776_960_720
[Imagen en portada] Recuperado de: https://pixabay.com

Reservados todos los derechos. No se permite la reproducción total o parcial de esta obra, ni su incorporación a un
sistema informático, ni su transmisión en cualquier forma o por cualquier medio (electrónico, mecánico, fotocopia,
grabación u otros) sin autorización previa y por escrito de los titulares del copyright. La infracción de dichos derechos
puede constituir un delito contra la propiedad intelectual.
CONTENIDO
PRESENTACIÓN 8

JUSTIFICACIÓN 9

CAPÍTULO I
DISTRIBUCIONES MUESTRALES Y ESTIMACIONES 10
1.1 VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS 12
1.2 CONCEPTO DE DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO 13
1.3 MEDIA Y LA VARIANZA DE LAS DISTRIBUCIONES
DISCRETAS Y CONTINUAS 19

AUTOEVALUACIÓN 25

CAPÍTULO II
DISTRIBUCION NORMAL E INTERVALOS DE CONFIANZA 26
2.1 DISTRIBUCIÓN DE PROBABILIDAD NORMAL 28
2.2 PROPIEDADES DE LA DISTRIBUCIÓN NORMAL 29
2.3 ESTANDARIZACIÓN O TIPIFICACIÓN DE LA DISTRIBUCIÓN NORMAL 30
2.4 ESTIMACIÓN POR INTERVALOS DE CONFIANZA 40

AUTOEVALUACIÓN 46
CONTENIDO
CAPÍTULO III
PRUEBAS DE HIPÓTESIS 47
3.1 CONCEPTOS BÁSICOS DE LAS PRUEBAS DE HIPÓTESIS 49
3.2 PASOS PARA PROBAR UNA HIPÓTESIS 49
3.3 PRUEBAS DE SIGNIFICANCIA DE UNA Y DOS COLAS 50

AUTOEVALUACIÓN 57

RESUMEN GENERAL 58

GLOSARIO 59

REFERENCIAS 60
LISTA DE TABLAS Y CUADROS
Tabla N° 1. Función de distribución de probabilidad 13
Tabla N° 2. Espacio muestral 15
Tabla N° 3. Función de distribución de probabilidad 15
Tabla N° 4. Resultados encuesta familiar 22
Tabla N° 5. Autoevaluación 25

Cuadro N° 1 Variables aleatorias 12


Cuadro N° 2. Información del problema 13
Cuadro No. 3 Ventas de celulares 20
Cuadro N° 4. Sumatoria de productos 21
Cuadro N° 5 Cálculo se la varianza y la desviación estándar 21
Cuadro N° 6. Sumatoria de productos 23
Cuadro N° 7. Cálculo de la varianza y desviación estándar 23
LISTA DE FIGURAS
Figura N° 1. Diagrama de barras. 10
Figura N° 2. Distribución de probabilidad 14
Figura N° 3. Distribución de probabilidad 16
Figura N° 4. Distribución de probabilidad 20
Figura N° 5 Distribución de la probabilidad normal 22
Figura N° 6. Distribución normal 26
Figura N° 7. Probabilidad de la distribución normal 28
Figura N° 8. Desviación estándar 29
Figura N° 9 Probabilidad de la distribución normal 29
Figura N° 10. Figura N° 10.
Cálculo de la probabilidad, con base al valor – 0,8 en la tabla 1. 33

Figura N° 11. Cálculo de la probabilidad, con base al valor -0,4 en la tabla 1 34


Figura N°12. Cálculo de la probabilidad con base, al valor – 1,2 en la tabla 1. 35
Figura N° 13. Cálculo de la probabilidad, con base al 0,4, en la tabla 2 35
Figura N° 14. Intervalo buscado: restando las áreas obtenidas, anteriormente. 36
Figura N° 15. Intervalo buscado: restando las áreas obtenidas, anteriormente. 36
Figura N° 16. Intervalo buscado: restando las áreas obtenidas, anteriormente. 36
Figura N° 17. Probabilidad, con base al valor -0,83, en la tabla 1. 37
Figura N° 18. Probabilidad, con base al valor 0,5 en la tabla 2. 38
Figura N° 19. Intervalo buscado, con base a la resta áreas obtenidas. 38
Figura N° 20. Probabilidad, con base al valor -01,66 de la tabla 1. 39
LISTA DE FIGURAS
Figura N° 20. Probabilidad, con base al valor -01,66 de la tabla 1. 39
Figura N° 21. Probabilidad, con base al valor 0,41 de la tabla 2 40
Figura N° 22. Determinación del intervalo de confianza. 41
Figura N° 23. Representación del Intervalo de confianza 42
Figura N° 24. Área bajo curva. 42
Figura N° 26. Área bajo la curva 44
Figura N° 27. Pruebas de hipótesis. 49
Figura N° 28. Gráfica de las regiones de aceptación y rechazo 51
Figura N° 29. Ubicación del estadístico de prueba. 52
Figura 30. Gráfica de las regiones de aceptación y rechazo 53

Figura N° 31. Ubicación del estadístico de prueba. 54


Figura N° 32. Gráfica de las regiones de aceptación y rechazo. 55
Figura N° 33. Ubicación del estadístico de prueba. 56
PRESENTACIÓN
ESTADÍSTICA INFERENCIAL

La cartilla didáctica digital de Estadística Inferencial, tiene como fin dar una guía acertada
y precisa, para la construcción del aprendizaje significativo de los estudiantes Uteísta, que
cursan virtualmente este módulo.

Los profesionales de las diferentes áreas, se enfrentan hoy en día a grandes retos como
nunca antes, debido a la utilización de la tecnología en los diferentes procesos de
producción y venta de productos o servicios, permitiendo el acceso a gran variedad de
datos.

Para llevar a cabo la ejecución de proyectos o metas, en una organización ya no basta sólo
con el sentido común, para los empresarios; la estadística se ha convertido en un
instrumento valioso, que los ayudará a enfrentar las diversas situaciones de
incertidumbre, en un mundo globalizado donde se dispone de una significativa
información competitiva, a nivel general.

El análisis estadístico y el uso de métodos de medición, son la base para evaluar el éxito
de un negocio o proceso, con la finalidad de posibilitar la implementación acciones, y
mejoras efectivas basadas en las necesidades y expectativas de la organización.

Este contexto este material, se constituye como guía temática y conceptual, para la toma
de decisiones, en el análisis de datos y procesamiento de información.

8
JUSTIFICACIÓN
ESTADÍSTICA INFERENCIAL

A medida que avanza la tecnología, y se involucra cada vez más en las diferentes ramas
del conocimiento, ha posibilitado, el incrementó el flujo de información relevante, para el
desarrollo de cualquier proyecto o investigación.

Para tomar decisiones efectivas, las organizaciones deben contar con profesionales con
capacidad de organizar grandes cantidades de datos, en forma apropiada, para
transformarlos en información, que permita llegar a conclusiones razonables, sobre una
determinada situación.

En este proceso, la comprensión de los métodos estadísticos, aumentará la eficiencia de


las actuaciones individuales y colectivas en las empresas, mejorando así las posibilidades
que puedan sobrevivir y prosperar, en ambientes cada vez más competitivos.

A través de la estadística inferencial, se pueden identificar las diferentes variables


aleatorias, en la mayoría de las ciencias naturales, sociales, económicas y médicas; con
ayuda de la teoría del muestreo, la estimación de parámetros, las distribuciones
muéstrales y la teoría de la probabilidad, se puede medir el riesgo sobre la ocurrencia de
algún suceso e incertidumbre, o realizar alguna generalización sobre un fenómeno, con
base en información parcial que se conoce sobre él, o verificar la veracidad de una
suposición, que sea importante dentro de un proceso decisorio.

Se puede decir que si se conoce y se entiende el entorno en cual se pueden mover, se


podrán plantear soluciones efectivas, a los problemas que se presenten, con la finalidad
de favorecer la toma decisiones responsables, generadoras de consecuencias positivas.

Finalmente, el módulo de estadística inferencial, es de gran importancia para los


estudiantes virtuales Uteístas, ya que, a través de él, se plantean los fundamentos para el
desarrollo proyectos de investigación.

9
Figura 1. Diagrama de barras.
logo-3543961_960_720 [ Imagen ]Recuperado de: https://pixabay.com

DISTRIBUCIONES MUESTRALES
Y ESTIMACIONES

10
VARIABLES ALEATORIAS.

Clasifican.

DISCRETAS. CONTINUAS.

Utilizan para definir.

DISTRIBUCION DE LA PROBABILIDAD

Determinar.

Media, varianza y desviación


estándar

Fuente: elaboración propia.


11
Capítulo I

DISTRIBUCIONES MUESTRALES Y ESTIMACIONES


1.1 VARIABLES ALEATORIAS DISCRETAS Y CONTINUAS.

1.1.1 Variables aleatorias


Cuando se habla de probabilidad, de manera implícita también se habla de espacio
muestral, el cual se define a partir de un experimento aleatorio, donde el azar es el factor
determinante. Una variable aleatoria, es una función que le asigna un número real, y sólo
uno, a cada uno de los resultados de un experimento aleatorio. Las variables aleatorias,
se representan por letras mayúsculas. Las variables aleatorias, se pueden clasificar como
discretas o continuas.

1.1.2 Variable aleatoria discreta.


Es aquella que sólo puede tomar un número finito de valores, o infinito numerable. Esta
Variable corresponde a experimentos, en los que se cuenta el número de veces que ha
ocurrido el suceso.

1.1.3 Variable aleatoria continúa.


Es aquella que puede tomar cualquier valor numérico en un intervalo, o conjunto de
intervalos.
EJEMPLO 1.

Cuadro N° 1. Variables aleatorias.


Experimento Variable Resultados Tipo
Lanzamiento de tres monedas. Número de caras obtenidas al 0,1,2,3 Discreta..
lanzar las monedas.
Llenar una botella de 700 Cantidad de centímetros cúbicos Continua..
centímetros cúbicos. completados. 0 ≤ X ≤ 700
Revisión de 40 bombillos. Cantidad de bombillos dañados. 0,1,2,3,…,40 Discreta..
Construcción de un muro de Porcentaje de avance en la obra. 0 ≤ X ≤ 100 Continua.
contención.
Prueba escrita de 20 preguntas Numero de respuestas correctas. 0,1,2,3,…,20 Discreta.
de selección múltiple.

Fuente: elaboración propia.


12
1.2 CONCEPTO DE DISTRIBUCIÓN MUESTRAL DE UN ESTADÍSTICO.

1.2.1 Distribución de la probabilidad.


Una distribución de probabilidad, muestra los posibles resultados de un experimento
aleatorio y la probabilidad, que presenta cada uno de los resultados. Hay diferentes
distribuciones de probabilidad, teniendo en cuenta si la variable aleatoria es discreta, o
continúa.

1.2.2 Distribución de la probabilidad para variables aleatorias discretas.


Si x es una variable aleatoria discreta, la función dada por P(x) para cada x, se denomina
función de probabilidad, o distribución de la probabilidad de x.

EJEMPLO 2.

La información sobre las ventas, del mes de junio del año 2018 de una tienda de celulares
ubicada centro comercial Bucacentro, de la ciudad de Bucaramanga durante los 24 días
que laboraron fueron:

Durante 3 días no se vendió ningún celular; durante 5 días se vendió un solo celular;
durante 7 días se vendieron dos celulares; durante 6 días se vendieron tres celulares, y
durante 3 días se vendieron cuatro celulares. Determinar la distribución de probabilidad,
para este caso.

Lo primero que se hace es definir la variable aleatoria discreta X, como el número de


celulares vendidos, durante los 24 días labores del mes de junio. Se elabora el cuadro N°
2, para resumir la información del problema.

Cuadro N° 2. Información del problema.


Días del mes de junio. 3 5 7 6 3
Celulares vendidos. 0 1 2 3 4

Para definir la función de distribución de probabilidad se realizará la tabla N° 1.

Tabla N° 1. Función de distribución de probabilidad.


X 0 1 2 3 4
P(x) 1/8 5/24 7/24 1/4 1/8

13
La figura N° 2 de la distribución de probabilidad, se muestra a continuación.

Figura N° 2. Distribución de probabilidad.

Fuente: elaboración propia.

Al analizar la función de probabilidad, se puede concluir:

• Que la probabilidad de vender 3 celulares un día cualquiera, en del mes de mayo es:
1
𝑃 2 = 4 = 0.25, es decir 25%.
• Que la probabilidad de vender 2 celulares o menos un día cualquiera, del mes de mayo
1 5 7 5
es: 𝑃 0 + 𝑃 1 + 𝑃 2 = 8 + 24 + 24 = 8 = 0.625, es decir 62.5%.
• Que la probabilidad de vender 3 celulares o más un día cualquiera, del mes de mayo
1 1 3
es: 𝑃 3 + 𝑃 4 = 4 + 8 = 8 = 0.375, es decir 37.5%.
• La suma de la probabilidad de los resultados obtenidos es igual 1, es decir,
1 5 7 1 1
100%, 8 + 24 + 24 + 4 + 8 = 1.

14
EJEMPLO 3.

Se lanzan dos dados, y al caer se suma el resultado de la cara superior de cada uno de
ellos. Determinar, la distribución de probabilidad para este caso.

Lo primero que se hace es definir la variable aleatoria discreta X, como la suma de los
resultados obtenidos, al lanzar los dados. Luego, se determina el espacio muestral
realizando una tabla, donde la primera fila representa el dado uno, y la primera columna
representa el dado dos, se completa la tabla realizando las sumas de los resultados, como
se muestra a continuación, en la Tabla N° 2.

Tabla N° 2. Espacio muestral.

Suma 1 2 3 4 5 6
1 2 3 4 5 6 7

2 3 4 5 6 7 8
3 4 5 6 7 8 9

4 5 6 7 8 9 10
5 6 7 8 9 10 11

6 7 8 9 10 11 12

Para definir la función de distribución de probabilidad, se realizará la tabla N° 3.

Tabla N° 3. Función de distribución de probabilidad.

x 2 3 4 5 6 7 8 9 10 11 12
P(x) 1/36 1/18 1/12 1/9 5/36 1/6 5/36 1/9 1/12 1/18 1/36

15
En la figura N° 3, se muestra la distribución de probabilidad.

Figura N° 3. Distribución de probalidad.

Fuente: elaboración propia.

Al analizar la función de probabilidad, se puede concluir:


• Que la probabilidad de que al lanzar los dados, la suma sea 4 es de
1
𝑃 4 = 12 = 0.083, es decir 8.3%.
• Que la probabilidad de que al lanzar los dados, la suma de 5 o menos, es de
1 1 1 1 5
𝑃 2 + 𝑃 3 + 𝑃 4 + 𝑃 5 = 36 + 18 + 12 + 9 = 18 = 0.277, es decir, 27.7%.
• La suma de la probabilidad de los resultados obtenidos es igual 1, es decir,
1 1 1 1 5 1 5 1 1 1 1
100%, 36 + 18 + 12 + 9 + 36 + 6 + 36 + 9 + 12 + 18 + 36 = 1.
• El resultado que tiene mayor probabilidad es el 7 con 16,67%, y los resultados
que tienen menor probabilidad, son el 2, y el 12 con 2,78%.

La función de probabilidad de una variable aleatoria discreta, cumple las siguientes


propiedades fundamentales, las cuales son:

1. Para cualquier valor de x, la probabilidad debe ser, mayor o igual a 0.


2. Los resultados, son eventos mutuamente excluyentes.
3. La suma de las probabilidades de los diversos eventos, es igual a 1.
16
1.2.3 Distribución de la probabilidad para variables aleatorias continúas.

Si la variable aleatoria es continua, existen infinitos valores posibles que puede tomar la
variable. Por lo tanto, no es posible encontrar la probabilidad de un valor puntual de la
variable, como se puede hacer en el caso de las variables aleatorias discretas, pero si es
posible calcular la probabilidad acumulada hasta cierto valor; a esto se denomina,
densidad de la probabilidad.

Si la función f(x), es la función densidad de probabilidad para la variable aleatoria continua


x definida, sobre el conjunto de los números reales. Entonces, cumple las siguientes
propiedades:

1. 𝑓(𝑥) ≥ 0
𝑏
2. 𝑃 𝑎 < 𝑥 < 𝑏 = ‫𝑥𝑑 𝑥 𝑓 𝑎׬‬

3. ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥 = 1


A la integral ‫׬‬−∞ 𝑓 𝑥 𝑑𝑥, se le denomina función de distribución. Teniendo en cuenta lo
anterior, se puede encontrar la función de distribución acumulada, la cual permite
calcular la probabilidad acumulada de un valor x dado, se representa por F(x) y se define:
𝑥
𝐹 𝑥 = 𝑃 𝑋 ≤ 𝑥 = ‫׬‬−∞ 𝑓 𝑡 𝑑𝑡, para −∞ ≤ 𝑥 ≤ ∞

La función de distribución acumulada, de una variable aleatoria continua cumple con las
siguientes propiedades:

1. 𝑃 𝑋 ≤ 𝑥 = 𝐹(𝑥)
2. 𝑃 𝑋 > 𝑥 = 1 − 𝐹(𝑥)
3. 𝑃 𝑎 ≤ 𝑥 ≤ 𝑏 = 𝐹 𝑏 − 𝐹(𝑎)

computer-767776_960_720 [ Imagen ]Recuperado de: https://pixabay.com


EJEMPLO 4.

El tiempo de duración, en miles de horas de una nueva marca de


bombillos, viene dado, por la siguiente función de distribución de acumulada:
0 𝑠𝑖 𝑥 < 0
𝐹 𝑥 =
1 − 2−𝑥 𝑠𝑖 𝑥 ≥ 0

a) ¿Cuál es la probabilidad, que un bombillo seleccionado al azar, funcione máximo


1,2 miles de horas?

Para determinar la probabilidad que cumpla la condición dada, sólo se reemplaza en la


función de distribución acumulada, de la siguiente forma:
𝑃 𝑋 ≤ 1,2 = 𝐹 1,2 = 1 − 2−1,2 = 0,5647

Por lo tanto, la probabilidad de que un bombillo seleccionado al azar, funcione máximo


1,2 miles de horas es de 56,47%

b) ¿Cuál es la probabilidad de que un bombillo seleccionado al azar, funcione más de 1,4


miles de horas?

Para determinar la probabilidad que cumpla la condición dada, sólo se reemplaza en la


función de distribución acumulada, utilizando la propiedad indicada, de la siguiente
forma:
𝑃 𝑋 > 1,4 = 1 − 𝐹 1,4 = 1 − (1 − 2−1,4 ) = 0,3789

Como consecuencia, la probabilidad de que un bombillo seleccionado al azar, funcione


más. 1.4 miles de horas, es de 37,89%.

c) ¿Cuál es la probabilidad que un bombillo funcione, entre 0,6 y 0,9 miles de horas?
Para determinar la probabilidad, que cumpla la condición dada, sólo se reemplaza en la
función de distribución acumulada, utilizando la propiedad indicada, de la siguiente
forma:
𝑃 0.6 ≤ 𝑋 ≤ 0.9 = 𝐹 0.9 − 𝐹 0.06 = 1 − 2−0,9 − 1 − 2−0,6 = 0.1238

Por lo tanto, la probabilidad de que un bombillo seleccionado al azar funcione, entre 0,6
y 0,9 miles de horas es de 12,38%.

18
1.3 MEDIA Y LA VARIANZA DE LAS DISTRIBUCIONES DISCRETAS Y CONTINUAS.

1.3.1 Valor esperado y varianza de una variable aleatoria discreta


Recordar que una parte esencial de la estadística, son las medidas de tendencia central
primordialmente la media representada por 𝑥,ҧ así como las de dispersión varianza 𝑠 2 y la
desviación estándar s, de la muestra. Como las distribuciones de probabilidad
representan poblaciones, las medidas que se trabajarán serán 𝜇 media, 𝜎 2 varianza. y 𝜎
desviación estándar de la población, se denominan parámetro poblacionales.

• La media o valor esperado de una variable aleatoria discreta x, se define como el


promedio ponderado de los valores de la variable, de la siguiente forma:

𝜇 = ෍ 𝑥𝑖 ∙ 𝑓(𝑥𝑖 )

• La varianza de una variable aleatoria discreta x, está determinada por la expresión:

𝜎 2 = ෍(𝑥𝑖 − 𝜇)2 ∙ 𝑓(𝑥𝑖 )

• La desviación estándar de una variable aleatoria discreta x, está determinada por la


expresión:

𝜎= ෍(𝑥𝑖 − 𝜇)2 ∙ 𝑓(𝑥𝑖 )

Las medidas valor esperado, varianza y desviación estándar, son importantes ya que
ayudan en el análisis y planteamiento de conclusiones, de un conjunto de datos a partir
de la función de distribución de probabilidad.

19
EJEMPLO 4.

La información sobre las ventas del mes de junio del año 2018, de una tienda de celulares
ubicada centro comercial Bucacentro de la ciudad de Bucaramanga durante los 24 días
que laboraron, se muestran en el cuadro N° 3:

Cuadro No. 3 Ventas de celulares.


Días del mes de junio. 3 5 7 6 3
Celulares vendidos. 0 1 2 3 4

Determinar el valor esperado, varianza y desviación estándar.

Para encontrar estas medidas, lo primero que se hace definir la variable aleatoria discreta
𝑥_𝑖, como el número de celulares vendidos durante los 24 días labores del mes de junio,
y 𝑓(𝑥_𝑖 ) la función de distribución de probabilidad, como se muestra en la figura N° 4.
(Ejemplo 2).

Figura N° 4. Distribución de probabilidad.

Fuente: elaboración propia.

20
Luego se multiplica cada 𝑥𝑖 por 𝑓 𝑥𝑖 , que es su probabilidad correspondiente para
después sumar todos los productos obtenidos, como se muestra en el cuadro N° 4:

Cuadro N° 4. Sumatoria de productos.

Realizando el proceso descrito en el párrafo anterior, se obtiene el valor esperado el cual


es 𝜇 = 2.04, se espera vender, en día cualquiera, del mes dos celulares.

Para calcular la varianza y la desviación estándar, se puede hacer completando el cuadro


N° 5, de la siguiente forma:

Cuadro N° 5 Cálculo se la varianza y la desviación estándar.

Como la varianza está dada en unidades cuadradas, es conveniente que se remitan a la


desviación estándar, la cual se presentan en unidades lineales, que a su vez son una
medida más sencilla, para trabajar. En este caso 𝜎 = 1.46 = 1.208.

El valor esperado, es un buen dato ya que la desviación estándar, es relativamente


pequeña. Analizando los datos obtenidos, se puede esperar al menos vender dos
celulares al día, para el siguiente mes.

21
EJEMPLO 5.

En barrio Rosales de la ciudad de Bucaramanga, se realizó una encuesta a 600 familias,


preguntándoles el número de hijos tienen cada una. Los resultados muestran en la tabla
N° 4:

Tabla N° 4. Resultados encuesta familiar.

Cantidad de hijos. 0 1 2 3 4
Número de familias. 72 168 192 108 60

Determinar el valor esperado, varianza y desviación estándar.

Para encontrar estas medidas, lo primero que se hace definir la variable aleatoria discreta
𝑥𝑖 , como el número de hijos tiene cada familia, y 𝑓 𝑥𝑖 la función de distribución de
probabilidad, como se muestra en la figura N° 5.

Fuente: elaboración propia.

22
Luego se multiplica cada 𝑥𝑖 por 𝑓 𝑥𝑖 , que es su probabilidad correspondiente para
después sumar todos los productos obtenidos, como se muestra en el cuadro N° 6:

Cuadro N° 6. Sumatoria de productos.

Realizando el proceso descrito en el párrafo anterior, se obtiene el valor esperado el cual


es 𝜇 = 1,86, si se toma una familia al azar del barrio rosales de la ciudad de
Bucaramanga, se espera que tenga por lo menos un hijo.

Para calcular la varianza y la desviación estándar se completa el cuadro N° 7, de la


siguiente forma:

Cuadro N° 7. Cálculo de la varianza y desviación estándar.

Como la varianza está dada en unidades cuadradas, es conveniente que se remitan a la


desviación estándar, la cual se presentan en unidades lineales, que a su vez son una
medida más sencilla para trabajar. En este caso, 𝜎 = 1,32 = 1.148.

El valor esperado, es un buen dato ya que la desviación estándar, es relativamente


pequeña. Analizando los datos obtenidos, se puede esperar, que, si una familia se muda al
barrio rosales de la ciudad de Bucaramanga, tendrá por lo menos un hijo.

23
1.3.2 Valor esperado y varianza de una variable aleatoria continúa:

Si x es una variable aleatoria continúa, con función densidad de probabilidad 𝑓 𝑥 ,


entonces se define:

• La media o valor esperado de la variable x, es 𝜇 = ‫׬‬−∞ 𝑥 ∙ 𝑓 𝑥 𝑑𝑥.


• La varianza de la variable x, es 𝜎 2 = ‫׬‬−∞(𝑥 − 𝜇)2 ∙ 𝑓 𝑥 𝑑𝑥 .


• La desviación estándar de la variable x, es 𝜎 = ‫׬‬−∞(𝑥 − 𝜇)2 ∙ 𝑓 𝑥 𝑑𝑥.

Para determinar cada una de estas medidas, se hace necesario evaluar la integral
resultante. Una variable aleatoria continua, corresponde a un modelo matemático de un
fenómeno. Para caracterizar el comportamiento de dicho modelo, es importante conocer
la función de distribución de probabilidad.

paper-3224638_960_720 [ Imagen ]Recuperado de: https://pixabay.com


24
AUTOEVALUACIÓN I

Teniendo en cuenta los conceptos y ejemplos trabajados en el


capítulo I, resolver el siguiente ejercicio:

En barrio Rosales de la ciudad de Bucaramanga, se realizó una


encuesta a 180 personas, preguntándoles la cantidad de
televisores que tienen en sus hogares. Los resultados muestran en
la tabla N°. 5

Tabla N° 5

Cantidad de TV. 0 1 2 3 4
Número de personas. 5 60 90 15 10

Determinar:

a) Función y grafica de la distribución de probabilidad.


b) El valor esperado, varianza y desviación estándar.

Recordar que, en este ejercicio se tiene la intención, de fortalecer


la aplicación de la temática desarrollada, en esta unidad.

25
Figura 6. Distribución normal.
logo-3543944_960_720 [ Imagen ]Recuperado de: https://pixabay.com

DISTRIBUCIÓN NORMAL E
INTERVALOS DE CONFIANZA

26
DISTRIBUCION DE PROBABILIDAD
NORMAL.

Cumple

PROPIEDADES Y CARACTERISTICAS.

Permiten.

LA ESTANDARIZACIÓN DE LA DISTRIBUCIÓN
NORMAL 𝑁 0,1 .

Para generar.

CALCULO DE LA PROBABILIDAD DE INTERVALOS DE CONFIANZA PARA LA


OCURRENCIA DE UN EVENTO. MEDIA.

Fuente: elaboración propia.

27
Capítulo II

DISTRIBUCIÓN NORMAL E INTERVALOS DE CONFIANZA.

2.1 Distribución de probabilidad normal.

La distribución de probabilidad normal de una variable aleatoria continua, también


conocida como distribución de la campana Gauss, es la más importante de las
distribuciones estadísticas, por la cantidad de fenómenos reales, del campo de las
ingenierías y las ciencias sociales (administración y economía), que se pueden modelar a
través de ella.

Además, proporciona una excelente aproximación, para describir algunos fenómenos de


variable aleatoria discreta, bajo ciertas condiciones. Con la distribución normal, se puede
calcular la probabilidad de ocurrencia de un evento, dentro de ciertos rangos o intervalos.

La función de densidad de distribución normal está definida por la expresión:


−(𝑥−𝜇)2
1
𝑓 𝑥 = ∙𝑒 2𝜎2 para −∞ < 𝑥 < ∞
𝜎∙ 2𝜋

Esta función depende de dos parámetros; la media 𝜇, y la varianza de la distribución 𝜎 2 .


Si se conoce la media y la varianza de la variable x, se representa la distribución normal,
a través de la notación 𝑁(𝜇, 𝜎 2 ).

La gráfica de la distribución de la probabilidad normal, es una curva acampanada como se


muestra, en la figura N° 7.

Figura N° 7. Distribución de la probabilidad normal.

Fuente: elaboración propia.


28
2.2 Propiedades de la distribución normal.

• El punto donde alcanza su valor más alto la curva, es la media que a su vez coincide con
la mediana, y la moda de la distribución.

• La curva es asintótica en el eje x, es decir se extiende en el intervalo [-∞,∞], cualquier


valor, es teóricamente posible. La medida del área total bajo, es igual 1 o 100%.

• Es simétrica, respecto a la media μ. Existe una probabilidad del 50% de observar un


dato mayor que la media, y existe una probabilidad 50% de observar un dato menor
que la media, además, los datos se distribuyen alrededor de la media, teniendo como
referencia la desviación estándar, se muestra en la figura N°8.

Figura N° 8. Desviación estándar.

Fuente: elaboración propia.

• Para calcular la probabilidad de la variable aleatoria normal, se define mediante áreas


bajo la curva, como se muestra en la figura N° 9, tomada como ejemplo.

Figura N° 9. Probabilidad de la distribución normal.

Fuente: elaboración propia.

Existe un número infinito de distribuciones normales posibles, con la forma en común de


la campana de Gauss, lo único que la diferencia es el valor de media y la varianza.

29
businessman-3492380_960_720 [ Imagen ]Recuperado de: https://pixabay.com

2.3 Estandarización o tipificación de la distribución normal.

Al estandarizar una distribución normal, permite determinar más fácilmente la


probabilidad de un evento. Si se tiene una variable aleatoria x, con una distribución
normal, 𝑁 𝜇, 𝜎 2 , se llama a estandarizar o tipificar al proceso de convertirla, en una
normal estándar 𝑁 0,1 ; esto se logra, trasladando o centrando la media en cero, y
haciendo que la desviación típica sea 𝜎 = 1, para ello, se aplica el cambio de variable Z,
mediante la siguiente fórmula:

𝑋−𝜇
𝑍=
𝜎

Al estandarizar la variable, se puede utilizar unas tablas de distribución normal, con 𝜇 = 0


y 𝜎 = 1 para encontrar la probabilidad de Z, como se muestra a continuación, en las
Tablas 1 y 2, que hacen referencia a: la Distribución Normal, con su correspondiente
gráfica de desviación:

30
TABLA DE DISTRIBUCIÓN NORMAL.

TABLA 1

Fuente: elaboración propia.

31
TABLA DE DISTRIBUCIÓN NORMAL.

TABLA 2
Fuente: elaboración propia.

32
En estas tablas, se muestra la medida del área bajo la curva de izquierda a derecha, hasta
el valor Z calculado, de la distribución normal estándar 𝑁(0,1). Para conocer el valor de
la probabilidad, se busca en la primera columna las unidades y las décimas, y en la
primera fila las centésimas del valor de Z.
EJEMPLO 1

La temperatura en el mes de junio de la ciudad de Bucaramanga, está


distribuida normalmente con media de 〖28〗^𝑜 𝐶, y desviación estándar de 4^𝑜 𝐶. Con
estos datos, calcular la probabilidad de que la temperatura está:

a) Por debajo de los 〖24〗^𝑜 𝐶 .


b) Por encima de los 〖26〗^𝑜 𝐶
c) Entre 〖22〗^𝑜 𝐶 y 〖30〗^𝑜 𝐶

Lo primero que se hace para determinar la probabilidad, es que la temperatura en este


mes, esté por debajo de los 〖24〗^𝑜 𝐶, es definir la variable X, como la temperatura.
Luego se sacan los datos que proporciona el problema, los cuales son 𝜇=〖28〗^𝑜 𝐶, 𝜎=4^𝑜
𝐶 y 〖𝑋=24〗^𝑜 𝐶, para encontrar el valor de Z, de la siguiente forma:

24 − 28
𝑍= = −0,8
5

Se busca este valor -0,8 en la tabla 1, y se encuentra la probabilidad correspondiente


como se muestra en la figura N°10.

Figura N° 10. Cálculo de la probabilidad, con base al valor – 0,8 en la tabla 1.

Fuente: elaboración propia.


33
Por lo tanto se puede concluir, que la probabilidad que la temperatura en este mes, esté
por debajo, de los 〖24〗^o C es de 21,19%.

Para determinar la probabilidad, que la temperatura, esté por encima de los 〖26〗^o C, de
nuevo se determina el valor Z, sólo cambiando 〖X=26〗^o C, como se muestra a
continuación: 26 − 28
𝑍= = −0,4
5
Se busca este valor -0,4 en la tabla 1 y se encuentra la probabilidad correspondiente
tiendo en cuenta que se buscan los valores mayores como se muestra en la figura N° 11.

Figura N° 11. Cálculo de la probabilidad, con base al valor -0,4 en la tabla 1.

Fuente: elaboración propia.

Para calcular el área deseada, se recuerda que la medida del área total bajo la curva es
igual 1, realizando la resta de áreas respectivas, se obtiene:

𝑃 𝑋 > 26𝑜 𝐶 = 1 − 0,3446 = 0,6554

Por lo tanto, la probabilidad de la temperatura en este mes, esté por encima de los 26𝑜 𝐶,
es de 65,54%.

Para determinar la probabilidad, de la temperatura, esté entre 22𝑜 𝐶 y 30𝑜 𝐶, se debe


encontrar el valor Z, para cada una de las temperaturas. Se comienza reemplazando
𝑋 = 22𝑜 𝐶, como se nuestra a continuación:

26−28
𝑍= = −1,2
5

34
Se busca este valor -1,2 en la tabla 1, y se encuentra la probabilidad correspondiente
como se muestra en la figura N° 12.

Figura N°12. Cálculo de la probabilidad con base, al valor – 1,2 en la tabla 1.

Fuente: elaboración propia.

Ahora se encuentra el valor Z, para 〖X=30〗^o C, como se muestra a continuación:


30 − 28
𝑍= = 0,4
5

Se busca el 0,4 en la tabla 2 y se encuentra la probabilidad correspondiente:

Figura N° 13. Cálculo de la probabilidad, con base al 0,4, en la tabla 2.

Fuente: elaboración propia.


35
Para calcular área del intervalo buscado, se realiza la resta de las áreas obtenidas
anteriormente, como se muestra en las figuras 14, 15 y 16.

Figura N° 14. Intervalo buscado: restando las áreas obtenidas, anteriormente.

Fuente: elaboración propia.


Figura N° 15. Intervalo buscado: restando las áreas obtenidas, anteriormente.

Fuente: elaboración propia.

Figura N° 16. Intervalo buscado: restando las áreas obtenidas, anteriormente.

Fuente: elaboración propia.

𝑃 22𝑜 𝐶 < 𝑋 < 30𝑜 = 0,6554 − 0,1151 = 0,5403

Por lo tanto, la probabilidad que en este mes la temperatura, esté entre 22𝑜 𝐶 y 30𝑜 𝐶 es
de 54,03%.

36
EJEMPLO 2.

La empresa de mensajería “Rapi-ya” de la ciudad de Bucaramanga, con el ánimo de


generar una campaña efectiva para buenos hábitos de alimentación, desde el
departamento de salud ocupacional realizó una encuesta, sobre el peso de sus 600
trabajadores; se encontró que la media fue 80 kg, y la desviación estándar es 12 kg, los
pesos, se distribuyen normalmente. Determinar, cuántos trabajadores tienen un peso:

a) Entre 70 y 86 Kilogramos
b) Menos 60 Kilogramos
c) Más 85 Kilogramos.

Lo primero que se hace para determinar la cantidad de trabajadores, que cumplen con el
peso indicado, es definir la variable X, como el peso de los trabajadores. Luego se sacan
los datos que proporciona el problema, los cuales son 𝜇=80𝑘𝑔, y 𝜎=12𝑘𝑔.
Para encontrar cuántos trabajares tienen un peso entre 70 y 86 Kilogramos, se debe
encontrar el valor Z, de cada uno de los pesos, comenzar reemplazando 𝑋=70𝐾𝑔, como
se nuestra a continuación:
70 − 80
𝑍= = −0,83
12

Se busca este valor -0,833 en la tabla 1, y se encuentra la probabilidad correspondiente:

Figura N° 17. Probabilidad, con base al valor -0,83, en la tabla 1..

Fuente: elaboración propia.

37
Ahora se encuentra el valor Z, para 𝑋 = 86 𝐾𝑔, como se muestra a continuación:

86 − 80
𝑍= = 0,5
12

Se busca el valor 0,5 en la tabla 2 y se encuentra la probabilidad correspondiente:

Figura N° 18. Probabilidad, con base al valor 0,5 en la tabla 2.

Fuente: elaboración propia.

Para calcular área del intervalo buscado, se realiza la resta de las áreas obtenidas
anteriormente:

Figura N° 19. Intervalo buscado, con base a la resta áreas obtenidas.

Fuente: elaboración propia.

𝑃 70 < 𝑋 < 86 = 0,6915 − 0,2033 = 0,4882

38
Ahora se multiplica la probabilidad obtenida, por la cantidad de trabajadores
encuestados, 600 ∙ 0,4882 = 292,92 . Por lo tanto, se puede concluir que 292
trabajadores, tienen un peso entre 70 y 86 Kilogramos.

Para encontrar cuántos trabajares tiene un peso menor a los 60 Kilogramos, se debe
encontrar el valor Z, para 𝑋 = 60 𝐾𝑔, como se muestra a continuación:

60 − 80
𝑍= = −1,66
12

Se busca este valor -01,66 en la tabla 1 y se encuentra la probabilidad correspondiente:

Figura N° 20. Probabilidad, con base al valor -01,66 de la tabla 1.


Fuente: elaboración propia.

Fuente: elaboración propia.


Ahora se multiplica la probabilidad obtenida, por la cantidad de trabajadores encuestados
600 ∙ 0,0485 = 29,1. Por lo tanto, se puede concluir que 29 trabajadores, tienen un peso
menor 60 Kilogramos.

Para encontrar cuántos trabajares tiene un peso mayor a los 88 Kilogramos, se debe
encontrar el valor Z, para 𝑋 = 60 𝐾𝑔 , como se nuestra a continuación:

85 − 80
𝑍= = 0,41
12

Se halla este valor 0,41 en la tabla 2, y se encuentra la probabilidad correspondiente,


tiendo en cuenta que se buscan los valores mayores, como se muestra en la gráfica N° 21.

39
Figura N° 21. Probabilidad, con base al valor 0,41 de la tabla 2.

Fuente: elaboración propia.

Para calcular el área deseada, se recuerda que la medida del área total bajo la curva es
igual 1, realizando la resta de áreas respectivas se obtiene:

𝑃 𝑋 > 85 = 1 − 0,6591 = 0,3409

Ahora se multiplica la probabilidad obtenida, por la cantidad de trabajadores encuestados


600 ∙ 0,3409 = 204,54. Por lo tanto, se puede concluir que 204 trabajadores, tienen un
peso mayor 85 Kilogramos.

2.4 Estimación por intervalos de confianza.

Un intervalo de confianza, muestra la variabilidad de una medida obtenida de la muestra,


respecto a la población (valor real); son un par de números entre los cuales se estima que
estará un valor desconocido, con una determinada probabilidad, de acierto (nivel de
confianza). Sirven para que se hagan una idea aproximada, del valor real del parámetro en
estudio, basado en los datos de la muestra.

2.4.1 Intervalos de confianza para la media.

Para determinar el intervalo de confianza, de la media poblacional de una variable


aleatoria con distribución normal, cuando se tiene la desviación estándar, y el tamaño de
la muestra es mayor a 30, se deben utilizar las siguientes fórmulas:

40
Figura N° 22. Determinación del intervalo de confianza.

Fuente: elaboración propia.

𝝈 𝝈
𝒙𝟎 = 𝑿 − 𝒁𝜶Τ𝟐 ∙ 𝒙𝟏 = 𝑿 + 𝒁𝜶Τ𝟐 ∙
𝒏 𝒏

𝝈 𝝈
Intervalo de confianza para 𝝁 = 𝑿 − 𝒁𝜶Τ𝟐 ∙ , 𝑿 + 𝒁𝜶Τ𝟐 ∙
𝒏 𝒏

𝜇 = Media poblacional. 𝜎 = Desviación estándar


𝑿= Media muestral. 𝑛 = Tamaño de la muestra
𝛼 = Nivel de significancia. 𝒁𝜶Τ𝟐 = Valor de 𝑁(0,1)

41
EJEMPLO 3.

Una nueva fábrica de bombillos, desea conocer la duración promedio en horas de su


producto, para incluirla en su empaque. Para esto, se tomó una muestra aleatoria de 300
bombillos, donde se obtuvo una duración media de 1200 h, con una desviación estándar
de 50 h. Determinar el intervalo de confianza, para la duración media de los bombillos,
con un nivel de confianza del 95%.

Lo primero que se hace es identificar los datos proporcionados el problema, los cuales
son 𝑛=300, ¯𝑋=1200 ℎ, 𝜎=50 ℎ, 𝛼=5% con un nivel de confianza, del 95%, luego se
grafica como se muestra en la figura N° 23.

Figura N° 23. Representación del Intervalo de confianza.

Fuente: elaboración propia.


Con ayuda de la gráfica y tabla de distribución normal, se busca el valor 𝒁𝜶Τ𝟐 , de la
siguiente forma:

Figura N° 24. Área bajo curva.

Fuente: elaboración propia.


42
Como se observa el área bajo la curva hasta 𝒁𝜶Τ𝟐 mide 0,975, ahora se busca en tabla de
distribución normal estandarizado (tabla 2) el valor Z, que tenga esta medida como se
muestra a continuación:

Como se observa en la tabla el valor de Z, para el área bajo la curva con medida 0,975 es
1.96, teniendo este valor se define 𝒁𝜶Τ𝟐 = 1.96 remplazamos en las fórmulas para
encontrar el intervalo de confianza para la media como se muestra a continuación:

50 50
𝒙0 = 1200 − 1,96 ∙ 𝒙1 = 11200 − 1,96 ∙
300 300

Intervalo de confianza para μ = (1194.34 , 1205.65)

Por lo tanto, se puede concluir con una confianza del 95%, que la media de la duración de
la nueva marca de bombillos, está entre 1194.34 y 1205.65 horas.

EJEMPLO 4.

Para conocer la altura promedio de los estudiantes de Tecnología Deportiva de las


Unidades Tecnológicas de Santander, se tomó una muestra aleatoria de 400 estudiantes,
donde se obtuvo una estatura media de 168 cm, con una desviación estándar de 10 cm.
Determine el intervalo de confianza para la altura media de los estudiantes de la
tecnología deportiva con un nivel de confianza del 90%.

Lo primero que se hace es identificar los datos proporcionados el problema los cuales son
n=400, ¯X=168 cm, σ=10 cm, α=10% con un nivel de confianza del 90%, luego se grafica
como se muestra en la Figura N° 25.

43
Con ayuda de la gráfica y tabla de distribución normal se busca el valor 𝒁𝜶Τ𝟐 de la
siguiente forma: Figura N° 26

Figura N° 26. Área bajo la curva

Fuente: elaboración propia.

Como se observa el área bajo la curva hasta 𝒁𝜶Τ𝟐 mide 0,95, ahora se busca en tabla de
distribución normal, estandarizada (tabla 2) el valor Z, que tenga esta medida como se
muestra a continuación:

44
Se observa en la tabla, que no está el valor exacto 0,95 y los valores de Z más de
cercanos, están a la misma distancia; por lo tanto se promedian, para encontrar el valor
de 𝒁𝜶Τ𝟐 de la siguiente forma:

1.64 + 1.65
𝒁𝜶Τ𝟐 = = 1.645
2

Teniendo el valor 𝒁𝜶Τ𝟐 = 1.645, se reemplazan en las fórmulas, para encontrar el


intervalo de confianza para la media, como se muestra a continuación:

𝟏𝟎 𝟏𝟎
𝒙𝟎 = 𝟏𝟔𝟖 − 𝟏, 𝟔𝟒𝟓 ∙ 𝒙𝟏 = 𝟏𝟔𝟖 + 𝟏, 𝟔𝟒𝟓 ∙
𝟒𝟎𝟎 𝟒𝟎𝟎

Intervalo de confianza para 𝝁 = 𝟏𝟔𝟕. 𝟏𝟕 , 𝟏𝟔𝟖. 𝟖𝟐

Por lo tanto, se puede concluir con una confianza del 90%, que la media de la altura de los
estudiantes de Tecnología Deportiva, está entre 167.17 y 168.82 centímetros.

office-2717014_960_720 [ Imagen ]Recuperado de: https://pixabay.com


45
AUTOEVALUACIÓN II

Teniendo en cuenta los conceptos y ejemplos trabajados en el


capítulo II, resolver los siguientes ejercicios:

1. El peso promedio de 320 estudiantes de primaria del Colegio


Semillitas de la ciudad de Bucaramanga, es de 42 kg con una
desviación estándar de 10 kg, los pesos, se distribuyen
normalmente. Determinar, cuántos estudiantes tienen un peso:

a) Entre 20 y 35 Kilogramos
b) Menos 25 Kilogramos
c) Más 30 Kilogramos.

2. Para conocer el peso promedio de los estudiantes de Tecnología


Deportiva de las Unidades Tecnológicas de Santander, se tomó una
muestra aleatoria de 180 estudiantes, donde se obtuvo un peso
medio de 74 kg, con una desviación estándar de 10 kg.
Determinar, el intervalo de confianza para el peso medio de los
estudiantes de la tecnología deportiva, con un nivel de confianza
del 99%.

Recordar: estos ejercicios tienen la finalidad de fortalecer, la


aplicación de las temáticas desarrolladas en la unidad II.

46
Figura 6. 27. Pruebas de hipótesis.
analysis-810025_960_720 [ Imagen ]Recuperado de: https://pixabay.com

PRUEBAS DE HIPÓTESIS

47
TOMA DE DECISIONES.

Basadas

EVIDENCIAS MUESTRALES TEORÍA DE LA PROBABILIDAD

Se apoyan para realizar

PRUEBAS HIPÓTESIS

Presentan

Pruebas de significancia de
una y dos colas.

Para.

VALIDAR O NEGAR UNA HIPÓTESIS, ES


DECIR LLEGAR A UNA CONCLUSIÓN

Fuente: elaboración propia.

48
Capítulo III

PRUEBAS DE HIPÓTESIS
Figura N° 27. Pruebas de hipótesis. 3.1 Conceptos básicos de las pruebas de
hipótesis.

En diversas situaciones, se requiere de la


toma de decisiones responsables, basadas
en el análisis de datos y parámetros
estadísticos, y sobre una población
definida.
Quimiometria.2013. Metabolismo del Nitrógeno
[ Imagen ]Recuperado de: https://bit.ly/2QxED8S

Para esto, se utilizan las pruebas de hipótesis, las que son un proceso basado en
evidencias muéstrales y la teoría de la probabilidad, con el ánimo de aceptar o rechazar,
una hipótesis (suposición o afirmación), relacionada con el comportamiento de un
conjunto de datos.

3.2 Pasos para probar una hipótesis.

Al realizar una prueba de hipótesis, se pueden aplicar diferentes procedimientos o


métodos, según el parámetro estadístico que se va analizar; en el caso particular, se
deberán enfocar en la media 𝜇. Para esto, en forma general, se tendrán en cuenta los
siguientes pasos fundamentales:

1. Se plantea la hipótesis nula, representada por 𝐻0 , es la que se encarga de negar,


contradecir la afirmación, que se quiera probar o demostrar.
2. Se plantea la hipótesis alternativa se representa por 𝐻1 , es la afirmación o supuesto,
que se quiere demostrar o verificar que se cumple.
3. Aplicación de la distribución de probabilidad adecuada, según el tamaño de la
muestra; se utilizará la distribución normal, ya que trabajarán, con más de 30 datos.

49
4. Establecer o especificar, el nivel de significancia.
5. Encontrar o limitar las regiones de rechazo, o aceptación de hipótesis nula.
6. Conclusión, es cuando se calcula el estadístico de prueba 𝑍𝑝 para la media, el que se
define a continuación:

𝑋 − 𝜇𝜃
𝑍𝑝 = 𝜎
ൗ 𝑛

𝜇𝜃 = Media poblacional (hipótesis nula). 𝜎 = Desviación estándar


𝑿= Media muestral. 𝑛 = Tamaño de la muestra

Para verificar, si se ubica en la zona de aceptación, o rechazo de la hipótesis nula.

3.3 Pruebas de significancia de una y dos colas.

Se trabaja con prueba de significancia de una cola, cuando se conoce el signo potencial,
de la hipótesis alternativa. En caso de no conocer el signo potencial de la hipótesis
alternativa, se emplea la prueba de significancia de dos colas, como se muestra a
continuación:

Prueba de significancia de una cola:

Caso 1. Caso 2.
𝐻0 ∶ 𝜇𝜃 ≤ 𝜇 𝐻0 ∶ 𝜇𝜃 ≥ 𝜇
𝐻1 ∶ 𝜇𝜃 > 𝜇 𝐻1 ∶ 𝜇𝜃 < 𝜇

(Unilateral derecha). (Unilateral izquierda).

Prueba de significancia de dos colas:

𝐻0 ∶ 𝜇𝜃 = 𝜇
𝐻1 ∶ 𝜇𝜃 ≠ 𝜇

(Bilateral)

𝜇𝜃 = Media poblacional (hipótesis nula).

50
EJEMPLO 1. Capítulo III
El gerente de una nueva fábrica de bombillos, asegura que la duración promedio en
horas de su producto es de mínimo 1200 h, con una desviación estándar de 50 h.

El departamento encargado del control de calidad, escoge al azar una muestra de 40


bombillos de un lote y comprueba su duración promedio, que de es de 1130 h. ¿Con un
nivel de significancia del 5%, se podría decir, que el gerente exagera, al hablar de la
duración de su producto?

Lo primero que se hace es plantear la hipótesis nula, la cual niega o contradice lo que se
quiere verificar, por esto, se afirma que la duración de los bombillos, es mayor a 1200 h.
Luego se plantea la hipótesis alternativa, en la cual se afirma que la duración de
bombillos es menor 1200 h, esto, se representa de la siguiente forma:

𝐻0 : 1200≥ 𝜇
𝐻1 : 1200 < 𝜇
Luego se identifican los demás datos proporcionados el problema, los cuales son 𝑛=40,
¯𝑋=1130 ℎ, 𝜎=50 ℎ y 𝛼=5%. Con ayuda del nivel de significancia, se definen las regiones
de rechazo o aceptación de hipótesis nula, como se muestra en la en la figura N° 28.

Figura N° 28. Gráfica de las regiones de aceptación y rechazo.

Fuente: elaboración propia.

51
Capítulo III
Para determinar el valor límite, se busca en la tabla 1 de distribución normal
estandarizada, para el cual valor de Z, es la medida del área bajo la curva es 0.05, como se
muestra a continuación:

Como se observa en la tabla, no está el valor exacto 0,05, y los valores de Z más de
cercanos, están a la misma distancia; por lo tanto, se promedian, para encontrar el valor
buscado:
−1.64 − 1.65
Z= = −1.645
2

Ahora se calcula el estadístico de prueba 𝑍𝑝 , para ubicarlo en el gráfico se acepta o


rechaza la hipótesis nula, como se muestra a continuación:

1130 − 1200
𝑍𝑝 = = −2.52
50ൗ
40

Figura N° 29. Ubicación del estadístico de prueba.

Fuente: elaboración propia.

Como se observa 𝑍𝑝 se ubica en la región de rechazo la hipótesis nula 𝐻0 , lo que significa


que se acepta la hipótesis alternativa 𝐻1 . Por lo tanto, se podrá concluir con un nivel de
significancia del 5%, que el promedio de duración de los bombillos, es menor 1200 h.

52
EJEMPLO 2. Capítulo III
Un informe publicado por una importante página de internet, afirma que el precio
promedio de un boleto de avión entre Bucaramanga y Cartagena en el mes de noviembre
tiene un valor mínimo $450.000 pesos, con una desviación estándar de $120.000 pesos.
Al tomar una muestra aleatoria de 80 pasajeros en este mes, se obtuvo costo promedio
$420.000 pesos. ¿Con un nivel de significancia del 10%, se podría decir que el informe
está en lo correcto?

Lo primero que hacemos es plantear la hipótesis nula, la cual niega o contradice lo que se
quiere verificar, por esto se afirma que el costo de los boletos de avión en este es menor
$450.000 pesos. Luego se plantea la hipótesis alternativa la cual afirma que el costo de
boletos de avión en este mes es mayor $450.000 pesos, esto se representa de la
siguiente forma:

𝐻0 : 450.000≤ 𝜇
𝐻1 : 450.000> 𝜇

Luego se identifican los demás datos proporcionados el problema los cuales son 𝑛=80,
¯𝑋=$420.000, 𝜎=$120.000 y 𝛼=10%. Con ayuda del nivel de significancia se definen las
regiones de rechazo o aceptación de hipótesis nula como se muestra en figura N°30.

Figura 30. Gráfica de las regiones de aceptación y rechazo.

Fuente: elaboración propia.

53
Capítulo III
Para determinar el valor límite, se busca en la tabla 2 de distribución normal
estandarizada, para cual valor de Z, la medida del área bajo la curva es de 0.9, como se
muestra a continuación:

Como se observa en la tabla 2, no está el valor exacto para 0,9; por lo tanto, se toma el
valor de Z más cercano, el cual es 1.28; luego se calcula el estadístico de prueba 𝑍𝑝 , para
ubicarlo en el gráfico de acepta o rechaza la hipótesis nula, como se muestra a
continuación:

420.000 − 450.000
𝑍𝑝 = = −2.23
120.000ൗ
80

Figura N° 31. Ubicación del estadístico de prueba.

Fuente: elaboración propia.

Como se observa 𝑍𝑝, se ubica en la región de aceptación la hipótesis nula 𝐻0 , significa,


que se rechaza la hipótesis alternativa 𝐻1 . Por lo tanto, se concluye con un nivel de
significancia del 10%, que el costo promedio de los boletos de avión en el mes de
noviembre, es menor $450.000 pesos.

54
EJEMPLO 2. Capítulo III
El departamento de salud ocupacional de una fábrica de zapatos, ubicada en la cuidad
Bucaramanga, realizó una encuesta sobre peso de cada uno de sus trabajadores, donde
se encontró que el peso promedio fue 82 kg, con desviación estándar de 12 kg. Después
10 meses, se tomó el peso de 50 trabajadores al azar, donde se obtuvo una media de 86
kg. ¿Con un nivel de significancia del 10%, se podría afirmar que el peso promedio, ya no
es igual?

Lo primero que se hace, es plantear la hipótesis nula, la cual niega o contradice lo que se
quiere verificar, por esto, se afirma que el peso promedio, se mantiene igual 82 kg. Luego
se plantea la hipótesis alternativa, la que afirma que el peso promedio ha cambiado, o es
diferente a 82 kg, esto se representa de la siguiente forma:

𝐻0 : 82= 𝜇
𝐻1 : 82≠𝜇

Luego se identifican los demás datos proporcionados el problema, los cuales son 𝑛=50,
¯𝑋=86 𝑘𝑔, 𝜎=12 𝑘𝑔 y 𝛼=10%. Con ayuda del nivel de significancia, se definen las dos
regiones de rechazo, y la región aceptación para la hipótesis nula, en este caso particular
como se muestra, en la Figura N° 32.

Figura N° 32. Gráfica de las regiones de aceptación y rechazo.

Fuente: elaboración propia.

Para determinar el valor de los límites, se busca en las tablas 1 y 2 de distribución normal
estandarizada, los valores de Z, que cumplan con las áreas, bajo la curva que se necesitan,
como se muestra a continuación:
55
Capítulo III

Como se observa en la tabla 1, no está el valor exacto 0,05 y los valores de Z más de
cercanos, están a la misma distancia; por lo tanto, se promedian, para encontrar el valor
buscado:
−1.64 − 1.65
Z= = −1.645
2
Para encontrar el segundo límite, se busca en la tabla 2, como se muestra a continuación:

Como se observa en la tabla 2, no está el valor exacto 0,95 y los valores de Z más de
cercanos, están a la misma distancia; por lo tanto, se promedian, para encontrar el valor
buscado:
1.64 + 1.65
Z= = 1.645
2
Ahora se calcula el estadístico de prueba 𝑍𝑝 para ubicarlo en el gráfico de acepta o
rechaza la hipótesis nula, como se muestra a continuación:

86 − 82
𝑍𝑝 = = 2.35
12ൗ
50

Figura N° 33. Ubicación del estadístico de prueba.

Fuente: elaboración propia.

Como se observa 𝑍𝑝 , se ubica en la región de rechazo hipótesis nula 𝐻0 , significa que se


acepta, la hipótesis alternativa 𝐻1 . Por lo tanto, se podrá concluir con un nivel de
significancia del 10%, y que el peso promedio de los trabajadores, no es igual a 82 kg.
56
AUTOEVALUACIÓN III

Teniendo en cuenta los conceptos y ejemplos trabajados en el


capítulo III, resolver los siguientes ejercicios:

1. El administrador de una importante de una ferretería de la


ciudad de Bucaramanga, asegura que el tiempo promedio máximo
de espera de los clientes por atender es de 8 minutos, con una
desviación estándar de 3 minutos. El departamento encargado del
control de calidad, escoge al azar una muestra de 60 clientes, y
comprueba que el tiempo medio de espera, es de 10 minutos.
¿Con un nivel de significancia del 2%, se podría decir que, el
administrador está en lo correcto?

2. Un informe publicado por una importante revista, se afirma que


el precio promedio de un boleto de avión entre Bucaramanga y
Cali en el mes de junio, tiene un valor mínimo $320.000 pesos, con
una desviación estándar de $80.000 pesos. Al tomar una muestra
aleatoria de 60 pasajeros en este mes, se obtuvo costo promedio
$350.000 pesos. ¿Con un nivel de significancia del 5%, se podría
decir que el informe está en lo correcto?

Recordar: que estos ejercicios tienen la finalidad de fortalecer, la


aplicación de la temática desarrollada en esta unidad.

57
RESUMEN
ESTADÍSTICA INFERENCIAL

En la primera unidad denominada “Distribuciones Muéstrales y Estimaciones”, se


presentan los conceptos de variables aleatorias discretas y continuas, los cuales
proporcionan las bases, para determinar una función distribución de probabilidad; a
través de esta función, se mostró cómo calcular los posibles resultados de un
experimento aleatorio, y la probabilidad que presenta cada uno de estos resultados.

Definida la función de distribución de probabilidad de una variable aleatoria discreta, se


presenta cómo aplicar las fórmulas de valor esperado, varianza y desviación estándar para
este tipo variable. Además, se deja claro que estas medidas son una herramienta
fundamental, para el análisis de un conjunto de datos, y el planteamiento de conclusiones

En la segunda unidad denominada “Distribución Normal e Intervalos de Confianza” se


presenta la definición de distribución normal y sus características o propiedades.

Luego se demostró la importancia de su estandarización, para resolver situaciones


problémicas, donde a partir de los datos presentados de medias µ y desviación típica 𝜎,
se plantea un modelo de solución, el cual funciona siempre, para que la variable en
estudio, cumpla con las condiciones, de una distribución normal.

También se explicó, qué es intervalo de confianza; además se presentó el proceso,


mediante el cual se determina dicho intervalo y su utilidad, con la finalidad de obtener,
información de un parámetro poblacional, partiendo de los datos de la muestra; en el
caso concreto la media, se demostró a través de varios ejemplos.

Finalmente, en la tercera y última unidad denominada “Pruebas de hipótesis,” se mostró


cómo con la ayuda de lo aprendido en las unidades anteriores, que las evidencias
muéstrales y la teoría de la probabilidad, se pueda validar o negar, en una hipótesis
basada, en el comportamiento de un conjunto de datos

58
GLOSARIO

D
Datos continuos: son aquellos, que pueden Eventos mutuamente excluyentes: eventos
tomar cualquier valor numérico, en un que no dependen, el uno del otro, para
intervalo o del conjunto, de los números suceder.
Reales. H
Datos discretos: son aquellos, que toman un
número finito de valores, se representan, a Hipótesis: Proposición o afirmación que no se
través del conjunto de los números enteros. ha probado acerca de un fenómeno de
interés para un investigador o empresario.
Dispersión: es la variabilidad, de un conjunto
de datos. M
E Medidas de dispersión: son aquellas que
indican la variabilidad, de un conjunto de
Espacio muestral: es el conjunto, de todos los datos.
posibles resultados de un experimento.
Medidas de tendencia central: son las que
Estadístico: descripción de una medida, es la determinan el valor central, al cual se acercan
que se obtiene de una muestra o población. o tienden un conjunto de datos.

Estimación: el valor calculado de un


parámetro.

Estimador: fórmula o método de cálculo, para


estimar el parámetro de la población.

Evento: posibles resultados, de realizar un


experimento.

59
REFERENCIAS
BIBLIOGRAFICAS

Anderson, D., Sweeney, D., & Williams, T. (2012). Estadística para negocios y economía
(Onceava ed.). CENGAGE Learning.

Bickel p.j., doksum k.a.(2015) Mathematical Statistics: Basic Ideas and Selected Topics,
Volume I, Second Edition. Chapman and Hall/CRC.

Diccionario de términos especializados usados en Estadística. (2000). Recuperado de:


https://glosarios.servidor-alicante.com/terminos-estadistica

Estadística Probabilidad. Intervalo de confianza para la media con desviación típica


poblacional conocida. (s.f.) Recuperado de:
http://proyectodescartes.org/iCartesiLibri/materiales_didacticos/EstadisticaProbabilidadI
nferencia/IntervalosConfianza/3_2IntervConfianzaMediaDesvConocida.html

Estadística. Conceptos generales de las pruebas de hipótesis. (s.f.) Recuperado


de:https://sites.google.com/site/tallerdebioestadistica/pruebas-de-hipotesis/4-1-
conceptos-generales-de-las-pruebas-de-hipotesis

George C. Canavos /. (1988). Probabilidad y Estadística, Métodos y Aplicaciones. México.


Mc Graw Hill.

Kazmier, (2006) Estadística Aplicada a la Administración. México. Mc Graw Hill.

Levin, R., & Rubin, D. (2004). Estadística para administración y economía. (Séptima ed.).
México: Pearson Educación.

Lind, D., Marchal, W. & Wathen, S. (2012). Estadística Aplicada a los Negocios y la
Economía. Décimo Quinta Edición. McGraw Hill.

Lind, Douglas. A. (2004). Estadística para administración y economía. 11ed. México: Alfa
omega.

60
REFERENCIAS
BIBLIOGRAFICAS

Manuel Córdova Zamora. Estadística Descriptiva e Inferencial, aplicaciones, quinta


edición, editorial Moshera

Martín Reyes, Guillermina. La función de probabilidad normal: Características y


aplicaciones. (s.f.) Recuperado de: http://www.extoikos.es/n6/pdf/16.pdf

Martínez B., Ciro. (2011). Estadística Aplicada. Primera Edición. Pearson.

Martínez B., Ciro. (2012). Estadística y Muestreo. Décima Tercera Edición. ECOE.

Metodología de las Ciencias del Comportamiento. (s.f.) Recuperado de:


https://psikipedia.com/libro/analisis-de-datos/2463-variable-aleatoria-definicion-y-tipos

Montero, Alonso. Estadística II. Variable aleatoria y función de distribución. (s.f.)


Recuperado de:
https://www.ugr.es/~eues/webgrupo/Docencia/MonteroAlonso/estadisticaII/tema2.pdf

Murray R. Spiegel, Larry J. Stephens. Estadística cuarta edición. McGraw-Hill México D.F.
Recuperado de:
file:///C:/Users/GERMAN/Downloads/Estad%C3%ADstica.%20Serie%20Schaum-
%204ta%20edici%C3%B3n%20-%20Murray%20R.%20Spiegel.pdf%20(1).pdf

Navidi, William. (2006) Estadística para Ingenieros. México. Mc Graw Hill.

Ramírez Benavides, (2005). Kryscia Daviana. Pruebas de Hipótesis de Una y Dos Muestras.
Recuperado
de:http://www.kramirez.net/ProbaEstad/Material/Presentaciones/PruebasHipotesisUnaY
DosMuestras.pdf

Retureta Álvarez, Elsa. (2010) Estadística Inferencial Recuperado de:


https://es.slideshare.net/guest8a3c19/intervalo-de-confianza-4

61
REFERENCIAS
BIBLIOGRAFICAS

Ritchey (2008). Estadística para las Ciencias. México. Mc Graw Hill.

Ruiz. (2006). Probabilidad y Estadística. México. Mc Graw Hill.

Spiegel, M, & Stephens, L. (2001). Estadística. Tercera edición. McGraw Hill.

Spiegel, M., Schiller J. & Srinivasan, A. (2010). Probabilidad y Estadística Schaum. Tercera
Edición. McGraw Hill.

Tipificación de una variable aleatoria normal. (s.f.) Recuperado de:


http://calculo.cc/temas/temas_estadistica/binomial_normal/teoria/tipificacion.html

Uso de la función de distribución acumulada (CDF) (s.f.) Recuperado de:


https://support.minitab.com/es-mx/minitab/18/help-and-how-to/probability-
distributions-and-random-data/supporting-topics/basics/using-the-cumulative-
distribution-function-cdf/

William Mendenhall, Richard L. Scheaffer, R. (2006) Lyman Ott. Elementos de Muestreo.


México. Thomson.

62

Das könnte Ihnen auch gefallen