Sie sind auf Seite 1von 18

Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

UNIDAD TEMÁTICA 4:
LA DISTRIBUCIÓN NORMAL

CONTENIDOS
Introducción. Distribución normal de probabilidad. Función de
densidad normal de probabilidad. La distribución normal
estándar de probabilidad. Determinación de probabilidades
para cualquier distribución normal. Comentario final.

4.1 INTRODUCCIÓN

Hemos estudiado hasta al momento algunas distribuciones de


probabilidad de variables aleatorias discretas como la distribución
binomial, la de Poisson y la hipergeométrica. En este capítulo
estudiaremos unas de las distribuciones de probabilidad para
variables aleatorias continuas más importantes de la estadística y
que se utiliza mucho en el control de calidad, la distribución
normal.
Para una variable aleatoria discreta podíamos calcular la
probabilidad de que la variable tome un determinado valor. Para
las variables aleatorias continuas el caso es diferente ya que puede
asumir cualquier valor entre dos valores cualesquiera.
Supongamos que consideramos la variable aleatoria peso de una
persona, entre 50 y 55 kg. existen infinitos valores posibles. Si
seleccionamos al azar una persona, la probabilidad de que su peso

Control Estadístico de la Calidad Pag. 1


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

sea exactamente de 51,258kg es prácticamente cero.


En lugar de esto, debemos pensar en términos de la probabilidad
de que el peso de la persona seleccionada se encuentre, digamos,
entre 50 y 55kg. En general, para una variable aleatoria continua
se calcula la probabilidad de que la variable aleatoria tome un
valor dentro de un intervalo dado.
Para describir las distribuciones discretas de probabilidad
presentamos el concepto de función de probabilidad f (x) .
Recordemos que esta función nos daba la probabilidad de que la
variable aleatoria X asuma el valor x, esto es f ( x)  P( X  x) . Para
las variables aleatorias continuas, el equivalente de la función de
probabilidad es la función de densidad de probabilidad que
también se representa por f (x) . El área bajo la gráfica de f (x) ,
entre dos valores de la variable aleatoria X nos dará la probabilidad
de que la variable aleatoria continua tome un valor en ese
intervalo.

4.2 DISTRIBUCIÓN NORMAL DE PROBABILIDAD

Quizás la distribución de probabilidad más importante para


describir una variable aleatoria continua es la distribución normal
de probabilidad. Esta distribución se utiliza en una gran variedad
de aplicaciones prácticas de la estadística y en especial en el
control estadístico de calidad.

Control Estadístico de la Calidad Pag. 2


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

4.2.1 FUNCIÓN DE DENSIDAD NORMAL DE PROBABILIDAD

La función de densidad de probabilidad normal se define de la


siguiente manera

( x  ) 2
1 
f ( x)  e 22

( 2. )

en donde
  promedio o valor esperado de la variable aleatoria
  desviación estándar de la variable aleatoria
  3,141
e  2,718
y x puede ser cualquier número real.

Recuerde que esta función se define de tal forma que sirve para
calcular probabilidades, la probabilidad de que una variable
aleatoria continua tome valores entre dos valores prefijados.

Si se grafica esta función utilizando un sistema de ejes


coordenados obtendríamos la curva acampanada de la figura 4.1

Control Estadístico de la Calidad Pag. 3


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

f (x)
f (x)


µ

Figura 4.1

Hay ciertas propiedades de la distribución normal de probabilidad


que son importantes tener en cuenta. Ellas son:

1. Hay toda una familia de distribuciones normales de


probabilidad; cada distribución normal específica se distingue
por su media  y su desviación estándar  .

2. El punto más alto de la curva normal ocurre en la media, que


coincide con la mediana y la moda de la distribución.

3. La media de la distribución puede ser cualquier valor numérico,


negativo, cero o positivo. A continuación vemos 3 curvas
normales con la misma desviación estándar pero con tres
medias distintas (-2, 0, y 2)

Control Estadístico de la Calidad Pag. 4


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

f(x)

-2
-2 0
0 22
Figura4.2

4. La distribución normal es simétrica respecto de la media, las


colas, es decir, los extremos o los lados de la curva, se
prolongan al infinito en ambas direcciones y, teóricamente,
nunca tocan el eje horizontal.

5. La desviación estándar determina el ancho de la curva. A


valores mayores de la desviación estándar se obtienen curvas
más anchas y bajas. A continuación vemos dos distribuciones
normales con el mismo promedio pero con distintas
desviaciones estándar (1 y 2 respectivamente).

f(x)
 1

  2

µ = 1

Figura 4.3

Control Estadístico de la Calidad Pag. 5


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

6. El área total bajo la curva de la distribución normal de


probabilidad es igual a 1. Esto es válido para todas las
distribuciones continuas de probabilidad.

7. La función de densidad normal f (x) está construida o definida


de manera tal que el área bajo la curva limitada por dos puntos
x1 y x 2 es igual a la probabilidad de que la variable aleatoria
asuma un valor entre x1 y x 2 . Es decir:

P( x1  X  x2 )  área de la región limitada por la


curva determinada por f (x) , el eje x entre x1 y

x2 .

Gráficamente:

2 f(x)

x1 x2
x1 x2

Figura 4.4

Esta es una propiedad de cualquier función de densidad continua.

8. Teóricamente, el dominio de la función de densidad normal es


infinito y así todo intervalo no vacío a lo largo del eje X (valores

Control Estadístico de la Calidad Pag. 6


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

posibles de la variable aleatoria) tiene una probabilidad no nula.


Pero en la práctica los valores de X se consideran reducidos ya
que es un hecho que aproximadamente el 68% de los valores de
X se encuentran en el intervalo   ;   ; es decir

P  ,     0,68 . Aproximadamente el 95% de los valores de X


se encuentran comprendidos en el intervalo   2;   2 , es

decir, P  2,   2  0,95 finalmente, aproximadamente el 99%


de los valores de X se encuentran comprendidos en el intervalo
  3;   3, es decir P  3,   3  0,99 . Gráficamente:

2 f(x)

 
µ-σ µ µ+σ
Figura 4.5

Nota: En el gráfico anterior sólo se consideró el área entre la media


y 

Por último diremos que si una variable aleatoria continua X tiene


distribución normal con media  y desvío estándar  se escribe
X  N (, )

Control Estadístico de la Calidad Pag. 7


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

4.3 LA DISTRIBUCIÓN NORMAL ESTÁNDAR DE


PROBABILIDAD

Una variable aleatoria que tiene distribución normal con media 0 y


desvío estándar 1 se dice que tiene una distribución normal
estándar. Se utiliza la letra Z para indicar esta variable aleatoria
especial. Escribiremos en este caso Z  N (0,1) . La figura 4.6
representa gráficamente esta distribución

 1

µ
=00
Figura 4.6

Como con otras variables aleatorias continuas, los cálculos de


probabilidad con cualquier distribución normal se llevan a cabo
determinando áreas bajo la gráfica de la función de densidad de
probabilidad. Así, para determinar la probabilidad de que una
variable aleatoria con distribución normal esté dentro de un
intervalo específico, debemos calcular el área bajo la curva normal

Control Estadístico de la Calidad Pag. 8


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

en ese intervalo. Para la distribución normal estándar de


probabilidad hay tablas que nos dan esta probabilidad. La tabla C
es una de estas tablas.

Para ver el empleo de la tabla de áreas bajo la curva de la


distribución normal estándar en la determinación de
probabilidades, analicemos algunos ejemplos. Luego veremos como
se puede utilizar la misma tabla para calcular probabilidades de
cualquier distribución normal.
En la tabla C están calculadas las áreas bajo la curva, desde  
(menos infinito), y los valores de Z se componen entre la primer
columna de la izquierda, y la primer fila superior. La Tabla C está
dividida en dos, desde el valor Z = -3 y hasta Z = 0,29; y desde el
valor de Z = 0,3 y hasta Z = 3,49.
El área sombreada (por problemas de dibujo se presenta con rayas)
de la figura 4.7 representa el área que se lista en la tabla

comprendida entre   y z 0 , donde z 0 es un valor específico de Z .

Z
z 0 Z0

Figura 4.7 - Área dada por la tabla C

Control Estadístico de la Calidad Pag. 9


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

Ejemplo 1. Dada la distribución normal estándar, calcular el área


bajo la curva, sobre el eje de las Z entre   y z  2 .
Solución: Resulta útil dibujar el gráfico de la distribución normal
estándar y sombrear el área que se pide.

Esto se muestra a continuación

2
2 Z
Figura 4.8

Se localiza el valor z  2 en la Tabla C y se lee el valor


correspondiente en el cuerpo de la tabla. Se encuentra que el área
pedida es 0,9772. Luego, como el área es equivalente a la
probabilidad, podemos decir que la probabilidad de que un valor de
Z esté entre  y 2 es 0,9772 o simplemente
P(  Z  2)  0,9772 ; o equivalentemente, el 97,72% de las
observaciones están comprendidas en ese intervalo.

Ejemplo 2. ¿Cuál es la probabilidad de que un valor de Z tomado


al azar esté entre z1  2,55 y z2  2,55 ?

Control Estadístico de la Calidad Pag. 10


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

Solución: La siguiente figura muestra el área pedida.

- 2,55
2,55 2,55
2,55

Figura 4.9

En la tabla C se da el área entre   y 2,55. El área se encuentra


al localizar el valor 2,5 en la primera columna de la izquierda de la
tabla y buscar sobre el renglón hasta encontrar la entrada de la
columna encabezada por 0,05. El área es 0,9946. Si se observa la
gráfica dibujada se aprecia que el área calculada es mayor que la
que se pide por lo que necesitamos restar de 0,9946 el área a la
izquierda de –2,55. Al consultar la tabla, esta muestra que el área
a la izquierda de –2,55 es 0,0054. Por lo tanto, la probabilidad que
buscamos es:

P(2,55  Z  2,55)  P(Z  2,55)  P(Z  2,55)  0,9946  0,0054  0,9892

Ejemplo 3. ¿Qué porcentaje o fracción de valores de Z están


comprendidos entre –2,74 y 1,53?

Solución: La siguiente figura muestra el área que se pide.

Control Estadístico de la Calidad Pag. 11


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

– 2 ,74
2,74 1,53
1,53

Figura 4.10

En la tabla C se encuentra que el área que está entre   y 1,53 es


de 0,9370 y el área entre  y –2,74 es 0,0031. Para obtener la
probabilidad procedemos de la siguiente manera

P(2,74  Z  1,53)  0,9370  0,0031  0,9339

Si expresamos esta probabilidad como porcentaje diremos que el


93,39% de las observaciones de Z están en este intervalo.

Ejemplo 4. Dada la distribución normal estándar calcular


P(Z  2,71) .

Solución: El área buscada se muestra en la siguiente figura

Control Estadístico de la Calidad Pag. 12


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

22,71
,71
Figura 4.11

Para obtener el área a la derecha de z  2,71 se resta a 1 (el área

entre   y   ) y el área entre   y 2,71. Por lo tanto

P(Z  2,71)  1  P(Z  2,71)  1  0,996  0,0034

Ejemplo 5. Determinar el valor de Z tal que la probabilidad de


obtener uno mayor sea 0,10.
Solución: En la siguiente figura representamos el problema

Control Estadístico de la Calidad Pag. 13


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

0,10

z 0 Z0
Figura 4.12
Este problema es el inverso de los anteriores.

Antes especificábamos el valor de Z que nos interesaba para luego


determinar la probabilidad o área correspondiente. En este ejemplo
el dato es la probabilidad o área y se nos pide determinar el valor
correspondiente de Z. Recordemos que en el cuerpo de la tabla
aparece el área bajo la curva entre   y z 0 . El valor de Z que deja

0,10 de área a la derecha es el mismo que deja 1 – 0,10 = 0,90 a la


izquierda. Se debe buscar en el cuerpo de la tabla el valor de Z que
deja por debajo suyo el 0,90 de área. Buscamos en el cuerpo de la
tabla 0,90 o un número próximo. El 0,8997 se le aproxima por
defecto y el 0,9015 por exceso. Luego, el valor de Z se calcula de la
0.08  0,09
siguiente manera: 1,20   1,285. Luego, z  1,285 es el
2
valor buscado.

Control Estadístico de la Calidad Pag. 14


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

4.4 DETERMINACIÓN DE PROBABILIDADES PARA


CUALQUIER DISTRIBUCIÓN NORMAL

La razón de haber descrito con todo detalle la distribución normal


estándar es que todas las probabilidades de todas las
distribuciones normales se determinan con esta distribución.
Entonces, cuando nos encontramos con una distribución normal
con media  (distinta de cero) y desvío  (distinto de 1), podemos
resolver los interrogantes acerca de la misma convirtiéndola
primero en la distribución normal estándar. Luego, se podrá
utilizar la tabla C para calcular las probabilidades buscadas.

La fórmula que se utiliza para pasar cualquier variable aleatoria


normal X con media  y desvío  a la distribución normal
estándar es

X 
Z

Es decir, si a cada valor de la variable aleatoria X le restamos su


media o valor esperado y luego dividimos este resultado por el
desvío estándar correspondiente, obtenemos una nueva variable
aleatoria normal con media 0 y desvío 1, es decir Z  N (0,1) . Si
tomamos, por ejemplo, el valor X   y aplicamos la fórmula,
obtenemos Z  (  ) /   0 . Por lo tanto, a un valor de X igual a su
media le corresponde un valor de Z igual a cero. Supongamos
ahora que x   . Aplicando la ecuación de conversión

tendremos z  (  )  /   1.

Control Estadístico de la Calidad Pag. 15


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

Por lo tanto, un valor de X que está a una desviación estándar de


su media ( x     ) da como resultado z  1 . En otras palabras, se
puede interpretar a z como la cantidad de desviaciones estándar
que la variable aleatoria Z se aleja de su promedio.

Ejemplo 6. Supongamos que una variable aleatoria X con


distribución normal, con media   10 y desvío   2 ; esto es
X  N (10,2) . ¿Cuál es la probabilidad de que un valor de X se
encuentre entre 10 y 14?

Solución: Se nos está pidiendo que calculemos P(10  X  14) .


Aplicando la fórmula de conversión Z  (X  ) /  tendremos

10  10
z1  0
2
14  10
z2  2
2

Por lo tanto, P(10  X  14)  P(0  Z  2) . Buscando en la Tabla C


encontramos que esta probabilidad es igual a 0,4772.
Veamos algunos problemas técnicos en los cuales se puede aplicar
la distribución normal.

Ejemplo 7. Una empresa fabricante de neumáticos, acaba de


desarrollar un modelo radial con banda de acero. Como se trata de
un producto nuevo, la dirección de la empresa cree que la garantía
en km. recorridos que se ofrece con el neumático será un factor
importante en la aceptación del nuevo producto. Antes de

Control Estadístico de la Calidad Pag. 16


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

formalizar esa política, la dirección desea contar con información


acerca de los km. que duran los neumáticos. En pruebas reales de
carretera, el grupo de control de calidad de la empresa ha estimado
que el promedio de distancia recorrida es   36.500 km. y que la
desviación estándar es   5000 km. Además, los datos reunidos
indican que la adopción de la distribución normal es una hipótesis
razonable. ¿Qué porcentaje de neumáticos se puede esperar que
duren más de 40.000 km.? . En otras palabras, ¿cuál es la
probabilidad de que los kilómetros recorridos rebasen los 40.000?

Solución: Se puede encontrar la respuesta a este interrogante


determinando el área de la región sombreada de la siguiente figura

  5000

40 .000
36.500
36 .500 40.000

Figura 4.13

Cuando x  40.000 se obtiene z  (40.000  36.500) / 5.000  0,70 .


Luego, al valor 40.000 le corresponde el valor Z  0,70 en la
distribución normal estándar. Por lo tanto
P( X  40.000)  P(Z  0,70) . Buscando en la tabla C encontramos

Control Estadístico de la Calidad Pag. 17


Universidad Nacional de Misiones

ESPECIALIZACIÓN EN GESTIÓN DE PRODUCCIÓN Y AMBIENTE

que P(Z  0,70)  1  P(Z  0,70)  1  0.7580  0.242 .


Esto es, un 24,2% de los neumáticos durará más de 40.000 km.

4.5 COMENTARIO FINAL

Podemos ver el papel importante que desempeña la probabilidad y


en especial las distribuciones de probabilidad para obtener
información en la toma de decisiones. Una vez determinada la
distribución de probabilidad para un problema en particular, se la
puede utilizar para obtener información acerca del problema. La
probabilidad no establece directamente una recomendación para la
decisión sino que produce información que ayuda a quienes toman
las decisiones a comprender mejor los riesgos e incertidumbres
relacionados con el problema. En última instancia, esta
información puede ayudar a quien toma decisiones a decidirse por
una buena opción. Estos aspectos de la probabilidad se irán
ampliando más a medida que avancemos en el estudio de nuestra
asignatura.

Control Estadístico de la Calidad Pag. 18

Das könnte Ihnen auch gefallen