Sie sind auf Seite 1von 13

Estrategia didáctica.

La Distribución Normal

En este texto solo estudiaremos la distribución normal por ser la distribución con una
mayor gama de aplicaciones y usos, la curva normal tiene la siguiente forma:

En la gráfica anterior se puede observar que el rango de valores que tomó la variable
continua es de aproximadamente 0 hasta 40. La distribución es simétrica alrededor de 20,
que también es el valor de la media y los extremos de la curva se les llama colas de la
distribución. Las colas no tocan el eje horizontal como podría verse en la gráfica, sino que
se acercan asintóticamente a dicho eje cuando la curva tiende a tomar valores cada vez más
alejados de la media.

Esta función matemática se le llama función de densidad y tiene la siguiente expresión:

1  x  
2

1   
 
f ( x)  e 2
2 

Donde x es la variable aleatoria, σ es la desviación estándar y μ es la media poblacional.


Aunque la expresión parece bastante complicada, en realidad se debe hacer notar que la
gráfica se obtuvo sustituyendo el valor de la media y de la desviación estándar conocidas de

1
una población en la función de densidad. Por ejemplo, en la gráfica que se dibujó la
distribución considerando que σ = 5 y μ = 20. Sustituyendo estos valores en la fórmula, se
procedió a graficar la siguiente función:

1   x  20  
2

1   
f ( x)  e 2 5 

2  5

Lo que significa que la variable x tiene una media de 20 y una desviación estándar de 5. De
hecho puede observarse que la media de la distribución ha sido localizada en la gráfica y
también debe remarcarse que la gráfica es simétrica en ese punto.

Dibujemos, por ejemplo otra gráfica normal, en la que σ = 7 y μ = 20:

Observemos que el rango de la distribución es un poco mayor al rango de la primer


distribución y además esta última distribución está más “achatada”. Comparemos ambas
distribuciones para que se vea la importancia de conocer los valores de la media y de la
desviación estándar.

2
Notemos que aunque las dos distribuciones normales tienen la misma media, su desviación
estándar cambia. Estos valores, por lo tanto, le dan la forma a la curva normal. Y con esto
completamos el comentario inicial en el boletín 0. Allí decíamos que para hacer
predicciones de una variable aleatoria continua, debemos conocer su distribución, su media
y su desviación estándar. Puede verse que cuando una variable aleatoria continua es normal
y se conoce su media y su desviación estándar (ambos valores los llamaremos
conjuntamente parámetros), entonces se puede realizar su gráfica. Desde luego que todavía
no hacemos predicciones con ella como las hacíamos en las variables aleatorias discretas,
pero estamos, como se verá en el siguiente boletín, muy cerca de hacerlo.

Debemos anotar, porque es muy importante aclararlo, que si sabemos que el peso de un
bebé es normal, entonces para realizar la gráfica del peso de los bebés con la función de
densidad, es necesario conocer la media y la desviación estándar del peso de los bebés.
Estos datos sólo pueden conocerse de manera práctica cuando se realizan muestras o se
llevan estudios para calcular estos dos parámetros a partir de la población de interés tal y
como se señaló en el boletín 0. Por ejemplo, supongamos que en cierto hospital de
Iztapalapa, las mujeres embarazadas y próximas a dar a luz, aseguradas, que viven en la
colonia Ejército de Oriente, con nivel de vida medio bajo, etcétera, el personal del hospital
lleva historial de cada mujer que ha dado a luz, luego se ha pesado al bebé y se ha
encontrado que el peso medio es de 2.4 kilogramos con una desviación de 0.5 kilogramos.
Si se sabe que el peso es normal (y ya vimos cómo podemos garantizar esto), entonces la
distribución normal de los pesos de los bebés al nacer está descrito por la siguiente gráfica:

3
La gráfica anterior es la distribución normal de los pesos de los bebés al nacer con peso
medio de 2.4 kg y desviación estándar de 0.5 kg, (en la población respectiva). Por lo tanto
debemos concluir que para realizar la gráfica de una variable continua, debemos saber si es
normal y conocer también su media y su desviación estándar que generalmente se calculan
de manera empírica realizando mediciones en la población de interés.

Una nota: En todos los problemas que seguirán a continuación, para simplificar la
explicación dada, se debe sobre entender que la población a la que se refiere una variable
continua que sea normal, está claramente especificada. En cualquier caso, de ser necesario,
se especificará la población en cuestión.

Antes debemos ver una última propiedad de la curva normal. Recordemos que una
distribución discreta tenía la característica de que la suma de las probabilidades de todos los
valores de la variable era 1. Como esperamos análogamente que la distribución de una
variable continua normal también describa las probabilidades de que ella ocurra, entonces
de manera semejante consideraremos que la suma de las probabilidades de todos los valores
posibles de una variable continua deberá valer 1. Por ejemplo, si el peso de un bebé al nacer
es una variable normal, tiene una media de 2.5 kilogramos y una desviación estándar de 0.5
kilogramos, entonces si sumamos todas las probabilidades de que un bebé pese al nacer en
el rango conocido de pesos, la suma deberá ser 1. Pero, ¿cuál es el rango conocido de pesos
de un bebé en la población de interés?

En una variable continua, la manera de calcular probabilidades (por ejemplo, ¿cómo


calcular la probabilidad de que un bebé pese al nacer entre 2 y 3 kilogramos? Tendríamos

4
que calcular las probabilidades de cada peso posible de un bebé entre los valores 2 y 3 y
sumarlos, ¡lo que sería una tarea imposible!), consiste de una manera más práctica en sumar
áreas. Así, la probabilidad de que un bebé pese al nacer entre 2 y 3 kilogramos equivale a
calcular el área entre 2 y 3 bajo la curva normal. Es decir

Probabilidad (el peso de un bebé esté entre 2 y 3 kg.) = Área bajo la curva entre 2 y 3.

Lo que si escribimos de manera un poco más matemática será:

P2  x  3  Area entre 2,3 bajo la curva normal

Donde x es la variable “peso de un bebé al nacer”

Aunque el problema de calcular probabilidades parece resuelto, en realidad, si lo pensamos


un poco más aún es muy complicado. La razón es que ¿cómo vamos a calcular áreas de
regiones donde uno de los lados de la figura es una curva? Y es que para calcular la
probabilidad de que un bebé pese entre 2 y 3 kilogramos al nacer debemos calcular el área
de un cuadrilátero donde el lado superior es una curva, lo cual complica el cálculo, como se
ve a continuación:

Hay sin embargo, un par de métodos que nos ayudarán a calcular el área en cualquier
región de interés. El primero es aproximado y el segundo es exacto. Comenzaremos por
explicar el método aproximado porque su comprensión nos ayudará a que se entienda el
método exacto para calcular áreas debajo de la distribución normal.

Método 1: Regla Empírica

5
¿Se puede dibujar la curva normal a mano sin tener un software graficador?, desde luego
que sí, pero para hacerlo con la mayor precisión, es necesario conocer la llamada regla
empírica. Ella indica lo siguiente:

“Si una variable aleatoria continua es normal, y se conoce su media y su desviación


estándar, entonces se cumplen las siguientes condiciones:

a) si se suma y se resta una desviación estándar a la media, entonces el intervalo que se


forma en el eje horizontal, contiene al 68% del área bajo la curva.”
b) si se suman y se restan dos desviaciones estándar a la media, entonces el intervalo
que se forma en el eje horizontal, contiene al 95% del área bajo la curva.”
c) si se suman y se restan tres desviaciones estándar a la media, entonces el intervalo
que se forma en el eje horizontal, contiene al 99% del área bajo la curva.”

Apliquemos la regla empírica al problema de los bebés. Dado que el peso de los bebés es
normal, entonces se le puede aplicar la regla empírica a esta variable puesto que además
conocemos la media y la desviación estándar del peso, que son de 2.5 kg y 0.5 kg
respectivamente. A continuación se mostrará el uso de la regla empírica calculando el
intervalo y se hará un dibujo que apoye la explicación de cada inciso de la regla empírica:

a) Calculamos, 2.5 ± 0.5 se tiene el intervalo [2,3]. Lo que significa que el 68% de los
bebés pesarán entre 2 y 3 kg. al nacer.

6
b) Calculamos, 2.5 ± (2)(0.5) se tiene el intervalo [1.5, 3.5]. Lo que significa que el
95% de los bebés pesarán entre 1.5 y 2.5 kg. al nacer.

c) Calculamos, 2.5 ± (3)(0.5) se tiene el intervalo [1, 4]. Lo que significa que el 99%
de los bebés pesarán entre 1.5 y 2.5 kg. al nacer.

7
Es muy importante recalcar que siempre que se dibuje una curva normal, se debe
especificar la variable continua en el eje horizontal tal y como se representa en las 3
gráficas anteriores.

Si se ven atentamente las 3 gráficas anteriores, obsérvese que la regla empírica resuelve en
parte el problema de calcular probabilidades bajo la curva, pero sólo parcialmente porque lo
hace únicamente para algunos valores del peso que ya están establecidos por los valores de
la media y de la desviación. Pero es evidente que si se nos preguntara ¿cuál es la
probabilidad de que un bebé pese, al nacer, entre 2.3 y 4.4 kilogramos?, para esta pregunta
no tendríamos respuesta porque la regla empírica no nos ayuda a calcular el área entre esos
valores. Sin embargo, a pesar de esa dificultad, la regla empírica nos ayuda a dibujar
fácilmente a mano la curva normal porque nos dice cuál es el rango de valores de la
variable donde debe dibujarse la curva normal. Por ejemplo, si el tiempo de traslado de la
casa a la escuela de un alumno es normal con media de 60 minutos y desviación estándar de
10 minutos, entonces el rango donde deberán estar el 99% de todos los tiempos de traslado
(aplicando el inciso c) de la regla empírica), estará entre 30 y 90 minutos. Esto quiere decir
que cuando este alumno se traslade de su casa a la escuela, empleará mínimamente 30
minutos y como máximo 90 minutos. Si se dibuja este intervalo graduando en el eje
horizontal los valores de la variable “X: tiempo de traslado” desde 30, 40, 50, 60, 70, 80 y
90, se podrá dibujar fácilmente la distribución normal cuidando que sea simétrica en 60,
que es le punto donde está la media. Véase la siguiente gráfica:

8
Método 2: Estandarización.

La regla empírica sirve básicamente para plantear un problema cuya variable continua sea
normal. Para resolverlo es necesario usar la estandarización.

Quienes hayan seguido atentamente toda la explicación anterior, se habrán dado cuenta que
el problema de calcular la probabilidad de una variable continua está lejos de resolverse a
pesar de la regla empírica. La razón es muy sencilla. Aunque la regla se aplica a variables
normales, que son las que usaremos en este texto, realmente hay tantas curvas normales
como poblaciones existan cuya variable sea normal. Por ejemplo, los bebés de los que
hablamos eran de una población específica y ellos tenían una media de 2.4 y una desviación
estándar de 0.5. Pero si cambiamos tan solo una de las características que sirvieron para
determinar la población de interés (por ejemplo ahora decimos que las mujeres que darán a
luz son de la delegación Cuajimalpa), es claro que la media y la desviación estándar de los
bebés al nacer, ya no tendrán esos valores. Prácticamente podemos concluir que cada
población tendrá una media y una desviación estándar particulares. Eso complica
muchísimo el cálculo del área para hallar la probabilidad deseada, porque tendríamos que
buscar procedimientos para hallar áreas para cada curva de cada población, lo que haría
bastante engorroso el cálculo de probabilidades de una variable continua. Sin embargo, la
regla empírica servirá para resolver el problema.

Consideremos el mismo problema de los bebés cuya variable continua “X: peso al nacer” es
normal con una media de 2.5 y una desviación de 0.5. Propondremos una ecuación nueva
que seguramente parecerá extraña al principio, pero que seguramente con la explicación
que se dará, pronto se entenderá porqué se propuso de esa manera. Definamos la siguiente
ecuación, que llamaremos “ecuación de transformación” o “ecuación de estandarización”:

x
z (1)

Donde x es la variable normal, μ es la media y σ es la desviación estándar de la variable.


Pero ¿qué es z?. Lo explicaremos a continuación con la gráfica y la tabla siguientes que
describen el peso de los bebés al nacer con los parámetros ya conocidos:

9
B

En primer lugar, x es la variable normal que puede tomar los valores desde 1 a 4 (y
cualquier otro valor intermedio por ser continua), como se muestra en la curva normal
superior en la gráfica anterior (ambas curvas normales tienen exactamente la misma forma).
Obsérvese que a los valores obtenidos por la regla empírica 1, 1.5, 2, 2.5, 3, 3.5 y 4 que
están marcados en la curva normal superior, coinciden con los valores -3, -2, -1, 0, 1, 2 y 3
que aparecen en la curva normal inferior de la gráfica anterior (llamada curva normal
estándar). ¿Porqué ocurre esta coincidencia? Para comprenderlo, veamos la siguiente tabla
donde se transformarán mediante la ecuación (1), los valores conocidos de x por la regla
empírica, que son 1, 1.5, 2, 2.5, 3, 3.5 y 4 y que se encuentran en la primer columna de la
tabla:

10
Valores de X Transformación de los valores de X Valores de z

(usando la ecuación (1))

1 1  2 .5 -3
0 .5

1.5 1.5  2.5 -2


0.5

2 2  2.5 -1
0.5

2.5 2.5  2.5 0


0.5

3 3  2.5 1
0.5

3.5 3.5  2.5 2


0.5

4 4  2 .5 3
0 .5

La tabla indica que la ecuación de estandarización, transforma los valores conocidos de x


por los nuevos valores de z. Esto se observa en cada fila de la tabla anterior, y esto se ha
graficado mostrando la coincidencia entre las dos curvas normales mediante líneas
punteadas. Además, se sabe que si x es una variable normal, entonces z también lo es, por
eso se ha dibujado una curva normal para z. Pero la gran ventaja que tiene la variable z es
que ahora ya no importa qué población describa la variable x, siempre que sea normal,
aunque tenga media y desviación diferente a los valores de 2.5 y 0.5 respectivamente,
porque si en otra población de pesos de bebés al nacer, la media es, por ejemplo, de 2.7 kg
y la desviación estándar es de 0.4, al construir la tabla anterior para transformar los valores
de x usando la regla empírica (que serían 1.5, 1.9, 2.3, 2.7, 3.1, 3.5 y 3.9) , coincidirían con
los mismos valores de z que están en la tabla anterior. Esto significa que ya no importa a

11
qué población normal se le quiera calcular la probabilidad o área en alguna región
determinada, pues ahora basta con que se calcule el área con la curva normal estándar, y
como ambas curvas coinciden, su área también será la misma y el problema estará resuelto.
Por lo tanto, en lugar de calcular áreas para cada curva normal de cada población de interés,
bastará con calcular el área para la curva normal estándar.

Desde luego que el problema, aunque se ha simplificado todavía muestra una dificultad. Es
necesario hallar una manera para calcular las áreas en la curva normal estándar. Sin
embargo, esa tarea ya se realizó mediante métodos de Cálculo y por tal razón existen tablas
que dan las áreas que se cubren por debajo de los valores de z de -4 hasta 4, generalmente
variando z en centésimas. Estas tablas se encuentran en cualquier libro de estadística pero
también cualquier software de estadística puede calcular las áreas bajo la curva normal
estándar, por lo que el problema ya está resuelto. Bastará ejemplificar este método para que
sea bien comprendido.

Por último, si en la tabla anterior observamos la tercer columna y la comparamos con la


manera en que los valores de x de la primer columna fueron obtenidos, se comprenderá el
significado de z: z es el número de desviaciones estándar con que el valor de x
transformado se aleja de la media. Por ejemplo, el valor del peso de un bebé de 3.5 se
calculó multiplicando la desviación estándar, 0.5, por 2, y luego se le sumó a la media de
2.5. Observemos que en la tabla anterior, el valor de x de 3.5 que está en la fila 7, coincide
con el valor de 2 de z que está en la misma fila. Esto significa que el valor de 3.5 está a dos
desviaciones estándar a la derecha de la media de 2.5. Por lo tanto z es el número de
desviaciones estándar que se deben sumar a la media para hallar el valor de x, cualquiera
que este sea.

EJERCICIOS

1. Usando un software graficador, escribe la función de distribución del modelo


normal y dibuja las 3 curvas siguientes superpuestas con una media de 20 y una
desviación estándar de a) 2; b) 4; c) 10. ¿Qué observas en las gráficas?

2. Usando un software graficador, escribe la función de distribución del modelo


normal y dibuja las 3 curvas siguientes superpuestas con una desviación estándar de
5 y una media de a) 25; b) 30; c) 40. ¿Qué observas en las gráficas?

3. Dibuja las curvas explicadas en esta práctica.

4. Dibuja la distribución de la variable continua “tiempo de estudio de los alumnos


antes de un examen” utilizando un software graficador. Define la población de

12
interés y determina según tu experiencia el valor de la media y de la desviación
estándar.

5. Construye la tabla que relaciona x con z mediante la ecuación de estandarización


para el peso de los bebés al nacer cuando es normal y la media y la desviación valen
2.7 y 0.4 respectivamente. Dibuja las dos curvas normales, la del peso de los bebés
y la estándar y verifica que los valores de z y x coinciden.

Guardar con el nombre nombre-apellido.Dist.normal-grupo.doc

13

Das könnte Ihnen auch gefallen