Abstract -- En el siguiente documento se realizara el anlisis sobre la distribucin continua de probabilidad, especficamente sobre la distribucin normal, caractersticas, anlisis sobre el rea bajo la curva, etc. Se ver los conceptos principales sobre la distribucin, como lo es; La distribucin normal general, la distribucin normal reducida y unos breves conceptos sobre la funcin de densidad as como su media y varianza de la distribucin normal
Todos los conceptos que se revisara en este documento trataran de ser lo ms especifico y concreto sobre el tema de la distribucin normal, no se buscara profundizar mucho estos temas, lo suficiente para poder resolver y razonar los problemas y ejercicios planteados sobre este tema.
Tambin se realizara el anlisis de la distribucin normal por medio del software matlab, el cual nos servir para la comprobacin de ejercicios y el anlisis de los mismos, se analizara a ms de estos, las graficas resultantes de la distribucin normal (rea bajo la curva).
I. INTRODUCCIN. Variables aleatorias continuas. Por medio del estudio de las variables aleatorias continuas las cuales nos permiten establecer correspondencia de los resultados obtenidos en experimentos cuyos valores deben medirse en una escala continua y los nmeros reales. Estos resultados pueden provenir de la medicin de la duracin de alguna actividad. Debido a que los experimentos se realizan de una manera continua debemos utilizar este tipo de distribucin como lo es la normal. [10]
La distribucin normal fue reconocida por primera vez por el francs Abraham de Moivre (1667-1754). Posteriormente, Carl Friedrich Gauss (1777-1855) elabor desarrollos ms profundos y formul la ecuacin de la curva; de ah que tambin se la conozca, ms comnmente, como la "campana de Gauss". La distribucin de una variable normal est completamente determinada por dos parmetros, su media y su desviacin estndar, denotadas generalmente por y . [1] [2] [3]
Una de las distribuciones tericas mejor estudiadas en los textos de estadstica y ms utilizada en la prctica es la distribucin normal, tambin llamada distribucin gaussiana. Su importancia se debe fundamentalmente a la frecuencia con la que distintas variables asociadas a fenmenos naturales y cotidianos siguen, aproximadamente, esta distribucin.
Caracteres morfolgicos (como la talla o el peso), o psicolgicos (como el cociente intelectual) son ejemplos de variables de las que frecuentemente se asume que siguen una distribucin normal. No obstante, y aunque algunos autores han sealado que el comportamiento de muchos parmetros en el campo de la salud puede ser descrito mediante una distribucin normal, puede resultar incluso poco frecuente encontrar variables que se ajusten a este tipo de comportamiento. [2] [3] [4] [5]
El uso extendido de la distribucin normal en las aplicaciones estadsticas puede explicarse, adems, por otras razones. Muchos de los procedimientos estadsticos habitualmente utilizados asumen la normalidad de los datos observados. Aunque muchas de estas tcnicas no son demasiado sensibles a desviaciones de la normal y, en general, esta hiptesis puede obviarse cuando se dispone de un nmero suficiente de datos, resulta recomendable contrastar siempre si se puede asumir o no una distribucin normal. La simple exploracin visual de los datos puede sugerir la forma de su distribucin. No obstante, existen otras medidas, grficos de normalidad y contrastes de hiptesis que pueden ayudarnos a decidir, de un modo ms riguroso, si la muestra de la que se dispone procede o no de una distribucin normal. Cuando los datos no sean normales, podremos o bien transformarlos o emplear otros mtodos estadsticos que no exijan este tipo de restricciones (los llamados mtodos no paramtricos). [2] [3] [4] [5]
La grfica de su funcin de densidad tiene una forma acampanada y es simtrica respecto de un determinado parmetro estadstico. Esta curva se conoce como campana de Gauss y es el grfico de una funcin gaussiana. [10]
II. DESARROLLO. La distribucin normal. La Normal es la distribucin de probabilidad ms importante. Multitud de variables aleatorias continuas siguen una distribucin normal o aproximadamente normal. Una de sus caractersticas ms importantes es que casi cualquier distribucin de probabilidad, tanto discreta como continua, se puede aproximar por una normal bajo ciertas condiciones. [6]
Al igual que ocurra con un histograma, en el que el rea de cada rectngulo es proporcional al nmero de datos en el rango de valores correspondiente si, tal y como se muestra en la figura 1, en el eje horizontal se levantan perpendiculares en dos puntos a y b, el rea bajo la curva delimitada por esas lneas indica la probabilidad de que la variable de inters, X, tome un valor cualquiera en ese intervalo. Puesto que la curva alcanza su mayor altura en torno a la media, mientras que sus "ramas" se extienden asintticamente hacia los ejes, cuando una variable siga una distribucin normal, ser mucho ms probable observar un dato cercano al valor medio que uno que se encuentre muy alejado de ste. [1] [2] [10]
Fig. 2 Grafica de una distribucin normal y significado del rea bajo la curva.
Una variable aleatoria continua x que tiene la distribucin con forma de campana de la figura 2 se denomina variable aleatoria normal. La ecuacin matemtica para la distribucin de probabilidad de la variable normal depende de los dos parmetros y , su media y su desviacin estndar respectivamente. De aqu, denotamos los valores de densidad de x con n(x; , ). [7]
La densidad de la variable aleatoria normal x, con media y su varianza 2 , es:
Donde =3.14159.. y e=2.71828.
Como graficar la distribucion normal. Para poder realizar la grafica de la distribucion normal nos tenemos que bazar en dos parametros importantes de la distribucion como lo son; y , su media y su desviacin estndar respectivamente. Con estos dos factores se puede realizar la grafica de la distribucion normal como podemos observar en la figura 3. La distribucin normal es una curva con forma de campana, con eje de simetra en el punto correspondiente al promedio del universo . La distancia entre el eje de simetra de la campana y el punto de inflexin de la curva es igual a , la desviacin standard de la poblacin. [8] [9]
El rea total debajo de la curva es igual a 1. El rea debajo de la curva comprendida entre - y + es aproximadamente igual a 0,68 del rea total; entre - 2 y + 2 es aproximadamente igual a 0,95 del rea total. [8] [9]
Es importante ver que los nicos parmetros necesarios para dibujar el grfico de la distribucin normal son y (Media y desviacin standard de la poblacin). Con estos dos parmetros sabemos donde situar la campana de Gauss (En el punto correspondiente a la media) y cual es su ancho (Determinado por la desviacin standard). [8] [9]
Cuando nos encontramos con una poblacin de observaciones, si podemos afirmar que la distribucin correspondiente es normal, slo hace falta estimar la media y la desviacin standard para tener toda la informacin necesaria acerca de dicha poblacin. [8] [9]
Fig. 3 Parmetros para graficar la distribucin normal.
Una vez especificado y , la curva normal queda determinada por completo. Por ejemplo. Si =50 y =5, entonces se puede calcular las ordenadas n(x; 50, 5) para diferentes valores de x y dibujar la curva. En la figura 4 podemos observar curvas normales que tienen la misma desviacin estndar pero diferentes medias. Las dos curvas son idnticas en forma, pero estn centradas en diferentes posiciones a lo largo del eje horizontal. [8] [9]
En la figura 5 podemos observar dos curvas normales con la misma media pero con diferentes desviaciones estndar. Esta vez observamos que las dos curvas estn centradas exactamente en la misma posicin sobre el eje horizontal; pero la curva con la mayor desviacin estndar es ms baja y se extiende ms lejos. Recuerde que el rea bajo una curva de probabilidad debe ser igual a 1 y por lo tanto cuando mas variable sea el conjunto de observaciones ms bajo y ms ancho ser la curva correspondiente. [8] [9]
La figura 6 muestra el resultado de trazar dos curvas normales que tienen diferentes medias y diferentes desviaciones estndar. Evidentemente, estn centradas en posiciones diferentes sobre el eje horizontal y sus formas relejan los dos valores diferentes de . [8] [9]
Fig. 4 Curvas normales con 1 < 2 y 1 = 2
Fig. 5 Curvas normales con 1 = 2 y 1 < 2
Fig. 6 Curvas normales con 1 < 2 y 1 < 2
Observando las figuras 2 y la figura 6 y al examinar la primera y la segunda derivaba de n(x; , ), listamos las siguientes propiedades de la curva normal: [8] [9]
1. La moda, que es el punto sobre el eje horizontal donde la curva es un mximo, ocurre en x = . 2. La curva es simtrica alrededor de un eje vertical a travs de la media . 3. La curva tiene sus puntos de inflexin en x = , es cncava hacia abajo si < X < + y es cncava hacia arriba en cualquier otro caso. 4. La curva normal se aproxima al eje horizontal de manera asinttica, conforme nos alejamos de la media en cualquier direccin. 5. El rea total bajo la curva y sobre el eje horizontal es igual a 1.
Fig. Propiedades de la distribucin normal.
rea bajo la curva normal.
La curva de cualquier distribucin continua de probabilidad o funcin de densidad se construye de manera que el rea bajo la curva limitada por las dos ordenadas x=x 1 y x=x 2 sea igual a la probabilidad de que la variable aleatoria x tome un valor entre x=x 1 y x=x 2 .
As, para la curva normal de la figura 7, est representada por el rea de la regin sombreada.
Fig. 7 P(x 1 < x <
x 2 ) = rea de la regin sombreada.
El rea bajo la curva entre cualesquiera dos ordenadas tambin debe depender de los valores y . Esto es evidente el la figura 8, donde se observa areas sombreadas que correponden a P(x 1 < x <
x 2 ) para dos curvas con diferentes valores de y . La P(x 1 < x <
x 2 ) donde x es la variable aleatoria que describe la distribucin A, se indica por el rea sombreada ms oscura. Si x es la variable aleatoria que describe la distribucin B, entonces P(x 1 < x <
x 2 ) est dada por toda la regin sombreada. Evidentemente las dos regiones sombreadas tienen tamaos diferentes, por lo tanto, la probabilidad que se asocie con cada distribucin ser diferente para los dos valores dados de x. [8] [12]
Fig. 8 P(x 1 < x <
x 2 ) para diferentes curvas normales.
Una parte imprtate sobre el tema de lo que es el rea bajo la curva normal, se encuentra en la dificultad al intentar resolver las integrales de funcin de densidad normal, necesita de la tabulacin de las areas de la curva normal para una referencia rpida. Sin embargo seria una tarea tediosa intentar establecer tablas separadas para cada valor concebible de y . [8] [12]
En pocas palabras la funcion de distribucion de la normal general, la integral no se puede resolver analiticamente, por lo tanto esto complica notablemente el calculo de probabilidades, por ello se pasa de la distribucion normal general a la normal tipificada o standard. [8] [12]
Distribucion normal Tipificada o Standard. La funcion de distribucion de una variable normal general X en un punto x se puede calcular a partir de la normal tipificada del siguiente modo: [8] [12]
Podemos escribir la frmula de la distribucin normal de la siguiente manera:
Esta es la frmula de la Distribucin Normal Standard o Tipificada. Como podemos observar, en ella hay un slo parmetro, Z, que incluye al promedio y la desviacin standard de la poblacin. Esta funcin est tabulada. [8] [9]
Al calcular Z, lo que estamos haciendo, en realidad, es un cambio de variable por el cual movemos la campana de Gauss centrndola en el 0 del eje X, y modificamos el ancho para que la desviacin standard sea 1. [8] [9]
De esta manera tenemos tabulada una funcin de Gauss que no depende de cual sea el promedio y la desviacin standard de nuestra poblacin real. El cambio de variable hace que se conserve la forma de la funcin y que sirva para cualquier poblacin, siempre y cuando esa poblacin tenga una distribucin normal. [8] [9] Cuando queremos calcular las probabilidades para una poblacin real, calculamos Z y entramos en la tabla de la funcin normal estandard. [8] [9]
Fig. 9 Equivalente de la normal general a la tipificada.
Por lo tanto tipificando la normal general, obtendremos los valores deseados, logrando asi realizar calculos de probabilidad de la normal mas sencillos, porque la funcion de distribucion de la normal tipificada, los valores se encuentran tabulados, reduciendo asi y facilitando el calculo de probabilidad. [8] [9] [10]
La distribucion de una variable aleatoria normal con media 0 y varianza 1 se llama distribucion normal estandar. [8]
Donde Z se ve como una variable aleatoria normal con media 0 y varianza 1.
Las distribuciones normal y transformada se ilustra en la figura 9. Como todos los valores de x caen entre x 1 y
x 2 tiene valores z correspondientes entre z 1 y
z 2 , el rea bajo la curva
x entre las ordenadas x=x 1 y x=x 2 de la figura 9 es igual al rea bajo la curva z entre las ordenadas transformadas z=z 1 y z=z 2.
Ahora hemos reducido el nmero requerido de tablas de areas de curva normal a una, la de la distribucin estndar. La tabla del anexo A.1 indica el rea bajo la curva normal estndar que corresponde a P (Z<z) para valores de z que van desde -3.49 a 3.49. Para ilustrar el uso de esta tabla se ver el siguiente ejemplo:
Ejemplo 1. Dada una distribucin normal estndar, encuentre el rea bajo la curva que yace: a) A la derecha de z=1.84. b) Entre z1=-1.97 y z2=0.87.
Primeramente localizamos el valor de z=1.8 en la columna izquierda de la tabla A.1 despus nos movemos a lo largo del regln a la columna bajo 0.04 donde leemos 0.9671 y tenemos nuestro valor. De la misma manera lo realizamos para el inciso b). ( ) ( ) ( ) ( ) ( )
Grfica del Ejemplo 1.
Ejemplo de estandarizacin. Supongamos que los datos de una muestra van de 80 a 90 (en el plano cartesiano se traza la recta en una escala de 10 en 10).
En la muestra, la media aritmtica es 60 y la desviacin estndar es 10. Estandarizar cada uno de los datos de la recta del plano cartesiano; es decir, cul es el valor de Z de cada dato desde 80 hasta 90.
Ejercicio en Matlab. Para la realizacin del programa por medio del software matlab tuvimos que revisar la teora vista previamente en el paper. A ms de la teora se investigo algunos comandos necesarios para realizar el programa, con estos comandos se logrando reducir de una manera considerable el cdigo del programa ya que se evito realizar la integral (por medio de cdigo) vista en las formulas anteriores de la distribucin normal.
Cambiando algunas lneas de cdigo podemos obtener las graficas de la curva de la normal, tanto su grafica general como su grafica tipificada.
Se pudo comprobar los ejercicios realizados en el libro de Probabilidad y Estadstica de Walpole y se compar con las respuestas del programa y se puede concluir que el programa trabaja de una manera satisfactoria.
Fig. 11 Guide del programa.
Para la realizacin del cdigo se ocupa los siguientes comandos: - normspec() Genera un grafico de densidad para una distribucin normal. Sintaxis p = normspec (limites, mu, sigma). Devuelve el grafico junto con la probabilidad p, correspondiente al rea de inters, es decir, la ubicada dentro de los lmites definidos en el vector que lleva el mismo nombre. [13]
Dentro del vector lmites al menos uno de los valores debe ser real, no se acepta que el intervalo vaya desde infinito a infinito. Error: limites = [-Inf Inf] Mu y sigma, corresponden a los parmetros propios de cada muestra. [13] Ejemplo: Tenemos una distribucin normal estndar, y deseamos saber cunta probabilidad existe: a) Antes de 0.5 a = normspec([-Inf 0.5],0,1) a = 0.6915
b) Entre - 0.3 y 0.5 c = normspec([-0.3 0.5],0,1) c = 0.3094
- normcdf() p = normcdf (x,mu,sigma) Calcula el valor de la integral para la distribucin normal con los respectivos parmetros, donde x,mu,sigma pueden ser un vector o una matriz, sigma debe ser positivo. [13]
La funcin normcdf puede ser usada de la misma manera que una tabla de distribucin normal estndar en la cual especificamos la media y la varianza. [13]
Comprobaremos el Ejemplo 1 con el programa realizado. Ingresamos el dato en el cuadro indicado y procedemos a pulsar el botn de la funcin requerida. Y como podemos observar y comparar las respuestas, podemos cerciorarnos que el ejercicio est bien resuelto, de igual manera lo podemos hacer la comparacin de los graficas. a)
b)
REFERENCIAS. [1]http://www.fisterra.com/mbe/investiga/distr_normal/distr_n ormal.asp [2] Altman DA. Practical statistics for medical research. 1th ed., repr. 1997. London: Chapman & Hall; 1997. [3] Daniel WW. Bioestadstica. Base para el anlisis de las ciencias de la salud. Mexico: Limusa; 1995. [4] Elston RC, Johnson WD. Essentials of Biostatistics. Philadelphia: F.A. Davis Company; 1987. [5] Altman DG, Bland JM. Statistics notes: The normal distribution. BMJ 1995; 310: 298-298. [6] http://www.uoc.edu/in3/emath/docs/Distrib_Normal.pdf [7] Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers, Keying Ye Probabilidad y Estadistica para ingeniera y ciencia, Libro, capitulo 6, pg. 173. [8] Ronald E. Walpole, Raymond H. Myers, Sharon L. Myers, Keying Ye Probabilidad y Estadistica para ingeniera y ciencia, Libro, capitulo 6, pg. 172-181. [9]http://www.matematicasypoesia.com.es/Estadist/ManualCP E04.htm [10] http://es.wikipedia.org/wiki/Distribuci%C3%B3n_normal [11] http://www.vitutor.net/1/55.html [12] http://polimedia.upv.es/visor/?id=4b9a5c82-5827-6d45- 88a8-582136ff21e2 [13]http://www.fce.unal.edu.co/wiki/images/e/e6/EntregaFinal Matlab.pdf
ANEXO.
Tabla A.1 Tabla de la Distribucin Normal Estndar N(0 ,1)