Beruflich Dokumente
Kultur Dokumente
Este tema lo debemos dar para poder entender las pruebas que van a seguir.
Si uno intentara abordar toda la complejidad desde el punto de vista terico que posee esta
seccin, debiramos profundizar tanto el tema que se tornara por un lado demasiado abstracto y
por otro excedera los alcances de esta Diplomatura.
Intentaremos hacer las explicaciones lo ms sencillas posible, desarrollando de manera muy
bsica los conceptos importantes y necesarios para aplicar la Bioestadstica.
Te repetimos lo que antes te decamos: Consult a tus tutores, particip en los foros... no te
quedes con dudas.No te marees con las frmulas
Distribucin Normal
El matemtico Carl Gauss (1777-1855) trabajaba para un observatorio astronmico alemn. A
partir de numerosos casos donde se determinaban los errores en las mediciones observ que la
forma en que se distribuan esos errores era simtrica. Dicho de otro modo: haba errores positivos
y errores negativos. Por su parte resultaban muy comunes los errores de poca magnitud (tanto
errores positivos como negativos), mientras que eran poco frecuentes los errores grandes.
Suponemos que debe haber realizado histogramas de frecuencia de estos errores. A partir de esa
informacin y a los fines de modelar matemticamente la frecuencia de los errores, adapt una
funcin desarrollada por De Moivre (1667- 1754) y la transform en una distribucin probabilstica,
agregndole un factor de correccin (de modo tal que se cumplan los axiomas de probabilidad o
dicho de otro modo que la probabilidad del espacio muestral sea igual a uno). (Figura 1).
b
Figura 1: a: Distribucin de los errores en un histograma de frecuencias. b: El mismo histograma,
pero con la funcin de una distribucin normal ajustada.
La funcin de densidad (la frmula de esta funcin) est dada por:
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
(
( )
)
2
Esta distribucin Z como dijimos est tabulada. Mediante una sencilla operacin se pueden
transformar a todas las variables X en la variable Z, esta operacin se denomina Estandarizacin
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
Estandarizacin.
Definimos como Estandarizacin a la operacin mediante la cual se transforma a una variable
X:
(
),a una Z:
(
)
Para este el caso particular donde la variable X posee E(X)= y V(X)= , la frmula es:
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
b
Figura 3: a: Distribucin Normal y la ubicacin del valor x=10 y b: del mismo valor estandarizado
z=1,414
Ante la pregunta cul es la probabilidad de tener valores mayores a 10 ppm,
Probabilidad que x>10
P (x >10) = P (z >1,414) = 0,0787, (de la bsqueda de la tabla Normal estndar surge el valor de
la probabilidad).
Para diversos casos ver Figuras 4.
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
a
d
c
Figuras 4: Valores de x graficados en la distribucin de la variable x (a y b) y sus respectivas
estandarizaciones (c y d).
Ahora ntese que se puede visualizar que los valores Z estn mostrando a cuntos desvos antes
o despus de la media se encuentra el valor de la variable X, es decir muestra la magnitud de cun
alejado est de la media. El valor de x= 6,583 se encuentra ubicado un desvo antes de la media,
por eso su valor z es -1.
Entonces los valores z estn relativizando a los valores de la variable de modo que se expresan no
en valores absolutos sino expresados en distancias con respecto a su centro de gravedad es
decir la media.
Una persona que mide 1,85 m es alta o baja? La respuesta debiera ser: depende. Si esa persona
naci en Argentina, es una persona relativamente alta para la media de este pas y esa persona
tendr un valor z de aproximadamente 2. Pero si naci en Finlandia, es una persona promedio,
pues su valor z es 0, ya que los finlandeses en promedio miden 1,85 m.
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
a. P(-1<z<1)= 0,6827
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
Para resumir entonces, si deseo conocer la probabilidad de obtener valore mayores, menores o
entre dos valores de una variable que poseen distribucin normal, debo estandarizar los valores.
Recordemos:
1) Dijimos: si tomamos a una unidad o elemento al azar y no sabemos con certeza cul va a ser el
valor exacto de la caracterstica tomada, entonces esa caracterstica es una variable.
2) Dijimos: la diferencia entre parmetro y estimador es que el parmetro es un valor nico tomado
de la poblacin, mientras que el estimador puede variar dependiendo de qu unidades entraron
en la muestra.
La pregunta ahora es: si tenemos una media muestral o una varianza muestral, y si ambas son
variables: qu distribucin van a tener stas.
Distribucin de la media muestral.
Si la variable tiene distribucin normal, la media muestral es una sumatoria de normales, entonces
tambin tiene distribucin normal.
Y cules son los parmetros de la distribucin normal?
Existen dos demostraciones que no explayaremos aqu, que demuestran:
1) Si uno toma varias medias muestrales, cul sera la media muestral de varias medias
muestrales?
La pregunta sera cul es el valor esperado de la media de las medias muestrales?
La respuesta es la media poblacional. Esto intuitivamente nos muestra que la Esperanza de las
medias muestrales es la media poblacional. ( )
2) Si uno toma una media muestral de una muestra de 5 unidades, la media muestral puede tener
diversos valores diferentes. Es decir tiene cierta variabilidad. Pero si tomamos una media muestral
de una muestra de 50 unidades, la media muestral tambin puede variar, pero menos que la
anterior, es decir va a ser menos variable.
Ahora si la muestra es de 100, o de 1000, cada vez la media muestral variar menos.
De ese modo se observa que a medida que se incrementa el n de la muestra, la media muestral
vara menos.
Una demostracin dice que la varianza de la media muestral es:
( )
y la raz cuadrada de la varianza de la media se denomina Error estndar
EE=
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
Para el caso en que se necesita saber las probabilidades de las medias muestrales entonces,
donde:
, la frmula es:
)
(
)
2
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
Importante:
Lo importante de la distribucin Chi cuadrado es que es una distribucin con valores positivos,
asimtrica a la derecha y que va cambiando a medida que se incrementan los valores que se estn
sumando. Si obtuvimos una varianza con una muestra de 10, se dice que tiene 9 grados de
libertad. Los grados de libertad se obtienen con el nmero de unidades de la muestra menos 1:
GL= n-1.
La distribucin chi cuadrado tiene una Esperanza de n-1.
Entonces la Estandarizacin de la varianza muestral es la siguiente frmula:
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
(
Formalizamos:
Dada Z una variable aleatoria con distribucin normal estndar (
(
)) y dada Y una variable
aleatoria con distribucin Chi cuadrado, entonces definimos a la distribucin t de Student como:
Es decir una distribucin t es una normal dividido la raz de una chi cuadrado dividida sus grados
de libertad.
Funcin de densidad de la distribucin t
( )
( )
(
10
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
Importante:
Lo importante de la distribucin t de Student es que es una distribucin simtrica centrada en el
cero y, al igual que la Chi cuadrado, va cambiando a medida que se incrementan los valores que
se estn sumando.
Tiene una Esperanza de cero (0).
( )
(
)
) (
* +
11
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.
Semana 4 :Captulo 2
E (F)= 1
(
( )
)
) (
Importante:
Lo importante de la distribucin F es que posee valores positivos, es asimtrica a la derecha y su
valor esperado es 1.
12
DIPLOMATURA
Bioestadstica bsica aplicada, mediada con entorno R.