Sie sind auf Seite 1von 19

Universidad Nacional del Comahue

Facultad de Ciencias del Ambiente y la Salud

BIOESTADSTICA
1er cuatrimestre 2016

CONTENIDOS

UNIDAD 5: Pruebas de Hiptesis. Teora general de las


pruebas de hiptesis. Tipos de errores. Dcimas relativas a la
media, a la variancia y a una proporcin. Comparacin de
medias,

dos

varianzas

dos

proporciones,

en

dos

muestras

independientes. Comparacin de medias en muestras apareadas.


Pruebas de hiptesis no-paramtricas. Comparacin de una series
de frecuencias empricas con una serie terica. Estadstico de
Pearson. Requerimientos de aplicacin del estadstico. Pruebas de
independencia de variables y de bondad de ajustes de modelos de
probabilidad.

Pruebas de Hiptesis
INFERENCIA ESTADSTICA

Estimacin de Parmetros

Pruebas de Hiptesis

Qu es una hiptesis estadstica ?


Es una proposicin o afirmacin sobre la distribucin de
probabilidad de una variable aleatoria.

Parmetros de la distribucin
Asociadas a una o ms poblaciones
Forma de la distribucin
Ejemplos:
La edad media de los alumnos del curso es de 22 aos.
Con la aplicacin de un determinado nutriente se obtendrn rendimientos
medios superiores a 2.000 kg/ha, que es la produccin usual de la zona.
El peso promedio al nacimiento de ovejas hembras es menor al de los
machos
La altura de almos sigue una distribucin normal
El nmero de semillas germinadas por placa responde a una distribucin
binomial

Hiptesis acerca de los parmetros de una poblacin:

Caso 1
H0: = 1

Hiptesis nula

H1: = 2

Hiptesis alternativa

Caso 2

Caso 3

Caso 4

H0: = 0

H0: = 0

H0: = 0

H1: 0

H1: < 0

H1: > 0

Caso 5

Caso 6

H0: 0

H0: 0

H1: < 0

H1: > 0

Hiptesis
puntuales
o simples

Hiptesis compuestas

Hiptesis
compuestas

Puedan combinarse otros casos de Hiptesis nulas e Hiptesis alternativas

Consideraciones importantes:
Las hiptesis son siempre afirmaciones relativas a la poblacin o
distribucin bajo estudio, no en torno a la muestra
La hiptesis nula siempre contiene a la hiptesis = 0
Hay una estrecha relacin entre la prueba de hiptesis en torno
a un parmetro y el intervalo de confianza de

Prueba de hiptesis:
Es un procedimiento (o experiencia) que conduce a una toma de
decisin en cuanto a optar por una u otra hiptesis, a la luz de la
informacin proporcionada por una muestra aleatoria extrada
de la poblacin bajo estudio

Estadstico de prueba y Regla de Decisin


Ho: = 15

X1

Poblacin

H1: 15

X2
.
.
.
Xi
.
.
.
XN

X1
.
.
.
Xn

Muestra

Bilaterales
Pruebas
7

10

11

12

13

14

15

16

17

18

19

10

20

21

22

23

Unilaterales

Variable

11

12

13

x obs

14

15

16

17

x obs
RECHAZO

NO RECHAZO

18

x obs
RECHAZO

Conclusin sujeta a error

19

20

Tipos de error:

DECISIN

Ho es Verdadera
Rechazo H0
No Rechazo H0

Ho es Falsa

ErrorError
de Tipo I

Decisin correcta

Decisin correcta

Error Error
de Tipo II

P(Error Tipo I) = P(Rechazar H0 | H0 es Verdadera) =

P(Error Tipo II) = P(No Rechazar H0 | H0 es Falsa) =


Potencia = 1 - = P(Rechazar H0 | H0 es Falsa)

Representacin esquemtica de tipos de errores


Ho: = 1
H1: = 2

x crit

Zona de no rechazo de H0

2
Zona de rechazo de H0

JUICIO

PRESUNCION

VEREDICTO
DECISION 2

DECISION 1

H0

H1

Procedimieno general para una prueba de hiptesis:


Del contexto del problema identificar el parmetro de inters
Plantear H0 y H1
Planificar una experiencia para la extraccin de la muestra
Establecer el nivel de significacin de la prueba
Seleccionar un estadstico de prueba e identificar su distribucin
bajo H0
Establecer regiones de rechazo y no rechazo para el estadstico
de prueba
Calcular de la muestra el valor del estadstico
Decidir si debe o no rechazarse H0 e interpretar esto en el
contexto del problema

A. Pruebas sobre una sola muestra


A1. Pruebas de hiptesis acerca de la media de una
distribucin normal con variancia conocida
Problema: A un productor se le ofrece un nutriente con el que obtendr
rendimientos medios superiores a 2.000 kg/ha, que es la produccin usual de la
zona. Se sabe que en esa poblacin los rendimientos tienen un desvo estndar
de 210 kg/ha. El productor decide realizar una prueba sobre 9 parcelas, en las
que pretende observar los rendimientos, promediarlos y de acuerdo al resultado
optar o no por el nuevo producto.

DATOS: 2150 1950 2170 1860 2050 2120 1920 1850 2230

a.

El parmetro de inters es , redimiento promedio con aplicacin de


nutriente.

b.

Informacin: 2 , VA distribucin normal, redimiento promedio sin


aplicacin de nutriente, n=9.

c.

Planteo H0 y H1
H0: 2.000

H0: 2.000

H1: 2.000

H1: 2.000

d.

Se acuerda correr un riesgo de rechazar el nutriente cuando en


realidad ste cumple con las especificaciones promocionales, fijando
para ello una probabilidad de error de 5% ( = 0,05)

e.

Dado que se conoce 2, el estadstico de prueba es:

Con Z0 ~ N(0;1)

f.

Regiones de rechazo:

Rechazo H0 si x obs > 2.115,15 kgs/ha

Rechazo H0 si zobs > 1,645

1800

1850

g.

1900

1950

2000

2050

2100

2150

-3

-2

-1

Clculo del estadstico observado:

x obs 2.033,33

h.

2200

Zobs = 0,476

Conclusin:
No se rechaza H0 , es decir, no existe suficiente evidencia como para decir
que efectivamente el nutriente aumenta los rendimientos.

Comentarios:
* P-value de un estadstico de prueba observado es la probabilidad de que
la VA estadstico de prueba tome un valor al menos tan extremo como el
observado dado que la hiptesis nula es verdadera.
En nuestro ejemplo: P-value = P(Z > zobs/ H0 es Verdadera)
* Si la VA bajo estudio no se distribuye normalmente debern
considerarse las condiciones para la aplicacin del Teorema Central del
Lmite

A2. Pruebas de hiptesis acerca de la media de una distribucin


normal con variancia desconocida

x
s
n

Con t0 ~ t(n-1)

A3. Pruebas de hiptesis sobre la variancia de una distribucin


normal
H0: 2 = 02

H0: 2 = 02

H0: 2 = 02

H1: 2 02

H1: 2 > 02

H1: 2 < 02

(n ) s

Con

20 ~ 2 (n-1)

A4. Pruebas de hiptesis sobre una proporcin

H0: P = P0
H1: P Po

p - P0
P0 .(1 - P0 )

Con Z0 ~ N(0;1)

Prueba no exacta basada en la aproximacin normal de una binomial.


Es vlida si P no es muy prxima a 0 o 1 y n es relativamente grande.

x - n . P0
n . P0 . ( P0 )

Donde x es el nmero de observaciones en una muestra aleatoria de tamao n


que pertenece a la clase asociada con P.

B. Pruebas sobre dos muestras


B1. Pruebas de hiptesis para la igualdad de dos variancias
Esta prueba es un paso intermedio necesario en las pruebas de
comparaciones de medias cuando se desconocen las varianzas poblacionales

H0 :

H0 :

H1 :

F0

Con F0 ~ F(n1-1;n2-1)

Las pruebas unilaterales son muy usadas y constituyen la base de las pruebas
asociadas a la tcnica ANOVA

H1 :

Algunas caractersticas

1,6

1,4

de Distribucin F-Snedecor:

1,2

1,0

0,8

0,6

Emprica:

Terica: si

0,4

F(n1-1;n2-1)

0,2

0,0
0,0

F(5,5)
F(12,12)
F(50,50)
0,5

1,0

1,5

2,0

2,5

3,0

3,5

4,0

U y V son dos variables aleatorias independientes con

distribucin chi-cuadrado con n1-1 y n2-1 grados de libertad, entonces:


W

F(n1-1;n2-1)

E(F) = (n2 1)/ (n2 3)

Mo (F) = (n2-1)(n1-3) / (n1-1)(n2-3)


V(F) = 2(n2 -1)2(n1+n2)/(n1-1)(n2-3)2(n2-5)

B2. Pruebas de hiptesis sobre las medias de dos


distribuciones normales con variancias conocidas (muestras
independientes)
Ho: 1 = 2

Ho: 1 - 2 = 0

H1: 1 2

H1: 1 - 2 0

X1

X2

1 ?

2 ?

n1

n2

B2. Pruebas de hiptesis sobre las medias de dos


distribuciones normales con variancias conocidas (muestras
independientes)
Ho: 1 = 2

Ho: 1 - 2 = 0

H1: 1 2

H1: 1 - 2 0

1
2

Estadstico de prueba se basa en la distribucin de una diferencia de medias:

X X ~ N ;

Bajo H0:

X X

Con Z0 ~ N(0;1)

Se rechazar H0 si:

Z0 > Z/2

Z0 < -Z/2

B3. Pruebas de hiptesis sobre las medias de


distribuciones normales con variancias desconocidas

dos

Este caso, al igual que el visto sobre hiptesis para una media con
varianza desconocida, es el que usualmente debemos resolver.

Situacin 1:

Dado que las varianzas se estiman de las muestras, antes de calcular el


estadstico de prueba para las medias, debemos verificar mediante una
Prueba F la igualdad de las varianzas poblacionales
Si la conclusin es que las varianzas no son distintas, ambas variancias
muestrales estiman la variancia comn 2, entonces podemos combinarlas
para producir una sola estimacin, digamos:
s p

(n ) s (n ) s
n n

El estadstico de prueba ser:

x x

t
sp

Con t0 ~ t(n1+n2-2)

Si las hiptesis son de la forma:


Ho: 1 = 2
H1: 1 2

Se rechazar H0 si:

t0 > t/2 ; n1+n2-2

t0 < - t/2 ; n1+n2-2

Tambin pueden plantearse pruebas unilaterales y todas las combinaciones entre H0 y


H1 vistas anteriormente:
Ho: 1 = 2
H1: 1 < 2

Situacin 2:

Si la homocedasticidad no es sustentable, no hay un estadstico de prueba


exacto disponible para Ho: 1 = 2 , sin embargo el estadstico:

t *

x x
s
s

n
n

Se distribuye aproximadamente como t con grados de libertad, donde :

s
s


n
n



(s / n )
(s / n )

n
n

B4. Pruebas de hiptesis para muestras apareadas


Se dicen muestras apareadas cuando las obervaciones en las dos
poblaciones de inters se recaban de a pares, con la premisa que cada par
se toma en condiciones homogeneas, aunque estas condiciones pueden
cambiar de un par a otro.
Ejemplo: considere que estamos interesados en comparar dos tipos de alimentos
para cerdos (A y B). Para ello se planea una experiencia donde se suministrar
cada alimento a 10 cerdos para luego comparar el peso ganado al cabo de cierto
tiempo. Pero no contamos con un lote homogeneo de 20 cerdos en cuanto a su
tamao y pensamos que el peso inicial de los animales es un factor que podra
incidir en los aumentos de peso. Para evitar que este efecto peso inicial se pueda
confundir con el efecto alimento se seleccionan parejas de cerdos de igual peso,
y en cada una de ellas se asignan ambos alimentos al azar. Se han obtenido 20
observaciones pero estas estn apareadas.

Para que la hiptesis contemple el efecto de apareo, se calcula una nueva


variable d que consiste en las diferencias observadas en cada par. La hiptesis
nula a probar es que la media de las diferencias es cero
H0: d = 0
H1: d 0
El estadstico asociado a la prueba es:

d
sd

Con t0 ~ t(n-1)

La comparacin de medias dependientes surge de un muestreo que se realiz


con restricciones en la aleatorizacin, esto constituye el paso elemental en un
diseo experimental en el que las unidades experimentales no son homogneas
(DBCA)

B5. Pruebas de hiptesis sobre dos proporciones

H0: P1 = P2

H0: P1 - P2 = 0

H1: P1 P2

H1: P1 - P2 0

2
p1 - p

p.( p).
n
n

x x
n n

C. Pruebas basadas en el estadstico de Pearson


Las pruebas conocidas como chi-cuadrado utilizan el estadstico que dise Karl Pearson
en 1899. Es un ndice que mide la desviacin de las frecuencias observadas en una
muestra respecto a las esperadas bajo una hiptesis.

fobservado fesperado

f1

f1

f2

f2

f3

f3

fk

fk

f

k

fi
fi

Frmula de clculo

o i

o i

n
i e i

ei

ei

Pearson estudi la distribucin terica bajo Ho verdadera. Algunas caractersticas son:


1. Tiene distribucin Chi-cuadrado con k-1 grados de libertad
2. Si el valor del estadstico=0 significa que no hay diferencias entre las frecuencias
observadas y esperadas. Cuanto ms se aleja de 0 mayor la discrepancia entre las
frecuencias
3. Si las frecuencias esperadas < 5 el estadstico se aleja de la distribucin ChiCuadrado por lo que se debe reagrupar intervalos o aumentar el numero de
individuos estudiados.
4. Si la frecuencia total es muy pequea (sobre todo para el caso de 1 grado de
libertad) es aconsejable introducir el factor de correccin de Yates al calcular el
estadstico.

e i ,

ei

C1. Pruebas de ajuste de modelo:


Modelo gentico (distribucin de proporciones):
Ho: la segregacin de cierto poroto responde a la teora de Mendel 9:3:3:1
(Lisos Amarillos Rugosos Amarilos Lisos Verdes Rugosos Verdes)

Ho: la relacin de moscas ojos blancos respecto a moscas ojos rojos es 1 a 3


Distribucin de probabilidad:
Ho: la variable X sigue una distribucin Poisson con parmetro
Ho: la variable X sigue una distribucin Poisson
Ho: la variable X sigue una distribucin Normal

fob

pesp

fesp

x1

f1

p1

f1

x2

f2

p2

f2

x3

f3

p3

f3

xk

fk

pk

Ho: X Possion

pi = P(X=xi/X Possion)

fi = pi . N

fk

2Pearson 2(k-1-p)

En general se prueba slo forma y para verificar valor de los parmetros se


dejan las pruebas vistas anteriormente

C2. Pruebas de independencia de dos factores:


Determina si dos factores que clasifican a una poblacin o muestra son
estadsticamente independientes. Es decir, los niveles de un determinado factor no
afectan a los niveles del otro factor. Es la Hiptesis general de una tabla de
contingencia y el principio de anlisis de datos categorizados.

1. Ho: los factores A y B son independientes


2. Proponer un Nivel de significacin
3. Regla de Decisin: Ho es rechazada si y solo si, el valor chi-cuadrado es mayor que el
valor crtico para el nivel de significacin.
4. Clculo del estadstico de Pearson
5. Decisin

Frecuencias observadas
en cada celda por
combinacin de dos
niveles de factores

Factor A

Factor B

A1

A2

...

Aa

B1

f11

f12

...

f1a

f1.

B2

f21

f22

...

f2a

f2.

...

...

...

fij

...

...

Bb

fb1

fb1

...

fba

fb.

f.1

f.2

...

f.a

f..

Marginales fila

Total fila

Marginales columna

Total columna

Total General

A1

A2

...

Aa

B1

f11

f11 f12

...

f1a

f1.

B2

f21

f22

...

f2a

f2.

...

...

fb1

fb1

Bb

...

...
f.2

f.1

...

...

...
fba

...
fb.

f.a

f..

Bajo la hiptesis nula, las frecuencias esperadas en una tabla de contingencia se pueden
obtener como producto de las frecuencias marginales observadas.
Es decir que bajo independencia de factores se cumple que:
f11
f.1

f12
f.2

f1a
f.a

==

f1.
f..

f11 f.1 f1.


f..

2Pearson 2[(a-1).(b-1)]

C3. Pruebas de homogeneidad de muestras


Equivalente a las anteriores slo que aqu se determina si k muestras son
homogeneas en cuanto a una caracterstica que tiene dos alternativas. La nica
diferencia radica en la obtencin de la informacin (muestreo).

A1

A2

Muestra 1

f11

f12

f1.

Muestra 2

f21

f22

f2.

...

...

...

...

Muestra i

fi1

fi2

fi.

...

...

...

...

Muestra k

fk1

fk1

fk.

f.1

f.2

f..

Das könnte Ihnen auch gefallen