Sie sind auf Seite 1von 20

INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA

1
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

UNIDAD IV ESTADSTICA NO PARAMTRICA

1.1 Diseos experimentales
Las tcnicas estadsticas de estimacin de parmetros, intervalos de confianza y prueba
de hiptesis son, en conjunto, denominadas estadstica paramtrica y son aplicadas
bsicamente a variables continuas. Estas tcnicas se basan en especificar una forma de
distribucin de la variable aleatoria y de los estadsticos derivados de los datos. En
estadstica paramtrica se asume que la poblacin de la cual la muestra es extrada es
normal o aproximadamente normal. Esta propiedad es necesaria para que la prueba de
hiptesis sea vlida.

Existen sin embargo otros mtodos paralelos cuyos procedimientos no precisan la
estimacin de parmetros ni suponer conocida ninguna ley de probabilidad subyacente
en la poblacin de la que se extrae la muestra. Estas son las denominadas tcnicas no
paramtricas o contrastes de distribuciones libres. La mayora de los mtodos no
paramtricos implican el anlisis del rango de los datos por lo que no se utilizan los
valores de la muestra (Quevedo, 2006).

En general, los mtodos no paramtricos especifican hiptesis en trminos de
distribuciones poblacionales en lugar de parmetros, como las medias y las desviaciones
estndar. A menudo, los supuestos paramtricos se sustituyen por suposiciones ms
generales con respecto a las distribuciones poblaciones, y la clasificacin de las
observaciones se usa en lugar de medidas reales.

Las investigaciones han demostrado que las pruebas estadsticas no paramtricas tienen
casi la misma capacidad para detectar diferencias entre las poblaciones que los mtodos
paramtricos, cuando se cumple la normalidad y otros supuestos. Podran ser, y con
frecuencia lo son, ms efectivos para discernir las diferencias poblacionales cuando no se
cumplen estos supuestos. Por esta razn, algunos especialistas en estadstica prefieren
los procedimientos no paramtricos a los paramtricos (Mendenhall et al, 2008).

Una de las consideraciones para determinar si lo apropiado es un mtodo paramtrico o
un mtodo no paramtrico es la escala de medicin empleada para generar los datos.
Todos los datos son generados por una de las cuatro escalas de medicin: nominal,
ordinal, de intervalo o de razn. Por lo tanto los anlisis estadsticos se realizan con datos
ya sea nominales, ordinales, de intervalo o de razn (Anderson et al, 2008).







INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



2
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Escala de medicin Ejemplos
Escala Nominal
Los datos son etiquetas o categoras que se
usan para definir un atributo de un
elemento. Los datos nominales pueden ser
numricos o no numricos.

El mercado en el que se cotiza una accin
(NYSE, NASDAQ o AMEX) es un dato
nominal no numrico. El nmero de seguro
social de una persona es un dato nominal
numrico.

Escala Ordinal
Los datos pueden usarse para jerarquizar u
ordenar las observaciones. Los datos
ordinales pueden ser numricos o no
numricos.

Las medidas pequeas, medianas y
grandes para dar el tamao de un objeto
son datos ordinales no numricos. El lugar
de los estudiantes en una clase 1, 2, 3,
son datos ordinales numricos.

Escala de Intervalo
Los datos tienen las propiedades de los
datos y los de intervalo entre observaciones
se expresan en trminos de una unidad de
medicin fija. Los datos de intervalo tienen
que ser numricos.

Las mediciones de temperatura son datos
de intervalo. Suponga la temperatura en
un lugar es de 21C y en otro es de 4C.
Estos lugares se pueden jerarquizar de
acuerdo con los calurosos que son: el
primero es ms caliente que el segundo. La
unidad fija de medicin, 1C , permite decir
cun ms caliente es el primer lugar: 17C.

Escala de Razn
Una escala de medicin es de razn si os
datos tiene las propiedades de los datos de
intervalo y el cociente (o razn) entre dos
medidas tiene sentido. Los datos de razn
tienen que ser numricos.


Variables como la altura, la distancia, el
peso y el tiempo se miden con una escala
de razn.

La mayor parte de los mtodos estadsticos conocidos como mtodos paramtricos
requieren del uso de datos de las escalas de intervalo o de razn. Con estos niveles de
medicin, tienen sentido las operaciones aritmticas y medias, varianzas, desviacin
estndar, etc., pueden calcularse, interpretarse y usarse en el anlisis. Con los datos
nominales y ordinales no es apropiado calcular medias, varianzas ni desviaciones
estndar; por lo tanto, no pueden emplearse los mtodos paramtricos. La nica manera
de analizar estos datos para obtener conclusiones estadsticas es emplear los mtodos no
paramtricos.

INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



3
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

En general para que un mtodo estadstico se clasifique como mtodo no paramtrico,
debe satisfacer, por lo menos, una de las siguientes condiciones:

1. Ser un mtodo que pueda ser usado con datos nominales.
2. Ser un mtodo que pueda ser usado con datos ordinales.
3. Ser un mtodo que pueda ser usado con datos de intervalo o de razn cuando no
sea posible hacer suposiciones acerca de la forma de la distribucin de la
poblacin.

Si el nivel de medicin de los datos es de intervalo o de razn y si las suposiciones
necesarias sobre la distribucin de probabilidades de la poblacin son apropiadas, con los
mtodos paramtricos se obtienen procedimientos estadsticos ms potentes y ms
refinados.

Quevedo (2006) y Levin y Rubin (2004), establecen las siguientes ventajas y desventajas
de los mtodos no paramtricos:

Ventajas:
1. Estos mtodos pueden aplicarse a un gran nmero de situaciones, porque no
requieren de las condiciones de normalidad requeridas por sus contrapartes
paramtricas y son ms simples que su contraparte, los mtodos paramtricos.
2. En contraste con los mtodos paramtricos, los mtodos no paramtricos pueden
ser aplicados a datos no numricos.
3. Generalmente, es ms sencillo de realizarlas y entenderlas. La mayora de las
pruebas no paramtricas no exigen el tipo de clculo laborioso a menudo
necesario.
4. Algunas veces ni siquiera se requiere un ordenamiento o clasificacin formal.

Desventajas:
1. Los mtodos no paramtricos tienden desperdiciar o ignorar informacin, porque
los datos numricos exactos usualmente se reducen a forma cualitativa. Por
ejemplo, en una prueba no paramtrica, digamos de pruebas de signos, la prdida
de peso por dietistas se registran simplemente signos negativos. Con este mtodo
de signos, la prdida de peso de una sola libra, recibe la misma representacin que
la prdida de 50 libras.

2. Las pruebas no paramtricas no tienen la eficiencia de las pruebas paramtricas.
Esto se debe a qu, con los mtodos no paramtricos, en las pruebas de hiptesis se
necesita una fuerte evidencia, antes de que se pueda rechazar la hiptesis.



INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



4
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

4.2 Prueba de Ji cuadrada
Los datos obtenidos en los trabajos y experimentos biolgicos son de dos tipos
principales. En un tipo cada individuo se caracteriza por una medida o alguna otra
especificacin cuantitativa. En el otro, cada individuo se coloca en una clase particular, y
los resultados se expresan como frecuencias en las cuales los individuos se encuentran
dentro de cada clase. En un gran nmero de trabajos biolgicos, las hiptesis que ms
interesan comprobar no estn relacionadas con la caracterizacin cuantitativa de los
individuos o de la muestras, sino con las probabilidades, y por tanto con las frecuencias de
los individuos u observaciones que pertenecen a determinadas clases, previamente
especificadas. Por lo que cuando se desea comprobar la significancia de la desviacin de
una proporcin simple entre dos frecuencias de lo que espera segn la hiptesis, cuando
se utilizan ms de dos frecuencias se emplea el estadstico ji-cuadrada (X
2
) (Bishop, 1966).

Steel y Torrie (1995) , definen a la X
2
como la suma de los cuadrados de las variables
independientes, normalmente distribuidas con medias y varianza 1.

Reyes (1995), menciona que la prueba de X
2
es aplicable a una serie de situaciones en
donde se hacen conteos y en donde los datos no obedecen a la distribucin normal y
constituyen lo que se conoce como estadstica paramtrica. Es muy comn tratar de
probar si los valores observados experimentalmente (O) estn de acuerdo con los valores
esperados (E) conforme a una teora determinada.

Para determinar el grado de concordancia se necesita un medio que permita conocer los
limites de que no debe exceder la discrepancia entre los valores reales observados y los
valores tericos calculados o conocidos, para que tanta discrepancia pueda considerarse
como un juego exclusivo del azar y no debido a diferencias fundamentales entre los
hechos reales y las hiptesis adoptadas. Con tal objeto, se emplea la X
2
, propuesta por
Karl Pearson a principios de siglo (De la Loma, 1980).

Quevedo (2006), menciona las siguientes propiedades de la distribucin de Ji- cuadrada:

1) La distribucin de Ji-cuadrada no es simtrica, como la distribucin normal o la
distribucin de t. Los valores de la Ji-cuadrada pueden ser de cero o positivos, pero
no negativos.

2) La distribucin de Ji-cuadrada es una familia de curvas y hay una distribucin
diferente para cada nmero de grados de libertad, . Pero, a medida que el
nmero de grados de libertad aumenta, la distribucin de la Ji-cuadrada se
aproxima a la distribucin normal.




INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



5
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA




4.2.1 Pruebas de concordancia
Bishop (1966), seala que el tipo ms sencillo en el cual se utiliza la prueba de X
2
es
aquella en la que una hiptesis particular conduce a esperar que los individuos u
observaciones caigan en una serie de clases en unas frecuencias determinadas. Cuando
se realizan observaciones, ests producen una serie de frecuencias observadas. El
problema radica entonces en comparar la significancia de una desviacin dada entre las
frecuencias observadas y esperadas, es decir, determinan la probabilidad de obtener tal
desviacin o una mayor, si la hiptesis es correcta.
La prueba de ji-cuadrada puede utilizarse tambin para decidir si una distribucin de
probabilidad en particular, como la binomial, la de Poisson o la norma, es la apropiada.
Esta es una habilidad importante, porque como tomadores de decisiones que utilizamos
la estadstica, necesitamos escoger cierta distribucin en particular para representar la
distribucin de los datos que tengamos que analizar. Necesitamos la habilidad para
cuestionar hasta donde podemos llegar con las suposiciones de que podemos usar una
distribucin probabilidad antes de que debamos concluir que esa distribucin ya no se
puede aplicar. La prueba de ji-cuadrada nos permite hacernos esta pregunta y probar si
existe diferencia significativa entre la distribucin de frecuencias observadas y una
distribucin de frecuencias tericas. De esta manera, podemos determinar la bondad de
ajuste de una distribucin terica (es decir, qu tan bien se ajusta a la distribucin de los
datos que observamos). De esta forma podemos determinar si debemos creer que los
datos observados constituyen una muestra obtenida de los distribucin terica hipottica
(Levin y Rubin, 2004).



Distribucin de JI cuadrada (X
2
) con varios
grados de libertad, en funcin
f (X
2
) = [(X
2
)
/(2-1)
e-
X2/2
] / {2
/2
[ - 2) / 2]!}.
INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



6
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Reyes (1992), hace mencin de los siguientes ejemplos de pruebas de concordancia
simple:
1) En todos los animales la relacin de sexo es 1:1, es decir, la mitad son hembras y la
mitad son machos. Si en un muestreo de sexos en 200 animales no hay 100
hembras y 100 machos sino, por ejemplo, hay 110 hembras y 90 machos, al
investigador le interesa probar si la falta de concordancia entre lo experimental y lo
terico obedece a causas al azar o de muestreo, o si tales desviaciones obedecen a
otras causas, esto es, sino cumplen la relacin 1:1.
2) En la generacin F
2
de un monohbrido, la relacin fenotpica terica debe ser 3:1.
Si esta relacin no se manifiesta, el genetista dispone de la prueba de X
2
, una
herramienta estadstica para desechar o aceptar una hiptesis.
3) En un dihbrido, cuando los caracteres son independientes, la relacin fenotpica
debe ser 9:3:3:1; las desviaciones de esta relacin pueden deberse al azar, a la
casualidad, a errores de muestreo o al tamao de la muestra, pero tambin pueden
deberse a que los genes no sean independientes y presenten ligamiento factorial y,
por tanto, no se manifieste la relacin 9:3:3:1.
4) Las desviaciones entre lo experimentan y lo terico al arrojar monedas, dados, etc.,
se prueban mediante X
2
.

La expresin matemtica del estadstico a utilizar es:
n
E
O
X con calcular puede se tambin
E
E O
X
i
i
i
i i

|
|
.
|

\
|
=

=

2
2
2
2
: ;
) (

Donde:
O = Frecuencia observada
E = Frecuencia esperada
i = 1,...k (nmero de clases)

El valor obtenido se busca en las tablas de X
2
para (n-1) grados de libertad, donde:
n = Nm. de clases de frecuencias esperadas o nm. de trminos de la suma

Las hiptesis por probar seran:
H
o
: O = E ; hay concordancia
H
A
: O = E; no hay concordancia
Se rechaza H
o
si: X
2
> X
2

o (GL)

Se acepta H
o
si: X
2
< X
2

o(GL)

Cuando se aplican a datos discretos los resultados para distribuciones continuas deben
hacerse ciertas correcciones. Para la X
2
la correccin se conoce como correccin de Yates
y consiste en:
( ) ( ) ( )
k
k k
e
e o
e
e o
e
e o
corregida X
2
2
2
2 2
1
2
1 1 2
5 . 0
...
5 . 0 5 . 0
) (

+ +

+

=
INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



7
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

En general la correccin se hace solamente cuando el nmero de grados de libertad es
igual a uno. En muestras grandes se obtienen prcticamente los mismos resultados que
la X
2
no corregida, pero pueden aparecer dificultades en relacin con los valores crticos.
Para muestra pequeas, donde cada frecuencia esperada se encuentra entre 5 y 10, quiz
sea mejor comparar los valores de X
2
corregido y no corregido. Si ambos valores
conducen a la misma conclusin, segn una hiptesis, tal como rechazarla a el nivel de
0.05, raramente se presentan dificultades. Si se conducen a conclusiones diferentes, se
puede o bien incrementar los tamaos muestrales o si esto no es posible, se puede
emplear mtodos de probabilidad exactos.

La prueba de X
2
puede ser empleada para determinar de qu forma distribuciones
tericas, tales como la normal, binomial, de Poisson, etc., se ajustan a las distribuciones
empricas, es decir, aquellas que se obtienen de los datos muestrales (Spiegel, 1986).


Ejemplo 10
Los siguientes datos son las cantidades de un organismo particular que se ha encontrado
en 100 muestras de agua tomadas de un estanque.

Nm. de
organismos por
muestra
Frecuencia
(O)
0 15
1 30
2 25
3 20
4 5
5 4
6 1
7 0

Probar la hiptesis de que los datos fueron extrados de una distribucin de Poisson.
H
o
: O = E; hay concordancia
H
A
: O = E; no hay concordancia






INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



8
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Nm. de
organismos por
muestra
Frecuencia
Observada
(O)
Frecuencia
relativa
esperada
Frecuencia
esperada
(E)
0 15 0.155 15.5
1 30 0.289 28.9
2 25 0.270 27.0
3 20 0.166 16.6
4 5 0.080 8.0
5 4 0.03 3.0
6 1 0.008*
7 0 0.002* 1.0
100 0.100 100
*Las frecuencias menores a 1 deben combinarse para evitar tener frecuencias esperadas menores a 1. Los
grados de libertad apropiados son 7-1= 6.

Se aplica la ecuacin de Poisson:
86 . 1
100
186
!
) (
= = = =

f
fx
X
e
f
x
x

+ +

=
= =
= =
= =

359 . 2
2 . 0
) 2 . 0 0 (
...
9 . 28
) 9 . 28 30 (
5 . 15
) 5 . 15 15 ( ) (
002 . 0
! 7
86 . 1
.
.
289 . 0
! 1
86 . 1
155 . 0
! 0
86 . 1
2 2 2
2
7 86 . 1
) 7 (
1 86 . 1
) 1 (
0 86 . 1
) 0 (
i
i i
E
E O
X
e
f
e
f
e
f


GL= n-1= 7-1=6
X
2
X
2
05(7)

2.359 < 14.067

Se acepta la H
o
Los datos observados concuerdan con los esperados, con un riesgo de
error que tiene una p < 5 %.


INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



9
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Ejemplo 11
Gregorio Mendel cultivo 929 vegetales, procedentes de la autofecundacin de plantas de
guisantes heterocigticas para el color de la flor; 705 de stas tenan flores coloradas y las
24 restantes tenan flores blancas. Son estas proporciones consistentes con la hiptesis
de una proporcin 3:1 entre las plantas coloradas y de flor blanca?

Semillas Frecuencia
observada
(O)
Relacin
terica
Frecuencia
esperada
(E)
Desviacin
(O E)
(O E)
2
/E
Coloradas 705.0 3 696.75 + 8.25 0.0976
Blancas 224.0 1 232.25 - 8.25 0.293
Sumas (n) 929.0 4 929.0 0.0 0.3906
H
o
: O = E; hay concordancia
H
A
: O = E; no hay concordancia
GL = n-1= 2-1= 1

X
2
X
2
05(1)

0.3906 < 3.841; p < 5 %
Se acepta H
o
existe concordancia entre los datos, se ajustan aceptablemente a la
hiptesis.


Ejemplo 12
De 160 familias con cuatro hijos cada una se obtuvieron los siguientes datos tomndolos
como resultados:

Mujeres 4 3 2 1 0
Varones 0 1 2 3 4
Familias 7 50 55 32 16

La distribucin familiar concuerda con la hiptesis de los nmeros iguales de varones y
de mujeres?. Aplquese la distribucin binomial. Sea o= 0.05.
a = probabilidad de que sea mujer
b = probabilidad de que sea varn

(a + b)
4
= a
4
+ 4 a
3
b + 6 a
2
b
2
+ 4 ab
3
+ b
4
4 mujeres 3 mujeres 2 mujeres 1 mujer 0 mujeres
0 varones 1 varn 2 varones 3 varones 4 varones
= (1/2)
4
+ 4(1/2)
3
(1/2) + 6(1/2)
2
(1/2)
2
+ 4(1/2) (1/2)
3
+ (1/2)
4

= 1/16 + 4/16 + 6/16 + 4/16 + 1/16
INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



10
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

El nmero esperado con 4 mujeres y o varones = 1/16 (160)= 10
3 mujeres y 1 varn = 4/16 (160) = 40
2 mujeres y 2 varones = 6/16 (160) = 60
1 mujer y 3 varones = 4/16 (160) = 40
0 mujeres y 4 varones = 1/16 (160) = 10

01 . 9
10
) 10 16 (
...
40
) 40 50 (
10
) 10 7 (
2 2 2
2
=

+ +

= X
GL = 5-1= 4
X
2
X
2
05(4)
9.01 < 9.488; p > 5 %

Se acepta H
o
existe concordancia entre los datos.





















INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



11
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Ejercicio 12
A 96 muestras de 4 peces cada una (n=4) se les inculo un organismo que poda originar
que el pez viviera o muriera con igual probabilidad (p = q). En los siguientes datos, X= 0
indica una muestra con cero vivos, X =1 una muestra con un pez vivo, etc.

Nm. de vivos
en la muestra
Frecuencia
experimental
0 1
1 20
2 41
3 25
4 9
96

Analice los datos mediante la distribucin Poisson , prueba las hiptesis pertinentes con
o =0.05.

Ejercicio 13
La densidad de una cierta suspensin bacteriana se estim mediante un conteo por
placas. Despus de agitar completamente la suspensin, se tomaron muestras de un
volumen de 0.5 ml cada una y se extendieron, aspticamente, sobre una superficie de una
placa de agar nutritivo. Despus de un periodo de incubacin se cont el nmero de
colonias formadas sobre cada una de las 100 placas. Los resultados se dan en la siguiente
tabla, en forma de una distribucin de frecuencias:

Nm. de colonia por
placa
0 1 2 3 4 5 6 7 8 9 10 11
Frecuencia
3 9 17 22 20 14 8 4 2 1 0 0

Analizar los datos anteriores mediante la distribucin de Poisson y probar las hiptesis
correspondientes. Sea o = 0.05.











INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



12
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

4.2.2 Pruebas de independencia
Reyes (1992), menciona que las pruebas de independencia se aplican cuando se estudian
datos de una poblacin que caracterizan a los individuos con respecto a dos atributos
observados conjuntamente, el clculo de X
2
permite probar si dichos atributos son
independientes entre s, o si alguno de ellos tiene influencia sobre otro.

Cada carcter, atributo o factor puede manifestar dos o ms clases, de manera que los
individuos de una muestra pueden ser clasificados de acuerdo con una de las categoras o
clases de cada carcter. Es decir, si se conoce la frecuencia observada de individuos con el
par de caracteres, se puede calcular la frecuencia terica.

Para lograr lo anterior es necesario hacer una tabla de contingencia o tabla de doble
entrada a x b.
Ejemplo.
Factor o carcter Clases
a
b
i = 1,...a
j = 1,b

Tabla de contingencia: a = 4, b = 3
Clases b
1
b
2
b
3
Sumas X
i

a
1
a
2


a
3
a
4
f
11
f
12
f
13

f
21

X
ij

f
31
f
41
f
43

X
1
X
2



X
3

X
4

X
j
X
1
X
2
X
3
X..

f
ij
= Frecuencia observada o experimental (O) de individuos con caractersticas que varan
conjuntamente.
F
ij
= Frecuencia terica esperada (E), si las caractersticas son independientes.

..
.) .)( (
X
X X
F
j i
ij
=
GL = (a-1)(b-1)
Las hiptesis se prueban de manera similar a las pruebas de concordancia.

INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



13
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Ejemplo 13
Los rendimientos (%) de la eclosin para quistes de Artemia salina, bajo diferentes
condiciones de temperatura son los siguientes: Sea o = 0.05

Eclosin
Temperatura (
o
C)
10 15 20
X
i
Mala
(< 50 %)
75 90 65 230
Buena
(> 50 %)
80 87 50 217
X
j
155 177 115 447

H
o
: O = E; el porcentaje de eclosin es independiente de la temperatura
H
A
: O = E; el porcentaje de eclosin depende de la temperatura

827 . 55
447
) 217 )( 115 (
.
2 ) 1 3 )( 1 2 ( ) 1 )( 1 ( .
.
794 . 1 447
827 . 55
) 50 (
...
073 . 91
) 90 (
753 . 79
) 75 (
753 . 79
447
) 230 )( 155 (
) )( (
23
2 2 2
2
11
2
2
= =
= = =
=
|
|
.
|

\
|
+ + + = = =

|
|
.
|

\
|
= =

F
b a GL
X F
n
E
O
X
X
X X
F
ij
ij j i
ij

X
2
X
2
05(2)
1.794 < 5.991; p > 5 %

Se acepta H
o
el porcentaje de eclosin no depende de la temperatura.








INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



14
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Ejercicio 14
En un experimento se analizo el efecto de la vacunacin de animales en laboratorio
contra una determinada enfermedad. Mediante un nivel de significancia del 0.01 y 0.05,
ensayar la hiptesis de que no haya diferencias entre los grupos vacunados y no
vacunados, es decir, la vacunacin y esta enfermedad son independientes.

Pasaron la
enfermedad
No pasaron la
enfermedad
Vacunados 9 42
No vacunados 17 28



Ejercicio 15

Se analiz el incremento de peso de peces machos y hembras de una especie de Tilapia
con alimento a diferentes porcentajes de protena. Los resultados se dan en gramos de
peso alcanzado durante un periodo de cultivo de 5 meses.

Sexo Protena (%)
20 25 30 35
Machos 340 355 385 360
hembras 320 345 370 355

Determinar si el incremento de biomasa depende del sexo a diferentes porcentajes de
protena. Sea o = 0.01.












INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



15
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

4.3 Prueba de Wilcoxon.
El contraste de Wilcoxon es la tcnica no paramtrica paralela al de la t de Student para
muestras apareadas. Igualmente dispondramos de n parejas de valores (xi, yi) que
podemos considerar como una variable medida en cada sujeto en dos momentos
diferentes.

El test de Wilcoxon, al igual que los otros contrastes no paramtricos puede realizarse
siempre que lo sea su homlogo paramtrico, con el inconveniente de que este ltimo
detecta diferencias significativas en un 95% de casos que el de la t de Student. Sin
embargo a veces las hiptesis necesarias para el test paramtrico (normalidad de las
diferencias apareadas, di) no se verifican y es estrictamente necesario realizar el contraste
que presentamos aqu. Un caso muy claro de no normalidad es cuando los datos
pertenecen a una escala ordinal (Rodrguez, 2006).

Se aplicada para determinar diferencias con tratamientos apareados.
Los pasos en el procedimiento son:
1. Asignar rangos a las diferencias entre valores pareados en forma ascendente sin
considerar el signo.
2. Asignar a los rangos los signos de las diferencias originales.
3. Calcular la suma de los rangos positivos T+ y la de los rangos negativos T-. Estas
estn relacionadas por la ecuacin T+ + T- = n(n+1)/2. Se elije el valor menor entre
T+ y T- llamndolo T. Slo hay que calcular la suma menor, si se ve claro cul de
ellas va a ser.
4. Comparar la suma obtenida en el paso 3 con el valor crtico.

Muestra 1
(X
1
, j)
Muestra 2
(X
2
, j)
Diferencia
(dj = X
1
,j X
2
, j)
Rank de
|d|
Ranks con
signos
X
1
, 1

X
2
,1 d1 rj rj
X
1
,2 X
2
, 2 + - d2 rj + - rj
X
1
,3 X
2
, 3 d3 rj rj
n
1
n
2


T+ = suma de rankeos con signo +
T- = suma de rankeos con signo

Tambin: T+ = n(n+1)/2 T- T- = n(n+1)/2 T+

Al testear H
O
: = 0
H
A
: 0

Se rechaza H
O
si T+ y T- , ambas > W(n) n= nmero de pares
Al testear H
O
: = 0
H
A
: > 0
INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



16
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Se rechazar H
O
si T+ > W1-, donde W1- es el percentil 1- de la distribucin exacta del
estadstico, que ha sido tabulada.

Si las hiptesis a testear fuesen H
O
: = 0
H
A
: < 0

Se rechazar H
O
si T+ W , donde W es el percentil de la distribucin exacta.
Tambin se podra definir T- como la suma de los rangos de los valores absolutos de las
observaciones menores que 0 en la muestra original.

Esta prueba tambin puede emplearse para una muestra nica, en la que se desee probar
una hiptesis nula acerca de la mediana. Aqu el valor hipottico se resta de cada
observacin y los valores resultantes se tratan como las instrucciones precedentes.

Ejercicio 16
En el cultivo del camarn blanco (Penaeus vannamei) en jaulas sumergidas se alimento
con 2 dietas, una de ellas a base de harina de pescado y la otra a base de harina de cabeza
de camarn, ambas con un 25 % de protena. Dando los siguientes resultados en
incrementos de peso (grs) por semana: Sea o= 0.05.

Semana Incremento con
Harina de
pescado (grs)
Incremento con
harina de cabeza de
camarn (grs)
1 0.99 0.83
2 0.89 0.02
3 0.86 1.88
4 1.14 0.65
5 1.79 1.34
6 0.81 0.50
7 0.40 0.51
8 0.30 0.31
9 0.49 0.26
10 0.35 0.06

INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



17
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Ejercicio 17
Se determino la talla promedio de la tortuga golfina (Lepidochelys olivacea) durante 10
aos en Puerto Vicente Guerrero, Gro., midiendo las longitudes del largo recto del
caparazn y la longitud curva del caparazn. Teniendo los siguientes resultados:
Sea o= 0.05.
Ao
Largo recto
del
caparazn
(cm)
Long. curva del
caparazn (cm)
1986 73.42 62.20
1987 73.00 63.90
1988 72.60 68.00
1989 71.77 68.18
1990 74.89 71.10
1991 64.70 69.20
1992 67.60 64.20
1993 68.23 64.82
1994 62.45 64.80
1995 65.83 68.66

















INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



18
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

4.4 Prueba de Kruskal- Wallis
La prueba de Kruskal-Wallis es la alternativa no paramtrica para la prueba de F del
anlisis de varianza para un diseo completamente aleatorizado. Se usa para detectar las
diferencias en lugares entre ms de dos distribuciones poblacionales con base en el
muestreo aleatorio independiente (Mendenhall et al, 2008).

Si una serie de datos es colectada acorde a un diseo completamente al azar donde k 3,
es posible probar no paramtricamente la diferencia entre los grupos o categoras de un
factor, lo cual es posible mediante la prueba de Kruskal-Wallis, frecuentemente
denominada ANOVA por rangos. Dicho anlisis puede ser empleado en instancias en
donde un ANOVA paramtrico no es aplicable, es decir cuando las k muestras no
provienen de poblaciones distribuidas normalmente y/o se observa heterogeneidad entre
varianzas. Como en las otras pruebas de rangos, se supone que todas las poblaciones
muestreadas son continuas e idnticas, excepto posiblemente en la localizacin. La
hiptesis en la prueba de Kruskal-Wallis para k 3 poblaciones se expresa como sigue
(Anderson et al, 2008):
H
o
: Todas las poblaciones son idnticas
H
a
: No todas las poblaciones son idnticas

De este modo, este contraste es el que debemos aplicar necesariamente cuando no se
cumple algunas de las condiciones que se necesitan para aplicar dicho mtodo.

La prueba de Kruskal-Wallis es una valiosa alternativa para el anlisis de varianza de un
criterio cuando se violan los supuestos de normalidad e igualdad de varianzas
(Mendenhall et al, 2008). La prueba de Kruskal-Wallis se puede usar tanto con datos
ordinales como con datos de intervalo o razn (Anderson et al, 2008).

Al igual que las dems tcnicas no paramtricas, esta se apoya en el uso de los rangos
asignados a las observaciones.

El procedimiento para aplicar la prueba es el siguiente:
1. Asignar rangos a todas las observaciones de menor a mayor
2. Sumar los rangos para cada muestra
3. Calcular el criterio de prueba y comparar con los valores tabulados.

Grupo 1 Grupo 2 Grupo 3
X1, 1
X1, 2
X1, 3
X2, 1
X2, 2
X3, 3
X3, 1
X3, 2
X3, 3
n1
R1
n2
R2
n3
R3
r= ranking de menor a mayor N= n1+n2+n3
INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



19
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Datos con repeticin


Si k< 5 utilizar distribucin H si k > 5 utiliza X
2

H 0.05 n1, n2, n3 X
2
0.05 k-1

Hc o H > H crtica o X
2
crtica rechazar H
o


Ejemplo 14
Un entomlogo realizo un estudio de distribucin de una especie de insecto en un bosque
y obtuvo 5 muestras de insectos de cada una de los tres diferentes tipos de vegetacin:
hierbas, arbustos y rboles.
H
o
: la abundancia de insectos es la misma en los 3 tipos de vegetacin
H
a
: La abundancia de los insectos no es la misma en los 3 tipos de vegetacin

Numero de insectos/m
3
de follaje
Hierbas Arbustos rboles
14.0 (15)
12.1 (14)
9.6 (12)
8.2 (10)
10.2 (13)

8.4 (11)
5.1 (2)
5.5 (4)
6.6 (7)
6.3 (6)

6.9 (8)
7.3 (9)
5.8 (5)
4.1 (1)
5.4 (3)
n1 = 5
R1= 64
n2= 5
R2 = 30
n3 = 5
R3= 26

N = 5+5+5 = 15


H = 56.720 -48
H= 8.72
Hc H
(0.05) 5,5,5
8.72 > 5.78 Rechazar H
o
INSTITUTO TECNOLGICO DE LERMA INGENIERA EN ACUICULTURA



20
ESTADSTICA APLICADA BIL. J. ALFREDO SOLS ECHEVERRA

Ejemplo 18

En un estudio se obtuvieron 8 muestras de agua cada uno de 4 estanques. El pH de cada
muestra de agua fue medido. Los datos estn organizados en orden ascendente en cada
estanque. = 0.05

H
o
: El pH es el mismo en todas las muestras
H
a
: El pH no es el mismo en todas las muestras

Estanque 1 Estanque 2 Estanque 3 Estanque 4
7.68 (1)
7.69 (2)
7.70 (3.5)
7.70 (3.5)
7.72 (8)
7.73 (10)
7.73 (10)
7.76 (17)
7.71 (6)
7.73 (10)
7.74 (13.5)
7.74 (13.5)
7.78 (20)
7.78 (20)
7.80 (23.5)
7.81 (26)
7.74 (13.5)
7.75 (16)
7.77 (18)
7.78 (20)
7.80 (23.5)
7.81 (26)
7.84 (28)
7.71 (6)
7.71 (6)
7.74 (13.5)
7.79 (22)
7.81 (26)
7.85 (29)
7.87 (30)
7.91 (31)
n1= 8
R1= 55
n2= 8
R2= 132.5
n3= 7
R3= 145
n4= 8
R4= 163.5

N= 8+8+7+8 = 31


H = 11.876


GL= k-1= 4-1=3
H
c
H
0.05 (3)

11.943 > 7.815 Rechazar H
o

Das könnte Ihnen auch gefallen