Beruflich Dokumente
Kultur Dokumente
CURSO BIOESTADSTICA
LECTURA 08: INTRODUCCIN A LA ESTADSTICA NO PARAMETRICA (PARTE I). PRUEBA DE SIGNO. PRUEBA DE INDEPENDENCIA CHI CUADRADO INTRODUCCIN:
Las pruebas no paramtricas, en realidad son poco utilizadas a pesar de la potencia y certeza de sus resultados. Normalmente se utilizan cuando no se dispone de informacin suficiente de la poblacin de la cual se extrajeron los datos; careciendo entonces de un soporte para la realizacin de una inferencia con base a una muestra observada.
ANALISIS NO PARAMTRICOS:
Para realizar este tipo de anlisis, se debe partir de las siguientes consideraciones: La mayora de estos anlisis no requieren de presupuestos acerca de la forma de la distribucin poblacional y acepta distribuciones no normales. Las variables no necesariamente tienen que estar medidas en un nivel por intervalos o de razn. En este seccin trataremos la prueba de signo en una sola muestra, prueba de independencia Chi Cuadrado y prueba de correlacin de Spearman.
TEMA 18: PRUEBA DE SIGNO 1. INTRODUCCIN:
La prueba t estudiada en los capitulos anteriores, no es estrictamente valida para probar: 1) La hipotesis nula de que la medida de una poblacin es igual a algn valor en particular, o bien, 2) La hiptesis nula de que la media de una poblacin de diferencia entre pares es igual a cero, a menos que las poblaciones en cuestin signa una distribucin normal. El caso 2 se reconocer como una situacin que se analiza mediante la prueba de comparacin de parejas. Cuando no es posible hacer suposiciones de normalidad o cuando los datos disponibles son categoras en lugar de medidas sobre una escala de intervalos o de razones, debe buscarse un procedimiento opcional. An cuando se sabe que la prueba t es casi insensible a las violaciones de la suposicin de
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2 1
CURSO BIOESTADSTICA
normalidad, hay casos en que resulta preferible una prueba alternativa. Una prueba no paramtrica que se utiliza con frecuencia y que no depende de los supuestos de la prueba t es la prueba del signo. Esta prueba se centra en la mediana ms que en la media como una medida de tendencia central o de ubicacin. La mediana y en la media sern iguales en distribuciones simtricas. La nica suposicin que fundamente la prueba es que la distribucin de la variable de inters es continua. Est suposicin excluye el uso de datos nominales. La prueba del signo toma su nombre del hecho de que los signos ms y menos, y no son valores nmericos proporcionan datos utilizados en los clculos. Se ilustraar el uso de esta prueba primero para una sola muestray, a continuacin, para pareja de datos.
2. PASOS PARA LLEVAR ACABO LA PRUEBA DE SIGNO EN UNA SOLA MUESTRA:
1.
Formulacin de hiptesis Ho: La mediana de la poblacin es igual a cierto valor. H1: La mediana de la poblacin es mayor(menor odiferente) que cierto valor. Nivel de significancia: Estadstica de prueba: Prueba de cola derecha: K=N de signos menos Prueba de cola izquierda: K=N de signos ms
2. 3.
B(n, 0.5)
B(n, 0.5)
B(n, 0.5)
NOTA: La distribucin muestral de K es la distribucin binomial con parametros n y p=0.5, donde n es el nmero de diferencias no nulas (x i Me) > 0
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
4.
Establecimientos de los criterios de decisin: Para H1: P(+)>P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener k o menos signos menos es menor o igual a . Para H1: P(+)<P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener k o menos signos ms es menor o igual a . Para H1: P(+)P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener un valor de k tan extremo o ms que el valor calculado es igual o menor que /2.
5.
Clculos
( ) (0.5)
i= 0 n i
( ) (0.5)
i= 0 n i
Prueba bilateral Se calcula la probabilidad del signo que ocurre con menor frecuencia.
6.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
Ejemplo 1: Los investigadores desean saber si al instruir en cuidados y aseo personal a una muestra de nias con retraso mental mejorara su apariencia. Se eligi aleatoriamente a 10 nias de una escuela para nios con retraso mental, para que recibieran educacin especial sobre cuidado y aseo personal. Dos semanas despus de concluir el curso de instruccin, las nias fueron entrevistadas por una enfermera y una trabajadora social, quienes asignaron a cada ia una calificacin basada en sus apariencia general. Los investigadores crean que, como mximo, las calificaciones alcanzaran el nivel de una escala ordinal. Crean que aunque una calificacin de, digamos 8, representaba una apariencia mejor que una de 6, no podian decir que la diferencia entre las calificaciones de 6 y 8 representaba el doble de mejora que la diferencia entre las calificaciones 5 y 6. las calificaciones se muestran en la tabla que se da a continuacin. Se desea saber si es posible concluir que la calificacin mediana de la poblacin de la que se supone se extrajo la muestra es diferente de 5, a un nivel de significancia del 5%. Tabla N 1 Nia 1 2 3 4 5 Calificacin 4 5 8 8 9 Nia 6 7 8 9 10 Calificacin 6 10 7 6 6
Solucin: 1. Formulacin de hiptesis Ho: La mediana de la poblacin es igual 5 H1: La mediana de la poblacin es diferente de 5. 2. 3. Nivel de significancia: =0.05 Estadstica de prueba: K=N de signos que ocurre con menor frecuencia
B(n,0.5)
4
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
4.
Establecimiento de los criterios de decisin: Para H1: P(+)P(-) se rechaza Ho , cuando Ho es verdadera, si la probabilidad de obtener un valor de k tan extremo o ms que el valor calculado es igual o menor que /2=0.025. Clculos: A continuacin se hallarn las calificaciones por arriba (+) y por abajo(-) de la mediana hipottica en los datos de la Tabla N 1 Nia 1 2 0 3 + 4 + 5 + 6 + 7 + 8 + 9 + 10 +
5.
Donde n= 9, teniendo en cuenta que no se toman las diferencias nulas Entonces en este caso de acuerdo a lo expuesto para una prueba bilateral hallaremos la probabilidad del nmero de signos que ocurre con menor frecuencia; es decir la probabilidad de obtener uno o menos signos menos.
P1 =
( ) (0.5)
k= 0 n k
P1 =
( ) (0.5)
k= 0 9 k
9 P1 = (9 )(0.5)9 + (1 )(0.5) 9 0
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
6.
Decisin: P1 = 0.0196 < 0.025. Se rechaza Ho. Lo cual quiere decir que la mediana de la poblacin es diferente de 5.
Es un procedimiento de contrastacin que se utiliza para determinar la dependencia (relacin o asociacin) o independencia entre dos variables categricas. Los datos pueden disponerse en una tabla de doble entrada llamada Tabla de Contingencia de r filas y k columnas. Pasos a seguir: 1. Formulacin de Hiptesis: H0 : No existe relacin entre las caractersticas. H1 : Existe relacin entre las caractersticas. 2. Nivel de signficancia: 3. Estadstica de prueba:
X =
2
(f ij e ij ) 2 e ij
i = 1 j= 1
X2 v
eij =
f i . f. j n
4.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
0
2 X 1 , v
R.A.
R.R
Cuando los grados de libertad es v = 1 y especialmente cuando la muestra es muy pequea (n < 50), es aconsejable introducir un factor de correccin de continuidad de al calcular el valor chi-cuadrado. Es decir cuando v = 1 modificamos la ecuacin
X =
2 0
i= 1
(/ f ij e ij / 0.5) 2 e ij
j= 1
f ij e ij 0.5
Si cada celda tiene 5 o ms observaciones y las X 2 tiene dos o ms grados de libertad la aproximacin es buena. Si las frecuencias observadas en alguna celda, son menores que cinco, se combinan adecuadamente las celdas correspondientes hasta salvar la dificultad.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
Para emplear correctamente el estadgrafo X 2, es necesario que por lo menos el 80% de las frecuencias esperadas de las distintas modalidades sean mayores o iguales que 5 y ninguna menor que 1. Si no es posible que se cumpla esta regla, los datos sern analizados por un medio de un procedimiento, llamado Test Exacto de Fisher. El coeficiente de contingencia C de Pearson: Es un indicador que sirve para medir el grado de relacin entre dos variables categricas y vara entre 0 y 1. C no tiene a 1 como lmite superior, su lmite superior se relaciona con el nmero de categoras. Para una tabla superior construida con igual nmero de filas y columnas el lmite superior es LS =
(k 1) / k . De este modo para una tabla 2 / 3 = 0.82 ; para una tabla
y filas difiere (Tabla Rectangular), por ejemplo, 3 x 4 (T34 ) el lmite superior de C se deduce con un valor k igual nmero ms pequeo.
Ejemplo 2: La siguiente tabla corresponde 360 alumnos del 5to y 6to grado de un colegio X por nivel de autoestima segn diagnostico nutricional: Diagnstico Nivel de Autoestima Alta Media Baja Nutricional Total Adecuado 100 50 10 160 Inadecuado 20 30 150 200 Total 120 80 160 360 a) Probar que el diagnstico nutricional y el nivel de autoestima se relacionan, a un nivel de significancia del 5%. b) Calcular e interpretar el coeficiente de contingencia Chi cuadrado.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2 8
CURSO BIOESTADSTICA
Solucin: a) 1. Formulacin de hiptesis: Ho: El estado nutricional y el nivel de autoestima de los alumnos no se relacionan. H1: El estado nutricional y el nivel de autoestima de los alumnos se relacionan. 2. 3. Nivel de significancia: = 0.05 Estadstica de prueba:
X =
2
i= 1
(f
ij
e ij ) e ij
j= 1
X2 2
R.A.
2 Si X 0 5.99 ; se acepta Ho.
2 Si X 0 > 5.99 ; se rechaza Ho.
R.R.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
CURSO BIOESTADSTICA
NOTA:
e ij =
f i. f . j n
f 1. f .1 160 120 = = 53.3 53 n 360 f 1. f .2 160 80 = = 35.5 36 n 360 f 1. f .3 160 160 = = 71.1 71 n 360 f 2. f .1 200 120 = = 66.7 67 n 360 f 2. f .2 200 80 = = 44.4 44 n 360 f 2. f .3 200 160 = = 88.9 89 n 360
e 21 =
e 22 =
e 23 =
Alto 53 67
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
10
CURSO BIOESTADSTICA
(100 53) 2 (50 36) 2 (10 71) 2 (20 67) 2 (30 44) 2 (150 89) 2 + + + + + 53 36 71 67 44 89 5 + 52 + 33 + 4 + 42
2 X 0 = 42 +
2 X 0 = 178
6.
Decisin: Como
2 X 0 = 178 > 5.99 ,
C =
C=
Haciendo el anlisis respectivo el grado de relacin entre el estado nutricional y el nivel de autoestima de los alumnos vemos que es adecuado.
___________________________________________________________________________ Elaborado por : Mg. Carmen Barreto R. Fecha : Marzo 2011 Versin :2
11