Beruflich Dokumente
Kultur Dokumente
1
MÉTODOS NO PARAMÉTRICOS
2
CONTENIDO
Pág.
INTRODUCCIÓN.......................................................................................................6
3. CONCLUSIONES..........................................................................................19
3
LISTA DE ILUSTRACIONES
4
LISTA DE TABLAS
5
INTRODUCCIÓN
Los métodos no paramétricos o de distribución libre son los que no suponen una
forma específica de la distribución de la cual se toman los datos, siendo una
alternativa en la solución de problemas, los cuales no existen supuestos tan
numerosos ni severos y son aplicables a cualquier variable, en particular a las de
tipo nominal u ordinal, así como a distribuciones diversas. Por ejemplo, muchas
pruebas de hipótesis parten del supuesto, donde la población sigue una
distribución normal con los parámetros μ y σ. Las pruebas no paramétricas no
parten de este supuesto, de modo que son útiles cuando los datos son
considerablemente no normales y resistentes a transformaciones.
En la estadística paramétrica se supone que las muestras provienen de
distribuciones totalmente especificadas, caracterizadas por uno o más parámetros
desconocidos sobre los cuales se desea hacer inferencias.
En un método no paramétrico se supone que la distribución de la que proviene la
muestra no está especificada y con frecuencia, se desea hacer inferencias sobre
el centro de la distribución.
6
1. OBJETIVOS
7
2. MÉTODOS NO PARAMÉTRICOS
El parámetro que se usa comúnmente para hacer las pruebas estadísticas no-
paramétricas es la Mediana y no la Media, aunque se pueden usar otros
parámetros.
VENTAJAS
DESVENTAJAS
8
Tabla 1. Relación entre métodos paramétricos y no paramétricos
9
La siguiente es una lista de las pruebas no paramétricas y sus alternativas
paramétricas.
Tabla 2. Relación entre pruebas paramétricas y no paramétricas
10
Ilustración 1. Clasificación de los métodos no paramétricos
11
En estadística no paramétrica la medida habitual de la dispersión (que sustituye a
la desviación estándar) es el recorrido (o intervalo) intercuartílico. Como se ha
visto, la mediana divide la muestra de medidas en dos mitades iguales: si cada
una de estas mitades se divide posterior mente en otras dos mitades los puntos de
división se denominan cuartiles inferior y superior. Al hacer este cálculo se usa n
varios convenios diferentes y de nuevo se remite al lector interesado a la
bibliografía. El intervalo intercuartílico no es muy utilizado en el trabajo analítico,
sin embargo, varios contrastes estadísticos se pueden realizar sobre él.
12
Los datos, escritos en dos filas como antecede, no aportan de inmediato
demasiado significado, y un analista poco reflexivo podría proceder enseguida a
realizar un contraste t (Capítulo 3), o quizá uno de los contrastes no paramétricos
que se describen posterior mente, para ver si los dos conjuntos de resultados son
significativamente diferentes. Sin embargo, cuando los datos se presentan como
dos diagramas de puntos, o como un único diagrama con los dos conjuntos de
datos escritos con símbolos diferentes, es manifiesto que los resultados, aunque
interesantes, son tan inconclusos que, sin, medidas adicionales, poco puede
deducirse de ellos (Figura 6.1).
Las medianas de los dos conjuntos de resultados son similares: 21 para los
alimentos tratados y 22.5 para los controles. Pero el intervalo de velocidades de
reacción para los materiales tratados con Pb(ll} es enorme, con los resultados
manifiestamente ubicados al menos en dos grupos: cinco alimentos parecen no
estar afectados por el plomo (quizá porque en estos casos el Pb(ll) esté
completado por otros componentes distintos de la enzima), mientras que otros tres
muestran un gran efecto de inhibición (es decir, la velocidad de reacción ha
disminuido mucho), y otro se ubica de alguna manera entre estos dos extremos.
Un problema adicional consiste en que uno de los resultados del grupo de control
es claramente diferente del resto, y se podría considerar como un resultado
anómalo (Capítulo 3). En estas circunstancias parece muy improbable que un
contraste de significación convencional vaya a revelar información químicamente
útil: el uso del método AID más simple nos ha conducido de la desconsideración
de los contrastes de significación (como ocurre a menudo) hacia más medidas
experimentales.
13
datos se describe por sus extremos, su cuartil inferior, la superior y su mediana. El
gráfico muestra de un vistazo la variabilidad y la simetría de los datos.
14
preponderancia de signos menos es significativa se utiliza la ley binomial. Esta
ley establece que la probabilidad de que aparezcan signos menos entre n
signos viene dada por
Queda claro a partir de este ejemplo que el contraste de los signos conllevará el
uso frecuente de la distribución binomial con p = q = 1/2. Esta aproximación tan
común en la estadística no paramétrica que la mayoría de las tablas estadísticas
incluyen los datos necesarios, permitiendo que tales cálculos se realicen
instantánea mente (véase Tabla A.9). Además, en muchas situaciones prácticas,
un analista tomará siempre el mismo número de lecturas o muestras y podrá
memorizar con facilidad las probabilidades correspondientes a los diversos signos
+ o -.
15
un signo más (o un signo menos) para cada diferencia es 0.5. Ahora se puede
comparar el número de signos más o menos realmente obtenidos con la
probabilidad que se deriva de la Ecuación (6.1). En los ejercicios del final de este
capítulo apa rece u n ejemplo de esta aplicación del contraste de signos.
Otro uso adicional del contraste de signos es indicar una tendencia. Esta
aplicación se ilustra mediante el siguiente ejemplo.
El nivel de una hormona en el plasma sanguíneo de un paciente se mide
durante diez días a la misma hora cada día. Los datos resultantes son:
Día 1 2 3 4 5 6 7 8 9 10
5.8 4. 6. 5. 5. 6. 4. 6. 5.0
Nivel, ng mi 1 9 1 5 5 0 9 0
5. 7. 4. 6. 5
8
5. 3
6. 9
4. 1
6. .5
5 0 9 0 .
El precio que se paga por la extrema sencillez del contraste de los signos es la
pérdida de cierta potencia estadística. El con traste no utiliza toda la información
ofrecida por los datos, por esa razón no es nada sorprendente encontrar que
16
proporcione también menos información discriminante. En secciones posteriores
se discutirá n métodos no para métricos que utilizan tanto la magnitud es de los
resultados individuales como sus signos
17
experimentales, y en su lugar se recomienda una gráfica de regresión no lineal
Estudiaba el uso del con traste de los signos. Su interés reside en los supuestos
mínimos que se hacen sobre los datos experimentales. La población de la que se
toma la muestra no se supone que sea normal, ni. incluso que sea simétrica. Por
otra parte, una cierta desventaja del contraste de signos es que no utiliza toda la
información disponible. Sólo es necesario saber si una medida individual es más
grande o más pequeña que la mediana: la magnitud de esta desviación no se
utiliza con ningún otro objetivo
18
3. CONCLUSIONES
19