Normalidad de Los Datos

INDICE
Introduccin.......................................................................................................... 1
NORMALIDAD DE LOS DATOS............................................................................... 2
2.
METODOS DE EVALUACIN........................................................................2
2.1 Metodologa Anderson-Darling................................................................2
2.2 Metodologa Kolgomorov-Smirnov..........................................................3
3.
PRUEBA DE HIPOTESIS............................................................................... 4
3.1 La hiptesis nula:.................................................................................... 5
3.2 La hiptesis alternativa:.........................................................................5
3.3 Prueba de una Hiptesis Estadstica.......................................................5
3.4 El error tipo I:.......................................................................................... 7
3.5 El error tipo II o error
...........................................................................7
FUENTES............................................................................................................. 8
NORMALIDAD DE LOS DATOS
Introduccin
El siguiente artculo, tiene como objetivo el poder adentrar al estudiante de la maestra en
administracin de empresas, del curso mtodos estadsticos aplicados a la maestra de
Recursos Humanos, en el tema de Normalidad de los datos, tipos de pruebas para medir
la normalidad de los datos y pruebas de hiptesis.
Dentro del articulo encontraran algunos ejemplos para los distintos temas con el fin de
esclarecer las dudas que puedan surgir en relacin a los temas expuestos, as mismo el
articulo servir como gua de apoyo para el estudiante, para realizar consultas durante la
implementacin de dichos temas en su entorno laborar y estudiantil.
NORMALIDAD DE LOS DATOS

La Prueba de normalidad genera una grfica de probabilidad normal y realiza una prueba de
hiptesis para examinar si las observaciones siguen o no una distribucin normal. Algunos
procedimientos estadsticos, como una prueba t o Z, presuponen que las muestras provienen de
una distribucin normal. Se utiliza este procedimiento para poner aprueba el supuesto de
normalidad. Para la prueba de normalidad, las hiptesis son:
H0: los datos siguen una distribucin normal
H1: los datos no siguen una distribucin normal
1. CARACTERSTICAS
La escala vertical de la grfica se asemeja a la escala vertical del papel de probabilidad normal. El
eje horizontal es una escala lineal. La lnea forma un estimado de la funcin de distribucin
acumulada para la poblacin de la cual se extrajeron los datos. Con la grfica se muestran
estimaciones numricas de los parmetros de la poblacin, m y s, el valor de la prueba de
normalidad y el valor p asociado.
En el siguiente informe se establecen los siguientes mtodos de prueba: Anderson-Darling y de
Kolgomorov-Smirnov.
2. METODOS DE EVALUACIN
2.1 Metodologa Anderson-Darling
La prueba Anderson-Darling es, en general, ms potente que la pruebas X2 de Pearson y la de
Kolmogorov-Smirnov. Resulta lgico pensar que la X2 de Pearson es menos potente que la de
Kolmogorov-Smirnov y la de Anderson- Darling debido a que trabaja con datos agrupados debido al
agrupamiento. Hay prdida de informacin. Por otro lado, la prueba Kolmogorov-Smirnov es menos
sensible a desajustes que pudiera haber en las colas de la distribucin, que la prueba AndersonDarling. En particular, la prueba Anderson- Darling funciona mejor que cualquiera otra, cuando
haya casos extraordinarios o aberrantes (outliers). 1 La estadstica Anderson-Darling est dada por
la siguiente expresin:
A2 = - n -
( 1 / n ) [ ( 2 i - 1 )
L n
( P (I)) + (2n +1 - 2i) Ln {1 - p(i) }]
Donde P (i) es el rea bajo la curva normal para el intervalo (-oo,z (i)), o sea es la funcin
distribucin normal estndar evaluada en el i-simo elemento (en orden ascendente) de la muestra.
Se presentan dos situaciones para la estadstica Anderson-Darling: la primera en que se conocen
los parmetros de la distribucin llamado caso 0 (cero), y la otra en que se desconoce al menos
uno de ellos (casos 1, 2 y 3).Situndonos en el caso de bondad de ajuste a la distribucin normal
se consideran los siguientes casos:
Caso 0: y s2conocidos.
Caso 1:s2 conocida y desconocida y estimada por X
Caso 2: conocida y s2 desconocida y estimada por s(n) = (xi-)2 /n
Caso 3: ambos desconocidos, estimados por X y s n-1 = (xi- x) 2 /n-1
Para cada uno de los casos existe una tabla estadstica para realizar la prueba de la hiptesis, Ho:
"La muestra aleatoria proviene de una distribucin normal". La estadstica de Anderson-Darling se
calcula para los cuatro casos de la misma manera; sin embargo, en el caso 3 se debe multiplicar
por un factor de correccin el cual es: 1 + (0.75/n) + (2.25/n2), que mejora la aproximacin. 2
2.2 Metodologa Kolgomorov-Smirnov

En estadstica ,la prueba de Kolmogrov-Smirnov (tambin prueba K-S) es una prueba no
paramtrica que se utiliza para determinar la bondad de ajuste de dos distribuciones de
probabilidad entre s .Conviene tener en cuenta que la prueba Kolmogrov-Smirnov es ms
sensible a los valores cercanos a la mediana que a los extremos de la distribucin. L aprueba de
Anderson-Darling proporciona igual sensibilidad con valores extremos.
En esta prueba tambin se est interesado en el grado de concordancia entre la distribucin de
frecuencia muestral y la distribucin de frecuencia terica, bajo la hiptesis nula de que la
distribucin de la muestra es f0(x,q) e interesa probar que no existe diferencia significativa. La
prueba trabaja con la funcin de distribucin (distribucin de frecuencia acumulativa). Esta prueba
1 http://es.scribd.com/doc/73884190/Equipo-10-Estadistica
2 http://gide.unileon.es/admin/UploadFolder/covarianzas.pdf
3
pertenece al campo de la Estadstica No Paramtrica. Sea F0(x) la funcin de distribucin terica

para la variable aleatoria X, y representa la probabilidad de que la variable aleatoria X tome un
valor menor o igual a x (tambin se interpreta como la proporcin esperada de observaciones que
tengan un valor menor o igual ax). Es decir: Sea Sn (x) la funcin de distribucin emprica,
calculada con base en los valores observados dela muestra n observaciones. Sn (x) representa la
proporcin de valores observados que son menores o iguales a x, y est definida como: Sn (x) = P
(X x/ dados los resultados mustrales) = m/n donde m es el nmero de valores observados que
son menores o iguales a x.3
3. PRUEBA DE HIPOTESIS
Puede encontrarse ya sea un slo nmero (estimador puntual) o un intervalo de valores posibles
(intervalo de confianza). Sin embargo, muchos problemas de ingeniera, ciencia, y administracin,
requieren que se tome una decisin entre aceptar o rechazar una proposicin sobre algn
parmetro. Esta proposicin recibe el nombre de hiptesis. Este es uno de los aspectos ms tiles
de la inferencia estadstica, puesto que muchos tipos de problemas de toma de decisiones,
pruebas o experimentos en el mundo de la ingeniera, pueden formularse como problemas de
prueba de hiptesis.
Una hiptesis estadstica es una proposicin o supuesto sobre los parmetros de una o ms
poblaciones.
Suponga que se tiene inters en la rapidez de combustin de un agente propulsor slido utilizado
en los sistemas de salida de emergencia para la tripulacin de aeronaves. El inters se centra
sobre la rapidez de combustin promedio. De manera especfica, el inters recae en decir si la
rapidez de combustin promedio es o no 50 cm/s. Esto puede expresarse de manera formal como
Ho;
H1;
= 50 cm/s
50 cm/s
La proposicin Ho;
= 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin H1;
50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis alternativa

especifica valores de
que pueden ser mayores o menores que 50 cm/s, tambin se conoce
3 http://gide.unileon.es/admin/UploadFolder/covarianzas.pdf
4
como hiptesis alternativa bilateral. En algunas situaciones, lo que se desea es formular una
hiptesis alternativa unilateral, como en
Ho;
= 50 cm/s Ho;
= 50 cm/s H1;
< 50 cm/s H1;
> 50 cm/s
Es importante recordar que las hiptesis siempre son proposiciones sobre la poblacin o
distribucin bajo estudio, no proposiciones sobre la muestra. Por lo general, el valor del parmetro
de la poblacin especificado en la hiptesis nula se determina en una de tres maneras diferentes:
1. Puede ser resultado de la experiencia pasada o del conocimiento del proceso, entonces el
objetivo de la prueba de hiptesis usualmente es determinar si ha cambiado el valor del
parmetro.
2. Puede obtenerse a partir de alguna teora o modelo que se relaciona con el proceso bajo
estudio. En este caso, el objetivo de la prueba de hiptesis es verificar la teora o modelo.
3. Cuando el valor del parmetro proviene de consideraciones externas, tales como las
especificaciones de diseo o ingeniera, o de obligaciones contractuales. En esta situacin,
el objetivo usual de la prueba de hiptesis es probar el cumplimiento de las
especificaciones.
Un procedimiento que conduce a una decisin sobre una hiptesis en particular recibe el nombre
de prueba de hiptesis. Los procedimientos de prueba de hiptesis dependen del empleo de la
informacin contenida en la muestra aleatoria de la poblacin de inters. Si esta informacin es
consistente con la hiptesis, se concluye que sta es verdadera; sin embargo si esta informacin
es inconsistente con la hiptesis, se concluye que esta es falsa. Debe hacerse hincapi en que la
verdad o falsedad de una hiptesis en particular nunca puede conocerse con certidumbre, a menos
que pueda examinarse a toda la poblacin. Usualmente esto es imposible en muchas situaciones
prcticas. Por tanto, es necesario desarrollar un procedimiento de prueba de hiptesis teniendo en
cuenta la probabilidad de llegar a una conclusin equivocada.
3.1 La hiptesis nula: representada por Ho, es la afirmacin sobre una o ms

caractersticas de poblaciones que al inicio se supone cierta (es decir, la "creencia a priori").
3.2 La hiptesis alternativa: representada por H1, es la afirmacin contradictoria

a Ho, y sta es la hiptesis del investigador.
La hiptesis nula se rechaza en favor de la hiptesis alternativa, slo si la evidencia muestral
sugiere que Ho es falsa. Si la muestra no contradice decididamente a H o, se contina creyendo en
la validez de la hiptesis nula. Entonces, las dos conclusiones posibles de un anlisis por prueba
de hiptesis son rechazar Ho o no rechazar Ho.
3.3 Prueba de una Hiptesis Estadstica

Para ilustrar los conceptos generales, considere el problema de la rapidez de combustin del
agente propulsor presentado con anterioridad. La hiptesis nula es que la rapidez promedio de
combustin es 50 cm/s, mientras que la hiptesis alternativa es que sta no es igual a 50 cm/s.
Esto es, se desea probar:
Ho;
= 50 cm/s
H1;
50 cm/s
Supngase que se realiza una prueba sobre una muestra de 10 especmenes, y que se observa
cual es la rapidez de combustin promedio muestral. La media muestral es un estimador de la
media verdadera de la poblacin. Un valor de la media muestral
hipottico
que este prximo al valor
= 50 cm/s es una evidencia de que el verdadero valor de la media
es realmente 50
cm/s; esto es, tal evidencia apoya la hiptesis nula H o. Por otra parte, una media muestral muy
diferente de 50 cm/s constituye una evidencia que apoya la hiptesis alternativa H 1. Por tanto, en
este caso, la media muestral es el estadstico de prueba.
La media muestral puede tomar muchos valores diferentes. Supngase que si 48.5
entonces no se rechaza la hiptesis nula H o;
acepta la hiptesis alternativa H1;
Los valores de
= 50 cm/s, y que si
<48.5
51.5,
>51.5, entonces se
50 cm/s.
que son menores que 48.5 o mayores que 51.5 constituyen la regin crtica de
la prueba, mientras que todos los valores que estn en el intervalo 48.5
51.5 forman la
regin de aceptacin. Las fronteras entre las regiones crticas y de aceptacin reciben el nombre
de valores crticos. La costumbre es establecer conclusiones con respecto a la hiptesis nula H o.
Por tanto, se rechaza Ho en favor de H1 si el estadstico de prueba cae en la regin crtica, de lo
contrario, no se rechaza Ho.4
4 http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
6
Este procedimiento de decisin puede conducir a una de dos conclusiones errneas. Por ejemplo,
es posible que el valor verdadero de la rapidez promedio de combustin del agente propulsor sea
igual a 50 cm/s. Sin embargo, para todos los especmenes bajo prueba, bien puede observarse un
valor del estadstico de prueba
que cae en la regin crtica. En este caso, la hiptesis nula H o
ser rechazada en favor de la alternativa H 1cuando, de hecho, Ho en realidad es verdadera. Este

tipo de conclusin equivocada se conoce como error tipo I.5
3.4 El error tipo I: se define como el rechazo de la hiptesis nula H o cuando sta es
verdadera. Tambin es conocido como
nivel de significancia.
Si tuviramos un nivel de confianza del 95% entonces el nivel de significancia sera del 5%.
Anlogamente si se tiene un nivel de confianza del 90% entonces el nivel de significancia sera del
10%.
Ahora supngase que la verdadera rapidez promedio de combustin es diferente de 50 cm/s,
aunque la media muestral
caiga dentro de la regin de aceptacin. En este caso se acepta H o
cuando sta es falsa. Este tipo de conclusin recibe el nombre de error tipo II.
3.5 El error tipo II o error
: se define como la aceptacin de la hiptesis nula
cuando sta es falsa.

Por tanto, al probar cualquier hiptesis estadstica, existen cuatro situaciones diferentes que
determinan si la decisin final es correcta o errnea.
Decisin
Ho es verdadera
Aceptar Ho
No hay error
Rechazar Ho
Error tipo I
Ho es falsa
Error tipo II
No hay error
1. Los errores tipo I y tipo II estn relacionados. Una disminucin en la probabilidad de uno
por lo general tiene como resultado un aumento en la probabilidad del otro.
2. El tamao de la regin crtica, y por tanto la probabilidad de cometer un error tipo I,
siempre se puede reducir al ajustar el o los valores crticos.
5 http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html
7
3. Un aumento en el tamao muestral n reducir
4. Si la hiptesis nula es falsa,
de forma simultnea.
es un mximo cuando el valor real del parmetro se
aproxima al hipottico. Entre ms grande sea la distancia entre el valor real y el valor
hipottico, ser menor
FUENTES
1.
2.
3.
4.
http://es.scribd.com/doc/73884190/Equipo-10-Estadistica
http://gide.unileon.es/admin/UploadFolder/covarianzas.pdf
http://definicion.de/prueba-de-hipotesis/
http://www.itch.edu.mx/academic/industrial/estadistica1/cap02.html

Normalidad de Los Datos

Hochgeladen von

Dokumentinformationen

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Normalidad de Los Datos

Hochgeladen von

Copyright:

Verfügbare Formate

INDICE

NORMALIDAD DE LOS DATOS

NORMALIDAD DE LOS DATOS

( P (I)) + (2n +1 - 2i) Ln {1 - p(i) }]

2.2 Metodologa Kolgomorov-Smirnov

pertenece al campo de la Estadstica No Paramtrica. Sea F0(x) la funcin de distribucin terica

= 50 cm/s, se conoce como hiptesis nula, mientras que la proposicin H1;

50 cm/s, recibe el nombre de hiptesis alternativa. Puesto que la hiptesis alternativa

que pueden ser mayores o menores que 50 cm/s, tambin se conoce

< 50 cm/s H1;

3.1 La hiptesis nula: representada por Ho, es la afirmacin sobre una o ms

3.2 La hiptesis alternativa: representada por H1, es la afirmacin contradictoria

3.3 Prueba de una Hiptesis Estadstica

que este prximo al valor

= 50 cm/s es una evidencia de que el verdadero valor de la media

que cae en la regin crtica. En este caso, la hiptesis nula H o

ser rechazada en favor de la alternativa H 1cuando, de hecho, Ho en realidad es verdadera. Este

caiga dentro de la regin de aceptacin. En este caso se acepta H o

3.5 El error tipo II o error

: se define como la aceptacin de la hiptesis nula

cuando sta es falsa.

3. Un aumento en el tamao muestral n reducir

4. Si la hiptesis nula es falsa,

es un mximo cuando el valor real del parmetro se

Das könnte Ihnen auch gefallen