Beruflich Dokumente
Kultur Dokumente
PROFESOR
TORRES, PRAXEDES
GRUPO N5
12L-141
INTEGRANTES
ACEVEDO, YINELIS
4-771-1973
AYALA, KATHERINE
4-759-364
ESTRADA, BIDELKA
8-884-1387
LIAO, ROSA
8-880-2347
PEREZ, ELYDENIS
8-824-16
VEGA, JUAN
8-848-1098
FECHA DE ENTREGA
MIERCOLES, 15 DE ABRIL DE 2015
I SEMESTRE
I have always thirsted for knowledge, I have always been full of questions.
Hermann Hesse
ndice General
Resumen.
Simbologa....
..
ndice
de
3
4
Ecuaciones. 5
..
ndice de Figuras...
Introduccin....
Determinacin del tipo de distribucin de un conjunto de datos...
Introduccin
Estadstica no Paramtrica..
Pruebas no Paramtricas.
Prueba de Hiptesis
Introduccin
Hiptesis Nula
Hiptesis Alternativa..
Tipos de Error.
Pruebas no Paramtricas.
Prueba de Anderson-Darling..
Prueba de Chi-Cuadrado o Ji-Cuadrado.
Prueba de Kolmogorov-Smirnov
Conclusiones..
5
6
7
7
8
8
11
11
12
13
13
15
16
18
29
35
.
Recomendaciones... 36
Bibliografa. 37
Anexo. 38
Resumen
La Estadstica es una ciencia que utiliza mtodos cientficos en la toma, organizacin,
recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones,
como para tomar decisiones razonables de acuerdo con tales anlisis.
Esta se divide en estadstica descriptiva e inferencial, en donde la inferencia a su vez se
divide en paramtrica y no paramtricas.
Cada una de las pruebas que utilizamos para determinar la distribucin de datos son: la
Prueba de Anderson-Darling, la cual que se utiliza para ajustar datos. La Prueba de ChiCuadrado, se utiliza para el anlisis de varias variables. Prueba de Kolmogorov-Smirvov
(K-S), la cual tambin es utilizada para ajustar los datos o muestras obtenidos.
Simbologa
Nivel de Significancia
Grado de Libertad
Valor p
Fo
Frecuencia Observada
Fe
Frecuencia Esperada
H0
Hiptesis Nula
H1
Hiptesis Alternativa
ndice de Ecuaciones
Ecuacin # 1: Frmula de Anderson-Darling.........................................................................1
Ecuacin # 2 Frmula de Chi-Cuadrado o Ji-Cuadrado (X2).................................................1
Ecuacin # 3: Frmula de Kolmogorov-Smirnov...................................................................1
ndice de Figuras
Figura # 1: Ejemplo de Pruebas no Paramtricas...................................................................1
Figura # 2: Proceso de Determinacin del Tipo de Distribucin de un Conjunto de Datos...1
Figura # 3: Definicin de Hiptesis........................................................................................1
Figura # 4: Definicin de Prueba de Hiptesis.......................................................................1
Figura # 5: Pasos para una Prueba de Hiptesis.....................................................................1
Figura # 6: Definicin de una Hiptesis Nula.........................................................................1
Figura # 7: Definicin de una Hiptesis Alternativa...............................................................1
Figura # 8: Definicin de Error Tipo I....................................................................................1
Figura # 9: Definicin de Error Tipo II...................................................................................1
Figura # 10: Distribuciones Simtricas...................................................................................1
Figura # 11: Estadsticos de pruebas y valores crticos para la prueba de Anderson-Darling 1
Figura # 12: Aplicaciones de la Prueba de Chi-Cuadrado o Ji-Cuadrado (X2).......................1
Introduccin
CONJUNTO DE DATOS
INTRODUCCIN
La Estadstica es una ciencia que utiliza mtodos cientficos en la toma, organizacin,
recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones,
como para tomar decisiones razonables de acuerdo con tales anlisis (Spiegel, 1970). Es un
conjunto de mtodos para planear estudios y experimentos, obtener datos y luego organizar,
resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos (Triola,
2009).
El trmino Estadstica se utiliza para denotar los mismos datos o nmeros que se derivan de
ellos. La Estadstica se divide en dos reas:
Estadstica Descriptiva: Se dedica a organizar, describir, analizar y presentar datos de
manera informativa sin sacar condiciones o inferencias de un grupo mayor.
Estadstica Inferencial: Utiliza mtodos para estimar las propiedades de una poblacin
basndose en muestras.
La Estadstica Inferencial es la rama de la estadstica que estudia el comportamiento y
propiedades de las muestras y la posibilidad, y limites, de la generalizacin de los
resultados obtenidos a partir de aquellas a las poblaciones que representan (Nolberto
Sifuentes & Ponce Aruneri, 2008). Dentro de la estadstica Inferencial se realizan estudios
basados en probabilidad para someter a prueba las diferentes muestras de poblaciones.
La Estadstica Inferencial se divide en dos subcategoras:
Estadstica Paramtrica: Realizan anlisis o estudios de muestras aleatorias extradas de una
poblacin en la cual sus datos estn distribuidos normalmente y contienen parmetros
mediables.
Estadstica no Paramtrica: Se encarga del anlisis y estudio de pruebas y modelos
estadsticos en los cuales su distribucin no se ajusta a ningn criterio paramtrico.
ESTADISTICA NO PARAMETRICA
La Estadstica no Paramtrica es una subcategora de la estadstica inferencial que se
encarga del anlisis y estudio de datos que no se ajustan a ningn criterio paramtrico. Las
tcnicas o mtodos no paramtricos trabajan bajo supuestos generales en base a la
distribucin que siguen los datos sin utilizar el supuesto de normalidad de una muestra o
poblacin.
Ventajas de la estadstica
no paramtrica
Desventajas de la estadstica
no paramtrica
PRUEBAS NO PARAMETRICAS
Las Pruebas Paramtricas o Pruebas de Distribucin Libre se basan en pruebas estadsticas
que no toman en cuenta ninguna suposicin en cuanto a la distribucin donde se obtuvieron
los datos. Estas no estn sometidas a requisitos que son comunes en las pruebas
paramtricas, dichos requisitos se refieren a la distribucin de las variables en la poblacin.
Para diferenciar las pruebas paramtricas de las pruebas no paramtricas existen parmetros
agrupados en sus datos que permiten establecer el tipo de prueba.
Caractersticas de las pruebas paramtricas
Permiten contrastar hiptesis referidas a algn parmetro (, 2, , , etc.).
Analizan datos obtenidos con una escala de medida de intervalo o razn.
Exigen determinados supuestos sobre las poblaciones originales de las que se
extraen los datos.
Cada una de las pruebas no paramtricas es aplicable a diferentes tipos de muestras
utilizando el criterio de que los supuestos de las muestras no sean exigentes sobre las
poblaciones originales.
1. Pruebas para una muestra: Chi-Cuadrado, Rachas y Kolmogorov-Smirnov.
2. Pruebas para dos muestras independientes: Mann.Whitney, Kolmogorov.Smirnov
3. Prueba para varias muestras independientes: Kruskal-Wallis
4. Prueba para dos pruebas relacionadas: Wilcoxon, Signos y McNemar.
5. Prueba para varias muestras relacionadas: Friedman
Caractersticas de las pruebas no paramtricas
No exigen el cumplimiento de supuestos sobre las poblaciones de donde se extraen las muestras.
No trabajan con datos obtenidos con una escala de medida de intervalo o razn.
El tamao de muestra requerido es menor (20 o <).
Pruebas no Paramtricas:
Pruebas no
Parmetrica
AndersonDarling
Chi-Cuadrado
Friedman
Fisher
KolmogorovSmirnov
PROCEDIMIENTO GENERAL
Shapiro-Wilks
PRUEBA DE HIPOTESIS
INTRODUCCION
Una Prueba de Hiptesis es una metodologa o procedimiento que se utiliza para medir la
probabilidad de error que se tendr cuando se hace una afirmacin sobre la poblacin bajo
estudio. La Prueba de Hiptesis permite analizar si los datos favorecen o no a alguna de las
hiptesis acerca de la poblacin estudiada. Durante la prueba de hiptesis se producen
nmeros entre los valores de 0 y 1 que miden el grado de certeza que puede tener la validez
de una hiptesis con respecto a una proporcin de la poblacin. Los procedimientos de la
Prueba de Hiptesis conducen a una decisin y las mismas dependen del empleo de la
informacin contenida en la muestra aleatoria de la poblacin de inters.
Objetivos de la prueba de hiptesis
QU ES UNA HIPTESIS?
Una Hiptesis es una afirmacin acerca de una poblacin. En los anlisis estadsticos se
hace una hiptesis estadstica para alcanzar una decisin o un propsito a partir de datos
que se extraen de una poblacin para comprobar si la hiptesis puede ser o no cierta. En
general es un enunciado acerca de las distribuciones de probabilidad de las poblaciones.
La Hiptesis Estadstica es un enunciado temporal con respecto a una situacin del mundo
real, generalmente se expresa a travs de las variables en estudio y que pueden contrastarse
con datos tomados de la realidad.
HIPOTESIS: Es una afirmacin acerca de un parmetro de una poblacin sujeto a verificacin.
Figura # 3: Definicin de Hiptesis
Fuente: (Lind, Marchal, & Wathen, 2008)
HIPOTESIS NULA
La Hiptesis Nula (denotada H0) es la afirmacin del valor del parmetro de una poblacin.
Dentro de la hiptesis se prueba de manera directa, si la hiptesis es verdadera y se llega a
una conclusin para rechazar o no rechazar H0, dependiendo del resultado de la prueba
realizada adems de contribuir a determinar las diferencias entre los grupos sometidos a
prueba y si son significativas.
Las conclusiones de la Prueba de Hiptesis Nula es si rechazamos la Hiptesis Nula se
concluye que existe suficiente evidencia estadstica para inferir que la hiptesis nula es
falsa. Si no rechazamos la Hiptesis Nula se concluye que no existen suficientes evidencias
estadsticas para inferir que la hiptesis nula es falsa.
HIPOTESIS NULA: Es un enunciado acerca del valor del parmetro de una poblacin
desarrollado con el propsito de hacer evidencias basadas en pruebas numricas.
HIPOTESIS ALTERNATIVA
Una Hiptesis Alternativa (denotada H1) describe las conclusiones las cuales hacen que la
hiptesis nula se rechace. La hiptesis alternativa es aceptada si los datos provenientes
Esta hiptesis se establece en base a la evidencia que se tiene.
TIPOS DE ERROR
Los Tipos de Error en trmino de Prueba de Hiptesis, cuando una hiptesis se rechaza
cuando debera ser aceptada.
ERROR TIPO I
El Error Tipo I es el que se comete al rechazar la hiptesis nula, H0, cuando sta es cierta.
= P [Error Tipo I] = P [Rechazar H0 / H0 es verdadera]
ERROR TIPO II
El Error Tipo II es el que se comete al no rechazar la hiptesis nula, H0, cuando sta es
falsa.
= P [Error Tipo II] = P [No Rechazar H0 / H0 es falsa]
ERROR TIPO II: Aceptando la hiptesis nula cuando es falsa.
Figura # 9: Definicin de Error Tipo II
Fuente: (Lind, Marchal, & Wathen, 2008)
Hiptesis Nula
H0
es verdadera
H0
es falsa
Investigacin
No se Rechaza
Se Rechaza
Ho
Ho
Decisin Correcta
Error Tipo I
Error Tipo II
Decisin Correcta
PRUEBA NO PARAMETRICAS
Una Prueba de no Paramtricas como Anderson-Daling, Chi Cuadrado y KolmogorovSmirnov son pruebas que ayudan a determinar el tipo de datos y que distribucin de
probabilidad se ajustan. Este tipo de pruebas requieren de una poblacin en estudio y de
supuestos.
Las Pruebas no Paramtricas se usan cuando los supuestos requeridos no se cumplen como
en las pruebas paramtricas, cuando es necesario usar una muestra pequea y cuando los
datos necesitan convertirse en informacin til para la toma de decisiones.
Chi-Cuadrado (X2)
Binomial
Poisson
PRUEBA DE ANDERSON-DARLING
Kolmogorov-Smirnov
Normal
Gamma
Exponencial
Weibull
probabilidad.
6. Calcular la probabilidad esperada acumulada para cada nmero Yi PEA(Yi) y la
probabilidad esperada acumulada para cada nmero Yn+1-i PEA (Yn+1-i ), a partir de la
7.
ln PEA ( Y i ) + ln
( 2i 1 )
n
A N = n+
n i=1
Ecuacin # 1: Frmula de Anderson-Darling
i Oi
E
x 0=
i=1
Generacin de nmeros aleatorios (3), la cual arrojara una nueva ventana la cual se debe
llenar as:
Al darle aceptar a estos pasos nos arrojara en la columna seleccionada 100 valores que se
distribuye normalmente pero lo que queremos comprobar que a pesar de que tomamos estos
valores normalmente comprobaremos por Chi-Cuadrado que no hay evidencia suficiente
para que se distribuya uniformemente as:
Se contina hallando los datos de la estadstica descriptiva para luego confeccionar la tabla
de frecuencias pero antes se brinda la funcin de cada uno:
Funcin
MEDIA
DESVIACIN
MININO
MAXIMO
RANGO
Implementacin
Es la suma de los valores de los elementos dividida por
la cantidad de stos. Se puede obtener la media en Excel
mediante la funcin =Promedio(rango de datos).
Por ejemplo, =PROMEDIO(B14:B113).
Mide el grado de dispersin o variabilidad de un
conjunto de datos respecto a s distribucin. Se puede
obtener la desviacin en Excel mediante la funcin
=DESVEST(rango
de
datos).
Por
ejemplo,
=DESVEST(B14:B113).
Es el valor mnimo del conjunto de b datos. Se puede
obtener la desviacin en Excel mediante la funcin
=MIN(rango de datos). Por ejemplo, =MIN(B14:B113).
Es el valor mximo del conjunto de datos. Se puede
obtener la desviacin en Excel mediante la funcin
=MAX(rango
de
datos).
Por
ejemplo,
=MAX(B14:B113).
Como se de saber el rango es la diferencia que hay entre
mi valor mximo y mnimo, se procede en Excel a
colocar en una celda vaca el smbolo igual tomar la
casilla del valor mximo y restarlo con la celda. Por
ejemplo, =F16-F15.
Es la cantidad de datos aleatorios tomado para el estudio
NUMERO DE DATOS
STURGE( # DE INTERVALO)
RAIZ N ( # DE INTERVALO)
TAMAO DE INTERVALO
Quedando as en Excel:
superior va ser la sumatoria del minino hallado ms el tamao del intervalo, luego se
procede al segundo intervalo donde el lmite inferior va ser el superior del primer intervalo
y el lmite superior para el segundo intervalo va ser el lmite inferior ms el tamao del
intervalo y as sucesivamente hasta llegar al nmero mximo hallado anteriormente. En
Excel en la columna de lmite inferior para el primer intervalo se fija la columna del
mnimo y el superior se suma ese mnimo y se fija el tamao del intervalo.
Luego se debe hallar la frecuencia esperada que se halla de esta manera para los 10
intervalos sern frecuencia de 10 para cada intervalo se espera que se distribuyan de
uniformemente para cada intervalo, ya que la frecuencia esperada se puede calcular sin
estimar ningn parmetro a partir de la muestra.
Ahora se dispone hallar el Chi2 por cada intervalo y se procede a sumar todos esto que nos
dar el estadstico de prueba, Lo que se hace al aplicar la frmula de chi cuadrada es restar
al nmero de frecuencias observadas, el nmero de frecuencias esperadas; elevar esta
diferencia al cuadrado, lo que hace que todos los valores asuman un valor positivo, y luego
se divide el cuadrado obtenido entre el las frecuencias esperadas. Esto se hace de manera
independiente para cada una delos intervalos. Una vez terminado este paso, se suman los
resultados obtenidos en cada intervalo y ese valor resultante de la suma es el valor del
estadstico de prueba, en Excel se realiza as:
Chi-cuadrado = 58.2. Pero tambin se puede realizar de manera directa con la funcin
=PRUEBA.CHI.INV(M36,L38), en donde M36 es la probabilidad de Chi cuadrada y L38
es el Grado de libertad [que es (# de columnas menos 1) multiplicado por (# de filas
menos 1)].
Entonces para comprobar la hiptesis se debe encontrar la Chi cuadrada inversa o valor
crtico y para ello se utiliza la funcin =PRUEBA.CHI.INV(L39,L38), en donde L39 es
nivel de significancia =0.05 y grado de libertad v=9.
Decisin: La hiptesis debe rechazarse si el valor de Chi cuadrado es mayor al valor crtico
o Chi inverso. Por lo tanto, por ser 58.2 > 16.9 entonces no hay evidencia suficiente para
decir que los datos observados se ajustan al modelo uniforme.
c=mx
,,m
Paso #2: Llenamos las casillas con los datos que nos solicitan. Se analizara una sola
variable. Generando cien datos aleatorios, con una distribucin normal. Los valores son
cercanos a la media. Y con una desviacin estndar de 0.35.
Paso #3: A continuacin se observa los nmeros aleatorios generados. Calculamos algunos
datos que nos ayudaran ms adelante a realizar nuestra prueba de ajuste de bondad de
Kolmogorov-Smirnov.
Clculo en Excel
= Promedio (A1:A100)
=Desvest(A1:A100)
=Min (A1:A100)
=Max(A1:A100)
=C4-C3
=Contar(A1:A100)
= 1+1.33 * Ln(NUMERO DE DATOS)
= RCUA(NUMERO DE DATOS)
= D5/D8
Paso #5: Con los datos anteriores se puede realizar la tabla de frecuencias.
1. Limites inferiores y superiores: El primer lmite inferior seria el valor mnimo que
se calcul anteriormente. Los limites superiores seria la suma de lmite inferior ms
FRECUENCIA ESPERADA
ACUMULADA
VALOR ABSOLUTO PARA
CALCULAR EL
ESTADISTICO K-S
Clculo en Excel
= DISTR.NORM (LIM.SUPE, $MEDIA$,
$DESVIACION$, VERDADERO
=ABS(FOR ACUM FER ACUM)
observa que cuando los datos son mayor de 30 se utiliza una frmula para encontrar
el estadstico.
Paso #7: Seleccionamos los datos de Frecuencia observada y los graficamos. Le agregamos
la lnea de tendencia ajustndose a la forma de las barras, en este caso la que ms se adecuo
fue la polinomica.
FRECUENCIA OBSERVADA
25
20
15
10
5
0
Polynomial ()
Linear ()
10
Conclusiones
Con la Simulacin Logstica podemos testar, y comunicar ms efectivamente, nuestras
propuestas y valorar las diferentes alternativas y su impacto de mejora previo al
lanzamiento de las mismas. Esta solucin supone un ahorro de tiempo y riesgo pues nos
anticipa cmo se van a comportar los sistemas antes de efectuar una inversin de capital.
Para la determinacin del tipo de distribucin de un conjunto de datos se utilizan dos tipos
de estadsticas o prueba inferenciales: las pruebas paramtricas y las no paramtricas.
Ambas pruebas inferenciales analizan o estudian datos de una poblacin tomado de manera
aleatorias, a diferencia que una se ajusta a criterios y la otra no como su nombre lo dicen.
Recomendaciones
La Estadstica es una ciencia que utiliza mtodos cientficos en la toma, organizacin,
recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones,
como para tomar decisiones razonables de acuerdo con tales anlisis.
Esta se divide en estadstica descriptiva e inferencial, en donde la inferencia a su vez se
divide en paramtrica y no paramtricas.
Cada una de las pruebas que utilizamos para determinar la distribucin de datos son: la
Prueba de Anderson-Darling, la cual que se utiliza para ajustar datos. La Prueba de ChiCuadrado, se utiliza para el anlisis de varias variables. Prueba de Kolmogorov-Smirvov
(K-S), la cual tambin es utilizada para ajustar los datos o muestras obtenidos.
BIBLIOGRAFIA
DeCoursey, W. J. (2003). Statistics and Probability for Engineering Applications (1 ed.).
United States of America: Newnes.
Garca Dunna, E., Garca Reyes, H., & Crdenas Barrn, L. E. (2013). Simulacin y
anlisis de sistemas con ProModel (2 ed.). Mxico: Pearson.
Gmez Gmez, M., Danglot Banck, C., & Vega Franco, L. (2003). Sinopsis de pruebas
estadsticas no paramtricas. Cundo usarlas. Revista Mexicana de Pediatra,
70(2), 10.
Johnson, R. A., Miller, I., & Freund, J. (2011). Probability and Statistics for Engineers (8
ed.). New York: Pearson.
Kelton, W. D., Sadowski, R. P., & Sturrock, D. T. (2004). Simulation with Arena (3 ed.).
New York: McGraw-Hill.
Lind, D. A., Marchal, W. G., & Wathen, S. A. (2008). Statistical Techniques in Business
and Economics (3 ed.). New York, United States of America: McGraw-Hill.
Nolberto Sifuentes, V. A., & Ponce Aruneri, M. E. (2008). Universidad Nacional Mayor de
San Marcos. Retrieved abril 9, 2015, from http://epg.unmsm.edu.pe/
Soong, T. T. (2004). Fundamentals of Probability and Statistics for Engineers (1 ed.).
West Sussex: John Wiley & Sons.
Spiegel, M. R. (1970). Estadstica. Mxico: McGraw-Hill.
Triola, M. F. (2009). Estadstica (10 ed.). Mxico: Pearson.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2011). Probability & Statistics for
Engineers & Scientists (9 ed.). United States of America: Pearson.
Zapata, C. J. (2010, 1). Universidade Estadual Paulista . Retrieved abril 10, 2015, from
www.feis.unesp.br
Anexo
NUMERACION
DATOS
ORDENAR DATOS
MEDIA
=PROMEDIO (C2:C21)
Colocar esta frmula en la celda C23 para ser especficos en las instrucciones.
DESVIACIN ESTANDAR
=DESVEST(C2:C21).
Colocar esta frmula en la celda C24 para ser especficos en las instrucciones.
ESTANDARIZAR VARIABLES
En la celda D2, utilizar esta frmula de estandarizacin para estandarizar las variables
X ' i=
X i X
S
Ingresando
= (C1-C$23$)/C$24$
PROBABILIDAD
Ya que este es el valor real de la probabilidad. Arrastrar frmula hasta la celda F21.
ORDENAR DATOS
A n=n
1
(2i1) [ lnF ( Y i ) +(1lnF ( Y ni+1 ) )]
n i=1
A 2n
Se verifica con esta tabla en el segundo rengln porque es para la prueba normal, en el que
se utiliza una media y una desviacin estndar. Casi siempre se trabaja con un porcentaje de
error del 5%, sea 0.05 as que el valor estadstico para esta prueba sera 0.75.
Al resultar 0.204 este valor es menor de 0.75
http://indeoperaciones.blogspot.com/p/simulacion.html