Sie sind auf Seite 1von 46

UNIVERSIDAD TECNOLOGICA DE PANAMA

FACULTAD DE INGENIERIA INDUSTRIAL


LICENCIATURA EN LOGISTICA Y TRANSPORTE MULTIMODAL
SIMULACION APLICADA A LA LOGISTICA

DETERMINACION DEL TIPO DE


DISTRIBUCIN DE UN CONJUNTO DE DATOS

PROFESOR
TORRES, PRAXEDES

GRUPO N5
12L-141

INTEGRANTES
ACEVEDO, YINELIS
4-771-1973
AYALA, KATHERINE
4-759-364
ESTRADA, BIDELKA
8-884-1387
LIAO, ROSA
8-880-2347
PEREZ, ELYDENIS
8-824-16
VEGA, JUAN
8-848-1098

FECHA DE ENTREGA
MIERCOLES, 15 DE ABRIL DE 2015

I SEMESTRE

I have always thirsted for knowledge, I have always been full of questions.
Hermann Hesse

ndice General
Resumen.
Simbologa....
..
ndice

de

3
4

Ecuaciones. 5

..
ndice de Figuras...
Introduccin....
Determinacin del tipo de distribucin de un conjunto de datos...
Introduccin
Estadstica no Paramtrica..
Pruebas no Paramtricas.
Prueba de Hiptesis
Introduccin
Hiptesis Nula
Hiptesis Alternativa..
Tipos de Error.
Pruebas no Paramtricas.
Prueba de Anderson-Darling..
Prueba de Chi-Cuadrado o Ji-Cuadrado.
Prueba de Kolmogorov-Smirnov
Conclusiones..

5
6
7
7
8
8
11
11
12
13
13
15
16
18
29
35

.
Recomendaciones... 36
Bibliografa. 37
Anexo. 38

Resumen
La Estadstica es una ciencia que utiliza mtodos cientficos en la toma, organizacin,
recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones,
como para tomar decisiones razonables de acuerdo con tales anlisis.
Esta se divide en estadstica descriptiva e inferencial, en donde la inferencia a su vez se
divide en paramtrica y no paramtricas.
Cada una de las pruebas que utilizamos para determinar la distribucin de datos son: la
Prueba de Anderson-Darling, la cual que se utiliza para ajustar datos. La Prueba de ChiCuadrado, se utiliza para el anlisis de varias variables. Prueba de Kolmogorov-Smirvov
(K-S), la cual tambin es utilizada para ajustar los datos o muestras obtenidos.

Simbologa

Nivel de Significancia

Grado de Libertad

Valor p

Fo

Frecuencia Observada

Fe

Frecuencia Esperada

H0

Hiptesis Nula

H1

Hiptesis Alternativa

ndice de Ecuaciones
Ecuacin # 1: Frmula de Anderson-Darling.........................................................................1
Ecuacin # 2 Frmula de Chi-Cuadrado o Ji-Cuadrado (X2).................................................1
Ecuacin # 3: Frmula de Kolmogorov-Smirnov...................................................................1

ndice de Figuras
Figura # 1: Ejemplo de Pruebas no Paramtricas...................................................................1
Figura # 2: Proceso de Determinacin del Tipo de Distribucin de un Conjunto de Datos...1
Figura # 3: Definicin de Hiptesis........................................................................................1
Figura # 4: Definicin de Prueba de Hiptesis.......................................................................1
Figura # 5: Pasos para una Prueba de Hiptesis.....................................................................1
Figura # 6: Definicin de una Hiptesis Nula.........................................................................1
Figura # 7: Definicin de una Hiptesis Alternativa...............................................................1
Figura # 8: Definicin de Error Tipo I....................................................................................1
Figura # 9: Definicin de Error Tipo II...................................................................................1
Figura # 10: Distribuciones Simtricas...................................................................................1
Figura # 11: Estadsticos de pruebas y valores crticos para la prueba de Anderson-Darling 1
Figura # 12: Aplicaciones de la Prueba de Chi-Cuadrado o Ji-Cuadrado (X2).......................1

Introduccin

La estadstica no paramtrica es una rama de la estadstica que estudia las diferentes


pruebas y modelos estadsticos que no se ajustan a un criterio establecido o a un parmetro
especifico. Estos mtodos se utilizan ms que nada, cuando los datos no se pueden ajustar a
una distribucin conocida.
Dentro del campo de la simulacin estas pruebas son de vital importancia pues sus
tendencia aleatoria provee gran cantidad de informacin con la cual se pueden crear
modelos de simulacin para todo tipo de escenarios, buscar si es factible su realizacin y
aplicarlos en la realidad para resolver problemas, enfrentar situaciones y preparar a las
personas para que tengan una idea y puedan tomar decisiones de forma eficiente y efectiva.

DETERMINACIN DEL TIPO DE DISTRIBUCIN DE UN

CONJUNTO DE DATOS
INTRODUCCIN
La Estadstica es una ciencia que utiliza mtodos cientficos en la toma, organizacin,
recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones,
como para tomar decisiones razonables de acuerdo con tales anlisis (Spiegel, 1970). Es un

conjunto de mtodos para planear estudios y experimentos, obtener datos y luego organizar,
resumir, presentar, analizar, interpretar y llegar a conclusiones basadas en los datos (Triola,
2009).
El trmino Estadstica se utiliza para denotar los mismos datos o nmeros que se derivan de
ellos. La Estadstica se divide en dos reas:
Estadstica Descriptiva: Se dedica a organizar, describir, analizar y presentar datos de
manera informativa sin sacar condiciones o inferencias de un grupo mayor.
Estadstica Inferencial: Utiliza mtodos para estimar las propiedades de una poblacin
basndose en muestras.
La Estadstica Inferencial es la rama de la estadstica que estudia el comportamiento y
propiedades de las muestras y la posibilidad, y limites, de la generalizacin de los
resultados obtenidos a partir de aquellas a las poblaciones que representan (Nolberto
Sifuentes & Ponce Aruneri, 2008). Dentro de la estadstica Inferencial se realizan estudios
basados en probabilidad para someter a prueba las diferentes muestras de poblaciones.
La Estadstica Inferencial se divide en dos subcategoras:
Estadstica Paramtrica: Realizan anlisis o estudios de muestras aleatorias extradas de una
poblacin en la cual sus datos estn distribuidos normalmente y contienen parmetros
mediables.
Estadstica no Paramtrica: Se encarga del anlisis y estudio de pruebas y modelos
estadsticos en los cuales su distribucin no se ajusta a ningn criterio paramtrico.

ESTADISTICA NO PARAMETRICA
La Estadstica no Paramtrica es una subcategora de la estadstica inferencial que se
encarga del anlisis y estudio de datos que no se ajustan a ningn criterio paramtrico. Las
tcnicas o mtodos no paramtricos trabajan bajo supuestos generales en base a la
distribucin que siguen los datos sin utilizar el supuesto de normalidad de una muestra o
poblacin.
Ventajas de la estadstica
no paramtrica

Desventajas de la estadstica
no paramtrica

Con n pequea (n<30) puede no haber


alternativa
No se requiere conocer la distribucin de la
poblacin

Con n muy pequea (n<6) es inconsistente


Con n grande es menor eficiente que la
estadstica paramtrica

PRUEBAS NO PARAMETRICAS
Las Pruebas Paramtricas o Pruebas de Distribucin Libre se basan en pruebas estadsticas
que no toman en cuenta ninguna suposicin en cuanto a la distribucin donde se obtuvieron
los datos. Estas no estn sometidas a requisitos que son comunes en las pruebas
paramtricas, dichos requisitos se refieren a la distribucin de las variables en la poblacin.
Para diferenciar las pruebas paramtricas de las pruebas no paramtricas existen parmetros
agrupados en sus datos que permiten establecer el tipo de prueba.
Caractersticas de las pruebas paramtricas
Permiten contrastar hiptesis referidas a algn parmetro (, 2, , , etc.).
Analizan datos obtenidos con una escala de medida de intervalo o razn.
Exigen determinados supuestos sobre las poblaciones originales de las que se
extraen los datos.
Cada una de las pruebas no paramtricas es aplicable a diferentes tipos de muestras
utilizando el criterio de que los supuestos de las muestras no sean exigentes sobre las
poblaciones originales.
1. Pruebas para una muestra: Chi-Cuadrado, Rachas y Kolmogorov-Smirnov.
2. Pruebas para dos muestras independientes: Mann.Whitney, Kolmogorov.Smirnov
3. Prueba para varias muestras independientes: Kruskal-Wallis
4. Prueba para dos pruebas relacionadas: Wilcoxon, Signos y McNemar.
5. Prueba para varias muestras relacionadas: Friedman
Caractersticas de las pruebas no paramtricas

No exigen el cumplimiento de supuestos sobre las poblaciones de donde se extraen las muestras.
No trabajan con datos obtenidos con una escala de medida de intervalo o razn.
El tamao de muestra requerido es menor (20 o <).

Pruebas no Paramtricas:

Pruebas no
Parmetrica

AndersonDarling

Chi-Cuadrado

Friedman

Fisher

KolmogorovSmirnov

Figura # 1: Ejemplo de Pruebas no Paramtricas

PROCEDIMIENTO GENERAL

Shapiro-Wilks

Figura # 2: Proceso de Determinacin del Tipo de Distribucin de un Conjunto de Datos


Fuente: Anlisis Probabilstico y Simulacin

PRUEBA DE HIPOTESIS
INTRODUCCION

Una Prueba de Hiptesis es una metodologa o procedimiento que se utiliza para medir la
probabilidad de error que se tendr cuando se hace una afirmacin sobre la poblacin bajo
estudio. La Prueba de Hiptesis permite analizar si los datos favorecen o no a alguna de las
hiptesis acerca de la poblacin estudiada. Durante la prueba de hiptesis se producen
nmeros entre los valores de 0 y 1 que miden el grado de certeza que puede tener la validez
de una hiptesis con respecto a una proporcin de la poblacin. Los procedimientos de la
Prueba de Hiptesis conducen a una decisin y las mismas dependen del empleo de la
informacin contenida en la muestra aleatoria de la poblacin de inters.
Objetivos de la prueba de hiptesis

Identificar la hiptesis nula o hiptesis alternativa.


Calcular el valor del estadstico de prueba.
Mediante el nivel de significancia, identificar el valor o los valores crticos.
Dado un valor del estadstico de prueba, identificar el valor p.
Plantear una conclusin sobre prueba de hiptesis.
Verificar la hiptesis de la teora o modelo que se relaciona con el proceso estudiado.

QU ES UNA HIPTESIS?
Una Hiptesis es una afirmacin acerca de una poblacin. En los anlisis estadsticos se
hace una hiptesis estadstica para alcanzar una decisin o un propsito a partir de datos
que se extraen de una poblacin para comprobar si la hiptesis puede ser o no cierta. En
general es un enunciado acerca de las distribuciones de probabilidad de las poblaciones.
La Hiptesis Estadstica es un enunciado temporal con respecto a una situacin del mundo
real, generalmente se expresa a travs de las variables en estudio y que pueden contrastarse
con datos tomados de la realidad.
HIPOTESIS: Es una afirmacin acerca de un parmetro de una poblacin sujeto a verificacin.
Figura # 3: Definicin de Hiptesis
Fuente: (Lind, Marchal, & Wathen, 2008)

QU ES UNA PRUEBA DE HIPTESIS?


El termino Prueba de Hiptesis e Hiptesis de Prueba se utilizan de ambas formas. La
Prueba de Hiptesis inicia con una afirmacin o suposicin acerca de un parmetro de una

poblacin. La misma es un procedimiento en el cual a partir de una muestra aleatoria y


significativa, extraer conclusiones las cuales pueden ser aceptar o rechazar una hiptesis
basada en el valor de un parmetro desconocido de una poblacin.

PRUEBA DE HIPOTESIS: Es un proceso basado en evidencia simple y teora de probabilidad


para determinar si la hiptesis es una afirmacin razonable.
Figura # 4: Definicin de Prueba de Hiptesis
Fuente: (Lind, Marchal, & Wathen, 2008)

PASOS PARA UNA PRUEBA DE HIPTESIS


Existen un procedimiento de cinco pasos para sistematizar una Prueba de Hiptesis, cuando
el procedimiento ha completado los cinco pasos, se puede rechazar o no la hiptesis. En la
Prueba de Hiptesis las herramientas estadsticas y modelos tericos brindan facilidad para
seguir la siguiente secuencia:

Figura # 5: Pasos para una Prueba de Hiptesis


Fuente: (Lind, Marchal, & Wathen, 2008)

HIPOTESIS NULA
La Hiptesis Nula (denotada H0) es la afirmacin del valor del parmetro de una poblacin.
Dentro de la hiptesis se prueba de manera directa, si la hiptesis es verdadera y se llega a
una conclusin para rechazar o no rechazar H0, dependiendo del resultado de la prueba
realizada adems de contribuir a determinar las diferencias entre los grupos sometidos a
prueba y si son significativas.
Las conclusiones de la Prueba de Hiptesis Nula es si rechazamos la Hiptesis Nula se
concluye que existe suficiente evidencia estadstica para inferir que la hiptesis nula es
falsa. Si no rechazamos la Hiptesis Nula se concluye que no existen suficientes evidencias
estadsticas para inferir que la hiptesis nula es falsa.

HIPOTESIS NULA: Es un enunciado acerca del valor del parmetro de una poblacin
desarrollado con el propsito de hacer evidencias basadas en pruebas numricas.

Figura # 6: Definicin de una Hiptesis Nula


Fuente: (Lind, Marchal, & Wathen, 2008)

HIPOTESIS ALTERNATIVA
Una Hiptesis Alternativa (denotada H1) describe las conclusiones las cuales hacen que la
hiptesis nula se rechace. La hiptesis alternativa es aceptada si los datos provenientes
Esta hiptesis se establece en base a la evidencia que se tiene.

HIPOTESIS ALTERNATIVA: Es un enunciado acerca del valor del parmetro de una


poblacin desarrollado con el propsito de hacer evidencias basadas en pruebas numricas.
Figura # 7: Definicin de una Hiptesis Alternativa
Fuente: (Lind, Marchal, & Wathen, 2008)

TIPOS DE ERROR
Los Tipos de Error en trmino de Prueba de Hiptesis, cuando una hiptesis se rechaza
cuando debera ser aceptada.

ERROR TIPO I
El Error Tipo I es el que se comete al rechazar la hiptesis nula, H0, cuando sta es cierta.
= P [Error Tipo I] = P [Rechazar H0 / H0 es verdadera]

ERROR TIPO I: Rechazando la hiptesis nula, H0, cuando esta es verdadera.


Figura # 8: Definicin de Error Tipo I
Fuente: (Lind, Marchal, & Wathen, 2008)

ERROR TIPO II
El Error Tipo II es el que se comete al no rechazar la hiptesis nula, H0, cuando sta es
falsa.
= P [Error Tipo II] = P [No Rechazar H0 / H0 es falsa]
ERROR TIPO II: Aceptando la hiptesis nula cuando es falsa.
Figura # 9: Definicin de Error Tipo II
Fuente: (Lind, Marchal, & Wathen, 2008)

Hiptesis Nula
H0
es verdadera
H0
es falsa

Investigacin
No se Rechaza
Se Rechaza
Ho
Ho
Decisin Correcta
Error Tipo I
Error Tipo II

Decisin Correcta

Fuente: (Lind, Marchal, & Wathen, 2008)

PRUEBA NO PARAMETRICAS

Una Prueba de no Paramtricas como Anderson-Daling, Chi Cuadrado y KolmogorovSmirnov son pruebas que ayudan a determinar el tipo de datos y que distribucin de
probabilidad se ajustan. Este tipo de pruebas requieren de una poblacin en estudio y de
supuestos.
Las Pruebas no Paramtricas se usan cuando los supuestos requeridos no se cumplen como
en las pruebas paramtricas, cuando es necesario usar una muestra pequea y cuando los
datos necesitan convertirse en informacin til para la toma de decisiones.

Distribuciones entre las pruebas no paramtricas


Anderson-Darling
Normal
Uniforme
Lognormal
Exponencial
Weibull
Valor Extremo Tipo I

Chi-Cuadrado (X2)
Binomial
Poisson

Figura # 10: Distribuciones Simtricas

PRUEBA DE ANDERSON-DARLING

Kolmogorov-Smirnov
Normal
Gamma
Exponencial
Weibull

La Prueba de Anderson-Darling se utiliza con un tamao muestra bajo de (n<25), las


muestras muy grandes pueden ser rechazada. La prueba utiliza datos extrados de una
poblacin con una distribucin especfica. Esta prueba usa distribuciones especficas para
calcular los valores crticos. Es una modificacin de la Prueba de Kolmogorov-Smirnov. La
prueba de Kolmogorov-Smirnov trabaja con una distribucin libre en el sentido de que los
valores crticos no dependen de una distribucin especfica.
Procedimiento general de la prueba:
1.
2.
3.
4.
5.

Obtener n datos de la variable aleatoria a analizar.


Calcular la media y la varianza de los datos.
Organizar los datos en forma ascendente: Y1 i=1,2,,n
Ordenar los datos en forma descendente: Yn+1-i i=1,2,,n
Establecer de manera explcita la hiptesis nula, al proponer una distribucin de

probabilidad.
6. Calcular la probabilidad esperada acumulada para cada nmero Yi PEA(Yi) y la
probabilidad esperada acumulada para cada nmero Yn+1-i PEA (Yn+1-i ), a partir de la
7.

funcin de probabilidad propuesta.


Calcular el estadstico de prueba

ln PEA ( Y i ) + ln

( 2i 1 )
n

A N = n+

n i=1
Ecuacin # 1: Frmula de Anderson-Darling

8. Ajustar el estadstico de prueba de acuerdo con la distribucin de probabilidad


propuesta.
9. Definir el nivel de significancia de la prueba , y determinar su valor crtico, a,n.
10. Comparar el estadstico de prueba con el valor crtico. Si el estadstico de prueba es
menor que el valor crtico no se puede rechazar la hiptesis nula.

Figura # 11: Estadsticos de pruebas y valores crticos para la prueba de Anderson-Darling

Caractersticas de la Prueba de Anderson-Darling

La distribucin tiene forma asimtrica positiva, y se acerca a la distribucin normal,


dependiendo como mayor sea el nmero de grados de libertad.
Los valores de no pueden tomar valores negativos.
Las muestras para el anlisis deben ser variables independientes
Se puede utilizar para uno y dos variables.

PRUEBA DE CHI-CUADRADO-JI CUADRADO (X2)


La Prueba Chi-Cuadrado o Ji-Cuadrado (X2) es el procedimiento para el contraste de una
prueba de hiptesis. Esta prueba estadstica se utiliza para el anlisis de varias variables.
La prueba permite conocer si la distribucin real de una variable se ajusta o no a una
determinada distribucin terica. El ajuste de bondad de esta prueba permite comprar las
frecuencias observadas con las esperadas, y corroborar que las variables realmente siguen
la distribucin terica propuesta en la hiptesis nula.
Procedimiento general de la Prueba de Chi-Cuadrado:
1. Obtener al menos 30 datos de la variable aleatoria a analizar.
2. Calcular la media y varianza de los datos.
3. Crear un histograma de m= n intervalos, y obtener la a observada en cada
intervalo Oi.
4. Establecer explcitamente la hiptesis nula, mediante una distribucin de
probabilidad que se ajusta a la forma del histograma.
5. Calcular la frecuencia esperada, Ei, a partir de la funcin de probabilidad propuesta.
6. Calcular el estadstico de prueba

i Oi
E

x 0=
i=1

Ecuacin # 2 Frmula de Chi-Cuadrado o Ji-Cuadrado (X2)

7. Definir el nivel de significancia de la prueba, , y determinar el valor crtico de la


prueba X2 (k es el nmero de parmetros estimados en la distribucin propuesta).
8. Comprar el estadstico de prueba con el valor crtico. Si el estadstico de prueba es
menor que el valor crtico no se puede rechazar la hiptesis nula.

Caractersticas de la Prueba de Chi-Cuadrado


La distribucin tiene forma asimtrica positiva, y se acerca a la distribucin normal,
dependiendo como mayor sea el nmero de grados de libertad.
Los valores de no pueden tomar valores negativos.
Las muestras para el anlisis deben ser variables independientes
Se puede utilizar para uno y dos variables.

Figura # 12: Aplicaciones de la Prueba de Chi-Cuadrado o Ji-Cuadrado (X2)

APLICACION DE LA PRUEBA DE CHI-CUADRADO O JICUADRADO (X2)


INSTRUCTIVO PARA RESOLUCION DEL PROBLEMA DE PRUEBA DE BONDAD
DE CHI CUADRADO EN EXCEL
ENUNCIADO DEL PROBLEMA: Un embotellador de refresco desea estar seguro de
que las botellas que usa tienen en promedio un valor que supera el mnimo de volumen
expresados en sus etiquetas de 350 m3 y si el proceso se distribuye uniformemente, para
esto se tomaron registro de 100 medidas aleatorias con un promedio de llenado de volumen
de 350 m3 y una desviacin de 0.35 con estos valores de deben hallar los datos necesarios
para utilizar el estadstico de prueba de hiptesis y la Prueba de Chi-Cuadrado.
Primero, se debe generar una serie de nmeros aleatorios y para ello se ubica en la pestaa
superior de Excel, llamada Datos (1), como se muestra en la imagen y selecciona la
herramienta Anlisis de datos (2), y del despliegue de opciones que este nos brinda se toma

Generacin de nmeros aleatorios (3), la cual arrojara una nueva ventana la cual se debe
llenar as:

Y al aceptar seguido de otro cuadro as:

Al darle aceptar a estos pasos nos arrojara en la columna seleccionada 100 valores que se
distribuye normalmente pero lo que queremos comprobar que a pesar de que tomamos estos
valores normalmente comprobaremos por Chi-Cuadrado que no hay evidencia suficiente
para que se distribuya uniformemente as:

Se contina hallando los datos de la estadstica descriptiva para luego confeccionar la tabla
de frecuencias pero antes se brinda la funcin de cada uno:

Funcin
MEDIA

DESVIACIN

MININO

MAXIMO

RANGO

Implementacin
Es la suma de los valores de los elementos dividida por
la cantidad de stos. Se puede obtener la media en Excel
mediante la funcin =Promedio(rango de datos).
Por ejemplo, =PROMEDIO(B14:B113).
Mide el grado de dispersin o variabilidad de un
conjunto de datos respecto a s distribucin. Se puede
obtener la desviacin en Excel mediante la funcin
=DESVEST(rango
de
datos).
Por
ejemplo,
=DESVEST(B14:B113).
Es el valor mnimo del conjunto de b datos. Se puede
obtener la desviacin en Excel mediante la funcin
=MIN(rango de datos). Por ejemplo, =MIN(B14:B113).
Es el valor mximo del conjunto de datos. Se puede
obtener la desviacin en Excel mediante la funcin
=MAX(rango
de
datos).
Por
ejemplo,
=MAX(B14:B113).
Como se de saber el rango es la diferencia que hay entre
mi valor mximo y mnimo, se procede en Excel a
colocar en una celda vaca el smbolo igual tomar la
casilla del valor mximo y restarlo con la celda. Por
ejemplo, =F16-F15.
Es la cantidad de datos aleatorios tomado para el estudio

NUMERO DE DATOS

STURGE( # DE INTERVALO)

RAIZ N ( # DE INTERVALO)

TAMAO DE INTERVALO

Quedando as en Excel:

Y las frmulas se veran as:

de prueba de hiptesis, es decir, en este caso 100. Pero


este valor tambin se puede hallar con la funcin Contar
la cual en una matriz que se le proporciona cuneta las
celdas que tiene nmeros.
Este proceso es utilizado para una cantidad de datos
menores de 100 y se basa en una formula matemtica
descrita en Excel as, = =1+1.33*LN(F18) donde F18 es
el nmero de datos.
Este proceso es utilizado para una cantidad de datos
menores de 100 y se basa en una formula matemtica
descrita en Excel as, = =1+1.33*LN(F18) donde F18 es
el nmero de datos.
Este se halla con la divisin del nmero de intervalos
entre el rango, con Excel introducimos el smbolo igual y
se realiza la divisin. Por ejemplo, = =F17/F20, donde
F20 es el nmero de intervalos hallado con la raz y F17
es el rango.

Tambin se puede obtener los mismos resultados mediante la herramienta de anlisis de


datos y seleccionando la opcin estadstica descriptiva.

Al presiona aceptar se despliega una ventana, en donde se selecciona el rango de datos a


estudiar y el resumen estadstico de la siguiente forma:

Se continua en hallar los limites inferiores y superiores de los 10 intervalos, aqu se


comienza con el primer intervalo donde el lmite inferior va ser el mnimo hallado y el

superior va ser la sumatoria del minino hallado ms el tamao del intervalo, luego se
procede al segundo intervalo donde el lmite inferior va ser el superior del primer intervalo
y el lmite superior para el segundo intervalo va ser el lmite inferior ms el tamao del
intervalo y as sucesivamente hasta llegar al nmero mximo hallado anteriormente. En
Excel en la columna de lmite inferior para el primer intervalo se fija la columna del
mnimo y el superior se suma ese mnimo y se fija el tamao del intervalo.

En la siguiente columna se halla la frecuencia que es el nmero de veces que se puede


repetir un nmero. Primero se selecciona la columna donde se van a introducir la frecuencia
observada (F.O). En Excel se tiene una funcin llamada Frecuencia la cual abarca dos
campos uno de ellos datos, que son todos los datos aleatorios en este ejercicio los 100 datos
y el segundo campo es, grupos que es la columna del lmite superior y por ltimo se
presiona Ctrl + Shift + Enter al mismo tiempo y as arrojar todas las frecuencias por cada
columna as por ejemplo:

Seguidamente se halla la frecuencia relativa as se divide la frecuencia observado entre la


cantidad de nmeros aleatorios recolectados en Excel as:

Posteriormente se halla la frecuencia acumulada, as el primer intervalo queda con el


mismo valor de mi frecuencia observada, el segundo intervalo suma el primer intervalo de
mi frecuencia acumulada ms el segundo de mi frecuencia observa, y as sucesivamente
hasta llegar al ltimo intervalo con un valor final de 100.

Luego se debe hallar la frecuencia esperada que se halla de esta manera para los 10
intervalos sern frecuencia de 10 para cada intervalo se espera que se distribuyan de
uniformemente para cada intervalo, ya que la frecuencia esperada se puede calcular sin
estimar ningn parmetro a partir de la muestra.

Ahora se dispone hallar el Chi2 por cada intervalo y se procede a sumar todos esto que nos
dar el estadstico de prueba, Lo que se hace al aplicar la frmula de chi cuadrada es restar
al nmero de frecuencias observadas, el nmero de frecuencias esperadas; elevar esta
diferencia al cuadrado, lo que hace que todos los valores asuman un valor positivo, y luego
se divide el cuadrado obtenido entre el las frecuencias esperadas. Esto se hace de manera

independiente para cada una delos intervalos. Una vez terminado este paso, se suman los
resultados obtenidos en cada intervalo y ese valor resultante de la suma es el valor del
estadstico de prueba, en Excel se realiza as:

Chi-cuadrado = 58.2. Pero tambin se puede realizar de manera directa con la funcin
=PRUEBA.CHI.INV(M36,L38), en donde M36 es la probabilidad de Chi cuadrada y L38
es el Grado de libertad [que es (# de columnas menos 1) multiplicado por (# de filas
menos 1)].

Entonces para comprobar la hiptesis se debe encontrar la Chi cuadrada inversa o valor
crtico y para ello se utiliza la funcin =PRUEBA.CHI.INV(L39,L38), en donde L39 es
nivel de significancia =0.05 y grado de libertad v=9.

Decisin: La hiptesis debe rechazarse si el valor de Chi cuadrado es mayor al valor crtico
o Chi inverso. Por lo tanto, por ser 58.2 > 16.9 entonces no hay evidencia suficiente para
decir que los datos observados se ajustan al modelo uniforme.

PRUEBA DE KOLMOGOROV-SMIRVOV (K-S)


Es procedimiento de la Prueba de Kolmogorov-Smirnov es una prueba alternativa para
probar que una muestra de una poblacin viene de una distribucin continua. La prueba
compara la funcin de frecuencia observada con la frecuencia esperada de la muestra.
Las diferencias observadas entre las frecuencias acumuladas es de menor tamao entonces
la hiptesis de acepta si al contrario las diferencias entre las frecuencias acumuladas son de
mayor tamao la hiptesis se rechaza.
Procedimiento general de la prueba:
1. Obtener al menos 30 datos de la variable aleatoria a analizar.
2. Calcular la media y la varianza de los datos
3. Crear un histograma de m= n intervalos, y obtener la frecuencia observada en
cada intervalo Oi.
4. Calcular la probabilidad observada en cada intervalo POi = Oi / n, esto es, dividir la
frecuencia observada Oi entre el nmero total de datos, n.
5. Acumular las probabilidades POi, para obtener la probabilidad observada hasta el isimo intervalo POA.

6. Establecer la manera explcita la hiptesis nula, para esto se propone una


distribucin de probabilidad que se ajuste a la forma del histograma.
7. Calcular la probabilidad esperada acumulada para cada intervalo, POAi, a
partir de la funcin de probabilidad propuesta.
8. Calcular el estadstico de prueba
i POA i
PEA

c=mx

,,m

Ecuacin # 3: Frmula de Kolmogorov-Smirnov

9. Definir el nivel de significancia de la prueba , y determinar el valor crtico de la


prueba, Da,n (consulte la tabla de valores crticos de la prueba de KolmogorovSmirnov en la seccin de apndices).
10. Comparar el estadstico de prueba con el valor crtico. Si el estadstico de prueba es
menor que el valor critico no se puede rechazar la hiptesis nula.

APLICACION DE LA PRUEBA DE KOLMOGOROV-SMIRNOV (K-S)


INSTRUCTIVO PARA RESOLUCION DEL PROBLEMA DE PRUEBA DE BONDAD
DE AJUSTE KOLMOGOROV - SMIRNOV EN EXCEL
ENUNCIADO DEL PROBLEMA: Se han simulado 100 observaciones de una mquina
de llenado de gaseosas, con una media de 100 y una desviacin estndar de 0.35.
Determinar si los datos siguen una distribucin normal de acuerdo a la prueba de bondad de
ajuste de Kolmogorov-Smirnov.
Paso #1: Generamos nmeros aleatorios, buscando la opcin Anlisis de datos.

Paso #2: Llenamos las casillas con los datos que nos solicitan. Se analizara una sola
variable. Generando cien datos aleatorios, con una distribucin normal. Los valores son
cercanos a la media. Y con una desviacin estndar de 0.35.

Paso #3: A continuacin se observa los nmeros aleatorios generados. Calculamos algunos
datos que nos ayudaran ms adelante a realizar nuestra prueba de ajuste de bondad de
Kolmogorov-Smirnov.

Paso #4: Generacin de frmulas a utilizarse


MEDIA
DESVIACION
VALOR MINIMO
VALOR MAXIMO
RANGO
NUMERO DE DATOS
NUMERO DE INTERVALOS
RAIZ DE N
TAMANO DEL INTERVALO

Clculo en Excel
= Promedio (A1:A100)
=Desvest(A1:A100)
=Min (A1:A100)
=Max(A1:A100)
=C4-C3
=Contar(A1:A100)
= 1+1.33 * Ln(NUMERO DE DATOS)
= RCUA(NUMERO DE DATOS)
= D5/D8

Paso #5: Con los datos anteriores se puede realizar la tabla de frecuencias.
1. Limites inferiores y superiores: El primer lmite inferior seria el valor mnimo que
se calcul anteriormente. Los limites superiores seria la suma de lmite inferior ms

el tamao de intervalo. Luego el segundo lmite inferior es el primer lmite superior


y as sucesivamente.
2. Frecuencia observada: Se seleccionaran las celdas donde irn las frecuencias
observadas se escribe =FRECUENCIA (muestras, lim superiores) y presione CTRL
+ SHIFT + ENTER.
3. Frecuencia relativa: Se divide cada frecuencia observada entre el total de la muestra
en nuestro caso es 100.
4. Frecuencias acumuladas: Se van sumando las frecuencias observadas.

FRECUENCIA ESPERADA
ACUMULADA
VALOR ABSOLUTO PARA
CALCULAR EL
ESTADISTICO K-S

Clculo en Excel
= DISTR.NORM (LIM.SUPE, $MEDIA$,
$DESVIACION$, VERDADERO
=ABS(FOR ACUM FER ACUM)

1. Estadstico K-S: Se obtiene al utilizar la funcin de Mximo aplicado en la columna


de valores absolutos (ABS: FOR ACUM FER ACUM)
2. Nivel de significancia: Siempre es 0.05 segn la teora estudiada.
3. Grados de libertad:
4. Estadstico obtenido por tabla: Se toma en cuenta el nmero de la muestra y el nivel
de significancia, en este caso el nivel de significancia es 0.05 y la muestra es de
100. Encontramos el valor de estadstico obtenido en la siguiente tabla, pero se

observa que cuando los datos son mayor de 30 se utiliza una frmula para encontrar
el estadstico.

Paso #6: La Prueba de Hiptesis la aceptamos o rechazamos la hiptesis comparando los


valores obtenidos de estadstico por tabla y estadstico de K-S. Si el estadstico por tabla es
mayor que el estadstico K-S, podemos aceptar la hiptesis, de lo contrario se rechaza.

Paso #7: Seleccionamos los datos de Frecuencia observada y los graficamos. Le agregamos
la lnea de tendencia ajustndose a la forma de las barras, en este caso la que ms se adecuo
fue la polinomica.

FRECUENCIA OBSERVADA
25
20
15
10
5
0

Polynomial ()
Linear ()

10

Conclusiones
Con la Simulacin Logstica podemos testar, y comunicar ms efectivamente, nuestras
propuestas y valorar las diferentes alternativas y su impacto de mejora previo al
lanzamiento de las mismas. Esta solucin supone un ahorro de tiempo y riesgo pues nos
anticipa cmo se van a comportar los sistemas antes de efectuar una inversin de capital.
Para la determinacin del tipo de distribucin de un conjunto de datos se utilizan dos tipos
de estadsticas o prueba inferenciales: las pruebas paramtricas y las no paramtricas.
Ambas pruebas inferenciales analizan o estudian datos de una poblacin tomado de manera
aleatorias, a diferencia que una se ajusta a criterios y la otra no como su nombre lo dicen.

Recomendaciones
La Estadstica es una ciencia que utiliza mtodos cientficos en la toma, organizacin,
recopilacin, presentacin y anlisis de datos, tanto para la deduccin de conclusiones,
como para tomar decisiones razonables de acuerdo con tales anlisis.
Esta se divide en estadstica descriptiva e inferencial, en donde la inferencia a su vez se
divide en paramtrica y no paramtricas.
Cada una de las pruebas que utilizamos para determinar la distribucin de datos son: la
Prueba de Anderson-Darling, la cual que se utiliza para ajustar datos. La Prueba de ChiCuadrado, se utiliza para el anlisis de varias variables. Prueba de Kolmogorov-Smirvov
(K-S), la cual tambin es utilizada para ajustar los datos o muestras obtenidos.

BIBLIOGRAFIA
DeCoursey, W. J. (2003). Statistics and Probability for Engineering Applications (1 ed.).
United States of America: Newnes.
Garca Dunna, E., Garca Reyes, H., & Crdenas Barrn, L. E. (2013). Simulacin y
anlisis de sistemas con ProModel (2 ed.). Mxico: Pearson.
Gmez Gmez, M., Danglot Banck, C., & Vega Franco, L. (2003). Sinopsis de pruebas
estadsticas no paramtricas. Cundo usarlas. Revista Mexicana de Pediatra,
70(2), 10.
Johnson, R. A., Miller, I., & Freund, J. (2011). Probability and Statistics for Engineers (8
ed.). New York: Pearson.
Kelton, W. D., Sadowski, R. P., & Sturrock, D. T. (2004). Simulation with Arena (3 ed.).
New York: McGraw-Hill.
Lind, D. A., Marchal, W. G., & Wathen, S. A. (2008). Statistical Techniques in Business
and Economics (3 ed.). New York, United States of America: McGraw-Hill.
Nolberto Sifuentes, V. A., & Ponce Aruneri, M. E. (2008). Universidad Nacional Mayor de
San Marcos. Retrieved abril 9, 2015, from http://epg.unmsm.edu.pe/
Soong, T. T. (2004). Fundamentals of Probability and Statistics for Engineers (1 ed.).
West Sussex: John Wiley & Sons.
Spiegel, M. R. (1970). Estadstica. Mxico: McGraw-Hill.
Triola, M. F. (2009). Estadstica (10 ed.). Mxico: Pearson.
Walpole, R. E., Myers, R. H., Myers, S. L., & Ye, K. (2011). Probability & Statistics for
Engineers & Scientists (9 ed.). United States of America: Pearson.
Zapata, C. J. (2010, 1). Universidade Estadual Paulista . Retrieved abril 10, 2015, from
www.feis.unesp.br

Anexo

INSTRUCTIVO DE PRUEBA DE BONDAD DE


AJUSTE ANDERSON DARLING
Tenemos un total de 20 datos.

NUMERACION

En la comuna A, escribir numeracin de 1 a 20 desde la A2 hasta la A21.

DATOS

En la columna B, ingresar datos desde la B2 hasta la B21.

ORDENAR DATOS

Copiar datos de la columna B a la columna C y ordenar de menor a mayor.

MEDIA
=PROMEDIO (C2:C21)

Colocar esta frmula en la celda C23 para ser especficos en las instrucciones.

DESVIACIN ESTANDAR

=DESVEST(C2:C21).

Colocar esta frmula en la celda C24 para ser especficos en las instrucciones.

ESTANDARIZAR VARIABLES

En la celda D2, utilizar esta frmula de estandarizacin para estandarizar las variables
X ' i=

X i X
S

Ingresando

= (C1-C$23$)/C$24$

Y arrastrar frmula hasta la celda D21.

PROBABILIDAD

En la celda E2, ingresar frmula para calcular la probabilidad

=DIST.NORM (D1, 0,1,


VERDADERO)

El primer valor es el dato estandarizado; el segundo, la media=0; el tercero, la desviacin


estndar=1; el cuarto, el acumulado=VERDADERO. Se coloca VERDADERO para que
sea acumulado, de lo contrario escribir FALSO. Seguido arrastrar la misma frmula hasta la
celda E21.

VALOR REAL DE PROBABILIDAD

En la celda F2, ingresar:


=1-E2

Ya que este es el valor real de la probabilidad. Arrastrar frmula hasta la celda F21.

ORDENAR DATOS

Copiar datos como nmeros y no la frmula de la F2 a la F21 a las celdas contiguas, es


decir G2 a la G21. Ordenar datos de menor a mayor.

FORMULA DE ANDERSON DARLING

Utilizando la frmula de Anderson Darling:

A n=n

1
(2i1) [ lnF ( Y i ) +(1lnF ( Y ni+1 ) )]
n i=1

En la celda H2, ingresar:


= ((2*A2)-1)*(LN (E2)+LN (G2))

Esta frmula representa la operacin

(2 i1) [ lnF ( Y i ) +(1lnF ( Y n+1i ) ) ] . Arrastrar

frmula hasta la celda H21.


En una celda aparte ingresar =-(SUMA (H2:H21)/20)-20. Esto representa el valor de

A 2n

VERIFICACION CON TABLA

Se verifica con esta tabla en el segundo rengln porque es para la prueba normal, en el que
se utiliza una media y una desviacin estndar. Casi siempre se trabaja con un porcentaje de
error del 5%, sea 0.05 as que el valor estadstico para esta prueba sera 0.75.
Al resultar 0.204 este valor es menor de 0.75

Quiere decir que estos datos se ajustan a una distribucin normal.

http://indeoperaciones.blogspot.com/p/simulacion.html

Das könnte Ihnen auch gefallen