Beruflich Dokumente
Kultur Dokumente
RESUMEN:El trabajo consisti en tomar mediciones de los intervalos de tiempo en que llegan los buses consecutivos de diferentes lneas del metropolitano en una estacin cualquiera y simular el tiempo de espera de diez pasajeros, por otra parte debemos medir los intervalos de tiempo que llegan los buses de una lnea en particular y tomar el tiempo de espera de diez personas. Para el anlisis de datos se escoge una hiptesis (hiptesis nula) basada en una distribucin terica (distribucin exponencial). El procedimiento a seguir en cada caso es la aplicacin de la prueba de Kolmogorov-Smirnov y ver si se acepta o rechaza la hiptesis nula (H0). Finalmente comparar los resultados obtenidos en los dos casos y obtener algunas conclusiones.
2 OBJETIVOS
Recordar y practicar las definiciones bsicas ya usadas en el tema de estadstica descriptiva como frecuencia relativa, frecuencia absoluta, frecuencia relativa acumulada, frecuencia absoluta acumulada, media, varianza, desviacin estndar, regla de Struges yconstruir grficos propios de la estadstica como histogramas o diagramas de frecuencias. Recordar la definicin del modelo probabilstico exponencial. Recordar las definiciones de variable aleatoria discreta y continua para el estudio de este experimento Registrar el tiempo exacto con el que llegan los buses a una estacin del METROPOLITANO as como para el tiempo que demoran los pasajeros en tomar los buses, para construir un histograma. Aprender a usar la prueba de KOLMOGOROV-SMIRNOV para ver si el histograma de aproxima una distribucin exponencial.
1 INTRODUCCIN
En el presente informe se aplicar lo aprendido en el curso de Estadstica y probabilidades ayudndonos con el Test de Kolmogorov-Smirnov, que para esta ocasin se basa en datos obtenidos en la estacin del metropolitano en la cual se considera los tiempos de frecuencia que hay entre buses. En la construccin del modelo de simulacin es importante decidir si un conjunto de datos se ajusta apropiadamente a una distribucin especfica de probabilidad. Al probar mediante alguno de los mtodos, como el Test de Kolmogorov-Smirnov,la bondad del ajuste de un conjunto de datos, se comparan las frecuencias observadas FO en cada categora o intervalo de clase con las frecuencias esperadas tericamente FE y mediante est comparacin se ve si los datos se pueden regir segn el modelo considerado.
3 FUNDAMENTO TERICO
PRUEBA DE SMIRNOV-KOLMOGOROV Esta es una prueba de bondad y ajuste. Surgi en 1939. Kolmogorov y Smirnov supusieron que la distribucin de probabilidad que se encontraba a prueba era continua y que se conoca ciertos parmetros de la poblacin (como la media y la varianza). La prueba se emplea para probar el grado de concordancia entre la distribucin de datos empricos de la muestra y alguna distribucin terica especfica.
Esta prueba sirve para verificar o negar la hiptesis que un conjunto de observaciones provienen de una distribucin. El estadstico D que se utiliza en esta prueba es una medida de la diferencia mxima observada entre la distribucin emprica y la terica supuesta. D es una variable aleatoria. Se utiliza esta prueba para verificar o negar que un conjunto de nmeros aleatorios tengan una distribucin supuesta inicialmente. El estadstico de prueba (D) est dado por la diferencia existente entre la frecuencia observada relativa y la frecuencia esperada relativa: Di = mx. {|F(xi) H(xi)|, |F(xi) H(xi-1)|} PROCEDIMIENTO A SEGUIR 1) Formular la hiptesis nula (H0). Teniendo en cuenta que los nmeros que se van a generar provienen de una distribucin. Se selecciona una muestra de tamao n de nmeros aleatorios. Se hallan los parmetros de acuerdo a la distribucin que se est utilizando y dems datos que sirvan de base para la realizacin de la prueba. Ej.: para el caso de una distribucin normal se deben hallar los parmetros respectivos (Media, desviacin estndar) y otros datos de utilidad. Se debe calcular la funcin de distribucin acumulada para despus hallar las frecuencias respectivas. Antes de poder hallar el estadstico de prueba se debe hallar la frecuencia relativa observada y la frecuencia relativa terica de cada uno de los intervalos establecidos de acuerdo al rango. Se aplica la ecuacin Di = mx. { F(xi) H(xi) , | F(xi) H(xi-1) } Posteriormente, se halla el estimador Kolmogorov-Smirnov que es: Valor mximo entre todos los valores hallados para cada intervalo. Se establece un nivel de significancia de acuerdo al planteamiento. Con base a lo anterior se consulta la tabla de lmites de aceptacin para la prueba de Kolmogorov-Smirnov para un tamao de muestra n y un determinado nivel de riesgo , Si el estimador de la prueba es menor al valor buscado en la tabla se acepta H0.
2) 3)
4)
5)
6) 7)
8) 9)
INSTANTE 610 669 680 683 688 692 703 708 879 885 895 981 988 993 1026 1051 1053 1059 1063 1068 1143 1144 1160 1175 1248 1254
Ordenamos los tiempos recolectado y con ellos construimos nuestra tabla de frecuencias usando la regla de STURGES: R=Tmax-Tmin R= 96-1=95 K=1+3.3log (n) K=1+3.3log(50)=6.6 Tomamos nmero de intervalos K=8 W=R/K W=11.875 Tabla 3.TABLA DE FRECUENCIAS CASO I TIEMPO [1-12.875> [12.875-24.75> [24.75-36.625> [36.625-48.5> [48.5-60.375> [60.375-72.25> [72.25-84.125> [84.125-96> f 32 6 4 1 1 1 2 3 F 32 38 42 43 44 45 47 50 h 0.64 0.12 0.08 0.02 0.02 0.02 0.04 0.06 H 0.64 0.76 0.84 0.86 0.88 0.9 0.94 1
Usando el programa EXCEL, con la funcin ALEATORIO.ENTRE (0,T), siendo T=1254 seg, se forman 10 nmeros aleatorios que representaran el instante de llegada de 10 pasajeros elegidos al azar y asumiendo que toman el bus ms prximo que llega a la estacin, calculamos el tiempo que esperan dichos pasajeros.
Figura 1.HISTOGRAMA CASO I El histograma tiene una forma que se asemeja a la distribucin exponencial; usaremos la prueba de KolmogorovSmirnov para verificarlo. H0= El tiempo entre llegada de buses tiene una distribucin exponencial. H1= El tiempo entre llegada de buses no tiene una distribucin exponencial. n (nmero de intervalos)= 8 Nivel de significancia: =0.02 Calculamos la funcin de distribucin acumulada terica para cada intervalo, calculamos el Estadstico D. DISTRIBUCION EXPONENCIAL: F(ti)= ;=1/ ;
Tabla 2.TIEMPO SIMULADO DE ESPERA DE PASAJEROS CASO I TIEMPO DE PASAJERO BUS ESPERA 67 138 71 145 158 13 165 170 5 236 262 26 372 384 12 441 479 38 613 617 4 725 748 23 738 748 10 890 897 7 TIEMPO PROMEDIO DE ESPERA: 20.9 seg
Table 4.TABLA DE DISTRIBUCIN ACUMULADA TIEMPO ti Hi F(ti) [1 - 12.875> 12.875 0.64 0.48293 [12.875 - 24.75> 24.75 0.76 0.71859 [24.75 - 36.625> 36.625 0.84 0.84684 [36.625 - 48.5> 48.5 0.86 0.91664 [48.5 - 60.375> 60.375 0.88 0.95463 [60.375 - 72.25> 72.25 0.9 0.97531 [72.25 - 84.125> 84.125 0.94 0.98656 [84.125 - 96> 96 1 0.99269 TIEMPO [1- 12.875> [12.875- 24.75> [24.75- 36.625> [36.625- 48.5> [48.5- 60.375> [60.375- 72.25> [72.25- 84.125> [84.125- 96> |F(ti)-Hi| 0.15707 0.04141 0.00684 0.05664 0.07463 0.07531 0.04656 0.00731 |F(ti)-Hi-1| 0.48293 0.07859 0.08684 0.07664 0.09463 0.09531 0.08656 0.05269 Di 0.48293 0.07859 0.08684 0.07664 0.09463 0.09531 0.08656 0.05269
TIEMPO MEDIO: Tabla 6. TIEMPO DE ESPERA DE 10 PASAJEROS CASO II 42 29 48 169 128 46 21 38 33 110 TIEMPO MEDIO DE ESPERA: 66.4seg Tabla de frecuencias e histograma: R=326-24=302 K=1+3.3log(38)= 6.21 Tomamos K=7 W=R/K= 43.14
D=Di(mx)=0.48293 Buscamos en la tabla del Test de Kolmogorov-Smirnov sobre Bondad de Ajuste en base a n y : D= 0.50654> D=0.48293 Esto quiere decir que se acepta Ho y por tanto el tiempo se puede ajustar a una Distribucin Exponencial.
TIEMPO [24 - 67.14> [67.14 - 110.29> [110.29 - 153.43> [153.43 - 196.57> [196.57 - 239.71> [239.71 - 282.86> [282.86 - 326]
f 19 9 1 3 3 1 2
F 19 28 29 32 35 36 38
CASO II Para el Caso II con un cronmetro hemos medido cada cuanto tiempo llegan los buses y para este caso no hay la necesidad de tomar un tiempo t=0, medimos adems el tiempo que esperan de 10 personas elegidas al azar. TOTAL DE DATOS: n=38 Tabla 5.TIEMPO ENTRE LLEGADA DE LOS BUSES CASO II 24 27 217 34 101 97 47 78 196 185 98 65 75 308 46 106 100 29 62 29 237 64 48 326 85 24 48 55 120 24 254 54 36 38 185 223 25 91 Figura 2. HISTOGRAMA CASO II Tiene una forma semejante a la exponencial, as que lo comprobaremos mediante la prueba deKolmogorovSmirnov. Ho=El tiempo entre llegada de buses tiene una distribucin exponencial. H1= El tiempo entre llegada de buses no tiene una distribucin exponencial. n (nmero de intervalos)= 7 Nivel de significancia: =0.02
Calculamos la funcin de distribucin acumulada terica para cada intervalo, calculamos el Estadstico D.
CASO II TIEMPO MEDIO ENTRE LLEGADA DE BUSES: Aproximadamente cada 1,6 minutos se estaciona una unidad del metropolitano, de una lnea especfica (Expreso N3), en un determinado terminal. TIEMPO PROMEDIO DE ESPERA DE UN PASASJERO:66.4seg Los usuarios que toman una determinada lnea ( Expreso N3) tardan en tomar el bus 1min aproximadamente. En contraste con los datos anteriores estos son ms distantes de los que se puede inferir : Los usuarios que optan por esta modalidad de lnea, tratan de embarcarse lo ms rpido posible incluso , el bus me mostrar con mayor cantidad de pasajeros que su capacidad.
Tabla 8. TABLA DE DISTRIBUCIN ACUMULADA CASO II TIEMPO ti Hi [24- 67.14> 67.14 0.5 [67.1 - 110.29> 110.29 0.7368 [110.29- 153.43> 153.43 0.7632 [153.43- 196.57> 196.57 0.8421 [196.57- 239.71> 239.71 0.9211 [239.71- 282.86> 282.86 0.9474 [282.86- 326] 326 1 TIEMPO [24- 67.14> [67.1- 110.29> [110.29- 153.43> [153.43- 196.57> [196.57- 239.71> [239.71- 282.86> [282.86- 326] |F(ti)-Hi| 0.0164 0.0746 0.0159 0.0134 0.0155 0.0092 0.0404 |F(ti)-Hi-1| 0.4836 0.1622 0.0423 0.0924 0.0634 0.0171 0.0122
F(ti) 0.4836 0.6622 0.7791 0.8555 0.9055 0.9382 0.9596 Di 0.4836 0.1622 0.0423 0.0924 0.0634 0.0171 0.0404
D=Di(mx)=0.4836 Buscamos en la tabla del Test de Kolmogorov-Smirnov sobre Bondad de Ajuste en base a n y : D= 0.53844> D= 0.4836 Por lo tanto se acepta Ho.
7 CONCLUSIONES
Si hay un acercamiento entre la grfica (histograma) y el modelo exponencial existe una probabilidad de que los datos se ajusten a la distribucin terica. El uso de la prueba de KOLMOGOROV de ajuste resulta sencillo si se conoce y entiende la metodologa de esta prueba. Adems es importante conocer las bases estadsticas necesarias. Entendiendo claramente los conceptos de parmetros, sus propiedades y las tcnicas de solucin, as se puede entender la aplicacin de las pruebas de bondad de ajuste y hacer buen uso de estas pruebas tan importantes dentro de la estadstica. De los resultados, se aprecia que los promedios son muy distintos, de esto se puede decir que como los contextos son distintos, tambin los resultados lo son. De lo anterior, a pesar de que los promedios son distintos, existe cierta proporcin en la variacin de dichos promedios. Notamos que al momento de tomar los datos analizados, estos pueden presentar
6 RESULTADOS
CASO I TIEMPO MEDIO ENTRE LLEGADA DE BUSES: A Aproximadamente cada 19,52 segundos llega una unidad de transporte ,de cualquier lnea, en un terminal del metropolitano) TIEMPO PROMEDIO DE ESPERA DE UN PASASJERO: 20.9 seg En promedio cada usuario que ingresa a un terminal del metropolitano tarda en esperar el bus unos 20.9 segundos) Al comparar ambos resultados obtenidos anteriormente notamos que son muy prximos, lo cual nos indica que la frecuencia de los buses satisface en gran medida la gran demanda de usuarios del metropolitano. DISTRIBUCIN DEL TIEMPO: F(ti)=
variaciones, puesto que influyen de manera significativa aspectos como los horarios , das feriados , fines de semana ,accidentes, etc.
8 BIBLIOGRAFA
Crdova ZamoraManuel, Estadstica Descriptiva e Inferencial. Moya Caldern Rufino, Probabilidad e Inferencia Estadstica. http://www.youtube.com/watch?v=vRG AUt4IGMQ&list=PLcdgQu_m4VZS20QB DllIwJjXljxT8MaBz