Sie sind auf Seite 1von 6

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

SEXTA PRCTICA DE ESTADSTICA Y PROBABILIDADES


Capdevila Salazar-Brando Josinio Clemente Briceo Ricardo Ral Ramrez Durand Rubn Daro Ruiz Ovalle Walter Fernando Retuerto Pomazn Juver Manrique Facultad de Ingeniera Civil Universidad Nacional de Ingeniera

RESUMEN:El trabajo consisti en tomar mediciones de los intervalos de tiempo en que llegan los buses consecutivos de diferentes lneas del metropolitano en una estacin cualquiera y simular el tiempo de espera de diez pasajeros, por otra parte debemos medir los intervalos de tiempo que llegan los buses de una lnea en particular y tomar el tiempo de espera de diez personas. Para el anlisis de datos se escoge una hiptesis (hiptesis nula) basada en una distribucin terica (distribucin exponencial). El procedimiento a seguir en cada caso es la aplicacin de la prueba de Kolmogorov-Smirnov y ver si se acepta o rechaza la hiptesis nula (H0). Finalmente comparar los resultados obtenidos en los dos casos y obtener algunas conclusiones.

2 OBJETIVOS
Recordar y practicar las definiciones bsicas ya usadas en el tema de estadstica descriptiva como frecuencia relativa, frecuencia absoluta, frecuencia relativa acumulada, frecuencia absoluta acumulada, media, varianza, desviacin estndar, regla de Struges yconstruir grficos propios de la estadstica como histogramas o diagramas de frecuencias. Recordar la definicin del modelo probabilstico exponencial. Recordar las definiciones de variable aleatoria discreta y continua para el estudio de este experimento Registrar el tiempo exacto con el que llegan los buses a una estacin del METROPOLITANO as como para el tiempo que demoran los pasajeros en tomar los buses, para construir un histograma. Aprender a usar la prueba de KOLMOGOROV-SMIRNOV para ver si el histograma de aproxima una distribucin exponencial.

1 INTRODUCCIN
En el presente informe se aplicar lo aprendido en el curso de Estadstica y probabilidades ayudndonos con el Test de Kolmogorov-Smirnov, que para esta ocasin se basa en datos obtenidos en la estacin del metropolitano en la cual se considera los tiempos de frecuencia que hay entre buses. En la construccin del modelo de simulacin es importante decidir si un conjunto de datos se ajusta apropiadamente a una distribucin especfica de probabilidad. Al probar mediante alguno de los mtodos, como el Test de Kolmogorov-Smirnov,la bondad del ajuste de un conjunto de datos, se comparan las frecuencias observadas FO en cada categora o intervalo de clase con las frecuencias esperadas tericamente FE y mediante est comparacin se ve si los datos se pueden regir segn el modelo considerado.

3 FUNDAMENTO TERICO
PRUEBA DE SMIRNOV-KOLMOGOROV Esta es una prueba de bondad y ajuste. Surgi en 1939. Kolmogorov y Smirnov supusieron que la distribucin de probabilidad que se encontraba a prueba era continua y que se conoca ciertos parmetros de la poblacin (como la media y la varianza). La prueba se emplea para probar el grado de concordancia entre la distribucin de datos empricos de la muestra y alguna distribucin terica especfica.

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

Esta prueba sirve para verificar o negar la hiptesis que un conjunto de observaciones provienen de una distribucin. El estadstico D que se utiliza en esta prueba es una medida de la diferencia mxima observada entre la distribucin emprica y la terica supuesta. D es una variable aleatoria. Se utiliza esta prueba para verificar o negar que un conjunto de nmeros aleatorios tengan una distribucin supuesta inicialmente. El estadstico de prueba (D) est dado por la diferencia existente entre la frecuencia observada relativa y la frecuencia esperada relativa: Di = mx. {|F(xi) H(xi)|, |F(xi) H(xi-1)|} PROCEDIMIENTO A SEGUIR 1) Formular la hiptesis nula (H0). Teniendo en cuenta que los nmeros que se van a generar provienen de una distribucin. Se selecciona una muestra de tamao n de nmeros aleatorios. Se hallan los parmetros de acuerdo a la distribucin que se est utilizando y dems datos que sirvan de base para la realizacin de la prueba. Ej.: para el caso de una distribucin normal se deben hallar los parmetros respectivos (Media, desviacin estndar) y otros datos de utilidad. Se debe calcular la funcin de distribucin acumulada para despus hallar las frecuencias respectivas. Antes de poder hallar el estadstico de prueba se debe hallar la frecuencia relativa observada y la frecuencia relativa terica de cada uno de los intervalos establecidos de acuerdo al rango. Se aplica la ecuacin Di = mx. { F(xi) H(xi) , | F(xi) H(xi-1) } Posteriormente, se halla el estimador Kolmogorov-Smirnov que es: Valor mximo entre todos los valores hallados para cada intervalo. Se establece un nivel de significancia de acuerdo al planteamiento. Con base a lo anterior se consulta la tabla de lmites de aceptacin para la prueba de Kolmogorov-Smirnov para un tamao de muestra n y un determinado nivel de riesgo , Si el estimador de la prueba es menor al valor buscado en la tabla se acepta H0.

4 PRESENTACIN DEL PROBLEMA


El Metropolitano es un sistema integrado de transporte pblico de Lima, que cuenta con buses articulados de gran capacidad. El objetivo de este moderno sistema es elevar la calidad de vida de los ciudadanos, al ahorrarles tiempo en el traslado diario, proteger el medio ambiente, brindarles mayor seguridad, una mejor calidad de servicio y trato ms humano. Bajo este contexto: Cunto ser el tiempo que espera un pasajero? Qu tan frecuente llegan los buses a una estacin? El tiempo en que llegan los buses seguir una distribucin exponencial?

5 RESOLUCIN DEL PROBLEMA


CASO I Para el Caso I a la llegada de un primer bus hemos considerado el instante de tiempo t=0 y con un cronmetro hemos medido cada cuanto tiempo llegan los buses. TOTAL DE DATOS: n=50 Tabla 1.TIEMPO ENTRE LLEGADA DE LOS BUSES CASO I TIEMPO 42 96 4 16 6 6 6 86 3 6 4 8 7 5 8 17 30 12 3 3 16 27 68 6 107 8 INSTANTE 42 138 142 158 164 170 176 262 265 271 275 283 290 295 303 320 350 362 365 368 384 411 479 485 592 600

2) 3)

4)

5)

6) 7)

8) 9)

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

TIEMPO 10 59 11 3 5 4 11 5 171 6 10 86 7 5 33 25 2 6 4 5 75 1 16 15 73 6 TIEMPO MEDIO:

INSTANTE 610 669 680 683 688 692 703 708 879 885 895 981 988 993 1026 1051 1053 1059 1063 1068 1143 1144 1160 1175 1248 1254

Ordenamos los tiempos recolectado y con ellos construimos nuestra tabla de frecuencias usando la regla de STURGES: R=Tmax-Tmin R= 96-1=95 K=1+3.3log (n) K=1+3.3log(50)=6.6 Tomamos nmero de intervalos K=8 W=R/K W=11.875 Tabla 3.TABLA DE FRECUENCIAS CASO I TIEMPO [1-12.875> [12.875-24.75> [24.75-36.625> [36.625-48.5> [48.5-60.375> [60.375-72.25> [72.25-84.125> [84.125-96> f 32 6 4 1 1 1 2 3 F 32 38 42 43 44 45 47 50 h 0.64 0.12 0.08 0.02 0.02 0.02 0.04 0.06 H 0.64 0.76 0.84 0.86 0.88 0.9 0.94 1

Usando el programa EXCEL, con la funcin ALEATORIO.ENTRE (0,T), siendo T=1254 seg, se forman 10 nmeros aleatorios que representaran el instante de llegada de 10 pasajeros elegidos al azar y asumiendo que toman el bus ms prximo que llega a la estacin, calculamos el tiempo que esperan dichos pasajeros.

Figura 1.HISTOGRAMA CASO I El histograma tiene una forma que se asemeja a la distribucin exponencial; usaremos la prueba de KolmogorovSmirnov para verificarlo. H0= El tiempo entre llegada de buses tiene una distribucin exponencial. H1= El tiempo entre llegada de buses no tiene una distribucin exponencial. n (nmero de intervalos)= 8 Nivel de significancia: =0.02 Calculamos la funcin de distribucin acumulada terica para cada intervalo, calculamos el Estadstico D. DISTRIBUCION EXPONENCIAL: F(ti)= ;=1/ ;

Tabla 2.TIEMPO SIMULADO DE ESPERA DE PASAJEROS CASO I TIEMPO DE PASAJERO BUS ESPERA 67 138 71 145 158 13 165 170 5 236 262 26 372 384 12 441 479 38 613 617 4 725 748 23 738 748 10 890 897 7 TIEMPO PROMEDIO DE ESPERA: 20.9 seg

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

Table 4.TABLA DE DISTRIBUCIN ACUMULADA TIEMPO ti Hi F(ti) [1 - 12.875> 12.875 0.64 0.48293 [12.875 - 24.75> 24.75 0.76 0.71859 [24.75 - 36.625> 36.625 0.84 0.84684 [36.625 - 48.5> 48.5 0.86 0.91664 [48.5 - 60.375> 60.375 0.88 0.95463 [60.375 - 72.25> 72.25 0.9 0.97531 [72.25 - 84.125> 84.125 0.94 0.98656 [84.125 - 96> 96 1 0.99269 TIEMPO [1- 12.875> [12.875- 24.75> [24.75- 36.625> [36.625- 48.5> [48.5- 60.375> [60.375- 72.25> [72.25- 84.125> [84.125- 96> |F(ti)-Hi| 0.15707 0.04141 0.00684 0.05664 0.07463 0.07531 0.04656 0.00731 |F(ti)-Hi-1| 0.48293 0.07859 0.08684 0.07664 0.09463 0.09531 0.08656 0.05269 Di 0.48293 0.07859 0.08684 0.07664 0.09463 0.09531 0.08656 0.05269

TIEMPO MEDIO: Tabla 6. TIEMPO DE ESPERA DE 10 PASAJEROS CASO II 42 29 48 169 128 46 21 38 33 110 TIEMPO MEDIO DE ESPERA: 66.4seg Tabla de frecuencias e histograma: R=326-24=302 K=1+3.3log(38)= 6.21 Tomamos K=7 W=R/K= 43.14

Tabla 7.TABLA DE FRECUENCIAS CASO II

D=Di(mx)=0.48293 Buscamos en la tabla del Test de Kolmogorov-Smirnov sobre Bondad de Ajuste en base a n y : D= 0.50654> D=0.48293 Esto quiere decir que se acepta Ho y por tanto el tiempo se puede ajustar a una Distribucin Exponencial.

TIEMPO [24 - 67.14> [67.14 - 110.29> [110.29 - 153.43> [153.43 - 196.57> [196.57 - 239.71> [239.71 - 282.86> [282.86 - 326]

f 19 9 1 3 3 1 2

F 19 28 29 32 35 36 38

h 0.5 0.2368 0.0263 0.0789 0.0789 0.0263 0.0526

H 0.5 0.7368 0.7632 0.8421 0.9211 0.9474 1

CASO II Para el Caso II con un cronmetro hemos medido cada cuanto tiempo llegan los buses y para este caso no hay la necesidad de tomar un tiempo t=0, medimos adems el tiempo que esperan de 10 personas elegidas al azar. TOTAL DE DATOS: n=38 Tabla 5.TIEMPO ENTRE LLEGADA DE LOS BUSES CASO II 24 27 217 34 101 97 47 78 196 185 98 65 75 308 46 106 100 29 62 29 237 64 48 326 85 24 48 55 120 24 254 54 36 38 185 223 25 91 Figura 2. HISTOGRAMA CASO II Tiene una forma semejante a la exponencial, as que lo comprobaremos mediante la prueba deKolmogorovSmirnov. Ho=El tiempo entre llegada de buses tiene una distribucin exponencial. H1= El tiempo entre llegada de buses no tiene una distribucin exponencial. n (nmero de intervalos)= 7 Nivel de significancia: =0.02

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

Calculamos la funcin de distribucin acumulada terica para cada intervalo, calculamos el Estadstico D.

CASO II TIEMPO MEDIO ENTRE LLEGADA DE BUSES: Aproximadamente cada 1,6 minutos se estaciona una unidad del metropolitano, de una lnea especfica (Expreso N3), en un determinado terminal. TIEMPO PROMEDIO DE ESPERA DE UN PASASJERO:66.4seg Los usuarios que toman una determinada lnea ( Expreso N3) tardan en tomar el bus 1min aproximadamente. En contraste con los datos anteriores estos son ms distantes de los que se puede inferir : Los usuarios que optan por esta modalidad de lnea, tratan de embarcarse lo ms rpido posible incluso , el bus me mostrar con mayor cantidad de pasajeros que su capacidad.

DISTRIBUCION EXPONENCIAL: F(ti)= ; =1/ ;

Tabla 8. TABLA DE DISTRIBUCIN ACUMULADA CASO II TIEMPO ti Hi [24- 67.14> 67.14 0.5 [67.1 - 110.29> 110.29 0.7368 [110.29- 153.43> 153.43 0.7632 [153.43- 196.57> 196.57 0.8421 [196.57- 239.71> 239.71 0.9211 [239.71- 282.86> 282.86 0.9474 [282.86- 326] 326 1 TIEMPO [24- 67.14> [67.1- 110.29> [110.29- 153.43> [153.43- 196.57> [196.57- 239.71> [239.71- 282.86> [282.86- 326] |F(ti)-Hi| 0.0164 0.0746 0.0159 0.0134 0.0155 0.0092 0.0404 |F(ti)-Hi-1| 0.4836 0.1622 0.0423 0.0924 0.0634 0.0171 0.0122

F(ti) 0.4836 0.6622 0.7791 0.8555 0.9055 0.9382 0.9596 Di 0.4836 0.1622 0.0423 0.0924 0.0634 0.0171 0.0404

D=Di(mx)=0.4836 Buscamos en la tabla del Test de Kolmogorov-Smirnov sobre Bondad de Ajuste en base a n y : D= 0.53844> D= 0.4836 Por lo tanto se acepta Ho.

DISTRIBUCIN DEL TIEMPO: F(ti)=

7 CONCLUSIONES
Si hay un acercamiento entre la grfica (histograma) y el modelo exponencial existe una probabilidad de que los datos se ajusten a la distribucin terica. El uso de la prueba de KOLMOGOROV de ajuste resulta sencillo si se conoce y entiende la metodologa de esta prueba. Adems es importante conocer las bases estadsticas necesarias. Entendiendo claramente los conceptos de parmetros, sus propiedades y las tcnicas de solucin, as se puede entender la aplicacin de las pruebas de bondad de ajuste y hacer buen uso de estas pruebas tan importantes dentro de la estadstica. De los resultados, se aprecia que los promedios son muy distintos, de esto se puede decir que como los contextos son distintos, tambin los resultados lo son. De lo anterior, a pesar de que los promedios son distintos, existe cierta proporcin en la variacin de dichos promedios. Notamos que al momento de tomar los datos analizados, estos pueden presentar

6 RESULTADOS
CASO I TIEMPO MEDIO ENTRE LLEGADA DE BUSES: A Aproximadamente cada 19,52 segundos llega una unidad de transporte ,de cualquier lnea, en un terminal del metropolitano) TIEMPO PROMEDIO DE ESPERA DE UN PASASJERO: 20.9 seg En promedio cada usuario que ingresa a un terminal del metropolitano tarda en esperar el bus unos 20.9 segundos) Al comparar ambos resultados obtenidos anteriormente notamos que son muy prximos, lo cual nos indica que la frecuencia de los buses satisface en gran medida la gran demanda de usuarios del metropolitano. DISTRIBUCIN DEL TIEMPO: F(ti)=

Universidad Nacional de Ingeniera Facultad de Ingeniera Civil

variaciones, puesto que influyen de manera significativa aspectos como los horarios , das feriados , fines de semana ,accidentes, etc.

8 BIBLIOGRAFA
Crdova ZamoraManuel, Estadstica Descriptiva e Inferencial. Moya Caldern Rufino, Probabilidad e Inferencia Estadstica. http://www.youtube.com/watch?v=vRG AUt4IGMQ&list=PLcdgQu_m4VZS20QB DllIwJjXljxT8MaBz

Das könnte Ihnen auch gefallen