INFORME N 1: ANLISIS DE UNA VARIABLE ALEATORIA PROBLEMA 1. Se muestran 50 observaciones de un muestro al azar del rendimiento (millas por galn (mpg)) de una marca particular de gasolina 33.2 29.4 36.5 38.1 30.0 29.1 32.2 29.5 36.0 31.5 34.5 33.6 27.4 30.4 28.4 32.6 30.4 31.8 29.8 34.6 30.7 31.9 32.3 28.2 27.5 34.9 32.8 27.7 28.4 28.8 30.2 26.8 27.8 30.5 28.5 31.8 29.2 28.6 27.5 28.5 30.8 31.8 29.1 26.9 34.2 33.5 27.4 28.5 34.8 30.5
Construya un histograma de frecuencia relativa y un histograma de frecuencia acumulada. Construya un diagrama de probabilidad normal para los datos anteriores. Qu inferencias puede Ud. realizar del grfico? Qu conclusiones puede Ud. sacar respecto del producto? Si la compaa tena como objetivo un rendimiento de 31 mpg, logr alcanzarlo? Establezca los lmites de confianza a un nivel del 95% para el rendimiento del combustible.
2. La compaa sobre investigaciones posteriores sobre el producto, ha salido al mercado con una nueva marca de gasolina. Los siguientes son los valores 30 observaciones de rendimiento (mpg) 32.9 31.5 34.3 36.8 35.0 29.4 33.2 37.8 35.0 32.7 28.5 30.4 32.6 31.5 30.6 35.8 36.4 34.2 35.0 33.5 31.8 32.5 28.4 33.8 35.2 30.2 33.0 34.6 32.4 32.0 32.9 31.5 34.3 36.8 35.0
Construya un histograma de frecuencia relativa y un histograma de frecuencia acumulada. Construya un diagrama de probabilidad normal para los datos anteriores. Qu inferencias puede Ud. realizar del grfico? Qu conclusiones puede Ud. sacar respecto del producto? Si la compaa tena como objetivo un rendimiento de 31 mpg, logr alcanzarlo? Establezca los lmites de confianza a un nivel del 95% para el rendimiento del combustible.
3. Establezca si hay diferencia significativa entre los rendimientos de la primera marca de combustible y los de la segunda.
UNIVERSIDAD TECNOLGICA NACIONAL FACULTAD REGIONAL VILLA MARA Control Estadstico de Procesos - Ingeniera Qumica
2
1- Para determinar si se trata o no de una distribucin normal se realiza un anlisis grafico y analtico de los parmetros estadsticos. Box-and-Whisker Plot 26 29 32 35 38 41 Informe II.Combined Data
Histogram 26 29 32 35 38 41 Informe II.Combined Data 0 4 8 12 16 f r e q u e n c y
Histogram 26 29 32 35 38 41 Informe II.Combined Data 0 10 20 30 40 50 f r e q u e n c y
UNIVERSIDAD TECNOLGICA NACIONAL FACULTAD REGIONAL VILLA MARA Control Estadstico de Procesos - Ingeniera Qumica
3
Normal Probability Plot 26 29 32 35 38 41 Informe II.Combined Data 0,1 1 5 20 50 80 95 99 99,9 p e r c e n t a g e
En el histograma de frecuencia relativa se observa un leve sesgo de la distribucin hacia la derecha. El mismo se comprueba con la variacin de la pendiente de la envolvente del grafico de frecuencia acumulada. Por otro lado, en el grafico de caja y bigotes se visualiza que hay una mayor concentracin de los datos en los valores inferiores, mientras que los valores superiores se encuentran ms dispersos. Adems, se puede mencionar quela mediana no coincide con la media. A partir del grafico de probabilidad normal se puede ver que la distribucin se aproxima a la normal, no obstante la presencia de una desviacin en los valores menores, hace necesario el anlisis analtico de los parmetros. Summary Statistics for Informe II.Combined Data
Count 50 Average 30,782 Median 30,4 Standard deviation 2,76477 Minimum 26,8 Maximum 38,1 Lower quartile 28,5 Upper quartile 32,6 Stnd. skewness 1,86173 Stnd. kurtosis -0,414352
Los datos de la muestra se hayan entre 26.8 y 38.1. El 50% de los rendimientos del combustible estn concentrados entre 28.5 y 32.6, con una media de 30.782, inferior al valor esperado de 31. El sesgo y la curtosis, medidas de forma, son de particular inters para determinar si la muestra corresponde a una distribucin normal. Para que esto suceda los valores de estos estadsticos deben encontrarse en un rango de -2 y +2. Ambos valores caen dentro de este rango. Por lo tanto podemos trabajar esta distribucin como Normal. Para evaluar que porcentaje de la muestra supera el rendimiento esperado se realiza la normalizacin de la variable.
Parameters: Mean Std. Dev. Dist. 1 30,782 2,76477
UNIVERSIDAD TECNOLGICA NACIONAL FACULTAD REGIONAL VILLA MARA Control Estadstico de Procesos - Ingeniera Qumica
4
Mean,Std. Dev. 30,782,2,76477 Normal Distribution Probability = 0,468574 16 21 26 31 36 41 46 x 0 0,03 0,06 0,09 0,12 0,15 d e n s i t y
Aqu se observa que solo el 46,8574% de los valores estn por encima del rendimiento deseado. Por lo tanto se concluye que no se logro alcanzar el objetivo de la compaa. Confidence Bounds for Informe II.Combined Data 97,0% lower confidence bound for mean: 30,782 +/- 0,87393 [29,9081 ; 31,6559] 97,0% lower confidence bound for standard deviation: [2,26682 ; 3,53129] Se puede afirmar con una confianza del 97% que la media real de la poblacin se sita entre 29,9081; 31,6559 mientras que la desviacin estndar real est entre 2,26682; 3,53129. Para validar estos datos se ha demostrado previamente que la muestra proviene de una distribucin normal. Confidence Intervals for Informe II.Combined Data 90,0% confidence interval for mean: 30,782 +/- 0,655529 [30,1265, 31,4375] 90,0% confidence interval for standard deviation: [2,37615, 3,32249] Con un nivel de confianza menor, por ejemplo del 90%, el rango en el que podemos encontrar el valor medio se acorta, sin embargo esto acarrea una mayor incertidumbre. 2- Se analizan ahora, el nuevo conjunto de datos provenientes de la nueva marca de gasolina. Box-and-Whisker Plot 28 30 32 34 36 38 D.Combined Data
UNIVERSIDAD TECNOLGICA NACIONAL FACULTAD REGIONAL VILLA MARA Control Estadstico de Procesos - Ingeniera Qumica
5
Histogram 27 29 31 33 35 37 39 D.Combined Data 0 2 4 6 8 10 f r e q u e n c y
Histogram 27 29 31 33 35 37 39 D.Combined Data 0 10 20 30 40 f r e q u e n c y
Normal Probability Plot 28 30 32 34 36 38 D.Combined Data 0,1 1 5 20 50 80 95 99 99,9 p e r c e n t a g e
A simple vista se observa que los nuevos datos presentados se corresponden con mayor exactitud a una distribucin normal. Ya no se visualiza una marcada tendencia a la dispersin en los valores inferiores en el grafico de probabilidad normal. Summary Statistics for D.Combined Data Count 35 Average 33,1571 Median 33,0 Standard deviation 2,35401 Minimum 28,4 Maximum 37,8 Lower quartile 31,5 Upper quartile 35,0 UNIVERSIDAD TECNOLGICA NACIONAL FACULTAD REGIONAL VILLA MARA Control Estadstico de Procesos - Ingeniera Qumica
6
Stnd. skewness -0,391937 Stnd. kurtosis -0,545188
Los datos de la muestra se hayan entre 28,4 y 37,8. El 50% de los rendimientos del combustible estn concentrados entre 31,5 y 35,0; con una media de 33,1571 esta vez superior al valor esperado. El sesgo y la curtosis se encuentran en un rango de -2 y +2, muy prximos a 0, el cual corresponde con una distribucin normal. Para evaluar que porcentaje de la muestra supera el rendimiento esperado se realiza la normalizacin de la variable.
Parameters: Mean Std. Dev. Dist. 1 33,1571 2,35401 Mean,Std. Dev. 33,1571,2,35401 Normal Di stri buti on Probabi l i ty = 0,820259 21 25 29 33 37 41 45 x 0 0,03 0,06 0,09 0,12 0,15 0,18 d e n s i t y
A partir de la normalizacin de la variable podemos evidenciar que el 82,0259% de los valores supera el rendimiento deseado. Este nuevo producto cumple con las expectativas de rendimiento. Confidence Intervals for D.Combined Data 97,0% confidence interval for mean: 33,1571 +/- 0,901248 [32,2559, 34,0584] 97,0% confidence interval for standard deviation: [1,86289, 3,18002] Se puede afirmar con una confianza del 97% que la media real de la poblacin se sita entre 32,2559, 34,0584; mientras que la desviacin estndar real est entre 1,86289 y 3,18002. Para validar estos datos se ha demostrado previamente que la muestra proviene de una distribucin normal. 3- Para realizar una comparacin de ambas muestras se procede a realizar un anlisis paralelo de los datos expuestos. Informe II.Combined Data 26 29 32 35 38 41 Informe IV.Combined Data 16 6 4 14 24 f r e q u e n c y
UNIVERSIDAD TECNOLGICA NACIONAL FACULTAD REGIONAL VILLA MARA Control Estadstico de Procesos - Ingeniera Qumica
7
Variables Informe II.Combined Data Informe IV.Combined Data Density Traces 26 29 32 35 38 41 0 0,03 0,06 0,09 0,12 0,15 d e n s i t y
Box-and-Whisker Plot 26 29 32 35 38 41 Informe II.Combined Data Informe IV.Combined Data
En primer lugar se debe mencionar que el valor mnimo de la segunda muestra es mayor que el mnimo de la primera, lo que desplaza los datos a una zona de mayores rendimientos. Es necesario tener en cuenta que la cantidad de datos del combustible 2 son menores que los del primer combustible. En el grafico de densidad se observa claramente que la primer distribucin esta sesgada y la segunda es simtrica con respecto a la media; lo cual coincide con los valores obtenidos de sesgo curtosis. En el grfico de caja y bigotes se visualiza quede el 50% de la primera muestra est ubicado entre 28.5 y 32.6, en cambio en la segunda muestra los cuartiles inferior y superior son 31.5 y 35. Cabe destacar que el cuartil inferior de la segunda muestra ya supera el valor esperado de rendimiento del combustible. Estas observaciones sumadas a las deducidas de los grficos normalizados indican que la segunda marca de combustibles proporciona un mejor rendimiento que la primera. Cuantitativamente, el rendimiento promedio de la primera marca es del 30,782 +/- 0,752808 y para la segunda 33,1571 +/- 0,901248 considerando un intervalo de confianza del 97%. Se determina como conclusin que la segunda partida de combustibles tiene mejores rendimientos que la primera, y obedece las especificaciones requeridas por la compaa.