Sie sind auf Seite 1von 7

UNIVERSIDAD TECNOLGICA NACIONAL

FACULTAD REGIONAL VILLA MARA


Control Estadstico de Procesos - Ingeniera Qumica

1

INFORME N 1: ANLISIS DE UNA VARIABLE ALEATORIA
PROBLEMA
1. Se muestran 50 observaciones de un muestro al azar del rendimiento (millas por galn
(mpg)) de una marca particular de gasolina
33.2 29.4 36.5 38.1 30.0
29.1 32.2 29.5 36.0 31.5
34.5 33.6 27.4 30.4 28.4
32.6 30.4 31.8 29.8 34.6
30.7 31.9 32.3 28.2 27.5
34.9 32.8 27.7 28.4 28.8
30.2 26.8 27.8 30.5 28.5
31.8 29.2 28.6 27.5 28.5
30.8 31.8 29.1 26.9 34.2
33.5 27.4 28.5 34.8 30.5

Construya un histograma de frecuencia relativa y un histograma de frecuencia acumulada.
Construya un diagrama de probabilidad normal para los datos anteriores. Qu inferencias
puede Ud. realizar del grfico?
Qu conclusiones puede Ud. sacar respecto del producto?
Si la compaa tena como objetivo un rendimiento de 31 mpg, logr alcanzarlo?
Establezca los lmites de confianza a un nivel del 95% para el rendimiento del combustible.

2. La compaa sobre investigaciones posteriores sobre el producto, ha salido al mercado con
una nueva marca de gasolina. Los siguientes son los valores 30 observaciones de
rendimiento (mpg)
32.9 31.5 34.3 36.8 35.0
29.4 33.2 37.8 35.0 32.7
28.5 30.4 32.6 31.5 30.6
35.8 36.4 34.2 35.0 33.5
31.8 32.5 28.4 33.8 35.2
30.2 33.0 34.6 32.4 32.0
32.9 31.5 34.3 36.8 35.0

Construya un histograma de frecuencia relativa y un histograma de frecuencia acumulada.
Construya un diagrama de probabilidad normal para los datos anteriores. Qu inferencias
puede Ud. realizar del grfico?
Qu conclusiones puede Ud. sacar respecto del producto?
Si la compaa tena como objetivo un rendimiento de 31 mpg, logr alcanzarlo?
Establezca los lmites de confianza a un nivel del 95% para el rendimiento del combustible.

3. Establezca si hay diferencia significativa entre los rendimientos de la primera marca de
combustible y los de la segunda.


UNIVERSIDAD TECNOLGICA NACIONAL
FACULTAD REGIONAL VILLA MARA
Control Estadstico de Procesos - Ingeniera Qumica

2

1- Para determinar si se trata o no de una distribucin normal se realiza un anlisis grafico
y analtico de los parmetros estadsticos.
Box-and-Whisker Plot
26 29 32 35 38 41
Informe II.Combined Data

Histogram
26 29 32 35 38 41
Informe II.Combined Data
0
4
8
12
16
f
r
e
q
u
e
n
c
y

Histogram
26 29 32 35 38 41
Informe II.Combined Data
0
10
20
30
40
50
f
r
e
q
u
e
n
c
y

UNIVERSIDAD TECNOLGICA NACIONAL
FACULTAD REGIONAL VILLA MARA
Control Estadstico de Procesos - Ingeniera Qumica

3

Normal Probability Plot
26 29 32 35 38 41
Informe II.Combined Data
0,1
1
5
20
50
80
95
99
99,9
p
e
r
c
e
n
t
a
g
e

En el histograma de frecuencia relativa se observa un leve sesgo de la distribucin hacia la
derecha. El mismo se comprueba con la variacin de la pendiente de la envolvente del grafico
de frecuencia acumulada. Por otro lado, en el grafico de caja y bigotes se visualiza que hay una
mayor concentracin de los datos en los valores inferiores, mientras que los valores superiores
se encuentran ms dispersos. Adems, se puede mencionar quela mediana no coincide con la
media.
A partir del grafico de probabilidad normal se puede ver que la distribucin se aproxima a la
normal, no obstante la presencia de una desviacin en los valores menores, hace necesario el
anlisis analtico de los parmetros.
Summary Statistics for Informe II.Combined Data

Count 50
Average 30,782
Median 30,4
Standard deviation 2,76477
Minimum 26,8
Maximum 38,1
Lower quartile 28,5
Upper quartile 32,6
Stnd. skewness 1,86173
Stnd. kurtosis -0,414352

Los datos de la muestra se hayan entre 26.8 y 38.1. El 50% de los rendimientos del combustible
estn concentrados entre 28.5 y 32.6, con una media de 30.782, inferior al valor esperado de 31.
El sesgo y la curtosis, medidas de forma, son de particular inters para determinar si la muestra
corresponde a una distribucin normal. Para que esto suceda los valores de estos estadsticos
deben encontrarse en un rango de -2 y +2. Ambos valores caen dentro de este rango. Por lo
tanto podemos trabajar esta distribucin como Normal. Para evaluar que porcentaje de la
muestra supera el rendimiento esperado se realiza la normalizacin de la variable.

Parameters: Mean Std. Dev.
Dist. 1 30,782 2,76477

UNIVERSIDAD TECNOLGICA NACIONAL
FACULTAD REGIONAL VILLA MARA
Control Estadstico de Procesos - Ingeniera Qumica

4

Mean,Std. Dev.
30,782,2,76477
Normal Distribution
Probability = 0,468574
16 21 26 31 36 41 46
x
0
0,03
0,06
0,09
0,12
0,15
d
e
n
s
i
t
y

Aqu se observa que solo el 46,8574% de los valores estn por encima del rendimiento deseado.
Por lo tanto se concluye que no se logro alcanzar el objetivo de la compaa.
Confidence Bounds for Informe II.Combined Data
97,0% lower confidence bound for mean: 30,782 +/- 0,87393 [29,9081 ; 31,6559]
97,0% lower confidence bound for standard deviation: [2,26682 ; 3,53129]
Se puede afirmar con una confianza del 97% que la media real de la poblacin se sita entre
29,9081; 31,6559 mientras que la desviacin estndar real est entre 2,26682; 3,53129. Para
validar estos datos se ha demostrado previamente que la muestra proviene de una distribucin
normal.
Confidence Intervals for Informe II.Combined Data
90,0% confidence interval for mean: 30,782 +/- 0,655529 [30,1265, 31,4375]
90,0% confidence interval for standard deviation: [2,37615, 3,32249]
Con un nivel de confianza menor, por ejemplo del 90%, el rango en el que podemos encontrar el
valor medio se acorta, sin embargo esto acarrea una mayor incertidumbre.
2- Se analizan ahora, el nuevo conjunto de datos provenientes de la nueva marca de
gasolina.
Box-and-Whisker Plot
28 30 32 34 36 38
D.Combined Data

UNIVERSIDAD TECNOLGICA NACIONAL
FACULTAD REGIONAL VILLA MARA
Control Estadstico de Procesos - Ingeniera Qumica

5

Histogram
27 29 31 33 35 37 39
D.Combined Data
0
2
4
6
8
10
f
r
e
q
u
e
n
c
y

Histogram
27 29 31 33 35 37 39
D.Combined Data
0
10
20
30
40
f
r
e
q
u
e
n
c
y

Normal Probability Plot
28 30 32 34 36 38
D.Combined Data
0,1
1
5
20
50
80
95
99
99,9
p
e
r
c
e
n
t
a
g
e

A simple vista se observa que los nuevos datos presentados se corresponden con mayor
exactitud a una distribucin normal. Ya no se visualiza una marcada tendencia a la dispersin en
los valores inferiores en el grafico de probabilidad normal.
Summary Statistics for D.Combined Data
Count 35
Average 33,1571
Median 33,0
Standard deviation 2,35401
Minimum 28,4
Maximum 37,8
Lower quartile 31,5
Upper quartile 35,0
UNIVERSIDAD TECNOLGICA NACIONAL
FACULTAD REGIONAL VILLA MARA
Control Estadstico de Procesos - Ingeniera Qumica

6

Stnd. skewness -0,391937
Stnd. kurtosis -0,545188

Los datos de la muestra se hayan entre 28,4 y 37,8. El 50% de los rendimientos del combustible
estn concentrados entre 31,5 y 35,0; con una media de 33,1571 esta vez superior al valor
esperado. El sesgo y la curtosis se encuentran en un rango de -2 y +2, muy prximos a 0, el cual
corresponde con una distribucin normal. Para evaluar que porcentaje de la muestra supera el
rendimiento esperado se realiza la normalizacin de la variable.

Parameters: Mean Std. Dev.
Dist. 1 33,1571 2,35401
Mean,Std. Dev.
33,1571,2,35401
Normal Di stri buti on
Probabi l i ty = 0,820259
21 25 29 33 37 41 45
x
0
0,03
0,06
0,09
0,12
0,15
0,18
d
e
n
s
i
t
y

A partir de la normalizacin de la variable podemos evidenciar que el 82,0259% de los valores
supera el rendimiento deseado. Este nuevo producto cumple con las expectativas de
rendimiento.
Confidence Intervals for D.Combined Data
97,0% confidence interval for mean: 33,1571 +/- 0,901248 [32,2559, 34,0584]
97,0% confidence interval for standard deviation: [1,86289, 3,18002]
Se puede afirmar con una confianza del 97% que la media real de la poblacin se sita entre
32,2559, 34,0584; mientras que la desviacin estndar real est entre 1,86289 y 3,18002. Para
validar estos datos se ha demostrado previamente que la muestra proviene de una distribucin
normal.
3- Para realizar una comparacin de ambas muestras se procede a realizar un anlisis
paralelo de los datos expuestos.
Informe II.Combined Data
26 29 32 35 38 41
Informe IV.Combined Data
16
6
4
14
24
f
r
e
q
u
e
n
c
y

UNIVERSIDAD TECNOLGICA NACIONAL
FACULTAD REGIONAL VILLA MARA
Control Estadstico de Procesos - Ingeniera Qumica

7

Variables
Informe II.Combined Data
Informe IV.Combined Data
Density Traces
26 29 32 35 38 41
0
0,03
0,06
0,09
0,12
0,15
d
e
n
s
i
t
y

Box-and-Whisker Plot
26 29 32 35 38 41
Informe II.Combined Data
Informe IV.Combined Data

En primer lugar se debe mencionar que el valor mnimo de la segunda muestra es mayor que el
mnimo de la primera, lo que desplaza los datos a una zona de mayores rendimientos. Es
necesario tener en cuenta que la cantidad de datos del combustible 2 son menores que los del
primer combustible. En el grafico de densidad se observa claramente que la primer distribucin
esta sesgada y la segunda es simtrica con respecto a la media; lo cual coincide con los valores
obtenidos de sesgo curtosis. En el grfico de caja y bigotes se visualiza quede el 50% de la
primera muestra est ubicado entre 28.5 y 32.6, en cambio en la segunda muestra los cuartiles
inferior y superior son 31.5 y 35. Cabe destacar que el cuartil inferior de la segunda muestra ya
supera el valor esperado de rendimiento del combustible.
Estas observaciones sumadas a las deducidas de los grficos normalizados indican que la
segunda marca de combustibles proporciona un mejor rendimiento que la primera.
Cuantitativamente, el rendimiento promedio de la primera marca es del 30,782 +/- 0,752808 y
para la segunda 33,1571 +/- 0,901248 considerando un intervalo de confianza del 97%.
Se determina como conclusin que la segunda partida de combustibles tiene mejores
rendimientos que la primera, y obedece las especificaciones requeridas por la compaa.

Das könnte Ihnen auch gefallen