Sie sind auf Seite 1von 10

SOLUCION AL EXAMEN DE ESTADISTICA GENERAL ING.

CIVIL UNA PUNO 2017 GRUPO B

NOTA: LOS EJERCICIOS SE HAN RESUELTO USANDO R, PARA CONFIRMAR LOS PROCEDIMIENTOS MANUALES

1. En una fbrica de ladrillos se ha ido anotando, durante un mes, el nmero de fallas en la fabricacin
de una muestra de 500 ladrillos se obtuvo las datos siguientes : SE ENTIENDE QUE DE LOS 500
LADRILLOS SE ENCONTRARON QUE EN 40 LADRILLOS DE ECONTRARON FALLAS COMO SE MUESTRA
EN LA TABLA SIGUIENTE.

nmero de fallas : 1 2 3 4 5 6 7 8
nmero de ladrillos : 2 6 10 5 10 3 2 2
Se pide:
a) cual es la variable de estudio, de que tipo es
RPTA: LA VARIABLE DE ESTUDIO ES X:NRO DE FALLAS, ES TIPO NUMERICA DISCRETA

b) Tabla de frecuencias. Diagrama de barras para frecuencias absolutas, relativas y acumuladas.


UTILIZAMOS R PARA RESOLVER ESTO:
1. Generamos un archivo txt llamado ladrillo.txt con los siguientes datos en una columna

defectos
1
1
2
2
2
2
2
2
3
3
3
3
3
3
3
3
3
3
4
4
4
4
4
5
5
5
5
5
5
5
5
5
5
6
6
6
7
7
8
8
Los comandos para leer son

> d = read.table("ladrillo.txt", header=T)


GENERAMOS LA TABLA DE FRECUENCIA CON EL COMANDO table como sigue
> str(d)
'data.frame': 40 obs. of 1 variable:
$ defectos: int 1 1 2 2 2 2 2 2 3 3 ...
> attach(d)
> defectos
[1] 1 1 2 2 2 2 2 2 3 3 3 3 3 3 3 3 3 3 4 4 4 4 4 5 5 5 5 5 5 5 5 5 5 6 6 6 7 7
[39] 8 8
El objeto fbas contiene la tabla de frecuencias de la
> fabs = table(defectos)
variable defectose, que representa el nro de defectos
> fabs
encontrado en los ladrillos
defectos
1 2 3 4 5 6 7 8 La primera fila contiene el nro de defectos encontrado
2 6 10 5 10 3 2 2
> La segunda fila contiene la frecuencia

UNA VEZ QUE TENEMOS LA TABLA DE FRECUENCIAS GENERAMOS EL GRAFICO DE


FRECUENCIAS ABSOLUTAS CON EL COMANDO:
> fabscum=as.table(cumsum(fabs))
> fabscum Frecuencias acumuladas estn en el objeto fabscum
1 2 3 4 5 6 7 8
2 8 18 23 33 36 38 40
>
> barplot(fabs,ylab="Frecuencias Absolutas",main="Diagrama de Barras de nro de Defectos")
>
> barplot(fabs,ylab="Frecuencias Absolutas",main="Diagrama de Barras de nro de Defectos en Ladrillos")

PARA LAS FRECUENCIAS RELATIVAS


> nd = length(defectos)
> nd
[1] 40
> frel=fabs/nd
> frel
defectos
1 2 3 4 5 6 7 8
0.050 0.150 0.250 0.125 0.250 0.075 0.050 0.050

> frelcum=as.table(cumsum(frel))
> frelcum
1 2 3 4 5 6 7 8
0.050 0.200 0.450 0.575 0.825 0.900 0.950 1.000
>
> barplot(frel,ylab="Frecuencias Relativas",main="Diagrama de Barras de nro de Defectos en Ladrillos")
>

> barplot(frelcum,ylab="Frecuencias Relativas Acumuladas",main="Diagrama de Barras de nro de Defectos


en Ladrillos")
>
c) Mediana, media aritmtica, moda y cuartiles.
> summary(defectos)
Min. 1st Qu. Median Mean 3rd Qu. Max.
1.00 3.00 4.00 4.05 5.00 8.00
>
EXPLICACION DE LOS RESULTADOS
La media que es 4 significa que el 50% de los ladrillos tienen igual a 4 o menos defectos, tambin podemos
decir que el 50% de los ladrilos tienen 4 mas de defectos
La media que resulta ser 4.05 indica que todos los ladrillos de la muestra contienen 4 defectos, al ser la
mediana y la media prcticamente igual, podemos decir la distribucin es simetrica y normal
La moda en la muestra son dos 3 defectos y 5 defectos que son la mayora de los ladrillos presentan este
nro de defectos.
El cuartil1 que es 3 significa que el 25% de los ladrilos en la muestra presenta a lo mas 3 defectos de
fabricacin
El cuartil2 es igual que la mediana
El cuartil3 significa que el 75% de los ladrillos presenta a lo mas 5 defectos, o el 25% de los ladrillos
presenta al menos 5 defectos.

d) Varianza y desviacin tpica, coeficiente de variacin


CALCULO DE LA VARIANZA
> vd = var(defectos)
> vd
[1] 3.176923 INTERPRETACION: EL VALOR DE LA VARIANZA MUESTRAL RESULTA SER 3.2 LO QUE SIGNIFICA
QUE LA VARIACION DEL NUMERO DE DEFECTOS ES MAYOR A CERO Y ES BASTANTE PUED EL RANGO ES 7.

CALCULO DE LA DESVIACION TIPICA


> s = sd(defectos)
>s
[1] 1.782393 INTERPRETACION: ESTE VALOR 1.8 INDICA QUE EN PROMEDIO EL NRO DE DEFECTOS SE
DISPERSA DEL PROMEDIO EN 1.8 DEFECTOS

CALCULO DEL COEFICIENTE DE VARIACION


> m=mean(defectos)
> cv = s/m*100
> cv
[1] 44.00969 INTERPRETACION: ESTA VALOR ME INDICA QUE EL 44% DE VARIACION EXISTE EN LOS DATOS
ESTO ES BASTANTE MAYOR A 30 POR CONSIGUIENTE LOS DATOS SON HETEROGENEOS
>

2. Los siguientes datos representan la flexin D que se observa en cm, para una viga de madera de de 10
pies de longitud, y 2x3 pulgadas de seccin, para un esfuerzo de 70 kg, en el punto central de la viga:

7.33 7.31 7.26 7.33 7.37 7.27 7.30 7.33 7.33 7.32 7.35 7.39 7.33 7.38 7.33 7.31 7.37 7.35 7.34 7.32 7.29 7.35
7.38 7.32 7.32 7.33 7.32 7.40 7.33 7.32 7.34 7.33

a) Agrupar los datos en 5 intervalos y confeccionar la tabla de frecuencias.

> flexion = c(7.33, 7.31, 7.26, 7.33, 7.37, 7.27, 7.30, 7.33, 7.33, 7.32, 7.35, 7.39, 7.33, 7.38, 7.33, 7.31, 7.37,
7.35, 7.34, 7.32, 7.29, 7.35, 7.38, 7.32, 7.32, 7.33, 7.32, 7.40, 7.33, 7.32, 7.34, 7.33)
> flexion
[1] 7.33 7.31 7.26 7.33 7.37 7.27 7.30 7.33 7.33 7.32 7.35 7.39 7.33 7.38 7.33
[16] 7.31 7.37 7.35 7.34 7.32 7.29 7.35 7.38 7.32 7.32 7.33 7.32 7.40 7.33 7.32
[31] 7.34 7.33

> sf =sort(flexion)
> sf DATOS ORDENADOS
[1] 7.26 7.27 7.29 7.30 7.31 7.31 7.32 7.32 7.32 7.32 7.32 7.32 7.33 7.33 7.33 7.33
[17] 7.33 7.33 7.33 7.33 7.33 7.34 7.34 7.35 7.35 7.35 7.37 7.37 7.38 7.38 7.39 7.40
> range(sf)
[1] 7.26 7.40
> max(sf )
[1] 7.4
> min(sf)
[1] 7.26
> a = (max(sf)-min(sf))/5 CLACULANDO LA AMPLITUD DE LA CLASE
>a
[1] 0.028
> hist(sf, seq(7.25, 7.5, by=0.028)) GRAFICO DEL HISTOGRAMA
> hist(sf, seq(7.25, 7.5, by=0.028),main="Histograma de Flexion") PONEMOS TITULO
> hist(sf, seq(7.25, 7.5, by=0.028),main="Histograma de Flexion",xlab="flexion en cm") NOMBRE EN X
> hist(sf, seq(7.25, 7.5, by=0.028),main="Histograma de Flexion",xlab="flexion en cm",
+ ylab="Nro de vigas") GRAFICO COMPLETO
>
PARA LOS INTERVALOS DE CLASE INTRODUCIMOS EL COMANDO
> hf = hist(sf, seq(7.25, 7.5, by=0.028), plot = F)
> hf
$breaks ESTOS SON LOS INTERVALOS DE CLASE
[1] 7.250 7.278 7.306 7.334 7.362 7.390 7.418 7.446 7.474

$counts ESTOS SON LAS FRECUENCIAS DE CLASE


[1] 2 2 17 5 5 1 0 0

$density
[1] 2.232143 2.232143 18.973214 5.580357 5.580357 1.116071 0.000000
[8] 0.000000

$mids SON LOS PUNTOS MEDIOS DE CLASE O MARCA DE CLASE


[1] 7.264 7.292 7.320 7.348 7.376 7.404 7.432 7.460

$xname
[1] "sf"

$equidist
[1] TRUE

attr(,"class")
[1] "histogram"
>

b) Calcular la media aritmtica, la moda y la mediana, indicar en un grafico de frecuencias absolutas


acumuladas donde se ubican estos puntos, graficar los puntos en x e y con una lnea para cada caso.

> summary(flexion)
Min. 1st Qu. Median Mean 3rd Qu. Max.
7.260 7.320 7.330 7.333 7.350 7.400
>

c) Ubique el tercer decil, En un grafico de tallo hojas.


> quantile(flexion,0.3)
30%
7.32

d) Determinar el porcentaje de individuos que se concentra fuera del intervalo (x , x+) mas menos
una desviacin estndar respecto a la media.
DEBEMOS CONTAR CUANTOS EXISTEN ENTRE LOS VALORES LIMITES CALCULADOS
> li=mean(flexion-sd(flexion))
> ls=mean(flexion+sd(flexion))
> li; ls
[1] 7.301576
[1] 7.364049
>
> sf
[1] 7.26 7.27 7.29 7.30 7.31 7.31 7.32 7.32 7.32 7.32 7.32 7.32 7.33 7.33
[15] 7.33 7.33 7.33 7.33 7.33 7.33 7.33 7.34 7.34 7.35 7.35 7.35 7.37 7.37
[29] 7.38 7.38 7.39 7.40
>
DE LOS DATOS ORDENADOS ENCONTRAMOS QUE EXISTE 22 DATOS EL PORCENTAJE ES 22/40*100
= 55%
> 22/40*100
[1] 55
> 22/40
[1] 0.55

e) cual es el valor por el que se encuentra el 15% ms alto de los datos


CALCULAMOS EL PERCENTIL SUPERIOR A 15 ES 85
> quantile(sf,0.85)
85%
7.37 QUIERE DECIR QUE EL NUMERO DE VIGAS QUE SUPERA EL 15% MAS ALTO DE FLEXION ES LOS
QUE TIENEN COMO MINIMO 7.37 DE FLEXION

3 . haga una seleccin aleatoria de dos muestras de tamao 10 para el ejerci 2, calcule para cada muestra
el promedio, la desviacin estndar, coeficiente de variacin, explique las diferencias de estos valores, son
iguales?, cunto varan? , a qu se debe esto?, grafique los valores calculados en un mismo grafico.
4. Utilizando la recta de regresin de x sobre y correspondiente a la distribucin siguiente:

x = altura sobre el nivel del mar 0 184 231 481 911

y = temperatura media en C 20 18 17 12 10

INGRESANDO LOS DATOS


> altura=c(0,84,231,481,911)
> temp = c(20,18,17,12,10)
> rg=lm(altura ~ temp)
> rg

Call:
lm(formula = altura ~ temp)

Coefficients:
(Intercept) temp
1632.0 -83.8

a. Grafique los puntos, la rectas medias en x e y


> plot(temp,altura)
> abline(rg)

a. Coeficiente de correlacin
> cor(altura,temp)
[1] -0.9632425

b. Coeficiente de determinacin
> summary(rg)

Call:
lm(formula = altura ~ temp)

Residuals:
1 2 3 4 5
44.10 -39.51 23.69 -145.33 117.06

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 1631.97 213.95 7.628 0.00468 **
temp -83.80 13.49 -6.211 0.00841 **
---
Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 113.9 on 3 degrees of freedom


Multiple R-squared: 0.9278, Adjusted R-squared: 0.9038
F-statistic: 38.57 on 1 and 3 DF, p-value: 0.008413
INTERPRETRACION: el coeficiente de determinacin es 90% QUIERE DECIR EQUE EL CAMBIO QUE
AFECTA LA TERMERATURA DEBIDO A LA ALTURA SOBRE EL NIVEL DEL MAR EL 90% DE ESE CAMBIO SE DEBE
A LA ALTURA .

c. Calcula la altitud de una ciudad en la que la temperatura media es de 15.


TENEMOS EL MODELO COMO SIGUE
> altitud = 1631.97 -83.8*15
> altitud
[1] 374.97

ALTITUD = 1631.97 - 83.8 (TEMPERATURA)


ALTITUD = 1631.97 - 83.8 (15)
ALTITUD = 374.97 metros sobre el nivel del mar

Das könnte Ihnen auch gefallen