Beruflich Dokumente
Kultur Dokumente
FASE 5 – POA
Presentado a:
Luis alberto caceres torres
Presentado por:
Camila Maldonado c
Código: 1077920854
Grupo
300046_7
OBJETIVOS
● Identificar las características y datos arrojados por las variables continuas, discretas y
cualitativas, empleando los códigos necesarios.
Específicos
23 24 25 26 27 28 30
74 78 79 89 92 94 100
> frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
> frel
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.01 0.04 0.02 0.03 0.02 0.01 0.06 0.04 0.06 0.06 0.03 0.03 0.07 0.08
19 20 21 22 23 24 25 26 27 28 30
0.05 0.05 0.02 0.02 0.04 0.04 0.01 0.10 0.03 0.02 0.06
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.01 0.05 0.07 0.10 0.12 0.13 0.19 0.23 0.29 0.35 0.38 0.41 0.48 0.56
19 20 21 22 23 24 25 26 27 28 30
0.61 0.66 0.68 0.70 0.74 0.78 0.79 0.89 0.92 0.94 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="Gráfico de barras
CONTEO") # Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",main="FRECUENCIAS RELATIVAS
CONTEO") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="FRECUENCIAS
RELATIVAS ACUMULADAS CONTEO") #Frecuencias relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los
que el programa R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
> attach(PROBA)
The following objects are masked from PROBA (pos = 3):
ACAROS, ACAROS1, ACAROS10, ACAROS2, ACAROS3, ACAROS4,
ACAROS5, ACAROS6, ACAROS7, ACAROS8, ACAROS9, GERMINACION,
HOGARES, HOGARES1, HOGARES10, HOGARES2, HOGARES3, HOGARES4,
HOGARES5, HOGARES6, HOGARES7, HOGARES8, HOGARES9, LECHONES,
LECHONES1, LECHONES10, LECHONES2, LECHONES3, LECHONES4,
LECHONES5, LECHONES6, LECHONES7, LECHONES8, LECHONES9,
PESOCON0, PESOCON1, PESOCON10, PESOCON2, PESOCON3,
PESOCON4, PESOCON5, PESOCON6, PESOCON7, PESOCON8, PESOCON9,
pH, pH1, pH10, pH2, pH3, pH4, pH5, pH6, pH7, pH8, pH9, PM,
PM1, PM10, PM2, PM3, PM4, PM5, PM6, PM7, PM8, PM9, X
>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "fdth"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de
abajo de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar: "USA(IA)" y posteriormente: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL
'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/3.5/fdth_1.2-5.zip'
Content type 'application/zip' length 291569 bytes (284 KB)
downloaded 284 KB
sd, var
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de conejos.
> # Para los estudiantes de agronomía, la variable "pH", que es el potencial de hidrógeno
del suelo.
> # Para los estudiantes de ambiental, la variable "PM", que corresponde al material
particulado de 2.5
> # Si el número del grupo es par, seleccionar una de las variables terminada en número
par.
> # Si el número del grupo es impar, seleccionar una de las variables terminada en número
impar.
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo para
escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=PM3 # En esta linea reemplaze la palabra "PESOCON0" por la
variable seleccionada por el grupo
>
> # Si el grupo seleccionó "PM8" entonces la línea previa deberá quedar así:
VARIABLECONTINUA=PM8
>
> summary(VARIABLECONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
9.00 14.00 20.50 19.24 24.25 29.00
> minimos=min(VARIABLECONTINUA)
> minimos
[1] 9
> maximos=max(VARIABLECONTINUA)
> maximos
[1] 29
> median(VARIABLECONTINUA)
[1] 20.5
> VARIANZA=var(VARIABLECONTINUA)
> VARIANZA
[1] 35.7398
> sd(VARIABLECONTINUA)
[1] 5.978277
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] 5.978277
> length(VARIABLECONTINUA)
[1] 100
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt (VARIABLECONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia acumulada
(cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[8.91,11.457) 14 0.14 14 14 14
[11.457,14.005) 12 0.12 12 26 26
[14.005,16.553) 13 0.13 13 39 39
[16.553,19.1) 9 0.09 9 48 48
[19.1,21.648) 11 0.11 11 59 59
[21.648,24.195) 16 0.16 16 75 75
[24.195,26.742) 12 0.12 12 87 87
[26.742,29.29) 13 0.13 13 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",main="HISTOGRAMA DE FRECUENCIAS
ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="POLIGONO DE FRECUENCIAS
ABSOLUTAS") #POLIGONO DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",main="HISTOGRAMA DE FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
> plot(dist, type="cfp",ylim=c(0,100), col="red",main="POLIGONO DE
FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE") #POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(VARIABLECONTINUA), col="red") # mediana
> abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
> abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la misma
mediana)
> abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(VARIABLECONTINUA), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una probabilidad
del 50% de que los datos sean iguales o inferiores a esta.
>
> #Distribución emprica
> ECDF=ecdf(VARIABLECONTINUA)
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:21] = 9, 10, 11, ..., 28, 29
> minimos
[1] 9
> maximos
[1] 29
> plot(ECDF,col="red",lwd=3,xlab="VARIABLECONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="Distribución empirica") #
Gráfico de Distribución empírica
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50%
de la frecuencia de la variable
> abline(v=median(VARIABLECONTINUA), col="red", ) # la línea vertical de
color rojo indica la mediana de la variable
> median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
[1] 20.5
> abline(v=mean(VARIABLECONTINUA), col="blue", ) # la línea vertical de
color azul indica la media de la variable
> mean(VARIABLECONTINUA) # valor de la media en la variable elegida
[1] 19.24
> # ¿es igual o distinto el valor de la media y la mediana en la variable elegida?
> # ¿cómo se puede interpretar esta similitud o diferencia?
>
> # CÁLCULO DE PROBABILIDADES
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 2758.13
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 151503.1
> sigma=sqrt(varianza)
>
> # Dentro del rango de valores presente en la variable elegida, indique aquel del
que quiere conocer su probabilidad:
> valor=2700
> pnorm(valor,media,sigma)
[1] 0.4406409
>
GRAFICAS
VARIABLE DISCRETA
Gráfico de Frecuencias Absolutas – hogares 7
Gráfico de barras CONTEO
10
8
Frecuencias absolutas
6
4
2
0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30
La gráfica de frecuencias absolutas nos muestra los datos obtenidos del conteo
donde nos dice que en 10 barrios encunestados 26 son los hogares que mas
reciclan
Gráfico de Frecuencias Relativas – hogares 7
FRECUENCIAS RELATIVAS CONTEO
0.10
0.08
Frecuencias relativas
0.06
0.04
0.02
0.00
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30
se observa en la grafica de
0.8
frecuencias relativas
Frecuencias relativas
0.6
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30
VARIABLE CONTINUA: PM3
Tabla resumen:
Gráfico de Histograma de Frecuencias
Absolutas
10
Class limits
Gráfico de Polígono de Frecuencias
Absolutas
POLIGONO DE FRECUENCIAS ABSOLUTAS
15
En esta grafica
podemos observar que
Frequency
10
Class limits
Gráfico de Histograma de Frecuencias
Relativas
HISTOGRAMA DE FRECUENCIAS RELATIVAS
0.15
Frequency
0.10
0.05
0.00
Class limits
Gráfico de Polígono de Frecuencias
Relativas Acumuladas en porcentaje
POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
100
80
60
Frequency
40
20
0
Class limits
Distribución empirica
1.0
0.8
Distribución empirica
0.6
0.4
0.2
0.0
10 15 20 25
VARIABLECONTINUA
CONCLUSIONES
Estos métodos estadísticos me permitieron organizar la información de las encuestas obteniendo
una mejor interpretación de los datos.
En conclusión se relaciono, se observó y se interpretó la información contenida en cada una de
las variables, además se aprendió a correr el código en el programa R.
Conocer un Programa como lo es R, encargado de diferentes procesos estadísticos por medio de
códigos empleados, ha sido de gran ventaja en la realización de esta actividad, ya que nos brinda
un nuevo método de conteo e identificación de variables, por medio de las gráficas y diagramas
obtenidos, teniendo en cuenta que pudimos distinguir las grandes diferencias que existen tanto en
la variable continua, como en la discreta y cualitativa.
La realización de este trabajo me permitió conocer la aplicabilidad de probabilidades a diversos
tipos de variables, en cuanto a la carrera de Ingeniería Ambiental, se tomaron en cuenta diferentes
datos, donde se interpreta los diferentes conceptos, obteniendo información de manera clara y
concisa.
BIBLIOGRAFÍAS
Texto Balzarini, M. (2013). Estadística y biometría : Ilustraciones del uso e infostat en problemas de
agronomía. Disponible en
http://www.agro.unc.edu.ar/~mcia/archivos/Estadistica%20y%20Biometria.pdf
Presentación PRACTICO EN R
https://drive.google.com/file/d/1h_zti3Rd0YMtqW2hwVcb-4fUQafm-99s/view?usp=sharing