Fase 5 - Trabajo Colaborativo - Grupo 7

ESTADÍSTICA DESCRIPTIVA
FASE 5 – POA
Presentado a:
Luis alberto caceres torres
Presentado por:
Camila Maldonado c
Código: 1077920854
Grupo
300046_7
Universidad Nacional Abierta y a Distancia UNAD

INTRODUCION
El presente trabajo se desarrolla con la finalidad de aplicar lo aprendido

durante las fases dos, tres y cuatro del curso, con el objetivo de
comprender y profundizar aún más en cuanto a lo temas que presenta la
estadística descriptiva para agrarias, para este caso recopilar, clasificar y
encontrar las características de datos reales y además comprender de una
manera mas clara la importancia de los modelos estadísticos y su
desempeño y función dentro de la estadística y sobre todo dentro de las
carreras que estamos ejerciendo. Por ende el trabajo se hizo con la
finalidad de que nosotros como futuros ingenieros debemos tener en
cuenta en todo el caso la estadística descriptiva y sus variables, pero
sobre todo saber que se desprende de cada una de ellas y que nos
podrían ayudar a resolver, con el fin de contribuir con el planeta para cosas
buenas, La estadística descriptiva me arroja mediante la herramienta R,
datos, frecuencias, cambios, y probabilidades con las cuales logramos
interpretar y sacar conclusiones, de los datos reales.
General
OBJETIVOS
● Identificar las características y datos arrojados por las variables continuas, discretas y
cualitativas, empleando los códigos necesarios.
Específicos
● Determinar y distinguir una variable discreta, continua y cualitativa de la parte

ambiental
● Identificar los datos que arroja cada una de las variables, según el fenómeno
ambiental.
● Detallar cual es la media de la variable continua.
● Interpretar las tablas de frecuencias y, los diagramas de barras y algunos índices
descriptivos
● Tener un enfoque real de lo que representa la Estadística Descriptiva en nuestra
carrera profesional, identificando métodos precisos para analizar cada variable.
>
> # Cuando el volumen de información es alto, se pueden importar de una hoja de cálculo
en formato "*.csv"
> # Los datos con los que vamos a trabajar se encuentran en el archivo
"PROBABILIDAD.CSV"
> # Deben descargarlo y ubicar tanto la hoja de cálculo como este código en una misma
carpeta (se sugiere nombrarla: "Estadistica Descriptiva" )
> # No abra ni modifique el archivo, sólo guárdelo en la carpeta "Estadistica descriptiva"
>
> # Vaya al menú de R - "Archivo"
> # Dé click en "Cambiar dir" y ubique la carpeta "Estadistica descriptiva", donde deben
estar los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
>
># VARIABLE CUANTITATIVA DISCRETA
>
> # Recuerde que debe ubicarse en cada línea del código y digitar al mismo tiempo:
"Control+R" para ejecutar cada comando
> # No se salte ninguna línea porque puede aparecerle errores en la ejecución de
los comandos
>
> getwd() # Debe aparecer la carpeta "Estadistica descriptiva" donde guardaron
los archivos "CODIGOPROBABILIDAD.txt" y "PROBABILIDAD.csv"
[1] "D:/documentos/Estadistica descriptiva"
> # Si no les aparece la carpeta, el programa R no va a encontrar la base de datos y
R mostrará un mensaje de error al intentar abrirla
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA)
> attach(PROBA) # Muestra los nombres de las variables sobre los cuales
R va a hacer los cálculos
The following objects are masked from PROBA (pos = 3):
ACAROS, ACAROS1, ACAROS10, ACAROS2, ACAROS3, ACAROS4,
ACAROS5, ACAROS6, ACAROS7, ACAROS8, ACAROS9, GERMINACION,
HOGARES, HOGARES1, HOGARES10, HOGARES2, HOGARES3, HOGARES4,
HOGARES5, HOGARES6, HOGARES7, HOGARES8, HOGARES9, LECHONES,
LECHONES1, LECHONES10, LECHONES2, LECHONES3, LECHONES4,
PESOCON0, PESOCON1, PESOCON10, PESOCON2, PESOCON3,
PESOCON4, PESOCON5, PESOCON6, PESOCON7, PESOCON8, PESOCON9,
pH, pH1, pH10, pH2, pH3, pH4, pH5, pH6, pH7, pH8, pH9, PM,
PM1, PM10, PM2, PM3, PM4, PM5, PM6, PM7, PM8, PM9, X
> View(PROBA) # Muestra la tabla de Excel con los datos
>
> # El grupo debe escoger entre los tres tipos de variables discretas
existentes:
> # Para los estudiantes de zootecnia, la variable "LECHONES", que es el
número de lechones por cerda.
> # Para los estudiantes de agronomía, la variable "ACAROS", que es el
número de ácaros por hoja.
> # Para los estudiantes de ambiental, la variable "HOGARES", que
corresponde al número de hogares que reciclan en 100 barrios
> # Si el número del grupo es par, seleccionar una de las variables terminada
en número par.
> # Si el número del grupo es impar, seleccionar una de las variables
terminada en número impar.
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de
acuerdo para escoger una sola variable con la que van a trabajar
>
> CONTEO=HOGARES7 # En esta linea reemplaze la palabra
"LECHONES1" por la variable seleccionada por el grupo
>
> # Si el grupo seleccionó "LECHONES7" entonces la línea previa deberá
quedar así: CONTEO=LECHONES7
> # No debe reemplazar nada más, porque de lo contrario puede
aparecerle algún error
>
> min(CONTEO)
[1] 5
> max(CONTEO)
[1] 30
> table(CONTEO) # Tabla de frecuencias absolutas
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
1 4 2 3 2 1 6 4 6 6 3 3 7 8 5 5 2 2 4 4 1 10 3 2 30 6
> fabs=table(CONTEO) # Tabla de frecuencias absolutas
> fabs
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28
1 4 2 3 2 1 6 4 6 6 3 3 7 8 5 5 2 2 4 4 1 10 3 2 30 6
> fabsacum<-as.table(cumsum(fabs)) # Frecuencias absolutas acumuladas
> fabsacum
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
1 5 7 10 12 13 19 23 29 35 38 41 48 56 61 66 68 70
23 24 25 26 27 28 30
74 78 79 89 92 94 100
> frel=prop.table(table(CONTEO)) # Tabla de frecuencias relativas
> frel
CONTEO
5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.01 0.04 0.02 0.03 0.02 0.01 0.06 0.04 0.06 0.06 0.03 0.03 0.07 0.08
19 20 21 22 23 24 25 26 27 28 30
0.05 0.05 0.02 0.02 0.04 0.04 0.01 0.10 0.03 0.02 0.06
> frelacum<-as.table(cumsum(frel)) # Frecuencias relativas acumuladas
> frelacum
5 6 7 8 9 10 11 12 13 14 15 16 17 18
0.01 0.05 0.07 0.10 0.12 0.13 0.19 0.23 0.29 0.35 0.38 0.41 0.48 0.56
19 20 21 22 23 24 25 26 27 28 30
0.61 0.66 0.68 0.70 0.74 0.78 0.79 0.89 0.92 0.94 1.00
>
> # GRAFICOS PARA VARIABLES DISCRETAS
> barplot(fabs,ylab="Frecuencias absolutas",main="Gráfico de barras
CONTEO") # Frecuencias absolutas
> barplot(frel,ylab="Frecuencias relativas",main="FRECUENCIAS RELATIVAS
CONTEO") # Frecuencias relativas
> barplot(frelacum,ylab="Frecuencias relativas",main="FRECUENCIAS
RELATIVAS ACUMULADAS CONTEO") #Frecuencias relativas acumuladas
>
>
># VARIABLE CUANTITATIVA CONTINUA
>
> PROBA=read.table("PROBABILIDAD.csv",header=T,sep=";",dec=",")
> attach(PROBA) # Muestra el nombre de las variables sobre los
que el programa R va a hacer los cálculos

HOGARES, HOGARES1, HOGARES10, HOGARES2, HOGARES3,
HOGARES4,
HOGARES5, HOGARES6, HOGARES7, HOGARES8, HOGARES9,
LECHONES,
PESOCON9,

HOGARES4,
LECHONES,
PESOCON9,
> attach(PROBA)
HOGARES, HOGARES1, HOGARES10, HOGARES2, HOGARES3, HOGARES4,
HOGARES5, HOGARES6, HOGARES7, HOGARES8, HOGARES9, LECHONES,
PESOCON4, PESOCON5, PESOCON6, PESOCON7, PESOCON8, PESOCON9,

HOGARES4,
LECHONES,
PESOCON9,

HOGARES4,
LECHONES,
PESOCON9,
>
> # Instalación del paquete "fdth"
> # Cuando aparezca el listado, elegir: "fdth"
> # Esperar hasta que instale el paquete de comandos, puede tardar varios
minutos
> # Esperar hasta que el cursor se vea de nuevo de color rojo en la parte de
abajo de la Consola R
>
> utils:::menuInstallPkgs() # seleccionar: "USA(IA)" y posteriormente: "fdth"
--- Please select a CRAN mirror for use in this session ---
probando la URL
'https://mirror.las.iastate.edu/CRAN/bin/windows/contrib/3.5/fdth_1.2-5.zip'
Content type 'application/zip' length 291569 bytes (284 KB)
downloaded 284 KB
package ‘fdth’ successfully unpacked and MD5 sums checked
The downloaded binary packages are in

C:\Users\USUARIO\AppData\Local\Temp\Rtmpyu3TBb\downloaded_packages
>
> library(fdth) # si se pone en rojo, significa que quedó correctamente instalada la
librería fdth
Attaching package: ‘fdth’
The following objects are masked from ‘package:stats’:
sd, var
>
> # El grupo debe escoger entre los tres tipos de variables continuas existentes:
> # Para los estudiantes de zootecnia, la variable "PESOCON", que es el peso de conejos.
> # Para los estudiantes de agronomía, la variable "pH", que es el potencial de hidrógeno
del suelo.
> # Para los estudiantes de ambiental, la variable "PM", que corresponde al material
particulado de 2.5
> # Si el número del grupo es par, seleccionar una de las variables terminada en número
par.
> # Si el número del grupo es impar, seleccionar una de las variables terminada en número
impar.
> # Si en el grupo hay estudiantes de distintos programas, deben ponerse de acuerdo para
escoger una sola variable con la que van a trabajar
>
> VARIABLECONTINUA=PM3 # En esta linea reemplaze la palabra "PESOCON0" por la
variable seleccionada por el grupo
>
> # Si el grupo seleccionó "PM8" entonces la línea previa deberá quedar así:
VARIABLECONTINUA=PM8
>
> summary(VARIABLECONTINUA)
Min. 1st Qu. Median Mean 3rd Qu. Max.
9.00 14.00 20.50 19.24 24.25 29.00
> minimos=min(VARIABLECONTINUA)
> minimos
[1] 9
> maximos=max(VARIABLECONTINUA)
> maximos
[1] 29
> median(VARIABLECONTINUA)
[1] 20.5
> VARIANZA=var(VARIABLECONTINUA)
> VARIANZA
[1] 35.7398
> sd(VARIABLECONTINUA)
[1] 5.978277
> SIGMA=sqrt(VARIANZA)
> SIGMA
[1] 5.978277
> length(VARIABLECONTINUA)
[1] 100
>
># TABLA DE FRECUENCIAS
>
> dist <- fdt (VARIABLECONTINUA)
> dist# Esta tabla presenta el intervalo inferior y superior, la frecuencia absoluta (f),
frecuencia relativa (rf), frecuencia relativa en porcenaje (rf(%)), frecuencia acumulada
(cf) y frecuencia acumulada en porcentaje (cf(%))
Class limits f rf rf(%) cf cf(%)
[8.91,11.457) 14 0.14 14 14 14
[11.457,14.005) 12 0.12 12 26 26
[14.005,16.553) 13 0.13 13 39 39
[16.553,19.1) 9 0.09 9 48 48
[19.1,21.648) 11 0.11 11 59 59
[21.648,24.195) 16 0.16 16 75 75
[24.195,26.742) 12 0.12 12 87 87
[26.742,29.29) 13 0.13 13 100 100
>
># GRÁFICOS DE VARIABLES CONTINUAS
>
> plot(dist, type="fh",col="blue",main="HISTOGRAMA DE FRECUENCIAS
ABSOLUTAS") # HISTOGRAMA DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="fp",col="blue",main="POLIGONO DE FRECUENCIAS
ABSOLUTAS") #POLIGONO DE FRECUENCIAS ABSOLUTAS
> plot(dist, type="rfh",col="blue",main="HISTOGRAMA DE FRECUENCIAS
RELATIVAS")#HISTOGRAMA DE FRECUENCIAS RELATIVAS
> plot(dist, type="cfp",ylim=c(0,100), col="red",main="POLIGONO DE
FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE") #POLIGONO
DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
> abline(h=25, col="black") # frecuencia = 25%
> abline(h=50, col="red") # frecuencia = 50%
> abline(h=75, col="blue") # frecuencia = 75%
> abline(h=100, col="green") # frecuencia = 100%
> abline(v=median(VARIABLECONTINUA), col="red") # mediana
> abline(v=quantile(VARIABLECONTINUA, 0.25), col="black")# Cuantil Q1
> abline(v=quantile(VARIABLECONTINUA, 0.5),col="red")# Cuantil Q2 (es la misma
mediana)
> abline(v=quantile(VARIABLECONTINUA, 0.75),col="blue")# Cuantil Q3
> abline(v=max(VARIABLECONTINUA), col="brown") # valor máximo
>
> # Donde se unen las líneas rojas es la mediana, lo cual indica que hay una probabilidad
del 50% de que los datos sean iguales o inferiores a esta.
>
> #Distribución emprica
> ECDF=ecdf(VARIABLECONTINUA)
> ECDF
Empirical CDF
Call: ecdf(VARIABLECONTINUA)
x[1:21] = 9, 10, 11, ..., 28, 29
> minimos
[1] 9
> maximos
[1] 29
> plot(ECDF,col="red",lwd=3,xlab="VARIABLECONTINUA",ylab="Distribución
empirica",ylim=c(0,1),xlim=c(minimos,maximos),main="Distribución empirica") #
Gráfico de Distribución empírica
> abline(h=0.5, col="red") # la línea horizontal de color rojo, indica el 50%
de la frecuencia de la variable
> abline(v=median(VARIABLECONTINUA), col="red", ) # la línea vertical de
color rojo indica la mediana de la variable
> median(VARIABLECONTINUA) # valor de la mediana en la variable elegida
[1] 20.5
> abline(v=mean(VARIABLECONTINUA), col="blue", ) # la línea vertical de
color azul indica la media de la variable
> mean(VARIABLECONTINUA) # valor de la media en la variable elegida
[1] 19.24
> # ¿es igual o distinto el valor de la media y la mediana en la variable elegida?
> # ¿cómo se puede interpretar esta similitud o diferencia?
>
> # CÁLCULO DE PROBABILIDADES
> # En el siguiente comando, indique el valor de la media de la variable elegida:
> media= 2758.13
> # Ahora indique el valor de la varianza de la variable elegida:
> varianza= 151503.1
> sigma=sqrt(varianza)
>
> # Dentro del rango de valores presente en la variable elegida, indique aquel del
que quiere conocer su probabilidad:
> valor=2700
> pnorm(valor,media,sigma)
[1] 0.4406409
>
GRAFICAS
VARIABLE DISCRETA
Gráfico de Frecuencias Absolutas – hogares 7
Gráfico de barras CONTEO
10
8
Frecuencias absolutas
6
4
2
0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30
La gráfica de frecuencias absolutas nos muestra los datos obtenidos del conteo
donde nos dice que en 10 barrios encunestados 26 son los hogares que mas
reciclan
Gráfico de Frecuencias Relativas – hogares 7
FRECUENCIAS RELATIVAS CONTEO
0.10
0.08
Frecuencias relativas
0.06
0.04
0.02
0.00
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30
Aquí se puede observar el conteo de Frecuencias Relativas nos muestra la

probabilidad de los intervalos que van creciendo con los datos obtenidos
del conteo donde nos dice que en 10% de los barrios encuestados 26%
son los hogares que mas reciclan para que los intervalos alcancen la
frecuencia relativa más alta que los demás.
Gráfico de Frecuencias Relativas Acumuladas – hogares 7
FRECUENCIAS RELATIVAS ACUMULADAS CONTEO

1.0
se observa en la grafica de
0.8
frecuencias relativas
Frecuencias relativas
0.6
acumuladas que los valores van

ascendiendo de intervalo en
0.4
intervalo ya que los barrios

donde están los hogares tiene
0.2
un capacidad muy buena a la

hora de reciclar.
0.0
5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 30
VARIABLE CONTINUA: PM3
Tabla resumen:
Gráfico de Histograma de Frecuencias
Absolutas
HISTOGRAMA DE FRECUENCIAS ABSOLUTAS

15
El histograma nos muestra los

intervalos con las frecuencias mas
Frequency
10
altas, estos entan entre el intervalo

1 al 6.
5
0
8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29
Class limits
Gráfico de Polígono de Frecuencias
Absolutas
POLIGONO DE FRECUENCIAS ABSOLUTAS
15
En esta grafica
podemos observar que
Frequency
10
los datos registrados

van en una escala 8 a
29 en forma ascendente
5
0
8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29
Class limits
Gráfico de Histograma de Frecuencias
Relativas
HISTOGRAMA DE FRECUENCIAS RELATIVAS
0.15
Frequency
0.10
0.05
0.00
8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29
Class limits
Gráfico de Polígono de Frecuencias
Relativas Acumuladas en porcentaje
POLIGONO DE FRECUENCIAS RELATIVAS ACUMULADAS EN PORCENTAJE
100
80
60
Frequency
40
20
0
8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29
Class limits
La gráfica de frecuencias relativas acumuladas nos

está mostrando que el 50% tiene PM
Gráfico de distribución empírica con las líneas verticales
que ubican la mediana y la media de la variable elegida.
Distribución empirica
1.0
0.8
Distribución empirica
0.6
0.4
0.2
0.0
10 15 20 25
VARIABLECONTINUA
CONCLUSIONES
 Estos métodos estadísticos me permitieron organizar la información de las encuestas obteniendo
una mejor interpretación de los datos.
 En conclusión se relaciono, se observó y se interpretó la información contenida en cada una de
las variables, además se aprendió a correr el código en el programa R.
 Conocer un Programa como lo es R, encargado de diferentes procesos estadísticos por medio de
códigos empleados, ha sido de gran ventaja en la realización de esta actividad, ya que nos brinda
un nuevo método de conteo e identificación de variables, por medio de las gráficas y diagramas
obtenidos, teniendo en cuenta que pudimos distinguir las grandes diferencias que existen tanto en
la variable continua, como en la discreta y cualitativa.
 La realización de este trabajo me permitió conocer la aplicabilidad de probabilidades a diversos
tipos de variables, en cuanto a la carrera de Ingeniería Ambiental, se tomaron en cuenta diferentes
datos, donde se interpreta los diferentes conceptos, obteniendo información de manera clara y
concisa.
BIBLIOGRAFÍAS
Texto Balzarini, M. (2013). Estadística y biometría : Ilustraciones del uso e infostat en problemas de
agronomía. Disponible en
http://www.agro.unc.edu.ar/~mcia/archivos/Estadistica%20y%20Biometria.pdf
Presentación PRACTICO EN R
https://drive.google.com/file/d/1h_zti3Rd0YMtqW2hwVcb-4fUQafm-99s/view?usp=sharing

Fase 5 - Trabajo Colaborativo - Grupo 7

Hochgeladen von

Dokumentinformationen

Originaltitel

Copyright

Verfügbare Formate

Dieses Dokument teilen

Dokument teilen oder einbetten

Freigabeoptionen

Stufen Sie dieses Dokument als nützlich ein?

Sind diese Inhalte unangemessen?

Copyright:

Verfügbare Formate

Fase 5 - Trabajo Colaborativo - Grupo 7

Hochgeladen von

Copyright:

Verfügbare Formate

ESTADÍSTICA DESCRIPTIVA

Universidad Nacional Abierta y a Distancia UNAD

El presente trabajo se desarrolla con la finalidad de aplicar lo aprendido

● Determinar y distinguir una variable discreta, continua y cualitativa de la parte

ACAROS, ACAROS1, ACAROS10, ACAROS2, ACAROS3, ACAROS4,

ACAROS, ACAROS1, ACAROS10, ACAROS2, ACAROS3, ACAROS4,

The following objects are masked from PROBA (pos = 4):

The following objects are masked from PROBA (pos = 5):

package ‘fdth’ successfully unpacked and MD5 sums checked

The downloaded binary packages are in

Attaching package: ‘fdth’

The following objects are masked from ‘package:stats’:

Aquí se puede observar el conteo de Frecuencias Relativas nos muestra la

FRECUENCIAS RELATIVAS ACUMULADAS CONTEO

acumuladas que los valores van

intervalo ya que los barrios

un capacidad muy buena a la

HISTOGRAMA DE FRECUENCIAS ABSOLUTAS

El histograma nos muestra los

altas, estos entan entre el intervalo

8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29

los datos registrados

8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29

8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29

8.91 11.46 14.00 16.55 19.10 21.65 24.20 26.74 29.29

La gráfica de frecuencias relativas acumuladas nos

Das könnte Ihnen auch gefallen