Beruflich Dokumente
Kultur Dokumente
OBJETIVOS:
Identificar los diferentes tipos de variables que se pueden encontrar en un conjunto de datos.
Ordenar y resumir los datos a través de la distribución de frecuencias.
Conocer e interpretar diversos tipos de representaciones gráficas, valorar sus ventajas e inconvenientes, y
seleccionar la más adecuada en cada caso según sea la finalidad que se pretenda.
Utilizar R para ordenar, resumir y presentación de un conjunto de datos.
DESARROLLO
MARCO TEÓRICO
Muestra: es un subconjunto representativo de la población sobre el que se obtiene la información empírica que
constituye la masa de datos.
Estadística Descriptiva e Inferencia Estadística: El análisis descriptivo puede realizarse con datos muéstrales
o con censos poblacionales, mientras que la inferencia trabaja con la información que proporcionan los datos
muéstrales, para llegar a conclusiones acerca de la población.
Tipos de datos: si la característica observada es cuantificable se genera una variable, cuando la característica
es cualitativa se genera un atributo; si los datos están referidos al mismo instante de tiempo se denominan de
corte transversal, pero si se observa el comportamiento de la característica en el tiempo se denominan series
temporales. Si se analiza una sola variable o atributo los datos son unidimensionales, si son dos o más
conjuntamente los datos son bidimensionales o multidimensionales.
Representación gráfica de los datos: en particular el histograma y el polígono de frecuencias, por el interés
que presentan como base empírica para la especificación de un modelo teórico. Se hace referencia, asimismo, a
otros tipos de gráficos como el diagrama de barras diagrama de sectores, éstos permiten explorar la distribución
de frecuencias de los datos e identificar las medidas de síntesis más adecuadas para su descripción.
PROCEDIMIENTO
Lea detenidamente las instrucciones y sígalas paso a paso. Realice una captura de pantalla de
cada ejecución.
Argumente adecuadamente sus respuestas, para ello relacione los ejercicios con los conceptos y
definiciones aprendidos.
¡Tomar en cuenta!
- Texto azul: sintaxis del código en R
- Texto en rojo: nombres variables o parámetros que se tienen que modificar
- TA – trabajo autónomo fuera del laboratorio
1. Se registran los ingresos anuales de 20 familias ecuatorianas. Los resultados se muestran en la tabla 1 y
los valores están en miles de dólares.
2. Importación de datos:
a) Descargar del AVAC el archivo ejercicio.csv. y guárdelo en la carpeta del directorio de trabajo de R.
b) Para importar los datos a R se utilizará el comando read.csv2, de acuerdo a la siguiente sintaxis:
datos.alumnos<-read.csv2("cambiar_path_del_fichero/ejercicio.csv", dec=',')
Tomar en cuenta que R utiliza / para especificar el path de directorios o ficheros en vez de \
utilizado por Windows.
c) Compruebe la estructura del fichero a través del comando: class(datos.alumnos)
Indique y explique el tipo de estructura que tienen los datos.
Lo que indica que los datos estan en filas y columnas y que contiene distintos tipos de datos.
d) Indicar la dimensión de los datos. Es decir, el número de datos y de variables del conjunto de datos.
dim.datos<-dim(datos.alumnos). Guardar estos valores en dos variables: n.ind=dim.datos[ 1] y
n.var=dim.datos[2]
datos.txt <- read.delim("Direccion del archivo que se va a importar.txt", header = TRUE, sep =
"\t")
Web<-
"http://people.cst.cmich.edu/lee1c/spss/V16_materials/DataSets_v16/Diseaseoutbreak.txt"
datosWeb1 <- read.table(Web) # o puede escribirse la dirección directamente dentro
library(foreign)
dspss <- read.spss("DatosSPSS.sav", to.data.frame = T)
3. Tipos de Variables
a) Enumere los nombres de variables que tienen los datos, para ello utilice el comando:
names(datos.alumnos)
Nos muestra directamente los resultados la función de Attach separa las variables poniéndolas
directamente en el workspace para que se puedan usar de manera mas fácil como si fueran
variables.
e) Para cada variable indique su tipo, para ello puede ayudarse del comando:
class(nombre_de_la_variable) Explique ¿Por qué la variable tipo “Medio_transporte” es una
variable cualitativa?¿Qué representan los valores de esta variable?
El medio de transporte es cualitativa ya que todas las personas usan medios de transporte diferente
y es de tipo Integer ya que un número representa a cada uno de los medios de transporte
diferentes.
4. Distribución de frecuencias y gráficos – Variables Cualitativas:
b) Para obtener las frecuencias relativas basta con dividir las frecuencias absolutas para el número total
de datos. frel1<-fabs1/n.ind
c) El porcentaje de frecuencias relativas se obtiene multiplicando por 100 las frecuencias relativas.
frel1_percent<-frel1*100
stripchart(x)
boxplot(x)
f) Realice este procedimiento con las variables: “Género” y “Medio_transporte”. Cambiando para cada
caso los nombres de los variables que correspondan. (TA)
Variables Discretas
c) Ejecute los comandos de Tabla 2, utilizando la tabla de frecuencias absolutas, relativas y acumuladas.
d) Repita el procedimiento con la variable “Tiempo_viaje” (TA)
Variables Continuas
Para trabajar con variables continuas en la mayoría de casos será necesario el uso de intervalos.
a) Ejecute el comando: fabs3<-table(cut(Nota_acceso, breaks=7))
Explique qué función realiza el comando cut y para qué sirve el parámetro breaks.
Sirve para dividir los datos de la tabla en intervalos y el comando break da la amplitud del interval
b) Para encontrar la tabla de frecuencias relativas y frecuencias relativas acumuladas se debe ejecutar
los comandos: frel3<-fabs3/n.ind y facum.rel3<-as.table(cumsum(frel3)) respectivamente.
CONCLUSIONES:
Mediante el manejo del programa R, podemos concluir que su uso es muy práctico y eficiente ya que permite
leer un archivo lleno de datos y a su vez se encarga de informar que tipo de dato es y de igual manera saca los
datos estadísticos de cada variable que se encuentre en dicho documento.
Gracias a la función de graficar se pudo observar los distintos gráficos que se puede obtener en R, solo se
debe introducir distintos comandos para poder ejecutar gráficos tales como barras, polígonos, histogramas
entre otros que a la hora de estudiar los datos obtenidos son muy útiles.
RECOMENDACIONES:
Si se quiere borrar las variables declaradas antes se tiene que crear una copia de seguridad ya que luego se
puede necesitar de nuevo
Se recomienda que después de cada ejecución para obtener grafico se guarde la imagen mediante la
herramienta exportar, donde te permite guardar la imagen en el lugar que se quiera, así se evitara perder el
grafico obtenido.