Sie sind auf Seite 1von 22

IDENTIFICACIÓN Y ANÁLISIS DE VARIABLES ESTADÍSTICAS

UNIDAD 1 FASE 2

PRESENTADO POR:
FABIO NELSON LUNA SOLARTE
CODIGO: 12283217
GRUPO: 300046_20

PRESENTADO A
LUIS ALBERTO CACERES TORRES

UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA “UNAD”


ESCUELA DE CIENCIAS AGRÍCOLAS, PECUARIAS Y DEL MEDIO AMBIENTE
ESTADÍSTICA DESCRIPTIVA (PARA AGRARIAS)
BOGOTÁ CEAD JAG-COLOMBIA
Introducción
Este trabajo es de gran importancia ya que nos fundamenta y nos da los
conocimientos necesarios para el análisis e interpretación de datos y los
fundamentos de los tipos de variables estadísticas cuantitativas y cualitativas y su
forma de procesamiento.
Objetivos.
Objetivo general.
Interpretar y analizar los fundamentos de análisis de tipos de variables estadísticas
cuantitativas y cualitativas y su forma de procesamiento.
Objetivos específicos.
Contextualizar los diferentes términos utilizados en estadística descriptiva.
Interpretar los fundamentos de los tipos de variables estadísticas cuantitativas y
cualitativas.
Analizar e interpretar y procesar datos mediante el programa RGui.
Desarrollo de la actividad individual:
Consultar la bibliografía disponible en el Entorno de Conocimiento para la Unidad
1 y explicar con sus propias palabras los siguientes términos y presentarlos en
el Foro del Entorno Colaborativo:
 Variable cuantitativa continúa: Son los valores que pertenecen o
contienen cualquier número real. Son los resultados de procesos de
medición como pueden ser pesadas o valores de longitudes, tiempos, áreas
y volúmenes. Por ejemplo: rendimiento del cultivo que puede ser medido en
quintal por hectárea, longitud de espigas de trigo en centímetros, aumento
de peso en kilogramos, diámetro de granos de maíz en milímetros,
temperatura máxima diaria en grados centígrados.
 Variable cuantitativa discreta: Son los valores posibles y aquellos
números enteros que provienen de un proceso de conteo, la variable se
dice de tipo discreta. Como ejemplo tenemos: cantidad de frutos por planta,
número de yemas por estaca, cantidad de insectos por trampa o número de
crías por parto.
 Variable cualitativa nominal: Constituye cada modalidad no numérica o
clase que representa una cualidad que no tiene ningún sentido ordenar
(como mayor o menor) respecto a otra de las clases de la variable. Por
ejemplo, en un estudio observacional realizado sobre 30 establecimientos
lecheros se podría relevar la variable “estación de concentración de partos”.
Como ejemplo tenemos: sexo (hembra/ macho), resultados del tacto que se
realiza a una vaca (preñada/ vacía), tenencia de la tierra (alquilada/
prestada/ propia/usurpada/ otra), tipo de labranza (convencional/ directa/
reducida).
 Variable cualitativa categórica: Son las variables que se pueden tomar a
un número limitado, y por lo general fijo, de posibles valores, asignando a
cada unidad individual u otro tipo observación a un grupo en particular o
categoría nominal sobre la base de alguna característica cualitativa o
también pueden recibir el nombre de variables binarias o dicotómicas. las
categorías indican un orden de la clasificación y si se usan códigos
estableciendo un orden jerárquico entre los mismos. Como ejemplo
tenemos: 1<2<3 para la variable “severidad de una enfermedad” registrada
como leve=1, moderada=2, alta=3; contrariamente 1>2 para la variable.
 Media poblacional: Es conveniente usar el mayor de los tamaños
muéstrales. El mayor tamaño muestral conduce a mayor confiabilidad
porque produce que en la distribución de las medias, obtenidas con
muestras de dicho tamaño, los valores se encuentren más cercanos al valor
de su media poblacional el cual coincide con la media de la población de la
que se extrajeron las muestras.
 Media muestral y fórmula de cálculo: Es una medida cuantitativa,
derivada de un conjunto de datos de una muestra, con el objetivo de
estimar o inferir características de una población o modelo estadístico.
n
yi
ý=∑
i=1 n

 Varianza poblacional: Es un conjunto de valores, una medida de variación


igual al cuadrado de la desviación estándar. Varianza muestral: s2 el
cuadrado de la desviación estándar s. Varianza poblacional: s2 el cuadrado
de la desviación estándar poblacional s.
 Varianza muestral y fórmulas de cálculo: Es una variable aleatoria.
¿Cómo se distribuyen los valores de la varianza muestral? Dado que
tenemos todos los posibles valores de la varianza muestral ( s2) para las
muestras de tamaño n=2, podemos tabular y graficar la distribución de la
variable aleatoria varianza muestral.

n
1
Var ( y )=s2= =∑ ¿ ¿ s2=f ( s2 )
n−1 i=1

 Desviación estándar: Es la medida de dispersión más común, que indica


qué tan dispersos están los datos con respecto a la media se utiliza para
representar la desviación estándar de una población de igual manera se
utiliza para medir la desviación estándar de una muestra.

DE=S=√ s 2

 Mediana: Es el número central de un grupo de números ordenados por


tamaño, Cuando la cantidad de términos es par, la mediana es el promedio
de los dos números centrales: Para averiguar la mediana de un grupo de
números: Ordena los números según su tamaño.
 Moda: Son todos los valores de una variable que no están igualmente
distribuidos dentro del rango de variación, los valores se presentan con
diferentes frecuencias al valor que aparece con mayor frecuencia.
 Cuartiles o cuantiles: Son valores que dividen una muestra de datos en
cuatro partes iguales, 0,25; 0,50 y 0,75 (denotados como Q1, Q2 y Q3,
respectivamente). Es decir, se divide la distribución en cuartos y se calcula
el primer, segundo y tercer cuartil. Utilizando cuartiles puede evaluar
rápidamente la dispersión y la tendencia central de un conjunto de datos,
que son los pasos iniciales importantes para comprender sus datos. 25% de
los datos es menor que o igual a este valor. Los cuantiles pueden
obtenerse, o aproximarse, utilizando el polígono de la distribución de FRA.
Debemos proceder en forma similar a la antes indicada para obtener la
mediana: ubicar en el eje de las FRA el valor de la proporción a la que hace
referencia el nombre del cantil, cortar al polígono y luego bajar al eje X,
leyendo el valor del cuantil:

Aproximación de los cuantiles 0,30 y 0,70 de la distribución del peso (g) de


cabezas de ajo blanco utilizando el polígono de frecuencias relativas
acumuladas.

Fuente: http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=3221775&query=bioestadistica

 Percentiles: El nombre percentil se usa si en el eje de las FRA la escala se


expresa en porcentaje. Así, el cuantil 0,30 se corresponde con el percentil
30 y el cuantil 0,70 es sinónimo de percentil 70. En el ejemplo anterior se
puede decir que un 30% de cabezas de ajo tienen pesos menores o iguales
a 29 g y un 70%, pesan hasta 49 g o que un 30% pesan más que 49 g.
 Regla de Sturges: Es un criterio que se utiliza para determinar el número
de clases o intervalos que son necesarios para representar gráficamente un
conjunto de datos estadísticos.
 Frecuencia absoluta (FA): Se denomina frecuencia absoluta al número de
veces que el valor de la variable se repite en un conjunto de datos, la
frecuencia absoluta e indica las veces que se registró cada valor de la
variable discreta, o la cantidad de datos que hay en cada intervalo de clase
de la variable continua.
 Frecuencia relativa (FR): Es el total de datos, que se define al resultado
entre la correspondiente frecuencia absoluta y el total de datos. Estas FR
nos remiten a la idea de proporciones, que multiplicadas por 100 pueden
ser interpretadas como porcentajes.
 Frecuencia absoluta acumulada (FAA): Es el resultado de ir sumando las
frecuencias absolutas de las observaciones o valores de una población o
muestra. Para calcular la frecuencia absoluta acumulada, hay que calcular
primero la frecuencia absoluta (FA) de la población o muestra.
 Frecuencia relativa acumulada: Para calcular la frecuencia relativa
acumulada, hay que calcular primero la frecuencia absoluta (FA) y la
frecuencia relativa (FR) de los valores de la población o muestra. Para ello,
los datos se ordenan de menor a mayor y se colocan en una tabla. Una vez
hecho esto, la frecuencia relativa acumulada se obtiene de ir sumando las
frecuencias relativas de una clase o grupo de la muestra con la anterior
(primer grupo + segundo grupo, primer grupo + segundo grupo + tercer
grupo y así sucesivamente hasta llegar a acumular del primer grupo al
último).
 Tabla de frecuencias: Es una alternativa para presentar los resultados
mediante las tablas de frecuencias y los histogramas los resultados que me
puede mostrar las tablas de frecuencia puede ser: límites inferiores (LI) y
superiores (LS) de los intervalos de clase, marca de clase (MC),
frecuencias absolutas (FA) y frecuencias relativas (FR), frecuencias
absolutas acumuladas (FAA) y frecuencias relativas acumuladas (FRA).
Modificamos.

Fuente: http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=3221775&query=bioestadistica

 Tabla de frecuencias de una variable continua y de una discreta e


intervalos: Agrupadas en intervalos se presenta cuando la variable es
continua o cuando es discreta pero con elevado número de valores en esta
situación se agrupan dichos valores en intervalos o clases.

Variable discreta: se presentan cuando el número de valores que puede


presentar la variable no es muy elevado, y en ese caso podemos observar
todos los valores de esa variable. Este caso se presenta cuando la variable
es discreta y no presenta excesivos valores.

La amplitud del intervalo es la distancia que existe entre los extremos,


marca de clase es el punto medio de un intervalo, este punto es importante
porque es el representante del intervalo. Se llama densidad de frecuencia
de un intervalo a la frecuencia correspondiente a cada unidad de la variable
en dicho intervalo, los intervalos se suelen tomar abiertos por la izquierda y
cerrados por la derecha, salvo el primero que se toma cerrado por los dos
lados. En este tipo de distribuciones se pierde parte de la información al
agruparlas en intervalos, ya no se puede hablar de valores concretos sino
de intervalos, cuanto mayor sea la amplitud de los intervalos menos
intervalos habrá, esto hace menos precisa la información. En cambio,
cuanto menor sea la amplitud de los intervalos menos intervalos habrá, y
mayor será la precisión, sin embargo la distribución será más grande y más
difícil de manejar.
 Boxplot o diagrama de cajas: Son los valores que se representan en una
distribución señalando, además de los cuantiles y la presencia de valores
extremos o inusuales, la posición de la media y de la mediana.

Fuente: http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?docID=3221775&query=bioestadistica
 Histograma y en qué tipo de variables se usa: el histograma es
recomendado ser usado en un modelo probabilístico para una variable
aleatoria continua es recomendable graficar un histograma de frecuencias
relativas.
 Gráfico de barras: El gráfico de barras se usa para representar datos de
variables categorizadas, la distribución de un conjunto de datos se
encuentra situada en un intervalo de valores, ya que en todo conjunto de
datos hay un valor mínimo y un valor máximo, esta diferencia entre dichos
valores es el rango o recorrido de la distribución.

Evidencia de participación en la webconference I (pantallazo) o en su


defecto informe de la grabación (mínimo dos páginas).
Actividad colaborativa:

VARIABLES CUANTITATIVAS CONTINUAS

VARIABLE EDAD: es una variable continua, ya que se pueden tener 10.5


años esto indica que admite decimales:

Edad: 18.4,19.2,19.6,23,20,20.4,19.4,21.4,18,24,17,22,15,22,25.

Variable
Valor Variable Discreta HERMANOS
continua EDAD
Media (mean)  20.29333  2.2
Mediana (median)  20  2
# de datos (length)  15  15
Mínimo (min)  15  0
Máximo (max)  25  5
Varianza (var)  7.182095  --
Desviación stándar
 2.679943  1.473577
(SD)
Rango (range)  15 25  0 5
Cuantil 25%  18.8  1
Cuantil 50%
 20  2
(mediana)
Cuantil 75%  22  3
Histograma de la variable edad con la regla de Sturges:

Histograma con Regla de Sturges variable edad

5
4
F re q u e n c y

3
2
1
0

16 18 20 22 24

edad

Los valores mínimo y máximo: 15 y 25 años, respectivamente.


Moda: 19 y 21 años
Rango intercuartílico: 3.2

Ordenados de menor a mayor: 15.0 17.0 18.0 18.4 19.2 19.4 19.6 20.0 20.4
21.4 22.0 22.0 23.0 24.0 25.0
Número de intervalos: 5
Límites de los intervalos: 15.0 17.5 20.0 22.5 25.0
El promedio del primer cuantil del 25% es menor o igual a los 18.8 años
El promedio del segundo cuantil del 50% es menor o igual a los 20 años
El promedio del tercer cuantil del 75% es menor o igual a los 22 años
Histograma de la variable continua Edad

5
4
Frecuencia

3
2
1
0

14 16 18 20 22 24 26

edad

La frecuencia de edad de los 14 a los 16 años es de 1


La frecuencia de edad de los 16 a los 18 años es de 2
La frecuencia de edad de los 18 a los 20 años es de 5
La frecuencia de edad de los 20 a los 22 años es de 4
La frecuencia de edad de los 22 a los 24 años es de 2
La frecuencia de edad de los 24 a los 26 años es de 1
Boxplot o diagrama de cajas variable continua

24
22
Edad (años)

20
18
16

Medidas resumen:

n 15
Media 20.00
D.E. 12.9
Var(n-1) 7.182095
Mín 15.00
Máx 25
Mediana 20
P(25) 18.80
P(75) 22.00
VARIABLES CUANTITATIVAS DISCRETAS

Hermanos: 0,1,4,1,2,3,2,3,1,2,0,5,4,3,2
Presentar en el informe grupal los siguientes resultados en un cuadro,
explicando cada uno de ellos:

Valor Variable Discreta HERMANOS


Media (mean)  2.2
Mediana (median)  2
# de datos (length)  15
Mínimo (min)  0
Máximo (max)  5
Varianza (var)  --
Desviación stándar
 1.473577
(SD)
Rango (range)  0 5
Cuantil 25%  1
Cuantil 50%
 2
(mediana)
Cuantil 75%  3
Boxplot o diagrama de cajas variable discreta

5
4
número de hermanos

3
2
1
0

La grafica anterior indica que el numero de hermanos es de 0 a 5 donde el


menor tiene o años y el mayor tiene una edad de 5 la edad media es menor
o igual a 2 y el 25% de edad es menor o igual 1 y el 75 % de la edad es
menor o igual a 3.
Diagrama de barras Frecuencia Absoluta

4
F re cu e n cia s a b so lu ta s

3
2
1
0

0 1 2 3 4 5

Número de hermanos

Frecuencias Numero de hermanos


0 2
1 3
2 4
3 3
4 2
5 1
Diagrama de barras Frecuencia relativa

0 .2 5
F re c u e n c ia s re la tiv a s

0 .2 0
0 .1 5
0 .1 0
0 .0 5
0 .0 0

0 1 2 3 4 5

Número de hermanos

La grafica indica que o hermanos tienen 14 años, 1 hermano tiene 20 años,


2 hermanos tienen 26 años, 3 hermanos tienen 20 años, 4 hermanos tiene
14 y 5 hermanos tiene 5 años.

Diagrama de barras Frecuencias relativas acumuladas


1 .0
F re c u e n c i a s re l a ti v a s

0 .8
0 .6
0 .4
0 .2
0 .0

0 1 2 3 4 5

Número de hermanos
Grafico de tarta de Hermanos

0
2

4
3

Si observamos la gráfica podemos concluir que en el mayor número de


hermanos se encuentran 2 y menor número de hermanos es cinco

VARIABLES CUALITATIVAS
A continuación tomaremos como ejemplo la variable categórica "Nivel de
estudios" de los agricultores pertenecientes a una misma vereda.

 Para poder codificar lo que cada agricultor respondió, se le asigna un


número a cada nivel de estudio:
 Nivel de estudios: 0:“Sin estudios”; 1: “Estudios Primarios”; 2:
“Estudios Secundarios”; 3:“Estudios Superiores”

Estudios: 1,2,0,1,0,1,1,2,3,2,3,1,2,3

Diagrama de barras frecuencias absolutas nivel de estudio de agricultores


5
4
Frecuencias absolutas

3
2
1
0

Sin estudios Estudios Secundarios


Diagrama de barras frecuencias relativas nivel de estudio de agricultores

0.35
0.30
0.25
Frecuencias relativas

0.20
0.15
0.10
0.05
0.00

Sin estudios Estudios Secundarios


Boxplot o diagrama de cajas variable continua

24
22
E dad (años)

20
18
16

En la grafica de edad en años podemos decir que entre los 15 años y los 25
años la edad media es menor o igual a 20 años, el cuantil 25% es menor o
igual a los 19 años y el Cuantil 75% es menor o igual a los 22 años.
Conclusiones.

Con el desarrollo de este trabajo y mediante la bibliografía sugerida de


manera grupal se analizaron e interpretaron fundamentos de los tipos de
variables estadísticas cuantitativas y cualitativas y su forma de
procesamiento mediante el programa RGui, se generó mayor destreza en el
análisis e interpretación de datos.
Referencias bibliográficas

Balzarini, M. (2013). Estadística y biometría: ilustraciones del uso e infostat


en problemas de agronomía. Recuperado de
http://bibliotecavirtual.unad.edu.co:2460/lib/unadsp/reader.action?
docID=3221775&query=bioestadistica

Maronna, Ricardo A. Octubre de 1995. Probabilidad y Estad´ıstica


Elementales para Estudiantes de Ciencias. Facultad de Ciencias Exactas
Universidad Nacional de La Plata. Recuperado de:
http://www.mate.unlp.edu.ar/~maron/MaronnaHome_archivos/Probabilidad
%20y%20Estadistica%20Elementales.pdf

Das könnte Ihnen auch gefallen