Sie sind auf Seite 1von 37

UNIVERSIDAD NACIONAL DEL CENTRO DEL PERÚ

FACULTAD DE INGENERÍA QUÍMICA

ESCUELA PROFESIONAL INGENERÍA QUÍMICA AMBIENTAL

DETERMINACIÓN ESTADIGRAFOS DEL PESO DE 110 SEMILLAS


DE HABAS(VICIA FABA) MEDIANTE LAS MEDIDAS DE
TENDENCIA CENTRAL, DISPERCICION Y POSICIÓN REALIZADO
EN LA FACULTAD DE INGENERIA QUÍMICA

CATEDRA:

ESTADISTICA Y DISEÑO EXPERIMENTAL

CATEDRATICO:

PALACIOS VELÁSQUEZ, Abraham Arsenio

PRESENTADO POR:

 VILA ROMERO, Mayumi Liny


HYO-PERÚ

2018
RESUMEN

El presente trabajo tiene como objetivo la determinación estadígrafos del peso


de 110 semillas de habas (vicia faba) mediante las medidas de tendencia central,
dispersión y posición realizada en la facultad de ingeniería química

Los pesos de las semillas de las muestra de 100 unidades es para saber el peso
promedio que los caracteriza.

Los pesos fueron registrados en la facultad de ingeniería quimica siendo el


instrumento principal de medición, la balanza analítica. Para nuestro análisis hemos
tomado los datos de los pesos.

Se construyó la tabla de frecuencia y con ello se determinó las medidas de


tendencia central, medidas de posición y medidas de dispersión.

La media aritmética es….., la mediana es …..y la moda es…..

El cuartil 1 es…., el Decil 1 es…, el percentil 37 es…..

La varianza es….., la desviación estándar es ……y el coeficiente de variación es


de …..

2
I. INTRODUCCION

Existen diferentes razones por las cuales los profesionales deben conocer los
fundamentos de la estadística como instrumento del trabajo cotidiano.

Cuando se realiza un estudio de investigación, se pretende generalmente inferir o


generalizar resultados de una muestra a una población. Se estudia en particular a
un reducido número de individuos a los que tenemos acceso con la idea de poder
generalizar los hallazgos a la población de la cual esa muestra procede. Este
proceso de inferencia se efectúa por medio de métodos estadísticos basados en la
probabilidad.

La población representa el conjunto grande de individuos que deseamos estudiar y


generalmente suele ser inaccesible. Es, en definitiva, un colectivo homogéneo que
reúne unas características determinadas.

La muestra es el conjunto menor de individuos (subconjunto de la población


accesible y limitado sobre el que realizamos las mediciones o el experimento con
la idea de obtener conclusiones generalizables a la población). El individuo es cada
uno de los componentes de la población y la muestra. La muestra debe ser
representativa de la población y con ello queremos decir que cualquier individuo de
la población en estudio debe haber tenido la misma probabilidad de ser elegido.

La Estadística Descriptiva, se encarga de recopilar la información de una muestra


aleatoria, esta información tiene que ser ordenada para una buena presentación;
Esta ordenación se basa en las llamadas Tablas de Frecuencias y también en los
Gráficos Estadísticos.

A continuación realizaremos el estudio de los datos del peso de 110 semillas de


habas (vicia faba) en la facultad de ingeniería química.

3
II. OBJETIVOS

2.1 OBJETIVO GENERAL

 Determinar el peso de 110 semillas de habas (vicia faba) mediante el análisis


de datos estadísticos en la facultad de ingeniería química.

2.2 OBJETIVOS ESPECIFICOS

 Elaborar la tabla de frecuencias para los pesos de 110 semillas de habas


(vicia faba)
 Determinar los elementos de la tabla de frecuencias para los pesos de
habas.
 Determinar las medidas de tendencia central (media aritmética, mediana y
moda).
 Determinar las medidas de posición (cuartiles, deciles y percentiles).
 Determinar las medidas de dispersión (varianza, desviación estándar y
coeficiente de variación).

4
III. MARCO TEORICO

3.1 Habas

La Vicia faba (Habas) es una planta anual de porte recto con un sistema radicular
muy desarrollado. Sus flores son axilares y crecen agrupadas en racimos cortos de
dos a ocho flores. Poseen una mancha grande característica de color negro o
violeta en sus pétalos. Una vez fecundadas, el fruto es una legumbre de longitud
variable que puede llegar a superar los 30 centímetros y en ella entre cuatro y diez
semillas. El color de estas es verde amarillento en su madurez, más o menos
oscuras según la variedad. Se cultiva para aprovechar sus semillas, empleadas en
alimentación humana y animal. Es la especie tipo, la que da nombre a la
familia fabáceas}

El haba tiene porte recto y erguido, con tallos fuertes y angulosos de hasta
1,6 metros de altura. Sus hojas aparecen sobre el tallo en disposición alterna, son
compuestas paripinnadas. Los foliolos son de forma oval-redondeada, color verde
oscuro. Como en otras especies del género Vicia, tienen un zarcillo terminal, pero
en el haba este es rudimentario e inútil para trepar.

Las flores se presentan agrupadas, de 5 a 8, en el extremo de una corta espiga,


que nace a su vez de la axila de las hojas superiores. Son grandes, comparadas
con las de otras especies del género, alcanzan 4 cm. La corola es papilionácea,
formada por cinco pétalos desiguales, blancos o algo amarillentos. Los dos pétalos
laterales o alas tienen una mancha púrpura oscura o negra, angulosa. El pétalo
superior o estandarte está surcado por venas radiales de color oscuro, de tono y
anchura atenuados hacia el borde. Las flores son hermafroditas y autofértiles.
(Torres, 2015)

Las semillas son reniformes, de tamaño más o menos grande, dependiendo


también de la variedad, y de color verde amarillento que luego, al sobre madurar,
se vuelve bronceado. También hay variedades de grano negruzco y morado.

5
El peso de una semilla es de uno a dos gramos. El poder germinativo dura de 4 a
6 años. En la semilla comercial el porcentaje mínimo de germinación es del 90 por
100 y la pureza mínima del 99 por 100.

Ilustración 1a) Vista longitudinal de la semilla madura de Vicia faba L. b) germinación


hipogea de la semilla y crecimiento de la plántula

La raíz del haba crece en profundidad hasta alcanzar un largo similar al del tallo de
la planta. Como otras fabáceas, los nódulos de la misma tienen la propiedad de
fijar nitrógeno en el suelo; aunque hasta un 80% del mismo es consumido por la
propia planta, el 20% restante mejora la fertilidad de la tierra, por lo que el cultivo
se emplea en sistemas de rotación para fortalecer suelos agotados. (Confalone,
2008)

3.1.1.-Variedades de habas:
Más que tipos de Habas se debe de hablar de variedades. Las más populares o
más cultivadas son:

Granadina. - Es una variedad destinada tanto a su consumo en verde cómo


también para grano. Sus semillas son bastante grandes y poseen una coloración
clara. Esta variedad es de producción más limitada comparada con el resto de las
variedades cultivadas en España, pero es la que mejor resiste el frío.

Mahón blanca y morada. - Es la variedad más resistente a la sequía, aunque


también la más sensible al frío. Se destina tanto para el consumo humano como
para el ganado.

6
En condiciones favorables de humedad y suelo alcanzan un porte superior al metro
de altura. Tiene poca tendencia al ahijamiento y sus vainas crecen semi-erguidas,
son estrechas y contienen de 5 a 6 granos.

Es una variedad precoz y está destinada a verdeo. La planta es de porte alto, con
flores blancas y con una mancha negra. Sus vainas no son muy largas ya que miden
entre 15 y 20 centímetros. El número de granos por vaina es de 3 a 7 unidades
(Torres, 2015).

3.1.3.-Valor nutricional:

La composición química para 100 gramos de habas frescas es la siguiente:

 Agua ............................................................. 65-70%


 Hidratos de carbono ....................................... 17-20%
 Proteínas ........................................................ 7-9%
 Grasas ......................................................... 0,4-0,7%
 Celulosa .......................................................... 2,75%
 Sales minerales y vitaminas .............................. 2,50%

El pH oscila de 5 a 6; y cien gramos de producto fresco proporcionan de 70 a


100 calorías.

Las sales minerales están representadas de la siguiente forma para 100 gramos de
producto fresco:

 Calcio ............................................................ 105 mg


 Potasio ....................................................... 1.390 mg
 Fósforo .......................................................... 600 mg
 Magnesio ....................................................... 240 mg
 Cobre ................................................................ 3 mg
 Hierro ................................................................ 2 mg

Las vitaminas están representadas de la siguiente forma:

 Vitamina A ............................................. 200 U.I./100 g producto fresco.


 Vitamina B1.......................................... 0,30 mg/100 g producto fresco.
7
 Vitamina B2 (riboflavina)......................... 0,18 mg/100 g producto fresco.
 Niacina (ácido nicotínico)....................... 1,80 mg/100 g producto fresco.
 Vitamina C .......................................... 25,00 mg/100 g producto fresco.

3.1.4.-Beneficios de las habas:


 Las habas favorecen el tránsito intestinal.
 Las flores de haba se pueden emplear como depurativas, diuréticas y
antirreumáticas.
 El consumo de habas como alimento es muy útil para eliminar grasa de las
arterias, disminuyendo el colesterol.
 Se cree que las habas son afrodisíacas.
 Su contenido en lecitina y colina ayuda a mejorar los síntomas del alzheimer.
La semilla constituye la primera fase del desarrollo de la nueva planta y las partes
esenciales de ésta son las cubiertas seminales y el embrión. (Torres, 2015)

3.2 ESTADISTICA

La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos


por las observaciones, para poder hacer comparaciones y sacar conclusiones.
(Barbero, 2004)
Un estudio estadístico consta de las siguientes fases.
 Recogida de datos
 Organización y representación de los datos
 Análisis de los datos
 Conclusiones del estudio

3.2.1.-Conceptos de Estadística:
Población: Una población es el conjunto de todos los elementos a los que se
somete a un estudio estadístico.

Individuo Un individuo o unidad estadística: es cada uno de los elementos que


componen la población.

Muestra: Una muestra es un conjunto representativo de la población de referencia,


el número de individuos de una muestra es menor que el de la población.

8
Muestreo: El muestreo es la reunión de datos que se desea estudiar, obtenidos de
una proporción reducida y representativa de la población.

3.2.2-Estadística descriptiva:
Obtenidos a través de encuestas, experimentos o cualquier otro conjunto de
medidas, los datos estadísticos suelen ser tan numerosos que resultan
prácticamente inútiles si no son resumidos de forma adecuada. Para ello la
Estadística utiliza tanto técnicas gráficas como numéricas, algunas de las cuales
describimos en este capítulo. Podemos decir que existe una clasificación, un tanto
artificial, de los datos, según se refieran a una población tangible, en cuyo caso se
conocerán todos los casos, o a una población conceptual, en cuyo caso sólo se
conocerá una muestra (aleatoria simple). (Raymond H. Myers (Autor), 2000)

3.2.4 Métodos gráficos y numéricos para describir datos cualitativos:

La forma más sencilla de describir de forma numérica una variable cualitativa es


determinar su distribución de frecuencias. Por su parte, esta distribución de
frecuencias determina a su vez las representaciones gráficas más usuales.
Supongamos que tenemos una variable cualitativa, que toma una serie de posibles
valores (categorías). El número de veces que se da cada valor es la distribución de
frecuencias de la variable. Si en vez de dar el número de veces nos fijamos en la
proporción de veces, tenemos la distribución de frecuencias relativas
Las representaciones gráficas más usuales son los diagramas de barras y los
diagramas de sectores.

Figure 1 Tabla de frecuencias

9
3.3 Métodos Gráficos

La forma de la distribución de frecuencias se percibe más rápidamente si la


representamos gráficamente. Se resume la información de la muestra de forma
gráfica con fines clarificadores o para enfatizar y descubrir determinadas
características que de otra manera seria muy difícil de apreciar. Un gráfico siempre
es más inmediato de comprender que un conjunto de datos estadísticos. Las
representaciones graficas varían según el tipo de variable:

Diagrama de barras:
Es la representación gráfica usual para variables cuantitativas discretas o para
variables cualitativas. En el eje de ordenadas representamos los diferentes valores
de la variable (xi). Sobre cada valor levantamos una barra de altura igual a la
frecuencia (absoluta o relativa). Ejemplo:

Ilustración 2copiado de tabla de datos blog

Diagrama de sectores o de pastel:


Es el más usual en variables cualitativas. Se representan mediante círculos. A cada
valor de la variable se le asocia el sector circular proporcional a su frecuencia.

10
Ilustración 3copiado de tabla de datos blog

3.3.1 Gráficos para variables continúas:


Histograma: Es la representación gráfica de las frecuencias agrupadas de una
variable continua sobre intervalos. A diferencia de los diagramas de barras, los
histogramas dibujan rectángulos unidos entre si, lo que significa que existe
continuidad en la variable cuyos valores se expresan

Ilustración 4copiado de tabla de datos blog

El histograma o diagrama de barras proporcionan mucha información respecto a la


estructura de los datos, nos permite evidenciar fundamentalmente tres
características:

 Forma de la distribución.

11
 Acumulación o tendencia posicional (valor central de la distribución).
 Dispersión o variabilidad. Cuando nos encontramos en distribuciones donde
los intervalos no tienen la misma amplitud, las barras del histograma tienen que
tener un área proporcional a la frecuencia que queramos representar

3.4 Medidas de tendencia central


Las medidas de tendencia central son medidas de posición que tratan de establecer
un valor que pueda considerarse el centro de los datos en algún sentido.

Media
Sea un conjunto de datos de una variable cuantitativa, x1,..., xn. La media de los
datos es:

∑ni=1 xi
x̅ =
n

Esta medida es la más común dentro de las de tendencia central y corresponde al


centro de gravedad de los datos. Es inmediato comprobar que, si se realiza un
cambio de origen y escala sobre los datos, del tipo y = ax + b, la media sufre
el mismo cambio, es decir, y¯ = ax¯ + b. De igual forma, si tenemos datos de la
suma de dos o más variables, la media de la suma es la suma de las medias de
cada variable.

Mediana
Sea un conjunto de datos de una variable cuantitativa, x1,..., xn. Ordenemos la
muestra de menor a mayor, x (1),..., x(n).

La mediana es el valor de la variable que deja el mismo número de datos antes y


después que él, una vez ordenados estos.

El cálculo de la mediana dependerá de si el número de datos, n, es par o impar

n+1
Si n es impar, la mediana es el valor que ocupa la posición una vez que los datos
2

han sido ordenados (en orden creciente o decreciente), porque éste es el valor
central. Es decir:

Me = x(n+1)
2

12
Si n es par, la mediana es la media aritmética de las dos observaciones centrales.
Cuando n es par, los dos datos que están en el centro de la muestra ocupan las
n n
posiciones y 2 + 1. Es decir:
2

x(n) + x(n+1)
2 2
Me =
2

La mediana corresponde exactamente con la idea de valor central de los datos. De


hecho, puede ser un valor más representativo de éstos que la media, ya que es
más robusta que la media.

Moda o intervalo modal


En principio la moda se define como el valor más frecuente de los datos. Lo que
ocurre es que, si éstos son datos de una variable continua o discreta con muchos
valores, puede que los datos apenas se repitan. En ese caso, en el que, como
vimos en las representaciones gráficas, se debe agrupar por intervalos, no debe
darse un valor como moda, sino un intervalo modal, aquél con mayor frecuencia
asociada.

Cuartiles:

Los cuartiles son medidas de posición, pero no necesariamente ligados al centro


de los datos. La idea a la que responden es muy sencilla y muy práctica. Se trata
de valorar de forma relativa cómo es un dato respecto del conjunto global de todos
los datos.

El cuartil p (Qp) de unos datos (0 ≤ p ≤ 1), sería un valor de la variable situado de


modo que el 100p % de los valores sean menores o iguales que él y el resto (100(1
− p) %) mayores.

No obstante, en la práctica vamos a encontrar un problema para encontrar cuartiles,


sobre todo con pocos datos: lo más habitual es que no exista el valor exacto que
deje a la izquierda el 100p % de los valores y el resto a la derecha. Por ese motivo,
los programas estadísticos utilizan unas fórmulas de interpolación para obtener el

13
valor del cuartil entre los dos valores de los datos que lo contienen. En nuestro
caso, a la hora de obtener cuartiles, las aplicaciones de esas fórmulas de
interpolación a mano harían muy lentos y pesados los cálculos, por lo que vamos a
aplicar un convenio mucho más sencillo: aproximaremos el valor del cuantil
correspondiente de la siguiente forma:

Si el 100p % de n, donde n es el número de datos, es un entero ,k, entonces:

xk + xk+1
Qp =
2

Si el 100p % de n no es un entero, lo redondeamos al entero siguiente, k, y


entonces:

Qp = x(k)

No olvidemos, sin embargo, que los programas estadísticos van a utilizar las
fórmulas de interpolación para calcular el valor de los cuartiles, de manera que no
debe extrañar si se observan pequeñas diferencias al comparar nuestros resultados
a mano con los de estos programas.

Existen diversos nombres para referirse a algunos tipos de cuartiles. Entre ellos:

Los percentiles son los cuartiles que dividen la muestra en 100 partes, es decir,
son los cuartiles 0.01 (percentil 1), 0.02 (percentil 2), ..., 0.99 (percentil 99). Si
notamos por Pα al percentil α, con α = 1, 2, 3, ..., 99, se tiene que Pα = Qα/100. En
Estadística Descriptiva es más frecuente hablar de percentiles que de cuartiles
porque se refieren a cantidades entre 0 y 100, en tanto por ciento, que son más
habituales de valorar por todo el mundo.

Los cuartiles dividen a la población en cuatro partes iguales, es decir, corresponden


a los cuartiles 0.25, 0.5 (mediana) y 0.75.

3.4 Medidas de variación o dispersión

Las medidas de variación o dispersión están relacionadas con las medidas de


tendencia central, ya que lo que pretenden es cuantificar cómo de concentrados o
dispersos están los datos respecto a estas medidas. Nosotros nos vamos a limitar
14
a dar medidas de dispersión asociadas a la media. La idea de estas medidas es
valorar en qué medida los datos están agrupados en torno a la media. Esta cuestión
tan simple es uno de los motivos más absurdos de la mala prensa que tiene la
Estadística en la sociedad en general. La gente no se fía de lo que ellos llaman la
Estadística entre otros motivos, porque parece que todo el mundo cree que una
media tiene que ser un valor válido para todos, y eso es materialmente imposible.

Varianza muestral:
Dados unos datos de una variable cuantitativa, x1,..., xn, la varianza muestral de
esos datos es

𝟐
∑𝐧𝐢=𝟏(𝐱 𝐢 − 𝐱̅)𝟐
𝐒𝐧−𝟏 =
𝐧−𝟏

Cuanto mayor sea la varianza de unos datos, más dispersos, heterogéneos o


variables son esos datos. Cuanto más pequeña sea una varianza de unos datos,
más agrupados u homogéneos son dichos datos.

En lo que respecta al comportamiento de la varianza muestral frente a cambios de


origen y escala, sólo le afectan los segundos. Es decir, si tenemos que y = ax + b,
se verifica que

𝟐
𝐒𝐲;𝐧−𝟏 = 𝐚𝟐

𝟐
𝐬𝐱;𝐧−𝟏

Finalmente, si bien habíamos comentado que en el caso de la media, si tenemos la


suma de varias variables, la media total es la suma de las medias de cada variable,
no ocurre así con la varianza en general.

Desviación típica o estándar muestral


El principal problema de la varianza es su unidad de medida. Por cómo se define
si, por ejemplo, la variable se expresa en kilos, la media también se expresa en
kilos, pero la varianza se expresa en kilos2, lo que hace que sea difícil valorar si
una varianza es muy elevada o muy pequeña.

Es por ello que se define la desviación típica o estandar muestral de los datos como:
15
𝟐
𝐒𝐧−𝟏 = √𝐒𝐧−𝟏

3.6 Tablas de distribución de frecuencias y gráficos para variables discretas

Una tabla de distribución de frecuencias posee una columna que contiene los
diferentes valores que toma la variable en estudio y otra columna que indica la
frecuencia absoluta.

se denomina frecuencia absoluta al número de veces que el valor de la variable se


repite en el conjunto de datos. Simbolizando con xi, i = 1,2, 3…, m, a los distintos
valores observados para la variable X y por ni a la frecuencia absoluta del valor xi,
podemos agrupar los datos en una tabla de frecuencias de la siguiente manera:

Con 𝐧 = 𝐧𝟏 + 𝐧𝟐 + 𝐧𝟑 + ⋯ + 𝐧𝐦 = ∑𝐦
𝐢=𝟏 𝐧𝐢 ; representando el número total de

Ilustración 5: tabla de frecuencias

observaciones. Generalmente en una tabla de distribución de frecuencias no sólo


se muestran las frecuencias absolutas, sino que también se incluyen las
frecuencias relativas y las frecuencias acumuladas (absolutas y relativas).

3.7.-tablas de frecuencias con datos agrupados

Cuando los valores de la variable son muchos, conviene agrupar los datos
en intervalos o clases para así realizar un mejor análisis e interpretación de ellos.
• Para construir una tabla de frecuencias con datos agrupados, conociendo los
intervalos, se debe determinar la frecuencia absoluta (fi) correspondiente a cada
intervalo, contando la cantidad de datos cuyo valor está entre los extremos del
intervalo. Luego se calculan las frecuencias relativas y acumuladas, si es
pertinente.
16
• Si no se conocen los intervalos, se pueden determinar de la siguiente manera:
(recuerda que los intervalos de clase se emplean si las variables toman un número
grande de valores o la variable es continua).

1) Calcule el Rango (R).- También se llama recorrido o amplitud total. Es la


diferencia entre el valor mayor y el menor de los datos.

2) Seleccione el Número de Intervalos de Clase (ni).- No debe ser menor de 5 y


mayor de 12, ya que un número mayor o menor de clases podría oscurecer
el comportamiento de los datos. Para calcular el número de intervalos se aplica la
regla de Sturges:

3) Calcule el Ancho del Intervalo (i).- Se obtiene dividiendo el Rango para el


número de intervalos

𝑹
𝒊=
𝒏𝒊

4) Organización de los datos


Distribuciones de frecuencias
La distribución de frecuencia es una disposición tabular de datos estadísticos,
ordenados ascendente o descendentemente, de acuerdo a la frecuencia de cada
dato. Las frecuencias pueden ser:

Frecuencia absoluta (fi):


Es el número de veces que se repite un determinado valor de la variable (xi). Se
designa por fi. PROPIEDAD: la suma de todas las frecuencias absolutas es igual al
total de observaciones (n).
17
Frecuencia acumulada (fi):
Las frecuencias acumuladas de una distribución de frecuencias son aquellas que
se obtienen de las sumas sucesivas de las fi que integran cada una de las filas de
una distribución de frecuencia, esto se logra cuando la acumulación de las
frecuencias se realiza tomando en cuenta la primera fila hasta alcanzar la última.
Las frecuencias acumuladas se designan con las letras Fi. Se calcula:

𝑭𝒊 = ∑ 𝒇𝒋 = 𝑭𝒊−𝟏 + 𝒇𝒊
𝒋=𝟏

Frecuencia relativa (hi):


Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el
número total de datos. Las frecuencias relativas se designan con las letras 𝒉𝒊 . Se
calcula

𝒇𝒊
𝒉𝒊 =
𝒏

Frecuencia relativa acumulada (hi):


Es aquella que resulta de dividir cada una de las frecuencias acumuladas entre
número total de datos. Se designa con las letras 𝑯𝒊 . Se calcula;

𝑭𝒊
𝑯𝒊 =
𝒏

18
3.8.1 distribución de frecuencias absolutas
Es la representación estructurada en forma de tabla de toda la información que se
ha recogido sobre la variable que se estudia, es decir, es una tabla que presenta
de manera ordenada los distintos valores de una variable y sus correspondientes
frecuencias. Su forma más común es la siguiente:

Ilustración 6: tabla de frecuencias google

3.8.2 cálculo de la media para datos agrupados


Cuando se trabaja con la distribución de frecuencia agrupada, se parte del supuesto
de que todos los datos comprendidos en un intervalo de clase se distribuyen
uniformemente a lo largo de este, entonces se puede tomar la marca de clase o
punto medio (X) del intervalo como adecuada representación de los valores que
conforman el mencionado intervalo.

𝒔𝒖𝒎𝒂(𝒎𝒂𝒓𝒄𝒂 𝒅𝒆 𝒄𝒍𝒂𝒔𝒆 𝒙 𝒇𝒓𝒆𝒄𝒖𝒆𝒏𝒄𝒊𝒂 𝒂𝒅𝒔𝒐𝒍𝒖𝒕𝒂)


̅=
𝑿
𝒕𝒐𝒕𝒂𝒍 𝒅𝒂𝒕𝒐𝒔

3.8.3 la mediana en datos agrupados


 Se elabora la tabla de frecuencia de datos con sus diferentes intervalos de
clases, se ubican las frecuencias fi y se calculan las frecuencias acumuladas Fi de
esa distribución.

 Se determina la ubicación o posición de la mediana en el intervalo de la


𝒏
distribución de frecuencia, mediante la formula 𝟐. El resultado obtenido determinará

la clase donde se encuentra ubicada la mediana, lo cual se conseguirá en la clase


donde la frecuencia acumulada Fi sea igual o superior a este resultado. Luego se
aplica la fórmula:

19
𝒏
+ 𝑭(𝒊−𝟏)
𝑴𝒆 = 𝑳𝒊 + [𝟐 ] 𝑰𝒄
𝒇𝒊

Donde:
𝒏
= posicion de la mediana
𝟐

Li = Es el límite inferior de la clase donde se encuentra ubicada la mediana.

F(i−1) =Es el valor de la frecuencia acumulada anterior a la clase mediana.

fi =Es el valor de la frecuencia de clase donde se encuentra la median

Ic = Es el tamaño del intervalo de clase

n = es el número total de datos de la distribución en estudio.

3.8.4 características de la mediana


• La mediana no es afectada por los valores extremos de una serie de valores,
puesto que la misma no es calculada con todos los valores de la serie.

• La mediana no está definida algebraicamente, ya que para su cálculo no


intervienen todos los valores de la serie.

• La mediana en algunos casos no se puede calcular exactamente y esto ocurre


cuando en una serie de valores para datos no agrupados el número de datos es
par, en este caso la mediana se calcula aproximadamente.

• La mediana se puede calcular en aquellas distribuciones de frecuencia de clases


abierta, siempre y cuando los elementos centrales puedan ser determinados.

• La suma de los valores absolutos de las desviaciones de los datos individuales


con respecto a la mediana siempre es mínima. (Propiedad)

20
3.8.5 Moda

Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias


con datos agrupados, hablaremos de intervalo modal.

La moda se representa por Mo

fi − fi−1
Mo = Li + xt
(fi − fi−1 ) + (fi − fi+1 ) i

Li=Extremo inferior del intervalo modal (intervalo que tiene mayor frecuencia
absoluta).

fi =Frecuencia absoluta del intervalo modal.

fi-1 =Frecuencia absoluta del intervalo anterior al modal.

fi+1= Frecuencia absoluta del intervalo posterior al modal.

21
IV. PARTE EXPERIMENTAL

4.1 RECOLECCION DE DATOS

Los datos se recolectaron en el laboratorio de ingeniería química mediante la


balanza analítica de 110 semillas de habas (vicia faba)
Cuadro c 1.1 0.7 1.2 1.1 1.1 1.8 1.2 1.6 1.4 1
N° 1: 1.4 1 1.4 1.3 1.3 1.5 1.3 1.3 1.8 1.2 0.9
1.4 1.5 1.2 1.1 1.3 1 1.7 0.9 1.7 1.3 1.2
Datos 1.2 1.4 1.2 0.7 1.4 1.2 1.3 1.6 1.1 0.9 1.6
del peso 1.2 1.2 1.1 1.6 1.6 1.2 1.4 1.4 1.4 1.2 1
1.1 1.2 0.8 0.9 1 1.3 1.4 1.4 1.7 1.2 0.7
de la
1 1.6 1.3 1 1.3 0.9 1 0.7 0.8 1.5 1.5
semilla 1 1.3 1 1.5 1.5 1.4 1.3 1.8 1.6 1.5 1.4
de habas 0.9 0.9 1.5 1.4 1.4 1.2 1.4 1.3 1.2 0.9 1.1
0.8 1.5 0.9 1.1 1.2 1 1.5 1.5 0.8 1.2 0.9
(vicia
faba)
Fuente: elaboración propia

4.2. ORGANIZACIÓN DE DATOS

- CONSTRUCCION DE TABLA DE FRECUENCIA POR INTERVALOS DE


CLASE

Se construye una tabla de frecuencia por intervalos de clase para los pesos de 110
semillas de habas (vicia faba).
1° Paso: Determinar Longitud de Clase (Rango):

R = Mayor Valor - Menor Valor

2° Paso: Determinar el Número de Intervalos (k):

Si n < 100, entonces k  1  3,3 * log( n) ; Si n > 100, entonces k  n

3° Paso: Determinemos el Tamaño de los Intervalos (c):

R
C 
N  de Intervalos

4° Paso: Fijar el Límite Inferior y el Límite Superior de cada Intervalo.


22
Intervalo de
clase
[I1 - I2>
[I2- I3>




[Ik-1- Ik>

5° Paso: Determinar la Marca de Clase y completar las frecuencias.

Para facilitar el manejo de una tabla de distribución de frecuencias de datos


agrupados en intervalos de clases, se acostumbra a trabajar con un solo valor de
cada intervalo, llamado Marca de Clase (xi), que corresponde a la semi-suma de
los límites de cada intervalo.
Límite Inferior  Límite Superior
xi 
2

- Tabla de Distribución de Frecuencias


𝒇𝒊
hi=
Ii-1 - Ii xi fi Fi 𝒏 %hi Hi %Hi

[I1 - I2> X1 f1 F1= f1 h1 h1*100 H1= h1 H1*100


[I2- I3> X2 f2 F2 h2 h2*100 H2 H2*100
… … … … … … … …
… … … … … … … …
… … … … … … … …
… … … … … … … …
[Ik-1- Ik> Xk fk Fk = n hk hk*100 Hk=1 100.0
TOTAL n 1 100

- Frecuencia absoluta (fi): Es el número de veces que se repite un determinado


valor (xi) de la variable.

m
 fi = n
i=1

- Frecuencia absoluta acumulada (Fi):


F1=f1
F2=f1+f2
.
23
.
Fk=f1+f2+f3...+fk = n

- Frecuencia relativa (hi):

fi
hi 
n

- Frecuencia relativa acumulada (Hi)

H1=h1
H2=h1+h2
.
.
Hk=h1+h2+h3...+hk = 1

También:
Fi
Hi 
n

1.1. MEDIDAS DE TENDENCIA CENTRAL

- MEDIA ARITMETICA

X 
 Xi * fi
n
fi = frec. Absoluta
hi = frec. Relativa

También: X   Xi * hi

- MEDIANA


C me * n  Fme1
2

Me  Li 
f me
Donde:
Li = límite inferior de la clase mediana.

24
Cme := tamaño del intervalo de la clase mediana.

Fme-1 = Frec. Abs. Acumulada anterior a la clase mediana.

fme = Frecuencia absoluta de la clase mediana.

Clase Mediana: Es aquel intervalo que contiene el valor que ocupa la


posición media, es decir contiene a la mediana. Se calcula mediante:

El primer valor Fi mayor o igual que n/2

- MODA

 D1 
M o  Li  Amo *  
 D1  D 2 

Donde:
Li = límite inferior de la clase modal.
Amo = Amplitud de la clase modal.
D1 = Diferencia ente la Frec. Absoluta de la clase modal menos la
frecuencia absoluta anterior.
D2 = Diferencia ente la Frec. Absoluta de la clase modal menos la
siguiente.

Clase Modal: Representa el intervalo con la mayor frecuencia absoluta.

1.2. MEDIDAS DE POSICION


- CUARTIL

Para calcular el Primer Cuartil

n 
  F (i  1)  * C
Q1  Li   
4
fi

25
Para calcular el Segundo Cuartil

n 
  F (i  1 * C
Q 2  Li   
2
fi

Para calcular el Tercer Cuartil

 3n 
  F (i  1 * C
Q3  Li   
4
fi
Q1 = Primer Cuartil
Q2 = Segundo Cuartil
Q3 = Tercer Cuartil
Li = Límite Real inferior de la Clase que contiene el Cuartil
n = Número de datos
Fi-1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
fi = Frecuencia absoluta de la Clase del Cuartil
C = Intervalo de Clase

- DECILES
 D # n  
  F (i  1)  * C
D  Li   
10
fi

D = El Decil
Li = Límite Real inferior de la Clase que contiene el Decil
D # = El número de Decil que se quiere hallar
n = Número de datos
Fi-1 = Frec. Acumulada de la clase anterior a la clase del Cuartil
f2 = Frecuencia absoluta de la Clase del Cuartil
C = Intervalo de Clase

- PERCENTILES

 P # n  
  F (i  1) i
P  Li   
100
fi
26
P = El Percentil
Li = Límite Real inferior de la Clase que contiene el Percentil
P # = El número de Percentil que se quiere hallar
n = Número de datos
Fi-1 = Frec. Acumulada de la clase anterior a la clase del Percentil
fi = Frecuencia absoluta de la Clase del Percentil
C = Intervalo de Clase

1.3. MEDIDAS DE DISPERCION

- VARIANZA
n

 ( Xi  X )
i 1
2
* fi
S 2 (X ) 
n

O también:
  Xi  X 
n
S 2 (X ) 
2
* hi
i 1

- DESVIACION ESTANDAR

S(X )  S 2 (X )

- COEFICIENTE DE VARIACION

S(X )
C.V .  *100%
X

Donde:
S(x) = desviación típica
X = promedio aritmético ó

27
V. RESULTADOS

1. Población: peso de las semillas de habas (vicia faba) expresado en


gramos.

2. Muestra: 110 semillas de habas (vicia faba)

n=110

3. Longitud de Clase (Rango):

R = Mayor Valor - Menor Valor

R = 1.8-0.7 = 1.1

4. Número de Intervalos (k):

Como n> 100, k  110  10.49  11

5. Tamaño de los Intervalos (c):

R 1 .1
c    0 .1
N  de Intervalos 11

6. Límite Inferior y el Límite Superior de cada Intervalo.

Intervalo de clase
[0.7 - 0.8>
[0.8 – 0.9>
[0.9 – 1.0>
[1.0 – 1.1>
[1.1 – 1.2>
[1.2 – 1.3>
[1.3 – 1.4>
[1.4 – 1.5>
[1.5 – 1.6>
[1.6 – 1.7>
[1.7 -1.8>

28
7. Marca de Clase

(0.7 + 0.8)
𝑥1 = = 0.9
2

8. Tabla de Distribución de Frecuencias


Cuadro N° 2: Tabla de Distribución de Frecuencias
𝒇𝒊
hi= 𝒏
Ii-1 - Ii xi fi Fi %hi Hi %Hi

[ 0.7 – 0.8 > 0.75 8 8 0.07 7.27% 0.07 7.27%

[ 0.8 - 0.9 > 0.85 11 19 0.1 10.00% 0.17 17.27%

[ 0.9 – 1.0 > 0.95 10 29 0.09 9.09% 0.26 26.36%

[ 1.0 – 1.1 > 1.05 9 38 0.08 8.18% 0.35 34.55%

[ 1.1 - 1.2 > 1.15 18 56 0.16 16.36% 0.51 50.91%

[ 1.2 – 1.3 > 1.25 13 69 0.12 11.82% 0.63 62.73%

[ 1.3 – 1.4 > 1.35 16 85 0.15 14.55% 0.77 77.27%

[ 1.4 – 1.5 > 1.45 12 97 0.11 10.91% 0.88 88.18%

[ 1.5 – 1.6 > 1.55 7 104 0.06


6.36% 0.95 94.55%

[ 1.6 – 1.7 > 1.65 3 107 0.03


2.73% 0.97 97.27%

[ 1.7 – 1.8 > 1.75 3 110 0.03 2.73% 1.00 100.00%

TOTAL 110 1.0000


Fuente: elaboración propia

9. Media aritmética

Cuadro N° 3: Calculo de la media aritmética

Ii-1 - Ii xi fi xi * fi
[ 0.7 – 0.8 > 0.75 8 6

[ 0.8 - 0.9 > 0.85 11 9.35

29
[ 0.9 – 1.0 > 0.95 10 9.5

[ 1.0 – 1.1 > 1.05 9 9.45

[ 1.1 - 1.2 > 1.15 18 20.7

[ 1.2 – 1.3 > 1.25 13 16.25

[ 1.3 – 1.4 > 1.35 16 21.6

[ 1.4 – 1.5 > 1.45 12 17.4

[ 1.5 – 1.6 > 1.55 7 10.85

[ 1.6 – 1.7 > 1.65 3 4.95

[ 1.7 – 1.8 > 1.75 3 5.25

TOTAL 110 131.3

X  Xi * fi  131.3  1.1936
n 110

10. Mediana

Cuadro N° 4: Calculo de la mediana

Ii-1 - Ii xi fi Fi
[ 0.7 – 0.8 > 0.75 8 8
[ 0.8 - 0.9 > 0.85 11 19
[ 0.9 – 1.0 > 0.95 10 29
[ 1.0 – 1.1 > 1.05 9 38
[ 1.1 - 1.2 > 1.15 18 56
[ 1.2 – 1.3 > 1.25 13 69
[ 1.3 – 1.4 > 1.35 16 85
[ 1.4 – 1.5 > 1.45 12 97
[ 1.5 – 1.6 > 1.55 7 104
[ 1.6 – 1.7 > 1.65 3 107
[ 1.7 – 1.8 > 1.75 3 110

30
TOTAL 110

Clase mediana: n/2 = 110 / 2 = 55

Me  Li 

Cme * n
2

 Fme 1
 1.1 

0.1 * 110  38
2
 1.1944
f me 18

11. Moda

Cuadro N° 5: Calculo de la moda

Ii-1 - Ii xi fi
[ 0.7 – 0.8 > 0.75 8
[ 0.8 - 0.9 > 0.85 11
[ 0.9 – 1.0 > 0.95 10
[ 1.0 – 1.1 > 1.05 9
[ 1.1 - 1.2 > 1.15 18
[ 1.2 – 1.3 > 1.25 13
[ 1.3 – 1.4 > 1.35 16
[ 1.4 – 1.5 > 1.45 12
[ 1.5 – 1.6 > 1.55 7
[ 1.6 – 1.7 > 1.65 3
[ 1.7 – 1.8 > 1.75 3
TOTAL 110
Clase modal: La mayor frecuencia absoluta. fi = 18

D1 = 18 – 9 =9

D2 = 18– 13 = 5

31
 D1   9 
M o  Li  Amo *    1.1  0.1.   1.1643
 D1  D 2   9  5 

12. Cuartiles

Cuadro N° 6: Calculo de los cuartiles

Ii-1 - Ii xi fi Fi
[ 0.7 – 0.8 > 0.75 8 8
[ 0.8 - 0.9 > 0.85 11 19
Q1: [ 0.9 – 1.0 > 0.95 10 29
[ 1.0 – 1.1 > 1.05 9 38
Q2: [ 1.1 - 1.2 > 1.15 18 56
[ 1.2 – 1.3 > 1.25 13 69
Q3: [ 1.3 – 1.4 > 1.35 16 85
[ 1.4 – 1.5 > 1.45 12 97
[ 1.5 – 1.6 > 1.55 7 104
[ 1.6 – 1.7 > 1.65 3 107
[ 1.7 – 1.8 > 1.75 3 110
TOTAL 110
TOTAL 122

n   110 
  F (i  1) i   19  * 0.1
Q1  Li     0.9   
4 4
 0.985
f2 10

n   110 
  F (i  1) i   38  * 0.1
Q 2  Li     1.1   2 
2
 1.1944
f2 18

32
 3n   3 *110 
  F (i  1) i   69  * 0.8
Q3  Li     1.3   
4 4
 1.3844
f2 16

13. Deciles

Cuadro N° 7: Calculo de los deciles

Ii-1 - Ii xi fi Fi
[ 0.7 – 0.8 > 0.75 8 8
D1: [ 0.8 - 0.9 > 0.85 11 19
[ 0.9 – 1.0 > 0.95 10 29
[ 1.0 – 1.1 > 1.05 9 38
[ 1.1 - 1.2 > 1.15 18 56
[ 1.2 – 1.3 > 1.25 13 69
[ 1.3 – 1.4 > 1.35 16 85
[ 1.4 – 1.5 > 1.45 12 97
[ 1.5 – 1.6 > 1.55 7 104
[ 1.6 – 1.7 > 1.65 3 107
[ 1.7 – 1.8 > 1.75 3 110

 D # n    1 * 110 
  F (i  1)  * C   8  * 0.1
D1  Li     0.8   
10 10
 0.8273
fi 11

33
D2 1.0

D3 1.1

D4 1.2

D5 1.3

D6 1.4

D7 1.4

D8 1.5

D9 1.7

14. Percentiles

Cuadro N° 8: Calculo de los percentiles

Ii-1 - Ii xi fi Fi
[ 0.7 – 0.8 > 0.75 8 8
[ 0.8 - 0.9 > 0.85 11 19
[ 0.9 – 1.0 > 0.95 10 29
[ 1.0 – 1.1 > 1.05 9 38
P37: [ 1.1 - 1.2 > 1.15 18 56
[ 1.2 – 1.3 > 1.25 13 69
[ 1.3 – 1.4 > 1.35 16 85
[ 1.4 – 1.5 > 1.45 12 97
[ 1.5 – 1.6 > 1.55 7 104
[ 1.6 – 1.7 > 1.65 3 107
[ 1.7 – 1.8 > 1.75 3 110

 P# n    37 *110 
  F (i  1) i   38  * 0.1
P37  Li     1.1   100 
100
 1.115
fi 18

34
P3 0.73

P13 0.9

P18 1.0

P45 1.2

P68 1.4

P79 1.5

P86 1.6

P90 1.7

P93 1.71

P99 10

15. Varianza

Cuadro N° 9: Calculo de varianza

Ii-1 - Ii xi fi ( Xi  X ) 2 * fi
[ 0.7 – 0.8 > 0.75 8 1.5488

[ 0.8 - 0.9 > 0.85 11 1.2716

[ 0.9 – 1.0 > 0.95 10 0.576

[ 1.0 – 1.1 > 1.05 9 0.1764 X  1.1936


[ 1.1 - 1.2 > 1.15 18 0.0288

[ 1.2 – 1.3 > 1.25 13 0.0468

[ 1.3 – 1.4 > 1.35 16 0.4096

[ 1.4 – 1.5 > 1.45 12 0.8112

[ 1.5 – 1.6 > 1.55 7 0.9072

[ 1.6 – 1.7 > 1.65 3 0.6348

[ 1.7 – 1.8 > 1.75 3 0.9408

TOTAL 110 7.352

35
n

 ( Xi  X )
i 1
2
* fi
7.352
S 2 (X )    0.0668
n 110

16. Desviación estándar

S ( X )  S 2 ( X )  0.0668  0.2584

17. Coeficiente de variación

S(X ) 0.2584
C.V .  *100%  *100%  21.65%
X 1.1936

36
37

Das könnte Ihnen auch gefallen