Sie sind auf Seite 1von 18

UNIVERSIDAD NACIONAL DE TRUJILLO

Dra. MARÍA T. ROJAS GARCÍA

MEDIDAS ESTADÍSTICAS
1. Estadísticos de tendencia central
Las tres medidas más usuales de tendencia central son:

El promedio arimético o media

La moda

La mediana.

En ciertas ocasiones estos tres estadísticos suelen coincidir, aunque generalmente


no es así. Cada uno de ellos presenta ventajas e inconvenientes.

1
̅)
Promedio Arimético (𝒙
1. Definición

La media aritmética de una variable estadística es la suma de todos sus


posibles valores, dividida entre el número de éstos.

2. Cálculo
2.1 Promedio para datos no tabulados

∑𝑛
𝑖=1 𝑥𝑖
𝑥̅ = …(1)
𝑛

Ejemplo: Halle el promedio arimético en los siguientes casos:

a) X: Porcentaje de humedad de suelos en diferentes parcelas de espárragos.

X: 3.2 3.1 2.4 4.0 3.5 3.0 3.5 3.8 4.2

b) X : Número de tractores a motor en sectores de Chao Viru

X: 2 2 3 0 1 2 4 2 2 0 1

2
1.2 Promedio para Datos tabulados

∑𝑚
𝑖=1 𝑥𝑖 𝑓𝑖
𝑥̅ = …(2)
𝑛

Donde:

xi : Es cada valor de la variable Discreta

xi : Es cada valor de la variable Continua

Ejemplo:

1. Calcule el promedio en el Cuadro 2 y 3. Interprete su resultado

2. Propiedades

1. P ( k) = k ; k = cte.
2. P ( k xi) = k P (xi) ; k= cte.
3. P ( k xi + a ) = k P (xi) + a ; k= cte. ; a = cte. ; k ≠ a
4. P ( xi +/ - yj ) = P (xi) +/ - P( yj ) ; x , y son v. independientes

3
4. Ventajas

 Es la medida de tendencia central más usada.


 El promedio es estable en el muestreo.
 Es sensible a cualquier cambio en los datos (puede ser usado como un
detector de variaciones en los datos).
 Se emplea a menudo en cálculos estadísticos posteriores.
 Presenta rigor matemático.
 En la gráfica de frecuencia representa el centro de gravedad.

5. Desventajas

 Es sensible a los valores extremos.


 No es recomendable emplearla en distribuciones muy asimétricas.
 Si se emplean variables discretas o cuasi-cualitativas, la media aritmética
 puede no pertenecer al conjunto de valores de la variable.

MODA (M0)

1. Definición :

Es el valor de la variable que más veces se repite, es decir, el valor


más frecuente en un conjunto de datos

2. Cálculo :

2.1. Mo Para datos no Tabulados.

Ejm. Halle la moda en los siguientes casos:

1. X: Número de máquinas para preparar terreno de sembrío de


espárragos.

X: 4 3 5 4 5 3 3 5 6 5 2 5

Mo = 5 Dist. Unimodal
4
3. X: número de parcelas de trigo cosechadas

X: 5 6 7 9 7 10 7 8 6 4 6

Mo 1 = 6 ; Mo 2 = 7 ; Distribución Bimodal

4. X: Ventas diarias de una Botica (s/.)

X: 125 124 136 118 110 145 162

No existe MO ; Distribución Amodal

5
2.2. Moda para datos Tabulados

a) Mo : Para datos tabulados por puntos Discretos

La Mo, es el valor de la variable que tiene mayor frecuencia

Mo = x j

Ejemplo: Halle la moda en el cuadro de distribución

fi
xi
1 15

2 9

3 18 xj Mo = 18

4 14

5 9

6
b) Mo : Para datos tabulados en intervalos de clase

Fórmula:

𝑫𝟏
𝑴𝒐 = 𝒙´𝒊−𝟏 + 𝒄𝒊 [ ]
𝑫𝟏 +𝑫𝟐

Donde:

fi : Mayor frecuencia

fi -1 : Frecuencia absoluta simple inmediata anterior a fi

fi +1 : Frecuencia absoluta simple inmediata posterior a fi

D1 = fi - fi -1

D2 = fi - fi +1

X´i − 1 = Límite inferior de la clase modal.

ci : Amplitud de clase de la clase modal

Clase modal : Clase que se relaciona con la mayor frecuencia

Ejemplo : Halle la Moda en el cuadro 2 y 3 . Interprete

7
Mediana (Me)

1. Definición : Es el valor de la variable que ocupa el lugar central de todos los


datos cuando éstos están ordenados de menor a mayor, que divide a la
distribución en dos clases o categorías iguales.

Mín 50% < Me 50 % > Máx

2. Cálculo :

2.1 Me : Para datos no Tabulados

a) Si la variable tiene un número impar de datos la mediana Me es la


puntuación central de los datos ordenados.

Ejemplo 1 : Halle al mediana en:

X: Porcentaje de humedad en parcelas de espárragos

X: 3.2 3.1 2.4 4.0 3.5 3.0 3.5 3.8 4.2

Solución

Ordenando X: 2.4 3.0 3.1 3.2 3.5 3.5 3.8 4.0 4.2

Me = 3.5

Interpretación: En el 50% de las parcelas de espárrago presentan una humedad


menor a 3.5 y en el 50% de las parcelas de espárrago presentan una humedad
mayor a 3.5.
8
b) Si la variable tiene un número par de datos la mediana Me es el promedio
de los valores centrales de los datos ordenados.

Ejemplo 2. Halle la Me en :

X : Número de surcadoras recibidas por agricultores de la zonas de Laredo

X: 2 2 3 0 1 2 4 2 2 0 1 6

Solución Me
Ordenando X: 0 0 1 1 2 2 2 2 2 3 4 6

Luego : Me = ( 2+ 2) / 2 = 2

Interpretación: En el 50 % de los agricultores de la zonas de Laredo

Recibió hasta 2 surcadoras y en otro 50% de agricultores recibió al menos 2


surcadoras.

2.2 Me : Para datos Tabulados

Se calcula con las frecuencias Absolutas Acumuladas (Fi)


Se determinan los factores de posición:

n / 2 ; si en número de datos es Par

n+1 / 2 ; si en número de datos es Impar

a) Me: Por puntos Discretos

Se presentan dos casos:

1. Si Fj -1 < n/2 < Fj ; Entonces Me = xj


2. Si n / 2 = Fj-1 ; Entonces Me = xj-1 + xj

9
Ejemplo 1 : Halle la Me en el cuadro siguiente:

Xi Fi Fi Cálculo del factor de posición: n/2 = 92 / 2 = 46


20 12 12
30 10 22 Fj-1 Luego como : Fj-1 < n/2 < Fj
40 20 42 n/2
50 18 60 Entonces la Me = Xj = 50
60 15 75 Fj
70 10 85
80 7 92 Interpretación: En el 50 % de los datos son menores a 50 y el
TOTAL 92 otro 50% de los datos son mayores a 50.
PAR

Ejemplo 2 : Halle la Me en el cuadro siguiente:

xi fi Fi Cálculo del factor de posición: n/2 = 30 / 2 = 15


30 4 4
31 2 6 Luego como : n/2 = Fj-1
32 2 8
33 1 9 Entonces, Me = (36 + 37) / 2 = 36.5
34 1 10 Interpretación: En el 50 % de los datos son
35 3 13 menores a 36.5 y el otro 50% de los datos son mayores a 36.5
36 2 15 n/2 Fj-1
37 2 17
38 6 23 Fj
39 4 27
40 3 30
T37OTAL 30

PAR

10
b) Me: Para datos agrupados en intervalos

FÓRMULA:

n
− Fj−1
Me = 𝒙´𝒊−𝟏 + cj [ 2 ]
Fj − Fj−1

Donde:

n/2 : Factor de posición de la mediana

Fj-1 : F.A.A. inmediata anterior al factor n/2

Fj : F.A.A. inmediata posterior al factor n/2

X´j-1 : Límite inferior de IMe ( intervalo medio)

ci : Amplitud de clase del IMe

IMe : Intervalo que se relaciona con F j.

Ejemplo : Halle la mediana en los cuadros 2 y 3. Interprete.

11
MEDIDAS DE DISPERSIÓN ABSOLUTAS

VARIANZA ( s2 )

1. Definición: es el promedio del cuadrado de las distancias entre cada


observación y la media aritmética del conjunto de observaciones.
2. Cálculo:
2.1) s2 : Para datos no Tabulados

a) Fórmula General:
∑𝒏
𝒊=𝟏(𝒙𝒊 −𝒙
̅)
𝟐
S2 =
𝒏−𝟏

b) Fórmula Práctica

(∑𝒏
𝒊=𝟏 𝒙𝒊 )
𝟐 𝟏
S2 ={∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 − } 𝒏−𝟏
𝒏

2.2) s2 : Para datos no Tabulados

a) Fórmula General:
∑𝒎
𝒊=𝟏(𝒙𝒊 −𝒙
𝟐
̅) 𝒇
2 𝒊
S =
𝒏−𝟏

a) Fórmula Práctica
∑𝒎
𝒊=𝟏(𝒙𝒊 𝒇𝒊 )
𝟐 𝟏
S2 ={∑𝒏𝒊=𝟏 𝒙𝒊 𝟐 𝒇𝒊 − } 𝒏−𝟏
𝒏

DONDE:

Xi : Es cada valor de la variable si es variable es Discreta


Xi : Es marca de clase si es variable es continua

12
3. PROPIEDADES

1. V(Xi) ≥ 0
2. V(K) = 0 ; K= cte
2
3. V(kXi) = k V(Xi) ; K= cte
2
4. V(kXi + b) = k V(Xi) ; K= cte ; b = cte
5. V(Xi +- Yj) = v(Xi) + - V(Yj) si X,Y son v. independientes
6. En una distribución simétrica y cuando la muestra es grande, la
distribución se puede dividir en áreas de la forma siguiente:

DESVIACIÓN TÍPICA (S): La varianza viene dada por las mismas


unidades que la variable pero al cuadrado, para e

vitar este problema podemos usar como medida de dispersión la desviación


típica que se define como la raíz cuadrada positiva de la varianza

Para estimar la desviación típica de una población a partir de los datos de


una muestra se utiliza la fórmula (cuasi desviación típica):

RECORRIDO O RANGO MUESTRAL (Re). Es la diferencia entre


el valor de las observaciones mayor y el menor. Re = xmax - xmin

13
MEDIDAS DE DISPERSIÓN RELATIVAS

COEFICIENTE DE VARIACIÓN DE PEARSON: Cuando se quiere


comparar el grado de dispersión de dos distribuciones que no vienen dadas
en las mismas unidades o que las medias no son iguales se utiliza el
coeficiente de variación de Pearson que se define como el cociente entre la
desviación típica y el valor absoluto de la media aritmética

CV representa el número de veces que la desviación típica contiene a la


media aritmética y por lo tanto cuanto mayor es CV mayor es la dispersión
y menor la representatividad de la media.

Si CV es < al 30% los datos son Homogéneos

Si CV es > al 30% los datos son Heterogéneos

Medidas de Forma

Comparan la forma que tiene la representación gráfica, bien sea el histograma o el


diagrama de barras de la distribución, con la distribución normal.

MEDIDA DE ASIMETRÍA

Diremos que una distribución es simétrica cuando su mediana, su moda y su media


aritmética coinciden.

Diremos que una distribución es asimétrica a la derecha si las frecuencias


(absolutas o relativas) descienden más lentamente por la derecha que por la
izquierda.

Si las frecuencias descienden más lentamente por la izquierda que por la derecha
diremos que la distribución es asimétrica a la izquierda.

Existen varias medidas de la asimetría de una distribución de frecuencias. Una de


ellas es el coeficiente de asimetría de Pearson.

14
Coeficiente de Asimetría de Pearson:

Su valor es cero cuando la distribución es simétrica, positivo cuando existe


asimetría a la derecha y negativo cuando existe asimetría a la izquierda.

EJEMPLO 1

El número de diás necesarios por 10 equipos de agricultores para terminar


los sembríos de diversos tubérculos han sido: 21, 32, 25, 59, 26, 30, 28, 60,
32, y 42 días. Calcular la media, mediana, moda, varianza y desviación
típica.

SOLUCIÓN:

La media: suma de todos los valores de una variable dividida entre el


número total de datos de los que se dispone:

15
La mediana: es el valor que deja a la mitad de los datos por encima de
dicho valor y a la otra mitad por debajo. Si ordenamos los datos de mayor a
menor observamos la secuencia:

15, 21, 32, 59, 60, 60,61, 64, 71, 80.

Como quiera que en este ejemplo el número de observaciones es par (10


individuos), los dos valores que se encuentran en el medio son 60 y 60. Si
realizamos el cálculo de la media de estos dos valores nos dará a su vez 60,
que es el valor de la mediana.

La moda: el valor de la variable que presenta una mayor frecuencia es 60

La varianza S2: Es la media de los cuadrados de las diferencias entre cada


valor de la variable y la media aritmética de la distribución.

Sx2=

La desviación típica S: es la raíz cuadrada de la varianza.

S = √ 427,61 = 20.67

El rango: diferencia entre el valor de las observaciones mayor y el menor

80 - 15 = 65 días

El coeficiente de variación: cociente entre la desviación típica y el valor


absoluto de la media aritmética

16
CV = 20,67/52,3 = 0,39

EJEMPLO 2

El precio de un interruptor magentotérmico en 10 comercios de


electricidad de una ciudad son : 25, 25, 26, 24, 30, 25, 29, 28, 26, y 27
Euros. Hallar la media, moda, mediana, (abrir la calculadora estadística,
más abajo) diagrama de barras y el diagrama de caja.

SOLUCIÓN:

(Utilizar la calculadora de debajo)

[El diagrama de cajas: caja desde Q1 a Q3 (50% de los datos), bigotes el recorrido]

Resumen de Fórmulas

17
18

Das könnte Ihnen auch gefallen