Sie sind auf Seite 1von 8

ESTADSTICA

Una poblacin puede ser finita o infinita


Una muestra pequea contiene menos de 30 elementos (n < 30), una

muestra grande contiene 30 o ms (n > 30)


Una muestra puede ser aleatoria o representativa

Media
N

La media poblacional ( x

es calculada con la siguiente frmula:

Xi

x= i =1
N

siendo esto la sumatoria de todos los valores de X desde el valor 1 al valor n,


divididos entre el nmero de elementos contenidos en la muestra.
La media muestral

( X ) es calculada de manera muy similar a la media

poblacional, la diferencia aqu es que la muestra contiene menos de 30 elementos,


n

y su frmula es:

Xi

X = i=1
n

La media tiene la siguiente propiedad:

( Xi X )=0 ,

y esto es demostrado con

un sencillo ejemplo:
n = 1, 2, 3, 4, 5
1+2+3+4+5= 15,15/3 = 3

X=3

(1-3) + (2-3) + (3-3) + (4-3) + (5-3) = 0

0=0

Mediana: Valor central ordenando los datos de menor a mayor.

Poblacional

(Me)

~
y muestral ( X ) . Cuando el nmero de datos

(n)

es

~
X= X 0.5 (n+1) , siendo as:

impar, se calcula de esta manera:

n= 1, 2, 3, 4, 5 Ya que tenemos cinco datos, el valor central le corresponde al 3,


siendo ste el valor de la mediana.

Cuando el nmero de datos es par, se calcula as:

~
X=

n
( )
2

+X
2

n
( +1)
2

, demostrado

del siguiente modo:

n= 1, 2, 3, 4, 5, 6

~
X=

Moda: Valor con mayor frecuencia

6
( )
2

+X
2

6
( +1)
2

X (3) + X (4) ~ X 7 ~
~
X=
= X= = X =3.5
2
2

(^
X)

No existe una frmula para calcular la moda, pero es recomendable ordenar los
datos de menor a mayor para as distinguir fcilmente cules datos se repiten ms
veces. Cuando slo hay un valor que se repite ms que los otros, se le llama
distribucin unimodal. Cuando hay dos o ms modas en una muestra, se conoce
como distribucin multimodal.

Tipos de distribucin
Existen tres tipos de distribucin de estas medidas de tendencia central.
a) Simtrica y unimodal (Insesgada)

En donde

^
X ~
X X , significando que los valores de las tres medidas de

tendencia central principales, tienen valores muy parecidos o iguales.

b) Asimtrica hacia la derecha (sesgo positivo)

En donde

X >~
X> ^
X , esto significa que el valor de la media es mayor al de

la mediana, y este a su vez es mayor al valor de la moda.


c) Asimtrica hacia la izquierda (sesgo negativo)

En donde

X <~
X< ^
X , esto significa que el valor de la media es menor al de la

mediana, y este a su vez es menor al valor de la moda.

Coeficiente de asimetra: Tambin conocido como sesgo, o ndice de


sesgo de Pearson

(I)

y representado como

siguiente modo:
X
~
X

3
^
Mediamoda
X
X
=

Desviacin estndar
Sx

Sk , es calculado del

Medidas de dispersin: Miden la variabilidad de los datos.

Rango: Es equivalente al valor mayor dentro de la muestra, menos el


valor menor de la muestra ( R= X mx X mn .
Xix 2

Varianza poblacional:

i =1

2x =
Xi X

Varianza muestral:

(Al igual que las medidas de tendencial

i=1
2
x

S =
central, la diferencia entre la muestral y la poblacional, son el tamao de
la muestra).
n

Xix
i=1

Desviacin media o absoluta (DM):

Desviacin estndar: Es la raz cuadrada de la varianza, con sus

n
DM=

respectivos parmetros o estadsticos para desviaciones muestrales o


2
poblacionales: = x

Coeficiente de variacin:

(poblacional),

Sx= S2x (muestral).

Desviacin estndar x Sx
= o 100 (se

Media
X
X

multiplica por 100 para obtener un porcentaje %)

EJEMPLO DE TODA LA UNIDAD


Un estudio tiene como objetivo determinar la concentracin de pH en muestras de
saliva humana. Para ello se recogieron datos de 10 personas, obtenindose los

siguientes resultados: 6.59, 7.37, 7.15, 7.08, 5.75, 5.83, 7.12, 7.23, 7.13, 5.6.
Calcular las medidas de tendencia central y las medidas de dispersin.
n = 10 datos
Ordenados de menor a mayor: 5.6, 5.75, 5.83, 6.59, 7.08, 7.12, 7.13, 7.15, 7.23,
7.37. Como la muestra contiene menos elementos, se utilizarn medidas de
tendencia central muestrales.
Ya que ningn dato se repite, la moda no existe,

^
X =Noexiste .

Media:
6.59+7.37+ 7.15+7.08+5.75+5.83+7.12+7.23+7.13+5.6
X =
=6.685
10
Mediana: Ya que el nmero de datos es par, se obtiene el siguiente resultado:
X (5 )+ X
2

( 6)

7.08+7.12 14.2
=
=7.1
2
2
Xn

( 2 )+ X

n
( + 1)
2

2
~
X=

Rango:

R= X mx X mn =7.375.6=1.77
n

Desviacin media:

| Xix|

DM= i=1

7.156.685+

7.236.685+ 7.376.685

|5.66.685|+|5.756.685|+|5.836.685|+|6.596.685|+|7.086.685|+|7.126.685|+ |7.136.685|+

.594

Xi X

Varianza:

i=1

S2x =

( 5.66.685 )2 + ( 5.756.685 )2+ (5.836.685 )2 + ( 6.596.685 )2+ (7.086.685 )2 + ( 7.126.685 )2 + ( 7.136.685 )2


2
2
2
+ ( 7.156.685 ) + ( 7.236.685 ) + ( 7.376.685 )
10
= .47969
Desviacin estndar:

Sx

S = .47969=.6 9259
2
x

Coeficiente de variacin (muestral):

Sx .6570
=
100=7.17
6.685
X

Diagrama de caja
Es una grfica descriptiva para un conjunto de datos que se basa en los cuartiles y
sirve para describir propiedades o caractersticas importantes de un conjunto de
datos.

(~
X)

Centralizacin: Mediana

Dispersin: Rango intercuartlico (RIC)


Simetra o sesgo
Puntos o valores atpicos

Rango intercuartlico: Es la diferencia entre el cuartil 3 y el cuartil 1,


RIC=Q3Q1 .
Clculo de cuartiles
Si n es impar,
~
Q 1=X 0.25 ( n+1 ) , Q 2=X 0.5 ( n+1 )= X , Q 3=X 0.75 ( n+1 )
Si n es par,
X

(34n )+ X

3n
+ 1)
4

2
X

(n2 )+ X

n
( + 1)
2

2
X

( n4 )+ X

, Q3=

n
( +1)
4

,Q2=
2
Q 1=

EJEMPLO
Datos: 5.36, 5.75, 5.83, 6.59, 7.08, 7.12, 7.13, 7.15, 7.23, 7.37
X (2.5 )+ X

(3.5)

2
X

=Q1=

(104 )+ X

X ( 6)
=X 3=5.83
2

10
+1)
4

=Q 1=

Q1=
X (5 )+ X
2

( 6)

=Q 2=

(n2 )+ X
2

7.08+7.12
=7.1
2

n
( + 1)
2

=Q2=

Q2=

X (7.5 )+ X

(8.5)

2
X

=X 8 =7.15

+ X
( 3(10)
4 )

3(10)
+ 1)
4

2
X

( 34n )+ X
2

3n
+ 1)
4

Q3=

=Q 3=

Q 3=
RIC=7.155.83=1.32

Das könnte Ihnen auch gefallen