Sie sind auf Seite 1von 40

Material de apoyo

523486

Bioestad stica
Estad stica Descriptiva en una variable

(Primer Semestre 2008) Universidad de Concepcion

Page 1

Material de apoyo

523486

de tablas de frecuencias). Ejemplo1:(Construcion

Un grupo de kilogramos:

n = 21 personas se realizan las siguientes observaciones de sus pesos, medidos en

58 56 70

42 58 72

51 57 71

54 59 69

40 63 70

39 58 68

49 66 64

Agrupar los datos en una tabla estad stica. Solucion: En primer lugar hay que observar que si denominamos X a la variable peso de cada persona esta es una variable de tipo cuantitativa y continua. Por tanto a la hora de ser ordenados los resultados en una tabla estad stica, esto se ha de hacer agrupandolos en intervalos de longitud conveniente. Esto nos lleva Para que la perdida de informacion no sea muy relevante seguimos el a perder cierto grado de precision.

m n = 21 intervalos (no son demasiadas las observaciones). En este punto podemos tomar bien m = 4 o bien m = 5. Arbitrariamente se elige una de estas dos posibilidades. Por ejemplo, vamos a tomar m = 5.
criterio de utilizar

(Primer Semestre 2008) Universidad de Concepcion

Page 2

Material de apoyo

523486

la misma longitud en todos los intervalos, ai as ), donde:

Lo siguiente es determinar la longitud de cada intervalo, ai i

comodo = 1, . . . , 5. Lo mas es tomar

ser necesariamente = a (aunque esto no tiene por que

L0 = xmin = 39

A 33 = = 6, 6 5 5 A = L5 L0 = 72 39 = 33 a =

L5 = xmax = 72

m = 5 intervalos de longitud a = 6, 6 comenzando por L0 = xmin = 39 y terminando en L5 = xm ax = 72:


Entonces tomaremos

(Primer Semestre 2008) Universidad de Concepcion

Page 3

Material de apoyo

523486

INTERVALOS,]Lj 1

Lj ]

Marca de clase, (M Cj ) 42,3 48,9 55,5 62,1 68,7

f.a(nj ) 3 2 6 3 7 21

f.r(fj ) 0,1428 0,0952 0,2857 0,1428 0,3333

f.a.a (Nj ) 3 5 11 14 21

f.r.a (Fj ) 0,1428 0,2381 0,5238 0,6667

[39 45,6] ]45,6 52,2] ]52,2 58,8] ]58,8 65,4] ]65, 4 72]

1 L0 y L5 no es

Otra posibilidad a la hora de construir la tabla, y que nos permite que trabajemos con cantidades mas simples a la hora de construir los intervalos, es la siguiente. Como la regla para elegir muy estricta podemos hacer la siguiente eleccion:

a = 7 d = A A = 35 33 = 2 d L0 = xmim = 39 1 = 38 2 d L5 = xmax + = 72 + 1 = 73 2
(Primer Semestre 2008) Universidad de Concepcion Page 4

A = a m = 7 5 = 35

Material de apoyo

523486

de los intervalos, y el aumento ya que as la tabla estad stica no contiene decimales en la expresion

d, cometido al ampliar el rango de las observaciones desde A hasta A , se reparte del mismo modo a
los lados de las observaciones menores y mayores: INTERVALOS (M Cj ) 41,5 48,5 55,5 62,5 69,5 f.a 3 2 7 3 6 21 Recordar: Recorrido: xm ax Amplitud: ai f.r 0,1428 0,0952 0,3333 0,1428 0,2857 f.a.a 3 5 12 15 21 f.r.a 0,1428 0,2381 0,5714 0,7143

]38 45] ]45 52] ]52 59] ]59 66] ]66 73]

xm n =

Li1 + Li 2 ni Frecuencias recticadas: fi = ; ni = fi n ai


Marca de clase: M Ci
(Primer Semestre 2008) Universidad de Concepcion Page 5

= li Li1

Material de apoyo

523486

1. Representaciones Gracas
de forma Hemos visto que la tabla estad stica resume los datos que disponemos de una poblacion, sistematica que esta se puede analizar de una manera mas y resumida . Para darnos cuenta de un vistazo de las caracter resulta aun esclarecedor el uso de gracos solo sticas de la poblacion y mas diagramas.

1.1. Gracos para variables cualitativas


usuales para representar variables de tipo nominal son los siguientes: Los gracos mas Diagramas de barras: Siguiendo la gura 1 (izquierda), representamos en el eje de abscisas las clases y en el eje de las ordenadas las frecuencias absolutas o bien, las frecuencias relativas. Si, me diante el graco, se intenta comparar varias poblaciones entre s , existen otras modalidades, como las mostradas en la gura 2. Cuando los tamanos de las dos poblaciones son diferentes, es conveniente utilizar las frecuencias relativas, ya que en otro caso podr an resultar poco interpretativas.

(Primer Semestre 2008) Universidad de Concepcion

Page 6

Material de apoyo

523486

Figura 1: Diagrama de barras para una variable cualitativa y Diagramas de barras para comparar una variable cualitativa en diferentes poblaciones. Se ha de tener en cuenta que la altura de cada barra es proporcional al numero de observaciones

(Primer Semestre 2008) Universidad de Concepcion

Page 7

Material de apoyo

523486

llamados gracos circulares). Se divide un c Diagramas de sectores (tambien rculo en tantas porciones como clases existan, de modo que a cada clase le corresponde un arco de c rculo proporcional a su frecuencia absoluta o relativa (gura 2).

Figura 2: graco circular

(Primer Semestre 2008) Universidad de Concepcion

Page 8

Material de apoyo

523486

se calcula usando la regla de tres: El arco de cada porcion

n 360 ni i =

360 ni n

anterior, puede interesar comparar dos poblaciones. En este caso tambien es Como en la situacion aconsejable el uso de las frecuencias relativas (porcentajes) de ambas sobre gracos como los anteriores. Otra posibilidad es comparar las 2 poblaciones usando para cada una de ellas un diagrama semicircular. Pictogramas Expresan con dibujos alusivo al tema de estudio las frecuencias de las clases de la variable. Estos gracos se hacen representado a diferentes escalas un mismo dibujo. El escalamiento de los dibujos debe ser tal que el area de cada uno de ellos sea proporcional a la frecuencia de las clases que representa. Este tipo de gracos suele usarse en los medios de co para que sean comprendidos por el publico municacion, no especializado, sin que sea necesaria una compleja. explicacion

(Primer Semestre 2008) Universidad de Concepcion

Page 9

Material de apoyo

523486

1.2. Gracos para variables cuantitativas


de que para rePara las variables cuantitativas, consideraremos dos tipos de gracos, en funcion alizarlos se usen las frecuencias (absolutas o relativas) o las frecuencias acumuladas: Diagramas diferenciales: Son aquellos en los que se representan frecuencias absolutas o relativas. En ellos se representa el numero o porcentaje de elementos que presenta una modalidad dada. Dia gramas integrales: Son aquellos en los que se representan el numero de elementos que presentan una modalidad inferior o igual a una dada. Se realizan a partir de las frecuencias acumuladas, lo que da lugar a gracos crecientes, y es obvio que este tipo de gracos no tiene sentido para variables cualitativas. Segun hemos visto existen dos tipos de variables cuantitativas: discretas y continuas. Vemos a contin las diferentes representaciones gracas uacion que pueden realizarse para cada una de ellas as como los nombres espec cos que reciben.

1.3. Gracos para variables discretas


Cuando representamos una variable discreta, usamos el diagrama de barras cuando pretendemos hacer una graca diferencial. Las barras deben ser estrechas para representar el que los valores que toma la variable son discretos. El diagrama integral o acumulado tiene, por la naturaleza de la variable, forma de escalera. Un ejemplo de diagrama de barras as como su diagrama integral correspondiente representados en la gura. estan
(Primer Semestre 2008) Universidad de Concepcion Page 10

Material de apoyo

523486

Ejemplo: Se lanzan tres monedas al aire en obteniendose los siguientes resultados:

8 ocasiones y se contabiliza el numero de sellos, X ,

2, 1, 0, 1, 3, 2, 1, 2
Representar gracamente el resultado. En primer lugar observamos que la variable X es cuantitativa discreta, presentando las Solucion: siguientes clases:

X 0, 1, 2, 3
los datos en una tabla estad Ordenamos a continuacion stica, y se representa dicha tabla en la gura 3. Clases 0 1 2 3

nj
1 3 3 1 n=8

fj
1/8 3/8 3/8 1/8 1

Nj
1 4 7 8

Fj
1/8 4/8 7/8 8/8

(Primer Semestre 2008) Universidad de Concepcion

Page 11

Material de apoyo

523486

Figura 3: Diagrama diferencial (barras) e integral para una variable discreta. Observese que el diagrama integral (creciente) contabiliza el numero de observaciones de la variable inferiores o iguales a cada punto del eje de abcisas.

(Primer Semestre 2008) Universidad de Concepcion

Page 12

Material de apoyo

523486

1.4. Gracos para variables continuas


Cuando las variables son continuas, utilizamos como diagramas diferenciales los histogramas y los pol gonos de frecuencias. Un histograma se construye a partir de la tabla estad stica, representando sobre cada intervalo, un rectangulo que tiene a este segmento como base. El criterio para calcular la altura de cada rectangulo es el de mantener la proporcionalidad entre las frecuencias absolutas (o relativas) de cada intervalo y el area de los mismos. El pol gono de frecuencias se construye facilmente si tenemos representado previamente el histograma, ya que consiste en unir mediante lineas rectas los puntos del histograma que corresponden a las marcas de clase. Para representar el pol gono de frecuencias en el primer y ultimo intervalo, suponemos que adyacentes a ellos existen otros intervalos de la misma amplitud y frecuencia nula, y se unen por una l nea recta los puntos del histograma que corresponden a sus marcas de clase. Ejemplo: Sea la variable cuantitativa continua expresada en la tabla siguiente: Clases

M Cj
1 3 5 7 9

nj
2 1 4 3 2

Nj
2 3 7 10 12
Page 13

]0 2] ]2 4] ]4 6] ]6 8] ]8 10]
(Primer Semestre 2008) Universidad de Concepcion

Material de apoyo

523486

Figura 4: Diagramas diferenciales e integrales para una variable.

(Primer Semestre 2008) Universidad de Concepcion

Page 14

Material de apoyo

523486

Problema1.(Tarea)

Consideremos la siguiente base de datos medica, sea

n = 20 individuos que fueron parte de un

sangu estudio medico para reducir la presion nea. Estudie que tipos de gracas puede realizar para dicho conjunto de datos.

(Primer Semestre 2008) Universidad de Concepcion

Page 15

Material de apoyo

523486

(Primer Semestre 2008) Universidad de Concepcion

Page 16

Material de apoyo

523486

Resumen: Principales Diagramas segun el tipo de variable:. 1. V. Cualitativa: Barras, sectores, pictogramas. 2. V. Discreta: Diferencial (barras),Integral (en escalera). 3. V. Continua: Diferencial (histograma, pol gono de frecuencias),Integral (diagramas acumulados (ojiva menor)).

(Primer Semestre 2008) Universidad de Concepcion

Page 17

Material de apoyo

523486

Practico1:Solucion se reere a la duracion en horas (completas) de un lote de 500 Ejercicio5: La siguiente distribucion ampolletas: Duracion 300 500 500 700 700 1.100 de 1.100 mas Numero de Tubos 50 150 275 25

T otal = 500
a) Representar el histograma de frecuencias relativas y el pol gono de frecuencias. b) Trazar la curva de frecuencias relativas acumuladas. inferior a 900 horas. c) Determinar el numero m nimo de ampolletas que tienen una duracion SOLUCION: En primer lugar observamos que la variable en estudio es discreta (horas completas), pero conveniente agruparla en intervalos, como si de una al tener un rango tan amplio de valores resulta mas variable continua se tratase. La consecuencia es una ligera perdida de precision. abierto por el l hay El ultimo intervalo esta mite superior. Dado que en el

25 observaciones puede

ser conveniente cerrarlo con una amplitud razonable. Todos los intervalos excepto el tercero tienen una
(Primer Semestre 2008) Universidad de Concepcion Page 18

Material de apoyo

523486

amplitud de 200 horas, luego podr amos cerrar el ultimo intervalo en 1,300 horas. importante. El histograma representa Antes de realizar el histograma conviene hacer una observacion las frecuencias de los intervalos mediante areas y no mediante alturas. Sin embargo nos es mucho mas hacer representaciones gracas facil teniendo en cuenta estas ultimas. Si todos los intervalos tienen la misma amplitud no es necesario diferenciar entre los conceptos de area y altura, pero en este caso y por tanto hay que repartir su area el tercer intervalo tiene una amplitud doble a los demas, en un rectangulo de base doble (lo que reduce su altura a la mitad). conveniente anadir As sera a la habitual tabla de frecuencias una columna que represente a las amplitudes ai de cada intervalo, y otra de frecuencias relativas recticadas, fi , para representar la altura del histograma. Los gracos requeridos se representan en las guras. Intervalos 300 500 500 700 700 1.100 1.100 1.300

ai
200 200 400 200

ni
50 150 275 25

fi
0,10 0,30 0,55 0,05

fi
0,10 0,30 0,275 0,05

Fi
0,10 0,40 0,95 1,00

T otal = 500

(Primer Semestre 2008) Universidad de Concepcion

Page 19

Material de apoyo

523486

item a)

Figura 5: Histograma. Observese que la altura del histograma en cada intervalo es fi que coincide en todos con fi salvo en el intervalo 700 1.100 en el que fi = 1/2 fi ya que la amplitud de ese intervalo es doble a la de los demas.

(Primer Semestre 2008) Universidad de Concepcion

Page 20

Material de apoyo

523486

item b)

Figura 6: Diagrama acumulativo de frecuencias relativas

(Primer Semestre 2008) Universidad de Concepcion

Page 21

Material de apoyo

523486

item c) al observar la gura se ve que sumando frecuencias relativas, hasta las 900 horas de duracion hay

0, 10 + 0, 30 + 0, 275 = 0, 675 = 67, 5 % de las ampolletas.


directo viendo que la altura correspondiente al valor Esta cantidad se obtiene de modo mas el diagrama de frecuencias acumuladas. igual o menor que 900 horas es Como en total son 500 tubos, el numero de tubos con una duracion

900 en

0, 675 500 = 337, 5, redondeando, 338 ampolletas.

(Primer Semestre 2008) Universidad de Concepcion

Page 22

Material de apoyo

523486

2. Medidas descriptivas
necesario que junto a una medida Los fenomenos biologicos no suelen ser constantes, por lo que sera que indique el valor alrededor del cual se agrupan los datos, se asocie una medida que haga referencia a la variabilidad que reeje dicha uctuacion. comunes: En este sentido pueden examinarse varias caracter sticas, siendo las mas La tendencia central de los datos; o variacion con respecto a este centro; La dispersion Los datos que ocupan ciertas posiciones. La simetr a de los datos. La forma en la que los datos se agrupan.

(Primer Semestre 2008) Universidad de Concepcion

Page 23

Material de apoyo

523486

(Primer Semestre 2008) Universidad de Concepcion

Page 24

Material de apoyo

523486

2.1. Estad sticos de tendencia central


usuales de tendencia central son: Las tres medidas mas la media, la mediana, la moda. En ciertas ocasiones estos tres estad sticos suelen coincidir, aunque generalmente no es as . Cada uno de ellos presenta ventajas e inconvenientes.

(Primer Semestre 2008) Universidad de Concepcion

Page 25

Material de apoyo

523486

2.1.1.

La media

La media aritmetica de una variable estad stica es la suma de todos sus posibles valores, ponderada por las frecuencias de los mismos. Es decir, si la tabla de valores de una variable X es:

X x1
...

nj n1
...

fj f1
...

xm

nm

fm

la media es el valor que podemos escribir de las siguientes formas equivalentes:

x = x1 f1 + . . . + xm fm 1 m = xj n j n j =1
ordenados en una tabla (Datos no agrupados), entonces Si los datos no estan

x=

x1 + . . . + xn n

(Primer Semestre 2008) Universidad de Concepcion

Page 26

Material de apoyo

523486

Observacion de media que tratabamos Hemos supuesto impl citamente en la denicion con una variable reta. Si la variable es continua tendremos que cambiar los valores de

X disc-

xi por las marcas de clase cor respondientes. En general, la media aritmetica obtenida a partir de las marcas de clase M Cj = xj , de la media obtenida con los valores reales, xi . Es decir, habra una perdida de precision que diferira
tanto mayor cuanto mayor sea la diferencia entre los valores reales y las marcas de clase, o sea, sera cuanto mayores sean las longitudes aj , de los intervalos. Tarea: La suma de las diferencias de la variable con respecto a la media es nula, es decir,
n i=1

(xi x) = 0

(Primer Semestre 2008) Universidad de Concepcion

Page 27

Material de apoyo

523486

2.1.2.

La mediana

X cuyas observaciones en una tabla estad stica han sido ordenadas de menor a mayor. Llamaremos mediana, Med al primer valor de la variable que deja por de observaciones, la mediana debajo de s al 50 % de las observaciones. Por tanto, si n es el numero a la observacion [n ] + 1, donde representamos por [ ] la parte entera de un numero. correspondera 2
Consideramos una variable discreta

Figura 7: Mediana representada geometricamente En el caso de variables continuas, las clases vienen dadas por intervalos, y aqu la formula de la
(Primer Semestre 2008) Universidad de Concepcion Page 28

Material de apoyo

523486

(pero no demasiado): Sea mediana se complica un poco mas el encontrado que por debajo estan

(Lj 1 , Lj ] el intervalo donde hemos

50 % de las observaciones. Entonces se obtiene la mediana a


n 2

partir de las frecuencias absolutas acumuladas su formula es:

Med = Lj 1 +

Nj 1 aj nj

(Primer Semestre 2008) Universidad de Concepcion

Page 29

Material de apoyo

523486

Observacion

x (Lj 1 , Lj ], su frecuencia relativa acumulada, F (x) entre los valores F (Lj 1 ) = Fj 1 y F (Lj ) = Fj de forma que:
La gura 7 corresponde a denir para cada posible observacion,

F (x) = F (Lj 1 ) +

F (Lj ) F (Lj 1 ) ( x Lj 1 ) aj =1 . Esto equivale a decir que la mediana divide al 2

De este modo, Med es el punto donde F (Med )


1 histograma en dos partes de areas iguales a 2 .

Entre las propiedades de la mediana, vamos a destacar las siguientes: Como medida descriptiva, tiene la ventaja de no estar afectada por las observaciones extremas, ya que no depende de los valores que toma la variable, sino del orden de las mismas. Por ello es adecuado su uso en distribuciones asimetricas. Es de calculo rapido. A diferencia de la media, la mediana de una variable discreta es siempre un valor de la variable que estudiamos (ej. La mediana de una variable numero de hijos toma siempre valores enteros). esta formada por 2 subpoblaciones de medianas Si una poblacion se puede M ed1 y M ed2 , solo esta comprendida entre M ed1 y M ed2 armar que la mediana, Med, de la poblacion

Med 1 Med Med 2


(Primer Semestre 2008) Universidad de Concepcion Page 30

Material de apoyo

523486

Ejemplo1: Sea X una variable discreta que ha presentado sobre una muestra las siguientes clases.

2, 5, 7, 9, 12 = x = 7,
si a la media:

Med = 7

por otra anormalmente grande, esto no afecta a la mediana, pero Si cambiamos la ultima observacion

2, 5, 7, 9, 125 = x = 29, 6;

Med = 7

En este caso la media no es un posible valor de la variable (discreta), y se ha visto muy afectada por extrema. Este no ha sido el caso para la mediana. la observacion

(Primer Semestre 2008) Universidad de Concepcion

Page 31

Material de apoyo

523486

adjunta. Determinar graca Ejemplo 2: Obtener la media aritmetica y la mediana en la distribucion de las dos medidas es mas signicativo. mente cual

]Lj 1 Lj ] nj
0 - 10 10 - 20 20 - 30 30 - 100 100 - 500 Solucion: 60 80 30 20 10

]Lj 1 Lj ]
0 - 10 10 - 20 20 - 30 30 - 100 100 - 500

nj
60 80 30 20 10

aj
10 10 10 70 400

M Cj = xj
5 15 25 65 300

xj n j
300 1.200 750 1.300 3.000

Nj
60 140 170 190 200

nj
60 80 30 2,9 0,25

n = 200
(Primer Semestre 2008) Universidad de Concepcion

xj nj =6.550
Page 32

Material de apoyo

523486

La media aritmetica es:

x=

1 n

xj n j =

6,550 = 32, 75 200 = 100 es Nj = 140. Por ello el

La primera frecuencia absoluta acumulada que supera el valor n 2 intervalo mediano es ]10;20]. As :

Med = Lj 1 +

n 2

Nj 1 100 60 aj = 10 + 10 = 15 nj 80

Para ver la representatividad de ambas medidas, realizamos el histograma en la gura 8 , y observa la mediana es mas representativa que la media. mos que dada la forma de la distribucion,

(Primer Semestre 2008) Universidad de Concepcion

Page 33

Material de apoyo

523486

Figura 8: Mediana representada geometricamente

(Primer Semestre 2008) Universidad de Concepcion

Page 33

Material de apoyo

523486

2.1.3.

La moda

de frecuencias, es decir, cualquier Llamaremos moda a cualquier maximo relativo de la distribucion valor de la variable que posea una frecuencia mayor que su anterior y su posterior. Se le obtiene facilmente a partir de un arreglo ordenado. A diferencia de la media aritmetica, la se utiliza la moda para moda no se afecta ante la ocurrencia de valores extremos. Sin embargo, solo variable, para distintas muestras, que las demas medidas de propositos descriptivos porque es mas de una moda o ninguna. tendencia central. Un conjunto de datos puede tener mas correcto hablar de intervalos modales. Una vez que este En el caso de variables continuas es mas intervalo, (Li1 , Li ], se ha obtenido, se utiliza la siguiente formula para calcular la moda

Moda = Lj 1 +

n j n j 1 aj (nj nj 1 )(nj nj +1 )

(Primer Semestre 2008) Universidad de Concepcion

Page 34

Material de apoyo

523486

Observaciones De la moda destacamos las siguientes propiedades: de calcular. Es muy facil

Puede no ser unica.


de los intervalos elegidos a traves de su amplitud, numero Es funcion y l mites de los mismos.

Aunque el primero o el ultimo de los intervalos no posean extremos inferior o superior respecti
vamente, la moda puede ser calculada. entre media, mediana y moda: Relacion con frecuencia comprendida entre la En el caso de distribuciones unimodales, la mediana esta cerca de la media). media y la moda (incluso mas es mas aconsejable el uso de la mediana. En distribuciones que presentan cierta inclinacion, conveniente la media.

Sin embargo en estudios relacionados con propositos estad sticos y de inferencia suele ser mas

(Primer Semestre 2008) Universidad de Concepcion

Page 35

Material de apoyo

523486

Consideramos una tabla estad stica relativa a una variable continua. calcular las medidas de tenden cia central ensenadas.

]Lj 1 Lj ] M Cj = xj
02 24 46 68 8 10 1 3 5 7 9

nj
2 1 4 3 2

Nj
2 3 7 10 12

n = 12
Claramente la media es: Solucion:

x=

64 = 5, 3 12

n observaciones, es decir 6. Asi Construimos en la tabla la columna de frecuencias absolutas acumuladas, Ni , y vemos
La mediana es el valor de la variable que deja por debajo de s a la mitad de las que eso ocurre en la tercera clase, es decir:

j = 3 (Lj 1 , Lj ] = (4; 6]

Observacion Intervalo donde se encuentra la mediana (1)


Page 36

(Primer Semestre 2008) Universidad de Concepcion

Material de apoyo
12 2

523486

Med = 4 +

3 2 = 5, 5 (Lj 1 , Lj ] 4

Para el calculo de la moda , lo primero es encontrar los intervalos modales, buscando los maximos relativos en la columna de las frecuencias absolutas, nj . Vemos que corresponde a la clase j el intervalo modal es: (L2 , L3 ]

= 3. asi

= (4; 6], la moda se calcula como:

Moda = Lj 1 +

n j n j 1 41 aj = 4 + 2 = 5, 5 (nj nj 1 ) + (nj nj +1 ) (4 1) + (4 3)

El conjunto de datos es unimodal o bimodal (ver gura) ? gracar el diagrama de diferencial (histograma) y fundamenta tu respuesta.

Figura 9: Distribuciones de frecuencias

(Primer Semestre 2008) Universidad de Concepcion

Page 37

Material de apoyo

523486

2.2. Estad sticos de posicion


Dividen un conjunto ordenado de datos en grupos con la misma cantidad de individuos. Para una variable discreta, se dene el percentil de orden si el Pk , que deja por debajo de k , como la observacion, Esta denicion nos recuerda a la mediana, pues como consecuencia de la k % de la poblacion.

es evidente que denicion

Med = P50 Pk (Lj 1 , Lj ], se calcula Pk se obtiene segun buscando el que deja debajo de si al k % de las observaciones. Dentro de el, la
En el caso de una variable continua, el intervalo donde se encuentra relacion:

n Pk = L j 1 +

k Nj 1 100 aj nj

por lo Por su propia naturaleza, el percentil puede estar situado en cualquier lugar de la distribucion, que no puede considerarsele como una medida de tendencia central. Los cuartiles, Ql, son un caso particular de los percentiles. Hay 3, y se denen como:

(Primer Semestre 2008) Universidad de Concepcion

Page 38

Material de apoyo

523486

Q1 = P25 Q2 = P50 Q3 = P75


De forma analoga se denen los deciles como los valores de la variable que dividen a las observa Mas precisamente, denimos D1 , D2 , ..., D9 como: ciones en 10 grupos de igual tamano.

= Med

Di = P10 i

i = 1, . . . , 9

son denominados estad Los percentiles (que incluyen a la mediana, cuartiles y deciles) tambien sti cos de posicion.

(Primer Semestre 2008) Universidad de Concepcion

Page 39

Das könnte Ihnen auch gefallen