Sie sind auf Seite 1von 36

BIOESTADSTICA

Estadstica Descriptiva

Facultad de Ingeniera Ambiental - UNI


MSc. Beatriz Castaeda S.
ESTADISTICA

POBLACION

E1 E2 E3 E4 E5 . . . EN
X1 X2 X3 X4 X5 . . . XN
Estadstica Descriptiva

Probabilidad
Inferencia
Muestreo

MUESTRA
E1 E2 E3 . . . En
X1 X2 X3 . . . Xn
Estadstica Descriptiva

Bioestadstica Mg. Beatriz Castaeda S. 2


Poblacin:
Es el conjunto de elementos para los cuales se tiene
inters en estudiar alguna caracterstica (por ejemplo
los nios de un distrito)

Es el conjunto de valores asociados a cada uno de los


elementos segn la caracterstica de inters (por ejemplo, si
interesa estudiar el peso de los nios, al medirlos se tendr la
poblacin de pesos de los nios del distrito)

Muestra: Es una parte de la poblacin

Unidades de observacin: Son los elementos para los


cuales se va a estudiar sus caractersticas.

Variable:
Es la caracterstica que interesa estudiar para los elementos.
Bioestadstica Mg. Beatriz Castaeda S. 3
ESTADSTICA
Es el campo de la ciencia que se relaciona con
1) La recopilacin, organizacin y resumen de los datos
2) La obtencin de inferencias acerca de un conjunto de
datos cuando slo se observa una parte de ellos.

BIOESTADSTICA
Cuando los datos que se estn analizando se obtienen de
las ciencias biolgicas y de la medicina, se utiliza el trmino
de bioestadstica para diferenciar a esta aplicacin
particular de herramientas y conceptos estadsticos.

Bioestadstica Mg. Beatriz Castaeda S. 4


La ciencia estadstica trata con:

- Diseo de experimentos
- Coleccin y manejo de datos
- Evaluacin de medidas de resumen
- Estimacin de parmetros poblacionales
- Prueba de hiptesis respecto a las
poblaciones
- Estudio de la relacin entre dos o ms
variables.
Bioestadstica Mg. Beatriz Castaeda S. 5
SELECCIN DE LOS MTODOS
ESTADSTICOS

Antes de seleccionar un mtodo estadstico debemos


tomar dos decisiones:

1) Cul es la variable dependiente y cual es la


independiente, y
2) Qu tipo de datos constituyen cada una de esas
variables.

Bioestadstica Mg. Beatriz Castaeda S. 6


Clasificacin de las variables en
funcin de los objetivos de la
investigacin
Variable Variables
dependiente: independientes:
Puede identificarse como Son las que determinan
la variable de inters las caractersticas que es
principal o el desenlace necesario tener en cuenta
principal del estudio. o las condiciones en que
Queremos contrastar hip- se contrastan las hiptesis
tesis o hacer estimacio- o se realizan las estima-
nes, o efectuar ambos pro- ciones.
cedimientos, acerca de la
variable dependiente.

Bioestadstica Mg. Beatriz Castaeda S. 7


Tipos de Variable y Escala
de Medicin
Tipo de Descripcin Escala Ejemplo
variable

Nominal -sexo
Clasifica a los
(no establece -estado civil
elementos
orden) -raza
Categrica en categoras o clases
-Dolor
Ordinal -Color (intensidad)
(orden en -Estado de
categoras) enfermedad
-Edad
Cuando asume valores -talla
Cuantitativa cuantitativos. Numrica
-peso
- Discretos -nmero de hijos
- Continuos -tiempo de
enfermedad
-Cloro residual

Bioestadstica Mg. Beatriz Castaeda S. 8


ORGANIZACIN Y
PRESENTACION DE DATOS
Arreglo ordenado segn edad de mujeres
con evaluacin de sobresaturacin de bilis
% de % de
Sobresa Sobresa
Orden Sujeto Edad turacin Orden Sujeto Edad turacin
1 7 23 98 16 4 44 89
2 12 23 35 17 27 44 84
3 25 23 46 18 15 47 77
4 20 25 69 19 26 48 107
5 6 27 58 20 3 49 76
6 10 30 66 21 23 49 73
7 2 33 86 22 14 50 127
8 13 35 55 23 18 53 75
9 16 36 91 24 8 56 146
10 28 37 120 25 21 57 84
11 11 38 52 26 29 57 123
12 1 40 65 27 24 60 87
13 9 41 80 28 5 63 142
14 19 41 82 29 17 74 128
15 22 42 116
Bioestadstica Mg. Beatriz Castaeda S. 9
Edad de mujeres sometidas a evaluacin
de porcentaje de sobresaturacin de bilis

Edad N de
(aos) mujeres Porcentaje
20 - 29 5 17%
30 - 39 6 21%
40 - 49 10 34%
50 - 59 5 17%
60 - 69 2 7%
70 - 79 1 3%
Total 29 100%

Bioestadstica Mg. Beatriz Castaeda S. 10


Histograma de frecuencias
Edad de mujeres sometidas a evaluacin de
porcentaje de saturacin de colesterol en bilis

12
10
N de mujeres

8
6
4
2
0
10 - 19 20 - 29 30 - 39 40 - 49 50 - 59 60 - 69 70 - 79 80 - 89
Edad (aos)

Bioestadstica Mg. Beatriz Castaeda S. 11


Agrupamiento por conteo individual

Etapa de la Nmero de
enfermedad pacientes Porcentaje
1 3 3%
2 28 24%
3 63 55%
4 21 18%
Total 115 100%

Etapa de la enfermedad de pacientes


con cncer colorrectal
Nmero de pacientes

70
60
50
40
30
20
10
0
1 2 3 4
Etapa de la enfermedad

Bioestadstica Mg. Beatriz Castaeda S. 12


Datos categricos

Bacteriemia N de pacientes %
Si 4 20%
No 16 80%
Total 20 100%

Frecuencia de bacteriemia en pacientes hipotticos


con cultivos de catter

20%

Si
No

80%

Bioestadstica Mg. Beatriz Castaeda S. 13


MEDIDAS DE RESUMEN

Llamadas tambin medidas


descriptivas por que tienen por objeto
describir la naturaleza de la
caracterstica en estudio.

MEDICIN DE DATOS NUMRICOS


- Medidas de Posicin: Media aritmtica o promedio, Moda,
Cuantilas: Mediana, cuartiles, deciles, percentiles

- Medidas de dispersin: Amplitud o rango, Varianza y


desviacin
Bioestadstica estndar y el Coeficiente de Variacin
Mg. Beatriz Castaeda S. . 14
Medidas de Posicin
MEDIA: Indica el centro de los datos, valor alrededor del
cual tiende a tomar medida la mayora de los datos.

x
n de n de
i hijos familias xi ni
x i 1 (xi) (ni)
n 0 4 0
198
1
2
8
11
8
22
x 3.09
Datos sin agrupar 64
3 15 45
4 10 40 3 hijos / familia
k

xn
5 13 65
i i 6 3 18
x i 1
TOTAL 64 198
n
Datos agrupados
Bioestadstica Mg. Beatriz Castaeda S. 15
Medidas de Posicin
2645.5
x 35.27 aos
Edad xi ni xi ni 75
5 14 9.5 5 47.5
15 24 19.5 10 195.0 Moda: Valor que ocurre
25 34 29.5 20 590.0 con mayor frecuencia (ms
35 44 39.5 22 869.0 probable), se calcula para
45 54 49.5 13 643.5
muestras moderadamente
55 64 59.5 5 297.5
grandes.
TOTAL 75 2645.5

Moda = 39.5 aos

Bioestadstica Mg. Beatriz Castaeda S. 16


Medidas de Posicin
Edad de mujeres sometidas a
Evaluacin de porcentaje de
Distribucin acumulada de las mujeres
Saturacin de bilis 100%
segn edad
Edad N de N 90%
(aos) mujeres Porcentaje acumulado 80%

% de mujeres
70%
20 - 29 5 17% 5 60%
30 - 39 6 21% 11 50%
40%
40 - 49 10 34% 21 30%
20%
50 - 59 5 17% 26 10%
60 - 69 2 7% 28 0%
20 29 39 49 59 69 79 Total
70 - 79 1 3% 29
Edad (aos)
Total 29 100%

Percentil: Medida que indica en que punto se acumula una


porcin p de datos con valor mximo el punto indicado
Bioestadstica Mg. Beatriz Castaeda S. 17
Medidas de Posicin
Mediana : Me = P50 = X0.50 Mediana = 36 aos

El 50% de las personas tienen mximo 36 aos

Cuartiles: q1= P25 = X0.25 , q3 = P75 = X0.75

q1 = 27 aos

El 25% de las personas tienen a los ms 27 aos y el 75% restante tienen


Mas de 27 aos.

Bioestadstica Mg. Beatriz Castaeda S. 18


Medidas de Posicin
Obtencin de cuantilas para datos agrupados
1) Datos agrupados por conteo individual

n de n de N Xp = xj si y slo si
hijos familias acumulado
(xi) (ni) Ni Nj np y Nj-1 np
0 4 4
1 8 12
2 11 23 P10 = X0.10 = 1 hijo
3 15 38
4 10 48
5 13 61 P50 = X0.50 = 3
6 3 64 hijos
Total 64 P75 = X0.75 = 4 hijos

Bioestadstica Mg. Beatriz Castaeda S. 19


Medidas de Posicin
Se determina el intervalo que
2) Datos agrupados por contiene a la cuantila Xp como
intervalos
LjI Ljs Si y slo si
Edad N de N
(aos) mujeres Porcentaje acumulado
20 - 29 5 17% 5 Nj np y Nj-1 np
30 - 39 6 21% 11
40 - 49
50 - 59
10
5
34%
17%
21
26
X p LjI c
np N j 1
60 - 69 2 7% 28
70 - 79 1 3% 29 nj
Total 29 100%

P25 = 29.5 + 10 (7.25 5) = 33.5


aos
6
P50 = 39.5 + 10 (14.5 11) = 43 aos
10
Bioestadstica Mg. Beatriz Castaeda S. 20
Medidas de dispersin
Medidas de Dispersin o variabilidad:
Rango, Varianza y desviacin estndar, coeficiente de variacin

Rango: Indica la variabilidad general de los datos obteniendo la diferencia


entre los valores mximo y mnimo. Se usa con muestras pequeas.

Varianza y Desviacin estndar: Indican la variabilidad como la medida


de dispersin de los datos respecto a la media.
i n n

(x x) x n x
2 2 2
i i
S
S
2 i 1
i 1
; S S ; 2
CV x100
n 1 n 1 x
Coeficiente de Variacin: Indica la dispersin en unidades porcentuales
de la media
Bioestadstica Mg. Beatriz Castaeda S. 21
MEDIDAS DE RESUMEN
Los siguientes son los niveles de hemoglobina (g/100ml) de 10
nios que reciben tratamiento para anemia hemolitica:

9,1 10,0 11,4 12,4 9,8 8,3 9,9 9,1 7,5 6,7

Los datos ordenados Son:

6,7 7,5 8,3 9,1 9,1 9,8 9,9 10,4 11,4 12,4

Medidas de resumen:
Mnimo: 6,7 Mximo: 12,4 x 9,42 g / 100 ml

S2 = 2,895 (g/100ml)2
Rango = 5,7

Mediana= 9,45 g/100ml S = 1,70 g/100ml C.V. = 18%

Bioestadstica Mg. Beatriz Castaeda S. 22


Medidas de Dispersin
Clculo de varianza para datos agrupados

k k

( x i x ) ni xi2 ni n x
2 2

S2 i
1
Varianza muestral
n1 n 1

Edad (aos) xi ni xi ni Xi2 ni


2645.5
x 35.27 aos
5 14 9.5 5 47.5 451.25 75
15 24 19.5 10 195.0 3802.50
105538.75 75( 35.27)2
25 34 29.5 20 590.0 17405.00 S 2
165.42
74
35 44 39.5 22 869.0 34325.50

45 54 49.5 13 643.5 31853.25 S 12.86 aos


55 64 59.5 5 297.5 17701.25
12.86
Total 75 2645.5 105538.75 C .V . x 100 36.5%
35.27
Bioestadstica Mg. Beatriz Castaeda S. 23
Asimetra

x Me Mo
Mo = x = Me Mo Me x

3 ( x Me )
Coeficiente de asimetra de Pearson: S kP
S

Bioestadstica Mg. Beatriz Castaeda S. 24


Curtosis

Distribucin
platicrtica Distribucin Mesocrtica Dist. Leptocrtica

Coeficiente de curtosis Distribucin platicrtica: k 0


( x0.75 x0.25 )
K Distribucin Mesocrtica: k 0.25
2 ( x0.90 x0.10 )

Distribucin Leptocrtica: k 0.5


Bioestadstica Mg. Beatriz Castaeda S. 25
Medicin en Epidemiologa
TASA
Una tasa es una comparacin por cociente entre un nmero de eventos
ocurridos en un tiempo y lugar dados y la poblacin que estuvo
expuesta al riesgo de que le ocurrieran dichos eventos en la misma
poca y en ese mismo lugar

a
Tasa x base; base 10n
ab

La tasa es la expresin numrica del riesgo al que estuvo sometida la


poblacin.
Nos permite estimar la probabilidad de que exista ese riesgo para la
poblacin en perodos inmediatos, particularmente si las condiciones
de dicha poblacin se mantienen estables.

Bioestadstica Mg. Beatriz Castaeda S. 26


Tasas de uso frecuente
N de defunciones ocurridas en
una regin y ao dado
Tasa anual bruta de mortalidad x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

N de defunciones nios menores de un ao


ocurridas en una regin y ao dado
Tasa de mortalidad inf antil x 1000
N total de nacimientos vivos ocurridos en la
poblacinen de la misma regin y ao dado

N de enfermos nuevos de una afeccin


aparecidos en una regin y ao dado
Tasa de incidencia x 1000
Estimacin de la poblacin a mitad de ao
en la misma regin y el mismo ao

Bioestadstica Mg. Beatriz Castaeda S. 27


Calcificaciones pulmonares en dos poblaciones
con fabrica de asbestos

Distancia de Poblacin A Poblacin B


domicilios a la
fbrica asbestos Habitantes Habitantes
(Km) N % Casos N % Casos

0 0,9 1 531 13,8 279 5 438 9,1 462


1,0 1,9 1 904 17,2 69 4 489 7,5 117
2,0 2,9 2 599 23,5 141 10 351 17,4 802
3,0 3,9 4 672 42,2 2 36 994 62,0 37
4,0 y ms 368 3,3 119 2 384 4,0 665

TOTAL 11 074 100,0 610 59 656 100,0 2083

Tasas de calcificaciones Tasa A =610/11074= 55,1calcific/ 1000 h


Tasa B =2083/59,656= 34,9calcific/ 1000 h
Bioestadstica Mg. Beatriz Castaeda S. 28
Ajuste de Tasas
Cuando dos poblaciones tienen diferente estructura de
poblacin no es apropiado comparar las tasas globales ya que
est comparacin podra no ser vlida debido a stas
diferencias

Mtodo directo de ajuste de tasas

1 Definir cul poblacin ser sometida a las condiciones de la otra


2 Con las tasas especficas de la poblacin mayor se calculan los
casos esperados de la poblacin menor

Casos esperados = Poblacin x tasa


Constante

Bioestadstica Mg. Beatriz Castaeda S. 29


Ajuste de Tasas
Casos esperados en poblacin A,
bajo condiciones de poblacin B
Casos esperados en A
Distancia Estructura de A Tasas de bajo condiciones de B
(Km) B
Habitantes

0 0,9 1 531 85,0 130


1,0 1,9 1 904 26,1 50
2,0 2,9 2 599 77,5 201
3,0 3,9 4 672 1,0 5
4,0 y ms 368 278,9 103
TOTAL 11 074 489

Tasa ajustada = Suma de casos esperados x constante


Poblacin

Tasa ajustada (A) = 489 x 1000 = 44,2


1074
Bioestadstica Mg. Beatriz Castaeda S. 30
Riesgo Relativo
Estudios de Cohorte Incidencia Acumulativa

Personas Expuestas No Total


Expuestas
Enfermos A1 A0 A
No N1-A1 N0- A0 N-A
enfermos
Total N1 N0 N
A1 / N1
RR
A0 / N0
Estimacin Intervlic a al 95% de confianza
N1 A1 N1 A 0
ln RR 1.96
Lmites : L e
N1A1 N0 A0

Bioestadstica Mg. Beatriz Castaeda S. 31


Riesgo Relativo
Si RR = 1, nos indica que el factor de exposicin no es un factor
de riesgo para la enfermedad, pues se tiene la misma incidencia
de enfermedad para las personas expuestas que para las no
expuestas.

- Si RR 1, nos indica que el factor de exposicin es un factor


de riesgo para la enfermedad, ya que para las personas
expuestas se tiene mayor incidencia de la enfermedad que para
las personas no expuestas.

Si RR 1, nos indica que el factor de exposicin es un factor de


proteccin para la enfermedad, ya que para las personas
expuestas se tiene menor incidencia de la enfermedad que para
las no expuestas.
Bioestadstica Mg. Beatriz Castaeda S. 32
Riesgo Relativo
Asuma que de 100 individuos expuestos 20 desarrollaron la
enfermedad. En un grupo de 200 individuos no expuestos, 25
desarrollaron la enfermedad. As en un arreglo de 2x2 tenemos:

Individuos Expuesto No expuestos Total


s RR = (20/100)
Enfermos 20 25 45
(25/200)
No enfermos 80 175 255 = 1.60

Total 100 200 300

Li = 0.935
100 20 200 25
ln(1.60) 1.96
Le 100 ( 20) 200( 25)
Ls = 2.74
Bioestadstica Mg. Beatriz Castaeda S. 33
Odds Ratio
Estudios de Casos Control
Personas Expuestas No Expuestas Total
Casos a b N1
Controles c d N0

a/b
OR
c/d
Estimacin Intervlic a al 95% de confianza
1 1 1 1
ln OR 1.96
Lmites : L e a b c d

Bioestadstica Mg. Beatriz Castaeda S. 34


Odds Ratio
Si OR = 1, nos indica que el factor de exposicin no es un
factor de riesgo para la enfermedad, pues la relacin de
expuestos a no expuesto es la misma para casos y controles.

Si OR 1, nos indica que el factor de exposicin es un factor


de riesgo para la enfermedad, ya que la proporcin de casos
que han sido expuestos es mayor que la proporcin de
controles que han sido expuestos.

Si OR 1, nos indica que el factor de exposicin es un factor


de proteccin para la enfermedad, ya que aqu la porcin de
expuestos es mayor en los controles que en los casos.

Bioestadstica Mg. Beatriz Castaeda S. 35


Odds Ratio
En un estudio de casos-control de dieta con frituras y cncer
pancretico (Norell et al 1986), los siguientes datos fueron
obtenidos:
Dieta No dieta con
Individuos con frituras Total
frituras
Casos 53 43 96 OR = 53/43 = 1.98
53/85
Controles 53 85 138

Total 106 128 234

1 1 1 1 Li = 1.167
ln(1.98) 1.96
Le 53 43 53 85
Ls = 3.359

Bioestadstica Mg. Beatriz Castaeda S. 36

Das könnte Ihnen auch gefallen