Beruflich Dokumente
Kultur Dokumente
2012 [consultado da mes ao]. Tema 4.1 Disponible en: direccion url del pdf.
Resumen:
Introduccin
Conclusiones
Los mtodos
estadsticos
proporcionan
herramientas
bsicas para la
descripcin y
cuantificacin
de los procesos de salud y
enfermedad,
convirtindose
en una disciplina imprescindible para
los estudios en
salud.
Una muestra
aleatoria es
una muestra
en la que cada
miembro de la
poblacin tiene las mismas
posibilidades
de ser seleccionado, con
independencia
de los miembros
seleccionados
previamente, y
la eleccin de
los diferentes
miembros de la
muestra est
basada en el
azar.
2. Tipos de variables
Una vez seleccionados los sujetos de la muestra, se recoge
informacin sobre las caractersticas a estudio. Generalmente,
los sujetos bajo observacin son individuos, aunque no siempre
(ejemplo: hogares familiares o hospitales). Las caractersticas
medidas en los sujetos se denominan variables. Los valores
que toman cada una de las variables en los diferentes sujetos se
denominan datos.
En la siguiente tabla se presenta la informacin de los primeros
10 nios de la muestra:
Sujetos
Al conjunto
total de sujetos
que estamos
interesados en
estudiar se le
denomina poblacin. Al
subconjunto de
sujetos de la
poblacin que
observamos se
le denomina
muestra. El nmero de sujetos
de la muestra
se conoce como
tamao muestral.
Id
1
2
3
4
5
6
7
8
9
10
Sexo
Masculino
Masculino
Masculino
Masculino
Femenino
Masculino
Femenino
Femenino
Masculino
Femenino
Variables
Edad (meses)
Altura (cm)
8
68.3
9
68.8
6
68.6
25
85.4
16
78.5
Datos
29
95.5
17
70.7
19
76.3
10
70.6
6
66.5
Clase social
Baja
Baja
Media
Alta
Media
Alta
Media
Media
Media
Media
Peso (kg.)
7.0
6.9
8.7
12.3
9.3
15.7
9.6
9.5
9.0
8.4
Las variables,
en funcin
de su escala
de medida,
se clasifican
en Variables
categricas
(ordinales o
nominales)
y Variables
cuantitativas (discretas o continuas)
Diagrama de sectores
Es un crculo en el que a cada categora de la variable se le
asigna un sector de rea proporcional a su frecuencia absoluta
o relativa. El diagrama de sectores de la Clase social de los
160 nios de la muestra sera:
Diagrama de barras
Es un grfico en el que las categoras de la variable se
representan sobre el eje horizontal y sus frecuencias absolutas
o relativas sobre el eje vertical. El diagrama de barras de la
Clase social de los 160 nios de la muestra sera:
El anlisis
descriptivo
de variables
categricas
se realiza,
numricamente, mediante tablas
de frecuencias y, grficamente,
mediante
diagramas
de barras y
diagramas
de sectores.
El anlisis
descriptivo
de variables
cuantitativas se realiza,
numricamente, mediante
una medida
de tendencia
central y una
medida de
dispersin y,
grficamente, mediante
histogramas
y diagramas
de cajas.
Moda
Es el valor que ocurre con ms frecuencia. Si las edades de
los primeros 10 nios de la muestra fueran 8, 9, 6, 25, 16, 29,
17, 19, 10 y 6 aos, la Moda sera 6.
Medida de dispersin
Es un valor que nos indica lo dispersos que se encuentran los
datos alrededor de la medida de tendencia central. Las principales
medidas de dispersin son:
Rango
Es la medida de dispersin ms simple e intuitiva. Se calcula
como la diferencia entre el mayor y el menor valor. Si los
pesos de los primeros 10 nios de la muestra fueran 7.0, 6.9,
8.7, 12.3, 9.3, 15.7, 9.6, 9.5, 9.0 y 8.4 kg., el rango sera:
Rango = 15.7 6.9 = 8.8 kg
Se expresa en las mismas unidades que los datos originales.
Sin embargo, est basado nicamente en los dos valores
extremos y, por tanto, su valor aumenta conforme aumenta
el tamao muestral ya que aumentan las posibilidades de
que aparezcan valores extremos.
Varianza
Para ilustrar el proceso intuitivo que da lugar a la definicin
de Varianza, utilizamos los pesos de los primeros 5 nios de
la muestra: 7.0, 6.9, 8.7, 12.3 y 9.3 kg.
El rango es 12.3 6.9 = 5.4 kg. La principal limitacin
del Rango es que se basa nicamente en dos valores. Nos
planteamos encontrar una medida de dispersin en la que
participen todos los datos de la muestra. Parece conveniente
calcular la diferencia entre cada peso y el peso medio (8.83
kg.):
Individuo
1
2
3
4
5
Peso
(kg)
7.0
6.9
8.7
12.3
9.3
Peso
(kg)
7.0
6.9
8.7
12.3
9.3
Rango Intercuartlico
Se define como la diferencia entre los percentiles 25 y 75. En
nuestro ejemplo, el Rango Intercuartlico sera RI = (8.55;
10.45)
Histograma
Es la representacin grfica ms utilizada en investigacin.
Asimtrica a la derecha
La cola derecha de la distribucin es ms larga que la
cola izquierda.
Ejemplo. Puntuacin GHQ
Asimtrica a la izquierda
La cola izquierda de la distribucin es ms larga que la
cola derecha.
Ejemplo. Perodo de gestacin
Percentil 75
Mediana
95% de
los
datos
Percentil 25
Peso (kg)
10
15
Si la distribucin de
una variable
cuantitativa
es aproximadamente
simtrica,
se utiliza la
media como
medida de
tendencia
central y la
desviacin
estndar
como medida
de dispersin
para describirla. Si, por
el contrario,
la distribucin
de la variable es marcadamente
asimtrica,
se utiliza la
mediana y el
rango intercuartlico
como medidas
de tendencia
central y de
dispersin,
respectivamente
Intervalos de
Confianza
y
MUESTRA
Aplicando las Propiedades de la
Distribucin en el Muestreo
Contraste de
Hiptesis
Un Intervalo
de Confianza
es un rango de
valores dentro
de los cuales
podemos estar
seguros que
se encuentra un valor
poblacional,
denominado
parmetro,
que queremos
estudiar. Un
Contraste
de Hiptesis
es un procedimiento que
nos permite
decidir sobre
la veracidad
de una hiptesis planteada
sobre un valor
poblacional.
La distribucin Normal
es la distribucin ms
importante en
Estadstica.
Est determinada por dos
parmetros:
la Media () y
la Desviacin
Estndar ().
Tiene forma
de campana
y es simtrica
respecto a su
media.
La distribucin
Normal estndar es una
distribucin
con media 0
y desviacin
estndar 1.
(a)
(b)
(b)
0.00
0.3085
0.2743
0.2420
0.2119
0.1841
0.01
0.3050
0.2709
0.2389
0.2090
0.1814
0.02
0.3015
0.2676
0.2358
0.2061
0.1788
0.03
0.2981
0.2643
0.2327
0.2033
0.1762
0.04
0.2946
0.2611
0.2296
0.2005
0.1736
0.05
0.2912
0.2578
0.2266
0.1977
0.1711
0.06
0.2877
0.2546
0.2236
0.1949
0.1685
0.07
0.2843
0.2514
0.2206
0.1922
0.1660
0.08
0.2810
0.2483
0.2177
0.1894
0.1635
0.09
0.2776
0.2451
0.2148
0.1867
0.1611
(a)
(b)
(c)
(b)
(c)
de
las
medias
es
La variacin
en el muestreo es la
variabilidad
que se observa al estudiar
muestras en
lugar de poblaciones.
de
las
medias,
X,
es
Por lo tanto,
Sabemos que el 95% de las puntuaciones z estn entre -1.96 y
+1.96.
con
una
Muestras pequeas
Un Intervalo
de Confianza ser ms
preciso cuanto
ms estrecho
sea. Existen
dos alternativas para
disminuir la
amplitud de
un Intervalo
de Confianza: aumentar
el tamao de
la muestra,
opcin aconsejable, o disminuir el nivel de
confianza.
Un Contraste
de Hiptesis
es un procedimiento cuyo
objetivo es
comprobar si
una determinada hiptesis enunciada
acerca de la
poblacin es
compatible
o no con los
datos de la
muestra.
El primer
paso de un
Contraste
de Hiptesis
consiste en
definir la Hiptesis Nula
(generalmente, ausencia
de asociacin entre dos
variables) y
la Hiptesis
Alternativa
(existencia de
asociacin).
s12 s22 .
+ )
n1 n2
2
2
Bajo la Hiptesis Nula, X 1 X 2 , se distribuye Normal (0, s1 + s2 ) .
n1
n2
(b)
El segundo
paso de un
Contraste de
Hiptesis se
basa en el clculo del test
estadstico,
cuya forma
general es:
Evidencia en contra de la
Hiptesis Nula en el lmite de la
significacin estadstica
0.05
Evidencia en contra de la
Hiptesis Nula
0.01
El tercer
paso de un
Contraste
de Hiptesis consiste
en calcular
el p-valor,
es decir, la
probabilidad
de observar
una diferencia como la
observada en
la muestra o
ms extrema
(ms a favor
de la Hiptesis
Alternativa),
si la Hiptesis Nula fuera
cierta
Conforme el
p-valor es
ms pequeo, mayor es
la evidencia
en contra de
la Hiptesis
Nula. Habitualmente, se
considera que
si el p-valor es
menor de 0.05
se dispone
de suficientes
evidencias
para rechazar
la Hiptesis
Nula, concluyendo que la
asociacin es
estadsticamente significativa. Si el
p-valor es mayor de 0.05,
se considera
que es muy
probable que
las diferencias
observadas se
deban nicamente al azar,
concluyendo
que la asociacin no es estadsticamente
significativa.
El p-valor
indica si la
asociacin
encontrada es
estadsticamente significativa pero
no mide su
magnitud o
relevancia, ya
que su valor
depende tanto
de la magnitud
de la asociacin como del
tamao muestral.
Es fundamental acompaar
el p-valor de
una medida
que cuantifique la magnitud de la
asociacin en
la muestra y
un Intervalo
de Confianza
al 95% para
la medida de
asociacin
utilizada.
n2 = 12
x2 = 106.4
s2 = 8.1
n1 = 10
x1 = 97.2
s1 = 4.7
75 pulsaciones / minuto
di
5
6
1
0
-1
El anlisis de
datos apareados se
hace calculando las diferencias entre
cada par de
observaciones
apareadas,
y aplicando
posteriormente los mtodos
para realizar
Inferencias sobre una Media.
En nuestro ejemplo,
Suma Cuadrados
(SC)
482.47
103.84
586.31
Media Cuadrtica
(MC = SC/gl)
241.23
0.66
3.69
(i, j = 1,2,3)
En nuestro ejemplo,
Cuando slo
hay 2 grupos,
el Anlisis de
la Varianza da
exactamente
el mismo resultado que el
contraste t de
Student para
la comparacin de la media en 2 grupos diferentes
de individuos.
La relacin
entre dos variables cuantitativas puede
explorarse
grficamente
mediante un
Diagrama de
dispersin y
numricamente, mediante
el Coeficiente
de correlacin lineal de
Pearson.
En el Diagrama de
Dispersin,
el sentido de
la asociacin
viene determinado por la inclinacin de la
nube de puntos: positiva,
si valores altos
de una variable se asocian
con valores altos de la otra;
y negativa, si
valores altos
de una variable se asocian
con valores
bajos de la
otra. La fuerza
de la asociacin viene determinada por
lo aplastado
de la nube de
puntos; asociacin ms
fuerte conforme los puntos
estn ms
cerca unos de
otros.
e = residuos
Valor observado
Recta regresin
La Regresin
Lineal permite estudiar la
relacin entre
dos variables
cuantitativas,
describiendo
el comportamiento de una
variable en
funcin de la
otra
El objetivo de
la Regresin
Lineal consiste
en determinar
la lnea recta,
denominada
Recta de Regresin, que
mejor describa
la relacin entre la variable
de exposicin
y la variable
de inters.
El intercepto
(a) se interpreta como
la media de
y cuando x
toma el valor
0; la media de
la variable de
inters cuando la variable
de exposicin
vale 0. Si la
variable de
exposicin no
puede tomar
el valor 0, el
intercepto no
es interpretable. La pendiente (b)
se interpreta
como el cambio por trmino medio en y
por cada aumento de una
unidad en x;
el cambio por
trmino medio
en la variable
de inters por
cada aumento
de una unidad
en la variable
de exposicin.
5. Mtodos no paramtricos
Los mtodos presentados hasta ahora, conocidos como mtodos
paramtricos, asumen que la variable de inters sigue una
distribucin aproximadamente Normal. Pero, qu mtodo
utilizar si esta asuncin no se cumple?
Mtodos no paramtricos: Se utilizan para analizar variables
de inters que no siguen una distribucin Normal. Se basan en
el anlisis de los rangos, reemplazando cada valor de la variable
de inters por su rango correspondiente.
Bootstrapping: Tcnica que permite calcular Intervalos de
Confianza haciendo muy pocas asunciones sobre la distribucin
de la variable de inters.
Errores estndar robustos: Tcnica que permite calcular
Intervalos de Confianza y Errores Estndar a partir de la
distribucin observada, y no asumida, de la variable de inters.
A continuacin, se presentan las principales ventajas y
desventajas de los Mtodos no Paramtricos.
Ventajas
Son ms robustos que los mtodos paramtricos, en el sentido
de que estn menos afectados por observaciones extremas.
Limitaciones
Los mtodos no paramtricos se han utilizado tradicionalmente
para realizar Contrastes de Hiptesis; el desarrollo de mtodos
no paramtricos para el clculo de Intervalos de Confianza es
Conclusiones
Referencias bibliogrficas
1. Pea D, Romo J. Introduccin a La Estadstica para las Ciencias Sociales. Editorial McGraw Hill, 2003
2. Martnez M.Bioestadstica amigable. Editorial Daz de Santos,
2006
3. Hernndez-Aguado I, Gil A, Delgado M, Bolumar F. Manual
de Epidemiologa y Salud Pblica. Editorial Mdica Panamericana, 2005
4. Kirkwood B, Sterne J. Essential Medical Statistics. Blackwell
Science Ltd, 2001.