Sie sind auf Seite 1von 23

Bioestatstica

Aula 4


Profa. Dra. Patrcia Calil



Bioestatstica | Aula 4
2

Ol, seja bem-vindo!
Assista ao vdeo a seguir e conhea quais sero os assuntos discutidos
nesta aula.

Introduo
Nas aulas anteriores ns estudamos diversas caractersticas de apenas
uma varivel, analisando o seu comportamento dentro de uma populao ou
amostra. Todavia, dentro das reas biolgicas e da sade, existem diversos
momentos em que h necessidade de estudar o comportamento conjunto de
duas variveis, ou seja, como a relao entre elas pode variar dentro de uma
populao.
A relao entre essas variveis pode ser observada por meio de grficos
e tabelas, mas tambm atravs de clculos que indicam a fora da relao, ou
se h relao de causa e consequncia entre elas. Na estatstica utilizamos a
correlao e a regresso de dados para observar a relao entre variveis
quantitativas, sendo esse o assunto desta aula.

Diagrama de Disperso
A parte relativa correlao segue as orientaes propostas por Vieira
(1998), contendo algumas modificaes. O diagrama de disperso um grfico
que contm duas variveis sem relao de causa e feito nos eixos X e Y.
Dentro da rea do grfico marcado um ponto onde houver o encontro do
valor do eixo X que corresponda ao valor no eixo Y. Por exemplo, para cada
exemplar de uma espcie de crustceo foi obtido o peso (g) e a quantidade de
ovos. Os resultados esto dispostos na tabela abaixo (tabela 12).


Bioestatstica | Aula 4
3

Tabela 12 Peso (g) e nmero de ovos de uma
espcie de crustceo
Peso (g) N
o
de ovos
1,5 15
1,8 18
1,9 20
2,0 25
2,1 27
2,5 35
2,8 36
3,0 41
3,3 41
3,3 42
4,0 46
4,4 40
4,6 47
4,8 49
5,0 51
5,2 55
5,4 55
5,5 50
5,5 62

Fonte: criado por Patrcia Calil, dados hipotticos.

Quando os dados da tabela 12 so plotados em um grfico, temos um
diagrama de disperso.
0
10
20
30
40
50
60
70
1 1.5 2 2.5 3 3.5 4 4.5 5 5.5 6
Peso (g)
N

m
e
r
o

d
e

o
v
o
s

Figura 12 - Peso (g) e nmero de ovos de uma espcie de crustceo.
Fonte: criado por Patrcia Calil.



Bioestatstica | Aula 4
4

Correlao Positiva e Negativa
Se medida que os valores de X aumentam, os valores de Y seguem a
mesma tendncia, ou seja, tambm aumentam, podemos dizer que as
variveis possuem uma correlao positiva. O exemplo dado acima (figura
12) representa bem uma correlao desse tipo, pois medida que o peso dos
crustceos aumenta, aumenta tambm o nmero de ovos que eles carregam.
Devemos tomar cuidado para no interpretar essa relao de forma errada, ou
subjetiva. A correlao positiva no indica que uma varivel est aumentando
por causa da outra, ou seja, no h relao de causa e dependncia entre as
variveis. Sabe-se, pela literatura especfica da rea, que diversas outras
variveis, tais como a temperatura da gua e o suporte de alimento, podem
influenciar a quantidade de ovos carregados por crustceos em geral.



Tabela 13 - Tempo mdio reservado para as refeies (min) em
diferentes pases e ndice mdio de problemas cardiovasculares (%).
Pas
Tempo reservado para
as refeies (min)
ndice de problemas
cardiovasculares (%)
frica 13 37
Brasil 18 36
Polnia 35 30
Chile 45 24
Itlia 75 22
Alemanha 78 15
Frana 88 10
Grcia 90 10
Espanha 91 18
Dinamarca 102 12
Sucia 105 10
Islndia 120 7
Fonte: criado por Patrcia Calil, dados hipotticos.

A correlao negativa ocorre quando as variveis X e Y variam em sentidos
contrrios, isto , na medida em que X cresce, Y decresce. Observe na tabela 13
um exemplo de variveis com correlao negativa.



Bioestatstica | Aula 4
5

Nessa tabela, transformada em grfico abaixo (figura 13), podemos
observar que na medida em que o tempo reservado para as refeies aumenta,
o ndice de problemas cardiovasculares diminui. Isto , as variveis variam em
sentidos opostos. Porm, nada indica uma relao de dependncia, ou causa e
consequncia, mesmo porque o aumento da porcentagem de problemas
cardiovasculares pode estar relacionado a diversos outros fatores, como o nvel
de vida, por exemplo, muito mais alto em pases econmica e socialmente mais
desenvolvidos.
0
5
10
15
20
25
30
35
40
0 20 40 60 80 100 120 140
Tempo reservado para as refeies - min

n
d
i
c
e

d
e

p
r
o
b
l
e
m
a
s

c
a
r
d
i
o
v
a
s
c
u
l
a
r
e
s

-

%

Figura 13 - Tempo mdio reservado para as refeies (min) em diferentes pases e ndice mdio
de problemas cardiovasculares (%).
Fonte: criado por Patrcia Calil.

Assista ao vdeo a seguir e entenda melhor o que acabamos de
estudar sobre correlao positiva e negativa.





Bioestatstica | Aula 4
6

Coeficiente de Correlao
At agora vimos que os dados podem apresentar uma correlao
positiva ou negativa. Entretanto, existe uma medida que reflete o nvel, ou grau
de correlao, entre as variveis. Essa medida o coeficiente de correlao
de Pearson, representado pela letra r. Para obter esse ndice, devemos
utilizar a frmula:

Vamos aplicar a frmula para obter o coeficiente linear de Pearson em
dois exemplos: correlao positiva e correlao negativa.
Na tabela abaixo (tabela 14), esto registrados valores de uma
correlao positiva e de uma correlao negativa, valores transformados em
grfico na figura 14.

Tabela 14 - Exemplo de correlao positiva e negativa

Correlao
Positiva Negativa
x y x y
1 1 1 7
2 2 2 4
3 4 3 4
4 5 4 3
5 8 5 1

Fonte: Vieira (1998, p.49).




= r
( )
n
y
y
2
2


( )
n
x
x
2
2


n
y x
xy






Bioestatstica | Aula 4
7



0
1
2
3
4
5
6
7
8
0 1 2 3 4 5 6
x
y
0
1
2
3
4
5
6
7
8
9
0 1 2 3 4 5 6
x
y

Figura 14 - Exemplo de correlao positiva e negativa.
Fonte: recriado por dados de Vieira (1998, p.49).


Para facilitar a obteno do resultado do coeficiente de correlao de
Pearson necessrio fazer alguns clculos intermedirios e os representar por
meio da tabela de correlao resumida (tabela 15), seguindo-se para a
substituio dos valores na frmula.

Tabela 15 - Tabela de correlao resumida com os clculos intermedirios
para a obteno do coeficiente de correlao de Pearson para o exemplo de
correlao positiva da tabela 14.

x y X
2
Y
2
xy
1 1 1 1 1
2 2 4 4 4
3 4 9 16 12
4 5 16 25 20
5 8 25 64 40
15 20 55 110 77

Fonte: Vieira (1998, p.49).




Bioestatstica | Aula 4
8


= r
77
5
15 . 20

)
5
(
2
15

55
( )
5
20

110
2



) ( ) ( 80 110 45 55
60 77
= r


300
17
98 , 0 =
= r



Foram tambm realizados os clculos intermedirios para a obteno do
coeficiente de correlao de Pearson, com os valores de correlao negativa
expostos na tabela 14, e realizao da frmula.

Tabela 16 - Tabela de correlao resumida com os clculos intermedirios
para a obteno do coeficiente de correlao de Pearson para o exemplo de
correlao negativa da tabela 14.

x y x
2
y
2
xy
1 7 49 1 7
2 4 16 4 8
3 4 16 16 12
4 3 9 25 12
5 1 1 64 5
15 19 91 110 44

Fonte: Vieira (1998, p. 49).




Bioestatstica | Aula 4
9


= r
44
5
15 . 19

)
5
(
2
15

55
( )
5
19

91
2




) ( ) ( 2 , 72 91 45 55
57 44
= r




188
13
95 , 0 = = r



O coeficiente de correlao de Pearson pode variar entre 1 e + 1. Se
aps o clculo for obtido r = 1, podemos dizer que as duas variveis apresentam
uma correlao perfeita positiva. J se for obtido um valor de r = 1, dizemos
que as variveis apresentam uma correlao perfeita negativa. Se, contudo, r
assumir um valor igual a zero (r = 0), a correlao nula, ou seja, no h
correlao entre as variveis, como mostram a tabela (tabela 17) e o grfico
abaixo (figura 15).


Tabela 17 - Exemplo de correlao nula.

x y
1 3
2 9
4 6
5 9
6 3

Fonte: VIEIRA (1998, p. 51).



Bioestatstica | Aula 4
10


0
1
2
3
4
5
6
7
8
9
10
0 1 2 3 4 5 6 7
x
y

Figura 15 - Exemplo de correlao nula.
Fonte: recriado por dados de Vieira (1998, p.51).

Nem sempre, contudo, podemos ter certeza de que um valor de r
representa realmente a existncia de uma correlao, pois na maioria das
vezes utiliza-se uma amostra aleatria da populao e no toda a populao
para o estudo da correlao entre duas variveis. Para testar se h correlao,
devemos utilizar um teste de hiptese sobre a correlao calculada. Os
fundamentos, aplicaes e a frmula desse tipo de teste sero explicados
terica e praticamente na aula 6.



Vrios vdeos contendo tutoriais esto disponveis na internet. Vale conferir um
que ensina, de forma simples, como fazer correlao linear de Pearson no Excel,
disponvel em: <http://www.youtube.com/watch?v=f7psvSOCGS4>.
Para acompanhar a explicao de como fazer a reta de regresso e seu
respectivo grfico, assista ao tutorial disponvel em:
<http://www.youtube.com/watch?feature=player_embedded&v=HCBS6uqlHF8#!>



Bioestatstica | Aula 4
11

No vdeo a seguir esses exemplos sero explicados visualmente para
que voc consiga acompanhar todos os clculos e o significado dos grficos de
correlao.

Regresso Linear
Alm de conhecer o comportamento conjunto de duas variveis, como
acabamos de estudar na sesso sobre correlao, podemos tambm ter
interesse na relao de causa e dependncia entre elas, isto , como uma
varivel varia em funo de outra. Na rea biolgica, por exemplo, h sempre
interesse em analisar a taxa reprodutiva de um animal em funo do seu
tamanho. O mesmo ocorre na rea da sade, sendo, por exemplo, bvia a
importncia de conhecer como o peso varia em funo da idade de um grupo
de crianas.
Sempre que houver a suposio de dependncia entre duas variveis,
mais adequado utilizar a regresso do que a correlao. A regresso pode
ser observada por meio de um grfico de linhas, semelhante ao grfico de
disperso, porm contendo uma linha de tendncia entre os pontos plotados na
rea do grfico.

Grfico de Linhas
Antes de plotar graficamente os dados no grfico de linhas, devemos
determinar qual a varivel dependente e qual a independente. Para tal,
assume-se que Y a varivel dependente e X a independente (tambm
chamada de explanatria). Assim, podemos dizer que Y varia em funo de
X, ou que Y depende de X. Observe os valores de comprimento total, em
milmetros, e o nmero de larvas de uma espcie de misidceo (tabela 18), um


Bioestatstica | Aula 4
12

microcrustceo muito abundante nas zonas de arrebentao do oceano
Atlntico, que incuba seus ovos em bolsas no abdome. Em seguida esses
dados foram plotados em um grfico de linhas (figura 16).

Tabela 18 - Comprimento total (mm) e nmero de larvas de uma espcie de
misidceo.
Comprimento
(mm)
N
o
de larvas Comprimento
(mm)
N
o
de larvas

1,1 2 3,4 9
1,3 2 3,4 12
1,5 3 3,6 12
1,7 3 3,8 13
2,0 5 4,0 15
2,2 6 4,2 17
2,3 7 4,4 17
3,0 8 4,5 19

Fonte: criado por Patrcia Calil, dados hipotticos.


0
2
4
6
8
10
12
14
16
18
20
1 1.5 2 2.5 3 3.5 4 4.5 5
Comprimento total (mm)
N

m
e
r
o

d
e

l
a
r
v
a
s

p
o
r

i
n
d
i
v

d
u
o

Figura 16 - Comprimento total (mm) e nmero de larvas de uma espcie de misidceo.
Fonte: criado por Patrcia Calil.





Bioestatstica | Aula 4
13

Reta de Regresso Linear Simples
Existe ainda uma forma interessante de compreender essa relao de
causa e efeito, a reta de regresso, que expressa matematicamente essa
relao por meio de uma equao (VIEIRA,1998; CALLEGARI-JACQUES,
2003). A anlise de regresso linear simples um procedimento que fornece
uma equao representada por uma linha reta, o que justifica o termo linear.
A equao da reta dada por: y = A + Bx
Onde: Y = varivel dependente; X = varivel independente; A =
coeficiente linear (valor de Y quando X = 0); B = coeficiente angular (inclinao
da reta).
No modelo matemtico, o valor de Y fixo e dependente do valor de X.
Contudo, nas reas biolgicas e da sade nem sempre isso ocorre, sendo
comum haver variao na varivel dependente (Y) em relao a certo valor da
varivel independente (X). Por exemplo, quantidades diferentes de ovos (Y)
podem ser encontradas para um mesmo tamanho (X) de uma espcie de
crustceo (tabela 19). Dessa forma os dados tendem a um alinhamento, mas
dificilmente sero plotados exatamente em uma linha. Esses desalinhamentos
so normais, so considerados desvios aleatrios do fenmeno estudado.
Assim, para um animal com 1,5cm de comprimento, existe um conjunto de
possveis valores de nmero de ovos. Sobre a linha reta observada no grfico
(figura 17) est somente a mdia desses valores.
Tabela 19 - Quantidade de ovos em diferentes tamanhos (cm) de
crustceos.

Comprimento (cm) Quantidade de ovos
1,5 48
1,5 50
1,5 42
2,0 55
2,1 57
2,1 62
2,5 65
2,5 68


Bioestatstica | Aula 4
14

2,5 72
3,0 75
3,0 78
3,4 81
3,6 88
3,6 90
Fonte: criada por Patrcia Calil, dados hipotticos.


30
40
50
60
70
80
90
100
1 1.5 2 2.5 3 3.5 4
Comprimento - cm
Q
u
a
n
t
i
d
a
d
e

d
e

o
v
o
s

Figura 17 - Quantidade de ovos em diferentes tamanhos (comprimento, em centmetro) de
crustceos.
Fonte: criada por Patrcia Calil





Para reforar o contedo que estudamos sobre correlao e regresso voc pode
consultar um material interessante que apresenta vrios exemplos e que est
disponvel em:
<http://www.eecis.udel.edu/~portnoi/classroom/prob_estatistica/2006_1/lecture_sli
des/aula20.pdf>



Bioestatstica | Aula 4
15

Por essa razo que se faz necessrio o ajuste de uma linha reta a
pontos no perfeitamente alinhados. Assim, a reta ajustada representar o
comportamento mdio, ou a tendncia dos valores de Y medida que X muda
de valor. Para esse caso, o modelo matemtico seguido : y = A + Bx + , em
que representa a diferena entre o valor observado e o esperado. Assim, com
a determinao da equao que define essa reta, podemos obter uma melhor
estimativa para Y. Essa equao denominada de equao de regresso. Na
regresso linear simples ela chamada de reta de regresso (CALLEGARI-
JACQUES, 2003).
Assista ao vdeo a seguir e conhea em mais detalhes os assuntos
trabalhados at aqui.


Obteno da Reta de Regresso Linear Simples
Nas reas biolgicas e da sade raramente se tm todos os valores de
uma populao, mas sim de uma amostra. Assim, no h como conseguir os
valores de X e Y para todos os elementos da populao. Para a obteno da
reta de regresso em uma amostra, devemos inicialmente calcular o a e o b
(estimativas dos parmetros a = coeficiente linear, e b = coeficiente angular).
Esses valores so obtidos pelo mtodo dos mnimos quadrados, pois a reta
que ser obtida possui as menores distncias (ao quadrado) entre os valores
observados (Y) e a prpria reta, ou seja, os menores valores de
2
.
O coeficiente angular b (inclinao da reta) obtido por:




Bioestatstica | Aula 4
16



O coeficiente linear a (valor de Y quando X = 0) obtido por:

A reta estimada de regresso obtida por:

Vamos utilizar os dados de quantidade de ovos em diferentes
comprimentos (cm) de crustceos registrados na tabela 19 para estimar a reta
de regresso. Observe na tabela (tabela 20) a realizao de clculos
intermedirios que facilitam a posterior substituio na frmula.
Tabela 20 - Obteno dos coeficientes da reta de regresso para o nmero de ovos, conforme o
comprimento (cm) de crustceos.

x
Comprimento
y
N
o
de ovos
xy x
2
y
2
y

1,5 48 72 2,25 2304 47,12
1,5 50 75 2,25 2500 47,12
1,5 42 63 2,25 1764 47,12
2,0 55 110 4,0 3025 56,95
2,1 57 119,7 4,41 3249 58,91
2,1 62 130,2 4,41 3844 58,91
2,5 65 162,5 6,25 4225 66,78

a = y - bx
( y e x so, respectivamente, as mdias de Y e de X)


bx a y

+ =
( y
o valor estimado, ou esperado, de Y para cada valor de X)


( )
n
x
x
n
y x
xy
b
2
2




=
) ( ) (
) (
2
x
xy
x x
y y x x
SQ
SP
b


= = ou




Bioestatstica | Aula 4
17

2,5 68 170 6,25 4624 66,78
2,5 72 180 6,25 5184 66,78
3,0 75 225 9,0 5625 76,60
3,0 78 234 9,0 6084 76,60
3,4 81 275,4 11,56 6561 84,46
3,6 88 316,8 12,96 7744 88,39
3,6 90 324 12,96 8100 88,39
= 34,8 931 2457,6 93,8 64833 930,91
x = 2,486
y = 66,5
-- -- -- --

De acordo com a frmula, o valor de b :

Enquanto o valor de a :

Podemos ento interpretar os valores de a e de b da seguinte forma: se
b = 19,652 ovos por comprimento (cm), ou seja, para cada acrscimo positivo
de 1cm de comprimento de um crustceo, parece haver um aumento de 19,7
no nmero de ovos que o animal carrega.
Seguindo a frmula da reta de regresso: a = x b y , a reta estimada
para o exemplo acima : y
= 17,645 + 19,652x , sendo y
o valor esperado de
ovos para cada valor de comprimento.
Alguns autores calculam ainda uma medida que pode, de forma fcil,
representar o grau de regresso, ou de relao de dependncia, entre duas
variveis. Essa medida denominada de r
2
, que nada mais do que o valor de
r obtido para a correlao, elevado ao quadrado. Pode-se dizer que o r
2
mede
a proporo de variao total de Y, que pode ser explicada atravs do ajuste

( )
652 , 19
297 , 7
4 , 143
503 , 86 8 , 93
2 , 2314 6 , 2457
14
8 , 34
8 , 93
14
931 x 8 , 34
6 , 2457
b
2
= =

=



a = 66,5 (19,652 x 2,486) = 17,645


Bioestatstica | Aula 4
18

do modelo linear. Dessa forma, quanto maior for o ajuste dos dados reta de
regresso, maior ser o valor de r
2
(BERQU et al., 1981). Podemos ento
dizer que quanto maior for o valor de r
2
, maior ser a relao de dependncia
entre as variveis, ou seja, maior a chance de que uma seja alterada pela
variao da outra.
Normalmente quando se representa um grfico de regresso, coloca-se
a reta de regresso e o valor de r
2
dentro da rea do grfico, o que prov todas
as informaes acerca do ajuste da reta e do grau de relao entre as variveis
(figura 18).

30
40
50
60
70
80
90
100
1 1.5 2 2.5 3 3.5 4
Comprimento - cm
Q
u
a
n
t
i
d
a
d
e

d
e

o
v
o
s
652 , 19 645 , 17 y + =

r
2
= 0,9646

Figura 18 - Quantidade de ovos em diferentes tamanhos (cm) de crustceos.
Fonte: criada por Patrcia Calil.

Da mesma forma que na correlao, na regresso tambm h
necessidade de testar a significncia estatstica de que o valor obtido de b
representa realmente uma dependncia de Y em relao X. Para isso utiliza-
se um teste de hiptese sobre a correlao calculada. Os fundamentos,
aplicaes e a frmula desse teste esto explicados de forma terica e prtica
na aula 6.


Bioestatstica | Aula 4
19

Assista ao vdeo a seguir para entender mais sobre o aquilo que
discutimos at aqui.

Concluindo
Nas reas biolgicas e de sade h necessidade de compreender com a
relao de duas variveis varia dentro de determinada atmosfera ou populao.
Se na medida em que os valores de X aumentam, os valores de Y
tambm aumentam, as variveis possuem uma correlao positiva;
Se na medida em que os valores de X aumentam, os valores de Y
diminuem, as variveis possuem um correlao negativa.

A correlao positiva e a correlao negativa no indicam relao de
causa e dependncia entre as variveis. O coeficiente de correlao de
Pearson (r) indica o grau de correlao entre as variveis, variando entre -1
(correlao negativa perfeita) e +1 (correlao positiva perfeita).
Para compreender uma relao de causa e efeito entre as variveis,
devemos utilizar a regresso. Por meio da regresso calculada uma reta que
se ajusta aos valores de relao entre as variveis. Ela chamada de reta de
regresso e a equao da reta dada por y = A + Bx, onde:
y = varivel dependente;
x = varivel independente;
A = coeficiente linear (valor de y quando x = 0)
B = coeficiente angular (inclinao da reta).


Bioestatstica | Aula 4
20

H ainda uma medida que pode representar o grau de regresso entre
duas variveis. Essa medida chamada de r
2
(valor de r obtido para a
correlao, elevado ao quadrado). Podemos dizer que r
2
mede a proporo de
variao total de y que pode ser explicada por meio do ajuste do modelo linear.



Sntese
O vdeo a seguir retoma os principais tpicos discutidos nesta aula,
acompanhe.


Artigos cientficos so sempre importantes fontes de consulta. Como exemplos,
voc pode consultar os seguintes endereos:
<http://www.scielo.br/pdf/abem/v50n3/30653.pdf>
<http://www.scielo.br/pdf/rbpm/v11n2/a15v11n2.pdf>
<http://www.scielo.br/pdf/abem/v53n9/v53n9a07.pdf>



Bioestatstica | Aula 4
21





1. Voc analisou a quantidade mdia de gordura ingerida mensalmente por
habitantes de diferentes estados do Brasil e o nmero de vezes que esses
mesmos indivduos sofreram com dores de cabea (por ms) e obteve um
valor de coeficiente de correlao de Pearson (r) = 0,68 para essas
variveis. Podemos dizer que:
a. As pessoas tm dor de cabea por ingerirem gordura.
b. medida que aumenta o consumo de gordura, aumenta a quantidade de
dor de cabea, mas uma no causa a outra.
c. As pessoas que ingerem mais gordura tm mais dor de cabea do que
quem no ingere, pois gordura causa dor de cabea.
d. No existe relao entre ingesto de gordura e quantidade de dor de
cabea.

2. Observe o grfico de disperso abaixo e a reta de regresso linear simples
e assinale a alternativa correta.


a. O r
2
da reta de regresso poderia ser 0,85.
b. O r
2
da reta de regresso poderia ser -0,71.


Bioestatstica | Aula 4
22

c. O r
2
da reta de regresso poderia ser 2,52.
d. O r
2
da reta de regresso poderia ser -0,15.





Bioestatstica | Aula 4
23

Referncias
BERQU, E. S., SOUZA, J. M. P., GOTLIEB, S. L. D. Bioestatstica. So
Paulo: Editora Pedaggica e Universitria Ltda., 1981.
CALLEGARI-JACQUES, S. M. Bioestatstica: princpios e aplicaes. Porto
Alegre: Artmed, 2003.
OLIVEIRA, F. E. M. O. Exerccios resolvidos e propostos. So Paulo: Atlas,
1995.
VIEIRA, S. Introduo bioestatstica. Rio de Janeiro: Campus, 1998.

Das könnte Ihnen auch gefallen