Sie sind auf Seite 1von 6

UNIVERSIDADE FEDERAL DE MATO GROSSO FACULDADE DE ENGENHARIA FLORESTAL

TIAGO ALTOBELLE DA SILVA SIQUEIRA

CORRELAO E REGRESSO

CUIAB MT JULHO/2011

1. INTRODUO A regresso e a correlao so duas tcnicas estreitamente relacionadas que envolvem uma forma de estimao. A anlise de correlao e regresso compreende a anlise de dados amostrais para saber se e como duas ou mais variveis esto relacionadas uma com a outra em um determinado universo de dados. A regresso linear simples constitui uma tentativa de estabelecer uma equao matemtica linear que descreva o relacionamento entre duas variveis. A anlise de correlao fornece um nmero que resume o grau de relacionamento entre duas variveis. J a anlise de regresso resulta numa equao matemtica que descreve esse relacionamento, apontando suas caractersticas preliminares de correlao positiva (relao direta) ou negativa (relao inversa). Essa mesma equao pode ser usada para se predizer valores futuros de uma varivel quando se tem valores de outra varivel. H diversas maneiras em que as equaes de regresso so utilizadas, como em situaes em que as variveis medem aproximadamente a mesma coisa. Por exemplo, a resistncia e a dureza de um metal podem ser relacionadas de modo que, conhecendo-lhe a dureza, podemos estimar-lhe a resistncia. Mas se o teste de resistncia destri o metal, enquanto que o teste de dureza no o destri, um pesquisador interessado em estimar a resistncia preferir confiar nos resultados do teste de dureza. A finalidade da equao de regresso, portanto, estimar valores de uma varivel com base em valores conhecidos de outra. Aps diversos clculos verifica-se o grau de dependncia das variveis. Nesse trabalho ser usado um exemplo para uma breve amostra desses clculos.

2. EXEMPLO CALCULADO Deseja-se verificar se possvel prever a altura de uma determinada espcie de rvore conhecendo o dimetro do tronco medido a 2 metros do solo. Os dados esto apresentados na tabela a seguir:

Tabela 1 Dimetro (cm) e Altura (m) de uma determinada espcie de rvore

Dimetro (X) 2,3 3,5 7,4 7,9 8,4 9,9 10,9

Altura (Y) 5,5 6,6 9,8 9,1 11,6 10,8 12,3

14 12 10 8 6 4 2 0 0 2 4 6 Dimetro
Figura 1 - Grfico de disperso

y = 0.7665x + 3.8777 R = 0.9254

Altura

Linear (Series1)

10

12

Visualmente o grfico apresenta correlao positiva (Relao direta), ou seja apresenta r > 0.

Tabela 2 Tabela auxiliar para o calculo de correlao

Observao 1 2 3 4 5 6 7 Total ( (

X 2,3 3,5 7,4 7,9 8,4 9,9 10,9 50,3

Y 5,5 6,6 9,8 9,1 11,6 10,8 12,3 65,7

)( 18,987 10,269 0,089 -0,204 2,688 3,838 10,823 46,49

) 23,873 13,587 0,046 0,510 1,474 7,366 13,749 60,65

) 15,101 7,762 0,171 0,082 4,902 1,999 8,491 38,508

-4,886 -3,686 0,214 0,714 1,214 2,714 3,714

-3,886 -2,786 0,414 -0,286 2,214 1,414 2,914

)( ) (

) ) ( )( )

Aps o calculo verifica-se que o valor da correlao igual a r = 0,962. Precisa-se testar a hiptese se este valor diferente de zero.

H0 : = 0 H1 : 0

Tem-se que = n 2 = 7 2 = 5 graus de liberdade

Tomando = 0,05 temos que t0,025;5 = 2,571

Como |tc| > t/2 rejeita-se H0 ao nvel de 5% de significncia. Logo a correlao diferente de zero e igual 0,962. Com o diagrama de disperso e pelo coeficiente de correlao, verifica-se que existe uma relao entre as variveis X e Y. Pode-se determinar essa relao por uma funo que a seguinte: Y = a + bX + a o coeficiente linear, interpretado como o valor da varivel de dependente quando a varivel independente igual a 0. b o coeficiente de regresso, interpretado como acrscimo na varivel dependente para a variao de uma unidade na varivel. so os erros aleatrios de uma populao normal, com mdia 0 e varincia constante . Para determinao dos coeficientes fez-se os seguintes clculos: ( ( )( ) )

Y = 3,878 + 0,7665X

Tabela 3 Anlise de Varincia para Regresso Linear Simples

Fontes de variao Regresso Erro Total

GL 1 n-2 n-1 ( ) ( ( (

Soma de Quadrados(SQ) SQ Regresso SQ Erro SQ Total

Quadrado Mdio(QM) QM Regresso QM Erro

Fc QM Regresso/QM Erro

)( )

))

SQ Erro = SQ Total SQ Regresso = 38,508 35,636 = 2,872

QM Regresso = SQ Regresso

Tabela 4 Anlise de Varincia para Regresso Linear Simples

Fontes de variao Regersso Erro Total

GL 1 5 6

SQ 35,636 2,872 38,508

QM 35,636 0,574

Fc 62,084

F 6,608

H0 : a = 0 ou b = 0 H1 : a 0 e b 0 O teste de hiptese tem a funo de verificar se o modelo de regresso significativo. Primeiro adota-se um nvel de significncia , depois se obtm o valor tabelado f, que tem a notao F(1;5;5%). Rejeita-se a hiptese H0 se Fc > F. Como Fc > F, rejeita-se H0, logo o modelo regresso linear significativo. Obtendo r2

Verifica-se que conhecendo o dimetro de uma determinada espcie de rvore medindo a 2 m do solo explica-se 92,54% a variao de altura dessa espcie.

3. CONCLUSO A anlise de regresso e correlao tem como objetivo estudar a relao entre duas variveis quantitativas. A correlao mede o grau de relacionamento, j a regresso ajusta uma equao a esse conjunto de dados de forma que essa relao possa ser expressa matematicamente. Aps isso se faz um teste de hiptese para avaliar se o modelo de regresso significativo.

Das könnte Ihnen auch gefallen