You are on page 1of 6

UNIVERSIDADE FEDERAL DE ALFENAS (UNIFAL-MG)

LICENCIATURA EM MATEMTICA
SEMINRIOS II
PROFESSORES DA UNIDADE CURRICULAR:
ANDRA CARDOSO
ANGELA LEITE MORENO
FABRCIO GOECKING AVELAR

REGRESSO LINEAR MLTIPLA: AJUSTE DE UM MODELO COM DUAS


VARIVEIS INDEPENDENTES E UMA VARIVEL RESPOSTA

ORIENTADOR: FABRCIO GOECKING AVELAR

FLVIO DOS SANTOS DELFINO


MATHEUS DE SOUZA COSTA

ALFENAS-MG, 14 DE SETEMBRO DE 2015

1. Introduo
Um modelo matemtico representa e explica as relaes entre as hipteses de um fenmeno
de maneira quantitativa. A anlise de regresso um recurso da estatstica utilizado para estudar e
modelar a relao entre variveis independentes e dependentes, podendo estimar os parmetros
desconhecidos de um modelo, avaliando as relaes entre as variveis independentes e
dependentes.
O mtodo de mnimos quadrados bastante til na estimao dos parmetros, alm de
permitir a representao em notao matricial dos parmetros e das variveis independentes e
dependentes.
O software R pode auxiliar com uma rotina que realize o ajuste de um modelo de regresso
linear com duas variveis independentes e uma dependente aplicado a um conjunto de dados reais.
A compreenso do algoritmo de estimao de parmetros pode ajudar a identificar e evitar
possveis erros no processo, alm de constituir uma alternativa para estimao de parmetros sem o
uso de softwares, o que muito relevante quando se tem um conjunto de dados com observaes
faltantes.
Em relao ao aspecto didtico o entendimento do algoritmo importante, pois existe a
possibilidade de aplicao das teorias matemticas aprendidas durante o curso sem recorrer a
softwares para o ajuste do modelo.
necessrio, portanto estudar como feito um ajuste de um modelo de regresso linear
mltipla para um conjunto de dados assim como fazer a verificao dos procedimentos mais
adequados para que este objetivo seja alcanado.
2. Referencial Terico
Para Bassanezi (1994), um modelo matemtico auxilia na representao de um objeto
estudado, expressando e interpretando uma ou mais hipteses de maneira quantitativa.
A anlise de regresso uma tcnica estatstica utilizada para estudar e modelar a relao
entre variveis independentes e dependentes, um dos seus objetivos estimar os parmetros
desconhecidos de um modelo (Barros et al. 2008). Ainda de acordo com estes autores, pode-se
avaliar uma varivel de interesse Y
variveis

Xj

(varivel dependente ou varivel resposta) em relao a duas

(variveis independentes), com

estabelecer esta relao pode ser dado por

j=1,2 . Logo um possvel modelo para

y i= 0 + 1 x i 1+ 2 xi 2 + i i=1, , n(1)
Em que

y i a observao da varivel dependente

o nmero de indivduos,
X i= ( xi 1 , x i 2 )'

para o i -simo indivduo,

=( 0 , 1 , 2 )'

i -simo indivduo,

independentes para o
coluna ) um

um vetor de observaes das variveis

vetor

(matriz transposta da matriz


i

de coeficientes de regresso (parmetros) e

um

componente de erro aleatrio.


Segundo Barros et al. (2008), o modelo (1) chamado de regresso linear mltipla, ou
mais especificamente regresso linear com duas variveis independentes, pois envolve mais de
um coeficiente de regresso; o adjetivo linear indica que o modelo linear em relao
aos parmetros

=( 0 , 1 , 2) , e no porque

uma funo linear das variveis

x s.
Podemos escrever o modelo (1) de forma matricial dessa forma
y= X . +
Em que:

[]

y1
y= y 2

yn

[ ] []

1 x 11 x 12
0
1 x 21 x 22
= 1 , X=
, =

2
1 xn 1 xn 2

[]

1
2

As equaes abaixo explicam a composio dessas matrizes:


y1 =
y2

0 +

1 x 11 +

2 x 12 + 1

0 +

1 x 21

2 x 22 +

yn =

0 +

1 xn 1 +

2 x n 2 + n

Para estimar os parmetros de (1) pode-se utilizar o mtodo de mnimos quadrados.


Suponha-se que

n>2

independentes, e seja

observaes so avaliadas, em que j


yi

o nmero de variveis

a i -sima varivel resposta observada e

x ij

i -sima

observao da

j -sima varivel independente ( i

= 1, . . ., n ;

= 1, 2). (Barros

et al, 2008)
A partir do mtodo de mnimos quadrados obtm-se equaes de mnimos
quadrados da forma
X ' X=X ' y
Efetuando-se a multiplicao dos termos por (X ' X )1 , temos que
^

= ( X ' X )1 Xy

Assumindo que ( X ' X )1 exista.

3. Objetivo Geral

O objetivo geral deste trabalho apresentar como feito o ajuste de um modelo de regresso
linear mltipla a um conjunto de dados com duas variveis independentes e uma varivel
dependente.

3.1 Objetivos Especficos

Estudar um mtodo de estimao de parmetros para um modelo de regresso linear

mltipla com duas variveis independentes;


Mostrar como podem ser obtidas as estimativas dos parmetros do modelo com base no

mtodo de estimao estudado;


Programar, no software R, uma rotina capaz de realizar o ajuste de um modelo linear

com duas variveis independentes e uma varivel dependente.


Ajustar um modelo de regresso linear mltipla com duas variveis independentes a um
conjunto de dados reais.

4. Justificativas
Faz-se necessrio entender o algoritmo da estimao de parmetros para que sejam
identificados e evitados possveis erros no processo. Sendo possvel ainda o ajuste de modelos
lineares para conjuntos de dados no contemplados pelos softwares estatsticos, por exemplo um
conjunto de dados com observaes faltantes (informaes sobre os objetos que foram perdidas ou
danificadas)

Alm disso, o melhor entendimento do processo constitui ferramenta importante em relao


ao aspecto didtico, pois pode-se assim ajustar o modelo sem o uso de softwares. Havendo ainda a
possibilidade de aplicao das teorias matemticas aprendidas durante o curso.
Com o desenvolvimento do processo de estimao possvel verificar qual o melhor mtodo
para calcular a matriz inversa de XX.
5. Metodologia
Ser feita uma reviso de literatura a fim de encontrar um conjunto de dados reais que possa
ser ajustado a um modelo de regresso linear com duas variveis.
Para a estimao dos parmetros ser utilizado o mtodo de mnimos quadrados.
O software R auxiliar no ajuste do modelo e na organizao dos dados.
6. Cronograma

Etapa/Semana

17-21/08

Busca dos
conhecimentos
oficiais
Reviso
bibliogrfica

24-28/08

x
x

Planejamento da
pesquisa

7. Resultados Esperados
Ao final deste trabalho espera-se:

07-11/09

14-18/09

x
x
x
x

Coleta e pesquisa
de dados
Redao

31/0804/08

x
x

Que haja um melhor entendimento sobre como ocorre o ajuste de modelos com

duas variveis.
Que seja obtida uma rotina em R para o ajuste de modelos lineares com duas

variveis independentes e uma varivel dependente.


Que seja encontrado um modelo linear com duas variveis independentes para
um conjunto de dados reais.

8. Referncias Bibliogrficas
BASSANEZI, R. A modelagem matemtica. Dynamis, Blumenau/SC, v 1, n. 7, p. 55-83, Abr/Jun.
1994.
BARROS, E. A. C. et al. Mtodos de estimao em regresso linear mltipla: aplicao a dados
clnicos. Revista Colombiana de Estadstica, Bogot, v 31, n. 01, p. 111-129, 2008.