Sie sind auf Seite 1von 2

Linear, curvilinear, cloud

Unimodal (que nem a normal), simtrica, assinttica, bimodal (duas montanhas), trimo
dal (tres montanhas)
u populao
x barra amostra
mdia est para linha da regresso linear (tendncia)
desvio-padro est para correlao
Correlao no significa causa. Jovens tem mais amigos no facebook que mais velhos. Ta
lvez a varivel causal seja h qts anos voc est no facebook.
Explore gapminder.org
SLope = deltaY/deltaX pq rise/run
O ponto mdio sempre est na linha de regresso. E ele est na metade das distncias de um
lado como do outro, equilibrando. A distancia de um lado cancela a do outro lad
o.
voc prediz Y a partir de X
Quando for uma previso de Y, voc coloca ^y.
Intrapolao (voc prediz coisas dentro dos dados do sample).
Extrapolao: est fora e mais arriscado de estar certo. Ex. tem dados de qts nescaus
pessoas toma, mas s tem dados de 10-20 anos, vc pode usar a regressao para previr
qts uma crianca de 5 anos toma.
Residuo y - ^y o erro, distncia do real ao previsto.
Por isso o erro pode ser positivo (acima da regressao) ou negativo (abaixo da li
nha)
Perceba que o erro (residuo) deve ter alguns positivos e alguns negativos.
A melhor linha (best fit) ser a que tem o termo meio, centro de massa, (-x, -y) e
est no meio (faz balano da distancia dos erros).
Dos quadrados mnimos pq a linha da regresso aquela que tem a menor soma do quadrad
o dos resduos
Propriedades da linha de regresso
> tem o centro de massa
> soma dos quadrados dos erros a menor
> soma e mdia dos resduos proxima de zero
> variancia dos residuos a menor possivel
Metodo gaussiano : para encontrar o slope da equacao da regresso
> parecido com deltay/delta x mas deltax*deltay/deltax^2
Com metodo gaussiano vc acha o A de y = ax + b, para o b, voc tem o a e sabe que
centro de massa est na reta.

Das könnte Ihnen auch gefallen