Sie sind auf Seite 1von 9

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)

Docente: Frederico de Souza Aleixo


Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

Pg.: 1/9

Sobre as influencias no nmero de citaes de um artigo


1. AMOSTRAGEM OU DESENHO EXPERIMENTAL
a. Unidade amostral
Artigos publicados em peridicos indexados na plataforma ISI (Institute for Scientific
Information).
b. Delineamento:
b.1. Hipteses:
H0: A extenso do ttulo e do resumo de um artigo, bem como a quantidade de pginas
do mesmo, no afeta o nmero de citaes noutros trabalhos.
HA: A extenso do ttulo e do resumo de um artigo, bem como a quantidade de pginas
do mesmo, afeta o nmero de citaes noutros trabalhos.
b.2.

Perodo analisado: 1969 a 2016;

b.3. Tipo de instrumento de medio/avaliao utilizado: coleta de dados junto


plataforma ISI;
b.4.

Tipo de estudo: Observacional.

b.5. Amostragem: 3644 artigos publicados em peridicos indexados na plataforma ISI,


selecionados por fazerem referncia s palavras-chave LANFILL (Aterro Sanitrio) e
SOLID WASTE (resduos slidos) em seu ttulo ou resumo, no perodo 1969-2016;
b.6.

Variveis Dependentes: Nmero de citaes;

b.7. Variveis Independentes: Extenso do resumo, extenso do ttulo e quantidade de


pginas.

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

Pg.: 2/9

2. REGRESSO LINEAR MLTIPLA (com transformao Z)


Call:
lm(formula = N_CITACOES ~ TITULO + RESUMO + QTD_PAG)
Residuals:
Min

1Q

Median

3Q

Max

-1.1929 -0.5725 -0.3416

0.2015

8.6533

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)

2.750e-15

1.641e-02

0.000

1.0000

TITULO

-5.592e-02

1.666e-02

-3.355

RESUMO

3.544e-02

1.685e-02

2.103

QTD_PAG

1.223e-01

1.660e-02

7.372 2.08e-13 ***

0.0008 ***
0.0355 *

--Signif. codes:

0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 0.9904 on 3640 degrees of freedom


Multiple R-squared:

0.0199,

Adjusted R-squared:

F-statistic: 24.64 on 3 and 3640 DF,

0.01909

p-value: 8.878e-16

Interpretao: As variveis que influenciam no NMERO DE CITAES dos artigos so a extenso


do ttulo (TITULO), extenso do resumo (RESUMO) e a quantidade de pginas (QTD_PAG): a
primeira, negativa; as demais, positivas. No entanto, o R = 0,0199 evidencia que todas as variveis
explicam apenas 1,99% do aumento no nmero de citaes.

Y=2,75e-15-0,056TITULO+0,035RESUMO+0,122QTD_PAG
O p-valor < 0,05 indica que a hiptese nula pode ser rejeitada em favor da alternativa, ou seja, h
influncia das variveis sobre o nmero de citaes. No entanto, como se pode verificar pelo valor de
R, a influncia baixa.
2.1. Diagnsticos da regresso mltipla

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

2.1.1. Teste de Normalidade


Shapiro-Wilk normality test

data:

resid(regmultipla)

W = 0.70317, p-value < 2.2e-16

Interpretao: p-valor < 0,05. Logo, a distribuio no normal.

2.1.2. Distncia de Cook x Resduos Studentizados

Pg.: 3/9

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

Pg.: 4/9

2.1.3. Teste de Durbin-Watson


lag Autocorrelation D-W Statistic p-value
1

0.2322909

1.53528

Alternative hypothesis: rho != 0

2.2. Anlise de Multicolinearidade


TITULO

RESUMO

QTD_PAG

TITULO

1.000000000 0.1729756 0.002997601

RESUMO

0.172975608 1.0000000 0.147667523

QTD_PAG 0.002997601 0.1476675 1.000000000

TITULO

RESUMO

QTD_PAG

1.031396 1.054378 1.022840

Interpretao: No h colinearidade (VIF < 10). Logo, todas as variveis podem ser
consideradas.

2.3. Regresso parcial (Partio da varincia)


2.3.1. Significncia das fraes

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

anova(siga, step=10000, perm.max=10000)

Permutation test for rda under reduced model


Permutation: free
Number of permutations: 999

Model: rda(X = N_CITACOES, Y = TITULO, Z = QTD_PAG)


Df Variance
Model

Residual 3641

F Pr(>F)

0.00248 9.2034

0.005 **

0.98129

--Signif. codes:

0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

anova(sigc,step=10000, perm.max=10000)

Permutation test for rda under reduced model


Permutation: free
Number of permutations: 999
Model: rda(X = N_CITACOES, Y = TITULO, Z = QTD_PAG)
Df Variance
F Pr(>F)
Model
1 0.00248 9.2034 0.002 **
Residual 3641 0.98129
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Pg.: 5/9

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

Pg.: 6/9

3. REGRESSO LINEAR MLTIPLA (com transformao log10)


Observao: Devido presena de dados nulos, optou-se pela transformao logartmica.
Call:
lm(formula = N_CITACOES ~ TITULO + RESUMO + QTD_PAG)

Residuals:
Min

1Q

Median

3Q

Max

-0.99825 -0.44795

0.02227

0.41009

1.39252

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept)

0.9447961

0.1517563

6.226 5.34e-10 ***

TITULO

-0.2853473

0.0643525

-4.434 9.52e-06 ***

RESUMO

0.0008522

0.0272068

0.031

QTD_PAG

0.4129030

0.0589199

7.008 2.87e-12 ***

0.975

--Signif. codes:

0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Residual standard error: 0.5388 on 3640 degrees of freedom


Multiple R-squared:

0.01822,

Adjusted R-squared:

F-statistic: 22.51 on 3 and 3640 DF,

0.01741

p-value: 1.941e-14

Interpretao: As variveis que influenciam no NMERO DE CITAES dos artigos so a extenso


do ttulo (TITULO) e a quantidade de pginas (QTD_PAG): a primeira, negativa, e a segunda, positiva.
No entanto, o R = 0,01822 evidencia que todas as variveis explicam apenas 1,82% do aumento no
nmero de citaes.

Y=0,94-0,28.TITULO+0,0008.RESUMO+0,413.QTD_PAG
O p-valor < 0,05 indica que a hiptese nula pode ser rejeitada em favor da alternativa, ou seja, h
influncia das variveis sobre o nmero de citaes. No entanto, como se pode verificar pelo valor de
R, a influncia baixa.

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

3.1. Diagnsticos da regresso mltipla

3.1.1. Teste de Normalidade


Shapiro-Wilk normality test

data:

resid(regmultipla)

W = 0.97173, p-value < 2.2e-16

Interpretao: p-valor < 0,05. Logo, a distribuio no normal.


3.1.2. Distncia de Cook x Resduos Studentizados

Pg.: 7/9

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

Pg.: 8/9

3.1.3. Teste de Durbin-Watson


lag Autocorrelation D-W Statistic p-value
1

0.4318993

1.135344

Alternative hypothesis: rho != 0

3.2. Anlise de Multicolinearidade


TITULO

RESUMO

QTD_PAG

TITULO

1.00000000 0.12831451 0.03032155

RESUMO

0.12831451 1.00000000 0.07972821

QTD_PAG 0.03032155 0.07972821 1.00000000

TITULO

RESUMO

QTD_PAG

1.017160 1.022726 1.006813

Interpretao: No h colinearidade (VIF < 10). Logo, todas as variveis podem ser
consideradas.

3.3. Regresso parcial (Partio da varincia)


3.3.1. Significncia das fraes

Mestrado em Recursos Naturais do Cerrado (RENAC/UEG)


Docente: Frederico de Souza Aleixo
Disciplina: Estatstica aplicada a dados ambientais
Prof. Joo Nabout
Contedo: Regresso linear

Data: 01/09/2016

anova(siga, step=10000, perm.max=10000)

Permutation test for rda under reduced model


Permutation: free
Number of permutations: 999

Model: rda(X = N_CITACOES, Y = TITULO, Z = QTD_PAG)


Df Variance
Model

F Pr(>F)

1 0.001589 19.95

0.001 ***

Residual 3641 0.290046


--Signif. codes:

0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

anova(sigc,step=10000, perm.max=10000)

Permutation test for rda under reduced model


Permutation: free
Number of permutations: 999
Model: rda(X = N_CITACOES, Y = TITULO, Z = QTD_PAG)
Df Variance
F Pr(>F)
Model
1 0.001589 19.95 0.001 ***
Residual 3641 0.290046
--Signif. codes: 0 *** 0.001 ** 0.01 * 0.05 . 0.1 1

Pg.: 9/9

Das könnte Ihnen auch gefallen