Sie sind auf Seite 1von 24

Mtodos de Ordenao

Valrio De Patta Pillar


Departamento de Ecologia Universidade Federal do Rio Grande do Sul Porto Alegre, RS vpillar@ufrgs.br http://ecoqua.ecologia.ufrgs.br

Em ecologia buscamos revelar padres, processos e mecanismos ao examinar conjuntos, geralmente complexos, de unidades ecolgicas descritas por muitas variveis.

Mtodos de ordenao podem sintetizar conjuntos complexos de dados, permitindo interpretaes sobre padres no espao e no tempo.

Bibliografia
Legendre, P.; Legendre, L. 1998. Numerical Ecology 2nd ed. Elsevier, Amsterdam. 853 p. Podani, J. 2000. Introduction to the Exploration of Multivariate Biological Data. Leiden, Backuys Publishers. 407 p. ISBN 905782-067-6 Pillar, V.D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902. Valentin, J.L. 2000. Ecologia Numrica. Rio de Janeiro, Intercincia. Wildi, O. & Orlci, L. 1990. Numerical Exploration of Community Patterns. Haia, SPB Academic Publishing. p. 6568.

Anlise de dados com MULTIV

Disponvel em http://ecoqua.ecologia.ufrgs.br

Ordenao
Os dados podem ser representados em um espao de comparao, abstrato, multidimensional: - p variveis so as dimenses que descrevem - n unidades amostrais, pontos no espao de comparao.

Ordenao uma projeo dos pontos em um nmero menor de dimenses (geralmente 2 ou 3) com mnima perda de informao. Alguns mtodos de ordenao:
Anlise de Componentes Principais (PCA) Anlise de Coordenadas Principais (PCOA) Anlise de Correspondncia (CA) Ordenao no-mtrica (NMDS) Ordenao Cannica (CCA, Anlise de Redundncia)

Unidade amostral 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22

Campos (-Ast) 25 47 22 64 109 115 188 223 170 235 220 195 205 230 234 253 234 228 242 227 227 217

Floresta Ombrfila Mista 237 234 269 214 175 156 68 37 40 24 20 16 15 6 6 8 12 11 13 19 24 28

Floresta Ombrfila Densa 6 16 9 14 6 15 8 12 6 0 2 4 0 1 2 0 0 1 0 1 1 1

350

300

250

200

150

100

50

0 -5 0 -5 0 0 50 100 150 200 250 300

Diagrama de disperso de 22 paleo-inventrios (unidades amostrais) descritas por trs variveis. A terceira dimenso (varivel 3) representada pelo dimetro das esferas (esferas maiores esto mais prximas do observador e indicam maior abundncia da varivel 3).

Wei n Aran Mi sc Mora Myrs Di ck

Myrt Cl et La sp Proc Ile x So la Schi Ce cr Eu te Trem Se co Acal Ce lt Al chXyri

Eryn Pa mp Pl au Pl tu Cype Echi Ap ia Se ne Hydr Ju ng Ba cc Myri AsTu Po ac

Ordenao de dados de plen de um perfil de sedimento, Cambar do Sul, Brazil, indicando a trajetria da composio da vegetao em 42.840 14C anos antes do presente. Mtodo de anlise de coordenadas principais com base em distncias euclidianas usando porcentagem de plen em 138 taxa. Taxa mais correlacionados com os eixos de ordenao esto indicados em posies proporcionais ao nvel de correlao.
Fonte: Behling, H.; Pillar, V.D.; Orlci, L. & Bauermann, S.G. 2004. Late Quaternary Araucaria forest, grassland (Campos), fire and climate dynamics, studied by high-resolution pollen, charcoal and multivariate analysis of the Cambar do Sul core in southern Brazil. Palaeogeography, Palaeoclimatology, Palaeoecology 203: 277-297.

Wei n

Da ph Se ne Myrt Mel a Mi ry sc Ile x AsTu Ph Stru Ba cc La sp Za nt Cl et cP ro So la Pi pe Di ck Acal Ce lt Aran Cype Myrs Amar Trem Eri o Po ac

Pi nu Se ba

Ordenao de dados de plen de um perfil de sedimento, Cambar do Sul, Brazil, indicando a trajetria da composio da vegetao desde 610 anos antes do presente. Mtodo de anlise de coordenadas principais com base em distncias euclidianas usando porcentagem de plen em 92 taxa. Taxa mais correlacionados com os eixos de ordenao esto indicados em posies proporcionais ao nvel de correlao.
Fonte: Behling, H.; Pillar, V.D.; Orlci, L. & Bauermann, S.G. 2004. Late Quaternary Araucaria forest, grassland (Campos), fire and climate dynamics, inferred from a high resolution pollen and charcoal record at Cambar do Sul in southern Brazil. Palaeogeography, Palaeoclimatology, Palaeoecology 203: 277-297.

Anlise de Componentes Principais


(Hotelling 1933)

nxp Dados

Calcula matriz de semelhana

pxp

Extrao de razes da matriz

Anlise de Componentes Principais


Sp.A Sp.B Sp.C

1 2 3 4 5 6 7

26 28 29 29 30 35 39

28 30 31 33 27 38 36

18 14 13 13 19 15 15
de autovalores e autovetores: 13.83 -1.50 16.00 -5.17 -5.17 5.57

Matriz submetida a extracao 19.67 13.83 -1.50

Numero de autovalores >1e-6 3 Autovalores: 32.6 Porcentagem: 79.0 Autovetores (normalizados max. 6): Eixo 1: -0.730 Eixo 2: -0.531 Eixo 3: 0.430

7.2 17.5

1.4 3.5

-0.662 0.396 -0.636

0.167 -0.750 -0.640

Escores de unid.amostrais nos primeiros Eixo 1: 2.76 Eixo 2: -0.39 Eixo 3: -0.55

3 componentes 0.78 0.71 0.67 0.97 0.24 0.51

0.17 1.29 -0.01

1.90 -1.73 0.15

-2.83 0.19 -0.78

-3.49 -1.00 0.44

Coeficientes de correlacao entre descritores originais e eixos da ordenacao: Variveis Eixo 1 Eixo 2 Eixo 3 a -0.940 -0.322 0.117 b -0.945 0.266 -0.191 c 0.405 -0.854 -0.326

Anlise de Coordenadas Principais (Gower 1966)


ou Metric Multidimensional Scaling (Torgerson 1952)
nxp Dados

Calcula semelhanas

nxn

Extrao de razes da matriz

Anlise de Coordenadas Principais


Matriz de distancias ao quadrado: 0 34 0 43 1 0 59 5 4 18 42 53 190 86 89 242 126 129

0 73 65 113

0 162 178

0 20

Matriz submetida a extracao de autovalores 48.37 10.51 7.80 -0.20 10.51 6.65 7.94 5.94 7.80 7.94 10.22 8.22 -0.20 5.94 8.22 10.22 35.08 2.22 -1.49 -11.49 -44.78 -13.63 -13.35 -1.35 -56.78 -19.63 -19.35 -11.35 Nmero de autovalores Autovalores Porcentagem

e autovetores: 35.08 -44.78 2.22 -13.63 -1.49 -13.35 -11.49 -1.35 39.80 -35.06 -35.06 52.08 -29.06 56.08

-56.78 -19.63 -19.35 -11.35 -29.06 56.08 80.08

3 195.3 79.0

43.4 17.5

8.7 3.5

Escores de unid.amostrais nos primeiros 3 componentes: Eixo 1: -6.76 -1.91 -1.74 -0.42 -4.66 Eixo 2: -0.96 1.63 2.38 3.17 -4.23 Eixo 3: -1.34 0.60 1.24 -0.03 0.37 Coeficientes de correlacao entre descritores Variveis Eixo 1 Eixo 2 Eixo 3 a 0.940 -0.322 0.117 b 0.945 0.266 -0.191 c -0.405 -0.854 -0.326

6.94 8.54 0.46 -2.45 -1.91 1.08

Sp.A Sp.B Sp.C

1 2 3 4 5 6 7

26 28 29 29 30 35 39

28 30 31 33 27 38 36

18 14 13 13 19 15 15

Anlise de Correspondncia
ou contingency table analysis, reciprocal averaging, reciprocal ordering, analyse factorielle des correspondances (ref. em Legendre & Legendre 1998:451)

nxp Dados ajuste duplo

Calcula matriz de semelhana

pxp

Extrao de razes da matriz

Sp.A Sp.B Sp.C

Anlise de Correspondncia

1 2 3 4 5 6 7

26 28 29 29 30 35 39

28 30 31 33 27 38 36

18 14 13 13 19 15 15

Matriz de dados transformados: (Linhas= 7 unidades amostrais, colunas= 3 variaveis)


-0.020088 -0.0023905 0.00073943 -0.0054785 -0.0007389 0.0011092 0.024052 -0.011265 0.0058395 0.0090759 0.018077 -0.03116 0.014453 -0.005552 0.044907 -0.005045 -0.014185 -0.018354 0.046138 -0.022491 -0.02622

Matriz submetida a extracao de autovalores e autovetores: 0.0010201 0.000025534 0.001781 -0.0014897 -0.002613 0.005902 Numero de autovalores >1e-6: 2 Autovalores(max.6): 0.007456 Porcentagem: 85.667

0.001248 14.333

Escores de unidades amostrais nos primeiros 2 componentes: Eixo1: 1.555 -0.20106 -0.52273 -0.70681 Eixo2: 1.043 0.38188 0.27698 1.0378 Escores de variaveis nos primeiros 2 componentes: Eixo 1: -0.32932 -0.64119 2.0102 Eixo 2: -1.1903 1.0175 0.28395

1.6765 -1.0589

-0.75526 0.4062

-0.74296 -1.7409

estvel esta ordenao, i.e., as mesmas tendncias de variao nesse espao de ordenao em duas dimenses reapareceriam se o mesmo universo amostral fosse reamostrado?
suficiente o nmero de unidades amostrais para responder essa questo?

Significncia de eixos de ordenao

Um problema na ordenao saber quantas dimenses so significativas, a serem ento interpretadas.


Interpretaes podem ser enganosas quando baseadas em dimenses representando tendncias instveis de variao que no reapareceriam na anlise de outras amostras do mesmo universo amostral. Pode haver perda de informao importante ao descartar dimenses significativas.

Jackson, D.A. 1993. Stopping rules in principal components analysis: a comparison of heuristical and statistical approaches. Ecology 74: 2204-2214. Pillar, V. D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902.

Algoritm o:

Bootstrapped ordination

1 . Anali sar a amos t ra (pseud o univ erso amos t ral) usando o m t odo de or denao escolhido. 2 . Armazenar os escores de ( escores de ref erncia ). unidades amostrais

Repet ir os passos seguintes um grande nme ro de vezes para cada amos t ra de t amanho k: 3 . Tomar uma amostra boots t rap de tamanho n k a qual submetida ao mt odo de ord enao. 4 . Armazenam -se em uma ma t riz X* os escores de ordenao da amos t ra boot st rap para um dado nm ero de eixos da or denao. 5 . Armazenam -se em uma matriz X os escores das unidades amostrais que esto na amos t ra boots t rap , mas ex t rados dos e scores de refer ncia (unidades amostrais p odem est ar repetidas). 6 . Ajust e Proc rusteano envo lven do os prime iros i eixo s da ordenao t orna os escores das duas ordenaes comparveis . Envo lve rota o, t ransla o e dilatao do subespao de ordenao na amos t ra boot st rap , de tal fo rma a maximi zar o ajuste com a ordenao do pseu do univ erso amos t ral. (Schn emann and Carroll 1 9 7 0).

Bootstrapped ordination

Ajuste de Procrustes
O ajuste envolve rotao, translao e dilatao do sub-espao de ordenao da amostra bootstrap de modo a maximizar o ajuste com a ordenao do pseudo universo amostral. O ajuste necessrio devido forma como os algoritmos de ordenao posicionam os eixos de diferentes amostras. Primeiro, imagens especulares so comuns e arbitrrias. Segundo, h variao entre amostras boostrap na ordem de expresso da mesma dimenso intrnseca porque podem ser muito semelhantes.

Schnemann, P.H. & Carroll, R.M. 1970. Fitting one matrix to another under choice of a central dilation and a rigid motion. Psychometrika 35: 245-256.

The effect of sample size on the significance of ordination axes (PCOA). The method involved bootstrap resampling with increasing sample size. Upper: data set with 60 species and 60 relevs from grassland in the south of Brazil. Bottom: the data set with the same relevs described by 20 environmental variables. (Pillar 1999)

Efeito do tamanho da amostra na significncia de eixos de ordenao. O mtodo envolveu auto-reamostragem (bootstrap) com tamanhos crescentes de amostra. A anlise usou matrizes simuladas com 3 grupos de 4 variveis cada e 40 unidades amostrais: correlao entre variveis r = 0.6 dentro e r = 0.3 entre grupos. (Pillar 1999)

( A) 1 0.9 9 0.9 9 0.9 9 ( B) 1 0.0 0 0.0 0 0.0 0

0.9 9 1 0.9 9 0.9 9

0.9 9 0.9 9 1 0.9 9

0.9 9 0.9 9 0.9 9 1

( C) 1 0.9 9 0.0 0 0.0 0 (D) 1 -0.9 9 -0.9 9 - 0.9 9

0.9 9 1 0.0 0 0.0 0

0.0 0 0.0 0 1 0.9 9

0.0 0 0.0 0 0.9 9 1

0.0 0 1 0.0 0 0.0 0

0.0 0 0.0 0 1 0.0 0

0.0 0 0.0 0 0.0 0 1

-0.9 9 1 0.9 9 0.9 9

-0.9 9 0.9 9 1 0.9 9

-0.9 9 0.9 9 0.9 9 1

Bootstrapped ordination
( 1 ) Da t a set ( variables in rows, sampling unit s in columns): 17 14 27 21 16 5 9 8 5 0 5 8 0 0 10 ( 2 ) Comp ute r efe rence ordinat ion with th e dat a set: PCOA eigenvalues: 1 83 .159 4 3 .5 4 97 1 1 .69 1 1 Scores of sampling unit s ( f irst 2 axes) : 1 2 3 4 5
Ax is 1: 1.80 579 Ax is 2: 0.28828 4.9865 4.9386 -9.39389 -4.32964 6.93124 -0.08556 -0.86007 -4.28128

( 6 ) Sc ores on axis 2 f rom ( 5) aft er Procrust ean adjust me nt involving axes 1 a nd 2 t o maximize fi t with similar ordinat ion subspace in ( 4 ): 3 4 2 1 2
Ax is 2: 0.8302 -2.00955 5.00678 0.385703 5.00678

( 7 ) Correlat ion 2 * betw een bootst rap ( 6) and ref erence scores (4 ) on axis 2: 0. 9 71 9 97 ( 8 ) Sc ores on axis 1 f rom ( 5) aft er Procrust ean adjust me nt involving only axis 1 to m axi mize f it with simi lar o rdinat ion subspace in ( 4 ): 3 4 2 1 2
Ax is 1: -8.8812 -4.7088 5.32221 1.00086 5.32221

( 3 ) Get a boot st rap sample f rom (1 ) : Sampling units: 3 4 2 1 2 ( 4 ) Sc ores of boot str ap sampling units on t he f irst 2 ref erence ordinat ion axe s, t aken f rom ( 2 ): 3 4 2 1 2
Ax is 1: -9.3939 -4.32964 Ax is 2: -0.08556 -0.86007 4.9865 4.9386 1.80579 0.28828 4.9865 4.93864

( 9 ) Correlat ion 1 * betw een bootst rap ( 6) and ref erence scores (4 ) on axis 1: 0. 9 95 9 73 ( 1 0) D at a set f rom st ep with in variables: 27 14 17 16 5 5 0 8 5 10 8 0 ( 1 ) r andomly permut ed 21 9 0

( 5 ) Ordinat ion wit h boot str ap sample: PCOA eigenvalues: 1 81 .712 1 9 .1 7 81 1. 9 10 0 8 Scores of sampling unit s ( f irst 2 axes) : 3 4 2 1 2
Ax is 1: -9.1088 Ax is 2: -2.4064 -4.6 3347 6.12578 2.46444 -1.12336 1.49071 2.18864 6.12578 -1.12336

( 1 1) R ef erence ordinat ion of permut ed dat a set: PCOA eigenvalues: 1 39 .413 8 5 .5 4 14 1 3 .44 5 4 Scores of sampling unit s ( f irst 2 axes) : 1 2 3 4 5
Ax is 1: 4.56838 Ax is 2: 6.56064 -6.84347 -5.75821 2.24378 5.78952 -1.2166 2.3469 -5.56826 -2.12269

Bootstrapped ordination (cont)


The fo llowing st eps ( 1 2) to ( 1 8) are similar to st eps ( 3 ) to (9 ) , but p erf orme d with permut ed dat a fr om ( 1 0): ( 1 2) Get a boots t rap sample f rom p ermut ed data (w ith same number o f repeats as in (3 ) ): Sampling units: 3 4 2 1 2 ( 1 3) S cores of bootst rap sampling unit s on th e fi rst 2 ref erence ordinat ion axe s of permut ed d at a, ta ken f rom st ep (1 1 ): 3 4 2 1 2
Ax is 1: -5.75821 2.24378 -6.84347 Ax is 2: 2.3469 -5.56826 -1.2166 4.56838 6.56064 -6.84347 -1.2166

( 1 6) Correlat ion 2 o betw een bootst rap ( 15 ) and ref erence scores (1 3 ) on a xi s 2: 0. 9 99 9 99 , wh ich is larger th an th e correlat ion * fo und i n st ep ( 7) .
2

( 1 7) S cores on axis 1 f rom (1 4 ) a f t er Procrust ean adjust me nt involving only axis 1 to m axi mize f it with simi lar o rdinat ion subspace in ( 1 3) : 3 4 2 1 2
Ax is 1: -4.0544 -0.64967 -6.77643 5.62398 -6.77643

( 1 8) Correlat ion 1 o betw een bootst rap ( 17 ) and ref erence scores (1 3 ) on a xi s 1: 0. 9 47 2 99 , wh ich is smaller th an th e correlat ion 1 * fo und i n st ep ( 9) . ( 1 9) R epeat st eps ( 3 ) to ( 1 8) up to B it erat ions. ( 2 0) A r un with B = 10 0 0 i t erat ions g ave th e f ollowing result s: Axi s P( io i* ) Average i* 1 2 0.3 91 0.5 67 0.9 82 2 27 0.8 70 7 88

( 1 4) Ordinat ion of boot str ap sample t aken f rom permut ed data : PCOA eigenvalues: 1 32 .979 7 1 .8 4 5 16. 7 76 Scores of sampling unit s ( f irst 2 axes) : 3 4 2 1 2
Ax is 1: 1.69214 -2.07875 4.7068 -9.02699 4.7068 Ax is 2: -3.13995 7.26744 -0.613028 -2.90144 -0.613028

( 1 5) S cores on axis 2 f rom (1 4 ) a f t er Procrust ean adjust me nt involving axes 1 a nd 2 t o maximize fi t wit h simi lar o rdinat ion subspace in ( 1 3) : 3 4 2 1 2
Ax is 2: 2.3248 -5.53962 -1.20902 6.53895 -1.20902

The probabilit ies indicat e none of th e ordinat ion dimensions examined is signif icant .

Das könnte Ihnen auch gefallen