Beruflich Dokumente
Kultur Dokumente
Em ecologia buscamos revelar padres, processos e mecanismos ao examinar conjuntos, geralmente complexos, de unidades ecolgicas descritas por muitas variveis.
Mtodos de ordenao podem sintetizar conjuntos complexos de dados, permitindo interpretaes sobre padres no espao e no tempo.
Bibliografia
Legendre, P.; Legendre, L. 1998. Numerical Ecology 2nd ed. Elsevier, Amsterdam. 853 p. Podani, J. 2000. Introduction to the Exploration of Multivariate Biological Data. Leiden, Backuys Publishers. 407 p. ISBN 905782-067-6 Pillar, V.D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902. Valentin, J.L. 2000. Ecologia Numrica. Rio de Janeiro, Intercincia. Wildi, O. & Orlci, L. 1990. Numerical Exploration of Community Patterns. Haia, SPB Academic Publishing. p. 6568.
Disponvel em http://ecoqua.ecologia.ufrgs.br
Ordenao
Os dados podem ser representados em um espao de comparao, abstrato, multidimensional: - p variveis so as dimenses que descrevem - n unidades amostrais, pontos no espao de comparao.
Ordenao uma projeo dos pontos em um nmero menor de dimenses (geralmente 2 ou 3) com mnima perda de informao. Alguns mtodos de ordenao:
Anlise de Componentes Principais (PCA) Anlise de Coordenadas Principais (PCOA) Anlise de Correspondncia (CA) Ordenao no-mtrica (NMDS) Ordenao Cannica (CCA, Anlise de Redundncia)
Unidade amostral 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
Campos (-Ast) 25 47 22 64 109 115 188 223 170 235 220 195 205 230 234 253 234 228 242 227 227 217
350
300
250
200
150
100
50
Diagrama de disperso de 22 paleo-inventrios (unidades amostrais) descritas por trs variveis. A terceira dimenso (varivel 3) representada pelo dimetro das esferas (esferas maiores esto mais prximas do observador e indicam maior abundncia da varivel 3).
Ordenao de dados de plen de um perfil de sedimento, Cambar do Sul, Brazil, indicando a trajetria da composio da vegetao em 42.840 14C anos antes do presente. Mtodo de anlise de coordenadas principais com base em distncias euclidianas usando porcentagem de plen em 138 taxa. Taxa mais correlacionados com os eixos de ordenao esto indicados em posies proporcionais ao nvel de correlao.
Fonte: Behling, H.; Pillar, V.D.; Orlci, L. & Bauermann, S.G. 2004. Late Quaternary Araucaria forest, grassland (Campos), fire and climate dynamics, studied by high-resolution pollen, charcoal and multivariate analysis of the Cambar do Sul core in southern Brazil. Palaeogeography, Palaeoclimatology, Palaeoecology 203: 277-297.
Wei n
Da ph Se ne Myrt Mel a Mi ry sc Ile x AsTu Ph Stru Ba cc La sp Za nt Cl et cP ro So la Pi pe Di ck Acal Ce lt Aran Cype Myrs Amar Trem Eri o Po ac
Pi nu Se ba
Ordenao de dados de plen de um perfil de sedimento, Cambar do Sul, Brazil, indicando a trajetria da composio da vegetao desde 610 anos antes do presente. Mtodo de anlise de coordenadas principais com base em distncias euclidianas usando porcentagem de plen em 92 taxa. Taxa mais correlacionados com os eixos de ordenao esto indicados em posies proporcionais ao nvel de correlao.
Fonte: Behling, H.; Pillar, V.D.; Orlci, L. & Bauermann, S.G. 2004. Late Quaternary Araucaria forest, grassland (Campos), fire and climate dynamics, inferred from a high resolution pollen and charcoal record at Cambar do Sul in southern Brazil. Palaeogeography, Palaeoclimatology, Palaeoecology 203: 277-297.
nxp Dados
pxp
1 2 3 4 5 6 7
26 28 29 29 30 35 39
28 30 31 33 27 38 36
18 14 13 13 19 15 15
de autovalores e autovetores: 13.83 -1.50 16.00 -5.17 -5.17 5.57
Numero de autovalores >1e-6 3 Autovalores: 32.6 Porcentagem: 79.0 Autovetores (normalizados max. 6): Eixo 1: -0.730 Eixo 2: -0.531 Eixo 3: 0.430
7.2 17.5
1.4 3.5
Escores de unid.amostrais nos primeiros Eixo 1: 2.76 Eixo 2: -0.39 Eixo 3: -0.55
Coeficientes de correlacao entre descritores originais e eixos da ordenacao: Variveis Eixo 1 Eixo 2 Eixo 3 a -0.940 -0.322 0.117 b -0.945 0.266 -0.191 c 0.405 -0.854 -0.326
Calcula semelhanas
nxn
0 73 65 113
0 162 178
0 20
Matriz submetida a extracao de autovalores 48.37 10.51 7.80 -0.20 10.51 6.65 7.94 5.94 7.80 7.94 10.22 8.22 -0.20 5.94 8.22 10.22 35.08 2.22 -1.49 -11.49 -44.78 -13.63 -13.35 -1.35 -56.78 -19.63 -19.35 -11.35 Nmero de autovalores Autovalores Porcentagem
e autovetores: 35.08 -44.78 2.22 -13.63 -1.49 -13.35 -11.49 -1.35 39.80 -35.06 -35.06 52.08 -29.06 56.08
3 195.3 79.0
43.4 17.5
8.7 3.5
Escores de unid.amostrais nos primeiros 3 componentes: Eixo 1: -6.76 -1.91 -1.74 -0.42 -4.66 Eixo 2: -0.96 1.63 2.38 3.17 -4.23 Eixo 3: -1.34 0.60 1.24 -0.03 0.37 Coeficientes de correlacao entre descritores Variveis Eixo 1 Eixo 2 Eixo 3 a 0.940 -0.322 0.117 b 0.945 0.266 -0.191 c -0.405 -0.854 -0.326
1 2 3 4 5 6 7
26 28 29 29 30 35 39
28 30 31 33 27 38 36
18 14 13 13 19 15 15
Anlise de Correspondncia
ou contingency table analysis, reciprocal averaging, reciprocal ordering, analyse factorielle des correspondances (ref. em Legendre & Legendre 1998:451)
pxp
Anlise de Correspondncia
1 2 3 4 5 6 7
26 28 29 29 30 35 39
28 30 31 33 27 38 36
18 14 13 13 19 15 15
Matriz submetida a extracao de autovalores e autovetores: 0.0010201 0.000025534 0.001781 -0.0014897 -0.002613 0.005902 Numero de autovalores >1e-6: 2 Autovalores(max.6): 0.007456 Porcentagem: 85.667
0.001248 14.333
Escores de unidades amostrais nos primeiros 2 componentes: Eixo1: 1.555 -0.20106 -0.52273 -0.70681 Eixo2: 1.043 0.38188 0.27698 1.0378 Escores de variaveis nos primeiros 2 componentes: Eixo 1: -0.32932 -0.64119 2.0102 Eixo 2: -1.1903 1.0175 0.28395
1.6765 -1.0589
-0.75526 0.4062
-0.74296 -1.7409
estvel esta ordenao, i.e., as mesmas tendncias de variao nesse espao de ordenao em duas dimenses reapareceriam se o mesmo universo amostral fosse reamostrado?
suficiente o nmero de unidades amostrais para responder essa questo?
Jackson, D.A. 1993. Stopping rules in principal components analysis: a comparison of heuristical and statistical approaches. Ecology 74: 2204-2214. Pillar, V. D. 1999. The bootstrapped ordination reexamined. Journal of Vegetation Science 10: 895-902.
Algoritm o:
Bootstrapped ordination
1 . Anali sar a amos t ra (pseud o univ erso amos t ral) usando o m t odo de or denao escolhido. 2 . Armazenar os escores de ( escores de ref erncia ). unidades amostrais
Repet ir os passos seguintes um grande nme ro de vezes para cada amos t ra de t amanho k: 3 . Tomar uma amostra boots t rap de tamanho n k a qual submetida ao mt odo de ord enao. 4 . Armazenam -se em uma ma t riz X* os escores de ordenao da amos t ra boot st rap para um dado nm ero de eixos da or denao. 5 . Armazenam -se em uma matriz X os escores das unidades amostrais que esto na amos t ra boots t rap , mas ex t rados dos e scores de refer ncia (unidades amostrais p odem est ar repetidas). 6 . Ajust e Proc rusteano envo lven do os prime iros i eixo s da ordenao t orna os escores das duas ordenaes comparveis . Envo lve rota o, t ransla o e dilatao do subespao de ordenao na amos t ra boot st rap , de tal fo rma a maximi zar o ajuste com a ordenao do pseu do univ erso amos t ral. (Schn emann and Carroll 1 9 7 0).
Bootstrapped ordination
Ajuste de Procrustes
O ajuste envolve rotao, translao e dilatao do sub-espao de ordenao da amostra bootstrap de modo a maximizar o ajuste com a ordenao do pseudo universo amostral. O ajuste necessrio devido forma como os algoritmos de ordenao posicionam os eixos de diferentes amostras. Primeiro, imagens especulares so comuns e arbitrrias. Segundo, h variao entre amostras boostrap na ordem de expresso da mesma dimenso intrnseca porque podem ser muito semelhantes.
Schnemann, P.H. & Carroll, R.M. 1970. Fitting one matrix to another under choice of a central dilation and a rigid motion. Psychometrika 35: 245-256.
The effect of sample size on the significance of ordination axes (PCOA). The method involved bootstrap resampling with increasing sample size. Upper: data set with 60 species and 60 relevs from grassland in the south of Brazil. Bottom: the data set with the same relevs described by 20 environmental variables. (Pillar 1999)
Efeito do tamanho da amostra na significncia de eixos de ordenao. O mtodo envolveu auto-reamostragem (bootstrap) com tamanhos crescentes de amostra. A anlise usou matrizes simuladas com 3 grupos de 4 variveis cada e 40 unidades amostrais: correlao entre variveis r = 0.6 dentro e r = 0.3 entre grupos. (Pillar 1999)
Bootstrapped ordination
( 1 ) Da t a set ( variables in rows, sampling unit s in columns): 17 14 27 21 16 5 9 8 5 0 5 8 0 0 10 ( 2 ) Comp ute r efe rence ordinat ion with th e dat a set: PCOA eigenvalues: 1 83 .159 4 3 .5 4 97 1 1 .69 1 1 Scores of sampling unit s ( f irst 2 axes) : 1 2 3 4 5
Ax is 1: 1.80 579 Ax is 2: 0.28828 4.9865 4.9386 -9.39389 -4.32964 6.93124 -0.08556 -0.86007 -4.28128
( 6 ) Sc ores on axis 2 f rom ( 5) aft er Procrust ean adjust me nt involving axes 1 a nd 2 t o maximize fi t with similar ordinat ion subspace in ( 4 ): 3 4 2 1 2
Ax is 2: 0.8302 -2.00955 5.00678 0.385703 5.00678
( 7 ) Correlat ion 2 * betw een bootst rap ( 6) and ref erence scores (4 ) on axis 2: 0. 9 71 9 97 ( 8 ) Sc ores on axis 1 f rom ( 5) aft er Procrust ean adjust me nt involving only axis 1 to m axi mize f it with simi lar o rdinat ion subspace in ( 4 ): 3 4 2 1 2
Ax is 1: -8.8812 -4.7088 5.32221 1.00086 5.32221
( 3 ) Get a boot st rap sample f rom (1 ) : Sampling units: 3 4 2 1 2 ( 4 ) Sc ores of boot str ap sampling units on t he f irst 2 ref erence ordinat ion axe s, t aken f rom ( 2 ): 3 4 2 1 2
Ax is 1: -9.3939 -4.32964 Ax is 2: -0.08556 -0.86007 4.9865 4.9386 1.80579 0.28828 4.9865 4.93864
( 9 ) Correlat ion 1 * betw een bootst rap ( 6) and ref erence scores (4 ) on axis 1: 0. 9 95 9 73 ( 1 0) D at a set f rom st ep with in variables: 27 14 17 16 5 5 0 8 5 10 8 0 ( 1 ) r andomly permut ed 21 9 0
( 5 ) Ordinat ion wit h boot str ap sample: PCOA eigenvalues: 1 81 .712 1 9 .1 7 81 1. 9 10 0 8 Scores of sampling unit s ( f irst 2 axes) : 3 4 2 1 2
Ax is 1: -9.1088 Ax is 2: -2.4064 -4.6 3347 6.12578 2.46444 -1.12336 1.49071 2.18864 6.12578 -1.12336
( 1 1) R ef erence ordinat ion of permut ed dat a set: PCOA eigenvalues: 1 39 .413 8 5 .5 4 14 1 3 .44 5 4 Scores of sampling unit s ( f irst 2 axes) : 1 2 3 4 5
Ax is 1: 4.56838 Ax is 2: 6.56064 -6.84347 -5.75821 2.24378 5.78952 -1.2166 2.3469 -5.56826 -2.12269
( 1 6) Correlat ion 2 o betw een bootst rap ( 15 ) and ref erence scores (1 3 ) on a xi s 2: 0. 9 99 9 99 , wh ich is larger th an th e correlat ion * fo und i n st ep ( 7) .
2
( 1 7) S cores on axis 1 f rom (1 4 ) a f t er Procrust ean adjust me nt involving only axis 1 to m axi mize f it with simi lar o rdinat ion subspace in ( 1 3) : 3 4 2 1 2
Ax is 1: -4.0544 -0.64967 -6.77643 5.62398 -6.77643
( 1 8) Correlat ion 1 o betw een bootst rap ( 17 ) and ref erence scores (1 3 ) on a xi s 1: 0. 9 47 2 99 , wh ich is smaller th an th e correlat ion 1 * fo und i n st ep ( 9) . ( 1 9) R epeat st eps ( 3 ) to ( 1 8) up to B it erat ions. ( 2 0) A r un with B = 10 0 0 i t erat ions g ave th e f ollowing result s: Axi s P( io i* ) Average i* 1 2 0.3 91 0.5 67 0.9 82 2 27 0.8 70 7 88
( 1 4) Ordinat ion of boot str ap sample t aken f rom permut ed data : PCOA eigenvalues: 1 32 .979 7 1 .8 4 5 16. 7 76 Scores of sampling unit s ( f irst 2 axes) : 3 4 2 1 2
Ax is 1: 1.69214 -2.07875 4.7068 -9.02699 4.7068 Ax is 2: -3.13995 7.26744 -0.613028 -2.90144 -0.613028
( 1 5) S cores on axis 2 f rom (1 4 ) a f t er Procrust ean adjust me nt involving axes 1 a nd 2 t o maximize fi t wit h simi lar o rdinat ion subspace in ( 1 3) : 3 4 2 1 2
Ax is 2: 2.3248 -5.53962 -1.20902 6.53895 -1.20902
The probabilit ies indicat e none of th e ordinat ion dimensions examined is signif icant .