Zastosowanie analiz
wielowymiarowych w badaniach
ekologicznych
Program Canoco
W badaniach ekologicznych często poszukujemy odpowiedzi
na pytanie, jak zmieniają się cechy gatunków/grup gatunków
w zależności od warunków środowiska
Środowisko –
ogół elementów, warunków i czynników
niezbędnych do życia i rozwoju danych organizmów
Środowisko to zespół wielu czynników, jednocześnie
oddziałujących na organizmy
Wieloczynnikowe analizy ordynacyjne pozwalają na
uporządkowanie cech gatunków lub ich zbiorów
w gradiencie zmian wielu czynników środowiska
Cechy
gatunków:
- morfologiczne
- anatomiczne
- behawioralne
- generatywne….
Cechy grup gatunków:
- skład gatunkowy
- liczebność, ilościowość,
pokrywanie poszczególnych
gatunków (udział gatunków
w próbach)
Próba – pojedyncza obserwacja (np. spis
gatunków z konkretnego miejsca)
Cechy środowiska:
- cechy klimatu
- cechy siedliska
- cechy innych składników biocenozy
- rodzaj/nasilenie antropopresji
Cechy gatunków lub ich grup – zmienne ZALEŻNE
(response variables)
Cechy środowiska – zmienne niezależne (explanatory
variables, predictors)
Rodzaje zmiennych:
- liczbowe (wyniki bezpośrednich pomiarów, posiadające
konkretną wartość liczbową)
- interwałowe (wartości szacowane przy zastosowaniu
skali wielostopniowej)
-nominalne (opisywane w skali 0 – 1 /np. obecność
jakiejś cechy lub jej brak/)
Wynikiem analizy wielowymiarowej jest dwuwymiarowy
diagram, na którym próby podobne (np. o podobnym
składzie gatunkowym) położone są blisko siebie, a próby
odmienne są od nich oddalone
Istnieje kilka typów analiz wielowymiarowych
Rodzaje analiz dobiera się w zależności od tego, czy:
- dysponujemy zmiennymi niezależnymi
- struktura analizowanych danych jest liniowa, czy
unimodalna
Zakładamy, że w szerokim spektrum działania czynników
ekologicznych
gatunki realizują swoje spektra występowania wg krzywej
Gaussa
Cecha środowiskowa (np. pH, temperatura itp.)
W
y
st
ę
p
o
w
a
n
ie
g
a
tu
n
ku
Jeżeli analizujemy tylko wąski wycinek środowiska
(niewielki zakres zmienności cech), „odpowiedź” gatunku
na działanie cechy będzie miała charakter linearny
Analizowany przedział
zmienności cechy
W
y
st
ę
p
o
w
a
n
ie
g
a
tu
n
ku
Jeżeli dysponujemy wyłącznie zmiennymi zależnymi (nie mamy
danych na temat środowiska), stosujemy metody ordynacji
pośredniej.
Dla danych o charakterze linearnym – PCA (analiza głównych
składowych, principal components analysis)
Dla danych o charakterze unimodalnym – CA (analiza zgodności,
correspondence analysis lub DCA (nietendencyjna analiza
zgodności, detrended correspondence analysis)
W ordynacji pośredniej zmienne środowiskowe są zmiennymi
teoretycznymi, otrzymanymi na podstawie struktury
występowania gatunków
Na diagramie ordynacyjnym powstałym w wyniku analizy
PCA osie ordynacyjne reprezentują główne kierunki zmian
w całym zbiorze danych, punkty przedstawiają próby, a
wektory wskazują kierunki zmian poszczególnych
składowych prób (np. zmiany ilościowości gatunków)
Oś 1
Oś 2
Jeżeli dysponujemy zmiennymi zależnymi oraz niezależnymi
(środowiskowymi), stosujemy metody ordynacji bezpośredniej.
Dla danych o charakterze linearnym – RDA (analiza redundancji,
redundance analysis)
Dla danych o charakterze unimodalnym – CCA (kanoniczna
analiza zgodności,
canonical correspondence analysis
W ordynacji bezpośredniej osie ordynacyjne stanowią liniową
kombinację czynników środowiska
Na diagramie ordynacyjnym powstałym w wyniku analizy RDA
wektorami oznaczone są zmienne środowiskowe oraz gatunki (lub
ich cechy) a punktami próby; jeżeli wektory cechy siedliska i
gatunku skierowane są w tą samą stronę, oznacza to silną
korelację występowania gatunku (lub zmienności cechy) ze
zmienną środowiskowa; wektory skierowane w przeciwną stronę –
korelacja negatywna; wektory pod kątem prostym – brak korelacji
-1.0
1.0
-0
.6
1.
0
zagęszcz.
biomasa
biom. pędu
pH
przew. el.
h
pokr. r. nacz.
Ntot.
Ca
Mg
cechy gatunku
zmienne środowiskowe
I
II
III
-
próby
RDA
PRZYKŁADY:
1. Analiza zmienności składu flory kęp
budowanych przez torfowca brunatnego w
gradiencie typów torfowisk na Pojezierzu
Kaszubskim
2. Analiza zmienności cech torfowca
brunatnego w gradiencie typów torfowisk
na Pojezierzu Kaszubskim
Torfowiska są ekosystemami mokradłowymi, w których cechy
siedliska i skład flory determinowane są przez rodzaj wód
zasilających, ich skład chemiczny i głębokość położenia lustra
wody
GRADIENTOWA ZMIENNOŚĆ CECH TORFOWISK
Skład gatunkowy roślinności torfowiskowej determinowany jest przez
gradient czynników środowiskowych
GRADIENT „POOR – RICH”
pH
Ca
2+
3,5 - 4
4 – 5,5
5,5 - 7
7 – 8,5
bog
poor fen
moderaterely
rich fen
rich fen
torfowisko
przejściowe
torfowisko
wysokie
torfowisko niskie
alkaliczne zasobne
w wapń
torfowisko niskie
słabo kwaśne
Gradient „poor – rich” jest słabo związany
z trofią siedliska
1. Analizie poddano florę kęp
budowanych przez ten sam
gatunek torfowca (torfowiec
brunatny Sphagnum fuscum) na
6 torfowiskach (wysokich,
przejściowych i niskich
alkalicznych zasobnych w wapń)
Próba – spis flory z pojedynczej
kępy wraz z pokrywaniem
poszczególnych gatunków
Zastosowana została 11
stopniowa skala pokrywania:
1: 0-5%, 2: 6 -10%, 3: 11- 20%,
4: 21- 30% (...) 11: 91- 100%.
Kępa Sphagnum
fuscum na torfowisku
alkalicznym
2. Analizie poddano cechy Sphagnum
fuscum na tych samych torfowiskach
- zagęszczenie [liczba pędów/m
2
],
-biomasę z jednostki powierzchni [kg
s.m/ m
2
]
- średnią biomasę pędu [kg
-3
]
Cechy środowiska –
Liczbowe - cechy wód zasilających torfowiska:
- głębokość położenia lustra wody w torfowisku (cm)
- pH
- przewodnictwo elektrolityczne K corr (mS/cm)
- zawartość jonów Ca
2+
i Mg
2+
(mg/dm
3
)
- zawartość Ntot (mg/dm
3
)
Nominalne – typ torfowiska
Nr kolejny kępy
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Stanowisko
S
S
S
BS BS BS BS K
K
K
K
JS
JS
JS
JS
Liczba gatunków
33
26 23 19
21
35
22 13 20
17
16
24
17
11
13
Pokrycie warstwy c
[%]
60
60 60 25
55
50
60 45 45
30
35
35
55
40
35
Pokrycie warstwy d
[%]
100 100 95 100 85 100 95 80 95
90 100 100
95
75
95
Menyanthes trifoliata
0
2
1
1
0
1
0
0
1
0
1
1
0
1
1
Scheuchzeria palustris
0
0
0
0
0
0
0
0
0
0
0
1
1
1
1
Carex lasiocarpa
0
2
1
0
0
1
0
0
0
2
0
0
0
0
0
Triglochin palustre
2
2
2
1
1
1
1
2
2
1
0
0
0
0
0
Viola palustris
0
1
0
0
1
1
0
0
0
1
0
0
0
0
0
Comarum palustre
0
0
0
0
0
0
1
3
3
2
2
1
0
0
0
Carex nigra
0
0
0
0
0
0
0
0
1
1
1
0
0
0
0
Eriophorum
angustifolium
1
0
0
0
0
1
1
2
1
0
0
2
2
2
0
Carex dioica
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
Stellaria palustris
1
1
1
0
0
0
1
0
0
0
0
0
0
0
0
Baza danych:
a) Dane florystyczne
Baza danych:
a) Dane o cechach gatunku
Nr kolejny
kępy
Stanowisko
liczba
pędów/1m2
biomasa
(kg/m2)
śr. biomasa
pędu (g)
średnia
długość pędu
(cm)
1
Sulęczyno
41200
0,2686
0,0065
2,21
2
Sulęczyno
28100
0,2021
0,0072
2,51
3
Bagno Stawek
42700
0,2800
0,0066
2,66
4
Bagno Stawek
26300
0,1920
0,0073
2,73
5
Bagno Stawek
40900
0,2800
0,0068
1,96
6
Bagno Stawek
48100
0,2500
0,0052
2,45
7
Klonowo
42000
0,2567
0,0061
2,34
8
Klonowo
21400
0,1520
0,0071
1,99
9
Klonowo
21500
0,1880
0,0087
2,10
10
Klonowo
20300
0,1148
0,0057
2,14
11
Jez. Strupino
26500
0,1622
0,0061
2,13
12
Jez. Strupino
22800
0,0810
0,0036
1,43
13
Jez. Strupino
15100
0,0330
0,0022
1,04
14
Jez. Strupino
26000
0,0750
0,0029
1,42
15
Żuromino
21000
0,0561
0,0024
1,21
Baza danych:
a) Dane środowiskowe
Nr kolejny
kępy
Stanowis
ko
Liczba
gatunkó
w
Pokryci
e
warstw
y c [%]
Pokryci
e
warstw
y d [%]
pH
K corr.
( mS/cm)
odległość od
lustra wody
(cm)
N tot.
(mg/dm3)
Ca
(mg/dm3
)
Mg
(mg/dm3
)
torfowi
sko
niskie
torfowis
ko
przejścio
we
torfowi
sko
wysoki
e
1
Sulęczyn
o
33
60
100
7,32
315
10
0,76
49,72
8,89
1
0
0
2
Sulęczyn
o
26
60
100
6,85
190
14
1,7
51,23
9,14
1
0
0
3
Sulęczyn
o
23
60
95
6,15
280
24
0,6
56,36
17,4
1
0
0
4
Bagno
Stawek
19
25
100
7,55
180
20
2,12
26,52
13,71
1
0
0
5
Bagno
Stawek
21
55
85
7,43
207
17
2,22
47,52
10,41
1
0
0
6
Bagno
Stawek
35
50
100
7,54
209
12
1,51
45,36
14,41
1
0
0
7
Bagno
Stawek
22
60
95
7,20
154
12
1,99
42,48
19,98
1
0
0
8
Klonowo
13
45
80
6,31
252
30
0,77
54,96
13,07
1
0
0
9
Klonowo
20
45
95
6,85
276
11
0,71
51
13,04
1
0
0
10
Klonowo
17
30
90
5,63
288
18
0,71
50,98
13,77
1
0
0
11
Klonowo
16
35
100
7,02
329
20
0,73
55,68
13,68
1
0
0
12
Jez.
Strupino
24
35
100
3,57
67
18
2,54
4,52
1,27
0
1
0
13
Jez.
Strupino
17
55
95
3,80
53
4
2,3
5,15
1,32
0
1
0
14
Jez.
Strupino
11
40
75
3,71
67
32
2,6
6,09
1,43
0
1
0
15
Jez.
Strupino
13
35
95
4,92
30
17
1,95
13,93
1,41
0
1
0
1.
Analiza zmienności składu flory kęp budowanych przez torfowca
brunatnego na różnych typach torfowisk Pojezierza Kaszubskiego –
ordynacja pośrednia
Import danych z Excela do Canoco – WCanoImp
-
Format nagłówków – nie więcej niż 8 znaków
-
Skopiować zakres danych do analizy (osobno pliki z danymi o
gatunkach, osobno z danymi środowiskowymi); w przypadku
gatunków użyć opcji „each column is a sample”. W obydwu
przypadkach „save in condensed format”
Sprawdzanie długości gradientu – wybór między metodami
unimodalnymi a linearnymi – analiza DCA
Włączyć Canoco for Windows
Wybrać opcję „only species data available”
Otworzyć plik z danymi o gatunkach, zapisać plik z analizą w
wybranej lokalizacji
Wybrać typ analizy – DCA
Skalowanie – bez zmian, nie transformujemy danych
Centrowanie – „by species”
Żadnych danych nie usuwamy
Uruchomić analizę, zapisać plik z wynikami („save log”)
Axes
1
2
3
4
Total
inertia
Eigenvalues :
0.512 0.265 0.159 0.060
2.969
Lengths of gradient : 2.780 2.218 1.824 1.790
Cumulative percentage variance
of species data :
17.2 26.2 31.5 33.5
Sum of all eigenvalues 2.969
Eigenvalue (wartość własna osi) – współczynnik mówiący o tym, jaką część zmienności
w zbiorze danych wyjaśnia dana oś
Długość gradientu decyduje o wyborze typu analizy:
<3 SD – PCA lub RDA (linearne),
>4 SD – CA, DCA, CCA (unimodalne)
3-4 SD – można stosować obydwa typy analiz
W naszym przypadku najdłuższy gradient wynosi 2,78 SD, a więc stosujemy analizę PCA
Analiza PCA
Wybrać opcję „only species data available”
Otworzyć plik z danymi o gatunkach, zapisać plik z analizą w
wybranej lokalizacji
Wybrać typ analizy – PCA
Skalowanie – bez zmian, nie transformujemy danych
Centrowanie – „by species”
Żadnych danych nie usuwamy
Uruchomić analizę, zapisać plik z wynikami („save log”)
**** Summary ****
Axes
1
2
3
4
Total
variance
Eigenvalues :
0.202 0.180 0.125 0.102
1.000
Cumulative percentage variance
of species data :
20.2 38.2 50.7 60.8
Sum of all eigenvalues 1.000
Tworzenie diagramu ordynacyjnego
Włączyć CanoDraw
Zapisać projekt w wybranej lokalizacji
Utworzyć diagram zawierający próby i gatunki (Create
Species and samples
Wykluczamy gatunki najmniej pasujące do modelu (Project
Settings
Inclusion rules
Klasyfikujemy próby z różnych typów torfowisk (Project
Classify
Samples New select (zaznaczyć „use this classification in
diagram”)
Wygląd wykresu (czcionki, symbole, kolory) modyfikujemy
klawiszem F5
Biplots and joint plots
Analiza RDA
Wybrać opcję „species and environment data available” oraz
„direct gradient analysis”
Otworzyć pliki z danymi o gatunkach i środowisku, zapisać projekt
Wybrać typ analizy – RDA
Skalowanie – bez zmian, transformacja logarytmiczna
Centrowanie – „by species”
Usunąć zmienne środowiskowe - stanowisko, pokrywanie warstw c
i d
Forward selection – automatic selection, use Monte Carlo
permutation test
Permutation type – bez zmian
Uruchomić analizę, zapisać plik z wynikami („save log”)
1.
Analiza zmienności składu flory kęp budowanych przez torfowca
brunatnego w gradiencie cech środowiska na Pojezierzu
Kaszubskim – ordynacja bezpośrednia
Tworzenie diagramu ordynacyjnego
Włączyć CanoDraw
Zapisać projekt w wybranej lokalizacji
Utworzyć diagram zawierający próby, gatunki i zmienne
środowiskowe (Create
Triplots with environmental variables
Wykluczamy gatunki najmniej pasujące do modelu (Project
Settings
Inclusion rules
Klasyfikujemy próby z różnych typów torfowisk (Project
Classify
Samples New select (zaznaczyć „use this classification in
diagram”)
Wygląd wykresu (czcionki, symbole, kolory) modyfikujemy
klawiszem F5