• Ei tuloksia

Pohjaeläimistön vertailuolojen (lajien vakioidut näytteenottoon sidotut havaitsemistodennäköisyydet, pc vertailuoloissa) ennustamiseksi sovellettiin logistista regressioanalyysiä, jolla voidaan mallintaa dikotomisia vasteita, jotka voivat saada vain arvon 0 tai 1 (tässä 0 = laji ei esiinny, 1 = laji esiintyy) (Nyblom 2015). Mallit ovat lajikohtaisia, ja ne estimoitiin kivennäismaiden jokien muiden kuin vertailuoloissa olevien aineistojen (IMP) avulla ja ekstrapoloitiin kivennäismaiden jokien vertailuoloihin (REF). Aineiston analyysit ja mallinnus tehtiin IBM SPSS Statistics 26 ohjelmalla.

Mallit ottavat huomioon kivennäismaiden jokien ei-vertailuoloissa olevien (IMP) jokien alueen maankäytön, ts. ihmisten aiheuttaman häiriön jokien valuma-alueella ja näiden jokien pohjaeläimistön pc -arvot, ja ennustavat niiden perusteella kyseisen lajin pc -arvon vertailuoloissa. Jokaista lajia tutkittiin erikseen ja testattiin, selittyykö sen pc yhdellä tai useammalla häiriögradientilla. Testattavia häiriögradientteja olivat maatalouden, asutuksen ja ojitettujen turvemaiden osuus valuma-alueesta. Maataloudesta ja asutuksesta luotiin myös toisen asteen muuttujat (maatalous2 ja asutus2), joita testattiin mallissa ennustavina muuttujina.

Näiden lisäksi valuma-alueen koko oli tarjolla ennustavana muuttujana.

Ennustaville muuttujille pienten kivennäismaiden jokien aineistossa ja pienten savimaiden jokien aineistossa laskettiin korrelaatiot (Pearsonin korrelaatiokerroin), sillä ne eivät saisi korreloida keskenään. Korrelaatiot laskettiin IMP-aineiston muuttujille sekä IMP ja REF aineiston muuttujille yhdessä (Taulukko 4).

Korrelaatiot olivat aina itseisarvoltaan melko pieniä (≤ 0,55), joten ennustavien muuttujien karsintaa ei nähty tarpeelliseksi.

Taulukko 4. Mallinnuksessa käytettävien ennustavien muuttujien väliset korrelaatiot

Ennustavat muuttujat (koko tai osuus valuma-alueesta)

Pienet kivennäismaiden joet Pienet savimaiden joet

IMP-aineisto

IMP+REF-aineistot IMP-aineisto IMP+REF-aineistot

Valuma-alue ja asutus -0,30 -0,21 -0,42 -0,41

Valuma-alue ja maatalous 0,46 0,43 0,19 0,14

Valuma-alue ja ojitettujen

turvemaiden osuus -0,00 0,08 0,47 0,45

Asutus ja maatalous -0,12 0,06 -0,55 -0,42

Asutus ja ojitettujen turvemaiden osuus

-0,30 -0,23 -0,42 -0,42

Maatalous ja ojitettujen

turvemaiden osuus -0,19 -0,09 -0,03 -0,18

Yhden pienen kivennäismaiden joen valuma-alueen asutuksen osuus oli selkeästi suurempi kuin muilla (29,6 %), minkä takia se päätettiin mahdollisesti häiritsevänä poistaa analyyseista. Koska tässä vaiheessa ei ollut vielä tietoa mikä häiriön aste, eli maankäytön osuus, vastaisi parhaiten vertailuoloja, päätettiin luoda vertailuoloja eri häiriötasoilla. Vertailuoloja luotiin niin, että valuma-alueella oli häiriötä maataloudesta johtuen 0–10 %, asutuksesta johtuen 0–5 % ja ojitettuja turvemaita 0–

10 % (Taulukko 5). Tällöin paras mahdollinen, tarkasteltujen muutostekijöiden suhteen täysin häiriötön vertailupaikka olisi LREF0 (=Luotu REF-paikka), jossa maataloutta, asutusta ja ojitettuja turvemaita ei olisi ollenkaan valuma-alueella.

Huonoin mahdollinen vertailupaikka olisi puolestaan LREF10, jossa maataloutta olisi valuma-alueella 10 %, asutusta 5 % ja ojitettuja turvemaita 10 %. Valuma-alueen kooksi luotuihin vertailupaikkoihin valittiin pienten jokien valuma-Valuma-alueen koon (10–100 km2) puoliväli, 55 km2.

Taulukko 5. Mallinnukseen luodut vertailuolot.

Luodut vertailuolot

Häiriö

Maatalous % Asutus % Ojitetut

turvemaat %

LREF0 0 0 0

LREF1 1 0,5 1

LREF2 2 1 2

LREF3 3 1,5 3

LREF4 4 2 4

LREF5 5 2,5 5

LREF6 6 3 6

LREF8 8 4 8

LREF10 10 5 10

Mallinnuksen periaatteellista toimivuutta testattiin ensin kivennäismaiden jokityypillä, josta on edustavaa vertailuaineistoa. Tämä tehtiin luomalla logistisen regression malli jokaiselle luokitteluohjeen (Aroviita 2019) lajilistassa olevalle lajille (ks. Suomen Ympäristökeskus 2019), jonka esiintymistodennäköisyys on yli 0,3 (n

= 34) ja käyttäen vain IMP aineistoa (REF-paikat poistettiin analyysistä).

Mallinnusta ei tehty kaikille lajeille, sillä jokien pohjaeläimistön luokittelussa tyyppiominaisiksi taksoneiksi luetaan vain ne, joiden esiintymisfrekvenssi eli havaitsemistodennäköisyys (pc) vertailuoloissa on ≥ 0,4. Mukaan otettiin kuitenkin varmuuden vuoksi lajit, joiden esiintymistodennäköisyys oli yli 0,3, sillä on mahdollista, että näiden lajien mallinnettu esiintymistodennäköisyys olisi yli 0,4.

Jokaiselle lajille luotiin paras malli tarjoamalla kaikki muuttujat (maatalous, asutus,

ojitetut turvemaat, valuma-alue, maatalous2 ja asutus2) malliin ja käyttämällä takaisinpäin askeltavaa ”Backward Elimination (Conditional)” -menetelmää muuttujien valinnassa. Eri malleja testattiin myös manuaalisesti, mutta askeltaen rakennetut mallit olivat p-arvoltaan pienimpiä ja siksi ne valittiin käyttöön.

Tilastollisen merkitsevyyden raja-arvo oli 0,05, mutta mukaan otettiin myös malleja, joiden p-arvo oli lähes merkitsevä (< 0,1).

Luoduilla malleilla ennustettiin havaitsemistodennäköisyydet (pc) kaikille luoduille LREF-paikoille (0–10 % häiriötä) sekä todellisille vertailupaikoille, jotka eivät olleet mukana mallien rakentamisessa. Niille lajeille, joille ei löytynyt merkitsevää tai lähes merkitsevää mallia (p-arvo < 0,1), käytettiin IMP-paikoista laskettua yleiskeskiarvoa havaitsemistodennäköisyytenä (= kuinka monessa paikassa kyseinen laji esiintyi/paikkojen lukumäärä). Jos millään häiriöillä ei ole mallin mukaan merkitsevästi yhteyttä lajin havaitsemiseen, voidaan päätellä, etteivät ihmisten aiheuttamat häiriöt havaitulla tasolla vaikuta lajin havaitsemistodennäköisyyksiin, ja ne ovat kaikissa paikoissa samat, myös vertailupaikoilla.

Jokaiselle lajille luodulla mallilla ennustettiin lajin pc luoduille vertailuoloille (LREF 0-10) myös käyttämällä koko aineistoa (IMP+REF). Tällä tavalla selvitettiin, muuttuivatko mallien ennusteet, kun mukana on vertailuaineistoa. Mallien tai ennusteiden muuttuminen merkitsisi sitä, että lähestymistavassa on heikkouksia ja ettei se ole täysin uskottava. Mallinnettuja ennusteita verrattiin tyyppiperusteisiin vertailuarvoihin, jotka on laskettu 18 vertailupaikasta. Mallinnettujen ja vertailupaikoista laskettujen pc -arvojen välinen vertailu tehtiin regressioanalyysillä.

Luotuja malleja validoitiin lisäksi laskemalla O/E-suhteita (O = observed, E = expected) eli mittaamalla tyyppiominaisten taksonien esiintymistä. Kaikille vertailupaikoille laskettiin O/E, joka vastaa luokittelussa käytettävää ekologista laatusuhdetta (ELS), käyttäen tyypille mallinnettuja havaitsemistodennäköisyyksiä ja koska koko mallinnusta arvioidaan, otettiin mukaan myös ne, joille pc on vakio (yleiskeskiarvo). Odotettu arvo E, eli kuinka monta lajia pitäisi löytyä, laskettiin

summaamalla havaitsemistodennäköisyydet ehdolla P ≥ 0,4 (Aroviita ym. 2019).

Havaittu arvo O taas laskettiin olemassa olevista aineistoista sen perusteella, kuinka monta näistä lajeista, joiden esiintymistodennäköisyys oli vähintään 0,4, löytyi kohteista.

Toinen validointikeino oli ennustaa kaikille todellisille vertailupaikoille lajien havaitsemistodennäköisyydet kehitetyillä malleilla. Jokaiselle vertailupaikalle laskettiin E esiintymistodennäköisyyksien summana (ehdolla P ≥ 0,4) ja katsottiin, kuinka moni lajeista (joiden P ≥ 0,4) oli paikalla ja laskettiin O/E. Tässä siis kaikille 17 pienten kivennäismaiden jokien vertailupaikalle laskettiin paikkakohtainen O/E. Kaikkien edellä mainittujen tapojen mukaan laskettujen O/E-suhteiden keskinäisiä yhteyksiä, sekä arvojen jakaumia tarkasteltiin. Parhaita menetelmiä ovat ne, joilla O/E keskiarvo on lähimpänä arvoa 1 (harha eli systemaattinen virhe = keskiarvo-1, pienin) sekä keskihajonta (satunnaisvirhe) ja kokonaisvirheen odotusarvo (RMSE, systemaattisen virheen ja satunnaisvirheen neliöiden summan neliöjuuri) ovat pienimpiä (Ostermiller & Hawkins, Van Sickle ym. 2006).

Kun menetelmää oli ensin testattu pienillä kivennäismaiden joilla, toteutettiin sama laskenta pienille savimaiden joille. Tosin tässä mallinnuksessa mallit rakennettiin IMP-aineistolla sekä IMP+REF-aineistolla alusta asti, kun pienillä kivennäismaiden joilla käytettiin rakenteellisesti samoja malleja (samat ennustavat muuttujat) sekä IMP- että IMP+REF-aineistoilla. Mallinnus tehtiin uudelleen eri aineistolla, jotta saatiin selville tuliko muutoksia ennusteiden lisäksi mallien rakenteeseen, kun aineistoon lisättiin aineiston viisi vertailupaikkaa. Pienten savimaiden jokien aineistoilla mallit rakennettiin kaikille lajeille (ei vain niille, joiden nykyinen muihin jokityyppeihin perustuva P > 0,3), sillä niiden todellisia havaitsemistodennäköisyyksiä ei tiedetä vertailupaikkojen puuttumisen takia.

Mallinnuksen validointi oli hankalampaa, koska vertailupaikkoja oli vain viisi, mistä syystä O/E-suhteet laskettiin vertailupaikkojen lisäksi myös IMP-paikoille.

Happamien sulfaattimaiden yhteyttä O/E-suhteisiin tutkittiin QGIS-ohjelmalla tuotettuun sulfaattimaa-aineistoon perustuen. Ensin tarkasteltiin, osuvatko pienten savimaiden jokien näytteenottopisteet Litorina-meren pohjan alueelle, minkä

jälkeen tutkittiin silmämääräisesti kartoista, millä riskillä (hyvin pieni, pieni, kohtalainen ja suuri) pienet savimaiden joet osuvat happamien sulfaattimaiden alueille. Lisäksi tarkasteltiin, onko Litorina-alueella olevien jokien O/E-suhteissa eroja niihin, jotka ovat sen ulkopuolella.

3 TULOKSET

3.1 Pienten kivennäismaiden jokien pohjaeläimistön vertailuolojen mallinnus