Maailmanlaajuisten meriekologisten provinssien (ekoprovinssien) määrittämiseen ehdotetaan ohjaamatonta oppimismenetelmää planktonyhteisörakenteen ja ravinnevirtatietojen perusteella.Systemaattinen integroitu ekologinen maakunta (SAGE) -menetelmällä voidaan tunnistaa ekologisia maakuntia erittäin epälineaarisissa ekosysteemimalleissa.Sopeutuakseen datan ei-gaussiseen kovarianssiin SAGE käyttää t satunnaista naapuri upotusta (t-SNE) dimensioivuuden vähentämiseksi.Tiheyspohjaiseen spatial clustering (DBSCAN) -algoritmiin perustuvan melusovelluksen avulla voidaan tunnistaa yli sata ekologista maakuntaa.Käyttämällä ekologisia eroja sisältävää liitettävyyskartaa etäisyyden mittana, vankka yhdistetty ekologinen maakunta (AEP) määritellään objektiivisesti sisäkkäisten ekologisten provinssien kautta.AEP:n avulla tutkittiin ravinteiden saantinopeuden säätelyä yhteisön rakenteessa.Eco-province ja AEP ovat ainutlaatuisia ja voivat auttaa mallin tulkinnassa.Ne voivat helpottaa mallien vertailua ja parantaa meren ekosysteemien ymmärtämistä ja seurantaa.
Provinssit ovat alueita, joilla merellä tai maalla monimutkainen biomaantiede on organisoitu yhtenäisiksi ja merkityksellisiksi alueiksi (1).Nämä maakunnat ovat erittäin tärkeitä paikkojen vertailussa, havaintojen karakterisoinnissa, seurannassa ja suojelussa.Näitä provinsseja tuottavat monimutkaiset ja epälineaariset vuorovaikutukset tekevät valvomattomista koneoppimismenetelmistä (ML) erittäin sopivia provinssien objektiiviseen määrittämiseen, koska datan kovarianssi on monimutkainen ja ei-gaussinen.Tässä ehdotetaan ML-menetelmää, joka tunnistaa järjestelmällisesti ainutlaatuiset meren ekologiset maakunnat (ekoprovinssit) Darwinin globaalista kolmiulotteisesta (3D) fyysisesta/ekosysteemimallista (2).Termiä "ainutlaatuinen" käytetään osoittamaan, että tunnistettu alue ei ole riittävän päällekkäinen muiden alueiden kanssa.Tätä menetelmää kutsutaan System Integrated Ecological Province (SAGE) -menetelmäksi.Hyödyllisen luokituksen suorittamiseksi algoritmimenetelmän on sallittava (i) globaali luokittelu ja (ii) monimittainen analyysi, joka voidaan sisäkkäin/agregoida tilassa ja ajassa (3).Tässä tutkimuksessa esitettiin ensin SAGE-menetelmää ja keskusteltiin tunnistetuista ekologisista maakunnista.Ekomaakunnat voivat edistää yhteisön rakennetta säätelevien tekijöiden ymmärtämistä, tarjota hyödyllisiä oivalluksia seurantastrategioihin ja auttaa seuraamaan ekosysteemin muutoksia.
Maan maakunnat luokitellaan yleensä ilmaston (sademäärä ja lämpötila), maaperän, kasvillisuuden ja eläimistön samankaltaisuuksien mukaan, ja niitä käytetään apuhoitoon, biologisen monimuotoisuuden tutkimukseen ja tautien torjuntaan (1, 4).Meren provinsseja on vaikeampi määritellä.Useimmat organismit ovat mikroskooppisia, ja niissä on nesterajat.Longhurst et ai.(5) Tarjosi yhden ensimmäisistä valtameren ministeriön maailmanlaajuisista luokituksista ympäristöolosuhteiden perusteella.Näiden "Longhurstin" maakuntien määritelmä sisältää muuttujat, kuten sekoitusnopeus, kerrostuminen ja säteilyvoimakkuus, sekä Longhurstin laajan kokemuksen meren valtameritutkijana, jolla on muita tärkeitä ehtoja meren ekosysteemeille.Longhurstia on käytetty laajalti esimerkiksi alkutuotannon ja hiilivirtojen arvioimiseen, kalastuksen auttamiseksi ja in situ -havaintotoimien suunnittelussa (5-9).Maakuntien objektiivisempaa määrittelyä varten on käytetty menetelmiä, kuten sumeaa logiikkaa ja alueellista valvomatonta klusterointia/tilastoa (9-14).Tällaisten menetelmien tarkoituksena on tunnistaa mielekkäitä rakenteita, jotka pystyvät tunnistamaan maakunnat saatavilla olevista havaintotiedoista.Esimerkiksi dynaamiset meriprovinssit (12) käyttävät itseorganisoituvia karttoja vähentääkseen melua ja käyttävät hierarkkista (puupohjaista) klusterointia alueellisista satelliiteista johdettujen meren värituotteiden määrittämiseen [klorofylli a (Chl-a), normalisoitu fluoresenssiviivan korkeus ja värillinen liuennut orgaaninen aines] ja fyysinen kenttä (meren pinnan lämpötila ja suolapitoisuus, absoluuttinen dynaaminen topografia ja merijää).
Planktonin yhteisörakenne on huolestuttava, koska sen ekologialla on suuri vaikutus korkeampiin ravinnetasoihin, hiilen imeytymiseen ja ilmastoon.Siitä huolimatta globaalin ekologisen maakunnan määrittäminen planktonyhteisörakenteen perusteella on edelleen haastava ja vaikea tavoite.Merivärisatelliitit voivat mahdollisesti tarjota näkemyksiä kasviplanktonin karkearakeisesta luokittelusta tai ehdottaa funktionaalisten ryhmien etuja (15), mutta ne eivät tällä hetkellä pysty tarjoamaan yksityiskohtaista tietoa yhteisön rakenteesta.Viimeaikaiset tutkimukset [esim. Tara Ocean (16)] tarjoavat ennennäkemättömiä mittauksia yhteisön rakenteesta;tällä hetkellä globaalissa mittakaavassa on vain vähän in situ -havaintoja (17).Aiemmat tutkimukset ovat suurelta osin määrittäneet "biogeokemiallisen maakunnan" (12, 14, 18) biokemiallisten yhtäläisyyksien (kuten alkutuotanto, Chl ja käytettävissä oleva valo) määrittämisen perusteella.Tässä käytetään numeerista mallia tulostamiseen [Darwin(2)] ja ekologinen maakunta määritetään yhteisön rakenteen ja ravinnevirran mukaan.Tässä tutkimuksessa käytetyllä numeerisella mallilla on maailmanlaajuinen kattavuus, ja sitä voidaan verrata olemassa oleviin kenttätietoihin (17) ja kaukokartoituskenttiin (huomautus S1).Tässä tutkimuksessa käytetyn numeerisen mallidatan etuna on maailmanlaajuinen kattavuus.Malliekosysteemi koostuu 35 kasviplanktonlajista ja 16 eläinplanktonlajista (katso materiaalit ja menetelmät).Malliplanktontyypit vuorovaikuttavat epälineaarisesti ei-gaussin kovarianssirakenteiden kanssa, joten yksinkertaiset diagnostiset menetelmät eivät sovellu yksilöllisten ja johdonmukaisten kuvioiden tunnistamiseen nousevissa yhteisörakenteissa.Tässä esitelty SAGE-menetelmä tarjoaa uuden tavan tarkistaa monimutkaisten Darwin-mallien tulos.
Datatieteen/ML-teknologian tehokkaat muunnosominaisuudet voivat mahdollistaa ylivoimaisen monimutkaiset malliratkaisut paljastamaan monimutkaisia mutta kestäviä rakenteita datan kovarianssissa.Vankka menetelmä määritellään menetelmäksi, joka voi toistaa tulokset todenmukaisesti tietyllä virhealueella.Jopa yksinkertaisissa järjestelmissä vahvojen kuvioiden ja signaalien määrittäminen voi olla haaste.Kunnes havaittuun malliin johtavat perusteet on selvitetty, ilmaantuva monimutkaisuus voi tuntua monimutkaiselta/vaikealta ratkaistavalta.Avainprosessi ekosysteemin koostumuksen asettamisessa on luonteeltaan epälineaarinen.Epälineaaristen vuorovaikutusten olemassaolo voi hämmentää robustin luokituksen, joten on vältettävä menetelmiä, jotka tekevät vahvoja olettamuksia datakovarianssin tilastollisesta perusjakaumasta.Suuriulotteiset ja epälineaariset tiedot ovat yleisiä valtameritutkimuksessa, ja niillä voi olla kovarianssirakenne, jossa on monimutkainen, ei-Gaussin topologia.Vaikka data, jolla on ei-Gaussin kovarianssirakenne, saattaa haitata vankkaa luokittelua, SAGE-menetelmä on uusi, koska se on suunniteltu tunnistamaan klustereita, joilla on mielivaltainen topologia.
SAGE-menetelmän tavoitteena on objektiivisesti tunnistaa esiin nousevia malleja, jotka voivat auttaa lisäämään ekologista ymmärrystä.Seuraamalla klusteripohjaista työnkulkua, joka on samanlainen kuin (19), ekologisia ja ravinnevirtamuuttujia käytetään määrittämään tietojen ainoa klusteri, jota kutsutaan ekologiseksi maakunnaksi.Tässä tutkimuksessa ehdotettu SAGE-menetelmä (kuva 1) vähentää ensin dimensiota 55:stä 11:een dimensiossa summaamalla etukäteen määritellyt planktonin funktionaaliset ryhmät (katso Materiaalit ja menetelmät).Käyttämällä t-satunnaisen naapurin upotusmenetelmää (t-SNE) kokoa pienennetään edelleen projisoimalla todennäköisyys 3D-avaruuteen.Valvomaton klusterointi voi tunnistaa ekologisesti lähellä olevia alueita [tiheyspohjainen spatial clustering (DBSCAN) melupohjaisille sovelluksille].Sekä t-SNE että DBSCAN ovat sovellettavissa luontaiseen epälineaariseen ekosysteemin numeeriseen mallitietoon.Projisoi sitten syntynyt ekologinen maakunta uudelleen maan päälle.Yli sata ainutlaatuista aluetutkimukseen soveltuvaa ekologista maakuntaa on tunnistettu.Globaalisti yhtenäisen ekosysteemimallin huomioon ottamiseksi SAGE-menetelmällä ekologiset maakunnat yhdistetään aggregoituiksi ekologisiin provinsseihin (AEP) ekologisten maakuntien tehokkuuden parantamiseksi.Aggregaation tasoa (kutsutaan "monimutkaisuuteen") voidaan säätää vaaditun yksityiskohtaisuuden mukaan.Määritä vankan AEP:n pienin monimutkaisuus.Valinnan painopiste on SAGE-menetelmällä ja pienimpien monimutkaisten AEP-tapausten tutkiminen hätäyhteisörakenteen hallinnan määrittämiseksi.Malleja voidaan sitten analysoida ekologisen näkemyksen saamiseksi.Tässä esiteltyä menetelmää voidaan käyttää myös mallien vertailuun laajemmin, esimerkiksi arvioimalla eri malleissa löydettyjä samankaltaisten ekologisten maakuntien sijainteja erojen ja yhtäläisyyksien tuomiseksi esiin, jotta malleja voidaan vertailla.
(A) Kaaviokaavio työnkulusta ekologisen maakunnan määrittämiseksi;käyttämällä funktionaalisen ryhmän summaa pienentämään alkuperäiset 55-ulotteiset tiedot 11-ulotteiseksi mallin tuotoksi, mukaan lukien seitsemän funktionaalisen/ravinneplanktonin biomassa ja neljä ravinteiden tarjontaa.Vähäinen arvo ja kestävä jääpeitealue.Tiedot on standardisoitu ja standardisoitu.Tarjoa 11-ulotteisia tietoja t-SNE-algoritmille tilastollisesti samankaltaisten ominaisuusyhdistelmien korostamiseksi.DBSCAN valitsee huolellisesti klusterin parametrin arvon asettamiseksi.Lopuksi projisoi tiedot takaisin leveys-/pituusaste-projektioon.Huomaa, että tämä prosessi toistetaan 10 kertaa, koska t-SNE:n soveltaminen voi saada aikaan pienen satunnaisuuden.(B) selittää kuinka saada AEP toistamalla kohdan (A) työnkulku 10 kertaa.Jokaiselle näistä 10 toteutuksesta maakuntien välinen Bray-Curtis (BC) -eromatriisi määritettiin 51 kasviplanktontyypin biomassan perusteella.Määritä BC-ero provinssien välillä monimutkaisuudesta 1 AEP täyteen monimutkaisuuteen 115. BC-vertailu on Longhurstin maakunnan asettama.
SAGE-menetelmä käyttää globaalin 3D-fysikaalisen/ekosysteemin numeerisen mallin tulosta ekologisen provinssin määrittämiseen [Darwin (2);Katso materiaalit ja menetelmät ja huomautus S1].Ekosysteemin komponentit koostuvat 35 kasviplanktonlajista ja 16 eläinplanktonlajista, joissa on seitsemän ennalta määriteltyä toiminnallista ryhmää: prokaryootit ja eukaryootit, jotka ovat sopeutuneet vähäravinteisiin ympäristöihin, kokkidiat, joissa on kalsiumkarbonaattipinnoite, ja raskas typen sitominen Typpiravinteet (yleensä puuttuu). tärkeät ravinteet) piipitoisella peitteellä voi tehdä muita planktonin fotosynteesiä ja laiduntavia sekaravinteita siimalaattoja ja eläinplanktonpaimenia.Kokoväli on 0,6 - 2500 μm vastaava pallomainen halkaisija.Kasviplanktonin koon ja toiminnallisen ryhmittelyn mallijakauma kuvaa satelliitti- ja in situ -havainnoissa havaitut yleiset ominaisuudet (katso kuvat S1-S3).Numeerisen mallin ja havaitun valtameren samankaltaisuus osoittaa, että mallin määrittelemät maakunnat voivat olla sovellettavissa in situ valtamereen.Huomaa, että tämä malli kaappaa vain tietyn kasviplanktonin monimuotoisuuden ja vain tietyt fysikaaliset ja kemialliset pakotusalueet in situ -valtamerestä.SAGE-menetelmä voi auttaa ihmisiä ymmärtämään paremmin malliyhteisörakenteen erittäin alueellista ohjausmekanismia.
Sisällyttämällä kuhunkin planktonin funktionaaliseen ryhmään vain pintabiomassan summa (keskimäärin 20 vuotta), voidaan tietojen dimensiota pienentää.Kun aikaisemmat tutkimukset osoittivat niiden keskeisen roolin yhdyskuntarakenteen määrittämisessä, se sisälsi myös pintalähteitä koskevat termit ravinnevirroille (typen, raudan, fosfaatin ja piihapon tarjonta) [esim. (20, 21)] .Funktionaalisten ryhmien summaus pienentää ongelman 55:stä (51 planktonia ja 4 ravinnevirtaa) 11:een.Tässä alkuperäisessä tutkimuksessa algoritmin asettamien laskennallisten rajoitusten vuoksi syvyys- ja aikavaihtelua ei otettu huomioon.
SAGE-menetelmällä voidaan tunnistaa tärkeitä epälineaaristen prosessien välisiä suhteita ja funktionaalisen ryhmän biomassan ja ravinnevirran välisten vuorovaikutusten keskeisiä piirteitä.Käyttämällä 11-ulotteista dataa, joka perustuu euklidisiin etäopiskelumenetelmiin (kuten K-keskiarvoihin), ei voida saada luotettavia ja toistettavia provinsseja (19, 22).Tämä johtuu siitä, että ekologisen maakunnan määrittävien avainelementtien kovarianssin perusjakaumasta ei löydy Gaussin muotoa.Voronoin solujen K-keskiarvot (suorat viivat) eivät voi säilyttää ei-Gaussin perusjakaumaa.
Seitsemän planktonin funktionaalisen ryhmän ja neljän ravinnevirran biomassa muodostaa 11-ulotteisen vektorin x.Siksi x on malliruudukon vektorikenttä, jossa jokainen elementti xi edustaa mallin vaakaverkossa määriteltyä 11-ulotteista vektoria.Jokainen indeksi i yksilöi yksilöllisesti pallon ruudukkopisteen, jossa (lon, lat) = (ϕi, θi).Jos malliruudukkoyksikön biomassa on alle 1,2×10-3mg Chl/m3 tai jääpeittoaste ylittää 70 %, käytetään biomassatietojen lokia ja hylätään.Tiedot on normalisoitu ja standardoitu, joten kaikki tiedot ovat alueella [0-1], keskiarvo poistetaan ja skaalataan yksikkövarianssiin.Tämä tehdään niin, että ominaisuudet (biomassa ja ravinnevirta) eivät rajoita kontrastia mahdollisten arvojen alueella.Klusteroinnin tulisi kaapata muutossuhde ominaisuuksien välisen avaintodennäköisyysetäisyyden perusteella maantieteellisen etäisyyden sijaan.Kun nämä etäisyydet mitataan määrällisesti, tärkeät ominaisuudet tulevat esiin ja tarpeettomat yksityiskohdat hylätään.Ekologisesta näkökulmasta tämä on välttämätöntä, koska tietyillä kasviplanktonilla, jolla on vähän biomassaa, voi olla suurempia biogeokemiallisia vaikutuksia, kuten typen sitominen diatsotrofisten bakteerien toimesta.Dataa standardoitaessa ja normalisoitaessa tämäntyyppiset kovariaatit korostetaan.
t-SNE-algoritmia käytetään selventämään olemassa olevia samankaltaisia alueita korostamalla piirteiden läheisyyttä korkeadimensionaalisessa avaruudessa pieniulotteisessa esityksessä.Aikaisemmissa töissä syvien hermoverkkojen rakentamiseen kaukokartoitussovelluksia varten käytettiin t-SNE:tä, joka osoitti taitonsa keskeisten ominaisuuksien erottamisessa (23).Tämä on välttämätön vaihe ominaisuustiedon vankan klusteroinnin tunnistamiseksi samalla kun vältetään ei-konvergenttisia ratkaisuja (huomautus S2).Gaussin ytimiä käyttämällä t-SNE säilyttää datan tilastolliset ominaisuudet kartoittamalla jokaisen korkeadimensionaalisen objektin johonkin pisteeseen 3D-vaiheavaruudessa, mikä varmistaa, että samanlaisten objektien todennäköisyys korkeassa ja matalassa suunnassa on korkea korkeassa tilassa. mittatila (24).Kun on annettu joukko N korkeadimensionaalista objektia x1,…,xN, t-SNE-algoritmi vähentää minimoimalla Kullback-Leibler (KL) -hajoamisen (25).KL-divergentti on mitta siitä, kuinka erilainen todennäköisyysjakauma eroaa toisesta referenssitodennäköisyysjakaumasta, ja se voi tehokkaasti arvioida korrelaatiomahdollisuutta korkeaulotteisten piirteiden pieniulotteisten esitysten välillä.Jos xi on i:s kohde N-ulotteisessa avaruudessa, xj on j:s kohde N-ulotteisessa avaruudessa, yi on i:s kohde matalaulotteisessa avaruudessa ja yj on j:s kohde matalassa. -ulotteinen avaruus, sitten t -SNE määrittelee samankaltaisuuden todennäköisyyden ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) ja ulottuvuuden vähennysjoukolle q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Kuva 2A havainnollistaa 11-ulotteisen yhdistelmän biomassa- ja ravinnevirtavektorien vähentämisen vaikutusta 3D-muotoon.T-SNE:n soveltamisen motivaatiota voidaan verrata pääkomponenttianalyysin (PCA) motivaatioon, joka käyttää varianssiattribuuttia korostaakseen datan aluetta/attribuuttia, mikä vähentää ulottuvuutta.t-SNE-menetelmän havaittiin olevan PCA:ta parempi, koska se tarjoaa luotettavia ja toistettavia tuloksia ympäristöministeriölle (katso huomautus S2).Tämä voi johtua siitä, että PCA:n ortogonaalisuusoletus ei sovellu kriittisten vuorovaikutusten tunnistamiseen erittäin epälineaaristen interaktiivisten piirteiden välillä, koska PCA keskittyy lineaarisiin kovarianssirakenteisiin (26).Käyttämällä kaukokartoitustietoja, Lunga et ai.(27) havainnollistaa, kuinka SNE-menetelmää käytetään Gaussin jakaumasta poikkeavien monimutkaisten ja epälineaaristen spektriominaisuuksien korostamiseen.
(A) t-SNE-algoritmilla piirretty mallinnettu ravinteiden saantinopeus, kasviplanktonin ja eläinplanktonin funktionaalisen ryhmän biomassa ja väritetty maakunnittain DBSCAN:ia käyttäen.Jokainen piste edustaa pistettä korkeadimensionaalisessa avaruudessa, kuten kuvassa 6B esitetään, useimmat pisteet kaapataan.Akselit viittaavat "t-SNE"-kokoihin 1, 2 ja 3. (B) DBSCANin löytämä maakunnan maantieteellinen projektio alkuperän leveys-pituusasteruudukosta.Väriä tulee pitää minkä tahansa värinä, mutta sen tulee vastata (A).
Kuvan 2A t-SNE-sirontakäyrän pisteet liittyvät vastaavasti leveys- ja pituusasteeseen.Jos kuvan 2A kaksi pistettä ovat lähellä toisiaan, se johtuu niiden biomassa- ja ravinnevirtojen samankaltaisuudesta, ei maantieteellisestä läheisyydestä.Kuvan 2A värit ovat DBSCAN-menetelmällä löydettyjä klustereita (28).Kun etsitään tiheitä havaintoja, DBSCAN-algoritmi käyttää 3D-esityksen pisteiden välistä etäisyyttä (ϵ = 0,39; lisätietoja tästä valinnasta on kohdassa Materiaalit ja menetelmät), ja samankaltaisten pisteiden lukumäärä vaaditaan klusterin määrittämiseen (tässä). 100 pistettä, katso yllä).DBSCAN-menetelmä ei tee mitään oletuksia datassa olevien klustereiden muodosta tai lukumäärästä, kuten alla on esitetty:
3) Kaikille pisteille, jotka on tunnistettu etäisyyden sisällä, toista vaihe 2 iteratiivisesti määrittääksesi klusterin rajan.Jos pisteiden määrä on suurempi kuin asetettu vähimmäisarvo, se nimetään klusteriksi.
Tiedot, jotka eivät täytä klusterin vähimmäisjäsenen ja etäisyyden ϵ-metriikkaa, katsotaan "kohinaksi" eikä niille määritetä väriä.DBSCAN on nopea ja skaalautuva algoritmi, jonka suorituskyky on O(n2) pahimmassa tapauksessa.Nykyisessä analyysissä se ei ole itse asiassa satunnainen.Vähimmäispistemäärä määräytyy asiantuntijan arvioinnissa.Jälkeen etäisyyden säätämisen jälkeen tulos ei ole tarpeeksi vakaa alueella ≈±10.Tämä etäisyys asetetaan käyttämällä yhteyksiä (kuva 6A) ja valtameren peittoprosenttia (kuva 6B).Yhteydet määritellään klusterien yhdistelmämääräksi ja on herkkä ϵ-parametrille.Alhaisempi liitettävyys tarkoittaa riittämätöntä sovitusta, alueiden keinotekoista ryhmittelyä yhteen.Korkeayhteys osoittaa ylikuormituksen.Korkeampaa minimiä voidaan käyttää, mutta jos minimi ylittää ca, on mahdotonta saavuttaa luotettavaa ratkaisua.135 (Katso lisätietoja kohdasta Materiaalit ja menetelmät).
Kuvassa 2A tunnistetut 115 klusteria projisoidaan takaisin maan päälle kuviossa 2B.Jokainen väri vastaa DBSCANin tunnistamien biogeokemiallisten ja ekologisten tekijöiden yhtenäistä yhdistelmää.Kun klusterit on määritetty, kunkin kuvan 2A pisteen yhdistämistä tiettyyn leveys- ja pituusasteeseen käytetään klusterien projisoimiseksi takaisin maantieteelliselle alueelle.Kuva 2B havainnollistaa tätä samoilla klusterin väreillä kuin kuvio 2A.Samanlaisia värejä ei pidä tulkita ekologiseksi samankaltaisuudeksi, koska ne määrätään siinä järjestyksessä, missä klusterit algoritmi löytää.
Kuvan 2B alue voi olla laadullisesti samanlainen kuin valtameren fysikaalisessa ja/tai biogeokemiassa vakiintunut alue.Esimerkiksi eteläisen valtameren klusterit ovat vyöhykesymmetrisiä, ja niissä esiintyy oligotrofisia pyörteitä, ja jyrkkä siirtymä osoittaa pasaatituulten vaikutuksen.Esimerkiksi päiväntasaajan Tyynellämerellä nähdään erilaisia nousuun liittyviä alueita.
Ekoprovinssin ekologisen ympäristön ymmärtämiseksi klusterin ekologian arvioinnissa käytettiin Bray-Curtisin (BC) eroindeksin (29) muunnelmaa.BC-indikaattori on tilastotietoa, jota käytetään määrittämään eroa yhteisön rakenteessa kahden eri kohteen välillä.BC-mittaus soveltuu 51 kasviplankton- ja eläinplanktonlajin biomassalle BCninj = 1-2CninjSni + Snj
BCninj viittaa yhdistelmän ni ja yhdistelmän nj samankaltaisuuteen, jossa Cninj on molemmissa yhdistelmissä ni ja nj esiintyvän yksittäisen biomassatyypin vähimmäisarvo, ja Sni edustaa kaikkien molemmissa yhdistelmissä ni ja Snj olevien biomassojen summaa.BC-ero on samanlainen kuin etäisyysmitta, mutta toimii ei-euklidisessa avaruudessa, joka todennäköisesti soveltuu paremmin ekologiselle tiedolle ja sen tulkinnalle.
Jokaisen kuviossa 2B tunnistetun klusterin osalta voidaan arvioida maakunnan sisäisen ja provinssien välisen BC:n samankaltaisuus.Provinssin sisäinen BC-ero viittaa maakunnan keskiarvon ja provinssin kunkin pisteen väliseen eroon.Ero eKr. provinssien välillä viittaa samanlaisuuteen yhden provinssin ja muiden provinssien välillä.Kuvio 3A esittää symmetristä BC-matriisia (0, musta: täysin vastaava; 1, valkoinen: täysin erilainen).Kukin kaavion rivi näyttää kuvion tiedoissa.Kuvio 3B esittää kuvion 3A BC:n tulosten maantieteellistä merkitystä kullekin maakunnalle.Vähäravinteisella ja vähäravinteisella alueella sijaitsevassa maakunnassa kuva 3B osoittaa, että päiväntasaajan ja Intian valtameren ympärillä olevien suurten alueiden symmetria on pohjimmiltaan samanlainen, mutta korkeammat leveysasteet ja nousualueet ovat merkittävästi erilaisia.
(A) BC-eron aste, joka on arvioitu kullekin maakunnalle perustuen maailmanlaajuiseen 20 vuoden keskimääräiseen maailmanlaajuiseen pinta-alaan, joka on 51 planktonia.Huomaa arvojen odotettu symmetria.(B) Sarakkeen (tai rivin) alueellinen projektio.Dystrofisessa ympyrässä olevalle maakunnalle arvioitiin BC:n samankaltaisuusmitan globaali jakautuminen ja arvioitiin globaali 20 vuoden keskiarvo.Musta (BC = 0) tarkoittaa samaa aluetta ja valkoinen (BC = 1) tarkoittaa, ettei samankaltaisuutta.
Kuvio 4A havainnollistaa BC:n eroa kunkin kuvion 2B provinssin sisällä.Määritetty käyttämällä klusterin keskimääräisen pinta-alan keskimääräistä yhdistelmää ja määrittämällä BC:n ja maakunnan kunkin ruudukkopisteen keskiarvon välinen ero, se osoittaa, että SAGE-menetelmällä voidaan erottaa hyvin 51 lajia ekologisen samankaltaisuuden perusteella. mallin tiedot.Kaikkien 51 tyypin keskimääräinen klusterin BC-eroisuus on 0,102±0,0049.
(A, B ja D) Provinssin sisällä oleva BC-ero arvioidaan keskimääräisenä BC-erona kunkin ruudukkopisteyhteisön ja keskimääräisen maakunnan välillä, eikä monimutkaisuus vähene.(2) Globaali keskimääräinen provinssin sisäinen BC-ero on 0,227±0,117.Tämä on tämän työn ehdottama ekologiseen motivaatioon perustuvan luokituksen vertailukohta [vihreä viiva (C)].(C) Keskimääräinen provinssin sisäinen BC-ero: Musta viiva edustaa provinssin sisäistä BC-eroa, jonka monimutkaisuus lisääntyy.2σ tulee ekoprovinssin tunnistusprosessin 10 toistosta.DBSCANin löytämän provinssien kokonaismonimutkaisuuden osalta (A) osoittaa, että BC-ero provinssissa on 0,099 ja (C):n ehdottama monimutkaisuusluokitus on 12, mikä johtaa BC-eroon provinssissa 0,200.kuten kuvasta näkyy.(D).
Kuvassa 4B 51 planktontyypin biomassaa on käytetty edustamaan vastaavaa BC-eroa Longhurstin maakunnassa.Kunkin maakunnan kokonaiskeskiarvo on 0,227 ja ruudukkopisteiden keskihajonta suhteessa BC-maakunnan eroon on 0,046.Tämä on suurempi kuin kuvassa 1B tunnistettu klusteri.Sen sijaan, käyttämällä seitsemän funktionaalisen ryhmän summaa, keskimääräinen kauden sisäinen BC-ero Longhurstissa kasvoi 0,232:een.
Maailmanlaajuinen ekoprovinssin kartta tarjoaa monimutkaisia yksityiskohtia ainutlaatuisista ekologisista vuorovaikutuksista, ja Longhurstin maakunnan koko ekosysteemirakenteen käytössä on tehty parannuksia.Ekologiaministeriön odotetaan antavan näkemyksen numeerisen malliekosysteemin hallintaprosessista, ja tämä näkemys auttaa kenttätöiden kartoittamisessa.Tätä tutkimusta varten ei ole mahdollista esittää täydellistä yli sataa maakuntaa.Seuraava osa esittelee SAGE-menetelmän, joka tiivistää maakunnat.
Yksi maakunnan tavoitteista on edistää ymmärrystä maakunnan sijainnista ja johtamisesta.Hätätilanteiden määrittämiseksi kuvan 1B menetelmä havainnollistaa ekologisesti samankaltaisten maakuntien pesintää.Ekomaakunnat ryhmitellään yhteen ekologisen samankaltaisuuden perusteella, ja tällaista maakuntien ryhmittelyä kutsutaan nimellä AEP.Aseta säädettävä "monimutkaisuus" huomioon otettavien provinssien kokonaismäärän perusteella.Termiä "monimutkaisuus" käytetään, koska se mahdollistaa hätäattribuuttien tason säätämisen.Merkittävien aggregaatioiden määrittämiseksi vertailuarvona käytetään provinssin sisäistä keskimääräistä BC-eroa 0,227 Longhurstista.Tämän vertailuarvon alapuolella yhdistettyjä provinsseja ei pidetä enää hyödyllisinä.
Kuten kuvasta 3B näkyy, globaalit ekologiset maakunnat ovat yhtenäisiä.Käyttämällä maakuntien välisiä BC-eroja voidaan nähdä, että jotkut kokoonpanot ovat hyvin "yleisiä".Genetiikan ja graafiteorian menetelmien innoittamana "yhdistettyjen graafien" avulla lajitellaan yli 100 maakuntaa niitä muistuttavien maakuntien perusteella."Yhteyden" metriikka tässä määritetään käyttämällä maakuntien välistä BC-eroa (30).Niiden provinssien lukumäärää, joissa on enemmän tilaa yli 100 provinssin luokittelulle, voidaan kutsua tässä monimutkaisuus.AEP on tuote, joka luokittelee yli 100 maakuntaa hallitsevimmaksi/lähimmäksi ekologiseksi maakunnaksi.Jokainen ekologinen maakunta on määritetty hallitsevaan/erittäin toisiinsa liittyvään ekologiseen maakuntaan, joka on niitä eniten muistuttava.Tämä BC-eron määräämä aggregaatio mahdollistaa sisäkkäisen lähestymistavan globaaliin ekologiaan.
Valittu monimutkaisuus voi olla mikä tahansa arvo 1:stä kuvion 1 täydelliseen monimutkaisuuteen.2A.Pienemmillä monimutkaisuudella AEP voi degeneroitua todennäköisyyspohjaisen ulottuvuuden vähennysvaiheen (t-SNE) vuoksi.Degeneraatio tarkoittaa, että ekologiset maakunnat voidaan osoittaa eri AEP:ille iteraatioiden välillä, mikä muuttaa katettua maantieteellistä aluetta.Kuva 4C havainnollistaa BC-erojen leviämistä provinssien sisällä yhä monimutkaisemmissa AEP:issä 10 toteutuksessa (kuvassa 1B).Kuvassa 4C 2σ (sininen alue) on huononemisen mitta 10 toteutuksessa, ja vihreä viiva edustaa Longhurstin vertailuarvoa.Faktat ovat osoittaneet, että 12:n monimutkaisuus voi pitää BC-eron provinssissa Longhurstin vertailuarvon alapuolella kaikissa toteutuksissa ja säilyttää suhteellisen pienen 2σ:n heikkenemisen.Yhteenvetona voidaan todeta, että pienin suositeltu monimutkaisuus on 12 AEP:tä ja provinssin sisäinen keskimääräinen BC-ero arvioituna 51 planktontyypin avulla on 0,198±0,013, kuten kuvassa 4D esitetään.Kun käytetään seitsemän planktonfunktionaalisen ryhmän summaa, maakunnan keskimääräinen BC-ero on 2σ 0,198±0,004 sijaan.Vertailu seitsemän funktionaalisen ryhmän kokonaisbiomassalla tai kaikkien 51 planktontyypin biomassalla laskettujen BC-erojen välillä osoittaa, että vaikka SAGE-menetelmää voidaan soveltaa 51-ulotteiseen tilanteeseen, se koskee seitsemän funktionaalisen ryhmän kokonaisbiomassaa. Harjoittelua varten.
Minkä tahansa tutkimuksen tarkoituksesta riippuen voidaan harkita eri monimutkaisuustasoja.Aluetutkimukset voivat vaatia täyden monimutkaisuuden (eli kaikki 115 maakuntaa).Esimerkkinä ja selvyyden vuoksi harkitse vähimmäissuositeltua monimutkaisuutta 12.
Esimerkkinä SAGE-menetelmän hyödyllisyydestä, 12 AEP:tä, joiden monimutkaisuus on vähintään 12, käytetään tässä tutkimaan hätäyhteisörakenteen hallintaa.Kuva 5 havainnollistaa ekologisia näkemyksiä ryhmiteltynä AEP:n mukaan (A:sta L): Redfieldin stoikiometriassa maantieteellisen laajuuden (kuva 5C), funktionaalisen ryhmän biomassakoostumuksen (kuva 5A) ja ravinteiden saannin (kuva 5B) suorittaa N Zoomed.Suhde (N: Si: P: Fe, 1: 1: 16: 16 × 103) on esitetty.Jälkimmäisessä paneelissa P kerrottuna 16:lla ja Fe kerrottuna 16 × 103:lla, joten pylväsdiagrammi vastaa kasviplanktonin ravintotarpeita.
Maakunnat on luokiteltu 12 AEP:ään A–L. (A) Ekosysteemien biomassa (mgC/m3) 12 maakunnassa.(B) Liuenneen epäorgaanisen typen (N), raudan (Fe), fosfaatin (P) ja piihapon (Si) ravinteiden virtausnopeus (mmol/m3 vuodessa).Fe ja P kerrotaan 16:lla ja 16 × 103:lla, jotta kaistaleet standardisoidaan kasviplanktonin stoikiometriavaatimuksiin.(C) Huomaa ero napa-alueiden, subtrooppisten syklonien ja tärkeimpien kausittaisten/nousevien alueiden välillä.Valvonta-asemat on merkitty seuraavasti: 1, ISTUMISET;2, ALOHA;3, asema P;ja 4, BATS.
Tunnistettu AEP on ainutlaatuinen.Päiväntasaajan ympärillä on jonkin verran symmetriaa Atlantilla ja Tyynellämerellä, ja samanlainen, mutta laajentunut alue on olemassa Intian valtamerellä.Jotkut AEP:t kattavat nousuun liittyvän mantereen länsipuolen.Etelänapapiirivirtaa pidetään suurena vyöhykkeen ominaisuutena.Subtrooppinen sykloni on monimutkainen sarja oligotrofista AEP:tä.Näissä maakunnissa tuttu kuvio biomassan eroista planktonin hallitsemien oligotrofisten pyörteiden ja piilevärikkaiden napa-alueiden välillä on ilmeinen.
AEP:illä, joilla on hyvin samanlainen kasviplanktonin kokonaisbiomassa, voi olla hyvin erilaisia yhteisörakenteita ja ne voivat kattaa eri maantieteellisiä alueita, kuten D, H ja K, joilla on samanlainen kasviplanktonin kokonaisbiomassa.AEP H esiintyy pääasiassa päiväntasaajan Intian valtamerellä, ja siellä on enemmän diatsotrofisia bakteereja.AEP D:tä esiintyy useissa altaissa, mutta se on erityisen näkyvä Tyynellämerellä päiväntasaajan nousun ympärillä olevien korkeatuottoisten alueiden ympärillä.Tämän Tyynenmeren maakunnan muoto muistuttaa planeettaaaltojunaa.AEP D:ssä on vähän diatsobakteereja ja enemmän kartioita.Verrattuna kahteen muuhun maakuntaan, AEP K:tä löytyy vain Jäämeren ylängöiltä, ja siellä on enemmän piileviä ja vähemmän planktoneja.On syytä huomata, että planktonin määrä näillä kolmella alueella on myös hyvin erilainen.Niistä AEP K:n planktonin runsaus on suhteellisen alhainen, kun taas AEP D:n ja H:n runsaus on suhteellisen korkea.Siksi biomassastaan huolimatta (ja siksi samankaltaisia kuin Chl-a) nämä maakunnat ovat melko erilaisia: Chl-pohjainen maakuntatestaus ei välttämättä ota huomioon näitä eroja.
On myös selvää, että jotkin biomassaltaan hyvin erilaiset AEP:t voivat olla samanlaisia kasviplanktonyhteisörakenteen suhteen.Tämä näkyy esimerkiksi AEP D:ssä ja E:ssä. Ne ovat lähellä toisiaan, ja Tyynellämerellä AEP E on lähellä erittäin tuottavaa AEPJ:tä.Vastaavasti kasviplanktonin biomassan ja eläinplanktonin runsauden välillä ei ole selvää yhteyttä.
AEP voidaan ymmärtää niille tarjottujen ravintoaineiden perusteella (kuva 5B).Piileviä on vain siellä, missä piihappoa on runsaasti.Yleensä mitä suurempi piihapon tarjonta, sitä suurempi on piilevien biomassa.Piilevät voidaan nähdä AEP A, J, K ja L. Piilevien biomassan suhde muuhun kasviplanktoniin määräytyy N:n, P:n ja Fe:n perusteella suhteessa piilevien kysyntään.Esimerkiksi AEP L: tä hallitsevat piimat.Muihin ravintoaineisiin verrattuna Si:llä on suurin tarjonta.Sitä vastoin korkeammasta tuottavuudesta huolimatta AEP J:ssä on vähemmän piileviä ja vähemmän piitä (kaikki ja suhteessa muihin ravinteisiin).
Diatsoniumbakteerilla on kyky sitoa typpeä, mutta ne kasvavat hitaasti (31).Ne esiintyvät rinnakkain muun kasviplanktonin kanssa, jossa rauta ja fosfori ovat liiallisia suhteessa muiden kuin diatsoniumravinteiden kysyntään (20, 21).On syytä huomata, että diatsotrofinen biomassa on suhteellisen korkea ja Fe:n ja P:n tarjonta on suhteellisen suuri suhteessa typen tarjontaan. Tällä tavalla, vaikka kokonaisbiomassa AEP J:ssä on suurempi, diatsoniumbiomassa AEP H:ssa on suurempi kuin J. Huomaa, että AEP J ja H ovat maantieteellisesti hyvin erilaisia ja H sijaitsee päiväntasaajan Intian valtamerellä.
Jos ainutlaatuista ekosysteemirakennetta ei jaeta provinsseihin, 12 AEP:n pienimmän kompleksisuuden mallista saadut oivallukset eivät ole niin selkeitä.SAGE:n tuottama AEP mahdollistaa ekosysteemimalleista saatavan monimutkaisen ja korkeaulotteisen tiedon johdonmukaisen ja samanaikaisen vertailun.AEP korostaa tehokkaasti, miksi Chl ei ole hyvä ja vaihtoehtoinen menetelmä yhteisön rakenteen tai eläinplanktonin runsauden määrittämiseen korkeammilla ravinnetasoilla.Yksityiskohtainen analyysi käynnissä olevista tutkimusaiheista ei kuulu tämän artikkelin piiriin.SAGE-menetelmä tarjoaa tavan tutkia muita mallin mekanismeja, joita on helpompi käsitellä kuin pisteestä pisteeseen -katselua.
SAGE-menetelmää ehdotetaan auttamaan äärimmäisen monimutkaisten ekologisten tietojen selvittämisessä globaaleista fysikaalisista/biogeokemiallisista/ekosysteemien numeerisista malleista.Ekologinen provinssi määräytyy planktonin funktionaalisten ryhmien kokonaisbiomassan, t-SNE-todennäköisyysulottuvuuden vähennysalgoritmin soveltamisen ja klusteroinnin avulla valvomattomalla ML-menetelmällä DBSCAN.Maakuntien välistä BC-ero/graafin teoriaa sisäkkäismenetelmälle käytetään johtamaan vankka AEP, jota voidaan käyttää globaaliin tulkintaan.Rakentamisen kannalta Eco-Province ja AEP ovat ainutlaatuisia.AEP-pesäkkäisyyttä voidaan säätää alkuperäisen ekologisen maakunnan täyden monimutkaisuuden ja suositellun 12 AEP:n vähimmäiskynnyksen välillä.Sisäkkäisyyttä ja AEP:n vähimmäismonimutkaisuuden määrittämistä pidetään avainvaiheina, koska todennäköisyys t-SNE degeneroi AEP:t, joiden monimutkaisuus on <12.SAGE-menetelmä on maailmanlaajuinen, ja sen monimutkaisuus vaihtelee > 100 AEP:stä 12:een. Yksinkertaisuuden vuoksi tällä hetkellä painopiste on 12 globaalin AEP:n monimutkaisuus.Tulevaisuuden tutkimukset, erityisesti aluetutkimukset, voivat löytää globaalien ekoprovinssien pienemmän alueellisen osajoukon hyödylliseksi, ja ne voidaan koota pienemmälle alueelle, jotta voidaan hyödyntää samoja ekologisia oivalluksia, joita täällä käsiteltiin.Se tarjoaa ehdotuksia siitä, miten näitä ekologisia maakuntia ja niistä saatuja oivalluksia voidaan hyödyntää ekologisen ymmärryksen lisäämiseksi, mallien vertailun helpottamiseksi ja mahdollisesti meriekosysteemien seurannan parantamiseksi.
SAGE-menetelmällä tunnistettu ekologinen maakunta ja AEP perustuvat numeerisen mallin tietoihin.Määritelmän mukaan numeerinen malli on yksinkertaistettu rakenne, joka yrittää vangita kohdejärjestelmän olemuksen, ja eri malleilla on erilainen planktonin jakautuminen.Tässä tutkimuksessa käytetty numeerinen malli ei pysty täysin kaappaamaan kaikkia havaittuja malleja (esimerkiksi päiväntasaajan alueen ja eteläisen valtameren Chl-estimaateissa).Vain pieni osa todellisen valtameren monimuotoisuudesta on vangittu, eikä meso- ja submesoskaaleja voida ratkaista, mikä voi vaikuttaa ravinnevirtaan ja pienemmän mittakaavan yhteisön rakenteeseen.Näistä puutteista huolimatta on käynyt ilmi, että AEP on erittäin hyödyllinen monimutkaisten mallien ymmärtämisessä.Arvioimalla, missä samankaltaisia ekologisia maakuntia löytyy, AEP tarjoaa potentiaalisen numeerisen mallin vertailutyökalun.Nykyinen numeerinen malli kaappaa kaukokartoituksen kasviplanktonin Chl-a-pitoisuuden sekä planktonin koon ja funktionaalisen ryhmän jakautumisen (Huomautus S1 ja kuva S1) (2, 32).
Kuten 0,1 mgChl-a/m-3 ääriviivaviiva osoittaa, AEP on jaettu oligotrofiseen alueeseen ja mesotrofiseen alueeseen (kuva S1B): AEP B, C, D, E, F ja G ovat oligotrofisia alueita, ja loput alueet ovat oligotrofisia alueita. sijaitsee korkeampi Chl-a.AEP näyttää jonkin verran kirjeenvaihtoa Longhurstin provinssin kanssa (kuva S3A), esimerkiksi eteläisen valtameren ja päiväntasaajan Tyynenmeren kanssa.Joillakin alueilla AEP kattaa useita Longhurstin alueita ja päinvastoin.Koska aikomus rajata provinsseja tällä alueella ja Longhurstilla on erilainen, on odotettavissa, että eroja tulee olemaan.Useat AEP:t Longhurstin maakunnassa osoittavat, että tietyillä alueilla, joilla on samanlainen biogeokemia, voi olla hyvin erilaiset ekosysteemirakenteet.AEP:llä on tietty vastaavuus fyysisten tilojen kanssa, mikä paljastuu valvomattoman oppimisen avulla (19), kuten korkean nousun tiloissa (esimerkiksi eteläisellä valtamerellä ja päiväntasaajan Tyynellämerellä; kuva S3, C ja D).Nämä vastaavuudet osoittavat, että valtamerten dynamiikka vaikuttaa voimakkaasti planktonin yhteisörakenteeseen.Pohjois-Atlantin kaltaisilla alueilla AEP kulkee fyysisten provinssien halki.Nämä erot aiheuttavat mekanismit voivat sisältää prosesseja, kuten pölynkuljetusta, jotka voivat johtaa täysin erilaisiin ravitsemusohjelmiin jopa samanlaisissa fyysisissä olosuhteissa.
Ekologiaministeriö ja AEP huomauttivat, että pelkästään Chl:n avulla ei voida tunnistaa ekologisia komponentteja, kuten meriekologiayhteisö on jo ymmärtänyt.Tämä näkyy AEP:issä, joissa on samanlainen biomassa, mutta merkittävästi erilainen ekologinen koostumus (kuten D ja E).Sitä vastoin AEP:illä, kuten D ja K, on hyvin erilainen biomassa, mutta samanlainen ekologinen koostumus.AEP korostaa, että biomassan, ekologisen koostumuksen ja eläinplanktonin runsauden välinen suhde on monimutkainen.Esimerkiksi vaikka AEP J erottuu kasviplanktonin ja planktonbiomassan suhteen, AEP:n A ja L on samanlainen planktonbiomassa, mutta A:lla on suurempi planktonin runsaus.AEP korostaa, että kasviplanktonin biomassaa (tai Chl:a) ei voida käyttää eläinplanktonin biomassan ennustamiseen.Eläinplankton on kalatalouden ravintoketjun perusta, ja tarkemmat arviot voivat johtaa parempaan luonnonvarojen hallintaan.Tulevat merivärisatelliitit [esimerkiksi PACE (planktoni, aerosoli, pilvi ja meren ekosysteemi)] voivat olla paremmat auttamaan arvioimaan kasviplanktonin yhteisörakennetta.AEP-ennusteen käyttäminen voi mahdollisesti helpottaa eläinplanktonin arvioimista avaruudesta.SAGE:n kaltaiset menetelmät yhdistettynä uusiin teknologioihin ja yhä enemmän maaperätutkimuksiin (kuten Tara- ja seurantatutkimukseen) saatavilla olevaa kenttätietoa voivat yhdessä ottaa askeleen kohti satelliittipohjaista ekosysteemien terveyden seurantaa.
SAGE-menetelmä tarjoaa kätevän tavan arvioida joitain mekanismeja, jotka ohjaavat maakunnan ominaisuuksia, kuten biomassa/Chl, nettoalkutuotanto ja yhteisön rakenne.Esimerkiksi piilevien suhteellinen määrä määräytyy Si:n, N:n, P:n ja Fe:n saannin epätasapainosta suhteessa kasviplanktonin stoikiometrisiin vaatimuksiin.Tasapainoisella tarjontanopeudella yhteisöä hallitsevat piilevät (L).Kun tarjonta on epätasapainossa (eli piin tarjonta on pienempi kuin piilevien ravinteiden tarve), piilevien osuus on vain pieni osuus (K).Kun Fe:n ja P:n tarjonta ylittää typen (esimerkiksi E ja H), diatsotrofiset bakteerit kasvavat voimakkaasti.AEP:n tarjoaman kontekstin kautta valvontamekanismien tutkimisesta tulee entistä hyödyllisempää.
Eco-Province ja AEP ovat alueita, joilla on samanlaiset yhteisörakenteet.Aikasarjaa tietystä paikasta ekologisen maakunnan tai AEP:n sisällä voidaan pitää vertailukohtana ja se voi edustaa ekologisen maakunnan tai AEP:n kattamaa aluetta.Tällaisia aikasarjoja tarjoavat pitkäaikaiset paikan päällä sijaitsevat seuranta-asemat.Pitkän aikavälin in situ -tietosarjoilla on jatkossakin mittaamaton rooli.Yhteisörakenteen seurannan näkökulmasta SAGE-menetelmää voidaan pitää keinona määrittää uusien kohteiden hyödyllisin sijainti.Esimerkiksi pitkän aikavälin oligotrofisen elinympäristön arvioinnin (ALOHA) aikasarja on oligotrofisen alueen AEP B:ssä (kuva 5C, etiketti 2).Koska ALOHA on lähellä toisen AEP:n rajaa, aikasarja ei välttämättä edusta koko aluetta, kuten aiemmin ehdotettiin (33).Samassa AEP B:ssä aikasarja SEATS (Southeast Asian Time Series) sijaitsee Taiwanin lounaisosassa (34), kauempana muiden AEP:iden rajoista (kuva 5C, etiketti 1), ja sitä voidaan käyttää parempana seurantapaikkana. AEPB.BATS (Bermuda Atlantic Time Series Study) -aikasarja (Kuva 5C, etiketti 4) AEPC:ssä on hyvin lähellä AEP C:n ja F:n välistä rajaa, mikä osoittaa, että AEP C:n seuranta BATS-aikasarjoilla voi olla suoraan ongelmallista.AEP J:n asema P (kuva 5C, etiketti 3) on kaukana AEP:n rajasta, joten se on edustavampi.Eco-Province ja AEP voivat auttaa luomaan seurantakehyksen, joka soveltuu globaalien muutosten arviointiin, koska maakuntien lupa arvioida, missä paikan päällä tapahtuva näytteenotto voi tarjota keskeisiä näkemyksiä.SAGE-menetelmää voidaan kehittää edelleen sovellettavaksi ilmastotietoihin aikaa säästävän vaihtelun arvioimiseksi.
SAGE-menetelmän menestys saavutetaan tietotieteen/ML-menetelmien ja toimialuekohtaisen tiedon huolellisella soveltamisella.Tarkemmin sanottuna t-SNE:tä käytetään dimensioiden vähentämiseen, mikä säilyttää korkeaulotteisen datan kovarianssirakenteen ja helpottaa kovarianssitopologian visualisointia.Tiedot on järjestetty juovien ja kovarianssien muodossa (kuva 2A), mikä osoittaa, että puhtaasti etäisyyteen perustuvat mittaukset (kuten K-keskiarvot) eivät ole sopivia, koska niissä käytetään yleensä Gaussin (ympyrä)perusteista jakaumaa (käsitelty huomautuksessa S2). .DBSCAN-menetelmä sopii mille tahansa kovarianssitopologialle.Niin kauan kuin kiinnität huomiota parametrien asettamiseen, luotettava tunnistaminen voidaan tarjota.t-SNE-algoritmin laskentakustannukset ovat korkeat, mikä rajoittaa sen nykyisen käytön suurempaan datamäärään, mikä tarkoittaa, että sitä on vaikea soveltaa syviin tai ajallisesti vaihteleviin kenttiin.T-SNE: n skaalautuvuuden työ on käynnissä.Koska KL-etäisyys on helppo rinnastaa, on t-SNE-algoritmilla hyvät mahdollisuudet laajentua tulevaisuudessa (35).Toistaiseksi muita lupaavia ulottuvuuksien vähentämismenetelmiä, jotka voivat paremmin pienentää kokoa, ovat yhtenäiset monikerroksiset approksimaatio- ja projektiotekniikat (UMAP), mutta arviointi valtameritietojen yhteydessä on tarpeen.Paremman skaalautuvuuden tarkoitus on esimerkiksi globaalien ilmastojen tai monimutkaisten mallien luokittelu sekakerrokselle.Alueita, joita SAGE ei voi luokitella missään provinssissa, voidaan pitää kuvan 2A jäljellä olevina mustina pisteinä.Maantieteellisesti nämä alueet ovat pääasiassa erittäin kausittaisilla alueilla, mikä viittaa siihen, että ajan myötä muuttuvien ekologisten maakuntien vangitseminen tarjoaa paremman kattavuuden.
SAGE-menetelmän rakentamiseen on käytetty monimutkaisten järjestelmien/tietotieteen ideoita, joissa on käytetty kykyä määrittää funktionaalisten ryhmien klustereita (mahdollisuutta olla hyvin lähellä 11-ulotteisessa avaruudessa) ja provinsseja.Nämä maakunnat kuvaavat tiettyjä tilavuuksia 3D-t-SNE-vaiheavaruudessamme.Samoin Poincarén osaa voidaan käyttää arvioimaan liikeradan miehittämän tilaavaruuden "tilavuutta" "normaalin" tai "kaaoottisen" käyttäytymisen määrittämiseksi (36).Staattisen 11-ulotteisen mallin lähdön osalta voidaan samalla tavalla selittää datan 3D-vaiheavaruudeksi muuntamisen jälkeen käytetty tilavuus.Maantieteellisen alueen ja alueen suhde 3D-vaiheavaruudessa ei ole yksinkertainen, mutta se voidaan selittää ekologisella samankaltaisella tavalla.Tästä syystä tavanomaisempi BC-erojen mitta on edullinen.
Tulevaisuudessa SAGE-menetelmää käytetään uudelleen kausivaihteluiden tiedoissa arvioitaessa tunnistettujen maakuntien ja AEP:n alueellista vaihtelua.Tulevaisuuden tavoitteena on käyttää tätä menetelmää määrittämään, mitkä maakunnat voidaan määrittää satelliittimittauksilla (kuten Chl-a, kaukokartoitusheijastavuus ja merenpinnan lämpötila).Tämä mahdollistaa ekologisten komponenttien kaukokartoituksen sekä ekologisten maakuntien ja niiden vaihtelun erittäin joustavan seurannan.
Tämän tutkimuksen tarkoituksena on esitellä SAGE-menetelmä, joka määrittelee ekologisen maakunnan ainutlaatuisen planktonyhteisörakenteensa kautta.Täällä tarjotaan yksityiskohtaisempaa tietoa fysikaalisesta/biogeokemiallisesta/ekosysteemimallista ja t-SNE- ja DBSCAN-algoritmien parametrien valinnasta.
Mallin fysikaaliset komponentit ovat peräisin valtamerten kiertokulun ja ilmaston arvioinnista [ECCOv4;(37) kohdan (38) kuvaama globaali tilaestimaatti.Tila-estimaatin nimellinen resoluutio on 1/5.Pienimmän neliösumman menetelmällä Lagrangian kertoimella saadaan havaintoja säädellyt alku- ja rajaehdot sekä sisäiset malliparametrit, jolloin syntyy vapaasti juokseva MIT-yleiskiertomalli (MITgcm) (39), malli Optimoinnin jälkeen tulokset voidaan saada. seurata ja tarkkailla.
Biogeokemialla/ekosysteemillä on täydellisempi kuvaus (eli yhtälöt ja parametriarvot) kohdassa (2).Malli kaappaa C-, N-, P-, Si- ja Fe-kierron epäorgaanisten ja orgaanisten lampien kautta.Tässä käytetty versio sisältää 35 kasviplanktonlajia: 2 mikroprokaryoottilajia ja 2 mikroeukaryoottilajia (sopii vähän ravintoaineisiin ympäristöihin), 5 Cryptomonas sphaeroides -lajia (kalsiumkarbonaattipäällysteellä), 5 diatsoniumlajia ( Pystyy sitomaan typpeä, joten se ei ole rajoitettu) liuenneen epäorgaanisen typen saatavuus), 11 piilevää (muodostavat piipitoisen peitteen), 10 sekavegetatiivista flagellaattia (voivat fotosyntetisoida ja syödä muuta planktonia) ja 16 eläinplanktonia (laiduntavat muuta planktonia).Näitä kutsutaan "biogeokemiallisiksi toiminnallisiksi ryhmiksi", koska niillä on erilaisia vaikutuksia meren biogeokemiaan (40, 41) ja niitä käytetään usein havainnointi- ja mallitutkimuksissa.Tässä mallissa kukin toiminnallinen ryhmä koostuu useista erikokoisista planktoneista, joiden jänneväli on 0,6 - 2500 μm vastaava pallomainen halkaisija.
Kasviplanktonin kasvuun, laiduntamiseen ja uppoamiseen vaikuttavat parametrit liittyvät kokoon, ja kuuden kasviplanktonin funktionaalisen ryhmän välillä on erityisiä eroja (32).Erilaisista fysikaalisista kehyksistä huolimatta mallin 51 planktonkomponentin tuloksia on käytetty useissa viimeaikaisissa tutkimuksissa (42-44).
Vuodesta 1992 vuoteen 2011 fyysisen/biogeokemiallisen/ekosysteemin kytkentämalli oli voimassa 20 vuotta.Mallin tuotos sisältää planktonin biomassan, ravinnepitoisuuden ja ravinteiden saantinopeuden (DIN, PO4, Si ja Fe).Tässä tutkimuksessa näiden tuotosten 20 vuoden keskiarvoa käytettiin Ekologisen maakunnan syötteenä.Chl:a, planktonin biomassan ja ravinnepitoisuuden jakautumista sekä funktionaalisten ryhmien jakautumista verrataan satelliitti- ja in situ -havaintoihin [ks. (2, 44), huomautus S1 ja kuva.S1 - S3].
SAGE-menetelmässä pääasiallinen satunnaisuuden lähde tulee t-SNE-vaiheesta.Satunnaisuus estää toistettavuuden, mikä tarkoittaa, että tulokset ovat epäluotettavia.SAGE-menetelmä testaa tiukasti kestävyyttä määrittämällä joukon t-SNE- ja DBSCAN-parametreja, jotka voivat jatkuvasti tunnistaa klustereita toistettaessa.t-SNE-parametrin "hämmennyksen" määrittäminen voidaan ymmärtää sen määrittämisenä, missä määrin kartoituksen korkeasta matalaan ulottuvuuteen tulee kunnioittaa datan paikallisia tai globaaleja ominaisuuksia.Päästiin sekaannukseen 400 ja 300 iteraatiosta.
Klusterointialgoritmille DBSCAN on määritettävä klusterin datapisteiden vähimmäiskoko ja etäisyysmetriikka.Vähimmäismäärä määritellään asiantuntijoiden ohjauksessa.Tämä tieto tietää, mikä sopii nykyiseen numeeriseen mallinnukseen ja resoluutioon.Vähimmäisluku on 100. Korkeampaa minimiarvoa (alle <135 ennen kuin vihreän yläraja levenee) voidaan harkita, mutta se ei voi korvata BC-eräisyyteen perustuvaa aggregointimenetelmää.Yhteysastetta (kuvio 6A) käytetään ϵ-parametrin asettamiseen, mikä edistää kattavuutta (kuva 6B).Yhteydet määritellään klusterien yhdistelmämääräksi ja on herkkä ϵ-parametrille.Alhaisempi liitettävyys tarkoittaa riittämätöntä sovitusta, alueiden keinotekoista ryhmittelyä yhteen.Korkea liitettävyys osoittaa yliasennusta.Ylisovitus on myös ongelmallista, koska se osoittaa, että alustavat satunnaiset arvaukset voivat johtaa toistamattomiin tuloksiin.Näiden kahden ääripään välillä jyrkkä nousu (kutsutaan yleensä "kyynärpääksi") osoittaa parhaan ϵ:n.Kuvassa 6A näet tasangon alueen jyrkän kasvun (keltainen, > 200 klusteria), jota seuraa jyrkkä lasku (vihreä, 100 klusteria), noin 130:een, joita ympäröi hyvin vähän klustereita (sininen, <60 klusteria) ).Vähintään 100 sinisellä alueella joko yksi klusteri hallitsee koko valtamerta (ϵ <0,42), tai suurinta osaa valtamerestä ei ole luokiteltu ja sitä pidetään meluna (ϵ> 0,99).Keltaisella alueella on erittäin vaihteleva, toistamaton klusterijakauma.Kun ϵ pienenee, kohina lisääntyy.Jyrkästi kasvavaa viheraluetta kutsutaan kyynärpääksi.Tämä on optimaalinen alue.Vaikka käytetään todennäköisyyttä t-SNE, provinssin sisäistä BC-eroa voidaan silti käyttää luotettavan klusteroinnin määrittämiseen.Käytä kuvaa 6 (A ja B) ja aseta ϵ arvoon 0,39.Mitä suurempi minimiluku on, sitä pienempi on todennäköisyys saavuttaa luotettavan luokituksen mahdollistava ϵ ja sitä suurempi on viheralue, jonka arvo on suurempi kuin 135. Tämän alueen suureneminen osoittaa, että kyynärpää on vaikeampi löytää tai ei olemassa.
Kun t-SNE:n parametrit on asetettu, löydettyjen klusterien kokonaismäärää käytetään yhteyksien (A) ja klusterille allokoidun datan prosenttiosuuden mittana (B).Punainen piste ilmaisee parhaan peiton ja liitettävyyden yhdistelmän.Vähimmäismäärä asetetaan ekologiaan liittyvän vähimmäismäärän mukaan.
Tämän artikkelin lisämateriaalit ovat osoitteessa http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Tämä on avoimen pääsyn artikkeli, jota jaetaan Creative Commons Attribution License -lisenssin ehtojen mukaisesti.Artikkeli sallii rajoittamattoman käytön, levittämisen ja jäljentämisen missä tahansa välineessä edellyttäen, että alkuperäiseen teokseen viitataan asianmukaisesti.
Huomautus: Pyydämme sinua antamaan sähköpostiosoitteesi vain, jotta sivulle suosittelemasi henkilö tietää, että haluat hänen näkevän sähköpostin ja että se ei ole roskapostia.Emme tallenna sähköpostiosoitteita.
Tätä kysymystä käytetään testaamaan, oletko vierailija, ja estää automaattisen roskapostin lähettämisen.
Maailmanlaajuinen meriekologian ministeriö on päättänyt ratkaista monimutkaisia ongelmia ja käyttää valvomatonta ML:ää yhteisön rakenteiden tutkimiseen.
Maailmanlaajuinen meriekologian ministeriö on päättänyt ratkaista monimutkaisia ongelmia ja käyttää valvomatonta ML:ää yhteisön rakenteiden tutkimiseen.
Postitusaika: 12.1.2021