topimg

Ferklearjen fan ekologyske kompleksiteit: learen sûnder tafersjoch bepaalt de wrâldwide marine ekologyske provinsje

In learmetoade sûnder tafersjoch wurdt foarsteld om globale marine-ekologyske provinsjes (eko-provinsjes) te bepalen op basis fan plankton-mienskipstruktuer en fiedingsfluxgegevens.De systematyske yntegreare ekologyske provinsje (SAGE) metoade kin ekologyske provinsjes identifisearje yn tige net-lineêre ekosysteemmodellen.Om oan te passen oan 'e net-Gaussiaanske kovariânsje fan 'e gegevens, brûkt SAGE t willekeurige buor-ynbêding (t-SNE) om de dimensionaliteit te ferminderjen.Mei help fan de lûdsapplikaasje basearre op it density-based spatial clustering (DBSCAN) algoritme kinne mear as hûndert ekologyske provinsjes identifisearre wurde.Mei de ferbiningskaart mei ekologyske ferskillen as ôfstânsmaat wurdt in robúste aggregearre ekologyske provinsje (AEP) objektyf definiearre troch nêste ekologyske provinsjes.Mei help fan AEP's waard de kontrôle fan it taryf fan fiedingsfoarsjenning op 'e mienskipstruktuer ûndersocht.Eco-provinsje en AEP binne unyk en kinne helpe model ynterpretaasje.Se kinne fergelikingen tusken modellen fasilitearje en kinne it begryp en tafersjoch fan marine-ekosystemen ferbetterje.
Provinsjes binne regio's dêr't komplekse biogeografy op see of lân organisearre is yn gearhingjende en betsjuttingsfolle gebieten (1).Dizze provinsjes binne tige wichtich foar it fergelykjen en kontrastearjen fan lokaasjes, karakterisearjen fan observaasjes, monitoring en beskerming.De komplekse en net-lineêre ynteraksjes dy't dizze provinsjes produsearje, meitsje metoaden sûnder tafersjoch masinelearen (ML) tige geskikt foar it objektyf fêststellen fan provinsjes, om't de kovarânsje yn 'e gegevens kompleks en net-Gaussiaansk is.Hjir wurdt in ML-metoade foarsteld, dy't systematysk unike marine-ekologyske provinsjes (eko-provinsjes) identifisearret út it Darwin globale trijediminsjonale (3D) fysike / ekosysteemmodel (2).De term "unyk" wurdt brûkt om oan te jaan dat it identifisearre gebiet net genôch oerlapet mei oare gebieten.Dizze metoade wurdt de System Integrated Ecological Province (SAGE) metoade neamd.Om brûkbere klassifikaasje út te fieren, moat in algoritmemetoade (i) globale klassifikaasje en (ii) multi-skaalanalyse tastean dy't yn romte en tiid yn romte en tiid kinne wurde nested/aggregearre (3).Yn dit ûndersyk waard earst de SAGE-metoade foarsteld en waarden de identifisearre ekologyske provinsjes besprutsen.Eko-provinsjes kinne it begryp befoarderje fan 'e faktoaren dy't de struktuer fan' e mienskip kontrolearje, nuttige ynsjoch leverje foar tafersjochstrategyen, en helpe by it folgjen fan feroaringen yn it ekosysteem.
Terrestryske provinsjes wurde meastentiids yndield neffens oerienkomsten yn klimaat (neerslach en temperatuer), boaiem, fegetaasje en fauna, en wurde brûkt foar helpbehear, ûndersyk nei biodiversiteit en syktebestriding (1, 4).Marineprovinsjes binne dreger te definiearjen.De measte organismen binne mikroskopysk, mei floeibere grinzen.Longhurst et al.(5) Levere ien fan 'e earste wrâldwide klassifikaasjes fan it Ministearje fan Oceanography basearre op miljeuomstannichheden.De definysje fan dizze "Longhurst" provinsjes omfettet fariabelen lykas mingsnelheid, stratifikaasje en bestraling, lykas de wiidweidige ûnderfining fan Longhurst as marine-oseanograaf, dy't oare wichtige betingsten hat foar marine-ekosystemen.Longhurst is wiidweidich brûkt, bygelyks om primêre produksje en koalstoffluxen te beoardieljen, fiskerij te helpen, en yn situ observaasjeaktiviteiten te plannen (5-9).Om provinsjes objektyfer te definiearjen binne metoaden lykas fuzzy logic en regionale net-begeliede klustering/statistyk brûkt (9-14).It doel fan sokke metoaden is om sinfolle struktueren te identifisearjen dy't provinsjes identifisearje kinne yn de beskikbere observaasjegegevens.Bygelyks, dynamyske marineprovinsjes (12) brûke selsorganisearjende kaarten om lûd te ferminderjen, en brûke hiërargyske (beam-basearre) klustering om marinekleurprodukten te bepalen dy't ôflaat binne fan regionale satelliten [chlorofyl a (Chl-a), normalisearre Fluorescence line hichte en kleurde oplost organysk materiaal] en fysyk fjild (see oerflak temperatuer en salinity, absolute dynamyske topografy en see iis).
De mienskipstruktuer fan plankton is fan soarch omdat syn ekology in grutte ynfloed hat op hegere fiedingsnivo's, koalstofopname en klimaat.Dochs is it noch altyd in útdaagjend en ûngrypber doel om in globale ekologyske provinsje te bepalen op basis fan de plankton-mienskipsstruktuer.Marine kleursatelliten kinne mooglik ynsjoch jaan yn 'e grofkorrelige klassifikaasje fan fytoplankton of suggerearje de foardielen fan funksjonele groepen (15), mar se binne op it stuit net yn steat om detaillearre ynformaasje te jaan oer mienskipstruktuer.Resinte ûndersiken [bgl. Tara Ocean (16)] jouwe ungewoane mjittingen fan mienskipstruktuer;op it stuit, der binne mar sparse in-situ observaasjes op in globale skaal (17).Foarige stúdzjes hawwe foar in grut part bepaald de "Biogeochemical Provinsje" (12, 14, 18) basearre op it fêststellen fan biogemyske oerienkomsten (lykas primêre produksje, Chl en beskikber ljocht).Hjir wurdt it numerike model brûkt foar de útfier [Darwin(2)], en wurdt de ekologyske provinsje bepaald neffens de mienskipstruktuer en fiedingsflux.It numerike model dat brûkt wurdt yn dizze stúdzje hat globale dekking en kin wurde fergelike mei besteande fjildgegevens (17) en fjilden foar remote sensing (Opmerking S1).De numerike modelgegevens brûkt yn dizze stúdzje hawwe it foardiel fan globale dekking.It modelekosysteem bestiet út 35 soarten fytoplankton en 16 soarten zooplankton (ferwize asjebleaft nei materialen en metoaden).Modelplanktontypen ynteraksje net-lineêr mei net-Gaussyske kovariânsjestruktueren, sadat ienfâldige diagnostyske metoaden net geskikt binne foar it identifisearjen fan unike en konsekwinte patroanen yn opkommende mienskipstruktueren.De hjir yntrodusearre SAGE-metoade biedt in nije manier om de útfier fan komplekse Darwin-modellen te kontrolearjen.
De krêftige transformative mooglikheden fan gegevenswittenskip / ML-technology kinne oerweldig komplekse modeloplossingen ynskeakelje om komplekse, mar robúste struktueren yn gegevenskovariânsje te iepenbierjen.In robúste metoade wurdt definiearre as in metoade dy't trou kin reprodusearje de resultaten binnen in opjûne flater berik.Sels yn ienfâldige systemen kin it bepalen fan robúste patroanen en sinjalen in útdaging wêze.Oant de reden dy't liedt ta it waarnommen patroan wurdt bepaald, kin de opkommende kompleksiteit yngewikkeld / lestich lykje op te lossen.It kaaiproses foar it ynstellen fan de gearstalling fan it ekosysteem is net-lineêr fan aard.It bestean fan net-lineêre ynteraksjes kin robúste klassifikaasje betiizje, dus is it needsaaklik om metoaden te foarkommen dy't sterke oannames meitsje oer de basis statistyske ferdieling fan gegevenskovariânsje.Heechdimensjonele en net-lineêre gegevens binne gewoan yn oseanografy en kinne in kovariânsjestruktuer hawwe mei komplekse, net-Gaussyske topology.Hoewol gegevens mei in net-Gaussyske kovariânsjestruktuer robúste klassifikaasje hinderje kinne, is de SAGE-metoade nij, om't it is ûntworpen om klusters te identifisearjen mei willekeurige topologyen.
It doel fan 'e SAGE-metoade is om opkommende patroanen objektyf te identifisearjen dy't fierder ekologysk begryp kinne helpe.Nei in kluster-basearre workflow fergelykber mei (19), wurde de ekologyske en fiedingsfluxfariabelen brûkt om it ienige kluster yn 'e gegevens te bepalen, de ekologyske provinsje neamd.De SAGE-metoade foarsteld yn dizze stúdzje (figuer 1) ferminderet earst de dimensjes fan 55 nei 11 diminsjes troch de plankton-funksjonele groepen op te tellen a priori definieare (sjoch Materialen en metoaden).Mei help fan t-willekeurige buorman ynbêde (t-SNE) metoade, de grutte wurdt fierder fermindere troch projektearje de kâns yn de 3D romte.Net tafersjoch klustering kin identifisearje ekologysk tichtby gebieten [dichtheid-basearre romtlike klustering (DBSCAN) foar lûd-basearre applikaasjes].Sawol t-SNE as DBSCAN binne fan tapassing op de ynherinte net-lineêre ekosysteem numerike modelgegevens.Dan werprojektearje de resultearjende ekologyske provinsje op 'e ierde.Mear as hûndert unike ekologyske provinsjes binne identifisearre, geskikt foar regionaal ûndersyk.Om it globaal konsekwinte ekosysteemmodel te beskôgjen, wurdt de SAGE-metoade brûkt om de ekologyske provinsjes te aggregearjen yn aggregearre ekologyske provinsjes (AEP) om de effektiviteit fan de ekologyske provinsjes te ferbetterjen.It nivo fan aggregaasje (neamd "kompleksiteit") kin oanpast wurde oan it fereaske nivo fan detail.Bepale de minimale kompleksiteit fan in robúste AEP.De fokus fan 'e seleksje is de SAGE-metoade en it ferkennen fan' e lytste kompleksiteit AEP-gefallen om de kontrôle fan 'e needgemeentestruktuer te bepalen.De patroanen kinne dan analysearre wurde om ekologyske ynsjoch te jaan.De hjir yntrodusearre metoade kin ek brûkt wurde foar modelfergeliking wiidweider, bygelyks troch de lokaasjes fan ferlykbere ekologyske provinsjes te evaluearjen dy't yn ferskate modellen fûn wurde om ferskillen en oerienkomsten te markearjen, om modellen te fergelykjen.
(A) Skematysk diagram fan de wurkwize foar it bepalen fan de ekologyske provinsje;mei help fan de som yn 'e funksjonele groep te ferminderjen de oarspronklike 55-diminsjonale gegevens ta in 11-dimensionale model útfier, ynklusyf de biomassa fan sân funksjonele / fiedingsstoffen plankton en fjouwer fiedingsstoffen oanbod tariven.Negligible wearde en duorsum iis cover gebiet.De gegevens binne standerdisearre en standerdisearre.Jou 11-diminsjonale gegevens oan it t-SNE-algoritme om statistysk ferlykbere funksjekombinaasjes te markearjen.DBSCAN sil it kluster foarsichtich selektearje om de parameterwearde yn te stellen.As lêste projektearje de gegevens werom nei de breedte-/lengte-projeksje.Tink derom dat dit proses 10 kear wurdt werhelle, om't in lichte willekeurigens kin wurde generearre troch it tapassen fan t-SNE.(B) ferklearret hoe't jo de AEP krije troch de workflow yn (A) 10 kear te werheljen.Foar elk fan dizze 10 ymplemintaasjes waard de ynterprovinsjale Bray-Curtis (BC) dissimilarity matrix bepaald op basis fan de biomassa fan 51 fytoplanktontypen.Bepale it BC-ferskil tusken provinsjes, fan kompleksiteit 1 AEP oant folsleine kompleksiteit 115. De BC-benchmark wurdt ynsteld troch Longhurst Province.
De SAGE-metoade brûkt de útfier fan it globale 3D fysike / ekosysteem numerike model om de ekologyske provinsje te definiearjen [Darwin (2);sjoch Materialen en Metoaden en Notysje S1].De komponinten fan it ekosysteem binne gearstald út 35 soarten fytoplankton en 16 soarten zooplankton, mei sân foarôf definieare funksjonele groepen: prokaryoten en eukaryoten oanpast oan omjouwings mei leech fiedingsstoffen, coccidia mei in kalsiumkarbonaatcoating, en swiere stikstoffixaasje Nitrogen fiedingsstoffen ûntbrekke (meastal ûntbrekke). wichtige fiedingsstoffen), mei siliceous dekking, kin meitsje oare plankton fotosynteze en weidzjen mingde fiedingsstoffen flagellates en zooplankton herders.De grutte span is 0,6 oant 2500μm lykweardige sfearyske diameter.De modelferdieling fan fytoplanktongrutte en funksjonele groepearring fange de algemiene skaaimerken dy't sjoen wurde yn satellyt- en in-situ-observaasjes (sjoch figueren S1 oant S3).De oerienkomst tusken it numerike model en de waarnommen oseaan jout oan dat provinsjes definieare troch it model fan tapassing wêze kinne op 'e in-situ oseaan.Tink derom dat dit model allinich beskate ferskaat fan fytoplankton fanget, en allinich bepaalde fysike en gemyske forcingbereiken fan 'e in situ oseaan.De SAGE-metoade kin minsken ynskeakelje om it tige regionale kontrôlemeganisme fan 'e modelmienskipstruktuer better te begripen.
Troch allinich de som fan oerflakbiomassa (mei in gemiddelde tiid fan 20 jier) yn elke funksjonele planktongroep op te nimmen, kin de dimensje fan 'e gegevens fermindere wurde.Nei't eardere stúdzjes har wichtige rol toand hawwe yn it ynstellen fan 'e mienskipstruktuer, omfette it ek oerflakboarnetermen foar fiedingsfluxen (oanbod fan stikstof, izer, fosfaat en silisiumsûr) [bgl. (20, 21)].De gearfetting fan funksjonele groepen ferminderet it probleem fan 55 (51 plankton en 4 fiedingsfluxen) nei 11 diminsjes.Yn dizze earste stúdzje, fanwege de berekkeningsbeperkingen oplein troch it algoritme, waarden djipte en tiidfariabiliteit net beskôge.
De SAGE-metoade is yn steat om wichtige relaasjes te identifisearjen tusken net-lineêre prosessen en wichtige skaaimerken fan ynteraksjes tusken funksjonele groepbiomassa en fiedingsflux.It brûken fan 11-diminsjonale gegevens basearre op Euklidyske metoaden foar ôfstânûnderwiis (lykas K-means) kinne gjin betroubere en reprodusearjende provinsjes krije (19, 22).Dit komt om't gjin Gaussiaanske foarm fûn wurdt yn 'e basisferdieling fan' e kovariânsje fan 'e kaaieleminten dy't de ekologyske provinsje bepale.De K-middels fan Voronoi-sellen (rjochte linen) kinne de net-Gaussyske basisferdieling net behâlde.
De biomassa fan sân plankton-funksjonele groepen en fjouwer fiedingsfluxen foarmje in 11-diminsjonale fektor x.Dêrom is x in vector fjild op it model raster, dêr't elk elemint xi stiet foar in 11-dimensionale vector definiearre op it model horizontale raster.Elke yndeks i identifisearret unyk in rasterpunt op 'e bol, wêrby't (lon, lat) = (ϕi, θi).As de biomassa fan 'e modelraster-ienheid minder is as 1.2 × 10-3mg Chl / m3 of it iisdekkingsnivo grutter is as 70%, wurdt it log fan biomassagegevens brûkt en wegere.De gegevens binne normalisearre en standerdisearre, sadat alle gegevens binne yn it berik fan [0 oant 1], it gemiddelde wurdt fuorthelle en skalearre nei ienheid fariânsje.Dit wurdt dien sadat de funksjes (biomassa en fiedingsflux) net beheind wurde troch it kontrast yn it berik fan mooglike wearden.Clustering moat de feroaringsrelaasje fange fan 'e kaai kâns ôfstân tusken de funksjes ynstee fan de geografyske ôfstân.Troch dizze ôfstannen te kwantifisearjen, komme wichtige funksjes nei foaren, wylst ûnnedige details wurde wegere.Ut ekologysk eachpunt is dat nedich om't guon soarten fytoplankton mei in bytsje biomassa gruttere biogeochemyske effekten hawwe kinne, lykas stikstoffixaasje troch diazotropyske baktearjes.By it standerdisearjen en normalisearjen fan gegevens, sille dizze soarten kovariaten wurde markearre.
Troch de neite fan funksjes yn heechdimensjonale romte yn leechdimensjonale foarstelling te beklamjen, wurdt it t-SNE-algoritme brûkt om besteande ferlykbere regio's dúdliker te meitsjen.Foarige wurk rjochte op it bouwen fan djippe neurale netwurken foar applikaasjes foar remote sensing brûkte t-SNE, dy't syn feardigens bewiisde yn it skieden fan wichtige funksjes (23).Dit is in needsaaklike stap om robúste klustering yn 'e funksjegegevens te identifisearjen, wylst net-konvergente oplossingen foarkomme (notysje S2).Mei help fan Gaussiaanske kernels behâldt t-SNE de statistyske eigenskippen fan 'e gegevens troch elk heechdimensjonaal objekt yn kaart te bringen nei in punt yn' e 3D-fazeromte, en soarget derfoar dat de kâns op ferlykbere objekten yn 'e hege en lege rjochtingen heech is yn in hege- dimensionale romte (24).Sjoen in set fan N heechdiminsjonale objekten x1, ..., xN, fermindert it t-SNE-algoritme troch it minimalisearjen fan de Kullback-Leibler (KL) diverginsje (25).KL divergence is in maatregel fan hoe oars in kâns distribúsje is fan in twadde referinsje kâns distribúsje, en kin effektyf evaluearje de mooglikheid fan korrelaasje tusken lege-dimensionale foarstellings fan hege-dimensionale funksjes.As xi it i-de objekt yn N-diminsjonale romte is, is xj it j-de objekt yn N-diminsjonale romte, yi is it i-de objekt yn leechdimensjonale romte, en yj is it j-de objekt yn leech -diminsjonale romte, dan definiearret t -SNE de oerienkomstskâns ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), en foar de diminsjereduksje set q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Figuer 2A yllustrearret it effekt fan it ferminderjen fan de biomassa- en fiedingsfluxvektoren fan 'e 11-diminsjonale kombinaasje nei 3D.De motivaasje fan it tapassen fan t-SNE kin wurde fergelike mei de motivaasje fan haadkomponintanalyse (PCA), dy't it fariânsje-attribút brûkt om it gebiet / attribút fan 'e gegevens te beklamjen, en dêrmei de dimensjeeliteit te ferminderjen.De t-SNE-metoade waard fûn dat it superieur wie foar PCA yn it leverjen fan betroubere en reprodusearjende resultaten foar it Eco-Ministearje (sjoch Notysje S2).Dit kin wêze om't de ortogonaliteitsoanname fan PCA net geskikt is foar it identifisearjen fan krityske ynteraksjes tusken tige net-lineêre ynteraktive funksjes, om't PCA him rjochtet op lineêre kovariânsjestruktueren (26).Mei help fan remote sensing data, Lunga et al.(27) yllustrearret hoe't jo de SNE-metoade brûke om komplekse en net-lineêre spektrale funksjes te markearjen dy't ôfwike fan 'e Gaussyske ferdieling.
(A) In modelearre fiedingsoanbod taryf, fytoplankton en soöplankton funksjonele groep biomassa tekene troch de t-SNE algoritme en kleurd troch provinsje mei help fan DBSCAN.Elts punt stiet foar in punt yn 'e hoydimensionale romte, lykas werjûn yn figuer 6B, de measte punten wurde fongen.Shafts ferwize nei "t-SNE" grutte 1, 2 en 3. (B) De geografyske projeksje fan 'e provinsje fûn troch DBSCAN op' e breedtegraad-lengtegraad roaster fan 'e oarsprong.De kleur moat wurde beskôge as elke kleur, mar moat oerienkomme mei (A).
De punten yn it t-SNE scatter plot yn figuer 2A wurde respektivelik ferbûn mei breedtegraad en lingtegraad.As de twa punten yn figuer 2A ticht by elkoar binne, is it om't har biomassa en fiedingsfluxen ferlykber binne, net fanwege geografyske tichtby.De kleuren yn figuer 2A binne klusters ûntdutsen mei de DBSCAN-metoade (28).By it sykjen nei dichte waarnimmings brûkt it DBSCAN-algoritme de ôfstân yn 'e 3D-representaasje tusken de punten (ϵ = 0,39; foar ynformaasje oer dizze kar, sjoch Materialen en metoaden), en it oantal ferlykbere punten is nedich om it kluster te definiearjen (hjir) 100 punten, sjoch hjirboppe).De DBSCAN-metoade makket gjin oannames oer de foarm of it oantal klusters yn 'e gegevens, lykas hjirûnder werjûn:
3) Foar alle punten identifisearre as binnen de ôfstân binnen, werhelje stap 2 iteratyf foar it bepalen fan de klustergrins.As it oantal punten grutter is as de ynstelde minimumwearde, wurdt it oanwiisd as in kluster.
Gegevens dy't net foldogge oan de minimale kluster lid en ôfstân ϵ metric wurdt beskôge as "lûd" en wurdt net tawiisd in kleur.DBSCAN is in fluch en skalberber algoritme mei O(n2) prestaasjes yn it slimste gefal.Foar de hjoeddeiske analyze is it net eins willekeurich.It minimum oantal punten wurdt bepaald troch saakkundige evaluaasje.Nei it oanpassen fan de ôfstân na, it resultaat is net stabyl genôch yn it berik fan ≈± 10.Dizze ôfstân wurdt ynsteld mei help fan ferbining (figuer 6A) en oseaan dekking persintaazje (figuer 6B).Konnektivität wurdt definiearre as it gearstalde oantal klusters en is gefoelich foar de parameter ϵ.Legere ferbining jout oan net genôch oanpassing, keunstmjittich groepearje regio's byinoar.Hege ferbining jout oerfitting oan.It is oannimlik om in hegere minimum te brûken, mar as it minimum mear dan ca is, is it ûnmooglik om in betroubere oplossing te berikken.135 (Foar mear details, sjoch Materialen en metoaden).
De 115 klusters identifisearre yn figuer 2A wurde projekteare werom op 'e ierde yn figuer 2B.Elke kleur komt oerien mei in gearhingjende kombinaasje fan biogeochemical en ekologyske faktoaren identifisearre troch DBSCAN.Sadree't de klusters binne bepaald, wurdt de assosjaasje fan elk punt yn figuer 2A mei in spesifike breedte- en lingtegraad brûkt om de klusters werom te projektearjen nei it geografyske gebiet.Figure 2B yllustrearret dit mei deselde kluster kleuren as Figure 2A.Fergelykbere kleuren moatte net ynterpretearre wurde as ekologyske oerienkomst, om't se wurde tawiisd troch de folchoarder wêryn't klusters ûntdutsen wurde troch it algoritme.
It gebiet yn figuer 2B kin kwalitatyf gelyk wêze oan in fêststeld gebiet yn 'e fysike en / of biogeochemy fan' e oseaan.Bygelyks, de klusters yn 'e Súdlike Oseaan binne sônesymmetrysk, wêrby't oligotropyske draaikolken ferskine, en de skerpe oergong jout de ynfloed fan passaatwynen oan.Bygelyks, yn 'e ekwatoriaal Stille Oseaan, wurde ferskate regio's sjoen yn ferbân mei de opkomst.
Om de ekologyske omjouwing fan 'e Ekoprovinsje te begripen, waard in fariaasje fan' e Bray-Curtis (BC) ferskil yndeks (29) brûkt om de ekology yn it kluster te evaluearjen.De BC-yndikator is in statistyske gegevens dy't brûkt wurde om it ferskil yn mienskipstruktuer tusken twa ferskillende siden te kwantifisearjen.De BC-mjitting is fan tapassing op de biomassa fan 51 soarten fytoplankton en zoöplankton BCninj = 1-2CninjSni + Snj
BCninj ferwiist nei de oerienkomst tusken kombinaasje ni en kombinaasje nj, dêr't Cninj is de minimale wearde fan in inkele soarte fan biomassa dat bestiet yn beide kombinaasjes ni en nj, en Sni stiet foar de som fan alle biomassen dy't bestean yn beide kombinaasjes ni en Snj.It BC-ferskil is fergelykber mei de ôfstânsmaat, mar wurket yn net-Euklidyske romte, dy't wierskynlik mear geskikt is foar ekologyske gegevens en har ynterpretaasje.
Foar elke kluster identifisearre yn figuer 2B, kin de oerienkomst fan intra-provinsjale en ynter-provinsjale BC wurde beoardiele.It BC-ferskil binnen in provinsje ferwiist nei it ferskil tusken de gemiddelde wearde fan de provinsje en elk punt yn de provinsje.It ferskil tusken BC-provinsjes ferwiist nei de oerienkomst tusken ien provinsje en oare provinsjes.Figure 3A lit in symmetryske BC-matrix sjen (0, swart: folslein oerienkommende; 1, wyt: folslein ûngelyk).Elke line yn 'e grafyk toant in patroan yn' e gegevens.Figuer 3B lit de geografyske betsjutting sjen fan de resultaten fan BC yn Figuer 3A foar elke provinsje.Foar in provinsje yn in gebiet mei leech fieding en leech fieding, lit figuer 3B sjen dat de symmetry fan grutte gebieten om de evener en de Yndyske Oseaan yn prinsipe ferlykber is, mar de hegere breedtegraden en opwellingsgebieten ferskille signifikant.
(A) De graad fan BC ferskil evaluearre foar elke provinsje basearre op de globale 20-jierrige gemiddelde globale oerflak gemiddelde fan 51 plankton.Notysje de ferwachte symmetry fan 'e wearden.(B) De romtlike projeksje fan in kolom (of rige).Foar in provinsje yn in dystrofyske sirkel waard de globale ferdieling fan 'e BC-likensmaat evaluearre, en it globale 20-jier gemiddelde waard evaluearre.Swart (BC = 0) betsjut itselde gebiet, en wyt (BC = 1) betsjut gjin oerienkomst.
Figure 4A yllustrearret it ferskil yn BC binnen elke provinsje yn Figure 2B.Bepaald troch it brûken fan de gemiddelde kombinaasje fan it trochsneed gebiet yn in kluster, en it bepalen fan de ûngelikens tusken de BC en it gemiddelde fan elk rasterpunt yn de provinsje, docht bliken dat de SAGE-metoade goed 51 soarten skiede kin op basis fan de ekologyske oerienkomst Type fan model data.De algemiene gemiddelde kluster BC-ûngelikens fan alle 51 soarten is 0,102±0,0049.
(A, B, en D) It BC-ferskil binnen de provinsje wurdt evaluearre as it gemiddelde BC-ferskil tusken elke rasterpuntmienskip en de gemiddelde provinsje, en de kompleksiteit wurdt net fermindere.(2) De wrâldwide gemiddelde intra-provinsjale BC ferskil is 0.227±0.117.Dit is de benchmark fan ekologyske motivaasje-basearre klassifikaasje foarsteld troch dit wurk [griene line yn (C)].(C) Gemiddelde intra-provinsjale BC ferskil: De swarte line stiet foar de intra-provinsjale BC ferskil mei tanimmende kompleksiteit.2σ komt út 10 werhellingen fan it proses foar identifikaasje fan 'e eko-provinsje.Foar de totale kompleksiteit fan 'e provinsjes ûntdutsen troch DBSCAN, lit (A) sjen dat de BC-ûngelikens yn' e provinsje 0,099 is, en de kompleksiteitsklassifikaasje foarsteld troch (C) is 12, wat resulteart yn in BC-ûngelikens fan 0,200 yn 'e provinsje.lykas de foto toant.(D).
Yn figuer 4B wurdt de biomassa fan 51 planktontypen brûkt om it lykweardige BC-ferskil yn Longhurst-provinsje foar te stellen.It totale gemiddelde fan elke provinsje is 0,227, en de standertdeviaasje fan 'e rasterpunten mei ferwizing nei it ferskil yn BC-provinsje is 0,046.Dit is grutter dan it kluster identifisearre yn figuer 1B.Ynstee, mei help fan de som fan 'e sân funksjonele groepen, de gemiddelde intra-season BC dissimilarity yn Longhurst tanommen nei 0.232.
De wrâldwide kaart fan 'e eko-provinsje jout yngewikkelde details fan unike ekologyske ynteraksjes en ferbetteringen binne makke yn it brûken fan' e heule ekosysteemstruktuer fan 'e provinsje Longhurst.It ministearje fan Ekology wurdt ferwachte om ynsjoch te jaan yn it proses fan it kontrolearjen fan it numerike modelekosysteem, en dit ynsjoch sil helpe by de ferkenning fan fjildwurk.Foar it doel fan dit ûndersyk is it net mooglik mear as hûndert provinsjes folslein wer te jaan.De folgjende paragraaf yntrodusearret de SAGE-metoade dy't de provinsjes gearfettet.
Ien fan de doelen fan de provinsje is it befoarderjen fan it begryp fan de lokaasje en it behear fan de provinsje.Om needsituaasjes te bepalen yllustrearret de metoade yn figuer 1B it nêstjen fan ekologysk ferlykbere provinsjes.Eko-provinsjes wurde groepearre op basis fan ekologyske oerienkomst, en sa'n groepearring fan provinsjes hjit AEP.Stel in ferstelbere "kompleksiteit" yn op basis fan it totale oantal te beskôgjen provinsjes.De term "kompleksiteit" wurdt brûkt om't it mooglik makket it nivo fan needattributen oan te passen.Om betsjuttingsfolle aggregations te definiearjen, wurdt it gemiddelde intra-provinsjale BC-ferskil fan 0.227 fan Longhurst brûkt as benchmark.Under dizze benchmark wurde de gearstalde provinsjes net mear nuttich beskôge.
Lykas werjûn yn figuer 3B, binne de globale ekologyske provinsjes gearhingjend.Mei help fan inter-provinsjale BC ferskillen, kin sjoen wurde dat guon konfiguraasjes binne hiel "gewoan".Ynspirearre troch genetyske en grafyske teorymetoaden wurde "ferbûne grafiken" brûkt om >100 provinsjes te sortearjen op basis fan de provinsjes dy't it meast lykje op har.De metryske "ferbining" hjir wurdt bepaald mei ynterprovinsjale BC-ûngelikens (30).It tal provinsjes mei in gruttere romte foar yndieling fan > 100 provinsjes kin hjiryn oantsjut wurde as kompleksiteit.AEP is in produkt dat mear as 100 provinsjes kategorisearret as de meast dominante / tichtst ekologyske provinsjes.Elke ekologyske provinsje wurdt tawiisd oan de dominante/heech ferbûne ekologyske provinsje dy't it meast op har liket.Dizze aggregaasje bepaald troch it BC-ferskil lit in nestele oanpak fan 'e wrâldwide ekology mooglik meitsje.
De selektearre kompleksiteit kin elke wearde wêze fan 1 oant de folsleine kompleksiteit fan FIG.2A.By legere kompleksiteit kin AEP degenerearje fanwege de probabilistyske dimensjereduksjestap (t-SNE).Degeneraasje betsjut dat ekologyske provinsjes kinne wurde tawiisd oan ferskate AEP's tusken iteraasjes, wêrtroch it geografyske gebiet feroaret.Figuer 4C yllustrearret de fersprieding fan BC-ûngelikens binnen provinsjes yn AEP's fan tanimmende kompleksiteit oer 10 ymplemintaasjes (yllustraasje yn figuer 1B).Yn figuer 4C is 2σ (blau gebiet) in maatregel fan degradaasje yn 10 ymplemintaasjes, en de griene line stiet foar de Longhurst-benchmark.Feiten hawwe bewiisd dat de kompleksiteit fan 12 kin hâlden it BC ferskil yn 'e provinsje ûnder de Longhurst benchmark yn alle ymplemintaasjes en behâlde in relatyf lytse 2σ degradaasje.Gearfetsjend is de minimale oanbefellende kompleksiteit 12 AEP's, en it gemiddelde intra-provinsje BC-ferskil evaluearre mei 51 planktontypen is 0,198 ± 0,013, lykas werjûn yn figuer 4D.Mei de som fan sân planktonfunksjonele groepen is it gemiddelde BC-ferskil binnen de provinsje 2σ ynstee fan 0,198±0,004.De fergeliking tusken de BC-ferskillen berekkene mei de totale biomassa fan 'e sân funksjonele groepen of de biomassa fan alle 51 planktontypen lit sjen dat hoewol de SAGE-metoade fan tapassing is op 'e 51-dimensionale situaasje, it is foar de totale biomassa fan 'e sân funksjonele groepen Foar training.
Ofhinklik fan it doel fan elk ûndersyk, kinne ferskate nivo's fan kompleksiteit wurde beskôge.Regionale stúdzjes kinne folsleine kompleksiteit fereaskje (dus alle 115 provinsjes).As foarbyld en foar dúdlikens, beskôgje de minimale oanbefellende kompleksiteit fan 12.
As foarbyld fan it nut fan 'e SAGE-metoade, wurde 12 AEP's mei in minimale kompleksiteit fan 12 hjir brûkt om de kontrôle fan' e needmienskipstruktuer te ferkennen.Figure 5 yllustrearret de ekologyske ynsjoggen groepearre troch AEP (fan A oant L): Yn Redfield stoichiometrie, geografyske omfang (figuer 5C), funksjonele groep biomassa gearstalling (figuer 5A) en fiedingsstoffen oanbod (figuer 5B) wurde útfierd troch N Zoomed.De ferhâlding (N:Si:P:Fe, 1:1:16:16×103) wurdt werjûn.Foar it lêste paniel is P fermannichfâldige mei 16 en Fe fermannichfâldige mei 16 × 103, sadat de bargrafyk lykweardich is oan de fiedingseasken fan fytoplankton.
De provinsjes binne yndield yn 12 AEPs A oant L. (A) Biomassa (mgC/m3) fan ekosystemen yn 12 provinsjes.(B) De fiedingsfluxrate fan oploste anorganyske stikstof (N), izer (Fe), fosfaat (P) en siliciumsûr (Si) (mmol/m3 per jier).Fe en P wurde fermannichfâldige mei respektivelik 16 en 16×103, sadat de strips wurde standerdisearre oan phytoplankton stoichiometrie easken.(C) Notysje it ferskil tusken poalregio's, subtropyske siklonen en grutte seizoens- / opkommende regio's.De tafersjochstasjons binne markearre as folget: 1, SEATS;2, ALOHA;3, stasjon P;en 4, BTS.
De identifisearre AEP is unyk.Der is wat symmetry om de evener yn 'e Atlantyske en Stille Oseaan, en in ferlykber mar fergrutte gebiet bestiet yn 'e Yndyske Oseaan.Guon AEP's omearmje de westlike kant fan it kontinint ferbûn mei de opstân.De Súdpoal Circumpolar Stream wurdt beskôge as in grutte sône funksje.Subtropyske sikloan is in komplekse rige fan oligotrophic AEP.Yn dizze provinsjes is it bekende patroan fan biomassa ferskillen tusken plankton-dominearre oligotrophic draaikolken en diatomeeënrike poalregio's dúdlik.
AEP's mei heul ferlykbere totale fytoplanktonbiomassa kinne heul ferskillende mienskipstruktueren hawwe en ferskate geografyske gebieten dekke, lykas D, H, en K, dy't ferlykbere totale fytoplanktonbiomassa hawwe.AEP H bestiet benammen yn 'e ekwatoriaal Yndyske Oseaan, en der binne mear diazotrophic baktearjes.AEP D wurdt fûn yn ferskate bassins, mar it is benammen prominint yn 'e Stille Oseaan om gebieten mei hege opbringst om' e ekwatoriale opwelling hinne.De foarm fan dizze provinsje yn 'e Stille Oseaan docht tinken oan in planetêre golftrein.D'r binne in pear diazobaktearjes yn AEP D, en mear kegels.Yn ferliking mei de oare twa provinsjes wurdt AEP K allinnich fûn yn 'e heechlannen fan 'e Noardlike Iissee, en binne d'r mear diatomeeën en minder planktons.It is de muoite wurdich opskriuwen dat it bedrach fan plankton yn dizze trije regio is ek hiel oars.Under harren is de plankton-oerfloed fan AEP K relatyf leech, wylst dy fan AEP D en H relatyf heech is.Dêrom, nettsjinsteande harren biomassa (en dus fergelykber mei Chl-a), dizze provinsjes binne hiel oars: Chl-basearre provinsje testen meie net fange dizze ferskillen.
It is ek fanselssprekkend dat guon AEP's mei heul ferskillende biomassa ferlykber wêze kinne yn termen fan fytoplankton-mienskipsstruktuer.Dit is bygelyks sichtber yn AEP D en E. Se lizze tichtby elkoar, en yn 'e Stille Oseaan is AEP E tichtby de tige produktive AEPJ.Likemin is d'r gjin dúdlike ferbining tusken fytoplanktonbiomassa en soöplankton oerfloed.
AEP kin wurde begrepen yn termen fan 'e fiedingsstoffen dy't har oanbean wurde (figuer 5B).Diatomeeën besteane allinich wêr't genôch oanbod fan silisiumsoer is.Algemien, hoe heger it oanbod fan siliciumsûr, hoe heger de biomassa fan diatomeeën.Diatomeeën kinne sjoen wurde yn AEP A, J, K en L. De ferhâlding fan diatomee biomassa relatyf oan oare fytoplankton wurdt bepaald troch de N, P en Fe foarsjoen relatyf oan de diatomeefraach.Bygelyks, AEP L wurdt dominearre troch diatomeeën.Yn ferliking mei oare fiedingsstoffen hat Si it heechste oanbod.Yn tsjinstelling, nettsjinsteande hegere produktiviteit, AEP J hat minder diatomeeën en minder silisium oanbod (alles en relatyf oan oare fiedingsstoffen).
Diazonium-baktearjes hawwe de mooglikheid om stikstof te fixearjen, mar groeie stadichoan (31).Se bestean tegearre mei oare fytoplankton, wêr't izer en fosfor oermjittich binne yn ferliking mei de fraach nei net-diazonium fiedingsstoffen (20, 21).It is de muoite wurdich opskriuwen dat de diazotrophic biomassa is relatyf heech, en it oanbod fan Fe en P is relatyf grut relatyf oan it oanbod fan N. Op dizze wize, hoewol't de totale biomassa yn AEP J is heger, de diazonium biomassa yn AEP H is grutter as dat yn J. Tink derom dat AEP J en H binne geografysk hiel oars, en H leit yn 'e ekwatoriaal Yndyske Oseaan.
As de unike struktuer fan it ekosysteem net yn provinsjes ferdield is, sille de ynsjoggen fan 'e 12 AEP's leechste kompleksiteitsmodellen net sa dúdlik wêze.De AEP generearre troch SAGE fasilitearret de gearhingjende en simultane fergeliking fan komplekse en heechdimensjonale ynformaasje fan ekosysteemmodellen.AEP beklammet effektyf wêrom't Chl gjin goede en alternative metoade is om mienskipstruktuer of soöplankton-oerfloed te bepalen op hegere fiedingsnivo's.In detaillearre analyze fan oanhâldende ûndersyksûnderwerpen is bûten it berik fan dit artikel.De SAGE-metoade biedt in manier om oare meganismen yn it model te ferkennen dy't makliker te behanneljen is dan punt-to-punt besjen.
De SAGE-metoade wurdt foarsteld om te helpen ekstreem komplekse ekologyske gegevens te ferdúdlikjen fan globale fysike / biogeochemical / ekosysteem numerike modellen.De ekologyske provinsje wurdt bepaald troch de totale biomassa fan cross-plankton funksjonele groepen, de tapassing fan t-SNE kâns dimensionality reduksje algoritme en de klustering mei help fan de net tafersjoch ML metoade DBSCAN.De ynterprovinsjale BC-ferskil/grafykteory foar nêstmetoade wurdt tapast om in robúste AEP ôf te lieden dy't brûkt wurde kin foar globale ynterpretaasje.Wat de bou oanbelanget, binne de Eco-Provincie en AEP unyk.De AEP-nêst kin oanpast wurde tusken de folsleine kompleksiteit fan 'e oarspronklike ekologyske provinsje en de oanrikkemandearre minimumdrompel fan 12 AEP's.Nestjen en it bepalen fan de minimale kompleksiteit fan AEP wurde beskôge as wichtige stappen, om't de kâns dat t-SNE AEP's fan <12 kompleksiteit degenerearret.De SAGE-metoade is wrâldwiid, en syn kompleksiteit farieart fan> 100 AEP's oant 12. Foar ienfâld is de hjoeddeiske fokus op 'e kompleksiteit fan 12 globale AEP's.Takomstich ûndersyk, benammen regionale stúdzjes, kin in lytsere romtlike subset fan 'e wrâldwide eko-provinsjes nuttich fine, en kin wurde aggregearre yn in lytser gebiet om te profitearjen fan deselde ekologyske ynsjoch dy't hjir besprutsen wurde.It jout suggestjes oer hoe't dizze ekologyske provinsjes en de ynsichten dy't dêrút krigen wurde kinne brûkt wurde foar fierder ekologysk begryp, it fasilitearjen fan modelfergeliking en mooglik it tafersjoch fan marine-ekosystemen ferbetterje.
De ekologyske provinsje en AEP identifisearre troch de SAGE-metoade binne basearre op de gegevens yn it numerike model.By definysje is it numerike model in ferienfâldige struktuer, besykje de essinsje fan it doelsysteem te fangen, en ferskate modellen sille ferskate planktonferdieling hawwe.It numerike model dat yn dizze stúdzje brûkt wurdt, kin guon fan 'e waarnommen patroanen net folslein fange (bygelyks yn' e Chl-skattingen foar de ekwatoriale regio en de Súdlike Oseaan).Allinnich in lyts part fan it ferskaat yn 'e echte oseaan wurdt finzen nommen, en de meso en sub-mesoscales kinne net oplost wurde, wat kin beynfloedzje fiedingsstoffen flux en lytserskalige mienskip struktuer.Nettsjinsteande dizze tekoarten docht bliken dat AEP tige nuttich is om te helpen komplekse modellen te begripen.Troch te evaluearjen wêr't ferlykbere ekologyske provinsjes wurde fûn, biedt AEP in potinsjele ark foar fergeliking fan numerike modellen.It hjoeddeiske numerike model vangt it algemiene patroan fan op ôfstân sensing fytoplankton Chl-a konsintraasje en de ferdieling fan plankton grutte en funksjonele groep (Opmerking S1 en figuer S1) (2, 32).
Lykas werjûn troch de 0,1 mgChl-a/m-3 kontoerline, is AEP ferdield yn oligotrofysk gebiet en mesotrofysk gebiet (figuer S1B): AEP B, C, D, E, F en G binne oligotropyske gebieten, en de oerbleaune gebieten binne leit Heger Chl-a.AEP toant wat korrespondinsje mei Longhurst Province (figuer S3A), Bygelyks, de Súdlike Oseaan en de ekwatoriaal Stille Oseaan.Yn guon regio's beslacht AEP meardere Longhurst-regio's, en oarsom.Om't de bedoeling om provinsjes yn dit gebiet en Longhurst ôf te skieden oars is, wurdt ferwachte dat der ferskillen komme.Meardere AEP's yn in Longhurst-provinsje jouwe oan dat bepaalde gebieten mei ferlykbere biogeochemy hiel ferskillende ekosysteemstruktueren hawwe kinne.AEP toant in beskate korrespondinsje mei fysike steaten, lykas bliken dien mei help fan learen sûnder tafersjoch (19), lykas yn hege opkommende steaten (bygelyks de Súdlike Oseaan en de ekwatoriale Stille Oseaan; figuer S3, C en D).Dizze korrespondinsjes jouwe oan dat de mienskipstruktuer fan plankton sterk beynfloede wurdt troch oseaandynamyk.Yn gebieten lykas de Noard-Atlantyske Oseaan trochkrúst AEP fysike provinsjes.It meganisme dat dizze ferskillen feroarsake kin prosessen omfetsje lykas stoftransport, wat kin liede ta folslein oare fiedingsprogramma's sels ûnder ferlykbere fysike omstannichheden.
It ministearje fan Ekology en AEP wiisde derop dat it brûken fan Chl allinich ekologyske komponinten net identifisearje kin, lykas de marine-ekologymienskip al realisearre hat.Dit wurdt sjoen yn AEP's mei ferlykbere biomassa, mar signifikant ferskillende ekologyske gearstalling (lykas D en E).Yn tsjinstelling, AEP's lykas D en K hawwe hiel ferskillende biomassa mar ferlykbere ekologyske gearstalling.AEP beklammet dat de relaasje tusken biomassa, ekologyske gearstalling en oerfloed fan zooplankton kompleks is.Bygelyks, hoewol AEP J opfalt yn termen fan fytoplankton en plankton biomassa, AEP's A en L hawwe ferlykbere plankton biomassa, mar A hat in hegere plankton oerfloed.AEP beklammet dat fytoplanktonbiomassa (of Chl) net brûkt wurde kin om zooplanktonbiomassa te foarsizzen.Zooplankton is de stifting fan 'e fiedselketen foar fiskerij, en krekter skattingen kinne liede ta better boarnebehear.Takomstige marinekleursatelliten [bygelyks PACE (plankton, aerosol, wolk, en marine-ekosysteem)] kinne better gepositioneerd wurde om de mienskipstruktuer fan fytoplankton te skatten.It brûken fan AEP-foarsizzing kin de skatting fan zoöplankton út 'e romte mooglik fasilitearje.Metoaden lykas SAGE, keppele oan nije technologyen, en mear en mear fjildgegevens beskikber foar grûnwierheidsûndersiken (lykas Tara en ferfolchûndersyk), kinne tegearre in stap nimme nei satellyt-basearre sûnensmonitoring fan ekosysteem.
De SAGE-metoade biedt in handige manier om guon meganismen te evaluearjen dy't de skaaimerken fan 'e provinsje kontrolearje, lykas biomassa / Chl, netto primêre produksje, en mienskipstruktuer.Bygelyks, it relatyf bedrach fan diatomeeën wurdt ynsteld troch in ûnbalâns yn it oanbod fan Si, N, P, en Fe relatyf oan de phytoplankton stoichiometryske easken.By in lykwichtige oanbod taryf, de mienskip wurdt dominearre troch diatomeeën (L).Wannear't it oanbod taryf is unbalanced (dat is, it oanbod fan silisium is leger as de fiedingsstoffen fraach fan diatomeeën), diatomeeën foar mar in lyts part Share (K).As it oanbod fan Fe en P grutter is as it oanbod fan N (bygelyks E en H), sille de diazotropyske baktearjes krêftich groeie.Troch de kontekst levere troch AEP sil de ferkenning fan kontrôlemeganismen brûkber wurde.
De Eco-Provincie en AEP binne gebieten mei ferlykbere mienskip struktueren.De tiidsearje fan in bepaalde lokaasje binnen in ekologyske provinsje of AEP kin beskôge wurde as in referinsjepunt en kin it gebiet fertsjintwurdigje dat de ekologyske provinsje of AEP beslacht.Lange-termyn monitoaringsstasjons op it terrein jouwe sokke tiidsearjes.In-situ-gegevenssets op lange termyn sille in ûnberekkenbere rol bliuwe.Fanút it perspektyf fan tafersjoch op mienskipstruktuer, kin de SAGE-metoade wurde sjoen as in manier om te helpen de nuttichste lokaasje fan nije siden te bepalen.Bygelyks, de tiidrige fan 'e lange termyn oligotropyske habitatbeoardieling (ALOHA) is yn' e AEP B fan it oligotropyske gebiet (figuer 5C, label 2).Om't ALOHA tichtby de grins fan in oare AEP is, kin de tiidsearje net represintatyf wêze foar it hiele gebiet, lykas earder suggerearre (33).Yn deselde AEP B is de tiidsearje SEATS (Súdeast-Aziatyske tiidsearjes) yn súdwestlik Taiwan (34), fierder fan 'e grinzen fan oare AEP's (figuer 5C, label 1), en kin brûkt wurde as in bettere lokaasje om te kontrolearjen AEPB.De BATS (Bermuda Atlantic Time Series Study) tiidsearje (figuer 5C, label 4) yn AEPC is heul ticht by de grins tusken AEP C en F, wat oanjout dat it kontrolearjen fan AEP C mei BATS-tiidreeks direkt problematysk kin wêze.Stasjon P yn AEP J (figuer 5C, label 3) is fier fan 'e AEP grins, dus it is mear represintatyf.De Eco-Provincie en AEP kinne helpe by it fêststellen fan in monitoaring ramt geskikt foar it beoardieljen fan globale feroarings, om't de provinsjes de tastimming om te beoardieljen wêr't sampling op 'e site kin leverje wichtige ynsjoch.De SAGE-metoade kin fierder ûntwikkele wurde om tapast te wurden op klimaatgegevens om tiidbesparjende fariabiliteit te beoardieljen.
It súkses fan 'e SAGE-metoade wurdt berikt troch soarchfâldige tapassing fan gegevenswittenskip / ML-metoaden en domeinspesifike kennis.Spesifyk wurdt t-SNE brûkt om dimensjereduksje út te fieren, dy't de kovariansjestruktuer fan heechdimensjonale gegevens behâldt en fisualisaasje fan kovariantopology fasilitearret.De gegevens binne arranzjearre yn 'e foarm fan strepen en kovariansjes (figuer 2A), wat oanjout dat suver op ôfstân basearre maatregels (lykas K-gemiddelden) net passend binne, om't se normaal in Gaussiaanske (sirkulêre) basisferdieling brûke (besprutsen yn Notysje S2) .De DBSCAN-metoade is geskikt foar elke kovariantopology.Salang't jo omtinken jaan oan it ynstellen fan parameters, kin betroubere identifikaasje wurde levere.De berekkeningskosten fan it t-SNE-algoritme binne heech, wat syn hjoeddeistige tapassing beheint ta in gruttere hoemannichte gegevens, wat betsjut dat it lestich is om oan te passen op djippe of tiidferoarjende fjilden.Der wurdt wurke oan de skalberens fan t-SNE.Sûnt KL-ôfstân is maklik te parallelisearjen, hat it t-SNE-algoritme in goed potinsjeel foar útwreiding yn 'e takomst (35).Oant no binne oare kânsrike metoaden foar reduksje fan dimensjes dy't de grutte better kinne ferminderje, omfetsje unified mannichfâldige approximaasje en projeksje (UMAP) techniken, mar evaluaasje yn 'e kontekst fan oseaangegevens is nedich.De betsjutting fan bettere skalberens is bygelyks it klassifisearjen fan globale klimaten of modellen mei ferskillende kompleksiteit op in mingde laach.Gebieten dy't net wurde klassifisearre troch SAGE yn elke provinsje kinne wurde beskôge as de oerbleaune swarte stippen yn figuer 2A.Geografysk lizze dizze gebieten benammen yn tige seizoensgebieten, wat suggerearret dat it fêstlizzen fan ekologyske provinsjes dy't yn 'e rin fan' e tiid feroarje, in bettere dekking sil jaan.
Om de SAGE-metoade te konstruearjen, binne ideeën út komplekse systemen/datawittenskip brûkt, mei de mooglikheid om klusters fan funksjonele groepen te bepalen (de mooglikheid om tige ticht te wêzen yn in 11-diminsjonale romte) en provinsjes te bepalen.Dizze provinsjes ferbyldzje spesifike folumes yn ús 3D t-SNE faze romte.Likegoed kin it Poincaré-diel brûkt wurde om it "folume" fan 'e steatromte dy't beset is troch it trajekt te evaluearjen om "normaal" of "chaotysk" gedrach te bepalen (36).Foar de statyske 11-diminsjonale modelútfier kin it folume dat beset is neidat de gegevens yn in 3D-fazeromte omboud binne, op deselde manier ferklearre wurde.De relaasje tusken geografysk gebiet en gebiet yn 3D faze romte is net ienfâldich, mar it kin ferklearre wurde yn termen fan ekologyske oerienkomst.Om dizze reden wurdt de mear konvinsjonele BC-ûngelikensmaat de foarkar.
Takomstich wurk sil de SAGE-metoade opnij brûke foar seizoensferoarjende gegevens om de romtlike fariabiliteit fan 'e identifisearre provinsjes en AEP te beoardieljen.It takomstige doel is om dizze metoade te brûken om te bepalen hokker provinsjes bepaald wurde kinne troch satellytmjittingen (lykas Chl-a, refleksiviteit op ôfstân en see-oerflaktemperatuer).Dit sil beoardieling fan ekologyske komponinten op ôfstân mooglik meitsje en tige fleksibele tafersjoch fan ekologyske provinsjes en har fariabiliteit.
It doel fan dit ûndersyk is om de SAGE-metoade yn te fieren, dy't in ekologyske provinsje definiearret troch syn unike plankton-mienskipsstruktuer.Hjir sil mear detaillearre ynformaasje oer it fysike / biogeochemical / ekosysteemmodel en de parameter seleksje fan 'e t-SNE en DBSCAN algoritmen wurde levere.
De fysike komponinten fan it model komme út 'e skatting fan oseaansirkulaasje en klimaat [ECCOv4;(37) de globale steat skatting beskreaun troch (38).De nominale resolúsje fan steatskatting is 1/5.De minste kwadraten metoade mei Lagrangian multiplier metoade wurdt brûkt om te krijen de inisjele en grins betingsten en ynterne model parameters oanpast troch observaasje, dêrmei it generearjen fan in frij rinnende MIT algemiene syklus model (MITgcm) (39), it model Nei optimalisaasje, de resultaten kinne wurde folge en observearre.
De biogeochemy/ekosysteem hat in mear folsleine beskriuwing (dws fergelikingen en parameterwearden) yn (2).It model vangt de sirkulaasje fan C, N, P, Si en Fe troch anorganyske en organyske fivers.De hjir brûkte ferzje omfettet 35 soarten fytoplankton: 2 soarten mikroprokaryoten en 2 soarten mikroeukaryoten (geskikt foar omjouwings mei leech fiedingsstoffen), 5 soarten Cryptomonas sphaeroides (mei kalsiumkarbonaatcoating), 5 soarten diazonium (Kin stikstof fixearje, dus it is net beheind) de beskikberens fan oploste anorganyske stikstof), 11 diatomeeën (it foarmjen fan in siliceous deksel), 10 mingd-vegetative flagellaten (kinne fotosynthesize en ite oar plankton) en 16 Zooplankton (weide op oare plankton).Dizze wurde "biogeochemyske funksjonele groepen" neamd, om't se ferskate effekten hawwe op marine biogeochemy (40, 41) en wurde faak brûkt yn observaasje- en modelstúdzjes.Yn dit model is elke funksjonele groep gearstald út ferskate planktons fan ferskate grutte, mei in span fan 0,6 oant 2500 μm lykweardige sfearyske diameter.
De parameters dy't ynfloed hawwe op groei, weidzjen en sinken fan fytoplankton binne relatearre oan grutte, en d'r binne spesifike ferskillen tusken de seis funksjonele groepen fan fytoplankton (32).Nettsjinsteande de ferskate fysike ramten binne de resultaten fan 'e 51 planktonkomponinten fan it model brûkt yn in oantal resinte stúdzjes (42-44).
Fan 1992 oant 2011 rûn it fysike/biogeochemical/ekosysteemkoppelingsmodel 20 jier.De útfier fan it model omfettet planktonbiomassa, fiedingskonsintraasje en fiedingsoanfierrate (DIN, PO4, Si en Fe).Yn dit ûndersyk is it 20-jiergemiddelde fan dizze útgongen brûkt as ynbring fan de Ekologyske Provinsje.Chl, de ferdieling fan plankton biomassa en fiedingsstoffen konsintraasje en de ferdieling fan funksjonele groepen wurde fergelike mei satellyt en in-situ observaasjes [sjoch (2, 44), Notysje S1 en figuer.S1 oant S3].
Foar de SAGE-metoade komt de wichtichste boarne fan willekeurigens fan 'e t-SNE-stap.Willekeurigens hinderet werhelling, wat betsjut dat de resultaten ûnbetrouber binne.De SAGE-metoade testet de robústheid strang troch it bepalen fan in set parameters fan t-SNE en DBSCAN, dy't konsekwint klusters kinne identifisearje as se werhelle wurde.It bepalen fan 'e "ferwûndering" fan' e t-SNE-parameter kin begrepen wurde as it bepalen fan 'e mjitte wêryn't de mapping fan hege nei lege dimensjes de lokale of globale skaaimerken fan' e gegevens respektearje moat.Berikke de betizing fan 400 en 300 iteraasjes.
Foar it klusteralgoritme DBSCAN moatte de minimale grutte en ôfstânmetrik fan 'e gegevenspunten yn it kluster bepaald wurde.It minimum oantal wurdt bepaald ûnder begelieding fan saakkundigen.Dizze kennis wit wat past by it hjoeddeistige numerike modelleringskader en resolúsje.It minimum oantal is 100. In hegere minimum wearde (minder as <135 foar de boppegrins fan grien wurdt breder) kin beskôge wurde, mar it kin net ferfange de aggregaasje metoade basearre op BC dissimilarity.De mjitte fan ferbining (figuer 6A) wurdt brûkt om de ϵ-parameter yn te stellen, wat befoarderlik is foar hegere dekking (figuer 6B).Konnektivität wurdt definiearre as it gearstalde oantal klusters en is gefoelich foar de parameter ϵ.Legere ferbining jout oan net genôch oanpassing, keunstmjittich groepearje regio's byinoar.Hege ferbining jout oerfitting oan.Overfitting is ek problematysk, om't it lit sjen dat inisjele willekeurige gissingen liede kinne ta unreprodusearjende resultaten.Tusken dizze twa utersten jout in skerpe ferheging (meastentiids "elmboog") de bêste ϵ oan.Yn figuer 6A sjogge jo in skerpe ferheging fan it platogebiet (giel,> 200 klusters), folge troch in skerpe fermindering (grien, 100 klusters), oant sawat 130, omjûn troch heul pear klusters (blau, <60 klusters) ).Yn op syn minst 100 blauwe gebieten dominearret of ien kluster de hiele oseaan (ϵ <0,42), of it grutste part fan 'e oseaan is net klassifisearre en wurdt beskôge as lûd (ϵ> 0,99).It giele gebiet hat in tige fariabele, unreprodusearjende klusterferdieling.As ϵ ôfnimt, nimt it lûd ta.It sterk tanimmende griene gebiet wurdt in elbow neamd.Dit is in optimale regio.Hoewol't de kâns t-SNE brûkt wurdt, kin de BC-ûngelikens binnen de provinsje noch brûkt wurde om betroubere klustering te bepalen.Mei help fan figuer 6 (A en B), set ϵ op 0,39.Hoe grutter it minimum oantal, hoe lytser de kâns om de ϵ te berikken dy't betroubere klassifikaasje mooglik makket, en hoe grutter it griene gebiet mei in wearde grutter as 135. De fergrutting fan dit gebiet jout oan dat de elbow dreger te finen of net- bestean.
Nei it ynstellen fan de parameters fan t-SNE, sil it totale oantal fûn klusters brûkt wurde as mjitte fan ferbining (A) en it persintaazje gegevens tawiisd oan it kluster (B).De reade stip jout de bêste kombinaasje fan dekking en ferbining oan.It minimale oantal wurdt ynsteld neffens it minimale oantal relatearre oan ekology.
Sjoch foar oanfoljend materiaal foar dit artikel http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Dit is in artikel mei iepen tagong ferspraat ûnder de betingsten fan de Creative Commons Attribution License.It artikel lit ûnbeheind gebrûk, distribúsje en reproduksje yn elk medium ta ûnder betingst dat it orizjinele wurk goed oanhelle wurdt.
Opmerking: wy freegje jo allinich om jo e-mailadres op te jaan, sadat de persoan dy't jo oan 'e side oanbefelje wit dat jo wolle dat se de e-post sjogge en dat it gjin spam is.Wy sille gjin e-mailadressen fange.
Dizze fraach wurdt brûkt om te testen oft jo in besiker binne en automatyske ynstjoering fan spam te foarkommen.
It Global Ministry of Marine Ecology is fêststeld om komplekse problemen op te lossen en brûkt sûnder tafersjoch ML om mienskipsstruktueren te ferkennen.
It Global Ministry of Marine Ecology is fêststeld om komplekse problemen op te lossen en brûkt sûnder tafersjoch ML om mienskipsstruktueren te ferkennen.


Post tiid: Jan-12-2021