topimg

Verheldering van ekologiese kompleksiteit: leer sonder toesig bepaal die globale mariene ekologiese provinsie

'n Leermetode sonder toesig word voorgestel om globale mariene ekologiese provinsies (eko-provinsies) te bepaal gebaseer op plankton gemeenskapstruktuur en nutriënt vloed data.Die sistematiese geïntegreerde ekologiese provinsie (SAGE) metode kan ekologiese provinsies identifiseer in hoogs nie-lineêre ekosisteemmodelle.Ten einde aan te pas by die nie-Gaussiese kovariansie van die data, gebruik SAGE t ewekansige buur-inbedding (t-SNE) om die dimensionaliteit te verminder.Met die hulp van die geraastoepassing gebaseer op die digtheid-gebaseerde ruimtelike groepering (DBSCAN) algoritme, kan meer as honderd ekologiese provinsies geïdentifiseer word.Deur die verbindingskaart met ekologiese verskille as afstandmaatstaf te gebruik, word 'n robuuste saamgevoegde ekologiese provinsie (AEP) objektief gedefinieer deur geneste ekologiese provinsies.Deur gebruik te maak van AEP's is die beheer van voedingstofvoorsieningstempo op gemeenskapstruktuur ondersoek.Eko-provinsie en AEP is uniek en kan modelinterpretasie help.Hulle kan vergelykings tussen modelle fasiliteer en kan die begrip en monitering van mariene ekosisteme verbeter.
Provinsies is streke waar komplekse biogeografie op die see of land in samehangende en betekenisvolle gebiede georganiseer is (1).Hierdie provinsies is baie belangrik vir die vergelyking en kontrastering van liggings, karakterisering van waarnemings, monitering en beskerming.Die komplekse en nie-lineêre interaksies wat hierdie provinsies produseer, maak metodes sonder toesig masjienleer (ML) baie geskik om provinsies objektief te bepaal, omdat die kovariansie in die data kompleks en nie-Gaussies is.Hier word 'n ML-metode voorgestel, wat sistematies unieke mariene ekologiese provinsies (eko-provinsies) identifiseer vanaf die Darwin globale driedimensionele (3D) fisiese/ekosisteemmodel (2).Die term "uniek" word gebruik om aan te dui dat die geïdentifiseerde area nie genoegsaam met ander gebiede oorvleuel nie.Hierdie metode word die System Integrated Ecological Province (SAGE)-metode genoem.Om bruikbare klassifikasie uit te voer, moet 'n algoritme-metode (i) globale klassifikasie en (ii) multiskaal-analise toelaat wat in ruimte en tyd geneste/aggregeer kan word (3).In hierdie navorsing is die SAGE-metode eers voorgestel en die geïdentifiseerde ekologiese provinsies is bespreek.Eko-provinsies kan begrip bevorder van die faktore wat gemeenskapstruktuur beheer, nuttige insigte vir moniteringstrategieë verskaf, en help om veranderinge in die ekosisteem op te spoor.
Terrestriële provinsies word gewoonlik geklassifiseer volgens ooreenkomste in klimaat (neerslag en temperatuur), grond, plantegroei en fauna, en word gebruik vir hulpbestuur, biodiversiteitsnavorsing en siektebeheer (1, 4).Mariene provinsies is moeiliker om te definieer.Die meeste organismes is mikroskopies, met vloeistofgrense.Longhurst et al.(5) Verskaf een van die eerste globale klassifikasies van die Ministerie van Oseanografie gebaseer op omgewingstoestande.Die definisie van hierdie "Longhurst" provinsies sluit veranderlikes soos vermengingstempo, stratifikasie en bestraling in, asook Longhurst se uitgebreide ervaring as 'n mariene oseanograaf, wat ander belangrike toestande vir mariene ekosisteme het.Longhurst is op groot skaal gebruik, byvoorbeeld, om primêre produksie en koolstof vloede te evalueer, hulp visserye, en beplan in situ waarneming aktiwiteite (5-9).Ten einde provinsies meer objektief te definieer, is metodes soos fuzzy logic en streeks sonder toesig groepering/statistieke gebruik (9-14).Die doel van sulke metodes is om betekenisvolle strukture te identifiseer wat provinsies in die beskikbare waarnemingsdata kan identifiseer.Dinamiese mariene provinsies (12) gebruik byvoorbeeld selforganiserende kaarte om geraas te verminder, en gebruik hiërargiese (boomgebaseerde) groepering om mariene kleurprodukte te bepaal wat van streeksatelliete afkomstig is [chlorofil a (Chl-a), genormaliseerde Fluoresensielynhoogte en gekleurde opgeloste organiese materiaal] en fisiese veld (see-oppervlaktemperatuur en soutgehalte, absolute dinamiese topografie en see-ys).
Die gemeenskapstruktuur van plankton is kommerwekkend omdat die ekologie daarvan 'n groot invloed op hoër voedingstofvlakke, koolstofabsorpsie en klimaat het.Nietemin is dit steeds 'n uitdagende en ontwykende doelwit om 'n globale ekologiese provinsie te bepaal gebaseer op die plankton gemeenskapstruktuur.Mariene kleursatelliete kan moontlik insig gee in die grofkorrelige klassifikasie van fitoplankton of die voordele van funksionele groepe voorstel (15), maar hulle is tans nie in staat om gedetailleerde inligting oor gemeenskapstruktuur te verskaf nie.Onlangse opnames [bv. Tara Ocean (16)] verskaf ongekende metings van gemeenskapstruktuur;tans is daar slegs yl in-situ waarnemings op 'n globale skaal (17).Vorige studies het grootliks die "Biogeochemiese Provinsie" (12, 14, 18) bepaal op grond van die bepaling van biochemiese ooreenkomste (soos primêre produksie, Chl en beskikbare lig).Hier word die numeriese model gebruik om uit te voer [Darwin(2)], en die ekologiese provinsie word bepaal volgens die gemeenskapstruktuur en voedingstofvloed.Die numeriese model wat in hierdie studie gebruik word, het globale dekking en kan vergelyk word met bestaande velddata (17) en afstandwaarnemingsvelde (Nota S1).Die numeriese modeldata wat in hierdie studie gebruik word, het die voordeel van globale dekking.Die model-ekosisteem bestaan ​​uit 35 spesies fitoplankton en 16 spesies soöplankton (verwys asseblief na materiaal en metodes).Modelplanktontipes wissel nie-lineêr met nie-Gaussiese kovariansiestrukture, dus is eenvoudige diagnostiese metodes nie geskik om unieke en konsekwente patrone in opkomende gemeenskapstrukture te identifiseer nie.Die SAGE-metode wat hier bekendgestel word, bied 'n nuwe manier om die uitset van komplekse Darwin-modelle na te gaan.
Die kragtige transformerende vermoëns van datawetenskap/ML-tegnologie kan oorweldigende komplekse modeloplossings in staat stel om komplekse maar robuuste strukture in data-kovariansie te openbaar.'n Robuuste metode word gedefinieer as 'n metode wat die resultate getrou binne 'n gegewe foutreeks kan weergee.Selfs in eenvoudige stelsels kan die bepaling van robuuste patrone en seine 'n uitdaging wees.Totdat die rasionaal wat tot die waargenome patroon lei, bepaal is, kan die ontluikende kompleksiteit ingewikkeld/moeilik lyk om op te los.Die sleutelproses om die samestelling van die ekosisteem te bepaal is nie-lineêr van aard.Die bestaan ​​van nie-lineêre interaksies kan robuuste klassifikasie verwar, daarom is dit nodig om metodes te vermy wat sterk aannames maak oor die basiese statistiese verspreiding van datakovariansie.Hoë-dimensionele en nie-lineêre data is algemeen in oseanografie en kan 'n kovariansiestruktuur hê met komplekse, nie-Gaussiese topologie.Alhoewel data met 'n nie-Gaussiese kovariansiestruktuur robuuste klassifikasie kan belemmer, is die SAGE-metode nuut omdat dit ontwerp is om trosse met arbitrêre topologieë te identifiseer.
Die doel van die SAGE-metode is om opkomende patrone objektief te identifiseer wat verdere ekologiese begrip kan help.Na aanleiding van 'n groep-gebaseerde werkvloei soortgelyk aan (19), word die ekologiese en nutriënt vloei veranderlikes gebruik om die enigste groepering in die data, genoem die ekologiese provinsie, te bepaal.Die SAGE-metode wat in hierdie studie (Figuur 1) voorgestel word, verminder eers die dimensionaliteit van 55 tot 11 dimensies deur die plankton funksionele groepe wat a priori gedefinieer is op te som (sien Materiale en Metodes).Deur gebruik te maak van t-ewekansige buur-inbedding (t-SNE) metode, word die grootte verder verminder deur die waarskynlikheid in die 3D-ruimte te projekteer.Groepering sonder toesig kan ekologies naby gebiede identifiseer [digtheid-gebaseerde ruimtelike groepering (DBSCAN) vir geraas-gebaseerde toepassings].Beide t-SNE en DBSCAN is van toepassing op die inherente nie-lineêre ekosisteem numeriese model data.Herprojekteer dan die gevolglike ekologiese provinsie op die aarde.Meer as honderd unieke ekologiese provinsies is geïdentifiseer wat geskik is vir streeknavorsing.Om die wêreldwye konsekwente ekosisteemmodel te oorweeg, word die SAGE-metode gebruik om die ekologiese provinsies in saamgevoegde ekologiese provinsies (AEP) saam te voeg om die doeltreffendheid van die ekologiese provinsies te verbeter.Die vlak van samevoeging (genoem "kompleksiteit") kan aangepas word na die vlak van detail wat benodig word.Bepaal die minimum kompleksiteit van 'n robuuste AEP.Die fokus van die seleksie is die SAGE-metode en die ondersoek van die kleinste kompleksiteit AEP-gevalle om die beheer van die noodgemeenskapstruktuur te bepaal.Die patrone kan dan ontleed word om ekologiese insigte te verskaf.Die metode wat hier bekendgestel word, kan ook vir meer omvattende modelvergelyking gebruik word, byvoorbeeld deur die liggings van soortgelyke ekologiese provinsies wat in verskillende modelle gevind word, te evalueer om verskille en ooreenkomste uit te lig, om sodoende modelle te vergelyk.
(A) Skematiese diagram van die werkvloei vir die bepaling van die ekologiese provinsie;die som in die funksionele groep te gebruik om die oorspronklike 55-dimensionele data te verminder tot 'n 11-dimensionele model-uitset, insluitend die biomassa van sewe funksionele/voedingstofplankton en vier voedingstofvoorsieningstempo's.Onbeduidende waarde en duursame ysbedekkingsarea.Die data is gestandaardiseer en gestandaardiseer.Verskaf 11-dimensionele data aan die t-SNE-algoritme om statisties soortgelyke kenmerkkombinasies uit te lig.DBSCAN sal die groep versigtig kies om die parameterwaarde te stel.Projekteer laastens die data terug na die breedte-/lengte-projeksie.Neem asseblief kennis dat hierdie proses 10 keer herhaal word omdat 'n effense ewekansigheid gegenereer kan word deur die toepassing van t-SNE.(B) verduidelik hoe om die AEP te kry deur die werkvloei in (A) 10 keer te herhaal.Vir elk van hierdie 10 implementerings is die inter-provinsiale Bray-Curtis (BC) ongelykheidsmatriks bepaal gebaseer op die biomassa van 51 fitoplanktontipes.Bepaal die BC-verskil tussen provinsies, van kompleksiteit 1 AEP tot volle kompleksiteit 115. Die BC-maatstaf word deur Longhurst-provinsie gestel.
Die SAGE-metode gebruik die uitset van die globale 3D fisiese/ekosisteem numeriese model om die ekologiese provinsie te definieer [Darwin (2);sien Materiale en Metodes en Nota S1].Die komponente van die ekosisteem bestaan ​​uit 35 spesies fitoplankton en 16 spesies soöplankton, met sewe voorafbepaalde funksionele groepe: prokariote en eukariote aangepas by lae-voedingstof omgewings, koksidia met 'n kalsiumkarbonaat deklaag, en swaar stikstofbinding Stikstofvoedingstowwe ontbreek (gewoonlik belangrike voedingstowwe), met siliciumbedekking, kan ander planktonfotosintese maak en gemengde voedingstofvlagellate en soöplanktonwagters bewei.Die grootte span is 0,6 tot 2500μm ekwivalente sferiese deursnee.Die modelverspreiding van fitoplanktongrootte en funksionele groepering vang die algehele kenmerke vas wat in satelliet- en in-situ waarnemings gesien word (sien Figure S1 tot S3).Die ooreenkoms tussen die numeriese model en die waargenome oseaan dui daarop dat provinsies wat deur die model gedefinieer word van toepassing kan wees op die in-situ oseaan.Neem asseblief kennis dat hierdie model slegs sekere diversiteit van fitoplankton vang, en slegs sekere fisiese en chemiese forseringsreekse van die in situ oseaan.Die SAGE-metode kan mense in staat stel om die hoogs streeksbeheermeganisme van die modelgemeenskapstruktuur beter te verstaan.
Deur slegs die som van oppervlakbiomassa (met 'n gemiddelde tyd van 20 jaar) in elke plankton funksionele groep in te sluit, kan die dimensionaliteit van die data verminder word.Nadat vroeëre studies hul sleutelrol in die opstel van die gemeenskapstruktuur getoon het, het dit ook oppervlakbronterme vir voedingstofvloeistowwe (voorsiening van stikstof, yster, fosfaat en siliciumsuur) ingesluit [bv. (20, 21)].Die opsomming van funksionele groepe verminder die probleem van 55 (51 plankton- en 4 voedingstofvloeie) tot 11 dimensies.In hierdie aanvanklike studie, as gevolg van die berekeningsbeperkings wat deur die algoritme opgelê word, is diepte- en tydveranderlikheid nie in ag geneem nie.
Die SAGE-metode is in staat om belangrike verwantskappe tussen nie-lineêre prosesse en sleutelkenmerke van interaksies tussen funksionele groepbiomassa en voedingstofvloed te identifiseer.Die gebruik van 11-dimensionele data gebaseer op Euklidiese afstandsonderrigmetodes (soos K-beteken) kan nie betroubare en reproduseerbare provinsies verkry nie (19, 22).Dit is omdat geen Gaussiese vorm gevind word in die basiese verspreiding van die kovariansie van die sleutelelemente wat die ekologiese provinsie definieer nie.Die K-gemiddelde van Voronoi-selle (reguit lyne) kan nie die nie-Gaussiese basiese verspreiding behou nie.
Die biomassa van sewe plankton funksionele groepe en vier voedingstowwe vorm 'n 11-dimensionele vektor x.Daarom is x 'n vektorveld op die modelrooster, waar elke element xi 'n 11-dimensionele vektor verteenwoordig wat op die model horisontale rooster gedefinieer is.Elke indeks i identifiseer uniek 'n roosterpunt op die sfeer, waar (lon, lat) = (ϕi, θi).As die biomassa van die modelroostereenheid minder as 1,2×10-3mg Chl/m3 is of die ysbedekkingskoers 70% oorskry, word die log van biomassadata gebruik en weggegooi.Die data is genormaliseer en gestandaardiseer, so alle data is in die reeks van [0 tot 1], die gemiddelde word verwyder en geskaal na eenheidsafwyking.Dit word gedoen sodat die kenmerke (biomassa en voedingstofvloed) nie beperk word deur die kontras in die reeks moontlike waardes nie.Groepering moet die veranderingsverhouding van die sleutelwaarskynlikheidsafstand tussen die kenmerke vaslê eerder as die geografiese afstand.Deur hierdie afstande te kwantifiseer, kom belangrike kenmerke na vore, terwyl onnodige besonderhede weggegooi word.Vanuit 'n ekologiese oogpunt is dit nodig omdat sommige tipes fitoplankton met min biomassa groter biogeochemiese effekte kan hê, soos stikstofbinding deur diasotrofiese bakterieë.Wanneer data gestandaardiseer en genormaliseer word, sal hierdie tipe kovariate uitgelig word.
Deur die nabyheid van kenmerke in hoë-dimensionele ruimte in lae-dimensionele voorstelling te beklemtoon, word die t-SNE-algoritme gebruik om bestaande soortgelyke streke duideliker te maak.Vorige werk wat daarop gemik was om diep neurale netwerke vir afstandwaarnemingstoepassings te bou, het t-SNE gebruik, wat sy vaardigheid bewys het om sleutelkenmerke te skei (23).Dit is 'n noodsaaklike stap om robuuste groepering in die kenmerkdata te identifiseer, terwyl nie-konvergente oplossings vermy word (nota S2).Deur Gaussiese pitte te gebruik, bewaar t-SNE die statistiese eienskappe van die data deur elke hoë-dimensionele voorwerp na 'n punt in die 3D-faseruimte te karteer, en sodoende te verseker dat die waarskynlikheid van soortgelyke voorwerpe in die hoë en lae rigtings hoog is in 'n hoë- en lae rigting. dimensionele ruimte (24).Gegewe 'n stel van N hoë-dimensionele voorwerpe x1, ..., xN, die t-SNE algoritme verminder deur die Kullback-Leibler (KL) divergensie te minimaliseer (25).KL divergensie is 'n maatstaf van hoe verskillend 'n waarskynlikheidsverdeling is van 'n tweede verwysing waarskynlikheidsverdeling, en kan die moontlikheid van korrelasie tussen lae-dimensionele voorstellings van hoë-dimensionele kenmerke effektief evalueer.As xi die i-de voorwerp in N-dimensionele ruimte is, is xj die j-de voorwerp in N-dimensionele ruimte, yi is die i-de voorwerp in 'n lae-dimensionele ruimte, en yj is die j-de voorwerp in laag -dimensionele ruimte, dan definieer t -SNE die ooreenkomswaarskynlikheid ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), en vir die dimensionaliteitsverminderingstel q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Figuur 2A illustreer die effek van die vermindering van die biomassa- en voedingstofvloedvektore van die 11-dimensionele kombinasie na 3D.Die motivering van die toepassing van t-SNE kan vergelyk word met die motivering van hoofkomponentanalise (PCA), wat die variansie-kenmerk gebruik om die area/kenmerk van die data te beklemtoon en sodoende die dimensionaliteit te verminder.Daar is gevind dat die t-SNE-metode beter is as PCA in die verskaffing van betroubare en reproduceerbare resultate vir die Eko-ministerie (sien Nota S2).Dit kan wees omdat die ortogonaliteitsaanname van PCA nie geskik is vir die identifisering van kritieke interaksies tussen hoogs nie-lineêre interaktiewe kenmerke nie, omdat PCA op lineêre kovariansiestrukture fokus (26).Deur afstandwaarnemingsdata te gebruik, het Lunga et al.(27) illustreer hoe om die SNE-metode te gebruik om komplekse en nie-lineêre spektrale kenmerke uit te lig wat afwyk van die Gaussiese verspreiding.
(A) 'n Gemodelleerde voedingstofvoorsieningstempo, fitoplankton en soöplankton funksionele groep biomassa geteken deur die t-SNE algoritme en gekleur deur provinsie met behulp van DBSCAN.Elke punt verteenwoordig 'n punt in die hoë-dimensionele ruimte, soos getoon in Figuur 6B, die meeste punte word vasgelê.Skagte verwys na "t-SNE" groottes 1, 2 en 3. (B) Die geografiese projeksie van die provinsie gevind deur DBSCAN op die breedtegraad-lengtegraad-rooster van die oorsprong.Die kleur moet as enige kleur beskou word, maar moet ooreenstem met (A).
Die punte in die t-SNE verstrooiingsgrafiek in Figuur 2A word onderskeidelik geassosieer met breedtegraad en lengtegraad.As die twee punte in Figuur 2A naby aan mekaar is, is dit omdat hul biomassa en voedingstofvloeie soortgelyk is, nie as gevolg van geografiese nabyheid nie.Die kleure in Figuur 2A is trosse ontdek met behulp van die DBSCAN metode (28).Wanneer na digte waarnemings gesoek word, gebruik die DBSCAN-algoritme die afstand in die 3D-voorstelling tussen die punte (ϵ = 0.39; vir inligting oor hierdie keuse, sien Materiale en Metodes), en die aantal soortgelyke punte word benodig om die groep te definieer (hier) 100 punte, sien asseblief hierbo).Die DBSCAN-metode maak geen aannames oor die vorm of aantal trosse in die data nie, soos hieronder getoon:
3) Vir alle punte wat geïdentifiseer is as binne die afstand binne, herhaal stap 2 iteratief om die groepgrens te bepaal.As die aantal punte groter is as die vasgestelde minimum waarde, word dit as 'n groep aangewys.
Data wat nie aan die minimum groeplid en afstand ϵ-metriek voldoen nie, word as "geraas" beskou en word nie 'n kleur toegeken nie.DBSCAN is 'n vinnige en skaalbare algoritme met O(n2) prestasie in die ergste geval.Vir die huidige ontleding is dit nie eintlik lukraak nie.Die minimum aantal punte word deur deskundige evaluering bepaal.Nadat die afstand daarna aangepas is, is die resultaat nie stabiel genoeg in die reeks van ≈±10 nie.Hierdie afstand word gestel deur gebruik te maak van konnektiwiteit (Figuur 6A) en oseaandekkingspersentasie (Figuur 6B).Konnektiwiteit word gedefinieer as die saamgestelde aantal trosse en is sensitief vir die ϵ-parameter.Laer konnektiwiteit dui op onvoldoende passing, wat streke kunsmatig saamgroepeer.Hoë konnektiwiteit dui op oorpassing.Dit is denkbaar om 'n hoër minimum te gebruik, maar as die minimum ca oorskry, is dit onmoontlik om 'n betroubare oplossing te bereik.135 (Vir meer besonderhede, sien Materiale en Metodes).
Die 115 trosse wat in Figuur 2A geïdentifiseer is, word in Figuur 2B terug op die aarde geprojekteer.Elke kleur stem ooreen met 'n samehangende kombinasie van biogeochemiese en ekologiese faktore wat deur DBSCAN geïdentifiseer is.Sodra die trosse bepaal is, word die assosiasie van elke punt in Figuur 2A met 'n spesifieke breedte- en lengtegraad gebruik om die trosse terug na die geografiese gebied te projekteer.Figuur 2B illustreer dit met dieselfde troskleure as Figuur 2A.Soortgelyke kleure moet nie as ekologiese ooreenkoms geïnterpreteer word nie, want hulle word toegeken deur die volgorde waarin trosse deur die algoritme ontdek word.
Die area in Figuur 2B kan kwalitatief soortgelyk wees aan 'n gevestigde area in die fisiese en/of biogeochemie van die oseaan.Byvoorbeeld, die trosse in die Suidelike Oseaan is sone-simmetries, met oligotrofiese draaikolke wat verskyn, en die skerp oorgang dui op die invloed van passaatwinde.Byvoorbeeld, in die ekwatoriale Stille Oseaan word verskillende streke gesien wat verband hou met die styging.
Ten einde die ekologiese omgewing van die Eko-provinsie te verstaan, is 'n variasie van die Bray-Curtis (BC) verskil-indeks (29) gebruik om die ekologie in die tros te evalueer.Die BC-aanwyser is 'n statistiese data wat gebruik word om die verskil in gemeenskapstruktuur tussen twee verskillende terreine te kwantifiseer.Die BC-meting is van toepassing op die biomassa van 51 spesies fitoplankton en soöplankton BCninj = 1-2CninjSni + Snj
BCninj verwys na die ooreenkoms tussen kombinasie ni en kombinasie nj, waar Cninj die minimum waarde is van 'n enkele tipe biomassa wat in beide kombinasies ni en nj bestaan, en Sni verteenwoordig die som van alle biomassas wat in beide kombinasies ni en Snj bestaan.Die BC-verskil is soortgelyk aan die afstandmaatstaf, maar werk in nie-Euklidiese ruimte, wat waarskynlik meer geskik sal wees vir ekologiese data en die interpretasie daarvan.
Vir elke groep wat in Figuur 2B geïdentifiseer is, kan die ooreenkoms van intra-provinsiale en inter-provinsiale BC geassesseer word.Die BC verskil binne 'n provinsie verwys na die verskil tussen die gemiddelde waarde van die provinsie en elke punt in die provinsie.Die verskil tussen BC-provinsies verwys na die ooreenkoms tussen een provinsie en ander provinsies.Figuur 3A toon 'n simmetriese BC-matriks (0, swart: heeltemal ooreenstem; 1, wit: heeltemal verskillend).Elke lyn in die grafiek toon 'n patroon in die data.Figuur 3B toon die geografiese betekenis van die resultate van BC in Figuur 3A vir elke provinsie.Vir 'n provinsie in 'n lae- en lae-voedingstof gebied, toon Figuur 3B dat die simmetrie van groot gebiede rondom die ewenaar en die Indiese Oseaan basies soortgelyk is, maar die hoër breedtegrade en opwellingsgebiede verskil aansienlik.
(A) Die graad van BC verskil geëvalueer vir elke provinsie gebaseer op die globale 20-jaar gemiddelde globale oppervlak gemiddelde van 51 plankton.Let op die verwagte simmetrie van die waardes.(B) Die ruimtelike projeksie van 'n kolom (of ry).Vir 'n provinsie in 'n distrofiese kring is die globale verspreiding van die BC-ooreenkomsmaatstaf geëvalueer, en die globale 20-jaar gemiddelde is geëvalueer.Swart (BC = 0) beteken dieselfde area, en wit (BC = 1) beteken geen ooreenkoms nie.
Figuur 4A illustreer die verskil in BC binne elke provinsie in Figuur 2B.Bepaal deur die gemiddelde kombinasie van die gemiddelde oppervlakte in 'n tros te gebruik, en die bepaling van die verskil tussen die BC en die gemiddelde van elke roosterpunt in die provinsie, toon dit dat die SAGE-metode 51 spesies goed kan skei op grond van die ekologiese ooreenkoms. model data.Die algehele gemiddelde tros-BC-ongelykheid van al 51 tipes is 0,102±0,0049.
(A, B en D) Die BC-verskil binne die provinsie word geëvalueer as die gemiddelde BC-verskil tussen elke roosterpuntgemeenskap en die gemiddelde provinsie, en die kompleksiteit word nie verminder nie.(2) Die globale gemiddelde intra-provinsiale BC verskil is 0.227±0.117.Dit is die maatstaf van ekologiese motivering-gebaseerde klassifikasie wat deur hierdie werk voorgestel word [groen lyn in (C)].(C) Gemiddelde intra-provinsiale BC verskil: Die swart lyn verteenwoordig die intra-provinsiale BC verskil met toenemende kompleksiteit.2σ kom van 10 herhalings van die eko-provinsie-identifikasieproses.Vir die totale kompleksiteit van die provinsies wat deur DBSCAN ontdek is, toon (A) dat die BC-ongelykheid in die provinsie 0,099 is, en die kompleksiteitsklassifikasie voorgestel deur (C) is 12, wat lei tot 'n BC-ongelykheid van 0,200 in die provinsie.soos die prentjie wys.(D).
In Figuur 4B word die biomassa van 51 planktontipes gebruik om die ekwivalente BC verskil in Longhurst provinsie voor te stel.Die algehele gemiddelde van elke provinsie is 0,227, en die standaardafwyking van die roosterpunte met verwysing na die verskil in BC-provinsie is 0,046.Dit is groter as die groep wat in Figuur 1B geïdentifiseer is.In plaas daarvan, deur die som van die sewe funksionele groepe te gebruik, het die gemiddelde intra-seisoen vC-ongelykheid in Longhurst tot 0,232 toegeneem.
Die globale eko-provinsie kaart verskaf ingewikkelde besonderhede van unieke ekologiese interaksies en verbeterings is gemaak in die gebruik van die hele ekosisteem struktuur van Longhurst Provinsie.Daar word van die Ministerie van Ekologie verwag om insig te gee in die proses om die numeriese model-ekosisteem te beheer, en hierdie insig sal die verkenning van veldwerk help.Vir die doel van hierdie navorsing is dit nie moontlik om meer as honderd provinsies volledig te vertoon nie.Die volgende afdeling stel die SAGE-metode bekend wat die provinsies opsom.
Een van die oogmerke van die provinsie is om begrip van die ligging en bestuur van die provinsie te bevorder.Om noodsituasies te bepaal, illustreer die metode in Figuur 1B die nes van ekologies soortgelyke provinsies.Eko-provinsies word saam gegroepeer op grond van ekologiese ooreenkomste, en so 'n groepering van provinsies word AEP genoem.Stel 'n verstelbare "kompleksiteit" gebaseer op die totale aantal provinsies wat oorweeg moet word.Die term "kompleksiteit" word gebruik omdat dit toelaat dat die vlak van noodeienskappe aangepas word.Ten einde betekenisvolle samevoegings te definieer, word die gemiddelde intra-provinsiale BC verskil van 0.227 vanaf Longhurst as die maatstaf gebruik.Onder hierdie maatstaf word die gekombineerde provinsies nie meer as nuttig beskou nie.
Soos getoon in Figuur 3B, is die globale ekologiese provinsies koherent.Deur inter-provinsiale BC verskille te gebruik, kan gesien word dat sommige konfigurasies baie "algemeen" is.Geïnspireer deur genetika en grafiekteorie-metodes, word "gekoppelde grafieke" gebruik om >100 provinsies te sorteer op grond van die provinsies wat die meeste ooreenstem met hulle.Die "konnektiwiteit"-metriek hier word bepaal deur interprovinsiale BC-ongelykheid te gebruik (30).Die aantal provinsies met 'n groter spasie vir klassifikasie van > 100 provinsies kan hierin as kompleksiteit verwys word.AEP is 'n produk wat meer as 100 provinsies kategoriseer as die mees dominante/naaste ekologiese provinsies.Elke ekologiese provinsie word toegewys aan die dominante/hoogs-verbonde ekologiese provinsie wat die meeste aan hulle ooreenstem.Hierdie samevoeging wat deur die BC-verskil bepaal word, laat 'n geneste benadering tot die globale ekologie toe.
Die geselekteerde kompleksiteit kan enige waarde van 1 tot die volledige kompleksiteit van FIG.2A.By laer kompleksiteit kan AEP degenereer as gevolg van die waarskynlikheidsdimensionaliteitverminderingstap (t-SNE).Degenerasie beteken dat ekologiese provinsies tussen iterasies aan verskillende AEP's toegewys kan word, en sodoende die geografiese gebied wat gedek word, verander.Figuur 4C illustreer die verspreiding van BC-ongelykhede binne provinsies in AEP's van toenemende kompleksiteit oor 10 implementerings (illustrasie in Figuur 1B).In Figuur 4C is 2σ (blou area) 'n maatstaf van agteruitgang in 10 implementerings, en die groen lyn verteenwoordig die Longhurst-maatstaf.Feite het bewys dat die kompleksiteit van 12 die BC-verskil in die provinsie onder die Longhurst-maatstaf in alle implementerings kan hou en 'n relatief klein 2σ-agteruitgang kan handhaaf.Samevattend, die minimum aanbevole kompleksiteit is 12 AEP's, en die gemiddelde intra-provinsie BC verskil geëvalueer deur gebruik te maak van 51 plankton tipes is 0.198±0.013, soos getoon in Figuur 4D.Deur die som van sewe plankton funksionele groepe te gebruik, is die gemiddelde BC verskil binne die provinsie 2σ in plaas van 0,198±0,004.Die vergelyking tussen die BC-verskille bereken met die totale biomassa van die sewe funksionele groepe of die biomassa van al 51 planktontipes toon dat alhoewel die SAGE-metode van toepassing is op die 51-dimensionele situasie, dit vir die totale biomassa van die sewe funksionele groepe is. Vir opleiding.
Afhangende van die doel van enige navorsing, kan verskillende vlakke van kompleksiteit oorweeg word.Streeksstudies kan volle kompleksiteit vereis (dws al 115 provinsies).As voorbeeld en vir duidelikheid, oorweeg die minimum aanbevole kompleksiteit van 12.
As 'n voorbeeld van die nut van die SAGE-metode, word 12 AEP's met 'n minimum kompleksiteit van 12 hier gebruik om die beheer van die noodgemeenskapstruktuur te verken.Figuur 5 illustreer die ekologiese insigte gegroepeer deur AEP (van A tot L): In Redfield-stoïgiometrie word geografiese omvang (Figuur 5C), funksionele groep biomassa samestelling (Figuur 5A) en voedingstofvoorsiening (Figuur 5B) uitgevoer deur N Zoomed.Die verhouding (N:Si:P:Fe, 1:1:16:16×103) word getoon.Vir laasgenoemde paneel, P vermenigvuldig met 16 en Fe vermenigvuldig met 16×103, dus is die staafgrafiek gelykstaande aan die voedingsbehoeftes van fitoplankton.
Die provinsies word geklassifiseer in 12 AEP's A tot L. (A) Biomassa (mgC/m3) van ekosisteme in 12 provinsies.(B) Die voedingsvloeitempo van opgeloste anorganiese stikstof (N), yster (Fe), fosfaat (P) en siliciumsuur (Si) (mmol/m3 per jaar).Fe en P word vermenigvuldig met onderskeidelik 16 en 16×103, sodat die stroke gestandaardiseer word volgens fitoplankton-stoïgiometrievereistes.(C) Let op die verskil tussen poolstreke, subtropiese siklone en groot seisoenale/stygende streke.Die moniteringstasies is soos volg gemerk: 1, SITPLEKKE;2, ALOHA;3, stasie P;en 4, VLEERMURE.
Die geïdentifiseerde AEP is uniek.Daar is 'n mate van simmetrie rondom die ewenaar in die Atlantiese en Stille Oseaan, en 'n soortgelyke maar vergrote gebied bestaan ​​in die Indiese Oseaan.Sommige AEP's omhels die westelike kant van die vasteland wat met die opgang verband hou.Die Suidpool Sirkumpolêre Stroom word as 'n groot sonale kenmerk beskou.Subtropiese sikloon is 'n komplekse reeks oligotrofe AEP.In hierdie provinsies is die bekende patroon van biomassa verskille tussen plankton-gedomineerde oligotrofiese draaikolke en diatomeeryke poolstreke duidelik.
AEP's met baie soortgelyke totale fitoplanktonbiomassa kan baie verskillende gemeenskapstrukture hê en verskillende geografiese gebiede dek, soos D, H en K, wat soortgelyke totale fitoplanktonbiomassa het.AEP H bestaan ​​hoofsaaklik in die ekwatoriale Indiese Oseaan, en daar is meer diasotrofiese bakterieë.AEP D word in verskeie komme aangetref, maar dit is veral prominent in die Stille Oseaan rondom hoë-opbrengsgebiede rondom die ekwatoriale opwelling.Die vorm van hierdie Stille Oseaan-provinsie herinner aan 'n planetêre golftrein.Daar is min diazobakterieë in AEP D, en meer keëls.In vergelyking met die ander twee provinsies word AEP K net in die hooglande van die Arktiese Oseaan aangetref, en daar is meer diatome en minder planktone.Dit is opmerklik dat die hoeveelheid plankton in hierdie drie streke ook baie verskil.Onder hulle is die plankton-oorvloed van AEP K relatief laag, terwyl dié van AEP D en H relatief hoog is.Daarom, ten spyte van hul biomassa (en dus soortgelyk aan Chl-a), verskil hierdie provinsies heelwat: Chl-gebaseerde provinsietoetsing sal dalk nie hierdie verskille vasvang nie.
Dit is ook duidelik dat sommige AEP's met baie verskillende biomassa soortgelyk kan wees in terme van fitoplankton gemeenskapstruktuur.Dit is byvoorbeeld sigbaar in AEP D en E. Hulle is naby mekaar, en in die Stille Oseaan is AEP E naby die hoogs produktiewe AEPJ.Net so is daar geen duidelike verband tussen fitoplankton biomassa en soöplankton oorvloed nie.
AEP kan verstaan ​​word in terme van die voedingstowwe wat aan hulle verskaf word (Figuur 5B).Diatome bestaan ​​slegs waar daar genoegsame voorraad van siliciumsuur is.Oor die algemeen, hoe hoër die aanbod van silisiumsuur, hoe hoër is die biomassa van diatome.Diatomeë kan gesien word in AEP A, J, K en L. Die verhouding van diatomee biomassa relatief tot ander fitoplankton word bepaal deur die N, P en Fe verskaf relatief tot die diatomee vraag.Byvoorbeeld, AEP L word oorheers deur diatome.In vergelyking met ander voedingstowwe, het Si die hoogste aanbod.In teenstelling, ten spyte van hoër produktiwiteit, het AEP J minder diatome en minder silikonvoorraad (alles en relatief tot ander voedingstowwe).
Diazonium-bakterieë het die vermoë om stikstof te bind, maar groei stadig (31).Hulle bestaan ​​saam met ander fitoplankton, waar yster en fosfor buitensporig is relatief tot die vraag na nie-diasonium voedingstowwe (20, 21).Dit is opmerklik dat die diasotrofiese biomassa relatief hoog is, en die aanbod van Fe en P relatief groot is relatief tot die aanbod van N. Op hierdie manier, hoewel die totale biomassa in AEP J hoër is, is die diasonium biomassa in AEP H groter as dié in J. Neem asseblief kennis dat AEP J en H geografies baie verskil, en H in die ekwatoriale Indiese Oseaan geleë is.
As die unieke ekosisteemstruktuur nie in provinsies verdeel word nie, sal die insigte verkry uit die 12 AEP se modelle met die laagste kompleksiteit nie so duidelik wees nie.Die AEP wat deur SAGE gegenereer word, fasiliteer die samehangende en gelyktydige vergelyking van komplekse en hoë-dimensionele inligting vanaf ekosisteemmodelle.AEP beklemtoon doeltreffend hoekom Chl nie 'n goeie en alternatiewe metode is om gemeenskapstruktuur of soöplankton oorvloed te bepaal by hoër voedingstofvlakke nie.'n Gedetailleerde ontleding van deurlopende navorsingsonderwerpe is buite die bestek van hierdie artikel.Die SAGE-metode bied 'n manier om ander meganismes in die model te verken wat makliker is om te hanteer as punt-tot-punt-kyk.
Die SAGE-metode word voorgestel om uiters komplekse ekologiese data van globale fisiese/biogeochemiese/ekosisteem numeriese modelle te help opklaar.Die ekologiese provinsie word bepaal deur die totale biomassa van kruis-plankton funksionele groepe, die toepassing van t-SNE waarskynlikheid dimensionaliteit vermindering algoritme en die groepering met behulp van die nie-toesig ML metode DBSCAN.Die interprovinsiale BC verskil/grafiekteorie vir nesmetode word toegepas om 'n robuuste AEP af te lei wat vir globale interpretasie gebruik kan word.Wat konstruksie betref, is die Eko-provinsie en AEP uniek.Die AEP-nes kan aangepas word tussen die volle kompleksiteit van die oorspronklike ekologiese provinsie en die aanbevole minimum drempel van 12 AEP's.Nesting en bepaling van die minimum kompleksiteit van AEP word as sleutelstappe beskou, omdat die waarskynlikheid dat t-SNE AEPs van <12 kompleksiteit degenereer.Die SAGE-metode is wêreldwyd, en die kompleksiteit daarvan wissel van> 100 AEP's tot 12. Vir eenvoud is die huidige fokus op die kompleksiteit van 12 globale AEP's.Toekomstige navorsing, veral streekstudies, kan 'n kleiner ruimtelike subset van die globale eko-provinsies nuttig vind, en kan in 'n kleiner gebied saamgevoeg word om voordeel te trek uit dieselfde ekologiese insigte wat hier bespreek word.Dit verskaf voorstelle oor hoe hierdie ekologiese provinsies en die insigte wat daaruit verkry is gebruik kan word vir verdere ekologiese begrip, modelvergelyking te fasiliteer en moontlik die monitering van mariene ekosisteme te verbeter.
Die ekologiese provinsie en AEP wat deur die SAGE-metode geïdentifiseer is, is gebaseer op die data in die numeriese model.Per definisie is die numeriese model 'n vereenvoudigde struktuur, wat probeer om die essensie van die teikenstelsel vas te vang, en verskillende modelle sal verskillende verspreiding van plankton hê.Die numeriese model wat in hierdie studie gebruik is, kan sommige van die waargenome patrone nie ten volle vasvang nie (byvoorbeeld in die Chl-skattings vir die ekwatoriale streek en die Suidelike Oseaan).Slegs 'n klein deel van die diversiteit in die werklike oseaan word gevang, en die meso- en sub-mesoskale kan nie opgelos word nie, wat voedingstofvloed en kleiner skaal gemeenskapstruktuur kan beïnvloed.Ten spyte van hierdie tekortkominge, blyk dit dat AEP baie nuttig is om komplekse modelle te help verstaan.Deur te evalueer waar soortgelyke ekologiese provinsies gevind word, bied AEP 'n potensiële numeriese modelvergelykingsinstrument.Die huidige numeriese model vang die algehele patroon van afstandwaarneming fitoplankton Chl-a konsentrasie en die verspreiding van plankton grootte en funksionele groep (Nota S1 en Figuur S1) (2, 32).
Soos getoon deur die 0.1 mgChl-a/m-3 kontoerlyn, word AEP verdeel in oligotrofiese area en mesotrofiese area (Figuur S1B): AEP B, C, D, E, F en G is oligotrofiese areas, en die oorblywende areas is geleë Hoër Chl-a.AEP toon 'n mate van korrespondensie met Longhurst Provinsie (Figuur S3A), byvoorbeeld, die Suidelike Oseaan en die ekwatoriale Stille Oseaan.In sommige streke dek AEP verskeie Longhurst-streke, en omgekeerd.Aangesien die bedoeling om provinsies in hierdie gebied en Longhurst af te baken anders is, word verwag dat daar verskille sal wees.Veelvuldige AEP's in 'n Longhurst-provinsie dui aan dat sekere gebiede met soortgelyke biogeochemie baie verskillende ekosisteemstrukture kan hê.AEP vertoon 'n sekere korrespondensie met fisiese toestande, soos geopenbaar deur gebruik te maak van leer sonder toesig (19), soos in hoë opwellende state (byvoorbeeld, die Suidelike Oseaan en die ekwatoriale Stille Oseaan; Figuur S3, C en D).Hierdie ooreenkomste dui aan dat die gemeenskapstruktuur van plankton sterk deur oseaandinamika beïnvloed word.In gebiede soos die Noord-Atlantiese Oseaan deurkruis AEP fisiese provinsies.Die meganisme wat hierdie verskille veroorsaak, kan prosesse soos stofvervoer insluit, wat selfs onder soortgelyke fisiese toestande tot heeltemal verskillende voedingsprogramme kan lei.
Die Ministerie van Ekologie en AEP het daarop gewys dat die gebruik van Chl alleen nie ekologiese komponente kan identifiseer nie, soos die mariene ekologie gemeenskap reeds besef het.Dit word gesien in AEP's met soortgelyke biomassa maar aansienlik verskillende ekologiese samestelling (soos D en E).Daarteenoor het AEP's soos D en K baie verskillende biomassa maar soortgelyke ekologiese samestelling.AEP beklemtoon dat die verband tussen biomassa, ekologiese samestelling en soöplankton oorvloed kompleks is.Byvoorbeeld, alhoewel AEP J uitstaan ​​in terme van fitoplankton en planktonbiomassa, het AEP se A en L soortgelyke planktonbiomassa, maar A het 'n hoër plankton-oorvloed.AEP beklemtoon dat fitoplanktonbiomassa (of Chl) nie gebruik kan word om soöplanktonbiomassa te voorspel nie.Diereplankton is die grondslag van die vissery-voedselketting, en meer akkurate skattings kan lei tot beter hulpbronbestuur.Toekomstige mariene kleursatelliete [byvoorbeeld PACE (plankton, aërosol, wolk en mariene ekosisteem)] kan beter geposisioneer wees om die gemeenskapstruktuur van fitoplankton te help skat.Die gebruik van AEP-voorspelling kan moontlik die skatting van soöplankton vanuit die ruimte vergemaklik.Metodes soos SAGE, tesame met nuwe tegnologieë, en meer en meer velddata beskikbaar vir grondwaarheidsopnames (soos Tara en opvolgnavorsing), kan gesamentlik 'n stap neem in die rigting van satelliet-gebaseerde ekosisteemgesondheidsmonitering.
Die SAGE-metode bied 'n gerieflike manier om sommige meganismes wat provinsie-eienskappe beheer, soos biomassa/Chl, netto primêre produksie en gemeenskapstruktuur te evalueer.Byvoorbeeld, die relatiewe hoeveelheid diatome word bepaal deur 'n wanbalans in die aanbod van Si, N, P en Fe relatief tot die fitoplankton stoïgiometriese vereistes.Teen 'n gebalanseerde aanbodkoers word die gemeenskap deur diatome (L) oorheers.Wanneer die aanbodtempo ongebalanseerd is (dit wil sê die aanbod van silikon is laer as die voedingstofaanvraag van diatome), verteenwoordig diatome slegs 'n klein gedeelte Aandeel (K).Wanneer die aanbod van Fe en P die aanbod van N oorskry (byvoorbeeld E en H), sal die diasotrofiese bakterieë kragtig groei.Deur die konteks wat deur AEP verskaf word, sal die verkenning van beheermeganismes nuttiger word.
Die Eko-provinsie en AEP is gebiede met soortgelyke gemeenskapstrukture.Die tydreekse vanaf 'n sekere ligging binne 'n ekologiese provinsie of AEP kan as 'n verwysingspunt beskou word en kan die gebied verteenwoordig wat deur die ekologiese provinsie of AEP gedek word.Langtermyn moniteringstasies op die terrein verskaf sulke tydreekse.Langtermyn in-situ datastelle sal voortgaan om 'n onberekenbare rol te speel.Vanuit die perspektief van die monitering van gemeenskapstruktuur, kan die SAGE-metode gesien word as 'n manier om te help om die nuttigste ligging van nuwe terreine te bepaal.Byvoorbeeld, die tydreeks van die langtermyn oligotrofiese habitatassessering (ALOHA) is in die AEP B van die oligotrofiese area (Figuur 5C, etiket 2).Omdat ALOHA naby die grens van 'n ander AEP is, is die tydreeks dalk nie verteenwoordigend van die hele gebied nie, soos voorheen voorgestel (33).In dieselfde AEP B is die tydreeks SEATS (Suidoos-Asiatiese Tydreeks) geleë in suidwestelike Taiwan (34), verder van die grense van ander AEP's (Figuur 5C, etiket 1), en kan gebruik word as 'n beter plek om te monitor AEPB.Die BATS (Bermuda Atlantic Time Series Study) tydreekse (Figuur 5C, etiket 4) in AEPC is baie naby aan die grens tussen AEP C en F, wat aandui dat die monitering van AEP C deur gebruik te maak van BATS tydreekse direk problematies kan wees.Stasie P in AEP J (Figuur 5C, etiket 3) is ver van die AEP-grens af, so dit is meer verteenwoordigend.Die Eko-provinsie en AEP kan help om 'n moniteringsraamwerk te vestig wat geskik is vir die assessering van globale veranderinge, omdat die provinsies se toestemming om te assesseer waar steekproefneming op die terrein sleutelinsigte kan verskaf.Die SAGE-metode kan verder ontwikkel word om op klimaatdata toegepas te word om tydbesparende wisselvalligheid te bepaal.
Die sukses van die SAGE-metode word behaal deur noukeurige toepassing van datawetenskap/ML-metodes en domeinspesifieke kennis.Spesifiek, t-SNE word gebruik om dimensionaliteitsvermindering uit te voer, wat die kovariansiestruktuur van hoëdimensionele data bewaar en visualisering van kovariansietopologie vergemaklik.Die data is gerangskik in die vorm van strepe en kovariansies (Figuur 2A), wat aandui dat suiwer afstandgebaseerde maatstawwe (soos K-gemiddeldes) nie toepaslik is nie omdat hulle gewoonlik 'n Gaussiese (sirkulêre) basisverspreiding gebruik (bespreek in Nota S2) .Die DBSCAN-metode is geskik vir enige kovariansietopologie.Solank jy aandag gee aan die instelling van parameters, kan betroubare identifikasie verskaf word.Die berekeningskoste van die t-SNE-algoritme is hoog, wat die huidige toepassing daarvan beperk tot 'n groter hoeveelheid data, wat beteken dat dit moeilik is om toe te pas op diep of tydverskillende velde.Werk aan die skaalbaarheid van t-SNE is aan die gang.Aangesien KL-afstand maklik paralleliseerbaar is, het die t-SNE-algoritme 'n goeie potensiaal vir uitbreiding in die toekoms (35).Tot dusver, ander belowende dimensionaliteit vermindering metodes wat die grootte beter kan verminder sluit verenigde manifold benadering en projeksie (UMAP) tegnieke, maar evaluering in die konteks van oseaan data is nodig.Die betekenis van beter skaalbaarheid is byvoorbeeld om globale klimate of modelle met verskillende kompleksiteit op 'n gemengde laag te klassifiseer.Gebiede wat nie in enige provinsie deur SAGE geklassifiseer word nie, kan as die oorblywende swart kolle in Figuur 2A beskou word.Geografies is hierdie gebiede hoofsaaklik in hoogs seisoenale gebiede, wat daarop dui dat die vaslegging van ekologiese provinsies wat oor tyd verander, beter dekking sal bied.
Ten einde die SAGE-metode te konstrueer, is idees uit komplekse stelsels/datawetenskap gebruik, wat die vermoë gebruik om groepe van funksionele groepe te bepaal (die moontlikheid om baie naby te wees in 'n 11-dimensionele ruimte) en provinsies te bepaal.Hierdie provinsies beeld spesifieke volumes in ons 3D t-SNE-faseruimte uit.Net so kan die Poincaré-deel gebruik word om die "volume" van die toestandsruimte wat deur die trajek beset word, te evalueer om "normale" of "chaotiese" gedrag te bepaal (36).Vir die statiese 11-dimensionele modeluitset kan die volume wat beset word nadat die data in 'n 3D-fasespasie omgeskakel is, op soortgelyke wyse verduidelik word.Die verhouding tussen geografiese gebied en area in 3D-faseruimte is nie eenvoudig nie, maar dit kan verduidelik word in terme van ekologiese ooreenkoms.Om hierdie rede word die meer konvensionele BC-ongelykheidsmaatstaf verkies.
Toekomstige werk sal die SAGE-metode hergebruik vir seisoenale veranderende data om die ruimtelike veranderlikheid van die geïdentifiseerde provinsies en AEP te assesseer.Die toekomstige doelwit is om hierdie metode te gebruik om te help bepaal watter provinsies deur middel van satellietmetings (soos Chl-a, afstandswaarnemingsreflektiwiteit en see-oppervlaktemperatuur) bepaal kan word.Dit sal afstandwaarnemingsevaluering van ekologiese komponente en hoogs buigsame monitering van ekologiese provinsies en hul veranderlikheid moontlik maak.
Die doel van hierdie navorsing is om die SAGE-metode bekend te stel, wat 'n ekologiese provinsie deur sy unieke plankton gemeenskapstruktuur definieer.Hier sal meer gedetailleerde inligting oor die fisiese/biogeochemiese/ekosisteemmodel en die parameterkeuse van die t-SNE en DBSCAN algoritmes verskaf word.
Die fisiese komponente van die model kom van die skatting van seesirkulasie en klimaat [ECCOv4;(37) die globale staat skatting beskryf deur (38).Die nominale resolusie van staatsberaming is 1/5.Die kleinste kwadrate-metode met Lagrangiese vermenigvuldiger-metode word gebruik om die aanvanklike en grenstoestande en interne modelparameters wat deur waarneming aangepas is te verkry, en daardeur 'n vrylopende MIT algemene siklusmodel (MITgcm) (39) te genereer, die model Na optimering kan die resultate opgespoor en waargeneem word.
Die biogeochemie/ekosisteem het 'n meer volledige beskrywing (dws vergelykings en parameterwaardes) in (2).Die model vang die sirkulasie van C, N, P, Si en Fe deur anorganiese en organiese damme vas.Die weergawe wat hier gebruik word, sluit 35 spesies fitoplankton in: 2 spesies mikroprokariote en 2 spesies mikroeukariote (geskik vir lae-voedingstof omgewings), 5 spesies Cryptomonas sphaeroides (met kalsiumkarbonaatbedekking), 5 spesies diasonium (Kan stikstof vasmaak, dus dit is nie beperk nie) die beskikbaarheid van opgeloste anorganiese stikstof), 11 diatome (wat 'n siliciumbedekking vorm), 10 gemengde-vegetatiewe flagellate (kan ander plankton fotosinteer en eet) en 16 Zooplankton (wei op ander plankton).Dit word "biogeochemiese funksionele groepe" genoem omdat hulle verskillende effekte op mariene biogeochemie het (40, 41) en word dikwels in waarnemings- en modelstudies gebruik.In hierdie model is elke funksionele groep saamgestel uit verskeie planktone van verskillende groottes, met 'n spanwydte van 0,6 tot 2500 μm ekwivalente sferiese deursnee.
Die parameters wat fitoplankton groei, weiding en sink beïnvloed, hou verband met grootte, en daar is spesifieke verskille tussen die ses fitoplankton funksionele groepe (32).Ten spyte van die verskillende fisiese raamwerke, is die resultate van die 51 planktonkomponente van die model in 'n aantal onlangse studies gebruik (42-44).
Van 1992 tot 2011 het die fisiese/biogeochemiese/ekosisteem-koppelingsmodel vir 20 jaar geloop.Die uitset van die model sluit planktonbiomassa, nutriëntkonsentrasie en nutriëntvoorsieningstempo (DIN, PO4, Si en Fe) in.In hierdie studie is die 20-jaar gemiddelde van hierdie uitsette gebruik as die inset van die Ekologiese Provinsie.Chl, die verspreiding van planktonbiomassa en voedingstofkonsentrasie en die verspreiding van funksionele groepe word vergelyk met satelliet- en in-situ waarnemings [sien (2, 44), Nota S1 en figuur.S1 tot S3].
Vir die SAGE-metode kom die hoofbron van willekeurigheid van die t-SNE-stap.Willekeurigheid belemmer herhaalbaarheid, wat beteken dat die resultate onbetroubaar is.Die SAGE-metode toets die robuustheid streng deur 'n stel parameters van t-SNE en DBSCAN te bepaal, wat trosse konsekwent kan identifiseer wanneer dit herhaal word.Die bepaling van die "verwarring" van die t-SNE parameter kan verstaan ​​word as die bepaling van die mate waarin die kartering van hoë na lae dimensies die plaaslike of globale kenmerke van die data moet respekteer.Het die verwarring van 400 en 300 iterasies bereik.
Vir die groeperingsalgoritme DBSCAN moet die minimum grootte en afstandmetriek van die datapunte in die groepering bepaal word.Die minimum getal word onder leiding van kundiges bepaal.Hierdie kennis weet wat pas by die huidige numeriese modelleringsraamwerk en resolusie.Die minimum getal is 100. 'n Hoër minimum waarde (minder as <135 voordat die boonste limiet van groen wyer word) kan oorweeg word, maar dit kan nie die samevoegingsmetode wat op BC-ongelykheid gebaseer is, vervang nie.Die graad van verbinding (Figuur 6A) word gebruik om die ϵ-parameter te stel, wat bevorderlik is vir hoër dekking (Figuur 6B).Konnektiwiteit word gedefinieer as die saamgestelde aantal trosse en is sensitief vir die ϵ-parameter.Laer konnektiwiteit dui op onvoldoende passing, wat streke kunsmatig saamgroepeer.Hoë konnektiwiteit dui op oorpassing.Oorpas is ook problematies, want dit wys dat aanvanklike ewekansige raaiskote tot onreproduceerbare resultate kan lei.Tussen hierdie twee uiterstes dui 'n skerp toename (gewoonlik "elmboog") die beste ϵ aan.In Figuur 6A sien jy 'n skerp toename in die plato-area (geel,> 200 trosse), gevolg deur 'n skerp afname (groen, 100 trosse), tot ongeveer 130, omring deur baie min trosse (blou, <60 trosse) ).In ten minste 100 blou gebiede oorheers óf een groep die hele oseaan (ϵ <0.42), óf die meeste van die see is nie geklassifiseer nie en word as geraas beskou (ϵ> 0.99).Die geel area het 'n hoogs veranderlike, onreproduceerbare trosverspreiding.Soos ϵ afneem, neem die geraas toe.Die skerp groeiende groen area word 'n elmboog genoem.Dit is 'n optimale streek.Alhoewel die waarskynlikheid t-SNE gebruik word, kan die BC-ongelykheid binne die provinsie steeds gebruik word om betroubare groepering te bepaal.Gebruik Figuur 6 (A en B), stel ϵ op 0.39.Hoe groter die minimum getal, hoe kleiner is die waarskynlikheid om die ϵ te bereik wat betroubare klassifikasie moontlik maak, en hoe groter is die groen area met 'n waarde groter as 135. Die vergroting van hierdie area dui aan dat die elmboog moeiliker sal wees om te vind of nie- bestaan.
Nadat die parameters van t-SNE gestel is, sal die totale aantal clusters gevind word as 'n maatstaf van konnektiwiteit (A) en die persentasie data wat aan die cluster (B) toegewys is.Die rooi kolletjie dui die beste kombinasie van dekking en konnektiwiteit aan.Die minimum getal word gestel volgens die minimum getal wat met ekologie verband hou.
Vir aanvullende materiaal vir hierdie artikel, sien asseblief http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Hierdie is 'n ooptoegangartikel wat onder die bepalings van die Creative Commons Erkenningslisensie versprei word.Die artikel laat onbeperkte gebruik, verspreiding en reproduksie in enige medium toe onder die voorwaarde dat die oorspronklike werk behoorlik aangehaal word.
Let wel: Ons vra jou net om jou e-posadres te verskaf sodat die persoon wat jy by die bladsy aanbeveel weet dat jy wil hê hulle moet die e-pos sien en dat dit nie strooipos is nie.Ons sal geen e-posadresse vaslê nie.
Hierdie vraag word gebruik om te toets of jy 'n besoeker is en om outomatiese strooipos indiening te voorkom.
Die Global Ministerie van Mariene Ekologie is vasbeslote om komplekse probleme op te los en gebruik ML sonder toesig om gemeenskapstrukture te verken.
Die Global Ministerie van Mariene Ekologie is vasbeslote om komplekse probleme op te los en gebruik ML sonder toesig om gemeenskapstrukture te verken.


Postyd: Jan-12-2021