Nekontrolita lernmetodo estas proponita por determini tutmondajn marajn ekologiajn provincojn (eko-provincoj) bazitajn sur planktonkomunumstrukturo kaj nutrafluodatenoj.La sistema integra ekologia provinco (SAGE) metodo povas identigi ekologiajn provincojn en tre neliniaj ekosistemmodeloj.Por adaptiĝi al la ne-gaŭsa kovarianco de la datenoj, SAGE uzas t hazardan najbaran enkonstruadon (t-SNE) por redukti la dimensiecon.Helpe de la brua aplikaĵo bazita sur la densecbazita spaca clustering (DBSCAN) algoritmo, pli ol cent ekologiaj provincoj povas esti identigitaj.Uzante la konekteblecmapon kun ekologiaj diferencoj kiel distanciniciaton, fortika agregita ekologia provinco (AEP) estas objektive difinita tra nestitaj ekologiaj provincoj.Uzante AEPojn, la kontrolo de nutra liverofteco sur komunuma strukturo estis esplorita.Eko-provinco kaj AEP estas unikaj kaj povas helpi modelan interpreton.Ili povas faciligi komparojn inter modeloj kaj povas plibonigi la komprenon kaj monitoradon de maraj ekosistemoj.
Provincoj estas regionoj kie kompleksa biogeografio surmara aŭ tero estas organizita en koheraj kaj signifaj areoj (1).Ĉi tiuj provincoj estas tre gravaj por kompari kaj kontrasti lokojn, karakterizi observaĵojn, monitoradon kaj protekton.La kompleksaj kaj ne-liniaj interagoj kiuj produktas tiujn provincojn igas nekontrolitajn maŝinlernadon (ML) metodojn tre taŭgaj por determinado de provincoj objektive, ĉar la kunvarianco en la datenoj estas kompleksa kaj ne-gaŭsa.Ĉi tie, ML-metodo estas proponita, kiu sisteme identigas unikajn marajn ekologiajn provincojn (eko-provincoj) de la Darwin tutmonda tridimensia (3D) fizika/ekosistemmodelo (2).La esprimo "unika" estas uzita por indiki ke la identigita areo ne sufiĉe interkovras kun aliaj areoj.Tiu metodo estas nomita la System Integrated Ecological Province (SAGE) metodo.Por elfari utilan klasifikon, algoritmometodo devas permesi (i) tutmondan klasifikon kaj (ii) multskalan analizon kiu povas esti nestita/agregata en spaco kaj tempo (3).En ĉi tiu esplorado, la SAGE-metodo unue estis proponita kaj la identigitaj ekologiaj provincoj estis diskutitaj.Ekoprovincoj povas antaŭenigi komprenon de la faktoroj kiuj kontrolas komunuman strukturon, disponigas utilajn komprenojn por monitorado de strategioj kaj helpas spuri ŝanĝojn en la ekosistemo.
Surteraj provincoj estas kutime klasifikitaj laŭ similecoj en klimato (precipitaĵo kaj temperaturo), grundo, vegetaĵaro kaj faŭno, kaj estas uzitaj por helpadministrado, biodiversecesplorado, kaj malsankontrolo (1, 4).Maraj provincoj estas pli malfacile difineblaj.La plej multaj organismoj estas mikroskopaj, kun fluidaj limoj.Longhurst et al.(5) Provizis unu el la unuaj tutmondaj klasifikoj de la Ministerio de Oceanografio bazita sur mediaj kondiĉoj.La difino de tiuj "Longhurst" provincoj inkludas variablojn kiel ekzemple miksa indico, tavoliĝo, kaj surradiado, same kiel la ampleksan sperton de Longhurst kiel mara oceanografo, kiu havas aliajn gravajn kondiĉojn por maraj ekosistemoj.Longhurst estis vaste uzata, ekzemple, por taksi primaran produktadon kaj karbonfluojn, helpi fiŝfarmojn kaj plani surloke-observajn agadojn (5-9).Por difini provincojn pli objektive, metodoj kiel ekzemple malklarkontura logiko kaj regiona nekontrolita grupigo/statistiko estis uzitaj (9-14).La celo de tiaj metodoj estas identigi signifajn strukturojn kiuj povas identigi provincojn en la haveblaj observaj datenoj.Ekzemple, dinamikaj maraj provincoj (12) uzas mem-organizajn mapojn por redukti bruon, kaj uzas hierarkian (arba-bazitan) grupigadon por determini marajn kolorproduktojn derivitajn de regionaj satelitoj [klorofilo a (Chl-a), normaligita Fluoresklinia alteco kaj kolora dissolvita organika materio] kaj fizika kampo (mara surfaca temperaturo kaj saleco, absoluta dinamika topografio kaj marglacio).
La komunuma strukturo de planktono maltrankviligas ĉar ĝia ekologio havas grandan influon sur pli altaj nutraĵniveloj, karbonsorbado kaj klimato.Tamen, estas ankoraŭ malfacila kaj evitema celo determini tutmondan ekologian provincon bazitan sur la planktonkomunuma strukturo.Maraj kolorsatelitoj eble povas doni sciojn pri la krud-grajna klasifiko de fitoplanktono aŭ sugesti la avantaĝojn de funkciaj grupoj (15), sed ili estas nuntempe nekapablaj disponigi detalajn informojn pri komunuma strukturo.Lastatempaj enketoj [ekz. Tara Ocean (16)] provizas senprecedencajn mezurojn de komunuma strukturo;nuntempe, ekzistas nur malabundaj surlokaj observoj je tutmonda skalo (17).Antaŭaj studoj plejparte determinis la "Biogeokemian Provincon" (12, 14, 18) surbaze de la determino de biokemiaj similecoj (kiel ekzemple primara produktado, Chl kaj disponebla lumo).Ĉi tie, la nombra modelo estas uzata por eligi [Darwin(2)], kaj la ekologia provinco estas determinita laŭ la komunuma strukturo kaj nutra fluo.La nombra modelo uzita en ĉi tiu studo havas tutmondan priraportadon kaj povas esti komparita kun ekzistantaj kampaj datumoj (17) kaj telesensaj kampoj (Noto S1).La nombraj modeldatenoj uzitaj en ĉi tiu studo havas la avantaĝon de tutmonda priraportado.La modelekosistemo konsistas el 35 specioj de fitoplanktono kaj 16 specioj de zooplanktono (bonvolu rilati al materialoj kaj metodoj).Modelaj planktonspecoj interagas nelinie kun ne-gaŭsaj kunvariancstrukturoj, tiel ke simplaj diagnozaj metodoj ne taŭgas por identigado de unikaj kaj koheraj padronoj en emerĝantaj komunumstrukturoj.La metodo SAGE prezentita ĉi tie disponigas novan manieron kontroli la produktadon de kompleksaj Darwin-modeloj.
La potencaj transformaj kapabloj de datumscienco/ML-teknologio povas ebligi superforte kompleksajn modelsolvojn malkaŝi kompleksajn sed fortigajn strukturojn en datuma kunvarianco.Fortika metodo estas difinita kiel metodo kiu povas fidele reprodukti la rezultojn ene de antaŭfiksita erarintervalo.Eĉ en simplaj sistemoj, determini fortigajn ŝablonojn kaj signalojn povas esti defio.Ĝis la raciaĵo kondukanta al la observita padrono estas determinita, la emerĝanta komplekseco povas ŝajni komplika/malfacila solvi.La ŝlosila procezo de fiksado de la kunmetaĵo de la ekosistemo estas nelinia en naturo.La ekzisto de ne-liniaj interagoj povas konfuzi fortikan klasifikon, tiel ke estas necese eviti metodojn kiuj faras fortajn supozojn pri la baza statistika distribuado de datenkunvarianco.Altdimensiaj kaj neliniaj datenoj estas oftaj en oceanografio kaj povas havi kunvariancstrukturon kun kompleksa, ne-gaŭsa topologio.Kvankam datenoj kun ne-gausiana kovariancstrukturo povas malhelpi fortikan klasifikon, la SAGE-metodo estas nova ĉar estas dizajnita por identigi aretojn kun arbitraj topologioj.
La celo de la SAGE-metodo estas objektive identigi emerĝantajn padronojn kiuj povas helpi plian ekologian komprenon.Sekvante aret-bazitan laborfluon similan al (19), la ekologiaj kaj nutraj fluvariabloj estas uzitaj por determini la nuran areton en la datenoj, nomita la ekologia provinco.La SAGE-metodo proponita en ĉi tiu studo (Figuro 1) unue reduktas la dimensiecon de 55 ĝis 11 dimensioj per sumado de la planktonfunkciaj grupoj difinitaj apriore (vidu Materialoj kaj Metodoj).Uzante t-hazardan najbaran enkonstruadon (t-SNE) metodon, la grandeco estas plue reduktita projekciante la probablecon en la 3D spacon.Nekontrolita grupigo povas identigi ekologie proksimajn areojn [densec-bazita spaca clustering (DBSCAN) por bru-bazitaj aplikoj].Kaj t-SNE kaj DBSCAN estas uzeblaj al la enecaj ne-liniaj ekosistemaj nombraj modeldatenoj.Poste reprojektu la rezultan ekologian provincon sur la teron.Oni identigis pli ol cent unikajn ekologiajn provincojn, taŭgajn por regionaj esploroj.Por pripensi la tutmonde konsekvencan ekosistemmodelon, la SAGE-metodo estas uzita por agregi la ekologiajn provincojn en agregitajn ekologiajn provincojn (AEP) por plibonigi la efikecon de la ekologiaj provincoj.La nivelo de agregado (nomita "komplekseco") povas esti alĝustigita al la nivelo de detalo bezonata.Determini la minimuman kompleksecon de fortika AEP.La fokuso de la selektado estas la SAGE-metodo kaj esplorado de la plej malgranda komplekseco AEP-kazoj por determini la kontrolon de la krizkomunuma strukturo.La ŝablonoj tiam povas esti analizitaj por disponigi ekologiajn komprenojn.La metodo enkondukita ĉi tie ankaŭ povas esti uzata por modela komparo pli vaste, ekzemple, per taksado de la lokoj de similaj ekologiaj provincoj trovitaj en malsamaj modeloj por reliefigi diferencojn kaj similecojn, por kompari modelojn.
(A) Skema diagramo de la laborfluo por determini la ekologian provincon;uzante la sumon en la funkcia grupo por redukti la originajn 55-dimensiajn datenojn al 11-dimensia modelproduktaĵo, inkluzive de la biomaso de sep funkcia/nutra planktono kaj kvar nutraĵprovizoprocentoj.Nekonsiderinda valoro kaj daŭrema glacikovra areo.La datumoj estis normigitaj kaj normigitaj.Provizu 11-dimensiajn datumojn al la t-SNE-algoritmo por reliefigi statistike similajn trajtajn kombinaĵojn.DBSCAN zorge elektos la areton por agordi la parametran valoron.Fine projekcii la datumojn reen al la latitudo/longitudo-projekcio.Bonvolu noti, ke ĉi tiu procezo estas ripetita 10 fojojn ĉar ioma hazardo povas esti generita aplikante t-SNE.(B) klarigas kiel akiri la AEP ripetante la laborfluon en (A) 10 fojojn.Por ĉiu el tiuj 10 efektivigoj, la interprovinca Bray-Curtis (BC) malsimilecmatrico estis determinita surbaze de la biomaso de 51 fitoplanktonspecoj.Determini la BC-diferencon inter provincoj, de komplekseco 1 AEP ĝis plena komplekseco 115. La BC-komparnormo estas fiksita fare de Longhurst Provinco.
La SAGE-metodo uzas la produktaĵon de la tutmonda 3D fizika/ekosistema nombra modelo por difini la ekologian provincon [Darwin (2);vidu Materialoj kaj Metodoj kaj Noto S1].La komponentoj de la ekosistemo estas kunmetitaj de 35 specioj de fitoplanktono kaj 16 specioj de zooplanktono, kun sep antaŭdifinitaj funkciaj grupoj: prokariotoj kaj eŭkariotoj adaptitaj al malaltaj nutraj medioj, kokdioj kun kalcia karbonata tegaĵo, kaj peza nitrogenfiksado Nitrogennutraĵoj (kutime mankas). gravaj nutraĵoj), kun silica kovraĵo, povas fari alian planktonfotosintezon kaj paŝti miksitajn nutrajn flagelatojn kaj zooplanktonpaŝtistojn.La grandecinterspaco estas 0,6 ĝis 2500μm ekvivalenta sfera diametro.La modeldistribuo de fitoplanktongrandeco kaj funkcia grupiĝo kaptas la totalajn karakterizaĵojn viditajn en satelitaj kaj surlokaj observaĵoj (vidu Figurojn S1 ĝis S3).La simileco inter la nombra modelo kaj la observita oceano indikas ke provincoj difinitaj per la modelo povas esti uzeblaj al la surloka oceano.Bonvolu noti ke tiu modelo nur kaptas certan diversecon de fitoplanktono, kaj nur certajn fizikajn kaj kemiajn devigajn intervalojn de la surloka oceano.La SAGE-metodo povas ebligi homojn pli bone kompreni la tre regionan kontrolmekanismon de la modelkomunuma strukturo.
Inkluzivante nur la sumon de surfacbiomaso (kun averaĝa tempo de 20 jaroj) en ĉiu planktonfunkcia grupo, la dimensieco de la datenoj povas esti reduktita.Post kiam pli fruaj studoj montris sian ŝlosilan rolon en fiksado de la komunuma strukturo, ĝi ankaŭ inkludis surfacfontajn terminojn por nutraj fluoj (provizo de nitrogeno, fero, fosfato kaj silicia acido) [ekz (20, 21)].La sumo de funkciaj grupoj reduktas la problemon de 55 (51 planktono kaj 4 nutraj fluoj) al 11 dimensioj.En ĉi tiu komenca studo, pro la komputilaj limoj truditaj per la algoritmo, profundo kaj tempoŝanĝebleco ne estis konsideritaj.
La SAGE-metodo povas identigi gravajn rilatojn inter neliniaj procezoj kaj esencaj ecoj de interagoj inter funkcia grupbiomaso kaj nutra fluo.Uzi 11-dimensiajn datumojn bazitajn sur eŭklidaj distanclernado-metodoj (kiel ekzemple K-mezaĵoj) ne povas akiri fidindajn kaj reprodukteblajn provincojn (19, 22).Ĉi tio estas ĉar neniu gaŭsa formo estas trovita en la baza distribuo de la kunvarianco de la ŝlosilaj elementoj kiuj difinas la ekologian provincon.La K-mezuro de Voronoi-ĉeloj (rektaj linioj) ne povas reteni la ne-Gausian bazan distribuon.
La biomaso de sep planktonfunkciaj grupoj kaj kvar nutraj fluoj formas 11-dimensian vektoron x.Tial, x estas vektora kampo sur la modela krado, kie ĉiu elemento xi reprezentas 11-dimensian vektoron difinitan sur la modela horizontala krado.Ĉiu indekso i unike identigas kradpunkton sur la sfero, kie (lon, lat) = (ϕi, θi).Se la biomaso de la modela krada unuo estas malpli ol 1.2×10-3mg Chl/m3 aŭ la glacia kovrado superas 70%, la protokolo de biomasaj datumoj estas uzata kaj forĵetita.La datenoj estas normaligitaj kaj normigitaj, do ĉiuj datumoj estas en la intervalo de [0 ĝis 1], la meznombro estas forigita kaj skalita al unuovarianco.Tio estas farita tiel ke la trajtoj (biomaso kaj nutra fluo) ne estas limigitaj per la kontrasto en la gamo de eblaj valoroj.Clustering devus kapti la ŝanĝrilaton de la ŝlosila probablodistanco inter la trajtoj prefere ol la geografia distanco.Kvantigante tiujn distancojn, gravaj trajtoj aperas, dum nenecesaj detaloj estas forĵetitaj.De ekologia vidpunkto, tio estas necesa ĉar kelkaj specoj de fitoplanktono kun malmulte da biomaso povas havi pli grandajn biogeokemiajn efikojn, kiel ekzemple nitrogenfiksado de diazotrofaj bakterioj.Dum normigado kaj normaligo de datumoj, ĉi tiuj specoj de kovariaĵoj estos reliefigitaj.
Substrekante la proksimecon de ecoj en alt-dimensia spaco en malalt-dimensia reprezentantaro, la t-SNE-algoritmo estas utiligita por igi ekzistantajn similajn regionojn pli klaraj.Antaŭa laboro celita al konstruado de profundaj neŭralaj retoj por telesensaj aplikoj uzis t-SNE, kiu pruvis sian kapablon en disigado de ŝlosilaj trajtoj (23).Ĉi tio estas necesa paŝo por identigi fortikan grupigon en la ĉefdatenoj evitante ne-konverĝajn solvojn (noto S2).Uzante gaŭsajn kernojn, t-SNE konservas la statistikajn trajtojn de la datenoj mapante ĉiun alt-dimensian objekton al punkto en la 3D fazspaco, tiel certigante ke la probableco de similaj objektoj en la altaj kaj malaltaj direktoj estas alta en alta. dimensia spaco (24).Donita aro de N alt-dimensiaj objektoj x1,..., xN, la t-SNE-algoritmo reduktas minimumigante la Kullback-Leibler (KL) diverĝon (25).KL-diverĝo estas kvanto de kiom malsama probablodistribuo estas de dua referenca verŝajnecdistribuo, kaj povas efike taksi la eblecon de korelacio inter malalt-dimensiaj reprezentadoj de alt-dimensiaj ecoj.Se xi estas la i-a objekto en N-dimensia spaco, xj estas la j-a objekto en N-dimensia spaco, yi estas la i-a objekto en malalt-dimensia spaco, kaj yj estas la j-a objekto en malalta -dimensia spaco, tiam t -SNE difinas la simileca probablo ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), kaj por la dimensia redukta aro q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Figuro 2A ilustras la efikon de reduktado de la biomaso kaj nutraj fluvektoroj de la 11-dimensia kombinaĵo al 3D.La instigo de aplikado de t-SNE povas esti komparita kun la instigo de ĉefkomponentanalizo (PCA), kiu uzas la variantributon por emfazi la areon/atributon de la datenoj, tiel reduktante la dimensiecon.La t-SNE-metodo estis trovita esti pli bona ol PCA provizante fidindajn kaj reprodukteblajn rezultojn por la Eco-Ministerio (vidu Noton S2).Ĉi tio povas esti ĉar la ortogonaleca supozo de PCA ne taŭgas por identigi kritikajn interagojn inter tre neliniaj interagaj trajtoj, ĉar PCA temigas liniajn kunvariancstrukturojn (26).Uzante telesensajn datumojn, Lunga et al.(27) ilustras kiel uzi la SNE-metodon por elstarigi kompleksajn kaj neliniajn spektrajn ecojn kiuj devias de la gaŭsa distribuo.
(A) Modeligita nutra provizorapideco, fitoplanktono kaj zooplankton-funkcia grupbiomaso desegnita per la t-SNE-algoritmo kaj kolorigita de provinco uzante DBSCAN.Ĉiu punkto reprezentas punkton en la alt-dimensia spaco, kiel montrite en Figuro 6B, la plej multaj punktoj estas kaptitaj.Ŝaftoj rilatas al "t-SNE" grandecoj 1, 2 kaj 3. (B) La geografia projekcio de la provinco trovita fare de DBSCAN sur la latitudo-longitudo krado de la origino.La koloro devus esti rigardata kiel ajna koloro, sed devus respondi al (A).
La punktoj en la t-SNE-disvastigo en Figuro 2A estas respektive rilataj al latitudo kaj longitudo.Se la du punktoj en Figuro 2A estas proksimaj unu al la alia, tio estas ĉar ilia biomaso kaj nutraj fluoj estas similaj, ne pro geografia proksimeco.La koloroj en Figuro 2A estas aretoj malkovritaj per la DBSCAN-metodo (28).Serĉante densajn observaĵojn, la DBSCAN-algoritmo uzas la distancon en la 3D-reprezento inter la punktoj (ϵ = 0.39; por informoj pri ĉi tiu elekto, vidu Materialoj kaj Metodoj), kaj la nombro da similaj punktoj estas postulata por difini la areton (ĉi tie 100 poentoj, bonvolu vidi supre).La DBSCAN-metodo ne faras iujn ajn supozojn pri la formo aŭ nombro da aretoj en la datenoj, kiel montrite malsupre:
3) Por ĉiuj punktoj identigitaj kiel ene de la distanco ene, ripetu paŝon 2 ripete por determini la aretlimon.Se la nombro da punktoj estas pli granda ol la fiksita minimuma valoro, ĝi estas indikita kiel areto.
Datenoj kiuj ne renkontas la minimuman aretmembron kaj distancon ϵ-metrikon estas konsideritaj "bruo" kaj ne ricevas koloron.DBSCAN estas rapida kaj skalebla algoritmo kun O(n2) agado en la plej malbona kazo.Por la nuna analizo, ĝi ne estas fakte hazarda.La minimuma nombro da poentoj estas determinita de fakula taksado.Post ĝustigi la distancon, la rezulto ne estas sufiĉe stabila en la intervalo de ≈±10.Ĉi tiu distanco estas agordita uzante konekteblecon (Figuro 6A) kaj oceanan kovroprocenton (Figuro 6B).Konektebleco estas difinita kiel la kunmetita nombro da aretoj kaj estas sentema al la ϵ parametro.Pli malalta konektebleco indikas nesufiĉan konvenon, artefarite grupigante regionojn kune.Alta konektebleco indikas troagordon.Estas penseble uzi pli altan minimumon, sed se la minimumo superas ĉ, estas neeble atingi fidindan solvon.135 (Por pliaj detaloj, vidu Materialoj kaj Metodoj).
La 115 aretoj identigitaj en Figuro 2A estas projekciitaj reen sur la teron en Figuro 2B.Ĉiu koloro egalrilatas al kohera kombinaĵo de biogeokemiaj kaj ekologiaj faktoroj identigitaj fare de DBSCAN.Post kiam la aretoj estas determinitaj, la asocio de ĉiu punkto en Figuro 2A kun specifa latitudo kaj longitudo kutimas projekcii la aretojn reen al la geografia areo.Figuro 2B ilustras tion per la samaj aretkoloroj kiel Figuro 2A.Similaj koloroj ne devus esti interpretitaj kiel ekologia simileco, ĉar ili estas asignitaj per la sinsekvo en kiu aretoj estas malkovritaj per la algoritmo.
La areo en Figuro 2B povas esti kvalite simila al establita areo en la fizika kaj/aŭ biogeokemio de la oceano.Ekzemple, la aretoj en la Suda Oceano estas zon-simetriaj, kun oligotrofaj vorticoj aperantaj, kaj la akra transiro indikas la influon de alizo.Ekzemple, en la ekvatora Pacifiko, malsamaj regionoj rilataj al la pliiĝo vidiĝas.
Por kompreni la ekologian medion de la Eko-Provinco, vario de la diferenco-indico de Bray-Curtis (BC) (29) estis uzata por taksi la ekologion en la areto.La BC-indikilo estas statistika datumo uzata por kvantigi la diferencon en komunuma strukturo inter du malsamaj ejoj.La mezurado de BC estas aplikebla al la biomaso de 51 specioj de fitoplanktono kaj zooplanktono BCninj = 1-2CninjSni + Snj
BCninj rilatas al la simileco inter kombinaĵo ni kaj kombinaĵo nj, kie Cninj estas la minimuma valoro de ununura speco de biomaso kiu ekzistas en ambaŭ kombinaĵoj ni kaj nj, kaj Sni reprezentas la sumon de ĉiuj biomasoj kiuj ekzistas en ambaŭ kombinaĵoj ni kaj Snj.La BC-diferenco estas simila al la distancomezuro, sed funkcias en ne-eŭklida spaco, kiu verŝajne pli taŭgas por ekologiaj datenoj kaj ĝia interpreto.
Por ĉiu areto identigita en Figuro 2B, la simileco de intra-provinca kaj inter-provinca BC povas esti taksita.La BC-diferenco ene de provinco rilatas al la diferenco inter la meza valoro de la provinco kaj ĉiu punkto en la provinco.La diferenco inter BC-provincoj rilatas al la simileco inter unu provinco kaj aliaj provincoj.Figuro 3A montras simetrian BC-matricon (0, nigra: tute responda; 1, blanka: tute malsimila).Ĉiu linio en la grafikaĵo montras ŝablonon en la datumoj.Figuro 3B montras la geografian signifon de la rezultoj de BC en Figuro 3A por ĉiu provinco.Por provinco en malalta nutrado kaj malalta nutra areo, Figuro 3B montras, ke la simetrio de grandaj areoj ĉirkaŭ la ekvatoro kaj la Hinda Oceano estas esence simila, sed la pli altaj latitudoj kaj suprenfluaj areoj estas signife malsamaj.
(A) La grado da BC-diferenco taksita por ĉiu provinco surbaze de la tutmonda 20-jara averaĝa tutmonda surfacmezumo de 51 planktono.Notu la atendatan simetrion de la valoroj.(B) La spaca projekcio de kolono (aŭ vico).Por provinco en distrofa cirklo, la tutmonda distribuo de la BC-simileco estis taksita, kaj la tutmonda 20-jara mezumo estis taksita.Nigra (BC = 0) signifas la saman areon, kaj blanka (BC = 1) signifas neniun similecon.
Figuro 4A ilustras la diferencon en BC ene de ĉiu provinco en Figuro 2B.Determinite uzante la mezan kombinaĵon de la meza areo en areto, kaj determinante la malsimilecon inter la BC kaj la meznombro de ĉiu kradpunkto en la provinco, ĝi montras ke la SAGE-metodo povas bone apartigi 51 speciojn surbaze de la ekologia simileco Tipo de modelaj datumoj.La totala meza areto BC-malsimileco de ĉiuj 51 tipoj estas 0.102±0.0049.
(A, B, kaj D) La BC-diferenco ene de la provinco estas taksita kiel la meza BC-diferenco inter ĉiu kradpunktokomunumo kaj la meza provinco, kaj la komplekseco ne estas reduktita.(2) La tutmonda averaĝa intraprovinca BC-diferenco estas 0.227±0.117.Ĉi tiu estas la komparnormo de ekologia instigo-bazita klasifiko proponita de ĉi tiu laboro [verda linio en (C)].(C) Meza intra-provinca BC-diferenco: La nigra linio reprezentas la intra-provincan BC-diferencon kun kreskanta komplekseco.2σ venas de 10 ripetoj de la ekoprovinca identiga procezo.Por la totala komplekseco de la provincoj malkovritaj fare de DBSCAN, (A) montras ke la BC-malsimileco en la provinco estas 0.099, kaj la kompleksecklasifiko proponita per (C) estas 12, rezultigante BC-malsimilecon de 0.200 en la provinco.kiel la bildo montras.(D).
En figuro 4B, la biomaso de 51 planktonspecoj kutimas reprezenti la ekvivalentan BC-diferencon en Longhurst-provinco.La totala mezumo de ĉiu provinco estas 0.227, kaj la norma devio de la kradpunktoj rilate al la diferenco en BC-provinco estas 0.046.Ĉi tio estas pli granda ol la areto identigita en Figuro 1B.Anstataŭe, uzante la sumon de la sep funkciaj grupoj, la meza intrasezona BC-malsimileco en Longhurst pliiĝis al 0.232.
La tutmonda eko-provinca mapo disponigas malsimplajn detalojn de unikaj ekologiaj interagoj kaj plibonigoj estis faritaj en uzado de la tuta ekosistemstrukturo de Longhurst Provinco.La Ministerio pri Ekologio estas atendita doni sciojn pri la procezo de kontrolo de la nombra modelekosistemo, kaj ĉi tiu kompreno helpos la esploradon de kamplaboro.Por la celo de ĉi tiu esplorado, ne eblas plene montri pli ol cent provincojn.La sekva sekcio enkondukas la metodon SAGE, kiu resumas la provincojn.
Unu el la celoj de la provinco estas antaŭenigi komprenon de la loko kaj administrado de la provinco.Por determini krizajn situaciojn, la metodo en Figuro 1B ilustras la nestadon de ekologie similaj provincoj.Ekoprovincoj estas grupigitaj surbaze de ekologia simileco, kaj tia grupiĝo de provincoj estas nomita AEP.Fiksu alĝustigeblan "kompleksecon" bazitan sur la tuta nombro de konsiderotaj provincoj.La termino "komplekseco" estas uzata ĉar ĝi permesas alĝustigi la nivelon de krizaj atributoj.Por difini signifajn agregaĵojn, la meza intra-provinca BC-diferenco de 0.227 de Longhurst estas utiligita kiel la komparnormo.Sub ĉi tiu komparnormo, la kombinitaj provincoj ne plu estas konsiderataj utilaj.
Kiel montrite en Figuro 3B, la tutmondaj ekologiaj provincoj estas koheraj.Uzante inter-provincajn BC-diferencojn, povas esti vidite ke kelkaj konfiguracioj estas tre "oftaj".Inspirite de genetikaj kaj grafteoriaj metodoj, "ligitaj grafeoj" estas uzataj por ordigi >100 provincojn surbaze de la plej similaj provincoj al ili.La "konekteco" metriko ĉi tie estas determinita uzante inter-provincan BC-malsimilecon (30).La nombro da provincoj kun pli granda spaco por klasifiko de> 100 provincoj povas esti referita ĉi tie kiel komplekseco.AEP estas produkto kiu klasifikas pli ol 100 provincojn kiel la plej dominajn/plej proksimajn ekologiajn provincojn.Ĉiu ekologia provinco estas asignita al la domina/tre ligita ekologia provinco kiu plej similas al ili.Tiu agregado determinita per la BC-diferenco permesas nestitan aliron al la tutmonda ekologio.
La elektita komplekseco povas esti ajna valoro de 1 ĝis la kompleta komplekseco de FIG.2A.Ĉe pli malalta komplekseco, AEP povas degeneri pro la probabilisma dimensia reduktopaŝo (t-SNE).Degenero signifas ke ekologiaj provincoj povas esti asignitaj al malsamaj AEPoj inter ripetoj, tiel ŝanĝante la geografian areon kovritan.Figuro 4C ilustras la disvastiĝon de BC-malsimilecoj ene de provincoj en AEPoj de kreskanta komplekseco trans 10 efektivigoj (ilustraĵo en Figuro 1B).En figuro 4C, 2σ (blua areo) estas kvanto de degenero en 10 efektivigoj, kaj la verda linio reprezentas la Longhurst-komparnormon.Faktoj pruvis, ke la komplekseco de 12 povas konservi la BC-diferencon en la provinco sub la Longhurst-komparnormo en ĉiuj efektivigoj kaj konservi relative malgrandan 2σ-degeneron.En resumo, la minimuma rekomendita komplekseco estas 12 AEPoj, kaj la meza intraprovinca BC-diferenco taksita uzante 51 planktonspecojn estas 0.198±0.013, kiel montrite en Figuro 4D.Uzante la sumon de sep planktonfunkciaj grupoj, la meza BC-diferenco ene de la provinco estas 2σ anstataŭe de 0.198±0.004.La komparo inter la BC-diferencoj kalkulitaj kun la totala biomaso de la sep funkciaj grupoj aŭ la biomaso de ĉiuj 51 planktonspecoj montras ke kvankam la SAGE-metodo estas aplikebla al la 51-dimensia situacio, ĝi estas por la totala biomaso de la sep funkciaj grupoj. Por trejnado.
Depende de la celo de iu esplorado, malsamaj niveloj de komplekseco povas esti pripensitaj.Regionaj studoj povas postuli plenan kompleksecon (t.e., ĉiuj 115 provincoj).Kiel ekzemplo kaj por klareco, konsideru la minimuman rekomenditan kompleksecon de 12.
Kiel ekzemplo de la utileco de la SAGE-metodo, 12 AEPoj kun minimuma komplekseco de 12 estas uzataj ĉi tie por esplori la kontrolon de la krizkomunuma strukturo.Figuro 5 ilustras la ekologiajn komprenojn grupigitajn de AEP (de A ĝis L): En Redfield-stoiĥiometrio, geografia amplekso (Figuro 5C), funkcia grupa biomasa konsisto (Figuro 5A) kaj nutra provizo (Figuro 5B) estas faritaj de N Zoomed.La proporcio (N:Si:P:Fe, 1:1:16:16×103) estas montrita.Por ĉi-lasta panelo, P multobligita per 16 kaj Feo multiplikita per 16×103, do la strekgrafiko estas ekvivalenta al la nutropostuloj de fitoplanktono.
La provincoj estas klasifikitaj en 12 AEPoj A al L. (A) Biomaso (mgC/m3) de ekosistemoj en 12 provincoj.(B) La nutra flukteco de solvita neorganika nitrogeno (N), fero (Fe), fosfato (P) kaj silicia acido (Si) (mmol/m3 jare).Fe kaj P estas multobligitaj per 16 kaj 16×103, respektive, tiel ke la strioj estas normigitaj al fitoplanktonaj stoiĥiometriopostuloj.(C) Notu la diferencon inter polusaj regionoj, subtropikaj ciklonoj kaj gravaj laŭsezonaj/altiĝantaj regionoj.La monitoraj stacioj estas markitaj jene: 1, SELOJ;2, ALOHA;3, stacidomo P;kaj 4, VESPERTOJ.
La identigita AEP estas unika.Estas iom da simetrio ĉirkaŭ la ekvatoro en la Atlantika kaj Pacifika Oceanoj, kaj simila sed pligrandigita areo ekzistas en la Hinda Oceano.Kelkaj AEPoj ampleksas la okcidentan flankon de la kontinento asociita kun la supreniro.La Suda Polusa Ĉirkaŭpolusa Fluo estas rigardata kiel granda zona trajto.Subtropika ciklono estas kompleksa serio de oligotrofa AEP.En tiuj provincoj, la konata padrono de biomasdiferencoj inter plankton-dominitaj oligotrofaj vorticoj kaj diatomeo-riĉaj polusregionoj estas evidenta.
AEPoj kun tre simila totala fitoplanktonbiomaso povas havi tre malsamajn komunumstrukturojn kaj kovri malsamajn geografiajn areojn, kiel ekzemple D, H, kaj K, kiuj havas similan totalan fitoplanktonbiomason.AEP H plejparte ekzistas en la ekvatora Hinda Oceano, kaj ekzistas pli da diazotrofaj bakterioj.AEP D estas trovita en pluraj basenoj, sed ĝi estas precipe elstara en la Pacifiko ĉirkaŭ alt-rendimentaj areoj ĉirkaŭ la ekvatora suprenfluo.La formo de tiu Pacifika provinco memorigas pri planeda ondotrajno.Estas malmultaj diazobakterioj en AEP D, kaj pli da konusoj.Kompare kun la aliaj du provincoj, AEP K estas nur trovita en la altebenaĵoj de la Arkta Oceano, kaj ekzistas pli da diatomeoj kaj malpli da planktonoj.Notindas, ke la kvanto de planktono en ĉi tiuj tri regionoj ankaŭ estas tre malsama.Inter ili, la planktonabundo de AEP K estas relative malalta, dum tiu de AEP D kaj H estas relative alta.Tial, malgraŭ ilia biomaso (kaj tial simila al Chl-a), tiuj provincoj estas tre malsamaj: Chl-bazita provinctestado eble ne kaptas tiujn diferencojn.
Estas ankaŭ evidente ke kelkaj AEPoj kun tre malsama biomaso povas esti similaj laŭ fitoplanktonkomunumstrukturo.Ekzemple, tio estas videbla en AEP D kaj E. Ili estas proksimaj unu al la alia, kaj en la Pacifika Oceano, AEP E estas proksima al la tre produktiva AEPJ.Simile, ekzistas neniu klara ligo inter fitoplanktonbiomaso kaj zooplanktonabundo.
AEP povas esti komprenita laŭ la nutraĵoj provizitaj al ili (Figuro 5B).Diatomeoj ekzistas nur kie ekzistas ampleksa provizo de silicia acido.Ĝenerale, ju pli alta la provizo de silicia acido, des pli alta la biomaso de diatomeoj.Diatomeoj povas esti viditaj en AEP A, J, K kaj L. La rilatumo de diatomeo-biomaso relative al alia fitoplanktono estas determinita per la N, P kaj Fe disponigita relative al la diatomeopostulo.Ekzemple, AEP L estas dominita per diatomeoj.Kompare kun aliaj nutraĵoj, Si havas la plej altan provizon.En kontrasto, malgraŭ pli alta produktiveco, AEP J havas malpli da diatomeoj kaj malpli da silicioprovizo (ĉio kaj relative al aliaj nutraĵoj).
Diazoniaj bakterioj havas la kapablon fiksi nitrogenon, sed kreskas malrapide (31).Ili kunekzistas kun alia fitoplanktono, kie fero kaj fosforo estas troaj rilate al la postulo je ne-diazoniaj nutraĵoj (20, 21).Indas rimarki, ke la diazotrofa biomaso estas relative alta, kaj la provizo de Fe kaj P estas relative granda rilate al la provizo de N. Tiamaniere, kvankam la totala biomaso en AEP J estas pli alta, la diazonia biomaso en AEP H estas pli granda ol tiu en J. Bonvolu noti ke AEP J kaj H estas geografie tre malsamaj, kaj H situas en la ekvatora Hinda Oceano.
Se la unika ekosistemstrukturo ne estas dividita en provincojn, la komprenoj akiritaj de la plej malaltaj kompleksecmodeloj de la 12 AEP ne estos tiel klaraj.La AEP generita de SAGE faciligas la koheran kaj samtempan komparon de kompleksaj kaj altdimensiaj informoj de ekosistemmodeloj.AEP efike emfazas kial Chl ne estas bona kaj alternativa metodo por determini komunumstrukturon aŭ zooplanktonabundon sur pli altaj nutraĵniveloj.Detala analizo de daŭrantaj esplortemoj estas preter la amplekso de ĉi tiu artikolo.La SAGE-metodo disponigas manieron esplori aliajn mekanismojn en la modelo kiu estas pli facile pritraktebla ol punkt-al-punkta spektado.
La SAGE-metodo estas proponita helpi klarigi ekstreme kompleksajn ekologiajn datenojn de tutmondaj fizikaj/biogeokemiaj/ekosistemaj nombraj modeloj.La ekologia provinco estas determinita per la totala biomaso de trans-planktonaj funkciaj grupoj, la apliko de t-SNE-probableca dimensia redukto-algoritmo kaj la grupigo uzante la nekontrolitan ML-metodon DBSCAN.La interprovinca BC-diferenco/grafeoteorio por nesta metodo estas aplikita por derivi fortikan AEP kiu povas esti uzita por tutmonda interpreto.Koncerne konstruon, la Eko-Provinco kaj AEP estas unikaj.La nestumado de AEP povas esti alĝustigita inter la plena komplekseco de la origina ekologia provinco kaj la rekomendita minimuma sojlo de 12 AEPoj.Nestumado kaj determini la minimuman kompleksecon de AEP estas konsideritaj ŝlosilaj paŝoj, ĉar la verŝajneco t-SNE degeneras AEPojn de <12 komplekseco.La SAGE-metodo estas tutmonda, kaj ĝia komplekseco varias de> 100 AEPoj ĝis 12. Por simpleco, la nuna fokuso estas sur la komplekseco de 12 tutmondaj AEPoj.Estonta esplorado, precipe regionaj studoj, povas trovi pli malgrandan spacan subaron de la tutmondaj ekoprovincoj utila, kaj povas esti agregata en pli malgranda areo por utiligi la samajn ekologiajn komprenojn diskutitajn ĉi tie.Ĝi disponigas sugestojn pri kiel tiuj ekologiaj provincoj kaj la komprenoj akiritaj de ili povas esti uzitaj por plia ekologia kompreno, faciligi modelkomparon, kaj eble plibonigas la monitoradon de maraj ekosistemoj.
La ekologia provinco kaj AEP identigita per la SAGE-metodo estas bazitaj sur la datenoj en la nombra modelo.Laŭ difino, la nombra modelo estas simpligita strukturo, provanta kapti la esencon de la celsistemo, kaj malsamaj modeloj havos malsaman distribuadon de planktono.La nombra modelo utiligita en tiu studo ne povas plene kapti kelkajn el la observitaj padronoj (ekzemple, en la Chl-taksoj por la ekvatora regiono kaj la Suda Oceano).Nur malgranda parto de la diverseco en la reala oceano estas kaptita, kaj la mezo kaj sub-mezoskaloj ne povas esti solvitaj, kiuj povas influi nutran fluon kaj pli malgrand-skalan komunuman strukturon.Malgraŭ ĉi tiuj mankoj, rezultas, ke AEP estas tre utila por helpi kompreni kompleksajn modelojn.Analizante kie similaj ekologiaj provincoj estas trovitaj, AEP disponigas eblan nombran modelan komparilon.La nuna nombra modelo kaptas la ĝeneralan ŝablonon de telesensa fitoplanktono Chl-a koncentriĝo kaj la distribuo de planktongrandeco kaj funkcia grupo (Noto S1 kaj Figuro S1) (2, 32).
Kiel montrite per la 0.1 mgChl-a/m-3 konturlinio, AEP estas dividita en oligotrofa areon kaj mezotrofa areon (Figuro S1B): AEP B, C, D, E, F kaj G estas oligotrofaj areoj, kaj la ceteraj areoj estas situis Supera Chl-a.AEP montras iun korespondadon kun Longhurst Provinco (Figuro S3A), ekzemple, la Suda Oceano kaj la ekvatora Pacifiko.En kelkaj regionoj, AEP kovras multoblajn Longhurst-regionojn, kaj inverse.Ĉar la intenco limigi provincojn en ĉi tiu areo kaj Longhurst estas malsama, estas atendite ke ekzistos diferencoj.Multoblaj AEPoj en Longhurst-provinco indikas ke certaj areoj kun simila biogeokemio povas havi tre malsamajn ekosistemstrukturojn.AEP elmontras certan korespondadon kun fizikaj statoj, kiel rivelita uzante nekontrolitan lernadon (19), kiel ekzemple en altaj suprenfluaj ŝtatoj (ekzemple, la Suda Oceano kaj la ekvatora Pacifiko; Figuro S3, C kaj D).Tiuj korespondado indikas ke la komunuma strukturo de planktono estas forte influita per oceandinamiko.En lokoj kiel ekzemple la Norda Atlantiko, AEP krucas fizikajn provincojn.La mekanismo, kiu kaŭzas ĉi tiujn diferencojn, povas inkluzivi procezojn kiel transporto de polvo, kiu povas konduki al tute malsamaj nutraj programoj eĉ sub similaj fizikaj kondiĉoj.
La Ministerio de Ekologio kaj AEP atentigis, ke uzi Chl sole ne povas identigi ekologiajn komponantojn, kiel la mara ekologia komunumo jam konstatis.Tio vidiĝas en AEPoj kun simila biomaso sed signife malsama ekologia kunmetaĵo (kiel ekzemple D kaj E).En kontrasto, AEPoj kiel ekzemple D kaj K havas tre malsaman biomason sed similan ekologian kunmetaĵon.AEP emfazas ke la rilato inter biomaso, ekologia kunmetaĵo kaj zooplanktona abundo estas kompleksa.Ekzemple, kvankam AEP J elstaras laŭ fitoplanktono kaj planktonbiomaso, AEP's A kaj L havas similan planktonbiomason, sed A havas pli altan planktonabundon.AEP emfazas ke fitoplanktonbiomaso (aŭ Chl) ne povas esti uzita por antaŭdiri zooplanktonbiomason.Zooplanktono estas la fundamento de la fiŝkapta nutroĉeno, kaj pli precizaj taksoj povas konduki al pli bona administrado de rimedoj.Estontaj markolorsatelitoj [ekzemple, PACE (planktono, aerosolo, nubo, kaj mara ekosistemo)] povas esti pli bone poziciigitaj por helpi taksi la komunumstrukturon de fitoplanktono.Uzi AEP-prognozon eble povas faciligi la takson de zooplanktono de spaco.Metodoj kiel SAGE, kunligitaj kun novaj teknologioj, kaj pli kaj pli da kampaj datumoj disponeblaj por grundaj veraj enketoj (kiel ekzemple Tara kaj sekva esplorado), povas kune fari paŝon al satelit-bazita ekosistemsanmonitorado.
La SAGE-metodo disponigas oportunan manieron analizi kelkajn mekanismojn kiuj kontrolas provinckarakterizaĵojn, kiel ekzemple biomaso/Chl, neta primara produktado, kaj komunumstrukturo.Ekzemple, la relativa kvanto de diatomeoj estas metita per malekvilibro en la liverado de Si, N, P, kaj Fe relative al la fitoplanktonaj stoiĥiometriaj postuloj.Je ekvilibra provizorapideco, la komunumo estas dominita per diatomeoj (L).Kiam la liverkvanto estas malekvilibra (t.e., la liverado de silicio estas pli malalta ol la nutra postulo de diatomeoj), diatomeoj respondecas pri nur malgranda parto Akcio (K).Kiam la provizo de Fe kaj P superas la provizon de N (ekzemple, E kaj H), la diazotrofaj bakterioj vigle kreskos.Per la kunteksto provizita de AEP, la esplorado de kontrolmekanismoj fariĝos pli utila.
La Eko-Provinco kaj AEP estas areoj kun similaj komunumstrukturoj.La temposerio de certa loko ene de ekologia provinco aŭ AEP povas esti rigardita kiel referencpunkto kaj povas reprezenti la areon kovritan fare de la ekologia provinco aŭ AEP.Longperspektivaj surlokaj monitoradstacioj disponigas tiajn temposerion.Longperspektivaj surlokaj datumaj aroj daŭre ludos nekalkuleblan rolon.De la perspektivo de monitorado de komunumstrukturo, la SAGE-metodo povas esti vidita kiel maniero helpi determini la plej utilan lokon de novaj ejoj.Ekzemple, la temposerio de la longperspektiva oligotrofa vivejtakso (ALOHA) estas en la AEP B de la oligotrofa areo (Figuro 5C, etikedo 2).Ĉar ALOHA estas proksima al la limo de alia AEP, la temposerio eble ne estas reprezenta de la tuta areo, kiel antaŭe sugestite (33).En la sama AEP B, la temposerio SEATS (Sudorienta Azia Temposerio) situas en sudokcidenta Tajvano (34), pli for de la limoj de aliaj AEPoj (Figuro 5C, etikedo 1), kaj povas esti uzata kiel pli bona loko por monitori. AEPB.La VESPERTOJ (Bermuda Atlantic Time Series Study) temposerio (Figuro 5C, etikedo 4) en AEPC estas tre proksima al la limo inter AEP C kaj F, kiu indikas ke monitorado de AEP C uzanta BATS-temposerion povas rekte esti problema.Stacio P en AEP J (Figuro 5C, etikedo 3) estas malproksima de la AEP-limo, do ĝi estas pli reprezenta.La Eko-Provinco kaj AEP povas helpi establi monitoradkadron taŭgan por taksi tutmondajn ŝanĝojn, ĉar la permeso de la provincoj taksi kie surloka specimenigo povas disponigi ŝlosilajn komprenojn.La SAGE-metodo povas esti plue evoluigita por esti aplikita al klimatdatenoj por taksi tempŝparan ŝanĝeblecon.
La sukceso de la SAGE-metodo estas atingita per zorgema aplikado de datumscienco/ML-metodoj kaj domajna specifa scio.Specife, t-SNE kutimas elfari dimensiecredukton, kiu konservas la kovariancstrukturon de alt-dimensiaj datenoj kaj faciligas bildigon de kovarianctopologio.La datenoj estas aranĝitaj en la formo de strioj kaj kunvariancoj (Figuro 2A), indikante ke pure distancaj mezuroj (kiel ekzemple K-mezaĵoj) ne taŭgas ĉar ili kutime uzas gaŭsan (cirklan) bazdistribuon (diskutitan en Noto S2) .La DBSCAN-metodo taŭgas por iu kunvarianca topologio.Dum vi atentas fiksi parametrojn, fidinda identigo povas esti provizita.La komputila kosto de la t-SNE-algoritmo estas alta, kiu limigas sian nunan aplikon al pli granda kvanto de datenoj, kio signifas ke estas malfacile apliki al profundaj aŭ temp-variaj kampoj.Laboro pri la skaleblo de t-SNE estas en progreso.Ĉar KL-distanco estas facile paraleligebla, la t-SNE-algoritmo havas bonan potencialon por ekspansio en la estonteco (35).Ĝis nun, aliaj esperigaj dimensiecreduktometodoj kiuj povas pli bone redukti la grandecon inkludas unuigitan multnombrajn aproksimadon kaj projekcion (UMAP) teknikojn, sed taksado en la kunteksto de oceandatenoj estas necesa.La signifo de pli bona skaleblo estas, ekzemple, klasifikado de tutmondaj klimatoj aŭ modeloj kun malsama komplekseco sur miksita tavolo.Areoj kiuj ne estas klasifikitaj fare de SAGE en iu provinco povas esti rigarditaj kiel la ceteraj nigraj punktoj en Figuro 2A.Geografie, tiuj areoj estas plejparte en tre laŭsezonaj lokoj, kio indikas ke kapti ekologiajn provincojn kiuj ŝanĝiĝas kun la tempo disponigos pli bonan priraportadon.
Por konstrui la SAGE-metodon, ideoj de kompleksaj sistemoj/datumscienco estis utiligitaj, uzante la kapablon determini aretojn de funkciaj grupoj (la ebleco de esti tre proksima en 11-dimensia spaco) kaj determini provincojn.Ĉi tiuj provincoj prezentas specifajn volumojn en nia 3D t-SNE-faza spaco.Simile, la parto de Poincaré povas esti uzata por taksi la "volumenon" de la ŝtatspaco okupita de la trajektorio por determini "normalan" aŭ "kaosan" konduton (36).Por la senmova 11-dimensia modelproduktaĵo, la volumeno okupita post kiam la datenoj estas konvertitaj en 3D fazspacon povas esti simile klarigita.La rilato inter geografia areo kaj areo en 3D faza spaco ne estas simpla, sed ĝi povas esti klarigita laŭ ekologia simileco.Tial, la pli konvencia BC-malsimileca mezuro estas preferita.
Estonta laboro reuzos la SAGE-metodon por laŭsezone ŝanĝi datumojn por taksi la spacan ŝanĝeblecon de la identigitaj provincoj kaj AEP.La estonta celo estas uzi tiun metodon por helpi determini kiuj provincoj povas esti determinitaj per satelitmezuradoj (kiel ekzemple Chl-a, telesensa reflektiveco kaj marsurfactemperaturo).Tio permesos telesensan taksadon de ekologiaj komponentoj kaj tre fleksebla monitorado de ekologiaj provincoj kaj ilia ŝanĝebleco.
La celo de ĉi tiu esplorado estas enkonduki la SAGE-metodon, kiu difinas ekologian provincon per sia unika planktonkomunuma strukturo.Ĉi tie, pli detalaj informoj pri la fizika/biogeokemia/ekosistemmodelo kaj la parametro-elekto de la t-SNE kaj DBSCAN-algoritmoj estos provizitaj.
La fizikaj komponentoj de la modelo venas de la takso de oceancirkulado kaj klimato [ECCOv4;(37) la tutmonda ŝtata takso priskribita de (38).La nominala rezolucio de ŝtata takso estas 1/5.La metodo de malplej kvadratoj kun lagranga multiplika metodo estas uzata por akiri la komencajn kaj limkondiĉojn kaj internajn modelparametrojn alĝustigitajn per observado, tiel generante liberfunkcian MIT-ĝeneralciklan modelon (MITgcm) (39), la modelon Post optimumigo, la rezultoj povas esti spurita kaj observita.
La biogeokemio/ekosistemo havas pli kompletan priskribon (t.e. ekvacioj kaj parametraj valoroj) en (2).La modelo kaptas la cirkuladon de C, N, P, Si kaj Fe tra neorganikaj kaj organikaj lagetoj.La versio uzata ĉi tie inkluzivas 35 speciojn de fitoplanktono: 2 specioj de mikroprokariotoj kaj 2 specioj de mikroeŭkariotoj (taŭgaj por malaltaj nutraj medioj), 5 specioj de Cryptomonas sphaeroides (kun kalcia karbonata tegaĵo), 5 specioj de diazonio (Povas fiksi nitrogenon, do. ĝi ne estas limigita) la havebleco de dissolvita neorganika nitrogeno), 11 diatomeoj (formante silican kovrilon), 10 miks-vegetativajn flagelatojn (povas fotosintezi kaj manĝi alian planktonon) kaj 16 Zooplankton (paŝtiĝi sur alia planktono).Tiuj estas nomitaj "biogeokemiaj funkciaj grupoj" ĉar ili havas malsamajn efikojn al mara biogeokemio (40, 41) kaj ofte estas uzitaj en observado kaj modelstudoj.En ĉi tiu modelo, ĉiu funkcia grupo estas kunmetita de pluraj planktonoj de malsamaj grandecoj, kun interspaco de 0,6 ĝis 2500 μm ekvivalenta sfera diametro.
La parametroj influantaj fitoplanktonkreskon, paŝtado kaj sinkigo rilatas al grandeco, kaj ekzistas specifaj diferencoj inter la ses fitoplanktonfunkciaj grupoj (32).Malgraŭ la malsamaj fizikaj kadroj, la rezultoj de la 51 planktonkomponentoj de la modelo estis utiligitaj en kelkaj lastatempaj studoj (42-44).
De 1992 ĝis 2011, la fizika/biogeokemia/ekosistemkunliga modelo funkciis dum 20 jaroj.La produktaĵo de la modelo inkluzivas planktonbiomason, nutran koncentriĝon kaj nutran provizon (DIN, PO4, Si kaj Fe).En ĉi tiu studo, la 20-jara mezumo de tiuj produktaĵoj estis utiligita kiel la enigaĵo de la Ekologia Provinco.Chl, la distribuado de planktonbiomaso kaj nutra koncentriĝo kaj la distribuado de funkciaj grupoj estas komparitaj kun satelitaj kaj surlokaj observoj [vidu (2, 44), Noton S1 kaj figuron.S1 ĝis S3].
Por la SAGE-metodo, la ĉeffonto de hazardo venas de la t-SNE-paŝo.Hazardeco malhelpas ripeteblon, kio signifas, ke la rezultoj estas nefidindaj.La SAGE-metodo rigore testas la fortikecon determinante aron de parametroj de t-SNE kaj DBSCAN, kiuj povas konstante identigi aretojn kiam ripetite.Determini la "perpleksecon" de la t-SNE-parametro povas esti komprenita kiel determini la gradon al kiu la mapado de alta ĝis malalta grandeco devus respekti la lokajn aŭ tutmondajn karakterizaĵojn de la datenoj.Atingis la konfuzon de 400 kaj 300 ripetoj.
Por la clustering-algoritmo DBSCAN, la minimuma grandeco kaj distancmetriko de la datenpunktoj en la areto devas esti determinitaj.La minimuma nombro estas determinita sub la gvido de spertuloj.Ĉi tiu scio scias kio konvenas al la nuna nombra modeliga kadro kaj rezolucio.La minimuma nombro estas 100. Pli alta minimuma valoro (malpli ol <135 antaŭ ol la supra limo de verda iĝas pli larĝa) povas esti konsiderata, sed ĝi ne povas anstataŭigi la agregacian metodon bazitan sur BC-malsimileco.La grado de konekto (Figuro 6A) estas uzata por agordi la ϵ-parametron, kiu estas favora al pli alta kovrado (Figuro 6B).Konektebleco estas difinita kiel la kunmetita nombro da aretoj kaj estas sentema al la ϵ parametro.Pli malalta konektebleco indikas nesufiĉan konvenon, artefarite grupigante regionojn kune.Alta konektebleco indikas troagordon.Troagordado ankaŭ estas problema, ĉar ĝi montras ke komencaj hazardaj divenoj povas konduki al nereprodukteblaj rezultoj.Inter ĉi tiuj du ekstremoj, akra pliiĝo (kutime nomata "kubuto") indikas la plej bonan ϵ.En Figuro 6A, vi vidas akran pliiĝon en la altebenaĵareo (flava,> 200 aretoj), sekvita de akra malkresko (verda, 100 aretoj), ĝis proksimume 130, ĉirkaŭita de tre malmultaj aretoj (bluaj, <60 aretoj) ).En almenaŭ 100 bluaj areoj, aŭ unu areto dominas la tutan oceanon (ϵ <0.42), aŭ la plej granda parto de la oceano ne estas klasifikita kaj estas konsiderita bruo (ϵ> 0.99).La flava areo havas tre varian, nereprodukteblan aretdistribuon.Ĉar ϵ malpliiĝas, la bruo pliiĝas.La akre kreskanta verda areo nomiĝas kubuto.Ĉi tio estas optimuma regiono.Kvankam la verŝajneco t-SNE estas uzita, la BC-malsimileco ene de la provinco daŭre povas esti uzita por determini fidindan grupigon.Uzante Figuro 6 (A kaj B), starigu ϵ al 0.39.Ju pli granda la minimuma nombro, des pli malgranda la probableco atingi la ϵ kiu permesas fidindan klasifikon, kaj des pli granda la verda areo kun valoro pli granda ol 135. La pligrandigo de ĉi tiu areo indikas, ke la kubuto estos pli malfacile trovebla aŭ ne- ekzistanta.
Post fikso de la parametroj de t-SNE, la tuta nombro de trovitaj aretoj estos uzata kiel mezurilo de konektebleco (A) kaj la procento de datumoj asignitaj al la areto (B).La ruĝa punkto indikas la plej bonan kombinaĵon de kovrado kaj konektebleco.La minimuma nombro estas fiksita laŭ la minimuma nombro rilata al ekologio.
Por suplementaj materialoj por ĉi tiu artikolo, bonvolu vidi http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ĉi tio estas libera alira artikolo distribuita laŭ la kondiĉoj de la Krea Komunaĵo Atribuite.La artikolo permesas senrestriktan uzon, distribuon kaj reproduktadon en iu ajn medio sub la kondiĉo ke la origina laboro estas konvene citita.
Noto: Ni nur petas vin provizi vian retadreson por ke la persono, kiun vi rekomendas al la paĝo, sciu, ke vi volas, ke ili vidu la retpoŝton kaj ke ĝi ne estas spamo.Ni ne kaptos retpoŝtadresojn.
Ĉi tiu demando estas uzata por provi ĉu vi estas vizitanto kaj malhelpi aŭtomatan sendadon de spamado.
La Tutmonda Ministerio pri Mara Ekologio estas celkonscia solvi kompleksajn problemojn kaj uzas nekontrolitan ML por esplori komunumajn strukturojn.
La Tutmonda Ministerio pri Mara Ekologio estas celkonscia solvi kompleksajn problemojn kaj uzas nekontrolitan ML por esplori komunumajn strukturojn.
Afiŝtempo: Jan-12-2021