Usa ka unsupervised learning method ang gisugyot sa pagdeterminar sa global marine ecological provinces (eco-provinces) base sa plankton community structure ug nutrient flux data.Ang sistematikong integrated ecological province (SAGE) nga pamaagi makaila sa mga ekolohikal nga probinsya sa mga nonlinear nga modelo sa ekosistema.Aron makapahiangay sa non-Gaussian covariance sa datos, ang SAGE naggamit sa t random neighbor embedding (t-SNE) aron makunhuran ang dimensionality.Uban sa tabang sa aplikasyon sa kasaba base sa density-based spatial clustering (DBSCAN) algorithm, labaw pa sa usa ka gatos nga ekolohikal nga probinsya ang mailhan.Gamit ang mapa sa pagkonekta nga adunay mga kalainan sa ekolohiya isip sukod sa gilay-on, usa ka lig-on nga aggregated ecological province (AEP) ang obhetibo nga gihubit pinaagi sa mga nested ecological provinces.Gamit ang mga AEP, gisusi ang pagkontrol sa gidaghanon sa suplay sa sustansiya sa istruktura sa komunidad.Ang Eco-province ug AEP talagsaon ug makatabang sa pag-modelo sa interpretasyon.Mahimo nila mapadali ang pagtandi tali sa mga modelo ug mahimo’g mapauswag ang pagsabut ug pag-monitor sa mga ekosistema sa dagat.
Ang mga probinsya maoy mga rehiyon diin ang komplikadong biogeography sa dagat o yuta giorganisar ngadto sa managsama ug makahuluganon nga mga dapit (1).Kini nga mga probinsya hinungdanon kaayo alang sa pagtandi ug pagtandi sa mga lokasyon, pagkilala sa mga obserbasyon, pagmonitor ug pagpanalipod.Ang komplikado ug dili-linear nga mga interaksyon nga nagpatungha niini nga mga probinsya naghimo sa mga paagi nga wala’y pagdumala sa pagkat-on sa makina (ML) nga haom kaayo alang sa pagtino sa mga probinsya nga katuyoan, tungod kay ang covariance sa datos komplikado ug dili Gaussian.Dinhi, gisugyot ang usa ka pamaagi sa ML, nga sistematikong nagpaila sa talagsaon nga marine ecological provinces (eco-provinces) gikan sa Darwin global three-dimensional (3D) physical/ecosystem model (2).Ang termino nga "talagsaon" gigamit sa pagpakita nga ang giila nga lugar dili igo nga nagsapaw sa ubang mga lugar.Kini nga pamaagi gitawag nga System Integrated Ecological Province (SAGE) nga pamaagi.Aron mahimo ang mapuslanon nga klasipikasyon, usa ka pamaagi sa algorithm kinahanglan nga tugotan ang (i) global nga klasipikasyon ug (ii) multi-scale nga pag-analisa nga mahimo nga nested / aggregate sa wanang ug oras (3).Niini nga panukiduki, ang pamaagi sa SAGE ang unang gisugyot ug ang mga giila nga ekolohikal nga probinsya ang gihisgutan.Ang mga Eco-province mahimong magpasiugda og pagsabot sa mga hinungdan nga nagkontrolar sa istruktura sa komunidad, makahatag ug mapuslanong pagsabot sa mga estratehiya sa pagmonitor, ug makatabang sa pagsubay sa mga kausaban sa ekosistema.
Ang mga probinsya nga terrestrial kasagaran giklasipikar sumala sa pagkaparehas sa klima (pag-ulan ug temperatura), yuta, mga tanom, ug mananap, ug gigamit alang sa pagdumala sa auxiliary, panukiduki sa biodiversity, ug pagkontrol sa sakit (1, 4).Ang mga probinsya sa dagat mas lisud ipasabut.Kadaghanan sa mga organismo mga mikroskopiko, nga adunay mga utlanan sa likido.Longhurst ug uban pa.(5) Gihatag ang usa sa unang global nga klasipikasyon sa Ministry of Oceanography base sa kahimtang sa kinaiyahan.Ang depinisyon niining mga "Longhurst" nga mga probinsya naglakip sa mga variables sama sa mixing rate, stratification, ug irradiance, ingon man ang lapad nga kasinatian ni Longhurst isip usa ka marine oceanographer, kinsa adunay uban pang importante nga mga kondisyon alang sa marine ecosystem.Ang Longhurst kaylap nga gigamit, pananglitan, sa pagtimbang-timbang sa panguna nga produksiyon ug carbon flux, pagtabang sa pangisda, ug pagplano sa mga kalihokan sa obserbasyon sa situ (5-9).Para mas obhetibo ang paghubit sa mga probinsya, gigamit ang mga pamaagi sama sa fuzzy logic ug regional unsupervised clustering/statistics (9-14).Ang katuyoan sa ingon nga mga pamaagi mao ang pag-ila sa mga makahuluganon nga istruktura nga makaila sa mga probinsya sa magamit nga datos sa obserbasyon.Pananglitan, ang dinamikong mga probinsya sa dagat (12) naggamit sa mga mapa nga nag-organisar sa kaugalingon aron makunhuran ang kasaba, ug naggamit sa hierarchical (base sa kahoy) clustering aron mahibal-an ang mga produkto sa kolor sa dagat nga nakuha gikan sa mga satelayt sa rehiyon [chlorophyll a (Chl-a), normal nga gitas-on sa linya sa Fluorescence ug colored dissolved organic matter] ug physical field (sea surface temperature and salinity, absolute dynamic topography ug sea ice).
Ang istruktura sa komunidad sa plankton nabalaka tungod kay ang ekolohiya niini adunay dako nga impluwensya sa mas taas nga lebel sa sustansya, pagsuyup sa carbon ug klima.Bisan pa niana, usa gihapon ka mahagiton ug idlas nga tumong ang pagdeterminar sa usa ka pangkalibutanon nga ekolohikal nga probinsiya base sa istruktura sa komunidad sa plankton.Ang mga satelayt nga kolor sa dagat posibleng makahatag ug mga panabut sa coarse-grained nga klasipikasyon sa phytoplankton o nagsugyot sa mga bentaha sa functional nga mga grupo (15), apan sa pagkakaron dili sila makahatag ug detalyadong impormasyon sa istruktura sa komunidad.Ang bag-ong mga surbey [eg Tara Ocean (16)] naghatag ug wala pa mahitabo nga pagsukod sa istruktura sa komunidad;Sa pagkakaron, adunay mga gamay nga in-situ nga mga obserbasyon sa usa ka global nga sukod (17).Ang nangaging mga pagtuon sa kadaghanan nagtino sa "Biogeochemical Province" (12, 14, 18) base sa determinasyon sa biochemical nga pagkaparehas (sama sa pangunang produksyon, Chl ug anaa nga kahayag).Dinhi, ang numerical model gigamit sa pag-output [Darwin(2)], ug ang ekolohikal nga probinsya gitino sumala sa istruktura sa komunidad ug nutrient flux.Ang numerical model nga gigamit niini nga pagtuon adunay global coverage ug mahimong itandi sa kasamtangan nga field data (17) ug remote sensing fields (Note S1).Ang numerical model data nga gigamit niini nga pagtuon adunay bentaha sa global coverage.Ang modelo nga ekosistema naglangkob sa 35 ka espisye sa phytoplankton ug 16 ka matang sa zooplankton (palihug tan-awa ang mga materyales ug pamaagi).Ang modelo nga mga tipo sa plankton nakig-interact nga dili linear sa mga non-Gaussian covariance structures, busa ang yano nga diagnostic nga mga pamaagi dili angay sa pag-ila sa talagsaon ug makanunayon nga mga pattern sa mga emerging community structures.Ang pamaagi sa SAGE nga gipaila dinhi naghatag usa ka bag-ong paagi aron masusi ang output sa komplikado nga mga modelo sa Darwin.
Ang kusog nga pagbag-o nga kapabilidad sa data science/ML nga teknolohiya makahimo sa hilabihan ka komplikado nga mga solusyon sa modelo sa pagpadayag sa komplikado apan lig-on nga mga istruktura sa data covariance.Ang usa ka lig-on nga pamaagi gihubit isip usa ka pamaagi nga matinud-anon nga makahimo sa mga resulta sulod sa gihatag nga error range.Bisan sa yano nga mga sistema, ang pagtino sa lig-on nga mga sumbanan ug mga signal mahimong usa ka hagit.Hangtud nga ang katarungan nga nagpadulong sa naobserbahan nga sumbanan matino, ang mitumaw nga pagkakomplikado mahimong ingon komplikado / lisud sulbaron.Ang yawe nga proseso sa pagtakda sa komposisyon sa ekosistema kay nonlinear sa kinaiyahan.Ang pagkaanaa sa non-linear nga mga interaksyon mahimong makalibog sa lig-on nga klasipikasyon, mao nga gikinahanglan nga likayan ang mga pamaagi nga naghimo sa lig-on nga mga pangagpas mahitungod sa sukaranan nga istatistika nga pag-apod-apod sa data covariance.Ang high-dimensional ug nonlinear nga datos kasagaran sa oceanography ug mahimong adunay covariance structure nga adunay komplikado, non-Gaussian nga topology.Bisan kung ang datos nga adunay usa ka non-Gaussian covariance structure mahimong makababag sa lig-on nga klasipikasyon, ang SAGE nga pamaagi kay nobela tungod kay kini gidisenyo sa pag-ila sa mga cluster nga adunay arbitraryong mga topologies.
Ang tumong sa pamaagi sa SAGE mao ang pag-ila sa mga mitumaw nga mga sumbanan nga makatabang sa dugang nga pagsabot sa ekolohiya.Pagsunod sa usa ka cluster-based workflow susama sa (19), ang ecological ug nutrient flux variables gigamit aron matino ang bugtong cluster sa data, nga gitawag ug ecological province.Ang pamaagi sa SAGE nga gisugyot niini nga pagtuon (Figure 1) una nga nagpamenos sa dimensionality gikan sa 55 ngadto sa 11 nga mga dimensyon pinaagi sa pagsumada sa plankton functional groups nga gihubit nga priori (tan-awa ang Materials and Methods).Pinaagi sa paggamit sa t-random neighbor embedding (t-SNE) nga pamaagi, ang gidak-on gipakunhod pa pinaagi sa pagproyekto sa posibilidad ngadto sa 3D space.Ang unsupervised clustering makaila sa ecologically close areas [density-based spatial clustering (DBSCAN) para sa noise-based nga mga aplikasyon].Parehong t-SNE ug DBSCAN magamit sa kinaiyanhon nga non-linear ecosystem numerical model data.Dayon i-reproject ang resulta nga ecological province sa yuta.Labaw sa usa ka gatos nga talagsaon nga mga probinsya sa ekolohiya ang nahibal-an, nga angay alang sa panukiduki sa rehiyon.Aron makonsiderar ang globally consistent ecosystem model, ang SAGE nga pamaagi gigamit sa pag-aggregate sa ecological provinces ngadto sa aggregated ecological provinces (AEP) aron mapalambo ang pagka-epektibo sa ecological provinces.Ang lebel sa aggregation (gitawag nga "complexity") mahimong ipasibo sa lebel sa detalye nga gikinahanglan.Tinoa ang minimum nga pagkakomplikado sa usa ka lig-on nga AEP.Ang pokus sa pagpili mao ang pamaagi sa SAGE ug pagsuhid sa pinakagamay nga pagkakomplikado sa mga kaso sa AEP aron mahibal-an ang pagkontrol sa istruktura sa emerhensya nga komunidad.Mahimong analisahon ang mga sumbanan aron mahatagan ang mga panabut sa ekolohiya.Ang pamaagi nga gipaila dinhi mahimo usab nga gamiton alang sa pagtandi sa modelo nga mas kaylap, pananglitan, pinaagi sa pagtimbang-timbang sa mga lokasyon sa parehas nga ekolohikal nga mga probinsya nga makit-an sa lainlaing mga modelo aron ipakita ang mga kalainan ug pagkaparehas, aron itandi ang mga modelo.
(A) Schematic diagram sa workflow para sa pagtino sa ecological province;gamit ang sum sa functional group aron makunhuran ang orihinal nga 55-dimensional nga datos ngadto sa 11-dimensional nga modelo nga output, lakip ang biomass sa pito ka functional/nutrient plankton ug upat ka nutrient supply rates.Ang gamay nga kantidad ug lig-on nga lugar nga tabon sa yelo.Ang datos gi-standardize ug gi-standardize.Paghatag ug 11-dimensional nga datos sa t-SNE algorithm aron i-highlight ang parehas nga mga kombinasyon sa estadistika.Maampingong pilion sa DBSCAN ang cluster aron itakda ang kantidad sa parameter.Sa katapusan iproyekto ang datos balik sa latitude/longitude projection.Palihug timan-i nga kini nga proseso gisubli 10 ka beses tungod kay ang usa ka gamay nga randomness mahimong mamugna pinaagi sa paggamit sa t-SNE.(B) nagpatin-aw unsaon pagkuha sa AEP pinaagi sa pagsubli sa workflow sa (A) 10 ka beses.Sa matag usa niining 10 ka implementasyon, ang inter-provincial Bray-Curtis (BC) dissimilarity matrix gitino base sa biomass sa 51 ka matang sa phytoplankton.Tinoa ang kalainan sa BC tali sa mga probinsya, gikan sa pagkakomplikado 1 AEP hangtod sa pagkakomplikado 115. Ang benchmark sa BC gitakda sa Probinsiya sa Longhurst.
Ang pamaagi sa SAGE naggamit sa output sa global 3D physical/ecosystem numerical model aron ipasabot ang ecological province [Darwin (2);tan-awa ang Materyal ug Pamaagi ug Nota S1].Ang mga sangkap sa ekosistema gilangkuban sa 35 ka espisye sa phytoplankton ug 16 ka espisye sa zooplankton, nga adunay pito ka predefined nga functional nga mga grupo: prokaryotes ug eukaryotes nga gipahaom sa ubos nga sustansiya nga palibot, coccidia nga adunay calcium carbonate coating, ug bug-at nga nitrogen fixation Nitrogen nutrients (kasagarang kulang. importante nga mga sustansya), nga adunay siliceous nga tabon, makahimo sa ubang mga plankton photosynthesis ug pagpasibsib sa sinagol nga nutrient flagellates ug zooplankton herders.Ang gidak-on sa gidak-on mao ang 0.6 ngadto sa 2500μm nga katumbas sa spherical diameter.Ang modelo nga pag-apod-apod sa gidak-on sa phytoplankton ug functional grouping nagkuha sa kinatibuk-ang mga kinaiya nga makita sa satellite ug in-situ nga obserbasyon (tan-awa ang Figures S1 hangtod S3).Ang pagkaparehas tali sa numerical model ug sa naobserbahan nga kadagatan nagpakita nga ang mga probinsya nga gihubit sa modelo mahimong magamit sa in-situ nga kadagatan.Palihug timan-i nga kini nga modelo nagkuha lamang sa pipila ka diversity sa phytoplankton, ug pipila lamang sa pisikal ug kemikal nga pagpugos nga han-ay sa in situ nga kadagatan.Ang pamaagi sa SAGE makapahimo sa mga tawo nga mas masabtan ang labi ka rehiyonal nga mekanismo sa pagkontrol sa modelo nga istruktura sa komunidad.
Pinaagi sa paglakip lamang sa sumada sa biomass sa ibabaw (nga adunay aberids nga panahon nga 20 ka tuig) sa matag pundok sa pagpaandar sa plankton, ang dimensyon sa datos mahimong makunhuran.Human sa naunang mga pagtuon nagpakita sa ilang mahinungdanong papel sa pagpahimutang sa istruktura sa komunidad, naglakip usab kini sa mga termino sa tinubdan sa ibabaw alang sa nutrient fluxes (supply sa nitrogen, iron, phosphate ug silicic acid) [eg (20, 21)].Ang summasyon sa mga functional nga grupo makapamenos sa problema gikan sa 55 (51 plankton ug 4 nutrient fluxes) ngadto sa 11 ka dimensyon.Niini nga inisyal nga pagtuon, tungod sa computational constraints nga gipahamtang sa algorithm, ang giladmon ug ang kabag-ohan sa oras wala gikonsiderar.
Ang pamaagi sa SAGE makahimo sa pag-ila sa importante nga mga relasyon tali sa nonlinear nga mga proseso ug mga importanteng bahin sa interaksyon tali sa functional group biomass ug nutrient flux.Ang paggamit sa 11-dimensional nga datos nga gibase sa Euclidean distance learning nga mga pamaagi (sama sa K-means) dili makakuha ug kasaligan ug reproducible nga mga probinsya (19, 22).Kini tungod kay walay Gaussian nga porma nga makita sa batakang pag-apod-apod sa covariance sa mga mahinungdanong elemento nga naghubit sa ekolohikal nga probinsya.Ang K-means sa Voronoi cells (tul-id nga mga linya) dili makahupot sa non-Gaussian nga batakang pag-apod-apod.
Ang biomass sa pito ka plankton functional groups ug upat ka nutrient fluxes nahimong 11-dimensional vector x.Busa, ang x usa ka vector field sa model grid, diin ang matag elemento xi nagrepresentar sa 11-dimensional nga vector nga gihubit sa modelo nga horizontal grid.Ang matag indeks i talagsaon nga nagpaila sa usa ka grid point sa sphere, diin (lon, lat) = (ϕi, θi).Kung ang biomass sa modelo nga grid unit dili mubu sa 1.2 × 10-3mg Chl/m3 o ang rate sa pagsakup sa yelo molapas sa 70%, ang log sa datos sa biomass gigamit ug gilabay.Ang datos gi-normalize ug gi-standardize, mao nga ang tanan nga datos anaa sa han-ay sa [0 ngadto sa 1], ang mean gikuha ug gi-scale sa unit variance.Gihimo kini aron ang mga bahin (biomass ug nutrient flux) dili limitado sa kalainan sa lain-laing posibleng mga bili.Ang clustering kinahanglan nga makuha ang kausaban nga relasyon gikan sa yawe nga kalagmitan nga gilay-on tali sa mga bahin kay sa geographic nga gilay-on.Pinaagi sa pag-ihap niini nga mga gilay-on, ang importante nga mga bahin mitungha, samtang ang wala kinahanglana nga mga detalye gilabay.Gikan sa ekolohikal nga punto sa panglantaw, kini gikinahanglan tungod kay ang pipila ka mga matang sa phytoplankton nga adunay gamay nga biomass mahimong adunay mas dako nga biogeochemical nga epekto, sama sa nitrogen fixation pinaagi sa diazotrophic bacteria.Kung ang pag-standardize ug pag-normalize sa datos, kini nga mga klase sa covariates ipasiugda.
Pinaagi sa paghatag og gibug-aton sa kaduol sa mga bahin sa taas nga dimensyon nga luna sa ubos nga dimensyon nga representasyon, ang t-SNE algorithm gigamit aron mas klaro ang kasamtangan nga susama nga mga rehiyon.Ang nangaging trabaho nga gitumong sa pagtukod og lawom nga mga neural network alang sa remote sensing nga mga aplikasyon nga gigamit ang t-SNE, nga nagpamatuod sa kahanas niini sa pagbulag sa mga importanteng bahin (23).Kini usa ka kinahanglanon nga lakang aron mahibal-an ang lig-on nga pag-cluster sa data nga bahin samtang naglikay sa mga dili managsama nga solusyon (tandaan S2).Gamit ang Gaussian kernels, gipreserbar sa t-SNE ang istatistikal nga mga kabtangan sa datos pinaagi sa pagmapa sa matag high-dimensional nga butang sa usa ka punto sa 3D phase space, sa ingon nagsiguro nga ang posibilidad sa parehas nga mga butang sa taas ug ubos nga direksyon taas sa usa ka taas- dimensional nga luna (24).Gihatag ang usa ka set sa N high-dimensional nga mga butang x1,…,xN, ang t-SNE algorithm mokunhod pinaagi sa pagpamenos sa Kullback-Leibler (KL) divergence (25).Ang KL divergence usa ka sukod kung unsa ang kalainan sa usa ka probability distribution gikan sa ikaduha nga reference probability distribution, ug epektibo nga makatimbang-timbang sa posibilidad sa correlation tali sa ubos nga dimensiyon nga representasyon sa high-dimensional nga mga feature.Kung ang xi mao ang i-th nga butang sa N-dimensional nga luna, ang xj mao ang j-th nga butang sa N-dimensional nga luna, ang yi mao ang i-th nga butang sa ubos nga dimensyon nga luna, ug ang yj mao ang j-th nga butang sa ubos. -dimensional nga luna, unya ang t -SNE naghubit sa kaparehas nga posibilidad ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), ug alang sa dimensionality reduction set q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Ang Figure 2A naghulagway sa epekto sa pagkunhod sa biomass ug nutrient flux vectors sa 11-dimensional nga kombinasyon ngadto sa 3D.Ang kadasig sa pag-apply sa t-SNE mahimong itandi sa pagdasig sa principal component analysis (PCA), nga naggamit sa variance attribute aron ipasiugda ang area/attribute sa data, sa ingon mamenosan ang dimensionality.Ang pamaagi sa t-SNE nakit-an nga labaw sa PCA sa paghatag kasaligan ug mabag-o nga mga resulta alang sa Eco-Ministry (tan-awa ang Note S2).Mahimo kini tungod kay ang orthogonality assumption sa PCA dili angay alang sa pag-ila sa mga kritikal nga interaksyon tali sa labi ka dili linya nga interactive nga mga bahin, tungod kay ang PCA nagpunting sa mga linear covariance nga istruktura (26).Gamit ang remote sensing data, Lunga et al.(27) nag-ilustrar kon unsaon paggamit ang SNE nga pamaagi aron ipasiugda ang komplikado ug dili linear nga spectral nga mga bahin nga motipas gikan sa Gaussian distribution.
(A) Usa ka modelo nga sustansiya sa suplay sa sustansiya, phytoplankton ug zooplankton functional group biomass nga gikuha sa t-SNE algorithm ug gikoloran sa probinsiya gamit ang DBSCAN.Ang matag punto nagrepresentar sa usa ka punto sa taas nga dimensyon nga wanang, ingon sa gipakita sa Figure 6B, kadaghanan sa mga punto nakuha.Ang mga shaft nagtumong sa "t-SNE" nga gidak-on 1, 2 ug 3. (B) Ang geographic projection sa probinsya nga nakit-an sa DBSCAN sa latitude-longitude grid sa gigikanan.Ang kolor kinahanglan nga isipon nga bisan unsang kolor, apan kinahanglan nga katumbas sa (A).
Ang mga punto sa t-SNE scatter plot sa Figure 2A kay gilangkit sa latitude ug longitude.Kung ang duha ka punto sa Figure 2A magkaduol sa usag usa, kini tungod kay ang ilang biomass ug nutrient flux managsama, dili tungod sa geographic nga kaduol.Ang mga kolor sa Figure 2A mga cluster nga nadiskubre gamit ang DBSCAN nga pamaagi (28).Kung nangita alang sa dasok nga mga obserbasyon, ang DBSCAN algorithm naggamit sa gilay-on sa 3D nga representasyon tali sa mga punto (ϵ = 0.39; alang sa kasayuran bahin niini nga pagpili, tan-awa ang Mga Materyal ug Mga Pamaagi), ug ang gidaghanon sa parehas nga mga punto gikinahanglan aron mahibal-an ang cluster (dinhi 100 puntos, palihog tan-awa sa ibabaw).Ang pamaagi sa DBSCAN wala maghimo ug bisan unsang mga pangagpas mahitungod sa porma o gidaghanon sa mga cluster sa datos, sama sa gipakita sa ubos:
3) Para sa tanang punto nga giila nga naa sa gilay-on sa sulod, balik-balika ang lakang 2 aron matino ang utlanan sa cluster.Kung ang gidaghanon sa mga punto mas dako pa sa gitakda nga minimum nga bili, kini gitudlo isip usa ka cluster.
Ang datos nga wala makaabot sa minimum nga miyembro sa cluster ug gilay-on ϵ metric giisip nga "saba" ug wala gi-assign og kolor.Ang DBSCAN usa ka paspas ug scalable nga algorithm nga adunay O(n2) nga performance sa pinakagrabe nga kaso.Alang sa kasamtangan nga pagtuki, kini dili tinuod nga random.Ang minimum nga gidaghanon sa mga punto gitino sa eksperto nga pagtimbang-timbang.Human sa pag-adjust sa gilay-on pagkahuman, ang resulta dili igo nga lig-on sa gilay-on nga ≈±10.Kini nga distansya gitakda gamit ang koneksyon (Figure 6A) ug porsyento sa coverage sa kadagatan (Figure 6B).Ang pagkadugtong gihubit isip ang composite nga gidaghanon sa mga cluster ug sensitibo sa ϵ parameter.Ang ubos nga koneksyon nagpakita sa dili igo nga angay, artipisyal nga paggrupo sa mga rehiyon.Ang taas nga koneksyon nagpaila sa overfitting.Mahunahunaan ang paggamit sa usa ka mas taas nga minimum, apan kung ang minimum nga molapas sa ca, imposible nga makab-ot ang usa ka kasaligan nga solusyon.135 (Alang sa dugang nga mga detalye, tan-awa ang Mga Materyal ug Mga Pamaagi).
Ang 115 ka pungpong nga giila sa Figure 2A gilantaw balik sa yuta sa Figure 2B.Ang matag kolor katumbas sa usa ka managsama nga kombinasyon sa biogeochemical ug ecological nga mga hinungdan nga giila sa DBSCAN.Kung matino na ang mga cluster, ang asosasyon sa matag punto sa Figure 2A nga adunay usa ka piho nga latitude ug longitude gigamit aron iproyekto ang mga cluster balik sa geographic nga lugar.Ang Figure 2B nag-ilustrar niini sa parehas nga cluster nga mga kolor sama sa Figure 2A.Ang parehas nga mga kolor dili kinahanglan hubaron nga pagkaparehas sa ekolohiya, tungod kay kini gi-assign sa han-ay kung diin ang mga cluster nadiskobrehan sa algorithm.
Ang lugar sa Figure 2B mahimong kwalitatibo nga susama sa usa ka natukod nga lugar sa pisikal ug/o biogeochemistry sa kadagatan.Pananglitan, ang mga pungpong sa Habagatang Dagat kay simetriko sa sona, nga adunay mga oligotrophic vortices nga makita, ug ang hait nga transisyon nagpakita sa impluwensya sa trade winds.Pananglitan, sa ekwador nga Pasipiko, lain-laing mga rehiyon nga may kalabotan sa pagsaka ang makita.
Aron masabtan ang ekolohikal nga palibot sa Eco-Province, usa ka variation sa Bray-Curtis (BC) difference index (29) ang gigamit sa pagtimbang-timbang sa ekolohiya sa cluster.Ang indikasyon sa BC usa ka estadistika nga datos nga gigamit sa pag-ihap sa kalainan sa istruktura sa komunidad tali sa duha ka lainlaing mga site.Ang pagsukod sa BC magamit sa biomass sa 51 ka espisye sa phytoplankton ug zooplankton BCninj = 1-2CninjSni + Snj
Ang BCninj nagtumong sa pagkaparehas tali sa kombinasyon ni ug kombinasyon nj, diin ang Cninj mao ang minimum nga bili sa usa ka matang sa biomass nga anaa sa duha ka kombinasyon ni ug nj, ug ang Sni nagrepresentar sa sum sa tanang biomass nga anaa sa duha ka kombinasyon ni ug Snj.Ang kalainan sa BC susama sa sukod sa gilay-on, apan naglihok sa wanang nga dili Euclidean, nga lagmit mas angay alang sa datos sa ekolohiya ug paghubad niini.
Alang sa matag cluster nga giila sa Figure 2B, ang pagkaparehas sa intra-provincial ug inter-provincial BC mahimong masusi.Ang kalainan sa BC sulod sa usa ka probinsiya nagtumong sa kalainan tali sa kasagarang bili sa probinsiya ug sa matag punto sa probinsiya.Ang kalainan tali sa mga probinsya sa BC nagtumong sa pagkaparehas sa usa ka probinsya ug uban pang mga probinsya.Ang Figure 3A nagpakita sa usa ka simetriko nga BC matrix (0, itom: hingpit nga katumbas; 1, puti: hingpit nga dili managsama).Ang matag linya sa graph nagpakita og pattern sa datos.Ang Figure 3B nagpakita sa geographic nga kahulogan sa mga resulta sa BC sa Figure 3A alang sa matag probinsya.Para sa usa ka probinsya sa ubos nga nutrisyon ug ubos nga sustansya nga lugar, ang Figure 3B nagpakita nga ang simetriya sa dagkong mga lugar sa palibot sa ekwador ug sa Indian Ocean kay pareha ra, apan ang mas taas nga mga latitud ug upwelling nga mga dapit lahi kaayo.
(A) Ang sukod sa kalainan sa BC nga gi-evaluate sa matag probinsya base sa global 20-year average global surface average nga 51 plankton.Matikdi ang gipaabot nga simetriya sa mga bili.(B) Ang spatial projection sa usa ka kolum (o laray).Alang sa usa ka probinsya sa usa ka dystrophic nga lingin, ang global nga pag-apod-apod sa BC nga sukod sa pagkaparehas gisusi, ug ang global nga 20 ka tuig nga average gisusi.Ang itom (BC = 0) nagpasabot sa samang lugar, ug puti (BC = 1) nagpasabot nga walay pagkaparehas.
Ang Figure 4A naghulagway sa kalainan sa BC sulod sa matag probinsya sa Figure 2B.Determinado pinaagi sa paggamit sa kasagaran nga kombinasyon sa kasagaran nga lugar sa usa ka cluster, ug pagtino sa dissimilarity tali sa BC ug sa mean sa matag grid point sa probinsya, kini nagpakita nga ang SAGE nga pamaagi makabulag og maayo sa 51 ka espisye base sa ekolohikal nga pagkaparehas. data sa modelo.Ang kinatibuk-ang kasagaran nga cluster BC dissimilarity sa tanang 51 ka matang mao ang 0.102±0.0049.
(A, B, ug D) Ang kalahian sa BC sulod sa probinsiya gitimbang-timbang isip kasagarang kalainan sa BC tali sa matag komunidad sa grid point ug sa kasagarang probinsiya, ug ang pagkakomplikado dili mapakunhod.(2) Ang global average intra-provincial BC kalainan mao ang 0.227±0.117.Kini ang sukaranan sa klasipikasyon nga gibase sa ekolohikal nga panukmod nga gisugyot niini nga buhat [berde nga linya sa (C)].(C) Average intra-provincial BC nga kalainan: Ang itom nga linya nagrepresentar sa intra-provincial BC nga kalainan uban sa nagkadako nga pagkakomplikado.Ang 2σ naggikan sa 10 ka pagbalik-balik sa proseso sa pag-ila sa eco-province.Alang sa kinatibuk-ang pagkakomplikado sa mga probinsya nga nadiskobrehan sa DBSCAN, (A) nagpakita nga ang BC dissimilarity sa probinsiya mao ang 0.099, ug ang complexity classification nga gisugyot sa (C) kay 12, nga miresulta sa BC dissimilarity nga 0.200 sa probinsya.ingon sa gipakita sa hulagway.(D).
Sa Figure 4B, ang biomass sa 51 ka matang sa plankton gigamit sa pagrepresentar sa katumbas sa BC nga kalainan sa Longhurst province.Ang kinatibuk-ang aberids sa matag probinsya mao ang 0.227, ug ang standard deviation sa mga grid points nga may reference sa kalainan sa BC province mao ang 0.046.Mas dako kini kay sa cluster nga giila sa Figure 1B.Hinuon, gamit ang sumada sa pito ka mga functional nga grupo, ang kasagaran nga intra-season BC dissimilarity sa Longhurst misaka ngadto sa 0.232.
Ang global nga eco-province nga mapa naghatag ug makuti nga mga detalye sa talagsaon nga ekolohikal nga interaksyon ug mga kalamboan nga nahimo sa paggamit sa tibuok ecosystem nga istruktura sa Longhurst Province.Ang Ministri sa Ekolohiya gilauman nga maghatag ug pagsabot sa proseso sa pagkontrolar sa numerical model ecosystem, ug kini nga pagsabot makatabang sa eksplorasyon sa field work.Alang sa katuyoan niini nga panukiduki, dili mahimo nga hingpit nga ipakita ang labaw sa usa ka gatos nga mga probinsya.Ang sunod nga seksyon nagpaila sa pamaagi sa SAGE nga nagsumaryo sa mga probinsya.
Usa sa mga katuyoan sa probinsiya mao ang pagpalambo sa pagsabot sa lokasyon ug pagdumala sa probinsiya.Aron mahibal-an ang mga sitwasyon sa emerhensya, ang pamaagi sa Figure 1B nag-ilustrar sa pagpugad sa parehas nga ekolohikal nga mga probinsya.Ang mga eko-probinsya gigrupo base sa ekolohikal nga pagkaparehas, ug ang maong paggrupo sa mga probinsiya gitawag ug AEP.Pagbutang ug adjustable nga “complexity” base sa kinatibuk-ang gidaghanon sa mga probinsya nga konsiderahon.Ang termino nga "komplikado" gigamit tungod kay gitugotan niini ang lebel sa mga kinaiya sa emerhensya nga ma-adjust.Aron mahibal-an ang makahuluganon nga mga aggregasyon, ang kasagaran nga intra-provincial BC nga kalainan nga 0.227 gikan sa Longhurst gigamit isip benchmark.Ubos sa kini nga sukaranan, ang hiniusa nga mga probinsya dili na giisip nga mapuslanon.
Sama sa gipakita sa Figure 3B, ang mga probinsya sa ekolohiya sa kalibutan managsama.Gamit ang mga kalainan sa inter-provincial BC, makita nga ang pipila ka mga configuration "komon" kaayo.Inspirado sa genetics ug graph theory method, ang "connected graphs" gigamit sa paghan-ay sa>100 ka probinsya base sa mga probinsya nga susama niini.Ang “koneksyon” metric dinhi gitino gamit ang inter-provincial BC dissimilarity (30).Ang gidaghanon sa mga probinsya nga adunay mas dako nga luna alang sa pagklasipikar sa> 100 ka mga probinsya mahimong matawag dinhi nga pagkakomplikado.Ang AEP kay usa ka produkto nga nagklasegorya sa labaw sa 100 ka probinsiya isip pinaka dominante/labing duol nga ekolohikal nga probinsiya.Ang matag ekolohikal nga probinsya gi-assign sa dominante/highly konektado nga ekolohikal nga probinsya nga labing susama kanila.Kini nga panagsama nga gitino sa kalainan sa BC nagtugot sa usa ka nested nga pamaagi sa global nga ekolohiya.
Ang napili nga pagkakomplikado mahimong bisan unsang kantidad gikan sa 1 hangtod sa kompleto nga pagkakomplikado sa FIG.2A.Sa ubos nga pagkakomplikado, ang AEP mahimong mous-os tungod sa probabilistic dimensionality reduction step (t-SNE).Ang degeneracy nagpasabot nga ang mga ekolohikal nga probinsya mahimong ma-assign sa lain-laing mga AEP tali sa mga pag-uli, sa ingon mausab ang geographic nga lugar nga nasakup.Ang Figure 4C nag-ilustrar sa pagkaylap sa BC dissimilarities sulod sa mga probinsya sa AEPs sa nagkadako nga pagkakomplikado sa 10 ka mga pagpatuman (ilustrasyon sa Figure 1B).Sa Figure 4C, ang 2σ (asul nga lugar) usa ka sukod sa pagkadaot sa 10 ka mga implementasyon, ug ang berdeng linya nagrepresentar sa Longhurst benchmark.Napamatud-an sa mga kamatuoran nga ang pagkakomplikado sa 12 makapabilin sa BC nga kalainan sa probinsya ubos sa Longhurst benchmark sa tanang implementasyon ug makapadayon sa medyo gamay nga 2σ degradation.Sa katingbanan, ang minimum nga girekomendar nga pagkakomplikado mao ang 12 ka AEP, ug ang kasagaran nga intra-province BC nga kalainan nga gi-evaluate gamit ang 51 ka matang sa plankton mao ang 0.198±0.013, sama sa gipakita sa Figure 4D.Gamit ang sumada sa pito ka plankton functional groups, ang kasagaran nga BC difference sulod sa probinsya kay 2σ imbes nga 0.198±0.004.Ang pagtandi tali sa mga kalainan sa BC nga gikalkulo sa kinatibuk-ang biomass sa pito ka functional nga mga grupo o ang biomass sa tanang 51 ka matang sa plankton nagpakita nga bisan tuod ang SAGE nga pamaagi magamit sa 51-dimensional nga sitwasyon, kini alang sa kinatibuk-ang biomass sa pito ka functional nga mga grupo. Alang sa pagbansay.
Depende sa katuyoan sa bisan unsang panukiduki, ang lainlaing lebel sa pagkakomplikado mahimong makonsiderar.Ang mga pagtuon sa rehiyon mahimong magkinahanglan og bug-os nga pagkakomplikado (ie, tanan nga 115 ka probinsya).Isip usa ka pananglitan ug alang sa katin-awan, tagda ang minimum nga girekomendar nga pagkakomplikado sa 12.
Isip usa ka pananglitan sa kapuslanan sa pamaagi sa SAGE, 12 ka AEP nga adunay minimum nga pagkakomplikado sa 12 ang gigamit dinhi aron masusi ang pagkontrol sa istruktura sa emerhensya nga komunidad.Ang Figure 5 naghulagway sa ecological insights nga gi-grupo sa AEP (gikan sa A to L): Sa Redfield stoichiometry, geographic nga gilapdon (Figure 5C), functional group biomass composition (Figure 5A) ug nutrient supply (Figure 5B) gihimo sa N Zoomed.Gipakita ang ratio (N:Si:P:Fe, 1:1:16:16×103).Alang sa ulahi nga panel, ang P gipadaghan sa 16 ug ang Fe gipadaghan sa 16 × 103, busa ang bar graph katumbas sa mga kinahanglanon sa nutrisyon sa phytoplankton.
Ang mga probinsya giklasipikar ngadto sa 12 ka AEPs A to L. (A) Biomass (mgC/m3) sa mga ekosistema sa 12 ka probinsiya.(B) Ang nutrient flux rate sa dissolved inorganic nitrogen (N), iron (Fe), phosphate (P) ug silicic acid (Si) (mmol/m3 kada tuig).Ang Fe ug P gipadaghan sa 16 ug 16 × 103, matag usa, aron ang mga strips ma-standardize sa mga kinahanglanon sa phytoplankton stoichiometry.(C) Matikdi ang kalainan tali sa mga polar region, subtropical cyclone ug major seasonal/rising regions.Ang monitoring stations gimarkahan sa mosunod: 1, SEATS;2, ALOHA;3, estasyon P;ug 4, BATS.
Ang giila nga AEP talagsaon.Adunay pipila ka simetrya sa palibot sa ekwador sa Atlantiko ug Pasipiko nga Kadagatang Pasipiko, ug usa ka susama apan gipadak-an nga lugar ang naglungtad sa Dagat sa India.Ang ubang mga AEP naglakip sa kasadpang bahin sa kontinente nga nalangkit sa pagsaka.Ang South Pole Circumpolar Current giisip nga usa ka dako nga zonal feature.Ang subtropical cyclone usa ka komplikadong serye sa oligotrophic AEP.Niini nga mga probinsya, ang pamilyar nga sumbanan sa biomass nga mga kalainan tali sa plankton-dominated oligotrophic vortices ug diatom-rich polar regions klaro.
Ang mga AEP nga adunay susama kaayo nga kinatibuk-ang biomass sa phytoplankton mahimong adunay lahi kaayo nga istruktura sa komunidad ug naglangkob sa lain-laing geographic nga mga lugar, sama sa D, H, ug K, nga adunay parehas nga kinatibuk-ang biomass sa phytoplankton.Ang AEP H kasagaran anaa sa ekwador nga Indian Ocean, ug adunay mas daghang diazotrophic nga bakterya.Ang AEP D makit-an sa daghang mga basin, apan kini labi ka prominente sa Pasipiko palibot sa mga lugar nga adunay taas nga ani sa palibot sa equatorial upwelling.Ang porma niining probinsya sa Pasipiko nagpahinumdom sa usa ka planetary wave train.Adunay pipila ka diazobacteria sa AEP D, ug daghang mga cone.Kon itandi sa laing duha ka probinsiya, ang AEP K makita lamang sa kabukiran sa Arctic Ocean, ug adunay mas daghang diatom ug mas diyutay nga plankton.Angay nga matikdan nga ang gidaghanon sa plankton niining tulo ka mga rehiyon lahi usab kaayo.Lakip kanila, ang plankton abundance sa AEP K medyo ubos, samtang ang sa AEP D ug H medyo taas.Busa, bisan pa sa ilang biomass (ug busa susama sa Chl-a), kini nga mga probinsya lahi kaayo: Ang pagsulay sa probinsya nga nakabase sa Chl mahimong dili makuha kini nga mga kalainan.
Dayag usab nga ang pipila ka mga AEP nga adunay lahi kaayo nga biomass mahimong parehas sa mga termino sa istruktura sa komunidad sa phytoplankton.Pananglitan, kini makita sa AEP D ug E. Duol sila sa usag usa, ug sa Dagat Pasipiko, ang AEP E duol sa produktibo kaayo nga AEPJ.Sa susama, walay klarong kalambigitan tali sa biomass sa phytoplankton ug sa kadagaya sa zooplankton.
Ang AEP mahimong masabtan sa mga termino sa mga sustansya nga gihatag kanila (Figure 5B).Ang mga diatom anaa lamang kung adunay igong suplay sa silicic acid.Kasagaran, kon mas taas ang suplay sa silicic acid, mas taas ang biomass sa diatoms.Ang diatoms makita sa AEP A, J, K ug L. Ang ratio sa diatom biomass kalabot sa ubang phytoplankton gitino sa N, P ug Fe nga gihatag kalabot sa panginahanglan sa diatom.Pananglitan, ang AEP L gimandoan sa mga diatom.Kung itandi sa ubang mga sustansya, ang Si adunay pinakataas nga suplay.Sa kasukwahi, bisan pa sa mas taas nga produktibidad, ang AEP J adunay gamay nga diatoms ug gamay nga suplay sa silicon (tanan ug may kalabotan sa ubang mga sustansya).
Ang Diazonium nga bakterya adunay katakus sa pag-ayo sa nitroheno, apan hinay nga motubo (31).Sila nag-uban sa ubang mga phytoplankton, diin ang iron ug phosphorus sobra ra kalabot sa panginahanglan alang sa non-diazonium nutrients (20, 21).Angayan nga matikdan nga ang diazotrophic biomass medyo taas, ug ang suplay sa Fe ug P medyo dako kalabot sa suplay sa N. Niining paagiha, bisan kung ang kinatibuk-ang biomass sa AEP J mas taas, ang diazonium biomass sa AEP H mao ang mas dako kay sa J. Palihug timan-i nga ang AEP J ug H lahi kaayo sa geograpiya, ug ang H nahimutang sa ekwador nga Indian Ocean.
Kung ang talagsaon nga istruktura sa ekosistema dili bahinon sa mga probinsya, ang mga panabut nga nakuha gikan sa 12 nga labing ubos nga pagkakomplikado nga modelo sa AEP dili kaayo klaro.Ang AEP nga gihimo sa SAGE nagpadali sa managsama ug dungan nga pagtandi sa komplikado ug taas nga dimensiyon nga impormasyon gikan sa mga modelo sa ekosistema.Epektibo nga gipasiugda sa AEP kung ngano nga ang Chl dili maayo ug alternatibong pamaagi aron mahibal-an ang istruktura sa komunidad o ang kadagaya sa zooplankton sa mas taas nga lebel sa sustansya.Ang usa ka detalyado nga pag-analisar sa nagpadayon nga mga hilisgutan sa panukiduki wala pa sa sulud sa kini nga artikulo.Ang pamaagi sa SAGE naghatag ug paagi sa pagsuhid sa ubang mga mekanismo sa modelo nga mas sayon dumalahon kay sa point-to-point nga pagtan-aw.
Ang pamaagi sa SAGE gisugyot aron makatabang sa pagpatin-aw sa labihan ka komplikado nga datos sa ekolohiya gikan sa global nga pisikal/biogeochemical/ecosystem numerical models.Ang ekolohikal nga probinsya gitino sa kinatibuk-ang biomass sa cross-plankton functional nga mga grupo, ang paggamit sa t-SNE probability dimensionality reduction algorithm ug ang clustering gamit ang unsupervised ML method DBSCAN.Ang inter-provincial BC difference/graph theory para sa nesting method gigamit aron makuha ang lig-on nga AEP nga magamit para sa global interpretation.Sa termino sa pagtukod, ang Eco-Province ug AEP talagsaon.Ang AEP nesting mahimong ipasibo tali sa hingpit nga pagkakomplikado sa orihinal nga ekolohikal nga probinsya ug sa girekomendar nga minimum nga threshold sa 12 ka AEP.Ang pagsalag ug pagtino sa minimum nga pagkakomplikado sa AEP gikonsiderar nga yawe nga mga lakang, tungod kay ang kalagmitan nga t-SNE makadaut sa mga AEP nga <12 ka komplikado.Ang pamaagi sa SAGE kay global, ug ang pagkakomplikado niini gikan sa> 100 ka AEP ngadto sa 12. Alang sa kayano, ang kasamtangang gipunting mao ang pagkakomplikado sa 12 ka global nga AEP.Ang umaabot nga panukiduki, labi na ang mga pagtuon sa rehiyon, mahimong makit-an ang usa ka gamay nga spatial nga subset sa mga global nga eco-province nga mapuslanon, ug mahimo nga giipon sa usa ka gamay nga lugar aron mapahimuslan ang parehas nga mga panan-aw sa ekolohiya nga gihisgutan dinhi.Naghatag kini og mga sugyot kung giunsa kini nga mga probinsya sa ekolohiya ug ang mga panabut nga nakuha gikan niini magamit alang sa dugang nga pagsabut sa ekolohiya, mapadali ang pagtandi sa modelo, ug mahimo’g mapaayo ang pagmonitor sa mga ekosistema sa dagat.
Ang ekolohikal nga probinsya ug AEP nga giila sa pamaagi sa SAGE gibase sa datos sa numerical model.Pinaagi sa kahulugan, ang numerical nga modelo usa ka gipasimple nga istruktura, naningkamot nga makuha ang esensya sa target nga sistema, ug ang lainlaing mga modelo adunay lainlaing pag-apod-apod sa plankton.Ang numerical model nga gigamit niini nga pagtuon dili hingpit nga makadakop sa pipila sa mga naobserbahang pattern (pananglitan, sa Chl banabana para sa ekwador nga rehiyon ug sa Southern Ocean).Gamay ra nga bahin sa pagkalainlain sa tinuod nga kadagatan ang nakuha, ug ang meso ug sub-mesoscales dili masulbad, nga mahimong makaapekto sa nutrient flux ug mas gamay nga istruktura sa komunidad.Bisan pa niini nga mga kakulian, kini nahimo nga ang AEP mapuslanon kaayo sa pagtabang sa pagsabut sa komplikado nga mga modelo.Pinaagi sa pagtimbang-timbang kung diin makit-an ang parehas nga mga probinsya sa ekolohiya, ang AEP naghatag usa ka potensyal nga himan sa pagtandi sa numerical model.Ang kasamtangang numerical model nagkuha sa kinatibuk-ang pattern sa remote sensing phytoplankton Chl-a nga konsentrasyon ug ang pag-apod-apod sa plankton size ug functional group (Note S1 ug Figure S1) (2, 32).
Ingon sa gipakita sa 0.1 mgChl-a/m-3 contour line, ang AEP gibahin sa oligotrophic area ug mesotrophic area (Figure S1B): AEP B, C, D, E, F ug G mga oligotrophic nga lugar, ug ang nahabilin nga mga lugar mao ang nahimutang sa Higher Chl-a.Gipakita sa AEP ang pipila ka mga sulat sa Longhurst Province (Figure S3A), pananglitan, ang Southern Ocean ug ang equatorial Pacific.Sa pipila ka mga rehiyon, ang AEP naglangkob sa daghang mga rehiyon sa Longhurst, ug vice versa.Tungod kay lahi ang tuyo sa pagdelimita sa mga probinsya niining dapita ug Longhurst, gilauman nga adunay mga kalainan.Daghang mga AEP sa usa ka probinsya sa Longhurst nagpakita nga ang pipila ka mga lugar nga adunay parehas nga biogeochemistry mahimong adunay lahi kaayo nga istruktura sa ekosistema.Ang AEP nagpakita sa usa ka piho nga mga sulat sa pisikal nga mga estado, ingon nga gipadayag gamit ang wala gibantayan nga pagkat-on (19), sama sa taas nga pagtaas sa estado (pananglitan, ang Southern Ocean ug ang equatorial Pacific; Figure S3, C ug D).Kini nga mga sulat nagpakita nga ang istruktura sa komunidad sa plankton kusog nga naimpluwensyahan sa dinamika sa kadagatan.Sa mga lugar sama sa North Atlantic, ang AEP naglatas sa pisikal nga mga probinsya.Ang mekanismo nga hinungdan sa kini nga mga kalainan mahimong maglakip sa mga proseso sama sa transportasyon sa abog, nga mahimong mosangput sa hingpit nga lainlaing mga programa sa nutrisyon bisan sa ilawom sa parehas nga pisikal nga kahimtang.
Gipunting sa Ministry of Ecology ug AEP nga ang paggamit sa Chl lamang dili makaila sa mga sangkap sa ekolohiya, ingon nga naamgohan na sa komunidad sa ekolohiya sa dagat.Makita kini sa mga AEP nga adunay parehas nga biomass apan lahi kaayo nga komposisyon sa ekolohiya (sama sa D ug E).Sa kasukwahi, ang mga AEP sama sa D ug K adunay lahi kaayo nga biomass apan parehas nga komposisyon sa ekolohiya.Gipasiugda sa AEP nga ang relasyon tali sa biomass, komposisyon sa ekolohiya ug kadagaya sa zooplankton komplikado.Pananglitan, bisan tuod ang AEP J nag-una sa mga termino sa phytoplankton ug plankton biomass, ang AEP's A ug L adunay susama nga plankton biomass, apan ang A adunay mas taas nga plankton abundance.Ang AEP nagpasiugda nga ang phytoplankton biomass (o Chl) dili magamit sa pagtagna sa zooplankton biomass.Ang Zooplankton mao ang pundasyon sa kadena sa pagkaon sa pangisda, ug ang mas tukma nga mga banabana mahimong mosangpot sa mas maayong pagdumala sa kahinguhaan.Ang umaabot nga mga satelayt nga kolor sa dagat [pananglitan, PACE (plankton, aerosol, cloud, ug marine ecosystem)] mahimong mas maayo nga posisyon aron makatabang sa pagbanabana sa istruktura sa komunidad sa phytoplankton.Ang paggamit sa prediksyon sa AEP posibleng mapadali ang pagbanabana sa zooplankton gikan sa kawanangan.Ang mga pamaagi sama sa SAGE, inubanan sa mga bag-ong teknolohiya, ug mas daghan pa nga datos sa field nga magamit para sa ground truth surveys (sama sa Tara ug follow-up nga panukiduki), mahimong magdungan og lakang padulong sa satellite-based ecosystem health monitoring.
Ang pamaagi sa SAGE naghatag ug sayon nga paagi sa pagtimbang-timbang sa pipila ka mekanismo nga nagkontrolar sa mga kinaiya sa probinsiya, sama sa biomass/Chl, net primary production, ug istruktura sa komunidad.Pananglitan, ang relatibong gidaghanon sa mga diatom gitakda sa usa ka imbalance sa suplay sa Si, N, P, ug Fe kalabot sa mga kinahanglanon sa stoichiometric sa phytoplankton.Sa balanse nga supply rate, ang komunidad gidominar sa diatoms (L).Kung ang supply rate dili balanse (nga mao, ang suplay sa silicon mas ubos kay sa nutrient nga panginahanglan sa diatoms), ang diatoms nag-asoy sa gamay nga bahin nga Share (K).Kung ang suplay sa Fe ug P molapas sa suplay sa N (pananglitan, E ug H), ang diazotrophic nga bakterya motubo nga kusog.Pinaagi sa konteksto nga gihatag sa AEP, ang pagsuhid sa mga mekanismo sa pagkontrol mahimong mas mapuslanon.
Ang Eco-Province ug AEP mga lugar nga adunay parehas nga istruktura sa komunidad.Ang serye sa oras gikan sa usa ka lokasyon sulod sa usa ka ekolohikal nga probinsya o AEP mahimong isipon nga usa ka reference point ug mahimong magrepresentar sa lugar nga sakop sa ecological province o AEP.Ang mga long-term on-site monitoring stations naghatag sa maong serye sa panahon.Ang mga long-term in-situ data sets magpadayon sa pagdula sa usa ka dili maihap nga papel.Gikan sa panan-aw sa pagmonitor sa istruktura sa komunidad, ang pamaagi sa SAGE makita isip usa ka paagi aron makatabang sa pagtino sa labing mapuslanon nga lokasyon sa bag-ong mga site.Pananglitan, ang serye sa panahon gikan sa long-term oligotrophic habitat assessment (ALOHA) anaa sa AEP B sa oligotrophic nga lugar (Figure 5C, label 2).Tungod kay ang ALOHA duol sa utlanan sa laing AEP, ang serye sa panahon mahimong dili representante sa tibuok dapit, sama sa gisugyot kaniadto (33).Sa samang AEP B, ang time series SEATS (Southeast Asian Time Series) nahimutang sa habagatan-kasadpang Taiwan (34), mas layo sa mga utlanan sa ubang mga AEP (Figure 5C, label 1), ug mahimong gamiton isip mas maayong lokasyon sa pagmonitor. AEPB.Ang serye sa oras sa BATS (Bermuda Atlantic Time Series Study) (Figure 5C, label 4) sa AEPC duol kaayo sa utlanan tali sa AEP C ug F, nga nagpakita nga ang pagmonitor sa AEP C gamit ang BATS time series mahimong direktang problema.Ang Estasyon P sa AEP J (Figure 5C, label 3) layo sa utlanan sa AEP, mao nga mas representante kini.Ang Eco-Province ug AEP makatabang sa pag-establisar og usa ka monitoring framework nga haom sa pag-assess sa global nga mga kausaban, tungod kay ang pagtugot sa mga probinsya sa pag-assess kung asa ang on-site sampling makahatag ug importanteng mga insight.Ang pamaagi sa SAGE mahimo pang mapalambo aron magamit sa datos sa klima aron masusi ang pagkabag-o nga makadaginot sa oras.
Ang kalampusan sa pamaagi sa SAGE makab-ot pinaagi sa mabinantayon nga paggamit sa mga pamaagi sa data science/ML ug kahibalo nga piho sa domain.Sa espesipiko, ang t-SNE gigamit sa paghimo sa pagkunhod sa dimensionality, nga nagpreserbar sa covariance structure sa high-dimensional nga datos ug nagpadali sa visualization sa covariance topology.Ang mga datos gihan-ay sa porma sa mga labud ug covariances (Figure 2A), nga nagpakita nga ang lunsay nga gibase sa gilay-on nga mga lakang (sama sa K-means) dili angay tungod kay sila kasagaran naggamit sa Gaussian (circular) nga basehan nga pag-apod-apod (gihisgot sa Note S2) .Ang pamaagi sa DBSCAN angay alang sa bisan unsang covariance topology.Hangtud nga imong hatagan ug pagtagad ang pagtakda sa mga parameter, ang kasaligan nga pag-ila mahimong ihatag.Ang computational nga gasto sa t-SNE algorithm taas, nga naglimite sa kasamtangan nga aplikasyon niini ngadto sa mas dako nga gidaghanon sa datos, nga nagpasabot nga lisud ang paggamit sa lawom o lain-laing mga natad sa panahon.Ang pagtrabaho sa scalability sa t-SNE nagpadayon.Tungod kay ang gilay-on sa KL dali nga maparehas, ang t-SNE algorithm adunay maayong potensyal alang sa pagpalapad sa umaabot (35).Sa pagkakaron, ang uban pang mga maayong pamaagi sa pagkunhod sa dimensyon nga mas maayo nga makunhuran ang gidak-on naglakip sa hiniusa nga manifold approximation ug projection (UMAP) nga mga teknik, apan gikinahanglan ang pagtimbang-timbang sa konteksto sa datos sa kadagatan.Ang kahulogan sa mas maayo nga scalability mao, pananglitan, ang pagklasipikar sa mga klima sa kalibutan o mga modelo nga adunay lainlaing pagkakomplikado sa usa ka sinagol nga layer.Ang mga lugar nga napakyas sa pagklasipikar sa SAGE sa bisan unsang probinsya mahimong isipon nga nahabilin nga itom nga tuldok sa Figure 2A.Sa heyograpiya, kini nga mga lugar kasagaran sa mga lugar nga labi ka seasonal, nga nagsugyot nga ang pag-ilog sa mga probinsya nga ekolohikal nga nagbag-o sa paglabay sa panahon makahatag og mas maayo nga coverage.
Aron matukod ang pamaagi sa SAGE, gigamit ang mga ideya gikan sa komplikadong mga sistema/siyensya sa datos, gamit ang abilidad sa pagtino sa mga pungpong sa mga functional nga grupo (ang posibilidad nga mahimong duol kaayo sa usa ka 11-dimensional nga luna) ug pagtino sa mga probinsya.Kini nga mga probinsya naghulagway sa piho nga mga volume sa atong 3D t-SNE phase space.Sa susama, ang bahin sa Poincaré mahimong gamiton sa pagtimbang-timbang sa "volume" sa luna sa estado nga giokupar sa trajectory aron mahibal-an ang "normal" o "gulo" nga kinaiya (36).Alang sa static nga 11-dimensional nga modelo nga output, ang gidaghanon nga na-okupar human ang datos mabag-o ngadto sa usa ka 3D phase space mahimong parehas nga ipasabut.Ang relasyon tali sa geographic nga lugar ug lugar sa 3D phase space dili yano, apan kini mahimong ipasabut sa mga termino sa ekolohikal nga pagkaparehas.Tungod niini nga rason, ang mas naandan nga BC dissimilarity nga sukod gipalabi.
Ang umaabot nga trabaho mogamit pag-usab sa pamaagi sa SAGE alang sa us aka seasonal nga pagbag-o sa datos aron masusi ang spatial variability sa giila nga mga probinsya ug AEP.Ang umaabot nga tumong mao ang paggamit niini nga pamaagi aron makatabang sa pagtino kung unsang mga probinsya ang matino pinaagi sa satellite measurements (sama sa Chl-a, remote sensing reflectivity ug sea surface temperature).Kini magtugot sa remote sensing assessment sa ecological components ug flexible kaayo nga pagmonitor sa ecological provinces ug sa ilang pagkausab-usab.
Ang katuyoan niini nga panukiduki mao ang pagpaila sa pamaagi sa SAGE, nga naghubit sa usa ka ekolohikal nga probinsya pinaagi sa talagsaon nga istruktura sa komunidad sa plankton.Dinhi, igahatag ang mas detalyado nga impormasyon bahin sa modelo sa pisikal/biogeochemical/ecosystem ug ang pagpili sa parameter sa t-SNE ug DBSCAN algorithm.
Ang pisikal nga mga sangkap sa modelo naggikan sa pagbanabana sa sirkulasyon sa kadagatan ug klima [ECCOv4;(37) ang global state banabana nga gihulagway sa (38).Ang nominal nga resolusyon sa pagbanabana sa estado mao ang 1/5.Ang labing gamay nga pamaagi sa squares nga adunay Lagrangian multiplier nga pamaagi gigamit aron makuha ang inisyal ug utlanan nga mga kondisyon ug internal nga mga parameter sa modelo nga gipasibo pinaagi sa obserbasyon, sa ingon makamugna og usa ka libre nga pagpadagan sa MIT general cycle model (MITgcm) (39), ang modelo Human sa pag-optimize, ang mga resulta mahimo bantayan ug bantayan.
Ang biogeochemistry/ecosystem adunay mas kompleto nga deskripsyon (ie mga equation ug parameter values) sa (2).Gikuha sa modelo ang sirkulasyon sa C, N, P, Si ug Fe pinaagi sa dili organiko ug organikong mga lim-aw.Ang bersyon nga gigamit dinhi naglakip sa 35 ka espisye sa phytoplankton: 2 ka espisye sa microprokaryotes ug 2 ka espisye sa microeukaryotes (angay alang sa ubos nga sustansiya nga palibot), 5 ka espisye sa Cryptomonas sphaeroides (nga adunay calcium carbonate coating), 5 ka espisye sa diazonium (Mahimong ayuhon ang nitrogen, busa kini dili limitado) ang pagkaanaa sa dissolved inorganic nitrogen), 11 diatoms (pagporma sa usa ka siliceous cover), 10 mixed-vegetative flagellates (mahimo photosynthesize ug makakaon sa ubang mga plankton) ug 16 Zooplankton (magsibsib sa ubang mga plankton).Gitawag kini nga "biogeochemical functional groups" tungod kay kini adunay lain-laing mga epekto sa marine biogeochemistry (40, 41) ug sagad gigamit sa obserbasyon ug modelo nga mga pagtuon.Niini nga modelo, ang matag functional nga grupo gilangkuban sa daghang mga plankton nga lainlain ang gidak-on, nga adunay gitas-on nga 0.6 hangtod 2500 μm nga katumbas sa spherical diameter.
Ang mga parametro nga nakaapekto sa pagtubo, pagpasibsib ug pagkalunod sa phytoplankton nalangkit sa gidak-on, ug adunay mga piho nga kalainan tali sa unom ka phytoplankton functional groups (32).Bisan pa sa nagkalainlaing pisikal nga mga gambalay, ang mga resulta sa 51 ka plankton nga mga sangkap sa modelo gigamit sa daghang bag-ong mga pagtuon (42-44).
Gikan sa 1992 ngadto sa 2011, ang physical/biogeochemical/ecosystem coupling model midagan sulod sa 20 ka tuig.Ang output sa modelo naglakip sa plankton biomass, nutrient concentration ug nutrient supply rate (DIN, PO4, Si ug Fe).Niini nga pagtuon, ang 20 ka tuig nga aberids niini nga mga output gigamit isip input sa Ecological Province.Chl, ang pag-apod-apod sa biomass sa plankton ug konsentrasyon sa nutrient ug ang pag-apod-apod sa mga functional nga grupo gitandi sa satellite ug in-situ nga mga obserbasyon [tan-awa ang (2, 44), Note S1 ug numero.S1 hangtod sa S3].
Alang sa pamaagi sa SAGE, ang nag-unang tinubdan sa randomness gikan sa t-SNE nga lakang.Ang pagka-random nakababag sa pagkasubli, nga nagpasabot nga ang mga resulta dili kasaligan.Ang pamaagi sa SAGE hugot nga nagsulay sa kalig-on pinaagi sa pagtino sa usa ka set sa mga parameter sa t-SNE ug DBSCAN, nga kanunay nga makaila sa mga cluster kung gisubli.Ang pagtino sa "kalibog" sa t-SNE parameter mahimong sabton ingon nga pagtino sa ang-ang diin ang pagmapa gikan sa taas ngadto sa ubos nga mga dimensyon kinahanglang morespeto sa lokal o global nga mga kinaiya sa datos.Nakab-ot ang kalibog sa 400 ug 300 nga mga pag-uli.
Alang sa clustering algorithm DBSCAN, ang minimum nga gidak-on ug gilay-on nga sukatan sa mga punto sa datos sa cluster kinahanglan nga matino.Ang minimum nga gidaghanon gitino ubos sa paggiya sa mga eksperto.Kini nga kahibalo nahibal-an kung unsa ang mohaum sa kasamtangan nga numerical modeling framework ug resolusyon.Ang minimum nga gidaghanon mao ang 100. Ang mas taas nga minimum nga bili (ubos sa <135 sa dili pa ang taas nga limitasyon sa berde mahimong mas lapad) mahimong isipon, apan dili kini makapuli sa pamaagi sa paghugpong base sa BC dissimilarity.Ang lebel sa koneksyon (Figure 6A) gigamit aron itakda ang ϵ parameter, nga makatabang sa mas taas nga coverage (Figure 6B).Ang pagkadugtong gihubit isip ang composite nga gidaghanon sa mga cluster ug sensitibo sa ϵ parameter.Ang ubos nga koneksyon nagpakita sa dili igo nga angay, artipisyal nga paggrupo sa mga rehiyon.Ang taas nga koneksyon nagpaila sa overfitting.Problema usab ang overfitting, tungod kay kini nagpakita nga ang inisyal nga random nga pagtag-an mahimong mosangpot sa dili mabag-o nga mga resulta.Sa tunga-tunga niining duha ka mga ekstrem, ang usa ka mahait nga pagtaas (kasagaran gitawag nga "siko") nagpakita sa labing maayo nga ϵ.Sa Figure 6A, nakita nimo ang usa ka mahait nga pagtaas sa lugar sa kapatagan (dilaw,> 200 nga mga pungpong), gisundan sa usa ka mahait nga pagkunhod (berde, 100 nga mga pungpong), hangtod sa mga 130, gilibutan sa pipila ka mga pungpong (asul, <60 nga mga pungpong) ).Sa labing menos 100 ka asul nga mga lugar, bisan usa ka pungpong ang nagdominar sa tibuok kadagatan (ϵ <0.42), o ang kadaghanan sa kadagatan wala giklasipikar ug gikonsiderar nga kasaba (ϵ> 0.99).Ang yellow nga lugar adunay daghan kaayo nga variable, dili mabag-o nga pag-apod-apod sa cluster.Samtang nagkunhod ang ϵ, nagkadaghan ang kasaba.Ang kusog nga pagtaas sa berde nga lugar gitawag nga siko.Kini usa ka labing maayo nga rehiyon.Bisan tuod gigamit ang probabilidad nga t-SNE, ang BC dissimilarity sulod sa probinsiya magamit gihapon sa pagdeterminar sa kasaligang clustering.Gamit ang Figure 6 (A ug B), ibutang ang ϵ sa 0.39.Kon mas dako ang minimum nga gidaghanon, mas gamay ang posibilidad nga makaabot sa ϵ nga nagtugot sa kasaligang klasipikasyon, ug mas dako ang berdeng dapit nga adunay bili nga labaw sa 135. Ang pagpadako niini nga dapit nagpakita nga ang siko mas lisud pangitaon o dili- anaa.
Human sa pag-set sa mga parameter sa t-SNE, ang kinatibuk-ang gidaghanon sa mga cluster nga makit-an gamiton isip sukod sa koneksyon (A) ug ang porsyento sa datos nga gigahin sa cluster (B).Ang pula nga tulbok nagpakita sa labing maayo nga kombinasyon sa coverage ug koneksyon.Ang minimum nga gidaghanon gitakda sumala sa minimum nga gidaghanon nga may kalabutan sa ekolohiya.
Para sa mga dugang nga materyales para niini nga artikulo, palihug tan-awa ang http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Kini usa ka bukas nga access nga artikulo nga gipang-apod-apod ubos sa mga termino sa Creative Commons Attribution License.Gitugotan sa artikulo ang walay pugong nga paggamit, pag-apod-apod, ug pagkopya sa bisan unsang medium sa ilawom sa kondisyon nga ang orihinal nga trabaho husto nga gisitar.
Mubo nga sulat: Gihangyo lang ka namo nga ihatag ang imong email address aron ang tawo nga imong girekomenda sa panid makahibalo nga gusto nimo nga makita nila ang email ug nga kini dili spam.Dili kami mokuha ug bisan unsang email address.
Kini nga pangutana gigamit sa pagsulay kung ikaw usa ka bisita ug mapugngan ang awtomatikong pagsumite sa spam.
Determinado ang Global Ministry of Marine Ecology nga sulbaron ang mga komplikadong problema ug gigamit ang dili bantayan nga ML aron masusi ang mga istruktura sa komunidad.
Determinado ang Global Ministry of Marine Ecology nga sulbaron ang mga komplikadong problema ug gigamit ang dili bantayan nga ML aron masusi ang mga istruktura sa komunidad.
Oras sa pag-post: Ene-12-2021