Gainbegiratu gabeko ikaskuntza-metodo bat proposatzen da itsas probintzia ekologiko globalak (eko-probintziak) zehazteko plankton komunitatearen egituran eta elikagai-fluxuaren datuetan oinarrituta.Probintzia ekologiko integratu sistematikoa (SAGE) metodoak probintzia ekologikoak identifikatu ditzake ekosistema eredu oso ez-linealetan.Datuen kobariantza ez-gaussierara egokitzeko, SAGEk t random neighbor embedding (t-SNE) erabiltzen du dimentsioa murrizteko.Density-based spatial clustering (DBSCAN) algoritmoan oinarritutako zarataren aplikazioaren laguntzaz, ehun probintzia ekologiko baino gehiago identifikatu daitezke.Distantzia-neurri gisa desberdintasun ekologikoak dituen konektibitate-mapa erabiliz, probintzia ekologiko agregatu sendo bat (AEP) objektiboki definitzen da habiaratu diren probintzia ekologikoen bidez.AEPak erabiliz, komunitatearen egituran mantenugaien hornikuntza-tasaren kontrola aztertu zen.Ekoprobintzia eta AEP bakarrak dira eta ereduaren interpretazioan lagun dezakete.Ereduen arteko konparaketak erraztu ditzakete eta itsas ekosistemen ulermena eta jarraipena hobetu dezakete.
Probintziak itsasoko edo lehorreko biogeografia konplexuak eremu koherente eta esanguratsuetan antolatzen diren eskualdeak dira (1).Probintzia hauek oso garrantzitsuak dira kokapenak alderatzeko eta kontrastatzeko, behaketak ezaugarritzeko, jarraipena egiteko eta babesteko.Probintzia hauek sortzen dituzten interakzio konplexu eta ez-linealek gainbegiratu gabeko ikaskuntza automatikoko (ML) metodoak oso egokiak bihurtzen dituzte probintziak objektiboki zehazteko, datuen kobariantza konplexua eta ez-gaussarra delako.Hemen, ML metodo bat proposatzen da, zeinak sistematikoki identifikatzen dituen itsas probintzia ekologiko bakarrak (eko-probintziak) Darwinen hiru dimentsioko (3D) eredu fisiko/ekosistema globaletik (2)."Bakarra" terminoa identifikatutako eremua beste eremu batzuekin behar adina gainjartzen ez dela adierazteko erabiltzen da.Metodo honi System Integrated Ecological Province (SAGE) metodoa deitzen zaio.Sailkapen erabilgarria egiteko, algoritmo-metodo batek (i) sailkapen globala eta (ii) eskala anitzeko analisia ahalbidetu behar ditu, espazioan eta denboran habiaratu/agregatu daitezkeen (3).Ikerketa honetan SAGE metodoa proposatu zen lehenik eta identifikatutako probintzia ekologikoak eztabaidatu ziren.Eko-probintziek komunitatearen egitura kontrolatzen duten faktoreen ulermena susta dezakete, estrategien jarraipena egiteko ikuspegi erabilgarriak eman ditzakete eta ekosistemako aldaketen jarraipena egiten lagun dezakete.
Lurreko probintziak klimaren (prezipitazioak eta tenperatura), lurzoruaren, landaretzaren eta faunaren antzekotasunen arabera sailkatu ohi dira, eta kudeaketa osagarrirako, biodibertsitatearen ikerketarako eta gaixotasunen kontrolerako erabiltzen dira (1, 4).Itsas probintziak zehaztea zailagoa da.Organismo gehienak mikroskopikoak dira, fluidoen mugak dituzte.Longhurst et al.(5) Ingurumen-baldintzetan oinarritutako Ozeanografia Ministerioaren lehen sailkapen globaletako bat eman zuen.“Longhurst” probintzia hauen definizioak nahasketa-tasa, estratifikazioa eta irradiantzia bezalako aldagaiak barne hartzen ditu, baita Longhurst-ek itsas ozeanografo gisa duen esperientzia zabala ere, itsas ekosistemetarako beste baldintza garrantzitsuak dituena.Longhurst asko erabili da, adibidez, ekoizpen primarioa eta karbono-fluxuak ebaluatzeko, arrantzari laguntzeko eta in situ behaketa jarduerak planifikatzeko (5-9).Probintziak modu objektiboagoan definitzeko, logika lausoa eta eskualdeko gainbegiratu gabeko clustering/estatistika bezalako metodoak erabili dira (9-14).Metodo horien helburua eskuragarri dauden behaketa-datuetan probintziak identifikatu ditzaketen egitura esanguratsuak identifikatzea da.Adibidez, itsas probintzia dinamikoek (12) mapa autoantolatzaileak erabiltzen dituzte zarata murrizteko, eta multzokatze hierarkikoa (zuhaitzetan oinarritutako) erabiltzen dute eskualdeko sateliteetatik eratorritako itsas koloreko produktuak zehazteko [klorofila a (Chl-a), fluoreszentzia lerroaren altuera normalizatua eta koloretako materia organiko disolbatua] eta eremu fisikoa (itsasoaren gainazaleko tenperatura eta gazitasuna, topografia dinamiko absolutua eta itsas izotza).
Planktonaren komunitate-egitura kezkagarria da bere ekologiak eragin handia duelako mantenugai maila altuagoetan, karbono-xurgapenean eta kliman.Hala ere, oraindik ere erronka eta iheskorra den helburu bat da plankton komunitatearen egituran oinarritutako probintzia ekologiko global bat zehaztea.Itsas koloreko sateliteek fitoplanktonaren ale lodiaren sailkapenari buruzko argibideak eman ditzakete edo talde funtzionalen abantailak iradoki ditzakete (15), baina gaur egun ezin dute komunitatearen egiturari buruzko informazio zehatza eman.Azken inkestek [adibidez, Tara Ocean (16)] komunitatearen egituraren aurrekaririk gabeko neurketak ematen ari dira;gaur egun, in situ behaketa eskasak baino ez daude mundu mailan (17).Aurretik egindako ikerketek, neurri handi batean, "Probintzia Biogeokimikoa" (12, 14, 18) zehaztu dute antzekotasun biokimikoen (hala nola ekoizpen primarioa, Chl eta eskuragarri dagoen argia) zehaztapenean oinarrituta.Hemen, zenbakizko eredua erabiltzen da [Darwin(2)] ateratzeko, eta probintzia ekologikoa komunitatearen egituraren eta mantenugai-fluxuaren arabera zehazten da.Ikerketa honetan erabilitako zenbakizko ereduak estaldura globala du eta dauden eremuko datuekin (17) eta teledetekzioarekin (S1 oharra) alderatu daiteke.Ikerketa honetan erabilitako zenbakizko ereduaren datuek estaldura globalaren abantaila dute.Ereduzko ekosistema 35 fitoplankton espeziek eta 16 zooplankton espeziek osatzen dute (mesedez, aipatu materialak eta metodoak).Eredu plankton motak ez-linealki elkarreragiten dute gausiar ez diren kobariantza-egiturekin, beraz, diagnostiko-metodo sinpleak ez dira egokiak sortzen ari diren komunitate-egituretan eredu bakarrak eta koherenteak identifikatzeko.Hemen aurkeztutako SAGE metodoak Darwin eredu konplexuen irteera egiaztatzeko modu berri bat eskaintzen du.
Datu-zientzien/ML teknologiaren gaitasun eraldatzaile indartsuek eredu-konponbide oso konplexuak ahalbidetu ditzakete datu-kobariantzan egitura konplexu baina sendoak erakusteko.Metodo sendoa errore-tarte jakin batean emaitzak zintzoki erreproduzi ditzakeen metodo gisa definitzen da.Sistema sinpleetan ere, eredu eta seinale sendoak zehaztea erronka bat izan daiteke.Behatutako eredura daraman arrazoia zehaztu arte, sortzen ari den konplexutasuna konpontzen zaila/konplikatua izan daiteke.Ekosistemaren konposizioa ezartzeko funtsezko prozesua ez-lineala da.Interakzio ez-linealak egoteak sailkapen sendoa nahas dezake, beraz, datu kobariantzaren oinarrizko banaketa estatistikoari buruzko hipotesi sendoak egiten dituzten metodoak saihestea beharrezkoa da.Dimentsio handiko datuak eta ez-linealak ohikoak dira ozeanografian eta topologia konplexua eta ez-gaussiana duen kobariantza-egitura izan dezakete.Gauss ez den kobariantza-egitura duten datuek sailkapen sendoa oztopatu dezaketen arren, SAGE metodoa berria da topologia arbitrarioak dituzten clusterrak identifikatzeko diseinatuta dagoelako.
SAGE metodoaren helburua ulermen ekologikoa gehiago lagun dezaketen ereduak objektiboki identifikatzea da.(19) antzeko kluster-oinarritutako lan-fluxuari jarraituz, aldagai ekologikoak eta mantenugaien fluxuaren aldagaiak erabiltzen dira datuetan dagoen kluster bakarra zehazteko, probintzia ekologikoa deritzona.Ikerketa honetan proposatutako SAGE metodoak (1. Irudia) lehenik eta behin dimentsio-dimentsioa murrizten du 55 dimentsiotik 11 dimentsiora, a priori definitutako plankton-talde funtzionalak batuz (ikus Materialak eta Metodoak).t-ausazko bizilagunen barneratzea (t-SNE) metodoa erabiliz, tamaina gehiago murrizten da probabilitatea 3D espazioan proiektatuz.Gainbegiratu gabeko clusteringek ekologikoki hurbileko eremuak identifika ditzake [dentsitatean oinarritutako clustering espaziala (DBSCAN) zaratan oinarritutako aplikazioetarako].T-SNE eta DBSCAN berezko ekosistema ez-linealaren zenbaki-ereduaren datuetarako aplikagarriak dira.Ondoren, ondoriozko probintzia ekologikoa birproiektatu lurrera.Ehun probintzia ekologiko berezi baino gehiago identifikatu dira, eskualdeko ikerketarako egokiak.Mundu mailan koherentea den ekosistema-eredua kontuan hartzeko, SAGE metodoa erabiltzen da probintzia ekologikoak probintzia ekologiko agregatuetan (AEP) gehitzeko, probintzia ekologikoen eraginkortasuna hobetzeko.Agregazio-maila («konplexutasuna» deritzona) behar den xehetasun mailara egokitu daiteke.Zehaztu AEP sendo baten gutxieneko konplexutasuna.Hautaketaren ardatza SAGE metodoa da eta konplexutasun txikieneko AEP kasuak aztertzea larrialdi-komunitate-egituraren kontrola zehazteko.Ondoren, ereduak aztertu daitezke ikuspegi ekologikoak emateko.Hemen aurkeztutako metodoa ereduak alderatzeko ere erabil daiteke zabalago, adibidez, eredu ezberdinetan aurkitutako antzeko probintzia ekologikoen kokapenak ebaluatuz, desberdintasunak eta antzekotasunak nabarmentzeko, ereduak alderatzeko.
(A) Probintzia ekologikoa zehazteko lan-fluxuaren diagrama eskematikoa;Talde funtzionaleko batura erabiliz, jatorrizko 55 dimentsioko datuak 11 dimentsioko ereduaren irteerara murrizteko, zazpi plankton funtzional/elikagaien biomasa eta lau nutriente hornidura tasa barne.Balio arbuiagarria eta izotz estaldura iraunkorra.Datuak estandarizatu eta estandarizatu egin dira.Eman 11 dimentsioko datuak t-SNE algoritmoari estatistikoki antzeko ezaugarrien konbinazioak nabarmentzeko.DBSCANek arreta handiz hautatuko du kluster parametroaren balioa ezartzeko.Azkenik, proiektatu datuak berriro latitude/longitude proiekziora.Kontuan izan prozesu hau 10 aldiz errepikatzen dela, t-SNE aplikatuz ausazkotasun apur bat sor daitekeelako.(B) AEP-a nola lortu azaltzen du (A) 10 aldiz lan-fluxua errepikatuz.10 inplementazio horietako bakoitzerako, Bray-Curtis (BC) probintzien arteko desberdintasun-matrizea 51 fitoplankton motaren biomasaren arabera zehaztu zen.Zehaztu probintzien arteko BC aldea, 1 AEP konplexutasunetik 115 konplexutasun osoraino. BC erreferentzia Longhurst probintziak ezartzen du.
SAGE metodoak 3D fisiko/ekosistemen zenbakizko eredu globalaren irteera erabiltzen du probintzia ekologikoa definitzeko [Darwin (2);ikus Materialak eta metodoak eta S1 oharra].Ekosistemaren osagaiak 35 fitoplankton eta 16 zooplankton espeziez osatuta daude, aurrez zehaztutako zazpi talde funtzionalrekin: nutriente gutxiko inguruneetara egokitutako prokariotoak eta eukariotoak, kaltzio karbonatozko estaldura duten kokzidioak eta nitrogeno finkapen astuna. mantenugai garrantzitsuak), estaldura silizeoarekin, beste plankton fotosintesia egin dezakete eta nutriente mistoen flagelatuak eta zooplankton-artzainak bazkatzen dituzte.Tamaina tartea 0,6 eta 2500μm arteko diametro esferiko baliokidea da.Fitoplanktonaren tamainaren eta talde funtzionalaren banaketa ereduak satelite bidezko eta in situ behaketetan ikusten diren ezaugarri orokorrak jasotzen ditu (ikus S1etik S3rako irudiak).Zenbakizko ereduaren eta behatutako ozeanoaren arteko antzekotasunak adierazten du ereduak definitutako probintziak in situ ozeanoan aplikagarriak izan daitezkeela.Kontuan izan eredu honek fitoplanktonaren aniztasun jakin batzuk baino ez dituela harrapatzen, eta in situ ozeanoaren indartze fisiko eta kimiko-tarte jakin batzuk bakarrik.SAGE metodoak jendeak hobeto ulertzeko aukera eman dezake komunitate ereduaren egituraren kontrol erregional handiko mekanismoa.
Plankton talde funtzional bakoitzean gainazaleko biomasaren batura (batez beste 20 urteko denborarekin) bakarrik sartuz, datuen dimentsioa murriztu daiteke.Aurretik egindako ikerketek komunitatearen egitura ezartzeko funtsezko eginkizuna erakutsi ostean, elikagai-fluxuen gainazaleko iturri terminoak ere barne hartzen zituen (nitrogeno, burdina, fosfato eta azido silizikoaren hornidura) [adibidez (20, 21)].Talde funtzionalen batuketak arazoa 55etik (51 plankton eta 4 nutriente-fluxua) 11 dimentsiora murrizten du.Hasierako azterketa honetan, algoritmoak ezarritako muga konputazionalak direla eta, sakontasuna eta denboraren aldakortasuna ez ziren kontuan hartu.
SAGE metodoak prozesu ez-linealen eta talde funtzionalaren biomasaren eta nutriente-fluxuaren arteko elkarrekintzen funtsezko ezaugarrien arteko erlazio garrantzitsuak identifikatzeko gai da.Urrutiko ikaskuntza-metodo euklidearren (esaterako, K-means) oinarritutako 11 dimentsioko datuak erabiliz, ezin dira probintzia fidagarriak eta erreproduzigarriak lortu (19, 22).Hau da, probintzia ekologikoa definitzen duten funtsezko elementuen kobarientziaren oinarrizko banaketan Gauss-eko formarik aurkitzen ez delako.Voronoi zelulen K-baliabideek (lerro zuzenek) ezin dute gaussiar ez den oinarrizko banaketa mantendu.
Zazpi plankton talde funtzional eta lau nutriente-fluxuen biomasak 11 dimentsioko x bektore bat osatzen dute.Beraz, x ereduko sareko eremu bektoriala da, non xi elementu bakoitzak ereduko sareta horizontalean definitutako 11 dimentsioko bektore bat adierazten duen.i indize bakoitzak esferaren sareta-puntu bat identifikatzen du, non (lon, lat) = (ϕi, θi).Sare-unitate ereduaren biomasa 1,2 × 10-3 mg Chl/m3 baino txikiagoa bada edo izotz estaldura-tasa % 70 gainditzen badu, biomasaren datuen erregistroa erabili eta baztertzen da.Datuak normalizatu eta estandarizatuta daude, beraz, datu guztiak [0 eta 1] arteko tartean daude, batez bestekoa kendu eta unitateko bariantzara eskalatzen da.Hau egiten da ezaugarriak (biomasa eta nutriente-fluxua) balio posibleen barrutian dagoen kontrasteagatik mugatu ez daitezen.Clustering-ak aldaketa-erlazioa jaso beharko luke ezaugarrien arteko probabilitate gako-distantziatik, distantzia geografikoa baino.Distantzia horiek kuantifikatuz, ezaugarri garrantzitsuak azaleratzen dira, beharrezkoak ez diren xehetasunak baztertzen diren bitartean.Ekologiaren ikuspuntutik, hori beharrezkoa da, biomasa gutxiko fitoplankton mota batzuek eragin biogeokimiko handiagoak izan ditzaketelako, bakterio diazotrofoek nitrogenoaren finkapena adibidez.Datuak normalizatzean eta normalizatzean, kobariatu mota hauek nabarmenduko dira.
Dimentsio baxuko irudikapenean dimentsio handiko espazioko ezaugarrien hurbiltasuna azpimarratuz, t-SNE algoritmoa erabiltzen da lehendik dauden antzeko eskualdeak argiago egiteko.Urruneko detekziorako aplikazioetarako neurona-sare sakonak eraikitzera bideratutako aurreko lanek t-SNE erabili zuten, eta horrek ezaugarri nagusiak bereizteko trebetasuna frogatu zuen (23).Ezaugarrien datuetan multzokatze sendoa identifikatzeko beharrezko urratsa da konbergenteak ez diren irtenbideak saihestuz (S2 oharra).Gauss kernelak erabiliz, t-SNE-k datuen propietate estatistikoak gordetzen ditu dimentsio handiko objektu bakoitza 3D fase-espazioko puntu batean mapatuz, eta horrela bermatzen du antzeko objektuak izateko probabilitatea altua eta baxua norabide altu batean. dimentsioko espazioa (24).N dimentsio handiko objektu multzo bat x1,...,xN emanda, t-SNE algoritmoak Kullback-Leibler (KL) dibergentzia txikiagotuz murrizten du (25).KL dibergentzia probabilitate banaketa bigarren erreferentziako probabilitate banaketa batetik zenbaterainokoa den neurtzen du, eta dimentsio handiko ezaugarrien dimentsio baxuko irudikapenen arteko korrelazio aukera eraginkortasunez ebaluatu dezake.Xi N dimentsioko espazioko i-garren objektua bada, xj N dimentsioko espazioko j-garren objektua da, yi dimentsio baxuko espazioko i-garren objektua da eta yj baxuko j-garren objektua da. -dimentsioko espazioa, orduan t -SNEk ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) antzekotasun probabilitatea definitzen du, eta dimentsio-murrizketa multzorako q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
2A irudiak 11 dimentsioko konbinazioaren biomasa eta nutriente-fluxuaren bektoreak 3Dra murriztearen eragina erakusten du.t-SNE aplikatzearen motibazioa osagai nagusien analisiaren (PCA) motibazioarekin alderatu daiteke, zeinak bariantza-atributua erabiltzen du datuen eremua/atributua azpimarratzeko, eta horrela dimentsioa murrizteko.t-SNE metodoa PCA baino hobea zela ikusi zen Eko Ministeriorako emaitza fidagarriak eta erreproduzigarriak eskaintzeko (ikus S2 oharra).Hau izan daiteke PCAren ortogonalitate-suposizioa ez delako egokia ezaugarri interaktibo oso ez-linealen arteko interakzio kritikoak identifikatzeko, PCA kobariantza-egitur linealetan zentratzen delako (26).Teledetekzioko datuak erabiliz, Lunga et al.(27) SNE metodoa nola erabili Gaussiar banaketatik aldentzen diren ezaugarri espektral konplexuak eta ez-linealak nabarmentzeko.
(A) Elikagaien hornikuntza tasa modelatua, fitoplankton eta zooplankton talde funtzionalaren biomasa t-SNE algoritmoak marraztuta eta DBSCAN erabiliz probintziaren arabera margotua.Puntu bakoitzak dimentsio handiko espazioko puntu bat adierazten du, 6B irudian ikusten den bezala, puntu gehienak atzematen dira.Ardatzek "t-SNE" 1., 2. eta 3. tamainak aipatzen dituzte. (B) DBSCANek jatorriaren latitude-longitude saretan aurkitutako probintziaren proiekzio geografikoa.Kolorea edozein koloretzat hartu behar da, baina (A)ri egokitu behar zaio.
2A irudiko t-SNE sakabanatze grafikoko puntuak hurrenez hurren latitude eta longitudearekin lotuta daude.2A irudiko bi puntuak elkarrengandik hurbil badaude, haien biomasa eta mantenugaien fluxuak antzekoak direlako da, ez hurbiltasun geografikoagatik.2A irudiko koloreak DBSCAN metodoa erabiliz aurkitutako multzoak dira (28).Behaketa trinkoak bilatzean, DBSCAN algoritmoak puntuen arteko 3D irudikapenean dagoen distantzia erabiltzen du (ϵ = 0,39; aukera honi buruzko informaziorako, ikus Materialak eta metodoak), eta antzeko puntu kopurua behar da klusterra definitzeko (hemen 100 puntu, ikusi goian).DBSCAN metodoak ez du datuen forma edo kluster kopuruari buruzko hipotesirik egiten, behean erakusten den moduan:
3) Barruko distantzian identifikatutako puntu guztietarako, errepikatu 2. urratsa iteratiboki klusterren muga zehazteko.Puntu kopurua ezarritako gutxieneko balioa baino handiagoa bada, multzo gisa izendatuko da.
Kluster-kide minimoa eta distantzia ϵ metrika betetzen ez duten datuak "zarata"tzat hartzen dira eta ez zaie kolorerik esleitzen.DBSCAN algoritmo azkar eta eskalagarria da, kasurik txarrenean O(n2) errendimendua duena.Oraingo analisirako, ez da ausazkoa.Gutxieneko puntu kopurua adituen ebaluazioaren bidez zehazten da.Ondoren distantzia egokitu ondoren, emaitza ez da nahiko egonkorra ≈±10 tartean.Distantzia hori konektibitatea (6A irudia) eta ozeanoaren estaldura ehunekoa erabiliz ezartzen da (6B irudia).Konektibitatea kluster kopuru konposatu gisa definitzen da eta ϵ parametroarekiko sentikorra da.Konektibitate baxuagoak egokitze nahikoa ez dela adierazten du, eskualdeak artifizialki multzokatuz.Konektagarritasun handiak gehiegizko egokitzea adierazten du.Pentsa daiteke minimo altuagoa erabiltzea, baina minimoak ca gainditzen badu, ezinezkoa da irtenbide fidagarri bat lortzea.135 (Xehetasun gehiagorako, ikus Materialak eta metodoak).
2A irudian identifikatutako 115 klusterrak lurrera proiektatzen dira 2B irudian.Kolore bakoitzari DBSCANek identifikatutako faktore biogeokimiko eta ekologikoen konbinazio koherente bati dagokio.Klusterrak zehaztu ondoren, 2A irudiko puntu bakoitza latitude eta longitude zehatz batekin elkartzea erabiltzen da klusterrak eremu geografikora itzultzeko.2B irudiak hori erakusten du 2A irudiko kluster kolore berdinekin.Antzeko koloreak ez dira antzekotasun ekologiko gisa interpretatu behar, algoritmoak klusterrak aurkitzen dituen ordenaren arabera esleitzen direlako.
2B irudiko eremua ozeanoaren fisikoan edo/eta biogeokimikan ezarritako eremu baten antzekoa izan daiteke kualitatiboki.Esaterako, Hego Ozeanoko multzoak zona-simetrikoak dira, zurrunbilo oligotrofoak agertzen dira, eta trantsizio zorrotzak alisioen eragina adierazten du.Esaterako, Ozeano Bareko ekuatorean, igoerarekin lotutako eskualde desberdinak ikusten dira.
Ekoprobintziaren ingurune ekologikoa ulertzeko, Bray-Curtis (BC) diferentzia indizearen (29) aldaera bat erabili zen klusterreko ekologia ebaluatzeko.BC adierazlea bi gune ezberdinen arteko komunitate-egituraren aldea kuantifikatzeko erabiltzen den datu estatistiko bat da.BC neurketa fitoplankton eta zooplankton 51 espezieren biomasari dagokio BCninj = 1-2CninjSni + Snj
BCninj-k ni eta nj konbinazioaren arteko antzekotasunari egiten dio erreferentzia, non Cninj ni eta nj konbinazioetan dagoen biomasa mota bakar baten balio minimoa den eta Sni-k ni eta Snj bi konbinazioetan dauden biomasa guztien batura adierazten du.BC aldea distantzia-neurriaren antzekoa da, baina euklidear ez den espazioan funtzionatzen du, ziurrenik datu ekologikoetarako eta bere interpretaziorako egokiagoa izango dena.
2B irudian identifikatutako kluster bakoitzeko, probintzia barruko eta probintziarteko BCren antzekotasuna ebaluatu daiteke.Probintzia baten barneko BC aldea probintziaren batez besteko balioaren eta probintziako puntu bakoitzaren arteko diferentziari dagokio.BC probintzien arteko aldea probintzia baten eta beste probintzien arteko antzekotasunari dagokio.3A irudiak BC matrize simetriko bat erakusten du (0, beltza: guztiz dagokiona; 1, zuria: guztiz desberdina).Grafikoko lerro bakoitzak eredu bat erakusten du datuetan.3B irudiak BCren emaitzen esangura geografikoa erakusten du 3A irudian probintzia bakoitzeko.Nutrizio gutxiko eta elikagai gutxiko eremuko probintzia baterako, 3B irudiak erakusten du ekuatorearen eta Indiako Ozeanoaren inguruko eremu handien simetria antzekoa dela funtsean, baina latitude altuenak eta gorakada-eremuak nabarmen desberdinak dira.
(A) Probintzia bakoitzerako ebaluatutako BC diferentzia-maila 20 urteko batez besteko azalera globalaren batez besteko 51 planktonaren arabera.Kontuan izan balioen espero den simetria.(B) Zutabe (edo errenkada) baten proiekzio espaziala.Zirkulu distrofikoko probintzia baterako, BC antzekotasun-neurriaren banaketa globala ebaluatu zen eta 20 urteko batez besteko globala ebaluatu zen.Beltzak (BC = 0) eremu bera esan nahi du, eta zuriak (BC = 1) ez duela antzekotasunik.
4A irudiak 2B irudian probintzia bakoitzaren barruko BC-ko aldea erakusten du.Kluster batean batez besteko azaleraren batez besteko konbinazioa erabiliz eta BC eta probintziako sareko puntu bakoitzaren batez bestekoaren arteko desberdintasuna zehaztuta, SAGE metodoak 51 espezie ondo bereiz ditzakeela erakusten du antzekotasun ekologikoan oinarrituta. ereduaren datuak.51 mota guztien batez besteko kluster BC desberdintasun orokorra 0,102±0,0049 da.
(A, B eta D) Probintzia barruko BC aldea sareta puntu-komunitate bakoitzaren eta batez besteko probintziaren arteko batez besteko BC diferentzia gisa ebaluatzen da, eta konplexutasuna ez da murrizten.(2) BC probintzia barruko batez besteko aldea 0,227±0,117koa da.Hau da lan honek proposatzen duen motibazio ekologikoan oinarritutako sailkapenaren erreferentea [marra berdea (C)].(C) Batez besteko probintzia barruko BC aldea: marra beltzak probintzia barruko BC aldea adierazten du gero eta konplexutasun handiagoarekin.2σ eko-probintzia identifikatzeko prozesuaren 10 errepikapenetatik dator.DBSCANek aurkitutako probintzien konplexutasun osorako, (A)-k erakusten du probintzian BC desberdintasuna 0,099koa dela, eta (C)-k proposatzen duen konplexutasun sailkapena 12koa dela, eta ondorioz BC desberdintasuna 0,200koa da probintzian.irudiak erakusten duen bezala.(D).
4B irudian, 51 plankton motaren biomasa Longhurst probintziako BC diferentzia baliokidea irudikatzeko erabiltzen da.Probintzia bakoitzaren batez besteko orokorra 0,227 da, eta sareko puntuen desbideratze estandarra BC probintziaren diferentziari dagokionez 0,046 da.Hau 1B irudian identifikatutako klusterra baino handiagoa da.Horren ordez, zazpi talde funtzionalen batura erabiliz, Longhurst-en denboraldi barruko batez besteko BC desberdintasuna 0,232ra igo zen.
Eko-probintzia globalaren mapak elkarrekintza ekologiko berezien xehetasun korapilatsuak eskaintzen ditu eta Longhurst Probintziako ekosistemaren egitura osoa erabiliz hobekuntzak egin dira.Ekologia Ministerioak zenbakizko ereduaren ekosistema kontrolatzeko prozesuari buruzko ikuspegia ematea espero da, eta ikuspegi honek landa-lana esploratzen lagunduko du.Ikerketa honen xederako, ezin da ehun probintzia baino gehiago guztiz bistaratu.Hurrengo atalean probintziak laburbiltzen dituen SAGE metodoa aurkezten da.
Probintziaren helburuetako bat probintziaren kokapena eta kudeaketa ulertzea da.Larrialdi-egoerak zehazteko, 1B irudiko metodoak ekologikoki antzeko probintzien habiak erakusten ditu.Eko-probintziak antzekotasun ekologikoaren arabera multzokatzen dira, eta probintzien multzokatzeari AEP deitzen zaio.Ezarri "konplexutasun" doigarri bat kontuan hartu beharreko lurralde-kopuru osoaren arabera."Konplexutasun" terminoa erabiltzen da, larrialdi-atributuen maila doitzeko aukera ematen duelako.Agregazio esanguratsuak definitzeko, Longhurst-en 0,227ko BC probintzia barneko batez besteko aldea erabiltzen da erreferentzia gisa.Erreferentzia honen azpian, probintzia konbinatuak jada ez dira baliagarritzat jotzen.
3B irudian ikusten den bezala, probintzia ekologiko globalak koherenteak dira.BC probintzien arteko desberdintasunak erabiliz, konfigurazio batzuk oso “ohikoak” direla ikus daiteke.Genetika eta grafoen teoriaren metodoetan inspiratuta, "grafiko konektatuak" erabiltzen dira > 100 probintzia ordenatzeko, haien antzekoenak diren probintzietan oinarrituta.Hemen "konektibitatea" metrika probintzien arteko BC desberdintasuna erabiliz zehazten da (30).Hemen > 100 probintzia sailkatzeko espazio handiagoa duten probintzien kopuruari konplexutasuna dei daiteke.AEP 100 probintzia baino gehiago probintzia ekologiko nagusien/hurbilen gisa sailkatzen dituen produktua da.Probintzia ekologiko bakoitzari esleitzen zaio haien antzekoena den nagusi/oso lotuta dagoen probintzia ekologikoari.BC diferentziak zehaztutako agregazio honek ekologia globalaren hurbilketa habiaratu bat ahalbidetzen du.
Hautatutako konplexutasuna 1etik FIG-eko konplexutasun osoraino edozein balio izan daiteke.2A.Konplexutasun txikiagoan, AEP endekatu egin daiteke dimentsio probabilistaren murrizketa-urratsaren (t-SNE) dela eta.Endekapenak esan nahi du probintzia ekologikoak iterazioen artean AEP desberdinak esleitu daitezkeela, eta, horrela, estalitako eremu geografikoa aldatuz.4C irudiak 10 inplementaziotan gero eta konplexutasun handiagoa duten AEPetan probintzien barruko BC desberdintasunen hedapena erakusten du (ilustrazioa 1B irudian).4C irudian, 2σ (eremu urdina) degradazio-neurria da 10 inplementaziotan, eta marra berdeak Longhurst-en erreferentzia adierazten du.Gertakariek frogatu dute 12-ren konplexutasunak Longhurst-en erreferentziaren azpitik mantendu dezakeela probintziako BC aldea inplementazio guztietan eta 2σ degradazio txiki samarra mantentzen duela.Laburbilduz, gomendatutako gutxieneko konplexutasuna 12 AEP da, eta 51 plankton mota erabiliz ebaluatutako probintzia barruko batez besteko BC diferentzia 0,198±0,013 da, 4D irudian ikusten den moduan.Zazpi plankton talde funtzionalen batura erabiliz, probintzia barruko batez besteko BC aldea 2σ da 0,198±0,004 izan beharrean.Zazpi talde funtzionalen biomasa osoaren edo 51 plankton mota guztien biomasarekin kalkulatutako BC desberdintasunen arteko konparaketak erakusten du SAGE metodoa 51 dimentsioko egoerarako aplikagarria den arren, zazpi talde funtzionalen biomasa osoarentzako dela. Prestakuntzarako.
Edozein ikerketaren xedearen arabera, konplexutasun maila desberdinak har daitezke.Eskualde-ikasketak konplexutasun osoa eska dezakete (hau da, 115 probintzia guztiak).Adibide gisa eta argitasunerako, kontuan hartu gomendatutako gutxieneko konplexutasuna 12.
SAGE metodoaren erabilgarritasunaren adibide gisa, 12ko konplexutasun minimoa duten 12 AEP erabiltzen dira hemen larrialdi-komunitate-egituraren kontrola aztertzeko.5. irudiak AEPk (A-tik L-ra) taldekatutako ikuspegi ekologikoak erakusten ditu: Redfield-en estekiometrian, hedadura geografikoa (5C irudia), talde funtzionalaren biomasaren konposizioa (5A irudia) eta nutrienteen hornidura (5B irudia) N Zoomed-ek egiten ditu.Ratioa (N:Si:P:Fe, 1:1:16:16×103) erakusten da.Azken panel honetarako, P bider 16 eta Fe bider 16×103, beraz, barra grafikoa fitoplanktonaren nutrizio-beharren baliokidea da.
Probintziak 12 AEPtan sailkatzen dira. (A) 12 probintzietako ekosistemen biomasa (mgC/m3).(B) Disolbatutako nitrogeno ez-organikoaren (N), burdinaren (Fe), fosfatoaren (P) eta azido silizikoaren (Si) elikagaien fluxua (mmol/m3 urtean).Fe eta P biderkatzen dira 16 eta 16 × 103, hurrenez hurren, zerrendak fitoplanktonaren estekiometria eskakizunetara estandarizatu daitezen.(C) Kontuan izan eskualde polar, zikloi subtropikalen eta urtaro/igoeraren eskualde nagusien arteko aldea.Jarraipen-guneak honela markatuta daude: 1, ESERlekuak;2, ALOHA;3, P geltokia;eta 4, BATS.
Identifikatutako AEP bakarra da.Ozeano Atlantikoan eta Ozeano Barean ekuatorearen inguruan nolabaiteko simetria dago, eta Indiako Ozeanoan antzeko eremua baina handitua dago.AEP batzuek igoerarekin lotutako kontinentearen mendebaldea hartzen dute.Hego Poloko Korronte Zirkunpolarra ezaugarri zonal handitzat hartzen da.Zikloi subtropikala AEP oligotrofoen serie konplexua da.Probintzia hauetan, bistakoa da planktonak nagusi diren zurrunbilo oligotrofoen eta diatomean aberatsak diren eskualde polarretan dauden biomasaren desberdintasunen eredu ezaguna.
Fitoplanktonaren biomasa oso antzekoa duten AEPek komunitate-egitura oso desberdinak izan ditzakete eta eremu geografiko desberdinak estaltzen dituzte, hala nola D, H eta K, zeinak fitoplanktonaren biomasa total antzekoa dutenak.AEP H, batez ere, Indiako Ozeano ekuatorean dago, eta bakterio diazotrofo gehiago daude.AEP D hainbat arrotan aurkitzen da, baina bereziki nabarmena da Pazifikoan gorakada ekuatorialaren inguruko errendimendu handiko eremuen inguruan.Pazifikoko probintzia honen formak olatu planetarioen trena gogorarazten du.AEP D-n diazobakterio gutxi daude, eta kono gehiago.Beste bi probintziekin alderatuta, AEP K Ozeano Artikoko goi-lurretan bakarrik aurkitzen da, eta diatomea gehiago eta plankton gutxiago daude.Aipatzekoa da hiru eskualde hauetan plankton kopurua ere oso ezberdina dela.Horien artean, AEP K-ren plankton ugaritasuna nahiko baxua da, AEP D eta H-rena, berriz, nahiko altua.Hori dela eta, biomasa duten arren (eta, beraz, Chl-a-ren antzekoa den), probintzia hauek nahiko desberdinak dira: Chl-en oinarritutako probintzien probek baliteke desberdintasun horiek ez jasotzea.
Era berean, begi bistakoa da biomasa oso desberdina duten AEP batzuk antzekoak izan daitezkeela fitoplanktonaren komunitatearen egiturari dagokionez.Esaterako, hori ikusten da AEP D eta E-n. Elkarrengandik hurbil daude, eta Ozeano Barean, AEP E produktibitate handiko AEPJtik gertu dago.Era berean, ez dago lotura argirik fitoplanktonaren biomasaren eta zooplanktonaren ugaritasunaren artean.
AEP haiei emandako mantenugaien arabera uler daiteke (5B irudia).Diatomeak azido silizikoaren hornidura zabala dagoen lekuetan bakarrik existitzen dira.Oro har, zenbat eta azido silizikoaren eskaintza handiagoa izan, orduan eta handiagoa izango da diatomeen biomasa.Diatomeak AEP A, J, K eta L-n ikus daitezke. Diatomearen biomasaren erlazioa beste fitoplanktonekiko erlazioa diatomeen eskariarekiko emandako N, P eta Fearen arabera zehazten da.Adibidez, AEP L diatomeak dira nagusi.Beste mantenugai batzuekin alderatuta, Si-k du eskaintzarik handiena.Aitzitik, produktibitate handiagoa izan arren, AEP J-k diatomea gutxiago eta silizio hornidura gutxiago du (guztiak eta beste mantenugaiekiko).
Diazonio bakterioek nitrogenoa finkatzeko gaitasuna dute, baina poliki hazten dira (31).Beste fitoplankton batzuekin batera bizi dira, non burdina eta fosforoa gehiegizkoak diren diazonioak ez diren mantenugaien eskariarekiko (20, 21).Azpimarratzekoa da biomasa diazotrofoa nahiko altua dela, eta Fe eta P-ren eskaintza nahiko handia dela N-ren eskaintzarekin alderatuta. Modu honetan, AEP J-ko biomasa osoa handiagoa den arren, AEP H-ko diazonio-biomasa da. J-n baino handiagoa. Kontuan izan AEP J eta H geografikoki oso desberdinak direla, eta H Indiako Ozeano ekuatorean kokatzen dela.
Ekosistemaren egitura berezia probintzietan banatzen ez bada, 12 AEPren konplexutasun txikieneko ereduetatik lortutako ikuspegiak ez dira hain argiak izango.SAGEk sortutako AEP-ak ekosistema-ereduetako informazio konplexua eta dimentsio handikoa koherente eta aldi berean alderatzea errazten du.AEPk eraginkortasunez azpimarratzen du zergatik Chl ez den metodo on eta alternatibo bat komunitatearen egitura edo zooplanktonaren ugaritasuna elikagai-maila altuagoetan zehazteko.Etengabeko ikerketa-gaien azterketa zehatza artikulu honen esparrutik kanpo dago.SAGE metodoak ereduko beste mekanismo batzuk aztertzeko modua eskaintzen du, puntuz puntu ikustea baino maneiatzeko errazagoa dena.
SAGE metodoa mundu mailako eredu fisiko/biogeokimiko/ekosistemen zenbakizko datu ekologiko oso konplexuak argitzen laguntzeko proposatzen da.Probintzia ekologikoa plankton zeharkako talde funtzionalen biomasa osoa, t-SNE probabilitate-dimentsio-murrizketa algoritmoaren aplikazioa eta DBSCAN gainbegiratu gabeko ML metodoa erabiliz multzokatzeak zehazten du.Probintzien arteko BC diferentzia/grafo teoria habia egiteko metodoa aplikatzen da interpretazio globalerako erabil daitekeen AEP sendo bat ateratzeko.Eraikuntzari dagokionez, Ekoprobintzia eta AEP bakarrak dira.AEPren habia jatorrizko probintzia ekologikoaren konplexutasun osoaren eta 12 AEPren gutxieneko atalasearen artean egokitu daiteke.AEPren gutxieneko konplexutasuna habiatzea eta zehaztea funtsezko pausotzat hartzen dira, t-SNE probabilitateak <12 konplexutasuneko AEPak degeneratzen dituelako.SAGE metodoa globala da, eta bere konplexutasuna> 100 AEPtik 12ra bitartekoa da. Sinpletasuna lortzeko, gaur egungo arreta 12 AEP globalen konplexutasuna da.Etorkizuneko ikerketek, batez ere eskualdeko ikerketek, munduko eko-probintzien azpimultzo espazial txikiago bat erabilgarria izan dezakete, eta eremu txikiago batean elkartu daitezke hemen eztabaidatutako ikuspegi ekologiko berberak aprobetxatzeko.Probintzia ekologiko horiek eta haietatik lortutako ezagutzak ulermen ekologiko gehiagorako, ereduen alderaketa errazteko eta itsas ekosistemen jarraipena hobetzeko iradokizunak eskaintzen ditu.
SAGE metodoaren bidez identifikatutako probintzia ekologikoa eta AEP eredu numerikoko datuetan oinarritzen dira.Definizioz, zenbakizko eredua egitura sinplifikatu bat da, xede-sistemaren funtsa jaso nahian, eta eredu ezberdinek planktona banaketa ezberdina izango dute.Ikerketa honetan erabilitako zenbakizko ereduak ezin ditu guztiz jaso behatutako eredu batzuk (adibidez, ekuatore eskualderako eta Hego Ozeanorako Chl estimazioetan).Ozeano errealeko aniztasunaren zati txiki bat baino ez da harrapatzen, eta meso eta azpimesoskalak ezin dira konpondu, eta horrek nutriente-fluxuari eta eskala txikiagoko komunitate-egiturari eragin diezaioke.Gabezia horiek gorabehera, AEP oso baliagarria da eredu konplexuak ulertzen laguntzeko.Antzeko probintzia ekologikoak non aurkitzen diren ebaluatuz, AEPk zenbakizko ereduak alderatzeko tresna potentzial bat eskaintzen du.Egungo zenbakizko ereduak teledetekzioko Chl-a fitoplanktonaren eredu orokorra eta planktonaren tamainaren eta talde funtzionalaren banaketa jasotzen ditu (S1 oharra eta S1 irudia) (2, 32).
0,1 mgChl-a/m-3 sestra-lerroak erakusten duen moduan, AEP eremu oligotrofoan eta eremu mesotrofoetan banatzen da (S1B irudia): AEP B, C, D, E, F eta G eremu oligotrofikoak dira, eta gainerako eremuak. kokatuta Goiko Chl-a.AEP-k Longhurst probintziarekiko korrespondentziaren bat erakusten du (S3A irudia), adibidez, Hego Ozeanoarekin eta Pazifiko ekuatorearekin.Eskualde batzuetan, AEPk Longhurst eskualde anitz estaltzen ditu, eta alderantziz.Eremu honetan probintziak eta Longhurst mugatzeko asmoa ezberdina denez, aldeak egongo direla espero da.Longhurst probintzia bateko AEP anitzek adierazten dute antzeko biogeokimika duten eremu jakin batzuek ekosistema-egitura oso desberdinak izan ditzaketela.AEPk nolabaiteko korrespondentzia erakusten du egoera fisikoekin, gainbegiratu gabeko ikaskuntza erabiliz (19), hala nola gorakada handiko egoeretan (adibidez, Hego Ozeanoa eta Ekuatore Pazifikoa; S3, C eta D irudiak).Korrespondentzia hauek planktonaren komunitate-egiturak ozeanoen dinamikak eragin handia duela adierazten du.Ipar Atlantikoa bezalako eremuetan, AEPk probintzia fisikoak zeharkatzen ditu.Desberdintasun horiek eragiten dituen mekanismoan hautsaren garraioa bezalako prozesuak izan daitezke, baldintza fisiko berdinetan ere nutrizio-programa guztiz desberdinak ekar ditzakete.
Ekologia Ministerioak eta AEPk adierazi dutenez, Chl bakarrik erabiltzeak ezin ditu osagai ekologikoak identifikatu, itsas ekologiaren komunitateak dagoeneko ohartu diren bezala.Biomasa antzekoa baina osaera ekologiko nabarmen ezberdina duten AEPetan ikusten da (adibidez, D eta E).Aitzitik, D eta K bezalako AEPek biomasa oso desberdina dute baina osaera ekologiko antzekoa dute.AEPk azpimarratzen du biomasaren, konposizio ekologikoaren eta zooplankton ugaritasunaren arteko erlazioa konplexua dela.Adibidez, AEP J fitoplanktonaren eta planktonaren biomasaren aldetik nabarmentzen den arren, AEPren A eta L-ek planktonaren biomasa antzekoa dute, baina A-k plankton ugaritasun handiagoa du.AEPk azpimarratzen du fitoplanktonaren biomasa (edo Chl) ezin dela erabili zooplanktonaren biomasa aurreikusteko.Zooplanktona arrantzako elikadura-katearen oinarria da, eta kalkulu zehatzagoek baliabideen kudeaketa hobea ekar dezakete.Etorkizuneko itsas koloreko sateliteak [adibidez, PACE (planktona, aerosol, hodeia eta itsas ekosistema)] hobeto kokatuta egon daitezke fitoplanktonaren komunitate-egitura estimatzen laguntzeko.AEP iragarpena erabiltzeak zooplanktonaren estimazioa espaziotik erraztu dezake.SAGE bezalako metodoek, teknologia berriekin eta lurreko egiaren inkestetarako eskuragarri dauden eremuko gero eta datu gehiagok (adibidez, Tara eta jarraipen-ikerketak), elkarrekin satelite bidezko ekosistemen osasunaren monitorizaziorako urrats bat eman dezakete.
SAGE metodoak probintziaren ezaugarriak kontrolatzen dituzten mekanismo batzuk ebaluatzeko modu erosoa eskaintzen du, hala nola biomasa/Chl, lehen mailako ekoizpen garbia eta komunitatearen egitura.Esate baterako, diatomeen kantitate erlatiboa Si, N, P eta Fe hornikuntzaren desoreka batek ezartzen du fitoplanktonaren eskakizun estekiometrikoekiko.Hornikuntza tasa orekatuan, komunitatean diatomeak (L) dira nagusi.Hornikuntza-tasa desorekatua dagoenean (hau da, silizio-eskaintza diatomeen mantenugaien eskaria baino txikiagoa da), diatomeek zati txiki bat baino ez dute hartzen Share (K).Fe eta P hornikuntza N hornidura gainditzen duenean (adibidez, E eta H), bakterio diazotrofoak indarrez haziko dira.AEPk eskaintzen duen testuinguruaren bidez, kontrol-mekanismoen esplorazioa baliagarriagoa izango da.
Ekoprobintzia eta AEP antzeko komunitate-egiturak dituzten eremuak dira.Probintzia ekologiko edo AEP bateko kokapen jakin bateko denbora serieak erreferentzia-puntutzat har daitezke eta probintzia ekologikoak edo AEPk hartzen duen eremua irudika dezake.Epe luzeko tokiko monitorizazio estazioek denbora-serie horiek eskaintzen dituzte.Epe luzerako in situ datu multzoek ezinbesteko papera izaten jarraituko dute.Komunitate-egituraren jarraipenaren ikuspegitik, SAGE metodoa gune berrien kokapen erabilgarriena zehazten laguntzeko modu gisa ikus daiteke.Esaterako, epe luzeko habitat oligotrofikoen ebaluazioaren (ALOHA) denbora-seriea eremu oligotrofikoko AEP B-an dago (5C irudia, 2. etiketa).ALOHA beste AEP baten mugatik hurbil dagoenez, baliteke denbora seriea ez izatea eremu osoaren adierazgarria, lehen iradoki bezala (33).B AEP berean, SEATS (Southeast Asian Time Series) denbora seriea Taiwan hego-mendebaldean dago (34), beste AEP batzuen mugetatik urrunago (5C irudia, 1. etiketa), eta kokapen hobe gisa erabil daiteke monitorizatzeko. AEPB.AEPCko BATS (Bermuda Atlantic Time Series Study) denbora seriea (5C irudia, 4. etiketa) AEP C eta Fren arteko mugatik oso gertu dago, eta horrek adierazten du BATS denbora serieak erabiliz AEP C monitorizatzea zuzenean arazotsua izan daitekeela.AEP J-ko P geltokia (5C irudia, 3. etiketa) AEPren mugatik urrun dago, beraz, adierazgarriagoa da.Eko-Provintzak eta AEPk aldaketa globalak ebaluatzeko egokia den jarraipen-esparru bat ezartzen lagun dezakete, probintziek tokian tokiko laginketak nondik norakoak eman ditzakeen ebaluatzeko duten baimena delako.SAGE metodoa gehiago garatu daiteke klima-datuei aplikatzeko, denbora aurrezteko aldakortasuna ebaluatzeko.
SAGE metodoaren arrakasta datu-zientzia/ML metodoak eta domeinu espezifikoko ezagutzak arretaz aplikatuta lortzen da.Zehazki, t-SNE dimentsio-murrizketa egiteko erabiltzen da, eta horrek dimentsio handiko datuen kobariantza-egitura gordetzen du eta kobariantza-topologiaren bistaratzea errazten du.Datuak marra eta kobariantza moduan antolatuta daude (2A irudia), distantzia hutsean oinarritutako neurriak (adibidez, K batezbestekoak) egokiak ez direla egokiak, normalean gaussiar (zirkularra) oinarri-banaketa erabiltzen dutelako (S2 oharrean eztabaidatua). .DBSCAN metodoa edozein kobariantza topologiarako egokia da.Parametroak ezartzeari arreta jartzen bazaio, identifikazio fidagarria eman daiteke.t-SNE algoritmoaren kostu konputazionala altua da, eta horrek bere egungo aplikazioa datu kopuru handiagora mugatzen du, eta horrek esan nahi du zaila dela eremu sakonetan edo denboran zehar aplikatzea.t-SNEren eskalagarritasunari buruzko lana abian da.KL distantzia paralelizatzeko erraza denez, t-SNE algoritmoak etorkizunean hedatzeko ahalmen ona du (35).Orain arte, tamaina hobeki murrizteko beste dimentsio-dimentsio-murrizketa-metodo batzuen artean, UMAP (Unified Multifold-en hurbilketa eta proiekzio) teknikak daude, baina ozeanoen datuen testuinguruan ebaluatzea beharrezkoa da.Eskalagarritasun hobearen esanahia, adibidez, klima globalak edo konplexutasun desberdina duten ereduak geruza misto batean sailkatzea da.SAGEk edozein lurraldetan sailkatu ez dituen eremuak 2A irudiko gainerako puntu beltztzat har daitezke.Geografikoki, eremu horiek batez ere urtaro handiko eremuetan daude, eta horrek iradokitzen du denborarekin aldatzen diren probintzia ekologikoak harrapatzea estaldura hobea emango duela.
SAGE metodoa eraikitzeko, sistema/datuen zientzia konplexuetatik abiatutako ideiak erabili dira, talde funtzionalen multzoak zehazteko (11 dimentsioko espazio batean oso hurbil egoteko aukera) eta probintziak zehazteko gaitasuna erabiliz.Probintzia hauek bolumen zehatzak irudikatzen dituzte gure 3D t-SNE fase-espazioan.Era berean, Poincaré-ren zatia ibilbideak hartzen duen egoera-espazioaren “bolumena” ebaluatzeko erabil daiteke, portaera “normala” edo “kaotikoa” zehazteko (36).11 dimentsioko eredu estatikoko irteerarako, datuak 3D faseko espazio batean bihurtu ondoren okupatutako bolumena antzera azal daiteke.Eremu geografikoaren eta eremuaren arteko erlazioa 3D faseko espazioan ez da erraza, baina antzekotasun ekologikoaren arabera azal daiteke.Horregatik, BC desberdintasun-neurri konbentzionalagoa hobesten da.
Etorkizuneko lanek SAGE metodoa berrerabiliko dute urtaroan aldatzeko datuetarako, identifikatutako probintzien eta AEPren aldakortasun espaziala ebaluatzeko.Etorkizuneko helburua da metodo hau erabiltzea sateliteen neurketen bidez zein probintzia zehaztu daitezkeen zehazten laguntzeko (adibidez, Chl-a, teledetekzio isladatzailea eta itsasoaren gainazaleko tenperatura).Horri esker, osagai ekologikoen teledetekzioa ebaluatu eta probintzia ekologikoen eta haien aldakortasunaren jarraipen oso malguak ahalbidetuko dira.
Ikerketa honen helburua SAGE metodoa aurkeztea da, zeinak probintzia ekologiko bat definitzen duen bere plankton komunitatearen egitura bereziaren bidez.Hemen, eredu fisiko/biogeokimiko/ekosistemen eta t-SNE eta DBSCAN algoritmoen parametroen hautaketari buruzko informazio zehatzagoa emango da.
Ereduaren osagai fisikoak ozeano-zirkulazioaren eta klimaren estimaziotik datoz [ECCOv4;(37) (38)-k deskribatutako egoera globalaren estimazioa.Estatuaren estimazioaren ebazpen nominala 1/5 da.Lagrangiarren biderkatzaile metodoaren karratu txikienen metodoa behaketaren bidez doitutako hasierako eta muga-baldintzak eta barne-ereduaren parametroak lortzeko erabiltzen da, eta, horrela, MITgcm-ren ziklo orokorreko eredu aske bat (MITgcm) sortuz (39), eredua Optimizatu ondoren, emaitzak izan daitezke. jarraitu eta behatu.
Biogeokimika/ekosistemak deskribapen osoagoa du (hau da, ekuazioak eta parametroen balioak) (2).Ereduak C, N, P, Si eta Fe-ren zirkulazioa jasotzen du urmael inorganiko eta organikoen bidez.Hemen erabiltzen den bertsioak 35 fitoplankton espezie biltzen ditu: 2 mikroprokarioto espezie eta 2 mikroeukarioto espezie (elikagai gutxiko inguruneetarako egokiak), Cryptomonas sphaeroides 5 espezie (kaltzio karbonato estaldurarekin), 5 diazonio espezie (nitrogenoa finka dezake, beraz. ez da mugatua) disolbatutako nitrogeno ez-organikoaren erabilgarritasuna), 11 diatomea (estalki silizeo bat osatuz), 10 flagelatu begetatibo mistoak (beste plankton fotosintesia egin eta jan dezakete) eta 16 zooplankton (beste planktonaz bazkatu).Horiei "talde funtzional biogeokimikoak" deitzen zaie, itsas biogeokimikan eragin desberdinak dituztelako (40, 41) eta behaketa eta eredu-azterketetan sarri erabiltzen direlako.Eredu honetan, talde funtzional bakoitza tamaina ezberdineko hainbat planktonez osatuta dago, 0,6 eta 2500 μm arteko diametro esferiko baliokidea dutenak.
Fitoplanktonaren hazkuntza, artzaintza eta hondoratzea eragiten duten parametroak tamainarekin lotuta daude, eta desberdintasun espezifikoak daude fitoplanktonaren sei talde funtzionalen artean (32).Marko fisiko desberdinak izan arren, ereduaren 51 plankton osagaien emaitzak azken ikerlan batzuetan (42-44) erabili dira.
1992tik 2011ra, fisiko/biogeokimiko/ekosistemen akoplamendu ereduak 20 urte iraun zuen.Ereduaren irteerak planktonaren biomasa, mantenugaien kontzentrazioa eta mantenugaien hornikuntza tasa (DIN, PO4, Si eta Fe) barne hartzen ditu.Ikerketa honetan, irteera horien 20 urteko batez bestekoa Probintzia Ekologikoaren sarrera gisa erabili da.Chl, planktonaren biomasaren banaketa eta mantenugaien kontzentrazioa eta talde funtzionalen banaketa satelite bidezko eta in situ behaketekin alderatzen dira [ikus (2, 44), S1 oharra eta irudia.S1etik S3ra].
SAGE metodorako, ausazkotasunaren iturri nagusia t-SNE urratsetik dator.Ausazkotasunak errepikakortasuna oztopatzen du, eta horrek esan nahi du emaitzak ez direla fidagarriak.SAGE metodoak zorroztasunez probatzen du sendotasuna t-SNE eta DBSCAN parametro multzo bat zehaztuz, zeinak koherentziaz identifikatu ditzaketen klusterrak errepikatzen direnean.t-SNE parametroaren "nahasmena" zehaztea dimentsio handietatik baxurako mapeak datuen ezaugarri lokalak edo globalak zenbateraino errespetatu behar dituen zehaztea dela uler daiteke.400 eta 300 iterazioko nahasketara iritsi da.
DBSCAN clustering algoritmorako, klusterreko datu-puntuen gutxieneko tamaina eta distantzia-metria zehaztu behar dira.Gutxieneko kopurua adituen gidaritzapean zehazten da.Ezagutza horrek badaki zer egokitzen den egungo zenbakizko modelizazio-esparruari eta ebazpenari.Gutxieneko zenbakia 100 da. Gutxieneko balio handiagoa (<135 baino gutxiago berdearen goiko muga zabalagoa izan aurretik) kontuan hartu daiteke, baina ezin du BC desberdintasunean oinarritutako agregazio-metodoa ordezkatu.Konexio-maila (6A irudia) ϵ parametroa ezartzeko erabiltzen da, hau da, estaldura handiagoa lortzeko (6B irudia).Konektibitatea kluster kopuru konposatu gisa definitzen da eta ϵ parametroarekiko sentikorra da.Konektibitate baxuagoak egokitze nahikoa ez dela adierazten du, eskualdeak artifizialki multzokatuz.Konektagarritasun handiak gehiegizko egokitzea adierazten du.Gehiegizko egokitzea ere arazotsua da, hasierako ausazko asmakizunek erreproduzi ezinezko emaitzak ekar ditzaketela erakusten duelako.Bi mutur horien artean, igoera nabarmen batek (normalean "ukondoa" deitua) adierazten du ϵ onena.6A irudian, goi-ordokiaren eremuan gorakada nabarmena ikusten duzu (horia, > 200 kluster), eta ondoren beherakada nabarmena (berdea, 100 kluster), 130 inguru arte, oso multzo gutxiz inguratuta (urdina, <60 kluster) ).Gutxienez 100 eremu urdinetan, kluster batek ozeano osoa menderatzen du (ϵ <0,42), edo ozeano gehiena ez dago sailkatuta eta zaratatzat hartzen da (ϵ> 0,99).Eremu horiak kluster banaketa oso aldakorra eta ugalgaitza du.ϵ murrizten den heinean, zarata handitu egiten da.Handitzen ari den eremu berdeari ukondoa deitzen zaio.Eskualde optimoa da hau.t-SNE probabilitatea erabiltzen den arren, probintzia barruko BC desberdintasuna oraindik erabil daiteke clustering fidagarria zehazteko.6. irudia erabiliz (A eta B), ezarri ϵ 0,39.Zenbat eta handiagoa izan gutxieneko kopurua, orduan eta txikiagoa izango da sailkapen fidagarria ahalbidetzen duen ϵra iristeko probabilitatea, eta orduan eta handiagoa izango da 135 baino balio handiagoa duen berdegunea. Eremu hori handitzeak adierazten du ukondoa zailagoa izango dela aurkitzeko edo ez existitzen.
t-SNE-ren parametroak ezarri ondoren, aurkitutako kluster kopuru osoa erabiliko da konektibitatearen (A) eta klusterari esleitutako datuen ehunekoa (B) neurri gisa.Puntu gorriak estalduraren eta konektibitatearen konbinazio onena adierazten du.Gutxieneko kopurua ekologiari lotutako gutxieneko kopuruaren arabera ezartzen da.
Artikulu honetarako material osagarrietarako, ikusi http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Creative Commons Aitortu Lizentziaren baldintzen arabera banatutako sarbide irekiko artikulua da.Artikuluak mugarik gabeko erabilera, banaketa eta erreprodukzioa ahalbidetzen du edozein euskarritan, jatorrizko lana behar bezala aipatzen bada.
Oharra: zure helbide elektronikoa ematea baino ez dizugu eskatzen, orrialdera gomendatzen duzun pertsonak jakin dezan mezu elektronikoa ikustea nahi duzula eta ez dela spama.Ez dugu helbide elektronikorik harrapatuko.
Galdera hau bisitaria zaren ala ez probatzeko eta spam-a bidalketa automatikoa saihesteko erabiltzen da.
Itsas Ekologiaren Ministerio Globalak arazo konplexuak konpontzeko erabakia du eta gainbegiratu gabeko ML erabiltzen du komunitatearen egiturak aztertzeko.
Itsas Ekologiaren Ministerio Globalak arazo konplexuak konpontzeko erabakia du eta gainbegiratu gabeko ML erabiltzen du komunitatearen egiturak aztertzeko.
Argitalpenaren ordua: 2021-01-12