Një metodë mësimi e pambikëqyrur propozohet për të përcaktuar provincat ekologjike detare globale (eko-provincat) bazuar në strukturën e komunitetit të planktonit dhe të dhënat e fluksit të lëndëve ushqyese.Metoda e provincës ekologjike të integruar sistematike (SAGE) mund të identifikojë provincat ekologjike në modelet e ekosistemeve shumë jolineare.Për t'u përshtatur me kovariancën jo-Gaussian të të dhënave, SAGE përdor t ngulitje të rastësishme fqinje (t-SNE) për të reduktuar dimensionalitetin.Me ndihmën e aplikacionit të zhurmës bazuar në algoritmin e grupimit hapësinor të bazuar në densitet (DBSCAN), mund të identifikohen më shumë se njëqind provinca ekologjike.Duke përdorur hartën e lidhjes me dallimet ekologjike si një masë distancë, një provincë ekologjike e grumbulluar e fortë (AEP) përcaktohet objektivisht përmes krahinave ekologjike të mbivendosura.Duke përdorur AEP-të, u hulumtua kontrolli i shkallës së furnizimit me lëndë ushqyese në strukturën e komunitetit.Eko-provinca dhe AEP janë unike dhe mund të ndihmojnë në interpretimin e modelit.Ato mund të lehtësojnë krahasimet midis modeleve dhe mund të përmirësojnë të kuptuarit dhe monitorimin e ekosistemeve detare.
Provincat janë rajone ku biogjeografia komplekse në det ose tokë është e organizuar në zona koherente dhe domethënëse (1).Këto krahina janë shumë të rëndësishme për krahasimin dhe kontrastin e vendndodhjeve, karakterizimin e vëzhgimeve, monitorimin dhe mbrojtjen.Ndërveprimet komplekse dhe jolineare që prodhojnë këto provinca i bëjnë metodat e mësimit të makinerive të pambikëqyrura (ML) shumë të përshtatshme për përcaktimin objektiv të provincave, sepse kovarianca në të dhëna është komplekse dhe jo-gausiane.Këtu, propozohet një metodë ML, e cila identifikon sistematikisht provincat unike ekologjike detare (eko-provincat) nga modeli fizik/ekosistem global tredimensional (3D) i Darvinit (2).Termi "unike" përdoret për të treguar se zona e identifikuar nuk mbivendoset mjaftueshëm me zonat e tjera.Kjo metodë quhet metoda e Provincës Ekologjike të Integruar të Sistemit (SAGE).Për të kryer një klasifikim të dobishëm, një metodë algoritmi duhet të lejojë (i) klasifikimin global dhe (ii) analizën në shumë shkallë që mund të ndërlidhen/përmbledhen në hapësirë dhe kohë (3).Në këtë hulumtim, fillimisht u propozua metoda SAGE dhe u diskutuan provincat ekologjike të identifikuara.Eko-provincat mund të nxisin të kuptuarit e faktorëve që kontrollojnë strukturën e komunitetit, të ofrojnë njohuri të dobishme për strategjitë e monitorimit dhe të ndihmojnë në gjurmimin e ndryshimeve në ekosistem.
Provincat tokësore zakonisht klasifikohen sipas ngjashmërive në klimë (reshje dhe temperaturë), tokë, vegjetacion dhe faunë, dhe përdoren për menaxhim ndihmës, kërkime të biodiversitetit dhe kontrollin e sëmundjeve (1, 4).Provincat detare janë më të vështira për t'u përcaktuar.Shumica e organizmave janë mikroskopikë, me kufij të lëngjeve.Longhurst et al.(5) Siguruar një nga klasifikimet e para globale të Ministrisë së Oqeanografisë bazuar në kushtet mjedisore.Përkufizimi i këtyre provincave "Longhurst" përfshin variabla të tillë si shkalla e përzierjes, shtresimi dhe rrezatimi, si dhe përvojën e gjerë të Longhurst si oqeanografi detar, i cili ka kushte të tjera të rëndësishme për ekosistemet detare.Longhurst është përdorur gjerësisht, për shembull, për të vlerësuar prodhimin primar dhe flukset e karbonit, për të ndihmuar peshkimin dhe për të planifikuar aktivitetet e vëzhgimit në vend (5-9).Për të përcaktuar provincat në mënyrë më objektive, janë përdorur metoda të tilla si logjika fuzzy dhe grupimi/statistikat rajonale të pambikëqyrura (9-14).Qëllimi i metodave të tilla është të identifikojnë struktura kuptimplota që mund të identifikojnë provincat në të dhënat e disponueshme të vëzhgimit.Për shembull, provincat detare dinamike (12) përdorin harta vetë-organizuese për të reduktuar zhurmën dhe përdorin grupimin hierarkik (të bazuar në pemë) për të përcaktuar produktet me ngjyra detare që rrjedhin nga satelitët rajonal [klorofili a (Chl-a), lartësia e normalizuar e linjës së fluoreshencës dhe lëndë organike e tretur me ngjyrë] dhe fushë fizike (temperatura dhe kripësia e sipërfaqes së detit, topografia dinamike absolute dhe akulli i detit).
Struktura e komunitetit të planktonit është shqetësuese sepse ekologjia e tij ka një ndikim të madh në nivelet më të larta të lëndëve ushqyese, thithjen e karbonit dhe klimën.Megjithatë, është ende një objektiv sfidues dhe i pakapshëm për të përcaktuar një provincë ekologjike globale bazuar në strukturën e komunitetit të planktonit.Satelitët me ngjyra detare potencialisht mund të ofrojnë njohuri mbi klasifikimin e trashë të fitoplanktonit ose të sugjerojnë avantazhet e grupeve funksionale (15), por ata aktualisht nuk janë në gjendje të japin informacion të detajuar mbi strukturën e komunitetit.Sondazhet e fundit [p.sh. Tara Ocean (16)] po ofrojnë matje të paprecedentë të strukturës së komunitetit;aktualisht, ka vetëm vëzhgime të rralla in-situ në një shkallë globale (17).Studimet e mëparshme kanë përcaktuar kryesisht "Provincën Biogjeokimike" (12, 14, 18) bazuar në përcaktimin e ngjashmërive biokimike (të tilla si prodhimi primar, Chl dhe drita e disponueshme).Këtu, modeli numerik përdoret për të nxjerrë [Darwin(2)], dhe krahina ekologjike përcaktohet sipas strukturës së komunitetit dhe fluksit të lëndëve ushqyese.Modeli numerik i përdorur në këtë studim ka mbulim global dhe mund të krahasohet me të dhënat ekzistuese në terren (17) dhe fushat e sensorit në distancë (Shënimi S1).Të dhënat e modelit numerik të përdorur në këtë studim kanë avantazhin e mbulimit global.Ekosistemi model përbëhet nga 35 lloje fitoplanktoni dhe 16 lloje zooplanktoni (ju lutemi referojuni materialeve dhe metodave).Llojet e planktoneve model ndërveprojnë në mënyrë jolineare me strukturat e kovariancës jo-Gaussian, kështu që metodat e thjeshta diagnostikuese nuk janë të përshtatshme për identifikimin e modeleve unike dhe të qëndrueshme në strukturat e komunitetit në zhvillim.Metoda SAGE e prezantuar këtu ofron një mënyrë të re për të kontrolluar prodhimin e modeleve komplekse të Darvinit.
Aftësitë e fuqishme transformuese të shkencës së të dhënave/teknologjisë ML mund të mundësojnë zgjidhje modeli jashtëzakonisht komplekse për të zbuluar struktura komplekse, por të forta në kovariancën e të dhënave.Një metodë e fortë përkufizohet si një metodë që mund të riprodhojë me besnikëri rezultatet brenda një diapazoni të caktuar gabimi.Edhe në sisteme të thjeshta, përcaktimi i modeleve dhe sinjaleve të fuqishme mund të jetë një sfidë.Derisa të përcaktohet arsyetimi që çon në modelin e vëzhguar, kompleksiteti i shfaqur mund të duket i ndërlikuar/i vështirë për t'u zgjidhur.Procesi kyç i përcaktimit të përbërjes së ekosistemit është i natyrës jolineare.Ekzistenca e ndërveprimeve jolineare mund të ngatërrojë klasifikimin e fortë, kështu që është e nevojshme të shmangen metodat që bëjnë supozime të forta për shpërndarjen bazë statistikore të kovariancës së të dhënave.Të dhënat me dimensione të larta dhe jolineare janë të zakonshme në oqeanografi dhe mund të kenë një strukturë kovariance me topologji komplekse, jo-gausiane.Megjithëse të dhënat me një strukturë kovariance jo-Gaussian mund të pengojnë klasifikimin e fortë, metoda SAGE është e re, sepse është projektuar për të identifikuar grupimet me topologji arbitrare.
Qëllimi i metodës SAGE është të identifikojë në mënyrë objektive modelet e reja që mund të ndihmojnë në kuptimin e mëtejshëm ekologjik.Pas një fluksi pune të bazuar në grupe të ngjashme me (19), variablat ekologjike dhe të fluksit të lëndëve ushqyese përdoren për të përcaktuar grupin e vetëm në të dhëna, të quajtur krahina ekologjike.Metoda SAGE e propozuar në këtë studim (Figura 1) së pari redukton dimensionalitetin nga 55 në 11 dimensione duke përmbledhur grupet funksionale të planktonit të përcaktuara apriori (shih Materialet dhe Metodat).Duke përdorur metodën e ngulitjes së fqinjëve të rastësishëm t (t-SNE), madhësia zvogëlohet më tej duke projektuar probabilitetin në hapësirën 3D.Grumbullimi i pambikëqyrur mund të identifikojë zona ekologjikisht të afërta [grupimi hapësinor i bazuar në densitet (DBSCAN) për aplikime të bazuara në zhurmë].Të dy t-SNE dhe DBSCAN janë të zbatueshme për të dhënat e modelit numerik jolinear të ekosistemit.Pastaj riprojektoni provincën ekologjike që rezulton në tokë.Janë identifikuar më shumë se njëqind provinca unike ekologjike, të përshtatshme për kërkime rajonale.Për të marrë në konsideratë modelin e ekosistemit të qëndrueshëm globalisht, metoda SAGE përdoret për të grumbulluar provincat ekologjike në provincat ekologjike të grumbulluara (AEP) për të përmirësuar efektivitetin e provincave ekologjike.Niveli i grumbullimit (i quajtur "kompleksitet") mund të rregullohet në nivelin e detajimit të kërkuar.Përcaktoni kompleksitetin minimal të një AEP të fortë.Fokusi i përzgjedhjes është metoda SAGE dhe eksplorimi i rasteve të kompleksitetit më të vogël të AEP për të përcaktuar kontrollin e strukturës së komunitetit të urgjencës.Modelet më pas mund të analizohen për të ofruar njohuri ekologjike.Metoda e prezantuar këtu mund të përdoret gjithashtu për krahasimin e modeleve më gjerësisht, për shembull, duke vlerësuar vendndodhjet e krahinave të ngjashme ekologjike të gjetura në modele të ndryshme për të theksuar dallimet dhe ngjashmëritë, në mënyrë që të krahasohen modelet.
(A) Diagrami skematik i rrjedhës së punës për përcaktimin e krahinës ekologjike;duke përdorur shumën në grupin funksional për të reduktuar të dhënat origjinale 55-dimensionale në një dalje modeli 11-dimensionale, duke përfshirë biomasën e shtatë planktoneve funksionale/ushqyese dhe katër norma furnizimi me lëndë ushqyese.Vlera e papërfillshme dhe zona e qëndrueshme e mbulimit të akullit.Të dhënat janë standardizuar dhe standardizuar.Jepni të dhëna 11-dimensionale për algoritmin t-SNE për të theksuar kombinime statistikisht të ngjashme të veçorive.DBSCAN do të zgjedhë me kujdes grupin për të vendosur vlerën e parametrit.Më në fund projektoni të dhënat përsëri në projeksionin e gjerësisë/gjatësisë.Ju lutemi vini re se ky proces përsëritet 10 herë sepse mund të krijohet një rastësi e lehtë duke aplikuar t-SNE.(B) shpjegon se si të merrni AEP duke përsëritur rrjedhën e punës në (A) 10 herë.Për secilin prej këtyre 10 zbatimeve, matrica e pangjashmërisë ndërkrahinore Bray-Curtis (BC) u përcaktua bazuar në biomasa e 51 llojeve fitoplankton.Përcaktoni ndryshimin BC midis provincave, nga kompleksiteti 1 AEP në kompleksitetin e plotë 115. Standardi BC përcaktohet nga Provinca Longhurst.
Metoda SAGE përdor daljen e modelit numerik global 3D fizik/ekosistem për të përcaktuar provincën ekologjike [Darwin (2);shih Materialet dhe Metodat dhe Shënimin S1].Komponentët e ekosistemit përbëhen nga 35 lloje fitoplanktoni dhe 16 lloje zooplanktoni, me shtatë grupe funksionale të paracaktuara: prokariote dhe eukariote të përshtatur në mjedise me vlera të ulëta ushqyese, kokcidi me një shtresë karbonat kalciumi dhe fiksim të rëndë të lëndëve ushqyese të azotit, nitrogjenit. lëndë ushqyese të rëndësishme), me mbulesë silicore, mund të bëjnë fotosintezën e planktoneve të tjera dhe kullotjen e flagjelatave të përziera të lëndëve ushqyese dhe barinjve të zooplanktonit.Hapësira e madhësisë është 0,6 deri në 2500μm diametër sferik ekuivalent.Shpërndarja e modelit të madhësisë së fitoplanktonit dhe grupimit funksional kap karakteristikat e përgjithshme që shihen në vëzhgimet satelitore dhe in-situ (shih Figurat S1 deri në S3).Ngjashmëria midis modelit numerik dhe oqeanit të vëzhguar tregon se provincat e përcaktuara nga modeli mund të jenë të zbatueshme për oqeanin in-situ.Ju lutemi vini re se ky model kap vetëm një diversitet të caktuar të fitoplanktonit dhe vetëm disa zona të caktuara fizike dhe kimike të detyrueshme të oqeanit in situ.Metoda SAGE mund t'u mundësojë njerëzve të kuptojnë më mirë mekanizmin e kontrollit shumë rajonal të strukturës model të komunitetit.
Duke përfshirë vetëm shumën e biomasës sipërfaqësore (me një kohë mesatare prej 20 vjetësh) në çdo grup funksional të planktonit, dimensionaliteti i të dhënave mund të reduktohet.Pasi studimet e mëparshme treguan rolin e tyre kyç në përcaktimin e strukturës së komunitetit, ai përfshinte gjithashtu termat e burimit sipërfaqësor për flukset ushqyese (furnizimi me azot, hekur, fosfat dhe acid silicik) [p.sh. (20, 21)] .Përmbledhja e grupeve funksionale e zvogëlon problemin nga 55 (51 plankton dhe 4 flukse lëndësh ushqyese) në 11 dimensione.Në këtë studim fillestar, për shkak të kufizimeve llogaritëse të vendosura nga algoritmi, ndryshueshmëria e thellësisë dhe e kohës nuk u morën parasysh.
Metoda SAGE është në gjendje të identifikojë marrëdhënie të rëndësishme midis proceseve jolineare dhe veçorive kryesore të ndërveprimeve midis biomasës së grupit funksional dhe fluksit të lëndëve ushqyese.Përdorimi i të dhënave 11-dimensionale të bazuara në metodat Euklidiane të mësimit në distancë (të tilla si K-means) nuk mund të përftojë provinca të besueshme dhe të riprodhueshme (19, 22).Kjo është për shkak se asnjë formë Gaussian nuk gjendet në shpërndarjen bazë të kovariancës së elementëve kyç që përcaktojnë provincën ekologjike.Mesatarja K e qelizave Voronoi (vijat e drejta) nuk mund të ruajë shpërndarjen bazë jo-gausiane.
Biomasa e shtatë grupeve funksionale të planktonit dhe katër flukseve ushqyese formojnë një vektor x 11-dimensionale.Prandaj, x është një fushë vektoriale në rrjetin e modelit, ku çdo element xi përfaqëson një vektor 11-dimensional të përcaktuar në rrjetin horizontal të modelit.Çdo indeks i identifikon në mënyrë unike një pikë rrjeti në sferë, ku (lon, lat) = (ϕi, θi).Nëse biomasa e njësisë së rrjetit model është më e vogël se 1.2×10-3mg Chl/m3 ose shkalla e mbulimit të akullit kalon 70%, përdoret regjistri i të dhënave të biomasës dhe hidhet.Të dhënat normalizohen dhe standardizohen, kështu që të gjitha të dhënat janë në rangun prej [0 deri në 1], mesatarja hiqet dhe shkallëzohet në variancën e njësisë.Kjo bëhet në mënyrë që veçoritë (biomasa dhe fluksi i lëndëve ushqyese) të mos kufizohen nga kontrasti në diapazonin e vlerave të mundshme.Grumbullimi duhet të kapë marrëdhënien e ndryshimit nga distanca kryesore e probabilitetit midis veçorive dhe jo nga distanca gjeografike.Duke llogaritur këto distanca, shfaqen karakteristika të rëndësishme, ndërsa detajet e panevojshme hidhen poshtë.Nga pikëpamja ekologjike, kjo është e nevojshme sepse disa lloje fitoplanktoni me pak biomasë mund të kenë efekte më të mëdha biogjeokimike, siç është fiksimi i azotit nga bakteret diazotrofike.Gjatë standardizimit dhe normalizimit të të dhënave, këto lloje të bashkëvariateve do të theksohen.
Duke theksuar afërsinë e veçorive në hapësirën me dimensione të larta në paraqitjen me dimensione të ulëta, algoritmi t-SNE përdoret për të bërë më të qarta rajonet ekzistuese të ngjashme.Puna e mëparshme që synonte ndërtimin e rrjeteve të thella nervore për aplikacionet e sensorit në distancë përdori t-SNE, i cili dëshmoi aftësinë e tij në ndarjen e veçorive kryesore (23).Ky është një hap i domosdoshëm për të identifikuar një grupim të fortë në të dhënat e veçorive duke shmangur zgjidhjet jokonvergjente (shënim S2).Duke përdorur bërthamat Gaussian, t-SNE ruan vetitë statistikore të të dhënave duke hartuar çdo objekt me dimensione të larta në një pikë në hapësirën e fazës 3D, duke siguruar kështu që probabiliteti i objekteve të ngjashme në drejtimet e larta dhe të ulëta të jetë i lartë në një shkallë të lartë. hapësira dimensionale (24).Duke pasur parasysh një grup N objektesh me dimensione të larta x1,…,xN, algoritmi t-SNE zvogëlohet duke minimizuar divergjencën Kullback-Leibler (KL) (25).Divergjenca KL është një masë se sa e ndryshme është një shpërndarje probabiliteti nga një shpërndarje e dytë e probabilitetit referencë dhe mund të vlerësojë në mënyrë efektive mundësinë e korrelacionit midis paraqitjeve me dimensione të ulëta të veçorive me dimensione të larta.Nëse xi është objekti i i-të në hapësirën N-dimensionale, xj është objekti i j-të në hapësirën N-dimensionale, yi është objekti i-të në hapësirën me dimensione të ulëta dhe yj është objekti i j-të në hapësirën e ulët -hapësirë dimensionale, atëherë t -SNE përcakton probabilitetin e ngjashmërisë ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), dhe për grupin e reduktimit të dimensionit q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Figura 2A ilustron efektin e reduktimit të vektorëve të biomasës dhe fluksit të lëndëve ushqyese të kombinimit 11-dimensional në 3D.Motivimi i aplikimit të t-SNE mund të krahasohet me motivimin e analizës së komponentit kryesor (PCA), i cili përdor atributin e variancës për të theksuar zonën/atributin e të dhënave, duke reduktuar kështu dimensionin.Metoda t-SNE rezultoi se ishte superiore ndaj PCA-së në ofrimin e rezultateve të besueshme dhe të riprodhueshme për Ministrinë e Eko-s (shih Shënimin S2).Kjo mund të jetë për shkak se supozimi i ortogonalitetit të PCA nuk është i përshtatshëm për identifikimin e ndërveprimeve kritike midis veçorive ndërvepruese shumë jolineare, sepse PCA fokusohet në strukturat e kovariancës lineare (26).Duke përdorur të dhënat e sensorit në distancë, Lunga et al.(27) ilustron se si të përdoret metoda SNE për të nxjerrë në pah veçoritë spektrale komplekse dhe jolineare që devijojnë nga shpërndarja Gaussian.
(A) Një normë e modeluar e furnizimit me lëndë ushqyese, biomasa e grupit funksional të fitoplanktonit dhe zooplanktonit, e tërhequr nga algoritmi t-SNE dhe e ngjyrosur sipas krahinës duke përdorur DBSCAN.Çdo pikë përfaqëson një pikë në hapësirën me dimensione të larta, siç tregohet në figurën 6B, shumica e pikave janë kapur.Boshtet i referohen madhësive "t-SNE" 1, 2 dhe 3. (B) Projeksioni gjeografik i krahinës i gjetur nga DBSCAN në rrjetin gjerësi-gjatësi të origjinës.Ngjyra duhet të konsiderohet si çdo ngjyrë, por duhet të korrespondojë me (A).
Pikat në grafikun e shpërndarjes t-SNE në figurën 2A shoqërohen përkatësisht me gjerësinë dhe gjatësinë gjeografike.Nëse dy pikat në figurën 2A janë afër njëra-tjetrës, kjo është për shkak se biomasa e tyre dhe fluksi i lëndëve ushqyese janë të ngjashme, jo për shkak të afërsisë gjeografike.Ngjyrat në figurën 2A janë grupime të zbuluara duke përdorur metodën DBSCAN (28).Kur kërkoni për vëzhgime të dendura, algoritmi DBSCAN përdor distancën në paraqitjen 3D midis pikave (ϵ = 0,39; për informacion rreth kësaj zgjedhjeje, shihni Materialet dhe Metodat), dhe numri i pikave të ngjashme kërkohet për të përcaktuar grupin (këtu 100 pikë, ju lutemi shihni më lart).Metoda DBSCAN nuk bën ndonjë supozim për formën ose numrin e grupimeve në të dhëna, siç tregohet më poshtë:
3) Për të gjitha pikat e identifikuara si brenda distancës brenda, përsëritni hapin 2 në mënyrë të përsëritur për të përcaktuar kufirin e grupit.Nëse numri i pikëve është më i madh se vlera minimale e vendosur, ai caktohet si një grup.
Të dhënat që nuk plotësojnë metrikën minimale të grupit dhe distancës ϵ konsiderohen "zhurmë" dhe nuk u caktohet një ngjyrë.DBSCAN është një algoritëm i shpejtë dhe i shkallëzuar me performancë O(n2) në rastin më të keq.Për analizën aktuale, në fakt nuk është e rastësishme.Numri minimal i pikëve përcaktohet nga vlerësimi i ekspertëve.Pas rregullimit të distancës më pas, rezultati nuk është mjaftueshëm i qëndrueshëm në intervalin ≈±10.Kjo distancë caktohet duke përdorur lidhjen (Figura 6A) dhe përqindjen e mbulimit të oqeanit (Figura 6B).Lidhshmëria përcaktohet si numri i përbërë i grupimeve dhe është i ndjeshëm ndaj parametrit ϵ.Lidhja më e ulët tregon përshtatje të pamjaftueshme, grupim artificial të rajoneve së bashku.Lidhja e lartë tregon mbipërshtatje.Është e imagjinueshme të përdoret një minimum më i lartë, por nëse minimumi tejkalon ca, është e pamundur të arrihet një zgjidhje e besueshme.135 (Për më shumë detaje, shih Materialet dhe Metodat).
115 grupimet e identifikuara në Figurën 2A janë projektuar përsëri në tokë në Figurën 2B.Çdo ngjyrë korrespondon me një kombinim koherent të faktorëve biogjeokimikë dhe ekologjikë të identifikuar nga DBSCAN.Pasi të përcaktohen grupimet, lidhja e secilës pikë në Figurën 2A me një gjerësi dhe gjatësi të caktuar gjeografike përdoret për të projektuar grupimet përsëri në zonën gjeografike.Figura 2B e ilustron këtë me të njëjtat ngjyra të grupit si Figura 2A.Ngjyrat e ngjashme nuk duhet të interpretohen si ngjashmëri ekologjike, sepse ato caktohen sipas rendit në të cilin grupet zbulohen nga algoritmi.
Zona në Figurën 2B mund të jetë cilësisht e ngjashme me një zonë të krijuar në fizikën dhe/ose biogjeokiminë e oqeanit.Për shembull, grupimet në Oqeanin Jugor janë zona-simetrike, me vorbulla oligotrofike që shfaqen, dhe tranzicioni i mprehtë tregon ndikimin e erërave tregtare.Për shembull, në Paqësorin ekuatorial, shihen rajone të ndryshme që lidhen me ngritjen.
Për të kuptuar mjedisin ekologjik të Eko-Provincës, një variacion i indeksit të diferencës Bray-Curtis (BC) (29) u përdor për të vlerësuar ekologjinë në grup.Treguesi BC është një e dhënë statistikore e përdorur për të përcaktuar diferencën në strukturën e komunitetit midis dy zonave të ndryshme.Matja BC është e zbatueshme për biomasën e 51 llojeve të fitoplanktonit dhe zooplanktonit BCninj = 1-2CninjSni + Snj
BCninj i referohet ngjashmërisë midis kombinimit ni dhe kombinimit nj, ku Cninj është vlera minimale e një lloji të vetëm të biomasës që ekziston në të dy kombinimet ni dhe nj, dhe Sni përfaqëson shumën e të gjitha biomasës që ekzistojnë në të dy kombinimet ni dhe Snj.Dallimi BC është i ngjashëm me masën e distancës, por vepron në hapësirën jo-Euklidiane, e cila ka të ngjarë të jetë më e përshtatshme për të dhënat ekologjike dhe interpretimin e saj.
Për secilin grup të identifikuar në Figurën 2B, mund të vlerësohet ngjashmëria e BC brenda-krahinore dhe ndërkrahinore.Diferenca para Krishtit brenda një krahine i referohet diferencës midis vlerës mesatare të krahinës dhe çdo pike në provincë.Dallimi midis provincave para Krishtit i referohet ngjashmërisë midis një krahine dhe krahinave të tjera.Figura 3A tregon një matricë simetrike BC (0, e zezë: plotësisht korresponduese; 1, e bardhë: krejtësisht e ndryshme).Çdo rresht në grafik tregon një model në të dhëna.Figura 3B tregon rëndësinë gjeografike të rezultateve të pes në Figurën 3A për çdo krahinë.Për një provincë në një zonë me ushqim të ulët dhe me lëndë ushqyese të ulët, Figura 3B tregon se simetria e zonave të mëdha rreth ekuatorit dhe Oqeanit Indian është në thelb e ngjashme, por gjerësitë më të larta dhe zonat e larta janë dukshëm të ndryshme.
(A) Shkalla e diferencës BC e vlerësuar për secilën krahinë bazuar në mesataren globale mesatare globale 20-vjeçare të sipërfaqes prej 51 plankton.Vini re simetrinë e pritur të vlerave.(B) Projeksioni hapësinor i një kolone (ose rreshti).Për një krahinë në një rreth distrofik, u vlerësua shpërndarja globale e masës së ngjashmërisë BC dhe u vlerësua mesatarja globale 20-vjeçare.E zeza (BC = 0) do të thotë të njëjtën zonë, dhe e bardha (BC = 1) nuk do të thotë asnjë ngjashmëri.
Figura 4A ilustron ndryshimin në pes brenda secilës krahinë në figurën 2B.Përcaktuar duke përdorur kombinimin mesatar të sipërfaqes mesatare në një grup, dhe duke përcaktuar pangjashmërinë midis BC dhe mesatares së secilës pikë të rrjetit në provincë, tregon se metoda SAGE mund të ndajë mirë 51 specie bazuar në ngjashmërinë ekologjike Lloji i të dhënat e modelit.Mosngjashmëria e përgjithshme mesatare BC e grupimit të të gjitha 51 llojeve është 0,102±0,0049.
(A, B dhe D) Diferenca BC brenda krahinës vlerësohet si diferenca mesatare BC midis çdo komuniteti të pikës së rrjetit dhe krahinës mesatare, dhe kompleksiteti nuk zvogëlohet.(2) Diferenca mesatare globale brënda krahinore BC është 0.227±0.117.Ky është pikë referimi i klasifikimit të bazuar në motivimin ekologjik i propozuar nga kjo punë [vija e gjelbër në (C)].(C) Diferenca mesatare brenda-provinciale BC: Vija e zezë përfaqëson diferencën brenda-krahinore BC me kompleksitet në rritje.2σ vjen nga 10 përsëritje të procesit të identifikimit të eko-krahinës.Për kompleksitetin total të provincave të zbuluara nga DBSCAN, (A) tregon se pangjashmëria BC në provincë është 0.099 dhe klasifikimi i kompleksitetit i propozuar nga (C) është 12, duke rezultuar në një pangjashmëri BC prej 0.200 në provincë.siç tregon fotografia.(D).
Në figurën 4B, biomasa e 51 llojeve të planktonit përdoret për të përfaqësuar diferencën ekuivalente para Krishtit në provincën Longhurst.Mesatarja e përgjithshme e çdo krahine është 0.227, dhe devijimi standard i pikave të rrjetit në lidhje me diferencën në provincën BC është 0.046.Ky është më i madh se grupi i identifikuar në Figurën 1B.Në vend të kësaj, duke përdorur shumën e shtatë grupeve funksionale, pangjashmëria mesatare brenda sezonit BC në Longhurst u rrit në 0.232.
Harta globale e eko-provincave ofron detaje të ndërlikuara të ndërveprimeve unike ekologjike dhe janë bërë përmirësime në përdorimin e të gjithë strukturës së ekosistemit të provincës Longhurst.Ministria e Ekologjisë pritet të ofrojë pasqyrë në procesin e kontrollit të ekosistemit të modelit numerik dhe ky pasqyrë do të ndihmojë në eksplorimin e punës në terren.Për qëllimin e këtij hulumtimi, nuk është e mundur të shfaqen plotësisht më shumë se njëqind provinca.Seksioni tjetër prezanton metodën SAGE që përmbledh provincat.
Një nga qëllimet e provincës është të promovojë të kuptuarit e vendndodhjes dhe menaxhimit të krahinës.Për të përcaktuar situatat emergjente, metoda në Figurën 1B ilustron folenë e krahinave ekologjikisht të ngjashme.Eko-provincat grupohen së bashku në bazë të ngjashmërisë ekologjike, dhe një grupim i tillë i krahinave quhet AEP.Vendosni një "kompleksitet" të rregullueshëm bazuar në numrin total të provincave që do të merren parasysh.Termi "kompleksitet" përdoret sepse lejon që niveli i atributeve të urgjencës të rregullohet.Në mënyrë që të përcaktohen grumbullimet kuptimplote, diferenca mesatare BC brenda provincës prej 0.227 nga Longhurst përdoret si pikë referimi.Nën këtë pikë referimi, krahinat e kombinuara nuk konsiderohen më të dobishme.
Siç tregohet në figurën 3B, krahinat ekologjike globale janë koherente.Duke përdorur dallimet ndërkrahinore BC, mund të shihet se disa konfigurime janë shumë "të zakonshme".Frymëzuar nga gjenetika dhe metodat e teorisë së grafikëve, "grafikët e lidhur" përdoren për të renditur > 100 provinca bazuar në provincat më të ngjashme me to.Metrika e "lidhshmërisë" këtu përcaktohet duke përdorur pangjashmërinë ndërkrahinore BC (30).Numri i provincave me hapësirë më të madhe për klasifikimin e > 100 provincave mund të quhet këtu si kompleksitet.AEP është një produkt që kategorizon më shumë se 100 provinca si krahinat ekologjike më dominuese/më të afërta.Çdo krahinë ekologjike i caktohet krahinës ekologjike dominuese/shumë të lidhur që është më e ngjashme me to.Ky grumbullim i përcaktuar nga diferenca BC lejon një qasje të mbivendosur ndaj ekologjisë globale.
Kompleksiteti i zgjedhur mund të jetë çdo vlerë nga 1 deri në kompleksitetin e plotë të FIG.2A.Në kompleksitet më të ulët, AEP mund të degjenerojë për shkak të hapit probabilistik të reduktimit të dimensionalitetit (t-SNE).Degjenerimi do të thotë që provincat ekologjike mund t'u caktohen AEP-ve të ndryshme ndërmjet përsëritjeve, duke ndryshuar kështu zonën gjeografike të mbuluar.Figura 4C ilustron përhapjen e pangjashmërive BC brenda provincave në AEP me kompleksitet në rritje në 10 zbatime (ilustrimi në Figurën 1B).Në figurën 4C, 2σ (zona blu) është një masë e degradimit në 10 zbatime dhe vija e gjelbër përfaqëson pikën referuese Longhurst.Faktet kanë vërtetuar se kompleksiteti i 12 mund të mbajë diferencën BC në provincë nën standardin Longhurst në të gjitha zbatimet dhe të mbajë një degradim relativisht të vogël 2σ.Në përmbledhje, kompleksiteti minimal i rekomanduar është 12 AEP dhe diferenca mesatare BC brenda krahinës e vlerësuar duke përdorur 51 lloje planktoni është 0.198±0.013, siç tregohet në Figurën 4D.Duke përdorur shumën e shtatë grupeve funksionale të planktonit, diferenca mesatare BC brenda krahinës është 2σ në vend të 0,198±0,004.Krahasimi midis diferencave BC të llogaritura me biomasën totale të shtatë grupeve funksionale ose biomasën e të gjitha 51 llojeve të planktonit tregon se megjithëse metoda SAGE është e zbatueshme për situatën 51-dimensionale, ajo është për biomasën totale të shtatë grupeve funksionale. Për trajnim.
Në varësi të qëllimit të çdo hulumtimi, mund të merren parasysh nivele të ndryshme kompleksiteti.Studimet rajonale mund të kërkojnë kompleksitet të plotë (dmth., të gjitha 115 provincat).Si shembull dhe për qartësi, merrni parasysh kompleksitetin minimal të rekomanduar prej 12.
Si shembull i dobisë së metodës SAGE, 12 AEP me një kompleksitet minimal prej 12 përdoren këtu për të eksploruar kontrollin e strukturës së komunitetit të urgjencës.Figura 5 ilustron njohuritë ekologjike të grupuara nga AEP (nga A në L): Në stoikiometrinë Redfield, shtrirja gjeografike (Figura 5C), përbërja e grupit funksional të biomasës (Figura 5A) dhe furnizimi me lëndë ushqyese (Figura 5B) kryhen nga N Zoomed.Tregohet raporti (N:Si:P:Fe, 1:1:16:16×103).Për panelin e fundit, P e shumëzuar me 16 dhe Fe e shumëzuar me 16×103, kështu që grafiku me shtylla është ekuivalent me kërkesat ushqyese të fitoplanktonit.
Provincat klasifikohen në 12 AEP A deri në L. (A) Biomasa (mgC/m3) e ekosistemeve në 12 provinca.(B) Shkalla e fluksit të lëndëve ushqyese të azotit inorganik të tretur (N), hekurit (Fe), fosfatit (P) dhe acidit silicik (Si) (mmol/m3 në vit).Fe dhe P shumëzohen me 16 dhe 16×103, respektivisht, në mënyrë që shiritat të standardizohen sipas kërkesave të stoikiometrisë fitoplanktonike.(C) Vini re ndryshimin midis rajoneve polare, cikloneve subtropikale dhe rajoneve kryesore sezonale/në rritje.Stacionet e monitorimit janë të shënuara si më poshtë: 1, SENDET;2, ALOHA;3, stacioni P;dhe 4, LAKURA.
AEP e identifikuar është unike.Ka njëfarë simetrie rreth ekuatorit në Oqeanin Atlantik dhe Paqësor, dhe një zonë e ngjashme por e zgjeruar ekziston në Oqeanin Indian.Disa AEP përqafojnë anën perëndimore të kontinentit të lidhur me ngjitjen.Rryma rreth polare e Polit të Jugut konsiderohet si një tipar i madh zonal.Cikloni subtropikal është një seri komplekse AEP oligotrofike.Në këto provinca, modeli i njohur i dallimeve të biomasës midis vorbullave oligotrofike të mbizotëruara nga plankton dhe rajoneve polare të pasura me diatom është i dukshëm.
AEP me biomasë totale fitoplanktonike shumë të ngjashme mund të kenë struktura shumë të ndryshme të komunitetit dhe të mbulojnë zona të ndryshme gjeografike, si D, H dhe K, të cilat kanë biomasë totale fitoplanktonike të ngjashme.AEP H kryesisht ekziston në Oqeanin Indian ekuatorial dhe ka më shumë baktere diazotrofike.AEP D gjendet në disa pellgje, por është veçanërisht i spikatur në Paqësor rreth zonave me rendiment të lartë rreth ngritjes ekuatoriale.Forma e kësaj krahine të Paqësorit të kujton një tren me valë planetare.Ka pak diazobaktere në AEP D, dhe më shumë kone.Krahasuar me dy provincat e tjera, AEP K gjendet vetëm në malësitë e Oqeanit Arktik, dhe ka më shumë diatome dhe më pak plankton.Vlen të përmendet se sasia e planktonit në këto tre rajone është gjithashtu shumë e ndryshme.Midis tyre, bollëku i planktonit të AEP K është relativisht i ulët, ndërsa ai i AEP D dhe H është relativisht i lartë.Prandaj, pavarësisht nga biomasa e tyre (dhe për rrjedhojë e ngjashme me Chl-a), këto provinca janë mjaft të ndryshme: testimi i provincës me bazë Chl mund të mos i kapë këto dallime.
Është gjithashtu e qartë se disa AEP me biomasë shumë të ndryshme mund të jenë të ngjashme për sa i përket strukturës së komunitetit fitoplankton.Për shembull, kjo është e dukshme në AEP D dhe E. Ata janë afër njëri-tjetrit, dhe në Oqeanin Paqësor, AEP E është afër AEPJ shumë produktive.Në mënyrë të ngjashme, nuk ka asnjë lidhje të qartë midis biomasës së fitoplanktonit dhe bollëkut të zooplanktonit.
AEP mund të kuptohet në termat e lëndëve ushqyese që u ofrohen atyre (Figura 5B).Diatomet ekzistojnë vetëm aty ku ka sasi të mjaftueshme të acidit silicik.Në përgjithësi, sa më e lartë të jetë furnizimi me acid silicik, aq më e lartë është biomasa e diatomeve.Diatomet mund të shihen në AEP A, J, K dhe L. Raporti i biomasës së diatomeve në raport me fitoplanktonet e tjera përcaktohet nga N, P dhe Fe të ofruara në lidhje me kërkesën për diatom.Për shembull, AEP L dominohet nga diatomet.Krahasuar me lëndët e tjera ushqyese, Si ka furnizimin më të lartë.Në të kundërt, pavarësisht produktivitetit më të lartë, AEP J ka më pak diatome dhe më pak furnizim silikoni (të gjitha dhe në lidhje me lëndët ushqyese të tjera).
Bakteret diazonium kanë aftësinë të rregullojnë azotin, por rriten ngadalë (31).Ato bashkëjetojnë me fitoplanktonet e tjera, ku hekuri dhe fosfori janë të tepërta në krahasim me kërkesën për lëndë ushqyese jo-diazonium (20, 21).Vlen të theksohet se biomasa diazotrofike është relativisht e lartë dhe furnizimi me Fe dhe P është relativisht i madh në raport me furnizimin e N. Në këtë mënyrë, megjithëse biomasa totale në AEP J është më e lartë, biomasa e diazoniumit në AEP H është më i madh se ai në J. Ju lutemi vini re se AEP J dhe H janë gjeografikisht shumë të ndryshëm, dhe H ndodhet në Oqeanin Indian ekuatorial.
Nëse struktura unike e ekosistemit nuk ndahet në provinca, njohuritë e marra nga 12 modelet e kompleksitetit më të ulët të AEP nuk do të jenë aq të qarta.AEP e gjeneruar nga SAGE lehtëson krahasimin koherent dhe të njëkohshëm të informacionit kompleks dhe me dimensione të larta nga modelet e ekosistemit.AEP thekson në mënyrë efektive pse Chl nuk është një metodë e mirë dhe alternative për të përcaktuar strukturën e komunitetit ose bollëkun e zooplanktonit në nivele më të larta të lëndëve ushqyese.Një analizë e detajuar e temave kërkimore në vazhdim është përtej qëllimit të këtij artikulli.Metoda SAGE ofron një mënyrë për të eksploruar mekanizma të tjerë në model që është më e lehtë për t'u trajtuar sesa shikimi pikë-për-pikë.
Metoda SAGE propozohet për të ndihmuar në sqarimin e të dhënave ekologjike jashtëzakonisht komplekse nga modelet numerike globale fizike/biogjeokimike/ekosistemike.Krahina ekologjike përcaktohet nga biomasa totale e grupeve funksionale ndërplanktonike, aplikimi i algoritmit të reduktimit të dimensionalitetit të probabilitetit t-SNE dhe grupimi duke përdorur metodën ML të pambikëqyrur DBSCAN.Diferenca/teoria e grafikëve ndër-krahinore BC për metodën e folezimit zbatohet për të nxjerrë një AEP të fortë që mund të përdoret për interpretim global.Për sa i përket ndërtimit, Eko-Provinca dhe AEP janë unike.Folezimi i AEP mund të rregullohet midis kompleksitetit të plotë të provincës ekologjike origjinale dhe pragut minimal të rekomanduar prej 12 AEP.Folezimi dhe përcaktimi i kompleksitetit minimal të AEP konsiderohen si hapa kyç, sepse probabiliteti t-SNE degjeneron AEP me kompleksitet <12.Metoda SAGE është globale dhe kompleksiteti i saj varion nga> 100 AEP në 12. Për thjeshtësi, fokusi aktual është në kompleksitetin e 12 AEP-ve globale.Hulumtimet e ardhshme, veçanërisht studimet rajonale, mund të gjejnë të dobishme një nëngrup më të vogël hapësinor të eko-provincave globale dhe mund të grumbullohen në një zonë më të vogël për të përfituar nga të njëjtat njohuri ekologjike të diskutuara këtu.Ai ofron sugjerime se si këto provinca ekologjike dhe njohuritë e marra prej tyre mund të përdoren për kuptim të mëtejshëm ekologjik, për të lehtësuar krahasimin e modeleve dhe për të përmirësuar potencialisht monitorimin e ekosistemeve detare.
Krahina ekologjike dhe AEP e identifikuar me metodën SAGE bazohen në të dhënat në modelin numerik.Sipas përkufizimit, modeli numerik është një strukturë e thjeshtuar, duke u përpjekur të kapë thelbin e sistemit të synuar, dhe modele të ndryshme do të kenë shpërndarje të ndryshme të planktonit.Modeli numerik i përdorur në këtë studim nuk mund të kapë plotësisht disa nga modelet e vëzhguara (për shembull, në vlerësimet e Chl për rajonin ekuatorial dhe Oqeanin Jugor).Vetëm një pjesë e vogël e diversitetit në oqeanin e vërtetë kapet, dhe meso dhe nën-mezoshkallët nuk mund të zgjidhen, gjë që mund të ndikojë në fluksin e lëndëve ushqyese dhe strukturën e komunitetit në shkallë më të vogël.Pavarësisht këtyre mangësive, rezulton se AEP është shumë i dobishëm për të ndihmuar në kuptimin e modeleve komplekse.Duke vlerësuar se ku gjenden krahina të ngjashme ekologjike, AEP ofron një mjet të mundshëm krahasimi të modelit numerik.Modeli numerik aktual kap modelin e përgjithshëm të përqendrimit të fitoplanktonit Chl-a me sensor në distancë dhe shpërndarjen e madhësisë së planktonit dhe grupit funksional (Shënimi S1 dhe Figura S1) (2, 32).
Siç tregohet nga linja konturore 0,1 mgChl-a/m-3, AEP ndahet në zonën oligotrofike dhe zonën mezotrofike (Figura S1B): AEP B, C, D, E, F dhe G janë zona oligotrofike, dhe zonat e mbetura janë ndodhet Chl-a e Larte.AEP tregon disa korrespondencë me Provincën Longhurst (Figura S3A), për shembull, Oqeani Jugor dhe Paqësori ekuatorial.Në disa rajone, AEP mbulon shumë rajone Longhurst, dhe anasjelltas.Meqenëse synimi për të kufizuar provincat në këtë zonë dhe Longhurst është i ndryshëm, pritet që të ketë dallime.AEP të shumta në një provincë Longhurst tregojnë se zona të caktuara me biogjeokimi të ngjashme mund të kenë struktura shumë të ndryshme të ekosistemit.AEP shfaq një korrespondencë të caktuar me gjendjet fizike, siç zbulohet duke përdorur mësimin e pambikëqyrur (19), si në shtetet me rritje të lartë (për shembull, Oqeani Jugor dhe Paqësori ekuatorial; Figura S3, C dhe D).Këto korrespondenca tregojnë se struktura e komunitetit të planktonit ndikohet fuqishëm nga dinamika e oqeanit.Në zona të tilla si Atlantiku i Veriut, AEP përshkon provincat fizike.Mekanizmi që shkakton këto dallime mund të përfshijë procese të tilla si transporti i pluhurit, i cili mund të çojë në programe krejtësisht të ndryshme ushqyese edhe në kushte të ngjashme fizike.
Ministria e Ekologjisë dhe AEP theksuan se vetëm përdorimi i Chl nuk mund të identifikojë komponentët ekologjikë, siç e ka kuptuar tashmë komuniteti i ekologjisë detare.Kjo shihet në AEP me biomasë të ngjashme, por me përbërje ekologjike dukshëm të ndryshme (si D dhe E).Në të kundërt, AEP-të si D dhe K kanë biomasë shumë të ndryshme, por përbërje ekologjike të ngjashme.AEP thekson se marrëdhënia midis biomasës, përbërjes ekologjike dhe bollëkut të zooplanktonit është komplekse.Për shembull, megjithëse AEP J dallohet për sa i përket biomasës së fitoplanktonit dhe planktonit, AEP-të A dhe L kanë biomasë të ngjashme të planktonit, por A ka një bollëk më të lartë të planktonit.AEP thekson se biomasa fitoplanktonike (ose Chl) nuk mund të përdoret për të parashikuar biomasën e zooplanktonit.Zooplanktoni është themeli i zinxhirit ushqimor të peshkimit dhe vlerësimet më të sakta mund të çojnë në menaxhim më të mirë të burimeve.Satelitët e ardhshëm me ngjyra detare [për shembull, PACE (planktoni, aerosoli, retë dhe ekosistemi detar)] mund të pozicionohen më mirë për të ndihmuar në vlerësimin e strukturës së komunitetit të fitoplanktonit.Përdorimi i parashikimit AEP mund të lehtësojë potencialisht vlerësimin e zooplanktonit nga hapësira.Metodat si SAGE, së bashku me teknologjitë e reja dhe gjithnjë e më shumë të dhëna në terren të disponueshme për sondazhet e së vërtetës në terren (të tilla si Tara dhe kërkimet pasuese), mund të hedhin së bashku një hap drejt monitorimit të shëndetit të ekosistemit të bazuar në satelit.
Metoda SAGE ofron një mënyrë të përshtatshme për të vlerësuar disa mekanizma që kontrollojnë karakteristikat e provincës, të tilla si biomasa/Chl, prodhimi primar neto dhe struktura e komunitetit.Për shembull, sasia relative e diatomeve përcaktohet nga një çekuilibër në furnizimin e Si, N, P dhe Fe në lidhje me kërkesat stoikiometrike të fitoplanktonit.Me një normë oferte të balancuar, komuniteti dominohet nga diatomet (L).Kur shkalla e ofertës është e pabalancuar (d.m.th., oferta e silikonit është më e ulët se kërkesa e diatomeve për lëndë ushqyese), diatomet përbëjnë vetëm një pjesë të vogël (K).Kur furnizimi i Fe dhe P tejkalon furnizimin e N (për shembull, E dhe H), bakteret diazotrofike do të rriten fuqishëm.Nëpërmjet kontekstit të ofruar nga AEP, eksplorimi i mekanizmave të kontrollit do të bëhet më i dobishëm.
Eko-Provinca dhe AEP janë zona me struktura të ngjashme komunitare.Seritë kohore nga një vendndodhje e caktuar brenda një krahine ekologjike ose AEP mund të konsiderohet si një pikë referimi dhe mund të përfaqësojë zonën e mbuluar nga provinca ekologjike ose AEP.Stacionet e monitorimit afatgjatë në vend ofrojnë seri të tilla kohore.Grupet e të dhënave afatgjata in-situ do të vazhdojnë të luajnë një rol të pallogaritshëm.Nga këndvështrimi i monitorimit të strukturës së komunitetit, metoda SAGE mund të shihet si një mënyrë për të ndihmuar në përcaktimin e vendndodhjes më të dobishme të vendeve të reja.Për shembull, seritë kohore nga vlerësimi afatgjatë i habitatit oligotrofik (ALOHA) është në AEP B të zonës oligotrofike (Figura 5C, etiketa 2).Për shkak se ALOHA është afër kufirit të një AEP tjetër, seritë kohore mund të mos jenë përfaqësuese të të gjithë zonës, siç sugjerohej më parë (33).Në të njëjtin AEP B, seria kohore SEATS (Seria kohore e Azisë Juglindore) ndodhet në Tajvanin jugperëndimor (34), më larg nga kufijtë e AEP-ve të tjera (Figura 5C, etiketa 1) dhe mund të përdoret si një vendndodhje më e mirë për të monitoruar AEPB.Seritë kohore BATS (Studimi i serive kohore të Atlantikut të Bermudës) (Figura 5C, etiketa 4) në AEPC është shumë afër kufirit midis AEP C dhe F, gjë që tregon se monitorimi i AEP C duke përdorur seritë kohore BATS mund të jetë drejtpërdrejt problematik.Stacioni P në AEP J (Figura 5C, etiketa 3) është larg kufirit të AEP, kështu që është më përfaqësues.Eko-Provinca dhe AEP mund të ndihmojnë në krijimin e një kuadri monitorimi të përshtatshëm për vlerësimin e ndryshimeve globale, sepse leja e provincave për të vlerësuar se ku marrja e mostrave në vend mund të japë njohuri kryesore.Metoda SAGE mund të zhvillohet më tej për t'u aplikuar në të dhënat klimatike për të vlerësuar ndryshueshmërinë e kursimit të kohës.
Suksesi i metodës SAGE arrihet përmes aplikimit të kujdesshëm të metodave të shkencës së të dhënave/ML dhe njohurive specifike për domenin.Në mënyrë të veçantë, t-SNE përdoret për të kryer reduktimin e dimensioneve, i cili ruan strukturën e kovariancës së të dhënave me dimensione të larta dhe lehtëson vizualizimin e topologjisë së kovariancës.Të dhënat janë të renditura në formën e shiritave dhe kovariancave (Figura 2A), duke treguar se masat thjesht të bazuara në distancë (siç janë mesataret K) nuk janë të përshtatshme sepse ato zakonisht përdorin një shpërndarje me bazë Gaussian (rrethore) (diskutuar në Shënimin S2) .Metoda DBSCAN është e përshtatshme për çdo topologji të kovariancës.Për sa kohë që i kushtoni vëmendje cilësimit të parametrave, mund të sigurohet identifikim i besueshëm.Kostoja llogaritëse e algoritmit t-SNE është e lartë, gjë që kufizon aplikimin e tij aktual në një sasi më të madhe të dhënash, që do të thotë se është e vështirë të aplikohet në fusha të thella ose me ndryshime në kohë.Puna për shkallëzimin e t-SNE është në progres.Meqenëse distanca KL është e lehtë për t'u paralelizuar, algoritmi t-SNE ka një potencial të mirë për zgjerim në të ardhmen (35).Deri më tani, metoda të tjera premtuese për zvogëlimin e dimensioneve që mund të zvogëlojnë më mirë madhësinë përfshijnë teknikat e përafrimit dhe projeksionit të unifikuar të shumëfishtë (UMAP), por vlerësimi në kontekstin e të dhënave të oqeanit është i nevojshëm.Kuptimi i shkallëzueshmërisë më të mirë është, për shembull, klasifikimi i klimave globale ose modeleve me kompleksitet të ndryshëm në një shtresë të përzier.Zonat që nuk mund të klasifikohen nga SAGE në çdo krahinë mund të konsiderohen si pikat e zeza të mbetura në Figurën 2A.Gjeografikisht, këto zona janë kryesisht në zona shumë sezonale, gjë që sugjeron se kapja e krahinave ekologjike që ndryshojnë me kalimin e kohës do të sigurojë mbulim më të mirë.
Për të ndërtuar metodën SAGE, janë përdorur ide nga sistemet komplekse/shkenca e të dhënave, duke përdorur aftësinë për të përcaktuar grupimet e grupeve funksionale (mundësia për të qenë shumë afër në një hapësirë 11-dimensionale) dhe për të përcaktuar provincat.Këto provinca përshkruajnë vëllime specifike në hapësirën tonë të fazës 3D t-SNE.Në mënyrë të ngjashme, pjesa Poincaré mund të përdoret për të vlerësuar "vëllimin" e hapësirës së gjendjes së zënë nga trajektorja për të përcaktuar sjelljen "normale" ose "kaotike" (36).Për daljen statike të modelit 11-dimensionale, vëllimi i zënë pasi të dhënat janë konvertuar në një hapësirë fazore 3D mund të shpjegohet në mënyrë të ngjashme.Marrëdhënia midis zonës gjeografike dhe zonës në hapësirën e fazës 3D nuk është e thjeshtë, por mund të shpjegohet në aspektin e ngjashmërisë ekologjike.Për këtë arsye, preferohet masa më konvencionale e pangjashmërisë BC.
Puna e ardhshme do të ripërdorë metodën SAGE për ndryshimin sezonal të të dhënave për të vlerësuar ndryshueshmërinë hapësinore të provincave të identifikuara dhe AEP.Qëllimi i ardhshëm është përdorimi i kësaj metode për të ndihmuar në përcaktimin se cilat provinca mund të përcaktohen nëpërmjet matjeve satelitore (të tilla si Chl-a, reflektimi i sensorit në distancë dhe temperatura e sipërfaqes së detit).Kjo do të lejojë vlerësimin me sensorë në distancë të komponentëve ekologjikë dhe monitorim shumë fleksibël të krahinave ekologjike dhe ndryshueshmërisë së tyre.
Qëllimi i këtij hulumtimi është të prezantojë metodën SAGE, e cila përcakton një provincë ekologjike përmes strukturës unike të komunitetit të planktonit.Këtu do të jepet informacion më i detajuar në lidhje me modelin fizik/biogjeokimik/ekosistem dhe përzgjedhjen e parametrave të algoritmeve t-SNE dhe DBSCAN.
Komponentët fizikë të modelit vijnë nga vlerësimi i qarkullimit të oqeanit dhe klimës [ECCOv4;(37) vlerësimi global i gjendjes i përshkruar nga (38).Rezolucioni nominal i vlerësimit shtetëror është 1/5.Metoda e katrorëve më të vegjël me metodën e shumëzuesit Lagranzhit përdoret për të marrë kushtet fillestare dhe kufitare dhe parametrat e modelit të brendshëm të rregulluar nga vëzhgimi, duke gjeneruar kështu një model të ciklit të përgjithshëm MIT (MITgcm) (39), modeli Pas optimizimit, rezultatet mund të të gjurmohen dhe vëzhgohen.
Biogjeokimia/ekosistemi ka një përshkrim më të plotë (dmth. ekuacionet dhe vlerat e parametrave) në (2).Modeli kap qarkullimin e C, N, P, Si dhe Fe përmes pellgjeve inorganike dhe organike.Versioni i përdorur këtu përfshin 35 lloje të fitoplanktonit: 2 lloje mikroprokariote dhe 2 lloje mikroeukariote (të përshtatshme për mjedise me vlera të ulëta ushqyese), 5 lloje të Cryptomonas sphaeroides (me shtresë karbonat kalciumi), 5 lloje diazonium ( Mund të rregullojë azotin, kështu që nuk është i kufizuar) disponueshmëria e azotit inorganik të tretur), 11 diatome (duke formuar një mbulesë silicore), 10 flagjelate vegjetative të përziera (mund të fotosintezojnë dhe hanë plankton të tjerë) dhe 16 zooplankton (kullosin në plankton të tjerë).Këto quhen "grupe funksionale biogjeokimike" sepse ato kanë efekte të ndryshme në biogjeokiminë detare (40, 41) dhe shpesh përdoren në vëzhgime dhe studime modelesh.Në këtë model, çdo grup funksional përbëhet nga disa planktone me madhësi të ndryshme, me një hapësirë prej 0,6 deri në 2500 μm diametër sferik ekuivalent.
Parametrat që ndikojnë në rritjen, kullotjen dhe fundosjen e fitoplanktonit lidhen me madhësinë dhe ka dallime specifike midis gjashtë grupeve funksionale të fitoplanktonit (32).Pavarësisht kornizave të ndryshme fizike, rezultatet e 51 komponentëve të planktonit të modelit janë përdorur në një numër studimesh të fundit (42-44).
Nga viti 1992 deri në vitin 2011, modeli i çiftëzimit fizik/biogjeokimik/ekosistem funksionoi për 20 vjet.Prodhimi i modelit përfshin biomasën e planktonit, përqendrimin e lëndëve ushqyese dhe shkallën e furnizimit me lëndë ushqyese (DIN, PO4, Si dhe Fe).Në këtë studim, mesatarja 20-vjeçare e këtyre outputeve është përdorur si input i Krahinës Ekologjike.Chl, shpërndarja e biomasës së planktonit dhe përqendrimi i lëndëve ushqyese dhe shpërndarja e grupeve funksionale krahasohen me vëzhgimet satelitore dhe in-situ [shih (2, 44), Shënimi S1 dhe figura.S1 në S3].
Për metodën SAGE, burimi kryesor i rastësisë vjen nga hapi t-SNE.Rastësia pengon përsëritshmërinë, që do të thotë se rezultatet janë jo të besueshme.Metoda SAGE teston me rigorozitet qëndrueshmërinë duke përcaktuar një grup parametrash të t-SNE dhe DBSCAN, të cilat mund të identifikojnë vazhdimisht grupimet kur përsëriten.Përcaktimi i "hutësisë" së parametrit t-SNE mund të kuptohet si përcaktimi i shkallës në të cilën hartëzimi nga dimensionet e larta në ato të ulëta duhet të respektojë karakteristikat lokale ose globale të të dhënave.Arriti konfuzionin e 400 dhe 300 përsëritjeve.
Për algoritmin e grupimit DBSCAN, duhet të përcaktohet madhësia minimale dhe metrika e distancës së pikave të të dhënave në grup.Numri minimal përcaktohet nën drejtimin e ekspertëve.Kjo njohuri e di se çfarë i përshtatet kornizës dhe rezolucionit aktual të modelimit numerik.Numri minimal është 100. Një vlerë minimale më e lartë (më pak se <135 përpara se kufiri i sipërm i ngjyrës së gjelbër të bëhet më i gjerë) mund të merret parasysh, por nuk mund të zëvendësojë metodën e grumbullimit të bazuar në pangjashmërinë BC.Shkalla e lidhjes (Figura 6A) përdoret për të vendosur parametrin ϵ, i cili është i favorshëm për mbulim më të lartë (Figura 6B).Lidhshmëria përcaktohet si numri i përbërë i grupimeve dhe është i ndjeshëm ndaj parametrit ϵ.Lidhja më e ulët tregon përshtatje të pamjaftueshme, grupim artificial të rajoneve së bashku.Lidhja e lartë tregon mbipërshtatje.Përshtatja e tepërt është gjithashtu problematike, sepse tregon se hamendjet fillestare të rastësishme mund të çojnë në rezultate të papërsëritshme.Midis këtyre dy ekstremeve, një rritje e mprehtë (zakonisht e quajtur "bërryl") tregon ϵ më të mirë.Në figurën 6A, shihni një rritje të mprehtë në zonën e pllajës (e verdhë,> 200 grupime), e ndjekur nga një rënie e mprehtë (jeshile, 100 grupime), deri në rreth 130, e rrethuar nga shumë pak grupime (blu, <60 grupime) ).Në të paktën 100 zona blu, ose një grup dominon të gjithë oqeanin (ϵ <0,42), ose pjesa më e madhe e oqeanit nuk klasifikohet dhe konsiderohet zhurmë (ϵ> 0,99).Zona e verdhë ka një shpërndarje grupore shumë të ndryshueshme dhe të papërpunueshme.Ndërsa ϵ zvogëlohet, zhurma rritet.Zona e gjelbër që rritet ndjeshëm quhet bërryl.Ky është një rajon optimal.Megjithëse përdoret probabiliteti t-SNE, pangjashmëria BC brenda krahinës mund të përdoret ende për të përcaktuar grupimin e besueshëm.Duke përdorur figurën 6 (A dhe B), vendosni ϵ në 0.39.Sa më i madh të jetë numri minimal, aq më i vogël është probabiliteti për të arritur ϵ që lejon klasifikim të besueshëm dhe aq më e madhe është zona e gjelbër me vlerë më të madhe se 135. Zgjerimi i kësaj zone tregon se bërryli do të jetë më i vështirë për t'u gjetur ose jo ekzistues.
Pas vendosjes së parametrave të t-SNE, numri total i grupeve të gjetura do të përdoret si masë e lidhjes (A) dhe përqindjes së të dhënave të alokuara në grup (B).Pika e kuqe tregon kombinimin më të mirë të mbulimit dhe lidhjes.Numri minimal vendoset sipas numrit minimal që lidhet me ekologjinë.
Për materialet plotësuese për këtë artikull, ju lutemi shihni http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ky është një artikull me akses të hapur i shpërndarë sipas kushteve të licencës Creative Commons Attribution.Artikulli lejon përdorimin, shpërndarjen dhe riprodhimin e pakufizuar në çdo medium, me kusht që vepra origjinale të citohet siç duhet.
Shënim: Ne ju kërkojmë vetëm të jepni adresën tuaj të emailit në mënyrë që personi që ju rekomandoni në faqe ta dijë se ju dëshironi që ai ta shohë emailin dhe se ai nuk është i padëshiruar.Ne nuk do të kapim asnjë adresë emaili.
Kjo pyetje përdoret për të testuar nëse jeni vizitor dhe për të parandaluar paraqitjen automatike të spamit.
Ministria Globale e Ekologjisë Detare është e vendosur të zgjidhë probleme komplekse dhe përdor ML të pambikëqyrur për të eksploruar strukturat e komunitetit.
Ministria Globale e Ekologjisë Detare është e vendosur të zgjidhë probleme komplekse dhe përdor ML të pambikëqyrur për të eksploruar strukturat e komunitetit.
Koha e postimit: Jan-12-2021