topimg

Pojašnjavanje ekološke složenosti: učenje bez nadzora određuje globalnu morsku ekološku provinciju

Predlaže se metoda učenja bez nadzora za određivanje globalnih morskih ekoloških provincija (eko-provincija) na temelju strukture zajednice planktona i podataka o protoku hranjivih tvari.Metoda sustavne integrirane ekološke pokrajine (SAGE) može identificirati ekološke pokrajine u izrazito nelinearnim modelima ekosustava.Kako bi se prilagodio ne-Gaussovoj kovarijanci podataka, SAGE koristi slučajno ugrađivanje susjeda (t-SNE) za smanjenje dimenzionalnosti.Uz pomoć aplikacije buke koja se temelji na algoritmu prostornog klasteriranja temeljenog na gustoći (DBSCAN), može se identificirati više od stotinu ekoloških pokrajina.Korištenjem karte povezanosti s ekološkim razlikama kao mjere udaljenosti, robusna agregirana ekološka pokrajina (AEP) objektivno je definirana kroz ugniježđene ekološke pokrajine.Pomoću AEP-a istražena je kontrola stope opskrbe hranjivim tvarima u strukturi zajednice.Eco-province i AEP su jedinstveni i mogu pomoći u interpretaciji modela.Oni mogu olakšati usporedbe između modela i mogu poboljšati razumijevanje i praćenje morskih ekosustava.
Provincije su regije u kojima je složena biogeografija na moru ili kopnu organizirana u koherentna i smislena područja (1).Ove pokrajine su vrlo važne za usporedbu i kontrastiranje lokacija, karakteriziranje promatranja, praćenje i zaštitu.Složene i nelinearne interakcije koje proizvode ove pokrajine čine metode nenadziranog strojnog učenja (ML) vrlo prikladnima za objektivno određivanje provincija, jer je kovarijanca u podacima složena i nije Gaussova.Ovdje se predlaže ML metoda koja sustavno identificira jedinstvene morske ekološke pokrajine (eko-provincije) iz Darwinovog globalnog trodimenzionalnog (3D) fizičkog/ekosustavnog modela (2).Izraz "jedinstven" koristi se za označavanje da se identificirano područje ne preklapa u dovoljnoj mjeri s drugim područjima.Ova se metoda naziva System Integrated Ecological Province (SAGE) metoda.Kako bi se izvršila korisna klasifikacija, metoda algoritma treba omogućiti (i) globalnu klasifikaciju i (ii) analizu na više skala koja se može ugniježditi/agregirati u prostoru i vremenu (3).U ovom je istraživanju prvi put predložena SAGE metoda i raspravljano o identificiranim ekološkim provincijama.Eko-provincije mogu promicati razumijevanje čimbenika koji kontroliraju strukturu zajednice, pružiti korisne uvide za strategije praćenja i pomoći u praćenju promjena u ekosustavu.
Kopnene pokrajine obično se klasificiraju prema sličnostima u klimi (oborina i temperatura), tlu, vegetaciji i fauni, a koriste se za pomoćno upravljanje, istraživanje bioraznolikosti i kontrolu bolesti (1, 4).Morske provincije teže je definirati.Većina organizama je mikroskopska, s tekućim granicama.Longhurst i sur.(5) Osigurao jednu od prvih globalnih klasifikacija Ministarstva oceanografije na temelju uvjeta okoliša.Definicija ovih “Longhurst” provincija uključuje varijable kao što su stopa miješanja, stratifikacija i zračenje, kao i Longhurstovo veliko iskustvo kao morskog oceanografa, koji ima druge važne uvjete za morske ekosustave.Longhurst se intenzivno koristio, na primjer, za procjenu primarne proizvodnje i tokova ugljika, pomoć u ribarstvu i planiranje aktivnosti promatranja na licu mjesta (5-9).Kako bi se pokrajine definirale objektivnije, korištene su metode poput neizrazite logike i regionalne nenadzirane klasterizacije/statistike (9-14).Svrha takvih metoda je identificirati smislene strukture koje mogu identificirati pokrajine u dostupnim podacima promatranja.Na primjer, dinamične morske provincije (12) koriste karte koje se same organiziraju kako bi smanjile šum i koriste hijerarhijsko grupiranje (na temelju stabla) za određivanje proizvoda boja mora izvedenih iz regionalnih satelita [klorofil a (Chl-a), normalizirana visina linije fluorescencije i obojena otopljena organska tvar] i fizičko polje (temperatura i salinitet površine mora, apsolutna dinamička topografija i morski led).
Struktura zajednice planktona je zabrinjavajuća jer njegova ekologija ima velik utjecaj na više razine hranjivih tvari, apsorpciju ugljika i klimu.Unatoč tome, još uvijek je izazovan i nedostižan cilj odrediti globalnu ekološku provinciju na temelju strukture planktonske zajednice.Morski sateliti u boji potencijalno mogu pružiti uvid u grubu klasifikaciju fitoplanktona ili sugerirati prednosti funkcionalnih skupina (15), ali trenutno ne mogu pružiti detaljne informacije o strukturi zajednice.Nedavna istraživanja [npr. Tara Ocean (16)] pružaju mjerenja strukture zajednice bez presedana;trenutno postoje samo rijetka promatranja na licu mjesta na globalnoj razini (17).Prethodne studije su uvelike odredile "Biogeokemijsku provinciju" (12, 14, 18) na temelju utvrđivanja biokemijskih sličnosti (kao što je primarna proizvodnja, Chl i dostupno svjetlo).Ovdje se numerički model koristi za izlaz [Darwin(2)], a ekološka pokrajina određena je prema strukturi zajednice i protoku hranjivih tvari.Numerički model korišten u ovoj studiji ima globalnu pokrivenost i može se usporediti s postojećim terenskim podacima (17) i poljima daljinskog istraživanja (Napomena S1).Numerički model podataka korišten u ovoj studiji ima prednost globalne pokrivenosti.Modelni ekosustav sastoji se od 35 vrsta fitoplanktona i 16 vrsta zooplanktona (pogledajte materijale i metode).Modelni tipovi planktona nelinearno djeluju na strukture ne-Gaussove kovarijance, tako da jednostavne dijagnostičke metode nisu prikladne za identificiranje jedinstvenih i dosljednih obrazaca u novonastalim strukturama zajednice.SAGE metoda koja je ovdje predstavljena pruža nov način provjere rezultata složenih Darwinovih modela.
Snažne transformativne sposobnosti podatkovne znanosti/tehnologije ML mogu omogućiti nevjerojatno složena rješenja modela za otkrivanje složenih, ali robusnih struktura u kovarijanci podataka.Robusna metoda je definirana kao metoda koja može vjerno reproducirati rezultate unutar zadanog raspona pogreške.Čak iu jednostavnim sustavima, određivanje robusnih uzoraka i signala može biti izazov.Sve dok se ne utvrdi obrazloženje koje vodi do promatranog obrasca, složenost koja se pojavljuje može se činiti kompliciranom/teškom za rješavanje.Ključni proces postavljanja sastava ekosustava je nelinearne prirode.Postojanje nelinearnih interakcija može zbuniti robusnu klasifikaciju, stoga je potrebno izbjegavati metode koje donose snažne pretpostavke o osnovnoj statističkoj distribuciji kovarijance podataka.Visokodimenzionalni i nelinearni podaci uobičajeni su u oceanografiji i mogu imati strukturu kovarijance sa složenom, ne-Gaussovom topologijom.Iako podaci s strukturom ne-Gaussove kovarijance mogu spriječiti robusnu klasifikaciju, SAGE metoda je nova jer je dizajnirana za identificiranje klastera s proizvoljnom topologijom.
Cilj SAGE metode je objektivno identificirati nove obrasce koji mogu pomoći daljnjem ekološkom razumijevanju.Slijedeći tijek rada koji se temelji na klasterima sličan (19), ekološke varijable i varijable protoka hranjivih tvari koriste se za određivanje jedinog klastera u podacima, koji se naziva ekološka provincija.Metoda SAGE predložena u ovoj studiji (Slika 1) najprije smanjuje dimenzionalnost s 55 na 11 dimenzija zbrajanjem unaprijed definiranih funkcionalnih skupina planktona (vidi Materijali i metode).Korištenjem metode t-slučajnog ugrađivanja susjeda (t-SNE), veličina se dodatno smanjuje projiciranjem vjerojatnosti u 3D prostor.Nenadzirano klasteriranje može identificirati ekološki bliska područja [prostorno klasteriranje temeljeno na gustoći (DBSCAN) za aplikacije temeljene na buci].I t-SNE i DBSCAN primjenjivi su na inherentne podatke numeričkog modela nelinearnog ekosustava.Zatim ponovno projicirajte rezultirajuću ekološku pokrajinu na Zemlju.Identificirano je više od sto jedinstvenih ekoloških pokrajina pogodnih za regionalna istraživanja.Kako bi se razmotrio globalno konzistentan model ekosustava, koristi se SAGE metoda za agregiranje ekoloških provincija u agregirane ekološke provincije (AEP) kako bi se poboljšala učinkovitost ekoloških provincija.Razina agregacije (koja se naziva "složenost") može se prilagoditi potrebnoj razini detalja.Odredite minimalnu složenost robusnog AEP-a.Fokus odabira je SAGE metoda i istraživanje najmanjih složenih AEP slučajeva kako bi se odredila kontrola strukture hitne zajednice.Uzorci se potom mogu analizirati kako bi se dobio ekološki uvid.Ovdje predstavljena metoda također se može koristiti za opsežniju usporedbu modela, na primjer, procjenom lokacija sličnih ekoloških pokrajina pronađenih u različitim modelima kako bi se istaknule razlike i sličnosti i usporedili modeli.
(A) Shematski dijagram tijeka rada za određivanje ekološke pokrajine;korištenje zbroja u funkcionalnoj skupini za smanjenje izvornih 55-dimenzionalnih podataka na 11-dimenzionalni izlaz modela, uključujući biomasu sedam funkcionalnih/hranjivih planktona i četiri stope opskrbe hranjivim tvarima.Zanemariva vrijednost i trajno područje ledenog pokrova.Podaci su standardizirani i standardizirani.Pružite 11-dimenzionalne podatke t-SNE algoritmu za isticanje statistički sličnih kombinacija značajki.DBSCAN će pažljivo odabrati klaster za postavljanje vrijednosti parametra.Na kraju projicirajte podatke natrag u projekciju zemljopisne širine/dužine.Imajte na umu da se ovaj postupak ponavlja 10 puta jer se primjenom t-SNE može generirati mala slučajnost.(B) objašnjava kako dobiti AEP ponavljanjem tijeka rada u (A) 10 puta.Za svaku od ovih 10 implementacija, međuprovincijska Bray-Curtis (BC) matrica različitosti određena je na temelju biomase 51 tipa fitoplanktona.Odredite razliku BC između pokrajina, od složenosti 1 AEP do pune složenosti 115. Referentnu vrijednost BC postavlja provincija Longhurst.
SAGE metoda koristi izlaz globalnog 3D fizičkog/ekosustavnog numeričkog modela za definiranje ekološke pokrajine [Darwin (2);vidi Materijali i metode i bilješku S1].Komponente ekosustava sastoje se od 35 vrsta fitoplanktona i 16 vrsta zooplanktona, sa sedam unaprijed definiranih funkcionalnih skupina: prokarioti i eukarioti prilagođeni okolišima s malo hranjivih tvari, kokcidije s prevlakom od kalcijevog karbonata i teška fiksacija dušika Dušikove hranjive tvari (obično nedostaju) važne hranjive tvari), sa silikatnim pokrovom, mogu pokrenuti fotosintezu drugog planktona i ispašu bičača s miješanim hranjivim tvarima i pastire zooplanktona.Raspon veličina je 0,6 do 2500 μm ekvivalentnog sfernog promjera.Model distribucije veličine fitoplanktona i funkcionalnog grupiranja obuhvaća sveukupne karakteristike uočene satelitskim promatranjima i promatranjima na licu mjesta (vidi slike S1 do S3).Sličnost između numeričkog modela i promatranog oceana ukazuje na to da se provincije definirane modelom mogu primijeniti na ocean in situ.Imajte na umu da ovaj model bilježi samo određenu raznolikost fitoplanktona i samo određene fizičke i kemijske raspone utjecaja in situ oceana.SAGE metoda može omogućiti ljudima da bolje razumiju visoko regionalni kontrolni mehanizam model strukture zajednice.
Uključivanjem samo zbroja površinske biomase (s prosječnim vremenom od 20 godina) u svaku funkcionalnu skupinu planktona, može se smanjiti dimenzionalnost podataka.Nakon što su ranije studije pokazale njihovu ključnu ulogu u postavljanju strukture zajednice, uključile su i termine površinskih izvora za tokove hranjivih tvari (opskrba dušikom, željezom, fosfatom i silicijskom kiselinom) [npr. (20, 21)].Zbrajanjem funkcionalnih skupina problem se smanjuje s 55 (51 plankton i 4 toka hranjivih tvari) na 11 dimenzija.U ovoj početnoj studiji, zbog računskih ograničenja nametnutih algoritmom, dubina i vremenska varijabilnost nisu uzete u obzir.
Metoda SAGE može identificirati važne odnose između nelinearnih procesa i ključnih značajki interakcija između biomase funkcionalne skupine i toka hranjivih tvari.Upotrebom 11-dimenzionalnih podataka temeljenih na euklidskim metodama učenja na daljinu (kao što su K-srednje vrijednosti) ne mogu se dobiti pouzdane i ponovljive pokrajine (19, 22).To je zato što se u osnovnoj distribuciji kovarijance ključnih elemenata koji definiraju ekološku pokrajinu ne nalazi Gaussov oblik.K-srednje vrijednosti Voronoijevih ćelija (ravne linije) ne mogu zadržati ne-Gaussovu osnovnu distribuciju.
Biomasa sedam funkcionalnih skupina planktona i četiri toka hranjivih tvari čine 11-dimenzionalni vektor x.Stoga je x vektorsko polje na rešetki modela, gdje svaki element xi predstavlja 11-dimenzionalni vektor definiran na horizontalnoj mreži modela.Svaki indeks i jedinstveno identificira točku mreže na sferi, gdje je (dužina, lat) = (ϕi, θi).Ako je biomasa mrežne jedinice modela manja od 1,2×10-3mg Chl/m3 ili stopa pokrivenosti ledom prelazi 70%, koristi se zapis podataka o biomasi i odbacuje.Podaci su normalizirani i standardizirani, tako da su svi podaci u rasponu od [0 do 1], srednja vrijednost je uklonjena i skalirana na jediničnu varijancu.To se radi tako da značajke (biomasa i tok hranjivih tvari) nisu ograničene kontrastom u rasponu mogućih vrijednosti.Grupiranje bi trebalo uhvatiti odnos promjene iz ključne vjerojatnosti udaljenosti između značajki, a ne geografske udaljenosti.Kvantificiranjem tih udaljenosti pojavljuju se važne značajke, dok se nepotrebni detalji odbacuju.S ekološkog gledišta, to je neophodno jer neke vrste fitoplanktona s malom biomasom mogu imati veće biogeokemijske učinke, kao što je fiksacija dušika pomoću diazotrofnih bakterija.Prilikom standardizacije i normalizacije podataka, ove će vrste kovarijabli biti istaknute.
Naglašavanjem blizine značajki u visokodimenzionalnom prostoru u niskodimenzionalnom prikazu, t-SNE algoritam se koristi kako bi postojeće slične regije bile jasnije.Prethodni rad usmjeren na izgradnju dubokih neuronskih mreža za aplikacije daljinskog očitavanja koristio je t-SNE, koji je dokazao svoju vještinu u odvajanju ključnih značajki (23).Ovo je nužan korak za identificiranje robusnog grupiranja u podacima značajki uz izbjegavanje nekonvergentnih rješenja (napomena S2).Koristeći Gaussove jezgre, t-SNE čuva statistička svojstva podataka preslikavanjem svakog visokodimenzionalnog objekta u točku u 3D faznom prostoru, čime se osigurava da je vjerojatnost sličnih objekata u visokom i niskom smjeru visoka u visokom dimenzionalni prostor (24).S obzirom na skup od N visokodimenzionalnih objekata x1,…,xN, t-SNE algoritam smanjuje minimiziranjem Kullback-Leiblerove (KL) divergencije (25).KL divergencija je mjera koliko se distribucija vjerojatnosti razlikuje od druge referentne distribucije vjerojatnosti i može učinkovito procijeniti mogućnost korelacije između niskodimenzionalnih prikaza visokodimenzionalnih značajki.Ako je xi i-ti objekt u N-dimenzionalnom prostoru, xj je j-ti objekt u N-dimenzionalnom prostoru, yi je i-ti objekt u niskodimenzionalnom prostoru, a yj je j-ti objekt u niskom -dimenzionalni prostor, tada t -SNE definira vjerojatnost sličnosti ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), a za skup smanjenja dimenzionalnosti q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Slika 2A ilustrira učinak smanjenja biomase i vektora protoka hranjivih tvari 11-dimenzionalne kombinacije u 3D.Motivacija primjene t-SNE može se usporediti s motivacijom analize glavnih komponenti (PCA), koja koristi atribut varijance za naglašavanje područja/atributa podataka, čime se smanjuje dimenzionalnost.Utvrđeno je da je metoda t-SNE bolja od PCA u pružanju pouzdanih i ponovljivih rezultata za Ministarstvo okoliša (vidi bilješku S2).To može biti zato što pretpostavka o ortogonalnosti PCA nije prikladna za identificiranje kritičnih interakcija između visoko nelinearnih interaktivnih značajki, jer se PCA fokusira na linearne kovarijancijske strukture (26).Koristeći podatke daljinskog istraživanja, Lunga et al.(27) ilustrira kako koristiti SNE metodu za isticanje složenih i nelinearnih spektralnih značajki koje odstupaju od Gaussove distribucije.
(A) Modelirana stopa opskrbe hranjivim tvarima, biomasa funkcionalne skupine fitoplanktona i zooplanktona nacrtana t-SNE algoritmom i obojana po pokrajinama pomoću DBSCAN-a.Svaka točka predstavlja točku u visokodimenzionalnom prostoru, kao što je prikazano na slici 6B, većina točaka je uhvaćena.Osovine se odnose na "t-SNE" veličine 1, 2 i 3. (B) Geografska projekcija provincije koju je pronašao DBSCAN na mreži zemljopisne širine i dužine ishodišta.Boju treba smatrati bilo kojom bojom, ali treba odgovarati (A).
Točke na t-SNE dijagramu raspršenosti na slici 2A pridružene su geografskoj širini i dužini.Ako su dvije točke na slici 2A blizu jedna drugoj, to je zato što su njihova biomasa i tokovi hranjivih tvari slični, a ne zbog geografske blizine.Boje na slici 2A su klasteri otkriveni metodom DBSCAN (28).Kada se traže gusta promatranja, DBSCAN algoritam koristi udaljenost u 3D prikazu između točaka (ϵ = 0,39; za informacije o ovom izboru, pogledajte Materijali i metode), a broj sličnih točaka potreban je za definiranje klastera (ovdje 100 bodova, pogledajte gore).Metoda DBSCAN ne donosi nikakve pretpostavke o obliku ili broju klastera u podacima, kao što je prikazano u nastavku:
3) Za sve točke za koje je utvrđeno da su unutar udaljenosti, ponovite korak 2 iterativno da odredite granicu klastera.Ako je broj bodova veći od zadane minimalne vrijednosti, označava se kao klaster.
Podaci koji ne zadovoljavaju metriku minimalnog člana klastera i udaljenosti ϵ smatraju se "šumom" i ne dodjeljuje im se boja.DBSCAN je brz i skalabilan algoritam s O(n2) performansama u najgorem slučaju.Za trenutnu analizu, to zapravo nije slučajno.Minimalan broj bodova utvrđuje se stručnom ocjenom.Nakon podešavanja udaljenosti, rezultat nije dovoljno stabilan u rasponu od ≈±10.Ova je udaljenost postavljena pomoću povezanosti (Slika 6A) i postotka pokrivenosti oceana (Slika 6B).Povezivost se definira kao kompozitni broj klastera i osjetljiva je na parametar ϵ.Niža povezanost ukazuje na nedovoljno uklapanje, umjetno grupiranje regija zajedno.Visoka povezanost ukazuje na pretjerano opremanje.Zamislivo je koristiti veći minimum, ali ako minimum prelazi ca, nemoguće je postići pouzdano rješenje.135 (za više detalja, pogledajte Materijali i metode).
115 klastera identificiranih na slici 2A projicirano je natrag na Zemlju na slici 2B.Svaka boja odgovara koherentnoj kombinaciji biogeokemijskih i ekoloških čimbenika koje je identificirao DBSCAN.Nakon što su klasteri određeni, povezivanje svake točke na slici 2A s određenom zemljopisnom širinom i dužinom koristi se za projekciju klastera natrag na geografsko područje.Slika 2B to ilustrira s istim bojama klastera kao Slika 2A.Slične boje ne treba tumačiti kao ekološku sličnost, jer se dodjeljuju prema redoslijedu kojim su klasteri otkriveni od strane algoritma.
Područje na slici 2B može biti kvalitativno slično utvrđenom području u fizičkoj i/ili biogeokemiji oceana.Na primjer, klasteri u Južnom oceanu su zonski simetrični, pojavljuju se oligotrofni vrtlozi, a oštar prijelaz ukazuje na utjecaj pasata.Na primjer, u ekvatorijalnom dijelu Tihog oceana vide se različite regije povezane s usponom.
Kako bi se razumjelo ekološko okruženje Eko-provincije, varijacija Bray-Curtisovog (BC) indeksa razlike (29) korištena je za procjenu ekologije u klasteru.Pokazatelj BC je statistički podatak koji se koristi za kvantificiranje razlike u strukturi zajednice između dva različita mjesta.Mjerenje BC je primjenjivo na biomasu 51 vrste fitoplanktona i zooplanktona BCninj = 1-2CninjSni + Snj
BCninj se odnosi na sličnost između kombinacije ni i kombinacije nj, gdje je Cninj minimalna vrijednost jedne vrste biomase koja postoji u obje kombinacije ni i nj, a Sni predstavlja zbroj svih biomasa koje postoje u obje kombinacije ni i Snj.Razlika BC slična je mjeri udaljenosti, ali djeluje u neeuklidskom prostoru, koji će vjerojatno biti prikladniji za ekološke podatke i njihovu interpretaciju.
Za svaki klaster identificiran na slici 2B može se procijeniti sličnost unutarprovincijskog i međuprovincijskog BC-a.Razlika BC unutar pokrajine odnosi se na razliku između prosječne vrijednosti pokrajine i svake točke u pokrajini.Razlika između provincija prije Krista odnosi se na sličnost između jedne provincije i drugih provincija.Slika 3A prikazuje simetričnu BC matricu (0, crno: potpuno odgovara; 1, bijelo: potpuno različito).Svaki redak u grafikonu prikazuje uzorak u podacima.Slika 3B prikazuje zemljopisni značaj rezultata BC na slici 3A za svaku pokrajinu.Za pokrajinu u području s niskim udjelom nutrijenata i hranjivim tvarima, slika 3B pokazuje da je simetrija velikih područja oko ekvatora i Indijskog oceana u osnovi slična, ali su više geografske širine i područja uzlazne struje značajno različiti.
(A) Stupanj razlike BC procijenjen za svaku pokrajinu na temelju globalnog 20-godišnjeg prosjeka globalne površine od 51 planktona.Obratite pažnju na očekivanu simetriju vrijednosti.(B) Prostorna projekcija stupca (ili retka).Za provinciju u distrofičnom krugu procijenjena je globalna distribucija mjere sličnosti BC-a, te je procijenjen globalni 20-godišnji prosjek.Crna (BC = 0) znači isto područje, a bijela (BC = 1) znači da nema sličnosti.
Slika 4A ilustrira razliku u BC unutar svake pokrajine na slici 2B.Određeno korištenjem prosječne kombinacije prosječnog područja u klasteru i određivanjem razlike između BC i srednje vrijednosti svake točke mreže u pokrajini, pokazuje da metoda SAGE može dobro razdvojiti 51 vrstu na temelju ekološke sličnosti Tip podaci o modelu.Ukupna prosječna razlika BC klastera svih 51 tipa je 0,102±0,0049.
(A, B i D) Razlika BC unutar pokrajine procjenjuje se kao prosječna razlika BC između svake zajednice točaka mreže i prosječne provincije, a složenost se ne smanjuje.(2) Globalna prosječna razlika BC unutar pokrajine je 0,227±0,117.Ovo je mjerilo klasifikacije temeljene na ekološkoj motivaciji koju predlaže ovaj rad [zelena crta u (C)].(C) Prosječna razlika BC unutar pokrajine: Crna linija predstavlja razliku BC unutar pokrajine s rastućom složenošću.2σ dolazi iz 10 ponavljanja procesa identifikacije eko-provincije.Za ukupnu složenost provincija koje je otkrio DBSCAN, (A) pokazuje da je BC različitost u provinciji 0,099, a klasifikacija složenosti koju predlaže (C) je 12, što rezultira BC različitošću od 0,200 u provinciji.kao što slika pokazuje.(D).
Na slici 4B, biomasa 51 vrste planktona koristi se za predstavljanje ekvivalentne razlike BC u pokrajini Longhurst.Ukupni prosjek svake pokrajine je 0,227, a standardna devijacija točaka mreže u odnosu na razliku u provinciji BC je 0,046.Ovo je veće od klastera identificiranog na slici 1B.Umjesto toga, korištenjem zbroja sedam funkcionalnih skupina, prosječna razlika BC-a unutar sezone u Longhurstu porasla je na 0,232.
Globalna karta eko-provincije pruža zamršene detalje jedinstvenih ekoloških interakcija i poboljšanja su napravljena u korištenju cjelokupne strukture ekosustava pokrajine Longhurst.Od Ministarstva ekologije očekuje se uvid u proces upravljanja numeričkim modelom ekosustava, a taj će uvid pomoći u istraživanju terenskog rada.Za potrebe ovog istraživanja nije moguće cjelovito prikazati više od stotinu pokrajina.Sljedeći odjeljak predstavlja SAGE metodu koja sažima pokrajine.
Jedna od svrha provincije je promicanje razumijevanja položaja i upravljanja provincijom.Za određivanje hitnih situacija, metoda na slici 1B ilustrira gniježđenje ekološki sličnih provincija.Ekoprovincije su grupirane zajedno na temelju ekološke sličnosti, a takvo grupiranje provincija naziva se AEP.Postavite podesivu "složenost" na temelju ukupnog broja pokrajina koje treba uzeti u obzir.Izraz "složenost" koristi se jer omogućuje prilagodbu razine atributa hitnosti.Kako bi se definirale smislene agregacije, kao referentna vrijednost koristi se prosječna unutarprovincijska razlika BC od 0,227 iz Longhursta.Ispod ove referentne vrijednosti, kombinirane pokrajine više se ne smatraju korisnima.
Kao što je prikazano na slici 3B, globalne ekološke pokrajine su koherentne.Koristeći međuprovincijske razlike prije Krista, može se vidjeti da su neke konfiguracije vrlo "uobičajene".Nadahnuti genetikom i metodama teorije grafova, "povezani grafovi" koriste se za sortiranje >100 provincija na temelju provincija koje su im najsličnije.Metrika "povezanosti" ovdje je određena korištenjem međuprovincijskih razlika prije Krista (30).Broj pokrajina s većim prostorom za klasifikaciju od > 100 pokrajina ovdje se može nazvati složenošću.AEP je proizvod koji kategorizira više od 100 pokrajina kao ekološki najdominantnije/najbliže pokrajine.Svaka ekološka pokrajina dodijeljena je dominantnoj/visoko povezanoj ekološkoj pokrajini koja im je najsličnija.Ova agregacija određena razlikom BC omogućuje ugniježđeni pristup globalnoj ekologiji.
Odabrana složenost može biti bilo koja vrijednost od 1 do potpune složenosti na SL.2A.Pri nižoj složenosti, AEP može degenerirati zbog vjerojatnosnog koraka smanjenja dimenzionalnosti (t-SNE).Degeneracija znači da se ekološke pokrajine mogu dodijeliti različitim AEP-ovima između iteracija, čime se mijenja pokriveno zemljopisno područje.Slika 4C ilustrira širenje razlika u BC-u unutar pokrajina u AEP-ovima sve veće složenosti u 10 implementacija (ilustracija na slici 1B).Na slici 4C, 2σ (plavo područje) je mjera degradacije u 10 implementacija, a zelena linija predstavlja Longhurstovo mjerilo.Činjenice su dokazale da složenost od 12 može zadržati BC razliku u pokrajini ispod referentne vrijednosti Longhursta u svim implementacijama i održati relativno malu degradaciju od 2σ.Ukratko, minimalna preporučena složenost je 12 AEP-ova, a prosječna razlika BC-a unutar provincije procijenjena korištenjem 51 tipa planktona je 0,198±0,013, kao što je prikazano na slici 4D.Korištenjem zbroja sedam funkcionalnih skupina planktona, prosječna razlika BC unutar pokrajine je 2σ umjesto 0,198±0,004.Usporedba razlika BC izračunatih s ukupnom biomasom sedam funkcionalnih skupina ili biomasom svih 51 tipova planktona pokazuje da iako je SAGE metoda primjenjiva na 51-dimenzionalnu situaciju, za ukupnu biomasu sedam funkcionalnih skupina Za trening.
Ovisno o svrsi svakog istraživanja, mogu se razmotriti različite razine složenosti.Regionalne studije mogu zahtijevati punu složenost (tj. svih 115 pokrajina).Kao primjer i radi jasnoće, razmotrite minimalnu preporučenu složenost od 12.
Kao primjer korisnosti SAGE metode, 12 AEP-ova s ​​minimalnom složenošću od 12 ovdje se koristi za istraživanje kontrole strukture hitne zajednice.Slika 5 ilustrira ekološke uvide grupirane prema AEP-u (od A do L): U stehiometriji Redfielda, zemljopisni opseg (Slika 5C), sastav biomase funkcionalne skupine (Slika 5A) i opskrbu hranjivim tvarima (Slika 5B) izvodi N Zoomed.Prikazan je omjer (N:Si:P:Fe, 1:1:16:16×103).Za potonju ploču, P pomnožen s 16 i Fe pomnožen s 16×103, tako da je stupčasti grafikon ekvivalentan prehrambenim potrebama fitoplanktona.
Provincije su razvrstane u 12 AEP-ova od A do L. (A) Biomasa (mgC/m3) ekosustava u 12 provincija.(B) Brzina protoka hranjivih tvari otopljenog anorganskog dušika (N), željeza (Fe), fosfata (P) i silicijeve kiseline (Si) (mmol/m3 godišnje).Fe i P se množe s 16, odnosno 16×103, tako da su trake standardizirane prema zahtjevima stehiometrije fitoplanktona.(C) Uočite razliku između polarnih regija, suptropskih ciklona i glavnih sezonskih/povećanih regija.Stanice za praćenje su označene kako slijedi: 1, SJEDALA;2, ALOHA;3, postaja P;i 4, ŠIŠIŠI.
Identificirani AEP je jedinstven.Postoji određena simetrija oko ekvatora u Atlantskom i Tihom oceanu, a slično, ali prošireno područje postoji u Indijskom oceanu.Neki AEP-ovi obuhvaćaju zapadnu stranu kontinenta povezanu s usponom.Cirkumpolarna struja Južnog pola smatra se velikom zonskom značajkom.Suptropski ciklon je kompleksan niz oligotrofnih AEP.U tim je pokrajinama očit poznati obrazac razlika u biomasi između oligotrofnih vrtloga kojima dominira plankton i polarnih regija bogatih dijatomejom.
AEP-ovi s vrlo sličnom ukupnom biomasom fitoplanktona mogu imati vrlo različite strukture zajednice i pokrivati ​​različita geografska područja, kao što su D, H i K, koja imaju sličnu ukupnu biomasu fitoplanktona.AEP H uglavnom postoji u ekvatorijalnom Indijskom oceanu, a ima više diazotrofnih bakterija.AEP D nalazi se u nekoliko bazena, ali je posebno istaknut u Pacifiku oko područja s visokim prinosom oko ekvatorijalnog uzdizanja.Oblik ove pacifičke pokrajine podsjeća na planetarni vlak valova.U AEP D ima malo diazobakterija, a više češera.U usporedbi s druge dvije provincije, AEP K se nalazi samo u visoravni Arktičkog oceana, i ima više dijatomeja, a manje planktona.Vrijedno je napomenuti da je količina planktona u ove tri regije također vrlo različita.Među njima, broj planktona AEP K je relativno nizak, dok je AEP D i H relativno visok.Stoga, usprkos njihovoj biomasi (i stoga sličnoj Chl-a), ove su pokrajine prilično različite: testiranje pokrajina temeljeno na Chl-u možda neće uhvatiti te razlike.
Također je očito da neki AEP-ovi s vrlo različitom biomasom mogu biti slični u smislu strukture zajednice fitoplanktona.Na primjer, to je vidljivo u AEP D i E. Oni su blizu jedan drugome, au Tihom oceanu, AEP E je blizu visokoproduktivnog AEPJ.Slično tome, ne postoji jasna veza između biomase fitoplanktona i brojnosti zooplanktona.
AEP se može razumjeti u smislu hranjivih tvari koje im se daju (Slika 5B).Dijatomeje postoje samo tamo gdje ima dovoljno silicijske kiseline.Općenito, što je veća opskrba silicijevom kiselinom, to je veća biomasa dijatomeja.Dijatomeje se mogu vidjeti u AEP A, J, K i L. Omjer biomase dijatomeja u odnosu na drugi fitoplankton određen je N, P i Fe koji se dobivaju u odnosu na potražnju dijatomeja.Na primjer, u AEP L dominiraju dijatomeje.U usporedbi s drugim hranjivim tvarima, Si ima najveću zalihu.Nasuprot tome, unatoč većoj produktivnosti, AEP J ima manje dijatomeja i manje zaliha silicija (sve u odnosu na druge hranjive tvari).
Diazonijeve bakterije imaju sposobnost fiksacije dušika, ali sporo rastu (31).Oni koegzistiraju s drugim fitoplanktonom, gdje su željezo i fosfor prekomjerni u odnosu na potražnju za nediazonijskim hranjivim tvarima (20, 21).Vrijedno je napomenuti da je diazotrofna biomasa relativno visoka, a zaliha Fe i P relativno velika u odnosu na zalihu N. Na taj način, iako je ukupna biomasa u AEP J veća, biomasa diazonija u AEP H je veći od onog u J. Imajte na umu da su AEP J i H geografski vrlo različiti, a H se nalazi u ekvatorijalnom Indijskom oceanu.
Ako jedinstvena struktura ekosustava nije podijeljena u pokrajine, uvidi dobiveni iz 12 modela najniže složenosti AEP-a neće biti tako jasni.AEP koji generira SAGE olakšava koherentnu i simultanu usporedbu složenih i visokodimenzionalnih informacija iz modela ekosustava.AEP učinkovito naglašava zašto Chl nije dobra i alternativna metoda za određivanje strukture zajednice ili obilja zooplanktona na višim razinama hranjivih tvari.Detaljna analiza tema istraživanja koja su u tijeku izvan je opsega ovog članka.SAGE metoda pruža način za istraživanje drugih mehanizama u modelu koji je lakši za rukovanje od pogleda od točke do točke.
SAGE metoda je predložena kao pomoć u razjašnjavanju izuzetno složenih ekoloških podataka iz globalnih numeričkih modela fizičkih/biogeokemijskih/ekosustava.Ekološka pokrajina određena je ukupnom biomasom međuplanktonskih funkcionalnih skupina, primjenom algoritma za redukciju dimenzionalnosti vjerojatnosti t-SNE i klasteriranjem pomoću nenadzirane ML metode DBSCAN.Međuprovincijska BC razlika/teorija grafova za metodu gniježđenja primjenjuje se za izvođenje robusnog AEP-a koji se može koristiti za globalno tumačenje.U građevinskom smislu, Eko-provincija i AEP su jedinstveni.Gniježđenje AEP-a može se prilagoditi između pune složenosti izvorne ekološke pokrajine i preporučenog minimalnog praga od 12 AEP-ova.Ugniježđivanje i određivanje minimalne složenosti AEP-a smatraju se ključnim koracima, jer vjerojatnost t-SNE degenerira AEP-ove <12 složenosti.SAGE metoda je globalna, a njezina složenost se kreće od> 100 AEP-ova do 12. Radi jednostavnosti, trenutni fokus je na složenosti 12 globalnih AEP-ova.Buduća istraživanja, posebice regionalne studije, mogu smatrati korisnim manji prostorni podskup globalnih eko-provincija i mogu se agregirati na manjem području kako bi se iskoristile prednosti istih ekoloških uvida o kojima se ovdje govori.Pruža prijedloge o tome kako se ove ekološke pokrajine i uvidi dobiveni iz njih mogu koristiti za daljnje ekološko razumijevanje, olakšati usporedbu modela i potencijalno poboljšati praćenje morskih ekosustava.
Ekološka pokrajina i AEP identificirani metodom SAGE temelje se na podacima u numeričkom modelu.Po definiciji, numerički model je pojednostavljena struktura koja pokušava uhvatiti bit ciljnog sustava, a različiti modeli će imati različitu distribuciju planktona.Numerički model korišten u ovoj studiji ne može u potpunosti obuhvatiti neke od promatranih obrazaca (na primjer, u procjenama Chl za ekvatorijalno područje i Južni ocean).Uhvaćen je samo mali dio raznolikosti u stvarnom oceanu, a mezo i sub-mezoskale se ne mogu razlučiti, što može utjecati na tok hranjivih tvari i strukturu zajednice manjih razmjera.Unatoč tim nedostacima, ispada da je AEP vrlo koristan u razumijevanju složenih modela.Procjenom gdje se nalaze slične ekološke pokrajine, AEP pruža potencijalni alat za usporedbu numeričkih modela.Trenutačni numerički model bilježi ukupni obrazac koncentracije Chl-a fitoplanktona daljinskim očitavanjem i distribuciju veličine i funkcionalne skupine planktona (Napomena S1 i Slika S1) (2, 32).
Kao što je prikazano konturnom linijom od 0,1 mgChl-a/m-3, AEP je podijeljen na oligotrofno područje i mezotrofno područje (Slika S1B): AEP B, C, D, E, F i G su oligotrofna područja, a preostala područja su nalazi se Viši Chl-a.AEP pokazuje neku korespondenciju s provincijom Longhurst (slika S3A), na primjer, Južni ocean i ekvatorijalni Pacifik.U nekim regijama AEP pokriva više regija Longhursta i obrnuto.Budući da je namjera razgraničenja pokrajina na ovom području iu Longhurstu različita, za očekivati ​​je da će biti razlika.Višestruki AEP-ovi u pokrajini Longhurst pokazuju da određena područja sa sličnom biogeokemijom mogu imati vrlo različite strukture ekosustava.AEP pokazuje određenu korespondenciju s fizičkim stanjima, što je otkriveno korištenjem nenadziranog učenja (19), kao što su stanja visokog uzdizanja (na primjer, Južni ocean i ekvatorijalni Pacifik; slika S3, C i D).Ove korespondencije pokazuju da je struktura zajednice planktona pod jakim utjecajem dinamike oceana.U područjima kao što je Sjeverni Atlantik, AEP prolazi fizičkim provincijama.Mehanizam koji uzrokuje te razlike može uključivati ​​procese poput prijenosa prašine, koji mogu dovesti do potpuno različitih prehrambenih programa čak i pod sličnim fizičkim uvjetima.
Ministarstvo ekologije i AEP istaknuli su da samo korištenje Chl ne može identificirati ekološke komponente, što je zajednica morskih ekologa već shvatila.To se vidi kod AEP-ova sa sličnom biomasom, ali znatno drugačijim ekološkim sastavom (kao što su D i E).Nasuprot tome, AEP kao što su D i K imaju vrlo različitu biomasu, ali sličan ekološki sastav.AEP naglašava da je odnos između biomase, ekološkog sastava i obilja zooplanktona složen.Na primjer, iako se AEP J ističe u pogledu fitoplanktona i biomase planktona, AEP-ovi A i L imaju sličnu biomasu planktona, ali A ima veću zastupljenost planktona.AEP naglašava da se biomasa fitoplanktona (ili Chl) ne može koristiti za predviđanje biomase zooplanktona.Zooplankton je temelj prehrambenog lanca ribarstva, a točnije procjene mogu dovesti do boljeg upravljanja resursima.Budući morski sateliti u boji [na primjer, PACE (plankton, aerosol, oblak i morski ekosustav)] mogli bi biti bolje pozicionirani da pomognu u procjeni strukture zajednice fitoplanktona.Korištenje AEP predviđanja može potencijalno olakšati procjenu zooplanktona iz svemira.Metode poput SAGE-a, u kombinaciji s novim tehnologijama i sve više i više podataka s terena dostupnih za ispitivanje istine na zemlji (kao što je Tara i naknadno istraživanje), mogu zajedno učiniti korak prema satelitskom praćenju zdravlja ekosustava.
SAGE metoda pruža prikladan način za procjenu nekih mehanizama koji kontroliraju karakteristike pokrajine, kao što su biomasa/Chl, neto primarna proizvodnja i struktura zajednice.Na primjer, relativna količina dijatomeja određena je neravnotežom u opskrbi Si, N, P i Fe u odnosu na stehiometrijske potrebe fitoplanktona.Uz uravnoteženu opskrbljenost, zajednicom dominiraju dijatomeje (L).Kada je stopa opskrbe neuravnotežena (tj. opskrba silicijem niža je od potrebe dijatomeja za hranjivim tvarima), dijatomeje čine samo mali dio udjela (K).Kada zaliha Fe i P premaši zalihu N (na primjer, E i H), diazotrofne bakterije će snažno rasti.Kroz kontekst koji pruža AEP, istraživanje kontrolnih mehanizama postat će korisnije.
Eko-provincija i AEP su područja sa sličnim strukturama zajednice.Vremenska serija s određene lokacije unutar ekološke pokrajine ili AEP-a može se smatrati referentnom točkom i može predstavljati područje koje pokriva ekološka pokrajina ili AEP.Dugoročne nadzorne stanice na licu mjesta daju takve vremenske serije.Dugoročni skupovi podataka na licu mjesta i dalje će igrati nesagledivu ulogu.Iz perspektive praćenja strukture zajednice, SAGE metoda može se promatrati kao način da se pomogne u određivanju najkorisnije lokacije novih mjesta.Na primjer, vremenski niz iz dugoročne procjene oligotrofnog staništa (ALOHA) nalazi se u AEP B oligotrofnog područja (Slika 5C, oznaka 2).Budući da je ALOHA blizu granice drugog AEP-a, vremenski niz možda neće biti reprezentativan za cijelo područje, kao što je prethodno predloženo (33).U istom AEP-u B, vremenska serija SEATS (jugoistočna azijska vremenska serija) nalazi se u jugozapadnom Tajvanu (34), dalje od granica drugih AEP-ova (Slika 5C, oznaka 1), i može se koristiti kao bolja lokacija za praćenje AEPB.Vremenska serija BATS (Bermuda Atlantic Time Series Study) (Slika 5C, oznaka 4) u AEPC-u vrlo je blizu granice između AEP C i F, što ukazuje da praćenje AEP C pomoću vremenske serije BATS može biti izravno problematično.Stanica P u AEP J (slika 5C, oznaka 3) daleko je od granice AEP-a, pa je reprezentativnija.Eco-Province i AEP mogu pomoći u uspostavljanju okvira praćenja prikladnog za procjenu globalnih promjena, jer dopuštenje provincija da procijene gdje uzorkovanje na licu mjesta može pružiti ključne uvide.Metoda SAGE može se dalje razvijati za primjenu na klimatske podatke za procjenu varijabilnosti koja štedi vrijeme.
Uspjeh SAGE metode postiže se pažljivom primjenom metoda znanosti o podacima/ML i znanja specifičnih za domenu.Konkretno, t-SNE se koristi za izvođenje smanjenja dimenzionalnosti, čime se čuva struktura kovarijancije visokodimenzionalnih podataka i olakšava vizualizacija topologije kovarijancije.Podaci su raspoređeni u obliku pruga i kovarijanci (Slika 2A), što ukazuje na to da mjere isključivo temeljene na udaljenosti (kao što su K-srednje vrijednosti) nisu prikladne jer obično koriste Gaussovu (kružnu) osnovnu distribuciju (o kojoj se govori u bilješci S2) .Metoda DBSCAN prikladna je za bilo koju topologiju kovarijacije.Sve dok pazite na podešavanje parametara, možete osigurati pouzdanu identifikaciju.Računalni trošak t-SNE algoritma je visok, što ograničava njegovu trenutnu primjenu na veću količinu podataka, što znači da ga je teško primijeniti na duboka ili vremenski promjenjiva polja.Rad na skalabilnosti t-SNE je u tijeku.Budući da je KL udaljenost lako paralelizirati, t-SNE algoritam ima dobar potencijal za proširenje u budućnosti (35).Do sada, druge obećavajuće metode smanjenja dimenzionalnosti koje mogu bolje smanjiti veličinu uključuju tehnike aproksimacije i projekcije jedinstvenog razvodnika (UMAP), ali je neophodna procjena u kontekstu podataka o oceanu.Smisao bolje skalabilnosti je, na primjer, klasificiranje globalnih klima ili modela različite složenosti na mješovitom sloju.Područja koja SAGE ne uspije klasificirati ni u jednoj pokrajini mogu se smatrati preostalim crnim točkama na slici 2A.Zemljopisno gledano, ta su područja uglavnom u izrazito sezonskim područjima, što sugerira da će snimanje ekoloških pokrajina koje se mijenjaju tijekom vremena omogućiti bolju pokrivenost.
Kako bi se konstruirala SAGE metoda, korištene su ideje iz složenih sustava/znanosti o podacima, korištenjem sposobnosti određivanja klastera funkcionalnih grupa (mogućnost da budu vrlo blizu u 11-dimenzionalnom prostoru) i određivanja provincija.Ove provincije prikazuju specifične volumene u našem 3D t-SNE faznom prostoru.Slično, Poincaréov dio može se koristiti za procjenu "volumena" prostora stanja koji zauzima putanja da bi se odredilo "normalno" ili "kaotično" ponašanje (36).Za izlaz statičnog 11-dimenzionalnog modela, volumen zauzet nakon što se podaci pretvore u 3D fazni prostor može se objasniti na sličan način.Odnos geografskog područja i područja u 3D faznom prostoru nije jednostavan, ali se može objasniti ekološkom sličnošću.Iz tog razloga, preferira se konvencionalnija mjera različitosti BC.
Budući rad ponovno će koristiti SAGE metodu za sezonske promjene podataka za procjenu prostorne varijabilnosti identificiranih pokrajina i AEP-a.Budući cilj je koristiti ovu metodu kako bi se pomoglo u određivanju koje se pokrajine mogu odrediti putem satelitskih mjerenja (kao što su Chl-a, reflektivnost daljinskog istraživanja i temperatura površine mora).To će omogućiti daljinsku procjenu ekoloških komponenti i vrlo fleksibilno praćenje ekoloških pokrajina i njihove varijabilnosti.
Svrha ovog istraživanja je uvođenje SAGE metode koja definira ekološku provinciju kroz njezinu jedinstvenu strukturu zajednice planktona.Ovdje će biti pružene detaljnije informacije o fizičkom/biogeokemijskom/ekosustavnom modelu i izboru parametara algoritama t-SNE i DBSCAN.
Fizičke komponente modela proizlaze iz procjene cirkulacije oceana i klime [ECCOv4;(37) globalna procjena stanja opisana s (38).Nominalna rezolucija procjene stanja je 1/5.Metoda najmanjih kvadrata s metodom Lagrangiana multiplikatora koristi se za dobivanje početnih i rubnih uvjeta i internih parametara modela prilagođenih promatranjem, čime se generira slobodni MIT model općeg ciklusa (MITgcm) (39), model Nakon optimizacije, rezultati mogu pratiti i promatrati.
Biogeokemija/ekosustav ima potpuniji opis (tj. jednadžbe i vrijednosti parametara) u (2).Model bilježi kruženje C, N, P, Si i Fe kroz anorganske i organske bazene.Ovdje korištena verzija uključuje 35 vrsta fitoplanktona: 2 vrste mikroprokariota i 2 vrste mikroeukariota (pogodni za okruženja s malo hranjivih tvari), 5 vrsta Cryptomonas sphaeroides (s prevlakom od kalcijevog karbonata), 5 vrsta diazonija (može fiksirati dušik, pa nije ograničena) dostupnost otopljenog anorganskog dušika), 11 dijatomeja (tvore silikatni pokrov), 10 mješovitih vegetativnih flagelata (mogu fotosintetizirati i jesti drugi plankton) i 16 zooplanktona (pasu drugi plankton).One se nazivaju "biogeokemijske funkcionalne skupine" jer imaju različite učinke na morsku biogeokemiju (40, 41) i često se koriste u studijama promatranja i modela.U ovom modelu, svaka funkcionalna skupina sastoji se od nekoliko planktona različitih veličina, s rasponom od 0,6 do 2500 μm ekvivalentnog sferičnog promjera.
Parametri koji utječu na rast, ispašu i tonjenje fitoplanktona povezani su s veličinom, a postoje specifične razlike između šest funkcionalnih skupina fitoplanktona (32).Unatoč različitim fizičkim okvirima, rezultati 51 planktonske komponente modela korišteni su u brojnim nedavnim studijama (42-44).
Od 1992. do 2011. model sprege fizikalnih/biogeokemijskih/ekosustava provodio se 20 godina.Izlaz modela uključuje biomasu planktona, koncentraciju hranjivih tvari i količinu opskrbe hranjivim tvarima (DIN, PO4, Si i Fe).U ovoj studiji, 20-godišnji prosjek ovih rezultata korišten je kao input Ekološke pokrajine.Chl, distribucija biomase planktona i koncentracija hranjivih tvari te distribucija funkcionalnih skupina uspoređeni su sa satelitskim i in situ opažanjima [vidi (2, 44), bilješku S1 i sliku.S1 do S3].
Za SAGE metodu, glavni izvor slučajnosti dolazi iz t-SNE koraka.Slučajnost sprječava ponovljivost, što znači da su rezultati nepouzdani.SAGE metoda rigorozno testira robusnost određivanjem skupa parametara t-SNE i DBSCAN, koji mogu dosljedno identificirati klastere kada se ponavljaju.Određivanje "zbrkanosti" parametra t-SNE može se shvatiti kao određivanje stupnja do kojeg preslikavanje od visokih do niskih dimenzija treba poštivati ​​lokalne ili globalne karakteristike podataka.Dosegnuta je zabuna od 400 i 300 ponavljanja.
Za algoritam klasteriranja DBSCAN potrebno je odrediti minimalnu veličinu i metriku udaljenosti podatkovnih točaka u klasteru.Minimalni broj se određuje pod vodstvom stručnjaka.Ovo znanje zna što odgovara trenutnom okviru i rezoluciji numeričkog modeliranja.Najmanji broj je 100. Može se uzeti u obzir veća minimalna vrijednost (manje od <135 prije nego što gornja granica zelene postane šira), ali ne može zamijeniti metodu združivanja temeljenu na različitosti BC.Stupanj povezanosti (Slika 6A) koristi se za postavljanje parametra ϵ, što je pogodno za veću pokrivenost (Slika 6B).Povezivost se definira kao kompozitni broj klastera i osjetljiva je na parametar ϵ.Niža povezanost ukazuje na nedovoljno uklapanje, umjetno grupiranje regija zajedno.Visoka povezanost ukazuje na pretjerivanje.Prekomjerno opremanje je također problematično, jer pokazuje da početna nasumična pogađanja mogu dovesti do neponovljivih rezultata.Između ove dvije krajnosti, naglo povećanje (obično nazvano "lakat") označava najbolji ϵ.Na slici 6A vidite nagli porast u području platoa (žuto,> 200 klastera), nakon čega slijedi oštro smanjenje (zeleno, 100 klastera), do oko 130, okruženih s vrlo malo klastera (plavo, <60 klastera) ).U najmanje 100 plavih područja, ili jedan klaster dominira cijelim oceanom (ϵ <0,42), ili većina oceana nije klasificirana i smatra se bukom (ϵ> 0,99).Žuto područje ima vrlo varijabilnu, neponovljivu distribuciju klastera.Kako se ϵ smanjuje, šum se povećava.Zelena površina koja se naglo povećava naziva se laktom.Ovo je optimalna regija.Iako se koristi vjerojatnost t-SNE, različitost BC unutar provincije još uvijek se može koristiti za određivanje pouzdanog klasteriranja.Koristeći sliku 6 (A i B), postavite ϵ na 0,39.Što je veći minimalni broj, manja je vjerojatnost dostizanja ϵ koja omogućuje pouzdanu klasifikaciju i veće je zeleno područje s vrijednošću većom od 135. Povećanje ovog područja ukazuje da će lakat biti teže pronaći ili ne- egzistirajući.
Nakon postavljanja parametara t-SNE, ukupan broj pronađenih klastera koristit će se kao mjera povezanosti (A) i postotak podataka dodijeljenih klasteru (B).Crvena točka označava najbolju kombinaciju pokrivenosti i povezivosti.Minimalan broj je određen prema minimalnom broju koji se odnosi na ekologiju.
Za dodatne materijale za ovaj članak, molimo pogledajte http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ovo je članak s otvorenim pristupom koji se distribuira pod uvjetima licence Creative Commons Attribution.Članak dopušta neograničenu uporabu, distribuciju i reprodukciju u bilo kojem mediju pod uvjetom da je izvorno djelo ispravno citirano.
Napomena: samo vas molimo da navedete svoju adresu e-pošte kako bi osoba koju preporučite stranici znala da želite da vidi e-poštu i da nije spam.Nećemo uhvatiti nijednu adresu e-pošte.
Ovo se pitanje koristi za provjeru jeste li posjetitelj i sprječavanje automatskog slanja neželjene pošte.
Globalno ministarstvo ekologije mora odlučno je riješilo složene probleme i koristi se nenadziranim ML-om za istraživanje struktura zajednice.
Globalno ministarstvo ekologije mora odlučno je riješilo složene probleme i koristi se nenadziranim ML-om za istraživanje struktura zajednice.


Vrijeme objave: 12. siječnja 2021