Predložena je metoda učenja bez nadzora za određivanje globalnih morskih ekoloških provincija (eko-provincija) na osnovu strukture planktonske zajednice i podataka o protoku nutrijenata.Metoda sistematske integrirane ekološke provincije (SAGE) može identificirati ekološke provincije u visoko nelinearnim modelima ekosistema.Kako bi se prilagodio ne-Gausovoj kovarijansi podataka, SAGE koristi t random susjedno ugrađivanje (t-SNE) da smanji dimenzionalnost.Uz pomoć aplikacije buke zasnovane na algoritmu prostornog grupisanja zasnovanog na gustini (DBSCAN), može se identifikovati više od sto ekoloških provincija.Koristeći mapu povezanosti sa ekološkim razlikama kao mjerom udaljenosti, robusna agregirana ekološka provincija (AEP) objektivno je definirana kroz ugniježđene ekološke provincije.Koristeći AEPs, istražena je kontrola količine nutrijenata u strukturi zajednice.Eko-provincija i AEP su jedinstveni i mogu pomoći u tumačenju modela.Oni mogu olakšati poređenja između modela i mogu poboljšati razumijevanje i praćenje morskih ekosistema.
Provincije su regije u kojima je složena biogeografija na moru ili kopnu organizirana u koherentna i smislena područja (1).Ove provincije su veoma važne za upoređivanje i suprotstavljanje lokacija, karakterizaciju posmatranja, praćenja i zaštite.Složene i nelinearne interakcije koje proizvode ove provincije čine metode nenadziranog mašinskog učenja (ML) vrlo pogodnim za objektivno određivanje provincija, jer je kovarijansa u podacima složena i ne-Gausova.Ovdje je predložena ML metoda, koja sistematski identificira jedinstvene morske ekološke provincije (eko-provincije) iz Darwinovog globalnog trodimenzionalnog (3D) fizičkog/ekosistemskog modela (2).Termin „jedinstveno“ se koristi da ukaže da se identifikovano područje ne preklapa u dovoljnoj meri sa drugim područjima.Ova metoda se naziva metodom integrirane ekološke provincije (SAGE).Da bi se izvršila korisna klasifikacija, metoda algoritma treba da omogući (i) globalnu klasifikaciju i (ii) analizu na više skala koja se može ugniježditi/agregirati u prostoru i vremenu (3).U ovom istraživanju prvo je predložena SAGE metoda i razmatrane su identificirane ekološke provincije.Eko-provincije mogu promovirati razumijevanje faktora koji kontroliraju strukturu zajednice, pružiti korisne uvide za strategije praćenja i pomoći u praćenju promjena u ekosistemu.
Kopnene provincije se obično klasifikuju prema sličnostima u klimi (padavine i temperatura), tlu, vegetaciji i fauni i koriste se za pomoćno upravljanje, istraživanje biodiverziteta i kontrolu bolesti (1, 4).Morske provincije je teže definirati.Većina organizama je mikroskopska, sa granicama tečnosti.Longhurst et al.(5) Dao jednu od prvih globalnih klasifikacija Ministarstva okeanografije na osnovu uslova životne sredine.Definicija ovih “Longhurst” provincija uključuje varijable kao što su brzina miješanja, stratifikacija i ozračenost, kao i Longhurstovo veliko iskustvo kao morskog okeanografa, koji ima druge važne uslove za morske ekosisteme.Longhurst se intenzivno koristio, na primjer, za procjenu primarne proizvodnje i tokova ugljika, pomoć ribarstvu i planiranje aktivnosti promatranja in situ (5-9).U cilju objektivnijeg definisanja provincija, korišćene su metode kao što su fuzzy logika i regionalno nenadgledano grupisanje/statistika (9-14).Svrha takvih metoda je da identifikuju smislene strukture koje mogu identifikovati provincije u dostupnim podacima posmatranja.Na primjer, dinamične morske provincije (12) koriste samoorganizirajuće karte za smanjenje buke i koriste hijerarhijsko grupiranje (bazirano na stablu) za određivanje morskih proizvoda u boji koji su izvedeni iz regionalnih satelita [klorofil a (Chl-a), normalizirana visina linije fluorescencije i obojena otopljena organska tvar] i fizičko polje (temperatura i salinitet površine mora, apsolutna dinamička topografija i morski led).
Struktura zajednice planktona je zabrinjavajuća jer njegova ekologija ima veliki utjecaj na viši nivo nutrijenata, apsorpciju ugljika i klimu.Ipak, još uvijek je izazovan i neuhvatljiv cilj odrediti globalnu ekološku provinciju zasnovanu na strukturi planktonske zajednice.Morski sateliti u boji potencijalno mogu pružiti uvid u grubo zrnatu klasifikaciju fitoplanktona ili sugerirati prednosti funkcionalnih grupa (15), ali trenutno nisu u mogućnosti pružiti detaljne informacije o strukturi zajednice.Nedavna istraživanja [npr. Tara Ocean (16)] pružaju mjerenja strukture zajednice bez presedana;trenutno postoje samo rijetke in situ opservacije na globalnoj razini (17).Prethodne studije su u velikoj meri odredile „Biogeohemijsku provinciju“ (12, 14, 18) na osnovu određivanja biohemijskih sličnosti (kao što su primarna proizvodnja, Chl i dostupno svetlo).Ovdje se za izlaz [Darwin(2)] koristi numerički model, a ekološka provincija se određuje prema strukturi zajednice i protoku nutrijenata.Numerički model korišćen u ovoj studiji ima globalnu pokrivenost i može se uporediti sa postojećim terenskim podacima (17) i poljima daljinske detekcije (Napomena S1).Podaci numeričkog modela korišteni u ovoj studiji imaju prednost globalne pokrivenosti.Modelni ekosistem se sastoji od 35 vrsta fitoplanktona i 16 vrsta zooplanktona (pogledajte materijale i metode).Modelski tipovi planktona nelinearno su u interakciji sa ne-Gausovim strukturama kovarijanse, tako da jednostavne dijagnostičke metode nisu prikladne za identifikaciju jedinstvenih i konzistentnih obrazaca u novonastalim strukturama zajednice.Metoda SAGE koja je ovdje predstavljena pruža novi način za provjeru rezultata složenih Darwinovih modela.
Moćne transformativne sposobnosti nauke o podacima/tehnologije ML mogu omogućiti izuzetno složenim modelskim rješenjima da otkriju složene, ali robusne strukture u kovarijansi podataka.Robusna metoda je definirana kao metoda koja može vjerno reproducirati rezultate unutar datog raspona greške.Čak iu jednostavnim sistemima, određivanje robusnih obrazaca i signala može biti izazov.Dok se ne utvrdi obrazloženje koje vodi do uočenog obrasca, složenost koja se pojavljuje može izgledati komplikovano/teško za razrješenje.Ključni proces određivanja sastava ekosistema je nelinearne prirode.Postojanje nelinearnih interakcija može zbuniti robusnu klasifikaciju, pa je neophodno izbjegavati metode koje daju jake pretpostavke o osnovnoj statističkoj distribuciji kovarijanse podataka.Visokodimenzionalni i nelinearni podaci su uobičajeni u oceanografiji i mogu imati kovarijantnu strukturu sa složenom, ne-Gausovom topologijom.Iako podaci sa ne-Gausovskom kovarijantnom strukturom mogu ometati robusnu klasifikaciju, SAGE metoda je nova jer je dizajnirana da identifikuje klastere sa proizvoljnim topologijama.
Cilj SAGE metode je objektivno identificiranje novih obrazaca koji mogu pomoći daljem ekološkom razumijevanju.Prateći radni tok zasnovan na klasterima sličan (19), varijable ekološkog protoka i protoka nutrijenata se koriste za određivanje jedinog klastera u podacima, koji se zove ekološka provincija.Metoda SAGE predložena u ovoj studiji (Slika 1) prvo smanjuje dimenzionalnost sa 55 na 11 dimenzija sumiranjem funkcionalnih grupa planktona definisanih a priori (vidi Materijali i metode).Koristeći metodu t-random susjednog ugrađivanja (t-SNE), veličina se dodatno smanjuje projektovanjem vjerovatnoće u 3D prostor.Grupisanje bez nadzora može identifikovati ekološki bliske oblasti [prostorno grupisanje zasnovano na gustini (DBSCAN) za aplikacije zasnovane na buci].I t-SNE i DBSCAN su primjenjivi na inherentne podatke numeričkog modela nelinearnog ekosistema.Zatim reprojicirajte nastalu ekološku provinciju na zemlju.Identificirano je više od stotinu jedinstvenih ekoloških provincija, pogodnih za regionalna istraživanja.Da bi se razmotrio globalno konzistentan model ekosistema, SAGE metoda se koristi za agregiranje ekoloških provincija u agregirane ekološke provincije (AEP) kako bi se poboljšala efikasnost ekoloških provincija.Nivo agregacije (koji se naziva “složenost”) može se prilagoditi potrebnom nivou detalja.Odredite minimalnu složenost robusnog AEP-a.Fokus selekcije je SAGE metoda i istraživanje najmanjih složenih AEP slučajeva kako bi se utvrdila kontrola strukture hitne zajednice.Obrasci se zatim mogu analizirati kako bi se dobio ekološki uvid.Metoda koja je ovdje uvedena također se može koristiti za opsežnije poređenje modela, na primjer, procjenom lokacija sličnih ekoloških provincija pronađenih u različitim modelima kako bi se istaknule razlike i sličnosti, kako bi se uporedili modeli.
(A) Šematski dijagram toka rada za određivanje ekološke provincije;koristeći zbroj u funkcionalnoj grupi da se originalni 55-dimenzionalni podaci svedu na 11-dimenzionalni izlazni model, uključujući biomasu od sedam funkcionalnih/hranjivih planktona i četiri stope opskrbe nutrijentima.Zanemarljiva vrijednost i izdržljiva ledena površina.Podaci su standardizovani i standardizovani.Obezbedite 11-dimenzionalne podatke t-SNE algoritmu da biste istakli statistički slične kombinacije karakteristika.DBSCAN će pažljivo odabrati klaster za postavljanje vrijednosti parametra.Konačno projicirajte podatke nazad u projekciju geografske širine/dužine.Imajte na umu da se ovaj proces ponavlja 10 puta jer se primjenom t-SNE može stvoriti neznatna slučajnost.(B) objašnjava kako dobiti AEP ponavljanjem toka posla u (A) 10 puta.Za svaku od ovih 10 implementacija, matrica različitosti između provincija Bray-Curtis (BC) određena je na osnovu biomase 51 tipa fitoplanktona.Odredite BC razliku između provincija, od složenosti 1 AEP do pune složenosti 115. BC mjerilo je postavljeno od strane provincije Longhurst.
SAGE metoda koristi izlaz globalnog 3D fizičkog/ekosistemskog numeričkog modela za definiranje ekološke provincije [Darwin (2);vidi Materijali i metode i Napomena S1].Komponente ekosistema se sastoje od 35 vrsta fitoplanktona i 16 vrsta zooplanktona, sa sedam unapred definisanih funkcionalnih grupa: prokarioti i eukarioti prilagođeni okruženju sa niskim sadržajem hranljivih materija, kokcidije sa prevlakom od kalcijum karbonata i teška fiksacija azota Hranljivi sastojci koji nedostaju za azotom ( važni nutrijenti), sa silicijumskom prevlakom, mogu napraviti fotosintezu drugog planktona i ispašu miješanih hranljivih sastojaka flagelata i stočara zooplanktona.Raspon veličine je od 0,6 do 2500 μm ekvivalentnog sfernog prečnika.Model distribucije veličine fitoplanktona i funkcionalnog grupiranja obuhvata ukupne karakteristike koje se vide u satelitskim i in situ opservacijama (vidi slike S1 do S3).Sličnost između numeričkog modela i posmatranog okeana ukazuje da se provincije definisane modelom mogu primeniti na in-situ okean.Imajte na umu da ovaj model obuhvata samo određenu raznolikost fitoplanktona i samo određene fizičke i hemijske opsege in situ okeana.SAGE metoda može omogućiti ljudima da bolje razumiju visoko regionalni kontrolni mehanizam strukture modela zajednice.
Uključivanjem samo sume površinske biomase (sa prosječnim vremenom od 20 godina) u svaku funkcionalnu grupu planktona, dimenzionalnost podataka može se smanjiti.Nakon što su ranije studije pokazale njihovu ključnu ulogu u uspostavljanju strukture zajednice, ona je takođe uključila termine površinskih izvora za protok nutrijenata (opskrba dušikom, željezom, fosfatom i silicijumskom kiselinom) [npr. (20, 21)] .Sumiranje funkcionalnih grupa smanjuje problem sa 55 (51 plankton i 4 tokova nutrijenata) na 11 dimenzija.U ovoj početnoj studiji, zbog računskih ograničenja koja nameće algoritam, dubina i vremenska varijabilnost nisu uzeti u obzir.
SAGE metoda je u stanju da identifikuje važne odnose između nelinearnih procesa i ključnih karakteristika interakcija između biomase funkcionalne grupe i protoka nutrijenata.Korištenjem 11-dimenzionalnih podataka zasnovanih na euklidskim metodama učenja na daljinu (kao što su K-srednje vrijednosti) ne mogu se dobiti pouzdane i ponovljive provincije (19, 22).To je zato što se u osnovnoj distribuciji kovarijanse ključnih elemenata koji definiraju ekološku provinciju ne nalazi Gausov oblik.K-srednje vrednosti Voronojevih ćelija (prave linije) ne mogu zadržati ne-Gausovu osnovnu distribuciju.
Biomasa sedam funkcionalnih grupa planktona i četiri toka nutrijenata formiraju 11-dimenzionalni vektor x.Dakle, x je vektorsko polje na mreži modela, gdje svaki element xi predstavlja 11-dimenzionalni vektor definiran na horizontalnoj mreži modela.Svaki indeks i jedinstveno identifikuje tačku mreže na sferi, gde je (lon, lat) = (ϕi, θi).Ako je biomasa jedinice modelske mreže manja od 1,2×10-3mg Chl/m3 ili stopa pokrivenosti ledom prelazi 70%, koristi se i odbacuje se evidencija podataka o biomasi.Podaci su normalizirani i standardizirani, tako da su svi podaci u rasponu od [0 do 1], srednja vrijednost je uklonjena i skalirana na jediničnu varijansu.Ovo je učinjeno tako da karakteristike (biomasa i protok nutrijenata) nisu ograničene kontrastom u rasponu mogućih vrijednosti.Grupiranje bi trebalo da obuhvati odnos promjene iz ključne udaljenosti vjerovatnoće između karakteristika, a ne geografske udaljenosti.Kvantifikacijom ovih udaljenosti pojavljuju se važne karakteristike, dok se nepotrebni detalji odbacuju.Sa ekološke tačke gledišta, to je neophodno jer neke vrste fitoplanktona sa malo biomase mogu imati veće biogeokemijske efekte, kao što je fiksacija dušika dijazotrofnim bakterijama.Prilikom standardizacije i normalizacije podataka, ove vrste kovarijata će biti istaknute.
Naglašavanjem blizine karakteristika u visokodimenzionalnom prostoru u niskodimenzionalnom predstavljanju, t-SNE algoritam se koristi da postojeće slične regije učini jasnijim.Prethodni rad usmjeren na izgradnju dubokih neuronskih mreža za aplikacije daljinskog otkrivanja koristio je t-SNE, koji je dokazao svoju vještinu u razdvajanju ključnih karakteristika (23).Ovo je neophodan korak za identifikaciju robusnog klasteriranja u podacima o značajkama uz izbjegavanje nekonvergentnih rješenja (napomena S2).Koristeći Gaussova jezgra, t-SNE čuva statistička svojstva podataka mapiranjem svakog visokodimenzionalnog objekta u tačku u 3D faznom prostoru, čime se osigurava da je vjerovatnoća sličnih objekata u visokom i niskom smjeru visoka u visokodimenzionalnom dimenzionalni prostor (24).S obzirom na skup od N visokodimenzionalnih objekata x1,…,xN, t-SNE algoritam smanjuje minimiziranjem Kullback-Leiblerove (KL) divergencije (25).KL divergencija je mjera koliko se distribucija vjerovatnoće razlikuje od druge referentne distribucije vjerovatnoće i može efikasno procijeniti mogućnost korelacije između niskodimenzionalnih reprezentacija visokodimenzionalnih karakteristika.Ako je xi i-ti objekt u N-dimenzionalnom prostoru, xj je j-ti objekt u N-dimenzionalnom prostoru, yi je i-ti objekt u niskodimenzionalnom prostoru, a yj je j-ti objekt u niskom -dimenzionalni prostor, tada t -SNE definira vjerovatnoću sličnosti ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), a za skup redukcije dimenzionalnosti q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Slika 2A ilustruje efekat smanjenja vektora biomase i protoka nutrijenata 11-dimenzionalne kombinacije na 3D.Motivacija primjene t-SNE može se uporediti s motivacijom analize glavnih komponenti (PCA), koja koristi atribut varijanse da naglasi područje/atribut podataka, čime se smanjuje dimenzionalnost.Utvrđeno je da je t-SNE metoda superiorna u odnosu na PCA u pružanju pouzdanih i ponovljivih rezultata za Eko-Ministarstvo (vidi Napomenu S2).Ovo može biti zato što pretpostavka ortogonalnosti PCA nije prikladna za identifikaciju kritičnih interakcija između visoko nelinearnih interaktivnih karakteristika, jer se PCA fokusira na linearne kovarijantne strukture (26).Koristeći podatke daljinskog istraživanja, Lunga et al.(27) ilustruje kako koristiti SNE metodu za isticanje složenih i nelinearnih spektralnih karakteristika koje odstupaju od Gaussove raspodjele.
(A) Modelirana stopa opskrbe nutrijentima, biomasa funkcionalne grupe fitoplanktona i zooplanktona nacrtana t-SNE algoritmom i obojena po pokrajinama pomoću DBSCAN-a.Svaka tačka predstavlja tačku u visokodimenzionalnom prostoru, kao što je prikazano na slici 6B, većina tačaka je uhvaćena.Osovine se odnose na “t-SNE” veličine 1, 2 i 3. (B) Geografska projekcija provincije koju je pronašao DBSCAN na mreži geografske širine i dužine ishodišta.Boju treba smatrati bilo kojom bojom, ali treba odgovarati (A).
Tačke na t-SNE dijagramu raspršenja na slici 2A su povezane sa zemljopisnom širinom i dužinom.Ako su dvije tačke na slici 2A blizu jedna drugoj, to je zato što su im tokovi biomase i nutrijenata slični, a ne zbog geografske blizine.Boje na slici 2A su klasteri otkriveni pomoću DBSCAN metode (28).Prilikom traženja gustih opservacija, DBSCAN algoritam koristi udaljenost u 3D prikazu između tačaka (ϵ = 0,39; za informacije o ovom izboru pogledajte Materijali i metode), a broj sličnih tačaka je potreban za definiranje klastera (ovdje 100 bodova, pogledajte gore).Metoda DBSCAN ne daje nikakve pretpostavke o obliku ili broju klastera u podacima, kao što je prikazano u nastavku:
3) Za sve tačke identifikovane kao unutar unutarnje udaljenosti, ponovite korak 2 iterativno da odredite granicu klastera.Ako je broj bodova veći od postavljene minimalne vrijednosti, označava se kao klaster.
Podaci koji ne zadovoljavaju minimalni član klastera i metriku udaljenosti ϵ smatraju se „šumom“ i ne dodjeljuju im se boja.DBSCAN je brz i skalabilan algoritam sa O(n2) performansama u najgorem slučaju.Za trenutnu analizu, to zapravo nije slučajno.Minimalni broj bodova utvrđuje se stručnom ocjenom.Nakon podešavanja udaljenosti, rezultat nije dovoljno stabilan u rasponu od ≈±10.Ova udaljenost je postavljena korištenjem povezanosti (Slika 6A) i postotka pokrivenosti oceanom (Slika 6B).Povezivost je definirana kao složeni broj klastera i osjetljiva je na parametar ϵ.Niža povezanost ukazuje na nedovoljno uklapanje, veštačko grupisanje regiona zajedno.Visoka povezanost ukazuje na preopterećenost.Zamislivo je koristiti veći minimum, ali ako minimum prelazi ca, nemoguće je postići pouzdano rješenje.135 (Za više detalja, pogledajte Materijali i metode).
115 klastera identifikovanih na slici 2A je projektovano nazad na zemlju na slici 2B.Svaka boja odgovara koherentnoj kombinaciji biogeokemijskih i ekoloških faktora identifikovanih od strane DBSCAN-a.Kada se klasteri odrede, povezivanje svake tačke na slici 2A sa određenom geografskom širinom i dužinom se koristi za projektovanje klastera nazad u geografsko područje.Slika 2B to ilustruje istim bojama klastera kao i slika 2A.Slične boje ne treba tumačiti kao ekološku sličnost, jer su dodijeljene redoslijedom kojim algoritam otkriva klastere.
Područje na slici 2B može biti kvalitativno slično poznatom području u fizičkoj i/ili biogeohemiji oceana.Na primjer, klasteri u Južnom okeanu su zonski simetrični, s pojavom oligotrofnih vrtloga, a oštar prijelaz ukazuje na utjecaj pasata.Na primjer, u ekvatorijalnom Pacifiku, vide se različiti regioni povezani sa usponom.
Kako bi se razumjelo ekološko okruženje Eko-provincije, varijacija indeksa razlike Bray-Curtis (BC) (29) korištena je za procjenu ekologije u klasteru.BC indikator je statistički podatak koji se koristi za kvantifikaciju razlike u strukturi zajednice između dvije različite lokacije.BC mjerenje je primjenjivo na biomasu 51 vrste fitoplanktona i zooplanktona BCninj = 1-2CninjSni + Snj
BCninj se odnosi na sličnost između kombinacije ni i kombinacije nj, gdje je Cninj minimalna vrijednost jedne vrste biomase koja postoji u obje kombinacije ni i nj, a Sni predstavlja zbir svih biomasa koje postoje u obje kombinacije ni i Snj.BC razlika je slična mjeri udaljenosti, ali djeluje u neeuklidskom prostoru, što je vjerovatno pogodnije za ekološke podatke i njihovu interpretaciju.
Za svaki klaster identifikovan na slici 2B, može se proceniti sličnost međupokrajinskog i međupokrajinskog BC.BC razlika unutar provincije odnosi se na razliku između prosječne vrijednosti pokrajine i svake tačke u pokrajini.Razlika između provincija BC odnosi se na sličnost između jedne provincije i drugih provincija.Slika 3A prikazuje simetričnu BC matricu (0, crna: potpuno odgovara; 1, bijela: potpuno različita).Svaka linija na grafikonu prikazuje obrazac u podacima.Slika 3B prikazuje geografski značaj rezultata BC na slici 3A za svaku provinciju.Za provinciju u području s malom ishranom i malo nutrijenata, Slika 3B pokazuje da je simetrija velikih područja oko ekvatora i Indijskog okeana u osnovi slična, ali veće geografske širine i područja uzdizanja se značajno razlikuju.
(A) Stepen BC razlike procijenjen za svaku provinciju na osnovu globalnog 20-godišnjeg prosjeka globalne površine od 51 planktona.Obratite pažnju na očekivanu simetriju vrijednosti.(B) Prostorna projekcija stupca (ili reda).Za provinciju u distrofičnom krugu procijenjena je globalna distribucija mjere sličnosti BC i procijenjen je globalni 20-godišnji prosjek.Crna (BC = 0) znači isto područje, a bijela (BC = 1) znači da nema sličnosti.
Slika 4A ilustruje razliku u BC unutar svake provincije na slici 2B.Utvrđen korištenjem prosječne kombinacije prosječne površine u klasteru i određivanjem razlika između BC i srednje vrijednosti svake tačke mreže u provinciji, pokazuje da SAGE metoda može dobro odvojiti 51 vrstu na osnovu ekološke sličnosti Tip podaci o modelu.Ukupna prosječna različitost klastera BC svih 51 tipa je 0,102±0,0049.
(A, B i D) BC razlika unutar provincije se ocenjuje kao prosečna BC razlika između svake zajednice tačaka mreže i prosečne provincije, a složenost se ne smanjuje.(2) Globalna prosječna unutarprovincijalna BC razlika je 0,227±0,117.Ovo je mjerilo klasifikacije zasnovane na ekološkoj motivaciji koju predlaže ovaj rad [zelena linija u (C)].(C) Prosječna razlika unutar pokrajinske BC: Crna linija predstavlja razliku unutar pokrajine BC sa rastućom složenošću.2σ dolazi od 10 ponavljanja procesa identifikacije eko-provincije.Za ukupnu složenost provincija koje je otkrio DBSCAN, (A) pokazuje da je BC razlika u provinciji 0,099, a klasifikacija složenosti koju predlaže (C) je 12, što rezultira razlikom BC od 0,200 u provinciji.kao što slika pokazuje.(D).
Na slici 4B, biomasa 51 vrste planktona je korištena da predstavi ekvivalentnu razliku između BC u provinciji Longhurst.Ukupan prosek svake pokrajine je 0,227, a standardna devijacija tačaka mreže u odnosu na razliku u provinciji BC je 0,046.Ovo je veće od klastera identifikovanog na slici 1B.Umjesto toga, koristeći zbir sedam funkcionalnih grupa, prosječna razlika između BC-a unutar sezone u Longhurstu se povećala na 0,232.
Globalna mapa eko-provincije pruža složene detalje jedinstvenih ekoloških interakcija i poboljšanja su napravljena u korištenju cjelokupne strukture ekosistema provincije Longhurst.Od Ministarstva ekologije se očekuje da pruži uvid u proces upravljanja ekosistemom numeričkog modela, a ovaj uvid će pomoći u istraživanju terenskog rada.Za potrebe ovog istraživanja nije moguće u potpunosti prikazati više od sto provincija.Sljedeći odjeljak uvodi SAGE metodu koja sumira provincije.
Jedna od svrha pokrajine je promicanje razumijevanja lokacije i upravljanja pokrajinom.Da bi se odredile vanredne situacije, metoda na slici 1B ilustruje gniježđenje ekološki sličnih provincija.Eko-provincije su grupisane na osnovu ekološke sličnosti, a takvo grupisanje provincija se naziva AEP.Postavite podesivu „složenost“ na osnovu ukupnog broja provincija koje treba uzeti u obzir.Termin “složenost” se koristi jer omogućava prilagođavanje nivoa atributa za hitne slučajeve.Da bi se definisale značajne agregacije, prosečna unutarprovincijalna BC razlika od 0,227 od Longhursta se koristi kao merilo.Ispod ove referentne vrijednosti, kombinovane provincije se više ne smatraju korisnim.
Kao što je prikazano na slici 3B, globalne ekološke provincije su koherentne.Koristeći međupokrajinske BC razlike, može se vidjeti da su neke konfiguracije vrlo „uobičajene“.Inspirisani genetikom i metodama teorije grafova, "povezani grafovi" se koriste za sortiranje >100 provincija na osnovu provincija koje su im najsličnije.metrika “povezanosti” ovdje je određena korištenjem međuprovincijske razlike u BC (30).Broj pokrajina sa većim prostorom za klasifikaciju od > 100 provincija se ovdje može nazvati složenošću.AEP je proizvod koji više od 100 pokrajina kategorizira kao najdominantnije/najbliže ekološke provincije.Svaka ekološka pokrajina je dodijeljena dominantnoj/visoko povezanoj ekološkoj provinciji koja im je najsličnija.Ova agregacija određena BC razlikom omogućava ugniježđeni pristup globalnoj ekologiji.
Odabrana složenost može biti bilo koja vrijednost od 1 do potpune složenosti na Sl.2A.Na nižoj složenosti, AEP može degenerirati zbog vjerovatnoćeg koraka smanjenja dimenzionalnosti (t-SNE).Degeneracija znači da se ekološke provincije mogu dodijeliti različitim AEP-ovima između iteracija, čime se mijenja pokriveno geografsko područje.Slika 4C ilustruje širenje BC različitosti unutar provincija u AEP-ovima sve složenosti kroz 10 implementacija (ilustracija na slici 1B).Na slici 4C, 2σ (plava oblast) je mjera degradacije u 10 implementacija, a zelena linija predstavlja Longhurst mjerilo.Činjenice su dokazale da složenost od 12 može zadržati razliku BC u provinciji ispod Longhurst referentne vrijednosti u svim implementacijama i održati relativno malu degradaciju od 2σ.Ukratko, minimalna preporučena složenost je 12 AEP-ova, a prosječna razlika BC unutar provincije procijenjena korištenjem 51 vrste planktona je 0,198±0,013, kao što je prikazano na slici 4D.Koristeći zbir sedam funkcionalnih grupa planktona, prosječna BC razlika unutar provincije je 2σ umjesto 0,198±0,004.Poređenje između BC razlika izračunatih sa ukupnom biomasom sedam funkcionalnih grupa ili biomasom svih 51 vrste planktona pokazuje da iako je SAGE metoda primjenjiva na 51-dimenzionalnu situaciju, ona je za ukupnu biomasu sedam funkcionalnih grupa Za obuku.
U zavisnosti od svrhe bilo kog istraživanja, mogu se uzeti u obzir različiti nivoi složenosti.Regionalne studije mogu zahtevati punu složenost (tj. svih 115 provincija).Kao primjer i radi jasnoće, razmotrite minimalnu preporučenu složenost od 12.
Kao primjer korisnosti SAGE metode, ovdje se koristi 12 AEP sa minimalnom složenošću od 12 za istraživanje kontrole strukture zajednice za hitne slučajeve.Slika 5 ilustruje ekološke uvide grupisane prema AEP (od A do L): U Redfield stehiometriji, geografski opseg (Slika 5C), sastav biomase funkcionalne grupe (Slika 5A) i snabdevanje nutrijentima (Slika 5B) izvodi N Zoomed.Prikazan je odnos (N:Si:P:Fe, 1:1:16:16×103).Za drugi panel, P pomnožen sa 16 i Fe pomnožen sa 16×103, tako da je trakasti grafikon ekvivalentan nutritivnim potrebama fitoplanktona.
Pokrajine su klasifikovane u 12 AEP A do L. (A) Biomasa (mgC/m3) ekosistema u 12 provincija.(B) Brzina protoka hranjivih tvari otopljenog neorganskog dušika (N), željeza (Fe), fosfata (P) i silicijumske kiseline (Si) (mmol/m3 godišnje).Fe i P se množe sa 16 i 16×103, respektivno, tako da su trake standardizovane prema zahtjevima stehiometrije fitoplanktona.(C) Obratite pažnju na razliku između polarnih regija, suptropskih ciklona i glavnih sezonskih/rastućih regija.Monitoring stanice su označene kako slijedi: 1, SJEDIŠTA;2, ALOHA;3, stanica P;i 4, BATS.
Identifikovani AEP je jedinstven.Postoji određena simetrija oko ekvatora u Atlantskom i Tihom okeanu, a slično, ali prošireno područje postoji u Indijskom okeanu.Neki AEP-ovi obuhvataju zapadnu stranu kontinenta povezanu sa usponom.Cirkumpolarna struja Južnog pola smatra se velikom zonskom karakteristikom.Subtropski ciklon je složena serija oligotrofnih AEP.U ovim provincijama je očigledan poznati obrazac razlika u biomasi između oligotrofnih vrtloga u kojima dominira plankton i polarnih regija bogatih dijatomejima.
AEP s vrlo sličnom ukupnom biomasom fitoplanktona mogu imati vrlo različite strukture zajednice i pokrivati različita geografska područja, kao što su D, H i K, koja imaju sličnu ukupnu biomasu fitoplanktona.AEP H uglavnom postoji u ekvatorijalnom Indijskom okeanu, a ima i više dijazotrofnih bakterija.AEP D se nalazi u nekoliko basena, ali je posebno istaknut u Pacifiku oko područja visokog prinosa oko ekvatorijalnog uzdizanja.Oblik ove pacifičke provincije podsjeća na planetarni talasni vlak.U AEP D ima malo dijazobakterija, a više čunjeva.U poređenju sa druge dve provincije, AEP K se nalazi samo u visoravnima Arktičkog okeana, a ima više dijatomeja i manje planktona.Vrijedi napomenuti da je količina planktona u ove tri regije također vrlo različita.Među njima, brojnost planktona AEP K je relativno niska, dok je AEP D i H relativno visoka.Stoga, uprkos njihovoj biomasi (i stoga slične Chl-a), ove provincije su prilično različite: testiranje provincija na bazi Chl možda neće obuhvatiti ove razlike.
Takođe je očigledno da neki AEP sa veoma različitom biomasom mogu biti slični u smislu strukture zajednice fitoplanktona.Na primjer, to je vidljivo u AEP D i E. Oni su blizu jedan drugom, au Tihom okeanu, AEP E je blizu visoko produktivnog AEPJ.Slično tome, ne postoji jasna veza između biomase fitoplanktona i obilja zooplanktona.
AEP se može shvatiti u smislu hranljivih materija koje su im date (Slika 5B).Dijatomeje postoje samo tamo gdje ima dovoljno silicijumske kiseline.Općenito, što je veća količina silicijumske kiseline, veća je biomasa dijatomeja.Dijatomeje se mogu vidjeti u AEP A, J, K i L. Odnos biomase dijatomeja u odnosu na drugi fitoplankton određen je N, P i Fe u odnosu na potrebe dijatomeja.Na primjer, AEP L dominiraju dijatomeje.U poređenju sa drugim nutrijentima, Si ima najveću zalihu.Nasuprot tome, uprkos većoj produktivnosti, AEP J ima manje dijatomeja i manje količine silicija (sve i u odnosu na druge nutrijente).
Diazonium bakterije imaju sposobnost fiksiranja dušika, ali rastu sporo (31).Oni koegzistiraju s drugim fitoplanktonom, gdje su željezo i fosfor preveliki u odnosu na potražnju za nediazonijskim nutrijentima (20, 21).Vrijedi napomenuti da je dijazotrofna biomasa relativno visoka, a ponuda Fe i P relativno velika u odnosu na ponudu N. Na ovaj način, iako je ukupna biomasa u AEP J veća, biomasa diazonija u AEP H je veća od one u J. Imajte na umu da su AEP J i H geografski veoma različiti, a H se nalazi u ekvatorijalnom Indijskom okeanu.
Ako jedinstvena struktura ekosistema nije podijeljena na provincije, uvidi stečeni iz 12 AEP modela najniže složenosti neće biti tako jasni.AEP koji generiše SAGE olakšava koherentno i istovremeno poređenje složenih i visokodimenzionalnih informacija iz modela ekosistema.AEP efikasno naglašava zašto Chl nije dobra i alternativna metoda za određivanje strukture zajednice ili obilja zooplanktona na višim nivoima nutrijenata.Detaljna analiza tekućih istraživačkih tema je izvan okvira ovog članka.SAGE metoda pruža način za istraživanje drugih mehanizama u modelu koji je lakši za rukovanje nego gledanje od tačke do tačke.
SAGE metoda je predložena da pomogne u razjašnjavanju izuzetno složenih ekoloških podataka iz globalnih fizičkih/biogeohemijskih/ekosistemskih numeričkih modela.Ekološka provincija određena je ukupnom biomasom unakrsnih planktonskih funkcionalnih grupa, primjenom algoritma smanjenja dimenzionalnosti t-SNE vjerovatnoće i grupiranjem pomoću nenadzirane ML metode DBSCAN.Međuprovincijalna teorija BC razlike/grafova za metodu gniježđenja je primijenjena da bi se dobio robustan AEP koji se može koristiti za globalnu interpretaciju.U pogledu izgradnje, Eko-pokrajina i AEP su jedinstveni.AEP gniježđenje može se podesiti između pune složenosti originalne ekološke provincije i preporučenog minimalnog praga od 12 AEP-ova.Ugniježđenje i određivanje minimalne složenosti AEP-a se smatraju ključnim koracima, jer vjerovatnoća t-SNE degeneriše AEP-ove <12 složenosti.SAGE metoda je globalna, a njena složenost se kreće od> 100 AEP-a do 12. Radi jednostavnosti, trenutni fokus je na složenosti 12 globalnih AEP-a.Buduća istraživanja, posebno regionalne studije, mogu smatrati korisnim manji prostorni podskup globalnih eko-provincija, i mogu se agregirati na manjem području kako bi iskoristili iste ekološke uvide o kojima se ovdje raspravlja.Daje sugestije o tome kako se ove ekološke provincije i uvidi stečeni iz njih mogu koristiti za dalje ekološko razumijevanje, olakšati poređenje modela i potencijalno poboljšati praćenje morskih ekosistema.
Ekološka provincija i AEP identifikovani metodom SAGE zasnovani su na podacima u numeričkom modelu.Po definiciji, numerički model je pojednostavljena struktura koja pokušava da obuhvati suštinu ciljnog sistema, a različiti modeli će imati različitu distribuciju planktona.Numerički model korišten u ovoj studiji ne može u potpunosti obuhvatiti neke od uočenih obrazaca (na primjer, u procjenama Chl za ekvatorijalnu regiju i Južni ocean).Uhvaćen je samo mali dio raznolikosti u stvarnom okeanu, a mezo i submezoskale se ne mogu razriješiti, što može utjecati na protok nutrijenata i manju strukturu zajednice.Uprkos ovim nedostacima, pokazalo se da je AEP veoma koristan u pomaganju da se razumeju složeni modeli.Procjenom gdje se nalaze slične ekološke provincije, AEP pruža potencijalni alat za poređenje numeričkih modela.Trenutni numerički model bilježi ukupni obrazac koncentracije fitoplanktona Chl-a na daljinu i distribuciju veličine planktona i funkcionalne grupe (Napomena S1 i Slika S1) (2, 32).
Kao što je prikazano konturnom linijom od 0,1 mgChl-a/m-3, AEP je podijeljen na oligotrofno područje i mezotrofno područje (slika S1B): AEP B, C, D, E, F i G su oligotrofne oblasti, a preostale oblasti su nalazi Viši Chl-a.AEP pokazuje određenu korespondenciju s provincijom Longhurst (slika S3A), na primjer, Južnim oceanom i ekvatorijalnim Pacifikom.U nekim regijama, AEP pokriva više regiona Longhursta, i obrnuto.Budući da je namjera razgraničenja provincija na ovom području i Longhursta drugačija, očekuje se da će biti razlika.Višestruki AEP u provinciji Longhurst ukazuje na to da određena područja sa sličnom biogeohemijom mogu imati vrlo različite strukture ekosistema.AEP pokazuje određenu korespondenciju sa fizičkim stanjima, kao što je otkriveno korišćenjem učenja bez nadzora (19), kao što su stanja visokog uzdizanja (na primer, Južni okean i ekvatorijalni Pacifik; slika S3, C i D).Ove korespondencije pokazuju da je struktura zajednice planktona pod jakim utjecajem dinamike oceana.U područjima kao što je Sjeverni Atlantik, AEP prolazi kroz fizičke provincije.Mehanizam koji uzrokuje ove razlike može uključivati procese kao što je transport prašine, što može dovesti do potpuno različitih nutritivnih programa čak i pod sličnim fizičkim uvjetima.
Ministarstvo ekologije i AEP su istakli da se samo korištenjem Chl-a ne mogu identificirati ekološke komponente, kao što je ekološka zajednica mora već shvatila.Ovo se vidi kod AEP sa sličnom biomasom, ali značajno drugačijim ekološkim sastavom (kao što su D i E).Nasuprot tome, AEP kao što su D i K imaju vrlo različitu biomasu, ali sličan ekološki sastav.AEP naglašava da je odnos između biomase, ekološkog sastava i obilja zooplanktona složen.Na primjer, iako se AEP J ističe u pogledu fitoplanktona i biomase planktona, AEP-ovi A i L imaju sličnu biomasu planktona, ali A ima veću brojnost planktona.AEP naglašava da se biomasa fitoplanktona (ili Chl) ne može koristiti za predviđanje biomase zooplanktona.Zooplankton je temelj lanca ishrane ribarstva, a preciznije procjene mogu dovesti do boljeg upravljanja resursima.Budući sateliti u boji mora [na primjer, PACE (plankton, aerosol, oblak i morski ekosistem)] mogu biti bolje pozicionirani da pomognu u procjeni strukture zajednice fitoplanktona.Korištenje AEP predviđanja potencijalno može olakšati procjenu zooplanktona iz svemira.Metode kao što je SAGE, zajedno sa novim tehnologijama i sve više i više terenskih podataka dostupnih za terenska istraživanja istine (kao što su Tara i naknadno istraživanje), mogu zajedno napraviti korak ka satelitskom praćenju zdravlja ekosistema.
SAGE metoda pruža zgodan način za procjenu nekih mehanizama koji kontroliraju karakteristike provincije, kao što su biomasa/Chl, neto primarna proizvodnja i struktura zajednice.Na primjer, relativna količina dijatomeja je određena neravnotežom u opskrbi Si, N, P i Fe u odnosu na stehiometrijske zahtjeve fitoplanktona.Uz uravnoteženu stopu ponude, zajednicom dominiraju dijatomeje (L).Kada je stopa ponude neuravnotežena (to jest, ponuda silicijuma je niža od potražnje za nutrijentima dijatomeja), dijatomeje čine samo mali dio Udjela (K).Kada zalihe Fe i P premaše zalihe N (na primjer, E i H), dijazotrofne bakterije će snažno rasti.Kroz kontekst koji pruža AEP, istraživanje kontrolnih mehanizama će postati korisnije.
Eko-pokrajina i AEP su područja sa sličnim strukturama zajednice.Vremenske serije sa određene lokacije unutar ekološke provincije ili AEP mogu se smatrati referentnom tačkom i mogu predstavljati područje koje pokriva ekološka pokrajina ili AEP.Stanice za dugotrajno praćenje na licu mjesta pružaju takve vremenske serije.Dugoročni skupovi podataka na licu mjesta će i dalje igrati neprocjenjivu ulogu.Iz perspektive praćenja strukture zajednice, SAGE metoda se može posmatrati kao način da se pomogne u određivanju najkorisnije lokacije novih lokacija.Na primjer, vremenska serija iz dugoročne procjene oligotrofnog staništa (ALOHA) nalazi se u AEP B oligotrofnog područja (Slika 5C, oznaka 2).Budući da je ALOHA blizu granice drugog AEP-a, vremenska serija možda neće biti reprezentativna za cijelo područje, kao što je prethodno sugerirano (33).U istom AEP B, vremenska serija SEATS (Southeast Asian Time Series) nalazi se u jugozapadnom Tajvanu (34), dalje od granica drugih AEP (Slika 5C, oznaka 1) i može se koristiti kao bolja lokacija za praćenje AEPB.Vremenska serija BATS (Bermuda Atlantic Time Series Study) (Slika 5C, oznaka 4) u AEPC je vrlo blizu granice između AEP C i F, što ukazuje da praćenje AEP C pomoću BATS vremenskih serija može biti direktno problematično.Stanica P u AEP J (slika 5C, oznaka 3) je daleko od granice AEP-a, pa je reprezentativnija.Eko-pokrajina i AEP mogu pomoći da se uspostavi okvir za praćenje pogodan za procjenu globalnih promjena, jer dozvola provincija da procijene gdje uzorkovanje na licu mjesta može pružiti ključne uvide.SAGE metoda se može dalje razvijati kako bi se primjenjivala na klimatske podatke kako bi se procijenila varijabilnost koja štedi vrijeme.
Uspeh SAGE metode postiže se pažljivom primenom metoda nauke o podacima/ML i znanja specifičnih za domen.Konkretno, t-SNE se koristi za izvođenje redukcije dimenzionalnosti, čime se čuva struktura kovarijanse visokodimenzionalnih podataka i olakšava vizualizacija kovarijansne topologije.Podaci su raspoređeni u obliku pruga i kovarijansi (slika 2A), što ukazuje da mjere isključivo zasnovane na udaljenosti (kao što su K-srednje vrijednosti) nisu prikladne jer obično koriste Gausovu (kružnu) osnovnu distribuciju (o kojoj se govori u bilješci S2) .DBSCAN metoda je pogodna za bilo koju topologiju kovarijanse.Sve dok obraćate pažnju na podešavanje parametara, može se obezbediti pouzdana identifikacija.Računski troškovi t-SNE algoritma su visoki, što ograničava njegovu trenutnu primjenu na veću količinu podataka, što znači da ga je teško primijeniti na duboka ili vremenski promjenjiva polja.Rad na skalabilnosti t-SNE je u toku.Budući da je KL udaljenost lako paralelizirati, t-SNE algoritam ima dobar potencijal za proširenje u budućnosti (35).Do sada, druge obećavajuće metode smanjenja dimenzionalnosti koje mogu bolje smanjiti veličinu uključuju tehnike objedinjene višestruke aproksimacije i projekcije (UMAP), ali je neophodna evaluacija u kontekstu podataka o oceanu.Značenje bolje skalabilnosti je, na primjer, klasificiranje globalne klime ili modela različite složenosti na mješovitom sloju.Područja koja nisu bila klasifikovana od strane SAGE ni u jednoj provinciji mogu se smatrati preostalim crnim tačkama na slici 2A.Geografski, ova područja se uglavnom nalaze u visoko sezonskim područjima, što sugerira da će hvatanje ekoloških provincija koje se mijenjaju tokom vremena pružiti bolju pokrivenost.
Za konstruisanje SAGE metode korišćene su ideje iz složenih sistema/nauke o podacima, koristeći mogućnost određivanja klastera funkcionalnih grupa (mogućnost da budu veoma bliski u 11-dimenzionalnom prostoru) i određivanja provincija.Ove provincije prikazuju specifične zapremine u našem 3D t-SNE faznom prostoru.Slično, Poincaréov dio se može koristiti za procjenu “volumena” prostora stanja koji trajektorija zauzima za određivanje “normalnog” ili “haotičnog” ponašanja (36).Za izlaz statičkog 11-dimenzionalnog modela, volumen koji je zauzet nakon što su podaci konvertovani u 3D fazni prostor može se objasniti na sličan način.Odnos između geografskog područja i područja u 3D faznom prostoru nije jednostavan, ali se može objasniti u smislu ekološke sličnosti.Iz tog razloga, preferira se konvencionalnija mjera BC različitosti.
Budući rad će ponovo koristiti SAGE metodu za sezonske promjene podataka kako bi se procijenila prostorna varijabilnost identifikovanih provincija i AEP-a.Budući cilj je korištenje ove metode kako bi se odredilo koje se provincije mogu odrediti putem satelitskih mjerenja (kao što je Chl-a, reflektivnost daljinskog senzora i temperatura površine mora).Ovo će omogućiti daljinsku procjenu ekoloških komponenti i vrlo fleksibilno praćenje ekoloških provincija i njihove varijabilnosti.
Svrha ovog istraživanja je uvođenje SAGE metode, koja definira ekološku provinciju kroz njenu jedinstvenu strukturu planktonske zajednice.Ovdje će biti date detaljnije informacije o fizičkom/biogeohemijskom/ekosistemskom modelu i odabiru parametara t-SNE i DBSCAN algoritama.
Fizičke komponente modela potiču iz procjene cirkulacije okeana i klime [ECCOv4;(37) procjena globalnog stanja opisana pomoću (38).Nominalna rezolucija procjene stanja je 1/5.Metoda najmanjih kvadrata sa metodom Lagranževog množitelja koristi se za dobijanje početnih i graničnih uslova i internih parametara modela prilagođenih posmatranjem, čime se generiše MIT model opšteg ciklusa (MITgcm) (39), model Nakon optimizacije, rezultati mogu biti praćeni i posmatrani.
Biogeohemija/ekosistem ima potpuniji opis (tj. jednačine i vrijednosti parametara) u (2).Model bilježi cirkulaciju C, N, P, Si i Fe kroz neorganske i organske bazene.Verzija koja se ovdje koristi uključuje 35 vrsta fitoplanktona: 2 vrste mikroprokariota i 2 vrste mikroeukariota (prikladne za okruženja s malo nutrijenata), 5 vrsta Cryptomonas sphaeroides (sa prevlakom kalcijevog karbonata), 5 vrsta diazonijuma (može fiksirati dušik, tako da nije ograničena) dostupnost rastvorenog neorganskog azota), 11 dijatomeja (formirajući silikatni pokrivač), 10 mešovito-vegetativnih flagelata (mogu fotosintetizirati i jesti drugi plankton) i 16 zooplanktona (pasu na drugom planktonu).One se nazivaju "biogeohemijske funkcionalne grupe" jer imaju različite efekte na morsku biogeohemiju (40, 41) i često se koriste u posmatranju i studijama modela.U ovom modelu, svaka funkcionalna grupa je sastavljena od nekoliko planktona različitih veličina, s rasponom od 0,6 do 2500 μm ekvivalentnog sfernog prečnika.
Parametri koji utiču na rast fitoplanktona, ispašu i potonuće povezani su sa veličinom, a postoje specifične razlike između šest funkcionalnih grupa fitoplanktona (32).Uprkos različitim fizičkim okvirima, rezultati 51 planktonske komponente modela korišteni su u brojnim novijim studijama (42-44).
Od 1992. do 2011., fizički/biogeohemijski/ekosistemski model spajanja je trajao 20 godina.Rezultat modela uključuje biomasu planktona, koncentraciju nutrijenata i brzinu opskrbe nutrijentima (DIN, PO4, Si i Fe).U ovoj studiji, 20-godišnji prosek ovih rezultata korišćen je kao input Ekološke pokrajine.Chl, distribucija biomase planktona i koncentracije nutrijenata i distribucija funkcionalnih grupa upoređuju se sa satelitskim i in situ opservacijama [vidi (2, 44), napomenu S1 i sliku.S1 do S3].
Za SAGE metodu, glavni izvor slučajnosti dolazi iz t-SNE koraka.Slučajnost ometa ponovljivost, što znači da su rezultati nepouzdani.SAGE metoda rigorozno testira robusnost određivanjem skupa parametara t-SNE i DBSCAN, koji mogu dosljedno identificirati klastere kada se ponavljaju.Određivanje „zbunjenosti“ parametra t-SNE može se shvatiti kao određivanje stepena do kojeg mapiranje od visokih do niskih dimenzija treba da poštuje lokalne ili globalne karakteristike podataka.Dosegnuta zbrka od 400 i 300 iteracija.
Za algoritam klasteriranja DBSCAN, potrebno je odrediti minimalnu veličinu i metriku udaljenosti točaka podataka u klasteru.Minimalni broj se utvrđuje pod vodstvom stručnjaka.Ovo znanje zna šta odgovara trenutnom okviru numeričkog modeliranja i rezoluciji.Minimalni broj je 100. Veća minimalna vrijednost (manje od <135 prije nego što gornja granica zelene postane šira) može se uzeti u obzir, ali ne može zamijeniti metodu agregacije zasnovanu na BC različitosti.Stepen povezanosti (slika 6A) se koristi za postavljanje parametra ϵ, koji pogoduje većoj pokrivenosti (slika 6B).Povezivost je definirana kao složeni broj klastera i osjetljiva je na parametar ϵ.Niža povezanost ukazuje na nedovoljno uklapanje, veštačko grupisanje regiona zajedno.Visoka povezanost ukazuje na preopterećenost.Prekomjerno prilagođavanje je također problematično, jer pokazuje da početna nasumična nagađanja mogu dovesti do neponovljivih rezultata.Između ova dva ekstrema, naglo povećanje (obično nazvano "lakat") ukazuje na najbolji ϵ.Na slici 6A vidite naglo povećanje područja platoa (žuto,> 200 klastera), nakon čega slijedi naglo smanjenje (zeleno, 100 klastera), do oko 130, okruženo s vrlo malo klastera (plavo, <60 klastera) ).U najmanje 100 plavih područja, bilo jedno jato dominira cijelim okeanom (ϵ <0,42), ili većina okeana nije klasifikovana i smatra se bukom (ϵ> 0,99).Žuto područje ima vrlo varijabilnu, neponovljivu distribuciju klastera.Kako se ϵ smanjuje, buka se povećava.Zelena površina koja se naglo povećava naziva se lakat.Ovo je optimalna regija.Iako se koristi vjerovatnoća t-SNE, BC različitost unutar provincije još uvijek se može koristiti za određivanje pouzdanog grupiranja.Koristeći sliku 6 (A i B), postavite ϵ na 0,39.Što je veći minimalni broj, to je manja verovatnoća dostizanja ϵ koja omogućava pouzdanu klasifikaciju, a veća je zelena površina sa vrednošću većom od 135. Povećanje ove oblasti ukazuje da će lakat biti teže pronaći ili ne- postoji.
Nakon postavljanja parametara t-SNE, ukupan broj pronađenih klastera će se koristiti kao mjera povezanosti (A) i procenta podataka dodijeljenih klasteru (B).Crvena tačka označava najbolju kombinaciju pokrivenosti i povezanosti.Minimalni broj se određuje prema minimalnom broju koji se odnosi na ekologiju.
Za dodatne materijale za ovaj članak pogledajte http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ovo je članak otvorenog pristupa koji se distribuira pod uslovima licence Creative Commons Attribution.Članak dozvoljava neograničenu upotrebu, distribuciju i reprodukciju u bilo kom mediju pod uslovom da je originalno delo pravilno citirano.
Napomena: Od vas tražimo samo da navedete svoju adresu e-pošte kako bi osoba koju preporučite na stranici znala da želite da vidi e-poštu i da nije neželjena pošta.Nećemo uhvatiti nijednu adresu e-pošte.
Ovo pitanje se koristi za testiranje da li ste posjetitelj i sprječavanje automatskog slanja neželjene pošte.
Globalno ministarstvo za ekologiju mora odlučno je riješiti složene probleme i koristi nenadzirano ML za istraživanje struktura zajednice.
Globalno ministarstvo za ekologiju mora odlučno je riješiti složene probleme i koristi nenadzirano ML za istraživanje struktura zajednice.
Vrijeme objave: Jan-12-2021