topimg

Razjasnitev ekološke kompleksnosti: nenadzorovano učenje določa globalno morsko ekološko provinco

Predlaga se metoda nenadzorovanega učenja za določanje globalnih morskih ekoloških provinc (ekoprovinc) na podlagi strukture planktonske skupnosti in podatkov o pretoku hranil.Metoda sistematične integrirane ekološke province (SAGE) lahko prepozna ekološke pokrajine v zelo nelinearnih modelih ekosistema.Da bi se prilagodil ne-Gaussovi kovarianci podatkov, Sage za zmanjšanje dimenzije uporablja T naključno sosedo (T-SNE).S pomočjo aplikacije za hrup, ki temelji na algoritmu prostorskega združevanja v gruče na podlagi gostote (DBSCAN), je mogoče prepoznati več kot sto ekoloških provinc.Z uporabo zemljevida povezljivosti z ekološkimi razlikami kot merilom razdalje je robustna agregirana ekološka provinca (AEP) objektivno opredeljena z ugnezdenimi ekološkimi provincami.Z uporabo AEP je bil raziskan nadzor stopnje oskrbe s hranili v strukturi skupnosti.Eco-provinca in AEP sta edinstvena in lahko pomagata pri interpretaciji modela.Olajšajo lahko primerjave med modeli in lahko izboljšajo razumevanje in spremljanje morskih ekosistemov.
Province so regije, kjer je kompleksna biogeografija na morju ali kopnem organizirana v skladna in smiselna območja (1).Te province so zelo pomembne za primerjavo in kontrastne lokacije, karakterizacijo opazovanj, spremljanje in zaščito.Zaradi zapletenih in nelinearnih interakcij, ki proizvajajo te province, so metode nenadzorovanega strojnega učenja (ML) zelo primerne za objektivno določanje provinc, ker je kovarianca v podatkih kompleksna in ni Gaussova.Tukaj je predlagana metoda ML, ki sistematično identificira edinstvene morske ekološke province (eko-province) iz Darwinovega globalnega tridimenzionalnega (3D) fizičnega/ekosistemskega modela (2).Izraz "edinstven" se uporablja za označevanje, da se identificirano območje ne prekriva z drugimi območji.Ta metoda se imenuje metoda sistema integrirane ekološke province (SAGE).Za izvedbo uporabne klasifikacije mora metoda algoritma omogočati (i) globalno klasifikacijo in (ii) analizo na več lestvicah, ki jo je mogoče ugnezditi/združiti v prostoru in času (3).V tej raziskavi je bila prvič predlagana metoda SAGE in razpravljali o opredeljenih ekoloških provincah.Ekološke province lahko spodbujajo razumevanje dejavnikov, ki nadzorujejo strukturo skupnosti, nudijo koristne vpoglede za strategije spremljanja in pomagajo slediti spremembam v ekosistemu.
Kopenske province so običajno razvrščene glede na podobnosti podnebja (padavine in temperature), tla, vegetacije in favne ter se uporabljajo za pomožno upravljanje, raziskave biotske raznovrstnosti in nadzor bolezni (1, 4).Morske province je težje opredeliti.Večina organizmov je mikroskopskih s tekočimi mejami.(5) Zagotavlja eno prvih globalnih klasifikacij Ministrstva za oceanografijo na podlagi okoljskih razmer.Opredelitev teh "Longhurst" provinc vključuje spremenljivke, kot so hitrost mešanja, stratifikacija in obsevanje, pa tudi Longhurstove bogate izkušnje kot morski oceanograf, ki ima druge pomembne pogoje za morske ekosisteme.Longhurst je bil na primer uporabljen za oceno primarne proizvodnje in ogljikovih tokov, pomoči ribištva in načrtovanja opazovalnih dejavnosti (5-9).Da bi province bolj objektivno opredelili, so bile uporabljene metode, kot so nejasna logika in regionalno nenadzorovano združevanje/statistika (9-14).Namen takih metod je identificirati pomembne strukture, ki lahko identificirajo province v razpoložljivih opazovalnih podatkih.For example, dynamic marine provinces (12) use self-organizing maps to reduce noise, and use hierarchical (tree-based) clustering to determine marine color products derived from regional satellites [chlorophyll a (Chl-a), normalized Fluorescence line height and obarvana raztopljena organska snov] in fizično polje (temperatura in slanost morske površine, absolutna dinamična topografija in morski led).
Struktura Skupnosti Planktona je zaskrbljujoča, saj njegova ekologija močno vpliva na višjo raven hranil, absorpcijo ogljika in podnebje.Kljub temu je še vedno zahteven in nedostopni cilj določiti globalno ekološko provinco, ki temelji na strukturi skupnosti Plankton.Morski barvni sateliti lahko nudijo vpogled v grobozrnat klasifikacijo fitoplanktona ali predlagajo prednosti funkcionalnih skupin (15), vendar trenutno ne morejo predložiti podrobnih informacij o strukturi skupnosti.Nedavne raziskave [npr. Tara Ocean (16)] zagotavljajo meritve strukture skupnosti brez primere;Trenutno obstajajo le redke opazovanja in situ v svetovnem merilu (17).Podatki o numeričnem modelu, uporabljeni v tej študiji, imajo prednost globalne pokritosti.Modelni ekosistem je sestavljen iz 35 vrst fitoplanktona in 16 vrst zooplanktona (glejte gradiva in metode).
Zmogljive preobrazbene zmožnosti podatkovne znanosti/tehnologije ML lahko omogočijo izjemno kompleksne modelne rešitve za razkrivanje kompleksnih, a robustnih struktur v kovarianci podatkov.Robustna metoda je opredeljena kot metoda, ki lahko zvesto reproducira rezultate znotraj danega obsega napak.Celo v preprostih sistemih je določanje robustnih vzorcev in signalov lahko izziv.Dokler ni določena utemeljitev, ki vodi do opazovanega vzorca, se lahko zdi, da je nastajajoča kompleksnost zapletena/težka za razrešitev.Ključni proces določanja sestave ekosistema je po naravi nelinearen.Obstoj nelinearnih interakcij lahko zmede robustno klasifikacijo, zato se je treba izogibati metodam, ki dajejo močne predpostavke o osnovni statistični porazdelitvi kovariance podatkov.Visokodimenzionalni in nelinearni podatki so pogosti v oceanografiji in imajo lahko kovariančno strukturo s kompleksno, ne-Gaussovo topologijo.Čeprav lahko podatki z ne-Gaussovo kovariančno strukturo ovirajo robustno klasifikacijo, je metoda SAGE nova, ker je zasnovana za prepoznavanje grozdov s poljubnimi topologijami.
Cilj metode SAGE je objektivno identificirati nastajajoče vzorce, ki lahko pomagajo pri nadaljnjem ekološkem razumevanju.Po delovnem toku, ki temelji na grozdu, podobnem (19), se spremenljivke ekološkega toka in pretoka hranil uporabijo za določitev edinega grozda v podatkih, imenovanega ekološka provinca.Metoda SAGE, predlagana v tej študiji (slika 1), najprej zmanjša dimenzionalnost s 55 na 11 dimenzij s seštevanjem funkcionalnih skupin planktona, definiranih vnaprej (glejte Materiali in metode).Z uporabo metode vdelave t-naključnega soseda (t-SNE) se velikost dodatno zmanjša s projiciranjem verjetnosti v 3D prostor.Nenadzorovano grozdje lahko določi ekološko zaprta območja [prostorsko grozdje na podlagi gostote (DBSCAN) za aplikacije, ki temeljijo na hrupu].Tako t-SNE kot DBSCAN sta uporabna za inherentne podatke numeričnega modela nelinearnega ekosistema.Nato reproducirajo nastalo ekološko provinco na zemljo.Ugotovljenih je več kot sto edinstvenih ekoloških provinc, primernih za regionalne raziskave.Da bi upoštevali globalno dosleden model ekosistema, se uporablja metoda SAGE za združevanje ekoloških provinc v združene ekološke province (AEP), da se izboljša učinkovitost ekoloških provinc.Stopnja združevanja (imenovana "zapletenost") je mogoče prilagoditi tako, da je potrebna stopnja podrobnosti.Določite minimalno kompleksnost robustne AEP.Poudarek izbora je metoda SAGE in raziskovanje najmanj zahtevnih primerov AEP za določitev nadzora strukture nujne skupnosti.Vzorce je mogoče nato analizirati, da zagotovimo ekološke vpoglede.Tukaj predstavljeno metodo je mogoče uporabiti tudi za obsežnejšo primerjavo modelov, na primer z vrednotenjem lokacij podobnih ekoloških provinc, najdenih v različnih modelih, da se poudarijo razlike in podobnosti, da se primerjajo modeli.
(A) shematični diagram delovnega toka za določanje ekološke province;Zanemarljiva vrednost in trajna ledena površina.Podatke smo poenotili in standardizirali.Navedite 11-dimenzionalne podatke algoritmu T-SNE, da poudarite statistično podobne kombinacije funkcij.
Metoda Sage uporablja izhod globalnega 3D fizičnega/ekosistema numeričnega modela za opredelitev ekološke province [Darwin (2);glej materiale in metode ter opombo S1].Sestavni deli ekosistema so sestavljeni iz 35 vrst fitoplanktona in 16 vrst zooplanktona s sedmimi vnaprej določenimi funkcionalnimi skupinami: prokarionti in evkarionti, prilagojeni okolju z nizko vsebnostjo hranil, kokcidije s prevleko iz kalcijevega karbonata in močna fiksacija dušika. Dušikova hranila (običajno manjkajo). Pomembna hranila) lahko s siliceznim pokrivanjem naredijo druge fotosinteze Planktona in pašo mešanih hranilnih flagelatov in pastirjev zooplanktona.Razpon velikosti je 0,6 do 2500 μm ekvivalentnega sferičnega premera.Model porazdelitev velikosti fitoplanktona in funkcionalnega združevanja zajema celotne značilnosti, ki jih opazimo pri satelitskih in in-situ opazovanjih (glej slike S1 do S3).Podobnost med numeričnim modelom in opazovanim oceanom kaže, da so province, opredeljene z modelom, lahko uporabne za ocean in situ.Upoštevajte, da ta model zajema le določeno raznolikost fitoplanktona in le nekatere fizične in kemične sile v situ oceanu.Metoda SAGE lahko ljudem omogoči boljše razumevanje zelo regionalnega nadzornega mehanizma vzorčne strukture skupnosti.
Če vključite samo vsoto površinske biomase (s povprečnim časom 20 let) v vsako funkcionalno skupino Plankton, se lahko zmanjša dimenzionalnost podatkov.Potem ko so prejšnje študije pokazale svojo ključno vlogo pri postavljanju strukture skupnosti, je vključeval tudi izraze površinskih virov za hranilne tokove (oskrbo z dušikom, železom, fosfatom in silikonsko kislino) [npr. (20, 21)].Seštevek funkcionalnih skupin zmanjša problem s 55 (51 plankton in 4 tokovi hranil) na 11 dimenzij.V tej začetni študiji zaradi računalniških omejitev, ki jih nalaga algoritem, globina in časovna variabilnost nista bili upoštevani.
Metoda SAGE lahko prepozna pomembna razmerja med nelinearnimi procesi in ključnimi značilnostmi interakcij med funkcionalno skupinsko biomaso in hranilnim tokom.Uporaba 11-dimenzionalnih podatkov, ki temeljijo na metodah evklidskega učenja na daljavo (na primer K-sredstvi), ne more pridobiti zanesljivih in ponovljivih provinc (19, 22).To je zato, ker v osnovni porazdelitvi kovariance ključnih elementov, ki definirajo ekološko provinco, ni Gaussove oblike.K-srednje vrednosti Voronoijevih celic (ravne črte) ne morejo ohraniti ne-Gaussove osnovne porazdelitve.
Biomasa sedmih planktonskih funkcionalnih skupin in štirih hranilnih tokov tvori 11-dimenzionalni vektor x.Zato je x vektorsko polje na mreži modela, kjer vsak element xi predstavlja 11-dimenzionalni vektor, definiran na horizontalni mreži modela.Vsak indeks I edinstveno identificira omrežno točko na krogli, kjer (LON, LAT) = (ϕi, θi).Če je biomasa modelne mrežne enote manjša od 1,2 × 10-3 mg Chl/m3 ali stopnja pokritosti z ledom presega 70 %, se uporabi in zavrže dnevnik podatkov o biomasi.Podatki so normalizirani in standardizirani, tako da so vsi podatki v območju [0 do 1], srednja vrednost se odstrani in spreminja na odstopanje enote.To se naredi tako, da značilnosti (biomasa in tok hranil) niso omejene s kontrastom v območju možnih vrednosti.Združevanje v gruče bi moralo zajeti razmerje sprememb iz ključne verjetnostne razdalje med značilnostmi in ne geografske razdalje.S kvantificiranjem teh razdalj se pojavijo pomembne značilnosti, medtem ko so nepotrebne podrobnosti zavržene.Z ekološkega vidika je to potrebno, ker imajo lahko nekatere vrste fitoplanktona z malo biomase večje biogeokemične učinke, kot je fiksacija dušika z diazotrofnimi bakterijami.Pri standardizaciji in normalizaciji podatkov bodo te vrste spremenljivk poudarjene.
To je nujen korak za identifikacijo robustnega združevanja v gruče v podatkih o funkcijah, hkrati pa se izogibajte nekonvergentnim rešitvam (opomba S2).Z uporabo Gaussovih jeder t-SNE ohranja statistične lastnosti podatkov tako, da preslika vsak visokodimenzionalni objekt v točko v 3D faznem prostoru, s čimer zagotovi, da je verjetnost podobnih objektov v visoki in nizki smeri velika v visoki. dimensional space (24).Glede na nabor N visokodimenzionalnih objektov x1,…,xN algoritem t-SNE reducira z minimiziranjem divergence Kullback-Leibler (KL) (25).Divergenca KL je merilo, kako drugačna je verjetnostna porazdelitev od druge referenčne verjetnostne porazdelitve, in lahko učinkovito oceni možnost korelacije med nizkodimenzionalnimi predstavitvami visokodimenzionalnih značilnosti.Če je xi i-ti objekt v N-dimenzionalnem prostoru, je xj j-ti objekt v N-dimenzionalnem prostoru, yi je i-ti objekt v nizkodimenzionalnem prostoru in yj je j-ti objekt v nizkodimenzionalnem prostoru. -dimenzionalni prostor, potem t -SNE definira verjetnost podobnosti ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) in za niz zmanjšanja razsežnosti q∣j = (1+ ∥ yi-yj∥2) -1∑k ≠ i (1 + ∥yj-yk∥2) -1
Z uporabo podatkov daljinskega zaznavanja sta Lunga et al.(27) ponazarja, kako uporabiti metodo SNE za poudarjanje kompleksnih in nelinearnih spektralnih značilnosti, ki odstopajo od Gaussove porazdelitve.
(A) Modelirana stopnja oskrbe s hranili, biomasa funkcionalne skupine fitoplanktona in zooplanktona, narisana z algoritmom t-SNE in obarvana po provincah z uporabo DBSCAN.Vsaka točka predstavlja točko v visokodimenzionalnem prostoru, kot je prikazano na sliki 6B, večina točk je zajetih.Gredi se nanašajo na velikosti "t-SNE" 1, 2 in 3. (B) Geografska projekcija province, ki jo je našel DBSCAN na mreži zemljepisne širine in dolžine izvora.Barvo je treba obravnavati kot katero koli barvo, vendar mora ustrezati (A).
Točke na grafu razpršenosti t-SNE na sliki 2A so povezane z zemljepisno širino in dolžino.Če sta dve točki na sliki 2a blizu drug drugemu, je to zato, ker sta njihovi biomasi in hranilni tokovi podobni, ne zaradi geografske bližine.Barve na sliki 2A so grozdi, odkrite z metodo DBSCAN (28).When looking for dense observations, the DBSCAN algorithm uses the distance in the 3D representation between the points (ϵ = 0.39; for information about this choice, see Materials and Methods), and the number of similar points is required to define the cluster (here 100 točk, glejte zgoraj).Metoda DBSCAN ne daje nobenih predpostavk o obliki ali številu grozdov v podatkih, kot je prikazano spodaj:
3) Za vse točke, opredeljene kot znotraj razdalje znotraj, ponovite korak 2 iterativno, da določite mejo grozda.Če je število točk večje od nastavljene minimalne vrednosti, je označeno kot grozd.
Podatki, ki ne ustrezajo minimalnemu članu grozda in metrika razdalje, se štejejo za "hrup" in niso dodeljeni barvi.DBSCAN je v najslabšem primeru hiter in razširljiv algoritem z zmogljivostjo O (N2).Za trenutno analizo dejansko ni naključna.Najmanjše število točk je določeno s strokovno oceno.Po nastavitvi razdalje po tem, rezultat ni dovolj stabilen v območju ≈ ± 10.Ta razdalja je nastavljena s pomočjo povezljivosti (slika 6A) in odstotka pokritosti oceana (slika 6B).Visoka povezljivost kaže na preobremenitev.
115 grozdov, opredeljenih na sliki 2A, je projiciranih nazaj na zemljo na sliki 2B.Slika 2B to prikazuje z enakimi barvami grozda kot slika 2A.
Območje na sliki 2B je lahko kvalitativno podobno uveljavljenemu območju v fizični in/ali biogeokemiji oceana.Na primer, grozdi v Južnem oceanu so consko simetrični, pojavljajo se oligotrofni vrtinci, oster prehod pa kaže na vpliv pasatov.Na primer, v ekvatorialnem Tihem oceanu so vidne različne regije, povezane z vzponom.
Da bi razumeli ekološko okolje ekološkega provinca, smo za oceno ekologije v grozdu uporabili različno različno indeks razlike Bray-Curtis (BC) (29).Indikator BC je statistični podatek, ki se uporablja za količinsko opredelitev razlike v strukturi skupnosti med dvema različnima območjema.Meritev BC se uporablja za biomaso 51 vrst fitoplanktona in zooplanktona BCninj = 1-2CninjSni + Snj
Bcninj se nanaša na podobnost med kombiniranim Ni in kombiniranim NJ, kjer je Cninj minimalna vrednost ene same vrste biomase, ki obstaja tako v kombinacijah Ni kot NJ, SNI pa predstavlja vsoto vseh biomase, ki obstajajo v kombinacijah Ni in SNJ.Razlika v BC je podobna ukrepu razdalje, vendar deluje v neevklidskem prostoru, kar je verjetno bolj primerno za ekološke podatke in njegovo razlago.
Za vsako gručo, opredeljeno na sliki 2B, je mogoče oceniti podobnost BC znotraj province in med provincami.Razlika BC znotraj province se nanaša na razliko med povprečno vrednostjo province in vsako točko v provinci.Razlika med provincami BC se nanaša na podobnost med eno provinco in drugimi provincami.Slika 3a prikazuje simetrično matrico BC (0, črna: popolnoma ustrezna; 1, bela: popolnoma drugačna).Vsaka vrstica v grafu prikazuje vzorec v podatkih.Slika 3B prikazuje geografski pomen rezultatov BC na sliki 3A za vsako provinco.Slika 3B za provinco na območju z nizko vsebnostjo hrane in hranil kaže, da je simetrija velikih območij okoli ekvatorja in Indijskega oceana v bistvu podobna, vendar so višje zemljepisne širine in območja dviganja bistveno drugačna.
(A) Stopnja razlike v BC, ocenjena za vsako provinco, na podlagi globalnega 20-letnega povprečnega svetovnega povprečja 51 planktona.Upoštevajte pričakovano simetrijo vrednosti.(B) Prostorska projekcija stolpca (ali vrstice).Za provinco v distrofičnem krogu je bila ocenjena globalna porazdelitev podobnosti BC in ocenjena globalno 20-letno povprečje.Črna (BC = 0) pomeni isto območje, bela (BC = 1) pa ne pomeni podobnosti.
Slika 4A prikazuje razliko v BC znotraj vsake province na sliki 2b.
(A, B in D) Razlika BC znotraj province je ovrednotena kot povprečna razlika BC med vsako skupnostjo mrežnih točk in povprečno provinco, kompleksnost pa se ne zmanjša.(2) Globalna povprečna razlika znotraj provinca BC je 0,227 ± 0,117.To je merilo klasifikacije, ki temelji na ekološki motivaciji, ki jo je predlagalo to delo [zelena črta v (c)].(C) Povprečna razlika BC znotraj province: črna črta predstavlja razliko BC znotraj province z naraščajočo kompleksnostjo.2σ izvira iz 10 ponovitev postopka identifikacije eko-province.Za skupno kompleksnost provinc, ki jih je odkril DBSCAN, (A) kaže, da je razlika BC v provinci 0,099, razvrstitev kompleksnosti, ki jo predlaga (C), pa je 12, kar ima za posledico razliko BC 0,200 v provinci.(D).
Na sliki 4B je biomasa 51 vrst planktona uporabljena za predstavitev enakovredne razlike BC v provinci Longhurst.Skupno povprečje vsake province je 0,227, standardna deviacija točk mreže glede na razliko v provinci BC je 0,046.To je večje od grozda, opredeljenega na sliki 1B.Namesto tega se je z uporabo vsote sedmih funkcionalnih skupin povprečna razlika med BC v Longhurstu povečala na 0,232.

Eden od namenov province je spodbujanje razumevanja lokacije in upravljanja province.Za določitev izrednih situacij metoda na sliki 1b ponazarja gnezdenje ekološko podobnih pokrajin.Eko-proizvajalci so združeni na podlagi ekološke podobnosti, takšno združevanje pokrajin pa se imenuje AEP.Nastavite nastavljivo "kompleksnost" glede na skupno število provinc, ki jih je treba upoštevati.Izraz "kompleksnost" se uporablja, ker omogoča prilagajanje ravni atributov v sili.Za opredelitev smiselnih združevanj se kot merilo uporabi povprečna razlika BC znotraj province 0,227 od Longhursta.Pod tem merilom uspešnosti se združene province ne štejejo več za uporabne.
Kot je prikazano na sliki 3B, so globalne ekološke pokrajine skladne.Z uporabo medprovincialnih razlik BC je razvidno, da so nekatere konfiguracije zelo "pogoste".Po navdihu metod genetike in teorije grafov se »povezani grafi« uporabljajo za razvrščanje >100 provinc glede na province, ki so jim najbolj podobne.Metrika „povezljivosti“ je določena z uporabo medprovincialne razlike v BC (30).Število pokrajin z večjim prostorom za razvrščanje> 100 provinc je mogoče tukaj navesti kot zapletenost.AEP je izdelek, ki razvršča več kot 100 provinc kot najbolj prevladujočih/najbližjih ekoloških provinc.Vsaka ekološka provinca je dodeljena prevladujoči/zelo povezani ekološki provinci, ki je najbolj podobna jim.To združevanje, ki ga določa razlika BC, omogoča ugnezdeni pristop k globalni ekologiji.
Izbrana kompleksnost je lahko poljubna vrednost od 1 do celotne kompleksnosti na sl.2A.Pri manjši zapletenosti se lahko AEP zaradi koraka zmanjšanja dimenzij (T-SNE) degenerira zaradi verjetnostne dimenzijske stopnje.Degeneracija pomeni, da se lahko ekološke pokrajine med iteracijami dodelijo različnim AEP -om in s tem spreminjajo pokrito geografsko območje.Slika 4C prikazuje širjenje razlik v BC znotraj provinc v AEP -jih povečanje zapletenosti v 10 izvedbah (ilustracija na sliki 1b).Na sliki 4C je 2σ (modra površina) merilo razgradnje v 10 izvedbah, zelena črta pa predstavlja referenčno vrednost Longhurst.Dejstva so dokazala, da lahko kompleksnost 12 ohrani razliko BC v provinci pod Longhurstovim merilom pri vseh izvedbah in ohrani razmeroma majhno razgradnjo 2σ.Če povzamemo, najmanjša priporočena kompleksnost je 12 AEP-jev, povprečna razlika med in province BC, ocenjena z uporabo 51 vrst planktona, pa je 0,198 ± 0,013, kot je prikazano na sliki 4D.S pomočjo vsote sedmih planktonskih funkcionalnih skupin je povprečna razlika BC znotraj province 2σ namesto 0,198 ± 0,004.Primerjava med razlikami v BC, izračunani s skupno biomaso sedmih funkcionalnih skupin ali biomaso vseh 51 vrst planktona Za trening.
Glede na namen katere koli raziskave se lahko upoštevajo različne stopnje kompleksnosti.Regionalne študije lahko zahtevajo popolno kompleksnost (tj. vseh 115 provinc).Za primer in zaradi jasnosti upoštevajte najmanjšo priporočeno kompleksnost 12.
Kot primer uporabnosti metode SAGE se tukaj uporablja 12 AEP z minimalno kompleksnostjo 12 za raziskovanje nadzora nad strukturo skupnosti.Slika 5 prikazuje ekološka vpogled, razvrščen z AEP (od A do L): v Redfield Stoichiometricy, geografski meri (slika 5C), sestava funkcionalne skupine biomase (slika 5A) in oskrbo s hranili (slika 5B) se izvajajo z n zooom.Prikazano je razmerje (N:Si:P:Fe, 1:1:16:16×103).Za slednjo ploščo je P pomnoženo s 16 in Fe, pomnoženo s 16 × 103, tako da je črtni graf enakovreden prehranskim zahtevam fitoplanktona.
Province so razvrščene v 12 AEPS A do L. (A) Biomasa (MGC/M3) ekosistemov v 12 provincah.(B) Hitrost pretoka pretoka raztopljenega anorganskega dušika (N), železa (Fe), fosfata (P) in silizične kisline (SI) (mmol/m3 na leto).Fe in P se pomnožita s 16 oziroma 16 × 103, tako da so trakovi standardizirani na zahteve po fitoplanktonu s stehiometrijo.(C) Upoštevajte razliko med polarnimi regijami, subtropskimi cikloni in večjimi sezonskimi/naraščajočimi regijami.Postaje za spremljanje so označene na naslednji način: 1, sedeži;
Identificirani AEP je edinstven.V Atlantskem in Tihem oceanu je nekaj simetrije okoli ekvatorja, v Indijskem oceanu pa obstaja podobno, a razširjeno območje.Nekateri AEP sprejemajo zahodno stran celine, povezane s vzponom.Cirkolarni tok južnega pola velja za veliko zonsko značilnost.Subtropski ciklon je zapletena serija oligotrofne AEP.V teh provincah je očiten znani vzorec razlik med biomaso med oligotrofičnimi vrtinci, ki prevladujejo v planktonu, in polarnimi regijami, bogata z diatomom.
AEP z zelo podobno skupno fitoplanktonsko biomaso lahko imajo zelo različne strukture skupnosti in pokrivajo različna geografska območja, kot so D, H in K, ki imajo podobno skupno biomaso fitoplanktona.AEP H obstaja predvsem v ekvatorialnem Indijskem oceanu, tam pa je več diazotrofnih bakterij.AEP D najdemo v več bazenih, vendar je še posebej izrazit v Pacifiku okoli območij z visokim donosom okoli ekvatorialnega vzpona.Oblika te pacifiške province spominja na planetarni vlak valov.V AEP D je malo diazobakterij in več stožcev.V primerjavi z drugimi dvema provincama je AEP K najdemo le v visokogorju Arktičnega oceana, na voljo pa je več diatomov in manj planktonov.Omeniti velja, da je tudi količina planktona v teh treh regijah zelo različna.Med njimi je številčnost planktona AEP K razmeroma nizka, medtem ko je AEP D in H razmeroma velika.Zato so te pokrajine kljub svoji biomasi (in zato podobno kot Chl-A) precej drugačne: testiranje v provinci na osnovi Chl teh razlik morda ne bo zajelo.
Očitno je tudi, da so lahko nekateri AEP z zelo različno biomaso podobni glede na strukturo fitoplanktonske skupnosti.To je na primer vidno pri AEP D in E. Sta blizu drug drugemu, v Tihem oceanu pa je AEP E blizu visoko produktivnemu AEPJ.Podobno ni jasne povezave med fitoplanktonsko biomaso in številčnostjo zooplanktona.
AEP je mogoče razumeti v smislu hranil, ki jim jih zagotavljajo (slika 5B).Diatomi obstajajo le tam, kjer je dovolj oskrbe silikonske kisline.Na splošno je večja oskrba silicinske kisline, višja je biomasa diatomov.Diatome je mogoče opaziti v AEP A, J, K in L. Razmerje diatomske biomase glede na druge fitoplanktona je določeno z N, P in Fe, ki so navedeni glede na povpraševanje po diatomu.Na primer, v AEP L prevladujejo diatomeje.V primerjavi z drugimi hranili ima SI največjo ponudbo.V nasprotju s tem ima AEP J kljub večji produktivnosti manj diatomov in manj oskrbe s silicijem (vse in glede na druge hranilne snovi).
Diazonijeve bakterije imajo sposobnost pritrditve dušika, vendar rastejo počasi (31).Soobstajajo z drugimi fitoplanktonom, kjer sta železo in fosfor pretirana glede na povpraševanje po nediazonijevih hranilih (20, 21).Treba je omeniti, da je diazotrofna biomasa sorazmerno visoka, zaloga Fe in P pa relativno velika glede na zalogo N. Na ta način, čeprav je skupna biomasa v AEP J večja, je biomasa diazonija v AEP H Večja od tistega v J. Upoštevajte, da sta AEP J in H geografsko zelo različna, H pa v ekvatorialnem Indijskem oceanu.
Če edinstvena struktura ekosistema ni razdeljena na province, vpogledi, pridobljeni z 12 modelih najnižje zapletenosti AEP, ne bodo tako jasni.AEP, ki ga ustvari SAGE, olajša skladno in hkratno primerjavo zapletenih in visokodimenzionalnih informacij iz modelov ekosistema.AEP učinkovito poudarja, zakaj CHL ni dobra in alternativna metoda za določanje strukture skupnosti ali številčnosti zooplanktona pri višjih nivojih hranil.Podrobna analiza tekočih raziskovalnih tem je zunaj obsega tega članka.Metoda Sage ponuja način za raziskovanje drugih mehanizmov v modelu, ki jih je lažje ravnati kot ogled od točke do točke.
Metoda SAGE je predlagana za razjasnitev izjemno zapletenih ekoloških podatkov iz globalnih fizičnih/biogeokemičnih/ekosistemov numeričnih modelov.Ekološka provinca je določena s skupno biomaso funkcionalnih skupin navzkrižnih planktona, uporaba algoritma za zmanjšanje dimenzij dimenzij T-SNE in grozd z uporabo nenadzorovane metode ML DBSCAN.Za izpeljavo robustnega AEP, ki ga je mogoče uporabiti za globalno interpretacijo, se uporablja medprovincialna teorija razlik/grafov BC za metodo gnezdenja.Ekoprovinca in AEP sta gradbeno edinstvena.Gnezdenje AEP je mogoče prilagoditi med popolno zapletenostjo prvotne ekološke province in priporočenim minimalnim pragom 12 AEP.Gnezdenje in določanje minimalne zapletenosti AEP se šteje za ključne korake, ker verjetnost T-SNE degenerira AEP <12 kompleksnosti.Metoda SAGE je globalna, njegova zapletenost pa se giblje od> 100 AEP do 12. Zaradi poenostavitve je trenutni poudarek na zapletenosti 12 globalnih AEP.Prihodnje raziskave, zlasti regionalne študije, se lahko zdijo manjša prostorska podskupina globalnih ekoloških provinc, ki so uporabna in se lahko združijo na manjšem območju, da bi izkoristili ista ekološka spoznanja, o katerih smo govorili.Ponuja predloge o tem, kako lahko te ekološke pokrajine in vpoglede, pridobljene od njih, uporabijo za nadaljnje ekološko razumevanje, olajšajo primerjavo modela in potencialno izboljšajo spremljanje morskih ekosistemov.
Ekološka provinca in AEP, identificirana z metodo SAGE, temeljijo na podatkih v numeričnem modelu.Po definiciji je numerični model poenostavljena struktura, ki poskuša zajeti bistvo ciljnega sistema, različni modeli pa bodo imeli drugačno porazdelitev planktona.Numerični model, uporabljen v tej študiji, ne more v celoti zajeti nekaterih opazovanih vzorcev (na primer v ocenah CHL za ekvatorialno regijo in Južni ocean).Zajet je le majhen del raznolikosti v resničnem oceanu in MESO in sub-Mezoskala ni mogoče rešiti, kar lahko vpliva na tok hranil in strukturo manjše obsega.Kljub tem pomanjkljivostim se je izkazalo, da je AEP zelo koristen pri razumevanju kompleksnih modelov.Z ocenjevanjem, kje so podobne ekološke province, AEP zagotavlja potencialno orodje za primerjavo numeričnih modelov.Trenutni numerični model zajema celoten vzorec koncentracije daljinskega zaznavanja fitoplanktona CHL-A in porazdelitve velikosti planktona in funkcionalne skupine (opomba S1 in slika S1) (2, 32).
Kot kaže konturna linija 0,1 mgchl-a/m-3, je AEP razdeljen na oligotrofno območje in mezotrofno območje (slika S1B): AEP B, C, E, E, F in G so oligotrofna območja, preostala območja pa so located Higher Chl-a.AEP prikazuje nekaj korespondence s provinco Longhurst (slika S3A), na primer Južni ocean in ekvatorialni Pacifik.V nekaterih regijah AEP pokriva več regij Longhurst in obratno.Ker je namen razmejitve provinc na tem območju in v Longhurstu drugačen, je pričakovati, da bodo razlike.Več AEP v provinci Longhurst kaže, da imajo lahko nekatera območja s podobno biogeokemijo zelo različne strukture ekosistemov.AEP ima določeno korespondenco s fizičnimi stanji, kot je razkrito z uporabo nenadzorovanega učenja (19), na primer v državah z visokimi utripanjem (na primer Južni ocean in ekvatorialni Tihi ocean; slika S3, C in D).Te korespondence kažejo, da na strukturo skupnosti planktona močno vpliva oceanska dinamika.Na območjih, kot je Severni Atlantik, AEP prečka fizične province.Mehanizem, ki povzroča te razlike, lahko vključuje procese, kot je transport prahu, kar lahko privede do popolnoma različnih prehranskih programov tudi v podobnih fizičnih pogojih.
Ministrstvo za ekologijo in AEP sta poudaril, da samo uporaba CHL ne more prepoznati ekoloških komponent, kot je že uresničila skupnost morske ekologije.To je razvidno iz AEP s podobno biomaso, vendar bistveno drugačno ekološko sestavo (kot sta D in E).V nasprotju s tem imajo AEP, kot sta D in K, zelo različno biomaso, vendar podobno ekološko sestavo.AEP poudarja, da je odnos med biomaso, ekološko sestavo in številčnostjo zooplanktona zapleten.Na primer, čeprav AEP J izstopa v smislu fitoplanktona in biomase Plankton, imata AEP A in L podobno biomaso Planktona, vendar ima A višjo obilico planktona.AEP poudarja, da fitoplanktonske biomase (ali CHL) ni mogoče uporabiti za napovedovanje biomase zooplanktona.Zooplankton je temelj ribiške prehranjevalne verige in natančnejše ocene lahko privedejo do boljšega upravljanja virov.Prihodnji morski barvni sateliti [na primer PACE (plankton, aerosol, oblak in morski ekosistem)] bodo morda bolje postavljeni, da bodo pomagali oceniti strukturo skupnosti fitoplanktona.Uporaba napovedi AEP lahko potencialno olajša oceno zooplanktona iz vesolja.Metode, kot je SAGE, skupaj z novimi tehnologijami in vse več terenskimi podatki, ki so na voljo za raziskave resnice na tleh (kot je Tara in nadaljnje raziskave), lahko skupaj naredijo korak k satelitskemu spremljanju zdravja ekosistema.
Metoda SAGE ponuja priročen način za oceno nekaterih mehanizmov, ki nadzorujejo značilnosti province, kot so biomasa/CHL, neto primarna proizvodnja in struktura skupnosti.Na primer, relativna količina diatomov je določena z neravnovesjem v oskrbi Si, N, P in FE glede na fitoplanktonske stehiometrične zahteve.Pri uravnoteženi stopnji ponudbe v skupnosti prevladujejo diatomi (L).Kadar je stopnja ponudbe neuravnotežena (torej je ponudba silicija nižja od potrebe po hranilih po diatomih), diatomi predstavljajo le majhen delež porcije (K).Ko dobava Fe in P presega oskrbo N (na primer E in H), bodo diazotrofne bakterije močno rasle.V kontekstu, ki ga zagotavlja AEP, bo raziskovanje mehanizmov nadzora postalo bolj koristno.
Ekoprovinca in AEP sta območji s podobnimi skupnostnimi strukturami.Časovna vrsta z določene lokacije v ekološki provinci ali AEP je mogoče obravnavati kot referenčno točko in lahko predstavlja območje, ki ga pokriva ekološka provinca ali AEP.Dolgoročne nadzorne postaje na kraju samem zagotavljajo takšne časovne vrste.Dolgoročni nabori podatkov in situ bodo še naprej imeli neprecenljivo vlogo.Z vidika spremljanja strukture skupnosti lahko metodo SAGE obravnavamo kot način, kako pomagati določiti najbolj uporabno lokacijo novih mest.Na primer, časovna serija dolgoročne ocene oligotrofne habitate (ALOHA) je v AEP B oligotrofnega območja (slika 5C, nalepka 2).Ker je Aloha blizu meji drugega AEP -a, časovna serija morda ni reprezentativna za celotno območje, kot je bilo predhodno predlagano (33).V istem AEP B se sedeži časovnih vrst (časovna serija jugovzhodne Azije) nahajajo na jugozahodnem Tajvanu (34), dlje od meja drugih AEP (slika 5C, nalepka 1) in jih je mogoče uporabiti kot boljšo lokacijo za spremljanje AEPB.Časovna serija netopirjev (Bermuda Atlantic Time Series) (slika 5C, nalepka 4) v AEPC je zelo blizu meji med AEP C in F, kar kaže na to, da je spremljanje AEP C z uporabo časovnih vrst netopirjev lahko neposredno problematično.Postaja P v AEP J (slika 5C, oznaka 3) je daleč od meje AEP, zato je bolj reprezentativna.Eko-Province in AEP lahko pomagata vzpostaviti okvir za spremljanje, ki je primeren za oceno globalnih sprememb, saj dovoljenje pokrajin za oceno, kje lahko vzorčenje na kraju samem omogoči ključni vpogled.Metodo SAGE je mogoče nadalje razviti za uporabo pri podnebnih podatkih za oceno variabilnosti, ki prihrani čas.
Uspeh metode SAGE je dosežen s skrbno uporabo metod znanosti o podatkih/ML in znanja, specifičnega za področje.Konkretno, T-SNE se uporablja za izvajanje zmanjšanja dimenzij, ki ohranja kovariance strukturo visokodimenzionalnih podatkov in olajša vizualizacijo kovariance topologije.Podatki so razporejeni v obliki trakov in kovarijanc (slika 2A), kar kaže, da izključno ukrepi, ki temeljijo na razdalji (na primer K-sredstva), niso primerni, ker običajno uporabljajo Gaussovo (krožno) osnovno porazdelitev (obravnavano v opombi S2) .Metoda DBSCAN je primerna za katero koli kovariančno topologijo.Dokler ste pozorni na nastavitve parametrov, je mogoče zagotoviti zanesljivo identifikacijo.Računalniški stroški algoritma T-SNE so visoki, kar omejuje trenutno aplikacijo na večjo količino podatkov, kar pomeni, da se je težko uporabiti za globoka ali časovno spreminjajoča se polja.Delo na razširljivosti t-SNE je v teku.Ker je razdaljo KL enostavno vzporediti, ima algoritem t-SNE dober potencial za razširitev v prihodnosti (35).Zaenkrat so tudi druge obetavne metode zmanjšanja dimenzij, ki lahko bolje zmanjšajo velikost, vključujejo tehnike poenotenega približka in projekcije (UMAP), vendar je potrebna ocena v okviru oceanskih podatkov.Pomen boljše razširljivosti je na primer razvrščanje globalnega podnebja ali modelov z različno kompleksnostjo na mešani plasti.Območja, ki jih žajbelj ne uvrsti v katero koli provinco, lahko na sliki 2A obravnavamo kot preostale črne pike.Geografsko gledano so ta območja predvsem na zelo sezonskih območjih, kar kaže na to, da bo zajem ekoloških provinc, ki se sčasoma spreminjajo, zagotovilo boljše pokritost.
Za konstruiranje metode žajblja so bile uporabljene ideje iz zapletenih sistemov/podatkovnih znanosti z uporabo sposobnosti določanja grozdov funkcionalnih skupin (možnost, da se v 11-dimenzionalnem prostoru zelo zaprejo) in določitve provinc.Te pokrajine prikazujejo posebne količine v našem 3D T-SNE faznem prostoru.Podobno lahko del Poincaré uporabimo za oceno "volumna" državnega prostora, ki ga zaseda pot, da se določi "normalno" ali "kaotično" vedenje (36).Za statični 11-dimenzionalni izhod modela je mogoče podobno razložiti glasnost, ki se zavzema po pretvorbi podatkov v 3D fazni prostor.Razmerje med geografskim območjem in površino v 3D faznem prostoru ni preprosto, vendar ga je mogoče razložiti v smislu ekološke podobnosti.Zaradi tega je prednostna bolj običajna ukrep razlike v BC.
Prihodnje delo bo ponovno uporabilo metodo SAGE za sezonsko spreminjanje podatkov za oceno prostorske spremenljivosti identificiranih provinc in AEP.Prihodnji cilj je uporabiti to metodo za lažje določitev, katere pokrajine je mogoče določiti s satelitskimi meritvami (kot so CHL-A, odbojnost na daljinsko zaznavanje in temperatura morske površine).To bo omogočilo oceno daljinskega zaznavanja ekoloških komponent in zelo prilagodljivo spremljanje ekoloških provinc in njihovo spremenljivost.
Namen te raziskave je uvesti metodo Sage, ki definira ekološko provinco s svojo edinstveno strukturo skupnosti Plankton.Tu bodo zagotovljene podrobnejše informacije o fizičnem/biogeokemičnem/ekosistemu in izbiri parametrov algoritmov T-SNE in DBSCAN.
Fizične sestavine modela izhajajo iz ocene obtoka oceana in podnebja [ECCOV4;(37) Globalna ocena države, opisana s (38).Nominalna ločljivost ocene stanja je 1/5.Metoda najmanjših kvadratov z metodo Lagrangian Multiphier se uporablja za pridobivanje začetnih in mejnih pogojev ter notranjega parametra modela, prilagojene z opazovanjem, s čimer se ustvari prosti model MIT splošnega cikla (MITGCM) (39), model po optimizaciji, rezultati lahko slediti in opazovati.
Biogeokemija/ekosistem ima v (2) popolnejši opis (tj. enačbe in vrednosti parametrov).Model zajame kroženje C, N, P, Si in Fe skozi anorganske in organske jezerce.Različica, uporabljena tukaj, vključuje 35 vrst fitoplanktona: 2 vrsti mikroprokariotov in 2 vrsti mikroevkariotov (primernih za okolje z nizko zaužitjem), 5 vrst Cryptomonas sphaeroides (s kalcijevim karbonatnim premazom), 5 vrst diazonija (lahko pritrdimo nitrogen (lahko pritrdimo nitrogen, tako torej. ni omejena) razpoložljivost raztopljenega anorganskega dušika), 11 diatomov (tvori silicijevo platnico), 10 mešanih vegetativnih flagelatov (lahko fotosintezizira in poje druge planktone) in 16 zooplanktona (paša na drugem planktonu).Temu se imenujejo "biogeokemijske funkcionalne skupine", ker imajo različne učinke na morsko biogeokemijo (40, 41) in se pogosto uporabljajo pri opazovanju in modelnih študijah.V tem modelu je vsaka funkcionalna skupina sestavljena iz več planktonov različnih velikosti, razpon od 0,6 do 2500 μm ekvivalentnega sferičnega premera.
Parametri, ki vplivajo na rast, pašo in potop fitoplanktona, so povezani z velikostjo, med šestimi funkcionalnimi skupinami fitoplanktona pa obstajajo posebne razlike (32).Kljub različnim fizikalnim okvirom so bili v številnih nedavnih študijah uporabljeni rezultati 51 komponent Planktona modela (42-44).
Od leta 1992 do 2011 je fizikalni/biogeokemični/ekosistemski model spojanja potekal 20 let.Rezultat modela vključuje planktonsko biomaso, koncentracijo hranil in hitrost oskrbe s hranili (DIN, PO4, SI in FE).V tej raziskavi je bilo 20-letno povprečje teh izhodov uporabljeno kot vnos ekološke province.CHL, porazdelitev planktonske biomase in koncentracije hranil ter porazdelitev funkcionalnih skupin primerjamo s satelitskimi in in-situ opazovanji [glej (2, 44), opombo S1 in slika.S1 do S3].
Pri metodi SAGE glavni vir naključnosti izhaja iz koraka t-SNE.Naključnost ovira ponovljivost, kar pomeni, da so rezultati nezanesljivi.Metoda žajblja natančno preizkuša robustnost z določitvijo nabora parametrov T-SNE in DBSCAN, ki lahko ob ponovitvi dosledno prepoznajo grozde.Določitev "zmede" parametra T-SNE je mogoče razumeti kot določitev stopnje, do katere bi moralo preslikavo od visokih do nizkih dimenzij spoštovati lokalne ali globalne značilnosti podatkov.Dosegla je zmedo 400 in 300 ponovitev.
Za algoritem združevanja DBSCAN je treba določiti najmanjšo velikost in metriko razdalje podatkovnih točk v grozdu.Najmanjše število se določi pod vodstvom strokovnjakov.To znanje ve, kaj ustreza trenutnemu numeričnemu okviru in ločljivosti.Najmanjše število je 100. Upoštevati je mogoče višjo minimalno vrednost (manjša od <135, preden zgornja meja zelene postane širša), vendar ne more nadomestiti metode združevanja, ki temelji na različnosti BC.Stopnja povezave (slika 6A) se uporablja za nastavitev parametra ϵ, ki je prikazan na višjo pokritost (slika 6B).Povezanost je opredeljena kot sestavljeno število grozdov in je občutljiva na ϵ parameter.Nižja povezljivost kaže na nezadostno prileganje, umetno združevanje regij skupaj.Visoka povezljivost kaže na preobremenitev.Prekomerno opremljanje je tudi problematično, saj kaže, da lahko začetna naključna ugibanja privedejo do nerazporednih rezultatov.Med tema dvema skrajnostma močno povečanje (običajno imenovano "komolec") kaže na najboljši ϵ.Na sliki 6a opazite močno povečanje območja planote (rumene,> 200 grozdov), ki mu sledi močno zmanjšanje (zelena, 100 grozdov), do približno 130, obdana z zelo malo grozdov (modri, <60 grozdi) ).Na vsaj 100 modrih območjih bodisi en grozd prevladuje v celotnem oceanu (ϵ <0,42), ali večina oceana ni razvrščena in se šteje za hrup (ϵ> 0,99).Rumeno območje ima zelo spremenljivo, neproducibilno porazdelitev grozda.Ko se ϵ zmanjša, se hrup poveča.Močno naraščajoče zeleno območje se imenuje komolec.To je optimalna regija.Čeprav se uporablja verjetnost T-SNE, se lahko za določitev zanesljivega grozda še vedno uporabi različnost BC znotraj province.Z uporabo slike 6 (A in B) nastavite ϵ na 0,39.Večje kot je minimalno število, manjša je verjetnost, da doseže ϵ, ki omogoča zanesljivo razvrstitev, in večja zelena površina z vrednostjo, večjo od 135. Povečanje tega območja kaže, da bo komolec težje najti ali ne obstoječe.
Po nastavitvi parametrov T-SNE bo skupno število najdenih grozdov uporabljeno kot merilo povezljivosti (a) in odstotek podatkov, dodeljenih grozdu (B).Rdeča pika označuje najboljšo kombinacijo pokritosti in povezljivosti.Najmanjša številka je nastavljena glede na minimalno število, povezano z ekologijo.
Za dodatna gradiva za ta članek si oglejte http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
To je članek z odprtim dostopom, ki se distribuira pod pogoji licence Creative Commons Attribution.Članek dovoljuje neomejeno uporabo, distribucijo in reproduciranje v kateremkoli mediju pod pogojem, da je izvirno delo pravilno citirano.
Opomba: Prosimo vas samo, da navedete svoj e-poštni naslov, da oseba, ki jo priporočite na strani, ve, da želite, da vidi e-pošto in da ni vsiljena pošta.E-poštnih naslovov ne bomo zajeli.
To vprašanje se uporablja za preverjanje, ali ste obiskovalec, in preprečevanje samodejnega pošiljanja neželene pošte.
Globalno ministrstvo za morsko ekologijo je odločeno, da reši zapletene težave in uporablja nenadzorovane ML za raziskovanje struktur skupnosti.
Globalno ministrstvo za morsko ekologijo je odločeno, da reši zapletene težave in uporablja nenadzorovane ML za raziskovanje struktur skupnosti.


Čas objave: 12. januarja 2021