topimg

Chjarificà a cumplessità ecologica: l'apprendimentu senza supervisione determina a pruvincia ecologica marina globale

Un metudu di apprendimentu senza supervisione hè prupostu per determinà e pruvince ecologiche marine globale (eco-province) basatu nantu à a struttura di a cumunità di plancton è i dati di flussu di nutrienti.U metudu sistematicu di a pruvincia ecologica integrata (SAGE) pò identificà e pruvince ecologiche in mudelli di ecosistema altamente non lineari.Per adattà à a covarianza non gaussiana di e dati, SAGE usa t random neighbor embedding (t-SNE) per riduce a dimensionalità.Cù l'aiutu di l'applicazione di u rumore basatu annantu à l'algoritmu di clustering spaziale basatu in densità (DBSCAN), più di centu pruvince ecologiche ponu esse identificate.Utilizendu a mappa di connettività cù e differenze ecologiche cum'è una misura di distanza, una pruvincia ecologica aggregata robusta (AEP) hè definita obiettivamente attraversu pruvince ecologiche nidificate.Utilizendu l'AEP, u cuntrollu di a tarifa di furnimentu di nutrienti nantu à a struttura di a cumunità hè stata esplorata.Eco-provincia è AEP sò unichi è ponu aiutà à l'interpretazione di mudelli.Puderanu facilità paraguni trà mudelli è ponu rinfurzà a cunniscenza è u monitoraghju di l'ecosistemi marini.
Pruvince sò rigioni induve a biogeografia cumplessa nantu à u mare o a terra hè urganizata in spazii coerenti è significativi (1).Queste pruvince sò assai impurtanti per paragunà è cuntrastà i lochi, caratterizendu l'osservazioni, u monitoraghju è a prutezzione.L'interazzioni cumplessi è non lineari chì pruducianu queste pruvince facenu metudi di machine learning (ML) senza supervisione assai adattati per a determinazione di pruvince obiettivamente, perchè a covarianza in i dati hè cumplessa è non gaussiana.Quì, un metudu ML hè prupostu, chì identifica sistematicamente pruvince ecologiche marine uniche (eco-province) da u mudellu di Darwin (3D) fisicu / ecosistema (2).U terminu "unicu" hè utilizatu per indicà chì l'area identificata ùn si superpone micca abbastanza cù l'altri spazii.Stu metudu hè chjamatu u metudu System Integrated Ecological Province (SAGE).Per fà una classificazione utile, un metudu di l'algoritmu deve permette (i) a classificazione globale è (ii) l'analisi multi-scala chì pò esse nidificatu / aggregatu in u spaziu è u tempu (3).In questa ricerca, u metudu SAGE hè statu prupostu prima è e pruvince ecologiche identificate sò state discusse.L'eco-province ponu prumove a cunniscenza di i fatturi chì cuntrolanu a struttura di a cumunità, furnisce insights utili per strategie di monitoraghju è aiutanu à seguità i cambiamenti in l'ecosistema.
E pruvince terrestri sò generalmente classificate secondu a similarità in u clima (precipitazioni è temperatura), terra, vegetazione è fauna, è sò usati per a gestione ausiliaria, a ricerca di a biodiversità è u cuntrollu di e malatie (1, 4).E pruvince marine sò più difficili di definisce.A maiò parte di l'organisimi sò microscòpichi, cù cunfini fluidi.Longhurst et al.(5) Fornitu una di e prime classificazioni mundiali di u Ministeru di l'Oceanografia basatu nantu à e cundizioni ambientali.A definizione di sti pruvince "Longhurst" include variàbili cum'è a rata di mistura, stratificazione è irradiance, è ancu a larga sperienza di Longhurst cum'è oceanografu marinu, chì hà altre cundizioni impurtanti per l'ecosistema marini.Longhurst hè stata largamente utilizata, per esempiu, per evaluà a produzzione primaria è i flussi di carbonu, aiuta à a pesca, è pianificà attività di osservazione in situ (5-9).Per definisce e pruvince in modu più obiettivu, sò stati utilizati metudi cum'è a logica fuzzy è u clustering / statistiche regiunale senza supervisione (9-14).U scopu di tali metudi hè di identificà strutture significativu chì ponu identificà pruvince in i dati d'osservazione dispunibili.Per esempiu, e pruvince marine dinamiche (12) utilizanu carte autourganistiche per riduce u rumore, è utilizanu clustering gerarchicu (basatu in l'arburu) per determinà i prudutti di culori marini derivati ​​da satelliti regiunali [clorofilla a (Chl-a), altezza di linea di Fluorescenza normalizzata è materia urganica dissoluta culurata] è campu fisicu (temperatura di a superficia di u mare è salinità, topografia dinamica assoluta è ghiaccio marinu).
A struttura di a cumunità di u plancton hè di preoccupazione perchè a so ecologia hà una grande influenza nantu à i livelli di nutrienti più altu, l'assorbimentu di carbone è u clima.Tuttavia, hè sempre un scopu sfida è sfarente di determinà una pruvincia ecologica globale basatu annantu à a struttura di a cumunità di u plancton.I satelliti di culore marini ponu potenzialmente furnisce insights in a classificazione grossa di u fitoplancton o suggerenu i vantaghji di i gruppi funziunali (15), ma sò attualmente incapaci di furnisce infurmazioni detallate nantu à a struttura di a cumunità.Sondaggi recenti [p.e. Tara Ocean (16)] furniscenu misurazioni senza precedente di a struttura di a cumunità;attualmente, ci sò solu scarse osservazioni in situ à scala globale (17).Studi precedenti anu largamente determinatu a "Provincia Biogeochemical" (12, 14, 18) basatu nantu à a determinazione di similarità biochimica (cum'è a pruduzzione primaria, Chl è u lume dispunibule).Quì, u mudellu numericu hè utilizatu per pruduce [Darwin (2)], è a pruvincia ecologica hè determinata secondu a struttura di a cumunità è u flussu di nutrienti.U mudellu numericu utilizatu in stu studiu hà una copertura glubale è pò esse paragunatu cù e dati di u campu esistenti (17) è i campi di rilevazione remota (Nota S1).I dati di mudelli numerichi utilizati in stu studiu anu u vantaghju di a cobertura globale.L'ecosistema mudellu hè custituitu da 35 spezie di fitoplancton è 16 spezie di zooplancton (per piacè riferite à i materiali è i metudi).I tipi di plancton mudeli interagiscenu in modu non lineale cù strutture di covarianza non gaussiana, cusì i metudi di diagnostichi simplici ùn sò micca adattati per identificà mudelli unichi è coerenti in strutture comunitarie emergenti.U metudu SAGE introduttu quì furnisce un modu novu per verificà l'output di mudelli Darwin cumplessi.
E putenti capacità di trasfurmazioni di a tecnulugia di scienza di dati / ML ponu permette soluzioni di mudelli estremamente cumplesse per revelà strutture cumplesse ma robuste in a covarianza di dati.Un metudu robustu hè definitu cum'è un metudu chì pò riproduce fedelmente i risultati in un intervallu d'errore.Ancu in sistemi simplici, a determinazione di mudelli robusti è signali pò esse una sfida.Finu à chì a logica chì porta à u patronu osservatu hè determinata, a cumplessità emergente pò parè complicata / difficiuli di risolve.U prucessu chjave di stabilisce a cumpusizioni di l'ecosistema ùn hè micca lineare in natura.L'esistenza di interazzione non lineari pò cunfundà a classificazione robusta, cusì hè necessariu di evitari metudi chì facenu ipotesi forti nantu à a distribuzione statistica basica di a covarianza di dati.I dati d'alta dimensione è non lineari sò cumuni in l'oceanografia è ponu avè una struttura di covarianza cù una topologia cumplessa, non gaussiana.Ancu se e dati cù una struttura di covarianza non gaussiana ponu impedisce a classificazione robusta, u metudu SAGE hè novu perchè hè pensatu per identificà clusters cù topologie arbitrarie.
L'obiettivu di u metudu SAGE hè di identificà oggettivamente mudelli emergenti chì ponu aiutà à una cunniscenza più ecologica.Dopu un flussu di travagliu basatu in cluster simili à (19), e variabili di flussu ecologicu è nutriente sò usati per determinà l'unicu cluster in i dati, chjamatu a pruvincia ecologica.U metudu SAGE prupostu in stu studiu (Figura 1) prima riduce a dimensionalità da 55 à 11 dimensioni summing i gruppi funziunali di u plancton definiti a priori (vede Materiali è Metodi).Utilizendu u metudu t-random neighbor embedding (t-SNE), a dimensione hè più ridutta prughjettendu a probabilità in u spaziu 3D.U clustering senza supervisione pò identificà e zone ecologicamente vicine [raggruppamentu spaziale basatu in densità (DBSCAN) per applicazioni basate in u rumore].Tramindui t-SNE è DBSCAN sò applicabili à i dati di mudelli numerichi di l'ecosistema non lineari inerenti.Allora riprughjettate a pruvincia ecologica resultanti nantu à a terra.Più di centu pruvince ecologiche uniche sò state identificate, adattate per a ricerca regiunale.Per cunsiderà u mudellu di l'ecosistema globalmente consistente, u metudu SAGE hè adupratu per aggregate e pruvince ecologiche in pruvince ecologiche aggregate (AEP) per migliurà l'efficacità di e pruvince ecologiche.U livellu di aggregazione (chjamatu "cumplessità") pò esse aghjustatu à u livellu di dettagliu necessariu.Determina a cumplessità minima di un AEP robustu.L'enfasi di a selezzione hè u metudu SAGE è l'esplorazione di i casi AEP di più chjuca cumplessità per determinà u cuntrollu di a struttura di a cumunità d'emergenza.I mudelli ponu esse analizzati per furnisce insights ecologichi.U metudu introduttu quì pò ancu esse usatu per a comparazione di mudelli più largamente, per esempiu, evaluendu i lochi di pruvince ecologiche simili chì si trovanu in mudelli diffirenti per mette in risaltu differenze è similitudini, per paragunà mudelli.
(A) Diagramma schematicu di u flussu di travagliu per a determinazione di a pruvincia ecologica;aduprendu a summa in u gruppu funziunale per riduce i dati originali 55-dimensionali à un mudellu 11-dimensionale di output, cumpresa a biomassa di sette plancton funziunale / nutriente è quattru tassi di furnimentu di nutrienti.Valore insignificante è zona di copertura di ghiaccio durable.I dati sò stati standardizati è standardizati.Fornite dati 11-dimensionali à l'algoritmu t-SNE per mette in risaltu cumminzioni di caratteristiche statisticamente simili.DBSCAN selezziunà currettamente u cluster per stabilisce u valore di u paràmetru.Infine prughjettanu i dati à a prughjezzione di latitudine / longitudine.Per piacè nutate chì stu prucessu hè ripetutu 10 volte perchè una ligera casualità pò esse generata da l'applicazione di t-SNE.(B) spiega cumu uttene l'AEP ripetendu u flussu di travagliu in (A) 10 volte.Per ognuna di queste implementazioni 10, a matrice di dissimilarità interprovinciale di Bray-Curtis (BC) hè stata determinata nantu à a biomassa di 51 tipi di fitoplancton.Determina a diffarenza BC trà pruvince, da a cumplessità 1 AEP à a cumplessità cumpleta 115. U benchmark BC hè stabilitu da a Pruvincia di Longhurst.
U metudu SAGE usa l'output di u mudellu numericu 3D fisicu / ecosistema globale per definisce a pruvincia ecologica [Darwin (2);vede Materiali è Metudi è Nota S1].I cumpunenti di l'ecosistema sò cumposti da 35 spezie di fitoplancton è 16 spezie di zooplancton, cù sette gruppi funziunali predefiniti: procarioti è eucarioti adattati à ambienti pocu nutrienti, coccidia cù un revestimentu di carbonatu di calciu è fissazione di nitrogenu pesante Nutrienti di azotu (di solitu mancanti). nutrienti impurtanti), cù una cupertura silicea, ponu fà altre fotosintesi di plancton è pasturanu flagellati di nutrienti misti è pastori di zooplancton.U span di taglia hè da 0,6 à 2500μm di diametru sfericu equivalente.A distribuzione di u mudellu di a dimensione di u fitoplancton è u raggruppamentu funziunale capta e caratteristiche generale vedute in l'osservazioni satellitari è in situ (vede Figure S1 à S3).La similitude entre le modèle numérique et l'océan observé indique que les provinces définies par le modèle peuvent être applicables à l'océan in-situ.Per piacè nutate chì stu mudellu captura solu una certa diversità di fitoplancton, è solu certi intervalli di forza fisiche è chimiche di l'oceanu in situ.U metudu SAGE pò permette à e persone di capisce megliu u mecanismu di cuntrollu altamente regiunale di a struttura di a cumunità mudellu.
Cumprendu solu a summa di a biomassa di a superficia (cù un tempu mediu di 20 anni) in ogni gruppu funziunale di u plancton, a dimensione di e dati pò esse ridutta.Dopu à studii precedenti dimustratu u so rolu chjave in a creazione di a struttura di a cumunità, hà ancu inclusu termini di fonte di superficia per i flussi di nutrienti (furnitu di nitrogenu, ferru, fosfatatu è acidu silicicu) [eg (20, 21)].A summation of groups functional reduces the problem from 55 (51 plankton and 4 nutrient fluxes) à 11 dimensioni.In stu studiu iniziale, per via di e limitazioni computazionale imposte da l'algoritmu, a variabilità di a prufundità è di u tempu ùn sò micca cunsiderate.
U metudu SAGE hè capaci di identificà relazioni impurtanti trà i prucessi non lineari è e caratteristiche chjave di l'interazzione trà a biomassa di u gruppu funziunale è u flussu di nutrienti.Utilizà dati 11-dimensionali basati nantu à i metudi di apprendimentu à distanza euclidianu (cum'è K-means) ùn ponu micca ottene pruvince affidabili è riproducibili (19, 22).Questu hè perchè nisuna forma gaussiana si trova in a distribuzione basica di a covarianza di l'elementi chjave chì definenu a pruvincia ecologica.I K-means di e cellule Voronoi (linee rette) ùn ponu micca mantene a distribuzione basica non gaussiana.
A biomassa di sette gruppi funziunali di plancton è quattru flussi di nutrienti formanu un vettore x 11-dimensionale.Dunque, x hè un campu di vettore nantu à a griglia di mudellu, induve ogni elementu xi rapprisenta un vettore 11-dimensionale definitu nantu à a griglia horizontale di mudellu.Chaque indice i identifie de manière unique un point de grille sur la sphère, où (lon, lat) = (ϕi, θi).Se a biomassa di l'unità di griglia mudellu hè menu di 1,2 × 10-3mg Chl / m3 o u tassu di a cobertura di ghiaccio supera u 70%, u logu di dati di biomassa hè utilizatu è scartatu.I dati sò nurmalizzati è standardizati, cusì tutti i dati sò in u intervalu di [0 à 1], a media hè eliminata è scalata à a varianza unità.Questu hè fattu per chì e caratteristiche (biomassa è u flussu di nutrienti) ùn sò micca limitati da u cuntrastu in a gamma di valori pussibuli.U clustering deve catturà a relazione di cambiamentu da a distanza di probabilità chjave trà e caratteristiche invece di a distanza geografica.Per quantificà queste distanze, emergenu caratteristiche impurtanti, mentre chì i dettagli inutili sò scartati.Da un puntu di vista ecologicu, questu hè necessariu perchè certi tipi di fitoplancton cù pocu biomassa pò avè effetti biogeochimichi maiò, cum'è a fissazione di nitrogenu da i batteri diazotrofi.Quandu standardizeghja è nurmalizà e dati, sti tipi di covariate seranu evidenziati.
Enfatizendu a proximità di e caratteristiche in u spaziu high-dimensionale in a rapprisintazioni dimensionale bassu, l'algoritmu t-SNE hè utilizatu per fà e regioni simili esistenti più chjaru.I travaglii precedenti destinati à custruisce reti neurali profonde per l'applicazioni di telerilevazione anu utilizatu t-SNE, chì hà dimustratu a so capacità in separà e caratteristiche chjave (23).Questu hè un passu necessariu per identificà un clustering robustu in i dati di e caratteristiche evitendu solu suluzione non-convergente (nota S2).Utilizendu kernels Gauss, t-SNE conserva e proprietà statistiche di e dati cartografendu ogni ughjettu di grande dimensione à un puntu in u spaziu di fasi 3D, assicurendu cusì chì a probabilità di oggetti simili in a direzzione alta è bassa hè alta in una alta. spaziu dimensionale (24).Datu un inseme di N oggetti di grande dimensione x1,…, xN, l'algoritmu t-SNE riduce minimizendu a divergenza Kullback-Leibler (KL) (25).A divergenza KL hè una misura di quantu hè diversa una distribuzione di probabilità da una seconda distribuzione di probabilità di riferimentu, è pò evaluà in modu efficace a pussibilità di correlazioni trà e rapprisintazioni di bassa dimensione di e caratteristiche high-dimensional.Se xi hè l'i-esimu ogettu in u spaziu N-dimensionale, xj hè u j-esimu ughjettu in u spaziu N-dimensionale, yi hè l'i-esimu ughjettu in u spaziu di dimensioni bassu, è yj hè l'ughjettu ogettu in u spaziu bassu. spazio -dimensionale, allora t -SNE definisce la probabilità di similitudine ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), è per l'insieme di riduzione di dimensionalità q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
A figura 2A illustra l'effettu di riduzzione di i vettori di flussu di biomassa è di nutrienti di a cumminazione 11-dimensionale à 3D.A motivazione di applicà t-SNE pò esse paragunata cù a motivazione di l'analisi di cumpunenti principali (PCA), chì usa l'attributu di varianza per enfatizà l'area / attributu di e dati, riducendu cusì a dimensionalità.U metudu t-SNE hè stata trovata superiore à PCA in furnisce risultati affidabili è riproducibili per l'Eco-Ministerio (vede a Nota S2).Questu pò esse perchè l'assunzione di ortogonalità di PCA ùn hè micca adattata per identificà interazzioni critichi trà caratteristiche interattive altamente non lineari, perchè PCA si cuncentra in strutture di covarianza lineari (26).Utilizendu dati di telesensing, Lunga et al.(27) illustra cumu utilizà u metudu SNE per mette in risaltu e caratteristiche spettrali cumplessi è non lineari chì devianu da a distribuzione gaussiana.
(A) Un tassu di fornimentu di nutrienti modellatu, u fitoplancton è a biomassa di u gruppu funziunale di zooplancton disegnati da l'algoritmu t-SNE è culurati per pruvincia cù DBSCAN.Ogni puntu rapprisenta un puntu in u spaziu altu-dimensionale, cum'è mostra in a Figura 6B, a maiò parte di i punti sò catturati.Shafts riferenu à "t-SNE" sizes 1, 2 è 3. (B) A prughjezzione giugrafica di a pruvincia truvata da DBSCAN nantu à a griglia di latitudine-longitudine di l'urigine.U culore deve esse cunsideratu cum'è qualsiasi culore, ma deve currisponde à (A).
I punti in u t-SNE scatter plot in Figura 2A sò rispettivamente assuciati cù a latitudine è a longitudine.Sì i dui punti in a Figura 2A sò vicinu à l'altru, hè perchè a so biomassa è i flussi di nutrienti sò simili, micca per via di a vicinanza geografica.I culori in a Figura 2A sò clusters scuperti cù u metudu DBSCAN (28).Quandu cercate osservazioni densi, l'algoritmu DBSCAN usa a distanza in a rapprisintazioni 3D trà i punti (ϵ = 0,39; per infurmazione nantu à sta scelta, vede Materiali è Methodi), è u numeru di punti simili hè necessariu per definisce u cluster (qui 100 punti, vede sopra).U metudu DBSCAN ùn face micca ipotesi nantu à a forma o u numeru di clusters in i dati, cum'è mostra quì sottu:
3) Per tutti i punti identificati cum'è in a distanza interna, ripetite u passu 2 iterativamente per determinà u cunfini di u cluster.Se u numeru di punti hè più grande di u valore minimu stabilitu, hè designatu cum'è un cluster.
I dati chì ùn sò micca cumplessi cù u membru di u cluster minimu è a metrica di distanza ϵ sò cunsiderate "rumore" è ùn sò micca attribuiti un culore.DBSCAN hè un algoritmu veloce è scalabile cù prestazioni O (n2) in u peghju casu.Per l'analisi attuale, ùn hè micca veramente aleatoriu.U numeru minimu di punti hè determinatu da una valutazione esperta.Dopu aghjustà a distanza dopu, u risultatu ùn hè micca abbastanza stabile in a gamma di ≈±10.Sta distanza hè stabilita utilizendu a cunnessione (Figura 6A) è u percentualità di copertura di l'oceanu (Figura 6B).A cunnessione hè definita cum'è u numeru cumpostu di clusters è hè sensibile à u paràmetru ϵ.A connettività più bassa indica un adattamentu insufficiente, raggruppendu artificialmente e regioni.L'alta connettività indica un overfitting.Hè cuncepimentu di utilizà un minimu più altu, ma se u minimu supera ca, hè impussibile di ottene una suluzione affidativa.135 (Per più dettagli, vede Materiali è Metudi).
I 115 clusters identificati in a Figura 2A sò prughjetti torna nantu à a terra in a Figura 2B.Ogni culore currisponde à una cumminazione coherente di fatturi biogeochimici è ecologichi identificati da DBSCAN.Una volta chì i clusters sò determinati, l'associazione di ogni puntu in a Figura 2A cù una latitudina è una longitudine specifiche hè aduprata per prughjettà i clusters torna à l'area geografica.A Figura 2B illustra questu cù i stessi culori di cluster cum'è a Figura 2A.I culori simili ùn devenu esse interpretati cum'è similitude ecologica, perchè sò attribuiti da l'ordine in quale i clusters sò scuperti da l'algoritmu.
L'area in a Figura 2B pò esse qualitativamente simili à una zona stabilita in a fisica è / o biogeochimica di l'oceanu.Per esempiu, i clusters in l'Oceanu Meridionale sò zona-simetriche, cù vortices oligotrophic chì appare, è a transizione sharp indica l'influenza di i venti alici.Per esempiu, in u Pacificu equatoriale, si vede diverse regioni ligati à l'ascesa.
Per capiscenu l'ambiente ecologicu di l'Eco-Provincia, una variazione di l'indici di diffarenza Bray-Curtis (BC) (29) hè stata utilizata per evaluà l'ecologia in u cluster.L'indicatore BC hè una data statistica utilizata per quantificà a diferenza in a struttura di a cumunità trà dui siti diffirenti.A misura BC hè applicabile à a biomassa di 51 spezie di fitoplancton è zooplancton BCninj = 1-2CninjSni + Snj
BCninj si riferisce à a similarità trà a cumminazione ni è a cumminazione nj, induve Cninj hè u valore minimu di un unicu tipu di biomassa chì esiste in i dui cumminazzioni ni è nj, è Sni rapprisenta a summa di tutte e biomasse chì esistenu in e duie cumminazzioni ni è Snj.A diferenza BC hè simile à a misura di distanza, ma opera in u spaziu non-euclidianu, chì hè prubabile di esse più adattatu per i dati ecologichi è a so interpretazione.
Per ogni cluster identificatu in a Figura 2B, a similitudine di BC intra-provinciale è inter-provinciale pò esse valutata.A diferenza BC in una pruvincia si riferisce à a diffarenza trà u valore mediu di a pruvincia è ogni puntu in a pruvincia.A diffarenza trà e pruvince BC si riferisce à a similarità trà una pruvincia è altre pruvince.A figura 3A mostra una matrice BC simmetrica (0, neru: cumpletamente currispundenti; 1, biancu: completamente dissimile).Ogni linea in u graficu mostra un mudellu in i dati.Figura 3B mostra u significatu geugraficu di i risultati di BC in Figura 3A per ogni pruvincia.Per una pruvincia in una zona di pocu nutrimentu è pocu nutriente, a Figura 3B mostra chì a simmetria di grandi spazii intornu à l'equatore è l'Oceanu Indianu hè basicamente simile, ma e latitudini più elevate è e zone di upwelling sò significativamente diverse.
(A) U gradu di diffarenza BC valutata per ogni pruvincia basatu annantu à a media di a superficia glubale media globale di 20 anni di 51 plancton.Nota a simetria prevista di i valori.(B) A prughjezzione spaziale di una colonna (o fila).Per una pruvincia in un circhiu distròficu, a distribuzione glubale di a misura di similarità BC hè stata evaluata, è a media globale di 20 anni hè stata evaluata.Neru (BC = 0) significa a stessa zona, è biancu (BC = 1) ùn significa micca similitudine.
Figura 4A illustra a diferenza in BC in ogni pruvincia in Figura 2B.Determinatu cù l'usu di a cumminazzioni media di l'area media in un cluster, è determinendu a dissimilarità trà a BC è a media di ogni puntu di griglia in a pruvincia, mostra chì u metudu SAGE pò separà bè 51 spezie basatu nantu à a similarità ecologica Tipu di dati di mudellu.A dissimilarità media generale di cluster BC di tutti i 51 tipi hè 0,102±0,0049.
(A, B, è D) A diferenza BC in a pruvincia hè evaluata cum'è a diffarenza media BC trà ogni cumunità di punti di griglia è a pruvincia media, è a cumplessità ùn hè micca ridutta.(2) A diffarenza BC intra-provinciale media glubale hè 0.227±0.117.Questu hè u benchmark di a classificazione basata nantu à a motivazione ecologica pruposta da stu travagliu [linea verde in (C)].(C) Differenza media intra-provinciale BC: A linea negra rapprisenta a diffarenza intra-provinciale BC cù a cumplessità crescente.2σ vene da 10 ripetizioni di u prucessu d'identificazione di l'eco-provincia.Per a cumplessità tutale di e pruvince scupertu da DBSCAN, (A) mostra chì a dissimilarità BC in a pruvincia hè 0.099, è a classificazione di cumplessità pruposta da (C) hè 12, chì risultatu in una dissimilarità BC di 0.200 in a pruvincia.cum'è a stampa mostra.(D).
In a Figura 4B, a biomassa di 51 tippi di plancton hè aduprata per rapprisintà a diferenza equivalente BC in a pruvincia di Longhurst.A media generale di ogni pruvincia hè 0.227, è a deviazione standard di i punti di griglia cù riferimentu à a diferenza in a pruvincia BC hè 0.046.Questu hè più grande di u cluster identificatu in Figura 1B.Invece, utilizendu a summa di i sette gruppi funziunali, a dissimilarità media intra-stagione BC in Longhurst hà aumentatu à 0,232.
A mappa di l'eco-provincia glubale furnisce dettagli intricati di interazzioni ecologiche uniche è miglioramenti sò stati fatti in l'usu di tutta a struttura di l'ecosistema di a Pruvincia di Longhurst.U Ministeru di l'Ecologia hè previstu di furnisce insight in u prucessu di cuntrollu di l'ecosistema di mudelli numerichi, è questu insight aiutarà l'esplorazione di u travagliu di campu.Per u scopu di sta ricerca, ùn hè micca pussibule di vede cumplettamente più di centu pruvince.A sezione dopu presenta u metudu SAGE chì riassume e pruvince.
Unu di i scopi di a pruvincia hè di prumove a cunniscenza di u locu è a gestione di a pruvincia.Per determinà e situazioni d'urgenza, u metudu in a Figura 1B illustra a nidificazione di pruvince ecologicamente simili.L'eco-provincia sò raggruppati inseme nantu à a similarità ecologica, è un tali raggruppamentu di pruvince hè chjamatu AEP.Stabilite una "complessità" regulabile basatu annantu à u numeru tutale di pruvince per esse cunsideratu.U terminu "cumplessità" hè utilizatu perchè permette à u livellu di l'attributi d'urgenza per esse aghjustatu.Per definisce aggregazioni significati, a diferenza media intra-provinciale BC di 0,227 da Longhurst hè aduprata cum'è u puntu di riferimentu.Sottu à questu benchmark, e pruvince cumminate ùn sò più cunsiderate utili.
Comu mostra in a Figura 3B, e pruvince ecologiche glubale sò coerenti.Utilizendu e differenze inter-provinciali BC, pò esse vistu chì certi cunfigurazioni sò assai "cumune".Ispirati da a genetica è i metudi di a teoria di i grafici, i "grafici cunnessi" sò usati per sorte > 100 pruvince basatu nantu à e pruvince più simili à elli.A metrica di "connettività" quì hè determinata aduprendu a dissimilarità interprovinciale BC (30).U numeru di pruvince cù un spaziu più grande per a classificazione di> 100 pruvince pò esse riferitu quì cum'è cumplessità.AEP hè un pruduttu chì categurizà più di 100 pruvince cum'è e pruvince ecologiche più dominanti / più vicine.Ogni pruvincia ecologica hè attribuita à a pruvincia ecologica dominante / altamente cunnessa chì hè più simile à elli.Questa aggregazione determinata da a diferenza BC permette un accostu nidificatu à l'ecologia glubale.
A cumplessità scelta pò esse qualsiasi valore da 1 à a cumplessità cumpleta di FIG.2A.À a più bassa cumplessità, AEP pò degenerare per via di u passu di riduzzione di dimensionalità probabilistica (t-SNE).A degenerazione significa chì e pruvince ecologiche ponu esse attribuite à diversi AEP trà iterazioni, cambiando cusì l'area geografica coperta.A Figura 4C illustra a diffusione di dissimilarità di BC in e pruvince in AEP di crescente cumplessità in 10 implementazioni (illustrazione in Figura 1B).In a Figura 4C, 2σ (zona blu) hè una misura di degradazione in 10 implementazioni, è a linea verde rapprisenta u benchmark Longhurst.I fatti anu dimustratu chì a cumplessità di 12 pò mantene a diferenza BC in a pruvincia sottu à u benchmark Longhurst in tutte l'implementazioni è mantene una degradazione 2σ relativamente chjuca.In riassuntu, a cumplessità minima cunsigliata hè 12 AEP, è a diferenza media intra-provincia BC valutata cù 51 tippi di plancton hè 0,198±0,013, cum'è mostra in a Figura 4D.Utilizendu a summa di sette gruppi funziunali di plancton, a diffarenza media di BC in a pruvincia hè 2σ invece di 0,198±0,004.A paraguni trà e differenze BC calculate cù a biomassa tutale di i sette gruppi funziunali o a biomassa di tutti i 51 tippi di plancton mostra chì, ancu s'ellu u metudu SAGE hè applicabile à a situazione 51-dimensionale, hè per a biomassa tutale di i sette gruppi funziunali. Per a furmazione.
Sicondu u scopu di ogni ricerca, ponu esse cunsideratu diversi livelli di cumplessità.I studii regiunale ponu esse bisognu di cumplessità cumpleta (vale à dì, tutte e 115 pruvince).Per esempiu è per chiarezza, cunzidira a cumplessità minima cunsigliata di 12.
Comu esempiu di l'utilità di u metu SAGE, 12 AEP cù una cumplessità minima di 12 sò usati quì per scopre u cuntrollu di a struttura di a cumunità d'urgenza.A Figura 5 illustra l'intuizioni ecologiche raggruppati da AEP (da A à L): In l'estechiometria Redfield, l'estensione geografica (Figura 5C), a cumpusizioni di a biomassa di u gruppu funziunale (Figura 5A) è l'approvvigionamentu di nutrienti (Figura 5B) sò realizati da N Zoomed.U rapportu (N:Si:P:Fe, 1:1:16:16×103) hè mostratu.Per l'ultimu pannellu, P multiplicate da 16 è Fe multiplicate da 16 × 103, cusì u graficu di barre hè equivalente à i bisogni nutrizionali di u fitoplancton.
E pruvince sò classificate in 12 AEP da A à L. (A) Biomassa (mgC/m3) di l'ecosistema in 12 pruvince.(B) U flussu di nutriente di nitrogenu inorganicu dissolutu (N), ferru (Fe), fosfatatu (P) è acidu silicicu (Si) (mmol / m3 per annu).Fe è P sò multiplicate da 16 è 16 × 103, rispettivamente, cusì chì e strisce sò standardizzate à i requisiti di stechiometria fitoplancton.(C) Nota a diffarenza trà e regioni polari, i cicloni subtropicali è e regioni staghjunali / crescente.I stazioni di surviglianza sò marcati cusì: 1, SEDI;2, ALOHA;3, stazione P;è 4, BATS.
L'AEP identificata hè unicu.Ci hè una certa simetria intornu à l'equatori in l'Oceani Atlanticu è Pacificu, è una zona simili, ma allargata, esiste in l'Oceanu Indianu.Certi AEP abbraccianu u latu uccidintali di u cuntinente assuciatu cù l'ascensione.U Corrente Circumpolare di u Polu Sud hè cunsideratu cum'è una grande caratteristica zonale.U ciclone subtropicale hè una seria cumplessa di AEP oligotroficu.In queste pruvince, u mudellu familiare di differenze di biomassa trà i vortici oligotrofichi dominati da u plancton è e regioni polari ricche di diatomee hè evidente.
L'AEP cù una biomassa di fitoplancton tutali assai simili pò avè strutture cumunitarii assai diverse è copre diverse aree geografiche, cum'è D, H è K, chì anu una biomassa fitoplancton tutale simili.AEP H esisti principarmenti in l'Oceanu Indianu equatoriale, è ci sò più bacteria diazotrophic.L'AEP D si trova in parechji bacini, ma hè particularmente prominente in u Pacificu intornu à e zoni à altu rendiment intornu à l'upwelling equatoriale.A forma di sta pruvincia di u Pacificu ricorda un trenu d'onda planetaria.Ci sò pocu diazobacteria in AEP D, è più cuni.Comparatu cù l'altri dui pruvince, AEP K si trova solu in l'altitudine di l'Oceanu Articu, è ci sò più diatomee è menu planctons.Hè da nutà chì a quantità di plancton in queste trè regioni hè ancu assai diffirenti.Frà elli, l'abbundanza di plancton di AEP K hè relativamente bassu, mentre chì quella di AEP D è H hè relativamente alta.Dunque, malgradu a so biomassa (è dunque simili à Chl-a), sti pruvince sò assai diffirenti: a prova di pruvincia basata in Chl ùn pò micca catturà queste differenze.
Hè ancu evidenti chì certi AEP cù una biomassa assai diversa pò esse simili in quantu à a struttura di a cumunità di u fitoplancton.Per esempiu, questu hè visibile in AEP D è E. Sò vicinu à l'altri, è in l'Oceanu Pacificu, AEP E hè vicinu à l'AEPJ assai pruduttivu.In listessu modu, ùn ci hè micca un ligame chjaru trà a biomassa di u fitoplancton è l'abbundanza di u zooplancton.
L'AEP pò esse capitu in quantu à i nutrienti furniti à elli (Figura 5B).I diatomei sò solu induve ci hè un ampiu suministru di l'acidu silicicu.In generale, più altu hè u supply of silicic acid, u più altu hè a biomassa di diatomee.Diatoms pò esse vistu in AEP A, J, K è L. U rapportu di a biomassa di diatomee relative à l'altru fitoplancton hè determinatu da u N, P è Fe furnitu relative à a dumanda di diatomea.Per esempiu, AEP L hè duminatu da diatomee.Comparatu cù l'altri nutrienti, Si hà u più altu supply.In cuntrastu, malgradu a produtividade più alta, AEP J hà menu diatomee è menu fornitura di siliciu (tutte è relative à l'altri nutrienti).
A bacteria Diazonium hà a capacità di riparà u nitrogenu, ma cresce lentamente (31).Coexistenu cù altri fitoplancton, induve u ferru è u fosforu sò eccessivi in ​​quantu à a dumanda di nutrienti non-diazonium (20, 21).Hè da nutà chì a biomassa diazotrophic hè relativamente alta, è l'offerta di Fe è P hè relativamente grande relative à l'offerta di N. In questu modu, ancu s'è a biomassa tutale in AEP J hè più altu, a biomassa diazonium in AEP H hè più grande chì in J. Per piacè nutate chì AEP J è H sò geograficamente assai diffirenti, è H hè situatu in l'Uceanu Indianu equatoriale.
Se a struttura unica di l'ecosistema ùn hè micca divisa in pruvince, l'intuizioni ottenute da i mudelli di cumplessità più bassa di 12 AEP ùn saranu micca cusì chjaru.L'AEP generatu da SAGE facilita a comparazione coherente è simultanea di l'infurmazioni cumplessi è d'alta dimensione da mudelli di l'ecosistema.AEP enfatiza in modu efficace perchè Chl ùn hè micca un metudu bonu è alternativu per determinà a struttura di a cumunità o l'abbundanza di zooplancton à livelli di nutrienti più altu.Un analisi detallatu di i temi di ricerca in corso hè fora di u scopu di stu articulu.U metudu SAGE furnisce un modu per esplorà altri miccanismi in u mudellu chì hè più faciule da trattà cà a visualizazione puntu à puntu.
U metudu SAGE hè prupostu per aiutà à chjarificà e dati ecologichi estremamente cumplessi da mudelli numerichi fisichi / biogeochimici / ecosistemi globali.A pruvincia ecologica hè determinata da a biomassa tutale di i gruppi funziunali cross-plancton, l'applicazione di l'algoritmu di riduzzione di dimensionalità di probabilità t-SNE è u clustering usendu u metudu ML senza supervisione DBSCAN.A teoria inter-provinciale di a differenza / graffiu di BC per u metudu di nidificazione hè appiicata per derivà un AEP robustu chì pò esse usatu per l'interpretazione globale.In quantu à a custruzzione, l'Eco-Provincia è l'AEP sò unichi.A nidificazione AEP pò esse aghjustata trà a cumplessità piena di a pruvincia ecologica originale è u limitu minimu cunsigliatu di 12 AEP.A nidificazione è a determinazione di a cumplessità minima di AEP sò cunsiderate cum'è passi chjave, perchè a probabilità t-SNE degenera AEP di <12 cumplessità.U metudu SAGE hè glubale, è a so cumplessità varieghja da> 100 AEP à 12. Per simplicità, l'attuale focus hè nantu à a cumplessità di 12 AEP globale.A ricerca futura, in particulare i studii regiunale, ponu truvà un sottumessu spaziale più chjucu di l'eco-province glubale utile, è pò esse aggregatu in una zona più chjuca per prufittà di e stesse intuizioni ecologiche discussate quì.Fornisce suggerimenti nantu à cumu queste pruvince ecologiche è l'intuizioni ottenute da elli ponu esse aduprate per una più cunniscenza ecologica, facilità a comparazione di mudelli è potenzialmente migliurà u monitoraghju di l'ecosistema marini.
A pruvincia ecologica è AEP identificata da u metudu SAGE sò basati nantu à e dati in u mudellu numericu.Per definizione, u mudellu numericu hè una struttura simplificata, chì prova di catturà l'essenza di u sistema di destinazione, è mudelli diffirenti averebbenu una distribuzione diversa di u plancton.U mudellu numericu utilizatu in stu studiu ùn pò micca capisce cumplettamente alcuni di i mudelli osservati (per esempiu, in l'estimi Chl per a regione equatoriale è l'Oceanu Meridionale).Solu una piccula parte di a diversità in l'oceanu reale hè catturata, è i meso è sub-mesoscales ùn ponu esse risolti, chì ponu influenzà u flussu di nutrienti è a struttura di a cumunità più chjuca.Malgradu questi difetti, si trova chì AEP hè assai utile per aiutà à capisce mudelli cumplessi.Evaluendu induve si trovanu pruvince ecologiche simili, AEP furnisce un strumentu potenziale di paragone di mudelli numerichi.U mudellu numericu attuale cattura u mudellu generale di a cuncentrazione di fitoplancton Chl-a di rilevazione remota è a distribuzione di a dimensione di u plancton è u gruppu funziunale (Nota S1 è Figura S1) (2, 32).
Cum'è mostratu da a linea di contorno 0,1 mgChl-a/m-3, AEP hè divisu in zona oligotrofica è zona mesotrofica (Figura S1B): AEP B, C, D, E, F è G sò zone oligotrofiche, è e zone restante sò situatu Higher Chl-a.AEP mostra una certa currispundenza cù a Pruvincia di Longhurst (Figura S3A), per esempiu, l'Oceanu Meridionale è u Pacificu equatoriale.Dans certaines régions, l'AEP couvre plusieurs régions de Longhurst, et vice versa.Siccomu l'intenzione di delimità e pruvince in questa zona è Longhurst hè sfarente, hè previstu chì ci saranu differenzi.Diversi AEP in una pruvincia di Longhurst indicanu chì certi spazii cù biogeochimica simili pò avè strutture di l'ecosistema assai diverse.L'AEP mostra una certa currispundenza cù i stati fisichi, cum'è revelatu cù l'apprendimentu senza supervisione (19), cum'è in stati elevati di upwelling (per esempiu, l'Oceanu Meridionale è u Pacificu equatoriale; Figura S3, C è D).Queste currispundenza indicanu chì a struttura di a cumunità di u plancton hè assai influinzata da a dinamica di l'oceanu.In zoni cum'è l'Atlanticu Nordu, AEP traversa pruvince fisiche.U miccanisimu chì pruvucassi sti diffirenzii pò include prucessi cum'è u trasportu di polvera, chì ponu purtà à prugrammi nutrizionali completamente differenti ancu in cundizioni fisiche simili.
U Ministeru di l'Ecologia è l'AEP hà dettu chì l'usu di Chl solu ùn pò micca identificà cumpunenti ecologichi, cum'è a cumunità di l'ecologia marina hà digià capitu.Questu hè vistu in AEP cù biomassa simili ma cumpusizioni ecologiche significativamente differenti (cum'è D è E).In cuntrastu, AEP cum'è D è K anu una biomassa assai diversa, ma cumpusizioni ecologiche simili.AEP enfatiza chì a relazione trà a biomassa, a cumpusizioni ecologica è l'abbundanza di zooplancton hè cumplessa.Per esempiu, ancu se l'AEP J si distingue in termini di fitoplancton è biomassa di plancton, AEP's A è L anu una biomassa di plancton simili, ma A hà una abbundanza di plancton più altu.AEP enfatiza chì a biomassa di fitoplancton (o Chl) ùn pò micca esse usata per predice a biomassa di u zooplancton.U zooplancton hè u fundamentu di a catena alimentaria di a pesca, è stimi più precisi ponu purtà à una megliu gestione di e risorse.I futuri satelliti di culore marinu [per esempiu, PACE (plancton, aerosol, cloud, è ecosistema marinu)] ponu esse megliu posizionati per aiutà à stimà a struttura di a cumunità di u fitoplancton.L'usu di a prediczione AEP pò facilità l'estimazione di u zooplancton da u spaziu.I metudi cum'è SAGE, accumpagnati da e novi tecnulugii, è più è più dati di u campu dispunibuli per i sondaggi di a verità in terra (cum'è Tara è a ricerca di seguitu), ponu inseme un passu versu u monitoraghju di a salute di l'ecosistema basatu à satelliti.
U metudu SAGE furnisce un modu convenientu per evaluà certi meccanismi chì cuntrolanu e caratteristiche di a pruvincia, cum'è a biomassa / Chl, a produzzione primaria neta è a struttura di a cumunità.Per esempiu, a quantità relative di diatomee hè stabilita da un sbilanciu in l'offerta di Si, N, P è Fe relative à i bisogni stechiometrichi fitoplancton.À un ritmu di fornimentu equilibratu, a cumunità hè duminata da diatomee (L).Quandu a tarifa di fornitura hè sbilanciata (vale à dì, l'offerta di silicuu hè più bassu di a dumanda di nutrienti di diatomee), i diatomei sò solu per una piccula parte Share (K).Quandu l'offerta di Fe è P supera l'offerta di N (per esempiu, E è H), a bacteria diazotrophic cresce vigorosamente.Per mezu di u cuntestu furnitu da AEP, l'esplorazione di i miccanismi di cuntrollu diventerà più utile.
L'Eco-Provincia è l'AEP sò zoni cù strutture comunitarie simili.A serie temporale da un certu locu in una pruvincia ecologica o AEP pò esse cunsiderata cum'è un puntu di riferimentu è pò rapprisintà l'area coperta da a pruvincia ecologica o AEP.Stazioni di surviglianza in situ à longu andà furnisce tali serie di tempu.I setti di dati in situ à longu andà continuanu à ghjucà un rolu incalculable.Da a perspettiva di u monitoraghju di a struttura di a cumunità, u metudu SAGE pò esse vistu cum'è un modu per aiutà à determinà u locu più utile di novi siti.Per esempiu, a serie di tempu da a valutazione di l'habitat oligotrophic à longu andà (ALOHA) hè in l'AEP B di l'area oligotrophic (Figura 5C, etichetta 2).Perchè ALOHA hè vicinu à u cunfini di un altru AEP, a serie temporale pò esse micca rappresentativa di tutta l'area, cum'è suggeritu prima (33).In u stessu AEP B, a serie temporale SEATS (Serie di tempu di l'Asia Sudueste) hè situata in u sud-ovest di Taiwan (34), più luntanu da i cunfini di l'altri AEP (Figura 5C, etichetta 1), è pò esse usata cum'è un locu megliu per monitorà. AEPB.A serie temporale BATS (Bermuda Atlantic Time Series Study) (Figura 5C, etichetta 4) in AEPC hè assai vicinu à a fruntiera trà AEP C è F, chì indica chì u monitoraghju AEP C cù a serie temporale BATS pò esse direttamente problematica.A stazione P in AEP J (Figura 5C, etichetta 3) hè luntanu da u cunfini AEP, cusì hè più rappresentativa.L'Eco-Provincia è l'AEP ponu aiutà à stabilisce un quadru di monitoraghju adattatu per valutà i cambiamenti globale, perchè u permessu di e pruvince per valutà induve u campionamentu in situ pò furnisce infurmazioni chjave.U metudu SAGE pò esse sviluppatu ulteriormente per esse appiicatu à e dati climatichi per valutà a variabilità di risparmiu di tempu.
U successu di u metudu SAGE hè ottenutu per una applicazione attenta di i metudi di scienza di dati / ML è cunniscenze specifiche di u duminiu.In particulare, t-SNE hè utilizatu per realizà a riduzzione di dimensionalità, chì cunserva a struttura di covarianza di dati d'alta dimensione è facilita a visualizazione di a topologia di covarianza.I dati sò disposti in forma di strisce è covariances (Figura 2A), chì indicanu chì e misure puramente basate nantu à a distanza (cum'è K-means) ùn sò micca appruvati perchè generalmente utilizanu una distribuzione di basa gaussiana (circulare) (discussa in Nota S2) .U metudu DBSCAN hè adattatu per qualsiasi topulugia di covarianza.Sempre chì fate attenzione à l'impostazione di i paràmetri, l'identificazione affidabile pò esse furnita.U costu computazionale di l'algoritmu t-SNE hè altu, chì limita a so applicazione attuale à una quantità più grande di dati, chì significa chì hè difficiule di applicà à i campi profondi o chì varianu in u tempu.U travagliu nantu à a scalabilità di t-SNE hè in corso.Siccomu a distanza KL hè faciule da parallelizà, l'algoritmu t-SNE hà un bonu potenziale per espansione in u futuru (35).Finu a ora, altri metudi prometenti di riduzzione di dimensionalità chì ponu riduce megliu a dimensione includenu tecniche di approssimazione è proiezione di varietà unificate (UMAP), ma a valutazione in u cuntestu di e dati di l'oceanu hè necessaria.U significatu di una scalabilità megliu hè, per esempiu, classificà i climi glubale o mudelli cù cumplessità sfarente nantu à una capa mista.I zoni chì ùn ponu esse classificati da SAGE in ogni pruvincia ponu esse cunsiderati cum'è i punti neri rimanenti in a Figura 2A.Geugraficamente, sti zoni sò principarmenti in zoni altamente staghjunali, chì suggerisce chì catturà pruvince ecologiche chì cambianu cù u tempu furnisce una cobertura megliu.
Per custruisce u metudu SAGE, l'idee da i sistemi cumplessi / scienza di dati sò stati utilizati, utilizendu a capacità di determinà clusters di gruppi funziunali (a pussibilità di esse assai vicinu in un spaziu 11-dimensionale) è determinanu pruvince.Queste pruvince riprisentanu volumi specifichi in u nostru spaziu di fasi 3D t-SNE.In listessu modu, a parti di Poincaré pò esse usata per evaluà u "volume" di u spaziu statale occupatu da a trajectoria per determinà u cumpurtamentu "normale" o "caòticu" (36).Per l'output di mudellu staticu 11-dimensionale, u voluminu occupatu dopu chì e dati sò cunvertiti in un spaziu di fasi 3D pò esse spiegatu in modu simile.A relazione trà l'area geografica è l'area in u spaziu di fase 3D ùn hè micca simplice, ma pò esse spiegata in termini di similitudine ecologica.Per quessa, a misura di dissimilarità BC più cunvinziunali hè preferita.
I travaglii futuri riutilizzeranu u metudu SAGE per i dati staghjunali per valutà a variabilità spaziale di e pruvince identificate è AEP.L'obiettivu futuru hè di utilizà stu metudu per aiutà à determinà quali pruvince ponu esse determinate per mezu di e misurazioni satellitari (cum'è Chl-a, a riflettività remota è a temperatura di a superficia di u mare).Questu permetterà a valutazione remota di i cumpunenti ecologichi è un monitoraghju altamente flessibile di e pruvince ecologiche è a so variabilità.
U scopu di sta ricerca hè di intruduce u metudu SAGE, chì definisce una pruvincia ecologica attraversu a so struttura unica di a cumunità di u plancton.Quì, infurmazione più dettagliata nantu à u mudellu fisicu / biogeochemical / ecosistema è a selezzione di parametri di l'algoritmi t-SNE è DBSCAN seranu furnite.
I cumpunenti fisichi di u mudellu venenu da l'estimazione di a circulazione di l'oceanu è u clima [ECCOv4;(37) l'estimazione di u statu glubale descritta da (38).A risoluzione nominali di stima statali hè 1/5.U metudu di i minimi quadrati cù u metudu multiplicatore Lagrangianu hè adupratu per ottene e cundizioni iniziali è di frontiera è i paràmetri di u mudellu internu aghjustati da l'osservazione, generendu cusì un mudellu di ciclu generale MIT (MITgcm) (39), u mudellu Dopu à l'optimizazione, i risultati ponu esse tracciatu è osservatu.
A biogeochimica / l'ecosistema hà una descrizzione più cumpleta (ie equazioni è valori di parametri) in (2).U mudellu capta a circulazione di C, N, P, Si è Fe attraversu stagni inorganici è organici.A versione aduprata quì include 35 spezie di fitoplancton: 2 spezie di microprocariote è 2 spezie di microeucariote (adatta per ambienti pocu nutrienti), 5 spezie di Cryptomonas sphaeroides (cù revestimentu di carbonate di calcium), 5 spezie di diazonium (Pudete riparà nitrogenu, cusì ùn hè micca limitatu) a dispunibilità di nitrogenu inorganicu dissolutu), 11 diatomee (furmanu una cuperta silicea), 10 flagellati vegetativi misti (pò photosynthesize è manghjà altri plancton) è 16 Zooplankton (pasce nantu à altri plancton).Questi sò chjamati "gruppi funziunali biogeochimici" perchè anu effetti diffirenti nantu à a biogeochimica marina (40, 41) è sò spessu usati in l'osservazione è i studii di mudelli.In questu mudellu, ogni gruppu funziunale hè cumpostu di parechji planctons di diverse dimensioni, cù un span di 0,6 à 2500 μm di diametru sfericu equivalente.
I paràmetri chì affettanu a crescita di u fitoplancton, u pastore è l'affondamentu sò ligati à a dimensione, è ci sò differenzi specifiche trà i sei gruppi funziunali di fitoplancton (32).Malgradu i diversi quadri fisichi, i risultati di i cumpunenti di u plancton 51 di u mudellu sò stati utilizati in una quantità di studii recenti (42-44).
Da u 1992 à u 2011, u mudellu di accoppiamentu fisicu / biogeochimicu / ecosistema durò per 20 anni.L'output di u mudellu include a biomassa di plancton, a cuncentrazione di nutrienti è a rata di furnimentu di nutrienti (DIN, PO4, Si è Fe).In stu studiu, a media di 20 anni di sti outputs hè stata utilizata cum'è input di a Pruvincia Ecologica.Chl, a distribuzione di a biomassa di u plancton è a cuncentrazione di nutrienti è a distribuzione di gruppi funziunali sò paragunati cù l'osservazioni satellitari è in situ [vede (2, 44), Nota S1 è figura.S1 à S3].
Per u metudu SAGE, a principal fonte di randomness vene da u passu t-SNE.L'aleatoriu impedisce a ripetibilità, chì significa chì i risultati ùn sò micca affidabili.U metudu SAGE prova rigurosamente a robustezza determinendu un inseme di parametri di t-SNE è DBSCAN, chì ponu identificà in modu coerente i clusters quandu si ripete.A determinazione di a "perplessità" di u paràmetru t-SNE pò esse intesa cum'è a determinazione di u gradu à quale a mapping from high to low dimensions deve rispettà e caratteristiche lucali o glubale di e dati.Righjuntu a cunfusione di 400 è 300 iterazioni.
Per l'algoritmu di clustering DBSCAN, a dimensione minima è a metrica di distanza di i punti di dati in u cluster deve esse determinata.U numeru minimu hè determinatu sottu a guida di esperti.Sta cunniscenza sà ciò chì si adatta à u quadru di mudellu numericu attuale è a risoluzione.U numeru minimu hè 100. Un valore minimu più altu (menu di <135 prima di u limitu superiore di u verde diventa più largu) pò esse cunsideratu, ma ùn pò micca rimpiazzà u metudu di aggregazione basatu nantu à a dissimilarità BC.U gradu di cunnessione (Figura 6A) hè utilizatu per stabilisce u paràmetru ϵ, chì conduce à una cobertura più altu (Figura 6B).A cunnessione hè definita cum'è u numeru cumpostu di clusters è hè sensibile à u paràmetru ϵ.A connettività più bassa indica un adattamentu insufficiente, raggruppendu artificialmente e regioni.L'alta connettività indica un overfitting.L'overfitting hè ancu problematicu, perchè mostra chì l'ipotesi aleatorii iniziali ponu purtà à risultati irreproducibili.Trà questi dui estremi, un forte aumentu (di solitu chjamatu "codu") indica u megliu ϵ.In a Figura 6A, vede un forte aumentu in l'area di l'altipiano (giallo, > 200 clusters), seguita da una forte diminuzione (verde, 100 clusters), finu à circa 130, circundatu da pochi clusters (blu, <60 clusters) ).Dans au moins 100 zones bleues, soit un cluster domine l'océan entier (ϵ <0,42), soit la majeure partie de l'océan n'est pas classée et est considérée comme du bruit (ϵ> 0,99).L'area gialla hà una distribuzione di cluster altamente variabile è irreproducibile.À mesure que ϵ diminue, le bruit augmente.L'area verde in forte crescita hè chjamata coddu.Questa hè una regione ottima.Ancu se a probabilità t-SNE hè aduprata, a dissimilarità BC in a pruvincia pò ancu esse usata per determinà un clustering affidabile.À l'aide de la figure 6 (A et B), définissez ϵ à 0,39.U più grande u numeru minimu, u più chjucu a probabilità di ghjunghje à u ϵ chì permette una classificazione affidativa, è più grande a zona verde cù un valore più grande di 135. L'allargamentu di questa zona indica chì u coddu serà più difficiuli di truvà o micca. esistente.
Dopu avè stabilitu i paràmetri di t-SNE, u numeru tutale di clusters truvati serà utilizatu cum'è una misura di cunnessione (A) è u percentuale di dati attribuiti à u cluster (B).U puntu rossu indica a megliu cumminazione di cobertura è cunnessione.U numeru minimu hè stabilitu secondu u numeru minimu ligatu à l'ecologia.
Per materiali supplementarii per questu articulu, vede http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Questu hè un articulu d'accessu apertu distribuitu sottu i termini di a Creative Commons Attribution License.L'articulu permette l'usu, a distribuzione è a ripruduzzione senza restrizioni in ogni mediu sottu à a cundizione chì l'opera originale hè citata bè.
Nota: Vi dumandemu solu di furnisce u vostru indirizzu email per chì a persona chì ricumandemu à a pagina sà chì vulete vede l'email è chì ùn hè micca spam.Ùn catturaremu micca indirizzi email.
Sta quistione hè usata per pruvà s'ellu site un visitatore è impedisce a sottumissione automatica di spam.
U Ministeru Globale di l'Ecologia Marina hè determinatu à risolve prublemi cumplessi è usa ML senza supervisione per scopre strutture di a cumunità.
U Ministeru Globale di l'Ecologia Marina hè determinatu à risolve prublemi cumplessi è usa ML senza supervisione per scopre strutture di a cumunità.


Tempu di pubblicazione: 12-Jan-2021