Clarifying ecological complexity: unsupervised learning determines the global marine ecological province

Ülemaailmsete mereökoloogiliste provintside (ökoprovintside) määramiseks planktoni koosluse struktuuri ja toitainete voo andmete põhjal pakutakse järelevalveta õppemeetodit.Süstemaatilise integreeritud ökoloogilise provintsi (SAGE) meetodiga saab tuvastada ökoloogilisi provintse väga mittelineaarsetes ökosüsteemimudelites.Andmete mitte-Gaussi kovariatsiooniga kohanemiseks kasutab SAGE dimensioonide vähendamiseks t juhuslikku naabri manustamist (t-SNE).Tiheduspõhise ruumiklastri (DBSCAN) algoritmil põhineva mürarakenduse abil saab tuvastada üle saja ökoloogilise provintsi.Kasutades kaugusmõõtjana ühenduvuskaarti ökoloogiliste erinevustega, määratletakse pesastatud ökoloogiliste provintside kaudu objektiivselt robustne koondatud ökoloogiline provints (AEP).AEP-de abil uuriti toitainete tarnimise määra kontrolli kogukonna struktuuris.Ökoprovints ja AEP on ainulaadsed ja võivad aidata tõlgendada.Need võivad hõlbustada mudelite võrdlemist ning parandada mereökosüsteemide mõistmist ja jälgimist.
Provintsid on piirkonnad, kus mere või maismaa keeruline biogeograafia on jaotatud sidusateks ja tähendusrikasteks piirkondadeks (1).Need provintsid on väga olulised asukohtade võrdlemiseks ja vastandamiseks, vaatluste iseloomustamiseks, seireks ja kaitseks.Neid provintse tekitavad keerulised ja mittelineaarsed interaktsioonid muudavad järelevalveta masinõppe (ML) meetodid väga sobivaks provintside objektiivseks määramiseks, kuna andmete kovariatsioon on keeruline ja mitte-Gaussi.Siin pakutakse välja ML-meetod, mis tuvastab Darwini globaalse kolmemõõtmelise (3D) füüsilise/ökosüsteemi mudeli (2) põhjal süstemaatiliselt ainulaadsed mereökoloogilised provintsid (ökoprovintsid).Mõistet "unikaalne" kasutatakse selleks, et näidata, et tuvastatud ala ei kattu piisavalt teiste piirkondadega.Seda meetodit nimetatakse System Integrated Ecological Province (SAGE) meetodiks.Kasulikuks klassifitseerimiseks peab algoritmmeetod võimaldama (i) globaalset klassifikatsiooni ja (ii) mitmeskaalulist analüüsi, mida saab ruumis ja ajas pesastada/agregeerida (3).Selles uuringus pakuti esmalt välja SAGE meetod ja arutati tuvastatud ökoloogilisi provintse.Ökoprovintsid võivad edendada kogukonna struktuuri kontrollivate tegurite mõistmist, anda kasulikke teadmisi seirestrateegiate jaoks ja aidata jälgida muutusi ökosüsteemis.
Maapealseid provintse klassifitseeritakse tavaliselt kliima (sademed ja temperatuur), pinnase, taimestiku ja loomastiku sarnasuste järgi ning neid kasutatakse abistamiseks, bioloogilise mitmekesisuse uuringutes ja haiguste tõrjeks (1, 4).Mereprovintse on keerulisem määratleda.Enamik organisme on mikroskoopilised, vedeliku piiridega.Longhurst et al.(5) Esitas ühe esimestest okeanograafiaministeeriumi ülemaailmsetest keskkonnatingimustel põhinevatest klassifikatsioonidest.Nende "Longhursti" provintside määratlus hõlmab selliseid muutujaid nagu segunemiskiirus, kihistumine ja kiirgustihedus, samuti Longhursti laialdased kogemused mereokeanograafina, kellel on mere ökosüsteemide jaoks muid olulisi tingimusi.Longhursti on laialdaselt kasutatud näiteks esmatootmise ja süsinikuvoogude hindamiseks, kalanduse abistamiseks ja kohapealse vaatlustegevuse planeerimiseks (5–9).Provintside objektiivsemaks määratlemiseks on kasutatud selliseid meetodeid nagu hägusloogika ja piirkondlik järelevalveta klasterdamine/statistika (9-14).Selliste meetodite eesmärk on tuvastada sisukad struktuurid, mis suudavad olemasolevate vaatlusandmete põhjal tuvastada provintse.Näiteks dünaamilised mereprovintsid (12) kasutavad müra vähendamiseks iseorganiseeruvaid kaarte ja hierarhilist (puupõhist) klastrit, et määrata kindlaks piirkondlikelt satelliitidelt saadud merevärvi tooted [klorofüll a (Chl-a), normaliseeritud fluorestsentsi joone kõrgus ja värviline lahustunud orgaaniline aine] ja füüsikaline väli (merepinna temperatuur ja soolsus, absoluutne dünaamiline topograafia ja merejää).
Planktoni koosluse struktuur on murettekitav, sest selle ökoloogial on suur mõju toitainete kõrgemale tasemele, süsiniku neeldumisele ja kliimale.Sellegipoolest on planktoni kogukonna struktuuri põhjal globaalse ökoloogilise provintsi kindlaksmääramine endiselt keeruline ja raskesti mõistetav eesmärk.Merevärvisatelliidid võivad potentsiaalselt anda ülevaate fütoplanktoni jämedateralisest klassifikatsioonist või soovitada funktsionaalrühmade eeliseid (15), kuid praegu ei suuda nad anda üksikasjalikku teavet kogukonna struktuuri kohta.Hiljutised uuringud [nt Tara Ocean (16)] annavad kogukonna struktuuri enneolematuid mõõtmisi;praegu on globaalses mastaabis in situ vaatlusi vaid hõredalt (17).Varasemad uuringud on suures osas määranud biogeokeemilise provintsi (12, 14, 18), mis põhinevad biokeemiliste sarnasuste (nagu esmane tootmine, Chl ja saadaolev valgus) määramisel.Siin kasutatakse väljundiks numbrilist mudelit [Darwin(2)] ja ökoloogiline provints määratakse vastavalt koosluse struktuurile ja toitainete voogudele.Selles uuringus kasutatud numbrilisel mudelil on globaalne katvus ja seda saab võrrelda olemasolevate väliandmete (17) ja kaugseireväljadega (märkus S1).Selles uuringus kasutatud numbriliste mudeliandmete eeliseks on globaalne katvus.Mudelökosüsteem koosneb 35 fütoplanktoni liigist ja 16 zooplanktoni liigist (vt materjalid ja meetodid).Mudelplanktonitüübid interakteeruvad mittelineaarselt mitte-Gaussi kovariatsioonistruktuuridega, mistõttu lihtsad diagnostikameetodid ei sobi tekkivates kogukonnastruktuurides ainulaadsete ja järjepidevate mustrite tuvastamiseks.Siin tutvustatud SAGE meetod pakub uudset viisi keerukate Darwini mudelite väljundi kontrollimiseks.
Andmeteaduse / ML-tehnoloogia võimsad ümberkujundamisvõimalused võivad võimaldada valdavalt keerukatel mudellahendustel paljastada keerulisi, kuid tugevaid struktuure andmete kovariatsioonis.Tugev meetod on defineeritud kui meetod, mis suudab antud veavahemikus tulemusi tõepäraselt reprodutseerida.Isegi lihtsates süsteemides võib tugevate mustrite ja signaalide kindlaksmääramine olla väljakutse.Kuni vaadeldava mustri põhjuste kindlaksmääramiseni võib tekkiv keerukus tunduda keeruline/raskesti lahendatav.Ökosüsteemi koostise määramise põhiprotsess on olemuselt mittelineaarne.Mittelineaarsete interaktsioonide olemasolu võib tugeva klassifikatsiooni segi ajada, mistõttu tuleb vältida meetodeid, mis teevad tugevaid eeldusi andmete kovariatsiooni põhilise statistilise jaotuse kohta.Suuremõõtmelised ja mittelineaarsed andmed on okeanograafias tavalised ning neil võib olla keeruka mitte-Gaussi topoloogiaga kovariatsioonistruktuur.Kuigi mitte-Gaussi kovariatsioonistruktuuriga andmed võivad takistada tugevat klassifitseerimist, on SAGE meetod uudne, kuna see on loodud suvalise topoloogiaga klastrite tuvastamiseks.
SAGE meetodi eesmärk on objektiivselt tuvastada tekkivaid mustreid, mis võivad aidata ökoloogilist mõistmist edasi arendada.Järgides (19) sarnast klastripõhist töövoogu, kasutatakse ökoloogilisi ja toitainete voo muutujaid andmete ainsa klastri, mida nimetatakse ökoloogiliseks provintsiks, määramiseks.Selles uuringus välja pakutud SAGE meetod (joonis 1) vähendab esmalt mõõtmeid 55-lt 11-le, liites eelnevalt määratletud planktoni funktsionaalsed rühmad (vt Materjalid ja meetodid).Kasutades t-juhusliku naabri manustamise (t-SNE) meetodit, vähendatakse suurust veelgi, projitseerides tõenäosuse 3D-ruumi.Järelevalveta rühmitamine võib tuvastada ökoloogiliselt lähedasi alasid [tiheduspõhine ruumiline klaster (DBSCAN) mürapõhistele rakendustele].Nii t-SNE kui ka DBSCAN on rakendatavad mittelineaarse ökosüsteemi numbrilise mudeli andmetele.Seejärel projitseerige saadud ökoloogiline provints maa peale.On tuvastatud üle saja ainulaadse ökoloogilise provintsi, mis sobivad regionaaluuringuteks.Globaalselt järjepideva ökosüsteemi mudeli arvestamiseks kasutatakse SAGE meetodit ökoloogiliste provintside liitmiseks agregeeritud ökoloogilisteks provintsideks (AEP), et parandada ökoloogiliste provintside tõhusust.Koondamisastet (nn "keerukus") saab kohandada vastavalt nõutavale üksikasjalikkuse tasemele.Määrake tugeva AEP minimaalne keerukus.Valiku keskmes on SAGE meetod ja väikseima keerukusega AEP juhtumite uurimine, et määrata kindlaks hädaolukorra kogukonna struktuuri juhtimine.Seejärel saab mustreid analüüsida, et saada ökoloogilisi teadmisi.Siin tutvustatud meetodit saab kasutada ka mudelite võrdlemiseks laiemalt, näiteks hinnates erinevates mudelites leitud sarnaste ökoloogiliste provintside asukohti, et tuua esile erinevusi ja sarnasusi, et võrrelda mudeleid.
(A) ökoloogilise provintsi määramise töövoo skemaatiline diagramm;kasutades funktsionaalrühma summat algsete 55-mõõtmeliste andmete vähendamiseks 11-mõõtmelise mudeli väljundiks, sealhulgas seitsme funktsionaalse/toitainete planktoni biomass ja neli toitainete tarnimismäära.Ebamäärane väärtus ja vastupidav jääkatte pindala.Andmed on standardiseeritud ja standardiseeritud.Statistiliselt sarnaste funktsioonide kombinatsioonide esiletõstmiseks esitage t-SNE algoritmile 11-mõõtmelised andmed.DBSCAN valib parameetri väärtuse määramiseks hoolikalt klastri.Lõpuks projitseerige andmed tagasi laius-/pikkuskraadide projektsioonile.Pange tähele, et seda protsessi korratakse 10 korda, kuna t-SNE rakendamine võib tekitada väikese juhuslikkuse.(B) selgitab, kuidas hankida AEP, korrates punktis A töövoogu 10 korda.Kõigi nende 10 teostuse jaoks määrati 51 fütoplanktoni tüübi biomassi põhjal provintsidevaheline Bray-Curtise (BC) erinevusmaatriks.Määrake BC erinevus provintside vahel, alates keerukusest 1 AEP kuni täieliku keerukusega 115. BC võrdlusaluse määrab Longhursti provints.
SAGE meetod kasutab globaalse 3D füüsilise/ökosüsteemi numbrilise mudeli väljundit ökoloogilise provintsi määratlemiseks [Darwin (2);vt Materjalid ja meetodid ning märkus S1].Ökosüsteemi komponendid koosnevad 35 fütoplanktoni liigist ja 16 zooplanktoni liigist, millel on seitse eelnevalt määratletud funktsionaalset rühma: prokarüootid ja eukarüootid, mis on kohanenud vähese toitainesisaldusega keskkonnaga, kaltsiumkarbonaatkattega koktsiidid ja raske lämmastiku sidumine Lämmastiktoitained (tavaliselt puuduvad). olulised toitained), ränikattega, võivad muuta planktoni fotosünteesi ja karjatada segatoitainete lipulaate ja zooplanktoni karjaseid.Suuruse ulatus on 0,6 kuni 2500 μm ekvivalentne sfääriline diameeter.Fütoplanktoni suuruse ja funktsionaalse rühmituse mudelijaotus kajastab satelliidi- ja in situ vaatluste üldisi omadusi (vt joonised S1 kuni S3).Sarnasus numbrilise mudeli ja vaadeldava ookeani vahel näitab, et mudeliga määratletud provintsid võivad olla rakendatavad in situ ookeanile.Pange tähele, et see mudel kajastab ainult teatud fütoplanktoni mitmekesisust ja ainult teatud in situ ookeani füüsikalisi ja keemilisi mõjualasid.SAGE meetod võib võimaldada inimestel paremini mõista kogukonna mudelstruktuuri väga piirkondlikku kontrollimehhanismi.
Kui lisada igasse planktoni funktsionaalrühma ainult pinnase biomassi summa (keskmiselt 20 aastat), saab andmete mõõtmelisust vähendada.Pärast seda, kui varasemad uuringud näitasid nende võtmerolli koosluse struktuuri kujundamisel, hõlmas see ka toitainete voogude pinnaallika termineid (lämmastiku, raua, fosfaadi ja ränihappe varu) [nt (20, 21)].Funktsionaalrühmade liitmine vähendab probleemi 55-lt (51 planktoni ja 4 toitainevoogu) 11-le mõõtmele.Selles esialgses uuringus ei võetud algoritmist tulenevate arvutuslike piirangute tõttu sügavust ja aja varieeruvust arvesse.
SAGE meetod suudab tuvastada olulisi seoseid mittelineaarsete protsesside ning funktsionaalrühma biomassi ja toitainete voo vaheliste interaktsioonide põhijoonte vahel.Eukleidilistel kaugõppemeetoditel põhinevate 11-mõõtmeliste andmete (nt K-keskmised) kasutamine ei saa usaldusväärseid ja reprodutseeritavaid provintse (19, 22).Seda seetõttu, et ökoloogilist provintsi määratlevate võtmeelementide kovariatsiooni põhijaotuses ei leidu Gaussi kuju.Voronoi rakkude K-keskmised (sirged jooned) ei saa säilitada mitte-Gaussi põhijaotust.
Planktoni seitsme funktsionaalrühma ja nelja toitainevoo biomass moodustab 11-mõõtmelise vektori x.Seetõttu on x mudeliruudustiku vektorväli, kus iga element xi tähistab mudeli horisontaalsel ruudustikul defineeritud 11-mõõtmelist vektorit.Iga indeks i identifitseerib unikaalselt ruudustikupunkti sfääril, kus (lon, lat) = (ϕi, θi).Kui mudelruudustiku biomass on alla 1,2×10-3mg Chl/m3 või jääkatte määr ületab 70%, kasutatakse biomassi andmete logi ja visatakse see kõrvale.Andmed on normaliseeritud ja standarditud, seega on kõik andmed vahemikus [0 kuni 1], keskmine eemaldatakse ja skaleeritakse ühiku dispersiooniks.Seda tehakse selleks, et omadused (biomass ja toitainete voog) ei oleks piiratud kontrastiga võimalike väärtuste vahemikus.Klasterdamine peaks jäädvustama muutuste seost objektide vahelisest võtmetõenäosusest, mitte geograafilisest kaugusest.Nende vahemaade kvantifitseerimisel ilmnevad olulised omadused, samas kui ebavajalikud detailid jäetakse kõrvale.Ökoloogilisest vaatenurgast on see vajalik, kuna teatud tüüpi vähese biomassiga fütoplanktonil võib olla suurem biogeokeemiline mõju, näiteks lämmastiku sidumine diasotroofsete bakterite poolt.Andmete standardiseerimisel ja normaliseerimisel tõstetakse esile seda tüüpi ühismuutujad.
Rõhutades funktsioonide lähedust kõrgmõõtmelises ruumis madalamõõtmelises esituses, kasutatakse t-SNE algoritmi olemasolevate sarnaste piirkondade selgemaks muutmiseks.Varasemates töödes, mille eesmärk oli kaugseirerakenduste jaoks sügavate närvivõrkude loomine, kasutati t-SNE-d, mis tõestas oma oskust põhifunktsioonide eraldamisel (23).See on vajalik samm funktsiooniandmete tugeva klastrite tuvastamiseks, vältides samas mittekonvergentseid lahendusi (märkus S2).Kasutades Gaussi tuumasid, säilitab t-SNE andmete statistilised omadused, kaardistades iga suuremõõtmelise objekti 3D-faasiruumi punktiga, tagades sellega, et sarnaste objektide tõenäosus kõrges ja madalas suunas on kõrgel tasemel kõrge. mõõtmete ruum (24).Arvestades N suuremõõtmelist objekti x1,…,xN, vähendab t-SNE algoritm Kullback-Leibleri (KL) lahknevuse minimeerimisega (25).KL-i lahknevus mõõdab, kui erinev on tõenäosusjaotus teisest võrdlustõenäosuse jaotusest, ja see võib tõhusalt hinnata kõrgemõõtmeliste tunnuste madalamõõtmeliste esituste korrelatsiooni võimalust.Kui xi on i-s objekt N-mõõtmelises ruumis, siis xj on j-s objekt N-mõõtmelises ruumis, yi on i-s objekt madalamõõtmelises ruumis ja yj on j-s objekt madalas ruumis. -mõõtmeline ruum, siis t -SNE määrab sarnasuse tõenäosuse ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) ja mõõtmete vähendamise komplekti q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Joonis fig 2A illustreerib 11-dimensioonilise kombinatsiooni biomassi ja toitainete voovektorite vähendamise mõju 3D-le.t-SNE rakendamise motivatsiooni saab võrrelda põhikomponentanalüüsi (PCA) motivatsiooniga, mis kasutab dispersioonatribuuti, et rõhutada andmete pindala/atribuuti, vähendades seeläbi dimensioonilisust.Leiti, et t-SNE meetod on parem kui PCA, pakkudes ökoministeeriumile usaldusväärseid ja reprodutseeritavaid tulemusi (vt märkust S2).Selle põhjuseks võib olla asjaolu, et PCA ortogonaalsuse eeldus ei sobi väga mittelineaarsete interaktiivsete omaduste vaheliste kriitiliste koostoimete tuvastamiseks, kuna PCA keskendub lineaarsetele kovariatsioonistruktuuridele (26).Kaugseire andmeid kasutades Lunga et al.(27) illustreerib, kuidas kasutada SNE meetodit keerukate ja mittelineaarsete spektriomaduste esiletõstmiseks, mis erinevad Gaussi jaotusest.
(A) Modelleeritud toitainete pakkumise kiirus, fütoplanktoni ja zooplanktoni funktsionaalrühma biomass, mis on joonistatud t-SNE algoritmi abil ja värvitud provintsi järgi, kasutades DBSCAN-i.Iga punkt tähistab punkti kõrgmõõtmelises ruumis, nagu on näidatud joonisel 6B, enamik punkte on hõivatud.Võllid viitavad "t-SNE" suurustele 1, 2 ja 3. (B) DBSCANi leitud provintsi geograafiline projektsioon lähtekoha laius-pikkuskraadide ruudustikul.Värvi tuleks käsitleda mis tahes värvina, kuid see peaks vastama (A).
t-SNE hajuvusgraafiku punktid joonisel 2A on vastavalt seotud laius- ja pikkuskraadidega.Kui kaks punkti joonisel 2A on üksteise lähedal, on põhjuseks nende biomassi ja toitainete vood sarnased, mitte geograafilise läheduse tõttu.Värvid joonisel 2A on klastrid, mis on avastatud DBSCAN-meetodil (28).Tihedate vaatluste otsimisel kasutab DBSCAN-algoritm 3D-esituses punktide vahelist kaugust (ϵ = 0,39; infot selle valiku kohta vt Materjalid ja meetodid) ning klastri määratlemiseks on vaja sarnaste punktide arvu (siin) 100 punkti, vt ülalt).DBSCAN-meetod ei tee mingeid eeldusi andmetes olevate klastrite kuju ega arvu kohta, nagu on näidatud allpool:
3) Kõigi punktide puhul, mis on tuvastatud kauguses olevatena, korrake klastri piiri määramiseks iteratiivselt sammu 2.Kui punktide arv on suurem kui seatud miinimumväärtus, määratakse see klastriks.
Andmeid, mis ei vasta klastri minimaalsele liikmele ja kauguse ϵ meetrikale, loetakse "müraks" ja neile ei omistata värvi.DBSCAN on kiire ja skaleeritav algoritm halvimal juhul O(n2) jõudlusega.Praeguse analüüsi jaoks pole see tegelikult juhuslik.Minimaalne punktide arv määratakse eksperthinnanguga.Pärast vahemaa reguleerimist ei ole tulemus vahemikus ≈±10 piisavalt stabiilne.See kaugus määratakse ühenduvuse (joonis 6A) ja ookeani katvuse protsendi (joonis 6B) abil.Ühenduvust määratletakse klastrite liitarvuna ja see on tundlik parameetri ϵ suhtes.Madalam ühenduvus näitab ebapiisavat sobitumist, piirkondade kunstlikku rühmitamist.Kõrge ühenduvus näitab ülepaigutamist.Mõeldav on kasutada kõrgemat miinimumi, kuid kui miinimum ületab ca, siis pole usaldusväärset lahendust võimalik saavutada.135 (Lisateavet vt Materjalid ja meetodid).
Joonisel 2A tuvastatud 115 klastrit projitseeritakse joonisel 2B maapinnale tagasi.Iga värv vastab DBSCANi tuvastatud biogeokeemiliste ja ökoloogiliste tegurite sidusale kombinatsioonile.Kui klastrid on kindlaks määratud, kasutatakse iga punkti seost joonisel 2A konkreetse laius- ja pikkuskraadiga, et projitseerida klastrid tagasi geograafilisse piirkonda.Joonis 2B illustreerib seda samade kobarate värvidega nagu joonisel 2A.Sarnaseid värve ei tohiks tõlgendada ökoloogilise sarnasusena, sest need määratakse algoritmi poolt klastrite avastamise järjekorras.
Joonisel 2B kujutatud ala võib olla kvalitatiivselt sarnane ookeani füüsikalises ja/või biogeokeemias väljakujunenud alaga.Näiteks lõunaookeani klastrid on tsoonisümmeetrilised, tekivad oligotroofsed keerised ja terav üleminek viitab passaattuulte mõjule.Näiteks Vaikse ookeani ekvatoriaalses osas on näha erinevaid tõusuga seotud piirkondi.
Ökoprovintsi ökoloogilise keskkonna mõistmiseks kasutati klastri ökoloogia hindamiseks Bray-Curtise (BC) erinevusindeksi (29) variatsiooni.BC indikaator on statistilised andmed, mida kasutatakse kahe erineva saidi kogukonna struktuuri erinevuste kvantifitseerimiseks.BC mõõtmine on rakendatav 51 fütoplanktoni ja zooplanktoni liigi biomassile BCninj = 1-2CninjSni + Snj
BCninj viitab kombinatsiooni ni ja kombinatsiooni nj sarnasusele, kus Cninj on üht tüüpi biomassi minimaalne väärtus, mis eksisteerib mõlemas kombinatsioonis ni ja nj, ja Sni esindab kõigi biomasside summat, mis eksisteerivad mõlemas kombinatsioonis ni ja Snj.BC erinevus on sarnane kauguse mõõtmisega, kuid toimib mitte-eukleidilises ruumis, mis on tõenäoliselt sobivam ökoloogiliste andmete ja nende tõlgendamise jaoks.
Iga joonisel 2B tuvastatud klastri puhul saab hinnata provintsisisese ja provintsidevahelise BC sarnasust.BC erinevus provintsis viitab erinevusele provintsi keskmise väärtuse ja provintsi iga punkti vahel.Erinevus eKr provintside vahel viitab ühe provintsi ja teiste provintside sarnasusele.Joonisel 3A on kujutatud sümmeetrilist BC-maatriksit (0, must: täiesti vastav; 1, valge: täiesti erinev).Graafiku iga rida näitab andmetes mustrit.Joonisel 3B on kujutatud joonisel fig 3A toodud BC tulemuste geograafilist tähtsust iga provintsi kohta.Madala toiteväärtusega ja madala toiteväärtusega piirkonnas asuva provintsi puhul on jooniselt 3B näha, et ekvaatorit ja India ookeani ümbritsevate suurte alade sümmeetria on põhimõtteliselt sarnane, kuid kõrgemad laiuskraadid ja tõusupiirkonnad on oluliselt erinevad.
(A) eKr erinevuse aste, mida hinnati igas provintsis, võttes aluseks globaalse 20 aasta keskmise globaalse pinna keskmise 51 planktoni.Pange tähele väärtuste eeldatavat sümmeetriat.(B) Veeru (või rea) ruumiline projektsioon.Düstroofilises ringis asuva provintsi puhul hinnati BC sarnasuse mõõdiku globaalset jaotust ja hinnati globaalset 20 aasta keskmist.Must (BC = 0) tähendab sama ala ja valge (BC = 1) tähendab sarnasuse puudumist.
Joonis 4A illustreerib BC erinevust igas provintsis joonisel 2B.Määratud kasutades klastri keskmise pindala keskmist kombinatsiooni ja määrates BC ja provintsi iga ruudustikupunkti keskmise vahelise erinevuse, näitab see, et SAGE meetod võimaldab hästi eraldada 51 liiki ökoloogilise sarnasuse tüübi alusel. mudeli andmed.Kõigi 51 tüübi klastri BC üldine keskmine erinevus on 0,102±0,0049.
(A, B ja D) BC erinevust provintsis hinnatakse keskmise BC erinevusena iga võrgupunktide kogukonna ja keskmise provintsi vahel ning keerukust ei vähendata.(2) Globaalne keskmine provintsisisene BC erinevus on 0,227±0,117.See on selles töös välja pakutud ökoloogilise motivatsioonipõhise klassifikatsiooni etalon [roheline joon (C)].(C) Keskmine provintsisisene BC erinevus: must joon tähistab provintsisisest BC erinevust kasvava keerukusega.2σ tuleneb ökoprovintsi identifitseerimisprotsessi kümnest kordusest.DBSCAN-i avastatud provintside kogukeerukuse kohta näitab (A), et BC erinevus provintsis on 0,099 ja (C) pakutud keerukuse klassifikatsioon on 12, mille tulemuseks on BC erinevus provintsis 0,200.nagu pilt näitab.(D).
Joonisel 4B on kasutatud 51 planktoni tüübi biomassi, et esindada samaväärset BC erinevust Longhursti provintsis.Iga provintsi üldine keskmine on 0,227 ja ruudustikupunktide standardhälve võrreldes eKr provintsi erinevusega on 0,046.See on suurem kui joonisel 1B näidatud klaster.Selle asemel, kasutades seitsme funktsionaalrühma summat, kasvas keskmine hooajasisene BC erinevus Longhurstis 0, 232-ni.
Ülemaailmne ökoprovintsi kaart pakub keerulisi üksikasju ainulaadsete ökoloogiliste vastasmõjude kohta ja Longhursti provintsi kogu ökosüsteemi struktuuri kasutamist on täiustatud.Ökoloogiaministeeriumilt oodatakse ülevaadet numbrilise mudeli ökosüsteemi kontrollimise protsessist ja see ülevaade aitab välitöödega tutvuda.Selle uurimistöö jaoks ei ole võimalik üle saja provintsi täielikult kuvada.Järgmises jaotises tutvustatakse SAGE meetodit, mis võtab kokku provintsid.
Üks provintsi eesmärke on edendada arusaamist provintsi asukohast ja juhtimisest.Hädaolukordade määramiseks illustreerib joonisel 1B toodud meetod ökoloogiliselt sarnaste provintside pesitsemist.Ökoprovintsid rühmitatakse ökoloogilise sarnasuse alusel ja sellist provintside rühmitamist nimetatakse AEP-ks.Seadke reguleeritav "keerukus", mis põhineb arvesse võetavate provintside koguarvul.Mõistet "keerukus" kasutatakse seetõttu, et see võimaldab hädaolukorra atribuutide taset reguleerida.Mõteliste liitmike määratlemiseks kasutatakse võrdlusalusena provintsisisest BC keskmist erinevust 0,227 Longhurstist.Sellest võrdlusalusest madalamal ei peeta kombineeritud provintse enam kasulikuks.
Nagu on näidatud joonisel 3B, on globaalsed ökoloogilised provintsid ühtsed.Kasutades provintsidevahelisi BC erinevusi, on näha, et mõned konfiguratsioonid on väga "levinud".Geneetikast ja graafikuteooria meetoditest inspireerituna kasutatakse "ühendatud graafikuid" >100 provintsi sortimiseks neile kõige sarnasemate provintside alusel."Ühenduvuse" mõõdik määratakse siin kindlaks provintsidevahelise BC erinevuse (30) abil.Provintside arvu, kus on rohkem kui 100 provintsi klassifitseerimiseks, võib siin viidata keerukusele.AEP on toode, mis liigitab enam kui 100 provintsi kõige domineerivamateks/lähimateks ökoloogilisteks provintsideks.Iga ökoloogiline provints on määratud domineeriva/kõrgelt seotud ökoloogilise provintsiga, mis on nendega kõige sarnasem.See BC erinevuse poolt määratud liit võimaldab pesastatud lähenemist globaalsele ökoloogiale.
Valitud keerukus võib olla mis tahes väärtus vahemikus 1 kuni joonisel fig.2A.Madalama keerukuse korral võib AEP degenereeruda tõenäosusliku mõõtmete vähendamise sammu (t-SNE) tõttu.Degeneratsioon tähendab, et ökoloogilisi provintse saab iteratsioonide vahel määrata erinevatele AEP-dele, muutes sellega hõlmatud geograafilist piirkonda.Joonis 4C illustreerib BC erinevuste levikut provintsides üha keerukamates AEP-des 10 rakenduse lõikes (illustratsioon joonisel 1B).Joonisel 4C on 2σ (sinine ala) halvenemise mõõt 10 teostuses ja roheline joon tähistab Longhursti võrdlusalust.Faktid on tõestanud, et 12 keerukus võib hoida BC erinevuse provintsis kõigis rakendustes alla Longhursti võrdlusaluse ja säilitada suhteliselt väikese 2σ lagunemise.Kokkuvõttes on minimaalne soovitatav keerukus 12 AEP-d ja keskmine provintsisisene BC erinevus, mida hinnati 51 planktonitüübi abil, on 0, 198 ± 0, 013, nagu on näidatud joonisel 4D.Kasutades seitsme planktoni funktsionaalrühma summat, on provintsi keskmine BC erinevus 0,198±0,004 asemel 2σ.Seitsme funktsionaalrühma kogubiomassi või kõigi 51 planktonitüübi biomassiga arvutatud BC erinevuste võrdlus näitab, et kuigi SAGE meetod on rakendatav 51-mõõtmelise olukorra jaoks, on see seitsme funktsionaalrühma kogu biomassi jaoks. Treeningu jaoks.
Olenevalt mis tahes uurimistöö eesmärgist võib kaaluda erinevaid keerukusastmeid.Piirkondlikud uuringud võivad nõuda täielikku keerukust (st kõik 115 provintsi).Näitena ja selguse huvides võtke arvesse minimaalset soovitatavat keerukust 12.
SAGE meetodi kasulikkuse näitena kasutatakse siin hädaabikogukonna struktuuri kontrollimise uurimiseks 12 AEP-d minimaalse keerukusega 12.Joonis 5 illustreerib ökoloogilisi teadmisi, mis on rühmitatud AEP järgi (A-st L): Redfieldi stöhhiomeetrias teostab geograafilist ulatust (joonis 5C), funktsionaalrühma biomassi koostist (joonis 5A) ja toitainetega varustamist (joonis 5B) N Zoomed.Näidatud on suhe (N:Si:P:Fe, 1:1:16:16×103).Viimase paneeli puhul on P korrutatud 16-ga ja Fe korrutis 16 × 103-ga, seega on tulpdiagramm samaväärne fütoplanktoni toitumisvajadustega.
Provintsid on klassifitseeritud 12 AEP-sse A–L. (A) 12 provintsi ökosüsteemide biomass (mgC/m3).(B) Lahustunud anorgaanilise lämmastiku (N), raua (Fe), fosfaadi (P) ja ränihappe (Si) toitainete voolukiirus (mmol/m3 aastas).Fe ja P korrutatakse vastavalt 16 ja 16 × 103-ga, nii et ribad on standarditud vastavalt fütoplanktoni stöhhiomeetria nõuetele.(C) Pange tähele erinevust polaarpiirkondade, subtroopiliste tsüklonite ja peamiste hooajaliste / tõusupiirkondade vahel.Seirejaamad on tähistatud järgmiselt: 1, ISTED;2, ALOHA;3, jaam P;ja 4, BATS.
Tuvastatud AEP on ainulaadne.Atlandi ookeanis ja Vaikses ookeanis on ekvaatori ümber teatav sümmeetria ning sarnane, kuid laienenud ala on ka India ookeanis.Mõned AEP-d hõlmavad tõusuga seotud mandri läänepoolset külge.Lõunapooluse ringpolaarvoolu peetakse suureks tsooniliseks tunnuseks.Subtroopiline tsüklon on oligotroofse AEP kompleksne seeria.Nendes provintsides on ilmne biomassi erinevuste muster planktoni domineerivate oligotroofsete keeriste ja ränivetikate rikaste polaaralade vahel.
Väga sarnase fütoplanktoni kogubiomassiga AEP-del võib olla väga erinev koosluse struktuur ja need võivad hõlmata erinevaid geograafilisi piirkondi, nagu D, H ja K, millel on sarnane kogu fütoplanktoni biomass.AEP H esineb peamiselt India ookeani ekvatoriaalses osas ja seal on rohkem diasotroofseid baktereid.AEP D leidub mitmes basseinis, kuid see on eriti silmapaistev Vaikse ookeani piirkonnas ekvatoriaalset tõusu ümbritsevate kõrge saagikusega alade ümber.Selle Vaikse ookeani provintsi kuju meenutab planeedilainerongi.AEP D-s on vähe diasobaktereid ja rohkem käbisid.Võrreldes kahe teise provintsiga, leidub AEP K-d ainult Põhja-Jäämere mägismaal ning seal on rohkem ränivetikuid ja vähem planktoneid.Väärib märkimist, et planktoni hulk on neis kolmes piirkonnas samuti väga erinev.Nende hulgas on AEP K planktoni arvukus suhteliselt madal, samas kui AEP D ja H suhteliselt kõrge.Seetõttu on need provintsid hoolimata nende biomassist (ja seetõttu sarnased Chl-a-ga) üsna erinevad: Chl-põhine provintsi testimine ei pruugi neid erinevusi tabada.
Samuti on ilmne, et mõned väga erineva biomassiga AEP-d võivad fütoplanktoni koosluse struktuuri poolest olla sarnased.Näiteks on see nähtav AEP D ja E puhul. Need on üksteise lähedal ning Vaikses ookeanis on AEP E lähedal väga tootlikule AEPJ-le.Samuti puudub selge seos fütoplanktoni biomassi ja zooplanktoni arvukuse vahel.
AEP-d saab mõista neile pakutavate toitainete järgi (joonis 5B).Diatomid eksisteerivad ainult seal, kus on piisavalt ränihapet.Üldiselt, mida suurem on ränihappe varu, seda suurem on ränivetikate biomass.Diatomeid võib näha AEP A, J, K ja L. Diatomi biomassi suhe muu fütoplanktoni suhtes määratakse N, P ja Fe järgi, mis on antud diatomi nõudluse suhtes.Näiteks AEP L-s domineerivad ränivetikad.Võrreldes teiste toitainetega on Si-l suurim varu.Seevastu vaatamata kõrgemale tootlikkusele on AEP J-l vähem ränivetikat ja vähem räni (kõik ja võrreldes teiste toitainetega).
Diasooniumibakteritel on võime siduda lämmastikku, kuid need kasvavad aeglaselt (31).Nad eksisteerivad koos teiste fütoplanktonidega, kus rauda ja fosforit on liiga palju, võrreldes nõudlusega mitte-diasooniumi toitainete järele (20, 21).Väärib märkimist, et diasotroofne biomass on suhteliselt suur ning Fe ja P pakkumine on suhteliselt suur võrreldes lämmastikuga. Sel viisil, kuigi kogu biomass AEP J-s on suurem, on diasooniumi biomass AEP H-s suurem. suurem kui J. Pange tähele, et AEP J ja H on geograafiliselt väga erinevad ning H asub India ookeani ekvatoriaalses osas.
Kui unikaalset ökosüsteemi struktuuri ei jaotata provintsideks, ei ole 12 AEP-i kõige väiksema keerukusega mudelist saadud arusaamad nii selged.SAGE loodud AEP hõlbustab ökosüsteemi mudelite keeruka ja suuremõõtmelise teabe sidusat ja samaaegset võrdlemist.AEP rõhutab tõhusalt, miks Chl ei ole hea ja alternatiivne meetod koosluse struktuuri või zooplanktoni arvukuse määramiseks kõrgematel toitainete tasemetel.Käimasolevate uurimisteemade üksikasjalik analüüs jääb selle artikli raamidest välja.SAGE meetod annab võimaluse uurida teisi mudeli mehhanisme, mida on lihtsam käsitleda kui punktist punkti vaatamist.
SAGE meetodit pakutakse selleks, et aidata selgitada globaalsete füüsikaliste / biogeokeemiliste / ökosüsteemi numbriliste mudelite põhjal väga keerulisi ökoloogilisi andmeid.Ökoloogiline provints määratakse ristplanktoni funktsionaalrühmade kogubiomassi, t-SNE tõenäosuse mõõtmete vähendamise algoritmi ja klastrimise abil järelevalveta ML-meetodil DBSCAN.Provintsidevahelist BC erinevuste/graafikuteooriat pesastusmeetodi jaoks rakendatakse tugeva AEP tuletamiseks, mida saab kasutada globaalseks tõlgendamiseks.Ehituse poolest on Eco-Province ja AEP ainulaadsed.AEP-pesastamist saab reguleerida algse ökoloogilise provintsi täieliku keerukuse ja soovitatava 12 AEP-i miinimumläve vahel.Pesastamist ja AEP minimaalse keerukuse määramist peetakse peamisteks sammudeks, kuna tõenäosus t-SNE degenereerib <12 keerukusega AEP-sid.SAGE-meetod on globaalne ja selle keerukus ulatub> 100 AEP-st 12-ni. Lihtsuse huvides keskendutakse praegu 12 globaalse AEP-i keerukusele.Tulevased uuringud, eriti piirkondlikud uuringud, võivad osutuda kasulikuks globaalsete ökoprovintside väiksemast ruumilisest alamhulgast ja neid võidakse koondada väiksemasse piirkonda, et kasutada ära samu siin käsitletud ökoloogilisi teadmisi.See annab soovitusi selle kohta, kuidas neid ökoloogilisi provintse ja nendest saadud teadmisi saab kasutada edasiseks ökoloogiliseks mõistmiseks, hõlbustada mudelite võrdlemist ja potentsiaalselt parandada mere ökosüsteemide seiret.
SAGE meetodil tuvastatud ökoloogiline provints ja AEP põhinevad arvmudeli andmetel.Määratluse järgi on numbriline mudel lihtsustatud struktuur, mis püüab tabada sihtsüsteemi olemust ja erinevatel mudelitel on planktoni jaotus erinev.Selles uuringus kasutatud numbriline mudel ei suuda mõnda vaadeldud mustrit täielikult tabada (näiteks ekvatoriaalpiirkonna ja lõunaookeani Chl hinnangutes).Jäädvustatud on vaid väike osa tegeliku ookeani mitmekesisusest ning meso- ja submesoskaale ei saa lahendada, mis võib mõjutada toitainete voogu ja väiksemat kogukonna struktuuri.Nendele puudustele vaatamata selgub, et AEP on väga kasulik keerukate mudelite mõistmisel.Hinnates, kus sarnaseid ökoloogilisi provintse leidub, pakub AEP potentsiaalset numbrilise mudeli võrdlustööriista.Praegune numbriline mudel kajastab kaugseire fütoplanktoni Chl-a kontsentratsiooni üldist mustrit ning planktoni suuruse ja funktsionaalse rühma jaotust (märkus S1 ja joonis S1) (2, 32).
Nagu näitab 0,1 mgChl-a/m-3 kontuurjoon, jaguneb AEP oligotroofseks piirkonnaks ja mesotroofseks piirkonnaks (joonis S1B): AEP B, C, D, E, F ja G on oligotroofsed alad ning ülejäänud alad on asub Kõrgem Chl-a.AEP näitab kirjavahetust Longhursti provintsiga (joonis S3A), näiteks ookeani lõunaosa ja Vaikse ookeani ekvatoriaalosaga.Mõnes piirkonnas hõlmab AEP mitut Longhursti piirkonda ja vastupidi.Kuna selle piirkonna ja Longhursti provintside piiritlemise kavatsus on erinev, on oodata erinevusi.Mitmed AEP-d Longhursti provintsis näitavad, et teatud sarnase biogeokeemiaga piirkondadel võib olla väga erinev ökosüsteemi struktuur.AEP näitab teatud vastavust füüsilistele olekutele, nagu ilmnes järelevalveta õppimise (19) abil, näiteks kõrge tõusu korral (näiteks ookeani lõunaosa ja Vaikse ookeani ekvatoriaalne osa; joonis S3, C ja D).Need vastavused näitavad, et planktoni kogukonna struktuuri mõjutab tugevalt ookeani dünaamika.Sellistes piirkondades nagu Atlandi ookeani põhjaosa läbib AEP füüsilisi provintse.Neid erinevusi põhjustav mehhanism võib hõlmata selliseid protsesse nagu tolmu transport, mis võib isegi sarnastes füüsilistes tingimustes viia täiesti erinevate toitumisprogrammideni.
Ökoloogiaministeerium ja AEP juhtisid tähelepanu sellele, et ainult Chl-i kasutamisel ei ole võimalik ökoloogilisi komponente tuvastada, nagu mereökoloogia kogukond on juba aru saanud.Seda on näha sarnase biomassiga, kuid oluliselt erineva ökoloogilise koostisega AEP-de puhul (nagu D ja E).Seevastu AEP-del, nagu D ja K, on väga erinev biomass, kuid sarnane ökoloogiline koostis.AEP rõhutab, et seos biomassi, ökoloogilise koostise ja zooplanktoni arvukuse vahel on keeruline.Näiteks kuigi AEP J paistab silma fütoplanktoni ja planktoni biomassi poolest, on AEP A ja L planktoni biomass sarnane, kuid planktoni arvukus A on suurem.AEP rõhutab, et fütoplanktoni biomassi (või Chl-i) ei saa kasutada zooplanktoni biomassi ennustamiseks.Zooplankton on kalanduse toiduahela alus ja täpsemad hinnangud võivad viia ressursside parema majandamiseni.Tulevased värvilised meresatelliidid [näiteks PACE (plankton, aerosool, pilv ja mereökosüsteem)] võivad olla paremini paigutatud, et aidata hinnata fütoplanktoni koosluse struktuuri.AEP-ennustuse kasutamine võib potentsiaalselt hõlbustada zooplanktoni hindamist kosmosest.Sellised meetodid nagu SAGE koos uute tehnoloogiate ja üha rohkemate maapealsete tõeuuringute jaoks saadaolevate väliandmetega (nagu Tara ja järeluuringud) võivad ühiselt astuda sammu satelliidipõhise ökosüsteemide terviseseire suunas.
SAGE meetod annab mugava võimaluse hinnata mõningaid mehhanisme, mis kontrollivad provintsi omadusi, nagu biomass/Chl, neto esmane tootmine ja kogukonna struktuur.Näiteks diatomite suhtelise koguse määrab Si, N, P ja Fe pakkumise tasakaalustamatus võrreldes fütoplanktoni stöhhiomeetriliste nõuetega.Tasakaalustatud tarnekiiruse korral domineerivad koosluses ränivetikad (L).Kui tarnekiirus on tasakaalustamata (st räni pakkumine on väiksem kui ränivetikate toitainete vajadus), moodustavad ränivetikad vaid väikese osa (K).Kui Fe ja P pakkumine ületab N pakkumise (näiteks E ja H), kasvavad diasotroofsed bakterid jõuliselt.AEP-i pakutava konteksti kaudu muutub kontrollimehhanismide uurimine kasulikumaks.
Ökoprovints ja AEP on sarnase kogukonnastruktuuriga piirkonnad.Ökoloogilise provintsi või AEP teatud kohast pärit aegrida võib pidada võrdluspunktiks ja see võib esindada ökoloogilise provintsi või AEP-ga hõlmatud ala.Selliseid aegridu pakuvad pikaajalised kohapealsed seirejaamad.Pikaajalised in situ andmekogumid mängivad jätkuvalt hindamatut rolli.Kogukonna struktuuri jälgimise seisukohalt võib SAGE meetodit vaadelda kui võimalust, mis aitab määrata uute saitide kõige kasulikumat asukohta.Näiteks pikaajalise oligotroofse elupaiga hindamise (ALOHA) aegrida on oligotroofse ala AEP B-s (joonis 5C, silt 2).Kuna ALOHA on mõne teise AEP piiri lähedal, ei pruugi aegrida kogu piirkonda esindada, nagu eelnevalt soovitati (33).Samas AEP B-s paikneb aegrida SEATS (Southeast Asian Time Series) Taiwani edelaosas (34), teiste AEP-de piiridest kaugemal (joonis 5C, silt 1) ja seda saab kasutada parema asukohana jälgimiseks. AEPB.BATS-i (Bermuda Atlantic Time Series Study) aegrida (joonis 5C, silt 4) AEPC-s on väga lähedal AEP C ja F vahelisele piirile, mis näitab, et AEP C jälgimine BATS-i aegridade abil võib olla otseselt problemaatiline.Jaam P AEP J-s (joonis 5C, silt 3) on AEP piirist kaugel, seega on see esinduslikum.Ökoprovints ja AEP võivad aidata luua globaalsete muutuste hindamiseks sobiva seireraamistiku, sest provintside luba hinnata, kus kohapealne proovide võtmine võib anda peamise ülevaate.SAGE meetodit saab edasi arendada, et seda saaks rakendada kliimaandmetele, et hinnata ajasäästlikku muutlikkust.
SAGE meetodi edu saavutatakse andmeteaduse/ML meetodite ja domeenispetsiifiliste teadmiste hoolika rakendamisega.Täpsemalt kasutatakse t-SNE-d dimensioonide vähendamiseks, mis säilitab suuremõõtmeliste andmete kovariatsioonistruktuuri ja hõlbustab kovariatsiooni topoloogia visualiseerimist.Andmed on paigutatud triipude ja kovariatsioonide kujul (joonis 2A), mis näitab, et puhtalt vahemaapõhised mõõdud (nt K-keskmised) ei ole asjakohased, kuna need kasutavad tavaliselt Gaussi (ringikujulist) jaotust (seda käsitletakse märkuses S2). .DBSCAN-meetod sobib iga kovariatsioonitopoloogia jaoks.Niikaua kui pöörate tähelepanu parameetrite seadistamisele, on võimalik tagada usaldusväärne tuvastamine.t-SNE algoritmi arvutuskulud on suured, mis piirab selle praegust kasutamist suurema andmehulgaga, mis tähendab, et seda on raske rakendada sügavatele või ajaliselt muutuvatele väljadele.Töö t-SNE skaleeritavuse kallal on pooleli.Kuna KL-i kaugust on lihtne paralleelstada, on t-SNE algoritmil hea potentsiaal tulevikus laieneda (35).Siiani hõlmavad muud paljulubavad mõõtmete vähendamise meetodid, mis võivad suurust paremini vähendada, ühtse kollektori lähendamise ja projektsiooni (UMAP) tehnikaid, kuid hindamine ookeaniandmete kontekstis on vajalik.Parema skaleeritavuse tähendus on näiteks globaalsete kliimade või erineva keerukusega mudelite klassifitseerimine segakihile.Piirkondi, mida SAGE ei suuda üheski provintsis klassifitseerida, võib pidada ülejäänud mustadeks punktideks joonisel 2A.Geograafiliselt asuvad need alad peamiselt väga hooajalistes piirkondades, mis viitab sellele, et aja jooksul muutuvate ökoloogiliste provintside hõivamine tagab parema katvuse.
SAGE meetodi konstrueerimiseks on kasutatud keerukate süsteemide/andmeteaduse ideid, kasutades võimalust määrata funktsionaalrühmade klastreid (võimalus olla väga lähedal 11-mõõtmelises ruumis) ja määrata provintse.Need provintsid kujutavad konkreetseid mahtusid meie 3D t-SNE faasiruumis.Samamoodi saab Poincaré osa kasutada trajektoori poolt hõivatud olekuruumi "mahu" hindamiseks, et määrata "normaalne" või "kaootiline" käitumine (36).Staatilise 11-mõõtmelise mudeli väljundi puhul saab samamoodi selgitada pärast andmete 3D-faasiruumiks teisendamist hõivatud mahtu.Geograafilise piirkonna ja piirkonna suhe 3D-faasiruumis ei ole lihtne, kuid seda saab seletada ökoloogilise sarnasuse kaudu.Sel põhjusel eelistatakse tavapärasemat BC erinevuse mõõdikut.
Edaspidine töö taaskasutab SAGE meetodit hooajaliselt muutuvate andmete jaoks, et hinnata tuvastatud provintside ja AEP ruumilist varieeruvust.Tuleviku eesmärk on kasutada seda meetodit, et aidata kindlaks teha, milliseid provintse saab määrata satelliitmõõtmiste abil (nt Chl-a, kaugseire peegeldusvõime ja merepinna temperatuur).See võimaldab hinnata ökoloogilisi komponente kaugseirega ning jälgida ökoloogiliste provintside ja nende varieeruvust väga paindlikult.
Selle uurimistöö eesmärk on tutvustada SAGE meetodit, mis määratleb ökoloogilise provintsi selle ainulaadse planktonikoosluse struktuuri kaudu.Siin antakse üksikasjalikum teave füüsikalise / biogeokeemilise / ökosüsteemi mudeli ning t-SNE ja DBSCAN algoritmide parameetrite valiku kohta.
Mudeli füüsikalised komponendid pärinevad ookeani tsirkulatsiooni ja kliima hinnangust [ECCOv4;(37) globaalse oleku hinnang, mida kirjeldab (38).Seisundi hinnangu nominaallahutusvõime on 1/5.Vähimruutude meetodit Lagrangi kordaja meetodiga kasutatakse vaatlusega korrigeeritud alg- ja piirtingimuste ning sisemudeli parameetrite saamiseks, genereerides seeläbi vabalt töötava MIT üldtsükli mudeli (MITgcm) (39), mudel Pärast optimeerimist saab tulemusi jälgida ja jälgida.
Biogeokeemial/ökosüsteemil on täielikum kirjeldus (st võrrandid ja parameetrite väärtused) punktis (2).Mudel kajastab C, N, P, Si ja Fe ringlust anorgaaniliste ja orgaaniliste tiikide kaudu.Siin kasutatav versioon sisaldab 35 liiki fütoplanktonit: 2 liiki mikroprokarüoote ja 2 liiki mikroeukarüoote (sobivad madala toiteväärtusega keskkonda), 5 liiki Cryptomonas sphaeroides (kaltsiumkarbonaatkattega), 5 liiki diasooniumi ( suudab siduda lämmastikku, nii et see ei ole piiratud) lahustunud anorgaanilise lämmastiku kättesaadavus), 11 ränivetikat (moodustavad ränikatte), 10 segavegetatiivset flagellaati (võivad fotosünteesida ja süüa teisi planktonit) ja 16 zooplanktonit (karjatavad teist planktonit).Neid nimetatakse "biogeokeemilisteks funktsionaalrühmadeks", kuna neil on mere biogeokeemiale erinev mõju (40, 41) ja neid kasutatakse sageli vaatlus- ja mudeliuuringutes.Selles mudelis koosneb iga funktsionaalrühm mitmest erineva suurusega planktonist, mille ulatus on 0,6 kuni 2500 μm ekvivalentse sfäärilise läbimõõduga.
Fütoplanktoni kasvu, karjatamist ja vajumist mõjutavad parameetrid on seotud suurusega ning kuue fütoplanktoni funktsionaalrühma vahel on spetsiifilised erinevused (32).Vaatamata erinevatele füüsikalistele raamistikele on mudeli 51 planktoni komponendi tulemusi kasutatud mitmetes hiljutistes uuringutes (42-44).
Aastatel 1992–2011 kestis füüsikalise/biogeokeemilise/ökosüsteemi sidumise mudel 20 aastat.Mudeli väljund sisaldab planktoni biomassi, toitainete kontsentratsiooni ja toitainetega varustamise kiirust (DIN, PO4, Si ja Fe).Selles uuringus kasutati ökoloogilise provintsi sisendina nende väljundite 20 aasta keskmist.Chl, planktoni biomassi ja toitainete kontsentratsiooni jaotust ning funktsionaalrühmade jaotust võrreldakse satelliidi ja in situ vaatlustega [vt (2, 44), märkus S1 ja joonis.S1 kuni S3].
SAGE meetodi puhul pärineb peamine juhuslikkuse allikas t-SNE sammust.Juhuslikkus takistab korratavust, mis tähendab, et tulemused on ebausaldusväärsed.SAGE meetod testib rangelt töökindlust, määrates kindlaks t-SNE ja DBSCAN parameetrite komplekti, mis võivad kordumisel klastreid järjekindlalt tuvastada.t-SNE parameetri "hämmakuse" määramist võib mõista kui määramist, mil määral peaks kaardistamine kõrgetest mõõtmetest madalatele arvestama andmete kohalikke või globaalseid omadusi.Jõudnud 400 ja 300 iteratsiooni segaduseni.
Klasterdamisalgoritmi DBSCAN jaoks tuleb määrata klastri andmepunktide minimaalne suurus ja kauguse mõõdik.Minimaalne arv määratakse ekspertide juhendamisel.Need teadmised teavad, mis sobib praeguse numbrilise modelleerimise raamistiku ja eraldusvõimega.Minimaalne arv on 100. Kõrgemat miinimumväärtust (vähem kui <135, enne kui rohelise ülempiir muutub laiemaks) võib kaaluda, kuid see ei saa asendada BC erinevusel põhinevat liitmismeetodit.Ühendusastet (joonis 6A) kasutatakse parameetri ϵ määramiseks, mis soodustab suuremat katvust (joonis 6B).Ühenduvust määratletakse klastrite liitarvuna ja see on tundlik parameetri ϵ suhtes.Madalam ühenduvus näitab ebapiisavat sobitumist, piirkondade kunstlikku rühmitamist.Kõrge ühenduvus näitab ülepaigutamist.Ülesobitamine on samuti problemaatiline, kuna see näitab, et esialgsed juhuslikud oletused võivad viia reprodutseerimata tulemusteni.Nende kahe äärmuse vahel näitab järsk tõus (tavaliselt nimetatakse seda küünarnukiks) parimat ϵ-d.Joonisel 6A näete platoo pindala järsku suurenemist (kollane, > 200 klastrit), millele järgneb järsk langus (roheline, 100 klastrit) kuni umbes 130-ni, mida ümbritsevad väga vähesed kobarad (sinine, <60 klastrit) ).Vähemalt 100 sinisel alal domineerib kogu ookeani üle üks kobar (ϵ <0,42) või suurem osa ookeanist ei ole klassifitseeritud ja seda peetakse müraks (ϵ> 0,99).Kollasel alal on väga varieeruv, reprodutseerimata kobarjaotus.Kui ϵ väheneb, suureneb müra.Järsult suurenevat haljasala nimetatakse küünarnukiks.See on optimaalne piirkond.Kuigi kasutatakse tõenäosust t-SNE, saab usaldusväärse klastrite määramiseks siiski kasutada provintsisisese BC erinevust.Kasutades joonist 6 (A ja B), määrake ϵ väärtuseks 0,39.Mida suurem on miinimumarv, seda väiksem on tõenäosus saavutada usaldusväärset klassifitseerimist võimaldav ϵ ja seda suurem on haljasala, mille väärtus on suurem kui 135. Selle ala suurenemine näitab, et küünarnukki on raskem leida või mitte. olemasolev.
Pärast t-SNE parameetrite määramist kasutatakse leitud klastrite koguarvu ühenduvuse (A) ja klastrile eraldatud andmete protsendina (B).Punane täpp näitab leviala ja ühenduvuse parimat kombinatsiooni.Minimaalne arv määratakse ökoloogiaga seotud miinimumarvu järgi.
Selle artikli täiendavaid materjale leiate aadressilt http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
See on avatud juurdepääsuga artikkel, mida levitatakse Creative Commonsi omistamislitsentsi tingimuste alusel.Artikkel lubab piiramatut kasutamist, levitamist ja reprodutseerimist mis tahes kandjatel tingimusel, et originaalteosele viidatakse õigesti.
Märkus. Palume teil sisestada oma e-posti aadress ainult selleks, et lehele soovitav inimene teaks, et soovite, et ta seda meili näeks ja et see pole rämpspost.Me ei jäädvusta ühtegi meiliaadressi.
Seda küsimust kasutatakse selleks, et testida, kas olete külastaja ja vältida rämpsposti automaatset saatmist.
Ülemaailmne mereökoloogia ministeerium on otsustanud lahendada keerulisi probleeme ja kasutab kogukonna struktuuride uurimiseks järelevalveta ML-i.
Ülemaailmne mereökoloogia ministeerium on otsustanud lahendada keerulisi probleeme ja kasutab kogukonna struktuuride uurimiseks järelevalveta ML-i.

Postitusaeg: jaanuar 12-2021

Ökoloogilise keerukuse selgitamine: järelevalveta õppimine määrab globaalse mereökoloogilise provintsi