topimg

Ekologinio sudėtingumo paaiškinimas: neprižiūrimas mokymasis lemia pasaulinę jūrų ekologinę provinciją

Pasaulinėms jūrų ekologinėms provincijoms (ekoprovincijoms) nustatyti siūlomas neprižiūrimas mokymosi metodas, pagrįstas planktono bendrijos struktūra ir maistinių medžiagų srauto duomenimis.Sisteminis integruotas ekologinės provincijos (SAGE) metodas gali nustatyti ekologines provincijas labai netiesiniuose ekosistemų modeliuose.Siekdamas prisitaikyti prie ne Gauso duomenų kovariacijos, SAGE naudoja t atsitiktinį kaimynų įterpimą (t-SNE), kad sumažintų matmenis.Naudojant triukšmo programą, pagrįstą tankiu pagrįsto erdvinio klasterizavimo (DBSCAN) algoritmu, galima nustatyti daugiau nei šimtą ekologinių provincijų.Naudojant ryšio žemėlapį su ekologiniais skirtumais kaip atstumo matą, tvirta apibendrinta ekologinė provincija (AEP) objektyviai apibrėžiama per įdėtas ekologines provincijas.Naudojant AEP, buvo ištirta maistinių medžiagų tiekimo greičio kontrolė bendruomenės struktūroje.Ekologinė provincija ir AEP yra unikalūs ir gali padėti modeliuoti interpretaciją.Jie gali palengvinti modelių palyginimą ir gali padėti suprasti bei stebėti jūrų ekosistemas.
Provincijos yra regionai, kuriuose sudėtinga jūros ar sausumos biogeografija suskirstyta į nuoseklias ir reikšmingas sritis (1).Šios provincijos labai svarbios vietovių palyginimui ir kontrastavimui, stebėjimų charakterizavimui, stebėjimui ir apsaugai.Dėl sudėtingų ir netiesinių sąveikų, kurios sukuria šias provincijas, neprižiūrimi mašininio mokymosi (ML) metodai yra labai tinkami objektyviai nustatyti provincijas, nes duomenų kovariacija yra sudėtinga ir ne Gauso.Čia siūlomas ML metodas, kuris sistemingai identifikuoja unikalias jūrų ekologines provincijas (ekoprovincijas) pagal Darvino pasaulinį trimatį (3D) fizinį / ekosistemų modelį (2).Sąvoka „unikali“ naudojama norint nurodyti, kad nustatyta sritis nepakankamai sutampa su kitomis sritimis.Šis metodas vadinamas sistemos integruotos ekologinės provincijos (SAGE) metodu.Kad būtų galima atlikti naudingą klasifikaciją, algoritminis metodas turi leisti (i) visuotinę klasifikaciją ir (ii) daugialypę analizę, kurią būtų galima įterpti / sujungti erdvėje ir laike (3).Šiame tyrime pirmiausia buvo pasiūlytas SAGE metodas ir aptartos nustatytos ekologinės provincijos.Ekologinės provincijos gali padėti suprasti bendruomenės struktūrą kontroliuojančius veiksnius, suteikti naudingų įžvalgų stebėjimo strategijoms ir padėti sekti ekosistemos pokyčius.
Sausumos provincijos paprastai klasifikuojamos pagal klimato (kritulių ir temperatūros), dirvožemio, augmenijos ir faunos panašumus ir yra naudojamos pagalbiniam valdymui, biologinės įvairovės tyrimams ir ligų kontrolei (1, 4).Sunkiau apibrėžti jūrų provincijas.Dauguma organizmų yra mikroskopiniai, su skysčių ribomis.Longhurst ir kt.(5) Pateikta viena iš pirmųjų pasaulinių Okeanografijos ministerijos klasifikacijų pagal aplinkos sąlygas.Šių „Longhurst“ provincijų apibrėžimas apima tokius kintamuosius kaip maišymosi greitis, stratifikacija ir apšvita, taip pat ilga Longhursto, kaip jūrų okeanografo, turinčio kitų svarbių sąlygų jūrų ekosistemoms, patirtis.Longhurst buvo plačiai naudojamas, pavyzdžiui, pirminei gamybai ir anglies srautams įvertinti, pagalbai žvejybai ir stebėjimo vietoje planuoti (5–9).Siekiant objektyviau apibrėžti provincijas, buvo naudojami tokie metodai kaip neaiškioji logika ir regioninė neprižiūrima klasterizacija / statistika (9–14).Tokių metodų tikslas yra nustatyti reikšmingas struktūras, kurios gali identifikuoti provincijas turimais stebėjimo duomenimis.Pavyzdžiui, dinamiškos jūrų provincijos (12) naudoja savaime besitvarkančius žemėlapius, kad sumažintų triukšmą, ir naudoja hierarchinius (medžių pagrindu) grupes, kad nustatytų jūros spalvų produktus, gautus iš regioninių palydovų [chlorofilas a (Chl-a), normalizuotas fluorescencinės linijos aukštis ir spalvota ištirpusi organinė medžiaga] ir fizinis laukas (jūros paviršiaus temperatūra ir druskingumas, absoliuti dinaminė topografija ir jūros ledas).
Planktono bendruomenės struktūra kelia susirūpinimą, nes jo ekologija turi didelę įtaką didesniam maistinių medžiagų kiekiui, anglies absorbcijai ir klimatui.Nepaisant to, vis dar yra sudėtingas ir sunkiai pasiekiamas tikslas nustatyti pasaulinę ekologinę provinciją, pagrįstą planktono bendruomenės struktūra.Jūriniai spalvoti palydovai gali suteikti įžvalgų apie stambiagrūdę fitoplanktono klasifikaciją arba pasiūlyti funkcinių grupių pranašumus (15), tačiau šiuo metu jie negali pateikti išsamios informacijos apie bendruomenės struktūrą.Naujausi tyrimai [pvz., Tara Ocean (16)] pateikia precedento neturinčius bendruomenės struktūros matavimus;Šiuo metu pasauliniu mastu in situ stebėjimų yra nedaug (17).Ankstesni tyrimai iš esmės nustatė „Biogeocheminę provinciją“ (12, 14, 18), pagrįstą biocheminių panašumų (tokių kaip pirminė gamyba, Chl ir turima šviesa) nustatymu.Čia skaitmeninis modelis naudojamas išvestiei [Darvinas (2)], o ekologinė provincija nustatoma pagal bendruomenės struktūrą ir maistinių medžiagų srautą.Šiame tyrime naudojamas skaitmeninis modelis apima pasaulinę aprėptį ir gali būti lyginamas su esamais lauko duomenimis (17) ir nuotolinio stebėjimo laukais (S1 pastaba).Šiame tyrime naudojami skaitmeninio modelio duomenys turi pasaulinės aprėpties pranašumą.Modelinę ekosistemą sudaro 35 fitoplanktono ir 16 zooplanktono rūšių (žr. medžiagas ir metodus).Modeliniai planktono tipai netiesiškai sąveikauja su ne Gauso kovariacijos struktūromis, todėl paprasti diagnostikos metodai netinka unikaliems ir nuosekliems besiformuojančios bendruomenės struktūrų modeliams nustatyti.Čia pristatytas SAGE metodas yra naujas būdas patikrinti sudėtingų Darvino modelių išvestį.
Galingos duomenų mokslo / ML technologijos transformacinės galimybės gali sudaryti sąlygas nepaprastai sudėtingiems modelių sprendimams atskleisti sudėtingas, bet tvirtas duomenų kovariacijos struktūras.Tvirtas metodas apibrėžiamas kaip metodas, kuris gali tiksliai atkurti rezultatus tam tikrame klaidų diapazone.Net ir paprastose sistemose nustatyti patikimus modelius ir signalus gali būti sudėtinga.Kol nebus nustatytas pastebėto modelio loginis pagrindas, kylantis sudėtingumas gali atrodyti sudėtingas / sunkiai išsprendžiamas.Pagrindinis ekosistemos sudėties nustatymo procesas yra netiesinis.Netiesinių sąveikų buvimas gali supainioti patikimą klasifikaciją, todėl būtina vengti metodų, kurie daro tvirtas prielaidas apie pagrindinį statistinį duomenų kovariacijos pasiskirstymą.Didelių matmenų ir netiesiniai duomenys yra įprasti okeanografijoje ir gali turėti kovariacijos struktūrą su sudėtinga, ne Gauso topologija.Nors duomenys su ne Gauso kovariacijos struktūra gali trukdyti tvirtai klasifikuoti, SAGE metodas yra naujas, nes jis skirtas identifikuoti grupes su savavališkomis topologijomis.
SAGE metodo tikslas yra objektyviai nustatyti atsirandančius modelius, kurie gali padėti toliau suprasti ekologinį supratimą.Atlikus klasteriais pagrįstą darbo eigą, panašią į (19), ekologiniai ir maistinių medžiagų srauto kintamieji naudojami nustatant vienintelį duomenų klasterį, vadinamą ekologine provincija.Šiame tyrime pasiūlytas SAGE metodas (1 pav.) pirmiausia sumažina matmenis nuo 55 iki 11 matmenų, susumuojant planktono funkcines grupes, apibrėžtas a priori (žr. Medžiagos ir metodai).Naudojant t-atsitiktinio kaimyninio įterpimo (t-SNE) metodą, dydis dar labiau sumažinamas, projektuojant tikimybę į 3D erdvę.Neprižiūrimas klasterizavimas gali nustatyti ekologiškai artimas sritis [tankiu pagrįstas erdvinis klasterizavimas (DBSCAN) triukšmu pagrįstoms programoms].Tiek t-SNE, tiek DBSCAN yra taikomi būdingiems nelinijinės ekosistemos skaitmeninio modelio duomenims.Tada atkurkite susidariusią ekologinę provinciją ant žemės.Išskirta daugiau nei šimtas unikalių ekologinių provincijų, tinkamų regioniniams tyrimams.Siekiant atsižvelgti į pasauliniu mastu nuoseklų ekosistemos modelį, SAGE metodas naudojamas ekologinėms provincijoms agreguoti į agreguotas ekologines provincijas (AEP), siekiant pagerinti ekologinių provincijų efektyvumą.Apibendrinimo lygis (vadinamas „sudėtingumu“) gali būti koreguojamas pagal reikiamą detalumo lygį.Nustatykite minimalų patikimo AEP sudėtingumą.Atrankos tikslas yra SAGE metodas ir mažiausio sudėtingumo AEP atvejų tyrimas, siekiant nustatyti avarinės bendruomenės struktūros kontrolę.Tada modelius galima analizuoti, kad būtų galima gauti ekologinių įžvalgų.Čia pristatytas metodas taip pat gali būti naudojamas modelių palyginimui plačiau, pavyzdžiui, įvertinant panašių ekologinių provincijų vietoves skirtinguose modeliuose, siekiant pabrėžti skirtumus ir panašumus, kad būtų galima palyginti modelius.
(A) Scheminė darbo eigos schema, skirta nustatyti ekologinę provinciją;naudojant funkcinės grupės sumą, siekiant sumažinti pradinius 55 matmenų duomenis iki 11 matmenų modelio išvesties, įskaitant septynių funkcinių / maistinių planktonų biomasę ir keturias maistinių medžiagų tiekimo normas.Nereikšminga vertė ir patvarus ledo dangos plotas.Duomenys buvo standartizuoti ir standartizuoti.Pateikite 11 matmenų duomenis t-SNE algoritmui, kad paryškintumėte statistiškai panašius funkcijų derinius.DBSCAN atidžiai parinks klasterį, kad nustatytų parametro vertę.Galiausiai projektuokite duomenis atgal į platumos / ilgumos projekciją.Atkreipkite dėmesį, kad šis procesas kartojamas 10 kartų, nes taikant t-SNE gali būti sukurtas nedidelis atsitiktinumas.(B) paaiškinama, kaip gauti AEP pakartojant (A) darbo eigą 10 kartų.Kiekvienam iš šių 10 įgyvendinimų buvo nustatyta tarpprovincinė Bray-Curtis (BC) skirtumų matrica, remiantis 51 fitoplanktono tipo biomase.Nustatykite BC skirtumą tarp provincijų, nuo 1 sudėtingumo AEP iki visiško sudėtingumo 115. BC etaloną nustato Longhurst provincija.
SAGE metodas naudoja pasaulinio 3D fizinio / ekosistemos skaitmeninio modelio išvestį ekologinei provincijai apibrėžti [Darwin (2);žr. Medžiagos ir metodai bei S1 pastaba].Ekosistemos komponentus sudaro 35 fitoplanktono ir 16 zooplanktono rūšių, turinčios septynias iš anksto nustatytas funkcines grupes: prokariotai ir eukariotai, pritaikyti mažai maistinių medžiagų turinčiai aplinkai, kokcidijos su kalcio karbonato danga ir sunkioji azoto fiksacija Azoto maistinių medžiagų (paprastai trūksta). svarbios maistinės medžiagos), su silicio danga, gali sukelti kitų planktono fotosintezę ir ganyti mišrias maistines medžiagas ir zooplanktono ganytojus.Dydžio tarpatramis yra nuo 0,6 iki 2500 μm ekvivalentinio sferinio skersmens.Fitoplanktono dydžio ir funkcinės grupės pasiskirstymo modelis atspindi bendras charakteristikas, pastebėtas atliekant palydovinius ir in situ stebėjimus (žr. S1–S3 paveikslus).Skaitmeninio modelio ir stebimo vandenyno panašumas rodo, kad modeliu apibrėžtos provincijos gali būti taikomos in situ vandenyne.Atkreipkite dėmesį, kad šis modelis fiksuoja tik tam tikrą fitoplanktono įvairovę ir tik tam tikrus fizinius ir cheminius in situ vandenyno jėgų diapazonus.SAGE metodas gali padėti žmonėms geriau suprasti labai regioninį pavyzdinės bendruomenės struktūros kontrolės mechanizmą.
Į kiekvieną planktono funkcinę grupę įtraukus tik paviršiaus biomasės sumą (vidutiniškai 20 metų), galima sumažinti duomenų matmenis.Ankstesni tyrimai parodė jų pagrindinį vaidmenį nustatant bendruomenės struktūrą, jie taip pat apėmė maistinių medžiagų srautų paviršiaus šaltinio terminus (azoto, geležies, fosfato ir silicio rūgšties tiekimą) [pvz., (20, 21)].Funkcinių grupių sumavimas sumažina problemą nuo 55 (51 planktonas ir 4 maistinių medžiagų srautai) iki 11 matmenų.Šiame pradiniame tyrime dėl algoritmo nustatytų skaičiavimo apribojimų nebuvo atsižvelgta į gylio ir laiko kintamumą.
SAGE metodas gali nustatyti svarbius ryšius tarp netiesinių procesų ir pagrindinių funkcinių grupių biomasės ir maistinių medžiagų srauto sąveikos ypatybių.Naudojant 11 matmenų duomenis, pagrįstus Euklido nuotolinio mokymosi metodais (pvz., K-means), negalima gauti patikimų ir atkuriamų provincijų (19, 22).Taip yra todėl, kad pagrindinių elementų, apibrėžiančių ekologinę provinciją, kovariacijos pagrindiniame pasiskirstyme nėra Gauso formos.Voronojaus ląstelių K vidurkis (tiesios linijos) negali išlaikyti ne Gauso pagrindinio skirstinio.
Septynių planktono funkcinių grupių biomasė ir keturi maistinių medžiagų srautai sudaro 11 matmenų vektorių x.Todėl x yra modelio tinklelio vektorinis laukas, kur kiekvienas elementas xi reiškia 11 matmenų vektorių, apibrėžtą modelio horizontaliame tinklelyje.Kiekvienas indeksas i vienareikšmiškai identifikuoja tinklelio tašką sferoje, kur (lon, lat) = (ϕi, θi).Jei modelio tinklelio bloko biomasė yra mažesnė nei 1,2×10-3mg Chl/m3 arba ledo dangos rodiklis viršija 70 proc., naudojamas biomasės duomenų žurnalas ir atmetamas.Duomenys yra normalizuoti ir standartizuoti, todėl visi duomenys yra intervale nuo [0 iki 1], vidurkis pašalinamas ir padidinamas iki vieneto dispersijos.Tai daroma taip, kad savybių (biomasės ir maistinių medžiagų srauto) neribotų kontrastas galimų verčių diapazone.Klasterizavimas turėtų fiksuoti pokyčių santykį pagal pagrindinį tikimybės atstumą tarp objektų, o ne geografinį atstumą.Kiekybiškai įvertinus šiuos atstumus, išryškėja svarbios savybės, o nereikalingos detalės atsisakomos.Ekologiniu požiūriu tai būtina, nes kai kurios fitoplanktono rūšys, turinčios nedidelę biomasę, gali turėti didesnį biogeocheminį poveikį, pavyzdžiui, diazotrofinių bakterijų surišti azotą.Standartizuojant ir normalizuojant duomenis bus paryškinti šie kovariacijų tipai.
Pabrėžiant ypatybių artumą didelės erdvės erdvėje mažo matmens vaizde, t-SNE algoritmas naudojamas esamiems panašiems regionams aiškesniems.Ankstesniame darbe, kurio tikslas buvo sukurti giliuosius neuroninius tinklus nuotolinio stebėjimo programoms, buvo naudojamas t-SNE, kuris įrodė savo įgūdžius atskirti pagrindines savybes (23).Tai būtinas veiksmas, norint nustatyti patikimą savybių duomenų grupavimą, vengiant nekonvergencinių sprendimų (S2 pastaba).Naudodamas Gauso branduolius, t-SNE išsaugo statistines duomenų savybes, kiekvieną didelės dimensijos objektą susiejant su tašku 3D fazės erdvėje, taip užtikrinant, kad panašių objektų tikimybė aukštoje ir žemoje kryptimis yra didelė aukštoje aplinkoje. matmenų erdvė (24).Atsižvelgiant į N didelės dimensijos objektų x1,…,xN rinkinį, t-SNE algoritmas sumažina iki minimumo sumažindamas Kullback-Leibler (KL) skirtumą (25).KL skirtumai yra matas, nurodantis, kiek tikimybių skirstinys skiriasi nuo antrojo etaloninio tikimybių skirstinio, ir gali veiksmingai įvertinti koreliacijos galimybę tarp mažo matmens didelės dimensijos ypatybių atvaizdų.Jei xi yra i-tas objektas N-matėje erdvėje, xj yra j-tas objektas N-matėje erdvėje, yi yra i-tas objektas žemos dimensijos erdvėje, o yj yra j-tas objektas žemoje erdvėje. -dimensinė erdvė, tada t -SNE apibrėžia panašumo tikimybę ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) ir matmenų mažinimo rinkinį q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
2A paveiksle parodytas 11 matmenų derinio biomasės ir maistinių medžiagų srauto vektorių sumažinimo iki 3D efektas.T-SNE taikymo motyvaciją galima palyginti su pagrindinių komponentų analizės (PCA) motyvacija, kuri naudoja dispersijos požymį, kad pabrėžtų duomenų sritį / požymį, taip sumažinant matmenis.Nustatyta, kad t-SNE metodas yra pranašesnis už PCA, nes ekologinei ministerijai suteikia patikimus ir atkuriamus rezultatus (žr. S2 pastabą).Taip gali būti todėl, kad PCA ortogonalumo prielaida nėra tinkama kritinėms sąveikoms tarp labai netiesinių interaktyvių savybių nustatyti, nes PCA daugiausia dėmesio skiria tiesinėms kovariacijos struktūroms (26).Naudodami nuotolinio stebėjimo duomenis, Lunga ir kt.(27) iliustruoja, kaip naudoti SNE metodą, norint pabrėžti sudėtingas ir netiesines spektrines ypatybes, kurios skiriasi nuo Gauso skirstinio.
(A) Sumodeliuotas maistinių medžiagų tiekimo greitis, fitoplanktono ir zooplanktono funkcinės grupės biomasė, sudaryta pagal t-SNE algoritmą ir nuspalvinta pagal provinciją, naudojant DBSCAN.Kiekvienas taškas reiškia tašką didelės erdvės erdvėje, kaip parodyta 6B paveiksle, dauguma taškų yra užfiksuoti.Šachtos nurodo „t-SNE“ 1, 2 ir 3 dydžius. (B) DBSCAN nustatyta geografinė provincijos projekcija kilmės platumos ir ilgumos tinkle.Spalva turėtų būti laikoma bet kokia spalva, bet turi atitikti (A).
2A paveiksle t-SNE sklaidos diagramos taškai yra atitinkamai susieti su platuma ir ilguma.Jei du taškai 2A paveiksle yra arti vienas kito, taip yra todėl, kad jų biomasė ir maistinių medžiagų srautai yra panašūs, o ne dėl geografinio artumo.2A paveiksle pateiktos spalvos yra klasteriai, atrasti naudojant DBSCAN metodą (28).Ieškodamas tankių stebėjimų, DBSCAN algoritmas naudoja atstumą 3D vaizde tarp taškų (ϵ = 0,39; informacijos apie šį pasirinkimą žr. Medžiagos ir metodai), o panašių taškų skaičius reikalingas klasteriui apibrėžti (čia 100 taškų, žr. aukščiau).DBSCAN metodas nedaro jokių prielaidų dėl duomenų klasterių formos ar skaičiaus, kaip parodyta toliau:
3) Visiems taškams, identifikuotiems kaip per atstumą, kartokite 2 veiksmą, kad nustatytumėte klasterio ribą.Jei taškų skaičius yra didesnis už nustatytą minimalią reikšmę, jis nurodomas kaip klasteris.
Duomenys, kurie neatitinka minimalaus klasterio nario ir atstumo ϵ metrikos, laikomi „triukšmu“ ir jiems nepriskiriama spalva.DBSCAN yra greitas ir keičiamo dydžio algoritmas su O(n2) našumu blogiausiu atveju.Dabartinei analizei tai iš tikrųjų nėra atsitiktinė.Minimalus balų skaičius nustatomas ekspertų vertinimu.Pakoregavus atstumą po, rezultatas nėra pakankamai stabilus ≈±10 diapazone.Šis atstumas nustatomas naudojant ryšį (6A pav.) ir vandenyno aprėpties procentą (6B pav.).Ryšys apibrėžiamas kaip sudėtinis klasterių skaičius ir yra jautrus ϵ parametrui.Mažesnis jungiamumas rodo nepakankamą pritaikymą, dirbtinai sugrupuojamus regionus.Didelis jungiamumas rodo permontavimą.Įmanoma naudoti didesnį minimumą, bet jei minimumas viršija ca, patikimo sprendimo pasiekti neįmanoma.135 (daugiau informacijos žr. Medžiagos ir metodai).
115 grupių, nurodytų 2A paveiksle, projektuojamos atgal į žemę 2B paveiksle.Kiekviena spalva atitinka nuoseklų DBSCAN nustatytų biogeocheminių ir ekologinių veiksnių derinį.Nustačius grupes, kiekvieno 2A paveikslo taško susiejimas su tam tikra platuma ir ilguma naudojamas klasteriams projektuoti atgal į geografinę sritį.2B paveiksle tai pavaizduota tomis pačiomis spiečių spalvomis kaip ir 2A paveiksle.Panašios spalvos neturėtų būti interpretuojamos kaip ekologinis panašumas, nes jos priskiriamos klasterių aptikimo tvarka pagal algoritmą.
2B paveiksle esantis plotas gali būti kokybiškai panašus į nustatytą vandenyno fizinės ir (arba) biogeochemijos plotą.Pavyzdžiui, pietiniame vandenyne esantys klasteriai yra zonai simetriški, atsiranda oligotrofinių sūkurių, o staigus perėjimas rodo pasatų įtaką.Pavyzdžiui, Ramiojo vandenyno pusiaujo dalyje matomi skirtingi regionai, susiję su kilimu.
Siekiant suprasti ekologinę ekologinės provincijos aplinką, klasterio ekologijai įvertinti buvo naudojamas Bray-Curtis (BC) skirtumo indekso (29) pokytis.BC rodiklis yra statistiniai duomenys, naudojami bendruomenės struktūros skirtumams tarp dviejų skirtingų vietų kiekybiškai įvertinti.BC matavimas taikomas 51 fitoplanktono ir zooplanktono rūšies biomasei BCninj = 1-2CninjSni + Snj
BCninj nurodo derinio ni ir derinio nj panašumą, kur Cninj yra minimali vieno tipo biomasės, esančios abiejuose ni ir nj deriniuose, vertė, o Sni reiškia visų biomasių, esančių abiejuose ni ir Snj deriniuose, sumą.BC skirtumas yra panašus į atstumo matą, tačiau veikia ne euklido erdvėje, kuri greičiausiai bus tinkamesnė ekologiniams duomenims ir jų interpretacijai.
Kiekviename 2B paveiksle nurodytame klasteryje galima įvertinti BC panašumą provincijoje ir tarp provincijų.BC skirtumas provincijoje reiškia skirtumą tarp vidutinės provincijos vertės ir kiekvieno provincijos taško.Skirtumas tarp BC provincijų reiškia vienos provincijos ir kitų provincijų panašumą.3A paveiksle parodyta simetriška BC matrica (0, juoda: visiškai atitinka; 1, balta: visiškai nepanaši).Kiekviena diagramos eilutė rodo duomenų šabloną.3B paveiksle parodyta 3A pav. BC rezultatų geografinė reikšmė kiekvienai provincijai.3B paveiksle parodyta, kad provincijoje, esančioje mažai maistingų ir mažai maistinių medžiagų turinčioje vietovėje, didelių plotų aplink pusiaują ir Indijos vandenyną simetrija iš esmės yra panaši, tačiau aukštesnės platumos ir aukštumos sritys labai skiriasi.
(A) BC skirtumo laipsnis, įvertintas kiekvienoje provincijoje, remiantis pasauliniu 20 metų vidutiniu pasauliniu paviršiaus vidurkiu – 51 planktonu.Atkreipkite dėmesį į numatomą reikšmių simetriją.(B) Stulpelio (arba eilutės) erdvinė projekcija.Provincijai, esančiai distrofiniame rate, buvo įvertintas pasaulinis BC panašumo pasiskirstymas ir įvertintas pasaulinis 20 metų vidurkis.Juoda (BC = 0) reiškia tą patį plotą, o balta (BC = 1) reiškia, kad nėra panašumo.
4A paveiksle pavaizduotas BC skirtumas kiekvienoje 2B paveikslo provincijoje.Nustatyta naudojant vidutinį klasterio ploto derinį ir nustatant skirtumą tarp BC ir kiekvieno tinklelio taško provincijoje vidurkio, tai rodo, kad SAGE metodas gali gerai atskirti 51 rūšį, remiantis ekologiniu panašumu. modelio duomenys.Bendras visų 51 tipo klasterio BC skirtumų vidurkis yra 0,102±0,0049.
(A, B ir D) BC skirtumas provincijoje vertinamas kaip vidutinis BC skirtumas tarp kiekvienos tinklelio taško bendruomenės ir vidutinės provincijos, o sudėtingumas nesumažėja.(2) Pasaulinis vidutinis skirtumas tarp provincijos BC yra 0,227±0,117.Tai yra šiame darbe pasiūlytos ekologine motyvacija pagrįstos klasifikacijos etalonas [žalia linija (C)].(C) Vidutinis BC skirtumas provincijoje: juoda linija rodo didėjantį sudėtingumą provincijos BC skirtumą.2σ gaunama iš 10 ekologinės provincijos identifikavimo proceso pakartojimų.Kalbant apie bendrą DBSCAN aptiktų provincijų sudėtingumą, (A) rodo, kad BC skirtumai provincijoje yra 0,099, o (C) pasiūlyta sudėtingumo klasifikacija yra 12, todėl provincijoje BC skirtumas yra 0,200.kaip parodyta paveikslėlyje.(D).
4B paveiksle 51 tipo planktono biomasė naudojama lygiaverčiui BC skirtumui Longhurst provincijoje parodyti.Bendras kiekvienos provincijos vidurkis yra 0,227, o standartinis tinklelio taškų nuokrypis, atsižvelgiant į skirtumą BC provincijoje, yra 0,046.Tai didesnis nei 1B paveiksle nurodytas klasteris.Vietoj to, naudojant septynių funkcinių grupių sumą, vidutinis sezono BC skirtumas Longhurste padidėjo iki 0, 232.
Pasauliniame ekologinių provincijų žemėlapyje pateikiama sudėtinga informacija apie unikalią ekologinę sąveiką, o naudojant visą Longhurst provincijos ekosistemos struktūrą buvo atlikti patobulinimai.Tikimasi, kad Ekologijos ministerija pateiks įžvalgą apie skaitmeninio modelio ekosistemos valdymo procesą, o ši įžvalga padės tyrinėti lauko darbus.Šio tyrimo tikslais neįmanoma visiškai parodyti daugiau nei šimto provincijų.Kitame skyriuje pristatomas SAGE metodas, kuris apibendrina provincijas.
Vienas iš provincijos tikslų – skatinti supratimą apie provincijos vietą ir valdymą.Avarinėms situacijoms nustatyti 1B paveiksle pateiktas metodas iliustruoja ekologiškai panašių provincijų lizdus.Ekoprovincijos grupuojamos pagal ekologinį panašumą, o toks provincijų grupavimas vadinamas AEP.Nustatykite reguliuojamą „sudėtingumą“ pagal bendrą provincijų, į kurias reikia atsižvelgti, skaičių.Terminas „sudėtingumas“ vartojamas, nes leidžia reguliuoti avarinių savybių lygį.Norint apibrėžti prasmingas agregacijas, kaip etalonas naudojamas vidutinis provincijos BC skirtumas 0,227 nuo Longhursto.Žemiau šio etalono, sujungtos provincijos nebelaikomos naudingomis.
Kaip parodyta 3B paveiksle, pasaulinės ekologinės provincijos yra nuoseklios.Naudojant tarpprovincinius BC skirtumus, galima pastebėti, kad kai kurios konfigūracijos yra labai „įprastos“.Įkvėpti genetikos ir grafų teorijos metodų, „sujungtieji grafikai“ naudojami rūšiuoti > 100 provincijų pagal į jas labiausiai panašias provincijas.„Sujungimo“ metrika čia nustatoma naudojant tarpprovincinį BC skirtumą (30).Provincijų, kuriose yra daugiau nei 100 provincijų klasifikavimo vietos, skaičius čia gali būti vadinamas sudėtingumu.AEP yra produktas, kuris priskiria daugiau nei 100 provincijų dominuojančių / artimiausių ekologinių provincijų kategorijai.Kiekviena ekologinė provincija priskiriama dominuojančiai/labai susijusiai ekologinei provincijai, kuri į jas yra panaši.Šis BC skirtumo nulemtas agregavimas leidžia integruoti požiūrį į pasaulinę ekologiją.
Pasirinktas sudėtingumas gali būti bet kokia vertė nuo 1 iki visiško sudėtingumo Fig.2A.Esant mažesniam sudėtingumui, AEP gali išsigimti dėl tikimybinio matmenų mažinimo žingsnio (t-SNE).Degeneracija reiškia, kad ekologinės provincijos gali būti priskirtos skirtingiems AEP tarp iteracijų, taip keičiant aprėpiamą geografinę sritį.4C paveiksle parodytas BC skirtumų paplitimas provincijose vis sudėtingesniuose AEP per 10 diegimų (1B paveikslas).4C paveiksle 2σ (mėlyna sritis) yra 10 diegimų degradacijos matas, o žalia linija reiškia Longhurst etaloną.Faktai įrodė, kad 12 sudėtingumas gali išlaikyti BC skirtumą provincijoje žemiau Longhurst etalono visuose diegimuose ir išlaikyti santykinai mažą 2σ degradaciją.Apibendrinant galima pasakyti, kad minimalus rekomenduojamas sudėtingumas yra 12 AEP, o vidutinis provincijos BC skirtumas, įvertintas naudojant 51 planktono tipą, yra 0,198±0,013, kaip parodyta 4D paveiksle.Naudojant septynių planktono funkcinių grupių sumą, vidutinis BC skirtumas provincijoje yra 2σ, o ne 0,198±0,004.Palyginus BC skirtumus, apskaičiuotus su bendra septynių funkcinių grupių biomase arba visų 51 planktono tipo biomase, matyti, kad nors SAGE metodas taikomas 51 matmens situacijai, jis taikomas bendrai septynių funkcinių grupių biomasei. Treniruotėms.
Atsižvelgiant į bet kokio tyrimo tikslą, galima atsižvelgti į skirtingus sudėtingumo lygius.Regioniniams tyrimams gali prireikti viso sudėtingumo (ty visos 115 provincijų).Kaip pavyzdį ir aiškumo dėlei apsvarstykite minimalų rekomenduojamą sudėtingumą – 12.
Kaip SAGE metodo naudingumo pavyzdys, čia naudojama 12 AEP, kurių minimalus sudėtingumas yra 12, siekiant ištirti avarinės bendruomenės struktūros valdymą.5 paveiksle pavaizduotos ekologinės įžvalgos, sugrupuotos pagal AEP (nuo A iki L): Redfieldo stechiometrijoje geografinį mastą (5C pav.), funkcinės grupės biomasės sudėtį (5A pav.) ir maistinių medžiagų tiekimą (5B pav.) atlieka N Zoomed.Rodomas santykis (N:Si:P:Fe, 1:1:16:16×103).Pastarojoje skydelyje P padaugintas iš 16, o Fe padaugintas iš 16 × 103, taigi juostinė diagrama atitinka fitoplanktono mitybos poreikius.
Provincijos suskirstytos į 12 AEP A–L. (A) Ekosistemų biomasė (mgC/m3) 12 provincijų.(B) Ištirpusio neorganinio azoto (N), geležies (Fe), fosfato (P) ir silicio rūgšties (Si) maistinių medžiagų srauto greitis (mmol/m3 per metus).Fe ir P padauginami atitinkamai iš 16 ir 16 × 103, kad juostos būtų standartizuotos pagal fitoplanktono stechiometrijos reikalavimus.(C) Atkreipkite dėmesį į skirtumą tarp poliarinių regionų, subtropinių ciklonų ir pagrindinių sezoninių / kylančių regionų.Stebėjimo stotys žymimos taip: 1, SĖDYNĖS;2, ALOHA;3, stotis P;ir 4, SIKSŠKINĖJIMAI.
Identifikuotas AEP yra unikalus.Tam tikra simetrija aplink pusiaują yra Atlanto ir Ramiajame vandenynuose, o panaši, bet padidėjusi sritis yra Indijos vandenyne.Kai kurie AEP apima vakarinę žemyno pusę, susijusią su pakilimu.Pietų ašigalio cirkumpolinė srovė laikoma didele zonine ypatybe.Subtropinis ciklonas yra sudėtinga oligotrofinių AEP serija.Šiose provincijose akivaizdus pažįstamas biomasės skirtumų tarp planktono dominuojamų oligotrofinių sūkurių ir diatomų turtingų poliarinių regionų modelis.
AEP, kurių bendra fitoplanktono biomasė yra labai panaši, gali turėti labai skirtingas bendruomenės struktūras ir apimti skirtingas geografines sritis, tokias kaip D, H ir K, kurių bendra fitoplanktono biomasė yra panaši.AEP H daugiausia egzistuoja pusiaujo Indijos vandenyne, o diazotrofinių bakterijų yra daugiau.AEP D randamas keliuose baseinuose, tačiau jis ypač ryškus Ramiajame vandenyne aplink didelio derlingumo sritis aplink pusiaujo pakilimą.Šios Ramiojo vandenyno provincijos forma primena planetų bangų traukinį.AEP D yra mažai diazobakterijų ir daugiau kūgių.Palyginti su kitomis dviem provincijomis, AEP K randamas tik Arkties vandenyno aukštumose, ten yra daugiau diatomų ir mažiau planktonų.Verta paminėti, kad planktono kiekis šiuose trijuose regionuose taip pat labai skiriasi.Tarp jų AEP K planktono gausa yra palyginti maža, o AEP D ir H yra gana didelė.Todėl, nepaisant jų biomasės (ir todėl panašios į Chl-a), šios provincijos yra gana skirtingos: Chl pagrįsti provincijų tyrimai gali neatspindėti šių skirtumų.
Taip pat akivaizdu, kad kai kurie AEP su labai skirtinga biomase gali būti panašūs fitoplanktono bendruomenės struktūros požiūriu.Pavyzdžiui, tai matoma AEP D ir E. Jie yra arti vienas kito, o Ramiajame vandenyne AEP E yra arti labai produktyvaus AEPJ.Panašiai nėra aiškaus ryšio tarp fitoplanktono biomasės ir zooplanktono gausos.
AEP galima suprasti pagal jiems teikiamas maistines medžiagas (5B pav.).Diatomės egzistuoja tik ten, kur yra pakankamai silicio rūgšties.Paprastai kuo didesnis silicio rūgšties kiekis, tuo didesnė diatomų biomasė.Diatomijos gali būti matomos AEP A, J, K ir L. Diatomijos biomasės santykis su kitu fitoplanktonu nustatomas pagal N, P ir Fe, atsižvelgiant į diatomės poreikį.Pavyzdžiui, AEP L vyrauja diatomės.Palyginti su kitomis maistinėmis medžiagomis, Si turi didžiausią pasiūlą.Priešingai, nepaisant didesnio produktyvumo, AEP J turi mažiau diatomų ir mažiau silicio (visų ir kitų maistinių medžiagų atžvilgiu).
Diazonio bakterijos turi savybę fiksuoti azotą, tačiau auga lėtai (31).Jie egzistuoja kartu su kitu fitoplanktonu, kuriame geležies ir fosforo yra per daug, palyginti su nediazonio maistinių medžiagų poreikiu (20, 21).Verta paminėti, kad diazotrofinė biomasė yra gana didelė, o Fe ir P pasiūla yra gana didelė, palyginti su N tiekimu. Tokiu būdu, nors bendra biomasė AEP J yra didesnė, diazonio biomasė AEP H yra didesnis nei J. Atkreipkite dėmesį, kad AEP J ir H geografiškai labai skiriasi, o H yra Indijos vandenyno pusiaujo dalyje.
Jei unikali ekosistemos struktūra nebus suskirstyta į provincijas, įžvalgos, gautos iš 12 AEP mažiausio sudėtingumo modelių, nebus tokios aiškios.SAGE sukurtas AEP palengvina nuoseklų ir vienalaikį sudėtingos ir didelės apimties informacijos iš ekosistemų modelių palyginimą.AEP veiksmingai pabrėžia, kodėl Chl nėra geras ir alternatyvus būdas nustatyti bendruomenės struktūrą arba zooplanktono gausą esant didesniam maistinių medžiagų kiekiui.Išsami vykdomų tyrimų temų analizė nepatenka į šio straipsnio taikymo sritį.SAGE metodas suteikia galimybę ištirti kitus modelio mechanizmus, kuriuos lengviau valdyti nei žiūrėjimą iš taško į tašką.
Siūlomas SAGE metodas, padedantis išsiaiškinti itin sudėtingus ekologinius duomenis iš pasaulinių fizikinių / biogeocheminių / ekosistemų skaitmeninių modelių.Ekologinė provincija nustatoma pagal bendrą kryžminių planktono funkcinių grupių biomasę, t-SNE tikimybės matmenų mažinimo algoritmo taikymą ir klasterizavimą, naudojant neprižiūrimą ML metodą DBSCAN.Tarpprovincinė BC skirtumo / grafiko teorija, skirta įdėjimo metodui, taikoma siekiant gauti tvirtą AEP, kurį galima naudoti visuotinei interpretacijai.Kalbant apie konstrukciją, Eco-Province ir AEP yra unikalūs.AEP lizdą galima koreguoti nuo viso pradinės ekologinės provincijos sudėtingumo ir rekomenduojamos minimalios 12 AEP slenksčio.Įdėjimas ir minimalaus AEP sudėtingumo nustatymas yra laikomi pagrindiniais žingsniais, nes tikimybė t-SNE degeneruoja <12 sudėtingumo AEP.SAGE metodas yra visuotinis, o jo sudėtingumas svyruoja nuo > 100 AEP iki 12. Paprastumo dėlei šiuo metu daugiausia dėmesio skiriama 12 pasaulinių AEP sudėtingumui.Būsimiems tyrimams, ypač regioniniams tyrimams, gali būti naudingas mažesnis erdvinis pasaulinių ekologinių provincijų pogrupis ir gali būti apibendrintas mažesnėje srityje, kad būtų galima pasinaudoti tomis pačiomis čia aptartomis ekologinėmis įžvalgomis.Jame pateikiami pasiūlymai, kaip šias ekologines provincijas ir iš jų gautas įžvalgas galima panaudoti tolesniam ekologiniam supratimui, palengvinti modelių palyginimą ir potencialiai pagerinti jūrų ekosistemų stebėjimą.
SAGE metodu identifikuota ekologinė provincija ir AEP yra pagrįsti skaitinio modelio duomenimis.Pagal apibrėžimą skaitmeninis modelis yra supaprastinta struktūra, bandanti užfiksuoti tikslinės sistemos esmę, o skirtingi modeliai turės skirtingą planktono pasiskirstymą.Šiame tyrime naudojamas skaitmeninis modelis negali visiškai užfiksuoti kai kurių pastebėtų modelių (pavyzdžiui, Chl įvertinimuose pusiaujo regionui ir pietiniam vandenynui).Užfiksuojama tik nedidelė tikrojo vandenyno įvairovės dalis, o mezo ir submezoskalės negali būti išspręstos, o tai gali turėti įtakos maistinių medžiagų srautui ir mažesnio masto bendruomenės struktūrai.Nepaisant šių trūkumų, paaiškėjo, kad AEP yra labai naudingas padedant suprasti sudėtingus modelius.Įvertinus, kur yra panašių ekologinių provincijų, AEP suteikia galimą skaitmeninio modelio palyginimo įrankį.Dabartinis skaitmeninis modelis fiksuoja bendrą nuotolinio stebėjimo fitoplanktono Chl-a koncentracijos modelį ir planktono dydžio bei funkcinės grupės pasiskirstymą (S1 pastaba ir S1 paveikslas) (2, 32).
Kaip rodo 0,1 mgChl-a/m-3 kontūro linija, AEP yra padalintas į oligotrofinę ir mezotrofinę sritį (S1B pav.): AEP B, C, D, E, F ir G yra oligotrofinės zonos, o likusios sritys yra esantis Aukštasis Chl-a.AEP rodo tam tikrą susirašinėjimą su Longhurst provincija (S3A pav.), pavyzdžiui, pietiniu vandenynu ir Ramiojo vandenyno pusiaujo dalimi.Kai kuriuose regionuose AEP apima kelis Longhurst regionus ir atvirkščiai.Kadangi šios srities ir Longhursto provincijų ribos yra kitokios, tikimasi, kad bus skirtumų.Keli AEP Longhurst provincijoje rodo, kad tam tikros panašios biogeochemijos vietovės gali turėti labai skirtingas ekosistemų struktūras.AEP rodo tam tikrą atitikimą fizinėms būsenoms, kaip atskleista naudojant neprižiūrimą mokymąsi (19), pavyzdžiui, esant dideliam pakilimui (pavyzdžiui, pietiniame vandenyne ir Ramiojo vandenyno pusiaujo dalyje; S3, C ir D paveikslai).Šie atitikmenys rodo, kad planktono bendruomenės struktūrai didelę įtaką daro vandenyno dinamika.Tokiose srityse kaip Šiaurės Atlantas AEP kerta fizines provincijas.Šiuos skirtumus sukeliantis mechanizmas gali apimti tokius procesus kaip dulkių pernešimas, dėl kurio net ir esant panašioms fizinėms sąlygoms gali būti sukurtos visiškai skirtingos mitybos programos.
Ekologijos ministerija ir AEP atkreipė dėmesį, kad naudojant vien Chl negalima nustatyti ekologinių komponentų, kaip jau suprato jūrų ekologijos bendruomenė.Tai pastebima AEP, kurių biomasė yra panaši, bet labai skiriasi ekologinė sudėtis (pvz., D ir E).Priešingai, AEP, pvz., D ir K, turi labai skirtingą biomasę, bet panašią ekologinę sudėtį.AEP pabrėžia, kad ryšys tarp biomasės, ekologinės sudėties ir zooplanktono gausos yra sudėtingas.Pavyzdžiui, nors AEP J išsiskiria fitoplanktonu ir planktono biomase, AEP A ir L turi panašią planktono biomasę, tačiau A yra didesnis planktono gausumas.AEP pabrėžia, kad fitoplanktono biomasė (arba Chl) negali būti naudojama zooplanktono biomasei prognozuoti.Zooplanktonas yra žuvininkystės maisto grandinės pagrindas, o tikslesni įvertinimai gali padėti geriau valdyti išteklius.Ateities jūrų spalvotieji palydovai [pavyzdžiui, PACE (planktonas, aerozolis, debesys ir jūrų ekosistema)] gali būti geriau išdėstyti, kad padėtų įvertinti fitoplanktono bendruomenės struktūrą.AEP prognozės naudojimas gali palengvinti zooplanktono iš kosmoso įvertinimą.Tokie metodai, kaip SAGE, kartu su naujomis technologijomis ir vis daugiau lauko duomenų, skirtų žemės tiesos tyrimams (pvz., Tara ir tolesni tyrimai), gali kartu žengti žingsnį palydovinio ekosistemų sveikatos stebėjimo link.
SAGE metodas yra patogus būdas įvertinti kai kuriuos mechanizmus, kurie kontroliuoja provincijos ypatybes, pvz., biomasę / Chl, grynąją pirminę gamybą ir bendruomenės struktūrą.Pavyzdžiui, santykinis diatomų kiekis nustatomas dėl Si, N, P ir Fe tiekimo disbalanso, palyginti su fitoplanktono stechiometriniais reikalavimais.Esant subalansuotam tiekimo greičiui, bendruomenėje dominuoja diatomės (L).Kai tiekimo greitis yra nesubalansuotas (ty silicio tiekimas yra mažesnis nei diatomų maistinių medžiagų poreikis), diatomai sudaro tik nedidelę dalį (K).Kai Fe ir P tiekimas viršija N tiekimą (pavyzdžiui, E ir H), diazotrofinės bakterijos sparčiai augs.Atsižvelgiant į AEP pateiktą kontekstą, kontrolės mechanizmų tyrimas taps naudingesnis.
Ekologinė provincija ir AEP yra sritys su panašiomis bendruomenės struktūromis.Laiko eilutė iš tam tikros vietos ekologinėje provincijoje arba AEP gali būti laikoma atskaitos tašku ir gali atspindėti ekologinės provincijos arba AEP apimamą plotą.Tokias laiko eilutes pateikia ilgalaikio stebėjimo vietoje stebėjimo stotys.Ilgalaikiai in situ duomenų rinkiniai ir toliau vaidins neapskaičiuojamą vaidmenį.Žiūrint iš bendruomenės struktūros stebėjimo perspektyvos, SAGE metodas gali būti vertinamas kaip būdas padėti nustatyti naudingiausią naujų svetainių vietą.Pavyzdžiui, ilgalaikio oligotrofinių buveinių vertinimo (ALOHA) laiko eilutė yra oligotrofinės zonos AEP B (5C pav., 2 etiketė).Kadangi ALOHA yra arti kito AEP ribos, laiko eilutė gali neatspindėti visos srities, kaip buvo pasiūlyta anksčiau (33).Tame pačiame AEP B laiko eilutė SEATS (Pietryčių Azijos laiko serija) yra Taivano pietvakariuose (34), toliau nuo kitų AEP ribų (5C pav., 1 etiketė) ir gali būti naudojama kaip geresnė stebėjimo vieta. AEPB.BATS (Bermuda Atlantic Time Series Study) laiko eilutė (5C pav., 4 etiketė) AEPC yra labai arti ribos tarp AEP C ir F, o tai rodo, kad AEP C stebėjimas naudojant BATS laiko eilutes gali būti tiesiogiai problemiškas.Stotis P AEP J (5C pav., 3 etiketė) yra toli nuo AEP ribos, todėl yra labiau reprezentatyvi.Ekologinė provincija ir AEP gali padėti sukurti stebėjimo sistemą, tinkamą pasauliniams pokyčiams įvertinti, nes provincijų leidimas įvertinti, kur vietoje mėginių ėmimas gali suteikti esminių įžvalgų.SAGE metodas gali būti toliau plėtojamas, kad būtų pritaikytas klimato duomenims, siekiant įvertinti laiko taupymo kintamumą.
SAGE metodo sėkmė pasiekiama kruopščiai taikant duomenų mokslo / ML metodus ir konkrečios srities žinias.Konkrečiai, t-SNE naudojamas matmenų mažinimui, kuris išsaugo didelio matmens duomenų kovariacijos struktūrą ir palengvina kovariacijos topologijos vizualizavimą.Duomenys išdėstyti juostelių ir kovariacijų pavidalu (2A pav.), o tai rodo, kad vien atstumu pagrįsti matai (pvz., K vidurkiai) nėra tinkami, nes dažniausiai naudojamas Gauso (apvalus) pasiskirstymas (aptarta S2 pastaboje). .DBSCAN metodas tinka bet kokiai kovariacijos topologijai.Jei atkreipiate dėmesį į parametrų nustatymą, galima užtikrinti patikimą identifikavimą.t-SNE algoritmo skaičiavimo sąnaudos yra didelės, o tai riboja dabartinį jo taikymą didesniam duomenų kiekiui, o tai reiškia, kad jį sunku pritaikyti giliems arba laikui bėgant besikeičiantiems laukams.Vykdomi t-SNE mastelio keitimo darbai.Kadangi KL atstumą lengva lygiagretinti, t-SNE algoritmas turi gerą potencialą plėsti ateityje (35).Iki šiol kiti perspektyvūs matmenų mažinimo metodai, galintys geriau sumažinti dydį, apima vieningą daugialypio aproksimavimo ir projekcijos (UMAP) metodus, tačiau vertinimas vandenyno duomenų kontekste yra būtinas.Geresnio mastelio keitimo reikšmė yra, pavyzdžiui, pasaulinio klimato ar skirtingo sudėtingumo modelių klasifikavimas mišriame lygyje.Sritys, kurių SAGE negali klasifikuoti jokioje provincijoje, gali būti laikomos likusiais juodais taškais 2A paveiksle.Geografiškai šios vietovės daugiausia yra labai sezoninėse vietovėse, o tai rodo, kad užfiksavus ekologines provincijas, kurios laikui bėgant keičiasi, bus galima geriau aprėpti.
Norint sukurti SAGE metodą, buvo panaudotos sudėtingų sistemų/duomenų mokslo idėjos, naudojant galimybę nustatyti funkcinių grupių grupes (galimybę būti labai arti 11 matmenų erdvėje) ir nustatyti provincijas.Šios provincijos vaizduoja specifinius tūrius mūsų 3D t-SNE fazės erdvėje.Panašiai Poincaré dalis gali būti naudojama vertinant būsenos erdvės, kurią užima trajektorija, „tūrį“, siekiant nustatyti „normalų“ arba „chaotišką“ elgesį (36).Statinio 11 dimensijų modelio išvesties tūris, užimtas po to, kai duomenys konvertuojami į 3D fazės erdvę, gali būti paaiškintas panašiai.Ryšys tarp geografinės zonos ir ploto 3D fazės erdvėje nėra paprastas, tačiau jį galima paaiškinti ekologiniu panašumu.Dėl šios priežasties pirmenybė teikiama įprastesniam BC skirtumų matui.
Ateityje bus pakartotinai naudojamas SAGE metodas sezoniškai besikeičiantiems duomenims, siekiant įvertinti nustatytų provincijų ir AEP erdvinį kintamumą.Ateities tikslas yra naudoti šį metodą, kad būtų galima nustatyti, kurias provincijas galima nustatyti naudojant palydovinius matavimus (pvz., Chl-a, nuotolinio stebėjimo atspindį ir jūros paviršiaus temperatūrą).Tai leis nuotoliniu būdu įvertinti ekologinius komponentus ir labai lanksčiai stebėti ekologines provincijas bei jų kintamumą.
Šio tyrimo tikslas – pristatyti SAGE metodą, kuris apibrėžia ekologinę provinciją per unikalią planktono bendruomenės struktūrą.Čia bus pateikta išsamesnė informacija apie fizinį/biogeocheminį/ekosistemos modelį ir t-SNE bei DBSCAN algoritmų parametrų pasirinkimą.
Fiziniai modelio komponentai gaunami įvertinus vandenyno cirkuliaciją ir klimatą [ECCOv4;(37) pasaulinės būklės įvertinimas, aprašytas (38).Būsenos įvertinimo nominali skiriamoji geba yra 1/5.Mažiausių kvadratų metodas su Lagranžo daugiklio metodu naudojamas norint gauti pradines ir ribines sąlygas bei vidinio modelio parametrus, pakoreguotus stebėjimu, taip sukuriant laisvai veikiantį MIT bendrojo ciklo modelį (MITgcm) (39), modelis Po optimizavimo rezultatai gali būti stebimas ir stebimas.
Biogeochemija / ekosistema turi išsamesnį aprašymą (ty lygtis ir parametrų reikšmes) (2).Modelis fiksuoja C, N, P, Si ir Fe cirkuliaciją per neorganinius ir organinius tvenkinius.Čia naudojama versija apima 35 fitoplanktono rūšis: 2 mikroprokariotų ir 2 mikroeukariotų rūšis (tinka mažai maistinių medžiagų turinčiai aplinkai), 5 Cryptomonas sphaeroides rūšis (su kalcio karbonato danga), 5 diazonio rūšis ( Gali fiksuoti azotą, todėl neribojamas) ištirpusio neorganinio azoto prieinamumas), 11 diatomų (sudarančių silicio sluoksnį), 10 mišrių vegetatyvinių žvynelių (gali fotosintezuoti ir valgyti kitą planktoną) ir 16 zooplanktonų (ganyti kitus planktonus).Jos vadinamos "biogeocheminėmis funkcinėmis grupėmis", nes jos turi skirtingą poveikį jūrų biogeochemijai (40, 41) ir dažnai naudojamos stebėjimo ir modelių tyrimuose.Šiame modelyje kiekviena funkcinė grupė susideda iš kelių skirtingo dydžio planktonų, kurių atstumas yra nuo 0,6 iki 2500 μm ekvivalentinio sferinio skersmens.
Parametrai, turintys įtakos fitoplanktono augimui, ganymuisi ir skęstymui, yra susiję su dydžiu, o šešios fitoplanktono funkcinės grupės turi specifinių skirtumų (32).Nepaisant skirtingų fizinių struktūrų, modelio 51 planktono komponento rezultatai buvo naudojami daugelyje naujausių tyrimų (42–44).
Nuo 1992 iki 2011 m. fizinio / biogeocheminio / ekosistemos sujungimo modelis veikė 20 metų.Modelio rezultatai apima planktono biomasę, maistinių medžiagų koncentraciją ir maistinių medžiagų tiekimo greitį (DIN, PO4, Si ir Fe).Šiame tyrime 20 metų šių rezultatų vidurkis buvo naudojamas kaip ekologinės provincijos įvestis.Chl, planktono biomasės ir maistinių medžiagų koncentracijos pasiskirstymas bei funkcinių grupių pasiskirstymas lyginamas su palydoviniais ir in situ stebėjimais [žr. (2, 44), S1 pastabą ir pav.S1–S3].
Naudojant SAGE metodą, pagrindinis atsitiktinumo šaltinis yra t-SNE žingsnis.Atsitiktinumas trukdo pakartojamumui, o tai reiškia, kad rezultatai yra nepatikimi.SAGE metodas griežtai tikrina tvirtumą, nustatydamas t-SNE ir DBSCAN parametrų rinkinį, kuris kartojantis gali nuosekliai identifikuoti grupes.t-SNE parametro „suklaidumo“ nustatymas gali būti suprantamas kaip laipsnis, kuriuo atvaizdavimas nuo didelių iki mažų matmenų turėtų atitikti vietines arba pasaulines duomenų charakteristikas.Pasiekė 400 ir 300 pakartojimų painiavą.
Klasterizacijos algoritmui DBSCAN reikia nustatyti minimalų duomenų taškų dydį ir atstumo metriką klasteryje.Minimalus skaičius nustatomas vadovaujant ekspertams.Šios žinios žino, kas atitinka dabartinę skaitmeninio modeliavimo sistemą ir skiriamąją gebą.Mažiausias skaičius yra 100. Galima apsvarstyti didesnę mažiausią reikšmę (mažiau nei <135, kol viršutinė žalios spalvos riba tampa platesnė), tačiau ji negali pakeisti BC skirtumu pagrįsto agregavimo metodo.Ryšio laipsnis (6A pav.) naudojamas norint nustatyti ϵ parametrą, kuris yra palankus didesnei aprėpčiai (6B pav.).Ryšys apibrėžiamas kaip sudėtinis klasterių skaičius ir yra jautrus ϵ parametrui.Mažesnis jungiamumas rodo nepakankamą pritaikymą, dirbtinai sugrupuojamus regionus.Didelis jungiamumas rodo perdėtą montavimą.Per didelis pritaikymas taip pat yra problemiškas, nes tai rodo, kad pirminiai atsitiktiniai spėjimai gali lemti neatkuriamus rezultatus.Tarp šių dviejų kraštutinumų staigus padidėjimas (dažniausiai vadinamas „alkūne“) rodo geriausią ϵ.6A paveiksle matote staigų plokščiakalnio ploto padidėjimą (geltona, > 200 grupių), po to staigiai sumažėjo (žalia, 100 sankaupų) iki maždaug 130, apsupta labai nedaug grupių (mėlyna, <60 grupių) ).Bent 100 mėlynų sričių visame vandenyne dominuoja vienas klasteris (ϵ <0,42), arba didžioji vandenyno dalis nėra klasifikuojama ir laikoma triukšmu (ϵ> 0,99).Geltona sritis turi labai kintamą, neatkuriamą klasterių pasiskirstymą.Kai ϵ mažėja, triukšmas didėja.Smarkiai didėjantis žalias plotas vadinamas alkūne.Tai optimalus regionas.Nors naudojama tikimybė t-SNE, BC skirtumai provincijoje vis tiek gali būti naudojami patikimam klasterizavimui nustatyti.Naudodami 6 paveikslą (A ir B), nustatykite ϵ į 0,39.Kuo didesnis minimalus skaičius, tuo mažesnė tikimybė pasiekti ϵ, leidžiantį patikimai klasifikuoti, ir tuo didesnis žaliasis plotas, kurio reikšmė didesnė nei 135. Šios srities padidėjimas rodo, kad alkūnę bus sunkiau rasti arba nebus esama.
Nustačius t-SNE parametrus, bendras rastų klasterių skaičius bus naudojamas kaip ryšio matas (A) ir klasteriui priskirtų duomenų procentas (B).Raudonas taškas rodo geriausią aprėpties ir ryšio derinį.Minimalus skaičius nustatomas pagal minimalų skaičių, susijusį su ekologija.
Norėdami gauti papildomos medžiagos šiam straipsniui, žr. http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Tai yra atviros prieigos straipsnis, platinamas pagal Creative Commons Attribution License sąlygas.Straipsnis leidžia neribotai naudoti, platinti ir dauginti bet kurioje laikmenoje, jei originalus kūrinys yra tinkamai cituojamas.
Pastaba: prašome jūsų pateikti savo el. pašto adresą tik tam, kad asmuo, kurį rekomenduojate puslapiui, žinotų, jog norite, kad jis matytų el. laišką ir kad tai nėra šlamštas.Mes neužfiksuosime jokių el. pašto adresų.
Šis klausimas naudojamas norint patikrinti, ar esate lankytojas, ir išvengti automatinio šlamšto pateikimo.
Pasaulinė jūrų ekologijos ministerija yra pasiryžusi spręsti sudėtingas problemas ir bendruomenės struktūroms tyrinėti naudoja neprižiūrimą ML.
Pasaulinė jūrų ekologijos ministerija yra pasiryžusi spręsti sudėtingas problemas ir bendruomenės struktūroms tyrinėti naudoja neprižiūrimą ML.


Paskelbimo laikas: 2021-01-12