Felügyelet nélküli tanulási módszert javasolnak a globális tengeri ökológiai tartományok (öko-tartományok) meghatározására a planktonközösség-szerkezet és a tápanyagáramlási adatok alapján.A szisztematikus integrált ökológiai tartomány (SAGE) módszerrel rendkívül nemlineáris ökoszisztéma modellekben azonosíthatók az ökológiai tartományok.Az adatok nem Gauss-féle kovarianciájához való alkalmazkodás érdekében a SAGE t véletlen szomszéd beágyazást (t-SNE) használ a dimenzionalitás csökkentésére.A sűrűség alapú térbeli klaszterezés (DBSCAN) algoritmuson alapuló zajalkalmazás segítségével több mint száz ökológiai tartomány azonosítható.Az ökológiai különbségeket tartalmazó összekapcsolási térképet távolságmérőként használva egy robusztus aggregált ökológiai tartomány (AEP) objektíven meghatározható a beágyazott ökológiai tartományokon keresztül.Az AEP-ek segítségével feltárták a tápanyag-ellátottság szabályozását a közösség szerkezetén.Az öko-tartomány és az AEP egyediek, és segíthetik a modellértelmezést.Megkönnyíthetik a modellek összehasonlítását, és javíthatják a tengeri ökoszisztémák megértését és nyomon követését.
A tartományok olyan régiók, ahol a tengeri vagy szárazföldi komplex biogeográfia koherens és értelmes területekre szerveződik (1).Ezek a tartományok nagyon fontosak a helyszínek összehasonlításához és szembeállításához, a megfigyelések jellemzéséhez, a megfigyeléshez és a védelemhez.Az ezeket a tartományokat létrehozó összetett és nemlineáris kölcsönhatások a felügyelet nélküli gépi tanulási (ML) módszereket nagyon alkalmassá teszik a tartományok objektív meghatározására, mivel az adatok kovariancia összetett és nem Gauss-féle.Itt egy ML módszert javasolunk, amely szisztematikusan azonosítja az egyedi tengeri ökológiai tartományokat (ökotartományokat) a darwini globális háromdimenziós (3D) fizikai/ökoszisztéma modellből (2).Az „egyedi” kifejezés azt jelzi, hogy az azonosított terület nem fedi át kellőképpen más területekkel.Ezt a módszert System Integrated Ecological Province (SAGE) módszernek nevezik.A hasznos osztályozás elvégzéséhez egy algoritmus módszernek lehetővé kell tennie (i) a globális osztályozást és (ii) a térben és időben egymásba ágyazható/aggregálható többléptékű elemzést (3).Ebben a kutatásban először a SAGE módszert javasolták, és megvitatták az azonosított ökológiai tartományokat.Az öko-tartományok elősegíthetik a közösség szerkezetét irányító tényezők megértését, hasznos betekintést nyújthatnak a nyomon követési stratégiákhoz, és segíthetnek nyomon követni az ökoszisztéma változásait.
A szárazföldi tartományokat általában az éghajlat (csapadék és hőmérséklet), a talaj, a növényzet és az állatvilág hasonlóságai alapján osztályozzák, és segédgazdálkodásra, biodiverzitás-kutatásra és betegségek elleni védekezésre használják (1, 4).A tengeri tartományokat nehezebb meghatározni.A legtöbb organizmus mikroszkopikus, folyadékhatárokkal.Longhurst et al.(5) Az Oceanográfiai Minisztérium egyik első globális osztályozását adta a környezeti feltételek alapján.Ezeknek a „Longhurst” tartományoknak a meghatározása olyan változókat tartalmaz, mint a keveredési sebesség, rétegződés és besugárzás, valamint Longhurst tengeri oceanográfusként szerzett kiterjedt tapasztalata, akinek más fontos feltételei vannak a tengeri ökoszisztémák számára.A Longhurstet széles körben használták például az elsődleges termelés és a szén-dioxid-áramlás felmérésére, a halászat támogatására és az in situ megfigyelési tevékenységek tervezésére (5-9).A tartományok objektívebb meghatározása érdekében olyan módszereket alkalmaztak, mint a fuzzy logika és a regionális felügyelet nélküli klaszterezés/statisztika (9-14).Az ilyen módszerek célja olyan értelmes struktúrák azonosítása, amelyek képesek azonosítani a tartományokat a rendelkezésre álló megfigyelési adatokban.Például a dinamikus tengeri tartományok (12) önszerveződő térképeket használnak a zaj csökkentésére, és hierarchikus (fa alapú) klaszterezést használnak a regionális műholdakból származó tengeri színtermékek meghatározására [klorofill a (Chl-a), normalizált fluoreszcencia vonalmagasság és színes oldott szerves anyag] és fizikai mező (tengerfelszín hőmérséklete és sótartalma, abszolút dinamikus domborzata és tengeri jég).
A plankton közösségszerkezete aggodalomra ad okot, mert ökológiája nagyban befolyásolja a magasabb tápanyagszintet, a szén-elnyelést és az éghajlatot.Ennek ellenére továbbra is kihívást jelentő és megfoghatatlan cél egy globális ökológiai tartomány meghatározása a plankton közösség szerkezete alapján.A színes tengeri műholdak betekintést nyújthatnak a fitoplankton durva szemcsés osztályozásába, vagy sugallhatják a funkcionális csoportok előnyeit (15), de jelenleg nem tudnak részletes információt adni a közösség szerkezetéről.A közelmúltbeli felmérések [pl. Tara Ocean (16)] példátlan méréseket adnak a közösség szerkezetéről;jelenleg globális szinten csak elvétve vannak in situ megfigyelések (17).Korábbi tanulmányok nagyrészt meghatározták a „biogeokémiai tartományt” (12, 14, 18) a biokémiai hasonlóságok (mint például az elsődleges termelés, a Chl és a rendelkezésre álló fény) meghatározása alapján.Itt a numerikus modellt használják a kimenetre [Darwin(2)], és az ökológiai tartományt a közösség szerkezete és a tápanyagáramlás alapján határozzák meg.A tanulmányban használt numerikus modell globális lefedettséggel rendelkezik, és összehasonlítható a meglévő terepi adatokkal (17) és távérzékelési mezőkkel (S1 megjegyzés).A tanulmányban használt numerikus modelladatok előnye a globális lefedettség.A modell ökoszisztéma 35 fitoplankton és 16 zooplankton fajból áll (lásd az anyagokat és módszereket).A modell planktontípusok nemlineáris kölcsönhatásba lépnek a nem Gauss-féle kovariancia-struktúrákkal, így az egyszerű diagnosztikai módszerek nem alkalmasak egyedi és konzisztens mintázatok azonosítására a kialakuló közösségi struktúrákban.Az itt bemutatott SAGE módszer újszerű módot kínál az összetett Darwin-modellek kimenetének ellenőrzésére.
Az adattudomány/ML technológia erőteljes transzformációs képességei lehetővé teszik a túlnyomórészt összetett modellmegoldásokat, amelyek összetett, de robusztus struktúrákat tárnak fel az adatkovariancia területén.A robusztus módszer olyan módszer, amely hűen reprodukálja az eredményeket egy adott hibatartományon belül.Még egyszerű rendszerekben is kihívást jelenthet a robusztus minták és jelek meghatározása.Amíg a megfigyelt mintázathoz vezető indokokat nem határozzuk meg, a kialakuló komplexitás bonyolultnak/nehezen megoldhatónak tűnhet.Az ökoszisztéma összetételének meghatározásának kulcsfolyamata természeténél fogva nemlineáris.A nemlineáris kölcsönhatások megléte megzavarhatja a robusztus osztályozást, ezért kerülni kell azokat az módszereket, amelyek erős feltételezéseket tesznek az adatok kovariancia alapvető statisztikai eloszlásáról.A nagydimenziós és nemlineáris adatok gyakoriak az oceanográfiában, és kovariancia-struktúrájuk lehet összetett, nem Gauss-topológiájú.Bár a nem Gauss-féle kovarianciastruktúrájú adatok akadályozhatják a robusztus osztályozást, a SAGE módszer újszerű, mivel tetszőleges topológiájú klaszterek azonosítására szolgál.
A SAGE módszer célja a kialakuló minták objektív azonosítása, amelyek segíthetik a további ökológiai megértést.A (19)-hez hasonló klaszter alapú munkafolyamatot követve az ökológiai és tápanyag-fluxus változók segítségével határozzuk meg az adatok egyetlen klaszterét, az úgynevezett ökológiai tartományt.A tanulmányban javasolt SAGE módszer (1. ábra) először 55-ről 11 dimenzióra csökkenti a dimenziót az a priori meghatározott plankton funkciós csoportok összegzésével (lásd Anyagok és módszerek).A t-random szomszéd beágyazás (t-SNE) módszerrel a méretet tovább csökkentjük, ha a valószínűséget a 3D térbe vetítjük.A felügyelet nélküli klaszterezés azonosíthatja az ökológiailag közeli területeket [sűrűség alapú térbeli klaszterezés (DBSCAN) zajalapú alkalmazásokhoz].Mind a t-SNE, mind a DBSCAN alkalmazható az inherens nemlineáris ökoszisztéma numerikus modelladatokra.Majd vetítsd vissza a létrejövő ökológiai tartományt a földre.Több mint száz egyedi, regionális kutatásra alkalmas ökológiai tartományt azonosítottak.A globálisan konzisztens ökoszisztéma modell figyelembevétele érdekében a SAGE módszert alkalmazzák az ökológiai tartományok aggregált ökológiai tartományokba (AEP) aggregálására, hogy javítsák az ökológiai tartományok hatékonyságát.Az összesítés szintje (úgynevezett „komplexitás”) a kívánt részletezettséghez állítható.Határozza meg a robusztus AEP minimális összetettségét.A kiválasztás fókuszában a SAGE módszer és a legkisebb bonyolultságú AEP esetek feltárása áll a sürgősségi közösség struktúra szabályozásának meghatározására.A minták ezután elemezhetők, hogy ökológiai betekintést nyerjenek.Az itt bemutatott módszer szélesebb körű modell-összehasonlításra is használható, például a különböző modellekben található hasonló ökológiai tartományok elhelyezkedésének kiértékelésével a különbségek és hasonlóságok kiemelése, a modellek összehasonlítása érdekében.
(A) Az ökológiai tartomány meghatározására szolgáló munkafolyamat sematikus diagramja;a funkcionális csoport összegének felhasználásával az eredeti 55 dimenziós adatok 11 dimenziós modelleredményre való csökkentésére, beleértve a hét funkcionális/tápanyag plankton biomasszáját és négy tápanyagellátási arányt.Elhanyagolható érték és tartós jégtakaró terület.Az adatokat szabványosították és szabványosították.Adjon 11-dimenziós adatokat a t-SNE algoritmushoz a statisztikailag hasonló jellemzőkombinációk kiemeléséhez.A DBSCAN gondosan kiválasztja a fürtöt a paraméterérték beállításához.Végül vetítse vissza az adatokat a szélességi/hosszúsági projekcióba.Kérjük, vegye figyelembe, hogy ez a folyamat 10-szer megismétlődik, mert a t-SNE alkalmazása enyhe véletlenszerűséget generálhat.(B) elmagyarázza, hogyan szerezheti be az AEP-t az (A) pontban szereplő munkafolyamat 10-szeri megismétlésével.Mind a 10 megvalósítás esetében a tartományok közötti Bray-Curtis (BC) eltérési mátrixot 51 fitoplanktontípus biomasszája alapján határoztuk meg.Határozza meg a BC különbséget a tartományok között, az 1 AEP komplexitástól a 115-ös teljes komplexitásig. A BC benchmarkot Longhurst tartomány határozza meg.
A SAGE módszer a globális 3D fizikai/ökoszisztéma numerikus modell kimenetét használja fel az ökológiai tartomány meghatározására [Darwin (2);lásd Anyagok és módszerek és S1 megjegyzés].Az ökoszisztéma összetevői 35 fitoplankton és 16 zooplankton fajból állnak, hét előre meghatározott funkcionális csoporttal: prokarióták és eukarióták, amelyek alkalmazkodtak alacsony tápanyagtartalmú környezethez, kalcium-karbonát bevonatú kokcidiák és nehéz nitrogénkötés Nitrogéntápanyagok (általában hiányoznak). fontos tápanyagok), szilíciumtartalmú borítással más plankton fotoszintézist és legeltetés vegyes tápanyagú flagellátokat és zooplankton pásztorokat tud létrehozni.A mérettartomány 0,6-2500 μm egyenértékű gömbátmérő.A fitoplankton méretének és funkcionális csoportosításának modelleloszlása megragadja a műholdas és in situ megfigyelések során látható általános jellemzőket (lásd az S1-S3 ábrákat).A numerikus modell és a megfigyelt óceán közötti hasonlóság azt jelzi, hogy a modell által meghatározott tartományok alkalmazhatók lehetnek az in situ óceánra is.Kérjük, vegye figyelembe, hogy ez a modell csak a fitoplankton bizonyos sokféleségét, és csak az in situ óceán bizonyos fizikai és kémiai kényszertartományait rögzíti.A SAGE módszer lehetővé teszi az emberek számára, hogy jobban megértsék a modellközösségi struktúra erősen regionális szabályozási mechanizmusát.
A funkcionális csoportok összegzése 55-ről (51 plankton és 4 tápanyagáramlás) 11 dimenzióra csökkenti a problémát.Ebben a kezdeti vizsgálatban az algoritmus által támasztott számítási korlátok miatt nem vették figyelembe a mélységet és az időbeli változékonyságot.
A SAGE módszer képes azonosítani a fontos összefüggéseket a nemlineáris folyamatok, valamint a funkcionális csoport biomassza és a tápanyagáramlás közötti kölcsönhatások legfontosabb jellemzői között.Az euklideszi távoktatási módszereken alapuló 11 dimenziós adatok (például a K-átlagok) felhasználásával nem lehet megbízható és reprodukálható tartományokat elérni (19, 22).Ennek az az oka, hogy az ökológiai tartományt meghatározó kulcselemek kovariancia alapeloszlásában nem található Gauss-forma.A Voronoi-sejtek K-középei (egyenesek) nem tudják megtartani a nem Gauss-féle alapeloszlást.
Hét plankton funkcionális csoport biomasszája és négy tápanyagáram egy 11 dimenziós x vektort alkot.Ezért x egy vektormező a modellrácson, ahol minden xi elem egy 11 dimenziós vektort jelent, amely a modell vízszintes rácsán van definiálva.Minden i index egyedileg azonosít egy rácspontot a gömbön, ahol (lon, lat) = (ϕi, θi).Ha a modellrácsegység biomasszája kisebb, mint 1,2×10-3mg Chl/m3, vagy a jégborítási arány meghaladja a 70%-ot, a biomassza adatnaplóját felhasználjuk és eldobjuk.Az adatok normalizáltak és standardizáltak, így minden adat a [0-tól 1]-ig terjedő tartományban van, az átlagot eltávolítjuk, és egységvarianciára skálázzuk.Ez azért történik, hogy a jellemzőket (biomassza és tápanyagáramlás) ne korlátozza a kontraszt a lehetséges értékek tartományában.A klaszterezésnek a változási kapcsolatot a jellemzők közötti kulcsvalószínűségi távolságból kell rögzítenie, nem pedig a földrajzi távolságból.E távolságok számszerűsítésével fontos jellemzők jelennek meg, míg a szükségtelen részletek elvetődnek.Ökológiai szempontból erre azért van szükség, mert a kis biomasszával rendelkező fitoplanktonok bizonyos típusai nagyobb biogeokémiai hatással bírhatnak, mint például a diazotróf baktériumok általi nitrogénkötés.Az adatok szabványosítása és normalizálása során az ilyen típusú kovariánsok kiemelésre kerülnek.
A nagydimenziós térben lévő jellemzők közelségének hangsúlyozásával az alacsony dimenziós ábrázolásban a t-SNE algoritmust a meglévő hasonló régiók világosabbá tételére használják.A távérzékelési alkalmazásokhoz mély neurális hálózatok kiépítésére irányuló korábbi munkák a t-SNE-t használták, amely bebizonyította, hogy készségesen elválasztja a kulcsfontosságú jellemzőket (23).Ez egy szükséges lépés a jellemzőadatok robusztus klaszterezésének azonosításához, miközben elkerüli a nem konvergens megoldásokat (S2 megjegyzés).A Gauss-kernelek használatával a t-SNE megőrzi az adatok statisztikai tulajdonságait azáltal, hogy minden nagy dimenziós objektumot leképez a 3D fázistér egy pontjára, ezáltal biztosítva, hogy magas és alacsony irányban magas a valószínűsége, hogy hasonló objektumok magas- és alacsony irányban jelenjenek meg. mérettér (24).Adott egy N nagydimenziós objektum x1,…,xN, a t-SNE algoritmus a Kullback-Leibler (KL) divergenciájának minimalizálásával csökkenti (25).A KL divergencia annak mértéke, hogy egy valószínűségi eloszlás mennyire különbözik a második referencia-valószínűségi eloszlástól, és hatékonyan képes értékelni a korreláció lehetőségét a nagy dimenziós jellemzők alacsony dimenziós ábrázolásai között.Ha xi az i-edik objektum az N-dimenziós térben, akkor xj a j-edik objektum az N-dimenziós térben, yi az i-edik objektum az alacsony dimenziós térben, és yj a j-edik objektum az alacsony dimenziós térben -dimenziós tér, akkor t -SNE határozza meg a hasonlósági valószínűséget ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), és a dimenziócsökkentési halmazhoz q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
A 2A. ábra a 11 dimenziós kombináció biomassza- és tápanyagáram-vektorainak 3D-re való csökkentésének hatását szemlélteti.A t-SNE módszer jobbnak bizonyult a PCA-nál abban, hogy megbízható és reprodukálható eredményeket biztosítson az Öko-minisztérium számára (lásd az S2 megjegyzést).Távérzékelési adatok felhasználásával Lunga et al.(27) bemutatja, hogyan lehet az SNE módszert használni a Gauss-eloszlástól eltérő komplex és nemlineáris spektrális jellemzők kiemelésére.
Minden pont a nagy dimenziós tér egy pontját képviseli, amint az a 6B. ábrán látható, a legtöbb pontot rögzíti.A színt bármilyen színnek kell tekinteni, de meg kell felelnie az (A)-nak.
A 2A. ábrán látható t-SNE szórásdiagram pontjai rendre a szélességi és hosszúsági fokokkal vannak társítva.A 2A. ábra színei a DBSCAN módszerrel felfedezett klaszterek (28).When looking for dense observations, the DBSCAN algorithm uses the distance in the 3D representation between the points (ϵ = 0.39; for information about this choice, see Materials and Methods), and the number of similar points is required to define the cluster (here 100 pont, lásd fent).A DBSCAN módszer nem tesz feltételezéseket az adatokban lévő klaszterek alakjáról vagy számáról, amint az alább látható:
3) Minden olyan pontnál, amely a távolságon belül van, ismételje meg ismételten a 2. lépést a klaszter határának meghatározásához.Ha a pontok száma nagyobb, mint a beállított minimális érték, akkor a rendszer klaszternek jelöli.
Azok az adatok, amelyek nem érik el a minimális klasztertag és távolság ϵ metrikát, „zajnak” minősülnek, és nem rendelnek hozzá színt.A DBSCAN egy gyors és skálázható algoritmus, amely a legrosszabb esetben O(n2) teljesítménnyel rendelkezik.A jelenlegi elemzésben ez valójában nem véletlen.A minimális pontszámot szakértői értékelés határozza meg.A távolság beállítása után az eredmény nem elég stabil a ≈±10 tartományban.Ezt a távolságot a kapcsolat (6A. ábra) és az óceáni lefedettség százalékos aránya (6B. ábra) használja.A kapcsolódást a klaszterek összetett számaként határozzuk meg, és érzékeny a ϵ paraméterre.Az alacsonyabb kapcsolódási lehetőség az elégtelen illeszkedést, a régiók mesterséges csoportosítását jelzi.A magas csatlakozási képesség túlillesztést jelez.Elképzelhető magasabb minimum alkalmazása, de ha a minimum meghaladja a ca-t, akkor nem lehet megbízható megoldást elérni.135 (További részletekért lásd: Anyagok és módszerek).
A 2A. ábrán azonosított 115 klaszter a 2B. ábrán visszavetül a földre.Mindegyik szín a DBSCAN által azonosított biogeokémiai és ökológiai tényezők koherens kombinációjának felel meg.A klaszterek meghatározása után a 2A. ábra minden egyes pontjának egy adott szélességi és hosszúsági fokhoz való társítását használja a klaszterek visszavetítése a földrajzi területre.A 2B. ábra ezt a 2A. ábrával azonos klaszterszínekkel szemlélteti.A hasonló színeket nem szabad ökológiai hasonlóságként értelmezni, mert az algoritmus által a klaszterek felfedezésének sorrendje szerint vannak hozzárendelve.
A 2B. ábrán látható terület minőségileg hasonló lehet az óceán fizikai és/vagy biogeokémiájában megállapított területhez.Például a Csendes-óceán egyenlítői részén az emelkedéshez kapcsolódó különböző régiók láthatók.
Az Ökotartomány ökológiai környezetének megértése érdekében a Bray-Curtis (BC) különbségi index (29) variációját használták a klaszter ökológiájának értékelésére.A BC mutató egy statisztikai adat, amelyet a két különböző helyszín közötti közösségszerkezet különbségének számszerűsítésére használnak.A BC mérés 51 fitoplankton és zooplankton faj biomasszájára alkalmazható BCninj = 1-2CninjSni + Snj
A 2B. ábrán azonosított összes klaszter esetében felmérhető a tartományon belüli és tartományok közötti BC hasonlósága.A BC különbség egy tartományon belül a tartomány átlagértéke és a tartomány egyes pontjai közötti különbségre utal.A Kr.e. tartományok közötti különbség az egyik tartomány és a többi tartomány közötti hasonlóságra utal.A 3A. ábra egy szimmetrikus BC mátrixot mutat (0, fekete: teljesen megfelelő; 1, fehér: teljesen eltérő).A grafikon minden sora egy-egy mintát mutat az adatokban.A 3B. ábra a 3A. ábra BC eredményeinek földrajzi jelentőségét mutatja az egyes tartományokra vonatkozóan.A 3B. ábra azt mutatja, hogy az egyenlítő és az Indiai-óceán körüli nagy területek szimmetriája alapvetően hasonló, de a magasabb szélességi körök és a felfutási területek jelentősen eltérnek egymástól.
(A) A Kr.e. különbség mértéke az egyes tartományokban a 20 éves átlagos globális felszíni átlag 51 plankton alapján.Jegyezze fel az értékek várható szimmetriáját.(B) Egy oszlop (vagy sor) térbeli vetülete.A fekete (BC = 0) ugyanazt a területet jelenti, a fehér (BC = 1) pedig azt, hogy nincs hasonlóság.
A 4A. ábra szemlélteti a BC különbségét a 2B. ábra egyes tartományaiban.A klaszter átlagos területeinek átlagos kombinációjával, valamint a BC és a tartomány egyes rácspontjainak átlaga közötti különbség meghatározásával meghatározva azt mutatja, hogy a SAGE módszerrel jól elkülöníthető 51 faj az ökológiai hasonlóság típusa alapján. modelladatok.Az összesített átlagos klaszter BC eltérés mind az 51 típus esetében 0,102±0,0049.
(A, B és D) A BC különbséget a tartományon belül az egyes rácspontok és az átlagos tartomány közötti BC átlagos különbségként értékelik, és a bonyolultság nem csökken.(2) A globális átlagos tartományon belüli BC különbség 0,227±0,117.Ez a munka által javasolt ökológiai motiváción alapuló osztályozás mércéje [zöld vonal a (C)-ben].(C) Átlagos tartományon belüli BC különbség: A fekete vonal jelzi a tartományon belüli BC különbséget növekvő összetettséggel.A 2σ az öko-tartomány azonosítási folyamat 10 ismétlődéséből származik.A DBSCAN által felfedezett tartományok teljes komplexitását tekintve (A) azt mutatja, hogy a Kr. e. eltérés a tartományban 0,099, a (C) által javasolt komplexitási besorolás pedig 12, ami a tartományban 0,200 BC eltérést eredményez.ahogy a kép is mutatja.(D).
A 4B. ábrán 51 planktontípus biomasszáját használjuk a Longhurst tartomány egyenértékű BC különbségének reprezentálására.Az egyes tartományok összesített átlaga 0,227, a rácspontok szórása a Kr. e. tartomány különbségéhez képest 0,046.Ez nagyobb, mint az 1B. ábrán azonosított klaszter.Ehelyett a hét funkciós csoport összegét használva az átlagos szezonon belüli BC eltérés Longhurstben 0,232-re nőtt.
A kutatás céljaira nem lehetséges száznál több tartomány teljes körű megjelenítése.A következő rész bemutatja a SAGE módszert, amely összefoglalja a tartományokat.
A tartomány egyik célja, hogy elősegítse a tartomány elhelyezkedésének és irányításának megértését.A vészhelyzetek meghatározásához az 1B. ábrán látható módszer ökológiailag hasonló tartományok egymásba ágyazását szemlélteti.Az öko-tartományokat az ökológiai hasonlóság alapján csoportosítják, és a tartományok ilyen csoportosítását AEP-nek nevezik.Állítson be egy állítható „komplexitást” a figyelembe veendő tartományok teljes száma alapján.A „komplexitás” kifejezést azért használják, mert lehetővé teszi a vészhelyzeti jellemzők szintjének beállítását.Az értelmes aggregációk meghatározásához a tartományon belüli átlagos BC 0,227-es különbséget Longhursthez képest használjuk viszonyítási alapként.E referenciaérték alatt az egyesített tartományok már nem tekinthetők hasznosnak.
Amint a 3B. ábra mutatja, a globális ökológiai tartományok koherensek.A tartományok közötti BC különbségeket felhasználva látható, hogy egyes konfigurációk nagyon „általánosak”.A genetika és a gráfelméleti módszerek által ihletett „összekapcsolt gráfok” több mint 100 tartomány rendezésére szolgálnak a hozzájuk leginkább hasonlító tartományok alapján.Az „összeköthetőség” mérőszámát itt a BC tartományok közötti eltérés (30) alapján határozzuk meg.A több mint 100 tartomány besorolására alkalmas tartományok számát itt összetettségnek nevezhetjük.Az AEP egy olyan termék, amely több mint 100 tartományt sorol be a legdominánsabb/legközelebbi ökológiai tartományok közé.Minden ökológiai tartomány a hozzájuk leginkább hasonlító domináns/erősen kapcsolódó ökológiai tartományhoz van hozzárendelve.Ez a BC különbség által meghatározott aggregáció lehetővé teszi a globális ökológia egymásba ágyazott megközelítését.
A kiválasztott komplexitás tetszőleges érték lehet 1-től a 3. ábra teljes komplexitásáig.2A.Alacsonyabb komplexitás esetén az AEP degenerálódhat a valószínűségi dimenziócsökkentési lépés (t-SNE) miatt.A degeneráció azt jelenti, hogy az ökológiai tartományok különböző AEP-ekhez rendelhetők az iterációk között, ezáltal megváltoztatva a lefedett földrajzi területet.A 4C. ábra szemlélteti a BC-különbségek terjedését a tartományokon belül a növekvő összetettségű AEP-ekben 10 megvalósítás között (az 1B. ábra illusztrációja).A 4C. ábrán a 2σ (kék terület) a leromlás mértéke 10 megvalósításban, a zöld vonal pedig a Longhurst benchmarkot jelöli.A tények bebizonyították, hogy a 12-es komplexitás a tartományban a BC különbséget a Longhurst-benchmark alatt tudja tartani minden megvalósításban, és fenntartani egy viszonylag kis 2σ-es degradációt.Összefoglalva, a minimális ajánlott komplexitás 12 AEP, és az 51 planktontípussal értékelt átlagos tartományon belüli BC különbség 0,198±0,013, amint az a 4D. ábrán látható.Hét plankton funkcionális csoport összegét használva az átlagos BC különbség a tartományon belül 2σ 0,198±0,004 helyett.A hét funkcionális csoport teljes biomasszájával vagy mind az 51 planktontípus biomasszájával számított BC különbségek összehasonlítása azt mutatja, hogy bár a SAGE módszer alkalmazható az 51 dimenziós helyzetre, a hét funkcionális csoport teljes biomasszájára vonatkozik. Edzéshez.
A kutatás céljától függően különböző összetettségi szintek jöhetnek számításba.A regionális vizsgálatok teljes komplexitást igényelhetnek (azaz mind a 115 tartomány).Példaként és az érthetőség kedvéért vegye figyelembe a 12-es minimális ajánlott összetettséget.
A SAGE módszer hasznosságának példájaként itt 12 AEP-t használunk, legalább 12 összetettséggel a sürgősségi közösség struktúra vezérlésének feltárására.Az 5. ábra szemlélteti az ökológiai meglátásokat AEP szerint csoportosítva (A-tól L-ig): A Redfield sztöchiometriában a földrajzi kiterjedést (5C. ábra), a funkcionális csoport biomassza összetételét (5A. ábra) és a tápanyagellátást (5B. ábra) az N Zoomed végzi.Az arány (N:Si:P:Fe, 1:1:16:16×103) látható.Az utóbbi panelen P szorozva 16-tal és Fe 16×103-mal, tehát az oszlopdiagram megfelel a fitoplankton táplálkozási igényeinek.
A tartományok 12 AEP-be vannak besorolva A-tól L-ig. (A) Az ökoszisztémák biomassza (mgC/m3) 12 tartományban.(B) Az oldott szervetlen nitrogén (N), vas (Fe), foszfát (P) és kovasav (Si) tápanyagáramlási sebessége (mmol/m3/év).Fe-t és P-t 16-tal, illetve 16×103-mal szorozzuk meg, így a csíkok a fitoplankton sztöchiometriai követelményei szerint vannak szabványosítva.(C) Jegyezze meg a különbséget a sarki régiók, a szubtrópusi ciklonok és a fő szezonális/növekvő régiók között.A megfigyelő állomások jelölése a következő: 1, SEATS;2, ALOHA;3, P állomás;és 4, DENEVEREK.
Az azonosított AEP egyedi.Az Atlanti- és a Csendes-óceánon van némi szimmetria az Egyenlítő körül, és hasonló, de megnagyobbodott terület létezik az Indiai-óceánon is.Egyes AEP-k a kontinens nyugati oldalát ölelik fel, ami az emelkedéshez kapcsolódik.A déli pólus körkörös áramlatát nagy zónajellemzőnek tekintik.A szubtrópusi ciklon az oligotróf AEP összetett sorozata.Ezekben a tartományokban nyilvánvaló a planktonok által dominált oligotróf örvények és a kovaföldben gazdag poláris régiók biomassza különbségeinek ismert mintázata.
A nagyon hasonló teljes fitoplankton biomasszával rendelkező AEP-k nagyon eltérő közösségi szerkezettel rendelkezhetnek, és különböző földrajzi területeket fedhetnek le, mint például D, H és K, amelyek hasonló teljes fitoplankton biomasszával rendelkeznek.Az AEP H főként az Indiai-óceán egyenlítői részén található, és több a diazotróf baktérium.Az AEP D számos medencében megtalálható, de különösen feltűnő a Csendes-óceánon az egyenlítői hullámok körüli magas hozamú területek környékén.Ennek a csendes-óceáni tartománynak az alakja egy bolygóhullám-vonatra emlékeztet.Az AEP D-ben kevés a diazobaktérium, és több a kúp.A másik két tartományhoz képest az AEP K csak a Jeges-tenger hegyvidékein található, és több kovaalg és kevesebb plankton található.Érdemes megjegyezni, hogy ebben a három régióban a plankton mennyisége is nagyon eltérő.Közülük az AEP K plankton abundanciája viszonylag alacsony, míg az AEP D-é és a H-é viszonylag magas.Ezért biomasszájuk ellenére (és ezért hasonlóak a Chl-a-hoz) ezek a tartományok meglehetősen különböznek egymástól: a Chl-alapú tartománytesztelések nem feltétlenül rögzítik ezeket a különbségeket.
Az is nyilvánvaló, hogy néhány nagyon eltérő biomasszával rendelkező AEP hasonló lehet a fitoplankton közösség szerkezetét tekintve.Ez például látható az AEP D-ben és az E-ben. Közel vannak egymáshoz, a Csendes-óceánon pedig az AEP E a rendkívül termelékeny AEPJ-hez.Hasonlóképpen nincs egyértelmű kapcsolat a fitoplankton biomassza és a zooplankton abundanciája között.
Az AEP a számukra biztosított tápanyagok alapján érthető (5B. ábra).Diatomák csak ott léteznek, ahol elegendő mennyiségű kovasav van.Általánosságban elmondható, hogy minél nagyobb a kovasav-ellátottság, annál nagyobb a kovaföld biomasszája.A kovaalgák láthatók az AEP A, J, K és L-ben. A kovaalma-biomassza más fitoplanktonokhoz viszonyított arányát az N, P és Fe határozza meg a kovaalma igényhez viszonyítva.Például az AEP L-t a kovamoszatok uralják.Más tápanyagokkal összehasonlítva a Si rendelkezik a legnagyobb mennyiséggel.Ezzel szemben a magasabb termelékenység ellenére az AEP J kevesebb kovaalmat és kevesebb szilíciumot tartalmaz (az összes többi tápanyaghoz képest).
A diazónium baktériumok képesek megkötni a nitrogént, de lassan növekednek (31).Együtt élnek más fitoplanktonokkal, ahol a vas és a foszfor túlzott mértékű a nem diazónium tápanyagok iránti igényhez képest (20, 21).Érdemes megjegyezni, hogy a diazotróf biomassza viszonylag magas, a vas és a P kínálata pedig viszonylag nagy a N-ellátáshoz képest. Ily módon, bár az AEP J teljes biomassza magasabb, az AEP H diazónium biomassza nagyobb, mint a J-ben. Kérjük, vegye figyelembe, hogy az AEP J és H földrajzilag nagyon eltérőek, és H az Indiai-óceán egyenlítői részén található.
Ha az egyedülálló ökoszisztéma-struktúra nincs tartományokra osztva, a 12 AEP legalacsonyabb komplexitású modelljéből nyert belátások nem lesznek ilyen egyértelműek.A SAGE által generált AEP megkönnyíti az ökoszisztéma modellekből származó összetett és nagy dimenziós információk koherens és egyidejű összehasonlítását.Az AEP hatékonyan hangsúlyozza, hogy a Chl miért nem jó és alternatív módszer a közösség szerkezetének vagy a zooplankton abundanciájának meghatározására magasabb tápanyagszinteken.A folyamatban lévő kutatási témák részletes elemzése túlmutat e cikk keretein.A SAGE módszer olyan módot ad a modell más mechanizmusainak feltárására, amelyek könnyebben kezelhetők, mint a pont-pont megtekintés.
A SAGE módszert a globális fizikai/biogeokémiai/ökoszisztéma numerikus modellekből származó rendkívül összetett ökológiai adatok tisztázására javasolták.Az ökológiai tartományt a Cross Plankton funkcionális csoportok teljes biomassza, a T-SNE valószínűségi dimenzió-csökkentési algoritmus és a klaszterezés alkalmazása határozza meg a DBSCAN nem felügyelt ML módszerrel.A tartományok közötti BC-differenciál/gráf elméletet a beágyazási módszerhez alkalmazzák egy robusztus AEP származtatására, amely használható globális értelmezéshez.Felépítését tekintve az Eco-Province és az AEP egyedülálló.Az AEP fészkelése beállítható az eredeti ökológiai tartomány teljes bonyolultsága és az ajánlott 12 AEP -k közötti minimális küszöbérték között.Az AEP minimális bonyolultságának fészkezését és meghatározását kulcsfontosságú lépéseknek tekintik, mivel a T-SNE valószínűség <12 komplexitású AEP-ket degenerálja.A SAGE módszer globális, bonyolultsága> 100 AEPS és 12 -ig terjed. Az egyszerűség kedvéért a jelenlegi hangsúly a 12 globális AEP -k összetettségére összpontosít.A jövőbeli kutatások, különösen a regionális tanulmányok hasznosak lehetnek a globális öko-provinciák kisebb térbeli részhalmazának, és egy kisebb területen összesíthetnek, hogy kihasználhassák ugyanazokat az ökológiai betekintést, amelyet itt tárgyaltak.Javaslatokat nyújt arra, hogy ezek az ökológiai tartományok és az azokból származó betekintések hogyan használhatók további ökológiai megértéshez, a modell összehasonlításának megkönnyítéséhez és a tengeri ökoszisztémák megfigyelésének potenciális javításához.
A SAGE módszerrel azonosított ökológiai tartomány és AEP a numerikus modell adatain alapul.Értelemszerűen a numerikus modell egy leegyszerűsített struktúra, amely a célrendszer lényegét próbálja megragadni, és a különböző modellek eltérő planktoneloszlással rendelkeznek.A tanulmányban használt numerikus modell nem képes teljes mértékben megragadni néhány megfigyelt mintát (például az egyenlítői régióra és a déli óceánra vonatkozó Chl-becslésekben).A valódi óceán diverzitásának csak egy kis részét rögzítik, és a mezo- és szubmezoskálákat nem lehet feloldani, ami befolyásolhatja a tápanyagáramlást és a kisebb léptékű közösségszerkezetet.E hiányosságok ellenére kiderült, hogy az AEP nagyon hasznos az összetett modellek megértésében.Annak értékelésével, hogy hol találhatók hasonló ökológiai tartományok, az AEP potenciális numerikus modell-összehasonlító eszközt kínál.A jelenlegi numerikus modell rögzíti a távérzékelési fitoplankton Chl-a koncentrációjának általános mintázatát, valamint a plankton méretének és funkcionális csoportjának megoszlását (S1 megjegyzés és S1 ábra) (2, 32).
Amint azt a 0,1 mgChl-a/m-3 kontúrvonal mutatja, az AEP oligotróf területre és mezotróf területre oszlik (S1B ábra): AEP B, C, D, E, F és G oligotróf területek, a fennmaradó területek pedig található Magasabb Chl-a.Az AEP némi megfelelést mutat Longhurst tartománnyal (S3A ábra), például az óceán déli részén és a Csendes-óceán egyenlítői részén.Egyes régiókban az AEP több Longhurst régiót is lefed, és fordítva.Mivel a tartományok elhatárolásának szándéka ezen a területen és Longhurstban más, várhatóan eltérések lesznek.Több AEP egy Longhurst tartományban azt jelzi, hogy bizonyos hasonló biogeokémiájú területek ökoszisztéma szerkezete nagyon eltérő lehet.Az AEP bizonyos levelezést mutat a fizikai állapotokkal, amint azt a felügyelet nélküli tanulás (19) felhasználásával feltárták, például a magas felfelé mutató államokban (például a Déli -óceán és az Egyenlítői Csendes -óceán; S3, C és D ábra).Ezek az összefüggések azt mutatják, hogy a plankton közösségszerkezetét erősen befolyásolja az óceán dinamikája.Az olyan területeken, mint az Atlanti-óceán északi része, az AEP fizikai tartományokon halad át.Az ezeket a különbségeket okozó mechanizmus olyan folyamatokat is tartalmazhat, mint például a porszállítás, amely teljesen eltérő táplálkozási programokhoz vezethet hasonló fizikai körülmények között.
Az Ökológiai Minisztérium és az AEP felhívta a figyelmet arra, hogy a Chl önmagában nem képes azonosítani az ökológiai összetevőket, amint azt a tengeri ökológiai közösség már felismerte.Ez látható a hasonló biomasszájú, de jelentősen eltérő ökológiai összetételű AEP-eknél (például D és E).Ezzel szemben az olyan AEP-k, mint a D és K, nagyon eltérő biomasszával, de hasonló ökológiai összetétellel rendelkeznek.Az AEP hangsúlyozza, hogy a biomassza, az ökológiai összetétel és a zooplankton abundanciája közötti kapcsolat összetett.Például, bár az AEP J kiemelkedik a fitoplankton és a plankton biomassza tekintetében, az AEP A és L plankton biomasszája hasonló, de az A magasabb planktonbőséggel rendelkezik.Az AEP hangsúlyozza, hogy a fitoplankton biomassza (vagy Chl) nem használható a zooplankton biomassza előrejelzésére.A zooplankton a halászati tápláléklánc alapja, és a pontosabb becslések jobb erőforrás-gazdálkodást eredményezhetnek.A jövőbeni színes tengeri műholdak [például a PACE (plankton, aeroszol, felhő és tengeri ökoszisztéma)] jobban elhelyezkedhetnek a fitoplankton közösségszerkezetének becslésében.Az AEP előrejelzés használata potenciálisan megkönnyítheti a zooplankton űrből való becslését.Az olyan módszerek, mint a SAGE, párosulva új technológiákkal és egyre több terepi adattal, amely a földi igazságfelméréshez (mint például a Tara és a nyomon követési kutatások) áll rendelkezésre, együttesen tehet egy lépést a műholdas ökoszisztéma-egészségügyi megfigyelés felé.
A SAGE módszer kényelmes módot biztosít néhány olyan mechanizmus értékelésére, amelyek szabályozzák a tartomány jellemzőit, mint például a biomassza/Chl, a nettó elsődleges termelés és a közösség szerkezete.Például a kovaföldek relatív mennyiségét a Si, N, P és Fe ellátásának a fitoplankton sztöchiometriai követelményeihez viszonyított egyensúlyhiánya határozza meg.Kiegyensúlyozott ellátási arány mellett a közösséget a kovamoszatok (L) uralják.Ha az ellátási ráta kiegyensúlyozatlan (vagyis a szilícium-ellátás kisebb, mint a kovamoszat tápanyagigénye), a kovamoszat csak kis részt képvisel (K).Ha a vas és a foszfor kínálata meghaladja a nitrogén-ellátást (például E és H), a diazotróf baktériumok erőteljesen szaporodnak.Az AEP által biztosított kontextuson keresztül az ellenőrzési mechanizmusok feltárása hasznosabbá válik.
Az Ökotartomány és az AEP hasonló közösségi struktúrájú területek.Az ökológiai tartományban vagy az AEP egy bizonyos helyről származó idősorok referenciapontnak tekinthetők, és képviselhetik az ökológiai tartomány vagy az AEP által lefedett területet.A hosszú távú helyszíni megfigyelő állomások biztosítanak ilyen idősorokat.A hosszú távú in situ adatkészletek továbbra is felbecsülhetetlen szerepet fognak játszani.A közösségi struktúra monitorozása szempontjából a SAGE módszert úgy tekinthetjük, mint az új telephelyek leghasznosabb helyének meghatározását.Például a hosszú távú oligotróf élőhelyértékelés (ALOHA) idősora az oligotróf terület AEP B-jében található (5C. ábra, 2. címke).Mivel az ALOHA közel van egy másik AEP határához, előfordulhat, hogy az idősor nem reprezentálja a teljes területet, ahogy azt korábban javasoltuk (33).Ugyanebben az AEP B-ben a SEATS (Southeast Asian Time Series) idősor Tajvan délnyugati részén található (34), távolabb más AEP-k határaitól (5C. ábra, 1. címke), és jobb helyként használható a megfigyeléshez. AEPB.A BATS (Bermuda Atlantic Time Series Study) idősora (5C. ábra, 4. címke) az AEPC-ben nagyon közel van az AEP C és F határához, ami azt jelzi, hogy az AEP C BATS idősorok használatával történő megfigyelése közvetlenül problémás lehet.A P állomás az AEP J-ben (5C. ábra, 3. címke) messze van az AEP határától, így inkább reprezentatív.Az Ökotartomány és az AEP segíthet a globális változások felmérésére alkalmas monitoring keret kialakításában, mert kulcsfontosságú betekintést nyújthat a tartományok engedélye annak felmérésére, hogy a helyszíni mintavétel hol történik.A SAGE módszer továbbfejleszthető éghajlati adatokra az időtakarékos változékonyság felmérésére.
A SAGE módszer sikere az adattudományi/ML módszerek és a tartományspecifikus ismeretek körültekintő alkalmazásával érhető el.Pontosabban, a T-SNE-t használják a dimenziós csökkentés végrehajtására, amely megőrzi a nagydimenziós adatok kovariancia struktúráját és megkönnyíti a kovariancia topológiájának megjelenítését.Az adatok csíkok és kovariancia formájában vannak elrendezve (2A. ábra), ami azt jelzi, hogy a tisztán távolságon alapuló mértékek (például K-átlagok) nem megfelelőek, mert általában Gauss-féle (körkörös) alapú eloszlást használnak (ezt az S2 megjegyzés tárgyalja). .A DBSCAN módszer bármilyen kovariancia topológiára alkalmas.Mindaddig, amíg odafigyel a paraméterek beállítására, megbízható azonosítás biztosítható.A T-SNE algoritmus számítási költsége magas, ami a jelenlegi alkalmazását nagyobb mennyiségű adatra korlátozza, ami azt jelenti, hogy nehéz alkalmazni a mély vagy időbeli változó mezőkre.A t-SNE skálázhatóságával kapcsolatos munka folyamatban van.Mivel a KL távolságot könnyű párhuzamosítani, a t-SNE algoritmusnak jó lehetősége van a jövőbeni bővítésre (35).Eddig más ígéretes dimenziócsökkentési módszerek, amelyek jobban csökkenthetik a méretet, magukban foglalják az egységes sokrétű közelítési és vetítési (UMAP) technikákat, de az óceánadatok összefüggésében értékelésre van szükség.A jobb skálázhatóság jelentése például a globális klímák vagy eltérő komplexitású modellek vegyes rétegre történő osztályozása.Azok a területek, amelyeket a SAGE egyik tartományban sem tud besorolni, a fennmaradó fekete pontoknak tekinthetők a 2A ábrán.Földrajzilag ezek a területek elsősorban a rendkívül szezonális területeken vannak, ami azt sugallja, hogy az időbeli változások ökológiai tartományok rögzítése jobb lefedettséget biztosít.
A SAGE módszer felépítéséhez a komplex rendszerek/adattudomány ötleteit használják, felhasználva a funkcionális csoportok klasztereinek meghatározását (annak lehetőségét, hogy nagyon közel álljunk egy 11-dimenziós térben), és meghatározzák a tartományokat.Ezek a tartományok meghatározott térfogatokat ábrázolnak a 3D t-SNE fázisterünkben.Hasonlóképpen, a Poincaré rész felhasználható a pálya által elfoglalt állami tér „térfogatának” értékelésére a „normál” vagy a „kaotikus” viselkedés meghatározására (36).A statikus 11 dimenziós modellkimenet esetében az adatok 3D fázistérré alakítása után elfoglalt térfogat hasonlóan magyarázható.A földrajzi terület és a terület kapcsolata a 3D fázistérben nem egyszerű, de az ökológiai hasonlósággal magyarázható.Emiatt a hagyományosabb BC eltérés mértékét részesítjük előnyben.
A jövőbeni munka során a SAGE módszert újra felhasználják a szezonálisan változó adatokhoz az azonosított tartományok és az AEP térbeli változékonyságának felmérésére.A jövőbeni cél az, hogy ezzel a módszerrel segítsék meghatározni, hogy mely tartományok határozhatók meg műholdas mérésekkel (például Chl-a, távérzékelési visszaverőképesség és tengerfelszíni hőmérséklet).Ez lehetővé teszi az ökológiai összetevők távérzékeléssel történő értékelését, valamint az ökológiai tartományok és változékonyságuk rendkívül rugalmas nyomon követését.
A kutatás célja a SAGE módszer megismertetése, amely egyedi planktonközösség-struktúrán keresztül határoz meg egy ökológiai tartományt.Itt a fizikai/biogeokémiai/ökoszisztéma-modellről, valamint a t-SNE és DBSCAN algoritmusok paraméterválasztásáról kapunk részletesebb információkat.
A modell fizikai összetevői az óceáni keringés és az éghajlat becsléséből származnak [ECCOv4;(37) a (38) által leírt globális állapotbecslés.Az állapotbecslés névleges felbontása 1/5.A legkisebb négyzetek módszere Lagrange-szorzó módszerrel a kezdeti és peremfeltételek, valamint a megfigyeléssel korrigált belső modellparaméterek megszerzésére szolgál, ezáltal egy szabadon futó MIT általános ciklusmodell (MITgcm) generálható (39), a modell Az optimalizálás után az eredmények nyomon kell követni és megfigyelni.
A biogeokémiának/ökoszisztémának teljesebb leírása (azaz egyenletek és paraméterértékek) található a (2)-ben.A modell rögzíti a C, N, P, Si és Fe keringését szervetlen és szerves tavakon keresztül.Az itt használt változat 35 fitoplanktonfajt tartalmaz: 2 mikroprokarióta és 2 mikroeukarióta faj (alacsony tápanyagtartalmú környezetre alkalmas), 5 Cryptomonas sphaeroides faj (kalcium-karbonát bevonattal), 5 faj diazónium ( Képes megkötni a nitrogént, így nincs korlátozva) az oldott szervetlen nitrogén elérhetősége), 11 kovaföld (kovásréteget képez), 10 vegyes-vegetatív flagellát (képes fotoszintetizálni és más planktonokat fogyasztani) és 16 zooplankton (más planktonokon legel).Ezeket "biogeokémiai funkcionális csoportoknak" nevezik, mivel eltérő hatást gyakorolnak a tengeri biogeokémiára (40, 41), és gyakran használják megfigyelésben és modellvizsgálatokban.Ebben a modellben minden funkcionális csoport több, különböző méretű planktonból áll, amelyek fesztávja 0,6-2500 μm egyenértékű gömbátmérőjű.
A fitoplankton növekedését, legeltetését és süllyedését befolyásoló paraméterek a mérethez kapcsolódnak, és a fitoplankton hat funkcionális csoportja között specifikus különbségek vannak (32).Az eltérő fizikai keretek ellenére a modell 51 plankton komponensének eredményeit számos közelmúltbeli tanulmány felhasználta (42-44).
1992 és 2011 között a fizikai/biogeokémiai/ökoszisztéma csatolási modell 20 évig futott.A modell kimenete tartalmazza a plankton biomasszát, a tápanyag-koncentrációt és a tápanyagellátási sebességet (DIN, PO4, Si és Fe).Ebben a tanulmányban ezen outputok 20 éves átlagát használtuk az Ökológiai Tartomány inputjaként.Chl, a plankton biomassza és tápanyagkoncentráció eloszlását, valamint a funkcionális csoportok eloszlását hasonlítjuk össze műholdas és in situ megfigyelésekkel [lásd (2, 44), S1 megjegyzés és ábra.S1-től S3-ig].
A SAGE módszer esetében a véletlenszerűség fő forrása a t-SNE lépésből származik.A véletlenszerűség akadályozza az ismételhetőséget, ami azt jelenti, hogy az eredmények megbízhatatlanok.A SAGE módszer szigorúan teszteli a robusztusságot a t-SNE és a DBSCAN paramétereinek meghatározásával, amelyek ismétlés esetén következetesen azonosíthatják a klasztereket.A t-SNE paraméter „zavartságának” meghatározása úgy értelmezhető, mint annak meghatározása, hogy a magas és alacsony dimenziók közötti leképezés milyen mértékben vegye figyelembe az adatok helyi vagy globális jellemzőit.Elérte a 400 és 300 iteráció zavarát.
A DBSCAN klaszterezési algoritmushoz meg kell határozni a fürt adatpontjainak minimális méretét és távolságmérőjét.A minimális létszám meghatározása szakértők irányítása mellett történik.Ez a tudás tudja, mi illik a jelenlegi numerikus modellezési keretrendszerhez és felbontáshoz.A minimális szám 100. Megfontolható egy magasabb minimális érték (<135-nél kisebb, mielőtt a zöld felső határa szélesedik), de ez nem helyettesítheti a BC eltérésen alapuló összesítési módszert.A kapcsolat mértéke (6A. ábra) a ϵ paraméter beállítására szolgál, ami elősegíti a nagyobb lefedettséget (6B. ábra).A kapcsolódást a klaszterek összetett számaként határozzuk meg, és érzékeny a ϵ paraméterre.Az alacsonyabb kapcsolódási lehetőség az elégtelen illeszkedést, a régiók mesterséges csoportosítását jelzi.A magas csatlakozási képesség túlillesztést jelez.A túlillesztés is problémás, mert azt mutatja, hogy a kezdeti véletlenszerű találgatások reprodukálhatatlan eredményekhez vezethetnek.E két szélsőség között egy éles növekedés (általában „könyöknek”) jelzi a legjobb ϵ-t.A 6A. ábrán a fennsík területének éles növekedése látható (sárga, > 200 klaszter), majd éles csökkenés (zöld, 100 klaszter), körülbelül 130-ig, nagyon kevés klaszterrel körülvéve (kék, <60 klaszter) ).Legalább 100 kék területen vagy egy klaszter uralja az egész óceánt (ϵ <0,42), vagy az óceán nagy része nincs besorolva, és zajnak minősül (ϵ> 0,99).A sárga terület igen változó, reprodukálhatatlan klasztereloszlású.A ϵ csökkenésével a zaj nő.Az élesen növekvő zöldfelületet könyöknek nevezzük.Ez egy optimális régió.Bár a t-SNE valószínűséget használjuk, a tartományon belüli BC eltérés továbbra is felhasználható a megbízható klaszterezés meghatározására.A 6. ábra (A és B) használatával állítsa ϵ-t 0,39-re.Minél nagyobb a minimális szám, annál kisebb a valószínűsége annak, hogy elérjük a megbízható osztályozást lehetővé tévő ϵ-t, és annál nagyobb a 135-nél nagyobb értékű zöldfelület. Ennek a területnek a megnagyobbodása azt jelzi, hogy a könyököt nehezebb lesz megtalálni vagy nem létező.
A t-SNE paramétereinek beállítása után a talált klaszterek teljes számát fogja használni a kapcsolat (A) és a fürthöz hozzárendelt adatok százalékos aránya (B).A piros pont a lefedettség és a csatlakozás legjobb kombinációját jelzi.A minimális szám az ökológiával kapcsolatos minimális számnak megfelelően kerül beállításra.
A cikkhez kapcsolódó kiegészítő anyagokért lásd: http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ez egy nyílt hozzáférésű cikk, amelyet a Creative Commons Attribution License feltételei szerint terjesztenek.A cikk lehetővé teszi a korlátlan felhasználást, terjesztést és reprodukálást bármilyen médiában, feltéve, hogy az eredeti műre megfelelően hivatkoznak.
Megjegyzés: Csak azért kérjük meg e-mail címét, hogy az oldalra ajánlott személy tudja, hogy szeretné látni az e-mailt, és az nem spam.E-mail címeket nem rögzítünk.
Ez a kérdés annak tesztelésére szolgál, hogy Ön látogató-e, és megakadályozza az automatikus spamküldést.
A Tengerökológiai Globális Minisztérium eltökélt szándéka az összetett problémák megoldása, és felügyelet nélküli ML-t használ a közösségi struktúrák feltárására.
A Tengerökológiai Globális Minisztérium eltökélt szándéka az összetett problémák megoldása, és felügyelet nélküli ML-t használ a közösségi struktúrák feltárására.
Feladás időpontja: 2021. január 12