topimg

Ekoloģiskās sarežģītības noskaidrošana: neuzraudzīta mācīšanās nosaka globālo jūras ekoloģisko provinci

Tiek piedāvāta nepārraudzīta mācību metode, lai noteiktu globālās jūras ekoloģiskās provinces (ekoprovinces), pamatojoties uz planktona kopienas struktūru un barības vielu plūsmas datiem.Sistemātiskā integrētā ekoloģiskās provinces (SAGE) metode var identificēt ekoloģiskās provinces ļoti nelineāros ekosistēmu modeļos.Lai pielāgotos datu ne-Gausa kovariācijai, SAGE izmanto t nejaušu kaimiņu iegulšanu (t-SNE), lai samazinātu dimensiju.Ar trokšņu lietojumprogrammas palīdzību, kas balstīta uz blīvuma telpiskās klasterizācijas (DBSCAN) algoritmu, var identificēt vairāk nekā simts ekoloģisko apgabalu.Izmantojot savienojamības karti ar ekoloģiskām atšķirībām kā attāluma mērauklu, stabila apkopota ekoloģiskā province (AEP) tiek objektīvi noteikta, izmantojot ligzdotas ekoloģiskās provinces.Izmantojot AEP, tika izpētīta barības vielu piegādes ātruma kontrole kopienas struktūrā.Ekoprovince un AEP ir unikālas un var palīdzēt modelēt interpretāciju.Tie var atvieglot modeļu salīdzināšanu un var uzlabot jūras ekosistēmu izpratni un uzraudzību.
Provinces ir reģioni, kur sarežģīta bioģeogrāfija uz jūras vai sauszemes ir sakārtota saskaņotās un nozīmīgos apgabalos (1).Šīs provinces ir ļoti svarīgas vietu salīdzināšanai un kontrastēšanai, novērojumu raksturošanai, uzraudzībai un aizsardzībai.Sarežģītās un nelineārās mijiedarbības, kas rada šīs provinces, padara neuzraudzītas mašīnmācīšanās (ML) metodes ļoti piemērotas, lai objektīvi noteiktu provinces, jo datu kovariācija ir sarežģīta un nav Gausa.Šeit tiek piedāvāta ML metode, kas sistemātiski identificē unikālas jūras ekoloģiskās provinces (ekoprovinces) no Darvina globālā trīsdimensiju (3D) fiziskā/ekosistēmas modeļa (2).Termins “unikāls” tiek lietots, lai norādītu, ka identificētā teritorija pietiekami nepārklājas ar citām jomām.Šo metodi sauc par System Integrated Ecological Province (SAGE) metodi.Lai veiktu noderīgu klasifikāciju, algoritma metodei ir jānodrošina (i) globālā klasifikācija un (ii) daudzpakāpju analīze, ko var ligzdot/apkopot telpā un laikā (3).Šajā pētījumā vispirms tika piedāvāta SAGE metode un tika apspriestas identificētās ekoloģiskās provinces.Ekoprovinces var veicināt izpratni par faktoriem, kas kontrolē kopienas struktūru, sniegt noderīgu ieskatu uzraudzības stratēģijās un palīdzēt izsekot izmaiņām ekosistēmā.
Sauszemes provinces parasti klasificē pēc līdzībām klimatā (nokrišņi un temperatūra), augsnē, veģetācijā un faunā, un tās izmanto palīgpārvaldībai, bioloģiskās daudzveidības pētījumiem un slimību kontrolei (1, 4).Jūras provinces ir grūtāk definēt.Lielākā daļa organismu ir mikroskopiski, ar šķidruma robežām.Longhurst et al.(5) Nodrošināta viena no pirmajām Okeanogrāfijas ministrijas globālajām klasifikācijām, pamatojoties uz vides apstākļiem.Šo “Longhērstas” provinču definīcijā ir iekļauti tādi mainīgie lielumi kā sajaukšanās ātrums, stratifikācija un izstarojums, kā arī Longhērstas plašā pieredze kā jūras okeanogrāfam, kuram ir citi svarīgi apstākļi jūras ekosistēmām.Longhērsta ir plaši izmantota, piemēram, lai novērtētu primāro ražošanu un oglekļa plūsmas, palīdzētu zivsaimniecībai un plānotu in situ novērošanas aktivitātes (5–9).Lai objektīvāk definētu provinces, ir izmantotas tādas metodes kā neskaidra loģika un reģionālā nepārraudzīta klasterizācija/statistika (9-14).Šādu metožu mērķis ir identificēt nozīmīgas struktūras, kas pieejamajos novērojumu datos var identificēt provinces.Piemēram, dinamiskās jūras provinces (12) izmanto pašorganizējošas kartes, lai samazinātu troksni, un izmanto hierarhisku (uz kokiem balstītu) klasterizāciju, lai noteiktu jūras krāsu produktus, kas iegūti no reģionālajiem satelītiem [hlorofils a (Chl-a), normalizēts fluorescences līniju augstums un krāsaina izšķīdušā organiskā viela] un fiziskais lauks (jūras virsmas temperatūra un sāļums, absolūtā dinamiskā topogrāfija un jūras ledus).
Planktona kopienas struktūra rada bažas, jo tā ekoloģijai ir liela ietekme uz augstāku barības vielu līmeni, oglekļa absorbciju un klimatu.Tomēr joprojām ir sarežģīts un nenotverams mērķis noteikt globālu ekoloģisko provinci, pamatojoties uz planktona kopienas struktūru.Jūras krāsu satelīti potenciāli var sniegt ieskatu fitoplanktona rupjā graudainā klasifikācijā vai ieteikt funkcionālo grupu priekšrocības (15), taču pašlaik tie nevar sniegt detalizētu informāciju par kopienas struktūru.Nesenie pētījumi [piemēram, Tara Ocean (16)] sniedz nepieredzētus kopienas struktūras mērījumus;pašlaik ir tikai reti in situ novērojumi globālā mērogā (17).Iepriekšējie pētījumi lielā mērā ir noteikuši “bioģeoķīmisko provinci” (12, 14, 18), pamatojoties uz bioķīmisko līdzību noteikšanu (piemēram, primāro ražošanu, Chl un pieejamo gaismu).Šeit izvadei tiek izmantots skaitliskais modelis [Darvins (2)], un ekoloģiskā province tiek noteikta atbilstoši kopienas struktūrai un barības vielu plūsmai.Šajā pētījumā izmantotajam skaitliskajam modelim ir globāls pārklājums, un to var salīdzināt ar esošajiem lauka datiem (17) un attālās uzrādes laukiem (S1 piezīme).Šajā pētījumā izmantoto skaitlisko modeļu datu priekšrocība ir globālais pārklājums.Modeļa ekosistēma sastāv no 35 fitoplanktona sugām un 16 zooplanktona sugām (lūdzu, skatiet materiālus un metodes).Modeļu planktona tipi nelineāri mijiedarbojas ar ne-Gausa kovariācijas struktūrām, tāpēc vienkāršas diagnostikas metodes nav piemērotas, lai identificētu unikālus un konsekventus modeļus jaunās kopienas struktūrās.Šeit ieviestā SAGE metode nodrošina jaunu veidu, kā pārbaudīt sarežģītu Darvina modeļu izvadi.
Datu zinātnes/ML tehnoloģijas jaudīgās pārveidošanas iespējas var ļaut pārsvarā sarežģītiem modeļu risinājumiem atklāt sarežģītas, bet stabilas datu kovariācijas struktūras.Robusta metode ir definēta kā metode, kas var patiesi reproducēt rezultātus noteiktā kļūdu diapazonā.Pat vienkāršās sistēmās stabilu modeļu un signālu noteikšana var būt izaicinājums.Kamēr nav noteikts pamatojums, kas noved pie novērotā modeļa, jaunā sarežģītība var šķist sarežģīta/grūti atrisināma.Galvenais ekosistēmas sastāva noteikšanas process pēc būtības ir nelineārs.Nelineāras mijiedarbības esamība var sajaukt robustu klasifikāciju, tāpēc ir jāizvairās no metodēm, kas rada spēcīgus pieņēmumus par datu kovariācijas pamata statistisko sadalījumu.Augstas dimensijas un nelineāri dati ir izplatīti okeanogrāfijā, un tiem var būt kovariācijas struktūra ar sarežģītu, ne Gausa topoloģiju.Lai gan dati ar kovariācijas struktūru, kas nav Gausa, var kavēt stabilu klasifikāciju, SAGE metode ir jauna, jo tā ir izstrādāta, lai identificētu kopas ar patvaļīgām topoloģijām.
SAGE metodes mērķis ir objektīvi identificēt jaunos modeļus, kas var palīdzēt tālākai ekoloģiskās izpratnes uzlabošanai.Pēc uz klasteriem balstītas darbplūsmas, kas līdzīga (19), ekoloģiskās un barības vielu plūsmas mainīgie tiek izmantoti, lai noteiktu vienīgo datu kopu, ko sauc par ekoloģisko provinci.Šajā pētījumā piedāvātā SAGE metode (1. attēls) vispirms samazina dimensiju no 55 līdz 11 dimensijām, summējot a priori noteiktās planktona funkcionālās grupas (sk. Materiāli un metodes).Izmantojot t-gadījuma kaimiņu iegulšanas (t-SNE) metodi, izmērs tiek vēl vairāk samazināts, projicējot varbūtību 3D telpā.Neuzraudzīta klasterizācija var identificēt ekoloģiski tuvus apgabalus [uz blīvumu balstīta telpiskā klasterizācija (DBSCAN) uz troksni balstītiem lietojumiem].Gan t-SNE, gan DBSCAN ir piemērojami raksturīgajiem nelineārajiem ekosistēmas skaitliskā modeļa datiem.Pēc tam pārprojicējiet iegūto ekoloģisko provinci uz zemes.Ir identificētas vairāk nekā simts unikālu ekoloģisko provinču, kas piemērotas reģionālajai izpētei.Lai apsvērtu globāli konsekventu ekosistēmas modeli, SAGE metode tiek izmantota, lai apkopotu ekoloģiskās provinces apkopotās ekoloģiskās provincēs (AEP), lai uzlabotu ekoloģisko provinču efektivitāti.Apkopošanas līmeni (sauktu par “sarežģītību”) var pielāgot vajadzīgajam detalizācijas līmenim.Nosakiet stabila AEP minimālo sarežģītību.Atlases uzmanības centrā ir SAGE metode un vismazākās sarežģītības AEP gadījumu izpēte, lai noteiktu ārkārtas kopienas struktūras kontroli.Pēc tam modeļus var analizēt, lai sniegtu ekoloģisku ieskatu.Šeit ieviesto metodi var izmantot arī modeļu salīdzināšanai plašāk, piemēram, izvērtējot dažādos modeļos atrasto līdzīgu ekoloģisko provinču atrašanās vietas, lai izceltu atšķirības un līdzības, lai salīdzinātu modeļus.
(A) shematiska darbplūsmas diagramma ekoloģiskās provinces noteikšanai;izmantojot funkcionālās grupas summu, lai samazinātu sākotnējos 55 dimensiju datus līdz 11 dimensiju modeļa rezultātiem, tostarp septiņu funkcionālo/barojošo planktona biomasu un četrus barības vielu piegādes ātrumus.Nenozīmīga vērtība un izturīgs ledus segas laukums.Dati ir standartizēti un standartizēti.Sniedziet 11 dimensiju datus t-SNE algoritmam, lai izceltu statistiski līdzīgas funkciju kombinācijas.DBSCAN rūpīgi atlasīs klasteru, lai iestatītu parametra vērtību.Visbeidzot projicējiet datus atpakaļ platuma/garuma grāda projekcijā.Lūdzu, ņemiet vērā, ka šis process tiek atkārtots 10 reizes, jo, izmantojot t-SNE, var rasties neliela nejaušība.(B) paskaidro, kā iegūt AEP, atkārtojot (A) darbplūsmu 10 reizes.Katrai no šīm 10 implementācijām tika noteikta starpprovinču Bray-Curtis (BC) atšķirības matrica, pamatojoties uz 51 fitoplanktona tipa biomasu.Nosakiet BC atšķirību starp provincēm, no sarežģītības 1 AEP līdz pilnas sarežģītības pakāpei 115. BC etalonu nosaka Longhērstas province.
SAGE metode izmanto globālā 3D fiziskā/ekosistēmas skaitliskā modeļa izvadi, lai definētu ekoloģisko provinci [Dārvins (2);skatīt Materiāli un metodes un S1 piezīmi].Ekosistēmas sastāvdaļas sastāv no 35 fitoplanktona sugām un 16 zooplanktona sugām ar septiņām iepriekš noteiktām funkcionālajām grupām: prokariotiem un eikariotiem, kas pielāgoti videi ar zemu uzturvielu saturu, kokcīdijas ar kalcija karbonāta pārklājumu un smago slāpekļa fiksāciju Slāpekļa barības vielu (parasti trūkst) svarīgas barības vielas), ar silīcija pārklājumu, var izraisīt citu planktona fotosintēzi un ganību jaukto barības vielu flagellates un zooplanktona ganāmpulkus.Izmēra laidums ir no 0,6 līdz 2500 μm ekvivalentam sfēriskam diametram.Fitoplanktona izmēra un funkcionālās grupēšanas modeļa sadalījums atspoguļo vispārējos raksturlielumus, kas novēroti satelīta un in situ novērojumos (sk. S1 līdz S3 attēlus).Skaitliskā modeļa un novērotā okeāna līdzība norāda, ka modelī definētās provinces var būt piemērojamas in situ okeānam.Lūdzu, ņemiet vērā, ka šis modelis tver tikai noteiktu fitoplanktona daudzveidību un tikai noteiktus in situ okeāna fizikālās un ķīmiskās piespiešanas diapazonus.SAGE metode var ļaut cilvēkiem labāk izprast kopienas modeļa struktūras ļoti reģionālo kontroles mehānismu.
Iekļaujot katrā planktona funkcionālajā grupā tikai virsmas biomasas summu (ar vidējo laiku 20 gadi), var samazināt datu dimensiju.Pēc tam, kad iepriekšējie pētījumi parādīja to galveno lomu kopienas struktūras noteikšanā, tie ietvēra arī virsmas avota terminus barības vielu plūsmai (slāpekļa, dzelzs, fosfāta un silīcija skābes piegāde) [piemēram, (20, 21)].Funkcionālo grupu summēšana samazina problēmu no 55 (51 planktona un 4 barības vielu plūsmas) līdz 11 dimensijām.Šajā sākotnējā pētījumā algoritma noteikto skaitļošanas ierobežojumu dēļ dziļuma un laika mainīgums netika ņemts vērā.
SAGE metode spēj identificēt svarīgas attiecības starp nelineāriem procesiem un funkcionālās grupas biomasas un barības vielu plūsmas mijiedarbības galvenajām iezīmēm.Izmantojot 11-dimensiju datus, kas balstīti uz Eiklīda tālmācības metodēm (piemēram, K-vidēji), nevar iegūt uzticamas un reproducējamas provinces (19, 22).Tas ir tāpēc, ka galveno elementu, kas nosaka ekoloģisko provinci, kovariācijas pamata sadalījumā nav atrasta Gausa forma.Voronoi šūnu K-vidēji (taisnās līnijas) nevar saglabāt ne-Gausa pamata sadalījumu.
Septiņu planktona funkcionālo grupu biomasa un četras barības vielu plūsmas veido 11 dimensiju vektoru x.Tāpēc x ir vektora lauks modeļa režģī, kur katrs elements xi apzīmē 11 dimensiju vektoru, kas definēts modeļa horizontālajā režģī.Katrs indekss i unikāli identificē režģa punktu uz sfēras, kur (lon, lat) = (ϕi, θi).Ja modeļa režģa bloka biomasa ir mazāka par 1,2×10-3mg Chl/m3 vai ledus pārklājuma pakāpe pārsniedz 70%, tiek izmantots biomasas datu žurnāls un tas tiek izmests.Dati ir normalizēti un standartizēti, tāpēc visi dati ir diapazonā no [0 līdz 1], vidējais tiek noņemts un mērogots līdz vienību dispersijai.Tas tiek darīts, lai pazīmes (biomasa un barības vielu plūsma) neierobežotu kontrastu iespējamo vērtību diapazonā.Klasterizēšanai ir jāietver izmaiņu attiecības no galvenā varbūtības attāluma starp objektiem, nevis ģeogrāfiskā attāluma.Nosakot šos attālumus kvantitatīvi, parādās svarīgas pazīmes, bet nevajadzīgās detaļas tiek izmestas.No ekoloģiskā viedokļa tas ir nepieciešams, jo dažiem fitoplanktona veidiem ar mazu biomasu var būt lielāka bioģeoķīmiskā ietekme, piemēram, slāpekļa fiksācija ar diazotrofo baktēriju palīdzību.Standartizējot un normalizējot datus, šie kovariantu veidi tiks izcelti.
Uzsverot pazīmju tuvumu augstas dimensijas telpā zemas dimensijas attēlojumā, t-SNE algoritms tiek izmantots, lai padarītu skaidrākus esošos līdzīgus reģionus.Iepriekšējais darbs, kura mērķis bija izveidot dziļus neironu tīklus attālās uzrādes lietojumprogrammām, izmantoja t-SNE, kas pierādīja savu prasmi atdalīt galvenās funkcijas (23).Tas ir nepieciešams solis, lai noteiktu robustu klasterizāciju līdzekļu datos, vienlaikus izvairoties no nekonverģentiem risinājumiem (S2 piezīme).Izmantojot Gausa kodolus, t-SNE saglabā datu statistiskās īpašības, kartējot katru augstas dimensijas objektu uz punktu 3D fāzes telpā, tādējādi nodrošinot, ka līdzīgu objektu iespējamība augstajā un zemajā virzienā ir augsta augstā līmenī. izmēru telpa (24).Ņemot vērā N augstas dimensijas objektu kopu x1,…,xN, t-SNE algoritms samazina, samazinot Kullback-Leibler (KL) novirzi (25).KL atšķirība ir mērs, kas nosaka, cik varbūtības sadalījums atšķiras no otrā atsauces varbūtības sadalījuma, un tas var efektīvi novērtēt korelācijas iespēju starp augstas dimensijas pazīmju zemas dimensijas attēlojumiem.Ja xi ir i-tais objekts N-dimensionālajā telpā, xj ir j-tais objekts N-dimensiju telpā, yi ir i-tais objekts zemas dimensijas telpā un yj ir j-tais objekts zemajā telpā. -dimensiju telpa, tad t -SNE definē līdzības varbūtību ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) un dimensiju samazināšanas kopai. q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
2.A attēlā parādīts 11 dimensiju kombinācijas biomasas un barības vielu plūsmas vektoru samazināšanas efekts līdz 3D.T-SNE piemērošanas motivāciju var salīdzināt ar galveno komponentu analīzes (PCA) motivāciju, kas izmanto dispersijas atribūtu, lai uzsvērtu datu apgabalu/atribūtu, tādējādi samazinot dimensiju.Tika konstatēts, ka t-SNE metode ir pārāka par PCA, nodrošinot uzticamus un reproducējamus rezultātus eko-ministrijā (skatīt S2 piezīmi).Tas var būt tāpēc, ka PCA ortogonalitātes pieņēmums nav piemērots, lai noteiktu kritiskās mijiedarbības starp ļoti nelineārām interaktīvajām iezīmēm, jo ​​PCA koncentrējas uz lineārām kovariācijas struktūrām (26).Izmantojot attālās izpētes datus, Lunga et al.(27) ilustrē, kā izmantot SNE metodi, lai izceltu sarežģītas un nelineāras spektrālās iezīmes, kas atšķiras no Gausa sadalījuma.
(A) Modelēts barības vielu piegādes ātrums, fitoplanktona un zooplanktona funkcionālās grupas biomasa, kas iegūta ar t-SNE algoritmu un iekrāsota pa provincēm, izmantojot DBSCAN.Katrs punkts apzīmē punktu augstas dimensijas telpā, kā parādīts 6.B attēlā, lielākā daļa punktu tiek uzņemti.Vārpstas attiecas uz “t-SNE” 1., 2. un 3. izmēru. (B) Provinces ģeogrāfiskā projekcija, ko DBSCAN ir atradusi izcelsmes platuma-garuma režģī.Krāsa ir jāuzskata par jebkuru krāsu, bet tai jāatbilst (A).
Punkti t-SNE izkliedes diagrammā 2.A attēlā ir attiecīgi saistīti ar platumu un garumu.Ja divi punkti 2.A attēlā atrodas tuvu viens otram, tas ir tāpēc, ka to biomasa un barības vielu plūsmas ir līdzīgas, nevis ģeogrāfiskā tuvuma dēļ.2.A attēlā redzamās krāsas ir kopas, kas atklātas, izmantojot DBSCAN metodi (28).Meklējot blīvus novērojumus, DBSCAN algoritms izmanto attālumu 3D attēlojumā starp punktiem (ϵ = 0,39; informāciju par šo izvēli skatiet sadaļā Materiāli un metodes), un līdzīgu punktu skaits ir nepieciešams, lai definētu kopu (šeit 100 punkti, lūdzu, skatiet iepriekš).DBSCAN metode neizdara nekādus pieņēmumus par klasteru formu vai skaitu datos, kā parādīts tālāk:
3) Visiem punktiem, kas identificēti kā attāluma robežās, atkārtojiet 2. darbību iteratīvi, lai noteiktu kopas robežu.Ja punktu skaits ir lielāks par iestatīto minimālo vērtību, tas tiek apzīmēts kā klasteris.
Dati, kas neatbilst minimālajai klastera dalībnieka un attāluma ϵ metrikai, tiek uzskatīti par “troksni”, un tiem netiek piešķirta krāsa.DBSCAN ir ātrs un mērogojams algoritms ar O(n2) veiktspēju sliktākajā gadījumā.Pašreizējā analīzē tas faktiski nav nejaušs.Minimālo punktu skaitu nosaka ekspertu vērtējums.Pēc attāluma pielāgošanas rezultāts nav pietiekami stabils diapazonā no ≈±10.Šis attālums tiek iestatīts, izmantojot savienojamību (6.A attēls) un okeāna pārklājuma procentuālo daļu (6.B attēls).Savienojamība ir definēta kā salikts klasteru skaits, un tā ir jutīga pret parametru ϵ.Zemāka savienojamība norāda uz nepietiekamu pielāgošanu, mākslīgi grupējot reģionus.Augsta savienojamība norāda uz pārmērīgu uzstādīšanu.Ir iedomājams izmantot augstāku minimumu, bet, ja minimums pārsniedz ca, uzticamu risinājumu panākt nav iespējams.135 (Papildinformāciju skatiet sadaļā Materiāli un metodes).
2.A attēlā norādītās 115 kopas ir projicētas atpakaļ uz zemi 2.B attēlā.Katra krāsa atbilst saskaņotai bioģeoķīmisko un ekoloģisko faktoru kombinācijai, ko identificē DBSCAN.Kad kopas ir noteiktas, katra 2.A attēlā redzamā punkta saistība ar noteiktu platuma un garuma grādu tiek izmantota, lai projicētu kopas atpakaļ uz ģeogrāfisko apgabalu.2.B attēls to ilustrē ar tām pašām kopu krāsām kā 2.A attēlā.Līdzīgas krāsas nevajadzētu interpretēt kā ekoloģisku līdzību, jo tās tiek piešķirtas secībā, kādā algoritms atklāj klasterus.
Apgabals 2.B attēlā var būt kvalitatīvi līdzīgs okeāna fizikālajā un/vai bioģeoķīmijā noteiktajam apgabalam.Piemēram, dienvidu okeāna kopas ir zonas simetriskas, tajās parādās oligotrofiski virpuļi, un asā pāreja norāda uz pasātu vēju ietekmi.Piemēram, Klusā okeāna ekvatoriālajā daļā ir redzami dažādi ar pieaugumu saistīti reģioni.
Lai izprastu Ekoprovinces ekoloģisko vidi, klastera ekoloģijas novērtēšanai tika izmantota Bray-Curtis (BC) atšķirības indeksa (29) variācija.BC indikators ir statistikas dati, ko izmanto, lai kvantitatīvi noteiktu atšķirību kopienas struktūrā starp divām dažādām vietām.BC mērījums ir piemērojams 51 fitoplanktona un zooplanktona sugas biomasai BCninj = 1-2CninjSni + Snj
BCninj norāda uz līdzību starp kombināciju ni un kombināciju nj, kur Cninj ir viena biomasas veida minimālā vērtība, kas pastāv abās kombinācijās ni un nj, un Sni ir visu biomasu summa, kas pastāv abās kombinācijās ni un Snj.BC atšķirība ir līdzīga attāluma mēram, bet darbojas ne-eiklīda telpā, kas, visticamāk, ir piemērotāka ekoloģiskajiem datiem un to interpretācijai.
Katrai klasterim, kas norādīts 2.B attēlā, var novērtēt iekšprovinču un starpprovinču BC līdzību.BC atšķirība provincē attiecas uz starpību starp provinces vidējo vērtību un katru provinces punktu.Atšķirība starp BC provincēm attiecas uz līdzību starp vienu provinci un citām provincēm.3.A attēlā parādīta simetriska BC matrica (0, melns: pilnībā atbilst; 1, balts: pilnīgi atšķirīgs).Katra diagrammas līnija parāda datu modeli.3.B attēlā parādīta BC rezultātu ģeogrāfiskā nozīme 3.A attēlā katrai provincei.Provincē ar zemu uzturvērtību un zemu uzturvielu daudzumu 3.B attēlā redzams, ka lielu teritoriju simetrija ap ekvatoru un Indijas okeānu būtībā ir līdzīga, taču augstākie platuma grādi un augšupejas apgabali ievērojami atšķiras.
(A) BC atšķirības pakāpe, kas novērtēta katrai provincei, pamatojoties uz globālo 20 gadu vidējo globālo virsmas vidējo 51 planktonu.Ņemiet vērā paredzamo vērtību simetriju.(B) Kolonnas (vai rindas) telpiskā projekcija.Provincē distrofiskā lokā tika novērtēts BC līdzības mēra globālais sadalījums un tika novērtēts globālais 20 gadu vidējais rādītājs.Melns (BC = 0) nozīmē to pašu apgabalu, un balts (BC = 1) nozīmē, ka nav līdzības.
4.A attēlā parādīta BC atšķirība katrā provincē 2B attēlā.Noteikts, izmantojot klastera vidējās platības vidējo kombināciju un nosakot atšķirību starp BC un katra režģa punkta vidējo vērtību provincē, tas parāda, ka SAGE metode var labi atdalīt 51 sugu, pamatojoties uz ekoloģisko līdzību. modeļa dati.Kopējā vidējā klasteru BC atšķirība visiem 51 tipiem ir 0,102±0,0049.
(A, B un D) BC atšķirība provincē tiek novērtēta kā vidējā BC starpība starp katru tīkla punktu kopienu un vidējo provinci, un sarežģītība netiek samazināta.(2) Globālā vidējā provinču BC atšķirība ir 0,227±0,117.Šis ir šajā darbā ierosinātās uz ekoloģisko motivāciju balstītās klasifikācijas etalons [zaļā līnija (C)].(C) Vidējā provinču BC atšķirība: melnā līnija apzīmē provinču BC atšķirību, pieaugot sarežģītībai.2σ nāk no 10 ekoprovinces identifikācijas procesa atkārtojumiem.Attiecībā uz kopējo DBSCAN atklāto provinču sarežģītību (A) parāda, ka BC atšķirība provincē ir 0, 099, un (C) piedāvātā sarežģītības klasifikācija ir 12, kā rezultātā provincē BC atšķirība ir 0, 200.kā redzams attēlā.(D).
4.B attēlā ir izmantota 51 planktona tipa biomasa, lai attēlotu līdzvērtīgu BC atšķirību Longhērstas provincē.Katras provinces kopējais vidējais rādītājs ir 0,227, un režģa punktu standarta novirze attiecībā uz starpību BC provincē ir 0,046.Tas ir lielāks par 1.B attēlā norādīto kopu.Tā vietā, izmantojot septiņu funkcionālo grupu summu, vidējā sezonas BC atšķirība Longhērstā palielinājās līdz 0,232.
Globālā ekoprovinces karte sniedz sarežģītas detaļas par unikālu ekoloģisko mijiedarbību, un ir veikti uzlabojumi, izmantojot visu Longhērstas provinces ekosistēmas struktūru.Paredzams, ka Ekoloģijas ministrija sniegs ieskatu skaitliskā modeļa ekosistēmas kontroles procesā, un šis ieskats palīdzēs izzināt lauka darbus.Šī pētījuma vajadzībām nav iespējams pilnībā attēlot vairāk nekā simts provinces.Nākamā sadaļa iepazīstina ar SAGE metodi, kas apkopo provinces.
Viens no provinces mērķiem ir veicināt izpratni par provinces atrašanās vietu un pārvaldību.Lai noteiktu ārkārtas situācijas, 1.B attēlā redzamā metode ilustrē ekoloģiski līdzīgu provinču ligzdošanu.Ekoprovinces tiek grupētas, pamatojoties uz ekoloģisko līdzību, un šādu provinču grupēšanu sauc par AEP.Iestatiet regulējamu “sarežģītību”, pamatojoties uz kopējo aplūkojamo provinču skaitu.Termins “sarežģītība” tiek izmantots, jo tas ļauj pielāgot ārkārtas situāciju atribūtu līmeni.Lai definētu jēgpilnus apkopojumus, par etalonu tiek izmantota vidējā provinču BC atšķirība 0,227 no Longhērstas.Zem šī kritērija apvienotās provinces vairs netiek uzskatītas par noderīgām.
Kā parādīts 3.B attēlā, globālās ekoloģiskās provinces ir saskaņotas.Izmantojot starpprovinču BC atšķirības, var redzēt, ka dažas konfigurācijas ir ļoti “parastas”.Iedvesmojoties no ģenētikas un grafiku teorijas metodēm, “savienotie grafiki” tiek izmantoti vairāk nekā 100 provinču šķirošanai, pamatojoties uz tām līdzīgākajām provincēm."Savienojamības" metrika šeit tiek noteikta, izmantojot starpprovinču BC atšķirību (30).To provinču skaitu, kurās ir lielāka vieta vairāk nekā 100 provinču klasifikācijai, šeit var saukt par sarežģītību.AEP ir produkts, kas vairāk nekā 100 provinces klasificē kā dominējošākās/tuvākās ekoloģiskās provinces.Katra ekoloģiskā province tiek piešķirta tai dominējošajai/augsti saistītajai ekoloģiskajai provincei, kas tai ir vislīdzīgākā.Šis apkopojums, ko nosaka BC atšķirība, ļauj izmantot ligzdotu pieeju globālajai ekoloģijai.
Izvēlētā sarežģītība var būt jebkura vērtība no 1 līdz pilnīgai sarežģītībai, kas parādīta Fig.2A.Ar mazāku sarežģītību AEP var deģenerēties varbūtiskās dimensijas samazināšanas soļa (t-SNE) dēļ.Deģenerācija nozīmē, ka ekoloģiskās provinces var tikt piešķirtas dažādām AEP starp iterācijām, tādējādi mainot aptverto ģeogrāfisko apgabalu.4.C attēlā parādīta BC atšķirību izplatība provincēs AEP ar pieaugošo sarežģītību 10 implementācijās (attēls 1B attēlā).4.C attēlā 2σ (zilais apgabals) ir degradācijas rādītājs 10 realizācijās, un zaļā līnija apzīmē Longhērstas etalonu.Fakti ir pierādījuši, ka 12 sarežģītība var noturēt BC atšķirību provincē zem Longhērstas etalona visos ieviesumos un saglabāt salīdzinoši nelielu 2σ degradāciju.Rezumējot, minimālā ieteicamā sarežģītība ir 12 AEP, un vidējā provincē BC atšķirība, kas novērtēta, izmantojot 51 planktona tipu, ir 0,198±0,013, kā parādīts 4.D attēlā.Izmantojot septiņu planktona funkcionālo grupu summu, vidējā BC atšķirība provincē ir 2σ, nevis 0,198±0,004.Salīdzinājums starp BC atšķirībām, kas aprēķinātas ar septiņu funkcionālo grupu kopējo biomasu vai visu 51 planktona tipa biomasu, parāda, ka, lai gan SAGE metode ir piemērojama 51 dimensijas situācijai, tā ir septiņu funkcionālo grupu kopējai biomasai. Treniņiem.
Atkarībā no jebkura pētījuma mērķa var ņemt vērā dažādus sarežģītības līmeņus.Reģionālajiem pētījumiem var būt nepieciešama pilnīga sarežģītība (ti, visas 115 provinces).Kā piemēru un skaidrības labad apsveriet minimālo ieteicamo sarežģītības pakāpi 12.
Kā SAGE metodes lietderības piemērs šeit tiek izmantoti 12 AEP ar minimālo sarežģītību 12, lai izpētītu ārkārtas kopienas struktūras kontroli.5. attēlā ir parādītas ekoloģiskās atziņas, kas sagrupētas pēc AEP (no A līdz L): Redfīlda stehiometrijā ģeogrāfisko apmēru (5.C attēls), funkcionālās grupas biomasas sastāvu (5.A attēls) un barības vielu piegādi (5.B attēls) veic N Zoomed.Tiek parādīta attiecība (N:Si:P:Fe, 1:1:16:16×103).Pēdējā panelī P reizināts ar 16 un Fe reizināts ar 16 × 103, tāpēc joslu diagramma ir līdzvērtīga fitoplanktona uztura prasībām.
Provinces ir klasificētas 12 AEP no A līdz L. (A) Ekosistēmu biomasa (mgC/m3) 12 provincēs.(B) Izšķīdinātā neorganiskā slāpekļa (N), dzelzs (Fe), fosfāta (P) un silīcijskābes (Si) barības vielu plūsmas ātrums (mmol/m3 gadā).Fe un P attiecīgi reizina ar 16 un 16 × 103, lai sloksnes tiktu standartizētas atbilstoši fitoplanktona stehiometrijas prasībām.(C) Ņemiet vērā atšķirību starp polārajiem reģioniem, subtropu cikloniem un galvenajiem sezonālajiem / pieaugošajiem reģioniem.Monitoringa stacijas ir apzīmētas šādi: 1, SĒDEKĻI;2, ALOHA;3, stacija P;un 4, SIKSPARI.
Identificētais AEP ir unikāls.Ap ekvatoru ir zināma simetrija Atlantijas okeānā un Klusajā okeānā, un līdzīga, bet paplašināta teritorija pastāv Indijas okeānā.Daži AEP aptver kontinenta rietumu pusi, kas saistīta ar pacelšanos.Dienvidpola cirkumpolārā strāva tiek uzskatīta par lielu zonas iezīmi.Subtropu ciklons ir sarežģīta oligotrofo AEP sērija.Šajās provincēs ir acīmredzams pazīstamais biomasas atšķirību modelis starp planktona dominētajiem oligotrofiskajiem virpuļiem un kramaļģu bagātajiem polārajiem reģioniem.
AEP ar ļoti līdzīgu kopējo fitoplanktona biomasu var būt ļoti atšķirīgas kopienas struktūras un aptver dažādus ģeogrāfiskos apgabalus, piemēram, D, H un K, kuriem ir līdzīga kopējā fitoplanktona biomasa.AEP H galvenokārt pastāv Indijas okeāna ekvatoriālajā daļā, un tur ir vairāk diazotrofo baktēriju.AEP D ir sastopams vairākos baseinos, bet tas ir īpaši pamanāms Klusajā okeānā ap augstas ražas apgabaliem ap ekvatoriālo pacēlumu.Šīs Klusā okeāna provinces forma atgādina planētu viļņu vilcienu.AEP D ir maz diazobaktēriju un vairāk konusu.Salīdzinot ar pārējām divām provincēm, AEP K ir sastopams tikai Ziemeļu Ledus okeāna augstienēs, un tur ir vairāk kramaļģu un mazāk planktonu.Ir vērts atzīmēt, ka arī planktona daudzums šajos trīs reģionos ir ļoti atšķirīgs.Tostarp AEP K planktona pārpilnība ir salīdzinoši zema, savukārt AEP D un H ir salīdzinoši augsta.Tāpēc, neskatoties uz to biomasu (un līdz ar to līdzīgas Chl-a), šīs provinces ir diezgan atšķirīgas: provinču testēšana, kuras pamatā ir Chl, šīs atšķirības var neatklāt.
Ir arī acīmredzams, ka daži AEP ar ļoti atšķirīgu biomasu var būt līdzīgi fitoplanktona kopienas struktūras ziņā.Piemēram, tas ir redzams AEP D un E. Tie atrodas tuvu viens otram, un Klusajā okeānā AEP E ir tuvu augsti produktīvajam AEPJ.Tāpat nav skaidras saiknes starp fitoplanktona biomasu un zooplanktona pārpilnību.
AEP var saprast pēc tiem nodrošinātajām uzturvielām (5.B attēls).Kramaļģes pastāv tikai tur, kur ir pietiekami daudz silīcijskābes.Parasti, jo augstāks ir silīcijskābes daudzums, jo lielāka ir kramaļģu biomasa.Kramaļgliemenes var redzēt AEP A, J, K un L. Diatomu biomasas attiecību pret citu fitoplanktonu nosaka N, P un Fe attiecībā pret kramaļģu pieprasījumu.Piemēram, AEP L dominē kramaļģes.Salīdzinot ar citām uzturvielām, Si ir vislielākais piedāvājums.Turpretim, neskatoties uz augstāku produktivitāti, AEP J ir mazāk kramaļģu un mazāk silīcija piegādes (visas un attiecībā pret citām uzturvielām).
Diazonija baktērijām ir spēja fiksēt slāpekli, bet tās aug lēni (31).Tie pastāv līdzās citiem fitoplanktoniem, kur dzelzs un fosfora saturs ir pārmērīgs, salīdzinot ar pieprasījumu pēc barības vielām, kas nav diazonijs (20, 21).Ir vērts atzīmēt, ka diazotrofā biomasa ir salīdzinoši augsta un Fe un P piedāvājums ir salīdzinoši liels attiecībā pret N piegādi. Šādā veidā, lai gan kopējā biomasa AEP J ir lielāka, diazonija biomasa AEP H ir lielāks nekā J. Lūdzu, ņemiet vērā, ka AEP J un H ģeogrāfiski ļoti atšķiras un H atrodas Indijas okeāna ekvatoriālajā daļā.
Ja unikālā ekosistēmas struktūra nav sadalīta provincēs, atziņas, kas iegūtas no 12 AEP viszemākās sarežģītības modeļiem, nebūs tik skaidras.SAGE ģenerētais AEP atvieglo saskaņotu un vienlaicīgu sarežģītas un augstas dimensijas informācijas salīdzināšanu no ekosistēmu modeļiem.AEP efektīvi uzsver, kāpēc Chl nav laba un alternatīva metode, lai noteiktu kopienas struktūru vai zooplanktona pārpilnību augstākos barības vielu līmeņos.Sīkāka notiekošo pētījumu tēmu analīze ir ārpus šī raksta darbības jomas.SAGE metode nodrošina veidu, kā izpētīt citus modeļa mehānismus, kas ir vieglāk apstrādājami nekā skatīšanās no punkta uz punktu.
SAGE metode ir ierosināta, lai palīdzētu noskaidrot ārkārtīgi sarežģītus ekoloģiskos datus no globālajiem fizikālajiem / bioģeoķīmiskiem / ekosistēmu skaitliskiem modeļiem.Ekoloģisko provinci nosaka pārrobežu planktona funkcionālo grupu kopējā biomasa, t-SNE varbūtības dimensijas samazināšanas algoritma pielietojums un klasterizācija, izmantojot nepārraudzītu ML metodi DBSCAN.Starpprovinču BC atšķirības/grafu teorija ligzdošanas metodei tiek izmantota, lai iegūtu stabilu AEP, ko var izmantot globālai interpretācijai.Būvniecības ziņā Eco-Province un AEP ir unikāli.AEP ligzdošanu var pielāgot starp sākotnējās ekoloģiskās provinces pilno sarežģītību un ieteicamo minimālo 12 AEP slieksni.Ligzdošana un AEP minimālās sarežģītības noteikšana tiek uzskatīta par galvenajiem soļiem, jo ​​t-SNE varbūtība deģenerē AEP, kuru sarežģītība ir <12.SAGE metode ir globāla, un tās sarežģītība svārstās no> 100 AEP līdz 12. Vienkāršības labad pašlaik uzmanība tiek pievērsta 12 globālo AEP sarežģītībai.Turpmākajos pētījumos, jo īpaši reģionālajos pētījumos, mazāka globālo ekoprovinču telpiskā apakškopa var būt noderīga, un tos var apkopot mazākā apgabalā, lai izmantotu tās pašas ekoloģiskās atziņas, kas šeit apspriestas.Tajā sniegti ieteikumi, kā šīs ekoloģiskās provinces un no tām gūtās atziņas var izmantot tālākai ekoloģiskai izpratnei, atvieglot modeļu salīdzināšanu un, iespējams, uzlabot jūras ekosistēmu uzraudzību.
Ar SAGE metodi identificētā ekoloģiskā province un AEP ir balstīta uz skaitliskā modeļa datiem.Pēc definīcijas skaitliskais modelis ir vienkāršota struktūra, kas mēģina aptvert mērķa sistēmas būtību, un dažādiem modeļiem būs atšķirīgs planktona sadalījums.Šajā pētījumā izmantotais skaitliskais modelis nevar pilnībā aptvert dažus novērotos modeļus (piemēram, Chl aplēsēs ekvatoriālajam reģionam un dienvidu okeānam).Ir notverta tikai neliela daļa no daudzveidības reālajā okeānā, un mezo un submezoskalas nevar atrisināt, kas var ietekmēt barības vielu plūsmu un mazāka mēroga kopienas struktūru.Neskatoties uz šiem trūkumiem, izrādās, ka AEP ir ļoti noderīgs, palīdzot izprast sarežģītus modeļus.Novērtējot, kur ir atrodamas līdzīgas ekoloģiskās provinces, AEP nodrošina potenciālu skaitlisko modeļu salīdzināšanas rīku.Pašreizējais skaitliskais modelis atspoguļo vispārējo attālās izpētes fitoplanktona Chl-a koncentrācijas modeli un planktona lieluma un funkcionālās grupas sadalījumu (S1 piezīme un S1 attēls) (2, 32).
Kā parādīts kontūrlīnijā 0,1 mgChl-a/m-3, AEP ir sadalīts oligotrofajā zonā un mezotrofajā zonā (S1B attēls): AEP B, C, D, E, F un G ir oligotrofie apgabali, bet atlikušie apgabali ir atrodas Augstākā Chl-a.AEP parāda zināmu saraksti ar Longhērstas provinci (S3A attēls), piemēram, okeāna dienvidu daļu un Klusā okeāna ekvatoriālo daļu.Dažos reģionos AEP aptver vairākus Longhērstas reģionus un otrādi.Tā kā nodoms norobežot provinces šajā apgabalā un Longhērstā ir atšķirīgs, sagaidāms, ka būs atšķirības.Vairāki AEP Longhērstas provincē norāda, ka noteiktiem apgabaliem ar līdzīgu bioģeoķīmiju var būt ļoti atšķirīgas ekosistēmu struktūras.AEP uzrāda noteiktu atbilstību fiziskajiem stāvokļiem, kas atklāti, izmantojot nekontrolētu mācīšanos (19), piemēram, stāvos ar augstu augšupeju (piemēram, dienvidu okeānā un Klusā okeāna ekvatoriālajā daļā; S3, C un D attēls).Šīs atbilstības liecina, ka planktona kopienas struktūru spēcīgi ietekmē okeāna dinamika.Tādos apgabalos kā Ziemeļatlantija AEP šķērso fiziskas provinces.Mehānisms, kas izraisa šīs atšķirības, var ietvert tādus procesus kā putekļu transportēšana, kas var izraisīt pilnīgi atšķirīgas uztura programmas pat līdzīgos fiziskos apstākļos.
Ekoloģijas ministrija un AEP norādīja, ka tikai izmantojot Chl nevar identificēt ekoloģiskos komponentus, kā to jau ir sapratusi jūras ekoloģijas kopiena.Tas ir redzams AEP ar līdzīgu biomasu, bet ievērojami atšķirīgu ekoloģisko sastāvu (piemēram, D un E).Turpretim AEP, piemēram, D un K, ir ļoti atšķirīga biomasa, bet līdzīgs ekoloģiskais sastāvs.AEP uzsver, ka saistība starp biomasu, ekoloģisko sastāvu un zooplanktona pārpilnību ir sarežģīta.Piemēram, lai gan AEP J izceļas fitoplanktona un planktona biomasas ziņā, AEP A un L planktona biomasa ir līdzīga, bet A ir lielāka planktona pārpilnība.AEP uzsver, ka fitoplanktona biomasu (vai Chl) nevar izmantot zooplanktona biomasas prognozēšanai.Zooplanktons ir zivsaimniecības pārtikas ķēdes pamats, un precīzāki aprēķini var nodrošināt labāku resursu pārvaldību.Nākotnes jūras krāsu satelīti [piemēram, PACE (planktons, aerosols, mākonis un jūras ekosistēma)] var būt labāk novietoti, lai palīdzētu novērtēt fitoplanktona kopienas struktūru.AEP prognozēšanas izmantošana potenciāli var atvieglot zooplanktona novērtēšanu no kosmosa.Tādas metodes kā SAGE apvienojumā ar jaunām tehnoloģijām un arvien vairāk lauka datu, kas pieejami zemes patiesības apsekojumiem (piemēram, Tara un turpmākiem pētījumiem), var kopīgi spert soli ceļā uz satelītu ekosistēmu veselības uzraudzību.
SAGE metode nodrošina ērtu veidu, kā novērtēt dažus mehānismus, kas kontrolē provinces īpašības, piemēram, biomasu/Chl, neto primāro ražošanu un kopienas struktūru.Piemēram, kramaļģu relatīvo daudzumu nosaka Si, N, P un Fe piegādes nelīdzsvarotība attiecībā pret fitoplanktona stehiometriskajām prasībām.Pie līdzsvarota piegādes ātruma sabiedrībā dominē kramaļģes (L).Ja piegādes ātrums ir nelīdzsvarots (tas ir, silīcija piedāvājums ir mazāks nekā kramaļģu barības vielu pieprasījums), kramaļģes veido tikai nelielu daļu (K).Ja Fe un P piedāvājums pārsniedz N piegādi (piemēram, E un H), diazotrofās baktērijas strauji aug.Izmantojot AEP sniegto kontekstu, kontroles mehānismu izpēte kļūs lietderīgāka.
Ekoprovince un AEP ir apgabali ar līdzīgām kopienas struktūrām.Laika rindas no noteiktas vietas ekoloģiskās provinces vai AEP var uzskatīt par atskaites punktu, un tās var attēlot ekoloģiskās provinces vai AEP aptverto apgabalu.Šādas laikrindas nodrošina ilgtermiņa uz vietas esošās monitoringa stacijas.Ilgtermiņa in situ datu kopām joprojām būs neaprēķināma loma.No kopienas struktūras uzraudzības viedokļa SAGE metodi var uzskatīt par veidu, kā palīdzēt noteikt visnoderīgāko jauno vietņu atrašanās vietu.Piemēram, laikrinda no ilgtermiņa oligotrofo biotopu novērtējuma (ALOHA) atrodas oligotrofā apgabala AEP B (5.C attēls, 2. marķējums).Tā kā ALOHA atrodas tuvu cita AEP robežai, laikrindas var neatspoguļot visu apgabalu, kā tika ieteikts iepriekš (33).Tajā pašā AEP B laikrinda SEATS (Southeast Asian Time Series) atrodas Taivānas dienvidrietumos (34), tālāk no citu AEP robežām (5.C attēls, 1. iezīme), un to var izmantot kā labāku vietu uzraudzībai. AEPB.BATS (Bermuda Atlantic Time Series Study) laika rindas (5.C attēls, 4. marķējums) AEPC ir ļoti tuvu robežai starp AEP C un F, kas norāda, ka AEP C uzraudzība, izmantojot BATS laika rindas, var būt tieši problemātiska.Stacija P AEP J (attēls 5C, etiķete 3) atrodas tālu no AEP robežas, tāpēc tā ir reprezentatīvāka.Ekoprovince un AEP var palīdzēt izveidot uzraudzības sistēmu, kas piemērota globālo pārmaiņu novērtēšanai, jo provinču atļauja novērtēt, kur paraugu ņemšana uz vietas var sniegt galveno ieskatu.SAGE metodi var tālāk attīstīt, lai to izmantotu klimata datiem, lai novērtētu laika taupīšanas mainīgumu.
SAGE metodes panākumi tiek sasniegti, rūpīgi izmantojot datu zinātnes/ML metodes un jomai specifiskas zināšanas.Konkrēti, t-SNE tiek izmantots, lai veiktu dimensiju samazināšanu, kas saglabā augstas dimensijas datu kovariācijas struktūru un atvieglo kovariācijas topoloģijas vizualizāciju.Dati ir sakārtoti svītru un kovariāciju veidā (2.A attēls), kas norāda, ka tikai uz attālumu balstīti mērījumi (piemēram, K-vidējie) nav piemēroti, jo tie parasti izmanto Gausa (apļveida) sadalījumu (apskatīts S2 piezīmē). .DBSCAN metode ir piemērota jebkurai kovariācijas topoloģijai.Kamēr pievēršat uzmanību parametru iestatīšanai, var nodrošināt uzticamu identifikāciju.t-SNE algoritma skaitļošanas izmaksas ir augstas, kas ierobežo tā pašreizējo pielietojumu lielākam datu apjomam, kas nozīmē, ka to ir grūti piemērot dziļiem vai laika ziņā mainīgiem laukiem.Notiek darbs pie t-SNE mērogojamības.Tā kā KL attālumu ir viegli paralēlizēt, t-SNE algoritmam ir labs paplašināšanās potenciāls nākotnē (35).Līdz šim citas daudzsološas dimensiju samazināšanas metodes, kas var labāk samazināt izmēru, ietver vienotas kolektora tuvināšanas un projekcijas (UMAP) metodes, taču ir nepieciešams novērtējums okeāna datu kontekstā.Labākas mērogojamības nozīme ir, piemēram, globālo klimatu vai dažādu sarežģītības modeļu klasificēšana jauktā slānī.Apgabalus, kurus SAGE nevar klasificēt nevienā provincē, var uzskatīt par atlikušajiem melnajiem punktiem 2.A attēlā.Ģeogrāfiski šie apgabali galvenokārt atrodas ļoti sezonālos apgabalos, kas liecina, ka ekoloģisko provinču tveršana, kas laika gaitā mainās, nodrošinās labāku pārklājumu.
Lai konstruētu SAGE metodi, izmantotas sarežģītu sistēmu/datu zinātnes idejas, izmantojot spēju noteikt funkcionālo grupu kopas (iespēja atrasties ļoti tuvu 11 dimensiju telpā) un noteikt provinces.Šīs provinces attēlo konkrētus apjomus mūsu 3D t-SNE fāzes telpā.Līdzīgi Puankarē daļu var izmantot, lai novērtētu trajektorijas aizņemtās stāvokļa telpas “apjomu”, lai noteiktu “normālu” vai “haotisku” uzvedību (36).Statiskajam 11-dimensiju modeļa izvadei apjomu, kas aizņemts pēc datu konvertēšanas 3D fāzes telpā, var izskaidrot līdzīgi.Attiecības starp ģeogrāfisko apgabalu un apgabalu 3D fāzes telpā nav vienkāršas, taču tās var izskaidrot ar ekoloģisko līdzību.Šī iemesla dēļ priekšroka tiek dota tradicionālajam BC atšķirības mēram.
Turpmākajā darbā SAGE metode tiks atkārtoti izmantota sezonāli mainīgiem datiem, lai novērtētu identificēto provinču un AEP telpisko mainīgumu.Nākotnes mērķis ir izmantot šo metodi, lai palīdzētu noteikt, kuras provinces var noteikt, izmantojot satelīta mērījumus (piemēram, Chl-a, attālās uzrādes atstarošanas spēja un jūras virsmas temperatūra).Tas ļaus veikt attālās izpētes ekoloģisko komponentu novērtēšanu un ļoti elastīgu ekoloģisko provinču un to mainīguma uzraudzību.
Šī pētījuma mērķis ir ieviest SAGE metodi, kas definē ekoloģisko provinci, izmantojot tās unikālo planktona kopienas struktūru.Šeit tiks sniegta sīkāka informācija par fizikālo/bioģeoķīmisko/ekosistēmas modeli un t-SNE un DBSCAN algoritmu parametru izvēli.
Modeļa fizikālās sastāvdaļas iegūtas, novērtējot okeāna cirkulāciju un klimatu [ECCOv4;(37) globālā stāvokļa novērtējums, kas aprakstīts ar (38).Stāvokļa novērtējuma nominālā izšķirtspēja ir 1/5.Mazāko kvadrātu metode ar Lagranža reizinātāja metodi tiek izmantota, lai iegūtu sākotnējos un robežnosacījumus un iekšējā modeļa parametrus, kas koriģēti ar novērojumiem, tādējādi ģenerējot brīvas darbības MIT vispārējā cikla modeli (MITgcm) (39), modelis Pēc optimizācijas var iegūt rezultātus. izsekot un novērot.
Bioģeoķīmijai/ekosistēmai ir pilnīgāks apraksts (ti, vienādojumi un parametru vērtības) (2).Modelis fiksē C, N, P, Si un Fe cirkulāciju caur neorganiskiem un organiskiem dīķiem.Šeit izmantotajā versijā ir iekļautas 35 fitoplanktona sugas: 2 mikroprokariotu sugas un 2 mikroeukariotu sugas (piemērotas videi ar zemu uzturvielu saturu), 5 Cryptomonas sphaeroides sugas (ar kalcija karbonāta pārklājumu), 5 diazonija sugas ( Spēj fiksēt slāpekli, tāpēc tas nav ierobežots) izšķīdušā neorganiskā slāpekļa pieejamība), 11 kramaļģes (veido silīcija pārklājumu), 10 jaukta-veģetatīvie flagellāti (var fotosintēzēt un ēst citu planktonu) un 16 zooplanktons (ganīties uz cita planktona).Tās sauc par "bioģeoķīmiskajām funkcionālajām grupām", jo tām ir atšķirīga ietekme uz jūras bioģeoķīmiju (40, 41), un tās bieži izmanto novērošanas un modeļu pētījumos.Šajā modelī katra funkcionālā grupa sastāv no vairākiem dažāda izmēra planktoniem ar sfērisku diametru no 0,6 līdz 2500 μm.
Fitoplanktona augšanu, ganību un nogrimšanu ietekmējošie parametri ir saistīti ar izmēru, un starp sešām fitoplanktona funkcionālajām grupām ir īpašas atšķirības (32).Neskatoties uz dažādajiem fiziskajiem ietvariem, modeļa 51 planktona komponenta rezultāti ir izmantoti vairākos nesenos pētījumos (42-44).
No 1992. līdz 2011. gadam fizikālās/bioģeoķīmiskās/ekosistēmas savienojuma modelis darbojās 20 gadus.Modeļa iznākums ietver planktona biomasu, barības vielu koncentrāciju un barības vielu piegādes ātrumu (DIN, PO4, Si un Fe).Šajā pētījumā kā ekoloģiskās provinces ievade tika izmantota šo rezultātu 20 gadu vidējā vērtība.Chl, planktona biomasas un barības vielu koncentrācijas sadalījums un funkcionālo grupu sadalījums tiek salīdzināts ar satelīta un in situ novērojumiem [sk. (2, 44), S1 piezīmi un attēlu.S1 līdz S3].
SAGE metodei galvenais nejaušības avots nāk no t-SNE soļa.Nejaušība kavē atkārtojamību, kas nozīmē, ka rezultāti nav ticami.SAGE metode stingri pārbauda noturību, nosakot t-SNE un DBSCAN parametru kopu, kas atkārtojot var konsekventi identificēt kopas.t-SNE parametra “apjukuma” noteikšanu var saprast kā pakāpes noteikšanu, kādā kartēšanai no augstas uz zemām dimensijām ir jāņem vērā datu lokālās vai globālās īpašības.Sasniedza 400 un 300 iterāciju apjukumu.
Klasterizācijas algoritmam DBSCAN ir jānosaka klastera datu punktu minimālais izmērs un attāluma metrika.Minimālais skaits tiek noteikts ekspertu vadībā.Šīs zināšanas zina, kas atbilst pašreizējai skaitliskās modelēšanas sistēmai un izšķirtspējai.Minimālais skaits ir 100. Var apsvērt augstāku minimālo vērtību (mazāku par <135, pirms zaļās krāsas augšējā robeža kļūst plašāka), taču tā nevar aizstāt agregācijas metodi, kuras pamatā ir BC atšķirība.Savienojuma pakāpi (6.A attēls) izmanto, lai iestatītu parametru ϵ, kas veicina lielāku pārklājumu (6.B attēls).Savienojamība ir definēta kā salikts klasteru skaits, un tā ir jutīga pret parametru ϵ.Zemāka savienojamība norāda uz nepietiekamu pielāgošanu, mākslīgi grupējot reģionus.Augsta savienojamība norāda uz pārmērīgu uzstādīšanu.Pārmērīga uzstādīšana ir arī problemātiska, jo tā parāda, ka sākotnējie nejauši minējumi var novest pie nereproducējamiem rezultātiem.Starp šīm divām galējībām straujš pieaugums (parasti saukts par "elkoni") norāda uz labāko ϵ.6.A attēlā ir redzams straujš plato apgabala pieaugums (dzeltens, > 200 kopas), kam seko straujš samazinājums (zaļš, 100 kopas) līdz aptuveni 130, ko ieskauj ļoti maz kopu (zils, <60 kopas) ).Vismaz 100 zilajos apgabalos vai nu viens klasteris dominē visā okeānā (ϵ <0,42), vai arī lielākā daļa okeāna nav klasificēta un tiek uzskatīta par troksni (ϵ> 0,99).Dzeltenajam apgabalam ir ļoti mainīgs, nereproducējams klasteru sadalījums.Samazinoties ϵ, palielinās troksnis.Strauji pieaugošo zaļo zonu sauc par elkoni.Šis ir optimālais reģions.Lai gan tiek izmantota varbūtība t-SNE, BC atšķirības provincē joprojām var izmantot, lai noteiktu uzticamu klasterizāciju.Izmantojot 6. attēlu (A un B), iestatiet ϵ uz 0,39.Jo lielāks ir minimālais skaitlis, jo mazāka ir varbūtība sasniegt ϵ, kas nodrošina ticamu klasifikāciju, un jo lielāka ir zaļā zona ar vērtību, kas lielāka par 135. Šīs zonas palielinājums norāda, ka elkoni būs grūtāk atrast vai tas nebūs iespējams. esošu.
Pēc t-SNE parametru iestatīšanas kopējais atrasto klasteru skaits tiks izmantots kā savienojamības (A) un klasterim piešķirto datu procentuālā attiecība (B).Sarkanais punkts norāda uz labāko pārklājuma un savienojamības kombināciju.Minimālais skaits tiek noteikts atbilstoši minimālajam skaitam, kas saistīts ar ekoloģiju.
Lai iegūtu papildmateriālus šim rakstam, lūdzu, skatiet vietni http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1.
Šis ir atvērtas piekļuves raksts, kas tiek izplatīts saskaņā ar Creative Commons attiecinājuma licences noteikumiem.Rakstā ir atļauts neierobežoti izmantot, izplatīt un reproducēt jebkurā datu nesējā ar nosacījumu, ka oriģinālais darbs ir pareizi citēts.
Piezīme. Mēs lūdzam jūs norādīt tikai savu e-pasta adresi, lai lapai ieteiktā persona zinātu, ka vēlaties, lai tā redz e-pastu un ka tas nav mēstule.Mēs neuzņemsim nevienu e-pasta adresi.
Šis jautājums tiek izmantots, lai pārbaudītu, vai esat apmeklētājs, un novērstu automātisku surogātpasta iesniegšanu.
Globālā jūras ekoloģijas ministrija ir apņēmusies risināt sarežģītas problēmas un izmanto bez uzraudzības ML, lai izpētītu kopienas struktūras.
Globālā jūras ekoloģijas ministrija ir apņēmusies risināt sarežģītas problēmas un izmanto bez uzraudzības ML, lai izpētītu kopienas struktūras.


Izlikšanas laiks: 12. janvāris 2021. gada laikā