Metode pembelajaran tanpa pengawasan diusulake kanggo nemtokake provinsi ekologi laut global (eko-provinsi) adhedhasar struktur komunitas plankton lan data fluks nutrisi.Metode systematic integrated ecological province (SAGE) bisa ngenali provinsi ekologis ing model ekosistem nonlinier banget.Kanggo adaptasi karo kovarian data non-Gaussian, SAGE nggunakake t embedding tetangga acak (t-SNE) kanggo nyuda dimensi.Kanthi bantuan aplikasi gangguan adhedhasar algoritma clustering spasial berbasis kepadatan (DBSCAN), luwih saka satus provinsi ekologis bisa diidentifikasi.Nggunakake peta konektivitas kanthi beda ekologis minangka ukuran jarak, provinsi ekologi gabungan (AEP) sing kuat ditemtokake kanthi objektif liwat provinsi ekologis bersarang.Nggunakake AEP, kontrol tingkat pasokan nutrisi ing struktur komunitas diteliti.Eko-provinsi lan AEP unik lan bisa mbantu interpretasi model.Padha bisa nggampangake mbandhingake antarane model lan bisa nambah pangerten lan ngawasi ekosistem segara.
Provinsi minangka wilayah sing biogeografi kompleks ing segara utawa daratan disusun dadi wilayah sing koheren lan migunani (1).Provinsi iki penting banget kanggo mbandhingake lan mbedakake lokasi, nggambarake pengamatan, pemantauan lan perlindungan.Interaksi kompleks lan non-linear sing ngasilake provinsi kasebut ndadekake metode machine learning (ML) sing ora diawasi cocok banget kanggo nemtokake provinsi kanthi objektif, amarga kovarian ing data kasebut kompleks lan non-Gaussian.Ing kene, metode ML diusulake, sing kanthi sistematis ngenali provinsi ekologi laut sing unik (provinsi eko) saka model fisik/ekosistem global Darwin telung dimensi (3D) (2).Istilah "unik" digunakake kanggo nunjukake yen wilayah sing diidentifikasi ora cukup tumpang tindih karo wilayah liyane.Cara iki diarani System Integrated Ecological Province (SAGE).Kanggo nindakake klasifikasi sing migunani, metode algoritma kudu ngidini (i) klasifikasi global lan (ii) analisis multi-skala sing bisa disusun / dikumpulake ing papan lan wektu (3).Ing panliten iki, metode SAGE pisanan diusulake lan provinsi ekologis sing diidentifikasi dibahas.Eko-provinsi bisa ningkatake pangerten babagan faktor sing ngontrol struktur komunitas, menehi wawasan sing migunani kanggo strategi ngawasi, lan mbantu nglacak owah-owahan ing ekosistem.
Provinsi terestrial biasane diklasifikasikake miturut persamaan iklim (udhara lan suhu), lemah, vegetasi, lan fauna, lan digunakake kanggo manajemen tambahan, riset keanekaragaman hayati, lan kontrol penyakit (1, 4).Provinsi laut luwih angel ditetepake.Umume organisme mikroskopis, kanthi wates cairan.Longhurst et al.(5) Nyedhiyakake salah sawijining klasifikasi global pisanan saka Kementerian Oseanografi adhedhasar kahanan lingkungan.Dhéfinisi provinsi "Longhurst" iki kalebu variabel kayata tingkat pencampuran, stratifikasi, lan iradiasi, uga pengalaman ekstensif Longhurst minangka oseanografer laut, sing nduweni kondisi penting liyane kanggo ekosistem laut.Longhurst wis digunakake sacara ekstensif, contone, kanggo netepake produksi utami lan fluks karbon, bantuan perikanan, lan rencana aktivitas observasi in situ (5-9).Kanggo nemtokake provinsi kanthi luwih objektif, cara kayata logika fuzzy lan clustering/statistik tanpa pengawasan regional wis digunakake (9-14).Tujuan saka metode kasebut yaiku kanggo ngenali struktur sing migunani sing bisa ngenali provinsi ing data observasi sing kasedhiya.Contone, provinsi segara dinamis (12) nggunakake peta swa-organisasi kanggo ngurangi gangguan, lan nggunakake hirarkis (basis wit) clustering kanggo nemtokake produk werna laut asalé saka satelit regional [chlorophyll a (Chl-a), normalisasi dhuwur garis Fluoresensi lan bahan organik terlarut berwarna] lan lapangan fisik (suhu permukaan laut lan salinitas, topografi dinamis absolut lan es laut).
Struktur komunitas plankton dadi prihatin amarga ekologi duweni pengaruh gedhe marang tingkat nutrisi sing luwih dhuwur, penyerapan karbon lan iklim.Nanging, isih dadi tujuan sing tantangan lan angel dipahami kanggo nemtokake provinsi ekologi global adhedhasar struktur komunitas plankton.Satelit warna laut duweni potensi bisa menehi katrangan babagan klasifikasi fitoplankton sing kasar utawa menehi saran babagan kaluwihan gugus fungsi (15), nanging saiki ora bisa menehi informasi rinci babagan struktur komunitas.Survei anyar [eg Tara Ocean (16)] nyedhiyakake pangukuran struktur komunitas sing durung tau ana sadurunge;saiki, ana mung jarang pengamatan ing-situ ing skala global (17).Pasinaon sadurunge wis umume nemtokake "Provinsi Biogeokimia" (12, 14, 18) adhedhasar penentuan persamaan biokimia (kayata produksi primer, Chl lan cahya sing kasedhiya).Ing kene, model numerik digunakake kanggo ngasilake [Darwin(2)], lan provinsi ekologis ditemtokake miturut struktur komunitas lan fluks nutrisi.Model numerik sing digunakake ing panliten iki nduweni cakupan global lan bisa dibandhingake karo data lapangan sing ana (17) lan lapangan penginderaan jarak jauh (Cathetan S1).Data model numerik sing digunakake ing panliten iki nduweni kaluwihan kanggo cakupan global.Ekosistem model kasusun saka 35 spesies fitoplankton lan 16 spesies zooplankton (waca bahan lan metode).Jinis plankton model interaksi nonlinier karo struktur kovarian non-Gaussian, supaya cara diagnostik prasaja ora cocok kanggo ngenali pola unik lan konsisten ing struktur komunitas berkembang.Cara SAGE sing dikenalake ing kene nyedhiyakake cara anyar kanggo mriksa output model Darwin sing kompleks.
Kapabilitas transformatif sing kuat saka ilmu data/teknologi ML bisa ngaktifake solusi model sing rumit banget kanggo mbukak struktur sing rumit nanging kuat ing kovarian data.Cara sing kuat ditetepake minangka cara sing bisa ngasilake asil kanthi bener ing sawetara kesalahan tartamtu.Malah ing sistem sing prasaja, nemtokake pola lan sinyal sing kuat bisa dadi tantangan.Nganti alasan sing nyebabake pola sing diamati ditemtokake, kerumitan sing muncul bisa uga katon rumit / angel diatasi.Proses kunci kanggo nyetel komposisi ekosistem yaiku nonlinier.Anane interaksi non-linear bisa mbingungake klasifikasi sing kuat, mula kudu dihindari metode sing nggawe asumsi sing kuat babagan distribusi statistik dhasar kovarian data.Data dimensi dhuwur lan nonlinier umum ing oseanografi lan bisa uga duwe struktur kovarian kanthi topologi non-Gaussian sing kompleks.Sanajan data kanthi struktur kovarian non-Gaussian bisa ngalang-alangi klasifikasi sing kuat, metode SAGE minangka novel amarga dirancang kanggo ngenali kluster kanthi topologi arbitrer.
Tujuan saka metode SAGE yaiku kanthi objektif ngenali pola sing muncul sing bisa mbantu pemahaman ekologis luwih lanjut.Sawise alur kerja adhedhasar kluster sing padha karo (19), variabel fluks ekologis lan nutrisi digunakake kanggo nemtokake siji-sijine kluster ing data kasebut, sing diarani provinsi ekologis.Cara SAGE sing diusulake ing panliten iki (Gambar 1) pisanan nyuda dimensi saka 55 dadi 11 dimensi kanthi nyimpulake gugus fungsi plankton sing ditetepake apriori (pirsani Bahan lan Metode).Nggunakake metode t-random neighbor embedding (t-SNE), ukurane luwih suda kanthi nggambarake kemungkinan menyang ruang 3D.Pengelompokan sing ora diawasi bisa ngenali wilayah sing cedhak kanthi ekologis [kluster spasial berbasis kepadatan (DBSCAN) kanggo aplikasi basis swara].T-SNE lan DBSCAN bisa ditrapake kanggo data model numerik ekosistem non-linear.Banjur reproject provinsi ekologis asil menyang bumi.Luwih saka satus provinsi ekologi unik wis diidentifikasi, cocok kanggo riset regional.Kanggo nimbang model ekosistem sing konsisten sacara global, metode SAGE digunakake kanggo nggabungake provinsi ekologis dadi provinsi ekologi gabungan (AEP) kanggo ningkatake efektifitas provinsi ekologis.Tingkat agregasi (disebut "kerumitan") bisa diatur menyang tingkat rinci sing dibutuhake.Nemtokake kerumitan minimal saka AEP sing kuat.Fokus pilihan yaiku metode SAGE lan njelajah kasus AEP kerumitan paling cilik kanggo nemtokake kontrol struktur komunitas darurat.Pola kasebut banjur bisa dianalisis kanggo menehi wawasan ekologis.Cara sing dikenalake ing kene uga bisa digunakake kanggo mbandhingake model kanthi luwih akeh, contone, kanthi ngevaluasi lokasi provinsi ekologis sing padha sing ditemokake ing model sing beda-beda kanggo nyorot beda lan mirip, supaya bisa mbandhingake model.
(A) Diagram skematik alur kerja kanggo nemtokake provinsi ekologis;nggunakake jumlah ing gugus fungsi kanggo ngurangi data asli 55-dimensi menyang output model 11-dimensi, kalebu biomas saka pitung fungsi / plankton gizi lan papat tarif sumber nutrisi.Nilai diabaikan lan area tutup es sing tahan lama.Data wis standar lan standar.Nyedhiyani data 11-dimensi menyang algoritma t-SNE kanggo nyorot kombinasi fitur sing padha karo statistik.DBSCAN bakal kasebut kanthi teliti, milih kluster kanggo nyetel nilai parameter.Pungkasan proyeksi data bali menyang proyeksi lintang / bujur.Wigati dimangerteni manawa proses iki bola-bali kaping 10 amarga keacakan sing sithik bisa diasilake kanthi nggunakake t-SNE.(B) nerangake carane entuk AEP kanthi mbaleni alur kerja ing (A) kaping 10.Kanggo saben 10 implementasi kasebut, matriks dissimilarity Bray-Curtis (BC) antar provinsi ditemtokake adhedhasar biomassa 51 jinis fitoplankton.Nemtokake prabédan SM antarane provinsi, saka kerumitan 1 AEP kanggo kerumitan lengkap 115. BC pathokan disetel dening Longhurst Province.
Cara SAGE nggunakake output model numerik fisik/ekosistem 3D global kanggo nemtokake provinsi ekologis [Darwin (2);deleng Materi lan Metode lan Cathetan S1].Komponen ekosistem kasebut dumadi saka 35 spesies fitoplankton lan 16 spesies zooplankton, kanthi pitung gugus fungsi sing wis ditemtokake: prokariota lan eukariota sing diadaptasi ing lingkungan sing kurang nutrisi, coccidia kanthi lapisan kalsium karbonat, lan fiksasi nitrogen abot Nutrisi nitrogen (biasane ora ana. nutrisi penting), kanthi tutup silika, bisa nggawe fotosintesis plankton liyane lan angonan flagellates nutrisi campuran lan zooplankton herders.Ukuran span punika 0,6 kanggo 2500μm padha karo diameteripun bunder.Distribusi model ukuran fitoplankton lan pengelompokan fungsional nggambarake karakteristik sakabèhé sing katon ing observasi satelit lan in-situ (pirsani Gambar S1 nganti S3).Persamaan antarane model numerik lan samudra sing diamati nuduhake yen provinsi sing ditetepake model kasebut bisa ditrapake kanggo samudra in-situ.Wigati dimangerteni manawa model iki mung njupuk macem-macem fitoplankton tartamtu, lan mung sawetara fisik lan kimia tartamtu saka segara in situ.Cara SAGE bisa ngidini wong luwih ngerti mekanisme kontrol regional saka struktur komunitas model.
Kanthi mung nyakup jumlah biomassa permukaan (kanthi wektu rata-rata 20 taun) ing saben gugus fungsi plankton, dimensi data bisa dikurangi.Sawisé pasinaon sadurungé nuduhake peran kunci ing nyetel struktur komunitas, uga kalebu istilah sumber lumahing kanggo fluks nutrisi (supply nitrogen, wesi, fosfat lan asam silicic) [eg (20, 21)].Penjumlahan gugus fungsi nyuda masalah saka 55 (51 plankton lan 4 fluks nutrisi) dadi 11 dimensi.Ing panliten awal iki, amarga watesan komputasi sing ditindakake dening algoritma, kedalaman lan variasi wektu ora dianggep.
Cara SAGE bisa ngenali hubungan penting antarane proses nonlinier lan fitur kunci interaksi antarane biomas gugus fungsional lan fluks nutrisi.Nggunakake data 11 dimensi adhedhasar metode pembelajaran jarak Euclidean (kayata K-means) ora bisa entuk provinsi sing bisa dipercaya lan bisa direproduksi (19, 22).Iki amarga ora ana wujud Gaussian sing ditemokake ing distribusi dhasar kovarian unsur-unsur kunci sing nemtokake provinsi ekologis.K-means saka sel Voronoi (garis lurus) ora bisa nahan distribusi dhasar non-Gaussian.
Biomassa pitung gugus fungsi plankton lan papat fluks nutrisi mbentuk vektor 11 dimensi x.Mulane, x minangka lapangan vektor ing kothak model, ing ngendi saben unsur xi nggambarake vektor 11 dimensi sing ditetepake ing kothak horisontal model.Saben indeks i kanthi unik ngenali titik kothak ing bal, ing ngendi (lon, lat) = (ϕi, θi).Yen biomas saka unit kothak model kurang saka 1.2 × 10-3mg Chl / m3 utawa tingkat jangkoan es ngluwihi 70%, log data biomas digunakake lan dibuwang.Data kasebut dinormalisasi lan distandarisasi, saengga kabeh data ana ing kisaran [0 nganti 1], rata-rata dibuwang lan diskalakake dadi varians unit.Iki ditindakake supaya fitur (biomas lan fluks nutrisi) ora diwatesi kanthi kontras ing sawetara nilai sing bisa ditindakake.Clustering kudu njupuk hubungan owah-owahan saka jarak kemungkinan tombol antarane fitur tinimbang jarak geografis.Kanthi ngitung jarak kasebut, fitur penting muncul, dene rincian sing ora perlu dibuwang.Saka sudut pandang ekologis, iki perlu amarga sawetara jinis fitoplankton kanthi biomassa cilik bisa uga duwe efek biogeokimia sing luwih gedhe, kayata fiksasi nitrogen dening bakteri diazotrofik.Nalika standarisasi lan normalake data, jinis kovariat kasebut bakal disorot.
Kanthi nandheske jarak fitur ing ruang dimensi dhuwur ing perwakilan dimensi kurang, algoritma t-SNE digunakake kanggo nggawe wilayah sing padha luwih cetha.Karya sadurunge sing dituju kanggo mbangun jaringan syaraf jero kanggo aplikasi penginderaan jauh sing digunakake t-SNE, sing mbuktekake katrampilan kanggo misahake fitur utama (23).Iki minangka langkah sing perlu kanggo ngenali clustering sing kuat ing data fitur nalika ngindhari solusi non-konvergen (cathetan S2).Nggunakake kernel Gaussian, t-SNE ngreksa sifat statistik data kanthi pemetaan saben obyek dimensi dhuwur menyang titik ing ruang fase 3D, saéngga mesthekake yen kemungkinan obyek sing padha ing arah dhuwur lan ngisor dhuwur ing dhuwur- spasi dimensi (24).Diwenehi sakumpulan N obyek dimensi dhuwur x1,…,xN, algoritma t-SNE nyuda kanthi minimalake bedane Kullback-Leibler (KL) (25).KL divergence punika ukuran carane beda distribusi kemungkinan saka distribusi kemungkinan referensi kapindho, lan èfèktif bisa ngira-ngira kamungkinan korélasi antarane perwakilan kurang dimensi fitur dhuwur-dimensi.Yen xi minangka obyek i-th ing ruang dimensi N, xj minangka obyek j-th ing ruang dimensi N, yi minangka obyek i-th ing ruang dimensi-end, lan yj minangka obyek j-th ing ruang cilik. -ruang dimensi, banjur t -SNE nemtokake kemungkinan mirip ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), lan kanggo set pengurangan dimensi q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Gambar 2A nggambarake efek nyuda biomassa lan vektor fluks nutrisi saka kombinasi 11 dimensi dadi 3D.Motivasi nglamar t-SNE bisa dibandhingake karo motivasi analisis komponen pokok (PCA), sing nggunakake atribut varian kanggo nandheske area / atribut data, saengga nyuda dimensi.Cara t-SNE ditemokake luwih unggul tinimbang PCA ing nyedhiyakake asil sing bisa dipercaya lan bisa direproduksi kanggo Eco-Ministry (pirsani Cathetan S2).Iki bisa uga amarga asumsi orthogonality PCA ora cocok kanggo ngenali interaksi kritis antarane fitur interaktif banget nonlinear, amarga PCA fokus ing struktur kovarian linear (26).Nggunakake data penginderaan jauh, Lunga et al.(27) nggambarake carane nggunakake cara SNE kanggo nyorot fitur spektral Komplek lan nonlinear sing nyimpang saka distribusi Gaussian.
(A) Tingkat pasokan nutrisi sing dimodelake, biomassa klompok fungsional fitoplankton lan zooplankton sing digambar kanthi algoritma t-SNE lan diwarnai miturut provinsi nggunakake DBSCAN.Saben titik nggantosi titik ing papan dhuwur-dimensi, minangka ditampilake ing Figure 6B, paling TCTerms dijupuk.Shafts nuduhake "t-SNE" ukuran 1, 2 lan 3. (B) Proyeksi geografis provinsi ditemokaké dening DBSCAN ing kothak lintang-bujur asal.Werna kudu dianggep minangka werna apa wae, nanging kudu cocog karo (A).
Titik ing plot sebar t-SNE ing Gambar 2A digandhengake karo garis lintang lan bujur.Yen loro titik ing Figure 2A cedhak siji liyane, iku amarga biomas lan fluks nutrisi padha, ora amarga jarak geografis.Werna ing Gambar 2A minangka klompok sing ditemokake nggunakake metode DBSCAN (28).Nalika nggoleki pengamatan sing padhet, algoritma DBSCAN nggunakake jarak ing perwakilan 3D antarane titik (ϵ = 0,39; kanggo informasi babagan pilihan iki, deleng Bahan lan Metode), lan jumlah titik sing padha dibutuhake kanggo nemtokake kluster (kene) 100 poin, deleng ndhuwur).Cara DBSCAN ora nggawe asumsi babagan wangun utawa jumlah klompok ing data, kaya sing ditampilake ing ngisor iki:
3) Kanggo kabeh TCTerms dikenali minangka ing kadohan ing, baleni langkah 2 iteratively kanggo nemtokake wates cluster.Yen jumlah poin luwih gedhe tinimbang nilai minimal sing disetel, ditunjuk minangka kluster.
Data sing ora cocog karo anggota kluster minimal lan metrik jarak ϵ dianggep "gangguan" lan ora diwenehi warna.DBSCAN minangka algoritma sing cepet lan bisa diukur kanthi kinerja O (n2) ing kasus sing paling ala.Kanggo analisis saiki, iku ora bener acak.Jumlah poin minimal ditemtokake dening evaluasi pakar.Sawise nyetel jarak sawise, asil ora cukup stabil ing sawetara ≈±10.Jarak iki disetel nggunakake konektivitas (Gambar 6A) lan persentase jangkoan segara (Gambar 6B).Konektivitas ditetepake minangka jumlah gabungan klompok lan sensitif marang parameter ϵ.Konektivitas sing luwih murah nuduhake pas sing ora cukup, nglumpukake wilayah kanthi artifisial.Konektivitas dhuwur nuduhake overfitting.Bisa dibayangake nggunakake minimal sing luwih dhuwur, nanging yen minimal ngluwihi ca, ora bisa entuk solusi sing bisa dipercaya.135 (Kanggo rincian liyane, waca Bahan lan Metode).
115 kluster sing diidentifikasi ing Gambar 2A digambarake bali menyang bumi ing Gambar 2B.Saben warna cocog karo kombinasi faktor biogeokimia lan ekologis sing diidentifikasi dening DBSCAN.Sawise kluster ditemtokake, asosiasi saben titik ing Gambar 2A kanthi garis lintang lan bujur tartamtu digunakake kanggo proyek kluster bali menyang wilayah geografis.Gambar 2B nggambarake iki kanthi werna kluster sing padha karo Gambar 2A.Werna sing padha ora kudu diinterpretasikake minangka mirip ekologis, amarga ditugasake miturut urutan klompok sing ditemokake dening algoritma.
Wilayah ing Gambar 2B bisa sacara kualitatif padha karo wilayah sing mapan ing fisik lan/utawa biogeokimia samudra.Contone, kluster ing Samudra Kidul zona simetris, kanthi vorteks oligotrofik muncul, lan transisi sing cetha nuduhake pengaruh angin dagang.Contone, ing Pasifik khatulistiwa, macem-macem wilayah sing ana hubungane karo munggah katon.
Kanggo mangerteni lingkungan ekologis Eko-Provinsi, variasi indeks prabédan Bray-Curtis (BC) (29) digunakake kanggo ngevaluasi ekologi ing kluster kasebut.Indikator BC minangka data statistik sing digunakake kanggo ngitung bedane struktur komunitas antarane rong situs sing beda.Pangukuran BC ditrapake kanggo biomassa 51 spesies fitoplankton lan zooplankton BCninj = 1-2CninjSni + Snj
BCninj nuduhake podho antarane kombinasi ni lan kombinasi nj, ngendi Cninj punika Nilai minimal saka siji jinis biomas sing ana ing loro kombinasi ni lan nj, lan Sni nggantosi jumlah kabeh biomas sing ana ing loro kombinasi ni lan Snj.Bentenipun SM padha karo ukuran jarak, nanging makaryakke ing papan non-Euclidean, kang kamungkinan bakal luwih cocok kanggo data ekologis lan interpretasi.
Kanggo saben kluster sing diidentifikasi ing Gambar 2B, podho BC intra-provinsi lan antarprovinsi bisa ditaksir.Bentenipun SM ing provinsi nuduhake prabédan antarane nilai rata-rata provinsi lan saben titik ing provinsi.Bentenipun antarane provinsi SM nuduhake podho antarane provinsi siji lan provinsi liyane.Gambar 3A nuduhake matriks BC simetris (0, ireng: cocog banget; 1, putih: beda banget).Saben baris ing grafik nuduhake pola ing data.Gambar 3B nuduhake signifikansi geografis asil SM ing Gambar 3A kanggo saben provinsi.Kanggo provinsi ing wilayah sing kurang gizi lan kurang gizi, Gambar 3B nuduhake yen simetri wilayah gedhe ing saubengé khatulistiwa lan Samudra Hindia dhasaré padha, nanging garis lintang sing luwih dhuwur lan wilayah upwelling beda banget.
(A) Tingkat prabédan SM sing dievaluasi kanggo saben provinsi adhedhasar rata-rata permukaan global rata-rata 20 taun global 51 plankton.Wigati simetri samesthine saka nilai.(B) Proyeksi spasial kolom (utawa baris).Kanggo provinsi ing bunder dystrophic, distribusi global ukuran mirip SM dievaluasi, lan rata-rata 20 taun global dievaluasi.Ireng (BC = 0) tegese area sing padha, lan putih (BC = 1) tegese ora padha.
Gambar 4A nggambarake prabédan ing SM ing saben provinsi ing Gambar 2B.Ditemtokake kanthi nggunakake kombinasi rata-rata area rata-rata ing sawijining kluster, lan nemtokake beda antarane BC lan rata-rata saben titik kothak ing provinsi kasebut, nuduhake yen metode SAGE bisa misahake 51 spesies adhedhasar persamaan ekologis. data model.Bedane rata-rata klompok BC saka kabeh 51 jinis yaiku 0,102±0,0049.
(A, B, lan D) Bentenipun SM ing provinsi dievaluasi minangka rata-rata beda SM antarane saben komunitas titik kothak lan provinsi rata-rata, lan kerumitan ora suda.(2) Bedane rata-rata global intra-provinsi SM yaiku 0,227±0,117.Iki minangka pathokan klasifikasi adhedhasar motivasi ekologis sing diusulake dening karya iki [garis ijo ing (C)].(C) Rata-rata prabédan SM intra-provinsi: Garis ireng nggantosi prabédan SM intra-provinsi karo nambah kerumitan.2σ asalé saka 10 repetisi saka proses identifikasi eko-provinsi.Kanggo kerumitan total provinsi sing ditemokake dening DBSCAN, (A) nuduhake yen dissimilarity BC ing provinsi kasebut yaiku 0,099, lan klasifikasi kerumitan sing diusulake dening (C) yaiku 12, nyebabake dissimilarity SM 0,200 ing provinsi kasebut.minangka gambar nuduhake.(D).
Ing Gambar 4B, biomassa 51 jinis plankton digunakake kanggo makili prabédan SM sing padha ing provinsi Longhurst.Rata-rata sakabèhé saben provinsi yaiku 0,227, lan standar deviasi titik kothak kanthi referensi kanggo prabédan ing provinsi SM yaiku 0,046.Iki luwih gedhe tinimbang kluster sing diidentifikasi ing Gambar 1B.Nanging, nggunakake jumlah saka pitung gugus fungsi, rata-rata intra-musim SM dissimilarity ing Longhurst tambah kanggo 0,232.
Peta eko-provinsi global nyedhiyakake rincian rumit babagan interaksi ekologis unik lan dandan sing wis ditindakake kanggo nggunakake kabeh struktur ekosistem Provinsi Longhurst.Kamentrian Ekologi samesthine bakal menehi wawasan babagan proses ngontrol ekosistem model numerik, lan wawasan iki bakal mbantu eksplorasi kerja lapangan.Kanggo tujuan riset iki, ora bisa ditampilake kanthi lengkap luwih saka satus provinsi.Bagean sabanjure ngenalake metode SAGE sing ngringkes provinsi.
Salah sawijining tujuan provinsi yaiku kanggo ningkatake pemahaman babagan lokasi lan manajemen provinsi.Kanggo nemtokake kahanan darurat, cara ing Gambar 1B nggambarake nesting provinsi sing padha karo ekologis.Eko-provinsi diklompokake adhedhasar persamaan ekologis, lan panglompokan provinsi kasebut diarani AEP.Setel "kerumitan" luwes adhedhasar jumlah total provinsi sing bakal dianggep.Istilah "kerumitan" digunakake amarga ngidini tingkat atribut darurat diatur.Kanggo nemtokake agregasi sing migunani, rata-rata prabédan SM intra-provinsi 0,227 saka Longhurst digunakake minangka pathokan.Ing ngisor pathokan iki, provinsi gabungan ora dianggep migunani maneh.
Kaya sing dituduhake ing Gambar 3B, provinsi ekologi global koheren.Nggunakake beda SM antar provinsi, bisa dideleng manawa sawetara konfigurasi "umum" banget.Diilhami dening metode teori genetika lan grafik, "grafik sing disambungake" digunakake kanggo ngurutake > 100 provinsi adhedhasar provinsi sing paling padha.Metrik "konektivitas" ing kene ditemtokake nggunakake dissimilarity BC antar provinsi (30).Cacahe provinsi sing nduweni ruang luwih gedhe kanggo klasifikasi > 100 provinsi bisa diarani kompleksitas.AEP minangka produk sing nggolongake luwih saka 100 provinsi minangka provinsi ekologi paling dominan/paling cedhak.Saben provinsi ekologis ditugasake menyang provinsi ekologi sing dominan/koneksi banget sing paling mirip karo dheweke.Agregasi iki ditemtokake dening prabédan SM ngidini pendekatan nested kanggo ekologi global.
Kompleksitas sing dipilih bisa dadi nilai saka 1 nganti kerumitan lengkap FIG.2A.Ing kerumitan sing luwih murah, AEP bisa degenerasi amarga langkah pengurangan dimensi probabilistik (t-SNE).Degenerasi tegese provinsi ekologis bisa ditugasake menyang AEP sing beda ing antarane iterasi, saengga ngganti wilayah geografis sing dicakup.Gambar 4C nggambarake panyebaran dissimilarities SM ing provinsi ing AEPs nambah kerumitan ing 10 implementasine (ilustrasi ing Gambar 1B).Ing Gambar 4C, 2σ (wilayah biru) minangka ukuran degradasi ing 10 implementasi, lan garis ijo nggambarake pathokan Longhurst.Kasunyatan wis mbuktekake manawa kerumitan 12 bisa njaga prabédan SM ing provinsi ing ngisor pathokan Longhurst ing kabeh implementasine lan njaga degradasi 2σ sing relatif cilik.Ing ringkesan, kerumitan minimal sing disaranake yaiku 12 AEP, lan rata-rata prabédan intra-provinsi SM sing dievaluasi nggunakake 51 jinis plankton yaiku 0,198 ± 0,013, kaya sing ditampilake ing Gambar 4D.Nggunakake jumlah pitung gugus fungsi plankton, rata-rata prabédan SM ing provinsi iki 2σ tinimbang 0,198±0,004.Perbandingan antarane prabédan SM sing diitung karo total biomas saka pitung gugus fungsi utawa biomas saka kabeh 51 jinis plankton nuduhake yen sanajan metode SAGE ditrapake kanggo kahanan 51 dimensi, nanging kanggo total biomas saka pitung gugus fungsi. Kanggo latihan.
Gumantung ing tujuan riset apa wae, tingkat kerumitan sing beda bisa dianggep.Pasinaon regional mbutuhake kompleksitas lengkap (yaiku, kabeh 115 provinsi).Minangka conto lan kanggo gamblang, nimbang kerumitan minimal dianjurake 12.
Minangka conto sarana metode SAGE, 12 AEP kanthi kerumitan minimal 12 digunakake ing kene kanggo njelajah kontrol struktur komunitas darurat.Gambar 5 nggambarake wawasan ekologis sing dikelompokake dening AEP (saka A nganti L): Ing stoikiometri Redfield, ombone geografis (Gambar 5C), komposisi biomassa klompok fungsional (Gambar 5A) lan pasokan nutrisi (Gambar 5B) ditindakake dening N Zoomed.Rasio (N:Si:P:Fe, 1:1:16:16×103) ditampilake.Kanggo panel pungkasan, P pingan dening 16 lan Fe pingan dening 16×103, supaya grafik bar padha karo syarat nutrisi fitoplankton.
Provinsi-provinsi kasebut diklasifikasikake dadi 12 AEPs A nganti L. (A) Biomassa (mgC/m3) ekosistem ing 12 provinsi.(B) Laju fluks nutrisi nitrogen anorganik terlarut (N), besi (Fe), fosfat (P) lan asam silikat (Si) (mmol/m3 saben taun).Fe lan P sing ping pingan dening 16 lan 16 × 103, mungguh, supaya ngudani sing standar kanggo syarat fitoplankton stoikiometri.(C) Wigati prabédan antarane wilayah kutub, siklon subtropis lan wilayah musiman / munggah.Stasiun pemantauan ditandhani kaya ing ngisor iki: 1, SEATS;2, ALOHA;3, stasiun P;lan 4, BATS.
AEP sing diidentifikasi unik.Ana sawetara simetri ing sakubenge khatulistiwa ing Samudra Atlantik lan Pasifik, lan wilayah sing padha nanging luwih gedhe ana ing Samudra Hindia.Sawetara AEP nyakup sisih kulon bawana sing ana gandhengane karo pendakian.Arus Circumpolar Kutub Kidul dianggep minangka fitur zona gedhe.Siklon subtropis minangka seri kompleks AEP oligotrofik.Ing provinsi-provinsi kasebut, pola sing akrab saka prabédan biomas antara vorteks oligotrofik sing didominasi plankton lan wilayah kutub sing sugih diatom katon jelas.
AEP kanthi biomassa fitoplankton total sing meh padha bisa duwe struktur komunitas sing beda banget lan nutupi wilayah geografis sing beda, kayata D, H, lan K, sing nduweni biomassa fitoplankton total sing padha.AEP H utamane ana ing Samudra Hindia khatulistiwa, lan luwih akeh bakteri diazotropik.AEP D ditemokaké ing sawetara cekungan, nanging utamané misuwur ing Pasifik watara wilayah dhuwur-ngasilaken watara upwelling khatulistiwa.Bentuk provinsi Pasifik iki kaya sepur gelombang planet.Ana sawetara diazobacteria ing AEP D, lan liyane cones.Dibandhingake karo rong provinsi liyane, AEP K mung ditemokake ing dataran tinggi Samudra Arktik, lan ana luwih akeh diatom lan luwih sithik plankton.Wigati dicathet yen jumlah plankton ing telung wilayah kasebut uga beda banget.Ing antarane, kelimpahan plankton AEP K relatif kurang, dene AEP D lan H relatif dhuwur.Mulane, senadyan biomassa (lan mulane padha karo Chl-a), provinsi-provinsi iki rada beda: Pengujian provinsi berbasis Chl bisa uga ora bisa njupuk beda kasebut.
Kajaba iku, sawetara AEP kanthi biomassa sing beda banget bisa uga padha karo struktur komunitas fitoplankton.Contone, iki katon ing AEP D lan E. Padha cedhak karo siji liyane, lan ing Samudra Pasifik, AEP E cedhak karo AEPJ banget produktif.Kajaba iku, ora ana hubungan sing jelas antarane biomas fitoplankton lan kelimpahan zooplankton.
AEP bisa dimangerteni babagan nutrisi sing diwenehake kanggo dheweke (Gambar 5B).Diatom mung ana ing ngendi ana pasokan asam silikat sing cukup.Umumé, luwih dhuwur pasokan asam silikat, luwih dhuwur biomas diatom.Diatom bisa dideleng ing AEP A, J, K lan L. Rasio diatom biomassa relatif marang fitoplankton liyane ditemtokake dening N, P lan Fe kasedhiya relatif kanggo dikarepake diatom.Contone, AEP L didominasi dening diatom.Dibandhingake karo nutrisi liyane, Si duwe sumber paling dhuwur.Beda, sanajan produktivitas luwih dhuwur, AEP J nduweni diatom sing luwih sithik lan pasokan silikon luwih sithik (kabeh lan relatif marang nutrisi liyane).
Bakteri diazonium nduweni kemampuan kanggo ndandani nitrogen, nanging tuwuh alon-alon (31).Dheweke urip bebarengan karo fitoplankton liyane, ing ngendi wesi lan fosfor luwih akeh tinimbang kabutuhan nutrisi non-diazonium (20, 21).Wigati dicathet yen biomassa diazotrofik relatif dhuwur, lan pasokan Fe lan P relatif gedhe tinimbang pasokan N. Kanthi cara iki, sanajan total biomas ing AEP J luwih dhuwur, biomas diazonium ing AEP H luwih dhuwur. luwih gedhe tinimbang ing J. Wigati dicathet menawa AEP J lan H sacara geografis beda banget, lan H dumunung ing Samudra Hindia khatulistiwa.
Yen struktur ekosistem unik ora dipérang dadi provinsi, wawasan sing dipikolehi saka 12 model kerumitan paling ngisor AEP ora bakal cetha.AEP sing digawe dening SAGE nggampangake perbandingan sing koheren lan simultan saka informasi kompleks lan dimensi dhuwur saka model ekosistem.AEP kanthi efektif nandheske kenapa Chl dudu cara sing apik lan alternatif kanggo nemtokake struktur komunitas utawa kelimpahan zooplankton ing tingkat nutrisi sing luwih dhuwur.Analisis rinci babagan topik riset sing lagi ditindakake ora ana ing ruang lingkup artikel iki.Cara SAGE nyedhiyakake cara kanggo njelajah mekanisme liyane ing model sing luwih gampang ditangani tinimbang ndeleng titik-kanggo-titik.
Cara SAGE diusulake kanggo mbantu njlentrehake data ekologis sing rumit banget saka model numerik fisik/biogeokimia/ekosistem global.Provinsi ekologis ditemtokake dening total biomassa gugus fungsi lintas-plankton, aplikasi algoritma pengurangan dimensi probabilitas t-SNE lan clustering nggunakake metode ML tanpa pengawasan DBSCAN.Teori prabédan / grafik BC antar provinsi kanggo metode nesting ditrapake kanggo ngasilake AEP sing kuat sing bisa digunakake kanggo interpretasi global.Ing babagan konstruksi, Eco-Province lan AEP unik.Sarang AEP bisa diatur ing antarane kerumitan lengkap provinsi ekologis asli lan ambang minimal sing disaranake 12 AEP.Nesting lan nemtokake kerumitan minimal AEP dianggep minangka langkah kunci, amarga kemungkinan t-SNE ngrusak AEP kanthi kerumitan <12.Cara SAGE iku global, lan kerumitan sawijining kisaran saka> 100 AEPs kanggo 12. Kanggo kesederhanaan, fokus saiki ing kerumitan 12 AEPs global.Panaliten ing mangsa ngarep, utamane studi regional, bisa nemokake subset spasial sing luwih cilik saka provinsi eko global sing migunani, lan bisa dikumpulake ing wilayah sing luwih cilik kanggo njupuk kauntungan saka wawasan ekologis sing padha sing dibahas ing kene.Iki menehi saran babagan kepiye provinsi ekologis lan wawasan sing dipikolehi saka dheweke bisa digunakake kanggo pangerten ekologis luwih lanjut, nggampangake perbandingan model, lan duweni potensi nambah pemantauan ekosistem laut.
Provinsi ekologis lan AEP sing diidentifikasi kanthi metode SAGE adhedhasar data ing model numerik.Miturut definisi, model numerik minangka struktur sing disederhanakake, nyoba njupuk inti saka sistem target, lan model sing beda bakal duwe distribusi plankton sing beda.Model numerik sing digunakake ing panliten iki ora bisa njupuk kanthi lengkap sawetara pola sing diamati (contone, ing perkiraan Chl kanggo wilayah khatulistiwa lan Samudra Kidul).Mung bagean cilik saka bhinéka ing segara nyata dijupuk, lan meso lan sub-mesoscales ora bisa ditanggulangi, kang bisa mengaruhi flux nutrisi lan struktur masyarakat cilik.Senadyan kekurangan kasebut, ternyata AEP migunani banget kanggo mbantu ngerteni model sing rumit.Kanthi ngevaluasi ing ngendi provinsi ekologis sing padha ditemokake, AEP nyedhiyakake alat perbandingan model numerik potensial.Model numerik saiki nangkep pola sakabèhé saka konsentrasi fitoplankton penginderaan jarak jauh Chl-a lan distribusi ukuran plankton lan gugus fungsi (Cathetan S1 lan Gambar S1) (2, 32).
Minangka dituduhake dening garis kontur 0,1 mgChl-a/m-3, AEP dipérang dadi area oligotrophic lan area mesotrophic (Gambar S1B): AEP B, C, D, E, F lan G minangka area oligotrophic, lan wilayah sing isih ana yaiku dumunung Higher Chl-a.AEP nuduhake sawetara korespondensi karo Provinsi Longhurst (Gambar S3A), contone, Samudra Kidul lan Pasifik khatulistiwa.Ing sawetara wilayah, AEP nyakup sawetara wilayah Longhurst, lan kosok balene.Amarga maksud mbatesi provinsi ing wilayah iki lan Longhurst beda, samesthine bakal ana bedane.Akeh AEP ing provinsi Longhurst nuduhake yen wilayah tartamtu kanthi biogeokimia bisa uga duwe struktur ekosistem sing beda banget.AEP nuduhake korespondensi tartamtu karo negara fisik, kaya sing dicethakaké nggunakake learning unsupervised (19), kayata ing negara upwelling dhuwur (contone, Samudra Kidul lan Pasifik khatulistiwa; Gambar S3, C lan D).Korespondensi kasebut nuduhake yen struktur komunitas plankton dipengaruhi banget dening dinamika samudra.Ing wilayah kayata Atlantik Lor, AEP ngliwati provinsi fisik.Mekanisme sing nyebabake beda kasebut bisa uga kalebu proses kayata transportasi bledug, sing bisa nyebabake program nutrisi sing beda sanajan ing kondisi fisik sing padha.
Kamentrian Ekologi lan AEP nyatakake yen nggunakake Chl mung ora bisa ngenali komponen ekologis, amarga komunitas ekologi laut wis ngerti.Iki katon ing AEP kanthi biomassa sing padha nanging komposisi ekologis sing beda banget (kayata D lan E).Ing kontras, AEP kayata D lan K duwe biomass beda banget nanging komposisi ekologis padha.AEP nandheske yen hubungan antarane biomassa, komposisi ekologis lan kelimpahan zooplankton rumit.Contone, senajan AEP J misuwur ing babagan fitoplankton lan biomas plankton, AEP lan L duwe biomas plankton sing padha, nanging A duwe kelimpahan plankton sing luwih dhuwur.AEP nandheske yen biomassa fitoplankton (utawa Chl) ora bisa digunakake kanggo prédhiksi biomassa zooplankton.Zooplankton minangka dhasar rantai panganan perikanan, lan perkiraan sing luwih akurat bisa nyebabake manajemen sumber daya sing luwih apik.Satelit warna laut mangsa ngarep [contone, PACE (plankton, aerosol, awan, lan ekosistem laut)] bisa uga luwih apik kanggo ngira struktur komunitas fitoplankton.Nggunakake prediksi AEP duweni potensi nggampangake ngira zooplankton saka angkasa.Cara kaya SAGE, ditambah karo teknologi anyar, lan luwih akeh data lapangan sing kasedhiya kanggo survey bebener lemah (kayata Tara lan riset tindak lanjut), bisa bebarengan njupuk langkah menyang pemantauan kesehatan ekosistem berbasis satelit.
Cara SAGE nyedhiyakake cara sing trep kanggo ngevaluasi sawetara mekanisme sing ngontrol karakteristik provinsi, kayata biomassa/Chl, produksi primer net, lan struktur komunitas.Contone, jumlah relatif saka diatoms disetel dening boten seimbang kalebet ing sumber Si, N, P, lan Fe relatif kanggo syarat fitoplankton stoikiometri.Ing tingkat pasokan imbang, masyarakat didominasi dening diatom (L).Nalika tingkat pasokan ora seimbang (yaiku, pasokan silikon luwih murah tinimbang kabutuhan nutrisi diatom), diatom mung duwe bagean cilik Share (K).Nalika pasokan Fe lan P ngluwihi pasokan N (umpamane, E lan H), bakteri diazotrofik bakal tuwuh kanthi kuat.Liwat konteks sing diwenehake dening AEP, eksplorasi mekanisme kontrol bakal luwih migunani.
Eco-Province lan AEP minangka wilayah kanthi struktur komunitas sing padha.Deret wektu saka lokasi tartamtu ing provinsi ekologis utawa AEP bisa dianggep minangka titik referensi lan bisa makili wilayah sing dilindhungi dening provinsi ekologis utawa AEP.Stasiun pemantauan ing situs jangka panjang nyedhiyakake seri wektu kasebut.Set data in-situ jangka panjang bakal terus muter peran sing ora bisa diitung.Saka perspektif ngawasi struktur komunitas, metode SAGE bisa dideleng minangka cara kanggo mbantu nemtokake lokasi situs anyar sing paling migunani.Contone, seri wektu saka penilaian habitat oligotropik jangka panjang (ALOHA) ana ing AEP B wilayah oligotropik (Gambar 5C, label 2).Amarga ALOHA cedhak karo wates AEP liyane, deret wektu bisa uga ora makili kabeh wilayah, kaya sing disaranake sadurunge (33).Ing AEP B sing padha, seri wektu SEATS (Seri Wektu Asia Tenggara) dumunung ing sisih kidul-kulon Taiwan (34), luwih adoh saka wates AEP liyane (Gambar 5C, label 1), lan bisa digunakake minangka lokasi sing luwih apik kanggo ngawasi. AEPB.Seri wektu BATS (Bermuda Atlantic Time Series Study) (Gambar 5C, label 4) ing AEPC cedhak banget karo wates antarane AEP C lan F, sing nuduhake yen ngawasi AEP C nggunakake seri wektu BATS bisa langsung dadi masalah.Stasiun P ing AEP J (Gambar 5C, label 3) adoh saka wates AEP, saengga luwih representatif.Eco-Province lan AEP bisa mbantu nggawe kerangka pemantauan sing cocog kanggo ngevaluasi owah-owahan global, amarga ijin provinsi kanggo netepake lokasi sampling ing situs bisa menehi wawasan utama.Cara SAGE bisa luwih dikembangake kanggo ditrapake ing data iklim kanggo netepake variabilitas sing ngirit wektu.
Kasuksesan metode SAGE digayuh kanthi nggunakake metode ilmu data/ML lan kawruh khusus domain.Khusus, t-SNE digunakake kanggo nindakake pengurangan dimensi, sing njaga struktur kovarian data dimensi dhuwur lan nggampangake visualisasi topologi kovarian.Data kasebut disusun kanthi bentuk garis lan kovarian (Gambar 2A), nuduhake yen ukuran adhedhasar jarak murni (kayata K-means) ora cocog amarga biasane nggunakake distribusi basis Gaussian (circular) (dibahas ing Cathetan S2). .Cara DBSCAN cocok kanggo topologi kovarian apa wae.Anggere sampeyan mbayar manungsa waé kanggo nyetel paramèter, identifikasi dipercaya bisa kasedhiya.Biaya komputasi algoritma t-SNE dhuwur, sing mbatesi aplikasi saiki kanggo jumlah data sing luwih gedhe, tegese angel ditrapake ing lapangan sing jero utawa beda-beda.Nggarap skalabilitas t-SNE lagi ditindakake.Wiwit kadohan KL gampang parallelize, algoritma t-SNE potensial apik kanggo expansion ing mangsa (35).Nganti saiki, metode pengurangan dimensi liyane sing bisa nyuda ukurane kalebu teknik perkiraan manifold lan proyeksi (UMAP), nanging evaluasi ing konteks data segara perlu.Makna skalabilitas sing luwih apik yaiku, contone, nggolongake iklim utawa model global kanthi kerumitan sing beda ing lapisan campuran.Wilayah sing gagal diklasifikasikake dening SAGE ing provinsi apa wae bisa dianggep minangka titik ireng sing isih ana ing Gambar 2A.Sacara geografis, wilayah kasebut utamane ing wilayah sing musiman banget, sing nuduhake yen njupuk provinsi ekologis sing owah saka wektu bakal nyedhiyakake jangkoan sing luwih apik.
Kanggo mbangun metode SAGE, gagasan saka sistem kompleks / ilmu data wis digunakake, nggunakake kemampuan kanggo nemtokake klompok-klompok fungsional (kamungkinan sing cedhak banget ing spasi 11 dimensi) lan nemtokake provinsi.Provinsi iki nggambarake volume tartamtu ing ruang fase t-SNE 3D kita.Kajaba iku, bagean Poincaré bisa digunakake kanggo ngevaluasi "volume" ruang negara sing dikuwasani dening lintasan kanggo nemtokake prilaku "normal" utawa "kacau" (36).Kanggo output model 11-dimensi statis, volume sing dikuwasani sawise data diowahi dadi ruang fase 3D bisa uga diterangake.Hubungane antarane wilayah geografis lan wilayah ing ruang fase 3D ora prasaja, nanging bisa dijlentrehake kanthi persamaan ekologis.Mulane, ukuran dissimilarity SM sing luwih konvensional luwih disenengi.
Karya ing mangsa ngarep bakal nggunakake maneh metode SAGE kanggo data ganti musiman kanggo netepake variasi spasial provinsi lan AEP sing diidentifikasi.Tujuan ing mangsa ngarep yaiku nggunakake cara iki kanggo mbantu nemtokake provinsi endi sing bisa ditemtokake liwat pangukuran satelit (kayata Chl-a, reflektivitas penginderaan jarak jauh lan suhu permukaan laut).Iki bakal ngidini penilaian sensing remot komponen ekologis lan ngawasi provinsi ekologis lan variabilitas sing fleksibel.
Tujuan saka panliten iki yaiku kanggo ngenalake metode SAGE, sing nemtokake provinsi ekologis liwat struktur komunitas plankton sing unik.Ing kene, informasi sing luwih rinci babagan model fisik/biogeokimia/ekosistem lan pilihan parameter algoritma t-SNE lan DBSCAN bakal diwenehake.
Komponen fisik model kasebut asale saka perkiraan sirkulasi lan iklim segara [ECCOv4;(37) taksiran negara global sing diandharake dening (38).Resolusi nominal estimasi negara yaiku 1/5.Metode kuadrat terkecil kanthi metode Lagrangian multiplier digunakake kanggo entuk kondisi awal lan wates lan parameter model internal sing diatur kanthi pengamatan, saengga ngasilake model siklus umum MIT (MITgcm) (39), model Sawise optimasi, asil bisa dilacak lan diamati.
Biogeokimia/ekosistem nduweni gambaran sing luwih lengkap (yaiku persamaan lan nilai parameter) ing (2).Model kasebut njupuk sirkulasi C, N, P, Si lan Fe liwat kolam anorganik lan organik.Versi sing digunakake ing kene kalebu 35 spesies fitoplankton: 2 spesies mikroprokariota lan 2 spesies mikroeukaryotes (cocog kanggo lingkungan sing kurang nutrisi), 5 spesies Cryptomonas sphaeroides (kanthi lapisan kalsium karbonat), 5 spesies diazonium (Bisa ndandani nitrogen, dadi ora diwatesi) kasedhiyan nitrogen anorganik larut), 11 diatom (mbentuk tutup silika), 10 flagellata campuran-vegetatif (bisa fotosintesis lan mangan plankton liyane) lan 16 Zooplankton (ngramut plankton liyane).Iki diarani "grup fungsional biogeokimia" amarga duwe efek sing beda ing biogeokimia laut (40, 41) lan asring digunakake ing observasi lan studi model.Ing model iki, saben gugus fungsi dumadi saka sawetara plankton kanthi ukuran sing beda-beda, kanthi span 0,6 nganti 2500 μm sing padha karo diameter bola.
Paramèter sing mengaruhi pertumbuhan fitoplankton, angonan lan nglelebke ana hubungane karo ukuran, lan ana beda tartamtu antarane enem gugus fungsi fitoplankton (32).Senadyan kerangka fisik sing beda, asil saka 51 komponen plankton saka model kasebut wis digunakake ing sawetara studi anyar (42-44).
Saka 1992 nganti 2011, model kopling fisik/biogeokimia/ekosistem lumaku suwene 20 taun.Output model kalebu biomas plankton, konsentrasi nutrisi lan tingkat pasokan nutrisi (DIN, PO4, Si lan Fe).Ing panliten iki, rata-rata 20 taun saka output kasebut digunakake minangka input Provinsi Ekologis.Chl, distribusi biomassa plankton lan konsentrasi nutrisi lan distribusi gugus fungsi dibandhingake karo pengamatan satelit lan in-situ [pirsani (2, 44), Cathetan S1 lan tokoh.S1 nganti S3].
Kanggo metode SAGE, sumber utama acak teka saka langkah t-SNE.Randomness ngalangi repeatability, kang tegese asil ora bisa dipercaya.Cara SAGE kanthi ketat nguji kekiatan kanthi nemtokake set paramèter t-SNE lan DBSCAN, sing bisa kanthi konsisten ngenali kluster nalika diulang.Nemtokake "kebingungan" saka parameter t-SNE bisa dimangerteni minangka nemtokake tingkat pemetaan saka dimensi dhuwur nganti kurang kudu ngormati karakteristik data lokal utawa global.Tekan kebingungan 400 lan 300 iterasi.
Kanggo algoritma clustering DBSCAN, ukuran minimal lan metrik jarak titik data ing kluster kudu ditemtokake.Jumlah minimal ditemtokake ing panuntun dhumateng para ahli.Kawruh iki ngerti apa sing cocog karo kerangka lan resolusi pemodelan numerik saiki.Jumlah minimal 100. Nilai minimal sing luwih dhuwur (kurang saka <135 sadurunge wates ndhuwur ijo dadi luwih akeh) bisa dianggep, nanging ora bisa ngganti cara agregasi adhedhasar dissimilarity SM.Derajat sambungan (Gambar 6A) digunakake kanggo nyetel parameter ϵ, sing cocog kanggo jangkoan sing luwih dhuwur (Gambar 6B).Konektivitas ditetepake minangka jumlah gabungan klompok lan sensitif marang parameter ϵ.Konektivitas sing luwih murah nuduhake pas sing ora cukup, nglumpukake wilayah kanthi artifisial.Konektivitas dhuwur nuduhake overfitting.Overfitting uga dadi masalah, amarga nuduhake manawa tebakan acak awal bisa nyebabake asil sing ora bisa ditindakake.Ing antarane rong ekstrem iki, mundhak sing cetha (biasane disebut "siku") nuduhake ϵ sing paling apik.Ing Figure 6A, sampeyan ndeleng paningkatan sing cetha ing wilayah dataran tinggi (kuning,> 200 kluster), banjur mudhun kanthi cetha (ijo, 100 kluster), nganti udakara 130, diubengi dening sawetara kluster (biru, <60 kluster) ).Ing paling ora 100 wilayah biru, salah siji klompok ndominasi kabeh segara (ϵ <0,42), utawa paling segara ora diklasifikasikaké lan dianggep rame (ϵ> 0,99).Wewengkon kuning nduweni distribusi kluster sing ora bisa direproduksi banget.Nalika ϵ suda, swara mundhak.Wewengkon ijo sing mundhak banget diarani sikut.Iki minangka wilayah sing optimal.Sanajan probabilitas t-SNE digunakake, dissimilarity SM ing provinsi isih bisa digunakake kanggo nemtokake clustering dipercaya.Nggunakake Gambar 6 (A lan B), atur ϵ dadi 0,39.Sing luwih gedhe nomer minimal, luwih cilik kemungkinan tekan ϵ sing ngidini klasifikasi sing bisa dipercaya, lan luwih gedhe wilayah ijo kanthi nilai luwih saka 135. Pembesaran wilayah iki nuduhake yen sikut bakal luwih angel ditemokake utawa ora ana. ana.
Sawise nyetel paramèter t-SNE, jumlah total kluster sing ditemokake bakal digunakake minangka ukuran konektivitas (A) lan persentase data sing dialokasikan kanggo kluster (B).Titik abang nuduhake kombinasi jangkoan lan konektivitas sing paling apik.Nomer minimal disetel miturut nomer minimal sing ana gandhengane karo ekologi.
Kanggo bahan tambahan kanggo artikel iki, waca http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Iki minangka artikel akses mbukak sing disebarake miturut syarat-syarat Lisensi Atribusi Creative Commons.Artikel kasebut ngidini panggunaan, distribusi, lan reproduksi tanpa watesan ing media apa wae kanthi syarat karya asli kasebut dikutip kanthi bener.
Cathetan: Kita mung njaluk sampeyan menehi alamat email supaya wong sing disaranake menyang kaca ngerti manawa sampeyan pengin dheweke ndeleng email kasebut lan dudu spam.Kita ora bakal njupuk alamat email.
Pitakonan iki digunakake kanggo nguji manawa sampeyan minangka pengunjung lan nyegah kiriman spam otomatis.
Kamentrian Ekologi Kelautan Global mutusake kanggo ngrampungake masalah sing rumit lan nggunakake ML sing ora diawasi kanggo njelajah struktur komunitas.
Kamentrian Ekologi Kelautan Global mutusake kanggo ngrampungake masalah sing rumit lan nggunakake ML sing ora diawasi kanggo njelajah struktur komunitas.
Wektu kirim: Jan-12-2021