Kaedah pembelajaran tanpa pengawasan dicadangkan untuk menentukan wilayah ekologi marin global (eko-provinsi) berdasarkan struktur komuniti plankton dan data fluks nutrien.Kaedah wilayah ekologi bersepadu sistematik (SAGE) boleh mengenal pasti wilayah ekologi dalam model ekosistem yang sangat tidak linear.Untuk menyesuaikan diri dengan kovarians bukan Gaussian data, SAGE menggunakan t pembenaman jiran rawak (t-SNE) untuk mengurangkan dimensi.Dengan bantuan aplikasi hingar berdasarkan algoritma pengelompokan spatial berasaskan kepadatan (DBSCAN), lebih daripada seratus wilayah ekologi boleh dikenal pasti.Menggunakan peta ketersambungan dengan perbezaan ekologi sebagai ukuran jarak, wilayah ekologi teragregat (AEP) yang teguh ditakrifkan secara objektif melalui wilayah ekologi bersarang.Menggunakan AEP, kawalan kadar bekalan nutrien pada struktur komuniti telah diterokai.Wilayah eko dan AEP adalah unik dan boleh membantu tafsiran model.Mereka boleh memudahkan perbandingan antara model dan boleh meningkatkan pemahaman dan pemantauan ekosistem marin.
Wilayah adalah wilayah di mana biogeografi kompleks di laut atau darat disusun menjadi kawasan yang koheren dan bermakna (1).Wilayah ini sangat penting untuk membandingkan dan membezakan lokasi, mencirikan pemerhatian, pemantauan dan perlindungan.Interaksi kompleks dan bukan linear yang menghasilkan wilayah ini menjadikan kaedah pembelajaran mesin (ML) tanpa pengawasan sangat sesuai untuk menentukan wilayah secara objektif, kerana kovarians dalam data adalah kompleks dan bukan Gaussian.Di sini, kaedah ML dicadangkan, yang secara sistematik mengenal pasti wilayah ekologi marin yang unik (eko-wilayah) daripada model fizikal/ekosistem global tiga dimensi (3D) Darwin (2).Istilah "unik" digunakan untuk menunjukkan bahawa kawasan yang dikenal pasti tidak cukup bertindih dengan kawasan lain.Kaedah ini dipanggil kaedah Wilayah Ekologi Bersepadu Sistem (SAGE).Untuk melaksanakan pengelasan yang berguna, kaedah algoritma perlu membenarkan (i) pengelasan global dan (ii) analisis berskala yang boleh disarang/diagregatkan dalam ruang dan masa (3).Dalam penyelidikan ini, kaedah SAGE pertama kali dicadangkan dan wilayah ekologi yang dikenal pasti telah dibincangkan.Wilayah eko boleh menggalakkan pemahaman tentang faktor yang mengawal struktur komuniti, memberikan cerapan berguna untuk strategi pemantauan dan membantu menjejaki perubahan dalam ekosistem.
Wilayah daratan biasanya dikelaskan mengikut persamaan dalam iklim (kerpasan dan suhu), tanah, tumbuh-tumbuhan, dan fauna, dan digunakan untuk pengurusan tambahan, penyelidikan biodiversiti, dan kawalan penyakit (1, 4).Wilayah laut lebih sukar untuk ditentukan.Kebanyakan organisma adalah mikroskopik, dengan sempadan bendalir.Longhurst et al.(5) Menyediakan salah satu klasifikasi global pertama Kementerian Oseanografi berdasarkan keadaan persekitaran.Takrif wilayah "Longhurst" ini termasuk pembolehubah seperti kadar percampuran, stratifikasi dan sinaran, serta pengalaman luas Longhurst sebagai ahli oseanografi marin, yang mempunyai syarat penting lain untuk ekosistem marin.Longhurst telah digunakan secara meluas, contohnya, untuk menilai pengeluaran utama dan fluks karbon, membantu perikanan, dan merancang aktiviti pemerhatian in situ (5-9).Untuk mentakrifkan wilayah secara lebih objektif, kaedah seperti logik kabur dan pengelompokan/statistik tanpa pengawasan wilayah telah digunakan (9-14).Tujuan kaedah tersebut adalah untuk mengenal pasti struktur bermakna yang boleh mengenal pasti wilayah dalam data pemerhatian yang ada.Sebagai contoh, wilayah marin dinamik (12) menggunakan peta penyusunan sendiri untuk mengurangkan hingar, dan menggunakan pengelompokan hierarki (berasaskan pokok) untuk menentukan produk warna marin yang diperoleh daripada satelit serantau [klorofil a (Chl-a), ketinggian garisan Pendarfluor yang dinormalkan dan bahan organik terlarut berwarna] dan medan fizikal (suhu permukaan laut dan kemasinan, topografi dinamik mutlak dan ais laut).
Struktur komuniti plankton membimbangkan kerana ekologinya mempunyai pengaruh yang besar terhadap tahap nutrien yang lebih tinggi, penyerapan karbon dan iklim.Namun begitu, ia masih merupakan matlamat yang mencabar dan sukar difahami untuk menentukan wilayah ekologi global berdasarkan struktur komuniti plankton.Satelit warna marin berpotensi memberikan pandangan tentang klasifikasi fitoplankton berbutir kasar atau mencadangkan kelebihan kumpulan berfungsi (15), tetapi pada masa ini mereka tidak dapat memberikan maklumat terperinci tentang struktur komuniti.Tinjauan terkini [cth Tara Ocean (16)] menyediakan ukuran struktur komuniti yang belum pernah berlaku sebelum ini;pada masa ini, hanya terdapat jarang pemerhatian in-situ pada skala global (17).Kajian terdahulu telah banyak menentukan "Wilayah Biogeokimia" (12, 14, 18) berdasarkan penentuan persamaan biokimia (seperti pengeluaran primer, Chl dan cahaya yang tersedia).Di sini, model berangka digunakan untuk mengeluarkan [Darwin(2)], dan wilayah ekologi ditentukan mengikut struktur komuniti dan fluks nutrien.Model berangka yang digunakan dalam kajian ini mempunyai liputan global dan boleh dibandingkan dengan data medan sedia ada (17) dan medan penderiaan jauh (Nota S1).Data model berangka yang digunakan dalam kajian ini mempunyai kelebihan liputan global.Ekosistem model terdiri daripada 35 spesies fitoplankton dan 16 spesies zooplankton (sila rujuk bahan dan kaedah).Jenis plankton model berinteraksi secara tidak linear dengan struktur kovarians bukan Gaussian, jadi kaedah diagnostik mudah tidak sesuai untuk mengenal pasti corak unik dan konsisten dalam struktur komuniti yang baru muncul.Kaedah SAGE yang diperkenalkan di sini menyediakan cara baru untuk menyemak output model Darwin yang kompleks.
Keupayaan transformatif berkuasa sains data/teknologi ML boleh membolehkan penyelesaian model yang sangat kompleks untuk mendedahkan struktur yang kompleks tetapi teguh dalam kovarians data.Kaedah teguh ditakrifkan sebagai kaedah yang boleh menghasilkan semula keputusan dengan jujur dalam julat ralat yang diberikan.Walaupun dalam sistem mudah, menentukan corak dan isyarat yang teguh boleh menjadi satu cabaran.Sehingga rasional yang membawa kepada corak yang diperhatikan ditentukan, kerumitan yang muncul mungkin kelihatan rumit/sukar untuk diselesaikan.Proses utama untuk menetapkan komposisi ekosistem adalah tidak linear.Kewujudan interaksi bukan linear boleh mengelirukan pengelasan yang teguh, jadi adalah perlu untuk mengelakkan kaedah yang membuat andaian yang kukuh tentang taburan statistik asas kovarians data.Data berdimensi tinggi dan bukan linear adalah biasa dalam oseanografi dan mungkin mempunyai struktur kovarians dengan topologi bukan Gaussian yang kompleks.Walaupun data dengan struktur kovarians bukan Gaussian boleh menghalang pengelasan yang mantap, kaedah SAGE adalah baru kerana ia direka untuk mengenal pasti kelompok dengan topologi sewenang-wenangnya.
Matlamat kaedah SAGE adalah untuk mengenal pasti secara objektif corak baru muncul yang boleh membantu pemahaman ekologi selanjutnya.Mengikuti aliran kerja berasaskan kelompok yang serupa dengan (19), pembolehubah fluks ekologi dan nutrien digunakan untuk menentukan satu-satunya kelompok dalam data, yang dipanggil wilayah ekologi.Kaedah SAGE yang dicadangkan dalam kajian ini (Rajah 1) mula-mula mengurangkan dimensi daripada 55 kepada 11 dimensi dengan menjumlahkan kumpulan berfungsi plankton yang ditakrifkan secara priori (lihat Bahan dan Kaedah).Menggunakan kaedah benam jiran-t rawak (t-SNE), saiznya dikurangkan lagi dengan mengunjurkan kebarangkalian ke dalam ruang 3D.Pengelompokan tanpa pengawasan boleh mengenal pasti kawasan yang rapat secara ekologi [penghimpunan spatial berasaskan kepadatan (DBSCAN) untuk aplikasi berasaskan hingar].Kedua-dua t-SNE dan DBSCAN boleh digunakan pada data model berangka ekosistem bukan linear yang wujud.Kemudian unjurkan semula wilayah ekologi yang terhasil ke bumi.Lebih daripada seratus wilayah ekologi unik telah dikenal pasti, sesuai untuk penyelidikan serantau.Untuk mempertimbangkan model ekosistem yang konsisten secara global, kaedah SAGE digunakan untuk mengagregatkan wilayah ekologi kepada wilayah ekologi agregat (AEP) untuk meningkatkan keberkesanan wilayah ekologi.Tahap pengagregatan (dipanggil "kerumitan") boleh dilaraskan kepada tahap perincian yang diperlukan.Tentukan kerumitan minimum AEP yang teguh.Fokus pemilihan adalah kaedah SAGE dan meneroka kes AEP kerumitan terkecil untuk menentukan kawalan struktur komuniti kecemasan.Corak itu kemudiannya boleh dianalisis untuk memberikan pandangan ekologi.Kaedah yang diperkenalkan di sini juga boleh digunakan untuk perbandingan model dengan lebih meluas, contohnya, dengan menilai lokasi wilayah ekologi serupa yang terdapat dalam model berbeza untuk menyerlahkan perbezaan dan persamaan, untuk membandingkan model.
(A) Gambar rajah skema aliran kerja untuk menentukan wilayah ekologi;menggunakan jumlah dalam kumpulan berfungsi untuk mengurangkan data 55 dimensi asal kepada output model 11 dimensi, termasuk biojisim tujuh plankton berfungsi/nutrien dan empat kadar bekalan nutrien.Nilai yang boleh diabaikan dan kawasan penutup ais yang tahan lama.Data telah diseragamkan dan diseragamkan.Sediakan data 11 dimensi kepada algoritma t-SNE untuk menyerlahkan gabungan ciri yang serupa secara statistik.DBSCAN akan memilih kluster dengan teliti untuk menetapkan nilai parameter.Akhir sekali unjurkan data kembali ke unjuran latitud/longitud.Sila ambil perhatian bahawa proses ini diulang 10 kali kerana sedikit rawak mungkin dijana dengan menggunakan t-SNE.(B) menerangkan cara mendapatkan AEP dengan mengulang aliran kerja dalam (A) 10 kali.Bagi setiap 10 pelaksanaan ini, matriks perbezaan Bray-Curtis (BC) antara wilayah ditentukan berdasarkan biojisim 51 jenis fitoplankton.Tentukan perbezaan BC antara wilayah, daripada kerumitan 1 AEP kepada kerumitan penuh 115. Penanda aras BC ditetapkan oleh Wilayah Longhurst.
Kaedah SAGE menggunakan output model berangka fizikal/ekosistem 3D global untuk menentukan wilayah ekologi [Darwin (2);lihat Bahan dan Kaedah dan Nota S1].Komponen ekosistem terdiri daripada 35 spesies fitoplankton dan 16 spesies zooplankton, dengan tujuh kumpulan berfungsi yang telah ditetapkan: prokariot dan eukariota yang disesuaikan dengan persekitaran nutrien rendah, coccidia dengan salutan kalsium karbonat, dan penetapan nitrogen berat Nutrien nitrogen (biasanya tiada nutrien penting), dengan penutup silika, boleh membuat fotosintesis plankton lain dan meragut flagellata nutrien campuran dan pengembala zooplankton.Rentang saiz ialah diameter sfera setara 0.6 hingga 2500μm.Taburan model saiz fitoplankton dan kumpulan berfungsi menangkap ciri keseluruhan yang dilihat dalam pemerhatian satelit dan in-situ (lihat Rajah S1 hingga S3).Persamaan antara model berangka dan lautan yang diperhatikan menunjukkan bahawa wilayah yang ditakrifkan oleh model mungkin boleh digunakan untuk lautan in-situ.Sila ambil perhatian bahawa model ini hanya menangkap kepelbagaian fitoplankton tertentu, dan hanya julat memaksa fizikal dan kimia tertentu di lautan in situ.Kaedah SAGE boleh membolehkan orang ramai memahami dengan lebih baik mekanisme kawalan serantau bagi struktur komuniti model.
Dengan memasukkan hanya jumlah biojisim permukaan (dengan purata masa 20 tahun) dalam setiap kumpulan berfungsi plankton, dimensi data boleh dikurangkan.Selepas kajian terdahulu menunjukkan peranan utama mereka dalam menetapkan struktur komuniti, ia juga termasuk istilah sumber permukaan untuk fluks nutrien (bekalan nitrogen, besi, fosfat dan asid silisik) [cth (20, 21)].Penjumlahan kumpulan berfungsi mengurangkan masalah daripada 55 (51 plankton dan 4 fluks nutrien) kepada 11 dimensi.Dalam kajian awal ini, disebabkan kekangan pengiraan yang dikenakan oleh algoritma, kedalaman dan kebolehubahan masa tidak dipertimbangkan.
Kaedah SAGE dapat mengenal pasti hubungan penting antara proses tak linear dan ciri utama interaksi antara biojisim kumpulan berfungsi dan fluks nutrien.Menggunakan data 11 dimensi berdasarkan kaedah pembelajaran jarak jauh Euclidean (seperti K-means) tidak boleh mendapatkan wilayah yang boleh dipercayai dan boleh dihasilkan semula (19, 22).Ini kerana tiada bentuk Gaussian ditemui dalam taburan asas kovarians unsur-unsur utama yang mentakrifkan wilayah ekologi.K-means bagi sel Voronoi (garis lurus) tidak dapat mengekalkan taburan asas bukan Gaussian.
Biojisim tujuh kumpulan berfungsi plankton dan empat fluks nutrien membentuk vektor 11 dimensi x.Oleh itu, x ialah medan vektor pada grid model, di mana setiap elemen xi mewakili vektor 11 dimensi yang ditakrifkan pada grid mendatar model.Setiap indeks i secara unik mengenal pasti titik grid pada sfera, di mana (lon, lat) = (ϕi, θi).Jika biojisim unit grid model kurang daripada 1.2×10-3mg Chl/m3 atau kadar liputan ais melebihi 70%, log data biojisim digunakan dan dibuang.Data dinormalisasi dan diseragamkan, jadi semua data berada dalam julat [0 hingga 1], min dialih keluar dan diskalakan kepada varians unit.Ini dilakukan supaya ciri-ciri (biojisim dan fluks nutrien) tidak dihadkan oleh kontras dalam julat nilai yang mungkin.Pengelompokan harus menangkap hubungan perubahan daripada jarak kebarangkalian utama antara ciri dan bukannya jarak geografi.Dengan mengukur jarak ini, ciri penting muncul, manakala butiran yang tidak perlu dibuang.Dari sudut pandangan ekologi, ini adalah perlu kerana sesetengah jenis fitoplankton dengan biojisim yang sedikit mungkin mempunyai kesan biogeokimia yang lebih besar, seperti penetapan nitrogen oleh bakteria diazotropik.Apabila menyeragamkan dan menormalkan data, jenis kovariat ini akan diserlahkan.
Dengan menekankan kehampiran ciri dalam ruang dimensi tinggi dalam perwakilan dimensi rendah, algoritma t-SNE digunakan untuk menjadikan kawasan serupa sedia ada lebih jelas.Kerja sebelumnya yang bertujuan untuk membina rangkaian saraf dalam untuk aplikasi penderiaan jauh menggunakan t-SNE, yang membuktikan kemahirannya dalam memisahkan ciri utama (23).Ini adalah langkah yang perlu untuk mengenal pasti pengelompokan teguh dalam data ciri sambil mengelakkan penyelesaian tidak menumpu (nota S2).Menggunakan kernel Gaussian, t-SNE mengekalkan sifat statistik data dengan memetakan setiap objek berdimensi tinggi ke satu titik dalam ruang fasa 3D, dengan itu memastikan kebarangkalian objek serupa dalam arah tinggi dan rendah adalah tinggi dalam ruang dimensi (24).Memandangkan set N objek berdimensi tinggi x1,…,xN, algoritma t-SNE dikurangkan dengan meminimumkan perbezaan Kullback-Leibler (KL) (25).Perbezaan KL ialah ukuran perbezaan taburan kebarangkalian daripada taburan kebarangkalian rujukan kedua, dan boleh menilai secara berkesan kemungkinan korelasi antara perwakilan dimensi rendah bagi ciri dimensi tinggi.Jika xi ialah objek ke-i dalam ruang dimensi-N, xj ialah objek ke-j dalam ruang dimensi-N, yi ialah objek ke-i dalam ruang dimensi rendah, dan yj ialah objek ke-j dalam ruang rendah. -ruang dimensi, kemudian t -SNE mentakrifkan kebarangkalian persamaan ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), dan untuk set pengurangan dimensi q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Rajah 2A menggambarkan kesan pengurangan biojisim dan vektor fluks nutrien gabungan 11 dimensi kepada 3D.Motivasi mengaplikasi t-SNE boleh dibandingkan dengan motivasi analisis komponen utama (PCA), yang menggunakan atribut varians untuk menekankan kawasan/atribut data, dengan itu mengurangkan dimensi.Kaedah t-SNE didapati lebih baik daripada PCA dalam memberikan hasil yang boleh dipercayai dan boleh dihasilkan semula untuk Kementerian Eko (lihat Nota S2).Ini mungkin kerana andaian ortogonal PCA tidak sesuai untuk mengenal pasti interaksi kritikal antara ciri interaktif yang sangat tidak linear, kerana PCA memfokuskan pada struktur kovarians linear (26).Menggunakan data penderiaan jauh, Lunga et al.(27) menggambarkan cara menggunakan kaedah SNE untuk menyerlahkan ciri spektrum kompleks dan tak linear yang menyimpang daripada taburan Gaussian.
(A) Kadar bekalan nutrien yang dimodelkan, biojisim kumpulan berfungsi fitoplankton dan zooplankton yang dilukis oleh algoritma t-SNE dan diwarnakan mengikut wilayah menggunakan DBSCAN.Setiap titik mewakili satu titik dalam ruang dimensi tinggi, seperti yang ditunjukkan dalam Rajah 6B, kebanyakan mata ditangkap.Aci merujuk kepada saiz "t-SNE" 1, 2 dan 3. (B) Unjuran geografi wilayah yang ditemui oleh DBSCAN pada grid latitud-longitud asal.Warna harus dianggap sebagai warna apa pun, tetapi harus sepadan dengan (A).
Titik dalam plot serakan t-SNE dalam Rajah 2A masing-masing dikaitkan dengan latitud dan longitud.Jika dua titik dalam Rajah 2A berdekatan antara satu sama lain, ia adalah kerana biojisim dan fluks nutrien mereka adalah serupa, bukan kerana kedekatan geografi.Warna dalam Rajah 2A adalah kelompok yang ditemui menggunakan kaedah DBSCAN (28).Apabila mencari pemerhatian yang padat, algoritma DBSCAN menggunakan jarak dalam perwakilan 3D antara titik (ϵ = 0.39; untuk maklumat tentang pilihan ini, lihat Bahan dan Kaedah), dan bilangan titik yang serupa diperlukan untuk menentukan kelompok (di sini 100 mata, sila lihat di atas).Kaedah DBSCAN tidak membuat sebarang andaian tentang bentuk atau bilangan kelompok dalam data, seperti yang ditunjukkan di bawah:
3) Untuk semua titik yang dikenal pasti dalam jarak dalam, ulangi langkah 2 secara berulang untuk menentukan sempadan kelompok.Jika bilangan mata lebih besar daripada nilai minimum yang ditetapkan, ia ditetapkan sebagai gugusan.
Data yang tidak memenuhi ahli kluster minimum dan metrik jarak ϵ dianggap "bunyi" dan tidak diberikan warna.DBSCAN ialah algoritma yang pantas dan berskala dengan prestasi O(n2) dalam kes terburuk.Untuk analisis semasa, ia sebenarnya tidak rawak.Bilangan mata minimum ditentukan oleh penilaian pakar.Selepas melaraskan jarak selepas itu, hasilnya tidak cukup stabil dalam julat ≈±10.Jarak ini ditetapkan menggunakan sambungan (Rajah 6A) dan peratusan liputan lautan (Rajah 6B).Ketersambungan ditakrifkan sebagai bilangan komposit kelompok dan sensitif kepada parameter ϵ.Ketersambungan yang lebih rendah menunjukkan pemasangan yang tidak mencukupi, mengelompokkan wilayah secara buatan bersama-sama.Ketersambungan yang tinggi menunjukkan overfitting.Ia boleh dibayangkan untuk menggunakan minimum yang lebih tinggi, tetapi jika minimum melebihi ca, adalah mustahil untuk mencapai penyelesaian yang boleh dipercayai.135 (Untuk butiran lanjut, lihat Bahan dan Kaedah).
115 kelompok yang dikenal pasti dalam Rajah 2A diunjurkan semula ke bumi dalam Rajah 2B.Setiap warna sepadan dengan gabungan koheren faktor biogeokimia dan ekologi yang dikenal pasti oleh DBSCAN.Setelah gugusan ditentukan, perkaitan setiap titik dalam Rajah 2A dengan latitud dan longitud tertentu digunakan untuk mengunjurkan gugusan kembali ke kawasan geografi.Rajah 2B menggambarkan ini dengan warna kelompok yang sama seperti Rajah 2A.Warna yang serupa tidak boleh ditafsirkan sebagai persamaan ekologi, kerana ia ditetapkan mengikut susunan gugusan ditemui oleh algoritma.
Kawasan dalam Rajah 2B boleh serupa secara kualitatif dengan kawasan yang telah ditetapkan dalam fizikal dan/atau biogeokimia lautan.Sebagai contoh, gugusan di Lautan Selatan adalah simetri zon, dengan pusaran oligotropik muncul, dan peralihan tajam menunjukkan pengaruh angin perdagangan.Sebagai contoh, di Pasifik khatulistiwa, kawasan berbeza yang berkaitan dengan kenaikan dilihat.
Untuk memahami persekitaran ekologi Wilayah Eko, satu variasi indeks perbezaan Bray-Curtis (BC) (29) telah digunakan untuk menilai ekologi dalam kelompok.Penunjuk BC ialah data statistik yang digunakan untuk mengukur perbezaan dalam struktur komuniti antara dua tapak yang berbeza.Pengukuran BC boleh digunakan untuk biojisim 51 spesies fitoplankton dan zooplankton BCninj = 1-2CninjSni + Snj
BCninj merujuk kepada persamaan antara kombinasi ni dan gabungan nj, di mana Cninj ialah nilai minimum bagi satu jenis biojisim yang wujud dalam kedua-dua kombinasi ni dan nj, dan Sni mewakili jumlah semua biojisim yang wujud dalam kedua-dua kombinasi ni dan Snj.Perbezaan BC adalah serupa dengan ukuran jarak, tetapi beroperasi dalam ruang bukan Euclidean, yang mungkin lebih sesuai untuk data ekologi dan tafsirannya.
Bagi setiap kluster yang dikenal pasti dalam Rajah 2B, persamaan BC dalam wilayah dan antara wilayah boleh dinilai.Perbezaan SM dalam wilayah merujuk kepada perbezaan antara nilai purata wilayah dan setiap titik dalam wilayah.Perbezaan antara wilayah SM merujuk kepada persamaan antara satu wilayah dengan wilayah lain.Rajah 3A menunjukkan matriks BC simetri (0, hitam: sepadan sepenuhnya; 1, putih: tidak serupa sepenuhnya).Setiap baris dalam graf menunjukkan corak dalam data.Rajah 3B menunjukkan kepentingan geografi keputusan BC dalam Rajah 3A bagi setiap wilayah.Bagi wilayah di kawasan berkhasiat rendah dan rendah nutrien, Rajah 3B menunjukkan bahawa simetri kawasan besar di sekitar khatulistiwa dan Lautan Hindi pada asasnya adalah serupa, tetapi latitud yang lebih tinggi dan kawasan upwelling adalah berbeza dengan ketara.
(A) Tahap perbezaan BC dinilai untuk setiap wilayah berdasarkan purata global permukaan global selama 20 tahun sebanyak 51 plankton.Perhatikan simetri nilai yang dijangkakan.(B) Unjuran spatial bagi lajur (atau baris).Untuk wilayah dalam bulatan distrofik, taburan global ukuran persamaan BC telah dinilai, dan purata 20 tahun global telah dinilai.Hitam (BC = 0) bermaksud kawasan yang sama, dan putih (BC = 1) bermaksud tiada persamaan.
Rajah 4A menggambarkan perbezaan BC dalam setiap wilayah dalam Rajah 2B.Ditentukan dengan menggunakan gabungan purata kawasan purata dalam kelompok, dan menentukan perbezaan antara BC dan min setiap titik grid di wilayah, ia menunjukkan bahawa kaedah SAGE boleh memisahkan 51 spesies berdasarkan persamaan ekologi. data model.Keseluruhan purata ketidaksamaan kluster BC bagi semua 51 jenis ialah 0.102±0.0049.
(A, B, dan D) Perbezaan BC dalam wilayah dinilai sebagai perbezaan purata BC antara setiap komuniti titik grid dan wilayah purata, dan kerumitan tidak dikurangkan.(2) Purata perbezaan BC intra-provinsi global ialah 0.227±0.117.Ini adalah penanda aras klasifikasi berasaskan motivasi ekologi yang dicadangkan oleh karya ini [garisan hijau dalam (C)].(C) Purata perbezaan BC intra-provinsi: Garis hitam mewakili perbezaan BC intra-provinsi dengan kerumitan yang semakin meningkat.2σ berasal daripada 10 ulangan proses pengenalan wilayah eko.Untuk jumlah kerumitan wilayah yang ditemui oleh DBSCAN, (A) menunjukkan bahawa perbezaan BC di wilayah itu ialah 0.099, dan klasifikasi kerumitan yang dicadangkan oleh (C) ialah 12, menghasilkan perbezaan BC sebanyak 0.200 di wilayah itu.seperti yang ditunjukkan oleh gambar.(D).
Dalam Rajah 4B, biojisim 51 jenis plankton digunakan untuk mewakili perbezaan BC yang setara di wilayah Longhurst.Purata keseluruhan setiap wilayah ialah 0.227, dan sisihan piawai mata grid dengan merujuk kepada perbezaan di wilayah BC ialah 0.046.Ini lebih besar daripada kelompok yang dikenal pasti dalam Rajah 1B.Sebaliknya, menggunakan jumlah tujuh kumpulan berfungsi, purata ketidaksamaan intra-musim BC di Longhurst meningkat kepada 0.232.
Peta eko-provinsi global memberikan butiran rumit tentang interaksi ekologi yang unik dan penambahbaikan telah dibuat dalam menggunakan keseluruhan struktur ekosistem Wilayah Longhurst.Kementerian Ekologi dijangka memberikan pandangan tentang proses mengawal ekosistem model berangka, dan pandangan ini akan membantu penerokaan kerja lapangan.Untuk tujuan penyelidikan ini, tidak mungkin untuk memaparkan sepenuhnya lebih daripada seratus wilayah.Bahagian seterusnya memperkenalkan kaedah SAGE yang meringkaskan wilayah.
Salah satu tujuan wilayah adalah untuk menggalakkan pemahaman tentang lokasi dan pengurusan wilayah.Untuk menentukan situasi kecemasan, kaedah dalam Rajah 1B menggambarkan sarang wilayah yang serupa dari segi ekologi.Wilayah eko dikumpulkan bersama berdasarkan persamaan ekologi, dan pengelompokan wilayah tersebut dipanggil AEP.Tetapkan "kerumitan" boleh laras berdasarkan jumlah wilayah yang akan dipertimbangkan.Istilah "kerumitan" digunakan kerana ia membenarkan tahap atribut kecemasan dilaraskan.Untuk mentakrifkan pengagregatan yang bermakna, purata perbezaan BC intra-provinsi sebanyak 0.227 daripada Longhurst digunakan sebagai penanda aras.Di bawah penanda aras ini, wilayah gabungan tidak lagi dianggap berguna.
Seperti yang ditunjukkan dalam Rajah 3B, wilayah ekologi global adalah koheren.Menggunakan perbezaan BC antara wilayah, dapat dilihat bahawa beberapa konfigurasi adalah sangat "biasa".Diilhamkan oleh kaedah genetik dan teori graf, "graf bersambung" digunakan untuk mengisih >100 wilayah berdasarkan wilayah yang paling serupa dengan wilayah tersebut.Metrik "kesambungan" di sini ditentukan menggunakan perbezaan BC antara wilayah (30).Bilangan wilayah dengan ruang yang lebih besar untuk klasifikasi> 100 wilayah boleh dirujuk di sini sebagai kerumitan.AEP ialah produk yang mengkategorikan lebih daripada 100 wilayah sebagai wilayah ekologi paling dominan/terdekat.Setiap wilayah ekologi ditugaskan kepada wilayah ekologi dominan/bersambung tinggi yang paling serupa dengan wilayah tersebut.Pengagregatan ini ditentukan oleh perbezaan BC membolehkan pendekatan bersarang kepada ekologi global.
Kerumitan yang dipilih boleh berupa sebarang nilai dari 1 hingga kerumitan lengkap FIG.2A.Pada kerumitan yang lebih rendah, AEP mungkin merosot disebabkan oleh langkah pengurangan dimensi kebarangkalian (t-SNE).Kemerosotan bermakna wilayah ekologi boleh ditugaskan kepada AEP berbeza antara lelaran, dengan itu mengubah kawasan geografi yang diliputi.Rajah 4C menggambarkan penyebaran ketidaksamaan BC dalam wilayah dalam AEP yang meningkatkan kerumitan merentas 10 pelaksanaan (ilustrasi dalam Rajah 1B).Dalam Rajah 4C, 2σ (kawasan biru) ialah ukuran kemerosotan dalam 10 pelaksanaan, dan garisan hijau mewakili penanda aras Longhurst.Fakta telah membuktikan bahawa kerumitan 12 boleh mengekalkan perbezaan BC di wilayah di bawah penanda aras Longhurst dalam semua pelaksanaan dan mengekalkan degradasi 2σ yang agak kecil.Ringkasnya, kerumitan minimum yang disyorkan ialah 12 AEP, dan purata perbezaan BC intra-provinsi yang dinilai menggunakan 51 jenis plankton ialah 0.198±0.013, seperti yang ditunjukkan dalam Rajah 4D.Dengan menggunakan jumlah tujuh kumpulan berfungsi plankton, perbezaan purata BC dalam wilayah itu ialah 2σ dan bukannya 0.198±0.004.Perbandingan antara perbezaan BC yang dikira dengan jumlah biojisim tujuh kumpulan berfungsi atau biojisim semua 51 jenis plankton menunjukkan bahawa walaupun kaedah SAGE boleh digunakan untuk keadaan 51 dimensi, ia adalah untuk jumlah biojisim tujuh kumpulan berfungsi. Untuk latihan.
Bergantung pada tujuan mana-mana penyelidikan, tahap kerumitan yang berbeza boleh dipertimbangkan.Kajian serantau mungkin memerlukan kerumitan penuh (iaitu, semua 115 wilayah).Sebagai contoh dan untuk kejelasan, pertimbangkan kerumitan minimum yang disyorkan sebanyak 12.
Sebagai contoh kegunaan kaedah SAGE, 12 AEP dengan kerumitan minimum 12 digunakan di sini untuk meneroka kawalan struktur komuniti kecemasan.Rajah 5 menggambarkan cerapan ekologi yang dikumpulkan oleh AEP (dari A hingga L): Dalam stoikiometri Redfield, takat geografi (Rajah 5C), komposisi biojisim kumpulan berfungsi (Rajah 5A) dan bekalan nutrien (Rajah 5B) dilakukan oleh N Zoomed.Nisbah (N:Si:P:Fe, 1:1:16:16×103) ditunjukkan.Untuk panel terakhir, P didarab dengan 16 dan Fe didarab dengan 16 × 103, jadi graf bar adalah bersamaan dengan keperluan pemakanan fitoplankton.
Wilayah dikelaskan kepada 12 AEP A hingga L. (A) Biojisim (mgC/m3) ekosistem di 12 wilayah.(B) Kadar fluks nutrien nitrogen tak organik terlarut (N), besi (Fe), fosfat (P) dan asid silisik (Si) (mmol/m3 setahun).Fe dan P didarab dengan 16 dan 16×103, masing-masing, supaya jalur diseragamkan kepada keperluan stoikiometri fitoplankton.(C) Perhatikan perbezaan antara kawasan kutub, siklon subtropika dan kawasan bermusim/naik utama.Stesen pemantauan ditandakan seperti berikut: 1, SEATS;2, ALOHA;3, stesen P;dan 4, BATS.
AEP yang dikenal pasti adalah unik.Terdapat beberapa simetri di sekeliling khatulistiwa di Lautan Atlantik dan Pasifik, dan kawasan yang serupa tetapi diperbesarkan wujud di Lautan Hindi.Sesetengah AEP merangkumi bahagian barat benua yang dikaitkan dengan pendakian.Arus Circumpolar Kutub Selatan dianggap sebagai ciri zon yang besar.Siklon subtropika ialah siri kompleks AEP oligotropik.Di wilayah ini, corak biasa perbezaan biojisim antara vorteks oligotropik yang dikuasai plankton dan kawasan kutub yang kaya dengan diatom adalah jelas.
AEP dengan jumlah biojisim fitoplankton yang hampir serupa boleh mempunyai struktur komuniti yang sangat berbeza dan meliputi kawasan geografi yang berbeza, seperti D, H, dan K, yang mempunyai jumlah biojisim fitoplankton yang serupa.AEP H kebanyakannya wujud di Lautan Hindi khatulistiwa, dan terdapat lebih banyak bakteria diazotropik.AEP D ditemui di beberapa lembangan, tetapi ia amat menonjol di Pasifik di sekitar kawasan hasil tinggi di sekitar telaga khatulistiwa.Bentuk wilayah Pasifik ini mengingatkan kereta api gelombang planet.Terdapat sedikit diazobakteria dalam AEP D, dan lebih banyak kon.Berbanding dengan dua wilayah lain, AEP K hanya terdapat di dataran tinggi Lautan Artik, dan terdapat lebih banyak diatom dan lebih sedikit plankton.Perlu diingat bahawa jumlah plankton di ketiga-tiga wilayah ini juga sangat berbeza.Antaranya, kelimpahan plankton AEP K agak rendah, manakala AEP D dan H agak tinggi.Oleh itu, walaupun biojisimnya (dan oleh itu serupa dengan Chl-a), wilayah ini agak berbeza: Ujian wilayah berasaskan Chl mungkin tidak menangkap perbezaan ini.
Ia juga jelas bahawa beberapa AEP dengan biojisim yang sangat berbeza mungkin serupa dari segi struktur komuniti fitoplankton.Sebagai contoh, ini boleh dilihat dalam AEP D dan E. Mereka rapat antara satu sama lain, dan di Lautan Pasifik, AEP E hampir dengan AEPJ yang sangat produktif.Begitu juga, tiada kaitan yang jelas antara biojisim fitoplankton dan kelimpahan zooplankton.
AEP boleh difahami dari segi nutrien yang diberikan kepada mereka (Rajah 5B).Diatom hanya wujud apabila terdapat bekalan asid silisik yang mencukupi.Secara amnya, semakin tinggi bekalan asid silisik, semakin tinggi biojisim diatom.Diatom boleh dilihat dalam AEP A, J, K dan L. Nisbah biojisim diatom berbanding fitoplankton lain ditentukan oleh N, P dan Fe yang disediakan berbanding dengan permintaan diatom.Sebagai contoh, AEP L dikuasai oleh diatom.Berbanding dengan nutrien lain, Si mempunyai bekalan yang paling tinggi.Sebaliknya, walaupun produktiviti lebih tinggi, AEP J mempunyai lebih sedikit diatom dan kurang bekalan silikon (semua dan relatif kepada nutrien lain).
Bakteria diazonium mempunyai keupayaan untuk membetulkan nitrogen, tetapi tumbuh dengan perlahan (31).Mereka wujud bersama fitoplankton lain, di mana besi dan fosforus adalah berlebihan berbanding dengan permintaan untuk nutrien bukan diazonium (20, 21).Perlu diingat bahawa biojisim diazotropik adalah agak tinggi, dan bekalan Fe dan P adalah agak besar berbanding dengan bekalan N. Dengan cara ini, walaupun jumlah biojisim dalam AEP J lebih tinggi, biojisim diazonium dalam AEP H adalah lebih besar daripada itu di J. Sila ambil perhatian bahawa AEP J dan H secara geografi sangat berbeza, dan H terletak di Lautan Hindi khatulistiwa.
Jika struktur ekosistem unik tidak dibahagikan kepada wilayah, cerapan yang diperoleh daripada 12 model kerumitan terendah AEP tidak akan begitu jelas.AEP yang dijana oleh SAGE memudahkan perbandingan yang koheren dan serentak bagi maklumat kompleks dan berdimensi tinggi daripada model ekosistem.AEP secara berkesan menekankan mengapa Chl bukan kaedah yang baik dan alternatif untuk menentukan struktur komuniti atau kelimpahan zooplankton pada tahap nutrien yang lebih tinggi.Analisis terperinci tentang topik penyelidikan yang sedang dijalankan adalah di luar skop artikel ini.Kaedah SAGE menyediakan cara untuk meneroka mekanisme lain dalam model yang lebih mudah dikendalikan daripada melihat titik ke titik.
Kaedah SAGE dicadangkan untuk membantu menjelaskan data ekologi yang sangat kompleks daripada model berangka fizikal/biogeokimia/ekosistem global.Wilayah ekologi ditentukan oleh jumlah biojisim kumpulan berfungsi silang-plankton, penggunaan algoritma pengurangan dimensi kebarangkalian t-SNE dan pengelompokan menggunakan kaedah ML tanpa pengawasan DBSCAN.Teori perbezaan/graf BC antara wilayah untuk kaedah bersarang digunakan untuk memperoleh AEP yang teguh yang boleh digunakan untuk tafsiran global.Dari segi pembinaan, Eco-Province dan AEP adalah unik.Sarang AEP boleh dilaraskan antara kerumitan penuh wilayah ekologi asal dan ambang minimum yang disyorkan sebanyak 12 AEP.Bersarang dan menentukan kerumitan minimum AEP dianggap sebagai langkah utama, kerana kebarangkalian t-SNE merosot AEP <12 kerumitan.Kaedah SAGE adalah global, dan kerumitannya berjulat daripada> 100 AEP hingga 12. Untuk kesederhanaan, tumpuan semasa adalah pada kerumitan 12 AEP global.Penyelidikan masa depan, terutamanya kajian serantau, mungkin mendapati subset spatial yang lebih kecil bagi wilayah eko global berguna, dan mungkin diagregatkan di kawasan yang lebih kecil untuk memanfaatkan cerapan ekologi yang sama yang dibincangkan di sini.Ia memberikan cadangan tentang cara wilayah ekologi ini dan cerapan yang diperoleh daripadanya boleh digunakan untuk pemahaman ekologi selanjutnya, memudahkan perbandingan model dan berpotensi meningkatkan pemantauan ekosistem marin.
Wilayah ekologi dan AEP yang dikenal pasti melalui kaedah SAGE adalah berdasarkan data dalam model berangka.Secara definisi, model berangka adalah struktur yang dipermudahkan, cuba menangkap intipati sistem sasaran, dan model yang berbeza akan mempunyai pengedaran plankton yang berbeza.Model berangka yang digunakan dalam kajian ini tidak dapat menangkap sepenuhnya beberapa corak yang diperhatikan (contohnya, dalam anggaran Chl untuk kawasan khatulistiwa dan Lautan Selatan).Hanya sebahagian kecil daripada kepelbagaian di lautan sebenar ditangkap, dan skala meso dan sub-meso tidak dapat diselesaikan, yang boleh menjejaskan fluks nutrien dan struktur komuniti berskala lebih kecil.Di sebalik kekurangan ini, ternyata AEP sangat berguna dalam membantu memahami model yang kompleks.Dengan menilai tempat wilayah ekologi yang serupa ditemui, AEP menyediakan alat perbandingan model berangka yang berpotensi.Model berangka semasa menangkap corak keseluruhan kepekatan fitoplankton penderiaan jauh Chl-a dan taburan saiz plankton dan kumpulan berfungsi (Nota S1 dan Rajah S1) (2, 32).
Seperti yang ditunjukkan oleh garis kontur 0.1 mgChl-a/m-3, AEP dibahagikan kepada kawasan oligotropik dan kawasan mesotropik (Rajah S1B): AEP B, C, D, E, F dan G ialah kawasan oligotropik, dan kawasan selebihnya ialah terletak Higher Chl-a.AEP menunjukkan beberapa surat-menyurat dengan Wilayah Longhurst (Rajah S3A), contohnya, Lautan Selatan dan Pasifik khatulistiwa.Di sesetengah wilayah, AEP meliputi beberapa wilayah Longhurst, dan begitu juga sebaliknya.Memandangkan niat untuk menyekat wilayah di kawasan ini dan Longhurst adalah berbeza, adalah dijangkakan akan ada perbezaan.AEP berbilang di wilayah Longhurst menunjukkan bahawa kawasan tertentu dengan biogeokimia yang serupa mungkin mempunyai struktur ekosistem yang sangat berbeza.AEP mempamerkan surat-menyurat tertentu dengan keadaan fizikal, seperti yang didedahkan menggunakan pembelajaran tanpa seliaan (19), seperti di negeri bertingkat tinggi (contohnya, Lautan Selatan dan Pasifik khatulistiwa; Rajah S3, C dan D).Surat-menyurat ini menunjukkan bahawa struktur komuniti plankton sangat dipengaruhi oleh dinamik lautan.Di kawasan seperti Atlantik Utara, AEP merentasi wilayah fizikal.Mekanisme yang menyebabkan perbezaan ini mungkin termasuk proses seperti pengangkutan habuk, yang boleh membawa kepada program pemakanan yang berbeza sama sekali walaupun dalam keadaan fizikal yang sama.
Kementerian Ekologi dan AEP menegaskan bahawa menggunakan Chl sahaja tidak boleh mengenal pasti komponen ekologi, kerana komuniti ekologi marin telah pun sedar.Ini dilihat dalam AEP dengan biojisim yang sama tetapi komposisi ekologi yang ketara berbeza (seperti D dan E).Sebaliknya, AEP seperti D dan K mempunyai biojisim yang sangat berbeza tetapi komposisi ekologi yang serupa.AEP menekankan bahawa hubungan antara biojisim, komposisi ekologi dan kelimpahan zooplankton adalah kompleks.Sebagai contoh, walaupun AEP J menonjol dari segi fitoplankton dan biojisim plankton, AEP dan L mempunyai biojisim plankton yang serupa, tetapi A mempunyai lebihan plankton yang lebih tinggi.AEP menekankan bahawa biojisim fitoplankton (atau Chl) tidak boleh digunakan untuk meramal biojisim zooplankton.Zooplankton ialah asas rantai makanan perikanan, dan anggaran yang lebih tepat boleh membawa kepada pengurusan sumber yang lebih baik.Satelit warna marin masa hadapan [contohnya, PACE (plankton, aerosol, awan, dan ekosistem marin)] mungkin mempunyai kedudukan yang lebih baik untuk membantu menganggarkan struktur komuniti fitoplankton.Menggunakan ramalan AEP berpotensi memudahkan anggaran zooplankton dari angkasa.Kaedah seperti SAGE, ditambah dengan teknologi baharu dan semakin banyak data lapangan tersedia untuk tinjauan kebenaran tanah (seperti Tara dan penyelidikan susulan), boleh bersama-sama mengambil langkah ke arah pemantauan kesihatan ekosistem berasaskan satelit.
Kaedah SAGE menyediakan cara yang mudah untuk menilai beberapa mekanisme yang mengawal ciri wilayah, seperti biojisim/Chl, pengeluaran primer bersih dan struktur komuniti.Sebagai contoh, jumlah relatif diatom ditetapkan oleh ketidakseimbangan dalam bekalan Si, N, P, dan Fe berbanding keperluan stoikiometrik fitoplankton.Pada kadar bekalan yang seimbang, komuniti didominasi oleh diatom (L).Apabila kadar bekalan tidak seimbang (iaitu, bekalan silikon lebih rendah daripada permintaan nutrien diatom), diatom hanya menyumbang sebahagian kecil Syer (K).Apabila bekalan Fe dan P melebihi bekalan N (contohnya, E dan H), bakteria diazotropik akan berkembang dengan pesat.Melalui konteks yang disediakan oleh AEP, penerokaan mekanisme kawalan akan menjadi lebih berguna.
Eco-Province dan AEP adalah kawasan yang mempunyai struktur komuniti yang serupa.Siri masa dari lokasi tertentu dalam wilayah ekologi atau AEP boleh dianggap sebagai titik rujukan dan boleh mewakili kawasan yang diliputi oleh wilayah ekologi atau AEP.Stesen pemantauan di tapak jangka panjang menyediakan siri masa sedemikian.Set data in-situ jangka panjang akan terus memainkan peranan yang tidak terkira.Dari perspektif memantau struktur komuniti, kaedah SAGE boleh dilihat sebagai satu cara untuk membantu menentukan lokasi tapak baharu yang paling berguna.Sebagai contoh, siri masa daripada penilaian habitat oligotropik jangka panjang (ALOHA) berada dalam AEP B kawasan oligotropik (Rajah 5C, label 2).Oleh kerana ALOHA berdekatan dengan sempadan AEP yang lain, siri masa mungkin tidak mewakili keseluruhan kawasan, seperti yang dicadangkan sebelum ini (33).Dalam AEP B yang sama, siri masa SEATS (Siri Masa Asia Tenggara) terletak di barat daya Taiwan (34), lebih jauh dari sempadan AEP lain (Rajah 5C, label 1), dan boleh digunakan sebagai lokasi yang lebih baik untuk memantau AEPB.Siri masa BATS (Bermuda Atlantic Time Series Study) (Rajah 5C, label 4) dalam AEPC adalah sangat hampir dengan sempadan antara AEP C dan F, yang menunjukkan bahawa pemantauan AEP C menggunakan siri masa BATS secara langsung mungkin bermasalah.Stesen P dalam AEP J (Rajah 5C, label 3) adalah jauh dari sempadan AEP, jadi ia lebih mewakili.Eco-Province dan AEP boleh membantu mewujudkan rangka kerja pemantauan yang sesuai untuk menilai perubahan global, kerana kebenaran wilayah untuk menilai tempat persampelan di tapak boleh memberikan cerapan utama.Kaedah SAGE boleh dikembangkan lagi untuk digunakan pada data iklim untuk menilai kebolehubahan yang menjimatkan masa.
Kejayaan kaedah SAGE dicapai melalui aplikasi sains data/kaedah ML dan pengetahuan khusus domain.Khususnya, t-SNE digunakan untuk melakukan pengurangan dimensi, yang mengekalkan struktur kovarians data berdimensi tinggi dan memudahkan visualisasi topologi kovarians.Data disusun dalam bentuk jalur dan kovarians (Rajah 2A), menunjukkan bahawa ukuran berasaskan jarak semata-mata (seperti K-means) tidak sesuai kerana ia biasanya menggunakan taburan asas Gaussian (bulatan) (dibincangkan dalam Nota S2) .Kaedah DBSCAN sesuai untuk sebarang topologi kovarians.Selagi anda memberi perhatian kepada menetapkan parameter, pengenalan yang boleh dipercayai boleh disediakan.Kos pengiraan algoritma t-SNE adalah tinggi, yang mengehadkan aplikasi semasanya kepada jumlah data yang lebih besar, yang bermaksud sukar untuk digunakan pada medan yang mendalam atau berbeza masa.Usaha untuk skalabiliti t-SNE sedang dijalankan.Oleh kerana jarak KL mudah disejajarkan, algoritma t-SNE mempunyai potensi yang baik untuk pengembangan pada masa hadapan (35).Setakat ini, kaedah pengurangan dimensi lain yang menjanjikan yang boleh mengurangkan saiz dengan lebih baik termasuk teknik penghampiran dan unjuran manifold bersatu (UMAP), tetapi penilaian dalam konteks data lautan adalah perlu.Maksud kebolehskalaan yang lebih baik ialah, sebagai contoh, mengklasifikasikan iklim atau model global dengan kerumitan yang berbeza pada lapisan campuran.Kawasan yang gagal diklasifikasikan oleh SAGE di mana-mana wilayah boleh dianggap sebagai titik hitam yang tinggal dalam Rajah 2A.Secara geografi, kawasan ini kebanyakannya berada di kawasan yang sangat bermusim, yang menunjukkan bahawa menangkap wilayah ekologi yang berubah dari semasa ke semasa akan memberikan liputan yang lebih baik.
Untuk membina kaedah SAGE, idea daripada sistem kompleks/sains data telah digunakan, menggunakan keupayaan untuk menentukan kelompok kumpulan berfungsi (kemungkinan menjadi sangat rapat dalam ruang 11 dimensi) dan menentukan wilayah.Wilayah ini menggambarkan volum tertentu dalam ruang fasa t-SNE 3D kami.Begitu juga, bahagian Poincaré boleh digunakan untuk menilai "isipadu" ruang keadaan yang diduduki oleh trajektori untuk menentukan tingkah laku "normal" atau "huru-hara" (36).Untuk output model 11 dimensi statik, volum yang diduduki selepas data ditukar kepada ruang fasa 3D boleh dijelaskan dengan cara yang sama.Hubungan antara kawasan geografi dan kawasan dalam ruang fasa 3D bukanlah mudah, tetapi ia boleh dijelaskan dari segi persamaan ekologi.Atas sebab ini, ukuran perbezaan BC yang lebih konvensional lebih diutamakan.
Kerja masa depan akan menggunakan semula kaedah SAGE untuk data perubahan bermusim untuk menilai kebolehubahan spatial wilayah dan AEP yang dikenal pasti.Matlamat masa depan adalah menggunakan kaedah ini untuk membantu menentukan wilayah mana yang boleh ditentukan melalui pengukuran satelit (seperti Chl-a, pemantulan penderiaan jauh dan suhu permukaan laut).Ini akan membolehkan penilaian penderiaan jauh bagi komponen ekologi dan pemantauan wilayah ekologi yang sangat fleksibel dan kebolehubahannya.
Tujuan penyelidikan ini adalah untuk memperkenalkan kaedah SAGE, yang mentakrifkan wilayah ekologi melalui struktur komuniti plankton yang unik.Di sini, maklumat lebih terperinci tentang model fizikal/biogeokimia/ekosistem dan pemilihan parameter algoritma t-SNE dan DBSCAN akan disediakan.
Komponen fizikal model datang daripada anggaran peredaran laut dan iklim [ECCOv4;(37) anggaran keadaan global yang diterangkan oleh (38).Resolusi nominal anggaran keadaan ialah 1/5.Kaedah kuasa dua terkecil dengan kaedah pengganda Lagrangian digunakan untuk mendapatkan keadaan awal dan sempadan serta parameter model dalaman yang diselaraskan dengan pemerhatian, seterusnya menghasilkan model kitaran am MIT (MITgcm) (39) yang berjalan bebas, model Selepas pengoptimuman, keputusan boleh dijejaki dan diperhatikan.
Biogeokimia/ekosistem mempunyai penerangan yang lebih lengkap (iaitu persamaan dan nilai parameter) dalam (2).Model ini menangkap peredaran C, N, P, Si dan Fe melalui kolam bukan organik dan organik.Versi yang digunakan di sini termasuk 35 spesies fitoplankton: 2 spesies mikroprokariot dan 2 spesies mikroeukariotik (sesuai untuk persekitaran rendah nutrien), 5 spesies Cryptomonas sphaeroides (dengan salutan kalsium karbonat), 5 spesies diazonium ( Boleh membetulkan nitrogen, jadi ia tidak terhad) ketersediaan nitrogen tak organik terlarut), 11 diatom (membentuk penutup silika), 10 flagellata bercampur-vegetatif (boleh berfotosintesis dan memakan plankton lain) dan 16 Zooplankton (meragut pada plankton lain).Ini dipanggil "kumpulan berfungsi biogeokimia" kerana ia mempunyai kesan yang berbeza pada biogeokimia marin (40, 41) dan sering digunakan dalam pemerhatian dan kajian model.Dalam model ini, setiap kumpulan berfungsi terdiri daripada beberapa plankton dengan saiz yang berbeza, dengan rentang diameter sfera setara 0.6 hingga 2500 μm.
Parameter yang mempengaruhi pertumbuhan fitoplankton, ragut dan tenggelam adalah berkaitan dengan saiz, dan terdapat perbezaan khusus antara enam kumpulan berfungsi fitoplankton (32).Walaupun rangka kerja fizikal berbeza, hasil daripada 51 komponen plankton model telah digunakan dalam beberapa kajian terkini (42-44).
Dari 1992 hingga 2011, model gandingan fizikal/biogeokimia/ekosistem berjalan selama 20 tahun.Output model termasuk biojisim plankton, kepekatan nutrien dan kadar bekalan nutrien (DIN, PO4, Si dan Fe).Dalam kajian ini, purata 20 tahun keluaran ini digunakan sebagai input Wilayah Ekologi.Chl, taburan biojisim plankton dan kepekatan nutrien dan taburan kumpulan berfungsi dibandingkan dengan pemerhatian satelit dan in-situ [lihat (2, 44), Nota S1 dan rajah.S1 hingga S3].
Untuk kaedah SAGE, sumber utama rawak datang daripada langkah t-SNE.Rawak menghalang kebolehulangan, yang bermaksud bahawa hasilnya tidak boleh dipercayai.Kaedah SAGE menguji keteguhan dengan ketat dengan menentukan set parameter t-SNE dan DBSCAN, yang boleh mengenal pasti kelompok secara konsisten apabila diulang.Menentukan "kebingungan" parameter t-SNE boleh difahami sebagai menentukan tahap pemetaan dari dimensi tinggi ke rendah harus menghormati ciri tempatan atau global data.Mencapai kekeliruan 400 dan 300 lelaran.
Untuk algoritma pengelompokan DBSCAN, saiz minimum dan metrik jarak titik data dalam kelompok perlu ditentukan.Bilangan minimum ditentukan di bawah bimbingan pakar.Pengetahuan ini mengetahui perkara yang sesuai dengan rangka kerja dan resolusi pemodelan berangka semasa.Nombor minimum ialah 100. Nilai minimum yang lebih tinggi (kurang daripada <135 sebelum had atas hijau menjadi lebih luas) boleh dipertimbangkan, tetapi ia tidak boleh menggantikan kaedah pengagregatan berdasarkan perbezaan BC.Darjah sambungan (Rajah 6A) digunakan untuk menetapkan parameter ϵ, yang kondusif kepada liputan yang lebih tinggi (Rajah 6B).Ketersambungan ditakrifkan sebagai bilangan komposit kelompok dan sensitif kepada parameter ϵ.Ketersambungan yang lebih rendah menunjukkan pemasangan yang tidak mencukupi, mengelompokkan wilayah secara buatan bersama-sama.Ketersambungan yang tinggi menunjukkan overfitting.Pemasangan berlebihan juga bermasalah, kerana ini menunjukkan bahawa tekaan rawak awal mungkin membawa kepada hasil yang tidak boleh dihasilkan semula.Di antara kedua-dua ekstrem ini, peningkatan mendadak (biasanya dipanggil "siku") menunjukkan ϵ terbaik.Dalam Rajah 6A, anda melihat peningkatan mendadak di kawasan dataran tinggi (kuning,> 200 gugusan), diikuti dengan penurunan mendadak (hijau, 100 gugusan), sehingga kira-kira 130, dikelilingi oleh sangat sedikit gugusan (biru, <60 gugusan) ).Dalam sekurang-kurangnya 100 kawasan biru, sama ada satu gugusan menguasai seluruh lautan (ϵ <0.42), atau kebanyakan lautan tidak dikelaskan dan dianggap bunyi (ϵ> 0.99).Kawasan kuning mempunyai taburan kelompok yang sangat berubah-ubah dan tidak boleh dihasilkan semula.Apabila ϵ berkurang, hingar bertambah.Kawasan hijau yang meningkat secara mendadak dipanggil siku.Ini adalah kawasan yang optimum.Walaupun kebarangkalian t-SNE digunakan, perbezaan BC dalam wilayah masih boleh digunakan untuk menentukan pengelompokan yang boleh dipercayai.Menggunakan Rajah 6 (A dan B), tetapkan ϵ kepada 0.39.Lebih besar bilangan minimum, lebih kecil kebarangkalian untuk mencapai ϵ yang membenarkan pengelasan yang boleh dipercayai, dan lebih besar kawasan hijau dengan nilai lebih besar daripada 135. Pembesaran kawasan ini menunjukkan bahawa siku akan lebih sukar dicari atau tidak- wujud.
Selepas menetapkan parameter t-SNE, jumlah bilangan kluster yang ditemui akan digunakan sebagai ukuran ketersambungan (A) dan peratusan data yang diperuntukkan kepada kluster (B).Titik merah menunjukkan gabungan liputan dan ketersambungan terbaik.Nombor minimum ditetapkan mengikut nombor minimum yang berkaitan dengan ekologi.
Untuk bahan tambahan untuk artikel ini, sila lihat http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ini ialah artikel akses terbuka yang diedarkan di bawah syarat Lesen Atribusi Creative Commons.Artikel itu membenarkan penggunaan, pengedaran dan pengeluaran semula tanpa had dalam mana-mana medium di bawah syarat bahawa karya asal dipetik dengan betul.
Nota: Kami hanya meminta anda memberikan alamat e-mel anda supaya orang yang anda cadangkan ke halaman itu tahu bahawa anda mahu mereka melihat e-mel itu dan ia bukan spam.Kami tidak akan menangkap sebarang alamat e-mel.
Soalan ini digunakan untuk menguji sama ada anda seorang pelawat dan menghalang penyerahan spam automatik.
Kementerian Ekologi Marin Global berazam untuk menyelesaikan masalah yang kompleks dan menggunakan ML tanpa pengawasan untuk meneroka struktur komuniti.
Kementerian Ekologi Marin Global berazam untuk menyelesaikan masalah yang kompleks dan menggunakan ML tanpa pengawasan untuk meneroka struktur komuniti.
Masa siaran: Jan-12-2021