topimg

Mengklarifikasi kompleksitas ekologi: pembelajaran tanpa pengawasan menentukan provinsi ekologi kelautan global

Metode pembelajaran tanpa pengawasan diusulkan untuk menentukan provinsi ekologi kelautan global (eco-provinsi) berdasarkan struktur komunitas plankton dan data fluks nutrisi.Metode provinsi ekologi terintegrasi sistematis (SAGE) dapat mengidentifikasi provinsi ekologi dalam model ekosistem yang sangat nonlinier.Untuk beradaptasi dengan kovarians data non-Gaussian, SAGE menggunakan t random neighbourding (t-SNE) untuk mengurangi dimensi.Dengan bantuan aplikasi kebisingan berdasarkan algoritma pengelompokan spasial berbasis kepadatan (DBSCAN), lebih dari seratus provinsi ekologis dapat diidentifikasi.Dengan menggunakan peta konektivitas dengan perbedaan ekologi sebagai ukuran jarak, provinsi ekologi agregat yang kuat (AEP) didefinisikan secara obyektif melalui provinsi ekologi tersarang.Dengan menggunakan AEP, pengendalian laju pasokan nutrisi pada struktur komunitas dieksplorasi.Eco-provinsi dan AEP bersifat unik dan dapat membantu memberikan model penafsiran.Mereka dapat memfasilitasi perbandingan antar model dan dapat meningkatkan pemahaman dan pemantauan ekosistem laut.
Provinsi adalah wilayah dimana biogeografi kompleks di laut atau darat diorganisasikan menjadi wilayah yang koheren dan bermakna (1).Provinsi-provinsi ini sangat penting untuk membandingkan dan membedakan lokasi, mengkarakterisasi observasi, pemantauan dan perlindungan.Interaksi kompleks dan non-linier yang menghasilkan provinsi-provinsi ini menjadikan metode pembelajaran mesin tanpa pengawasan (ML) sangat cocok untuk menentukan provinsi secara objektif, karena kovarians dalam datanya kompleks dan non-Gaussian.Di sini, metode ML diusulkan, yang secara sistematis mengidentifikasi provinsi ekologi laut (eco-provinsi) yang unik dari model fisik/ekosistem tiga dimensi (3D) global Darwin (2).Istilah “unik” digunakan untuk menunjukkan bahwa wilayah yang diidentifikasi tidak cukup tumpang tindih dengan wilayah lain.Metode ini disebut metode System Integrated Ecological Province (SAGE).Untuk melakukan klasifikasi yang berguna, metode algoritma perlu memungkinkan (i) klasifikasi global dan (ii) analisis multi-skala yang dapat disarangkan/digabungkan dalam ruang dan waktu (3).Dalam penelitian ini, metode SAGE pertama kali diusulkan dan provinsi ekologis yang teridentifikasi dibahas.Eco-provinsi dapat meningkatkan pemahaman tentang faktor-faktor yang mengendalikan struktur masyarakat, memberikan wawasan yang berguna untuk strategi pemantauan, dan membantu melacak perubahan dalam ekosistem.
Provinsi daratan biasanya diklasifikasikan menurut kesamaan iklim (curah hujan dan suhu), tanah, vegetasi, dan fauna, dan digunakan untuk pengelolaan tambahan, penelitian keanekaragaman hayati, dan pengendalian penyakit (1, 4).Provinsi kelautan lebih sulit untuk didefinisikan.Kebanyakan organisme berukuran mikroskopis, dengan batas cair.Longhurst dkk.(5) Memberikan salah satu klasifikasi global pertama dari Kementerian Oseanografi berdasarkan kondisi lingkungan.Definisi provinsi “Longhurst” ini mencakup variabel seperti laju pencampuran, stratifikasi, dan radiasi, serta pengalaman luas Longhurst sebagai ahli kelautan kelautan, yang memiliki kondisi penting lainnya bagi ekosistem laut.Longhurst telah digunakan secara luas, misalnya, untuk menilai produksi primer dan fluks karbon, membantu perikanan, dan merencanakan kegiatan observasi in-situ (5-9).Untuk mendefinisikan provinsi secara lebih obyektif, metode seperti logika fuzzy dan pengelompokan/statistik regional tanpa pengawasan telah digunakan (9-14).Tujuan dari metode tersebut adalah untuk mengidentifikasi struktur bermakna yang dapat mengidentifikasi provinsi dalam data observasi yang tersedia.Misalnya, provinsi kelautan dinamis (12) menggunakan peta yang dapat diatur sendiri untuk mengurangi kebisingan, dan menggunakan pengelompokan hierarki (berbasis pohon) untuk menentukan produk warna laut yang berasal dari satelit regional [klorofil a (Chl-a), tinggi garis Fluoresensi yang dinormalisasi, dan bahan organik terlarut berwarna] dan medan fisik (suhu dan salinitas permukaan laut, topografi dinamis absolut, dan es laut).
Struktur komunitas plankton menjadi perhatian karena ekologinya mempunyai pengaruh besar terhadap tingkat nutrisi yang lebih tinggi, penyerapan karbon dan iklim.Meskipun demikian, masih merupakan suatu tantangan dan tujuan yang sulit untuk ditentukan untuk menentukan provinsi ekologi global berdasarkan struktur komunitas plankton.Satelit warna laut berpotensi memberikan wawasan tentang klasifikasi fitoplankton secara kasar atau menyarankan keunggulan kelompok fungsional (15), namun saat ini satelit tersebut tidak dapat memberikan informasi rinci tentang struktur komunitas.Survei terbaru [misalnya Tara Ocean (16)] memberikan pengukuran struktur komunitas yang belum pernah terjadi sebelumnya;saat ini, hanya ada sedikit observasi in-situ dalam skala global (17).Penelitian sebelumnya sebagian besar telah menentukan “Provinsi Biogeokimia” (12, 14, 18) berdasarkan penentuan kesamaan biokimia (seperti produksi primer, Chl dan cahaya yang tersedia).Di sini, model numerik digunakan untuk menghasilkan keluaran [Darwin(2)], dan provinsi ekologi ditentukan berdasarkan struktur komunitas dan fluks nutrisi.Model numerik yang digunakan dalam penelitian ini memiliki cakupan global dan dapat dibandingkan dengan data lapangan yang ada (17) dan bidang penginderaan jauh (Catatan S1).Data model numerik yang digunakan dalam penelitian ini memiliki keunggulan cakupan global.Ekosistem model terdiri dari 35 spesies fitoplankton dan 16 spesies zooplankton (silakan mengacu pada bahan dan metode).Model tipe plankton berinteraksi secara nonlinier dengan struktur kovarians non-Gaussian, sehingga metode diagnostik sederhana tidak cocok untuk mengidentifikasi pola unik dan konsisten dalam struktur komunitas yang muncul.Metode SAGE yang diperkenalkan di sini memberikan cara baru untuk memeriksa keluaran model Darwin yang kompleks.
Kemampuan transformatif yang kuat dari ilmu data/teknologi ML dapat memungkinkan solusi model yang sangat kompleks untuk mengungkap struktur yang kompleks namun kuat dalam kovarians data.Metode yang kuat didefinisikan sebagai metode yang dapat mereproduksi hasil dengan tepat dalam rentang kesalahan tertentu.Bahkan dalam sistem yang sederhana, menentukan pola dan sinyal yang kuat dapat menjadi sebuah tantangan.Sebelum alasan yang mendasari pola yang diamati dapat ditentukan, kompleksitas yang muncul mungkin tampak rumit/sulit untuk diselesaikan.Proses kunci dalam pengaturan komposisi ekosistem bersifat nonlinier.Adanya interaksi non-linier dapat membingungkan klasifikasi kuat, sehingga perlu menghindari metode yang membuat asumsi kuat tentang distribusi statistik dasar kovarians data.Data berdimensi tinggi dan nonlinier umum ditemukan dalam oseanografi dan mungkin memiliki struktur kovarians dengan topologi non-Gaussian yang kompleks.Meskipun data dengan struktur kovarians non-Gaussian mungkin menghambat klasifikasi yang kuat, metode SAGE merupakan hal baru karena dirancang untuk mengidentifikasi cluster dengan topologi yang berubah-ubah.
Tujuan dari metode SAGE adalah untuk secara obyektif mengidentifikasi pola-pola yang muncul yang dapat membantu pemahaman ekologi lebih lanjut.Mengikuti alur kerja berbasis cluster yang mirip dengan (19), variabel fluks ekologi dan nutrisi digunakan untuk menentukan satu-satunya cluster dalam data, yang disebut provinsi ekologi.Metode SAGE yang diusulkan dalam penelitian ini (Gambar 1) pertama-tama mengurangi dimensi dari 55 menjadi 11 dimensi dengan menjumlahkan gugus fungsi plankton yang ditentukan secara apriori (lihat Bahan dan Metode).Dengan menggunakan metode t-random neighbourding (t-SNE), ukurannya semakin dikurangi dengan memproyeksikan probabilitas ke dalam ruang 3D.Pengelompokan tanpa pengawasan dapat mengidentifikasi kawasan yang dekat secara ekologis [pengelompokan spasial berbasis kepadatan (DBSCAN) untuk aplikasi berbasis kebisingan].Baik t-SNE maupun DBSCAN dapat diterapkan pada data model numerik ekosistem non-linier yang melekat.Kemudian proyeksikan kembali provinsi ekologis yang dihasilkan ke bumi.Lebih dari seratus provinsi ekologi unik telah diidentifikasi, cocok untuk penelitian regional.Untuk mempertimbangkan model ekosistem yang konsisten secara global, metode SAGE digunakan untuk menggabungkan provinsi ekologi menjadi provinsi ekologi agregat (AEP) untuk meningkatkan efektivitas provinsi ekologi.Tingkat agregasi (disebut “kompleksitas”) dapat disesuaikan dengan tingkat detail yang diperlukan.Tentukan kompleksitas minimum AEP yang kuat.Fokus seleksinya adalah metode SAGE dan eksplorasi kasus AEP dengan kompleksitas terkecil untuk menentukan pengendalian struktur komunitas darurat.Pola-pola tersebut kemudian dapat dianalisis untuk memberikan wawasan ekologis.Metode yang diperkenalkan di sini juga dapat digunakan untuk perbandingan model secara lebih luas, misalnya dengan mengevaluasi lokasi provinsi ekologi serupa yang ditemukan dalam model berbeda untuk menyoroti perbedaan dan persamaan, sehingga dapat membandingkan model.
(A) Diagram skema alur kerja untuk menentukan provinsi ekologi;menggunakan penjumlahan dalam gugus fungsi untuk mereduksi data asli 55 dimensi menjadi keluaran model 11 dimensi, termasuk biomassa tujuh plankton fungsional/nutrisi dan empat tingkat pasokan nutrisi.Nilai yang dapat diabaikan dan area lapisan es yang tahan lama.Data telah distandarisasi dan distandarisasi.Berikan data 11 dimensi ke algoritme t-SNE untuk menyorot kombinasi fitur yang serupa secara statistik.DBSCAN akan memilih cluster dengan hati-hati untuk menetapkan nilai parameter.Terakhir, proyeksikan data kembali ke proyeksi lintang/bujur.Harap dicatat bahwa proses ini diulangi 10 kali karena sedikit keacakan mungkin dihasilkan dengan menerapkan t-SNE.(B) menjelaskan cara mendapatkan AEP dengan mengulangi alur kerja di (A) sebanyak 10 kali.Untuk masing-masing dari 10 implementasi ini, matriks ketidaksamaan Bray-Curtis (BC) antarprovinsi ditentukan berdasarkan biomassa 51 jenis fitoplankton.Tentukan selisih BC antar provinsi, dari kompleksitas 1 AEP hingga kompleksitas penuh 115. Patokan BC ditentukan oleh Provinsi Longhurst.
Metode SAGE menggunakan keluaran model numerik fisik/ekosistem 3D global untuk menentukan provinsi ekologi [Darwin (2);lihat Bahan dan Metode dan Catatan S1].Komponen ekosistem terdiri dari 35 spesies fitoplankton dan 16 spesies zooplankton, dengan tujuh kelompok fungsional yang telah ditentukan: prokariota dan eukariota beradaptasi dengan lingkungan dengan nutrisi rendah, coccidia dengan lapisan kalsium karbonat, dan fiksasi nitrogen berat Nutrisi nitrogen (biasanya hilang nutrisi penting), dengan penutup mengandung silika, dapat membuat plankton lain berfotosintesis dan merumput campuran nutrisi flagellata dan penggembala zooplankton.Rentang ukurannya adalah diameter bola setara 0,6 hingga 2500μm.Model distribusi ukuran fitoplankton dan pengelompokan fungsional menangkap keseluruhan karakteristik yang terlihat pada observasi satelit dan in-situ (lihat Gambar S1 hingga S3).Kesamaan antara model numerik dan lautan yang diamati menunjukkan bahwa provinsi yang ditentukan oleh model tersebut mungkin dapat diterapkan pada lautan in-situ.Harap dicatat bahwa model ini hanya menangkap keanekaragaman fitoplankton tertentu, dan hanya rentang tekanan fisik dan kimia tertentu di lautan in situ.Metode SAGE dapat memungkinkan masyarakat untuk lebih memahami mekanisme kontrol regional dari struktur komunitas model.
Dengan hanya memasukkan jumlah biomassa permukaan (dengan waktu rata-rata 20 tahun) pada setiap kelompok fungsional plankton, maka dimensi data dapat dikurangi.Setelah penelitian sebelumnya menunjukkan peran kuncinya dalam menentukan struktur komunitas, penelitian ini juga memasukkan istilah sumber permukaan untuk fluks nutrisi (pasokan nitrogen, besi, fosfat, dan asam silikat) [misalnya (20, 21)] .Penjumlahan gugus fungsi mengurangi masalah dari 55 (51 plankton dan 4 fluks nutrisi) menjadi 11 dimensi.Dalam studi awal ini, karena kendala komputasi yang disebabkan oleh algoritma, variabilitas kedalaman dan waktu tidak dipertimbangkan.
Metode SAGE mampu mengidentifikasi hubungan penting antara proses nonlinier dan fitur utama interaksi antara biomassa kelompok fungsional dan fluks nutrisi.Menggunakan data 11 dimensi berdasarkan metode pembelajaran jarak jauh Euclidean (seperti K-means) tidak dapat memperoleh provinsi yang dapat diandalkan dan dapat direproduksi (19, 22).Hal ini karena tidak ada bentuk Gaussian yang ditemukan dalam distribusi dasar kovarians elemen kunci yang menentukan provinsi ekologi.K-means sel Voronoi (garis lurus) tidak dapat mempertahankan distribusi dasar non-Gaussian.
Biomassa tujuh kelompok fungsional plankton dan empat fluks nutrisi membentuk vektor 11 dimensi x.Oleh karena itu, x adalah bidang vektor pada kisi model, di mana setiap elemen xi mewakili vektor 11 dimensi yang ditentukan pada kisi horizontal model.Setiap indeks i secara unik mengidentifikasi titik grid pada bola, dimana (lon, lat) = (ϕi, θi).Jika biomassa unit jaringan model kurang dari 1,2×10-3mg Chl/m3 atau tingkat cakupan es melebihi 70%, log data biomassa akan digunakan dan dibuang.Data dinormalisasi dan distandarisasi, sehingga semua data berada dalam rentang [0 hingga 1], mean dihilangkan dan diskalakan ke unit varians.Hal ini dilakukan agar fitur (fluks biomassa dan nutrisi) tidak dibatasi oleh kontras dalam kisaran nilai yang memungkinkan.Pengelompokan harus menangkap hubungan perubahan berdasarkan jarak probabilitas utama antar fitur, bukan berdasarkan jarak geografis.Dengan mengkuantifikasi jarak-jarak ini, ciri-ciri penting akan muncul, sementara detail-detail yang tidak diperlukan akan dibuang.Dari sudut pandang ekologi, hal ini diperlukan karena beberapa jenis fitoplankton dengan biomassa kecil mungkin memiliki efek biogeokimia yang lebih besar, seperti fiksasi nitrogen oleh bakteri diazotrofik.Saat melakukan standarisasi dan normalisasi data, jenis kovariat ini akan disorot.
Dengan menekankan kedekatan fitur dalam ruang berdimensi tinggi dalam representasi berdimensi rendah, algoritma t-SNE digunakan untuk memperjelas wilayah serupa yang ada.Pekerjaan sebelumnya yang bertujuan membangun jaringan saraf dalam untuk aplikasi penginderaan jauh menggunakan t-SNE, yang membuktikan keahliannya dalam memisahkan fitur-fitur utama (23).Ini adalah langkah penting untuk mengidentifikasi pengelompokan yang kuat dalam data fitur sambil menghindari solusi non-konvergen (catatan S2).Dengan menggunakan kernel Gaussian, t-SNE mempertahankan properti statistik data dengan memetakan setiap objek berdimensi tinggi ke suatu titik dalam ruang fase 3D, sehingga memastikan bahwa probabilitas objek serupa di arah tinggi dan rendah tinggi dalam arah tinggi dan rendah. ruang dimensi (24).Diberikan sekumpulan N objek berdimensi tinggi x1,…,xN, algoritma t-SNE mereduksi dengan meminimalkan divergensi Kullback-Leibler (KL) (25).Divergensi KL adalah ukuran seberapa berbedanya suatu distribusi probabilitas dari distribusi probabilitas referensi kedua, dan dapat secara efektif mengevaluasi kemungkinan korelasi antara representasi berdimensi rendah dari fitur berdimensi tinggi.Jika xi adalah benda ke-i dalam ruang berdimensi N, xj adalah benda ke-j dalam ruang berdimensi N, yi adalah benda ke-i dalam ruang berdimensi rendah, dan yj adalah benda ke-j dalam ruang berdimensi rendah. -ruang dimensi, maka t -SNE mendefinisikan probabilitas kesamaan ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), dan untuk himpunan reduksi dimensi q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Gambar 2A mengilustrasikan efek pengurangan vektor biomassa dan fluks nutrisi dari kombinasi 11 dimensi menjadi 3D.Motivasi penerapan t-SNE dapat dibandingkan dengan motivasi analisis komponen utama (PCA) yang menggunakan atribut varians untuk menekankan area/atribut data sehingga mengurangi dimensi.Metode t-SNE terbukti lebih unggul dibandingkan PCA dalam memberikan hasil yang dapat diandalkan dan dapat direproduksi bagi Kementerian Lingkungan Hidup (lihat Catatan S2).Hal ini mungkin karena asumsi ortogonalitas PCA tidak cocok untuk mengidentifikasi interaksi kritis antara fitur interaktif yang sangat nonlinier, karena PCA berfokus pada struktur kovarians linier (26).Menggunakan data penginderaan jauh, Lunga dkk.(27) mengilustrasikan cara menggunakan metode SNE untuk menyorot fitur spektral kompleks dan nonlinier yang menyimpang dari distribusi Gaussian.
(A) Model laju pasokan nutrisi, biomassa kelompok fungsional fitoplankton dan zooplankton yang digambarkan dengan algoritma t-SNE dan diwarnai berdasarkan provinsi menggunakan DBSCAN.Setiap titik mewakili satu titik dalam ruang dimensi tinggi, seperti yang ditunjukkan pada Gambar 6B, sebagian besar titik ditangkap.Poros mengacu pada “t-SNE” ukuran 1, 2 dan 3. (B) Proyeksi geografis provinsi yang ditemukan oleh DBSCAN pada grid lintang-bujur asal.Warnanya harus dianggap sebagai warna apa pun, tetapi harus sesuai dengan (A).
Titik-titik pada plot sebar t-SNE pada Gambar 2A masing-masing dikaitkan dengan garis lintang dan garis bujur.Jika kedua titik pada Gambar 2A berdekatan, hal ini disebabkan karena fluks biomassa dan unsur haranya serupa, bukan karena kedekatan geografisnya.Warna pada Gambar 2A adalah cluster yang ditemukan menggunakan metode DBSCAN (28).Saat mencari observasi padat, algoritma DBSCAN menggunakan jarak dalam representasi 3D antar titik (ϵ = 0,39; untuk informasi tentang pilihan ini, lihat Bahan dan Metode), dan jumlah titik serupa diperlukan untuk mendefinisikan cluster (di sini 100 poin, silakan lihat di atas).Metode DBSCAN tidak membuat asumsi apapun mengenai bentuk atau jumlah cluster pada datanya, seperti gambar di bawah ini:
3) Untuk semua titik yang diidentifikasi berada dalam jarak dalam, ulangi langkah 2 secara berulang untuk menentukan batas cluster.Jika jumlah titik lebih besar dari nilai minimum yang ditetapkan, maka ditetapkan sebagai cluster.
Data yang tidak memenuhi anggota cluster minimum dan jarak ϵ metrik dianggap “noise” dan tidak diberi warna.DBSCAN adalah algoritma yang cepat dan terukur dengan kinerja O(n2) dalam kasus terburuk.Untuk analisis saat ini sebenarnya tidak acak.Jumlah minimum poin ditentukan oleh evaluasi ahli.Setelah diatur jaraknya, hasilnya kurang stabil di kisaran ≈±10.Jarak ini ditentukan berdasarkan konektivitas (Gambar 6A) dan persentase cakupan lautan (Gambar 6B).Konektivitas didefinisikan sebagai jumlah gabungan cluster dan sensitif terhadap parameter ϵ.Konektivitas yang lebih rendah menunjukkan kurangnya kesesuaian, pengelompokan wilayah secara artifisial.Konektivitas tinggi menunjukkan overfitting.Dimungkinkan untuk menggunakan nilai minimum yang lebih tinggi, tetapi jika nilai minimum melebihi ca, tidak mungkin mencapai solusi yang andal.135 (Untuk lebih jelasnya lihat Bahan dan Cara).
115 cluster yang diidentifikasi pada Gambar 2A diproyeksikan kembali ke bumi pada Gambar 2B.Setiap warna sesuai dengan kombinasi faktor biogeokimia dan ekologi yang koheren yang diidentifikasi oleh DBSCAN.Setelah cluster ditentukan, asosiasi setiap titik pada Gambar 2A dengan garis lintang dan bujur tertentu digunakan untuk memproyeksikan cluster kembali ke wilayah geografis.Gambar 2B mengilustrasikan hal ini dengan warna cluster yang sama seperti Gambar 2A.Warna yang serupa tidak boleh diartikan sebagai kesamaan ekologis, karena warna tersebut ditetapkan berdasarkan urutan penemuan cluster oleh algoritme.
Wilayah pada Gambar 2B secara kualitatif dapat serupa dengan wilayah yang sudah ada secara fisik dan/atau biogeokimia lautan.Misalnya, gugusan di Samudra Selatan memiliki zona-simetris, dengan munculnya vortisitas oligotrofik, dan transisi yang tajam menunjukkan pengaruh angin pasat.Misalnya, di Pasifik khatulistiwa, terlihat berbagai wilayah yang terkait dengan kenaikan tersebut.
Untuk memahami lingkungan ekologi Eco-Province, variasi indeks perbedaan Bray-Curtis (BC) (29) digunakan untuk mengevaluasi ekologi di cluster.Indikator BC adalah data statistik yang digunakan untuk mengukur perbedaan struktur komunitas antara dua lokasi berbeda.Pengukuran BC dapat diterapkan pada biomassa 51 spesies fitoplankton dan zooplankton BCninj = 1-2CninjSni + Snj
BCninj mengacu pada persamaan antara kombinasi ni dan kombinasi nj, dimana Cninj adalah nilai minimum dari satu jenis biomassa yang ada pada kedua kombinasi ni dan nj, dan Sni mewakili jumlah seluruh biomassa yang ada pada kedua kombinasi ni dan Snj.Perbedaan BC mirip dengan ukuran jarak, namun beroperasi di ruang non-Euclidean, yang mungkin lebih cocok untuk data ekologi dan interpretasinya.
Untuk setiap cluster yang diidentifikasi pada Gambar 2B, dapat dinilai kesamaan BC intra-provinsi dan antar-provinsi.Selisih BC dalam suatu provinsi mengacu pada selisih antara nilai rata-rata provinsi tersebut dengan setiap titik di provinsi tersebut.Perbedaan provinsi BC mengacu pada persamaan antara satu provinsi dengan provinsi lainnya.Gambar 3A menunjukkan matriks BC simetris (0, hitam: bersesuaian sepenuhnya; 1, putih: sangat berbeda).Setiap baris pada grafik menunjukkan suatu pola pada data.Gambar 3B menunjukkan signifikansi geografis hasil BC pada Gambar 3A untuk masing-masing provinsi.Untuk provinsi yang berada di daerah bergizi rendah dan rendah gizi, Gambar 3B menunjukkan bahwa simetri wilayah luas di sekitar khatulistiwa dan Samudera Hindia pada dasarnya serupa, namun pada garis lintang yang lebih tinggi dan daerah upwelling berbeda nyata.
(A) Derajat perbedaan BC dievaluasi untuk setiap provinsi berdasarkan rata-rata global rata-rata permukaan global selama 20 tahun sebanyak 51 plankton.Perhatikan simetri nilai yang diharapkan.(B) Proyeksi spasial suatu kolom (atau baris).Untuk provinsi yang berada dalam lingkaran distrofi, distribusi global ukuran kesamaan BC dievaluasi, dan rata-rata global selama 20 tahun dievaluasi.Hitam (BC = 0) berarti luasnya sama, dan putih (BC = 1) berarti tidak ada kemiripan.
Gambar 4A menggambarkan perbedaan BC tiap provinsi pada Gambar 2B.Ditentukan dengan menggunakan kombinasi rata-rata luas rata-rata dalam suatu cluster, dan menentukan ketidaksamaan antara BC dengan rata-rata setiap titik grid di provinsi tersebut, menunjukkan bahwa metode SAGE dapat dengan baik memisahkan 51 spesies berdasarkan kesamaan ekologi. data model.Rata-rata keseluruhan ketidaksamaan cluster BC dari seluruh 51 tipe adalah 0,102±0,0049.
(A, B, dan D) Perbedaan BC dalam suatu provinsi dievaluasi sebagai perbedaan BC rata-rata antara setiap komunitas titik grid dan rata-rata provinsi, dan kompleksitasnya tidak berkurang.(2) Rata-rata perbedaan BC intra-provinsi secara global adalah 0,227±0,117.Ini adalah tolok ukur klasifikasi berbasis motivasi ekologi yang diusulkan oleh penelitian ini [garis hijau di (C)].(C) Rata-rata perbedaan BC intra-provinsi: Garis hitam mewakili perbedaan BC intra-provinsi dengan kompleksitas yang semakin meningkat.2σ berasal dari 10 kali pengulangan proses identifikasi eco-provinsi.Untuk kompleksitas total provinsi yang ditemukan oleh DBSCAN, (A) menunjukkan bahwa ketidaksamaan BC di provinsi tersebut adalah 0,099, dan klasifikasi kompleksitas yang diusulkan oleh (C) adalah 12, sehingga menghasilkan ketidaksamaan BC di provinsi tersebut sebesar 0,200.seperti yang ditunjukkan gambar.(D).
Pada Gambar 4B, biomassa dari 51 jenis plankton digunakan untuk mewakili perbedaan BC yang setara di provinsi Longhurst.Rata-rata keseluruhan setiap provinsi adalah 0,227, dan standar deviasi titik grid dengan mengacu pada selisih provinsi BC adalah 0,046.Ini lebih besar dari cluster yang diidentifikasi pada Gambar 1B.Sebaliknya, dengan menggunakan jumlah tujuh gugus fungsi, rata-rata ketidaksamaan SM intra-musim di Longhurst meningkat menjadi 0,232.
Peta eko-provinsi global memberikan rincian rumit tentang interaksi ekologi yang unik dan perbaikan telah dilakukan dalam menggunakan seluruh struktur ekosistem di Provinsi Longhurst.Kementerian Ekologi diharapkan dapat memberikan wawasan mengenai proses pengendalian ekosistem model numerik, dan wawasan ini akan membantu eksplorasi kerja lapangan.Untuk keperluan penelitian ini, tidak mungkin menampilkan secara lengkap lebih dari seratus provinsi.Bagian selanjutnya memperkenalkan metode SAGE yang merangkum provinsi-provinsi.
Salah satu tujuan provinsi ini adalah untuk meningkatkan pemahaman tentang lokasi dan pengelolaan provinsi.Untuk menentukan situasi darurat, metode pada Gambar 1B mengilustrasikan penempatan provinsi-provinsi yang secara ekologis serupa.Eco-provinsi dikelompokkan berdasarkan kesamaan ekologi, dan pengelompokan provinsi tersebut disebut AEP.Tetapkan “kompleksitas” yang dapat disesuaikan berdasarkan jumlah total provinsi yang akan dipertimbangkan.Istilah “kompleksitas” digunakan karena memungkinkan penyesuaian tingkat atribut darurat.Untuk menentukan agregasi yang bermakna, rata-rata perbedaan BC intra-provinsi sebesar 0,227 dari Longhurst digunakan sebagai patokan.Di bawah tolok ukur ini, gabungan provinsi-provinsi tersebut tidak lagi dianggap berguna.
Seperti ditunjukkan pada Gambar 3B, provinsi-provinsi ekologi global bersifat koheren.Dengan menggunakan perbedaan BC antarprovinsi, terlihat bahwa beberapa konfigurasi sangat “umum”.Terinspirasi oleh metode genetika dan teori graf, “grafik terhubung” digunakan untuk mengurutkan >100 provinsi berdasarkan provinsi yang paling mirip.Metrik “konektivitas” di sini ditentukan dengan menggunakan ketidaksamaan BC antarprovinsi (30).Banyaknya provinsi yang ruang klasifikasinya lebih besar > 100 provinsi dalam hal ini dapat disebut kompleksitas.AEP merupakan produk yang mengkategorikan lebih dari 100 provinsi sebagai provinsi ekologi paling dominan/terdekat.Setiap provinsi ekologis ditetapkan ke provinsi ekologi dominan/sangat terhubung yang paling mirip dengannya.Agregasi yang ditentukan oleh perbedaan BC ini memungkinkan pendekatan tersarang terhadap ekologi global.
Kompleksitas yang dipilih dapat berupa nilai apa pun dari 1 hingga kompleksitas lengkap pada Gambar.2A.Pada kompleksitas yang lebih rendah, AEP dapat merosot karena langkah reduksi dimensi probabilistik (t-SNE).Degenerasi berarti bahwa provinsi ekologi dapat ditetapkan ke AEP yang berbeda antar iterasi, sehingga mengubah wilayah geografis yang dicakup.Gambar 4C mengilustrasikan penyebaran ketidaksamaan BC antar provinsi dalam AEP yang semakin kompleks di 10 implementasi (ilustrasi pada Gambar 1B).Pada Gambar 4C, 2σ (area biru) adalah ukuran degradasi dalam 10 implementasi, dan garis hijau mewakili tolok ukur Longhurst.Fakta membuktikan bahwa kompleksitas 12 dapat menjaga perbedaan BC di provinsi tersebut di bawah tolok ukur Longhurst dalam semua implementasi dan mempertahankan degradasi 2σ yang relatif kecil.Ringkasnya, kompleksitas minimum yang direkomendasikan adalah 12 AEP, dan rata-rata perbedaan BC antarprovinsi yang dievaluasi menggunakan 51 jenis plankton adalah 0,198±0,013, seperti yang ditunjukkan pada Gambar 4D.Dengan menggunakan penjumlahan tujuh gugus fungsi plankton, rata-rata perbedaan BC di provinsi tersebut adalah 2σ, bukan 0,198±0,004.Perbandingan antara selisih BC yang dihitung dengan total biomassa tujuh gugus fungsi atau biomassa seluruh 51 jenis plankton menunjukkan bahwa meskipun metode SAGE dapat diterapkan pada situasi 51 dimensi, namun berlaku untuk total biomassa tujuh gugus fungsi. Untuk latihan.
Tergantung pada tujuan penelitian, tingkat kompleksitas yang berbeda dapat dipertimbangkan.Studi regional mungkin memerlukan kompleksitas penuh (yaitu seluruh 115 provinsi).Sebagai contoh dan untuk kejelasan, pertimbangkan kompleksitas minimum yang disarankan yaitu 12.
Sebagai contoh kegunaan metode SAGE, 12 AEP dengan kompleksitas minimum 12 digunakan di sini untuk mengeksplorasi pengendalian struktur komunitas darurat.Gambar 5 mengilustrasikan wawasan ekologi yang dikelompokkan berdasarkan AEP (dari A ke L): Dalam stoikiometri Redfield, luas geografis (Gambar 5C), komposisi biomassa kelompok fungsional (Gambar 5A) dan pasokan nutrisi (Gambar 5B) dilakukan dengan N Zoomed.Rasio (N:Si:P:Fe, 1:1:16:16×103) ditampilkan.Untuk panel terakhir, P dikalikan 16 dan Fe dikalikan 16×103, sehingga grafik batang setara dengan kebutuhan nutrisi fitoplankton.
Provinsi-provinsi tersebut diklasifikasikan menjadi 12 AEP A hingga L. (A) Biomassa (mgC/m3) ekosistem di 12 provinsi.(B) Laju fluks nutrisi nitrogen anorganik terlarut (N), besi (Fe), fosfat (P) dan asam silikat (Si) (mmol/m3 per tahun).Fe dan P dikalikan masing-masing dengan 16 dan 16×103, sehingga strip tersebut terstandarisasi dengan persyaratan stoikiometri fitoplankton.(C) Perhatikan perbedaan antara wilayah kutub, siklon subtropis, dan wilayah musiman/naik tinggi.Stasiun pemantauan ditandai sebagai berikut: 1, SEATS;2, ALOHA;3, stasiun P;dan 4, KELELAWAR.
AEP yang diidentifikasi adalah unik.Terdapat beberapa simetri di sekitar khatulistiwa di Samudera Atlantik dan Pasifik, dan wilayah serupa namun lebih luas terdapat di Samudera Hindia.Beberapa AEP mencakup sisi barat benua yang terkait dengan pendakian.Arus Sirkumpolar Kutub Selatan dianggap sebagai fitur zonal yang besar.Siklon subtropis adalah rangkaian kompleks AEP oligotrofik.Di provinsi-provinsi ini, pola perbedaan biomassa antara pusaran oligotrofik yang didominasi plankton dan daerah kutub yang kaya diatom terlihat jelas.
AEP dengan total biomassa fitoplankton yang sangat mirip dapat memiliki struktur komunitas yang sangat berbeda dan mencakup wilayah geografis yang berbeda, seperti D, H, dan K, yang memiliki total biomassa fitoplankton serupa.AEP H terutama ada di Samudera Hindia khatulistiwa, dan terdapat lebih banyak bakteri diazotrofik.AEP D ditemukan di beberapa cekungan, namun sangat menonjol di Pasifik sekitar daerah dengan hasil panen tinggi di sekitar upwelling khatulistiwa.Bentuk provinsi Pasifik ini mengingatkan kita pada kereta gelombang planet.Ada sedikit diazobakteri di AEP D, dan lebih banyak kerucut.Dibandingkan dengan dua provinsi lainnya, AEP K hanya ditemukan di dataran tinggi Samudera Arktik, dan terdapat lebih banyak diatom dan lebih sedikit plankton.Perlu diketahui, jumlah plankton di ketiga wilayah ini juga sangat berbeda.Diantaranya, kelimpahan plankton AEP K relatif rendah, sedangkan AEP D dan H relatif tinggi.Oleh karena itu, meskipun biomassanya (dan karenanya mirip dengan Chl-a), provinsi-provinsi ini sangat berbeda: pengujian provinsi berbasis Chl mungkin tidak dapat menangkap perbedaan-perbedaan ini.
Jelas juga bahwa beberapa AEP dengan biomassa yang sangat berbeda mungkin serupa dalam hal struktur komunitas fitoplankton.Misalnya, hal ini terlihat pada AEP D dan E. Letaknya berdekatan, dan di Samudera Pasifik, AEP E berdekatan dengan AEPJ yang sangat produktif.Demikian pula, tidak ada hubungan yang jelas antara biomassa fitoplankton dan kelimpahan zooplankton.
AEP dapat dipahami dari segi nutrisi yang diberikan kepada mereka (Gambar 5B).Diatom hanya ada jika terdapat banyak pasokan asam silikat.Secara umum, semakin tinggi pasokan asam silikat, semakin tinggi pula biomassa diatom.Diatom dapat dilihat pada AEP A, J, K dan L. Rasio biomassa diatom relatif terhadap fitoplankton lainnya ditentukan oleh N, P dan Fe yang disediakan relatif terhadap kebutuhan diatom.Misalnya AEP L didominasi oleh diatom.Dibandingkan dengan unsur hara lainnya, Si mempunyai persediaan paling tinggi.Sebaliknya, meskipun produktivitasnya lebih tinggi, AEP J memiliki lebih sedikit diatom dan lebih sedikit pasokan silikon (semuanya dan relatif terhadap nutrisi lainnya).
Bakteri diazonium memiliki kemampuan memfiksasi nitrogen, namun pertumbuhannya lambat (31).Mereka hidup berdampingan dengan fitoplankton lain, di mana zat besi dan fosfor berlebih dibandingkan dengan kebutuhan nutrisi non-diazonium (20, 21).Perlu dicatat bahwa biomassa diazotrofik relatif tinggi, dan pasokan Fe dan P relatif besar dibandingkan pasokan N. Dengan cara ini, meskipun total biomassa di AEP J lebih tinggi, biomassa diazonium di AEP H adalah lebih besar dari pada J. Perlu diketahui bahwa AEP J dan H secara geografis sangat berbeda, dan H terletak di garis khatulistiwa Samudera Hindia.
Jika struktur ekosistem yang unik tidak dibagi menjadi beberapa provinsi, wawasan yang diperoleh dari 12 model kompleksitas terendah AEP tidak akan begitu jelas.AEP yang dihasilkan oleh SAGE memfasilitasi perbandingan informasi kompleks dan berdimensi tinggi yang koheren dan simultan dari model ekosistem.AEP secara efektif menekankan mengapa Chl bukanlah metode yang baik dan alternatif untuk menentukan struktur komunitas atau kelimpahan zooplankton pada tingkat nutrisi yang lebih tinggi.Analisis terperinci mengenai topik penelitian yang sedang berlangsung berada di luar cakupan artikel ini.Metode SAGE menyediakan cara untuk mengeksplorasi mekanisme lain dalam model yang lebih mudah ditangani daripada tampilan point-to-point.
Metode SAGE diusulkan untuk membantu memperjelas data ekologi yang sangat kompleks dari model numerik fisik/biogeokimia/ekosistem global.Provinsi ekologis ditentukan oleh total biomassa kelompok fungsional lintas plankton, penerapan algoritma reduksi dimensi probabilitas t-SNE dan pengelompokan menggunakan metode ML tanpa pengawasan DBSCAN.Teori grafik/perbedaan BC antarprovinsi untuk metode nesting diterapkan untuk mendapatkan AEP yang kuat dan dapat digunakan untuk interpretasi global.Dalam hal konstruksi, Eco-Province dan AEP memiliki keunikan.Penyusunan AEP dapat disesuaikan antara kompleksitas penuh dari provinsi ekologi asli dan ambang batas minimum yang direkomendasikan yaitu 12 AEP.Penyusunan dan penentuan kompleksitas minimum AEP dianggap sebagai langkah kunci, karena kemungkinan t-SNE menurunkan AEP dengan kompleksitas <12.Metode SAGE bersifat global, dan kompleksitasnya berkisar antara> 100 AEP hingga 12. Untuk mempermudah, fokus saat ini adalah pada kompleksitas 12 AEP global.Penelitian di masa depan, khususnya studi regional, mungkin akan menemukan manfaat dari subset spasial yang lebih kecil dari eco-provinsi global, dan dapat dikumpulkan dalam wilayah yang lebih kecil untuk memanfaatkan wawasan ekologi yang sama yang dibahas di sini.Laporan ini memberikan saran mengenai bagaimana provinsi-provinsi ekologis ini dan wawasan yang diperoleh dari provinsi-provinsi tersebut dapat digunakan untuk pemahaman ekologi lebih lanjut, memfasilitasi perbandingan model, dan berpotensi meningkatkan pemantauan ekosistem laut.
Provinsi ekologi dan AEP yang diidentifikasi dengan metode SAGE didasarkan pada data dalam model numerik.Menurut definisinya, model numerik adalah struktur yang disederhanakan, mencoba menangkap esensi sistem target, dan model yang berbeda akan memiliki distribusi plankton yang berbeda.Model numerik yang digunakan dalam penelitian ini tidak dapat sepenuhnya menangkap beberapa pola yang diamati (misalnya pada perkiraan Chl untuk wilayah khatulistiwa dan Samudra Selatan).Hanya sebagian kecil dari keanekaragaman di lautan sebenarnya yang tertangkap, dan skala meso dan sub-meso tidak dapat diatasi, sehingga dapat mempengaruhi fluks nutrisi dan struktur komunitas skala kecil.Terlepas dari kekurangan tersebut, ternyata AEP sangat berguna dalam membantu memahami model yang kompleks.Dengan mengevaluasi lokasi provinsi ekologi serupa, AEP menyediakan alat perbandingan model numerik yang potensial.Model numerik saat ini menangkap pola keseluruhan konsentrasi fitoplankton Chl-a penginderaan jauh dan distribusi ukuran plankton dan kelompok fungsional (Catatan S1 dan Gambar S1) (2, 32).
Seperti yang ditunjukkan oleh garis kontur 0,1 mgChl-a/m-3, AEP dibagi menjadi area oligotrofik dan area mesotrofik (Gambar S1B): AEP B, C, D, E, F dan G adalah area oligotrofik, dan area sisanya adalah terletak Lebih Tinggi Chl-a.AEP menunjukkan beberapa korespondensi dengan Provinsi Longhurst (Gambar S3A), misalnya Samudera Selatan dan Pasifik khatulistiwa.Di beberapa wilayah, AEP mencakup beberapa wilayah Longhurst, dan sebaliknya.Karena maksud penetapan batas provinsi di wilayah ini dan Longhurst berbeda, maka diperkirakan akan terjadi perbedaan.Beberapa AEP di provinsi Longhurst menunjukkan bahwa wilayah tertentu dengan biogeokimia serupa mungkin memiliki struktur ekosistem yang sangat berbeda.AEP menunjukkan korespondensi tertentu dengan keadaan fisik, seperti yang diungkapkan dengan menggunakan pembelajaran tanpa pengawasan (19), seperti di negara-negara dengan upwelling tinggi (misalnya, Samudra Selatan dan Pasifik khatulistiwa; Gambar S3, C dan D).Korespondensi ini menunjukkan bahwa struktur komunitas plankton sangat dipengaruhi oleh dinamika lautan.Di wilayah seperti Atlantik Utara, AEP melintasi provinsi fisik.Mekanisme yang menyebabkan perbedaan ini mungkin mencakup proses seperti pengangkutan debu, yang dapat menyebabkan program nutrisi yang sangat berbeda bahkan dalam kondisi fisik yang serupa.
Kementerian Ekologi dan AEP menekankan bahwa penggunaan Chl saja tidak dapat mengidentifikasi komponen ekologi, seperti yang telah disadari oleh komunitas ekologi kelautan.Hal ini terlihat pada AEP dengan biomassa serupa tetapi komposisi ekologisnya sangat berbeda (seperti D dan E).Sebaliknya, AEP seperti D dan K memiliki biomassa yang sangat berbeda namun komposisi ekologinya serupa.AEP menekankan bahwa hubungan antara biomassa, komposisi ekologi, dan kelimpahan zooplankton sangatlah kompleks.Misalnya, meskipun AEP J menonjol dalam hal biomassa fitoplankton dan plankton, A dan L AEP memiliki biomassa plankton yang serupa, namun A memiliki kelimpahan plankton yang lebih tinggi.AEP menekankan bahwa biomassa fitoplankton (atau Chl) tidak dapat digunakan untuk memprediksi biomassa zooplankton.Zooplankton adalah fondasi rantai makanan perikanan, dan perkiraan yang lebih akurat dapat menghasilkan pengelolaan sumber daya yang lebih baik.Satelit warna laut di masa depan [misalnya, PACE (plankton, aerosol, cloud, dan ekosistem laut)] mungkin memiliki posisi yang lebih baik untuk membantu memperkirakan struktur komunitas fitoplankton.Penggunaan prediksi AEP berpotensi memfasilitasi estimasi zooplankton dari luar angkasa.Metode seperti SAGE, ditambah dengan teknologi baru, dan semakin banyak data lapangan yang tersedia untuk survei kebenaran lapangan (seperti Tara dan penelitian lanjutan), dapat bersama-sama mengambil langkah menuju pemantauan kesehatan ekosistem berbasis satelit.
Metode SAGE memberikan cara yang mudah untuk mengevaluasi beberapa mekanisme yang mengendalikan karakteristik provinsi, seperti biomassa/Chl, produksi primer bersih, dan struktur komunitas.Misalnya, jumlah relatif diatom ditentukan oleh ketidakseimbangan pasokan Si, N, P, dan Fe relatif terhadap kebutuhan stoikiometri fitoplankton.Pada tingkat pasokan yang seimbang, masyarakat didominasi oleh diatom (L).Ketika tingkat pasokan tidak seimbang (yaitu pasokan silikon lebih rendah dari kebutuhan nutrisi diatom), diatom hanya menyumbang sebagian kecil Share (K).Ketika pasokan Fe dan P melebihi pasokan N (misalnya E dan H), bakteri diazotrofik akan tumbuh subur.Melalui konteks yang diberikan oleh AEP, eksplorasi mekanisme pengendalian akan menjadi lebih bermanfaat.
Eco-Province dan AEP adalah wilayah dengan struktur komunitas yang serupa.Rangkaian waktu dari suatu lokasi tertentu dalam suatu provinsi ekologi atau AEP dapat dianggap sebagai titik acuan dan dapat mewakili wilayah yang dicakup oleh provinsi ekologi atau AEP tersebut.Stasiun pemantauan jangka panjang di lokasi menyediakan rangkaian waktu seperti itu.Kumpulan data in-situ jangka panjang akan terus memainkan peran yang sangat penting.Dari perspektif pemantauan struktur komunitas, metode SAGE dapat dilihat sebagai cara untuk membantu menentukan lokasi situs baru yang paling berguna.Misalnya, rangkaian waktu dari penilaian habitat oligotrofik jangka panjang (ALOHA) berada di AEP B kawasan oligotrofik (Gambar 5C, label 2).Karena ALOHA dekat dengan batas AEP lain, rangkaian waktu mungkin tidak mewakili keseluruhan wilayah, seperti yang disarankan sebelumnya (33).Pada AEP B yang sama, rangkaian waktu SEATS (Southeast Asian Time Series) berlokasi di barat daya Taiwan (34), lebih jauh dari batas AEP lainnya (Gambar 5C, label 1), dan dapat digunakan sebagai lokasi yang lebih baik untuk memantau AEPB.Deret waktu BATS (Bermuda Atlantic Time Series Study) (Gambar 5C, label 4) di AEPC sangat dekat dengan batas antara AEP C dan F, yang menunjukkan bahwa pemantauan AEP C menggunakan deret waktu BATS mungkin secara langsung menimbulkan masalah.Stasiun P pada AEP J (Gambar 5C, label 3) terletak jauh dari batas AEP sehingga lebih representatif.Eco-Province dan AEP dapat membantu membangun kerangka pemantauan yang sesuai untuk menilai perubahan global, karena izin provinsi untuk menilai pengambilan sampel di lokasi dapat memberikan wawasan penting.Metode SAGE dapat dikembangkan lebih lanjut untuk diterapkan pada data iklim guna menilai variabilitas yang menghemat waktu.
Keberhasilan metode SAGE dicapai melalui penerapan metode ilmu data/ML dan pengetahuan khusus domain secara cermat.Secara khusus, t-SNE digunakan untuk melakukan reduksi dimensi, yang mempertahankan struktur kovarians data berdimensi tinggi dan memfasilitasi visualisasi topologi kovarians.Data disusun dalam bentuk garis dan kovarians (Gambar 2A), yang menunjukkan bahwa pengukuran berbasis jarak murni (seperti K-means) tidak tepat karena biasanya menggunakan distribusi basis Gaussian (melingkar) (dibahas dalam Catatan S2) .Metode DBSCAN cocok untuk topologi kovarians apa pun.Selama Anda memperhatikan parameter pengaturan, identifikasi yang andal dapat diberikan.Biaya komputasi algoritma t-SNE tinggi, yang membatasi penerapannya saat ini pada jumlah data yang lebih besar, yang berarti sulit diterapkan pada bidang yang dalam atau bervariasi terhadap waktu.Pekerjaan pada skalabilitas t-SNE sedang berlangsung.Karena jarak KL mudah untuk diparalelkan, algoritma t-SNE memiliki potensi yang baik untuk diperluas di masa depan (35).Sejauh ini, metode pengurangan dimensi lain yang menjanjikan dan dapat mengurangi ukuran dengan lebih baik mencakup teknik pendekatan dan proyeksi manifold terpadu (UMAP), namun evaluasi dalam konteks data lautan tetap diperlukan.Yang dimaksud dengan skalabilitas yang lebih baik adalah, misalnya, mengklasifikasikan iklim atau model global dengan kompleksitas berbeda pada lapisan campuran.Daerah yang gagal diklasifikasikan oleh SAGE di provinsi mana pun dapat dianggap sebagai titik hitam yang tersisa pada Gambar 2A.Secara geografis, wilayah-wilayah ini sebagian besar berada di wilayah yang sangat musiman, sehingga menunjukkan bahwa menangkap provinsi-provinsi ekologis yang berubah seiring waktu akan memberikan cakupan yang lebih baik.
Untuk membangun metode SAGE, telah digunakan ide-ide dari sistem/ilmu data yang kompleks, menggunakan kemampuan untuk menentukan kelompok gugus fungsi (kemungkinan sangat dekat dalam ruang 11 dimensi) dan menentukan provinsi.Provinsi-provinsi ini menggambarkan volume spesifik dalam ruang fase t-SNE 3D kami.Demikian pula, bagian Poincaré dapat digunakan untuk mengevaluasi “volume” ruang keadaan yang ditempati oleh lintasan untuk menentukan perilaku “normal” atau “kacau” (36).Untuk keluaran model 11 dimensi statis, volume yang ditempati setelah data diubah menjadi ruang fase 3D dapat dijelaskan dengan cara yang sama.Hubungan antara wilayah geografis dan wilayah dalam ruang fase 3D tidaklah sederhana, tetapi dapat dijelaskan dari segi kesamaan ekologi.Oleh karena itu, ukuran ketidaksamaan BC yang lebih konvensional lebih disukai.
Penelitian di masa depan akan menggunakan kembali metode SAGE untuk mengubah data secara musiman guna menilai variabilitas spasial provinsi dan AEP yang diidentifikasi.Tujuan masa depannya adalah menggunakan metode ini untuk membantu menentukan provinsi mana yang dapat ditentukan melalui pengukuran satelit (seperti Chl-a, reflektivitas penginderaan jauh, dan suhu permukaan laut).Hal ini akan memungkinkan penilaian penginderaan jauh terhadap komponen ekologi dan pemantauan yang sangat fleksibel terhadap provinsi ekologi dan variabilitasnya.
Tujuan dari penelitian ini adalah untuk memperkenalkan metode SAGE, yang mendefinisikan provinsi ekologis melalui struktur komunitas plankton yang unik.Di sini akan diberikan informasi lebih rinci tentang model fisik/biogeokimia/ekosistem dan pemilihan parameter algoritma t-SNE dan DBSCAN.
Komponen fisik model berasal dari estimasi sirkulasi laut dan iklim [ECCOv4;(37) estimasi keadaan global dijelaskan oleh (38).Resolusi nominal estimasi negara adalah 1/5.Metode kuadrat terkecil dengan metode pengali Lagrangian digunakan untuk memperoleh kondisi awal dan batas serta parameter internal model yang disesuaikan dengan observasi, sehingga menghasilkan model siklus umum MIT yang berjalan bebas (MITgcm) (39), model Setelah optimasi, hasilnya bisa dilacak dan diamati.
Biogeokimia/ekosistem mempunyai gambaran yang lebih lengkap (yaitu persamaan dan nilai parameter) pada (2).Model tersebut menangkap sirkulasi C, N, P, Si dan Fe melalui kolam anorganik dan organik.Versi yang digunakan di sini mencakup 35 spesies fitoplankton: 2 spesies mikroprokariota dan 2 spesies mikroeukariota (cocok untuk lingkungan dengan nutrisi rendah), 5 spesies Cryptomonas sphaeroides (dengan lapisan kalsium karbonat), 5 spesies diazonium (Dapat mengikat nitrogen, jadi tidak dibatasi) ketersediaan nitrogen anorganik terlarut), 11 diatom (membentuk penutup mengandung silika), 10 flagelata vegetatif campuran (dapat berfotosintesis dan memakan plankton lain) dan 16 Zooplankton (merumput di plankton lain).Kelompok ini disebut “gugus fungsi biogeokimia” karena mempunyai efek berbeda terhadap biogeokimia kelautan (40, 41) dan sering digunakan dalam observasi dan studi model.Dalam model ini, setiap kelompok fungsional terdiri dari beberapa plankton dengan ukuran berbeda, dengan rentang diameter bola setara 0,6 hingga 2500 μm.
Parameter yang mempengaruhi pertumbuhan fitoplankton, penggembalaan dan tenggelamnya berkaitan dengan ukuran, dan terdapat perbedaan spesifik antara enam kelompok fungsi fitoplankton (32).Meskipun kerangka fisiknya berbeda, hasil dari 51 komponen plankton model tersebut telah digunakan dalam sejumlah penelitian terbaru (42-44).
Dari tahun 1992 hingga 2011, model penggabungan fisik/biogeokimia/ekosistem dijalankan selama 20 tahun.Keluaran model meliputi biomassa plankton, konsentrasi unsur hara dan laju penyediaan unsur hara (DIN, PO4, Si dan Fe).Dalam studi ini, rata-rata keluaran selama 20 tahun digunakan sebagai masukan Provinsi Ekologis.Chl, distribusi biomassa plankton dan konsentrasi nutrisi serta distribusi gugus fungsi dibandingkan dengan pengamatan satelit dan in-situ [lihat (2, 44), Catatan S1 dan gambar.S1 hingga S3].
Untuk metode SAGE, sumber utama keacakan berasal dari langkah t-SNE.Keacakan menghalangi pengulangan, yang berarti hasilnya tidak dapat diandalkan.Metode SAGE menguji ketahanan secara ketat dengan menentukan serangkaian parameter t-SNE dan DBSCAN, yang secara konsisten dapat mengidentifikasi cluster ketika diulang.Menentukan “kebingungan” parameter t-SNE dapat dipahami sebagai menentukan sejauh mana pemetaan dari dimensi tinggi ke rendah harus memperhatikan karakteristik data lokal atau global.Mencapai kebingungan 400 dan 300 iterasi.
Untuk algoritma pengelompokan DBSCAN, ukuran minimum dan metrik jarak dari titik data dalam cluster perlu ditentukan.Jumlah minimum ditentukan di bawah bimbingan para ahli.Pengetahuan ini mengetahui apa yang sesuai dengan kerangka dan resolusi pemodelan numerik saat ini.Angka minimumnya adalah 100. Nilai minimum yang lebih tinggi (kurang dari <135 sebelum batas atas warna hijau menjadi lebih lebar) dapat dipertimbangkan, namun tidak dapat menggantikan metode agregasi berdasarkan ketidaksamaan BC.Tingkat koneksi (Gambar 6A) digunakan untuk mengatur parameter ϵ, yang kondusif untuk cakupan yang lebih tinggi (Gambar 6B).Konektivitas didefinisikan sebagai jumlah gabungan cluster dan sensitif terhadap parameter ϵ.Konektivitas yang lebih rendah menunjukkan kurangnya kesesuaian, pengelompokan wilayah secara artifisial.Konektivitas tinggi menunjukkan overfitting.Overfitting juga bermasalah, karena ini menunjukkan bahwa tebakan acak awal dapat memberikan hasil yang tidak dapat direproduksi.Di antara kedua ekstrem ini, peningkatan tajam (biasanya disebut “siku”) menunjukkan ϵ terbaik.Pada Gambar 6A, terlihat peningkatan tajam pada area dataran tinggi (kuning, > 200 cluster), diikuti penurunan tajam (hijau, 100 cluster), hingga sekitar 130, dikelilingi oleh sangat sedikit cluster (biru, <60 cluster) ).Di setidaknya 100 wilayah biru, salah satu cluster mendominasi seluruh lautan (ϵ <0,42), atau sebagian besar lautan tidak diklasifikasikan dan dianggap kebisingan (ϵ> 0,99).Area kuning memiliki distribusi cluster yang sangat bervariasi dan tidak dapat direproduksi.Ketika ϵ menurun, kebisingan meningkat.Area hijau yang meningkat tajam disebut siku.Ini adalah wilayah yang optimal.Meskipun probabilitas t-SNE digunakan, ketidaksamaan BC dalam suatu provinsi masih dapat digunakan untuk menentukan pengelompokan yang dapat diandalkan.Menggunakan Gambar 6 (A dan B), atur ϵ menjadi 0,39.Semakin besar angka minimumnya, semakin kecil kemungkinan mencapai ϵ yang memungkinkan klasifikasi dapat diandalkan, dan semakin besar area hijau dengan nilai lebih besar dari 135. Pembesaran area ini menunjukkan bahwa siku akan semakin sulit ditemukan atau tidak. ada.
Setelah mengatur parameter t-SNE, jumlah cluster yang ditemukan akan digunakan sebagai ukuran konektivitas (A) dan persentase data yang dialokasikan ke cluster (B).Titik merah menunjukkan kombinasi cakupan dan konektivitas terbaik.Jumlah minimum ditetapkan sesuai dengan jumlah minimum yang berkaitan dengan ekologi.
Untuk materi tambahan artikel ini, silakan lihat http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ini adalah artikel akses terbuka yang didistribusikan berdasarkan ketentuan Lisensi Atribusi Creative Commons.Artikel ini mengizinkan penggunaan, distribusi, dan reproduksi tanpa batas dalam media apa pun dengan syarat karya aslinya dikutip dengan benar.
Catatan: Kami hanya meminta Anda untuk memberikan alamat email Anda sehingga orang yang Anda rekomendasikan ke halaman tersebut mengetahui bahwa Anda ingin mereka melihat email tersebut dan bahwa itu bukan spam.Kami tidak akan menangkap alamat email apa pun.
Pertanyaan ini digunakan untuk menguji apakah Anda pengunjung dan mencegah pengiriman spam otomatis.
Kementerian Ekologi Kelautan Global bertekad untuk memecahkan masalah kompleks dan menggunakan ML tanpa pengawasan untuk mengeksplorasi struktur komunitas.
Kementerian Ekologi Kelautan Global bertekad untuk memecahkan masalah kompleks dan menggunakan ML tanpa pengawasan untuk mengeksplorasi struktur komunitas.


Waktu posting: 12 Januari 2021