Clarifying ecological complexity: unsupervised learning determines the global marine ecological province

Plankton topluluk yapısı ve besin akışı verilerine dayalı olarak küresel deniz ekolojik bölgelerini (eko-iller) belirlemek için denetimsiz bir öğrenme yöntemi önerilmiştir.Sistematik entegre ekolojik eyalet (SAGE) yöntemi, oldukça doğrusal olmayan ekosistem modellerinde ekolojik bölgeleri tanımlayabilir.Verilerin Gaussian olmayan kovaryansına uyum sağlamak amacıyla SAGE, boyutluluğu azaltmak için rastgele komşu yerleştirmeyi (t-SNE) kullanır.Yoğunluğa dayalı mekansal kümeleme (DBSCAN) algoritmasını temel alan gürültü uygulaması sayesinde yüzün üzerinde ekolojik il tespit edilebilmektedir.Ekolojik farklılıklara sahip bağlantı haritasını bir mesafe ölçüsü olarak kullanarak, sağlam bir toplu ekolojik bölge (AEP), iç içe geçmiş ekolojik bölgeler aracılığıyla objektif olarak tanımlanır.AEP'ler kullanılarak besin tedarik oranının topluluk yapısı üzerindeki kontrolü araştırıldı.Eko-il ve AEP benzersizdir ve modelin yorumlanmasına yardımcı olabilir.Modeller arasındaki karşılaştırmaları kolaylaştırabilir ve deniz ekosistemlerinin anlaşılmasını ve izlenmesini geliştirebilirler.
İller, deniz veya karadaki karmaşık biyocoğrafyanın tutarlı ve anlamlı alanlar halinde organize edildiği bölgelerdir (1).Bu iller, lokasyonların karşılaştırılması ve karşılaştırılması, gözlemlerin karakterizasyonu, izleme ve koruma açısından çok önemlidir.Bu illeri üreten karmaşık ve doğrusal olmayan etkileşimler, denetimsiz makine öğrenimi (ML) yöntemlerini illerin nesnel olarak belirlenmesi için çok uygun hale getirir çünkü verilerdeki kovaryans karmaşıktır ve Gaussian değildir.Burada, Darwin'in küresel üç boyutlu (3 boyutlu) fiziksel/ekosistem modelinden (2) benzersiz deniz ekolojik bölgelerini (eko-iller) sistematik olarak tanımlayan bir ML yöntemi önerilmektedir.Tanımlanan alanın diğer alanlarla yeterince örtüşmediğini belirtmek için “benzersiz” tabiri kullanılmaktadır.Bu yönteme Sistem Entegre Ekolojik İl (SAGE) yöntemi adı verilmektedir.Yararlı bir sınıflandırma gerçekleştirmek için, bir algoritma yönteminin (i) küresel sınıflandırmaya ve (ii) uzay ve zamanda iç içe/toplanabilen çok ölçekli analize izin vermesi gerekir (3).Bu araştırmada ilk olarak SAGE yöntemi önerilmiş ve belirlenen ekolojik iller ele alınmıştır.Eko-iller, topluluk yapısını kontrol eden faktörlerin anlaşılmasını teşvik edebilir, izleme stratejileri için yararlı bilgiler sağlayabilir ve ekosistemdeki değişikliklerin izlenmesine yardımcı olabilir.
Karasal bölgeler genellikle iklim (yağış ve sıcaklık), toprak, bitki örtüsü ve faunadaki benzerliklere göre sınıflandırılır ve yardımcı yönetim, biyolojik çeşitlilik araştırması ve hastalık kontrolü için kullanılır (1, 4).Deniz illerini tanımlamak daha zordur.Çoğu organizma mikroskobiktir ve sıvı sınırları vardır.Longhurst ve diğerleri.(5) Oşinografi Bakanlığının çevre koşullarına dayalı ilk küresel sınıflandırmalarından birini sağlamıştır.Bu "Longhurst" eyaletlerinin tanımı, karışım oranı, tabakalaşma ve ışınım gibi değişkenlerin yanı sıra, Longhurst'ün deniz ekosistemleri için başka önemli koşullara da sahip olan bir deniz oşinografı olarak kapsamlı deneyimini içerir.Longhurst, örneğin birincil üretimi ve karbon akışını değerlendirmek, balıkçılığa yardım etmek ve yerinde gözlem faaliyetlerini planlamak için yaygın olarak kullanılmaktadır (5-9).İllerin daha objektif tanımlanması amacıyla bulanık mantık ve bölgesel denetimsiz kümeleme/istatistik gibi yöntemler kullanılmıştır (9-14).Bu tür yöntemlerin amacı, mevcut gözlemsel verilerdeki illeri tanımlayabilecek anlamlı yapıları tespit etmektir.Örneğin, dinamik deniz bölgeleri (12) gürültüyü azaltmak için kendi kendini organize eden haritalar kullanır ve bölgesel uydulardan [klorofil a (Chl-a), normalleştirilmiş Floresan çizgi yüksekliği ve renkli çözünmüş organik madde] ve fiziksel alan (deniz yüzeyi sıcaklığı ve tuzluluk, mutlak dinamik topografya ve deniz buzu).
Planktonun topluluk yapısı endişe vericidir çünkü ekolojisinin daha yüksek besin seviyeleri, karbon emilimi ve iklim üzerinde büyük etkisi vardır.Bununla birlikte, plankton topluluk yapısına dayalı olarak küresel bir ekolojik bölge belirlemek hâlâ zorlu ve anlaşılması zor bir hedeftir.Deniz rengi uydular, potansiyel olarak fitoplanktonun kaba taneli sınıflandırmasına ilişkin bilgiler sağlayabilir veya fonksiyonel grupların avantajlarını önerebilir (15), ancak şu anda topluluk yapısı hakkında ayrıntılı bilgi sağlayamamaktadırlar.Son araştırmalar [örn. Tara Ocean (16)] topluluk yapısına ilişkin benzeri görülmemiş ölçümler sağlıyor;şu anda küresel ölçekte yalnızca seyrek yerinde gözlemler bulunmaktadır (17).Önceki çalışmalar büyük ölçüde biyokimyasal benzerliklerin (birincil üretim, Chl ve mevcut ışık gibi) belirlenmesine dayanarak “Biyojeokimyasal Bölgeyi” (12, 14, 18) belirlemiştir.Burada [Darwin(2)] çıktısı almak için sayısal model kullanılır ve ekolojik il, topluluk yapısına ve besin akışına göre belirlenir.Bu çalışmada kullanılan sayısal model küresel kapsama sahiptir ve mevcut saha verileri (17) ve uzaktan algılama alanlarıyla (Not S1) karşılaştırılabilir.Bu çalışmada kullanılan sayısal model verileri küresel kapsam avantajına sahiptir.Model ekosistem 35 fitoplankton türü ve 16 zooplankton türünden oluşur (lütfen materyallere ve yöntemlere bakın).Model plankton türleri, Gaussian olmayan kovaryans yapılarıyla doğrusal olmayan bir şekilde etkileşime girer, bu nedenle basit teşhis yöntemleri, ortaya çıkan topluluk yapılarındaki benzersiz ve tutarlı kalıpları tanımlamak için uygun değildir.Burada tanıtılan SAGE yöntemi, karmaşık Darwin modellerinin çıktılarını kontrol etmek için yeni bir yol sağlar.
Veri bilimi/ML teknolojisinin güçlü dönüştürücü yetenekleri, son derece karmaşık model çözümlerinin veri kovaryansındaki karmaşık ancak sağlam yapıları ortaya çıkarmasını sağlayabilir.Sağlam bir yöntem, belirli bir hata aralığında sonuçları aslına sadık kalarak yeniden üretebilen bir yöntem olarak tanımlanır.Basit sistemlerde bile sağlam modelleri ve sinyalleri belirlemek zor olabilir.Gözlemlenen örüntüye yol açan mantık belirleninceye kadar, ortaya çıkan karmaşıklığın çözümü karmaşık/zor görünebilir.Ekosistemin bileşimini belirlemenin temel süreci doğası gereği doğrusal değildir.Doğrusal olmayan etkileşimlerin varlığı sağlam sınıflandırmayı karıştırabilir, bu nedenle veri kovaryansının temel istatistiksel dağılımı hakkında güçlü varsayımlarda bulunan yöntemlerden kaçınmak gerekir.Yüksek boyutlu ve doğrusal olmayan veriler oşinografide yaygındır ve karmaşık, Gauss olmayan topolojiye sahip bir kovaryans yapısına sahip olabilir.Gauss olmayan kovaryans yapısına sahip veriler sağlam sınıflandırmayı engellese de SAGE yöntemi yenidir çünkü rastgele topolojilere sahip kümeleri tanımlamak için tasarlanmıştır.
SAGE yönteminin amacı, ekolojik anlayışın daha da geliştirilmesine yardımcı olabilecek ortaya çıkan modelleri objektif olarak belirlemektir.(19)'a benzer küme bazlı iş akışının ardından, ekolojik il adı verilen verilerdeki tek kümeyi belirlemek için ekolojik ve besin akışı değişkenleri kullanılır.Bu çalışmada önerilen SAGE yöntemi (Şekil 1) öncelikle önceden tanımlanan plankton fonksiyonel gruplarını toplayarak boyutluluğu 55'ten 11 boyuta düşürür (bkz. Malzemeler ve Yöntemler).T-rastgele komşu gömme (t-SNE) yöntemi kullanılarak, olasılık 3 boyutlu alana yansıtılarak boyut daha da azaltılır.Denetimsiz kümeleme ekolojik olarak yakın alanları tanımlayabilir [gürültü tabanlı uygulamalar için yoğunluk tabanlı mekansal kümeleme (DBSCAN).Hem t-SNE hem de DBSCAN, doğal doğrusal olmayan ekosistem sayısal model verilerine uygulanabilir.Daha sonra ortaya çıkan ekolojik bölgeyi dünyaya yeniden yansıtın.Bölgesel araştırmalara uygun yüzden fazla benzersiz ekolojik il tespit edilmiştir.Küresel olarak tutarlı ekosistem modelini dikkate almak amacıyla, ekolojik eyaletlerin etkinliğini artırmak amacıyla ekolojik eyaletleri toplu ekolojik eyaletler (AEP) halinde toplamak için SAGE yöntemi kullanılır.Toplama düzeyi ("karmaşıklık" olarak adlandırılır) gereken ayrıntı düzeyine göre ayarlanabilir.Sağlam bir AEP'nin minimum karmaşıklığını belirleyin.Seçimin odak noktası SAGE yöntemi ve acil durum topluluk yapısının kontrolünü belirlemek için en küçük karmaşıklıktaki AEP vakalarının araştırılmasıdır.Desenler daha sonra ekolojik bilgiler sağlamak için analiz edilebilir.Burada tanıtılan yöntem, model karşılaştırması için daha kapsamlı bir şekilde de kullanılabilir; örneğin, modelleri karşılaştırmak amacıyla farklılıkları ve benzerlikleri vurgulamak için farklı modellerde bulunan benzer ekolojik illerin konumları değerlendirilerek.
(A) Ekolojik ili belirlemek için iş akışının şematik diyagramı;orijinal 55 boyutlu verileri, yedi fonksiyonel/besin planktonunun biyokütlesi ve dört besin tedarik oranı dahil olmak üzere 11 boyutlu bir model çıktısına azaltmak için fonksiyonel gruptaki toplamı kullanmak.İhmal edilebilir değer ve dayanıklı buz örtüsü alanı.Veriler standartlaştırıldı ve standartlaştırıldı.İstatistiksel olarak benzer özellik kombinasyonlarını vurgulamak için t-SNE algoritmasına 11 boyutlu veriler sağlayın.DBSCAN, parametre değerini ayarlamak için kümeyi dikkatlice seçecektir.Son olarak verileri enlem/boylam projeksiyonuna geri yansıtın.Lütfen bu işlemin 10 kez tekrarlandığını unutmayın çünkü t-SNE uygulanarak hafif bir rastgelelik oluşabilir.(B), (A)'daki iş akışını 10 kez tekrarlayarak AEP'nin nasıl alınacağını açıklıyor.Bu 10 uygulamanın her biri için iller arası Bray-Curtis (BC) farklılık matrisi, 51 fitoplankton tipinin biyokütlesi temel alınarak belirlendi.Karmaşıklık 1 AEP'den tam karmaşıklık 115'e kadar iller arasındaki BC farkını belirleyin. BC kıyaslaması Longhurst Eyaleti tarafından belirlenir.
SAGE yöntemi, ekolojik bölgeyi tanımlamak için küresel 3 boyutlu fiziksel/ekosistem sayısal modelinin çıktısını kullanır [Darwin (2);bkz. Malzemeler ve Yöntemler ve Not S1].Ekosistemin bileşenleri, önceden tanımlanmış yedi fonksiyonel gruba sahip 35 fitoplankton türü ve 16 zooplankton türünden oluşur: düşük besinli ortamlara adapte olmuş prokaryotlar ve ökaryotlar, kalsiyum karbonat kaplamalı koksidia ve ağır nitrojen fiksasyonu Azot besinleri (genellikle eksiktir) önemli besin maddeleri) silisli örtü ile diğer plankton fotosentezini yapabilir ve karışık besin kamçılılarını ve zooplankton çobanlarını otlatabilir.Boyut aralığı 0,6 ila 2500μm eşdeğer küresel çaptır.Fitoplankton boyutu ve fonksiyonel gruplamaya ilişkin model dağılımı, uydu ve yerinde gözlemlerde görülen genel özellikleri yansıtmaktadır (bkz. Şekil S1 ila S3).Sayısal model ile gözlenen okyanus arasındaki benzerlik, modelin tanımladığı illerin yerinde okyanusa da uygulanabileceğini göstermektedir.Bu modelin fitoplanktonun yalnızca belirli çeşitliliğini ve yerinde okyanusun yalnızca belirli fiziksel ve kimyasal zorlama aralıklarını yakaladığını lütfen unutmayın.SAGE yöntemi, insanların model topluluk yapısının son derece bölgesel kontrol mekanizmasını daha iyi anlamalarını sağlayabilir.
Her plankton fonksiyonel grubuna yalnızca yüzey biyokütlesinin toplamının (ortalama 20 yıllık bir süre ile) dahil edilmesiyle verilerin boyutu azaltılabilir.Daha önceki çalışmalar topluluk yapısını belirlemedeki anahtar rollerini gösterdikten sonra, aynı zamanda besin akışları (nitrojen, demir, fosfat ve silisik asit temini) için yüzey kaynağı terimlerini de içeriyordu [örneğin (20, 21)].Fonksiyonel grupların toplamı, sorunu 55'ten (51 plankton ve 4 besin akışı) 11 boyuta indirir.Bu ilk çalışmada algoritmanın getirdiği hesaplama kısıtlamaları nedeniyle derinlik ve zaman değişkenliği dikkate alınmadı.
SAGE yöntemi, doğrusal olmayan süreçler ile fonksiyonel grup biyokütlesi ve besin akışı arasındaki etkileşimlerin temel özellikleri arasındaki önemli ilişkileri tanımlayabilmektedir.Öklid uzaktan öğrenme yöntemlerine (K-ortalamaları gibi) dayalı 11 boyutlu veriler kullanılarak güvenilir ve tekrarlanabilir iller elde edilemez (19, 22).Bunun nedeni, ekolojik bölgeyi tanımlayan anahtar unsurların kovaryansının temel dağılımında Gauss şeklinin bulunmamasıdır.Voronoi hücrelerinin K-ortalamaları (düz çizgiler), Gauss olmayan temel dağılımı koruyamaz.
Yedi plankton fonksiyonel grubunun ve dört besin akışının biyokütlesi, 11 boyutlu bir vektör x oluşturur.Bu nedenle x, model ızgarası üzerindeki bir vektör alanıdır; burada her bir xi öğesi, model yatay ızgarasında tanımlanan 11 boyutlu bir vektörü temsil eder.Her bir i indeksi, küre üzerindeki bir ızgara noktasını benzersiz bir şekilde tanımlar; burada (lon, enlem) = (ϕi, θi).Model ızgara ünitesinin biyokütlesi 1,2×10-3mg Chl/m3'ten azsa veya buz kapsama oranı %70'i aşarsa biyokütle verilerinin günlüğü kullanılır ve atılır.Veriler normalleştirilir ve standartlaştırılır, böylece tüm veriler [0 ila 1] aralığında olur, ortalama kaldırılır ve birim varyansa göre ölçeklenir.Bu, özelliklerin (biyokütle ve besin akışı) olası değerler aralığındaki kontrastla sınırlı olmaması için yapılır.Kümeleme, coğrafi mesafeden ziyade özellikler arasındaki temel olasılık mesafesinden değişim ilişkisini yakalamalıdır.Bu mesafelerin ölçülmesiyle önemli özellikler ortaya çıkarken, gereksiz ayrıntılar da atılır.Ekolojik açıdan bakıldığında bu gereklidir çünkü az biyokütleye sahip bazı fitoplankton türleri, diazotrofik bakteriler tarafından nitrojenin sabitlenmesi gibi daha büyük biyojeokimyasal etkilere sahip olabilir.Verileri standartlaştırırken ve normalleştirirken bu tür ortak değişkenler vurgulanacaktır.
Düşük boyutlu gösterimde yüksek boyutlu uzaydaki özelliklerin yakınlığını vurgulayan t-SNE algoritması, mevcut benzer bölgeleri daha net hale getirmek için kullanılır.Önceki çalışma, temel özellikleri ayırma becerisini kanıtlayan t-SNE'yi kullanan uzaktan algılama uygulamaları için derin sinir ağları oluşturmayı amaçlıyordu (23).Bu, yakınsak olmayan çözümlerden kaçınırken özellik verilerindeki sağlam kümelemeyi tanımlamak için gerekli bir adımdır (not S2).Gauss çekirdeklerini kullanan t-SNE, her yüksek boyutlu nesneyi 3B faz uzayındaki bir noktaya haritalayarak verilerin istatistiksel özelliklerini korur, böylece yüksek ve alçak yönlerde benzer nesnelerin olasılığının yüksek olması sağlanır. boyutlu uzay (24).N adet yüksek boyutlu nesne x1,…,xN kümesi verildiğinde, t-SNE algoritması Kullback-Leibler (KL) sapmasını en aza indirerek azaltır (25).KL sapması, bir olasılık dağılımının ikinci bir referans olasılık dağılımından ne kadar farklı olduğunun bir ölçüsüdür ve yüksek boyutlu özelliklerin düşük boyutlu temsilleri arasındaki korelasyon olasılığını etkili bir şekilde değerlendirebilir.Eğer xi, N boyutlu uzayda i'inci nesne ise, xj, N boyutlu uzayda j'inci nesnedir, yi, düşük boyutlu uzayda i'inci nesnedir ve yj, düşük boyutlu uzayda j'inci nesnedir. -boyutlu uzay, o zaman t -SNE benzerlik olasılığını tanımlar ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) ve boyutluluk azaltma seti için q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Şekil 2A, 11 boyutlu kombinasyonun biyokütle ve besin akışı vektörlerini 3D'ye azaltmanın etkisini göstermektedir.T-SNE uygulama motivasyonu, verinin alanını/niteliğini vurgulamak için varyans özelliğini kullanan ve böylece boyutluluğu azaltan temel bileşen analizinin (PCA) motivasyonuyla karşılaştırılabilir.t-SNE yönteminin, Çevre Bakanlığı için güvenilir ve tekrarlanabilir sonuçlar sağlama açısından PCA'dan üstün olduğu bulunmuştur (bkz. Not S2).Bunun nedeni, PCA'nın diklik varsayımının, yüksek derecede doğrusal olmayan etkileşimli özellikler arasındaki kritik etkileşimleri tanımlamak için uygun olmaması olabilir, çünkü PCA, doğrusal kovaryans yapılarına odaklanır (26).Uzaktan algılama verilerini kullanan Lunga ve ark.(27), Gauss dağılımından sapan karmaşık ve doğrusal olmayan spektral özellikleri vurgulamak için SNE yönteminin nasıl kullanılacağını göstermektedir.
(A) T-SNE algoritması tarafından çizilen ve DBSCAN kullanılarak ile renklendirilen modellenmiş bir besin tedarik oranı, fitoplankton ve zooplankton fonksiyonel grup biyokütlesi.Her nokta, Şekil 6B'de gösterildiği gibi yüksek boyutlu uzayda bir noktayı temsil eder; çoğu nokta yakalanır.Şaftlar “t-SNE” 1, 2 ve 3 boyutlarını ifade etmektedir. (B) DBSCAN tarafından bulunan ilin menşe enlem-boylam ızgarasındaki coğrafi izdüşümü.Renk herhangi bir renk olarak kabul edilmeli ancak (A)'ya karşılık gelmelidir.
Şekil 2A'daki t-SNE dağılım grafiğindeki noktalar sırasıyla enlem ve boylamla ilişkilidir.Şekil 2A'daki iki nokta birbirine yakınsa bunun nedeni coğrafi yakınlık değil, biyokütle ve besin akışlarının benzer olmasıdır.Şekil 2A'daki renkler DBSCAN yöntemi (28) kullanılarak keşfedilen kümelerdir.Yoğun gözlemler ararken, DBSCAN algoritması 3 boyutlu gösterimdeki noktalar arasındaki mesafeyi kullanır (ϵ = 0,39; bu seçim hakkında bilgi için Malzemeler ve Yöntemler'e bakın) ve kümeyi tanımlamak için benzer noktaların sayısı gerekir (burada). 100 puan, lütfen yukarıya bakınız).DBSCAN yöntemi, aşağıda gösterildiği gibi, verilerdeki kümelerin şekli veya sayısı hakkında herhangi bir varsayımda bulunmaz:
3) Mesafe dahilinde olarak tanımlanan tüm noktalar için, küme sınırını belirlemek amacıyla 2. adımı tekrar tekrar tekrarlayın.Nokta sayısı belirlenen minimum değerden büyükse küme olarak tanımlanır.
Minimum küme üyesini ve uzaklık ϵ ölçüsünü karşılamayan veriler "gürültü" olarak kabul edilir ve bir renk atanmaz.DBSCAN, en kötü durumda O(n2) performansına sahip, hızlı ve ölçeklenebilir bir algoritmadır.Mevcut analize göre aslında rastgele değil.Asgari puan sayısı uzman değerlendirmesiyle belirlenir.Mesafeyi ayarladıktan sonra sonuç ≈±10 aralığında yeterince kararlı değildir.Bu mesafe, bağlantı (Şekil 6A) ve okyanus kapsama yüzdesi (Şekil 6B) kullanılarak ayarlanır.Bağlantı, kümelerin bileşik sayısı olarak tanımlanır ve ϵ parametresine duyarlıdır.Daha düşük bağlantı, bölgelerin yapay olarak gruplandırıldığı yetersiz uyum anlamına gelir.Yüksek bağlantı aşırı uyumu gösterir.Daha yüksek bir minimumun kullanılması düşünülebilir ancak minimumun ca'yı aşması durumunda güvenilir bir çözüm elde etmek imkansızdır.135 (Daha fazla ayrıntı için bkz. Malzemeler ve Yöntemler).
Şekil 2A'da tanımlanan 115 küme, Şekil 2B'de dünyaya geri yansıtılmaktadır.Her renk, DBSCAN tarafından tanımlanan biyojeokimyasal ve ekolojik faktörlerin tutarlı bir kombinasyonuna karşılık gelir.Kümeler belirlendikten sonra, Şekil 2A'daki her noktanın belirli bir enlem ve boylamla ilişkisi, kümeleri coğrafi bölgeye geri yansıtmak için kullanılır.Şekil 2B, bunu Şekil 2A ile aynı küme renkleriyle göstermektedir.Benzer renkler ekolojik benzerlik olarak yorumlanmamalıdır çünkü bunlar algoritma tarafından kümelerin keşfedilme sırasına göre atanır.
Şekil 2B'deki alan, okyanusun fiziksel ve/veya biyojeokimyasında belirlenmiş bir alana niteliksel olarak benzer olabilir.Örneğin, Güney Okyanusu'ndaki kümeler bölge açısından simetriktir, oligotrofik girdaplar ortaya çıkar ve keskin geçiş, alize rüzgarlarının etkisini gösterir.Örneğin Ekvator Pasifik'te yükselişle ilgili farklı bölgeler görülüyor.
Eko-İl'in ekolojik ortamını anlamak amacıyla kümedeki ekolojiyi değerlendirmek için Bray-Curtis (BC) fark indeksinin (29) bir varyasyonu kullanıldı.BC göstergesi, iki farklı site arasındaki topluluk yapısındaki farkı ölçmek için kullanılan istatistiksel bir veridir.BC ölçümü 51 fitoplankton ve zooplankton türünün biyokütlesine uygulanabilir BCninj = 1-2CninjSni + Snj
BCninj, ni kombinasyonu ve nj kombinasyonu arasındaki benzerliği ifade eder; burada Cninj, hem ni hem de nj kombinasyonlarında mevcut olan tek bir biyokütle tipinin minimum değeridir ve Sni, her iki ni ve Snj kombinasyonunda mevcut olan tüm biyokütlelerin toplamını temsil eder.BC farkı mesafe ölçümüne benzer, ancak Öklid dışı uzayda çalışır ve bu muhtemelen ekolojik veriler ve yorumlanması için daha uygundur.
Şekil 2B'de tanımlanan her küme için, iller içi ve iller arası BC benzerliği değerlendirilebilir.Bir il içindeki BC farkı, ilin ortalama değeri ile ildeki her bir nokta arasındaki farkı ifade eder.BC iller arasındaki fark, bir ilin diğer iller arasındaki benzerliğini ifade eder.Şekil 3A simetrik bir BC matrisini göstermektedir (0, siyah: tamamen karşılık gelen; 1, beyaz: tamamen farklı).Grafikteki her satır verilerdeki bir modeli gösterir.Şekil 3B, Şekil 3A'daki BC sonuçlarının her il için coğrafi önemini göstermektedir.Şekil 3B, düşük besinli ve düşük besinli bir bölgedeki bir il için, ekvator ve Hint Okyanusu çevresindeki geniş alanların simetrisinin temelde benzer olduğunu, ancak daha yüksek enlemler ve yükselme alanlarının önemli ölçüde farklı olduğunu göstermektedir.
(A) 51 planktonun küresel 20 yıllık ortalama küresel yüzey ortalamasına göre her il için değerlendirilen BC farkının derecesi.Değerlerin beklenen simetrisine dikkat edin.(B) Bir sütunun (veya satırın) uzaysal izdüşümü.Distrofik çemberde yer alan bir il için BC benzerlik ölçüsünün küresel dağılımı değerlendirilerek, küresel 20 yıllık ortalama değerlendirildi.Siyah (BC = 0) aynı alanı, beyaz (BC = 1) ise hiçbir benzerlik olmadığını ifade eder.
Şekil 4A, Şekil 2B'de her ildeki BC'deki farkı göstermektedir.Bir kümedeki ortalama alanın ortalama kombinasyonu kullanılarak ve BC ile ildeki her grid noktasının ortalaması arasındaki farklılığın belirlenmesiyle belirlenen bu, SAGE yönteminin 51 türü ekolojik benzerliğe dayalı olarak iyi bir şekilde ayırabildiğini göstermektedir. modeli verileri.51 türün tamamının genel ortalama BC kümesi farklılığı 0,102±0,0049'dur.
(A, B ve D) İl içindeki BC farkı, her grid noktası topluluğu ile ortalama il arasındaki ortalama BC farkı olarak değerlendirilir ve karmaşıklık azaltılmaz.(2) Küresel ortalama il içi BC farkı 0,227±0,117'dir.Bu, bu çalışma tarafından önerilen ekolojik motivasyona dayalı sınıflandırmanın referans noktasıdır [(C)'deki yeşil çizgi].(C) İl içi ortalama BC farkı: Siyah çizgi, artan karmaşıklığa sahip iller içi BC farkını temsil eder.2σ eko-il tanımlama sürecinin 10 tekrarından gelir.DBSCAN tarafından keşfedilen illerin toplam karmaşıklığı için (A), ildeki BC farklılığının 0,099 olduğunu ve (C) tarafından önerilen karmaşıklık sınıflandırmasının 12 olduğunu, bunun sonucunda ilde BC farklılığının 0,200 olduğunu göstermektedir.resim gösterdiği gibi.(D).
Şekil 4B'de, Longhurst eyaletindeki eşdeğer BC farkını temsil etmek için 51 plankton türünün biyokütlesi kullanılmıştır.Her ilin genel ortalaması 0,227 olup, grid noktalarının BC ili farkına göre standart sapması 0,046'dır.Bu, Şekil 1B'de tanımlanan kümeden daha büyüktür.Bunun yerine, yedi fonksiyonel grubun toplamı kullanıldığında Longhurst'teki ortalama sezon içi BC farklılığı 0,232'ye yükseldi.
Küresel eko-il haritası, benzersiz ekolojik etkileşimlerin karmaşık ayrıntılarını sağlar ve Longhurst Eyaletinin tüm ekosistem yapısının kullanılmasında iyileştirmeler yapılmıştır.Ekoloji Bakanlığı'nın sayısal model ekosistemini kontrol etme sürecine ilişkin bilgi sağlaması bekleniyor ve bu bilgi, saha çalışmasının araştırılmasına yardımcı olacaktır.Bu araştırmanın amacı doğrultusunda yüzden fazla ilin tam olarak ortaya konulması mümkün değildir.Bir sonraki bölümde illeri özetleyen SAGE yöntemi tanıtılmaktadır.
Vilayetin amaçlarından biri de ilin konumu ve yönetiminin anlaşılmasını teşvik etmektir.Acil durumları belirlemek için Şekil 1B'deki yöntem, ekolojik açıdan benzer illerin iç içe geçmesini göstermektedir.Eko-iller ekolojik benzerliklerine göre gruplandırılmaktadır ve bu tür il gruplamasına AEP adı verilmektedir.Dikkate alınacak toplam il sayısına göre ayarlanabilir bir "karmaşıklık" belirleyin.“Karmaşıklık” terimi, acil durum niteliklerinin düzeyinin ayarlanmasına izin verdiği için kullanılmaktadır.Anlamlı toplamaları tanımlamak amacıyla, Longhurst'ten eyaletler arası ortalama 0,227'lik BC farkı kıyaslama noktası olarak kullanılmıştır.Bu kriterin altında, birleştirilmiş iller artık kullanışlı sayılmıyor.
Şekil 3B'de gösterildiği gibi küresel ekolojik iller tutarlıdır.İller arası BC farklılıklarına bakıldığında bazı konfigürasyonların oldukça “ortak” olduğu görülmektedir.Genetik ve grafik teorisi yöntemlerinden ilham alan “bağlantılı grafikler”, 100'den fazla ili kendilerine en çok benzeyen illere göre sıralamak için kullanılıyor.Buradaki “bağlantılılık” ölçüsü, iller arası BC farklılığı kullanılarak belirlenmektedir (30).100'den fazla ilin sınıflandırılması için daha geniş alana sahip olan il sayısı burada karmaşıklık olarak ifade edilebilir.AEP, 100'den fazla ili en baskın/en yakın ekolojik iller olarak kategorize eden bir üründür.Her ekolojik il, kendisine en çok benzeyen baskın/yüksek bağlantılı ekolojik ile atanır.BC farkıyla belirlenen bu kümelenme, küresel ekolojiye iç içe bir yaklaşıma olanak tanıyor.
Seçilen karmaşıklık, 1'den Şekil 2'deki tam karmaşıklığa kadar herhangi bir değer olabilir.2A.Daha düşük karmaşıklıkta, AEP olasılıksal boyutluluk azaltma adımı (t-SNE) nedeniyle dejenere olabilir.Dejenerasyon, ekolojik illerin yinelemeler arasında farklı AEP'lere atanabileceği ve böylece kapsanan coğrafi alanın değiştirilebileceği anlamına gelir.Şekil 4C, 10 uygulama genelinde artan karmaşıklığa sahip AEP'lerdeki iller arasındaki BC farklılıklarının yayılmasını göstermektedir (Şekil 1B'deki çizim).Şekil 4C'de 2σ (mavi alan), 10 uygulamadaki bozulmanın ölçüsüdür ve yeşil çizgi, Longhurst kriterini temsil eder.Gerçekler, 12'nin karmaşıklığının eyaletteki BC farkını tüm uygulamalarda Longhurst kriterinin altında tutabildiğini ve nispeten küçük bir 2σ bozulmayı koruyabildiğini kanıtladı.Özetle, önerilen minimum karmaşıklık 12 AEP'dir ve Şekil 4D'de gösterildiği gibi 51 plankton türü kullanılarak değerlendirilen ortalama il içi BC farkı 0,198±0,013'tür.Yedi plankton fonksiyonel grubunun toplamı kullanıldığında il içindeki ortalama BC farkı 0,198±0,004 yerine 2σ'dır.Yedi fonksiyonel grubun toplam biyokütlesi veya 51 plankton tipinin tamamının biyokütlesi ile hesaplanan BC farklılıkları arasındaki karşılaştırma, SAGE yönteminin 51 boyutlu duruma uygulanabilir olmasına rağmen yedi fonksiyonel grubun toplam biyokütlesi için geçerli olduğunu göstermektedir. Eğitim için.
Herhangi bir araştırmanın amacına bağlı olarak farklı karmaşıklık düzeyleri dikkate alınabilir.Bölgesel çalışmalar tam karmaşıklık gerektirebilir (yani 115 ilin tamamı).Örnek olarak ve netlik sağlamak amacıyla önerilen minimum karmaşıklık değeri olan 12'yi düşünün.
SAGE yönteminin kullanımına bir örnek olarak, acil durum topluluk yapısının kontrolünü araştırmak için burada minimum karmaşıklığı 12 olan 12 AEP kullanılmıştır.Şekil 5, AEP'ye göre gruplandırılmış ekolojik bilgileri (A'dan L'ye) göstermektedir: Redfield stokiyometrisinde, coğrafi kapsam (Şekil 5C), fonksiyonel grup biyokütle bileşimi (Şekil 5A) ve besin kaynağı (Şekil 5B) N Zoomed tarafından gerçekleştirilir.Oran (N:Si:P:Fe, 1:1:16:16×103) gösterilmektedir.İkinci panel için P 16 ile çarpılır ve Fe 16x103 ile çarpılır, dolayısıyla çubuk grafik fitoplanktonun besin gereksinimlerine eşdeğerdir.
İller A'dan L'ye kadar 12 AEP olarak sınıflandırılmıştır. 12 ildeki ekosistemlerin (A) Biyokütlesi (mgC/m3).(B) Çözünmüş inorganik nitrojen (N), demir (Fe), fosfat (P) ve silisik asidin (Si) besin akış hızı (mmol/m3/yıl).Fe ve P sırasıyla 16 ve 16x103 ile çarpılır, böylece şeritler fitoplankton stokiyometrisi gerekliliklerine göre standardize edilir.(C) Kutup bölgeleri, subtropikal siklonlar ve büyük mevsimsel/yükselen bölgeler arasındaki farka dikkat edin.İzleme istasyonları şu şekilde işaretlenmiştir: 1, KOLTUKLAR;2, ALOHA;3, istasyon P;ve 4, YARASALAR.
Tanımlanan AEP benzersizdir.Atlantik ve Pasifik Okyanuslarında ekvator etrafında bir miktar simetri vardır ve Hint Okyanusunda da benzer ancak daha geniş bir alan mevcuttur.Bazı AEP'ler kıtanın yükselişle ilişkili batı tarafını kapsar.Güney Kutbu Çevresel Akımı büyük bir bölgesel özellik olarak kabul edilir.Subtropikal siklon, karmaşık bir oligotrofik AEP serisidir.Bu illerde, planktonun baskın olduğu oligotrofik girdaplar ile diatom açısından zengin kutup bölgeleri arasındaki biyokütle farklılıklarının tanıdık modeli açıktır.
Çok benzer toplam fitoplankton biyokütlesine sahip AEP'ler çok farklı topluluk yapılarına sahip olabilir ve benzer toplam fitoplankton biyokütlesine sahip D, H ve K gibi farklı coğrafi alanları kapsayabilir.AEP H esas olarak ekvatoral Hint Okyanusu'nda bulunur ve daha fazla diazotrofik bakteri vardır.AEP D birçok havzada bulunur, ancak Pasifik'te ekvatoral yükselme etrafındaki yüksek verimli alanlar çevresinde özellikle belirgindir.Bu Pasifik eyaletinin şekli gezegensel bir dalga trenini andırıyor.AEP D'de az sayıda diazobakteri ve daha fazla koni vardır.Diğer iki il ile karşılaştırıldığında AEP K yalnızca Arktik Okyanusu'nun dağlık bölgelerinde bulunur ve diyatomlar daha fazla, planktonlar ise daha azdır.Bu üç bölgedeki plankton miktarının da oldukça farklı olduğunu belirtmekte fayda var.Bunlar arasında AEP K'nın plankton bolluğu nispeten düşükken, AEP D ve H'nin plankton bolluğu nispeten yüksektir.Bu nedenle, biyokütlelerine (ve dolayısıyla Chl-a'ya benzer) rağmen bu iller oldukça farklıdır: Chl tabanlı il testleri bu farklılıkları yakalayamayabilir.
Ayrıca çok farklı biyokütleye sahip bazı AEP'lerin fitoplankton topluluk yapısı açısından benzer olabileceği de açıktır.Örneğin, bu AEP D ve E'de görülebilir. Birbirlerine yakındırlar ve Pasifik Okyanusu'nda AEP E, oldukça üretken AEPJ'ye yakındır.Benzer şekilde fitoplankton biyokütlesi ile zooplankton bolluğu arasında da net bir bağlantı yoktur.
AEP kendilerine sağlanan besinler açısından anlaşılabilir (Şekil 5B).Diatomlar yalnızca bol miktarda silisik asit kaynağının olduğu yerlerde bulunur.Genel olarak silisik asit miktarı arttıkça diatomların biyokütlesi de artar.Diatomlar AEP A, J, K ve L'de görülebilir. Diatom biyokütlesinin diğer fitoplanktonlara göre oranı, diatom talebine göre sağlanan N, P ve Fe ile belirlenir.Örneğin, AEP L'ye diatomlar hakimdir.Diğer besinlerle karşılaştırıldığında Si en yüksek kaynağa sahiptir.Buna karşılık, daha yüksek üretkenliğe rağmen, AEP J'de daha az diyatome ve daha az silikon kaynağına (tümü ve diğer besin maddelerine göre) sahiptir.
Diazonyum bakterileri nitrojeni sabitleme yeteneğine sahiptir ancak yavaş büyürler (31).Demir ve fosforun diazonyum dışı besinlere olan talebe göre aşırı olduğu diğer fitoplanktonlarla bir arada bulunurlar (20, 21).Diazotrofik biyokütlenin nispeten yüksek olduğunu ve Fe ve P tedarikinin N arzına göre nispeten büyük olduğunu belirtmekte fayda var. Bu şekilde, AEP J'deki toplam biyokütle daha yüksek olmasına rağmen, AEP H'deki diazonyum biyokütlesi J'dekinden daha büyük. Lütfen AEP J ve H'nin coğrafi olarak çok farklı olduğunu ve H'nin ekvator Hint Okyanusu'nda bulunduğunu unutmayın.
Benzersiz ekosistem yapısı illere bölünmemişse, 12 AEP'nin en düşük karmaşıklık modellerinden elde edilen bilgiler o kadar net olmayacaktır.SAGE tarafından oluşturulan AEP, ekosistem modellerinden elde edilen karmaşık ve yüksek boyutlu bilgilerin tutarlı ve eşzamanlı olarak karşılaştırılmasını kolaylaştırır.AEP, yüksek besin seviyelerinde topluluk yapısını veya zooplankton bolluğunu belirlemek için Chl'nin neden iyi ve alternatif bir yöntem olmadığını etkili bir şekilde vurguluyor.Devam eden araştırma konularının ayrıntılı bir analizi bu makalenin kapsamı dışındadır.SAGE yöntemi, modeldeki diğer mekanizmaları keşfetmenin noktadan noktaya görüntülemeye göre daha kolay bir yolunu sağlar.
SAGE yöntemi, küresel fiziksel/biyojeokimyasal/ekosistem sayısal modellerinden son derece karmaşık ekolojik verilerin netleştirilmesine yardımcı olmak için önerilmiştir.Ekolojik bölge, çapraz plankton fonksiyonel gruplarının toplam biyokütlesi, t-SNE olasılık boyutluluk azaltma algoritmasının uygulanması ve denetimsiz ML yöntemi DBSCAN kullanılarak yapılan kümeleme ile belirlenir.Küresel yorumlama için kullanılabilecek sağlam bir AEP elde etmek amacıyla, iç içe yerleştirme yöntemi için iller arası BC farkı/grafik teorisi uygulanmıştır.İnşaat açısından Eko-İl ve AEP benzersizdir.AEP yuvalaması, orijinal ekolojik bölgenin tam karmaşıklığı ile önerilen minimum 12 AEP eşiği arasında ayarlanabilir.AEP'nin minimum karmaşıklığının yuvalanması ve belirlenmesi önemli adımlar olarak kabul edilir, çünkü t-SNE olasılığı <12 karmaşıklıktaki AEP'leri dejenere eder.SAGE yöntemi globaldir ve karmaşıklığı > 100 AEP'den 12'ye kadar değişir. Basitlik açısından, mevcut odak noktası 12 global AEP'nin karmaşıklığıdır.Gelecekteki araştırmalar, özellikle bölgesel çalışmalar, küresel eko-illerin daha küçük bir mekansal alt kümesini faydalı bulabilir ve burada tartışılan aynı ekolojik anlayışlardan yararlanmak için daha küçük bir alanda toplanabilir.Bu ekolojik illerin ve onlardan elde edilen bilgilerin daha ileri düzeyde ekolojik anlayış için nasıl kullanılabileceği, model karşılaştırmasını kolaylaştıracağı ve deniz ekosistemlerinin izlenmesinin potansiyel olarak nasıl iyileştirilebileceği konusunda öneriler sunmaktadır.
SAGE yöntemiyle belirlenen ekolojik il ve AEP, sayısal modeldeki verilere dayanmaktadır.Tanım gereği sayısal model, hedef sistemin özünü yakalamaya çalışan basitleştirilmiş bir yapıdır ve farklı modeller, farklı plankton dağılımına sahip olacaktır.Bu çalışmada kullanılan sayısal model, gözlemlenen modellerden bazılarını (örneğin, ekvator bölgesi ve Güney Okyanusu için Chl tahminlerinde) tam olarak yakalayamamaktadır.Gerçek okyanustaki çeşitliliğin yalnızca küçük bir kısmı yakalanır ve orta ve alt orta ölçekler çözülemez, bu da besin akışını ve daha küçük ölçekli topluluk yapısını etkileyebilir.Bu eksikliklere rağmen AEP'nin karmaşık modellerin anlaşılmasına yardımcı olma konusunda çok faydalı olduğu ortaya çıktı.AEP, benzer ekolojik illerin nerede bulunduğunu değerlendirerek potansiyel bir sayısal model karşılaştırma aracı sağlar.Mevcut sayısal model, uzaktan algılamalı fitoplankton Chl-a konsantrasyonunun genel modelini ve plankton boyutu ile fonksiyonel grubun dağılımını yakalamaktadır (Not S1 ve Şekil S1) (2, 32).
0,1 mgChl-a/m-3 kontur çizgisiyle gösterildiği gibi, AEP oligotrofik alana ve mezotrofik alana bölünmüştür (Şekil S1B): AEP B, C, D, E, F ve G oligotrofik alanlardır ve geri kalan alanlar Yüksek Chl-a'da bulunur.AEP, Longhurst Eyaleti (Şekil S3A) ile, örneğin Güney Okyanusu ve ekvator Pasifik ile bazı yazışmaları göstermektedir.Bazı bölgelerde AEP birden fazla Longhurst bölgesini kapsar ve bunun tersi de geçerlidir.Bu bölgedeki ve Longhurst'teki illerin sınırlandırılmasının amacı farklı olduğundan farklılıkların olması bekleniyor.Longhurst eyaletindeki çok sayıda AEP, benzer biyojeokimyaya sahip belirli alanların çok farklı ekosistem yapılarına sahip olabileceğini göstermektedir.AEP, yüksek yükselme durumları (örneğin, Güney Okyanusu ve ekvator Pasifik; Şekil S3, C ve D) gibi denetimsiz öğrenme (19) kullanılarak ortaya konduğu gibi fiziksel durumlarla belirli bir benzerlik sergiler.Bu yazışmalar, planktonun topluluk yapısının okyanus dinamiklerinden güçlü bir şekilde etkilendiğini göstermektedir.Kuzey Atlantik gibi bölgelerde AEP fiziksel eyaletleri geçer.Bu farklılıklara neden olan mekanizma, benzer fiziksel koşullar altında bile tamamen farklı beslenme programlarına yol açabilen toz taşınması gibi süreçleri içerebilir.
Ekoloji Bakanlığı ve AEP, deniz ekolojisi topluluğunun zaten fark ettiği gibi, Chl'nin tek başına kullanılmasının ekolojik bileşenleri tanımlayamayacağına dikkat çekti.Bu, benzer biyokütleye sahip ancak önemli ölçüde farklı ekolojik bileşime (D ve E gibi) sahip AEP'lerde görülür.Bunun tersine, D ve K gibi AEP'ler çok farklı biyokütleye ancak benzer ekolojik bileşime sahiptir.AEP, biyokütle, ekolojik bileşim ve zooplankton bolluğu arasındaki ilişkinin karmaşık olduğunu vurguluyor.Örneğin AEP J, fitoplankton ve plankton biyokütlesi açısından öne çıksa da AEP'nin A ve L'si benzer plankton biyokütlesine sahiptir ancak A'nın plankton bolluğu daha yüksektir.AEP, fitoplankton biyokütlesinin (veya Chl) zooplankton biyokütlesini tahmin etmek için kullanılamayacağını vurgulamaktadır.Zooplankton, balıkçılık besin zincirinin temelidir ve daha doğru tahminler, daha iyi kaynak yönetimine yol açabilir.Gelecekteki deniz rengi uydular [örneğin, PACE (plankton, aerosol, bulut ve deniz ekosistemi)] fitoplanktonun topluluk yapısını tahmin etmeye yardımcı olmak için daha iyi konumlandırılabilir.AEP tahminini kullanmak, zooplanktonun uzaydan tahminini potansiyel olarak kolaylaştırabilir.SAGE gibi yöntemler, yeni teknolojiler ve temel gerçek araştırmaları için (Tara ve takip araştırmaları gibi) giderek daha fazla saha verisi ile birleştiğinde, uydu tabanlı ekosistem sağlığı izleme yönünde ortak bir adım atabilir.
SAGE yöntemi, biyokütle/Chl, net birincil üretim ve topluluk yapısı gibi il özelliklerini kontrol eden bazı mekanizmaları değerlendirmek için uygun bir yol sağlar.Örneğin, diatomların göreceli miktarı, fitoplanktonun stokiyometrik gereksinimlerine göre Si, N, P ve Fe tedarikindeki dengesizlik tarafından belirlenir.Dengeli bir arz oranında, topluluğa diatomlar (L) hakimdir.Arz oranı dengesiz olduğunda (yani silikon arzı diatomların besin talebinden düşük olduğunda), diatomlar yalnızca küçük bir Pay (K) payı oluşturur.Fe ve P arzı N arzını aştığında (örneğin E ve H), diazotrofik bakteriler kuvvetli bir şekilde büyüyecektir.AEP'nin sağladığı bağlam sayesinde kontrol mekanizmalarının araştırılması daha faydalı hale gelecektir.
Eko-İl ve AEP benzer topluluk yapılarına sahip alanlardır.Ekolojik bir il veya AEP içindeki belirli bir konuma ait zaman serileri bir referans noktası olarak kabul edilebilir ve ekolojik il veya AEP'nin kapsadığı alanı temsil edebilir.Uzun vadeli yerinde izleme istasyonları bu tür zaman serileri sağlar.Uzun vadeli yerinde veri setleri hesaplanamaz bir rol oynamaya devam edecek.Topluluk yapısının izlenmesi açısından SAGE yöntemi, yeni sitelerin en kullanışlı konumunun belirlenmesine yardımcı olacak bir yol olarak görülebilir.Örneğin, uzun vadeli oligotrofik habitat değerlendirmesinden (ALOHA) elde edilen zaman serisi, oligotrofik alanın AEP B'sindedir (Şekil 5C, etiket 2).ALOHA başka bir AEP sınırına yakın olduğundan, daha önce önerildiği gibi zaman serisi tüm alanı temsil etmeyebilir (33).Aynı AEP B'de, SEATS (Güneydoğu Asya Zaman Serisi) zaman serisi Tayvan'ın güneybatısında (34), diğer AEP'lerin sınırlarından daha uzakta (Şekil 5C, etiket 1) yer almaktadır ve izleme için daha iyi bir konum olarak kullanılabilir. AEPB.AEPC'deki BATS (Bermuda Atlantik Zaman Serisi Çalışması) zaman serisi (Şekil 5C, etiket 4), AEP C ve F arasındaki sınıra çok yakındır; bu, BATS zaman serisini kullanarak AEP C'nin izlenmesinin doğrudan sorunlu olabileceğini gösterir.AEP J'deki P İstasyonu (Şekil 5C, etiket 3) AEP sınırından uzakta olduğundan daha temsili niteliktedir.Eko-İl ve AEP, küresel değişikliklerin değerlendirilmesi için uygun bir izleme çerçevesinin oluşturulmasına yardımcı olabilir, çünkü eyaletlerin yerinde örneklemenin nerede yapılacağını değerlendirme izni önemli bilgiler sağlayabilir.SAGE yöntemi, zamandan tasarruf sağlayan değişkenliği değerlendirmek için iklim verilerine uygulanacak şekilde daha da geliştirilebilir.
SAGE yönteminin başarısı, veri bilimi/ML yöntemlerinin ve alana özgü bilgilerin dikkatli bir şekilde uygulanmasıyla elde edilir.Spesifik olarak, t-SNE, yüksek boyutlu verilerin kovaryans yapısını koruyan ve kovaryans topolojisinin görselleştirilmesini kolaylaştıran boyut azaltma işlemini gerçekleştirmek için kullanılır.Veriler şeritler ve kovaryanslar şeklinde düzenlenmiştir (Şekil 2A), bu da tamamen mesafeye dayalı ölçümlerin (K-ortalamaları gibi) genellikle Gauss (dairesel) temel dağılımı kullandıkları için uygun olmadığını gösterir (Not S2'de tartışılmıştır) .DBSCAN yöntemi herhangi bir kovaryans topolojisi için uygundur.Parametrelerin ayarlanmasına dikkat ettiğiniz sürece güvenilir tanımlama sağlanabilir.T-SNE algoritmasının hesaplama maliyeti yüksektir, bu da mevcut uygulamasını daha büyük miktarda veriyle sınırlandırır, bu da derin veya zamanla değişen alanlara uygulanmasının zor olduğu anlamına gelir.T-SNE'nin ölçeklenebilirliğine ilişkin çalışmalar devam etmektedir.KL mesafesinin paralelleştirilmesi kolay olduğundan, t-SNE algoritması gelecekte genişleme açısından iyi bir potansiyele sahiptir (35).Şimdiye kadar, boyutu daha iyi azaltabilecek diğer umut verici boyutsallık azaltma yöntemleri arasında birleşik manifold yaklaşımı ve projeksiyon (UMAP) teknikleri yer alıyor, ancak okyanus verileri bağlamında değerlendirme yapılması gerekiyor.Daha iyi ölçeklenebilirliğin anlamı, örneğin küresel iklimleri veya farklı karmaşıklığa sahip modelleri karma bir katmanda sınıflandırmaktır.Herhangi bir ilde SAGE tarafından sınıflandırılamayan alanlar Şekil 2A'da kalan siyah noktalar olarak kabul edilebilir.Coğrafi olarak bu alanlar çoğunlukla mevsimselliği yüksek bölgelerde yer alıyor; bu da zamanla değişen ekolojik bölgelerin yakalanmasının daha iyi kapsama alanı sağlayacağını gösteriyor.
SAGE yöntemini oluşturmak için, fonksiyonel grup kümelerini belirleme (11 boyutlu uzayda birbirine çok yakın olma olasılığı) ve illeri belirleme yeteneği kullanılarak karmaşık sistemlerden/veri biliminden fikirler kullanılmıştır.Bu bölgeler 3 boyutlu t-SNE faz alanımızdaki belirli hacimleri göstermektedir.Benzer şekilde Poincaré kısmı, "normal" veya "kaotik" davranışı belirlemek amacıyla yörüngenin kapladığı durum uzayının "hacmini" değerlendirmek için kullanılabilir (36).Statik 11 boyutlu model çıktısı için, verinin 3 boyutlu faz uzayına dönüştürülmesinden sonra kapladığı hacim de benzer şekilde açıklanabilir.Coğrafi alan ile 3 boyutlu faz uzayındaki alan arasındaki ilişki basit değildir ancak ekolojik benzerlik açısından açıklanabilir.Bu nedenle daha geleneksel BC benzemezlik ölçüsü tercih edilir.
Gelecekteki çalışmalarda, belirlenen illerin ve AEP'nin mekansal değişkenliğini değerlendirmek amacıyla mevsimsel olarak değişen veriler için SAGE yöntemi yeniden kullanılacaktır.Gelecekteki hedef ise bu yöntemi kullanarak uydu ölçümleri (Chl-a, uzaktan algılama yansıması ve deniz yüzeyi sıcaklığı gibi) ile hangi illerin belirlenebileceğinin belirlenmesine yardımcı olmaktır.Bu, ekolojik bileşenlerin uzaktan algılamayla değerlendirilmesine ve ekolojik bölgelerin ve bunların değişkenliğinin oldukça esnek bir şekilde izlenmesine olanak sağlayacaktır.
Bu araştırmanın amacı, ekolojik bir ili kendine özgü plankton topluluk yapısı üzerinden tanımlayan SAGE yöntemini tanıtmaktır.Burada t-SNE ve DBSCAN algoritmalarının fiziksel/biyojeokimyasal/ekosistem modeli ve parametre seçimi hakkında daha detaylı bilgi verilecektir.
Modelin fiziksel bileşenleri okyanus dolaşımı ve iklim tahmininden gelmektedir [ECCOv4;(37) (38) tarafından açıklanan küresel durum tahmini.Durum tahmininin nominal çözünürlüğü 1/5'tir.Başlangıç ve sınır koşullarını ve gözlem yoluyla ayarlanan dahili model parametrelerini elde etmek için Lagrangian çarpan yöntemi ile en küçük kareler yöntemi kullanılır, böylece serbest çalışan bir MIT genel döngü modeli (MITgcm) (39) oluşturulur, model optimizasyondan sonra sonuçlar takip edilmeli ve gözlemlenmelidir.
Biyojeokimya/ekosistem (2)'de daha kapsamlı bir açıklamaya (yani denklemler ve parametre değerleri) sahiptir.Model, inorganik ve organik havuzlarda C, N, P, Si ve Fe'nin dolaşımını yakalıyor.Burada kullanılan versiyon 35 fitoplankton türü içerir: 2 tür mikroprokaryot ve 2 tür mikroökaryot (besin değeri düşük ortamlar için uygundur), 5 tür Cryptomonas sphaeroides (kalsiyum karbonat kaplamalı), 5 tür diazonyum (Azodu sabitleyebilir, yani (sınırlı değildir) çözünmüş inorganik nitrojenin mevcudiyeti), 11 diatom (silisli bir örtü oluşturur), 10 karışık bitkisel flagellat (fotosentez yapabilir ve diğer planktonları yiyebilir) ve 16 Zooplankton (diğer planktonları otlatabilir).Bunlar, deniz biyojeokimyası üzerinde farklı etkileri olduğundan (40, 41) "biyojeokimyasal fonksiyonel gruplar" olarak adlandırılmaktadır ve gözlem ve model çalışmalarında sıklıkla kullanılmaktadır.Bu modelde, her fonksiyonel grup, 0,6 ila 2500 μm eşdeğer küresel çapa sahip, farklı boyutlarda birkaç planktondan oluşur.
Fitoplanktonun büyümesini, otlamasını ve batmasını etkileyen parametreler boyutla ilişkilidir ve altı fitoplankton fonksiyonel grubu arasında spesifik farklılıklar vardır (32).Farklı fiziksel çerçevelere rağmen, modelin 51 plankton bileşeninin sonuçları yakın zamanda yapılan birçok çalışmada kullanılmıştır (42-44).
1992'den 2011'e kadar fiziksel/biyojeokimyasal/ekosistem birleştirme modeli 20 yıl sürdü.Modelin çıktısı plankton biyokütlesini, besin konsantrasyonunu ve besin tedarik oranını (DIN, PO4, Si ve Fe) içerir.Bu çalışmada Ekolojik İl'in girdisi olarak bu çıktıların 20 yıllık ortalaması kullanılmıştır.Chl, plankton biyokütlesinin ve besin konsantrasyonunun dağılımı ve fonksiyonel grupların dağılımı uydu ve yerinde gözlemlerle karşılaştırılır [bkz. (2, 44), Not S1 ve şekil.S1 ila S3].
SAGE yöntemi için rastgeleliğin ana kaynağı t-SNE adımından gelir.Rastgelelik tekrarlanabilirliği engeller, bu da sonuçların güvenilmez olduğu anlamına gelir.SAGE yöntemi, tekrarlandığında kümeleri tutarlı bir şekilde tanımlayabilen bir dizi t-SNE ve DBSCAN parametresini belirleyerek sağlamlığı titizlikle test eder.T-SNE parametresinin "karışıklığının" belirlenmesi, yüksek boyutlardan alçak boyutlara doğru yapılan haritalamanın verinin yerel veya küresel özelliklerine ne ölçüde uyması gerektiğinin belirlenmesi olarak anlaşılabilir.400 ve 300 tekrarlama karışıklığına ulaşıldı.
Kümeleme algoritması DBSCAN için kümedeki veri noktalarının minimum boyutunun ve mesafe ölçüsünün belirlenmesi gerekmektedir.Minimum sayı uzmanların rehberliğinde belirlenir.Bu bilgi, mevcut sayısal modelleme çerçevesine ve çözünürlüğüne neyin uyduğunu bilir.Minimum sayı 100'dür. Daha yüksek bir minimum değer (yeşilin üst sınırı genişlemeden önce <135'ten küçük) düşünülebilir ancak BC farklılığına dayalı toplama yönteminin yerini alamaz.Bağlantı derecesi (Şekil 6A), daha yüksek kapsama alanı sağlayan ϵ parametresini ayarlamak için kullanılır (Şekil 6B).Bağlantı, kümelerin bileşik sayısı olarak tanımlanır ve ϵ parametresine duyarlıdır.Daha düşük bağlantı, bölgelerin yapay olarak gruplandırıldığı yetersiz uyum anlamına gelir.Yüksek bağlantı aşırı uyumu gösterir.Aşırı uyum da sorunludur çünkü başlangıçtaki rastgele tahminlerin tekrarlanamayan sonuçlara yol açabileceğini gösterir.Bu iki uç nokta arasında keskin bir artış (genellikle "dirsek" olarak adlandırılır) en iyi ϵ'yi gösterir.Şekil 6A'da plato alanında keskin bir artış (sarı, > 200 küme) ve ardından yaklaşık 130'a kadar keskin bir düşüş (yeşil, 100 küme) ve çok az kümeyle (mavi, <60 küme) çevrelendiğini görüyorsunuz. ).En az 100 mavi alanda ya bir küme tüm okyanusa hakimdir (ϵ <0,42) ya da okyanusun büyük bir kısmı sınıflandırılmaz ve gürültü olarak kabul edilir (ϵ> 0,99).Sarı alan oldukça değişken, tekrarlanamayan bir küme dağılımına sahiptir.ϵ azaldıkça gürültü artar.Keskin bir şekilde artan yeşil alana dirsek denir.Bu optimal bir bölgedir.Her ne kadar t-SNE olasılığı kullanılsa da, il içindeki BC farklılığı güvenilir kümelemeyi belirlemek için hala kullanılabilir.Şekil 6'yı (A ve B) kullanarak ϵ'yi 0,39'a ayarlayın.Minimum sayı ne kadar büyük olursa, güvenilir sınıflandırmayı sağlayan ϵ değerine ulaşma olasılığı da o kadar küçük olur ve değeri 135'ten büyük olan yeşil alan da o kadar büyük olur. Bu alanın genişlemesi, dirseğin bulunmasının daha zor olacağını veya bulunamayacağını gösterir. mevcut.
T-SNE parametrelerini ayarladıktan sonra, bulunan toplam küme sayısı, bağlantı ölçüsü (A) ve kümeye (B) tahsis edilen verilerin yüzdesi olarak kullanılacaktır.Kırmızı nokta, kapsama ve bağlantının en iyi kombinasyonunu gösterir.Minimum sayı ekolojiyle ilgili minimum sayıya göre belirlenir.
Bu makaleye ilişkin ek materyaller için lütfen http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1 adresine bakın.
Bu, Creative Commons Atıf Lisansı koşulları altında dağıtılan açık erişimli bir makaledir.Makale, orijinal esere uygun şekilde atıfta bulunulması koşuluyla, herhangi bir ortamda sınırsız kullanıma, dağıtıma ve çoğaltmaya izin vermektedir.
Not: Sayfaya önerdiğiniz kişinin e-postayı görmesini istediğinizi ve spam olmadığını bilmesi için e-posta adresinizi vermenizi rica ediyoruz.Herhangi bir e-posta adresini yakalamayacağız.
Bu soru ziyaretçi olup olmadığınızı test etmek ve otomatik spam gönderimini önlemek için kullanılır.
Küresel Deniz Ekolojisi Bakanlığı karmaşık sorunları çözmeye kararlıdır ve topluluk yapılarını keşfetmek için denetimsiz ML'yi kullanır.
Küresel Deniz Ekolojisi Bakanlığı karmaşık sorunları çözmeye kararlıdır ve topluluk yapılarını keşfetmek için denetimsiz ML'yi kullanır.

Gönderim zamanı: Ocak-12-2021

Ekolojik karmaşıklığın açıklığa kavuşturulması: Denetimsiz öğrenme küresel deniz ekolojik bölgesini belirliyor