प्लवक समुदाय संरचना और पोषक प्रवाह डेटा के आधार पर वैश्विक समुद्री पारिस्थितिक प्रांतों (इको-प्रांतों) को निर्धारित करने के लिए एक अप्रशिक्षित शिक्षण पद्धति प्रस्तावित है।व्यवस्थित एकीकृत पारिस्थितिक प्रांत (एसएजीई) विधि अत्यधिक गैर-रेखीय पारिस्थितिकी तंत्र मॉडल में पारिस्थितिक प्रांतों की पहचान कर सकती है।डेटा के गैर-गॉसियन सहप्रसरण को अनुकूलित करने के लिए, SAGE आयामीता को कम करने के लिए टी यादृच्छिक पड़ोसी एम्बेडिंग (टी-एसएनई) का उपयोग करता है।घनत्व-आधारित स्थानिक क्लस्टरिंग (डीबीएससीएएन) एल्गोरिदम पर आधारित शोर अनुप्रयोग की मदद से सौ से अधिक पारिस्थितिक प्रांतों की पहचान की जा सकती है।दूरी के माप के रूप में पारिस्थितिक मतभेदों के साथ कनेक्टिविटी मानचित्र का उपयोग करते हुए, एक मजबूत समग्र पारिस्थितिक प्रांत (एईपी) को नेस्टेड पारिस्थितिक प्रांतों के माध्यम से निष्पक्ष रूप से परिभाषित किया गया है।एईपी का उपयोग करके सामुदायिक संरचना पर पोषक तत्व आपूर्ति दर के नियंत्रण का पता लगाया गया।इको-प्रांत और एईपी अद्वितीय हैं और मॉडल व्याख्या में मदद कर सकते हैं।वे मॉडलों के बीच तुलना की सुविधा प्रदान कर सकते हैं और समुद्री पारिस्थितिक तंत्र की समझ और निगरानी को बढ़ा सकते हैं।
प्रांत वे क्षेत्र हैं जहां समुद्र या भूमि पर जटिल जीवनी को सुसंगत और सार्थक क्षेत्रों में व्यवस्थित किया जाता है (1)।ये प्रांत स्थानों की तुलना और अंतर करने, अवलोकन, निगरानी और सुरक्षा को चिह्नित करने के लिए बहुत महत्वपूर्ण हैं।इन प्रांतों को उत्पन्न करने वाली जटिल और गैर-रैखिक बातचीत प्रांतों को निष्पक्ष रूप से निर्धारित करने के लिए अनसुपरवाइज्ड मशीन लर्निंग (एमएल) विधियों को बहुत उपयुक्त बनाती है, क्योंकि डेटा में सहप्रसरण जटिल और गैर-गॉसियन है।यहां, एक एमएल विधि प्रस्तावित है, जो डार्विन वैश्विक त्रि-आयामी (3डी) भौतिक/पारिस्थितिकी तंत्र मॉडल (2) से व्यवस्थित रूप से अद्वितीय समुद्री पारिस्थितिक प्रांतों (इको-प्रांतों) की पहचान करती है।"अद्वितीय" शब्द का उपयोग यह इंगित करने के लिए किया जाता है कि पहचाना गया क्षेत्र अन्य क्षेत्रों के साथ पर्याप्त रूप से ओवरलैप नहीं होता है।इस विधि को सिस्टम इंटीग्रेटेड इकोलॉजिकल प्रोविंस (SAGE) विधि कहा जाता है।उपयोगी वर्गीकरण करने के लिए, एक एल्गोरिदम विधि को (i) वैश्विक वर्गीकरण और (ii) बहु-स्तरीय विश्लेषण की अनुमति देने की आवश्यकता होती है जिसे अंतरिक्ष और समय (3) में नेस्टेड/एकत्रित किया जा सकता है।इस शोध में सबसे पहले SAGE पद्धति प्रस्तावित की गई और पहचाने गए पारिस्थितिक प्रांतों पर चर्चा की गई।इको-प्रांत उन कारकों की समझ को बढ़ावा दे सकते हैं जो सामुदायिक संरचना को नियंत्रित करते हैं, निगरानी रणनीतियों के लिए उपयोगी अंतर्दृष्टि प्रदान करते हैं और पारिस्थितिकी तंत्र में परिवर्तनों को ट्रैक करने में मदद करते हैं।
स्थलीय प्रांतों को आमतौर पर जलवायु (वर्षा और तापमान), मिट्टी, वनस्पति और जीवों में समानता के अनुसार वर्गीकृत किया जाता है, और सहायक प्रबंधन, जैव विविधता अनुसंधान और रोग नियंत्रण (1, 4) के लिए उपयोग किया जाता है।समुद्री प्रांतों को परिभाषित करना अधिक कठिन है।अधिकांश जीव तरल सीमा वाले सूक्ष्मदर्शी होते हैं।लॉन्गहर्स्ट एट अल.(5) पर्यावरणीय स्थितियों के आधार पर समुद्र विज्ञान मंत्रालय के पहले वैश्विक वर्गीकरणों में से एक प्रदान किया गया।इन "लॉन्गहर्स्ट" प्रांतों की परिभाषा में मिश्रण दर, स्तरीकरण और विकिरण जैसे चर शामिल हैं, साथ ही समुद्री समुद्र विज्ञानी के रूप में लॉन्गहर्स्ट का व्यापक अनुभव भी शामिल है, जिनके पास समुद्री पारिस्थितिक तंत्र के लिए अन्य महत्वपूर्ण स्थितियां हैं।उदाहरण के लिए, प्राथमिक उत्पादन और कार्बन प्रवाह का आकलन करने, मत्स्य पालन में सहायता करने और यथास्थान अवलोकन गतिविधियों की योजना बनाने के लिए लॉन्गहर्स्ट का बड़े पैमाने पर उपयोग किया गया है (5-9)।प्रांतों को अधिक वस्तुनिष्ठ रूप से परिभाषित करने के लिए, फ़ज़ी लॉजिक और क्षेत्रीय अनपर्यवेक्षित क्लस्टरिंग/सांख्यिकी जैसी विधियों का उपयोग किया गया है (9-14)।ऐसी विधियों का उद्देश्य सार्थक संरचनाओं की पहचान करना है जो उपलब्ध अवलोकन डेटा में प्रांतों की पहचान कर सकें।उदाहरण के लिए, गतिशील समुद्री प्रांत (12) शोर को कम करने के लिए स्व-संगठित मानचित्रों का उपयोग करते हैं, और क्षेत्रीय उपग्रहों [क्लोरोफिल ए (सीएचएल-ए), सामान्यीकृत प्रतिदीप्ति रेखा ऊंचाई और से प्राप्त समुद्री रंग उत्पादों को निर्धारित करने के लिए पदानुक्रमित (वृक्ष-आधारित) क्लस्टरिंग का उपयोग करते हैं। रंगीन विघटित कार्बनिक पदार्थ] और भौतिक क्षेत्र (समुद्र की सतह का तापमान और लवणता, पूर्ण गतिशील स्थलाकृति और समुद्री बर्फ)।
प्लवक की सामुदायिक संरचना चिंता का विषय है क्योंकि इसकी पारिस्थितिकी का उच्च पोषक स्तर, कार्बन अवशोषण और जलवायु पर बहुत प्रभाव पड़ता है।फिर भी, प्लवक समुदाय संरचना के आधार पर वैश्विक पारिस्थितिक प्रांत का निर्धारण करना अभी भी एक चुनौतीपूर्ण और मायावी लक्ष्य है।समुद्री रंग उपग्रह संभावित रूप से फाइटोप्लांकटन के मोटे अनाज वाले वर्गीकरण में अंतर्दृष्टि प्रदान कर सकते हैं या कार्यात्मक समूहों (15) के लाभों का सुझाव दे सकते हैं, लेकिन वे वर्तमान में सामुदायिक संरचना पर विस्तृत जानकारी प्रदान करने में असमर्थ हैं।हाल के सर्वेक्षण [जैसे तारा ओसियन (16)] सामुदायिक संरचना का अभूतपूर्व माप प्रदान कर रहे हैं;वर्तमान में, वैश्विक स्तर पर केवल विरल इन-सीटू अवलोकन हैं (17)।पिछले अध्ययनों ने जैव रासायनिक समानताओं (जैसे प्राथमिक उत्पादन, सीएचएल और उपलब्ध प्रकाश) के निर्धारण के आधार पर बड़े पैमाने पर "बायोजियोकेमिकल प्रांत" (12, 14, 18) निर्धारित किया है।यहां, संख्यात्मक मॉडल का उपयोग आउटपुट के लिए किया जाता है [डार्विन(2)], और पारिस्थितिक प्रांत सामुदायिक संरचना और पोषक प्रवाह के अनुसार निर्धारित किया जाता है।इस अध्ययन में उपयोग किए गए संख्यात्मक मॉडल में वैश्विक कवरेज है और इसकी तुलना मौजूदा फ़ील्ड डेटा (17) और रिमोट सेंसिंग फ़ील्ड (नोट S1) से की जा सकती है।इस अध्ययन में उपयोग किए गए संख्यात्मक मॉडल डेटा में वैश्विक कवरेज का लाभ है।मॉडल पारिस्थितिकी तंत्र में फाइटोप्लांकटन की 35 प्रजातियां और ज़ोप्लांकटन की 16 प्रजातियां शामिल हैं (कृपया सामग्री और विधियों को देखें)।मॉडल प्लैंकटन प्रकार गैर-गाऊसी सहप्रसरण संरचनाओं के साथ गैर-रेखीय रूप से बातचीत करते हैं, इसलिए सरल नैदानिक तरीके उभरते सामुदायिक संरचनाओं में अद्वितीय और सुसंगत पैटर्न की पहचान करने के लिए उपयुक्त नहीं हैं।यहां प्रस्तुत SAGE पद्धति जटिल डार्विन मॉडल के आउटपुट की जांच करने का एक नया तरीका प्रदान करती है।
डेटा विज्ञान/एमएल प्रौद्योगिकी की शक्तिशाली परिवर्तनकारी क्षमताएं डेटा सहप्रसरण में जटिल लेकिन मजबूत संरचनाओं को प्रकट करने के लिए अत्यधिक जटिल मॉडल समाधानों को सक्षम कर सकती हैं।एक मजबूत विधि को एक ऐसी विधि के रूप में परिभाषित किया जाता है जो किसी दिए गए त्रुटि सीमा के भीतर परिणामों को ईमानदारी से पुन: पेश कर सकती है।यहां तक कि सरल प्रणालियों में भी, मजबूत पैटर्न और संकेतों का निर्धारण करना एक चुनौती हो सकता है।जब तक देखे गए पैटर्न के लिए तर्क निर्धारित नहीं किया जाता है, तब तक उभरती जटिलता जटिल/हल करना मुश्किल लग सकती है।पारिस्थितिकी तंत्र की संरचना निर्धारित करने की मुख्य प्रक्रिया प्रकृति में अरैखिक है।गैर-रेखीय इंटरैक्शन का अस्तित्व मजबूत वर्गीकरण को भ्रमित कर सकता है, इसलिए उन तरीकों से बचना आवश्यक है जो डेटा सहप्रसरण के बुनियादी सांख्यिकीय वितरण के बारे में मजबूत धारणा बनाते हैं।उच्च-आयामी और गैर-रेखीय डेटा समुद्र विज्ञान में आम हैं और इसमें जटिल, गैर-गॉसियन टोपोलॉजी के साथ एक सहप्रसरण संरचना हो सकती है।यद्यपि गैर-गॉसियन सहप्रसरण संरचना वाला डेटा मजबूत वर्गीकरण में बाधा उत्पन्न कर सकता है, SAGE विधि नवीन है क्योंकि इसे मनमाने ढंग से टोपोलॉजी वाले समूहों की पहचान करने के लिए डिज़ाइन किया गया है।
SAGE पद्धति का लक्ष्य उभरते हुए पैटर्न की निष्पक्ष रूप से पहचान करना है जो पारिस्थितिक समझ को आगे बढ़ाने में मदद कर सकता है।(19) के समान क्लस्टर-आधारित वर्कफ़्लो के बाद, पारिस्थितिक और पोषक तत्व प्रवाह चर का उपयोग डेटा में एकमात्र क्लस्टर को निर्धारित करने के लिए किया जाता है, जिसे पारिस्थितिक प्रांत कहा जाता है।इस अध्ययन में प्रस्तावित SAGE विधि (चित्र 1) सबसे पहले प्राथमिकता परिभाषित प्लैंकटन कार्यात्मक समूहों को जोड़कर आयामीता को 55 से 11 आयामों तक कम कर देती है (सामग्री और तरीके देखें)।टी-रैंडम पड़ोसी एम्बेडिंग (टी-एसएनई) विधि का उपयोग करके, संभावना को 3डी स्पेस में प्रक्षेपित करके आकार को और कम किया जाता है।अप्रशिक्षित क्लस्टरिंग पारिस्थितिक रूप से करीबी क्षेत्रों की पहचान कर सकती है [शोर-आधारित अनुप्रयोगों के लिए घनत्व-आधारित स्थानिक क्लस्टरिंग (डीबीएससीएएन)।टी-एसएनई और डीबीएससीएएन दोनों अंतर्निहित गैर-रेखीय पारिस्थितिकी तंत्र संख्यात्मक मॉडल डेटा पर लागू होते हैं।फिर परिणामी पारिस्थितिक प्रांत को पृथ्वी पर पुनः प्रक्षेपित करें।क्षेत्रीय अनुसंधान के लिए उपयुक्त एक सौ से अधिक अद्वितीय पारिस्थितिक प्रांतों की पहचान की गई है।विश्व स्तर पर सुसंगत पारिस्थितिकी तंत्र मॉडल पर विचार करने के लिए, पारिस्थितिक प्रांतों की प्रभावशीलता में सुधार के लिए पारिस्थितिक प्रांतों को समग्र पारिस्थितिक प्रांतों (एईपी) में एकत्रित करने के लिए एसएजीई विधि का उपयोग किया जाता है।एकत्रीकरण का स्तर (जिसे "जटिलता" कहा जाता है) को आवश्यक विवरण के स्तर पर समायोजित किया जा सकता है।एक मजबूत एईपी की न्यूनतम जटिलता निर्धारित करें।चयन का फोकस एसएजीई पद्धति और आपातकालीन सामुदायिक संरचना के नियंत्रण को निर्धारित करने के लिए सबसे छोटी जटिलता वाले एईपी मामलों की खोज करना है।फिर पारिस्थितिक अंतर्दृष्टि प्रदान करने के लिए पैटर्न का विश्लेषण किया जा सकता है।यहां प्रस्तुत विधि का उपयोग मॉडल की तुलना के लिए अधिक व्यापक रूप से किया जा सकता है, उदाहरण के लिए, अंतर और समानता को उजागर करने के लिए विभिन्न मॉडलों में पाए गए समान पारिस्थितिक प्रांतों के स्थानों का मूल्यांकन करके, ताकि मॉडल की तुलना की जा सके।
(ए) पारिस्थितिक प्रांत के निर्धारण के लिए कार्यप्रवाह का योजनाबद्ध आरेख;मूल 55-आयामी डेटा को 11-आयामी मॉडल आउटपुट में कम करने के लिए कार्यात्मक समूह में योग का उपयोग करना, जिसमें सात कार्यात्मक/पोषक प्लवक का बायोमास और चार पोषक आपूर्ति दरें शामिल हैं।नगण्य मूल्य और टिकाऊ बर्फ आवरण क्षेत्र।डेटा को मानकीकृत और मानकीकृत किया गया है।सांख्यिकीय रूप से समान सुविधा संयोजनों को उजागर करने के लिए टी-एसएनई एल्गोरिदम को 11-आयामी डेटा प्रदान करें।DBSCAN पैरामीटर मान सेट करने के लिए क्लस्टर का सावधानीपूर्वक चयन करेगा।अंत में डेटा को वापस अक्षांश/देशांतर प्रक्षेपण पर प्रोजेक्ट करें।कृपया ध्यान दें कि इस प्रक्रिया को 10 बार दोहराया जाता है क्योंकि टी-एसएनई लगाने से थोड़ी सी यादृच्छिकता उत्पन्न हो सकती है।(बी) बताता है कि (ए) 10 बार वर्कफ़्लो को दोहराकर एईपी कैसे प्राप्त करें।इन 10 कार्यान्वयनों में से प्रत्येक के लिए, अंतर-प्रांतीय ब्रे-कर्टिस (बीसी) असमानता मैट्रिक्स को 51 फाइटोप्लांकटन प्रकारों के बायोमास के आधार पर निर्धारित किया गया था।जटिलता 1 एईपी से पूर्ण जटिलता 115 तक, प्रांतों के बीच बीसी अंतर निर्धारित करें। बीसी बेंचमार्क लॉन्गहर्स्ट प्रांत द्वारा निर्धारित किया गया है।
SAGE विधि पारिस्थितिक प्रांत को परिभाषित करने के लिए वैश्विक 3D भौतिक/पारिस्थितिकी तंत्र संख्यात्मक मॉडल के आउटपुट का उपयोग करती है [डार्विन (2);सामग्री और विधियाँ और नोट S1 देखें]।पारिस्थितिकी तंत्र के घटक फाइटोप्लांकटन की 35 प्रजातियों और ज़ोप्लांकटन की 16 प्रजातियों से बने होते हैं, जिनमें सात पूर्वनिर्धारित कार्यात्मक समूह होते हैं: प्रोकैरियोट्स और यूकेरियोट्स कम पोषक तत्व वाले वातावरण के लिए अनुकूलित होते हैं, कैल्शियम कार्बोनेट कोटिंग के साथ कोक्सीडिया, और भारी नाइट्रोजन स्थिरीकरण नाइट्रोजन पोषक तत्व (आमतौर पर गायब होते हैं) महत्वपूर्ण पोषक तत्व), सिलिसियस आवरण के साथ, अन्य प्लवक प्रकाश संश्लेषण और चराई मिश्रित पोषक तत्व फ्लैगेलेट्स और ज़ोप्लांकटन चरवाहे बना सकते हैं।आकार अवधि 0.6 से 2500μm समतुल्य गोलाकार व्यास है।फाइटोप्लांकटन आकार और कार्यात्मक समूहन का मॉडल वितरण उपग्रह और इन-सीटू अवलोकनों में देखी गई समग्र विशेषताओं को कैप्चर करता है (आंकड़े S1 से S3 देखें)।संख्यात्मक मॉडल और प्रेक्षित महासागर के बीच समानता इंगित करती है कि मॉडल द्वारा परिभाषित प्रांत इन-सीटू महासागर पर लागू हो सकते हैं।कृपया ध्यान दें कि यह मॉडल केवल फाइटोप्लांकटन की कुछ विविधता और सीटू महासागर की केवल कुछ भौतिक और रासायनिक बल सीमाओं को ही पकड़ता है।SAGE पद्धति लोगों को मॉडल सामुदायिक संरचना के अत्यधिक क्षेत्रीय नियंत्रण तंत्र को बेहतर ढंग से समझने में सक्षम बना सकती है।
प्रत्येक प्लवक कार्यात्मक समूह में केवल सतह बायोमास (20 वर्षों के औसत समय के साथ) का योग शामिल करके, डेटा की आयामीता को कम किया जा सकता है।पहले के अध्ययनों से पता चला है कि सामुदायिक संरचना स्थापित करने में उनकी महत्वपूर्ण भूमिका थी, इसमें पोषक तत्वों के प्रवाह (नाइट्रोजन, लौह, फॉस्फेट और सिलिकिक एसिड की आपूर्ति) के लिए सतह स्रोत शब्द भी शामिल थे [उदाहरण (20, 21)]।कार्यात्मक समूहों का योग समस्या को 55 (51 प्लवक और 4 पोषक प्रवाह) से घटाकर 11 आयामों तक कर देता है।इस प्रारंभिक अध्ययन में, एल्गोरिदम द्वारा लगाए गए कम्प्यूटेशनल बाधाओं के कारण, गहराई और समय परिवर्तनशीलता पर विचार नहीं किया गया।
SAGE विधि गैर-रेखीय प्रक्रियाओं और कार्यात्मक समूह बायोमास और पोषक प्रवाह के बीच बातचीत की प्रमुख विशेषताओं के बीच महत्वपूर्ण संबंधों की पहचान करने में सक्षम है।यूक्लिडियन दूरस्थ शिक्षा विधियों (जैसे के-मीन्स) पर आधारित 11-आयामी डेटा का उपयोग करके विश्वसनीय और प्रतिलिपि प्रस्तुत करने योग्य प्रांत (19, 22) प्राप्त नहीं किए जा सकते हैं।ऐसा इसलिए है क्योंकि पारिस्थितिक प्रांत को परिभाषित करने वाले प्रमुख तत्वों के सहप्रसरण के मूल वितरण में कोई गाऊसी आकार नहीं पाया जाता है।वोरोनोई कोशिकाओं (सीधी रेखाएं) के के-साधन गैर-गॉसियन मूल वितरण को बरकरार नहीं रख सकते हैं।
सात प्लवक कार्यात्मक समूहों और चार पोषक प्रवाह का बायोमास एक 11-आयामी वेक्टर x बनाता है।इसलिए, x मॉडल ग्रिड पर एक वेक्टर फ़ील्ड है, जहां प्रत्येक तत्व xi मॉडल क्षैतिज ग्रिड पर परिभाषित 11-आयामी वेक्टर का प्रतिनिधित्व करता है।प्रत्येक सूचकांक मैं विशिष्ट रूप से गोले पर एक ग्रिड बिंदु की पहचान करता है, जहां (लोन, लैट) = (ϕi, θi)।यदि मॉडल ग्रिड इकाई का बायोमास 1.2×10-3mg Chl/m3 से कम है या बर्फ कवरेज दर 70% से अधिक है, तो बायोमास डेटा के लॉग का उपयोग किया जाता है और त्याग दिया जाता है।डेटा सामान्यीकृत और मानकीकृत है, इसलिए सभी डेटा [0 से 1] की सीमा में हैं, माध्य हटा दिया गया है और इकाई भिन्नता पर स्केल किया गया है।ऐसा इसलिए किया जाता है ताकि विशेषताएं (बायोमास और पोषक तत्व प्रवाह) संभावित मूल्यों की सीमा में विरोधाभास से सीमित न हों।क्लस्टरिंग को भौगोलिक दूरी के बजाय सुविधाओं के बीच मुख्य संभाव्यता दूरी से परिवर्तन संबंध को पकड़ना चाहिए।इन दूरियों को मापने से महत्वपूर्ण विशेषताएं सामने आती हैं, जबकि अनावश्यक विवरण हटा दिए जाते हैं।पारिस्थितिक दृष्टिकोण से, यह आवश्यक है क्योंकि कम बायोमास वाले कुछ प्रकार के फाइटोप्लांकटन में अधिक जैव-रासायनिक प्रभाव हो सकते हैं, जैसे कि डायज़ोट्रोफ़िक बैक्टीरिया द्वारा नाइट्रोजन निर्धारण।डेटा को मानकीकृत और सामान्य करते समय, इस प्रकार के सहसंयोजकों को हाइलाइट किया जाएगा।
निम्न-आयामी प्रतिनिधित्व में उच्च-आयामी स्थान में सुविधाओं की निकटता पर जोर देकर, टी-एसएनई एल्गोरिथ्म का उपयोग मौजूदा समान क्षेत्रों को स्पष्ट करने के लिए किया जाता है।पिछले काम का उद्देश्य रिमोट सेंसिंग अनुप्रयोगों के लिए गहरे तंत्रिका नेटवर्क का निर्माण करना था, जिसमें टी-एसएनई का उपयोग किया गया था, जिसने प्रमुख विशेषताओं (23) को अलग करने में अपना कौशल साबित किया था।गैर-अभिसरण समाधानों (नोट S2) से बचते हुए फीचर डेटा में मजबूत क्लस्टरिंग की पहचान करने के लिए यह एक आवश्यक कदम है।गॉसियन कर्नेल का उपयोग करते हुए, टी-एसएनई प्रत्येक उच्च-आयामी वस्तु को 3डी चरण स्थान में एक बिंदु पर मैप करके डेटा के सांख्यिकीय गुणों को संरक्षित करता है, जिससे यह सुनिश्चित होता है कि उच्च और निम्न दिशाओं में समान वस्तुओं की संभावना उच्च-उच्च है। आयामी स्थान (24)।एन उच्च-आयामी वस्तुओं x1,…,xN के एक सेट को देखते हुए, टी-एसएनई एल्गोरिथ्म कुल्बैक-लीब्लर (केएल) विचलन (25) को कम करके कम करता है।केएल विचलन एक माप है कि संभाव्यता वितरण दूसरे संदर्भ संभाव्यता वितरण से कितना अलग है, और उच्च-आयामी सुविधाओं के निम्न-आयामी प्रतिनिधित्व के बीच सहसंबंध की संभावना का प्रभावी ढंग से मूल्यांकन कर सकता है।यदि xi, N-आयामी अंतरिक्ष में i-th वस्तु है, xj, N-आयामी अंतरिक्ष में j-th वस्तु है, yi निम्न-आयामी अंतरिक्ष में i-th वस्तु है, और yj निम्न-आयामी अंतरिक्ष में j-th वस्तु है। -आयामी स्थान, फिर t -SNE समानता संभाव्यता ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) को परिभाषित करता है, और आयामी कमी सेट के लिए q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
चित्र 2ए 11-आयामी संयोजन के बायोमास और पोषक प्रवाह वैक्टर को 3डी में कम करने के प्रभाव को दर्शाता है।टी-एसएनई को लागू करने की प्रेरणा की तुलना प्रमुख घटक विश्लेषण (पीसीए) की प्रेरणा से की जा सकती है, जो डेटा के क्षेत्र/विशेषता पर जोर देने के लिए विचरण विशेषता का उपयोग करता है, जिससे आयामीता कम हो जाती है।इको-मंत्रालय के लिए विश्वसनीय और प्रतिलिपि प्रस्तुत करने योग्य परिणाम प्रदान करने में टी-एसएनई विधि पीसीए से बेहतर पाई गई (नोट एस2 देखें)।ऐसा इसलिए हो सकता है क्योंकि पीसीए की ऑर्थोगोनैलिटी धारणा अत्यधिक गैर-रेखीय इंटरैक्टिव सुविधाओं के बीच महत्वपूर्ण इंटरैक्शन की पहचान करने के लिए उपयुक्त नहीं है, क्योंकि पीसीए रैखिक सहप्रसरण संरचनाओं (26) पर केंद्रित है।रिमोट सेंसिंग डेटा का उपयोग करते हुए, लुंगा एट अल।(27) यह दर्शाता है कि गौसियन वितरण से विचलित होने वाली जटिल और गैर-रेखीय वर्णक्रमीय विशेषताओं को उजागर करने के लिए एसएनई पद्धति का उपयोग कैसे किया जाए।
(ए) एक मॉडल पोषक तत्व आपूर्ति दर, फाइटोप्लांकटन और ज़ोप्लांकटन कार्यात्मक समूह बायोमास टी-एसएनई एल्गोरिदम द्वारा तैयार किया गया है और डीबीएससीएएन का उपयोग करके प्रांत द्वारा रंगीन किया गया है।प्रत्येक बिंदु उच्च-आयामी अंतरिक्ष में एक बिंदु का प्रतिनिधित्व करता है, जैसा कि चित्र 6बी में दिखाया गया है, अधिकांश बिंदु कैप्चर किए गए हैं।शाफ्ट "टी-एसएनई" आकार 1, 2 और 3 को संदर्भित करते हैं। (बी) मूल के अक्षांश-देशांतर ग्रिड पर डीबीएससीएएन द्वारा पाया गया प्रांत का भौगोलिक प्रक्षेपण।रंग को किसी भी रंग के रूप में माना जाना चाहिए, लेकिन (ए) के अनुरूप होना चाहिए।
चित्र 2ए में टी-एसएनई स्कैटर प्लॉट के बिंदु क्रमशः अक्षांश और देशांतर से जुड़े हैं।यदि चित्र 2ए में दो बिंदु एक-दूसरे के करीब हैं, तो इसका कारण यह है कि उनके बायोमास और पोषक तत्वों का प्रवाह समान है, भौगोलिक निकटता के कारण नहीं।चित्र 2ए में रंग डीबीएससीएएन विधि (28) का उपयोग करके खोजे गए क्लस्टर हैं।सघन अवलोकनों की तलाश करते समय, DBSCAN एल्गोरिथ्म बिंदुओं के बीच 3D प्रतिनिधित्व में दूरी का उपयोग करता है (ϵ = 0.39; इस विकल्प के बारे में जानकारी के लिए, सामग्री और तरीके देखें), और क्लस्टर को परिभाषित करने के लिए समान बिंदुओं की संख्या आवश्यक है (यहां) 100 अंक, कृपया ऊपर देखें)।DBSCAN विधि डेटा में समूहों के आकार या संख्या के बारे में कोई धारणा नहीं बनाती है, जैसा कि नीचे दिखाया गया है:
3) भीतर की दूरी के रूप में पहचाने गए सभी बिंदुओं के लिए, क्लस्टर सीमा निर्धारित करने के लिए चरण 2 को बार-बार दोहराएं।यदि अंकों की संख्या निर्धारित न्यूनतम मान से अधिक है, तो इसे क्लस्टर के रूप में नामित किया गया है।
वह डेटा जो न्यूनतम क्लस्टर सदस्य और दूरी ϵ मीट्रिक को पूरा नहीं करता है उसे "शोर" माना जाता है और उसे कोई रंग नहीं दिया जाता है।DBSCAN सबसे खराब स्थिति में O(n2) प्रदर्शन के साथ एक तेज़ और स्केलेबल एल्गोरिदम है।वर्तमान विश्लेषण के लिए, यह वास्तव में यादृच्छिक नहीं है।अंकों की न्यूनतम संख्या विशेषज्ञ मूल्यांकन द्वारा निर्धारित की जाती है।दूरी को समायोजित करने के बाद, परिणाम ≈±10 की सीमा में पर्याप्त स्थिर नहीं है।यह दूरी कनेक्टिविटी (चित्रा 6ए) और महासागर कवरेज प्रतिशत (चित्रा 6बी) का उपयोग करके निर्धारित की जाती है।कनेक्टिविटी को क्लस्टर की समग्र संख्या के रूप में परिभाषित किया गया है और यह ϵ पैरामीटर के प्रति संवेदनशील है।कम कनेक्टिविटी अपर्याप्त फिटिंग, कृत्रिम रूप से क्षेत्रों को एक साथ समूहित करने का संकेत देती है।उच्च कनेक्टिविटी ओवरफिटिंग को इंगित करती है।उच्चतर न्यूनतम का उपयोग करना संभव है, लेकिन यदि न्यूनतम सीए से अधिक है, तो विश्वसनीय समाधान प्राप्त करना असंभव है।135 (अधिक जानकारी के लिए, सामग्री और विधियाँ देखें)।
चित्र 2ए में पहचाने गए 115 समूहों को चित्र 2बी में पृथ्वी पर वापस प्रक्षेपित किया गया है।प्रत्येक रंग डीबीएससीएएन द्वारा पहचाने गए जैव-भू-रासायनिक और पारिस्थितिक कारकों के सुसंगत संयोजन से मेल खाता है।एक बार जब क्लस्टर निर्धारित हो जाते हैं, तो चित्र 2ए में प्रत्येक बिंदु का एक विशिष्ट अक्षांश और देशांतर के साथ जुड़ाव का उपयोग समूहों को भौगोलिक क्षेत्र में वापस प्रोजेक्ट करने के लिए किया जाता है।चित्र 2बी इसे चित्र 2ए के समान क्लस्टर रंगों के साथ दिखाता है।समान रंगों की व्याख्या पारिस्थितिक समानता के रूप में नहीं की जानी चाहिए, क्योंकि उन्हें उस क्रम द्वारा निर्दिष्ट किया जाता है जिसमें एल्गोरिदम द्वारा समूहों की खोज की जाती है।
चित्र 2बी का क्षेत्र गुणात्मक रूप से समुद्र के भौतिक और/या जैव-भू-रसायन विज्ञान में एक स्थापित क्षेत्र के समान हो सकता है।उदाहरण के लिए, दक्षिणी महासागर में क्लस्टर ज़ोन-सममित हैं, जिसमें ऑलिगोट्रॉफ़िक भंवर दिखाई देते हैं, और तेज संक्रमण व्यापारिक हवाओं के प्रभाव को इंगित करता है।उदाहरण के लिए, भूमध्यरेखीय प्रशांत क्षेत्र में उत्थान से संबंधित विभिन्न क्षेत्र दिखाई देते हैं।
इको-प्रांत के पारिस्थितिक पर्यावरण को समझने के लिए, क्लस्टर में पारिस्थितिकी का मूल्यांकन करने के लिए ब्रे-कर्टिस (बीसी) अंतर सूचकांक (29) की एक भिन्नता का उपयोग किया गया था।बीसी संकेतक एक सांख्यिकीय डेटा है जिसका उपयोग दो अलग-अलग साइटों के बीच सामुदायिक संरचना में अंतर को मापने के लिए किया जाता है।BC माप फाइटोप्लांकटन और ज़ोप्लांकटन की 51 प्रजातियों के बायोमास पर लागू होता है BCninj = 1-2CninjSni + Snj
BCninj संयोजन ni और संयोजन nj के बीच समानता को संदर्भित करता है, जहां Cninj एक एकल प्रकार के बायोमास का न्यूनतम मूल्य है जो ni और nj दोनों संयोजनों में मौजूद है, और Sni उन सभी बायोमास के योग का प्रतिनिधित्व करता है जो दोनों संयोजन ni और Snj में मौजूद हैं।बीसी अंतर दूरी माप के समान है, लेकिन गैर-यूक्लिडियन अंतरिक्ष में संचालित होता है, जो पारिस्थितिक डेटा और इसकी व्याख्या के लिए अधिक उपयुक्त होने की संभावना है।
चित्र 2बी में पहचाने गए प्रत्येक क्लस्टर के लिए, अंतर-प्रांतीय और अंतर-प्रांतीय बीसी की समानता का आकलन किया जा सकता है।एक प्रांत के भीतर बीसी अंतर प्रांत के औसत मूल्य और प्रांत के प्रत्येक बिंदु के बीच अंतर को संदर्भित करता है।बीसी प्रांतों के बीच अंतर एक प्रांत और अन्य प्रांतों के बीच समानता को दर्शाता है।चित्र 3ए एक सममित बीसी मैट्रिक्स दिखाता है (0, काला: पूरी तरह से संगत; 1, सफेद: पूरी तरह से भिन्न)।ग्राफ़ की प्रत्येक पंक्ति डेटा में एक पैटर्न दिखाती है।चित्र 3बी प्रत्येक प्रांत के लिए चित्र 3ए में बीसी के परिणामों का भौगोलिक महत्व दिखाता है।कम पोषण और कम पोषक तत्व वाले क्षेत्र में एक प्रांत के लिए, चित्र 3बी से पता चलता है कि भूमध्य रेखा और हिंद महासागर के आसपास के बड़े क्षेत्रों की समरूपता मूल रूप से समान है, लेकिन उच्च अक्षांश और उत्थान क्षेत्र काफी भिन्न हैं।
(ए) 51 प्लवक के वैश्विक 20-वर्षीय औसत वैश्विक सतह औसत के आधार पर प्रत्येक प्रांत के लिए बीसी अंतर की डिग्री का मूल्यांकन किया गया।मानों की अपेक्षित समरूपता पर ध्यान दें।(बी) एक स्तंभ (या पंक्ति) का स्थानिक प्रक्षेपण।एक डिस्ट्रोफिक सर्कल में एक प्रांत के लिए, बीसी समानता माप के वैश्विक वितरण का मूल्यांकन किया गया था, और वैश्विक 20-वर्षीय औसत का मूल्यांकन किया गया था।काले (बीसी = 0) का मतलब समान क्षेत्र है, और सफेद (बीसी = 1) का मतलब कोई समानता नहीं है।
चित्र 4ए चित्र 2बी में प्रत्येक प्रांत के भीतर बीसी में अंतर को दर्शाता है।एक क्लस्टर में औसत क्षेत्र के औसत संयोजन का उपयोग करके और प्रांत में प्रत्येक ग्रिड बिंदु के बीसी और माध्य के बीच असमानता का निर्धारण करके, यह दर्शाता है कि एसएजीई विधि पारिस्थितिक समानता के आधार पर 51 प्रजातियों को अच्छी तरह से अलग कर सकती है। मॉडल डेटा.सभी 51 प्रकारों की कुल औसत क्लस्टर बीसी असमानता 0.102 ± 0.0049 है।
(ए, बी, और डी) प्रांत के भीतर बीसी अंतर का मूल्यांकन प्रत्येक ग्रिड बिंदु समुदाय और औसत प्रांत के बीच औसत बीसी अंतर के रूप में किया जाता है, और जटिलता कम नहीं होती है।(2) वैश्विक औसत अंतर-प्रांतीय बीसी अंतर 0.227±0.117 है।यह इस कार्य द्वारा प्रस्तावित पारिस्थितिक प्रेरणा-आधारित वर्गीकरण का बेंचमार्क है [(सी) में हरी रेखा]।(सी) औसत अंतर-प्रांतीय बीसी अंतर: काली रेखा बढ़ती जटिलता के साथ अंतर-प्रांतीय बीसी अंतर का प्रतिनिधित्व करती है।2σ इको-प्रांत पहचान प्रक्रिया के 10 दोहराव से आता है।DBSCAN द्वारा खोजे गए प्रांतों की कुल जटिलता के लिए, (ए) से पता चलता है कि प्रांत में बीसी असमानता 0.099 है, और (सी) द्वारा प्रस्तावित जटिलता वर्गीकरण 12 है, जिसके परिणामस्वरूप प्रांत में बीसी असमानता 0.200 है।जैसा कि चित्र में दिखाया गया है.(डी)।
चित्र 4बी में, 51 प्लवक प्रकार के बायोमास का उपयोग लॉन्गहर्स्ट प्रांत में समतुल्य बीसी अंतर को दर्शाने के लिए किया जाता है।प्रत्येक प्रांत का कुल औसत 0.227 है, और बीसी प्रांत में अंतर के संदर्भ में ग्रिड बिंदुओं का मानक विचलन 0.046 है।यह चित्र 1बी में पहचाने गए क्लस्टर से बड़ा है।इसके बजाय, सात कार्यात्मक समूहों के योग का उपयोग करते हुए, लॉन्गहर्स्ट में औसत इंट्रा-सीजन बीसी असमानता बढ़कर 0.232 हो गई।
वैश्विक इको-प्रांत मानचित्र अद्वितीय पारिस्थितिक इंटरैक्शन का जटिल विवरण प्रदान करता है और लॉन्गहर्स्ट प्रांत की संपूर्ण पारिस्थितिकी तंत्र संरचना का उपयोग करने में सुधार किए गए हैं।पारिस्थितिकी मंत्रालय से अपेक्षा की जाती है कि वह संख्यात्मक मॉडल पारिस्थितिकी तंत्र को नियंत्रित करने की प्रक्रिया में अंतर्दृष्टि प्रदान करेगा, और यह अंतर्दृष्टि क्षेत्र कार्य की खोज में मदद करेगी।इस शोध के प्रयोजन के लिए, एक सौ से अधिक प्रांतों को पूर्ण रूप से प्रदर्शित करना संभव नहीं है।अगला भाग SAGE पद्धति का परिचय देता है जो प्रांतों का सारांश प्रस्तुत करती है।
प्रांत का एक उद्देश्य प्रांत के स्थान और प्रबंधन की समझ को बढ़ावा देना है।आपातकालीन स्थितियों को निर्धारित करने के लिए, चित्र 1 बी में विधि पारिस्थितिक रूप से समान प्रांतों के घोंसले को दर्शाती है।पारिस्थितिकी-प्रांतों को पारिस्थितिक समानता के आधार पर एक साथ समूहीकृत किया जाता है, और प्रांतों के ऐसे समूह को एईपी कहा जाता है।विचार किए जाने वाले प्रांतों की कुल संख्या के आधार पर एक समायोज्य "जटिलता" निर्धारित करें।"जटिलता" शब्द का उपयोग इसलिए किया जाता है क्योंकि यह आपातकालीन विशेषताओं के स्तर को समायोजित करने की अनुमति देता है।सार्थक एकत्रीकरण को परिभाषित करने के लिए, लॉन्गहर्स्ट से 0.227 के औसत अंतर-प्रांतीय बीसी अंतर को बेंचमार्क के रूप में उपयोग किया जाता है।इस बेंचमार्क के नीचे, संयुक्त प्रांतों को अब उपयोगी नहीं माना जाता है।
जैसा कि चित्र 3बी में दिखाया गया है, वैश्विक पारिस्थितिक प्रांत सुसंगत हैं।अंतर-प्रांतीय बीसी मतभेदों का उपयोग करके, यह देखा जा सकता है कि कुछ कॉन्फ़िगरेशन बहुत "सामान्य" हैं।आनुवंशिकी और ग्राफ़ सिद्धांत विधियों से प्रेरित होकर, "कनेक्टेड ग्राफ़" का उपयोग उनसे सबसे समान प्रांतों के आधार पर >100 प्रांतों को क्रमबद्ध करने के लिए किया जाता है।यहां "कनेक्टिविटी" मीट्रिक अंतर-प्रांतीय बीसी असमानता (30) का उपयोग करके निर्धारित की जाती है।> 100 प्रांतों के वर्गीकरण के लिए अधिक स्थान वाले प्रांतों की संख्या को यहां जटिलता के रूप में संदर्भित किया जा सकता है।एईपी एक ऐसा उत्पाद है जो 100 से अधिक प्रांतों को सबसे प्रमुख/निकटतम पारिस्थितिक प्रांतों के रूप में वर्गीकृत करता है।प्रत्येक पारिस्थितिक प्रांत को प्रमुख/अत्यधिक जुड़े पारिस्थितिक प्रांत को सौंपा गया है जो उनके समान है।बीसी अंतर द्वारा निर्धारित यह एकत्रीकरण वैश्विक पारिस्थितिकी के लिए एक अंतर्निहित दृष्टिकोण की अनुमति देता है।
चयनित जटिलता 1 से लेकर चित्र की पूर्ण जटिलता तक कोई भी मान हो सकती है।2ए.कम जटिलता पर, संभाव्य आयामी कमी चरण (टी-एसएनई) के कारण एईपी ख़राब हो सकता है।डिजनरेसी का मतलब है कि पारिस्थितिक प्रांतों को पुनरावृत्तियों के बीच विभिन्न एईपी को सौंपा जा सकता है, जिससे कवर किए गए भौगोलिक क्षेत्र में बदलाव हो सकता है।चित्र 4सी 10 कार्यान्वयनों में बढ़ती जटिलता के एईपी में प्रांतों के भीतर बीसी असमानताओं के प्रसार को दर्शाता है (चित्र 1बी में चित्रण)।चित्र 4C में, 2σ (नीला क्षेत्र) 10 कार्यान्वयनों में गिरावट का एक माप है, और हरी रेखा लॉन्गहर्स्ट बेंचमार्क का प्रतिनिधित्व करती है।तथ्यों ने साबित कर दिया है कि 12 की जटिलता सभी कार्यान्वयनों में प्रांत में बीसी अंतर को लॉन्गहर्स्ट बेंचमार्क से नीचे रख सकती है और अपेक्षाकृत छोटे 2σ गिरावट को बनाए रख सकती है।संक्षेप में, न्यूनतम अनुशंसित जटिलता 12 एईपी है, और 51 प्लवक प्रकारों का उपयोग करके मूल्यांकन किया गया औसत अंतर-प्रांत बीसी अंतर 0.198±0.013 है, जैसा चित्र 4डी में दिखाया गया है।सात प्लवक कार्यात्मक समूहों के योग का उपयोग करते हुए, प्रांत के भीतर औसत बीसी अंतर 0.198±0.004 के बजाय 2σ है।सात कार्यात्मक समूहों के कुल बायोमास या सभी 51 प्लैंकटन प्रकारों के बायोमास के साथ गणना की गई बीसी अंतर के बीच तुलना से पता चलता है कि यद्यपि एसएजीई विधि 51-आयामी स्थिति पर लागू होती है, यह सात कार्यात्मक समूहों के कुल बायोमास के लिए है प्रशिक्षण के लिए।
किसी भी शोध के उद्देश्य के आधार पर जटिलता के विभिन्न स्तरों पर विचार किया जा सकता है।क्षेत्रीय अध्ययनों के लिए पूर्ण जटिलता की आवश्यकता हो सकती है (अर्थात, सभी 115 प्रांत)।उदाहरण के तौर पर और स्पष्टता के लिए, 12 की न्यूनतम अनुशंसित जटिलता पर विचार करें।
एसएजीई विधि की उपयोगिता के एक उदाहरण के रूप में, आपातकालीन सामुदायिक संरचना के नियंत्रण का पता लगाने के लिए 12 की न्यूनतम जटिलता वाले 12 एईपी का उपयोग यहां किया जाता है।चित्र 5 एईपी (ए से एल तक) द्वारा समूहीकृत पारिस्थितिक अंतर्दृष्टि को दर्शाता है: रेडफील्ड स्टोइकोमेट्री में, भौगोलिक सीमा (चित्रा 5सी), कार्यात्मक समूह बायोमास संरचना (चित्रा 5ए) और पोषक तत्व आपूर्ति (चित्रा 5बी) एन ज़ूम द्वारा किया जाता है।अनुपात (N:Si:P:Fe, 1:1:16:16×103) दिखाया गया है।बाद वाले पैनल के लिए, P को 16 से गुणा किया गया और Fe को 16×103 से गुणा किया गया, इसलिए बार ग्राफ फाइटोप्लांकटन की पोषण संबंधी आवश्यकताओं के बराबर है।
प्रांतों को 12 एईपी ए से एल में वर्गीकृत किया गया है। 12 प्रांतों में पारिस्थितिक तंत्र का (ए) बायोमास (एमजीसी/एम3)।(बी) घुलित अकार्बनिक नाइट्रोजन (एन), आयरन (एफई), फॉस्फेट (पी) और सिलिकिक एसिड (सी) (एमएमओएल/एम3 प्रति वर्ष) की पोषक प्रवाह दर।Fe और P को क्रमशः 16 और 16×103 से गुणा किया जाता है, ताकि स्ट्रिप्स को फाइटोप्लांकटन स्टोइकोमेट्री आवश्यकताओं के लिए मानकीकृत किया जा सके।(सी) ध्रुवीय क्षेत्रों, उपोष्णकटिबंधीय चक्रवातों और प्रमुख मौसमी/उभरते क्षेत्रों के बीच अंतर पर ध्यान दें।निगरानी स्टेशनों को इस प्रकार चिह्नित किया गया है: 1, सीटें;2, अलोहा;3, स्टेशन पी;और 4, चमगादड़.
पहचानी गई AEP अद्वितीय है.अटलांटिक और प्रशांत महासागरों में भूमध्य रेखा के आसपास कुछ समरूपता है, और हिंद महासागर में भी एक समान लेकिन विस्तारित क्षेत्र मौजूद है।कुछ एईपी चढ़ाई से जुड़े महाद्वीप के पश्चिमी हिस्से को गले लगाते हैं।दक्षिणी ध्रुव सर्कम्पोलर धारा को एक बड़ी आंचलिक विशेषता माना जाता है।उपोष्णकटिबंधीय चक्रवात ऑलिगोट्रॉफ़िक एईपी की एक जटिल श्रृंखला है।इन प्रांतों में, प्लवक-प्रभुत्व वाले ऑलिगोट्रॉफ़िक भंवरों और डायटम-समृद्ध ध्रुवीय क्षेत्रों के बीच बायोमास अंतर का परिचित पैटर्न स्पष्ट है।
बहुत समान कुल फाइटोप्लांकटन बायोमास वाले एईपी में बहुत अलग सामुदायिक संरचनाएं हो सकती हैं और विभिन्न भौगोलिक क्षेत्रों को कवर किया जा सकता है, जैसे डी, एच, और के, जिनका कुल फाइटोप्लांकटन बायोमास समान है।एईपी एच मुख्य रूप से भूमध्यरेखीय हिंद महासागर में मौजूद है, और वहां अधिक डायज़ोट्रॉफ़िक बैक्टीरिया हैं।एईपी डी कई बेसिनों में पाया जाता है, लेकिन यह विषुवतीय उथल-पुथल के आसपास उच्च उपज वाले क्षेत्रों के आसपास प्रशांत क्षेत्र में विशेष रूप से प्रमुख है।इस प्रशांत प्रांत का आकार एक ग्रहीय तरंग ट्रेन की याद दिलाता है।एईपी डी में डायज़ोबैक्टीरिया कम और शंकु अधिक हैं।अन्य दो प्रांतों की तुलना में, एईपी के केवल आर्कटिक महासागर के ऊंचे इलाकों में पाया जाता है, और वहां अधिक डायटम और कम प्लवक हैं।ध्यान देने योग्य बात यह है कि इन तीनों क्षेत्रों में प्लवक की मात्रा भी बहुत भिन्न है।उनमें से, एईपी के की प्लवक बहुतायत अपेक्षाकृत कम है, जबकि एईपी डी और एच अपेक्षाकृत अधिक है।इसलिए, उनके बायोमास (और इसलिए Chl-a के समान) के बावजूद, ये प्रांत काफी भिन्न हैं: Chl-आधारित प्रांत परीक्षण इन अंतरों को पकड़ नहीं सकता है।
यह भी स्पष्ट है कि बहुत भिन्न बायोमास वाले कुछ एईपी फाइटोप्लांकटन समुदाय संरचना के संदर्भ में समान हो सकते हैं।उदाहरण के लिए, यह एईपी डी और ई में दिखाई देता है। वे एक दूसरे के करीब हैं, और प्रशांत महासागर में, एईपी ई अत्यधिक उत्पादक एईपीजे के करीब है।इसी प्रकार, फाइटोप्लांकटन बायोमास और ज़ोप्लांकटन प्रचुरता के बीच कोई स्पष्ट संबंध नहीं है।
एईपी को उन्हें प्रदान किए गए पोषक तत्वों के संदर्भ में समझा जा सकता है (चित्र 5बी)।डायटम केवल वहीं मौजूद होते हैं जहां सिलिकिक एसिड की पर्याप्त आपूर्ति होती है।आम तौर पर, सिलिकिक एसिड की आपूर्ति जितनी अधिक होगी, डायटम का बायोमास उतना ही अधिक होगा।डायटम को एईपी ए, जे, के और एल में देखा जा सकता है। अन्य फाइटोप्लांकटन के सापेक्ष डायटम बायोमास का अनुपात डायटम मांग के सापेक्ष प्रदान किए गए एन, पी और फे द्वारा निर्धारित किया जाता है।उदाहरण के लिए, एईपी एल में डायटम का प्रभुत्व है।अन्य पोषक तत्वों की तुलना में सी की आपूर्ति सबसे अधिक है।इसके विपरीत, उच्च उत्पादकता के बावजूद, एईपी जे में कम डायटम और कम सिलिकॉन आपूर्ति (सभी और अन्य पोषक तत्वों के सापेक्ष) है।
डायज़ोनियम बैक्टीरिया में नाइट्रोजन को स्थिर करने की क्षमता होती है, लेकिन वे धीरे-धीरे बढ़ते हैं (31)।वे अन्य फाइटोप्लांकटन के साथ सह-अस्तित्व में रहते हैं, जहां गैर-डायज़ोनियम पोषक तत्वों की मांग के सापेक्ष लौह और फास्फोरस अत्यधिक होते हैं (20, 21)।यह ध्यान देने योग्य है कि डायज़ोट्रोफ़िक बायोमास अपेक्षाकृत अधिक है, और Fe और P की आपूर्ति N की आपूर्ति के सापेक्ष अपेक्षाकृत बड़ी है। इस तरह, हालांकि AEP J में कुल बायोमास अधिक है, AEP H में डायज़ोनियम बायोमास है जे से बड़ा। कृपया ध्यान दें कि एईपी जे और एच भौगोलिक रूप से बहुत अलग हैं, और एच भूमध्यरेखीय हिंद महासागर में स्थित है।
यदि अद्वितीय पारिस्थितिकी तंत्र संरचना को प्रांतों में विभाजित नहीं किया गया है, तो 12 एईपी के सबसे कम जटिलता मॉडल से प्राप्त अंतर्दृष्टि इतनी स्पष्ट नहीं होगी।SAGE द्वारा उत्पन्न AEP पारिस्थितिकी तंत्र मॉडल से जटिल और उच्च-आयामी जानकारी की सुसंगत और एक साथ तुलना की सुविधा प्रदान करता है।एईपी प्रभावी ढंग से इस बात पर जोर देता है कि उच्च पोषक तत्वों के स्तर पर सामुदायिक संरचना या ज़ोप्लांकटन प्रचुरता को निर्धारित करने के लिए सीएचएल एक अच्छा और वैकल्पिक तरीका क्यों नहीं है।चल रहे शोध विषयों का विस्तृत विश्लेषण इस लेख के दायरे से परे है।SAGE विधि मॉडल में अन्य तंत्रों का पता लगाने का एक तरीका प्रदान करती है जिसे पॉइंट-टू-पॉइंट देखने की तुलना में संभालना आसान है।
वैश्विक भौतिक/जैव भू-रासायनिक/पारिस्थितिकी तंत्र संख्यात्मक मॉडल से अत्यंत जटिल पारिस्थितिक डेटा को स्पष्ट करने में मदद करने के लिए SAGE विधि प्रस्तावित है।पारिस्थितिक प्रांत क्रॉस-प्लैंकटन कार्यात्मक समूहों के कुल बायोमास, टी-एसएनई संभाव्यता आयामी कमी एल्गोरिथ्म के अनुप्रयोग और अनपर्यवेक्षित एमएल विधि डीबीएससीएएन का उपयोग करके क्लस्टरिंग द्वारा निर्धारित किया जाता है।नेस्टिंग विधि के लिए अंतर-प्रांतीय बीसी अंतर/ग्राफ सिद्धांत को एक मजबूत एईपी प्राप्त करने के लिए लागू किया जाता है जिसका उपयोग वैश्विक व्याख्या के लिए किया जा सकता है।निर्माण के मामले में, इको-प्रांत और एईपी अद्वितीय हैं।एईपी नेस्टिंग को मूल पारिस्थितिक प्रांत की पूर्ण जटिलता और 12 एईपी की अनुशंसित न्यूनतम सीमा के बीच समायोजित किया जा सकता है।एईपी की न्यूनतम जटिलता को स्थापित करना और निर्धारित करना महत्वपूर्ण कदम माना जाता है, क्योंकि संभावना टी-एसएनई <12 जटिलता के एईपी को कम कर देती है।SAGE विधि वैश्विक है, और इसकी जटिलता > 100 AEPs से लेकर 12 तक है। सरलता के लिए, वर्तमान फोकस 12 वैश्विक AEPs की जटिलता पर है।भविष्य के अनुसंधान, विशेष रूप से क्षेत्रीय अध्ययन, वैश्विक पर्यावरण-प्रांतों के एक छोटे स्थानिक उपसमूह को उपयोगी पा सकते हैं, और यहां चर्चा की गई समान पारिस्थितिक अंतर्दृष्टि का लाभ उठाने के लिए इसे एक छोटे क्षेत्र में एकत्रित किया जा सकता है।यह सुझाव देता है कि कैसे इन पारिस्थितिक प्रांतों और उनसे प्राप्त अंतर्दृष्टि का उपयोग आगे की पारिस्थितिक समझ, मॉडल तुलना की सुविधा और संभावित रूप से समुद्री पारिस्थितिक तंत्र की निगरानी में सुधार के लिए किया जा सकता है।
SAGE विधि द्वारा पहचाने गए पारिस्थितिक प्रांत और AEP संख्यात्मक मॉडल के डेटा पर आधारित हैं।परिभाषा के अनुसार, संख्यात्मक मॉडल एक सरलीकृत संरचना है, जो लक्ष्य प्रणाली के सार को पकड़ने की कोशिश करती है, और विभिन्न मॉडलों में प्लवक का अलग-अलग वितरण होगा।इस अध्ययन में उपयोग किया गया संख्यात्मक मॉडल कुछ देखे गए पैटर्न को पूरी तरह से कैप्चर नहीं कर सकता है (उदाहरण के लिए, भूमध्यरेखीय क्षेत्र और दक्षिणी महासागर के लिए सीएचएल अनुमान में)।वास्तविक महासागर में विविधता का केवल एक छोटा सा हिस्सा ही कैप्चर किया गया है, और मेसो और सब-मेसोस्केल को हल नहीं किया जा सकता है, जो पोषक तत्वों के प्रवाह और छोटे पैमाने की सामुदायिक संरचना को प्रभावित कर सकता है।इन कमियों के बावजूद, यह पता चला है कि एईपी जटिल मॉडलों को समझने में मदद करने में बहुत उपयोगी है।यह मूल्यांकन करके कि समान पारिस्थितिक प्रांत कहां पाए जाते हैं, एईपी एक संभावित संख्यात्मक मॉडल तुलना उपकरण प्रदान करता है।वर्तमान संख्यात्मक मॉडल रिमोट सेंसिंग फाइटोप्लांकटन सीएचएल-ए एकाग्रता के समग्र पैटर्न और प्लैंकटन आकार और कार्यात्मक समूह (नोट एस 1 और चित्रा एस 1) (2, 32) के वितरण को दर्शाता है।
जैसा कि 0.1 mgChl-a/m-3 समोच्च रेखा द्वारा दिखाया गया है, AEP को ऑलिगोट्रॉफ़िक क्षेत्र और मेसोट्रोफ़िक क्षेत्र (चित्र S1B) में विभाजित किया गया है: AEP B, C, D, E, F और G ऑलिगोट्रॉफ़िक क्षेत्र हैं, और शेष क्षेत्र हैं उच्चतर Chl-ए स्थित है।एईपी लॉन्गहर्स्ट प्रांत (चित्र S3A) के साथ कुछ पत्राचार दिखाता है, उदाहरण के लिए, दक्षिणी महासागर और भूमध्यरेखीय प्रशांत।कुछ क्षेत्रों में, AEP कई लॉन्गहर्स्ट क्षेत्रों को कवर करता है, और इसके विपरीत।चूँकि इस क्षेत्र और लॉन्गहर्स्ट में प्रांतों के परिसीमन का इरादा अलग-अलग है, इसलिए उम्मीद है कि मतभेद होंगे।लॉन्गहर्स्ट प्रांत में एकाधिक एईपी से संकेत मिलता है कि समान जैव-भू-रसायन वाले कुछ क्षेत्रों में बहुत भिन्न पारिस्थितिकी तंत्र संरचनाएं हो सकती हैं।एईपी भौतिक अवस्थाओं के साथ एक निश्चित पत्राचार प्रदर्शित करता है, जैसा कि बिना पर्यवेक्षित शिक्षण (19) का उपयोग करके पता चला है, जैसे कि उच्च उत्थान वाले राज्यों में (उदाहरण के लिए, दक्षिणी महासागर और भूमध्यरेखीय प्रशांत; चित्र एस3, सी और डी)।इन पत्राचारों से संकेत मिलता है कि प्लवक की सामुदायिक संरचना समुद्री गतिशीलता से काफी प्रभावित है।उत्तरी अटलांटिक जैसे क्षेत्रों में, एईपी भौतिक प्रांतों को पार करता है।इन अंतरों का कारण बनने वाले तंत्र में धूल परिवहन जैसी प्रक्रियाएं शामिल हो सकती हैं, जो समान भौतिक परिस्थितियों में भी पूरी तरह से अलग पोषण कार्यक्रमों को जन्म दे सकती हैं।
पारिस्थितिकी मंत्रालय और एईपी ने बताया कि अकेले सीएचएल का उपयोग पारिस्थितिक घटकों की पहचान नहीं कर सकता है, जैसा कि समुद्री पारिस्थितिकी समुदाय पहले ही महसूस कर चुका है।यह समान बायोमास लेकिन काफी भिन्न पारिस्थितिक संरचना (जैसे डी और ई) वाले एईपी में देखा जाता है।इसके विपरीत, डी और के जैसे एईपी में बहुत भिन्न बायोमास लेकिन समान पारिस्थितिक संरचना होती है।एईपी इस बात पर जोर देता है कि बायोमास, पारिस्थितिक संरचना और ज़ोप्लांकटन बहुतायत के बीच संबंध जटिल है।उदाहरण के लिए, हालांकि एईपी जे फाइटोप्लांकटन और प्लैंकटन बायोमास के मामले में अलग दिखता है, एईपी के ए और एल में प्लैंकटन बायोमास समान है, लेकिन ए में प्लैंकटन बहुतायत अधिक है।एईपी इस बात पर जोर देता है कि फाइटोप्लांकटन बायोमास (या सीएचएल) का उपयोग ज़ोप्लांकटन बायोमास की भविष्यवाणी करने के लिए नहीं किया जा सकता है।ज़ोप्लांकटन मत्स्य पालन खाद्य श्रृंखला की नींव है, और अधिक सटीक अनुमान से बेहतर संसाधन प्रबंधन हो सकता है।भविष्य के समुद्री रंग उपग्रह [उदाहरण के लिए, PACE (प्लैंकटन, एयरोसोल, क्लाउड और समुद्री पारिस्थितिकी तंत्र)] फाइटोप्लांकटन की सामुदायिक संरचना का अनुमान लगाने में मदद करने के लिए बेहतर स्थिति में हो सकते हैं।एईपी भविष्यवाणी का उपयोग संभावित रूप से अंतरिक्ष से ज़ोप्लांकटन के अनुमान को सुविधाजनक बना सकता है।SAGE जैसे तरीके, नई प्रौद्योगिकियों के साथ मिलकर, और जमीनी सच्चाई सर्वेक्षणों (जैसे तारा और अनुवर्ती अनुसंधान) के लिए अधिक से अधिक फ़ील्ड डेटा उपलब्ध हैं, संयुक्त रूप से उपग्रह-आधारित पारिस्थितिकी तंत्र स्वास्थ्य निगरानी की दिशा में एक कदम उठा सकते हैं।
SAGE पद्धति कुछ तंत्रों का मूल्यांकन करने का एक सुविधाजनक तरीका प्रदान करती है जो प्रांत की विशेषताओं, जैसे बायोमास/सीएचएल, शुद्ध प्राथमिक उत्पादन और सामुदायिक संरचना को नियंत्रित करते हैं।उदाहरण के लिए, डायटम की सापेक्ष मात्रा फाइटोप्लांकटन स्टोइकोमेट्रिक आवश्यकताओं के सापेक्ष Si, N, P और Fe की आपूर्ति में असंतुलन द्वारा निर्धारित की जाती है।संतुलित आपूर्ति दर पर, समुदाय में डायटम (एल) का प्रभुत्व है।जब आपूर्ति दर असंतुलित होती है (अर्थात, सिलिकॉन की आपूर्ति डायटम की पोषक मांग से कम होती है), तो डायटम का केवल एक छोटा सा हिस्सा शेयर (K) होता है।जब Fe और P की आपूर्ति N (उदाहरण के लिए, E और H) की आपूर्ति से अधिक हो जाती है, तो डायज़ोट्रोफ़िक बैक्टीरिया तेजी से बढ़ेगा।एईपी द्वारा प्रदान किए गए संदर्भ के माध्यम से, नियंत्रण तंत्र की खोज अधिक उपयोगी हो जाएगी।
इको-प्रांत और एईपी समान सामुदायिक संरचनाओं वाले क्षेत्र हैं।पारिस्थितिक प्रांत या एईपी के भीतर एक निश्चित स्थान से समय श्रृंखला को एक संदर्भ बिंदु माना जा सकता है और पारिस्थितिक प्रांत या एईपी द्वारा कवर किए गए क्षेत्र का प्रतिनिधित्व कर सकता है।दीर्घकालिक ऑन-साइट निगरानी स्टेशन ऐसी समय श्रृंखला प्रदान करते हैं।दीर्घकालिक इन-सीटू डेटा सेट एक अगणनीय भूमिका निभाते रहेंगे।सामुदायिक संरचना की निगरानी के दृष्टिकोण से, SAGE पद्धति को नई साइटों के सबसे उपयोगी स्थान को निर्धारित करने में मदद करने के एक तरीके के रूप में देखा जा सकता है।उदाहरण के लिए, दीर्घकालिक ऑलिगोट्रॉफ़िक आवास मूल्यांकन (एएलओएचए) से समय श्रृंखला ऑलिगोट्रॉफ़िक क्षेत्र के एईपी बी (चित्रा 5 सी, लेबल 2) में है।क्योंकि ALOHA किसी अन्य AEP की सीमा के करीब है, समय श्रृंखला पूरे क्षेत्र का प्रतिनिधि नहीं हो सकती है, जैसा कि पहले सुझाव दिया गया था (33)।उसी एईपी बी में, समय श्रृंखला सीटें (दक्षिण पूर्व एशियाई समय श्रृंखला) दक्षिण-पश्चिमी ताइवान (34) में स्थित है, जो अन्य एईपी (चित्रा 5सी, लेबल 1) की सीमाओं से दूर है, और इसे निगरानी के लिए एक बेहतर स्थान के रूप में इस्तेमाल किया जा सकता है। एईपीबी.AEPC में BATS (बरमूडा अटलांटिक टाइम सीरीज़ स्टडी) समय श्रृंखला (चित्र 5C, लेबल 4) AEP C और F के बीच की सीमा के बहुत करीब है, जो इंगित करता है कि BATS समय श्रृंखला का उपयोग करके AEP C की निगरानी करना सीधे तौर पर समस्याग्रस्त हो सकता है।एईपी जे में स्टेशन पी (चित्र 5सी, लेबल 3) एईपी सीमा से बहुत दूर है, इसलिए यह अधिक प्रतिनिधि है।इको-प्रांत और एईपी वैश्विक परिवर्तनों का आकलन करने के लिए उपयुक्त एक निगरानी ढांचा स्थापित करने में मदद कर सकते हैं, क्योंकि प्रांतों की अनुमति यह आकलन करने के लिए है कि ऑन-साइट नमूनाकरण महत्वपूर्ण अंतर्दृष्टि प्रदान कर सकता है।समय बचाने वाली परिवर्तनशीलता का आकलन करने के लिए जलवायु डेटा पर लागू करने के लिए SAGE पद्धति को और विकसित किया जा सकता है।
SAGE पद्धति की सफलता डेटा विज्ञान/ML विधियों और डोमेन-विशिष्ट ज्ञान के सावधानीपूर्वक अनुप्रयोग के माध्यम से प्राप्त की जाती है।विशेष रूप से, टी-एसएनई का उपयोग आयामीता में कमी करने के लिए किया जाता है, जो उच्च-आयामी डेटा की सहप्रसरण संरचना को संरक्षित करता है और सहप्रसरण टोपोलॉजी के विज़ुअलाइज़ेशन की सुविधा प्रदान करता है।डेटा को धारियों और सहप्रसरणों (चित्र 2ए) के रूप में व्यवस्थित किया गया है, जो दर्शाता है कि पूरी तरह से दूरी-आधारित उपाय (जैसे कि के-साधन) उपयुक्त नहीं हैं क्योंकि वे आमतौर पर गाऊसी (गोलाकार) आधार वितरण का उपयोग करते हैं (नोट एस 2 में चर्चा की गई है) .DBSCAN विधि किसी भी सहप्रसरण टोपोलॉजी के लिए उपयुक्त है।जब तक आप पैरामीटर सेट करने पर ध्यान देते हैं, विश्वसनीय पहचान प्रदान की जा सकती है।टी-एसएनई एल्गोरिथ्म की कम्प्यूटेशनल लागत अधिक है, जो इसके वर्तमान अनुप्रयोग को बड़ी मात्रा में डेटा तक सीमित करती है, जिसका अर्थ है कि इसे गहरे या समय-भिन्न क्षेत्रों में लागू करना मुश्किल है।टी-एसएनई की स्केलेबिलिटी पर काम प्रगति पर है।चूंकि केएल दूरी को समानांतर करना आसान है, टी-एसएनई एल्गोरिदम में भविष्य में विस्तार की अच्छी संभावना है (35)।अब तक, अन्य आशाजनक आयामी कमी के तरीके जो आकार को बेहतर ढंग से कम कर सकते हैं उनमें एकीकृत मैनिफोल्ड सन्निकटन और प्रक्षेपण (यूएमएपी) तकनीक शामिल हैं, लेकिन महासागर डेटा के संदर्भ में मूल्यांकन आवश्यक है।बेहतर स्केलेबिलिटी का अर्थ, उदाहरण के लिए, मिश्रित परत पर विभिन्न जटिलता वाले वैश्विक जलवायु या मॉडल को वर्गीकृत करना है।जो क्षेत्र किसी भी प्रांत में SAGE द्वारा वर्गीकृत होने में विफल रहते हैं उन्हें चित्र 2A में शेष काले बिंदु के रूप में माना जा सकता है।भौगोलिक दृष्टि से, ये क्षेत्र मुख्य रूप से अत्यधिक मौसमी क्षेत्रों में हैं, जो बताता है कि समय के साथ बदलते पारिस्थितिक प्रांतों पर कब्जा करने से बेहतर कवरेज मिलेगा।
SAGE विधि का निर्माण करने के लिए, कार्यात्मक समूहों के समूहों (11-आयामी अंतरिक्ष में बहुत करीब होने की संभावना) को निर्धारित करने और प्रांतों को निर्धारित करने की क्षमता का उपयोग करते हुए, जटिल प्रणालियों/डेटा विज्ञान के विचारों का उपयोग किया गया है।ये प्रांत हमारे 3डी टी-एसएनई चरण स्थान में विशिष्ट मात्रा दर्शाते हैं।इसी तरह, पोंकारे भाग का उपयोग "सामान्य" या "अराजक" व्यवहार (36) निर्धारित करने के लिए प्रक्षेपवक्र द्वारा कब्जा किए गए राज्य स्थान की "मात्रा" का मूल्यांकन करने के लिए किया जा सकता है।स्थिर 11-आयामी मॉडल आउटपुट के लिए, डेटा को 3डी चरण स्थान में परिवर्तित करने के बाद व्याप्त मात्रा को इसी तरह समझाया जा सकता है।भौगोलिक क्षेत्र और 3डी चरण अंतरिक्ष के क्षेत्र के बीच संबंध सरल नहीं है, लेकिन इसे पारिस्थितिक समानता के संदर्भ में समझाया जा सकता है।इस कारण से, अधिक परंपरागत बीसी असमानता माप को प्राथमिकता दी जाती है।
भविष्य के काम में पहचाने गए प्रांतों और एईपी की स्थानिक परिवर्तनशीलता का आकलन करने के लिए मौसमी रूप से बदलते डेटा के लिए एसएजीई पद्धति का पुन: उपयोग किया जाएगा।भविष्य का लक्ष्य इस पद्धति का उपयोग यह निर्धारित करने में मदद करना है कि कौन से प्रांतों को उपग्रह माप (जैसे कि सीएचएल-ए, रिमोट सेंसिंग परावर्तन और समुद्री सतह के तापमान) के माध्यम से निर्धारित किया जा सकता है।इससे पारिस्थितिक घटकों के रिमोट सेंसिंग मूल्यांकन और पारिस्थितिक प्रांतों और उनकी परिवर्तनशीलता की अत्यधिक लचीली निगरानी की अनुमति मिलेगी।
इस शोध का उद्देश्य SAGE पद्धति को पेश करना है, जो एक पारिस्थितिक प्रांत को उसकी अद्वितीय प्लवक समुदाय संरचना के माध्यम से परिभाषित करता है।यहां, भौतिक/जैव भू-रासायनिक/पारिस्थितिकी तंत्र मॉडल और टी-एसएनई और डीबीएससीएएन एल्गोरिदम के पैरामीटर चयन के बारे में अधिक विस्तृत जानकारी प्रदान की जाएगी।
मॉडल के भौतिक घटक समुद्री परिसंचरण और जलवायु के अनुमान से आते हैं [ECCOv4;(37) (38) द्वारा वर्णित वैश्विक स्थिति अनुमान।राज्य अनुमान का नाममात्र संकल्प 1/5 है।लैग्रेंजियन गुणक विधि के साथ न्यूनतम वर्ग विधि का उपयोग अवलोकन द्वारा समायोजित प्रारंभिक और सीमा स्थितियों और आंतरिक मॉडल मापदंडों को प्राप्त करने के लिए किया जाता है, जिससे एक फ्री-रनिंग एमआईटी सामान्य चक्र मॉडल (एमआईटीजीसीएम) (39) उत्पन्न होता है, मॉडल अनुकूलन के बाद, परिणाम प्राप्त कर सकते हैं ट्रैक किया जाए और निरीक्षण किया जाए।
बायोजियोकेमिस्ट्री/पारिस्थितिकी तंत्र का (2) में अधिक संपूर्ण विवरण (यानी समीकरण और पैरामीटर मान) है।मॉडल अकार्बनिक और कार्बनिक तालाबों के माध्यम से सी, एन, पी, सी और फ़े के परिसंचरण को दर्शाता है।यहां उपयोग किए गए संस्करण में फाइटोप्लांकटन की 35 प्रजातियां शामिल हैं: माइक्रोप्रोकैरियोट्स की 2 प्रजातियां और माइक्रोयूकैरियोट्स की 2 प्रजातियां (कम पोषक तत्व वाले वातावरण के लिए उपयुक्त), क्रिप्टोमोनस स्फेरोइड्स की 5 प्रजातियां (कैल्शियम कार्बोनेट कोटिंग के साथ), डायज़ोनियम की 5 प्रजातियां (नाइट्रोजन को ठीक कर सकती हैं, इसलिए) यह सीमित नहीं है) घुले हुए अकार्बनिक नाइट्रोजन की उपलब्धता), 11 डायटम (एक सिलिसियस आवरण बनाते हैं), 10 मिश्रित-वानस्पतिक फ्लैगेलेट्स (प्रकाश संश्लेषण कर सकते हैं और अन्य प्लवक को खा सकते हैं) और 16 ज़ोप्लांकटन (अन्य प्लवक पर चर सकते हैं)।इन्हें "जैव-भू-रासायनिक कार्यात्मक समूह" कहा जाता है क्योंकि इनका समुद्री जैव-भू-रसायन विज्ञान (40, 41) पर अलग-अलग प्रभाव पड़ता है और अक्सर अवलोकन और मॉडल अध्ययन में उपयोग किया जाता है।इस मॉडल में, प्रत्येक कार्यात्मक समूह 0.6 से 2500 माइक्रोन के बराबर गोलाकार व्यास के साथ विभिन्न आकारों के कई प्लवक से बना है।
फाइटोप्लांकटन की वृद्धि, चराई और डूबने को प्रभावित करने वाले पैरामीटर आकार से संबंधित हैं, और छह फाइटोप्लांकटन कार्यात्मक समूहों (32) के बीच विशिष्ट अंतर हैं।विभिन्न भौतिक ढाँचों के बावजूद, मॉडल के 51 प्लवक घटकों के परिणामों का उपयोग हाल के कई अध्ययनों (42-44) में किया गया है।
1992 से 2011 तक, भौतिक/जैव-भू-रासायनिक/पारिस्थितिकी तंत्र युग्मन मॉडल 20 वर्षों तक चला।मॉडल के आउटपुट में प्लवक बायोमास, पोषक तत्व एकाग्रता और पोषक तत्व आपूर्ति दर (DIN, PO4, Si और Fe) शामिल हैं।इस अध्ययन में, इन आउटपुट के 20-वर्षीय औसत को पारिस्थितिक प्रांत के इनपुट के रूप में उपयोग किया गया था।सीएचएल, प्लैंकटन बायोमास और पोषक तत्व एकाग्रता का वितरण और कार्यात्मक समूहों के वितरण की तुलना उपग्रह और इन-सीटू अवलोकनों से की जाती है [देखें (2, 44), नोट एस1 और चित्र।S1 से S3]।
SAGE विधि के लिए, यादृच्छिकता का मुख्य स्रोत t-SNE चरण से आता है।यादृच्छिकता पुनरावृत्ति में बाधा डालती है, जिसका अर्थ है कि परिणाम अविश्वसनीय हैं।SAGE विधि टी-एसएनई और डीबीएससीएएन के मापदंडों का एक सेट निर्धारित करके मजबूती का परीक्षण करती है, जो दोहराए जाने पर लगातार क्लस्टर की पहचान कर सकती है।टी-एसएनई पैरामीटर की "उलझन" का निर्धारण उस डिग्री को निर्धारित करने के रूप में समझा जा सकता है जिस तक उच्च से निम्न आयामों की मैपिंग को डेटा की स्थानीय या वैश्विक विशेषताओं का सम्मान करना चाहिए।400 और 300 पुनरावृत्तियों की उलझन तक पहुँच गया।
क्लस्टरिंग एल्गोरिदम DBSCAN के लिए, क्लस्टर में डेटा बिंदुओं का न्यूनतम आकार और दूरी मीट्रिक निर्धारित करने की आवश्यकता है।न्यूनतम संख्या विशेषज्ञों के मार्गदर्शन में निर्धारित की जाती है।यह ज्ञान जानता है कि वर्तमान संख्यात्मक मॉडलिंग ढांचे और रिज़ॉल्यूशन में क्या फिट बैठता है।न्यूनतम संख्या 100 है। एक उच्च न्यूनतम मूल्य (हरे रंग की ऊपरी सीमा व्यापक होने से पहले <135 से कम) पर विचार किया जा सकता है, लेकिन यह बीसी असमानता के आधार पर एकत्रीकरण विधि को प्रतिस्थापित नहीं कर सकता है।कनेक्शन की डिग्री (चित्रा 6ए) का उपयोग ϵ पैरामीटर सेट करने के लिए किया जाता है, जो उच्च कवरेज (चित्रा 6बी) के लिए अनुकूल है।कनेक्टिविटी को क्लस्टर की समग्र संख्या के रूप में परिभाषित किया गया है और यह ϵ पैरामीटर के प्रति संवेदनशील है।कम कनेक्टिविटी अपर्याप्त फिटिंग, कृत्रिम रूप से क्षेत्रों को एक साथ समूहित करने का संकेत देती है।उच्च कनेक्टिविटी ओवरफिटिंग को इंगित करती है।ओवरफिटिंग भी समस्याग्रस्त है, क्योंकि यह दर्शाता है कि प्रारंभिक यादृच्छिक अनुमानों से अप्राप्य परिणाम हो सकते हैं।इन दो चरम सीमाओं के बीच, एक तेज वृद्धि (आमतौर पर "कोहनी" कहा जाता है) सर्वोत्तम ϵ को इंगित करती है।चित्र 6ए में, आप पठारी क्षेत्र में तेज वृद्धि (पीला,> 200 क्लस्टर) देखते हैं, इसके बाद तेज कमी (हरा, 100 क्लस्टर), लगभग 130 तक, बहुत कम क्लस्टर (नीला, <60 क्लस्टर) से घिरा हुआ देखते हैं। ).कम से कम 100 नीले क्षेत्रों में, या तो एक समूह पूरे महासागर पर हावी है (ϵ <0.42), या अधिकांश महासागर को वर्गीकृत नहीं किया गया है और उन्हें शोर (ϵ> 0.99) माना जाता है।पीले क्षेत्र में अत्यधिक परिवर्तनशील, अप्राप्य क्लस्टर वितरण है।जैसे-जैसे ϵ घटता है, शोर बढ़ता है।तेजी से बढ़ने वाले हरित क्षेत्र को कोहनी कहा जाता है।यह एक इष्टतम क्षेत्र है.यद्यपि संभावना टी-एसएनई का उपयोग किया जाता है, फिर भी प्रांत के भीतर बीसी असमानता का उपयोग विश्वसनीय क्लस्टरिंग निर्धारित करने के लिए किया जा सकता है।चित्र 6 (ए और बी) का उपयोग करते हुए, ϵ को 0.39 पर सेट करें।न्यूनतम संख्या जितनी बड़ी होगी, ϵ तक पहुंचने की संभावना उतनी ही कम होगी जो विश्वसनीय वर्गीकरण की अनुमति देती है, और 135 से अधिक मूल्य वाला हरा क्षेत्र उतना ही अधिक होगा। इस क्षेत्र का विस्तार इंगित करता है कि कोहनी को ढूंढना या गैर-खोजना अधिक कठिन होगा। विद्यमान.
टी-एसएनई के पैरामीटर सेट करने के बाद, पाए गए क्लस्टरों की कुल संख्या का उपयोग कनेक्टिविटी (ए) और क्लस्टर को आवंटित डेटा के प्रतिशत (बी) के माप के रूप में किया जाएगा।लाल बिंदु कवरेज और कनेक्टिविटी के सर्वोत्तम संयोजन को इंगित करता है।न्यूनतम संख्या पारिस्थितिकी से संबंधित न्यूनतम संख्या के अनुसार निर्धारित की जाती है।
इस लेख की पूरक सामग्री के लिए, कृपया http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1 देखें
यह क्रिएटिव कॉमन्स एट्रिब्यूशन लाइसेंस की शर्तों के तहत वितरित एक ओपन एक्सेस लेख है।लेख किसी भी माध्यम में अप्रतिबंधित उपयोग, वितरण और पुनरुत्पादन की अनुमति देता है, बशर्ते कि मूल कार्य को उचित रूप से उद्धृत किया गया हो।
ध्यान दें: हम आपसे केवल अपना ईमेल पता प्रदान करने के लिए कहते हैं ताकि जिस व्यक्ति को आप पेज की अनुशंसा करते हैं उसे पता चले कि आप चाहते हैं कि वे ईमेल देखें और यह स्पैम नहीं है।हम किसी भी ईमेल पते पर कब्जा नहीं करेंगे.
इस प्रश्न का उपयोग यह जांचने के लिए किया जाता है कि आप एक आगंतुक हैं या नहीं और स्वचालित स्पैम सबमिशन को रोकें।
वैश्विक समुद्री पारिस्थितिकी मंत्रालय जटिल समस्याओं को हल करने के लिए प्रतिबद्ध है और सामुदायिक संरचनाओं का पता लगाने के लिए अप्रयुक्त एमएल का उपयोग करता है।
वैश्विक समुद्री पारिस्थितिकी मंत्रालय जटिल समस्याओं को हल करने के लिए प्रतिबद्ध है और सामुदायिक संरचनाओं का पता लगाने के लिए अप्रयुक्त एमएल का उपयोग करता है।
पोस्ट समय: जनवरी-12-2021