Clarifying ecological complexity: unsupervised learning determines the global marine ecological province

प्लँक्टन समुदाय संरचना आणि पोषक प्रवाह डेटावर आधारित जागतिक सागरी पर्यावरणीय प्रांत (इको-प्रांत) निर्धारित करण्यासाठी एक पर्यवेक्षित शिक्षण पद्धत प्रस्तावित आहे.सिस्टेमॅटिक इंटिग्रेटेड इकोलॉजिकल प्रोव्हिन्स (SAGE) पद्धत अत्यंत नॉनलाइनर इकोसिस्टम मॉडेल्समध्ये पर्यावरणीय प्रांत ओळखू शकते.डेटाच्या गैर-गॉसियन सहविभाजनाशी जुळवून घेण्यासाठी, आकारमान कमी करण्यासाठी SAGE t यादृच्छिक शेजारी एम्बेडिंग (t-SNE) वापरते.घनता-आधारित स्थानिक क्लस्टरिंग (DBSCAN) अल्गोरिदमवर आधारित नॉइज ऍप्लिकेशनच्या मदतीने, शंभरहून अधिक पर्यावरणीय प्रांत ओळखले जाऊ शकतात.अंतर मोजण्यासाठी पर्यावरणीय फरकांसह कनेक्टिव्हिटी नकाशाचा वापर करून, एक मजबूत एकत्रित पर्यावरणीय प्रांत (AEP) नेस्टेड इकोलॉजिकल प्रांतांद्वारे वस्तुनिष्ठपणे परिभाषित केले आहे.AEPs वापरून, सामुदायिक संरचनेवर पोषक पुरवठा दराच्या नियंत्रणाचा शोध घेण्यात आला.इको-प्रांत आणि AEP अद्वितीय आहेत आणि मॉडेलच्या व्याख्या करण्यात मदत करू शकतात.ते मॉडेलमधील तुलना सुलभ करू शकतात आणि सागरी परिसंस्थेची समज आणि निरीक्षण वाढवू शकतात.
प्रांत हे असे प्रदेश आहेत जेथे समुद्र किंवा जमिनीवरील जटिल जैविक भूगोल सुसंगत आणि अर्थपूर्ण भागात आयोजित केले जाते (1).स्थानांची तुलना आणि विरोधाभास, निरीक्षणे, निरीक्षण आणि संरक्षण यासाठी हे प्रांत अतिशय महत्त्वाचे आहेत.हे प्रांत निर्माण करणार्‍या जटिल आणि नॉन-लिनियर परस्परसंवादांमुळे पर्यवेक्षी नसलेल्या मशीन लर्निंग (ML) पद्धती वस्तुनिष्ठपणे प्रांतांचे निर्धारण करण्यासाठी अतिशय योग्य बनतात, कारण डेटामधील सहप्रवाह जटिल आणि गैर-गॉसियन आहे.येथे, एक ML पद्धत प्रस्तावित आहे, जी डार्विन जागतिक त्रिमितीय (3D) भौतिक/इकोसिस्टम मॉडेल (2) मधून पद्धतशीरपणे अद्वितीय सागरी पर्यावरणीय प्रांत (इको-प्रांत) ओळखते."अद्वितीय" हा शब्द दर्शविण्यासाठी वापरला जातो की ओळखले गेलेले क्षेत्र इतर क्षेत्रांशी पुरेसे ओव्हरलॅप होत नाही.या पद्धतीला सिस्टम इंटिग्रेटेड इकोलॉजिकल प्रोव्हिन्स (SAGE) पद्धत म्हणतात.उपयुक्त वर्गीकरण करण्यासाठी, अल्गोरिदम पद्धतीला परवानगी देणे आवश्यक आहे (i) जागतिक वर्गीकरण आणि (ii) बहु-स्केल विश्लेषण जे स्थान आणि वेळेमध्ये नेस्टेड/एकत्रित केले जाऊ शकते (3).या संशोधनात, SAGE पद्धत प्रथम प्रस्तावित करण्यात आली आणि ओळखल्या गेलेल्या पर्यावरणीय प्रांतांवर चर्चा करण्यात आली.इको-प्रांत हे घटक समजून घेण्यास प्रोत्साहन देऊ शकतात जे समुदाय संरचना नियंत्रित करतात, निरीक्षण धोरणांसाठी उपयुक्त अंतर्दृष्टी प्रदान करतात आणि इकोसिस्टममधील बदलांचा मागोवा घेण्यास मदत करतात.
स्थलीय प्रांत सामान्यतः हवामान (पर्जन्य आणि तापमान), माती, वनस्पती आणि प्राणी यांच्यातील समानतेनुसार वर्गीकृत केले जातात आणि ते सहायक व्यवस्थापन, जैवविविधता संशोधन आणि रोग नियंत्रणासाठी वापरले जातात (1, 4).सागरी प्रांतांची व्याख्या करणे अधिक कठीण आहे.बहुतेक जीव सूक्ष्म असतात, द्रव सीमा असतात.लाँगहर्स्ट वगैरे.(५) पर्यावरणीय परिस्थितीवर आधारित समुद्रविज्ञान मंत्रालयाच्या पहिल्या जागतिक वर्गीकरणांपैकी एक प्रदान केले.या "लॉन्गहर्स्ट" प्रांतांच्या व्याख्येमध्ये मिक्सिंग रेट, स्तरीकरण आणि विकिरण यांसारख्या चलांचा समावेश आहे, तसेच सागरी समुद्रशास्त्रज्ञ म्हणून लॉंगहर्स्टचा व्यापक अनुभव आहे, ज्यांच्याकडे सागरी परिसंस्थेसाठी इतर महत्त्वाच्या परिस्थिती आहेत.लॉन्गहर्स्टचा मोठ्या प्रमाणावर वापर केला गेला आहे, उदाहरणार्थ, प्राथमिक उत्पादन आणि कार्बन फ्लक्सचे मूल्यांकन करण्यासाठी, मत्स्यपालनाला मदत करण्यासाठी आणि परिस्थिती निरीक्षण क्रियाकलापांमध्ये योजना (5-9).प्रांतांना अधिक वस्तुनिष्ठपणे परिभाषित करण्यासाठी, फजी लॉजिक आणि प्रादेशिक अनपर्यवेक्षित क्लस्टरिंग/आकडेवारी या पद्धती वापरल्या गेल्या आहेत (9-14).अशा पद्धतींचा उद्देश अर्थपूर्ण संरचना ओळखणे आहे जे उपलब्ध निरीक्षण डेटामध्ये प्रांत ओळखू शकतात.उदाहरणार्थ, डायनॅमिक सागरी प्रांत (१२) आवाज कमी करण्यासाठी स्व-संयोजित नकाशे वापरतात आणि प्रादेशिक उपग्रह [क्लोरोफिल a (Chl-a), सामान्यीकृत फ्लोरोसेन्स रेषेची उंची आणि सागरी रंग उत्पादने निर्धारित करण्यासाठी श्रेणीबद्ध (वृक्ष-आधारित) क्लस्टरिंग वापरतात. रंगीत विरघळलेले सेंद्रिय पदार्थ] आणि भौतिक क्षेत्र (समुद्र पृष्ठभागाचे तापमान आणि क्षारता, परिपूर्ण गतिशील स्थलाकृति आणि समुद्र बर्फ).
प्लँक्टनची सामुदायिक रचना चिंतेची बाब आहे कारण त्याच्या पर्यावरणाचा उच्च पोषक पातळी, कार्बन शोषण आणि हवामानावर मोठा प्रभाव आहे.तरीही, प्लँक्टन समुदायाच्या संरचनेवर आधारित जागतिक पर्यावरणीय प्रांत निश्चित करणे हे अजूनही आव्हानात्मक आणि मायावी उद्दिष्ट आहे.सागरी रंगाचे उपग्रह फायटोप्लँक्टनच्या खडबडीत वर्गीकरणात अंतर्दृष्टी प्रदान करू शकतात किंवा कार्यात्मक गटांचे फायदे सुचवू शकतात (15), परंतु ते सध्या समुदाय संरचनेबद्दल तपशीलवार माहिती प्रदान करण्यात अक्षम आहेत.अलीकडील सर्वेक्षणे [उदा. तारा महासागर (१६)] समुदाय संरचनेचे अभूतपूर्व मोजमाप देत आहेत;सध्या, जागतिक स्तरावर केवळ विरळ इन-सीटू निरीक्षणे आहेत (17).मागील अभ्यासांनी जैवरासायनिक समानता (जसे की प्राथमिक उत्पादन, Chl आणि उपलब्ध प्रकाश) च्या निर्धारावर आधारित "जैव-रासायनिक प्रांत" (12, 14, 18) मोठ्या प्रमाणावर निर्धारित केले आहे.येथे, संख्यात्मक मॉडेल [डार्विन(2)] आउटपुट करण्यासाठी वापरले जाते आणि पर्यावरणीय प्रांत समुदाय रचना आणि पोषक प्रवाहानुसार निर्धारित केला जातो.या अभ्यासात वापरलेल्या संख्यात्मक मॉडेलमध्ये जागतिक व्याप्ती आहे आणि विद्यमान फील्ड डेटा (17) आणि रिमोट सेन्सिंग फील्ड (टीप S1) शी तुलना केली जाऊ शकते.या अभ्यासात वापरलेल्या संख्यात्मक मॉडेल डेटाचा जागतिक व्याप्तीचा फायदा आहे.मॉडेल इकोसिस्टममध्ये फायटोप्लँक्टनच्या 35 प्रजाती आणि झुप्लँक्टनच्या 16 प्रजाती आहेत (कृपया सामग्री आणि पद्धती पहा).मॉडेल प्लँक्टनचे प्रकार गैर-गॉसियन सहविभाजन संरचनांशी अरेखीयपणे परस्परसंवाद करतात, त्यामुळे साध्या निदान पद्धती उदयोन्मुख समुदाय संरचनांमध्ये अद्वितीय आणि सुसंगत नमुने ओळखण्यासाठी योग्य नाहीत.येथे सादर केलेली SAGE पद्धत जटिल डार्विन मॉडेल्सचे आउटपुट तपासण्यासाठी एक नवीन मार्ग प्रदान करते.
डेटा सायन्स/एमएल टेक्नॉलॉजीच्या शक्तिशाली परिवर्तनीय क्षमता डेटा सहविभाजनातील जटिल परंतु मजबूत संरचना प्रकट करण्यासाठी जबरदस्त जटिल मॉडेल सोल्यूशन्स सक्षम करू शकतात.एक मजबूत पद्धत ही एक पद्धत म्हणून परिभाषित केली जाते जी दिलेल्या त्रुटी श्रेणीमध्ये विश्वासूपणे परिणाम पुनरुत्पादित करू शकते.अगदी साध्या सिस्टीममध्येही, मजबूत नमुने आणि सिग्नल निश्चित करणे एक आव्हान असू शकते.जोपर्यंत निरीक्षण नमुन्याकडे नेणारे तर्क निश्चित होत नाही तोपर्यंत, उदयोन्मुख गुंतागुंतीचे निराकरण करणे क्लिष्ट/कठीण वाटू शकते.इकोसिस्टमची रचना निश्चित करण्याची मुख्य प्रक्रिया निसर्गात नॉनलाइनर आहे.नॉन-रेखीय परस्परसंवादाचे अस्तित्व मजबूत वर्गीकरण गोंधळात टाकू शकते, म्हणून डेटा सहविभाजनाच्या मूलभूत सांख्यिकीय वितरणाविषयी भक्कम गृहितक असलेल्या पद्धती टाळणे आवश्यक आहे.समुद्रशास्त्रात उच्च-आयामी आणि नॉनलाइनर डेटा सामान्य आहेत आणि जटिल, गैर-गॉसियन टोपोलॉजीसह सहप्रसरण रचना असू शकते.गैर-गॉसियन सहप्रवाह संरचनेसह डेटा मजबूत वर्गीकरणात अडथळा आणू शकतो, तरीही SAGE पद्धत नवीन आहे कारण ती अनियंत्रित टोपोलॉजीजसह क्लस्टर ओळखण्यासाठी डिझाइन केलेली आहे.
SAGE पद्धतीचे उद्दिष्ट उद्दिष्टपणे उदयोन्मुख नमुने ओळखणे हे आहे जे पुढील पर्यावरणीय समजून घेण्यास मदत करू शकतात.(19) सारख्या क्लस्टर-आधारित वर्कफ्लोनंतर, पर्यावरणीय आणि पोषक प्रवाह व्हेरिएबल्सचा वापर डेटामधील एकमेव क्लस्टर निर्धारित करण्यासाठी केला जातो, ज्याला पर्यावरणीय प्रांत म्हणतात.या अभ्यासात प्रस्तावित केलेली SAGE पद्धत (आकृती 1) प्रथम प्लँक्टन फंक्शनल गटांना प्राधान्य देऊन (सामग्री आणि पद्धती पहा) 55 ते 11 परिमाणांपासून कमी करते.टी-रँडम शेजारी एम्बेडिंग (t-SNE) पद्धतीचा वापर करून, संभाव्यता 3D स्पेसमध्ये प्रक्षेपित करून आकार आणखी कमी केला जातो.पर्यवेक्षित नसलेले क्लस्टरिंग पर्यावरणीयदृष्ट्या जवळचे क्षेत्र ओळखू शकते [ध्वनी-आधारित अनुप्रयोगांसाठी घनता-आधारित अवकाशीय क्लस्टरिंग (DBSCAN)].t-SNE आणि DBSCAN दोन्ही अंतर्निहित नॉन-लिनियर इकोसिस्टम संख्यात्मक मॉडेल डेटावर लागू आहेत.नंतर परिणामी पर्यावरणीय प्रांत पृथ्वीवर पुन्हा प्रक्षेपित करा.प्रादेशिक संशोधनासाठी योग्य असे शंभरहून अधिक अद्वितीय पर्यावरणीय प्रांत ओळखले गेले आहेत.जागतिक स्तरावर सुसंगत पारिस्थितिक प्रणाली मॉडेलचा विचार करण्यासाठी, पर्यावरणीय प्रांतांची परिणामकारकता सुधारण्यासाठी पर्यावरणीय प्रांतांना एकत्रित पर्यावरणीय प्रांतांमध्ये (AEP) एकत्रित करण्यासाठी SAGE पद्धत वापरली जाते.एकत्रीकरणाची पातळी (ज्याला "जटिलता" म्हणतात) आवश्यक तपशिलांच्या पातळीवर समायोजित केली जाऊ शकते.मजबूत AEP ची किमान जटिलता निश्चित करा.निवडीचा फोकस SAGE पद्धत आहे आणि आणीबाणी समुदाय संरचनेचे नियंत्रण निश्चित करण्यासाठी सर्वात लहान जटिलता AEP प्रकरणे शोधणे.नंतर पर्यावरणीय अंतर्दृष्टी प्रदान करण्यासाठी नमुन्यांचे विश्लेषण केले जाऊ शकते.येथे सादर केलेली पद्धत मॉडेल तुलनेसाठी देखील अधिक विस्तृतपणे वापरली जाऊ शकते, उदाहरणार्थ, भिन्न मॉडेलमध्ये आढळलेल्या समान पर्यावरणीय प्रांतांच्या स्थानांचे मूल्यमापन करून फरक आणि समानता हायलाइट करण्यासाठी, मॉडेलची तुलना करण्यासाठी.
(अ) पर्यावरणीय प्रांत निश्चित करण्यासाठी कार्यप्रवाहाचे योजनाबद्ध आकृती;सात फंक्शनल/पोषक प्लँक्टनचे बायोमास आणि चार पोषक पुरवठा दरांसह 11-मितीय मॉडेल आउटपुटमध्ये मूळ 55-आयामी डेटा कमी करण्यासाठी फंक्शनल ग्रुपमधील बेरीज वापरणे.नगण्य मूल्य आणि टिकाऊ बर्फ कव्हर क्षेत्र.डेटा प्रमाणित आणि प्रमाणित केला गेला आहे.सांख्यिकीयदृष्ट्या समान वैशिष्ट्य संयोजन हायलाइट करण्यासाठी t-SNE अल्गोरिदमला 11-आयामी डेटा प्रदान करा.पॅरामीटर मूल्य सेट करण्यासाठी DBSCAN काळजीपूर्वक क्लस्टर निवडेल.शेवटी डेटा परत अक्षांश/रेखांश प्रोजेक्शनवर प्रोजेक्ट करा.कृपया लक्षात घ्या की ही प्रक्रिया 10 वेळा पुनरावृत्ती केली जाते कारण t-SNE लागू करून थोडीशी यादृच्छिकता निर्माण केली जाऊ शकते.(B) 10 वेळा (A) मध्ये कार्यप्रवाह पुनरावृत्ती करून AEP कसे मिळवायचे ते स्पष्ट करते.या प्रत्येक 10 अंमलबजावणीसाठी, आंतर-प्रांतीय ब्रे-कर्टिस (बीसी) विषमता मॅट्रिक्स 51 फायटोप्लँक्टन प्रकारांच्या बायोमासवर आधारित निर्धारित केले गेले.प्रांतांमधील BC फरक निश्चित करा, जटिलता 1 AEP पासून संपूर्ण जटिलता 115. BC बेंचमार्क लाँगहर्स्ट प्रांताद्वारे सेट केला जातो.
SAGE पद्धत पर्यावरणीय प्रांताची व्याख्या करण्यासाठी जागतिक 3D भौतिक/इकोसिस्टम संख्यात्मक मॉडेलचे आउटपुट वापरते [डार्विन (2);साहित्य आणि पद्धती आणि टीप S1 पहा].इकोसिस्टमचे घटक फायटोप्लँक्टनच्या 35 प्रजाती आणि झूप्लँक्टनच्या 16 प्रजातींनी बनलेले आहेत, ज्यामध्ये सात पूर्वनिर्धारित कार्यात्मक गट आहेत: प्रोकेरियोट्स आणि युकेरियोट्स कमी-पोषक वातावरणाशी जुळवून घेतात, कॅल्शियम कार्बोनेट लेपसह कोकिडिया, आणि हेवी मिस्सिस्ट्रोजेननट (नाइट्रोजेन) महत्वाचे पोषक घटक), सिलिसियस आच्छादनासह, इतर प्लँक्टन प्रकाशसंश्लेषण आणि चराई मिश्रित पोषक फ्लॅगेलेट आणि झुप्लँक्टन पशुपालक करू शकतात.आकार कालावधी 0.6 ते 2500μm समतुल्य गोलाकार व्यास आहे.फायटोप्लँक्टन आकाराचे मॉडेल वितरण आणि कार्यात्मक गट उपग्रह आणि इन-सीटू निरीक्षणांमध्ये दिसणारी एकंदर वैशिष्ट्ये कॅप्चर करते (आकडे S1 ते S3 पहा).संख्यात्मक मॉडेल आणि निरीक्षण केलेल्या महासागरातील समानता दर्शवते की मॉडेलद्वारे परिभाषित केलेले प्रांत इन-सीटू महासागराला लागू होऊ शकतात.कृपया लक्षात घ्या की हे मॉडेल केवळ फायटोप्लँक्टनची काही विविधता आणि सिटू महासागरातील केवळ काही भौतिक आणि रासायनिक जबरदस्ती श्रेणी कॅप्चर करते.SAGE पद्धत लोकांना मॉडेल समुदाय संरचनेची उच्च प्रादेशिक नियंत्रण यंत्रणा अधिक चांगल्या प्रकारे समजून घेण्यास सक्षम करू शकते.
प्रत्येक प्लँक्टन फंक्शनल ग्रुपमध्ये केवळ पृष्ठभागाच्या बायोमासची बेरीज (सरासरी 20 वर्षांसह) समाविष्ट करून, डेटाची परिमाणे कमी केली जाऊ शकते.पूर्वीच्या अभ्यासांनी समुदाय रचना निश्चित करण्यात त्यांची महत्त्वाची भूमिका दर्शविल्यानंतर, त्यात पोषक प्रवाह (नायट्रोजन, लोह, फॉस्फेट आणि सिलिकिक ऍसिडचा पुरवठा) [उदा. (20, 21)] साठी पृष्ठभागाच्या स्त्रोत शब्दांचा देखील समावेश होता.कार्यात्मक गटांची बेरीज समस्या 55 (51 प्लँक्टन आणि 4 पोषक प्रवाह) पासून 11 परिमाणांपर्यंत कमी करते.या प्रारंभिक अभ्यासात, अल्गोरिदमद्वारे लादलेल्या संगणकीय मर्यादांमुळे, खोली आणि वेळेची परिवर्तनशीलता विचारात घेतली गेली नाही.
SAGE पद्धत नॉनलाइनर प्रक्रिया आणि फंक्शनल ग्रुप बायोमास आणि पोषक प्रवाह यांच्यातील परस्परसंवादाची प्रमुख वैशिष्ट्ये यांच्यातील महत्त्वाचे संबंध ओळखण्यास सक्षम आहे.युक्लिडियन डिस्टन्स लर्निंग पद्धतींवर आधारित 11-आयामी डेटा वापरणे (जसे की के-मीन्स) विश्वसनीय आणि पुनरुत्पादित प्रांत मिळवू शकत नाही (19, 22).याचे कारण असे की पर्यावरणीय प्रांताची व्याख्या करणार्‍या मुख्य घटकांच्या सहविभाजनाच्या मूलभूत वितरणामध्ये कोणताही गौसियन आकार आढळत नाही.व्होरोनोई पेशींचे के-माध्यम (सरळ रेषा) गैर-गॉसियन मूलभूत वितरण राखू शकत नाहीत.
सात प्लँक्टन कार्यात्मक गट आणि चार पोषक प्रवाहांचे बायोमास 11-मितीय वेक्टर x बनवतात.म्हणून, x हे मॉडेल ग्रिडवर वेक्टर फील्ड आहे, जेथे प्रत्येक घटक xi मॉडेल क्षैतिज ग्रिडवर परिभाषित केलेल्या 11-मितीय वेक्टरचे प्रतिनिधित्व करतो.प्रत्येक इंडेक्स i गोलावर एक ग्रिड पॉइंट ओळखतो, जिथे (lon, lat) = (ϕi, θi).मॉडेल ग्रिड युनिटचे बायोमास 1.2×10-3mg Chl/m3 पेक्षा कमी असल्यास किंवा बर्फ कव्हरेज दर 70% पेक्षा जास्त असल्यास, बायोमास डेटाचा लॉग वापरला जातो आणि टाकून दिला जातो.डेटा सामान्यीकृत आणि प्रमाणित केला जातो, म्हणून सर्व डेटा [0 ते 1] च्या श्रेणीत असतो, मध्यभागी काढला जातो आणि एकक भिन्नतेनुसार मोजला जातो.हे केले जाते जेणेकरून वैशिष्ट्ये (बायोमास आणि पोषक प्रवाह) संभाव्य मूल्यांच्या श्रेणीतील कॉन्ट्रास्टद्वारे मर्यादित नाहीत.क्लस्टरिंगने भौगोलिक अंतराऐवजी वैशिष्ट्यांमधील मुख्य संभाव्यता अंतरावरून बदल संबंध कॅप्चर केले पाहिजे.या अंतरांचे प्रमाण ठरवून, महत्त्वाची वैशिष्ट्ये समोर येतात, तर अनावश्यक तपशील टाकून दिले जातात.पर्यावरणीय दृष्टिकोनातून, हे आवश्यक आहे कारण काही प्रकारच्या फायटोप्लँक्टनचे थोडेसे बायोमास जास्त जैव-रासायनिक प्रभाव असू शकतात, जसे की डायझोट्रॉफिक बॅक्टेरियाद्वारे नायट्रोजनचे निर्धारण.डेटाचे मानकीकरण आणि सामान्यीकरण करताना, या प्रकारचे कोव्हरिएट्स हायलाइट केले जातील.
कमी-आयामी प्रतिनिधित्वामध्ये उच्च-आयामी जागेतील वैशिष्ट्यांच्या समीपतेवर जोर देऊन, विद्यमान समान प्रदेश स्पष्ट करण्यासाठी t-SNE अल्गोरिदम वापरला जातो.रिमोट सेन्सिंग ऍप्लिकेशन्ससाठी डीप न्यूरल नेटवर्क्स तयार करण्याच्या उद्देशाने मागील कामात टी-एसएनईचा वापर केला गेला, ज्याने मुख्य वैशिष्ट्ये वेगळे करण्याचे कौशल्य सिद्ध केले (23).नॉन-कन्व्हर्जेंट सोल्यूशन्स टाळताना वैशिष्ट्य डेटामध्ये मजबूत क्लस्टरिंग ओळखण्यासाठी हे आवश्यक पाऊल आहे (टीप S2).गॉसियन कर्नल वापरून, t-SNE प्रत्येक उच्च-आयामी ऑब्जेक्टला 3D फेज स्पेसमधील एका बिंदूवर मॅप करून डेटाचे सांख्यिकीय गुणधर्म संरक्षित करते, ज्यामुळे उच्च आणि निम्न दिशांमध्ये समान वस्तूंची संभाव्यता उच्च- मितीय जागा (24).N उच्च-आयामी वस्तू x1,…,xN चा संच दिल्यास, टी-एसएनई अल्गोरिदम कुलबॅक-लेइबलर (KL) विचलन (25) कमी करून कमी करते.KL विचलन हे संभाव्यता वितरण दुसऱ्या संदर्भ संभाव्यता वितरणापेक्षा किती वेगळे आहे याचे मोजमाप आहे आणि उच्च-आयामी वैशिष्ट्यांच्या निम्न-आयामी प्रतिनिधित्वांमधील परस्परसंबंधाच्या शक्यतेचे प्रभावीपणे मूल्यांकन करू शकते.जर xi ही N-मितीय जागेतील i-th वस्तू असेल, तर N-मितीय जागेत xj ही j-th वस्तू असेल, yi ही कमी-आयामी जागेतील i-th वस्तू असेल आणि yj ही कमी-आयामी जागेतील j-वी वस्तू असेल. -आयामी जागा, नंतर t -SNE समानता संभाव्यता ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) परिभाषित करते, आणि आयाम कमी करण्याच्या संचासाठी q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
आकृती 2A 11-आयामी संयोजनाचे बायोमास आणि पोषक प्रवाह वेक्टर 3D वर कमी करण्याचा प्रभाव स्पष्ट करते.t-SNE लागू करण्याच्या प्रेरणेची तुलना मुख्य घटक विश्लेषण (PCA) च्या प्रेरणाशी केली जाऊ शकते, जी डेटाच्या क्षेत्र/विशेषतेवर जोर देण्यासाठी भिन्नता गुणधर्म वापरते, ज्यामुळे आयाम कमी होते.पर्यावरण मंत्रालयासाठी विश्वसनीय आणि पुनरुत्पादक परिणाम प्रदान करण्यात T-SNE पद्धत PCA पेक्षा श्रेष्ठ असल्याचे आढळले (टीप S2 पहा).हे असे असू शकते कारण PCA ची ऑर्थोगोनॅलिटी गृहीतक अत्यंत नॉनलाइनर परस्परसंवादी वैशिष्ट्यांमधील गंभीर परस्परसंवाद ओळखण्यासाठी योग्य नाही, कारण PCA रेखीय सहविभाजन संरचनांवर लक्ष केंद्रित करते (26).रिमोट सेन्सिंग डेटा वापरणे, लुंगा आणि इतर.(27) गॉसियन वितरणापासून विचलित होणारी जटिल आणि नॉनलाइनर स्पेक्ट्रल वैशिष्ट्ये हायलाइट करण्यासाठी SNE पद्धत कशी वापरायची हे स्पष्ट करते.
(A) एक मॉडेल केलेला पोषक पुरवठा दर, फायटोप्लँक्टन आणि झूप्लँक्टन फंक्शनल ग्रुप बायोमास t-SNE अल्गोरिदमद्वारे काढलेले आणि DBSCAN वापरून प्रांतानुसार रंगवलेले.प्रत्येक बिंदू उच्च-आयामी जागेतील एक बिंदू दर्शवतो, आकृती 6B मध्ये दर्शविल्याप्रमाणे, बहुतेक बिंदू कॅप्चर केले जातात.शाफ्टचा संदर्भ “t-SNE” आकार 1, 2 आणि 3 आहे. (B) DBSCAN द्वारे उत्पत्तीच्या अक्षांश-रेखांश ग्रिडवर आढळलेल्या प्रांताचे भौगोलिक प्रक्षेपण.रंग कोणताही रंग मानला पाहिजे, परंतु (A) शी संबंधित असावा.
आकृती 2A मधील t-SNE स्कॅटर प्लॉटमधील बिंदू अनुक्रमे अक्षांश आणि रेखांशाशी संबंधित आहेत.जर आकृती 2A मधील दोन बिंदू एकमेकांच्या जवळ असतील, तर त्याचे कारण असे की त्यांचे बायोमास आणि पोषक प्रवाह समान आहेत, भौगोलिक समीपतेमुळे नाही.आकृती 2A मधील रंग DBSCAN पद्धत (28) वापरून शोधलेले क्लस्टर आहेत.दाट निरीक्षणे शोधताना, DBSCAN अल्गोरिदम बिंदूंमधील 3D प्रतिनिधित्वामध्ये अंतर वापरतो (ϵ = 0.39; या निवडीबद्दल माहितीसाठी, सामग्री आणि पद्धती पहा), आणि क्लस्टर परिभाषित करण्यासाठी समान बिंदूंची संख्या आवश्यक आहे (येथे 100 गुण, कृपया वर पहा).DBSCAN पद्धत खाली दर्शविल्याप्रमाणे, डेटामधील आकार किंवा क्लस्टर्सच्या संख्येबद्दल कोणतीही गृहीत धरत नाही:
3) अंतराच्या आत म्हणून ओळखल्या जाणार्‍या सर्व बिंदूंसाठी, क्लस्टरची सीमा निश्चित करण्यासाठी चरण 2 पुनरावृत्ती करा.जर गुणांची संख्या सेट केलेल्या किमान मूल्यापेक्षा जास्त असेल तर ते क्लस्टर म्हणून नियुक्त केले जाते.
किमान क्लस्टर सदस्य आणि अंतर ϵ मेट्रिकची पूर्तता न करणारा डेटा "आवाज" मानला जातो आणि त्याला रंग नियुक्त केला जात नाही.DBSCAN हे सर्वात वाईट परिस्थितीत O(n2) कार्यक्षमतेसह एक जलद आणि स्केलेबल अल्गोरिदम आहे.सध्याच्या विश्लेषणासाठी, ते प्रत्यक्षात यादृच्छिक नाही.गुणांची किमान संख्या तज्ञांच्या मूल्यांकनाद्वारे निर्धारित केली जाते.नंतरचे अंतर समायोजित केल्यानंतर, परिणाम ≈±10 च्या श्रेणीमध्ये पुरेसा स्थिर नाही.हे अंतर कनेक्टिव्हिटी (आकृती 6A) आणि महासागर व्याप्ती टक्केवारी (आकृती 6B) वापरून सेट केले आहे.कनेक्टिव्हिटी क्लस्टरची संमिश्र संख्या म्हणून परिभाषित केली जाते आणि ती ϵ पॅरामीटरसाठी संवेदनशील असते.कमी कनेक्टिव्हिटी अपुरी फिटिंग दर्शवते, कृत्रिमरित्या क्षेत्रांना एकत्र गटबद्ध करते.उच्च कनेक्टिव्हिटी ओव्हरफिटिंग दर्शवते.उच्च किमान वापरणे शक्य आहे, परंतु जर किमान सीए पेक्षा जास्त असेल तर विश्वसनीय उपाय साध्य करणे अशक्य आहे.135 (अधिक तपशीलांसाठी, साहित्य आणि पद्धती पहा).
आकृती 2A मध्ये ओळखले गेलेले 115 क्लस्टर आकृती 2B मध्ये पृथ्वीवर परत प्रक्षेपित केले आहेत.प्रत्येक रंग DBSCAN द्वारे ओळखलेल्या जैव-रासायनिक आणि पर्यावरणीय घटकांच्या सुसंगत संयोजनाशी संबंधित आहे.एकदा क्लस्टर्स निश्चित झाल्यानंतर, आकृती 2A मधील प्रत्येक बिंदूचा विशिष्ट अक्षांश आणि रेखांशासह जोडण्याचा उपयोग क्लस्टर्सना पुन्हा भौगोलिक क्षेत्राकडे प्रक्षेपित करण्यासाठी केला जातो.आकृती 2B हे आकृती 2A प्रमाणेच क्लस्टर रंगांसह स्पष्ट करते.समान रंगांचा पर्यावरणीय समानता म्हणून अर्थ लावला जाऊ नये, कारण ते अल्गोरिदमद्वारे क्लस्टर्स शोधल्या गेलेल्या क्रमाने नियुक्त केले जातात.
आकृती 2B मधील क्षेत्रफळ हे महासागराच्या भौतिक आणि/किंवा जैव-रसायनशास्त्रातील स्थापित क्षेत्रासारखेच असू शकते.उदाहरणार्थ, दक्षिणी महासागरातील समूह झोन-सममितीय आहेत, ज्यामध्ये ऑलिगोट्रॉफिक व्हर्टिसेस दिसतात आणि तीक्ष्ण संक्रमण व्यापार वाऱ्यांचा प्रभाव दर्शवते.उदाहरणार्थ, विषुववृत्तीय पॅसिफिकमध्ये, उदयाशी संबंधित भिन्न प्रदेश दिसतात.
इको-प्रांताचे पर्यावरणीय वातावरण समजून घेण्यासाठी, क्लस्टरमधील पर्यावरणाचे मूल्यमापन करण्यासाठी ब्रे-कर्टिस (बीसी) फरक निर्देशांक (29) च्या फरकाचा वापर केला गेला.BC निर्देशक हा सांख्यिकी डेटा आहे जो दोन भिन्न साइट्समधील समुदाय संरचनेतील फरक मोजण्यासाठी वापरला जातो.BC मापन 51 प्रजातींच्या फायटोप्लँक्टन आणि झूप्लँक्टन BCninj = 1-2CninjSni + Snj च्या बायोमासला लागू आहे.
BCninj हे संयोजन ni आणि संयोजन nj मधील समानतेचा संदर्भ देते, जेथे Cninj हे ni आणि nj या दोन्ही संयोगांमध्ये अस्तित्वात असलेल्या एकाच प्रकारच्या बायोमासचे किमान मूल्य आहे आणि Sni हे ni आणि Snj या दोन्ही संयोगांमध्ये अस्तित्त्वात असलेल्या सर्व बायोमासची बेरीज दर्शवते.BC फरक अंतराच्या मापाप्रमाणेच आहे, परंतु गैर-युक्लिडियन जागेत चालतो, जो पर्यावरणीय डेटा आणि त्याच्या व्याख्यासाठी अधिक योग्य असण्याची शक्यता आहे.
आकृती 2B मध्ये ओळखल्या गेलेल्या प्रत्येक क्लस्टरसाठी, इंट्रा-प्रांतीय आणि आंतर-प्रांतीय BC च्या समानतेचे मूल्यांकन केले जाऊ शकते.प्रांतातील BC फरक म्हणजे प्रांताचे सरासरी मूल्य आणि प्रांतातील प्रत्येक बिंदूमधील फरक.बीसी प्रांतांमधील फरक एक प्रांत आणि इतर प्रांतांमधील समानता दर्शवतो.आकृती 3A सममितीय BC मॅट्रिक्स दाखवते (0, काळा: पूर्णपणे संबंधित; 1, पांढरा: पूर्णपणे भिन्न).आलेखामधील प्रत्येक ओळ डेटामधील नमुना दर्शवते.आकृती 3B प्रत्येक प्रांतासाठी आकृती 3A मध्ये BC च्या निकालांचे भौगोलिक महत्त्व दर्शवते.कमी-पोषण आणि कमी-पोषक क्षेत्रामध्ये असलेल्या प्रांतासाठी, आकृती 3B दाखवते की विषुववृत्त आणि हिंदी महासागराच्या आसपासच्या मोठ्या क्षेत्रांची सममिती मुळात सारखीच आहे, परंतु उच्च अक्षांश आणि उत्थान क्षेत्र लक्षणीय भिन्न आहेत.
(अ) 51 प्लँक्टनच्या जागतिक 20 वर्षांच्या सरासरी जागतिक पृष्ठभागाच्या आधारे प्रत्येक प्रांतासाठी BC फरकाची डिग्री मूल्यांकन केली जाते.मूल्यांची अपेक्षित सममिती लक्षात घ्या.(ब) स्तंभाचे (किंवा पंक्ती) अवकाशीय प्रक्षेपण.डिस्ट्रोफिक वर्तुळातील प्रांतासाठी, BC समानता मापाच्या जागतिक वितरणाचे मूल्यांकन केले गेले आणि जागतिक 20 वर्षांच्या सरासरीचे मूल्यांकन केले गेले.काळा (BC = 0) म्हणजे समान क्षेत्रफळ आणि पांढरा (BC = 1) म्हणजे समानता नाही.
आकृती 4A आकृती 2B मधील प्रत्येक प्रांतातील BC मधील फरक स्पष्ट करते.क्लस्टरमधील सरासरी क्षेत्रफळाच्या सरासरी संयोजनाचा वापर करून आणि बीसी आणि प्रांतातील प्रत्येक ग्रिड पॉइंटच्या मध्यभागी असमानता निर्धारित करून, हे दर्शविते की SAGE पद्धत पर्यावरणीय समानतेच्या आधारावर 51 प्रजाती चांगल्या प्रकारे विभक्त करू शकते. मॉडेल डेटा.सर्व 51 प्रकारांची एकूण सरासरी क्लस्टर BC विषमता 0.102±0.0049 आहे.
(A, B, आणि D) प्रत्येक ग्रिड पॉइंट समुदाय आणि सरासरी प्रांतातील सरासरी BC फरक म्हणून प्रांतातील BC फरकाचे मूल्यमापन केले जाते आणि जटिलता कमी होत नाही.(2) जागतिक सरासरी इंट्रा-प्रांतीय BC फरक 0.227±0.117 आहे.या कामाद्वारे प्रस्तावित केलेल्या पर्यावरणीय प्रेरणा-आधारित वर्गीकरणाचा हा बेंचमार्क आहे [(C) मधील ग्रीन लाइन].(C) सरासरी इंट्रा-प्रांतीय BC फरक: काळी रेषा वाढत्या जटिलतेसह इंट्रा-प्रांतीय BC फरक दर्शवते.2σ इको-प्रांत ओळख प्रक्रियेच्या 10 पुनरावृत्तींमधून येतो.DBSCAN ने शोधलेल्या प्रांतांच्या एकूण जटिलतेसाठी, (A) दर्शविते की प्रांतातील BC विषमता 0.099 आहे, आणि (C) द्वारे प्रस्तावित जटिलता वर्गीकरण 12 आहे, परिणामी प्रांतात BC ची विषमता 0.200 आहे.जसे चित्र दाखवते.(डी).
आकृती 4B मध्ये, लॉंगहर्स्ट प्रांतातील BC समतुल्य फरक दर्शवण्यासाठी 51 प्लँक्टन प्रकारांचा बायोमास वापरला जातो.प्रत्येक प्रांताची एकूण सरासरी 0.227 आहे आणि BC प्रांतातील फरकाच्या संदर्भात ग्रिड पॉइंट्सचे मानक विचलन 0.046 आहे.हे आकृती 1B मध्ये ओळखल्या गेलेल्या क्लस्टरपेक्षा मोठे आहे.त्याऐवजी, सात कार्यात्मक गटांची बेरीज वापरून, लॉंगहर्स्टमधील सरासरी इंट्रा-सीझन बीसी असमानता 0.232 पर्यंत वाढली.
ग्लोबल इको-प्रांत नकाशा अद्वितीय पर्यावरणीय परस्परसंवादांचे गुंतागुंतीचे तपशील प्रदान करतो आणि लाँगहर्स्ट प्रांताच्या संपूर्ण पर्यावरणीय संरचनेचा वापर करून सुधारणा केल्या आहेत.इकोलॉजी मंत्रालयाने संख्यात्मक मॉडेल इकोसिस्टम नियंत्रित करण्याच्या प्रक्रियेत अंतर्दृष्टी प्रदान करणे अपेक्षित आहे आणि ही अंतर्दृष्टी फील्ड वर्कच्या शोधात मदत करेल.या संशोधनाच्या उद्देशाने शंभरहून अधिक प्रांत पूर्णपणे प्रदर्शित करणे शक्य नाही.पुढील भागात प्रांतांचा सारांश देणारी SAGE पद्धत सादर केली आहे.
प्रांताचे स्थान आणि व्यवस्थापन समजून घेण्यास प्रोत्साहन देणे हा प्रांताचा एक उद्देश आहे.आपत्कालीन परिस्थिती निश्चित करण्यासाठी, आकृती 1B मधील पद्धत पर्यावरणीयदृष्ट्या समान प्रांतांचे घरटे स्पष्ट करते.पर्यावरणीय समानतेच्या आधारे इको-प्रांत एकत्र केले जातात आणि प्रांतांच्या अशा गटाला AEP म्हणतात.विचारात घ्यायच्या एकूण प्रांतांच्या संख्येवर आधारित समायोज्य "जटिलता" सेट करा."जटिलता" हा शब्द वापरला जातो कारण तो आपत्कालीन गुणधर्मांची पातळी समायोजित करण्यास अनुमती देतो.अर्थपूर्ण एकत्रीकरण परिभाषित करण्यासाठी, लाँगहर्स्ट मधील सरासरी इंट्रा-प्रांतीय BC फरक 0.227 बेंचमार्क म्हणून वापरला जातो.या बेंचमार्कच्या खाली, एकत्रित प्रांत यापुढे उपयुक्त मानले जात नाहीत.
आकृती 3B मध्ये दाखवल्याप्रमाणे, जागतिक पर्यावरणीय प्रांत सुसंगत आहेत.आंतर-प्रांतीय BC फरक वापरून, हे पाहिले जाऊ शकते की काही कॉन्फिगरेशन खूप "सामान्य" आहेत.अनुवांशिक आणि आलेख सिद्धांत पद्धतींद्वारे प्रेरित, "कनेक्ट केलेले आलेख" त्यांच्यासारखेच प्रांतांवर आधारित > 100 प्रांतांची क्रमवारी लावण्यासाठी वापरले जातात.येथे "कनेक्‍टिव्हिटी" मेट्रिक आंतर-प्रांतीय BC विषमता (30) वापरून निर्धारित केले आहे.> 100 प्रांतांच्या वर्गीकरणासाठी मोठी जागा असलेल्या प्रांतांची संख्या येथे जटिलता म्हणून संदर्भित केली जाऊ शकते.AEP हे एक उत्पादन आहे जे 100 हून अधिक प्रांतांना सर्वात प्रबळ/जवळचे पर्यावरणीय प्रांत म्हणून वर्गीकृत करते.प्रत्येक इकोलॉजिकल प्रांत प्रबळ/अत्यंत कनेक्टेड इकोलॉजिकल प्रांताला नियुक्त केला जातो जो त्यांच्याशी सर्वात समान आहे.बीसी फरकाने निर्धारित केलेले हे एकत्रीकरण जागतिक पर्यावरणाकडे नेस्टेड दृष्टिकोनास अनुमती देते.
निवडलेली जटिलता 1 ते अंजीरच्या संपूर्ण जटिलतेपर्यंत कोणतेही मूल्य असू शकते.2A.कमी जटिलतेवर, संभाव्य आयामीपणा कमी करण्याच्या पायरीमुळे (t-SNE) AEP क्षीण होऊ शकतो.अध:पतनाचा अर्थ असा आहे की पुनरावृत्ती दरम्यान विविध AEPs ला पर्यावरणीय प्रांत नियुक्त केले जाऊ शकतात, ज्यामुळे कव्हर केलेले भौगोलिक क्षेत्र बदलते.आकृती 4C 10 अंमलबजावणीमध्ये वाढत्या जटिलतेच्या AEPs मधील प्रांतांमध्ये BC विषमतेचा प्रसार स्पष्ट करते (आकृती 1B मधील उदाहरण).आकृती 4C मध्ये, 2σ (निळा क्षेत्र) हे 10 अंमलबजावणीमध्ये अधोगतीचे माप आहे आणि हिरवी रेषा लॉन्गहर्स्ट बेंचमार्क दर्शवते.तथ्यांनी हे सिद्ध केले आहे की 12 ची जटिलता प्रांतातील BC फरक सर्व अंमलबजावणीमध्ये लाँगहर्स्ट बेंचमार्कच्या खाली ठेवू शकते आणि तुलनेने लहान 2σ अधोगती राखू शकते.सारांश, आकृती 4D मध्ये दर्शविल्याप्रमाणे, किमान शिफारस केलेली जटिलता 12 AEPs आहे आणि 51 प्लँक्टन प्रकार वापरून मूल्यमापन केलेले सरासरी इंट्रा-प्रांतीय BC फरक 0.198±0.013 आहे.सात प्लँक्टन कार्यात्मक गटांची बेरीज वापरून, प्रांतातील सरासरी BC फरक 0.198±0.004 ऐवजी 2σ आहे.सात कार्यात्मक गटांच्या एकूण बायोमास किंवा सर्व 51 प्लँक्टन प्रकारांच्या बायोमाससह गणना केलेल्या BC फरकांमधील तुलना दर्शवते की जरी SAGE पद्धत 51-आयामी परिस्थितीला लागू आहे, ती सात कार्यात्मक गटांच्या एकूण बायोमाससाठी आहे. प्रशिक्षणासाठी.
कोणत्याही संशोधनाच्या उद्देशानुसार, जटिलतेच्या विविध स्तरांचा विचार केला जाऊ शकतो.प्रादेशिक अभ्यासांना संपूर्ण जटिलता आवश्यक असू शकते (म्हणजे, सर्व 115 प्रांत).उदाहरण म्हणून आणि स्पष्टतेसाठी, 12 ची किमान शिफारस केलेली जटिलता विचारात घ्या.
SAGE पद्धतीच्या उपयुक्ततेचे उदाहरण म्हणून, आपत्कालीन समुदाय संरचनेचे नियंत्रण शोधण्यासाठी येथे 12 च्या किमान जटिलतेसह 12 AEPs वापरले जातात.आकृती 5 एईपी (A ते एल पर्यंत) द्वारे गटबद्ध केलेले पर्यावरणीय अंतर्दृष्टी स्पष्ट करते: रेडफील्ड स्टोचिओमेट्रीमध्ये, भौगोलिक विस्तार (आकृती 5C), कार्यात्मक गट बायोमास रचना (आकृती 5A) आणि पोषक पुरवठा (आकृती 5B) एन झूमद्वारे केले जातात.गुणोत्तर (N:Si:P:Fe, 1:1:16:16×103) दाखवले आहे.नंतरच्या पॅनेलसाठी, P 16 ने गुणाकार केला आणि Fe चा 16×103 ने गुणाकार केला, त्यामुळे बार आलेख फायटोप्लँक्टनच्या पौष्टिक गरजांच्या समतुल्य आहे.
12 प्रांतांमधील परिसंस्थेचे 12 AEPs A ते L. (A) बायोमास (mgC/m3) मध्ये प्रांतांचे वर्गीकरण केले आहे.(ब) विरघळलेल्या अजैविक नायट्रोजन (N), लोह (Fe), फॉस्फेट (P) आणि सिलिकिक ऍसिड (Si) (mmol/m3 प्रति वर्ष) यांचा पोषक प्रवाह दर.Fe आणि P अनुक्रमे 16 आणि 16 × 103 ने गुणाकार केला जातो, ज्यामुळे पट्ट्या फायटोप्लँक्टन स्टोचिओमेट्री आवश्यकतांनुसार प्रमाणित केल्या जातात.(C) ध्रुवीय प्रदेश, उपोष्णकटिबंधीय चक्रीवादळे आणि प्रमुख मोसमी/वाढत्या प्रदेशांमधील फरक लक्षात घ्या.निरीक्षण केंद्रे खालीलप्रमाणे चिन्हांकित केली आहेत: 1, सीट;2, अलोहा;3, स्टेशन पी;आणि 4, BATS.
ओळखलेला AEP अद्वितीय आहे.अटलांटिक आणि पॅसिफिक महासागरांमध्ये विषुववृत्ताभोवती काही सममिती आहे आणि हिंद महासागरात समान परंतु विस्तारित क्षेत्र अस्तित्वात आहे.काही AEPs चढाईशी संबंधित महाद्वीपाची पश्चिम बाजू स्वीकारतात.दक्षिण ध्रुव सर्कंपोलर करंट हे एक मोठे क्षेत्रीय वैशिष्ट्य मानले जाते.उपोष्णकटिबंधीय चक्रीवादळ ही ऑलिगोट्रॉफिक एईपीची एक जटिल मालिका आहे.या प्रांतांमध्ये, प्लँक्टन-प्रभुत्व असलेल्या ऑलिगोट्रॉफिक व्हर्टिसेस आणि डायटम-समृद्ध ध्रुवीय प्रदेशांमधील बायोमास फरकांचा परिचित नमुना स्पष्ट आहे.
अगदी समान एकूण फायटोप्लँक्टन बायोमास असलेल्या एईपीमध्ये खूप भिन्न समुदाय संरचना असू शकते आणि भिन्न भौगोलिक क्षेत्रे, जसे की डी, एच आणि के, ज्यामध्ये एकूण फायटोप्लँक्टन बायोमास आहे.AEP H मुख्यत्वे विषुववृत्तीय हिंदी महासागरात अस्तित्वात आहे आणि तेथे अधिक डायझोट्रॉफिक जीवाणू आहेत.AEP D अनेक खोऱ्यांमध्ये आढळतो, परंतु विषुववृत्तीय अपवेलिंगच्या आजूबाजूच्या उच्च-उत्पन्न क्षेत्राभोवती पॅसिफिकमध्ये हे विशेषतः प्रमुख आहे.या पॅसिफिक प्रांताचा आकार प्लॅनेटरी वेव्ह ट्रेनची आठवण करून देणारा आहे.AEP D मध्ये काही डायझोबॅक्टेरिया आहेत आणि अधिक शंकू आहेत.इतर दोन प्रांतांच्या तुलनेत, AEP K फक्त आर्क्टिक महासागराच्या उच्च प्रदेशात आढळतो आणि तेथे जास्त डायटॉम्स आणि कमी प्लँक्टन्स आहेत.हे लक्षात घेण्यासारखे आहे की या तीन प्रदेशांमध्ये प्लवकांचे प्रमाण देखील खूप भिन्न आहे.त्यापैकी, AEP K चे प्लँक्टन विपुलता तुलनेने कमी आहे, तर AEP D आणि H चे प्रमाण तुलनेने जास्त आहे.म्हणून, त्यांचे बायोमास असूनही (आणि म्हणून Chl-a सारखे), हे प्रांत बरेच वेगळे आहेत: Chl-आधारित प्रांत चाचणी हे फरक कॅप्चर करू शकत नाहीत.
हे देखील स्पष्ट आहे की फायटोप्लँक्टन समुदायाच्या संरचनेच्या दृष्टीने खूप भिन्न बायोमास असलेले काही AEP सारखे असू शकतात.उदाहरणार्थ, हे AEP D आणि E मध्ये दृश्यमान आहे. ते एकमेकांच्या जवळ आहेत आणि प्रशांत महासागरात, AEP E अत्यंत उत्पादक AEPJ च्या जवळ आहे.त्याचप्रमाणे, फायटोप्लँक्टन बायोमास आणि झूप्लँक्टन विपुलता यांच्यात कोणताही स्पष्ट संबंध नाही.
AEP त्यांना प्रदान केलेल्या पोषक तत्वांच्या संदर्भात समजले जाऊ शकते (आकृती 5B).डायटॉम्स फक्त तिथेच अस्तित्वात असतात जिथे सिलिकिक ऍसिडचा पुरेसा पुरवठा असतो.साधारणपणे, सिलिकिक ऍसिडचा पुरवठा जितका जास्त असेल तितका डायटॉम्सचा बायोमास जास्त असतो.डायटॉम्स AEP A, J, K आणि L मध्ये दिसू शकतात. इतर फायटोप्लँक्टनच्या सापेक्ष डायटॉम बायोमासचे गुणोत्तर डायटॉम मागणीच्या सापेक्ष प्रदान केलेल्या N, P आणि Fe द्वारे निर्धारित केले जाते.उदाहरणार्थ, एईपी एल डायटॉम्सचे वर्चस्व आहे.इतर पोषक तत्वांच्या तुलनेत Si चा सर्वाधिक पुरवठा आहे.याउलट, उच्च उत्पादकता असूनही, AEP J मध्ये कमी डायटॉम्स आणि कमी सिलिकॉन पुरवठा आहे (सर्व आणि इतर पोषक घटकांच्या तुलनेत).
डायझोनियम बॅक्टेरियामध्ये नायट्रोजन निश्चित करण्याची क्षमता असते, परंतु हळूहळू वाढतात (31).ते इतर फायटोप्लँक्टनसह एकत्र राहतात, जिथे लोह आणि फॉस्फरस गैर-डायझोनियम पोषक घटकांच्या मागणीच्या तुलनेत जास्त आहेत (20, 21).हे लक्षात घेण्यासारखे आहे की डायझोट्रॉफिक बायोमास तुलनेने जास्त आहे, आणि N च्या पुरवठ्याच्या तुलनेत Fe आणि P चा पुरवठा तुलनेने मोठा आहे. अशा प्रकारे, AEP J मध्ये एकूण बायोमास जास्त असला तरी, AEP H मध्ये डायझोनियम बायोमास आहे. J पेक्षा मोठा. कृपया लक्षात घ्या की AEP J आणि H भौगोलिकदृष्ट्या खूप भिन्न आहेत आणि H विषुववृत्तीय हिंदी महासागरात स्थित आहे.
अद्वितीय परिसंस्थेची रचना प्रांतांमध्ये विभागली नसल्यास, 12 AEP च्या सर्वात कमी जटिलतेच्या मॉडेल्समधून मिळालेली अंतर्दृष्टी इतकी स्पष्ट होणार नाही.SAGE द्वारे व्युत्पन्न केलेले AEP इकोसिस्टम मॉडेल्समधून जटिल आणि उच्च-आयामी माहितीची सुसंगत आणि एकाचवेळी तुलना सुलभ करते.एईपी प्रभावीपणे यावर जोर देते की उच्च पोषक स्तरांवर समुदाय रचना किंवा झूप्लँक्टन विपुलता निर्धारित करण्यासाठी Chl ही चांगली आणि पर्यायी पद्धत का नाही.सध्या सुरू असलेल्या संशोधन विषयांचे तपशीलवार विश्लेषण या लेखाच्या व्याप्तीच्या पलीकडे आहे.SAGE पद्धत मॉडेलमधील इतर यंत्रणा एक्सप्लोर करण्याचा एक मार्ग प्रदान करते जी पॉइंट-टू-पॉइंट दृश्यापेक्षा हाताळण्यास सोपी आहे.
जागतिक भौतिक/बायोजियोकेमिकल/इकोसिस्टम संख्यात्मक मॉडेल्समधून अत्यंत जटिल पर्यावरणीय डेटा स्पष्ट करण्यात मदत करण्यासाठी SAGE पद्धत प्रस्तावित आहे.पारिस्थितिक प्रांत क्रॉस-प्लँक्टन फंक्शनल ग्रुप्सच्या एकूण बायोमास, टी-एसएनई संभाव्यता आयामीपणा कमी करण्याच्या अल्गोरिदमचा वापर आणि पर्यवेक्षित ML पद्धत DBSCAN वापरून क्लस्टरिंगद्वारे निर्धारित केला जातो.नेस्टिंग पद्धतीसाठी आंतर-प्रांतीय बीसी फरक/ आलेख सिद्धांत एक मजबूत AEP प्राप्त करण्यासाठी लागू केला जातो ज्याचा वापर जागतिक व्याख्यासाठी केला जाऊ शकतो.बांधकामाच्या बाबतीत, इको-प्रांत आणि AEP अद्वितीय आहेत.मूळ पर्यावरणीय प्रांताची संपूर्ण जटिलता आणि 12 AEP च्या शिफारस केलेल्या किमान थ्रेशोल्ड दरम्यान AEP नेस्टिंग समायोजित केले जाऊ शकते.नेस्टिंग आणि AEP ची किमान जटिलता निश्चित करणे हे महत्त्वाचे टप्पे मानले जातात, कारण t-SNE संभाव्यता <12 जटिलतेच्या AEPs ची झीज करते.SAGE पद्धत जागतिक आहे, आणि तिची जटिलता > 100 AEPs ते 12 पर्यंत आहे. साधेपणासाठी, सध्याचे लक्ष 12 जागतिक AEPs च्या जटिलतेवर आहे.भविष्यातील संशोधन, विशेषत: प्रादेशिक अभ्यासांना, जागतिक पर्यावरण-प्रांतांचा एक छोटा अवकाशीय उपसंच उपयुक्त वाटू शकतो, आणि येथे चर्चा केलेल्या समान पर्यावरणीय अंतर्दृष्टीचा लाभ घेण्यासाठी एका लहान भागात एकत्रित केले जाऊ शकते.हे पर्यावरणीय प्रांत आणि त्यांच्याकडून मिळालेल्या अंतर्दृष्टींचा वापर पुढील पर्यावरणीय समज, मॉडेल तुलना सुलभ करण्यासाठी आणि सागरी परिसंस्थेचे निरीक्षण सुधारण्यासाठी कसे करता येईल याबद्दल सूचना प्रदान करते.
SAGE पद्धतीद्वारे ओळखले जाणारे पर्यावरणीय प्रांत आणि AEP संख्यात्मक मॉडेलमधील डेटावर आधारित आहेत.व्याख्येनुसार, संख्यात्मक मॉडेल ही एक सरलीकृत रचना आहे, जी लक्ष्य प्रणालीचे सार कॅप्चर करण्याचा प्रयत्न करते आणि वेगवेगळ्या मॉडेल्समध्ये प्लँक्टनचे वेगवेगळे वितरण असेल.या अभ्यासात वापरलेले संख्यात्मक मॉडेल काही निरीक्षण नमुने पूर्णपणे कॅप्चर करू शकत नाही (उदाहरणार्थ, विषुववृत्तीय प्रदेश आणि दक्षिण महासागरासाठी Chl अंदाजांमध्ये).वास्तविक महासागरातील विविधतेचा फक्त एक छोटासा भाग पकडला जातो आणि मेसो आणि सब-मेसोस्केल्सचे निराकरण केले जाऊ शकत नाही, ज्यामुळे पोषक प्रवाह आणि लहान-सामुदायिक संरचना प्रभावित होऊ शकतात.या कमतरता असूनही, हे दिसून आले की जटिल मॉडेल्स समजून घेण्यात मदत करण्यासाठी AEP खूप उपयुक्त आहे.समान पर्यावरणीय प्रांत कुठे आढळतात याचे मूल्यांकन करून, AEP संभाव्य संख्यात्मक मॉडेल तुलना साधन प्रदान करते.वर्तमान संख्यात्मक मॉडेल रिमोट सेन्सिंग फायटोप्लँक्टन Chl-a एकाग्रता आणि प्लँक्टन आकार आणि कार्यात्मक गटाचे वितरण (टीप S1 आणि आकृती S1) (2, 32) च्या एकूण नमुना कॅप्चर करते.
0.1 mgChl-a/m-3 समोच्च रेषा द्वारे दर्शविल्याप्रमाणे, AEP हे ऑलिगोट्रॉफिक क्षेत्र आणि मेसोट्रॉफिक क्षेत्र (आकृती S1B) मध्ये विभागलेले आहे: AEP B, C, D, E, F आणि G हे ऑलिगोट्रॉफिक क्षेत्र आहेत आणि उर्वरित क्षेत्रे आहेत. स्थित उच्च Chl-a.AEP लाँगहर्स्ट प्रांत (आकृती S3A) सह काही पत्रव्यवहार दर्शविते, उदाहरणार्थ, दक्षिणी महासागर आणि विषुववृत्तीय पॅसिफिक.काही क्षेत्रांमध्ये, AEP अनेक लाँगहर्स्ट प्रदेशांचा समावेश करते आणि त्याउलट.या भागात आणि लाँगहर्स्टमधील प्रांतांचे सीमांकन करण्याचा हेतू भिन्न असल्याने, फरक असणे अपेक्षित आहे.लाँगहर्स्ट प्रांतातील एकापेक्षा जास्त AEP असे सूचित करतात की समान जैव-रसायन असलेल्या काही क्षेत्रांमध्ये खूप भिन्न परिसंस्था संरचना असू शकते.AEP भौतिक अवस्थांसह विशिष्ट पत्रव्यवहार प्रदर्शित करते, जसे की पर्यवेक्षण न केलेले शिक्षण (19) वापरून प्रकट होते, जसे की उच्च अपवेलिंग राज्यांमध्ये (उदाहरणार्थ, दक्षिणी महासागर आणि विषुववृत्तीय पॅसिफिक; आकृती S3, C आणि D).हे पत्रव्यवहार दर्शवितात की प्लँक्टनच्या समुदायाच्या संरचनेवर सागरी गतिशीलतेचा जोरदार प्रभाव पडतो.उत्तर अटलांटिक सारख्या भागात, AEP भौतिक प्रांतांमधून मार्गक्रमण करते.या फरकांना कारणीभूत असलेल्या यंत्रणेमध्ये धूळ वाहतुकीसारख्या प्रक्रियांचा समावेश असू शकतो, ज्यामुळे समान शारीरिक परिस्थितीतही पूर्णपणे भिन्न पोषण कार्यक्रम होऊ शकतात.
इकोलॉजी मंत्रालय आणि AEP ने निदर्शनास आणले की केवळ Chl वापरल्याने पर्यावरणीय घटक ओळखता येत नाहीत, कारण सागरी पर्यावरणीय समुदायाने आधीच लक्षात घेतले आहे.हे समान बायोमास असलेल्या परंतु लक्षणीय भिन्न पर्यावरणीय रचना (जसे की D आणि E) असलेल्या AEPs मध्ये दिसून येते.याउलट, D आणि K सारख्या AEP मध्ये खूप भिन्न बायोमास आहे परंतु समान पर्यावरणीय रचना आहे.AEP यावर भर देते की बायोमास, पर्यावरणीय रचना आणि झूप्लँक्टन विपुलता यांच्यातील संबंध जटिल आहे.उदाहरणार्थ, जरी AEP J हे फायटोप्लँक्टन आणि प्लँक्टन बायोमासच्या बाबतीत वेगळे असले तरी, AEP च्या A आणि L मध्ये प्लँक्टन बायोमास समान आहे, परंतु A मध्ये प्लँक्टनचे प्रमाण जास्त आहे.AEP यावर जोर देते की फायटोप्लँक्टन बायोमास (किंवा Chl) चा वापर झूप्लँक्टन बायोमासचा अंदाज लावण्यासाठी केला जाऊ शकत नाही.झूप्लँक्टन हा मत्स्यपालन अन्नसाखळीचा पाया आहे आणि अधिक अचूक अंदाजामुळे संसाधनांचे उत्तम व्यवस्थापन होऊ शकते.भविष्यातील सागरी रंगाचे उपग्रह [उदाहरणार्थ, PACE (प्लँक्टन, एरोसोल, क्लाउड आणि सागरी परिसंस्था)] फायटोप्लँक्टनच्या सामुदायिक संरचनेचा अंदाज लावण्यास मदत करण्यासाठी अधिक चांगल्या स्थितीत असू शकतात.एईपी अंदाज वापरल्याने अंतराळातून झूप्लँक्टनचा अंदाज लावणे शक्य होते.नवीन तंत्रज्ञानासह SAGE सारख्या पद्धती आणि ग्राउंड ट्रूथ सर्व्हेसाठी (जसे की तारा आणि फॉलो-अप संशोधन) उपलब्ध असलेला अधिकाधिक फील्ड डेटा, उपग्रह-आधारित इकोसिस्टम आरोग्य निरीक्षणाच्या दिशेने एक पाऊल उचलू शकतात.
बायोमास/Chl, निव्वळ प्राथमिक उत्पादन आणि समुदाय रचना यासारख्या प्रांतीय वैशिष्ट्यांचे नियंत्रण करणाऱ्या काही यंत्रणांचे मूल्यांकन करण्यासाठी SAGE पद्धत एक सोयीस्कर मार्ग प्रदान करते.उदाहरणार्थ, डायटॉम्सची सापेक्ष रक्कम फायटोप्लँक्टन स्टोइचियोमेट्रिक आवश्यकतांच्या सापेक्ष Si, N, P आणि Fe च्या पुरवठ्यातील असमतोलाने सेट केली जाते.समतोल पुरवठा दराने, समुदायावर डायटॉम्स (एल) चे वर्चस्व आहे.जेव्हा पुरवठा दर असंतुलित असतो (म्हणजे सिलिकॉनचा पुरवठा डायटॉम्सच्या पोषक मागणीपेक्षा कमी असतो), तेव्हा डायटॉम्सचा फक्त एक छोटासा भाग शेअर (K) असतो.जेव्हा Fe आणि P चा पुरवठा N च्या पुरवठ्यापेक्षा जास्त होतो (उदाहरणार्थ, E आणि H), तेव्हा डायझोट्रॉफिक जीवाणू जोमाने वाढतात.AEP द्वारे प्रदान केलेल्या संदर्भाद्वारे, नियंत्रण यंत्रणेचा शोध अधिक उपयुक्त होईल.
इको-प्रांत आणि AEP हे समान समुदाय संरचना असलेले क्षेत्र आहेत.पारिस्थितिक प्रांत किंवा AEP मधील विशिष्ट स्थानावरील वेळ मालिका संदर्भ बिंदू म्हणून ओळखली जाऊ शकते आणि पर्यावरणीय प्रांत किंवा AEP द्वारे समाविष्ट असलेल्या क्षेत्राचे प्रतिनिधित्व करू शकते.दीर्घकालीन ऑन-साइट मॉनिटरिंग स्टेशन्स अशी वेळ मालिका प्रदान करतात.दीर्घकालीन इन-सिटू डेटा सेट अगणित भूमिका बजावत राहतील.समुदाय संरचनेचे निरीक्षण करण्याच्या दृष्टीकोनातून, SAGE पद्धतीला नवीन साइट्सचे सर्वात उपयुक्त स्थान निर्धारित करण्यात मदत करण्याचा एक मार्ग म्हणून पाहिले जाऊ शकते.उदाहरणार्थ, दीर्घकालीन ऑलिगोट्रॉफिक अधिवास मूल्यांकन (ALOHA) मधील वेळ मालिका ऑलिगोट्रॉफिक क्षेत्राच्या AEP B मध्ये आहे (आकृती 5C, लेबल 2).कारण ALOHA दुसर्‍या AEP च्या सीमेच्या जवळ आहे, पूर्वी सुचवल्याप्रमाणे, वेळ मालिका संपूर्ण क्षेत्राचे प्रतिनिधी असू शकत नाही (33).त्याच AEP B मध्ये, वेळ मालिका SEATS (दक्षिण आशियाई वेळ मालिका) नैऋत्य तैवान (34) मध्ये स्थित आहे, इतर AEPs (आकृती 5C, लेबल 1) च्या सीमांपासून दूर आहे आणि निरीक्षण करण्यासाठी एक चांगले स्थान म्हणून वापरले जाऊ शकते. AEPB.AEPC मधील BATS (बरमुडा अटलांटिक टाईम सिरीज स्टडी) वेळ मालिका (आकृती 5C, लेबल 4) AEP C आणि F मधील सीमेच्या अगदी जवळ आहे, जे सूचित करते की BATS वेळ मालिकेचा वापर करून AEP C चे निरीक्षण करणे थेट समस्याप्रधान असू शकते.AEP J मधील स्टेशन P (आकृती 5C, लेबल 3) AEP सीमेपासून दूर आहे, त्यामुळे ते अधिक प्रातिनिधिक आहे.इको-प्रांत आणि AEP जागतिक बदलांचे मूल्यांकन करण्यासाठी योग्य एक मॉनिटरिंग फ्रेमवर्क स्थापित करण्यात मदत करू शकतात, कारण ऑन-साइट सॅम्पलिंग कोठे मुख्य अंतर्दृष्टी प्रदान करू शकते याचे मूल्यांकन करण्यासाठी प्रांतांची परवानगी.वेळ-बचत परिवर्तनशीलतेचे मूल्यांकन करण्यासाठी हवामान डेटावर लागू करण्यासाठी SAGE पद्धत आणखी विकसित केली जाऊ शकते.
डेटा सायन्स/एमएल पद्धती आणि डोमेन-विशिष्ट ज्ञानाचा काळजीपूर्वक वापर करून SAGE पद्धतीचे यश प्राप्त केले जाते.विशेषत:, t-SNE चा वापर आयामीपणा कमी करण्यासाठी केला जातो, जो उच्च-आयामी डेटाची सहविभाजन रचना संरक्षित करतो आणि सह-आयामी टोपोलॉजीचे व्हिज्युअलायझेशन सुलभ करतो.डेटा पट्टे आणि सहविभाजन (आकृती 2A) च्या स्वरूपात मांडला जातो, हे दर्शविते की पूर्णपणे अंतर-आधारित उपाय (जसे की के-मीन्स) योग्य नाहीत कारण ते सहसा गॉसियन (परिपत्रक) आधारभूत वितरण वापरतात (टीप S2 मध्ये चर्चा केली आहे) .DBSCAN पद्धत कोणत्याही कोव्हेरिअन्स टोपोलॉजीसाठी योग्य आहे.जोपर्यंत तुम्ही पॅरामीटर्स सेट करण्याकडे लक्ष देता, विश्वसनीय ओळख प्रदान केली जाऊ शकते.टी-एसएनई अल्गोरिदमची संगणकीय किंमत जास्त आहे, जी त्याच्या वर्तमान अनुप्रयोगास मोठ्या प्रमाणात डेटापर्यंत मर्यादित करते, याचा अर्थ सखोल किंवा वेळ-विविध फील्डवर लागू करणे कठीण आहे.t-SNE च्या स्केलेबिलिटीवर काम सुरू आहे.KL अंतर समांतर करणे सोपे असल्याने, t-SNE अल्गोरिदममध्ये भविष्यात विस्ताराची चांगली क्षमता आहे (35).आतापर्यंत, आकार कमी करू शकणार्‍या इतर आशादायक आयाम कमी करण्याच्या पद्धतींमध्ये युनिफाइड मॅनिफोल्ड ऍपॉक्झिमेशन आणि प्रोजेक्शन (UMAP) तंत्रांचा समावेश आहे, परंतु महासागर डेटाच्या संदर्भात मूल्यमापन आवश्यक आहे.चांगल्या स्केलेबिलिटीचा अर्थ, उदाहरणार्थ, मिश्रित स्तरावर विविध जटिलतेसह जागतिक हवामान किंवा मॉडेल्सचे वर्गीकरण करणे.कोणत्याही प्रांतात SAGE द्वारे वर्गीकृत करण्यात अयशस्वी झालेले क्षेत्र आकृती 2A मधील उर्वरित काळा ठिपके म्हणून ओळखले जाऊ शकतात.भौगोलिकदृष्ट्या, हे क्षेत्र मुख्यत्वे उच्च हंगामी भागात आहेत, जे सूचित करते की काळानुसार बदलणारे पर्यावरणीय प्रांत कॅप्चर केल्याने अधिक चांगले कव्हरेज मिळेल.
SAGE पद्धत तयार करण्यासाठी, जटिल प्रणाली/डेटा सायन्समधील कल्पनांचा वापर केला गेला आहे, कार्यात्मक गटांचे क्लस्टर (11-आयामी जागेत अगदी जवळ असण्याची शक्यता) आणि प्रांत निर्धारित करण्याची क्षमता वापरून.हे प्रांत आमच्या 3D t-SNE फेज स्पेसमध्ये विशिष्ट खंडांचे चित्रण करतात.त्याचप्रमाणे, "सामान्य" किंवा "अराजक" वर्तन (36) निर्धारित करण्यासाठी प्रक्षेपकाने व्यापलेल्या राज्य जागेच्या "व्हॉल्यूम" चे मूल्यमापन करण्यासाठी Poincaré भाग वापरला जाऊ शकतो.स्थिर 11-आयामी मॉडेल आउटपुटसाठी, डेटाचे 3D फेज स्पेसमध्ये रूपांतरित झाल्यानंतर व्यापलेल्या व्हॉल्यूमचे देखील त्याचप्रमाणे स्पष्टीकरण दिले जाऊ शकते.3D फेज स्पेसमधील भौगोलिक क्षेत्र आणि क्षेत्रफळ यांच्यातील संबंध साधे नाहीत, परंतु पर्यावरणीय समानतेच्या दृष्टीने ते स्पष्ट केले जाऊ शकते.या कारणास्तव, अधिक पारंपारिक BC विषमता मापनाला प्राधान्य दिले जाते.
भविष्यातील कार्य ओळखल्या गेलेल्या प्रांतांच्या आणि AEP च्या अवकाशीय परिवर्तनशीलतेचे मूल्यांकन करण्यासाठी ऋतूनुसार बदलणाऱ्या डेटासाठी SAGE पद्धतीचा पुन्हा वापर करेल.उपग्रह मोजमाप (जसे की Chl-a, रिमोट सेन्सिंग रिफ्लेक्टिव्हिटी आणि समुद्राच्या पृष्ठभागाचे तापमान) द्वारे कोणते प्रांत निश्चित केले जाऊ शकतात हे निर्धारित करण्यात मदत करण्यासाठी ही पद्धत वापरणे हे भविष्यातील ध्येय आहे.हे पर्यावरणीय घटकांचे रिमोट सेन्सिंग मूल्यांकन आणि पर्यावरणीय प्रांतांचे आणि त्यांच्या परिवर्तनशीलतेचे अत्यंत लवचिक निरीक्षण करण्यास अनुमती देईल.
या संशोधनाचा उद्देश SAGE पद्धतीचा परिचय करून देणे हा आहे, जी पर्यावरणीय प्रांताला त्याच्या अद्वितीय प्लँक्टन समुदाय संरचनेद्वारे परिभाषित करते.येथे, भौतिक/बायोजियोकेमिकल/इकोसिस्टम मॉडेल आणि t-SNE आणि DBSCAN अल्गोरिदमच्या पॅरामीटर निवडीबद्दल अधिक तपशीलवार माहिती प्रदान केली जाईल.
मॉडेलचे भौतिक घटक सागरी परिसंचरण आणि हवामानाच्या अंदाजावरून येतात [ECCOv4;(37) (38) द्वारे वर्णन केलेले जागतिक राज्य अंदाज.राज्य अंदाजाचे नाममात्र ठराव 1/5 आहे.Lagrangian गुणक पद्धतीसह किमान चौरस पद्धतीचा वापर प्रारंभिक आणि सीमा परिस्थिती आणि निरीक्षणाद्वारे समायोजित अंतर्गत मॉडेल पॅरामीटर्स प्राप्त करण्यासाठी केला जातो, ज्यामुळे मुक्त-चालणारे MIT जनरल सायकल मॉडेल (MITgcm) (39) तयार होते, मॉडेल ऑप्टिमायझेशननंतर, परिणाम प्राप्त करू शकतात. ट्रॅक आणि निरीक्षण करा.
(२) मध्ये जैव-रसायन/परिसंस्थेचे अधिक संपूर्ण वर्णन (म्हणजे समीकरणे आणि पॅरामीटर मूल्ये) आहेत.मॉडेल अकार्बनिक आणि सेंद्रिय तलावांमधून C, N, P, Si आणि Fe चे अभिसरण कॅप्चर करते.येथे वापरलेल्या आवृत्तीमध्ये फायटोप्लँक्टनच्या 35 प्रजातींचा समावेश आहे: मायक्रोप्रोकेरियोट्सच्या 2 प्रजाती आणि मायक्रोयूकेरियोट्सच्या 2 प्रजाती (कमी पोषक वातावरणासाठी योग्य), 5 प्रजाती क्रिप्टोमोनास स्फेरॉइड्स (कॅल्शियम कार्बोनेट लेपसह), डायझोनियमच्या 5 प्रजाती (सोफिक्स कॅनट्रोजेन) हे मर्यादित नाही) विरघळलेल्या अजैविक नायट्रोजनची उपलब्धता), 11 डायटॉम्स (सिलिसियस आवरण तयार करणे), 10 मिश्रित-वनस्पतिजन्य फ्लॅगेलेट (प्रकाशसंश्लेषण करू शकतात आणि इतर प्लँक्टन खाऊ शकतात) आणि 16 झूप्लँक्टन (इतर प्लँक्टनवर चरतात).त्यांना "बायोजियोकेमिकल फंक्शनल ग्रुप्स" असे म्हणतात कारण त्यांचा सागरी जैव-रसायनशास्त्रावर (40, 41) भिन्न प्रभाव पडतो आणि ते निरीक्षण आणि मॉडेल अभ्यासामध्ये वापरले जातात.या मॉडेलमध्ये, प्रत्येक कार्यात्मक गट 0.6 ते 2500 μm समतुल्य गोलाकार व्यासासह, विविध आकारांच्या अनेक प्लँक्टन्सने बनलेला आहे.
फायटोप्लँक्टनची वाढ, चर आणि बुडणे यावर परिणाम करणारे मापदंड आकाराशी संबंधित आहेत आणि सहा फायटोप्लँक्टन कार्यात्मक गटांमध्ये विशिष्ट फरक आहेत (32).भिन्न भौतिक फ्रेमवर्क असूनही, मॉडेलच्या 51 प्लँक्टन घटकांचे परिणाम अनेक अलीकडील अभ्यासांमध्ये वापरले गेले आहेत (42-44).
1992 ते 2011 पर्यंत, भौतिक/बायोजियोकेमिकल/इकोसिस्टम कपलिंग मॉडेल 20 वर्षे चालले.मॉडेलच्या आउटपुटमध्ये प्लँक्टन बायोमास, पोषक घटकांचे प्रमाण आणि पोषक पुरवठा दर (DIN, PO4, Si आणि Fe) यांचा समावेश होतो.या अभ्यासात, या आउटपुटची 20 वर्षांची सरासरी इकोलॉजिकल प्रांताचे इनपुट म्हणून वापरली गेली.Chl, प्लँक्टन बायोमास आणि पोषक घटकांचे वितरण आणि कार्यात्मक गटांच्या वितरणाची तुलना उपग्रह आणि इन-सीटू निरीक्षणांशी केली जाते [पहा (2, 44), टीप S1 आणि आकृती.S1 ते S3].
SAGE पद्धतीसाठी, यादृच्छिकतेचा मुख्य स्त्रोत t-SNE पायरीवरून येतो.यादृच्छिकता पुनरावृत्ती होण्यास अडथळा आणते, याचा अर्थ असा होतो की परिणाम अविश्वसनीय आहेत.SAGE पद्धत t-SNE आणि DBSCAN च्या पॅरामीटर्सचा संच ठरवून मजबूततेची कठोरपणे चाचणी करते, जे पुनरावृत्ती केल्यावर सातत्याने क्लस्टर ओळखू शकतात.t-SNE पॅरामीटरची "संभ्रमता" निश्चित करणे हे उच्च ते निम्न परिमाणे मॅपिंगने डेटाच्या स्थानिक किंवा जागतिक वैशिष्ट्यांचा किती प्रमाणात आदर केला पाहिजे हे निर्धारित करणे समजले जाऊ शकते.400 आणि 300 पुनरावृत्तीच्या गोंधळापर्यंत पोहोचले.
क्लस्टरिंग अल्गोरिदम DBSCAN साठी, क्लस्टरमधील डेटा पॉइंट्सचा किमान आकार आणि अंतर मेट्रिक निर्धारित करणे आवश्यक आहे.तज्ञांच्या मार्गदर्शनाखाली किमान संख्या निश्चित केली जाते.सध्याच्या संख्यात्मक मॉडेलिंग फ्रेमवर्क आणि रिझोल्यूशनमध्ये काय बसते हे या ज्ञानाला माहीत आहे.किमान संख्या 100 आहे. उच्च किमान मूल्य (हिरव्याची वरची मर्यादा रुंद होण्यापूर्वी <135 पेक्षा कमी) विचारात घेतली जाऊ शकते, परंतु ते BC विषमतेवर आधारित एकत्रीकरण पद्धतीची जागा घेऊ शकत नाही.कनेक्शनची डिग्री (आकृती 6A) ϵ पॅरामीटर सेट करण्यासाठी वापरली जाते, जे उच्च कव्हरेजसाठी अनुकूल आहे (आकृती 6B).कनेक्टिव्हिटी क्लस्टरची संमिश्र संख्या म्हणून परिभाषित केली जाते आणि ती ϵ पॅरामीटरसाठी संवेदनशील असते.कमी कनेक्टिव्हिटी अपुरी फिटिंग दर्शवते, कृत्रिमरित्या क्षेत्रांना एकत्र गटबद्ध करते.उच्च कनेक्टिव्हिटी ओव्हरफिटिंग दर्शवते.ओव्हरफिटिंग देखील समस्याप्रधान आहे, कारण हे दर्शविते की सुरुवातीच्या यादृच्छिक अंदाजांमुळे पुनरुत्पादित परिणाम होऊ शकतात.या दोन टोकांच्या दरम्यान, एक तीव्र वाढ (सामान्यतः "कोपर" म्हणतात) सर्वोत्तम ϵ दर्शवते.आकृती 6A मध्ये, आपण पठार क्षेत्रात (पिवळे,> 200 क्लस्टर) तीव्र वाढ पहात आहात, त्यानंतर तीक्ष्ण घट (हिरवे, 100 क्लस्टर्स), सुमारे 130 पर्यंत, खूप कमी क्लस्टर्सने वेढलेले (निळे, <60 क्लस्टर) ).कमीत कमी 100 निळ्या भागात, एकतर एक क्लस्टर संपूर्ण महासागरावर वर्चस्व गाजवतो (ϵ <0.42), किंवा बहुतेक महासागर वर्गीकृत नाही आणि तो आवाज (ϵ> 0.99) मानला जातो.पिवळ्या क्षेत्रामध्ये अत्यंत परिवर्तनशील, पुनरुत्पादन न करता येणारे क्लस्टर वितरण आहे.जसजसे ϵ कमी होते, आवाज वाढतो.झपाट्याने वाढणाऱ्या हिरव्या भागाला कोपर म्हणतात.हा इष्टतम प्रदेश आहे.संभाव्यता t-SNE वापरली जात असली तरी, विश्वसनीय क्लस्टरिंग निश्चित करण्यासाठी प्रांतातील BC विषमता अजूनही वापरली जाऊ शकते.आकृती 6 (A आणि B) वापरून, ϵ 0.39 वर सेट करा.किमान संख्या जितकी मोठी असेल, विश्वसनीय वर्गीकरणास अनुमती देणारे ϵ पर्यंत पोहोचण्याची संभाव्यता जितकी कमी असेल आणि 135 पेक्षा जास्त मूल्य असलेले हिरवे क्षेत्र जास्त असेल. या क्षेत्राचा विस्तार सूचित करतो की कोपर शोधणे अधिक कठीण होईल किंवा गैर- अस्तित्वात
t-SNE चे पॅरामीटर्स सेट केल्यानंतर, सापडलेल्या क्लस्टरची एकूण संख्या कनेक्टिव्हिटी (A) आणि क्लस्टर (B) ला वाटप केलेल्या डेटाची टक्केवारी म्हणून वापरली जाईल.लाल बिंदू कव्हरेज आणि कनेक्टिव्हिटीचा सर्वोत्तम संयोजन दर्शवतो.पर्यावरणाशी संबंधित किमान संख्येनुसार किमान संख्या सेट केली जाते.
या लेखासाठी पूरक सामग्रीसाठी, कृपया पहा http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
क्रिएटिव्ह कॉमन्स अॅट्रिब्युशन लायसन्सच्या अटींनुसार वितरीत केलेला हा खुला प्रवेश लेख आहे.लेख कोणत्याही माध्यमात अप्रतिबंधित वापर, वितरण आणि पुनरुत्पादनास अनुमती देतो या स्थितीत मूळ कार्य योग्यरित्या उद्धृत केले आहे.
टीप: आम्‍ही तुम्‍हाला तुमचा ईमेल अॅड्रेस प्रदान करण्‍यास सांगतो जेणेकरुन तुम्‍ही पृष्‍ठावर शिफारस करणार्‍या व्‍यक्‍तीने ईमेल पहावे असे तुम्‍हाला कळेल आणि ते स्‍पॅम नाही.आम्ही कोणतेही ईमेल पत्ते कॅप्चर करणार नाही.
हा प्रश्न तुम्ही अभ्यागत आहात की नाही हे तपासण्यासाठी आणि स्वयंचलित स्पॅम सबमिशन रोखण्यासाठी वापरला जातो.
जागतिक सागरी पर्यावरण मंत्रालय जटिल समस्यांचे निराकरण करण्यासाठी दृढनिश्चय करते आणि समुदाय संरचनांचा शोध घेण्यासाठी पर्यवेक्षण न केलेले एमएल वापरते.
जागतिक सागरी पर्यावरण मंत्रालय जटिल समस्यांचे निराकरण करण्यासाठी दृढनिश्चय करते आणि समुदाय संरचनांचा शोध घेण्यासाठी पर्यवेक्षण न केलेले एमएल वापरते.

पोस्ट वेळ: जानेवारी-12-2021

पर्यावरणीय जटिलतेचे स्पष्टीकरण: पर्यवेक्षण न केलेले शिक्षण जागतिक सागरी पर्यावरणीय प्रांत निर्धारित करते