تم اقتراح طريقة تعلم غير خاضعة للرقابة لتحديد المقاطعات البيئية البحرية العالمية (المقاطعات البيئية) بناءً على بنية مجتمع العوالق وبيانات تدفق المغذيات.يمكن لطريقة المقاطعة البيئية المنهجية المتكاملة (SAGE) تحديد المقاطعات البيئية في نماذج النظام البيئي غير الخطية للغاية.من أجل التكيف مع التباين المشترك غير الغوسي للبيانات، يستخدم SAGE تضمين الجوار العشوائي (t-SNE) لتقليل الأبعاد.وبمساعدة تطبيق الضوضاء القائم على خوارزمية التجميع المكاني القائمة على الكثافة (DBSCAN)، يمكن تحديد أكثر من مائة مقاطعة بيئية.باستخدام خريطة الاتصال مع الاختلافات البيئية كمقياس للمسافة، يتم تحديد مقاطعة بيئية مجمعة قوية (AEP) بشكل موضوعي من خلال المقاطعات البيئية المتداخلة.باستخدام AEPs، تم استكشاف السيطرة على معدل إمدادات المواد الغذائية على بنية المجتمع.تعد المقاطعات البيئية وAEP فريدة من نوعها ويمكن أن تساعد في تفسير النماذج.ويمكنها أن تسهل المقارنات بين النماذج وقد تعزز فهم ورصد النظم الإيكولوجية البحرية.
المقاطعات هي مناطق يتم فيها تنظيم الجغرافيا الحيوية المعقدة على البحر أو الأرض في مناطق متماسكة وذات معنى (1).تعتبر هذه المقاطعات مهمة جدًا لمقارنة المواقع وتباينها، وتوصيف الملاحظات والمراقبة والحماية.التفاعلات المعقدة وغير الخطية التي تنتج هذه المقاطعات تجعل أساليب التعلم الآلي غير الخاضعة للرقابة (ML) مناسبة جدًا لتحديد المقاطعات بشكل موضوعي، لأن التباين في البيانات معقد وغير غاوسي.هنا، يتم اقتراح طريقة ML، والتي تحدد بشكل منهجي المقاطعات البيئية البحرية الفريدة (المقاطعات البيئية) من نموذج داروين العالمي ثلاثي الأبعاد (3D) الفيزيائي / النظام البيئي (2).يُستخدم مصطلح "فريد" للإشارة إلى أن المنطقة المحددة لا تتداخل بشكل كافٍ مع المناطق الأخرى.تُسمى هذه الطريقة طريقة المقاطعة البيئية للنظام المتكامل (SAGE).من أجل إجراء تصنيف مفيد، تحتاج طريقة الخوارزمية إلى السماح بـ (1) التصنيف العالمي و(2) التحليل متعدد المقاييس الذي يمكن تداخله/تجميعه في المكان والزمان (3).في هذا البحث، تم اقتراح طريقة SAGE لأول مرة وتمت مناقشة المقاطعات البيئية المحددة.يمكن للمقاطعات البيئية أن تعزز فهم العوامل التي تتحكم في بنية المجتمع، وتوفر رؤى مفيدة لاستراتيجيات المراقبة، وتساعد في تتبع التغيرات في النظام البيئي.
تصنف المقاطعات الأرضية عادة وفقا لأوجه التشابه في المناخ (هطول الأمطار ودرجة الحرارة)، والتربة، والغطاء النباتي، والحيوانات، وتستخدم للإدارة المساعدة، وأبحاث التنوع البيولوجي، ومكافحة الأمراض (1، 4).من الصعب تحديد المقاطعات البحرية.معظم الكائنات الحية مجهرية، ذات حدود سائلة.لونجهيرست وآخرون.(5) قدمت أحد التصنيفات العالمية الأولى لوزارة علوم المحيطات على أساس الظروف البيئية.يتضمن تعريف مقاطعات "Longhurst" هذه متغيرات مثل معدل الخلط، والتقسيم الطبقي، والإشعاع، بالإضافة إلى خبرة Longhurst الواسعة كعالم محيطات بحرية، لديه شروط مهمة أخرى للنظم البيئية البحرية.وقد تم استخدام Longhurst على نطاق واسع، على سبيل المثال، لتقييم الإنتاج الأولي وتدفقات الكربون، ومساعدة مصايد الأسماك، والتخطيط لأنشطة المراقبة في الموقع (5-9).ومن أجل تعريف المقاطعات بشكل أكثر موضوعية، تم استخدام أساليب مثل المنطق الغامض والتجميع/الإحصائيات الإقليمية غير الخاضعة للرقابة (9-14).والغرض من هذه الأساليب هو تحديد الهياكل ذات المعنى التي يمكنها تحديد المقاطعات في بيانات الرصد المتاحة.على سبيل المثال، تستخدم المقاطعات البحرية الديناميكية (12) خرائط ذاتية التنظيم لتقليل الضوضاء، وتستخدم مجموعات هرمية (قائمة على الأشجار) لتحديد منتجات الألوان البحرية المشتقة من الأقمار الصناعية الإقليمية [الكلوروفيل أ (Chl-a)، وارتفاع خط التألق المعياري و المادة العضوية الذائبة الملونة] والمجال الفيزيائي (درجة حرارة سطح البحر والملوحة والتضاريس الديناميكية المطلقة والجليد البحري).
يشكل الهيكل المجتمعي للعوالق مصدر قلق لأن بيئته لها تأثير كبير على مستويات المغذيات الأعلى وامتصاص الكربون والمناخ.ومع ذلك، لا يزال تحديد مقاطعة بيئية عالمية استنادًا إلى بنية مجتمع العوالق يمثل هدفًا صعبًا وبعيد المنال.يمكن للأقمار الصناعية ذات الألوان البحرية أن توفر نظرة ثاقبة للتصنيف الخشن للعوالق النباتية أو تقترح مزايا المجموعات الوظيفية (15)، لكنها غير قادرة حاليًا على تقديم معلومات مفصلة عن بنية المجتمع.توفر الدراسات الاستقصائية الأخيرة [مثل Tara Ocean (16)] قياسات غير مسبوقة لبنية المجتمع؛حاليًا، لا توجد سوى عمليات رصد متفرقة في الموقع على نطاق عالمي (17).حددت الدراسات السابقة إلى حد كبير "المقاطعة البيوجيوكيميائية" (12، 14، 18) بناءً على تحديد أوجه التشابه البيوكيميائية (مثل الإنتاج الأولي، والكلوريد الكلور، والضوء المتاح).هنا، يتم استخدام النموذج العددي لإخراج [داروين (2)]، ويتم تحديد المقاطعة البيئية وفقًا لبنية المجتمع وتدفق المغذيات.النموذج العددي المستخدم في هذه الدراسة له تغطية عالمية ويمكن مقارنته بالبيانات الميدانية الموجودة (17) ومجالات الاستشعار عن بعد (الملاحظة S1).تتمتع بيانات النموذج العددي المستخدمة في هذه الدراسة بميزة التغطية العالمية.يتكون النظام البيئي النموذجي من 35 نوعًا من العوالق النباتية و16 نوعًا من العوالق الحيوانية (يرجى الرجوع إلى المواد والأساليب).تتفاعل أنواع العوالق النموذجية بشكل غير خطي مع هياكل التغاير غير الغوسية، لذا فإن طرق التشخيص البسيطة ليست مناسبة لتحديد الأنماط الفريدة والمتسقة في الهياكل المجتمعية الناشئة.توفر طريقة SAGE المقدمة هنا طريقة جديدة للتحقق من مخرجات نماذج داروين المعقدة.
يمكن للقدرات التحويلية القوية لعلوم البيانات/تقنية التعلم الآلي أن تمكن الحلول النموذجية المعقدة للغاية من الكشف عن الهياكل المعقدة ولكن القوية في تباين البيانات.يتم تعريف الطريقة القوية على أنها طريقة يمكنها إعادة إنتاج النتائج بأمانة ضمن نطاق خطأ معين.حتى في الأنظمة البسيطة، قد يمثل تحديد الأنماط والإشارات القوية تحديًا.وإلى أن يتم تحديد الأساس المنطقي المؤدي إلى النمط المرصود، قد يبدو التعقيد الناشئ معقدًا/صعب الحل.العملية الأساسية لتحديد تكوين النظام البيئي هي عملية غير خطية بطبيعتها.إن وجود تفاعلات غير خطية يمكن أن يربك التصنيف القوي، لذلك من الضروري تجنب الأساليب التي تضع افتراضات قوية حول التوزيع الإحصائي الأساسي لتباين البيانات.تعد البيانات عالية الأبعاد وغير الخطية شائعة في علم المحيطات وقد يكون لها بنية تباين مع طوبولوجيا معقدة غير غاوسية.على الرغم من أن البيانات ذات بنية التغاير غير الغوسي قد تعيق التصنيف القوي، فإن طريقة SAGE جديدة لأنها مصممة لتحديد المجموعات ذات الطبولوجيا التعسفية.
الهدف من طريقة SAGE هو التحديد الموضوعي للأنماط الناشئة التي قد تساعد في زيادة الفهم البيئي.باتباع سير عمل قائم على المجموعة مشابه لـ (19)، يتم استخدام المتغيرات البيئية ومتغيرات تدفق المغذيات لتحديد المجموعة الوحيدة في البيانات، والتي تسمى المقاطعة البيئية.تعمل طريقة SAGE المقترحة في هذه الدراسة (الشكل 1) أولاً على تقليل الأبعاد من 55 إلى 11 بُعدًا عن طريق جمع المجموعات الوظيفية للعوالق المحددة مسبقًا (انظر المواد والأساليب).باستخدام طريقة تضمين الجوار العشوائي (t-SNE)، يتم تقليل الحجم بشكل أكبر من خلال إسقاط الاحتمالية في الفضاء ثلاثي الأبعاد.يمكن للتجمعات غير الخاضعة للرقابة تحديد المناطق القريبة بيئيًا [التجميع المكاني القائم على الكثافة (DBSCAN) للتطبيقات القائمة على الضوضاء].ينطبق كل من t-SNE وDBSCAN على بيانات النموذج العددي للنظام البيئي غير الخطي المتأصل.ثم قم بإعادة إسقاط المقاطعة البيئية الناتجة على الأرض.تم تحديد أكثر من مائة مقاطعة بيئية فريدة ومناسبة للبحث الإقليمي.من أجل النظر في نموذج النظام البيئي المتسق عالميًا، يتم استخدام طريقة SAGE لتجميع المقاطعات البيئية في مقاطعات بيئية مجمعة (AEP) لتحسين فعالية المقاطعات البيئية.يمكن تعديل مستوى التجميع (الذي يسمى "التعقيد") حسب مستوى التفاصيل المطلوبة.تحديد الحد الأدنى من التعقيد لAEP قوي.ينصب تركيز الاختيار على طريقة SAGE واستكشاف حالات AEP ذات التعقيد الأصغر لتحديد التحكم في هيكل مجتمع الطوارئ.ويمكن بعد ذلك تحليل الأنماط لتقديم رؤى بيئية.يمكن أيضًا استخدام الطريقة المقدمة هنا لمقارنة النماذج على نطاق أوسع، على سبيل المثال، من خلال تقييم مواقع المقاطعات البيئية المماثلة الموجودة في نماذج مختلفة لتسليط الضوء على الاختلافات وأوجه التشابه، وذلك لمقارنة النماذج.
(أ) رسم تخطيطي لسير العمل لتحديد المقاطعة البيئية؛باستخدام المجموع في المجموعة الوظيفية لتقليل البيانات الأصلية ذات 55 بُعدًا إلى مخرجات نموذجية ذات 11 بُعدًا، بما في ذلك الكتلة الحيوية لسبعة عوالق وظيفية/مغذية وأربعة معدلات لإمدادات المغذيات.قيمة ضئيلة ومنطقة غطاء جليدي متينة.لقد تم توحيد البيانات وتوحيدها.قم بتوفير بيانات ذات 11 بُعدًا لخوارزمية t-SNE لتسليط الضوء على مجموعات الميزات المتشابهة إحصائيًا.سوف يقوم DBSCAN بتحديد المجموعة بعناية لتعيين قيمة المعلمة.وأخيرًا، قم بعرض البيانات مرة أخرى على إسقاط خط العرض/خط الطول.يرجى ملاحظة أن هذه العملية تتكرر 10 مرات لأنه قد يتم إنشاء عشوائية طفيفة عن طريق تطبيق t-SNE.(ب) يشرح كيفية الحصول على AEP بتكرار سير العمل في (أ) 10 مرات.بالنسبة لكل من هذه التطبيقات العشرة، تم تحديد مصفوفة التباين في Bray-Curtis (BC) بين المقاطعات بناءً على الكتلة الحيوية لـ 51 نوعًا من العوالق النباتية.حدد فرق BC بين المقاطعات، من التعقيد 1 AEP إلى التعقيد الكامل 115. تم تعيين معيار BC بواسطة مقاطعة Longhurst.
تستخدم طريقة SAGE مخرجات النموذج العددي الفيزيائي/النظام البيئي ثلاثي الأبعاد العالمي لتحديد المنطقة البيئية [داروين (2)؛انظر المواد والأساليب والملاحظة S1].تتكون مكونات النظام البيئي من 35 نوعًا من العوالق النباتية و16 نوعًا من العوالق الحيوانية، مع سبع مجموعات وظيفية محددة مسبقًا: بدائيات النوى وحقيقيات النوى التي تتكيف مع البيئات منخفضة المغذيات، والكوكسيديا المغلفة بكربونات الكالسيوم، والعناصر الغذائية النيتروجينية المثبتة للنيتروجين الثقيل (عادةً ما تكون مفقودة). العناصر الغذائية الهامة)، مع غطاء سيليسي، يمكن أن تقوم بعملية التمثيل الضوئي للعوالق الأخرى ورعي السوطيات المغذية المختلطة ورعاة العوالق الحيوانية.يتراوح حجم القطر الكروي من 0.6 إلى 2500 ميكرومتر.يجسد التوزيع النموذجي لحجم العوالق النباتية والتجمع الوظيفي الخصائص العامة التي تظهر في عمليات الرصد عبر الأقمار الصناعية وفي الموقع (انظر الأشكال من S1 إلى S3).ويشير التشابه بين النموذج العددي والمحيط المرصود إلى أن المقاطعات التي يحددها النموذج قد تكون قابلة للتطبيق على المحيط الموجود في الموقع.يرجى ملاحظة أن هذا النموذج يلتقط فقط تنوعًا معينًا من العوالق النباتية، ونطاقات معينة فقط من التأثيرات الفيزيائية والكيميائية للمحيط الموجود في الموقع.يمكن لطريقة SAGE أن تمكن الناس من فهم أفضل لآلية التحكم الإقليمية للغاية لهيكل المجتمع النموذجي.
ومن خلال تضمين مجموع الكتلة الحيوية السطحية فقط (بمتوسط وقت يبلغ 20 عامًا) في كل مجموعة وظيفية من العوالق، يمكن تقليل أبعاد البيانات.بعد أن أظهرت الدراسات السابقة دورها الرئيسي في تحديد بنية المجتمع، فقد تضمنت أيضًا مصطلحات المصدر السطحي لتدفقات المغذيات (إمدادات النيتروجين والحديد والفوسفات وحمض السيليك) [على سبيل المثال (20، 21)] .يؤدي جمع المجموعات الوظيفية إلى تقليل المشكلة من 55 (51 بلانكتون و4 تدفقات مغذية) إلى 11 بُعدًا.في هذه الدراسة الأولية، نظرًا للقيود الحسابية التي تفرضها الخوارزمية، لم يتم أخذ تقلب العمق والوقت في الاعتبار.
طريقة SAGE قادرة على تحديد العلاقات المهمة بين العمليات غير الخطية والسمات الرئيسية للتفاعلات بين الكتلة الحيوية للمجموعة الوظيفية وتدفق المغذيات.لا يمكن أن يؤدي استخدام البيانات ذات 11 بُعدًا المستندة إلى أساليب التعلم عن بعد الإقليدية (مثل وسائل K) إلى الحصول على مقاطعات موثوقة وقابلة للتكرار (19، 22).وذلك لأنه لم يتم العثور على شكل غوسي في التوزيع الأساسي لتباين العناصر الأساسية التي تحدد المقاطعة البيئية.لا يمكن لوسائل K لخلايا Voronoi (الخطوط المستقيمة) الاحتفاظ بالتوزيع الأساسي غير الغوسي.
تشكل الكتلة الحيوية المكونة من سبع مجموعات وظيفية من العوالق وأربعة تدفقات مغذية ناقلًا ذو 11 بُعدًا x.لذلك، x هو حقل متجه على شبكة النموذج، حيث يمثل كل عنصر xi متجهًا ذو 11 بُعدًا محددًا على الشبكة الأفقية للنموذج.يحدد كل فهرس i نقطة شبكة على الكرة بشكل فريد، حيث (lon, lat) = (ϕi, θi).إذا كانت الكتلة الحيوية لوحدة الشبكة النموذجية أقل من 1.2×10-3 ملجم كلولتر/م3 أو إذا تجاوز معدل تغطية الجليد 70%، فسيتم استخدام سجل بيانات الكتلة الحيوية والتخلص منه.تم تسوية البيانات وتوحيدها، بحيث تكون جميع البيانات في النطاق من [0 إلى 1]، ويتم إزالة المتوسط وقياسه إلى تباين الوحدة.ويتم ذلك بحيث لا تقتصر الميزات (الكتلة الحيوية وتدفق المغذيات) على التباين في نطاق القيم المحتملة.يجب أن يلتقط التجميع علاقة التغيير من المسافة الاحتمالية الرئيسية بين المعالم بدلاً من المسافة الجغرافية.ومن خلال قياس هذه المسافات، تظهر ميزات مهمة، بينما يتم تجاهل التفاصيل غير الضرورية.من وجهة نظر بيئية، يعد هذا ضروريًا لأن بعض أنواع العوالق النباتية ذات الكتلة الحيوية القليلة قد يكون لها تأثيرات بيوجيوكيميائية أكبر، مثل تثبيت النيتروجين بواسطة البكتيريا ثنائية التغذية.عند توحيد البيانات وتطبيعها، سيتم تسليط الضوء على هذه الأنواع من المتغيرات المشتركة.
من خلال التأكيد على قرب الميزات في الفضاء عالي الأبعاد في التمثيل منخفض الأبعاد، يتم استخدام خوارزمية t-SNE لجعل المناطق المماثلة الموجودة أكثر وضوحًا.العمل السابق الذي كان يهدف إلى بناء شبكات عصبية عميقة لتطبيقات الاستشعار عن بعد استخدم t-SNE، والذي أثبت مهارته في فصل الميزات الرئيسية (23).تعد هذه خطوة ضرورية لتحديد التجميع القوي في بيانات الميزة مع تجنب الحلول غير المتقاربة (الملاحظة S2).باستخدام حبات غاوسية، يحافظ t-SNE على الخصائص الإحصائية للبيانات عن طريق تعيين كل كائن عالي الأبعاد إلى نقطة في مساحة الطور ثلاثي الأبعاد، وبالتالي ضمان أن احتمال وجود كائنات مماثلة في الاتجاهين العالي والمنخفض مرتفع في الاتجاه العالي. الفضاء البعدي (24).بالنظر إلى مجموعة من الكائنات عالية الأبعاد N x1،...،xN، تقلل خوارزمية t-SNE عن طريق تقليل تباعد Kullback-Leibler (KL) (25).يعد تباعد KL مقياسًا لمدى اختلاف التوزيع الاحتمالي عن التوزيع الاحتمالي المرجعي الثاني، ويمكنه إجراء تقييم فعال لإمكانية الارتباط بين التمثيلات منخفضة الأبعاد للميزات عالية الأبعاد.إذا كان xi هو الكائن رقم i في الفضاء ذو الأبعاد N، فإن xj هو الكائن j في الفضاء ذو الأبعاد N، وyi هو الكائن رقم i في الفضاء ذي الأبعاد المنخفضة، وyj هو الكائن j في الفضاء ذي الأبعاد المنخفضة -مساحة الأبعاد، ثم يحدد t -SNE احتمال التشابه ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2)، ولمجموعة تقليل الأبعاد q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
يوضح الشكل 2A تأثير تقليل ناقلات الكتلة الحيوية وتدفق المغذيات للتركيبة ذات 11 بُعدًا إلى ثلاثية الأبعاد.يمكن مقارنة دوافع تطبيق t-SNE مع دوافع تحليل المكون الرئيسي (PCA)، الذي يستخدم سمة التباين للتأكيد على منطقة/سمة البيانات، وبالتالي تقليل الأبعاد.تبين أن طريقة t-SNE تتفوق على طريقة PCA في توفير نتائج موثوقة وقابلة للتكرار لوزارة البيئة (انظر الملاحظة S2).قد يكون هذا بسبب أن افتراض التعامد لـ PCA غير مناسب لتحديد التفاعلات الحرجة بين الميزات التفاعلية غير الخطية للغاية، لأن PCA يركز على هياكل التغاير الخطي (26).وباستخدام بيانات الاستشعار عن بعد، لونجا وآخرون.(27) يوضح كيفية استخدام طريقة SNE لتسليط الضوء على السمات الطيفية المعقدة وغير الخطية التي تنحرف عن التوزيع الغوسي.
(أ) معدل إمداد المغذيات النموذجي، والكتلة الحيوية للمجموعة الوظيفية للعوالق النباتية والعوالق الحيوانية التي تم رسمها بواسطة خوارزمية t-SNE والملونة حسب المقاطعة باستخدام DBSCAN.تمثل كل نقطة نقطة في الفضاء عالي الأبعاد، كما هو موضح في الشكل 6ب، يتم التقاط معظم النقاط.تشير الأعمدة إلى أحجام "t-SNE" 1 و2 و3. (ب) الإسقاط الجغرافي للمقاطعة الذي عثر عليه DBSCAN على شبكة خطوط الطول والعرض للأصل.يجب اعتبار اللون كأي لون، ولكن يجب أن يتوافق مع (أ).
ترتبط النقاط الموجودة في مخطط مبعثر t-SNE في الشكل 2A على التوالي بخطوط الطول والعرض.إذا كانت النقطتان في الشكل 2أ قريبتين من بعضهما البعض، فذلك لأن كتلتهما الحيوية وتدفقات المغذيات متشابهة، وليس بسبب القرب الجغرافي.الألوان في الشكل 2A هي مجموعات تم اكتشافها باستخدام طريقة DBSCAN (28).عند البحث عن ملاحظات كثيفة، تستخدم خوارزمية DBSCAN المسافة في التمثيل ثلاثي الأبعاد بين النقاط (ϵ = 0.39؛ للحصول على معلومات حول هذا الاختيار، راجع المواد والأساليب)، وعدد النقاط المتشابهة مطلوب لتحديد المجموعة (هنا 100 نقطة، يرجى الاطلاع أعلاه).لا تقدم طريقة DBSCAN أي افتراضات حول شكل أو عدد المجموعات في البيانات، كما هو موضح أدناه:
3) بالنسبة لجميع النقاط التي تم تحديدها ضمن المسافة، كرر الخطوة 2 بشكل متكرر لتحديد حدود المجموعة.إذا كان عدد النقاط أكبر من الحد الأدنى للقيمة المحددة، فسيتم تعيينها ككتلة.
البيانات التي لا تلبي الحد الأدنى لعضو المجموعة ومقياس المسافة ϵ تعتبر "ضوضاء" ولا يتم تعيين لون لها.DBSCAN عبارة عن خوارزمية سريعة وقابلة للتطوير مع أداء O(n2) في أسوأ الحالات.بالنسبة للتحليل الحالي، فهو ليس عشوائيًا في الواقع.يتم تحديد الحد الأدنى لعدد النقاط من خلال تقييم الخبراء.بعد ضبط المسافة بعد ذلك، تكون النتيجة غير مستقرة بدرجة كافية في نطاق ≈±10.يتم تعيين هذه المسافة باستخدام الاتصال (الشكل 6A) ونسبة تغطية المحيط (الشكل 6B).يتم تعريف الاتصال على أنه العدد المركب للمجموعات وهو حساس للمعلمة ϵ.يشير انخفاض الاتصال إلى عدم كفاية التركيب، مما يؤدي إلى تجميع المناطق معًا بشكل مصطنع.يشير الاتصال العالي إلى التجهيز الزائد.من الممكن استخدام حد أدنى أعلى، ولكن إذا تجاوز الحد الأدنى كاليفورنيا، فمن المستحيل تحقيق حل موثوق.135 (لمزيد من التفاصيل، راجع المواد والأساليب).
يتم عرض المجموعات الـ 115 المحددة في الشكل 2A مرة أخرى على الأرض في الشكل 2B.يتوافق كل لون مع مجموعة متماسكة من العوامل البيوجيوكيميائية والبيئية التي حددتها DBSCAN.بمجرد تحديد المجموعات، يتم استخدام ربط كل نقطة في الشكل 2أ مع خط طول وعرض محدد لعرض المجموعات مرة أخرى على المنطقة الجغرافية.ويوضح الشكل 2ب ذلك بنفس ألوان المجموعة كما في الشكل 2أ.لا ينبغي تفسير الألوان المتشابهة على أنها تشابه بيئي، لأنه يتم تعيينها حسب الترتيب الذي يتم به اكتشاف المجموعات بواسطة الخوارزمية.
يمكن أن تكون المنطقة في الشكل 2ب مشابهة نوعيًا لمنطقة محددة في الكيمياء الفيزيائية و/أو الجيوكيميائية الحيوية للمحيط.على سبيل المثال، تكون التجمعات في المحيط الجنوبي متناظرة المنطقة، مع ظهور دوامات قليلة التغذية، ويشير التحول الحاد إلى تأثير الرياح التجارية.على سبيل المثال، في منطقة المحيط الهادئ الاستوائية، تُرى مناطق مختلفة مرتبطة بالارتفاع.
من أجل فهم البيئة البيئية للمقاطعة البيئية، تم استخدام شكل مختلف من مؤشر الفرق Bray-Curtis (BC) (29) لتقييم البيئة في المجموعة.مؤشر BC هو عبارة عن بيانات إحصائية تستخدم لقياس الفرق في بنية المجتمع بين موقعين مختلفين.ينطبق قياس BC على الكتلة الحيوية لـ 51 نوعًا من العوالق النباتية والعوالق الحيوانية BCninj = 1-2CninjSni + Snj
يشير BCninj إلى التشابه بين التركيبة ni والتركيبة nj، حيث Cninj هي القيمة الدنيا لنوع واحد من الكتلة الحيوية الموجودة في كلا التوليفتين ni وnj، ويمثل Sni مجموع كل الكتل الحيوية الموجودة في كلا التوليفتين ni وSnj.يشبه الفرق BC قياس المسافة، ولكنه يعمل في الفضاء غير الإقليدي، والذي من المرجح أن يكون أكثر ملاءمة للبيانات البيئية وتفسيرها.
بالنسبة لكل مجموعة تم تحديدها في الشكل 2ب، يمكن تقييم التشابه بين المقاطعات داخل المقاطعات وبين المقاطعات.يشير فرق BC داخل المقاطعة إلى الفرق بين متوسط قيمة المقاطعة وكل نقطة في المقاطعة.يشير الفرق بين مقاطعات كولومبيا البريطانية إلى التشابه بين مقاطعة واحدة والمقاطعات الأخرى.ويبين الشكل 3A مصفوفة BC متناظرة (0، أسود: مطابق تمامًا؛ 1، أبيض: مختلف تمامًا).يُظهر كل سطر في الرسم البياني نمطًا في البيانات.ويبين الشكل 3ب الأهمية الجغرافية لنتائج BC في الشكل 3A لكل مقاطعة.بالنسبة لمقاطعة تقع في منطقة منخفضة التغذية ومنخفضة المغذيات، يوضح الشكل 3ب أن تناظر المناطق الكبيرة حول خط الاستواء والمحيط الهندي متشابه بشكل أساسي، لكن خطوط العرض الأعلى ومناطق ارتفاع مياه القاع إلى السطح تختلف بشكل كبير.
(أ) تم تقييم درجة الفرق قبل الميلاد لكل مقاطعة بناءً على المتوسط العالمي للسطح العالمي لمدة 20 عامًا والذي يبلغ 51 عوالق.لاحظ التماثل المتوقع للقيم.(ب) الإسقاط المكاني لعمود (أو صف).بالنسبة لمقاطعة تقع في دائرة ضمورية، تم تقييم التوزيع العالمي لقياس التشابه قبل الميلاد، وتم تقييم المتوسط العالمي لمدة 20 عامًا.الأسود (BC = 0) يعني نفس المنطقة، والأبيض (BC = 1) يعني عدم وجود تشابه.
يوضح الشكل 4A الفرق في BC داخل كل مقاطعة في الشكل 2B.تم تحديده باستخدام متوسط مجموعة متوسط المساحة في المجموعة، وتحديد الاختلاف بين BC ومتوسط كل نقطة شبكة في المقاطعة، وهو يوضح أن طريقة SAGE يمكنها فصل 51 نوعًا بناءً على التشابه البيئي نوع بيانات النموذج.متوسط الاختلاف الشامل للكتلة قبل الميلاد لجميع الأنواع الـ 51 هو 0.102 ± 0.0049.
(أ، ب، د) يتم تقييم فرق BC داخل المقاطعة على أنه متوسط فرق BC بين كل مجتمع نقطة شبكة والمقاطعة المتوسطة، ولا يتم تقليل التعقيد.(2) يبلغ المتوسط العالمي لفرق BC بين المقاطعات 0.227±0.117.هذا هو معيار التصنيف القائم على الدوافع البيئية الذي اقترحه هذا العمل [الخط الأخضر في (C)].(ج) متوسط الفرق قبل الميلاد داخل المقاطعات: يمثل الخط الأسود الفرق قبل الميلاد داخل المقاطعات مع زيادة التعقيد.2σ تأتي من 10 تكرارات لعملية تحديد هوية المقاطعة البيئية.بالنسبة للتعقيد الإجمالي للمقاطعات التي اكتشفها DBSCAN، يوضح (A) أن اختلاف BC في المقاطعة هو 0.099، وتصنيف التعقيد المقترح بواسطة (C) هو 12، مما يؤدي إلى اختلاف BC قدره 0.200 في المقاطعة.كما تظهر الصورة.(د).
في الشكل 4B، يتم استخدام الكتلة الحيوية المكونة من 51 نوعًا من العوالق لتمثيل الفرق المكافئ قبل الميلاد في مقاطعة لونجهيرست.المتوسط العام لكل مقاطعة هو 0.227، والانحراف المعياري لنقاط الشبكة مع الإشارة إلى الفرق في مقاطعة كولومبيا البريطانية هو 0.046.وهذا أكبر من المجموعة المحددة في الشكل 1B.بدلاً من ذلك، وباستخدام مجموع المجموعات الوظيفية السبع، زاد متوسط الاختلاف قبل الميلاد خلال موسم BC في Longhurst إلى 0.232.
توفر خريطة المقاطعة البيئية العالمية تفاصيل معقدة عن التفاعلات البيئية الفريدة والتحسينات التي تم إجراؤها في استخدام هيكل النظام البيئي بأكمله في مقاطعة لونج هيرست.ومن المتوقع أن تقدم وزارة البيئة نظرة ثاقبة لعملية التحكم في النظام البيئي النموذجي العددي، وستساعد هذه الرؤية في استكشاف العمل الميداني.ولغرض هذا البحث لا يمكن عرض أكثر من مائة مقاطعة بشكل كامل.يقدم القسم التالي طريقة SAGE التي تلخص المقاطعات.
أحد أهداف المقاطعة هو تعزيز فهم موقع المقاطعة وإدارتها.لتحديد حالات الطوارئ، يوضح الأسلوب الموجود في الشكل 1B تداخل المقاطعات المشابهة بيئيًا.يتم تجميع المقاطعات البيئية معًا على أساس التشابه البيئي، ويسمى هذا التجميع للمقاطعات بـ AEP.قم بتعيين "التعقيد" القابل للتعديل بناءً على العدد الإجمالي للمقاطعات التي سيتم النظر فيها.يُستخدم مصطلح "التعقيد" لأنه يسمح بتعديل مستوى سمات الطوارئ.من أجل تحديد التجمعات ذات المعنى، يتم استخدام متوسط الفرق قبل الميلاد داخل المقاطعات وهو 0.227 من لونجهيرست كمعيار.تحت هذا المعيار، لم تعد المقاطعات المجمعة تعتبر مفيدة.
وكما هو مبين في الشكل 3ب، فإن المقاطعات البيئية العالمية متماسكة.وباستخدام الاختلافات بين المقاطعات في كولومبيا البريطانية، يمكن ملاحظة أن بعض التكوينات "شائعة" للغاية.مستوحاة من أساليب علم الوراثة ونظرية الرسم البياني، تُستخدم "الرسوم البيانية المتصلة" لفرز أكثر من 100 مقاطعة بناءً على المقاطعات الأكثر تشابهًا معها.يتم تحديد مقياس "الاتصال" هنا باستخدام الاختلاف بين المقاطعات في كولومبيا البريطانية (30).يمكن الإشارة هنا إلى عدد المقاطعات التي لديها مساحة أكبر للتصنيف تزيد عن 100 مقاطعة على أنها تعقيد.AEP هو منتج يصنف أكثر من 100 مقاطعة باعتبارها المقاطعات البيئية الأكثر هيمنة/الأقرب.يتم تعيين كل مقاطعة بيئية للمقاطعة البيئية المهيمنة/المرتبطة بشكل كبير والتي تكون أكثر تشابهًا معها.يسمح هذا التجميع الذي يحدده اختلاف BC باتباع نهج متداخل في التعامل مع البيئة العالمية.
يمكن أن يكون التعقيد المحدد بأي قيمة من 1 إلى التعقيد الكامل للشكل.2 أ.في حالة التعقيد الأقل، قد يتدهور AEP بسبب خطوة تقليل الأبعاد الاحتمالية (t-SNE).الانحطاط يعني أنه يمكن تعيين المقاطعات البيئية لمختلف AEPs بين التكرارات، وبالتالي تغيير المنطقة الجغرافية المغطاة.يوضح الشكل 4C انتشار الاختلافات في BC داخل المقاطعات في AEPs ذات التعقيد المتزايد عبر 10 تطبيقات (التوضيح في الشكل 1B).في الشكل 4C، 2σ (المنطقة الزرقاء) هو مقياس للتدهور في 10 تطبيقات، ويمثل الخط الأخضر معيار Longhurst.أثبتت الحقائق أن تعقيد 12 يمكن أن يبقي فرق BC في المقاطعة أقل من معيار Longhurst في جميع التطبيقات ويحافظ على تدهور صغير نسبيًا قدره 2σ.باختصار، الحد الأدنى الموصى به من التعقيد هو 12 AEPs، ومتوسط الفرق قبل الميلاد داخل المقاطعة الذي تم تقييمه باستخدام 51 نوعًا من العوالق هو 0.198 ± 0.013، كما هو موضح في الشكل 4D.باستخدام مجموع سبع مجموعات وظيفية من العوالق، يكون متوسط فرق BC داخل المقاطعة 2σ بدلاً من 0.198±0.004.توضح المقارنة بين فروق BC المحسوبة مع إجمالي الكتلة الحيوية للمجموعات الوظيفية السبع أو الكتلة الحيوية لجميع أنواع العوالق البالغ عددها 51 نوعًا أنه على الرغم من أن طريقة SAGE تنطبق على الوضع ذي الـ 51 بُعدًا، إلا أنها تنطبق على إجمالي الكتلة الحيوية للمجموعات الوظيفية السبع للتدريب.
اعتمادا على الغرض من أي بحث، يمكن النظر في مستويات مختلفة من التعقيد.قد تتطلب الدراسات الإقليمية تعقيدًا كاملاً (أي جميع المقاطعات البالغ عددها 115 مقاطعة).كمثال وللتوضيح، ضع في اعتبارك الحد الأدنى الموصى به من التعقيد وهو 12.
وكمثال على فائدة طريقة SAGE، يتم استخدام 12 AEPs بحد أدنى من التعقيد يبلغ 12 هنا لاستكشاف التحكم في بنية مجتمع الطوارئ.يوضح الشكل 5 الرؤى البيئية المجمعة بواسطة AEP (من A إلى L): في قياس العناصر المتفاعلة في ريدفيلد، يتم تنفيذ النطاق الجغرافي (الشكل 5C)، وتكوين الكتلة الحيوية للمجموعة الوظيفية (الشكل 5A) وإمدادات المغذيات (الشكل 5B) بواسطة N Zoomed.وتظهر النسبة (N:Si:P:Fe، 1:1:16:16×103).بالنسبة للوحة الأخيرة، P مضروبًا في 16 وFe مضروبًا في 16 × 103، وبالتالي فإن الرسم البياني الشريطي يعادل المتطلبات الغذائية للعوالق النباتية.
تم تصنيف المقاطعات إلى 12 منطقة AEPs من A إلى L. (A) الكتلة الحيوية (mgC/m3) للأنظمة البيئية في 12 مقاطعة.(ب) معدل تدفق المغذيات من النيتروجين غير العضوي المذاب (N)، والحديد (Fe)، والفوسفات (P) وحمض السيليك (Si) (مليمول/م3 سنويًا).يتم ضرب Fe وP بـ 16 و16×103، على التوالي، بحيث يتم توحيد الشرائط وفقًا لمتطلبات قياس العناصر الكيميائية للعوالق النباتية.(ج) لاحظ الفرق بين المناطق القطبية والأعاصير شبه الاستوائية والمناطق الموسمية/الصاعدة الرئيسية.يتم وضع علامة على محطات الرصد على النحو التالي: 1، مقاعد؛2، الوها؛3، المحطة ف؛و4، الخفافيش.
إن AEP الذي تم تحديده فريد من نوعه.هناك بعض التماثل حول خط الاستواء في المحيطين الأطلسي والهادئ، وتوجد منطقة مماثلة ولكن موسعة في المحيط الهندي.تشمل بعض AEPs الجانب الغربي من القارة المرتبط بالصعود.يعتبر التيار المحيط بالقطب الجنوبي بمثابة ميزة مناطقية كبيرة.الأعاصير شبه الاستوائية عبارة عن سلسلة معقدة من الأعاصير قليلة التغذية.في هذه المقاطعات، يكون النمط المألوف لاختلافات الكتلة الحيوية بين الدوامات قليلة التغذية التي تهيمن عليها العوالق والمناطق القطبية الغنية بالدياتومات واضحًا.
يمكن أن يكون للـ AEPs ذات الكتلة الحيوية الإجمالية للعوالق النباتية هياكل مجتمعية مختلفة جدًا وتغطي مناطق جغرافية مختلفة، مثل D وH وK، والتي لها كتلة حيوية إجمالية مماثلة للعوالق النباتية.AEP H موجود بشكل رئيسي في المحيط الهندي الاستوائي، وهناك المزيد من البكتيريا المسببة للديازوتروفيك.تم العثور على AEP D في العديد من الأحواض، ولكنه بارز بشكل خاص في المحيط الهادئ حول المناطق ذات الإنتاجية العالية حول المنطقة الاستوائية.يذكرنا شكل هذه المقاطعة الواقعة في المحيط الهادئ بقطار الأمواج الكوكبية.هناك عدد قليل من بكتيريا الديازوبكتريا في AEP D، والمزيد من المخاريط.بالمقارنة مع المقاطعتين الأخريين، يوجد AEP K فقط في مرتفعات المحيط المتجمد الشمالي، وهناك عدد أكبر من الدياتومات وعدد أقل من العوالق.ومن الجدير بالذكر أن كمية العوالق في هذه المناطق الثلاث تختلف أيضًا بشكل كبير.من بينها، تكون وفرة العوالق في AEP K منخفضة نسبيًا، في حين أن وفرة AEP D وH مرتفعة نسبيًا.لذلك، على الرغم من كتلتها الحيوية (وبالتالي تشبه Chl-a)، فإن هذه المقاطعات مختلفة تمامًا: اختبار المقاطعات المعتمد على Chl قد لا يلتقط هذه الاختلافات.
ومن الواضح أيضًا أن بعض الـ AEPs ذات الكتلة الحيوية المختلفة جدًا قد تكون متشابهة من حيث بنية مجتمع العوالق النباتية.على سبيل المثال، يكون هذا مرئيًا في AEP D وE. وهما قريبان من بعضهما البعض، وفي المحيط الهادئ، يكون AEP E قريبًا من AEPJ عالي الإنتاجية.وبالمثل، لا توجد صلة واضحة بين الكتلة الحيوية للعوالق النباتية ووفرة العوالق الحيوانية.
يمكن فهم AEP من حيث العناصر الغذائية المقدمة لهم (الشكل 5B).توجد الدياتومات فقط في الأماكن التي يوجد بها مخزون وافر من حمض السيليك.بشكل عام، كلما زاد المعروض من حمض السيليك، زادت الكتلة الحيوية للدياتومات.يمكن رؤية الدياتومات في AEP A وJ وK وL. ويتم تحديد نسبة الكتلة الحيوية للدياتوم مقارنة بالعوالق النباتية الأخرى بواسطة N وP وFe المقدمة بالنسبة لطلب الدياتوم.على سبيل المثال، AEP L تهيمن عليه الدياتومات.بالمقارنة مع العناصر الغذائية الأخرى، فإن Si لديه أعلى العرض.في المقابل، على الرغم من الإنتاجية العالية، فإن AEP J يحتوي على عدد أقل من الدياتومات وإمدادات أقل من السيليكون (كل ذلك بالنسبة إلى العناصر الغذائية الأخرى).
تتمتع بكتيريا الديازونيوم بالقدرة على تثبيت النيتروجين، ولكنها تنمو ببطء (31).وهي تتعايش مع العوالق النباتية الأخرى، حيث يكون الحديد والفوسفور مفرطين مقارنة بالطلب على المغذيات غير الديازونيوم (20، 21).تجدر الإشارة إلى أن الكتلة الحيوية الديازوتروفية مرتفعة نسبيًا، وأن المعروض من Fe وP كبير نسبيًا مقارنة بإمدادات N. وبهذه الطريقة، على الرغم من أن إجمالي الكتلة الحيوية في AEP J أعلى، فإن الكتلة الحيوية للديازونيوم في AEP H تكون أكبر من ذلك الموجود في J. يرجى ملاحظة أن AEP J وH مختلفان جغرافيًا تمامًا، وأن H يقع في المحيط الهندي الاستوائي.
إذا لم يتم تقسيم بنية النظام البيئي الفريد إلى مقاطعات، فإن الأفكار المكتسبة من النماذج الـ 12 الأقل تعقيدًا لـ AEP لن تكون واضحة تمامًا.يسهل AEP الذي تم إنشاؤه بواسطة SAGE المقارنة المتماسكة والمتزامنة للمعلومات المعقدة وعالية الأبعاد من نماذج النظام البيئي.يؤكد AEP بشكل فعال على سبب عدم كون Chl طريقة جيدة وبديلة لتحديد بنية المجتمع أو وفرة العوالق الحيوانية عند مستويات المغذيات الأعلى.التحليل التفصيلي لموضوعات البحث الجارية هو خارج نطاق هذه المقالة.توفر طريقة SAGE طريقة لاستكشاف الآليات الأخرى في النموذج والتي يسهل التعامل معها مقارنة بالعرض من نقطة إلى نقطة.
تم اقتراح طريقة SAGE للمساعدة في توضيح البيانات البيئية المعقدة للغاية من النماذج العددية الفيزيائية/الكيميائية الحيوية/النظام البيئي العالمية.يتم تحديد المقاطعة البيئية من خلال الكتلة الحيوية الإجمالية للمجموعات الوظيفية عبر العوالق، وتطبيق خوارزمية تقليل أبعاد احتمالية t-SNE والتجميع باستخدام طريقة ML غير الخاضعة للرقابة DBSCAN.يتم تطبيق نظرية الفرق / الرسم البياني قبل الميلاد بين المقاطعات لطريقة التداخل لاشتقاق AEP قوي يمكن استخدامه للتفسير العالمي.من حيث البناء، تعتبر المقاطعة البيئية و AEP فريدة من نوعها.يمكن تعديل تداخل AEP بين التعقيد الكامل للمقاطعة البيئية الأصلية والحد الأدنى الموصى به وهو 12 AEPs.يعتبر التداخل وتحديد الحد الأدنى من تعقيد AEP بمثابة خطوات أساسية، لأن احتمالية أن يؤدي t-SNE إلى تدهور AEPs بمقدار أقل من 12 تعقيدًا.تعتبر طريقة SAGE عالمية، ويتراوح تعقيدها من أكثر من 100 AEPs إلى 12. وللتبسيط، ينصب التركيز الحالي على تعقيد 12 AEPs عالمية.قد تجد الأبحاث المستقبلية، وخاصة الدراسات الإقليمية، مجموعة فرعية مكانية أصغر من المقاطعات البيئية العالمية مفيدة، ويمكن تجميعها في منطقة أصغر للاستفادة من نفس الأفكار البيئية التي تمت مناقشتها هنا.ويقدم اقتراحات حول كيفية استخدام هذه المقاطعات البيئية والأفكار المكتسبة منها لمزيد من الفهم البيئي، وتسهيل مقارنة النماذج، وربما تحسين مراقبة النظم البيئية البحرية.
تعتمد المقاطعة البيئية وAEP المحددة بواسطة طريقة SAGE على البيانات الموجودة في النموذج الرقمي.بحكم التعريف، النموذج العددي هو هيكل مبسط، يحاول التقاط جوهر النظام المستهدف، وسيكون للنماذج المختلفة توزيع مختلف للعوالق.لا يمكن للنموذج العددي المستخدم في هذه الدراسة أن يلتقط بشكل كامل بعض الأنماط المرصودة (على سبيل المثال، في تقديرات Chl للمنطقة الاستوائية والمحيط الجنوبي).يتم التقاط جزء صغير فقط من التنوع الموجود في المحيط الحقيقي، ولا يمكن حل النطاقات المتوسطة ودون المتوسطة، مما قد يؤثر على تدفق المغذيات وبنية المجتمع الأصغر حجمًا.على الرغم من هذه العيوب، فقد تبين أن AEP مفيد جدًا في المساعدة على فهم النماذج المعقدة.ومن خلال تقييم أماكن وجود مقاطعات بيئية مماثلة، يوفر برنامج AEP أداة محتملة لمقارنة النماذج الرقمية.يلتقط النموذج العددي الحالي النمط العام لتركيز العوالق النباتية للاستشعار عن بعد Chl-a وتوزيع حجم العوالق والمجموعة الوظيفية (الملاحظة S1 والشكل S1) (2، 32).
كما هو موضح في الخط الكفاف 0.1 mgChl-a/m-3، يتم تقسيم AEP إلى منطقة قليلة التغذية ومنطقة متوسطة التغذية (الشكل S1B): AEP B وC وD وE وF وG هي مناطق قليلة التغذية، والمناطق المتبقية هي يقع أعلى Chl-a.يُظهر AEP بعض المراسلات مع مقاطعة Longhurst (الشكل S3A)، على سبيل المثال، المحيط الجنوبي ومنطقة المحيط الهادئ الاستوائية.في بعض المناطق، يغطي AEP مناطق Longhurst متعددة، والعكس صحيح.وبما أن نية ترسيم حدود المقاطعات في هذه المنطقة ولونغهيرست مختلفة، فمن المتوقع أن تكون هناك اختلافات.تشير AEPs المتعددة في مقاطعة Longhurst إلى أن مناطق معينة ذات كيمياء جيولوجية حيوية مماثلة قد يكون لها هياكل بيئية مختلفة جدًا.يُظهر AEP توافقًا معينًا مع الحالات الفيزيائية، كما هو موضح باستخدام التعلم غير الخاضع للرقابة (19)، كما هو الحال في حالات ارتفاع مياه القاع إلى السطح (على سبيل المثال، المحيط الجنوبي ومنطقة المحيط الهادئ الاستوائية؛ الأشكال S3 وC وD).تشير هذه المراسلات إلى أن بنية مجتمع العوالق تتأثر بشدة بديناميكيات المحيط.في مناطق مثل شمال الأطلسي، يعبر AEP المقاطعات المادية.قد تشمل الآلية التي تسبب هذه الاختلافات عمليات مثل نقل الغبار، والتي يمكن أن تؤدي إلى برامج غذائية مختلفة تمامًا حتى في ظل الظروف المادية المماثلة.
أشارت وزارة البيئة وAEP إلى أن استخدام الكلوروفيل وحده لا يمكنه تحديد المكونات البيئية، كما أدرك مجتمع البيئة البحرية بالفعل.يظهر هذا في AEPs ذات الكتلة الحيوية المماثلة ولكن التركيب البيئي مختلف بشكل كبير (مثل D وE).في المقابل، فإن AEPs مثل D وK لها كتلة حيوية مختلفة تمامًا ولكن تكوينها البيئي متشابه.يؤكد AEP على أن العلاقة بين الكتلة الحيوية والتركيب البيئي ووفرة العوالق الحيوانية معقدة.على سبيل المثال، على الرغم من أن AEP J يبرز من حيث العوالق النباتية والكتلة الحيوية للعوالق، فإن AEP's A وL لهما كتلة حيوية مماثلة للعوالق، لكن A لديه وفرة أعلى من العوالق.يؤكد AEP على أنه لا يمكن استخدام الكتلة الحيوية للعوالق النباتية (أو Chl) للتنبؤ بالكتلة الحيوية للعوالق الحيوانية.العوالق الحيوانية هي أساس السلسلة الغذائية لمصايد الأسماك، وقد تؤدي التقديرات الأكثر دقة إلى إدارة أفضل للموارد.قد تكون أقمار الألوان البحرية المستقبلية [على سبيل المثال، PACE (العوالق والهباء الجوي والسحاب والنظام البيئي البحري)] في وضع أفضل للمساعدة في تقدير البنية المجتمعية للعوالق النباتية.يمكن أن يؤدي استخدام تنبؤ AEP إلى تسهيل تقدير العوالق الحيوانية من الفضاء.يمكن لطرق مثل SAGE، إلى جانب التقنيات الجديدة، والمزيد والمزيد من البيانات الميدانية المتاحة لاستقصاءات الحقيقة الأرضية (مثل Tara وأبحاث المتابعة)، أن تتخذ خطوة مشتركة نحو مراقبة صحة النظام البيئي عبر الأقمار الصناعية.
يوفر أسلوب SAGE طريقة ملائمة لتقييم بعض الآليات التي تتحكم في خصائص المقاطعة، مثل الكتلة الحيوية/الكلور، وصافي الإنتاج الأولي، وبنية المجتمع.على سبيل المثال، يتم تحديد الكمية النسبية للدياتومات من خلال عدم التوازن في المعروض من Si وN وP وFe بالنسبة لمتطلبات قياس العناصر المتكافئة للعوالق النباتية.وبمعدل عرض متوازن، تهيمن الدياتومات (L) على المجتمع.عندما يكون معدل العرض غير متوازن (أي أن المعروض من السيليكون أقل من الطلب على المغذيات من الدياتومات)، لا تمثل الدياتومات سوى جزء صغير من الحصة (K).عندما يتجاوز المعروض من Fe وP المعروض من N (على سبيل المثال، E وH)، فإن البكتيريا الديازوتروفية سوف تنمو بقوة.ومن خلال السياق الذي يوفره AEP، سيصبح استكشاف آليات التحكم أكثر فائدة.
تعد المقاطعة البيئية وAEP مناطق ذات هياكل مجتمعية مماثلة.يمكن اعتبار السلسلة الزمنية من موقع معين داخل مقاطعة بيئية أو AEP بمثابة نقطة مرجعية ويمكن أن تمثل المنطقة التي تغطيها المقاطعة البيئية أو AEP.توفر محطات المراقبة الميدانية طويلة المدى مثل هذه السلاسل الزمنية.وسوف تستمر مجموعات البيانات الموقعية طويلة الأجل في لعب دور لا يُحصى.من منظور مراقبة بنية المجتمع، يمكن اعتبار طريقة SAGE وسيلة للمساعدة في تحديد الموقع الأكثر فائدة للمواقع الجديدة.على سبيل المثال، السلسلة الزمنية من تقييم الموائل قليلة التغذية على المدى الطويل (ALOHA) موجودة في AEP B لمنطقة قليلة التغذية (الشكل 5C، التسمية 2).ونظرًا لأن ALOHA قريب من حدود منطقة AEP أخرى، فقد لا تمثل السلسلة الزمنية المنطقة بأكملها، كما تم اقتراحه مسبقًا (33).في نفس AEP B، تقع السلسلة الزمنية SEATS (السلسلة الزمنية لجنوب شرق آسيا) في جنوب غرب تايوان (34)، بعيدًا عن حدود AEPs الأخرى (الشكل 5C، التسمية 1)، ويمكن استخدامها كموقع أفضل للمراقبة اييب.السلسلة الزمنية BATS (دراسة السلاسل الزمنية لبرمودا الأطلسية) (الشكل 5C، التسمية 4) في AEPC قريبة جدًا من الحدود بين AEP C وF، مما يشير إلى أن مراقبة AEP C باستخدام السلاسل الزمنية BATS قد تكون مشكلة مباشرة.المحطة P في AEP J (الشكل 5C، التسمية 3) بعيدة عن حدود AEP، لذا فهي أكثر تمثيلاً.يمكن للمقاطعة البيئية وAEP المساعدة في إنشاء إطار مراقبة مناسب لتقييم التغيرات العالمية، لأن إذن المقاطعات بتقييم مكان أخذ العينات في الموقع يمكن أن يوفر رؤى أساسية.يمكن تطوير طريقة SAGE بشكل أكبر لتطبيقها على البيانات المناخية لتقييم التقلبات الموفرة للوقت.
يتم تحقيق نجاح طريقة SAGE من خلال التطبيق الدقيق لأساليب علم البيانات/تعلم الآلة والمعرفة الخاصة بالمجال.على وجه التحديد، يتم استخدام t-SNE لإجراء تقليل الأبعاد، مما يحافظ على بنية التغاير للبيانات عالية الأبعاد ويسهل تصور طوبولوجيا التغاير.يتم ترتيب البيانات في شكل خطوط وتباينات (الشكل 2A)، مما يشير إلى أن التدابير القائمة على المسافة البحتة (مثل وسائل K) ليست مناسبة لأنها تستخدم عادة توزيع أساس غوسي (دائري) (تمت مناقشته في الملاحظة S2) .تعتبر طريقة DBSCAN مناسبة لأي طوبولوجيا التغاير.طالما أنك تهتم بإعداد المعلمات، يمكن توفير تعريف موثوق.التكلفة الحسابية لخوارزمية t-SNE مرتفعة، مما يحد من تطبيقها الحالي على كمية أكبر من البيانات، مما يعني أنه من الصعب تطبيقها على الحقول العميقة أو المتغيرة بمرور الوقت.يجري العمل على قابلية التوسع لـ t-SNE.نظرًا لسهولة موازاة مسافة KL، فإن خوارزمية t-SNE تتمتع بإمكانية جيدة للتوسع في المستقبل (35).حتى الآن، هناك طرق واعدة أخرى لتقليل الأبعاد يمكنها تقليل الحجم بشكل أفضل، بما في ذلك تقنيات التقريب والإسقاط المتنوع الموحد (UMAP)، لكن التقييم في سياق بيانات المحيطات ضروري.إن معنى قابلية التوسع الأفضل هو، على سبيل المثال، تصنيف المناخات العالمية أو النماذج ذات التعقيد المختلف على طبقة مختلطة.يمكن اعتبار المناطق التي لم يتم تصنيفها بواسطة SAGE في أي مقاطعة بمثابة النقاط السوداء المتبقية في الشكل 2A.ومن الناحية الجغرافية، تقع هذه المناطق أساسًا في مناطق موسمية للغاية، مما يشير إلى أن السيطرة على المقاطعات البيئية التي تتغير بمرور الوقت ستوفر تغطية أفضل.
من أجل بناء طريقة SAGE، تم استخدام أفكار من الأنظمة المعقدة/علم البيانات، وذلك باستخدام القدرة على تحديد مجموعات من المجموعات الوظيفية (إمكانية أن تكون قريبة جدًا في مساحة ذات 11 بُعدًا) وتحديد المقاطعات.تصور هذه المقاطعات أحجامًا محددة في مساحة الطور ثلاثي الأبعاد t-SNE.وبالمثل، يمكن استخدام جزء بوانكاريه لتقييم "حجم" مساحة الحالة التي يشغلها المسار لتحديد السلوك "الطبيعي" أو "الفوضوي" (36).بالنسبة لمخرجات النموذج الثابت ذو 11 بُعدًا، يمكن تفسير الحجم المشغول بعد تحويل البيانات إلى مساحة طور ثلاثية الأبعاد بالمثل.العلاقة بين المنطقة الجغرافية والمنطقة في مساحة الطور ثلاثي الأبعاد ليست بسيطة، ولكن يمكن تفسيرها من حيث التشابه البيئي.لهذا السبب، يفضل إجراء الاختلاف BC الأكثر تقليدية.
سيعمل العمل المستقبلي على إعادة استخدام طريقة SAGE لتغيير البيانات موسميًا لتقييم التباين المكاني للمقاطعات المحددة وAEP.الهدف المستقبلي هو استخدام هذه الطريقة للمساعدة في تحديد المقاطعات التي يمكن تحديدها من خلال قياسات الأقمار الصناعية (مثل Chl-a، وانعكاس الاستشعار عن بعد، ودرجة حرارة سطح البحر).وهذا سيسمح بتقييم المكونات البيئية بالاستشعار عن بعد والرصد المرن للغاية للمقاطعات البيئية وتقلباتها.
الغرض من هذا البحث هو تقديم طريقة SAGE، التي تحدد المقاطعة البيئية من خلال هيكل مجتمع العوالق الفريد.هنا، سيتم توفير معلومات أكثر تفصيلاً حول النموذج الفيزيائي/الكيميائي الحيوي/النظام البيئي واختيار المعلمة لخوارزميات t-SNE وDBSCAN.
تأتي المكونات المادية للنموذج من تقدير دوران المحيطات والمناخ [ECCOv4;(37) تقدير الحالة العالمية الموصوف بـ (38).القرار الاسمي لتقدير الدولة هو 1/5.يتم استخدام طريقة المربعات الصغرى مع طريقة مضاعف لاغرانج للحصول على الشروط الأولية والحدية ومعلمات النموذج الداخلي المعدلة عن طريق الملاحظة، وبالتالي إنشاء نموذج الدورة العامة لمعهد ماساتشوستس للتكنولوجيا (MITgcm) (39) الحر، بعد التحسين، يمكن الحصول على النتائج يمكن تتبعها ومراقبتها.
تحتوي الكيمياء الجيولوجية الحيوية/النظام البيئي على وصف أكثر اكتمالًا (أي المعادلات وقيم المعلمات) في (2).يلتقط النموذج تداول C وN وP وSi وFe من خلال الأحواض العضوية وغير العضوية.يتضمن الإصدار المستخدم هنا 35 نوعًا من العوالق النباتية: نوعان من بدائيات النوى الدقيقة ونوعان من حقيقيات النوى الدقيقة (مناسبة للبيئات منخفضة المغذيات)، و5 أنواع من Cryptomonas sphaeroides (مع طلاء كربونات الكالسيوم)، و5 أنواع من الديازونيوم (يمكن تثبيت النيتروجين، لذلك وهي ليست محدودة) توافر النيتروجين غير العضوي المذاب)، و11 دياتومات (تشكل غطاء سيليسيًا)، و10 سوطات نباتية مختلطة (يمكنها القيام بعملية التمثيل الضوئي وأكل العوالق الأخرى) و16 العوالق الحيوانية (ترعى على العوالق الأخرى).وتسمى هذه "المجموعات الوظيفية الجيوكيميائية الحيوية" لأن لها تأثيرات مختلفة على الكيمياء الجيوكيميائية الحيوية البحرية (40، 41) وغالبًا ما تستخدم في دراسات المراقبة والنماذج.في هذا النموذج، تتكون كل مجموعة وظيفية من عدة عوالق ذات أحجام مختلفة، يتراوح قطرها الكروي من 0.6 إلى 2500 ميكرومتر.
ترتبط المعلمات التي تؤثر على نمو العوالق النباتية والرعي والغرق بالحجم، وهناك اختلافات محددة بين المجموعات الوظيفية الستة للعوالق النباتية (32).وعلى الرغم من اختلاف الأطر المادية، فقد تم استخدام نتائج مكونات العوالق الـ 51 للنموذج في عدد من الدراسات الحديثة (42-44).
من عام 1992 إلى عام 2011، استمر نموذج الاقتران الفيزيائي/البيوجيوكيميائي/النظام البيئي لمدة 20 عامًا.يتضمن ناتج النموذج الكتلة الحيوية للعوالق وتركيز المغذيات ومعدل إمداد المغذيات (DIN وPO4 وSi وFe).في هذه الدراسة، تم استخدام متوسط 20 عامًا لهذه المخرجات كمدخل للمقاطعة البيئية.Chl، تتم مقارنة توزيع الكتلة الحيوية للعوالق وتركيز المغذيات وتوزيع المجموعات الوظيفية مع ملاحظات الأقمار الصناعية والموقعية [انظر (2، 44)، الملاحظة S1 والشكل.من S1 إلى S3].
بالنسبة لطريقة SAGE، يأتي المصدر الرئيسي للعشوائية من خطوة t-SNE.العشوائية تعيق التكرار، مما يعني أن النتائج غير موثوقة.تقوم طريقة SAGE باختبار المتانة بدقة من خلال تحديد مجموعة من معلمات t-SNE وDBSCAN، والتي يمكنها تحديد المجموعات باستمرار عند تكرارها.يمكن فهم تحديد "الحيرة" لمعلمة t-SNE على أنه تحديد الدرجة التي يجب أن يحترم بها التعيين من الأبعاد العالية إلى الأبعاد المنخفضة الخصائص المحلية أو العالمية للبيانات.وصلت إلى ارتباك 400 و 300 تكرار.
بالنسبة لخوارزمية التجميع DBSCAN، يجب تحديد الحد الأدنى لحجم ومقياس المسافة لنقاط البيانات في المجموعة.يتم تحديد الحد الأدنى للعدد بتوجيه من الخبراء.تعرف هذه المعرفة ما يناسب إطار النمذجة العددية الحالي ودقة الوضوح.الحد الأدنى للرقم هو 100. ويمكن وضع قيمة دنيا أعلى (أقل من <135 قبل أن يصبح الحد الأعلى للأخضر أوسع) في الاعتبار، ولكن لا يمكن أن تحل محل طريقة التجميع القائمة على اختلاف BC.يتم استخدام درجة الاتصال (الشكل 6A) لتعيين المعلمة ϵ، والتي تفضي إلى تغطية أعلى (الشكل 6B).يتم تعريف الاتصال على أنه العدد المركب للمجموعات وهو حساس للمعلمة ϵ.يشير انخفاض الاتصال إلى عدم كفاية التركيب، مما يؤدي إلى تجميع المناطق معًا بشكل مصطنع.يشير الاتصال العالي إلى التجهيز الزائد.يمثل الإفراط في التجهيز مشكلة أيضًا، لأنه يوضح أن التخمينات العشوائية الأولية قد تؤدي إلى نتائج غير قابلة للتكرار.بين هذين النقيضين، تشير الزيادة الحادة (التي تسمى عادة "الكوع") إلى أفضل ϵ.في الشكل 6أ، ترى زيادة حادة في منطقة الهضبة (الأصفر،> 200 مجموعة)، يليها انخفاض حاد (الأخضر، 100 مجموعة)، حتى حوالي 130، محاطة بعدد قليل جدًا من المجموعات (الأزرق، <60 مجموعة) ).في ما لا يقل عن 100 منطقة زرقاء، إما أن تهيمن مجموعة واحدة على المحيط بأكمله (ϵ <0.42)، أو أن معظم المحيط غير مصنف ويعتبر ضوضاء (ϵ> 0.99).تحتوي المنطقة الصفراء على توزيع عنقودي متغير للغاية وغير قابل للتكرار.ومع انخفاض ϵ، تزداد الضوضاء.المنطقة الخضراء المتزايدة بشكل حاد تسمى الكوع.هذه هي المنطقة المثالية.على الرغم من استخدام احتمال t-SNE، لا يزال من الممكن استخدام اختلاف BC داخل المقاطعة لتحديد المجموعات الموثوقة.باستخدام الشكل 6 (A و B)، قم بتعيين ϵ إلى 0.39.كلما زاد العدد الأدنى، قل احتمال الوصول إلى ϵ الذي يسمح بتصنيف موثوق به، وكلما زادت المساحة الخضراء بقيمة أكبر من 135. ويشير توسيع هذه المنطقة إلى أنه سيكون من الصعب العثور على الكوع أو عدم وجوده. موجود.
بعد تعيين معلمات t-SNE، سيتم استخدام العدد الإجمالي للمجموعات التي تم العثور عليها كمقياس للاتصال (A) والنسبة المئوية للبيانات المخصصة للمجموعة (B).تشير النقطة الحمراء إلى أفضل مزيج من التغطية والاتصال.يتم تعيين الحد الأدنى للعدد وفقًا للحد الأدنى للعدد المتعلق بالبيئة.
للحصول على مواد تكميلية لهذه المقالة، يرجى الاطلاع على http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
هذه مقالة ذات وصول مفتوح وموزعة بموجب شروط ترخيص Creative Commons Attribution.تسمح المقالة بالاستخدام والتوزيع والاستنساخ غير المقيد في أي وسيلة بشرط الاستشهاد بالعمل الأصلي بشكل صحيح.
ملحوظة: نحن نطلب منك فقط تقديم عنوان بريدك الإلكتروني حتى يعلم الشخص الذي توصيه بالصفحة أنك تريد منه أن يرى البريد الإلكتروني وأنه ليس بريدًا عشوائيًا.لن نقوم بالتقاط أي عناوين بريد إلكتروني.
يُستخدم هذا السؤال لاختبار ما إذا كنت زائرًا أم لا، ومنع إرسال البريد العشوائي تلقائيًا.
إن وزارة البيئة البحرية العالمية مصممة على حل المشكلات المعقدة وتستخدم التعلم الآلي غير الخاضع للرقابة لاستكشاف الهياكل المجتمعية.
إن وزارة البيئة البحرية العالمية مصممة على حل المشكلات المعقدة وتستخدم التعلم الآلي غير الخاضع للرقابة لاستكشاف الهياكل المجتمعية.
وقت النشر: 12 يناير 2021