topimg

Διευκρίνιση της οικολογικής πολυπλοκότητας: η μάθηση χωρίς επίβλεψη καθορίζει την παγκόσμια θαλάσσια οικολογική επαρχία

Προτείνεται μια μέθοδος μάθησης χωρίς επίβλεψη για τον προσδιορισμό παγκόσμιων θαλάσσιων οικολογικών επαρχιών (οικολογικές επαρχίες) με βάση τη δομή της κοινότητας του πλαγκτόν και τα δεδομένα ροής θρεπτικών ουσιών.Η μέθοδος συστηματικής ολοκληρωμένης οικολογικής επαρχίας (SAGE) μπορεί να προσδιορίσει οικολογικές επαρχίες σε εξαιρετικά μη γραμμικά μοντέλα οικοσυστημάτων.Προκειμένου να προσαρμοστεί στη μη Gaussian συνδιακύμανση των δεδομένων, το SAGE χρησιμοποιεί t τυχαία ενσωμάτωση γειτόνων (t-SNE) για να μειώσει τη διάσταση.Με τη βοήθεια της εφαρμογής θορύβου που βασίζεται στον αλγόριθμο χωρικής ομαδοποίησης βάσει πυκνότητας (DBSCAN), μπορούν να αναγνωριστούν περισσότερες από εκατό οικολογικές επαρχίες.Χρησιμοποιώντας τον χάρτη συνδεσιμότητας με οικολογικές διαφορές ως μέτρο απόστασης, μια ισχυρή συγκεντρωτική οικολογική επαρχία (AEP) ορίζεται αντικειμενικά μέσω ένθετων οικολογικών επαρχιών.Χρησιμοποιώντας AEPs, διερευνήθηκε ο έλεγχος του ρυθμού παροχής θρεπτικών ουσιών στη δομή της κοινότητας.Το Eco-province και το AEP είναι μοναδικά και μπορούν να βοηθήσουν στην ερμηνεία του μοντέλου.Μπορούν να διευκολύνουν τις συγκρίσεις μεταξύ μοντέλων και μπορεί να ενισχύσουν την κατανόηση και την παρακολούθηση των θαλάσσιων οικοσυστημάτων.
Οι επαρχίες είναι περιοχές όπου η σύνθετη βιογεωγραφία στη θάλασσα ή στη στεριά είναι οργανωμένη σε συνεκτικές και ουσιαστικές περιοχές (1).Αυτές οι επαρχίες είναι πολύ σημαντικές για τη σύγκριση και την αντιπαράθεση τοποθεσιών, τον χαρακτηρισμό των παρατηρήσεων, την παρακολούθηση και την προστασία.Οι σύνθετες και μη γραμμικές αλληλεπιδράσεις που παράγουν αυτές τις επαρχίες καθιστούν τις μη εποπτευόμενες μεθόδους μηχανικής μάθησης (ML) πολύ κατάλληλες για τον αντικειμενικό προσδιορισμό των επαρχιών, επειδή η συνδιακύμανση στα δεδομένα είναι σύνθετη και μη Gaussian.Εδώ, προτείνεται μια μέθοδος ML, η οποία προσδιορίζει συστηματικά μοναδικές θαλάσσιες οικολογικές επαρχίες (οικολογικές επαρχίες) από το παγκόσμιο τρισδιάστατο (3D) φυσικό/οικοσυστημικό μοντέλο του Δαρβίνου (2).Ο όρος «μοναδική» χρησιμοποιείται για να υποδείξει ότι η προσδιοριζόμενη περιοχή δεν επικαλύπτεται επαρκώς με άλλες περιοχές.Αυτή η μέθοδος ονομάζεται μέθοδος System Integrated Ecological Province (SAGE).Προκειμένου να πραγματοποιηθεί χρήσιμη ταξινόμηση, μια μέθοδος αλγορίθμου πρέπει να επιτρέπει (i) σφαιρική ταξινόμηση και (ii) ανάλυση πολλαπλής κλίμακας που μπορεί να ενσωματωθεί/συγκεντρωθεί στο χώρο και στο χρόνο (3).Σε αυτή την έρευνα, προτάθηκε αρχικά η μέθοδος SAGE και συζητήθηκαν οι οικολογικές επαρχίες που προσδιορίστηκαν.Οι οικολογικές επαρχίες μπορούν να προωθήσουν την κατανόηση των παραγόντων που ελέγχουν τη δομή της κοινότητας, να παρέχουν χρήσιμες πληροφορίες για στρατηγικές παρακολούθησης και να βοηθήσουν στην παρακολούθηση των αλλαγών στο οικοσύστημα.
Οι χερσαίες επαρχίες ταξινομούνται συνήθως σύμφωνα με τις ομοιότητες στο κλίμα (υετός και θερμοκρασία), στο έδαφος, στη βλάστηση και στην πανίδα και χρησιμοποιούνται για βοηθητική διαχείριση, έρευνα βιοποικιλότητας και έλεγχο ασθενειών (1, 4).Οι θαλάσσιες επαρχίες είναι πιο δύσκολο να προσδιοριστούν.Οι περισσότεροι οργανισμοί είναι μικροσκοπικοί, με όρια υγρών.Longhurst et al.(5) Παρέχεται μία από τις πρώτες παγκόσμιες ταξινομήσεις του Υπουργείου Ωκεανογραφίας με βάση τις περιβαλλοντικές συνθήκες.Ο ορισμός αυτών των επαρχιών "Longhurst" περιλαμβάνει μεταβλητές όπως ο ρυθμός ανάμειξης, η διαστρωμάτωση και η ακτινοβολία, καθώς και η εκτεταμένη εμπειρία του Longhurst ως θαλάσσιου ωκεανογράφου, ο οποίος έχει άλλες σημαντικές προϋποθέσεις για τα θαλάσσια οικοσυστήματα.Το Longhurst έχει χρησιμοποιηθεί εκτενώς, για παράδειγμα, για την αξιολόγηση της πρωτογενούς παραγωγής και των ροών άνθρακα, για την ενίσχυση της αλιείας και για τον σχεδιασμό δραστηριοτήτων επιτόπιας παρατήρησης (5-9).Προκειμένου να οριστούν οι επαρχίες πιο αντικειμενικά, χρησιμοποιήθηκαν μέθοδοι όπως η ασαφής λογική και η περιφερειακή μη εποπτευόμενη ομαδοποίηση/στατιστικές (9-14).Ο σκοπός τέτοιων μεθόδων είναι να εντοπίσουν σημαντικές δομές που μπορούν να προσδιορίσουν επαρχίες στα διαθέσιμα δεδομένα παρατήρησης.Για παράδειγμα, οι δυναμικές θαλάσσιες επαρχίες (12) χρησιμοποιούν αυτοοργανωμένους χάρτες για τη μείωση του θορύβου και χρησιμοποιούν ιεραρχική (βασισμένη σε δέντρα) ομαδοποίηση για τον προσδιορισμό προϊόντων θαλάσσιου χρώματος που προέρχονται από τοπικούς δορυφόρους [χλωροφύλλη a (Chl-a), κανονικοποιημένο ύψος γραμμής φθορισμού και έγχρωμη διαλυμένη οργανική ύλη] και φυσικό πεδίο (θερμοκρασία και αλατότητα της επιφάνειας της θάλασσας, απόλυτη δυναμική τοπογραφία και θαλάσσιος πάγος).
Η κοινοτική δομή του πλαγκτόν προκαλεί ανησυχία επειδή η οικολογία του έχει μεγάλη επίδραση στα υψηλότερα επίπεδα θρεπτικών συστατικών, στην απορρόφηση του άνθρακα και στο κλίμα.Ωστόσο, εξακολουθεί να είναι ένας δύσκολος και άπιαστος στόχος ο καθορισμός μιας παγκόσμιας οικολογικής επαρχίας με βάση τη δομή της κοινότητας του πλαγκτού.Οι θαλάσσιοι έγχρωμοι δορυφόροι μπορούν δυνητικά να παρέχουν πληροφορίες για τη χονδρόκοκκη ταξινόμηση του φυτοπλαγκτού ή να προτείνουν τα πλεονεκτήματα των λειτουργικών ομάδων (15), αλλά επί του παρόντος δεν είναι σε θέση να παρέχουν λεπτομερείς πληροφορίες για τη δομή της κοινότητας.Πρόσφατες έρευνες [π.χ. Tara Ocean (16)] παρέχουν πρωτοφανείς μετρήσεις της δομής της κοινότητας.Επί του παρόντος, υπάρχουν μόνο αραιές επιτόπιες παρατηρήσεις σε παγκόσμια κλίμακα (17).Προηγούμενες μελέτες έχουν προσδιορίσει σε μεγάλο βαθμό τη «Βιογεωχημική Επαρχία» (12, 14, 18) με βάση τον προσδιορισμό των βιοχημικών ομοιοτήτων (όπως η πρωτογενής παραγωγή, το Chl και το διαθέσιμο φως).Εδώ, το αριθμητικό μοντέλο χρησιμοποιείται για την έξοδο [Darwin(2)] και η οικολογική επαρχία καθορίζεται σύμφωνα με τη δομή της κοινότητας και τη ροή των θρεπτικών ουσιών.Το αριθμητικό μοντέλο που χρησιμοποιείται σε αυτή τη μελέτη έχει παγκόσμια κάλυψη και μπορεί να συγκριθεί με υπάρχοντα δεδομένα πεδίου (17) και πεδία τηλεπισκόπησης (Σημείωση S1).Τα δεδομένα αριθμητικών μοντέλων που χρησιμοποιούνται σε αυτή τη μελέτη έχουν το πλεονέκτημα της παγκόσμιας κάλυψης.Το πρότυπο οικοσύστημα αποτελείται από 35 είδη φυτοπλαγκτού και 16 είδη ζωοπλαγκτού (παρακαλούμε ανατρέξτε στα υλικά και τις μεθόδους).Οι τύποι μοντέλων πλαγκτονίου αλληλεπιδρούν μη γραμμικά με δομές συνδιακύμανσης μη Gauss, επομένως απλές διαγνωστικές μέθοδοι δεν είναι κατάλληλες για τον εντοπισμό μοναδικών και συνεπών προτύπων σε αναδυόμενες δομές κοινότητας.Η μέθοδος SAGE που εισάγεται εδώ παρέχει έναν νέο τρόπο ελέγχου της παραγωγής πολύπλοκων μοντέλων Darwin.
Οι ισχυρές μετασχηματιστικές δυνατότητες της επιστήμης δεδομένων/τεχνολογίας ML μπορούν να επιτρέψουν σε εξαιρετικά πολύπλοκες λύσεις μοντέλων να αποκαλύψουν πολύπλοκες αλλά ισχυρές δομές στη συνδιακύμανση δεδομένων.Μια ισχυρή μέθοδος ορίζεται ως μια μέθοδος που μπορεί να αναπαράγει πιστά τα αποτελέσματα εντός ενός δεδομένου εύρους σφαλμάτων.Ακόμη και σε απλά συστήματα, ο προσδιορισμός ισχυρών μοτίβων και σημάτων μπορεί να είναι μια πρόκληση.Μέχρι να προσδιοριστεί η λογική που οδηγεί στο παρατηρούμενο μοτίβο, η αναδυόμενη πολυπλοκότητα μπορεί να φαίνεται περίπλοκη/δύσκολη επίλυση.Η βασική διαδικασία καθορισμού της σύνθεσης του οικοσυστήματος είναι μη γραμμική.Η ύπαρξη μη γραμμικών αλληλεπιδράσεων μπορεί να προκαλέσει σύγχυση στην ισχυρή ταξινόμηση, επομένως είναι απαραίτητο να αποφευχθούν μέθοδοι που κάνουν ισχυρές υποθέσεις σχετικά με τη βασική στατιστική κατανομή της συνδιακύμανσης δεδομένων.Τα υψηλών διαστάσεων και τα μη γραμμικά δεδομένα είναι κοινά στην ωκεανογραφία και μπορεί να έχουν δομή συνδιακύμανσης με σύνθετη, μη-Γκαουσιανή τοπολογία.Παρόλο που τα δεδομένα με μια μη-Gaussian δομή συνδιακύμανσης μπορεί να εμποδίσουν την ισχυρή ταξινόμηση, η μέθοδος SAGE είναι νέα επειδή έχει σχεδιαστεί για να αναγνωρίζει συστάδες με αυθαίρετες τοπολογίες.
Ο στόχος της μεθόδου SAGE είναι να προσδιορίσει αντικειμενικά τα αναδυόμενα μοτίβα που μπορούν να βοηθήσουν στην περαιτέρω οικολογική κατανόηση.Μετά από μια ροή εργασίας που βασίζεται σε ομάδες παρόμοια με (19), οι μεταβλητές οικολογικής και θρεπτικής ροής χρησιμοποιούνται για τον προσδιορισμό του μοναδικού συμπλέγματος στα δεδομένα, που ονομάζεται οικολογική επαρχία.Η μέθοδος SAGE που προτείνεται σε αυτή τη μελέτη (Εικόνα 1) μειώνει πρώτα τη διάσταση από 55 σε 11 διαστάσεις αθροίζοντας τις λειτουργικές ομάδες πλαγκτού που ορίστηκαν a priori (βλ. Υλικά και Μέθοδοι).Χρησιμοποιώντας τη μέθοδο t-random γειτονικής ενσωμάτωσης (t-SNE), το μέγεθος μειώνεται περαιτέρω προβάλλοντας την πιθανότητα στον τρισδιάστατο χώρο.Η ομαδοποίηση χωρίς επίβλεψη μπορεί να προσδιορίσει οικολογικά κοντινές περιοχές [χωρική ομαδοποίηση βάσει πυκνότητας (DBSCAN) για εφαρμογές που βασίζονται στον θόρυβο].Τόσο το t-SNE όσο και το DBSCAN ισχύουν για τα εγγενή μη γραμμικά δεδομένα αριθμητικών μοντέλων του οικοσυστήματος.Στη συνέχεια, επαναπροβολή της οικολογικής επαρχίας που προκύπτει στη γη.Έχουν εντοπιστεί περισσότερες από εκατό μοναδικές οικολογικές επαρχίες, κατάλληλες για περιφερειακή έρευνα.Προκειμένου να εξεταστεί το παγκόσμιο συνεπές μοντέλο οικοσυστήματος, η μέθοδος SAGE χρησιμοποιείται για τη συγκέντρωση των οικολογικών επαρχιών σε συγκεντρωτικές οικολογικές επαρχίες (AEP) για τη βελτίωση της αποτελεσματικότητας των οικολογικών επαρχιών.Το επίπεδο συνάθροισης (που ονομάζεται "πολυπλοκότητα") μπορεί να προσαρμοστεί στο επίπεδο λεπτομέρειας που απαιτείται.Προσδιορίστε την ελάχιστη πολυπλοκότητα ενός ισχυρού AEP.Το επίκεντρο της επιλογής είναι η μέθοδος SAGE και η διερεύνηση των περιπτώσεων AEP μικρότερης πολυπλοκότητας για τον προσδιορισμό του ελέγχου της δομής της κοινότητας έκτακτης ανάγκης.Τα μοτίβα μπορούν στη συνέχεια να αναλυθούν για να παρέχουν οικολογικές γνώσεις.Η μέθοδος που εισάγεται εδώ μπορεί επίσης να χρησιμοποιηθεί για σύγκριση μοντέλων εκτενέστερα, για παράδειγμα, με την αξιολόγηση των τοποθεσιών παρόμοιων οικολογικών επαρχιών που βρίσκονται σε διαφορετικά μοντέλα για να επισημανθούν οι διαφορές και οι ομοιότητες, ώστε να συγκριθούν μοντέλα.
(Α) Σχηματικό διάγραμμα της ροής εργασιών για τον προσδιορισμό της οικολογικής επαρχίας.χρησιμοποιώντας το άθροισμα στη λειτουργική ομάδα για τη μείωση των αρχικών δεδομένων 55 διαστάσεων σε μια έξοδο μοντέλου 11 διαστάσεων, συμπεριλαμβανομένης της βιομάζας επτά λειτουργικών/θρεπτικών πλαγκτόν και τεσσάρων ρυθμών παροχής θρεπτικών ουσιών.Αμελητέα αξία και ανθεκτική περιοχή κάλυψης πάγου.Τα δεδομένα έχουν τυποποιηθεί και τυποποιηθεί.Παρέχετε δεδομένα 11 διαστάσεων στον αλγόριθμο t-SNE για να επισημάνετε στατιστικά παρόμοιους συνδυασμούς χαρακτηριστικών.Το DBSCAN θα επιλέξει προσεκτικά το σύμπλεγμα για να ορίσει την τιμή της παραμέτρου.Τέλος, προβάλετε τα δεδομένα πίσω στην προβολή γεωγραφικού πλάτους/μήκους.Λάβετε υπόψη ότι αυτή η διαδικασία επαναλαμβάνεται 10 φορές επειδή μπορεί να δημιουργηθεί μια ελαφρά τυχαιότητα με την εφαρμογή του t-SNE.Το (Β) εξηγεί πώς να αποκτήσετε το AEP επαναλαμβάνοντας τη ροή εργασίας στο (Α) 10 φορές.Για καθεμία από αυτές τις 10 εφαρμογές, προσδιορίστηκε η μήτρα ανομοιότητας μεταξύ των επαρχιακών Bray-Curtis (BC) με βάση τη βιομάζα 51 τύπων φυτοπλαγκτού.Προσδιορίστε τη διαφορά BC μεταξύ επαρχιών, από πολυπλοκότητα 1 AEP έως πλήρη πολυπλοκότητα 115. Το σημείο αναφοράς BC ορίζεται από την επαρχία Longhurst.
Η μέθοδος SAGE χρησιμοποιεί την έξοδο του παγκόσμιου τρισδιάστατου αριθμητικού μοντέλου φυσικού/οικοσυστήματος για να ορίσει την οικολογική επαρχία [Darwin (2);βλέπε Υλικά και Μέθοδοι και Σημείωση S1].Τα συστατικά του οικοσυστήματος αποτελούνται από 35 είδη φυτοπλαγκτού και 16 είδη ζωοπλαγκτού, με επτά προκαθορισμένες λειτουργικές ομάδες: προκαρυώτες και ευκαρυώτες προσαρμοσμένους σε περιβάλλοντα χαμηλής περιεκτικότητας σε θρεπτικά συστατικά, κοκκίδια με επίστρωση ανθρακικού ασβεστίου και βαριά αζωτούχα δέσμευση θρεπτικών ουσιών Nitrogen. σημαντικά θρεπτικά συστατικά), με πυριτικό κάλυμμα, μπορούν να κάνουν άλλες φωτοσύνθεση πλαγκτού και βόσκηση μικτών θρεπτικών συστατικών μαστιγωτών και κτηνοτρόφων ζωοπλαγκτού.Το άνοιγμα μεγέθους είναι 0,6 έως 2500μm ισοδύναμη σφαιρική διάμετρος.Η κατανομή του μοντέλου του μεγέθους του φυτοπλαγκτού και της λειτουργικής ομαδοποίησης καταγράφει τα συνολικά χαρακτηριστικά που φαίνονται σε δορυφορικές και επιτόπιες παρατηρήσεις (βλ. Σχήματα S1 έως S3).Η ομοιότητα μεταξύ του αριθμητικού μοντέλου και του παρατηρούμενου ωκεανού δείχνει ότι οι επαρχίες που ορίζονται από το μοντέλο μπορεί να είναι εφαρμόσιμες στον επιτόπιο ωκεανό.Λάβετε υπόψη ότι αυτό το μοντέλο συλλαμβάνει μόνο ορισμένη ποικιλία φυτοπλαγκτού και μόνο ορισμένες φυσικές και χημικές περιοχές εξαναγκασμού του in situ ωκεανού.Η μέθοδος SAGE μπορεί να επιτρέψει στους ανθρώπους να κατανοήσουν καλύτερα τον εξαιρετικά περιφερειακό μηχανισμό ελέγχου της δομής της κοινότητας του μοντέλου.
Συμπεριλαμβάνοντας μόνο το άθροισμα της επιφανειακής βιομάζας (με μέσο χρόνο 20 ετών) σε κάθε λειτουργική ομάδα πλαγκτού, η διαστασιολόγηση των δεδομένων μπορεί να μειωθεί.Αφού προηγούμενες μελέτες έδειξαν τον βασικό τους ρόλο στον καθορισμό της δομής της κοινότητας, περιλάμβανε επίσης όρους επιφανειακής πηγής για τις ροές θρεπτικών ουσιών (παροχή αζώτου, σιδήρου, φωσφορικού και πυριτικού οξέος) [π.χ. (20, 21)] .Η άθροιση των λειτουργικών ομάδων μειώνει το πρόβλημα από 55 (51 πλαγκτόν και 4 ροές θρεπτικών ουσιών) σε 11 διαστάσεις.Σε αυτή την αρχική μελέτη, λόγω των υπολογιστικών περιορισμών που επιβάλλονται από τον αλγόριθμο, η μεταβλητότητα βάθους και χρόνου δεν ελήφθησαν υπόψη.
Η μέθοδος SAGE είναι σε θέση να προσδιορίσει σημαντικές σχέσεις μεταξύ μη γραμμικών διεργασιών και βασικών χαρακτηριστικών αλληλεπιδράσεων μεταξύ της βιομάζας της λειτουργικής ομάδας και της ροής θρεπτικών ουσιών.Η χρήση 11-διάστατων δεδομένων που βασίζονται σε μεθόδους Ευκλείδειας εξ αποστάσεως μάθησης (όπως K-means) δεν μπορεί να αποκτήσει αξιόπιστες και αναπαραγώγιμες επαρχίες (19, 22).Αυτό οφείλεται στο γεγονός ότι στη βασική κατανομή της συνδιακύμανσης των βασικών στοιχείων που καθορίζουν την οικολογική επαρχία δεν βρίσκεται γκαουσιανό σχήμα.Το Κ-μέσο των κυττάρων Voronoi (ευθείες γραμμές) δεν μπορεί να διατηρήσει τη μη-Gaussian βασική κατανομή.
Η βιομάζα επτά λειτουργικών ομάδων πλαγκτού και τεσσάρων θρεπτικών ροών σχηματίζουν ένα 11-διάστατο διάνυσμα x.Επομένως, το x είναι ένα διανυσματικό πεδίο στο πλέγμα του μοντέλου, όπου κάθε στοιχείο xi αντιπροσωπεύει ένα διάνυσμα 11 διαστάσεων που ορίζεται στο οριζόντιο πλέγμα του μοντέλου.Κάθε δείκτης i προσδιορίζει μοναδικά ένα σημείο πλέγματος στη σφαίρα, όπου (lon, lat) = (φi, θi).Εάν η βιομάζα της μονάδας πλέγματος μοντέλου είναι μικρότερη από 1,2×10-3mg Chl/m3 ή ο ρυθμός κάλυψης πάγου υπερβαίνει το 70%, το αρχείο καταγραφής δεδομένων βιομάζας χρησιμοποιείται και απορρίπτεται.Τα δεδομένα κανονικοποιούνται και τυποποιούνται, επομένως όλα τα δεδομένα βρίσκονται στην περιοχή από [0 έως 1], ο μέσος όρος αφαιρείται και κλιμακώνεται σε μοναδιαία διακύμανση.Αυτό γίνεται έτσι ώστε τα χαρακτηριστικά (βιομάζα και ροή θρεπτικών ουσιών) να μην περιορίζονται από την αντίθεση στο εύρος των πιθανών τιμών.Η ομαδοποίηση θα πρέπει να συλλαμβάνει τη σχέση αλλαγής από τη βασική απόσταση πιθανότητας μεταξύ των χαρακτηριστικών και όχι από τη γεωγραφική απόσταση.Με την ποσοτικοποίηση αυτών των αποστάσεων, αναδεικνύονται σημαντικά χαρακτηριστικά, ενώ οι περιττές λεπτομέρειες απορρίπτονται.Από οικολογική άποψη, αυτό είναι απαραίτητο γιατί ορισμένοι τύποι φυτοπλαγκτού με μικρή βιομάζα μπορεί να έχουν μεγαλύτερες βιογεωχημικές επιδράσεις, όπως η δέσμευση αζώτου από διαζωτροφικά βακτήρια.Κατά την τυποποίηση και την κανονικοποίηση δεδομένων, αυτοί οι τύποι συμμεταβλητών θα επισημαίνονται.
Δίνοντας έμφαση στην εγγύτητα των χαρακτηριστικών σε χώρο υψηλών διαστάσεων σε αναπαράσταση χαμηλών διαστάσεων, ο αλγόριθμος t-SNE χρησιμοποιείται για να κάνει πιο σαφείς υπάρχουσες παρόμοιες περιοχές.Προηγούμενες εργασίες που στόχευαν στη δημιουργία βαθιάς νευρωνικών δικτύων για εφαρμογές τηλεπισκόπησης χρησιμοποιούσαν το t-SNE, το οποίο απέδειξε την ικανότητά του να διαχωρίζει βασικά χαρακτηριστικά (23).Αυτό είναι ένα απαραίτητο βήμα για τον εντοπισμό ισχυρής ομαδοποίησης στα δεδομένα χαρακτηριστικών, αποφεύγοντας παράλληλα μη συγκλίνουσες λύσεις (σημείωση S2).Χρησιμοποιώντας πυρήνες Gauss, το t-SNE διατηρεί τις στατιστικές ιδιότητες των δεδομένων χαρτογραφώντας κάθε αντικείμενο υψηλής διάστασης σε ένα σημείο του χώρου φάσης 3D, διασφαλίζοντας έτσι ότι η πιθανότητα παρόμοιων αντικειμένων στις υψηλές και χαμηλές κατευθύνσεις είναι υψηλή σε υψηλό διαστασιακός χώρος (24).Δεδομένου ενός συνόλου N αντικειμένων υψηλών διαστάσεων x1,…,xN, ο αλγόριθμος t-SNE μειώνεται ελαχιστοποιώντας την απόκλιση Kullback-Leibler (KL) (25).Η απόκλιση KL είναι ένα μέτρο του πόσο διαφορετική είναι μια κατανομή πιθανότητας από μια δεύτερη κατανομή πιθανότητας αναφοράς και μπορεί να αξιολογήσει αποτελεσματικά τη δυνατότητα συσχέτισης μεταξύ αναπαραστάσεων χαμηλών διαστάσεων χαρακτηριστικών υψηλών διαστάσεων.Αν το xi είναι το i-ο αντικείμενο στον Ν-διάστατο χώρο, το xj είναι το j-ο αντικείμενο στον Ν-διάστατο χώρο, το yi είναι το i-ο αντικείμενο σε χώρο χαμηλών διαστάσεων και το yj είναι το j-ο αντικείμενο στο χαμηλό -διάστατος χώρος, τότε ο t -SNE ορίζει την πιθανότητα ομοιότητας ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), και για το σύνολο μείωσης διαστάσεων q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Το Σχήμα 2Α απεικονίζει το αποτέλεσμα της μείωσης των φορέων ροής βιομάζας και θρεπτικών ουσιών του συνδυασμού 11 διαστάσεων σε 3D.Το κίνητρο εφαρμογής του t-SNE μπορεί να συγκριθεί με το κίνητρο της ανάλυσης κύριου συστατικού (PCA), το οποίο χρησιμοποιεί το χαρακτηριστικό διακύμανσης για να τονίσει την περιοχή/χαρακτηριστικό των δεδομένων, μειώνοντας έτσι τη διάσταση.Η μέθοδος t-SNE διαπιστώθηκε ότι είναι ανώτερη από την PCA όσον αφορά την παροχή αξιόπιστων και αναπαραγώγιμων αποτελεσμάτων για το Οικολογικό Υπουργείο (βλ. Σημείωση S2).Αυτό μπορεί να οφείλεται στο ότι η υπόθεση της ορθογωνικότητας του PCA δεν είναι κατάλληλη για τον προσδιορισμό κρίσιμων αλληλεπιδράσεων μεταξύ εξαιρετικά μη γραμμικών διαδραστικών χαρακτηριστικών, επειδή το PCA εστιάζει σε δομές γραμμικής συνδιακύμανσης (26).Χρησιμοποιώντας δεδομένα τηλεπισκόπησης, οι Lunga et al.Το (27) επεξηγεί τον τρόπο χρήσης της μεθόδου SNE για την επισήμανση πολύπλοκων και μη γραμμικών φασματικών χαρακτηριστικών που αποκλίνουν από την κατανομή Gauss.
(Α) Ένας μοντελοποιημένος ρυθμός παροχής θρεπτικών ουσιών, βιομάζας λειτουργικής ομάδας φυτοπλαγκτού και ζωοπλαγκτού που σχεδιάστηκε από τον αλγόριθμο t-SNE και χρωματίστηκε ανά επαρχία χρησιμοποιώντας DBSCAN.Κάθε σημείο αντιπροσωπεύει ένα σημείο στον χώρο υψηλών διαστάσεων, όπως φαίνεται στο Σχήμα 6Β, τα περισσότερα σημεία συλλαμβάνονται.Οι άξονες αναφέρονται στα μεγέθη "t-SNE" 1, 2 και 3. (Β) Η γεωγραφική προβολή της επαρχίας που βρέθηκε από το DBSCAN στο πλέγμα γεωγραφικού μήκους της προέλευσης.Το χρώμα πρέπει να θεωρείται ως οποιοδήποτε χρώμα, αλλά πρέπει να αντιστοιχεί στο (Α).
Τα σημεία στο διάγραμμα διασποράς t-SNE στο Σχήμα 2Α σχετίζονται αντίστοιχα με το γεωγραφικό πλάτος και το γεωγραφικό μήκος.Εάν τα δύο σημεία στο Σχήμα 2Α είναι κοντά το ένα στο άλλο, αυτό οφείλεται στο ότι η βιομάζα και οι ροές θρεπτικών ουσιών τους είναι παρόμοιες, όχι λόγω γεωγραφικής εγγύτητας.Τα χρώματα στο Σχήμα 2Α είναι ομάδες που ανακαλύφθηκαν χρησιμοποιώντας τη μέθοδο DBSCAN (28).Όταν ψάχνετε για πυκνές παρατηρήσεις, ο αλγόριθμος DBSCAN χρησιμοποιεί την απόσταση στην τρισδιάστατη αναπαράσταση μεταξύ των σημείων (ε = 0,39· για πληροφορίες σχετικά με αυτήν την επιλογή, βλ. Υλικά και Μέθοδοι), και ο αριθμός παρόμοιων σημείων απαιτείται για τον ορισμό του συμπλέγματος (εδώ 100 βαθμοί, δείτε παραπάνω).Η μέθοδος DBSCAN δεν κάνει υποθέσεις σχετικά με το σχήμα ή τον αριθμό των συμπλεγμάτων στα δεδομένα, όπως φαίνεται παρακάτω:
3) Για όλα τα σημεία που προσδιορίζονται εντός της απόστασης, επαναλάβετε το βήμα 2 επαναληπτικά για να προσδιορίσετε το όριο του συμπλέγματος.Εάν ο αριθμός των σημείων είναι μεγαλύτερος από την καθορισμένη ελάχιστη τιμή, ορίζεται ως σύμπλεγμα.
Τα δεδομένα που δεν πληρούν την ελάχιστη μετρική ϵ μέλους συμπλέγματος και απόστασης θεωρούνται "θόρυβος" και δεν τους εκχωρείται χρώμα.Ο DBSCAN είναι ένας γρήγορος και επεκτάσιμος αλγόριθμος με απόδοση O(n2) στη χειρότερη περίπτωση.Για την τρέχουσα ανάλυση, δεν είναι στην πραγματικότητα τυχαία.Ο ελάχιστος αριθμός βαθμών καθορίζεται από την αξιολόγηση εμπειρογνωμόνων.Μετά τη ρύθμιση της απόστασης μετά, το αποτέλεσμα δεν είναι αρκετά σταθερό στην περιοχή ≈±10.Αυτή η απόσταση ορίζεται χρησιμοποιώντας συνδεσιμότητα (Εικόνα 6Α) και ποσοστό κάλυψης ωκεανού (Εικόνα 6Β).Η συνδεσιμότητα ορίζεται ως ο σύνθετος αριθμός συμπλεγμάτων και είναι ευαίσθητη στην παράμετρο ϵ.Η χαμηλότερη συνδεσιμότητα υποδηλώνει ανεπαρκή προσαρμογή, τεχνητή ομαδοποίηση περιοχών μαζί.Η υψηλή συνδεσιμότητα υποδηλώνει υπερβολική τοποθέτηση.Είναι δυνατό να χρησιμοποιηθεί ένα υψηλότερο ελάχιστο, αλλά εάν το ελάχιστο υπερβαίνει το ca, είναι αδύνατο να επιτευχθεί μια αξιόπιστη λύση.135 (Για περισσότερες λεπτομέρειες, βλ. Υλικά και Μέθοδοι).
Τα 115 σμήνη που προσδιορίζονται στο Σχήμα 2Α προβάλλονται πίσω στη γη στο Σχήμα 2Β.Κάθε χρώμα αντιστοιχεί σε έναν συνεκτικό συνδυασμό βιογεωχημικών και οικολογικών παραγόντων που προσδιορίζονται από το DBSCAN.Μόλις καθοριστούν οι συστάδες, ο συσχετισμός κάθε σημείου στο Σχήμα 2Α με ένα συγκεκριμένο γεωγραφικό πλάτος και μήκος χρησιμοποιείται για την προβολή των συστάδων πίσω στη γεωγραφική περιοχή.Το Σχήμα 2Β το απεικονίζει με τα ίδια χρώματα συμπλέγματος όπως το Σχήμα 2Α.Παρόμοια χρώματα δεν πρέπει να ερμηνεύονται ως οικολογική ομοιότητα, επειδή αντιστοιχίζονται με τη σειρά με την οποία ανακαλύπτονται οι συστάδες από τον αλγόριθμο.
Η περιοχή στο Σχήμα 2Β μπορεί να είναι ποιοτικά παρόμοια με μια καθιερωμένη περιοχή στη φυσική ή/και βιογεωχημεία του ωκεανού.Για παράδειγμα, τα σμήνη στον Νότιο Ωκεανό είναι συμμετρικά σε ζώνη, με ολιγοτροφικές δίνες να εμφανίζονται και η απότομη μετάβαση υποδηλώνει την επίδραση των εμπορικών ανέμων.Για παράδειγμα, στον ισημερινό Ειρηνικό, φαίνονται διαφορετικές περιοχές που σχετίζονται με την άνοδο.
Προκειμένου να κατανοηθεί το οικολογικό περιβάλλον της Οικολογικής Επαρχίας, χρησιμοποιήθηκε μια παραλλαγή του δείκτη διαφοράς Bray-Curtis (BC) (29) για την αξιολόγηση της οικολογίας στο σύμπλεγμα.Ο δείκτης BC είναι ένα στατιστικό στοιχείο που χρησιμοποιείται για να ποσοτικοποιήσει τη διαφορά στη δομή της κοινότητας μεταξύ δύο διαφορετικών τοποθεσιών.Η μέτρηση BC ισχύει για τη βιομάζα 51 ειδών φυτοπλαγκτού και ζωοπλαγκτού BCninj = 1-2CninjSni + Snj
Το BCninj αναφέρεται στην ομοιότητα μεταξύ του συνδυασμού ni και του συνδυασμού nj, όπου το Cninj είναι η ελάχιστη τιμή ενός μεμονωμένου τύπου βιομάζας που υπάρχει και στους δύο συνδυασμούς ni και nj, και το Sni αντιπροσωπεύει το άθροισμα όλων των βιομάζας που υπάρχουν και στους δύο συνδυασμούς ni και Snj.Η διαφορά BC είναι παρόμοια με το μέτρο της απόστασης, αλλά λειτουργεί σε μη Ευκλείδειο χώρο, ο οποίος είναι πιθανό να είναι πιο κατάλληλος για οικολογικά δεδομένα και την ερμηνεία του.
Για κάθε συστάδα που προσδιορίζεται στο Σχήμα 2Β, μπορεί να εκτιμηθεί η ομοιότητα του ενδοεπαρχιακού και του διαεπαρχιακού BC.Η διαφορά π.Χ. εντός μιας επαρχίας αναφέρεται στη διαφορά μεταξύ της μέσης αξίας της επαρχίας και κάθε σημείου στην επαρχία.Η διαφορά μεταξύ των επαρχιών π.Χ. αναφέρεται στην ομοιότητα μεταξύ μιας επαρχίας και άλλων επαρχιών.Το Σχήμα 3Α δείχνει έναν συμμετρικό πίνακα BC (0, μαύρο: απολύτως αντίστοιχο, 1, λευκό: εντελώς ανόμοιο).Κάθε γραμμή στο γράφημα δείχνει ένα μοτίβο στα δεδομένα.Το Σχήμα 3Β δείχνει τη γεωγραφική σημασία των αποτελεσμάτων του BC στο σχήμα 3Α για κάθε επαρχία.Για μια επαρχία σε μια περιοχή χαμηλής διατροφής και χαμηλής περιεκτικότητας σε θρεπτικά συστατικά, το Σχήμα 3Β δείχνει ότι η συμμετρία μεγάλων περιοχών γύρω από τον ισημερινό και τον Ινδικό Ωκεανό είναι βασικά παρόμοια, αλλά τα υψηλότερα γεωγραφικά πλάτη και οι περιοχές ανόδου είναι σημαντικά διαφορετικές.
(Α) Ο βαθμός διαφοράς BC που αξιολογήθηκε για κάθε επαρχία με βάση τον παγκόσμιο μέσο όρο της παγκόσμιας επιφάνειας 20 ετών των 51 πλαγκτόν.Σημειώστε την αναμενόμενη συμμετρία των τιμών.(Β) Η χωρική προβολή μιας στήλης (ή σειράς).Για μια επαρχία σε έναν δυστροφικό κύκλο, αξιολογήθηκε η συνολική κατανομή του μέτρου ομοιότητας BC και αξιολογήθηκε ο παγκόσμιος μέσος όρος 20 ετών.Το μαύρο (BC = 0) σημαίνει την ίδια περιοχή και το λευκό (BC = 1) σημαίνει καμία ομοιότητα.
Το Σχήμα 4Α απεικονίζει τη διαφορά στο BC σε κάθε επαρχία στο Σχήμα 2Β.Καθορισμένος χρησιμοποιώντας τον μέσο συνδυασμό της μέσης έκτασης σε μια συστάδα και προσδιορίζοντας την ανομοιότητα μεταξύ του BC και του μέσου όρου κάθε σημείου πλέγματος στην επαρχία, δείχνει ότι η μέθοδος SAGE μπορεί κάλλιστα να διαχωρίσει 51 είδη με βάση την οικολογική ομοιότητα Τύπος Μοντέλο Δεδομένων.Η συνολική μέση ανομοιότητα του συμπλέγματος BC και των 51 τύπων είναι 0,102±0,0049.
(Α, Β και Δ) Η διαφορά BC εντός της επαρχίας αξιολογείται ως η μέση διαφορά BC μεταξύ κάθε κοινότητας σημείων πλέγματος και της μέσης επαρχίας και η πολυπλοκότητα δεν μειώνεται.(2) Η συνολική μέση διαφορά μεταξύ των επαρχιακών π.Χ. είναι 0,227±0,117.Αυτό είναι το σημείο αναφοράς της ταξινόμησης βάσει οικολογικών κινήτρων που προτείνεται από αυτήν την εργασία [πράσινη γραμμή στο (C)].(Γ) Μέση ενδοεπαρχιακή διαφορά BC: Η μαύρη γραμμή αντιπροσωπεύει την ενδοεπαρχιακή διαφορά BC με αυξανόμενη πολυπλοκότητα.Το 2σ προέρχεται από 10 επαναλήψεις της διαδικασίας αναγνώρισης οικολογικής επαρχίας.Για τη συνολική πολυπλοκότητα των επαρχιών που ανακαλύφθηκε από το DBSCAN, το (A) δείχνει ότι η ανομοιότητα BC στην επαρχία είναι 0,099 και η ταξινόμηση πολυπλοκότητας που προτείνεται από το (C) είναι 12, με αποτέλεσμα μια ανομοιότητα BC 0,200 στην επαρχία.όπως δείχνει η εικόνα.(ΡΕ).
Στο Σχήμα 4Β, η βιομάζα 51 τύπων πλαγκτού χρησιμοποιείται για να αναπαραστήσει την ισοδύναμη διαφορά π.Χ. στην επαρχία Λόνγκχερστ.Ο συνολικός μέσος όρος κάθε επαρχίας είναι 0,227 και η τυπική απόκλιση των σημείων του πλέγματος σε σχέση με τη διαφορά στην επαρχία π.Χ. είναι 0,046.Αυτό είναι μεγαλύτερο από το σύμπλεγμα που προσδιορίζεται στο Σχήμα 1Β.Αντίθετα, χρησιμοποιώντας το άθροισμα των επτά λειτουργικών ομάδων, η μέση ανομοιότητα εντός της σεζόν π.Χ. στο Longhurst αυξήθηκε σε 0,232.
Ο παγκόσμιος χάρτης οικολογικής επαρχίας παρέχει περίπλοκες λεπτομέρειες για μοναδικές οικολογικές αλληλεπιδράσεις και έχουν γίνει βελτιώσεις στη χρήση ολόκληρης της δομής του οικοσυστήματος της επαρχίας Longhurst.Το Υπουργείο Οικολογίας αναμένεται να παράσχει πληροφορίες σχετικά με τη διαδικασία ελέγχου του οικοσυστήματος αριθμητικών μοντέλων και αυτή η γνώση θα βοηθήσει στην εξερεύνηση των εργασιών πεδίου.Για τους σκοπούς αυτής της έρευνας, δεν είναι δυνατόν να εμφανιστούν πλήρως περισσότερες από εκατό επαρχίες.Η επόμενη ενότητα εισάγει τη μέθοδο SAGE που συνοψίζει τις επαρχίες.
Ένας από τους σκοπούς της επαρχίας είναι να προωθήσει την κατανόηση της τοποθεσίας και της διαχείρισης της επαρχίας.Για τον προσδιορισμό των καταστάσεων έκτακτης ανάγκης, η μέθοδος στο Σχήμα 1Β απεικονίζει τη φωλεοποίηση οικολογικά παρόμοιων επαρχιών.Οι οικολογικές επαρχίες ομαδοποιούνται με βάση την οικολογική ομοιότητα και μια τέτοια ομαδοποίηση επαρχιών ονομάζεται AEP.Ορίστε μια ρυθμιζόμενη "πολυπλοκότητα" με βάση τον συνολικό αριθμό των επαρχιών που θα ληφθούν υπόψη.Ο όρος «πολυπλοκότητα» χρησιμοποιείται επειδή επιτρέπει την προσαρμογή του επιπέδου των χαρακτηριστικών έκτακτης ανάγκης.Προκειμένου να οριστούν σημαντικές συναθροίσεις, χρησιμοποιείται ως σημείο αναφοράς η μέση ενδοεπαρχιακή διαφορά BC 0,227 από το Longhurst.Κάτω από αυτό το σημείο αναφοράς, οι συνδυασμένες επαρχίες δεν θεωρούνται πλέον χρήσιμες.
Όπως φαίνεται στο Σχήμα 3Β, οι παγκόσμιες οικολογικές επαρχίες είναι συνεκτικές.Χρησιμοποιώντας δια-επαρχιακές διαφορές π.Χ., μπορεί να φανεί ότι ορισμένες διαμορφώσεις είναι πολύ «κοινές».Εμπνευσμένα από μεθόδους γενετικής και θεωρίας γραφημάτων, τα «συνδεδεμένα γραφήματα» χρησιμοποιούνται για την ταξινόμηση >100 επαρχιών με βάση τις πιο παρόμοιες επαρχίες με αυτές.Η μέτρηση «συνδεσιμότητας» εδώ καθορίζεται χρησιμοποιώντας την ανομοιότητα μεταξύ των επαρχιακών π.Χ. (30).Ο αριθμός των επαρχιών με μεγαλύτερο χώρο ταξινόμησης > 100 επαρχιών μπορεί να αναφέρεται εδώ ως πολυπλοκότητα.Το AEP είναι ένα προϊόν που κατηγοριοποιεί περισσότερες από 100 επαρχίες ως τις πιο κυρίαρχες/πλησιέστερες οικολογικές επαρχίες.Κάθε οικολογική επαρχία εκχωρείται στην κυρίαρχη/υψηλά συνδεδεμένη οικολογική επαρχία που μοιάζει περισσότερο με αυτές.Αυτή η συσσώρευση που καθορίζεται από τη διαφορά BC επιτρέπει μια ένθετη προσέγγιση στην παγκόσμια οικολογία.
Η επιλεγμένη πολυπλοκότητα μπορεί να είναι οποιαδήποτε τιμή από 1 έως την πλήρη πολυπλοκότητα του ΣΧ.2Α.Σε χαμηλότερη πολυπλοκότητα, το AEP μπορεί να εκφυλιστεί λόγω του βήματος πιθανολογικής μείωσης διαστάσεων (t-SNE).Εκφυλισμός σημαίνει ότι οι οικολογικές επαρχίες μπορούν να εκχωρηθούν σε διαφορετικά AEP μεταξύ των επαναλήψεων, αλλάζοντας έτσι τη γεωγραφική περιοχή που καλύπτεται.Το σχήμα 4Γ απεικονίζει την εξάπλωση των διαφορών BC εντός επαρχιών σε AEP αυξανόμενης πολυπλοκότητας σε 10 υλοποιήσεις (εικόνα στο Σχήμα 1Β).Στο Σχήμα 4Γ, το 2σ (μπλε περιοχή) είναι ένα μέτρο υποβάθμισης σε 10 υλοποιήσεις και η πράσινη γραμμή αντιπροσωπεύει το σημείο αναφοράς Longhurst.Τα γεγονότα έχουν αποδείξει ότι η πολυπλοκότητα του 12 μπορεί να διατηρήσει τη διαφορά BC στην επαρχία κάτω από το σημείο αναφοράς Longhurst σε όλες τις υλοποιήσεις και να διατηρήσει μια σχετικά μικρή υποβάθμιση 2σ.Συνοπτικά, η ελάχιστη συνιστώμενη πολυπλοκότητα είναι 12 AEPs και η μέση διαφορά BC εντός της επαρχίας που αξιολογήθηκε χρησιμοποιώντας 51 τύπους πλαγκτού είναι 0,198±0,013, όπως φαίνεται στο Σχήμα 4Δ.Χρησιμοποιώντας το άθροισμα επτά λειτουργικών ομάδων πλαγκτού, η μέση διαφορά BC εντός της επαρχίας είναι 2σ αντί για 0,198±0,004.Η σύγκριση μεταξύ των διαφορών BC που υπολογίστηκαν με τη συνολική βιομάζα των επτά λειτουργικών ομάδων ή τη βιομάζα και των 51 τύπων πλαγκτονίου δείχνει ότι παρόλο που η μέθοδος SAGE είναι εφαρμόσιμη στην κατάσταση των 51 διαστάσεων, είναι για τη συνολική βιομάζα των επτά λειτουργικών ομάδων Για εκπαίδευση.
Ανάλογα με τον σκοπό οποιασδήποτε έρευνας, μπορούν να ληφθούν υπόψη διαφορετικά επίπεδα πολυπλοκότητας.Οι περιφερειακές μελέτες ενδέχεται να απαιτούν πλήρη πολυπλοκότητα (δηλαδή και οι 115 επαρχίες).Ως παράδειγμα και για λόγους σαφήνειας, λάβετε υπόψη την ελάχιστη συνιστώμενη πολυπλοκότητα των 12.
Ως παράδειγμα της χρησιμότητας της μεθόδου SAGE, 12 AEP με ελάχιστη πολυπλοκότητα 12 χρησιμοποιούνται εδώ για να διερευνήσουν τον έλεγχο της δομής της κοινότητας έκτακτης ανάγκης.Το Σχήμα 5 απεικονίζει τις οικολογικές ιδέες που ομαδοποιούνται κατά AEP (από το A έως το L): Στη στοιχειομετρία Redfield, η γεωγραφική έκταση (Εικόνα 5C), η σύνθεση βιομάζας της λειτουργικής ομάδας (Εικόνα 5Α) και η παροχή θρεπτικών ουσιών (Εικόνα 5Β) εκτελούνται από το N Zoomed.Εμφανίζεται η αναλογία (N:Si:P:Fe, 1:1:16:16×103).Για το τελευταίο πλαίσιο, το P πολλαπλασιάζεται με 16 και το Fe πολλαπλασιάζεται με 16×103, επομένως το ραβδόγραμμα είναι ισοδύναμο με τις διατροφικές απαιτήσεις του φυτοπλαγκτού.
Οι επαρχίες ταξινομούνται σε 12 AEPs A έως L. (A) Βιομάζα (mgC/m3) οικοσυστημάτων σε 12 επαρχίες.(Β) Ο ρυθμός ροής θρεπτικών ουσιών διαλυμένου ανόργανου αζώτου (N), σιδήρου (Fe), φωσφορικού (P) και πυριτικού οξέος (Si) (mmol/m3 ανά έτος).Το Fe και το P πολλαπλασιάζονται επί 16 και 16×103, αντίστοιχα, έτσι ώστε οι λωρίδες να είναι τυποποιημένες στις απαιτήσεις της στοιχειομετρίας του φυτοπλαγκτού.(Γ) Σημειώστε τη διαφορά μεταξύ των πολικών περιοχών, των υποτροπικών κυκλώνων και των μεγάλων εποχιακών/ανερχόμενων περιοχών.Οι σταθμοί παρακολούθησης επισημαίνονται ως εξής: 1, ΘΕΣΕΙΣ;2, ALOHA;3, σταθμός P;και 4, Νυχτερίδες.
Η αναγνωρισμένη ΑΕΠ είναι μοναδική.Υπάρχει κάποια συμμετρία γύρω από τον ισημερινό στον Ατλαντικό και τον Ειρηνικό Ωκεανό, και μια παρόμοια αλλά διευρυμένη περιοχή υπάρχει στον Ινδικό Ωκεανό.Ορισμένα AEP αγκαλιάζουν τη δυτική πλευρά της ηπείρου που σχετίζεται με την ανάβαση.Το κυκλικό ρεύμα του Νότιου Πόλου θεωρείται ως ένα μεγάλο ζωνικό χαρακτηριστικό.Ο υποτροπικός κυκλώνας είναι μια σύνθετη σειρά ολιγοτροφικών AEP.Σε αυτές τις επαρχίες, το γνωστό μοτίβο των διαφορών βιομάζας μεταξύ ολιγοτροφικών δίνων που κυριαρχούνται από πλαγκτόν και πολικών περιοχών πλούσιων σε διάτομα είναι προφανές.
Τα AEP με πολύ παρόμοια ολική βιομάζα φυτοπλαγκτού μπορεί να έχουν πολύ διαφορετικές κοινοτικές δομές και να καλύπτουν διαφορετικές γεωγραφικές περιοχές, όπως D, H και K, που έχουν παρόμοια συνολική βιομάζα φυτοπλαγκτού.Το AEP H υπάρχει κυρίως στον ισημερινό Ινδικό Ωκεανό και υπάρχουν περισσότερα διαζοτροφικά βακτήρια.Το AEP D βρίσκεται σε πολλές λεκάνες, αλλά είναι ιδιαίτερα εμφανές στον Ειρηνικό γύρω από περιοχές υψηλής απόδοσης γύρω από την άνοδο του ισημερινού.Το σχήμα αυτής της επαρχίας του Ειρηνικού θυμίζει τρένο πλανητικών κυμάτων.Υπάρχουν λίγα διαζωβακτήρια στο AEP D και περισσότεροι κώνοι.Σε σύγκριση με τις άλλες δύο επαρχίες, το AEP K βρίσκεται μόνο στα υψίπεδα του Αρκτικού Ωκεανού και υπάρχουν περισσότερα διάτομα και λιγότερα πλαγκτόν.Αξίζει να σημειωθεί ότι η ποσότητα του πλαγκτόν σε αυτές τις τρεις περιοχές είναι επίσης πολύ διαφορετική.Μεταξύ αυτών, η αφθονία πλαγκτόν του ΑΕΠ Κ είναι σχετικά χαμηλή, ενώ αυτή των ΑΕΠ Δ και Η είναι σχετικά υψηλή.Επομένως, παρά τη βιομάζα τους (και επομένως παρόμοιες με το Chl-a), αυτές οι επαρχίες είναι αρκετά διαφορετικές: οι δοκιμές επαρχιών με βάση το Chl ενδέχεται να μην καταγράφουν αυτές τις διαφορές.
Είναι επίσης προφανές ότι ορισμένα AEPs με πολύ διαφορετική βιομάζα μπορεί να είναι παρόμοια ως προς τη δομή της κοινότητας φυτοπλαγκτού.Για παράδειγμα, αυτό είναι ορατό στο AEP D και E. Είναι κοντά το ένα στο άλλο, και στον Ειρηνικό Ωκεανό, το AEP E είναι κοντά στο εξαιρετικά παραγωγικό AEPJ.Ομοίως, δεν υπάρχει σαφής σχέση μεταξύ της βιομάζας φυτοπλαγκτού και της αφθονίας του ζωοπλαγκτού.
Το AEP μπορεί να γίνει κατανοητό ως προς τα θρεπτικά συστατικά που τους παρέχονται (Εικόνα 5Β).Διάτομα υπάρχουν μόνο όπου υπάρχει άφθονη παροχή πυριτικού οξέος.Γενικά, όσο μεγαλύτερη είναι η παροχή πυριτικού οξέος, τόσο μεγαλύτερη είναι η βιομάζα των διατόμων.Τα διάτομα μπορούν να φανούν στα AEP A, J, K και L. Η αναλογία βιομάζας διατόμων σε σχέση με άλλα φυτοπλαγκτόν καθορίζεται από τα N, P και Fe που παρέχονται σε σχέση με τη ζήτηση διατόμων.Για παράδειγμα, στο AEP L κυριαρχούν τα διάτομα.Σε σύγκριση με άλλα θρεπτικά συστατικά, το Si έχει την υψηλότερη προσφορά.Αντίθετα, παρά την υψηλότερη παραγωγικότητα, το AEP J έχει λιγότερα διάτομα και λιγότερη παροχή πυριτίου (όλα και σε σχέση με άλλα θρεπτικά συστατικά).
Τα βακτήρια Diazonium έχουν την ικανότητα να δεσμεύουν το άζωτο, αλλά αναπτύσσονται αργά (31).Συνυπάρχουν με άλλα φυτοπλαγκτόν, όπου ο σίδηρος και ο φώσφορος είναι υπερβολικοί σε σχέση με τη ζήτηση για μη διαζωνιακά θρεπτικά συστατικά (20, 21).Αξίζει να σημειωθεί ότι η διαζοτροφική βιομάζα είναι σχετικά υψηλή και η προσφορά Fe και P είναι σχετικά μεγάλη σε σχέση με την προσφορά Ν. Με αυτόν τον τρόπο, αν και η συνολική βιομάζα στο AEP J είναι υψηλότερη, η βιομάζα διαζωνίου στο AEP H είναι μεγαλύτερο από αυτό στο J. Σημειώστε ότι τα AEP J και H είναι γεωγραφικά πολύ διαφορετικά και το H βρίσκεται στον ισημερινό Ινδικό Ωκεανό.
Εάν η μοναδική δομή του οικοσυστήματος δεν χωριστεί σε επαρχίες, οι γνώσεις που αποκτήθηκαν από τα μοντέλα χαμηλότερης πολυπλοκότητας των 12 AEP δεν θα είναι τόσο σαφείς.Το AEP που δημιουργείται από το SAGE διευκολύνει τη συνεκτική και ταυτόχρονη σύγκριση πολύπλοκων και υψηλών διαστάσεων πληροφοριών από μοντέλα οικοσυστημάτων.Η AEP τονίζει αποτελεσματικά γιατί το Chl δεν είναι μια καλή και εναλλακτική μέθοδος για τον προσδιορισμό της δομής της κοινότητας ή της αφθονίας του ζωοπλαγκτού σε υψηλότερα επίπεδα θρεπτικών συστατικών.Η λεπτομερής ανάλυση των εν εξελίξει θεμάτων έρευνας ξεφεύγει από το πεδίο εφαρμογής αυτού του άρθρου.Η μέθοδος SAGE παρέχει έναν τρόπο διερεύνησης άλλων μηχανισμών στο μοντέλο που είναι ευκολότερος στον χειρισμό από την προβολή από σημείο σε σημείο.
Η μέθοδος SAGE προτείνεται για να βοηθήσει στην αποσαφήνιση εξαιρετικά πολύπλοκων οικολογικών δεδομένων από παγκόσμια φυσικά/βιογεωχημικά/οικοσυστημικά αριθμητικά μοντέλα.Η οικολογική επαρχία καθορίζεται από τη συνολική βιομάζα των λειτουργικών ομάδων διασταυρούμενου πλαγκτονίου, την εφαρμογή του αλγόριθμου μείωσης διαστάσεων πιθανότητας t-SNE και την ομαδοποίηση χρησιμοποιώντας τη μη εποπτευόμενη μέθοδο ML DBSCAN.Η δια-επαρχιακή θεωρία διαφοράς/γραφήματος BC για τη μέθοδο ένθεσης εφαρμόζεται για την εξαγωγή ενός ισχυρού AEP που μπορεί να χρησιμοποιηθεί για καθολική ερμηνεία.Κατασκευαστικά η Οικολογική Επαρχία και η ΑΕΠ είναι μοναδικές.Η ένθεση AEP μπορεί να προσαρμοστεί μεταξύ της πλήρους πολυπλοκότητας της αρχικής οικολογικής επαρχίας και του συνιστώμενου ελάχιστου ορίου των 12 AEP.Η ένθεση και ο προσδιορισμός της ελάχιστης πολυπλοκότητας του AEP θεωρούνται ως βασικά βήματα, επειδή η πιθανότητα t-SNE εκφυλίζει AEPs πολυπλοκότητας <12.Η μέθοδος SAGE είναι παγκόσμια και η πολυπλοκότητά της κυμαίνεται από> 100 AEP έως 12. Για λόγους απλότητας, η τρέχουσα εστίαση είναι στην πολυπλοκότητα 12 παγκόσμιων AEP.Η μελλοντική έρευνα, ειδικά οι περιφερειακές μελέτες, μπορεί να βρει χρήσιμο ένα μικρότερο χωρικό υποσύνολο των παγκόσμιων οικολογικών επαρχιών και μπορεί να συγκεντρωθεί σε μια μικρότερη περιοχή για να επωφεληθεί από τις ίδιες οικολογικές γνώσεις που συζητούνται εδώ.Παρέχει προτάσεις για το πώς αυτές οι οικολογικές επαρχίες και οι γνώσεις που αποκτήθηκαν από αυτές μπορούν να χρησιμοποιηθούν για περαιτέρω οικολογική κατανόηση, να διευκολύνουν τη σύγκριση μοντέλων και ενδεχομένως να βελτιώσουν την παρακολούθηση των θαλάσσιων οικοσυστημάτων.
Η οικολογική επαρχία και η ΑΕΠ που προσδιορίζονται με τη μέθοδο SAGE βασίζονται στα δεδομένα του αριθμητικού μοντέλου.Εξ ορισμού, το αριθμητικό μοντέλο είναι μια απλοποιημένη δομή, που προσπαθεί να συλλάβει την ουσία του συστήματος στόχου και διαφορετικά μοντέλα θα έχουν διαφορετική κατανομή του πλαγκτού.Το αριθμητικό μοντέλο που χρησιμοποιείται σε αυτή τη μελέτη δεν μπορεί να συλλάβει πλήρως ορισμένα από τα παρατηρούμενα μοτίβα (για παράδειγμα, στις εκτιμήσεις Chl για την περιοχή του Ισημερινού και τον Νότιο Ωκεανό).Μόνο ένα μικρό μέρος της ποικιλομορφίας στον πραγματικό ωκεανό αποτυπώνεται και οι μεσο και οι υπομεσοκλίμακες δεν μπορούν να επιλυθούν, γεγονός που μπορεί να επηρεάσει τη ροή θρεπτικών ουσιών και τη δομή της κοινότητας μικρότερης κλίμακας.Παρά αυτές τις ελλείψεις, αποδεικνύεται ότι το AEP είναι πολύ χρήσιμο για να βοηθήσει στην κατανόηση πολύπλοκων μοντέλων.Αξιολογώντας πού βρίσκονται παρόμοιες οικολογικές επαρχίες, η AEP παρέχει ένα πιθανό εργαλείο σύγκρισης αριθμητικών μοντέλων.Το τρέχον αριθμητικό μοντέλο αποτυπώνει το συνολικό μοτίβο της συγκέντρωσης του φυτοπλαγκτού Chl-a με τηλεπισκόπηση και την κατανομή του μεγέθους και της λειτουργικής ομάδας πλαγκτού (Σημείωση S1 και Εικόνα S1) (2, 32).
Όπως φαίνεται από τη γραμμή περιγράμματος 0,1 mgChl-a/m-3, το AEP χωρίζεται σε ολιγοτροφική περιοχή και μεσοτροφική περιοχή (Εικόνα S1B): Οι AEP B, C, D, E, F και G είναι ολιγοτροφικές περιοχές και οι υπόλοιπες περιοχές είναι που βρίσκεται Ανώτερη Χλ-α.Το AEP δείχνει κάποια αντιστοιχία με την επαρχία Longhurst (Εικόνα S3A), για παράδειγμα, τον Νότιο Ωκεανό και τον ισημερινό Ειρηνικό.Σε ορισμένες περιοχές, η AEP καλύπτει πολλές περιοχές Longhurst και αντίστροφα.Δεδομένου ότι η πρόθεση οριοθέτησης επαρχιών στην περιοχή αυτή και του Λόνγκχερστ είναι διαφορετική, αναμένεται ότι θα υπάρξουν διαφορές.Πολλαπλές AEPs σε μια επαρχία Longhurst δείχνουν ότι ορισμένες περιοχές με παρόμοια βιογεωχημεία μπορεί να έχουν πολύ διαφορετικές δομές οικοσυστήματος.Το AEP εμφανίζει μια ορισμένη αντιστοιχία με φυσικές καταστάσεις, όπως αποκαλύπτεται χρησιμοποιώντας μάθηση χωρίς επίβλεψη (19), όπως σε πολιτείες υψηλής ανόδου (για παράδειγμα, ο Νότιος Ωκεανός και ο ισημερινός Ειρηνικός, Εικόνα S3, C και D).Αυτές οι αντιστοιχίες δείχνουν ότι η κοινοτική δομή του πλαγκτόν επηρεάζεται έντονα από τη δυναμική των ωκεανών.Σε περιοχές όπως ο Βόρειος Ατλαντικός, η AEP διασχίζει φυσικές επαρχίες.Ο μηχανισμός που προκαλεί αυτές τις διαφορές μπορεί να περιλαμβάνει διαδικασίες όπως η μεταφορά σκόνης, η οποία μπορεί να οδηγήσει σε εντελώς διαφορετικά διατροφικά προγράμματα ακόμη και κάτω από παρόμοιες φυσικές συνθήκες.
Το Υπουργείο Οικολογίας και η ΑΕΠ επεσήμαναν ότι η χρήση του Chl από μόνη της δεν μπορεί να αναγνωρίσει οικολογικά συστατικά, όπως έχει ήδη αντιληφθεί η θαλάσσια οικολογική κοινότητα.Αυτό παρατηρείται σε AEP με παρόμοια βιομάζα αλλά σημαντικά διαφορετική οικολογική σύνθεση (όπως D και E).Αντίθετα, τα AEPs όπως το D και το K έχουν πολύ διαφορετική βιομάζα αλλά παρόμοια οικολογική σύνθεση.Η AEP τονίζει ότι η σχέση μεταξύ βιομάζας, οικολογικής σύνθεσης και αφθονίας ζωοπλαγκτόν είναι πολύπλοκη.Για παράδειγμα, αν και το AEP J ξεχωρίζει ως προς το φυτοπλαγκτόν και τη βιομάζα πλαγκτού, τα AEP και L του AEP έχουν παρόμοια βιομάζα πλαγκτόν, αλλά το Α έχει μεγαλύτερη αφθονία πλαγκτού.Η AEP τονίζει ότι η βιομάζα φυτοπλαγκτού (ή Chl) δεν μπορεί να χρησιμοποιηθεί για την πρόβλεψη της βιομάζας του ζωοπλαγκτού.Το ζωοπλαγκτόν είναι το θεμέλιο της αλιευτικής τροφικής αλυσίδας και πιο ακριβείς εκτιμήσεις μπορεί να οδηγήσουν σε καλύτερη διαχείριση των πόρων.Οι μελλοντικοί θαλάσσιοι έγχρωμοι δορυφόροι [για παράδειγμα, PACE (πλαγκτόν, αεροζόλ, σύννεφο και θαλάσσιο οικοσύστημα)] μπορεί να είναι καλύτερα τοποθετημένοι για να βοηθήσουν στην εκτίμηση της κοινοτικής δομής του φυτοπλαγκτού.Η χρήση της πρόβλεψης AEP μπορεί ενδεχομένως να διευκολύνει την εκτίμηση του ζωοπλαγκτού από το διάστημα.Μέθοδοι όπως το SAGE, σε συνδυασμό με νέες τεχνολογίες και ολοένα και περισσότερα δεδομένα πεδίου διαθέσιμα για έρευνες επίγειας αλήθειας (όπως η Tara και η περαιτέρω έρευνα), μπορούν από κοινού να κάνουν ένα βήμα προς την παρακολούθηση της υγείας των οικοσυστημάτων βάσει δορυφόρου.
Η μέθοδος SAGE παρέχει έναν βολικό τρόπο αξιολόγησης ορισμένων μηχανισμών που ελέγχουν τα χαρακτηριστικά της επαρχίας, όπως η βιομάζα/Chl, η καθαρή πρωτογενής παραγωγή και η δομή της κοινότητας.Για παράδειγμα, η σχετική ποσότητα διατόμων καθορίζεται από μια ανισορροπία στην παροχή Si, N, P και Fe σε σχέση με τις στοιχειομετρικές απαιτήσεις του φυτοπλαγκτού.Σε έναν ισορροπημένο ρυθμό προσφοράς, η κοινότητα κυριαρχείται από τα διάτομα (L).Όταν ο ρυθμός προσφοράς δεν είναι ισορροπημένος (δηλαδή, η προσφορά πυριτίου είναι χαμηλότερη από τη ζήτηση θρεπτικών συστατικών των διατόμων), τα διάτομα αντιπροσωπεύουν μόνο ένα μικρό μέρος του Μεριδίου (K).Όταν η παροχή Fe και P υπερβαίνει την παροχή Ν (για παράδειγμα, Ε και Η), τα διαζωτροφικά βακτήρια θα αναπτυχθούν έντονα.Μέσα από το πλαίσιο που παρέχει η ΑΕΠ, η διερεύνηση ελεγκτικών μηχανισμών θα γίνει πιο χρήσιμη.
Η Οικολογική Επαρχία και η ΑΕΠ είναι περιοχές με παρόμοιες κοινοτικές δομές.Οι χρονοσειρές από μια συγκεκριμένη τοποθεσία εντός μιας οικολογικής επαρχίας ή AEP μπορεί να θεωρηθεί ως σημείο αναφοράς και μπορεί να αντιπροσωπεύει την περιοχή που καλύπτεται από την οικολογική επαρχία ή AEP.Οι μακροπρόθεσμοι επιτόπιοι σταθμοί παρακολούθησης παρέχουν τέτοιες χρονοσειρές.Τα μακροπρόθεσμα in situ σύνολα δεδομένων θα συνεχίσουν να διαδραματίζουν έναν ανυπολόγιστο ρόλο.Από τη σκοπιά της παρακολούθησης της δομής της κοινότητας, η μέθοδος SAGE μπορεί να θεωρηθεί ως ένας τρόπος που βοηθά στον προσδιορισμό της πιο χρήσιμης τοποθεσίας νέων τοποθεσιών.Για παράδειγμα, η χρονοσειρά από τη μακροπρόθεσμη αξιολόγηση ολιγοτροφικών οικοτόπων (ALOHA) βρίσκεται στο ΑΕΠ Β της ολιγοτροφικής περιοχής (Εικόνα 5Γ, ετικέτα 2).Επειδή το ALOHA βρίσκεται κοντά στα όρια ενός άλλου AEP, η χρονοσειρά μπορεί να μην είναι αντιπροσωπευτική ολόκληρης της περιοχής, όπως προτάθηκε προηγουμένως (33).Στο ίδιο AEP B, η χρονοσειρά SEATS (Southeast Asian Time Series) βρίσκεται στη νοτιοδυτική Ταϊβάν (34), πιο μακριά από τα όρια άλλων AEPs (Εικόνα 5C, ετικέτα 1) και μπορεί να χρησιμοποιηθεί ως καλύτερη τοποθεσία για παρακολούθηση ΑΕΠΒ.Η χρονοσειρά BATS (Bermuda Atlantic Time Series Study) (Εικόνα 5C, ετικέτα 4) στο AEPC είναι πολύ κοντά στο όριο μεταξύ AEP C και F, γεγονός που δείχνει ότι η παρακολούθηση του AEP C χρησιμοποιώντας χρονοσειρές BATS μπορεί να είναι άμεσα προβληματική.Ο σταθμός P στο AEP J (Εικόνα 5C, ετικέτα 3) απέχει πολύ από το όριο του AEP, επομένως είναι πιο αντιπροσωπευτικός.Η Eco-Province και η AEP μπορούν να βοηθήσουν στη δημιουργία ενός πλαισίου παρακολούθησης κατάλληλου για την αξιολόγηση των παγκόσμιων αλλαγών, επειδή η άδεια των επαρχιών να αξιολογούν πού η επιτόπια δειγματοληψία μπορεί να παρέχει βασικές πληροφορίες.Η μέθοδος SAGE μπορεί να αναπτυχθεί περαιτέρω για να εφαρμοστεί σε κλιματικά δεδομένα για την αξιολόγηση της μεταβλητότητας που εξοικονομεί χρόνο.
Η επιτυχία της μεθόδου SAGE επιτυγχάνεται μέσω της προσεκτικής εφαρμογής των μεθόδων επιστήμης δεδομένων/ML και της γνώσης για συγκεκριμένο τομέα​​.Συγκεκριμένα, το t-SNE χρησιμοποιείται για την εκτέλεση μείωσης διαστάσεων, η οποία διατηρεί τη δομή συνδιακύμανσης δεδομένων υψηλών διαστάσεων και διευκολύνει την οπτικοποίηση της τοπολογίας συνδιακύμανσης.Τα δεδομένα είναι διατεταγμένα με τη μορφή λωρίδων και συνδιακυμάνσεων (Εικόνα 2Α), υποδεικνύοντας ότι τα καθαρά μέτρα που βασίζονται στην απόσταση (όπως η μέση τιμή K) δεν είναι κατάλληλα επειδή συνήθως χρησιμοποιούν μια κατανομή βάσης Gaussian (κυκλική) (συζητείται στη Σημείωση S2) .Η μέθοδος DBSCAN είναι κατάλληλη για οποιαδήποτε τοπολογία συνδιακύμανσης.Εφόσον δίνετε προσοχή στη ρύθμιση των παραμέτρων, μπορεί να παρέχεται αξιόπιστη αναγνώριση.Το υπολογιστικό κόστος του αλγόριθμου t-SNE είναι υψηλό, γεγονός που περιορίζει την τρέχουσα εφαρμογή του σε μεγαλύτερο όγκο δεδομένων, πράγμα που σημαίνει ότι είναι δύσκολο να εφαρμοστεί σε βαθιά ή χρονικά μεταβαλλόμενα πεδία.Οι εργασίες για την επεκτασιμότητα του t-SNE βρίσκονται σε εξέλιξη.Δεδομένου ότι η απόσταση KL είναι εύκολο να παραλληλιστεί, ο αλγόριθμος t-SNE έχει καλές δυνατότητες επέκτασης στο μέλλον (35).Μέχρι στιγμής, άλλες πολλά υποσχόμενες μέθοδοι μείωσης διαστάσεων που μπορούν να μειώσουν καλύτερα το μέγεθος περιλαμβάνουν τεχνικές ενοποιημένης πολλαπλής προσέγγισης και προβολής (UMAP), αλλά η αξιολόγηση στο πλαίσιο των δεδομένων των ωκεανών είναι απαραίτητη.Το νόημα της καλύτερης επεκτασιμότητας είναι, για παράδειγμα, η ταξινόμηση παγκόσμιων κλιμάτων ή μοντέλων με διαφορετική πολυπλοκότητα σε ένα μικτό στρώμα.Οι περιοχές που αποτυγχάνουν να ταξινομηθούν από το SAGE σε οποιαδήποτε επαρχία μπορούν να θεωρηθούν ως οι υπόλοιπες μαύρες κουκκίδες στο Σχήμα 2Α.Γεωγραφικά, αυτές οι περιοχές βρίσκονται κυρίως σε άκρως εποχιακές περιοχές, γεγονός που υποδηλώνει ότι η κατάληψη οικολογικών επαρχιών που αλλάζουν με την πάροδο του χρόνου θα παρέχει καλύτερη κάλυψη.
Για να κατασκευαστεί η μέθοδος SAGE, έχουν χρησιμοποιηθεί ιδέες από πολύπλοκα συστήματα/επιστήμη δεδομένων, χρησιμοποιώντας την ικανότητα προσδιορισμού συστάδων λειτουργικών ομάδων (η πιθανότητα να είναι πολύ κοντά σε έναν 11-διάστατο χώρο) και προσδιορισμού επαρχιών.Αυτές οι επαρχίες απεικονίζουν συγκεκριμένους όγκους στον τρισδιάστατο χώρο φάσης t-SNE μας.Ομοίως, το τμήμα Poincaré μπορεί να χρησιμοποιηθεί για την αξιολόγηση του «όγκου» του χώρου κατάστασης που καταλαμβάνει η τροχιά για τον προσδιορισμό της «κανονικής» ή «χαοτικής» συμπεριφοράς (36).Για τη στατική έξοδο μοντέλου 11 διαστάσεων, ο όγκος που καταλαμβάνεται μετά τη μετατροπή των δεδομένων σε χώρο φάσης 3D μπορεί να εξηγηθεί με παρόμοιο τρόπο.Η σχέση μεταξύ γεωγραφικής περιοχής και περιοχής στον τρισδιάστατο χώρο φάσης δεν είναι απλή, αλλά μπορεί να εξηγηθεί από την άποψη της οικολογικής ομοιότητας.Για το λόγο αυτό, προτιμάται το πιο συμβατικό μέτρο ανομοιότητας BC.
Μελλοντικές εργασίες θα επαναχρησιμοποιήσουν τη μέθοδο SAGE για εποχιακά μεταβαλλόμενα δεδομένα για την αξιολόγηση της χωρικής μεταβλητότητας των προσδιοριζόμενων επαρχιών και AEP.Ο μελλοντικός στόχος είναι να χρησιμοποιηθεί αυτή η μέθοδος για να καθοριστεί ποιες επαρχίες μπορούν να προσδιοριστούν μέσω δορυφορικών μετρήσεων (όπως το Chl-a, η ανακλαστικότητα της τηλεπισκόπησης και η θερμοκρασία της επιφάνειας της θάλασσας).Αυτό θα επιτρέψει την αξιολόγηση των οικολογικών στοιχείων με τηλεπισκόπηση και την εξαιρετικά ευέλικτη παρακολούθηση των οικολογικών επαρχιών και της μεταβλητότητάς τους.
Σκοπός αυτής της έρευνας είναι να εισαγάγει τη μέθοδο SAGE, η οποία ορίζει μια οικολογική επαρχία μέσω της μοναδικής δομής της κοινότητας πλαγκτού.Εδώ, θα δοθούν αναλυτικότερες πληροφορίες σχετικά με το φυσικό/βιογεωχημικό/οικοσυστημικό μοντέλο και την επιλογή παραμέτρων των αλγορίθμων t-SNE και DBSCAN.
Τα φυσικά στοιχεία του μοντέλου προέρχονται από την εκτίμηση της ωκεάνιας κυκλοφορίας και του κλίματος [ECCOv4;(37) η συνολική εκτίμηση κατάστασης που περιγράφεται από τον (38).Η ονομαστική ανάλυση της εκτίμησης κατάστασης είναι 1/5.Η μέθοδος ελαχίστων τετραγώνων με τη μέθοδο του Lagrangian πολλαπλασιαστή χρησιμοποιείται για τη λήψη των αρχικών και συνοριακών συνθηκών και των εσωτερικών παραμέτρων του μοντέλου προσαρμοσμένες με παρατήρηση, δημιουργώντας έτσι ένα μοντέλο γενικού κύκλου MIT ελεύθερης λειτουργίας (MITgcm) (39), το μοντέλο Μετά τη βελτιστοποίηση, τα αποτελέσματα μπορούν να παρακολουθούνται και να παρατηρούνται.
Η βιογεωχημεία/οικοσύστημα έχει μια πληρέστερη περιγραφή (δηλ. εξισώσεις και τιμές παραμέτρων) στο (2).Το μοντέλο καταγράφει την κυκλοφορία των C, N, P, Si και Fe μέσω ανόργανων και οργανικών λιμνών.Η έκδοση που χρησιμοποιείται εδώ περιλαμβάνει 35 είδη φυτοπλαγκτού: 2 είδη μικροπροκαρυωτών και 2 είδη μικροευκαρυωτών (κατάλληλα για περιβάλλοντα χαμηλής περιεκτικότητας σε θρεπτικά συστατικά), 5 είδη Cryptomonas sphaeroides (με επίστρωση ανθρακικού ασβεστίου), 5 είδη διαζωνίου ( Μπορεί να διορθώσει το άζωτο, έτσι δεν περιορίζεται) η διαθεσιμότητα διαλυμένου ανόργανου αζώτου), 11 διατόμων (που σχηματίζουν ένα πυριτικό κάλυμμα), 10 μικτών φυτικών μαστιγωτών (μπορούν να φωτοσυνθέσουν και να φάνε άλλο πλαγκτόν) και 16 ζωοπλαγκτόν (βόσκουν σε άλλο πλαγκτόν).Αυτές ονομάζονται "βιογεωχημικές λειτουργικές ομάδες" επειδή έχουν διαφορετικές επιδράσεις στη θαλάσσια βιογεωχημεία (40, 41) και χρησιμοποιούνται συχνά σε μελέτες παρατήρησης και μοντέλων.Σε αυτό το μοντέλο, κάθε λειτουργική ομάδα αποτελείται από πολλά πλαγκτόν διαφορετικών μεγεθών, με άνοιγμα 0,6 έως 2500 μm ισοδύναμης σφαιρικής διαμέτρου.
Οι παράμετροι που επηρεάζουν την ανάπτυξη, τη βόσκηση και τη βύθιση του φυτοπλαγκτού σχετίζονται με το μέγεθος και υπάρχουν συγκεκριμένες διαφορές μεταξύ των έξι λειτουργικών ομάδων φυτοπλαγκτού (32).Παρά τα διαφορετικά φυσικά πλαίσια, τα αποτελέσματα των 51 συστατικών πλαγκτού του μοντέλου έχουν χρησιμοποιηθεί σε πολλές πρόσφατες μελέτες (42-44).
Από το 1992 έως το 2011, το μοντέλο σύζευξης φυσικής/βιογεωχημικής/οικοσυστήματος λειτούργησε για 20 χρόνια.Η παραγωγή του μοντέλου περιλαμβάνει βιομάζα πλαγκτού, συγκέντρωση θρεπτικών ουσιών και ρυθμό παροχής θρεπτικών ουσιών (DIN, PO4, Si και Fe).Σε αυτή τη μελέτη, ο μέσος όρος των 20 ετών αυτών των εκροών χρησιμοποιήθηκε ως εισροή της Οικολογικής Επαρχίας.Chl, η κατανομή της βιομάζας του πλαγκτόν και της συγκέντρωσης θρεπτικών ουσιών και η κατανομή των λειτουργικών ομάδων συγκρίνονται με δορυφορικές και επιτόπιες παρατηρήσεις [βλέπε (2, 44), Σημείωση S1 και σχήμα.S1 έως S3].
Για τη μέθοδο SAGE, η κύρια πηγή τυχαιότητας προέρχεται από το βήμα t-SNE.Η τυχαιότητα εμποδίζει την επαναληψιμότητα, πράγμα που σημαίνει ότι τα αποτελέσματα είναι αναξιόπιστα.Η μέθοδος SAGE ελέγχει αυστηρά την ευρωστία προσδιορίζοντας ένα σύνολο παραμέτρων των t-SNE και DBSCAN, οι οποίες μπορούν να προσδιορίζουν με συνέπεια συστάδες όταν επαναλαμβάνονται.Ο προσδιορισμός της «περίπλοκης» της παραμέτρου t-SNE μπορεί να γίνει κατανοητός ως ο καθορισμός του βαθμού στον οποίο η αντιστοίχιση από υψηλές σε χαμηλές διαστάσεις πρέπει να σέβεται τα τοπικά ή γενικά χαρακτηριστικά των δεδομένων.Έφτασε στη σύγχυση των 400 και 300 επαναλήψεων.
Για τον αλγόριθμο ομαδοποίησης DBSCAN, πρέπει να καθοριστεί το ελάχιστο μέγεθος και η μετρική απόσταση των σημείων δεδομένων στο σύμπλεγμα.Ο ελάχιστος αριθμός καθορίζεται με την καθοδήγηση ειδικών.Αυτή η γνώση γνωρίζει τι ταιριάζει στο τρέχον πλαίσιο αριθμητικής μοντελοποίησης και ανάλυση.Ο ελάχιστος αριθμός είναι 100. Μια υψηλότερη ελάχιστη τιμή (λιγότερη από <135 πριν το ανώτερο όριο του πράσινου γίνει ευρύτερο) μπορεί να ληφθεί υπόψη, αλλά δεν μπορεί να αντικαταστήσει τη μέθοδο συνάθροισης που βασίζεται στην ανομοιότητα BC.Ο βαθμός σύνδεσης (Εικόνα 6Α) χρησιμοποιείται για τη ρύθμιση της παραμέτρου ϵ, η οποία ευνοεί την υψηλότερη κάλυψη (Εικόνα 6Β).Η συνδεσιμότητα ορίζεται ως ο σύνθετος αριθμός συμπλεγμάτων και είναι ευαίσθητη στην παράμετρο ϵ.Η χαμηλότερη συνδεσιμότητα υποδηλώνει ανεπαρκή προσαρμογή, τεχνητή ομαδοποίηση περιοχών μαζί.Η υψηλή συνδεσιμότητα υποδηλώνει υπερβολική τοποθέτηση.Η υπερβολική προσαρμογή είναι επίσης προβληματική, επειδή δείχνει ότι οι αρχικές τυχαίες εικασίες μπορεί να οδηγήσουν σε μη αναπαραγώγιμα αποτελέσματα.Μεταξύ αυτών των δύο άκρων, μια απότομη αύξηση (που συνήθως ονομάζεται "αγκώνας") δείχνει το καλύτερο ϵ.Στο Σχήμα 6Α, βλέπετε μια απότομη αύξηση στην περιοχή του οροπεδίου (κίτρινο,> 200 συστάδες), ακολουθούμενη από μια απότομη μείωση (πράσινο, 100 συστάδες), έως περίπου 130, που περιβάλλονται από πολύ λίγα σμήνη (μπλε, <60 συστάδες) ).Σε τουλάχιστον 100 μπλε περιοχές, είτε ένα σύμπλεγμα κυριαρχεί σε ολόκληρο τον ωκεανό (ε <0,42), είτε το μεγαλύτερο μέρος του ωκεανού δεν ταξινομείται και θεωρείται θόρυβος (ε> 0,99).Η κίτρινη περιοχή έχει μια εξαιρετικά μεταβλητή, μη αναπαραγώγιμη κατανομή συστάδων.Καθώς το ϵ μειώνεται, ο θόρυβος αυξάνεται.Η απότομα αυξανόμενη πράσινη περιοχή ονομάζεται αγκώνας.Αυτή είναι η βέλτιστη περιοχή.Αν και χρησιμοποιείται η πιθανότητα t-SNE, η ανομοιότητα BC εντός της επαρχίας μπορεί ακόμα να χρησιμοποιηθεί για τον προσδιορισμό της αξιόπιστης ομαδοποίησης.Χρησιμοποιώντας το Σχήμα 6 (Α και Β), ορίστε το ϵ στο 0,39.Όσο μεγαλύτερος είναι ο ελάχιστος αριθμός, τόσο μικρότερη είναι η πιθανότητα επίτευξης του ϵ που επιτρέπει αξιόπιστη ταξινόμηση και τόσο μεγαλύτερη είναι η περιοχή πρασίνου με τιμή μεγαλύτερη από 135. Η μεγέθυνση αυτής της περιοχής δείχνει ότι ο αγκώνας θα είναι πιο δύσκολο να βρεθεί ή όχι υπαρκτός.
Μετά τη ρύθμιση των παραμέτρων του t-SNE, ο συνολικός αριθμός των συμπλεγμάτων που βρέθηκαν θα χρησιμοποιηθεί ως μέτρο συνδεσιμότητας (A) και το ποσοστό των δεδομένων που κατανέμονται στο σύμπλεγμα (Β).Η κόκκινη κουκκίδα υποδηλώνει τον καλύτερο συνδυασμό κάλυψης και συνδεσιμότητας.Ο ελάχιστος αριθμός ορίζεται σύμφωνα με τον ελάχιστο αριθμό που σχετίζεται με την οικολογία.
Για συμπληρωματικό υλικό για αυτό το άρθρο, ανατρέξτε στη διεύθυνση http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Αυτό είναι ένα άρθρο ανοιχτής πρόσβασης που διανέμεται σύμφωνα με τους όρους της άδειας αναφοράς Creative Commons.Το άρθρο επιτρέπει την απεριόριστη χρήση, διανομή και αναπαραγωγή σε οποιοδήποτε μέσο, ​​υπό την προϋπόθεση ότι το πρωτότυπο έργο αναφέρεται σωστά.
Σημείωση: Σας ζητάμε μόνο να δώσετε τη διεύθυνση email σας, ώστε το άτομο που προτείνετε στη σελίδα να γνωρίζει ότι θέλετε να δει το email και ότι δεν είναι ανεπιθύμητο.Δεν θα καταγράψουμε καμία διεύθυνση email.
Αυτή η ερώτηση χρησιμοποιείται για να ελέγξει εάν είστε επισκέπτης και να αποτρέψει την αυτόματη υποβολή ανεπιθύμητων μηνυμάτων.
Το Παγκόσμιο Υπουργείο Θαλάσσιας Οικολογίας είναι αποφασισμένο να λύσει πολύπλοκα προβλήματα και χρησιμοποιεί μη εποπτευόμενη ML για να εξερευνήσει τις δομές της κοινότητας.
Το Παγκόσμιο Υπουργείο Θαλάσσιας Οικολογίας είναι αποφασισμένο να λύσει πολύπλοκα προβλήματα και χρησιμοποιεί μη εποπτευόμενη ML για να εξερευνήσει τις δομές της κοινότητας.


Ώρα δημοσίευσης: Ιαν-12-2021