შემოთავაზებულია უკონტროლო სწავლის მეთოდი გლობალური საზღვაო ეკოლოგიური პროვინციების (ეკო-პროვინციების) დასადგენად პლანქტონის საზოგადოების სტრუქტურისა და საკვები ნივთიერებების ნაკადის მონაცემებზე დაყრდნობით.სისტემატური ინტეგრირებული ეკოლოგიური პროვინციის (SAGE) მეთოდს შეუძლია ეკოლოგიური პროვინციების იდენტიფიცირება უაღრესად არაწრფივი ეკოსისტემის მოდელებში.მონაცემთა არაგაუსური კოვარიანტობისადმი ადაპტაციის მიზნით, SAGE იყენებს t შემთხვევითი მეზობლების ჩაშენებას (t-SNE) განზომილების შესამცირებლად.ხმაურის აპლიკაციის დახმარებით, სიმკვრივეზე დაფუძნებული სივრცითი კლასტერიზაციის (DBSCAN) ალგორითმის საფუძველზე, შესაძლებელია ასზე მეტი ეკოლოგიური პროვინციის იდენტიფიცირება.კავშირის რუქის გამოყენებით ეკოლოგიური განსხვავებები, როგორც მანძილის საზომი, ძლიერი აგრეგირებული ეკოლოგიური პროვინცია (AEP) ობიექტურად განისაზღვრება ბუდობრივი ეკოლოგიური პროვინციების მეშვეობით.AEP-ების გამოყენებით, შესწავლილი იქნა საკვები ნივთიერებების მიწოდების სიჩქარის კონტროლი თემის სტრუქტურაზე.ეკო-პროვინცია და AEP უნიკალურია და შეუძლია დაეხმაროს მოდელის ინტერპრეტაციას.მათ შეუძლიათ ხელი შეუწყონ მოდელებს შორის შედარებას და გააძლიერონ საზღვაო ეკოსისტემების გაგება და მონიტორინგი.
პროვინციები არის რეგიონები, სადაც რთული ბიოგეოგრაფია ზღვაზე ან ხმელეთზე არის ორგანიზებული თანმიმდევრულ და მნიშვნელოვან ზონებად (1).ეს პროვინციები ძალზე მნიშვნელოვანია მდებარეობების შედარებისა და კონტრასტის, დაკვირვებების, მონიტორინგისა და დაცვისთვის.რთული და არაწრფივი ურთიერთქმედებები, რომლებიც წარმოქმნიან ამ პროვინციებს, ხდის უკონტროლო მანქანათმცოდნეობის მეთოდებს (ML) ძალიან შესაფერისი პროვინციების ობიექტურად დასადგენად, რადგან მონაცემების კოვარიანტობა რთული და არაგაუსურია.აქ შემოთავაზებულია ML მეთოდი, რომელიც სისტემატურად განსაზღვრავს უნიკალურ საზღვაო ეკოლოგიურ პროვინციებს (ეკო-პროვინციებს) დარვინის გლობალური სამგანზომილებიანი (3D) ფიზიკური/ეკოსისტემური მოდელიდან (2).ტერმინი „უნიკალური“ გამოიყენება იმის აღსანიშნავად, რომ გამოვლენილი ტერიტორია საკმარისად არ ემთხვევა სხვა ტერიტორიებს.ამ მეთოდს ეწოდება სისტემური ინტეგრირებული ეკოლოგიური პროვინციის (SAGE) მეთოდი.სასარგებლო კლასიფიკაციის განსახორციელებლად, ალგორითმის მეთოდმა უნდა დაუშვას (i) გლობალური კლასიფიკაცია და (ii) მრავალმასშტაბიანი ანალიზი, რომელიც შეიძლება იყოს ჩადგმული/აგრეგირებული სივრცეში და დროში (3).ამ კვლევაში პირველად იქნა შემოთავაზებული SAGE მეთოდი და განიხილეს გამოვლენილი ეკოლოგიური პროვინციები.ეკო-პროვინციებს შეუძლიათ ხელი შეუწყონ ფაქტორების გაგებას, რომლებიც აკონტროლებენ საზოგადოების სტრუქტურას, უზრუნველყონ სასარგებლო ინფორმაცია მონიტორინგის სტრატეგიებისთვის და დაეხმარონ ეკოსისტემაში ცვლილებების თვალყურის დევნებას.
ხმელეთის პროვინციები ჩვეულებრივ კლასიფიცირდება კლიმატის (ნალექები და ტემპერატურა), ნიადაგის, მცენარეულობისა და ფაუნის მსგავსების მიხედვით და გამოიყენება დამხმარე მართვის, ბიომრავალფეროვნების კვლევისა და დაავადების კონტროლისთვის (1, 4).საზღვაო პროვინციების განსაზღვრა უფრო რთულია.ორგანიზმების უმეტესობა მიკროსკოპულია, სითხის საზღვრებით.ლონგჰერსტი და სხვ.(5) უზრუნველყოფილია ოკეანოგრაფიის სამინისტროს ერთ-ერთი პირველი გლობალური კლასიფიკაცია გარემო პირობების საფუძველზე.ამ "ლონგჰერსტის" პროვინციების განმარტება მოიცავს ცვლადებს, როგორიცაა შერევის სიჩქარე, სტრატიფიკაცია და დასხივება, ისევე როგორც ლონგჰერსტის, როგორც საზღვაო ოკეანოგრაფის ფართო გამოცდილება, რომელსაც აქვს სხვა მნიშვნელოვანი პირობები საზღვაო ეკოსისტემებისთვის.ლონგჰერსტი ფართოდ გამოიყენებოდა, მაგალითად, პირველადი წარმოებისა და ნახშირბადის ნაკადების შესაფასებლად, თევზაობის დასახმარებლად და ადგილზე დაკვირვების აქტივობების დასაგეგმად (5-9).პროვინციების უფრო ობიექტურად განსაზღვრის მიზნით, გამოყენებულია ისეთი მეთოდები, როგორიცაა ბუნდოვანი ლოგიკა და რეგიონული უკონტროლო კლასტერირება/სტატისტიკა (9-14).ასეთი მეთოდების მიზანია მნიშვნელოვანი სტრუქტურების იდენტიფიცირება, რომლებსაც შეუძლიათ პროვინციების იდენტიფიცირება არსებული დაკვირვების მონაცემებში.მაგალითად, დინამიური საზღვაო პროვინციები (12) იყენებენ თვითორგანიზებულ რუქებს ხმაურის შესამცირებლად და იყენებენ იერარქიულ (ხეებზე დაფუძნებულ) კლასტერირებას რეგიონალური თანამგზავრებიდან მიღებული საზღვაო ფერის პროდუქტების დასადგენად [ქლოროფილი a (Chl-a), ნორმალიზებული ფლუორესცენციის ხაზის სიმაღლე და ფერადი გახსნილი ორგანული ნივთიერებები] და ფიზიკური ველი (ზღვის ზედაპირის ტემპერატურა და მარილიანობა, აბსოლუტური დინამიური ტოპოგრაფია და ზღვის ყინული).
პლანქტონის საზოგადოების სტრუქტურა შემაშფოთებელია, რადგან მის ეკოლოგიას აქვს დიდი გავლენა საკვები ნივთიერებების მაღალ დონეზე, ნახშირბადის შეწოვასა და კლიმატზე.მიუხედავად ამისა, პლანქტონის საზოგადოების სტრუქტურის საფუძველზე გლობალური ეკოლოგიური პროვინციის განსაზღვრა ჯერ კიდევ რთული და მიუღწეველი მიზანია.საზღვაო ფერის თანამგზავრებს შეუძლიათ პოტენციურად მიაწოდონ ინფორმაცია ფიტოპლანქტონის მსხვილმარცვლოვანი კლასიფიკაციის შესახებ ან მიუთითონ ფუნქციური ჯგუფების უპირატესობები (15), მაგრამ მათ ამჟამად არ შეუძლიათ დეტალური ინფორმაციის მიწოდება საზოგადოების სტრუქტურის შესახებ.ბოლო კვლევები [მაგ. Tara Ocean (16)] უზრუნველყოფს საზოგადოების სტრუქტურის უპრეცედენტო გაზომვას;ამჟამად, გლობალური მასშტაბით არის მხოლოდ იშვიათი in-situ დაკვირვებები (17).წინა კვლევებმა დიდწილად განსაზღვრა „ბიოგეოქიმიური პროვინცია“ (12, 14, 18) ბიოქიმიური მსგავსების განსაზღვრის საფუძველზე (როგორიცაა პირველადი წარმოება, Chl და ხელმისაწვდომი სინათლე).აქ რიცხვითი მოდელი გამოიყენება [Darwin(2)] გამოსატანად და ეკოლოგიური პროვინცია განისაზღვრება საზოგადოების სტრუქტურისა და საკვები ნივთიერებების ნაკადის მიხედვით.ამ კვლევაში გამოყენებულ ციფრულ მოდელს აქვს გლობალური გაშუქება და შეიძლება შევადაროთ არსებულ საველე მონაცემებს (17) და დისტანციური ზონდირების ველებს (შენიშვნა S1).ამ კვლევაში გამოყენებული რიცხვითი მოდელის მონაცემებს აქვს გლობალური გაშუქების უპირატესობა.მოდელის ეკოსისტემა შედგება 35 სახეობის ფიტოპლანქტონისა და 16 სახეობის ზოოპლანქტონისაგან (გთხოვთ იხილეთ მასალები და მეთოდები).მოდელის პლანქტონის ტიპები ურთიერთქმედებენ არაწრფივად არა-გაუსის კოვარიანციულ სტრუქტურებთან, ამიტომ მარტივი დიაგნოსტიკური მეთოდები არ არის შესაფერისი უნიკალური და თანმიმდევრული შაბლონების იდენტიფიცირებისთვის განვითარებადი საზოგადოების სტრუქტურებში.აქ წარმოდგენილი SAGE მეთოდი გთავაზობთ ახალ გზას დარვინის რთული მოდელების გამოსავლის შესამოწმებლად.
მონაცემთა მეცნიერების/ML ტექნოლოგიის მძლავრ ტრანსფორმაციულ შესაძლებლობებს შეუძლია უაღრესად კომპლექსური მოდელის გადაწყვეტილებების გამოვლენა მონაცემთა კოვარიანტში რთული, მაგრამ ძლიერი სტრუქტურები.ძლიერი მეთოდი განისაზღვრება, როგორც მეთოდი, რომელსაც შეუძლია შედეგების ერთგულად რეპროდუცირება შეცდომის მოცემულ დიაპაზონში.მარტივ სისტემებშიც კი, ძლიერი შაბლონებისა და სიგნალების განსაზღვრა შეიძლება იყოს გამოწვევა.სანამ არ განისაზღვრება დაკვირვებული ნიმუშისკენ მიმავალი დასაბუთება, აღმოცენებული სირთულე შეიძლება ჩანდეს რთული/ძნელად მოსაგვარებელი.ეკოსისტემის შემადგენლობის დადგენის ძირითადი პროცესი ბუნებით არაწრფივია.არაწრფივი ურთიერთქმედებების არსებობამ შეიძლება დააბნიოს მძლავრი კლასიფიკაცია, ამიტომ აუცილებელია თავიდან იქნას აცილებული მეთოდები, რომლებიც მტკიცე ვარაუდებს აკეთებენ მონაცემთა კოვარიანტობის ძირითადი სტატისტიკური განაწილების შესახებ.მაღალგანზომილებიანი და არაწრფივი მონაცემები გავრცელებულია ოკეანოგრაფიაში და შეიძლება ჰქონდეს კოვარიანტული სტრუქტურა რთული, არაგაუსური ტოპოლოგიით.მიუხედავად იმისა, რომ არა-გაუსური კოვარიანციული სტრუქტურის მქონე მონაცემებმა შეიძლება ხელი შეუშალოს მყარ კლასიფიკაციას, SAGE მეთოდი ახალია, რადგან ის შექმნილია თვითნებური ტოპოლოგიის მქონე კლასტერების იდენტიფიცირებისთვის.
SAGE მეთოდის მიზანია ობიექტურად იდენტიფიცირება აღმოცენებული შაბლონები, რომლებიც შეიძლება დაეხმარონ შემდგომ ეკოლოგიურ გაგებას.(19) მსგავსი კლასტერზე დაფუძნებული სამუშაო პროცესის შემდეგ, ეკოლოგიური და საკვები ნივთიერებების ნაკადის ცვლადები გამოიყენება მონაცემების ერთადერთი კლასტერის დასადგენად, რომელსაც ეკოლოგიური პროვინცია ეწოდება.ამ კვლევაში შემოთავაზებული SAGE მეთოდი (სურათი 1) ჯერ ამცირებს განზომილებას 55-დან 11 განზომილებამდე პლანქტონის ფუნქციური ჯგუფების შეჯამებით, რომლებიც განსაზღვრულია აპრიორი (იხ. მასალები და მეთოდები).t-შემთხვევითი მეზობლების ჩაშენების მეთოდის (t-SNE) გამოყენებით, ზომა კიდევ უფრო მცირდება 3D სივრცეში ალბათობის პროექციით.უკონტროლო კლასტერირებას შეუძლია ეკოლოგიურად მჭიდრო ტერიტორიების იდენტიფიცირება [სიმკვრივეზე დაფუძნებული სივრცითი კლასტერირება (DBSCAN) ხმაურზე დაფუძნებული აპლიკაციებისთვის].ორივე t-SNE და DBSCAN გამოიყენება ეკოსისტემის თანდაყოლილი არაწრფივი რიცხვითი მოდელის მონაცემებზე.შემდეგ მიღებული ეკოლოგიური პროვინციის ხელახალი პროექტირება დედამიწაზე.გამოვლენილია ასზე მეტი უნიკალური ეკოლოგიური პროვინცია, რომლებიც შესაფერისია რეგიონული კვლევისთვის.გლობალურად თანმიმდევრული ეკოსისტემის მოდელის გასათვალისწინებლად, SAGE მეთოდი გამოიყენება ეკოლოგიური პროვინციების აგრეგაციად აგრეგირებულ ეკოლოგიურ პროვინციებად (AEP) ეკოლოგიური პროვინციების ეფექტურობის გასაუმჯობესებლად.აგრეგაციის დონე (ე.წ. "სირთულის") შეიძლება მორგებული იყოს საჭირო დეტალების დონეზე.განსაზღვრეთ ძლიერი AEP-ის მინიმალური სირთულე.შერჩევის აქცენტი არის SAGE მეთოდი და იკვლევს ყველაზე მცირე სირთულის AEP შემთხვევებს, რათა განისაზღვროს გადაუდებელი თემის სტრუქტურის კონტროლი.შაბლონები შემდეგ შეიძლება გაანალიზდეს ეკოლოგიური შეხედულებების უზრუნველსაყოფად.აქ დანერგილი მეთოდი ასევე შეიძლება გამოყენებულ იქნას მოდელების უფრო ფართო შედარებისთვის, მაგალითად, სხვადასხვა მოდელებში ნაპოვნი მსგავსი ეკოლოგიური პროვინციების მდებარეობების შეფასებით, რათა ხაზი გავუსვა განსხვავებებს და მსგავსებებს, რათა შევადაროთ მოდელები.
(ა) სამუშაო პროცესის სქემატური დიაგრამა ეკოლოგიური პროვინციის დასადგენად;ფუნქციურ ჯგუფში ჯამის გამოყენებით ორიგინალური 55-განზომილებიანი მონაცემების 11-განზომილებიანი მოდელის გამოსავალზე შესამცირებლად, შვიდი ფუნქციური/კვებითი პლანქტონის ბიომასისა და საკვები ნივთიერებების მიწოდების ოთხი სიჩქარის ჩათვლით.უმნიშვნელო ღირებულება და გამძლე ყინულის საფარი.მონაცემები სტანდარტიზებულია და სტანდარტიზებულია.მიაწოდეთ 11-განზომილებიანი მონაცემები t-SNE ალგორითმისთვის სტატისტიკურად მსგავსი მახასიათებლების კომბინაციების ხაზგასასმელად.DBSCAN ყურადღებით შეარჩევს კლასტერს პარამეტრის მნიშვნელობის დასაყენებლად.საბოლოოდ დააბრუნეთ მონაცემები გრძედი/გრძედი პროექციაში.გთხოვთ გაითვალისწინოთ, რომ ეს პროცესი მეორდება 10-ჯერ, რადგან t-SNE-ის გამოყენებით შეიძლება წარმოიქმნას მცირე შემთხვევითობა.(B) განმარტავს, თუ როგორ უნდა მიიღოთ AEP სამუშაო პროცესის გამეორებით (A) 10-ჯერ.ამ 10 განხორციელებისთვის თითოეული პროვინციული ბრეი-კურტისის (BC) უმსგავსობის მატრიცა განისაზღვრა 51 ფიტოპლანქტონის ბიომასის საფუძველზე.დაადგინეთ BC სხვაობა პროვინციებს შორის, სირთულიდან 1 AEP-დან სრულ სირთულემდე 115. BC ნიშნული დაყენებულია ლონგჰერსტში.
SAGE მეთოდი იყენებს გლობალური 3D ფიზიკური/ეკოსისტემური რიცხვითი მოდელის გამოსავალს ეკოლოგიური პროვინციის დასადგენად [დარვინი (2);იხილეთ მასალები და მეთოდები და შენიშვნა S1].ეკოსისტემის კომპონენტები შედგება ფიტოპლანქტონის 35 სახეობისა და ზოოპლანქტონის 16 სახეობისგან, შვიდი წინასწარ განსაზღვრული ფუნქციური ჯგუფით: პროკარიოტები და ევკარიოტები, რომლებიც ადაპტირებულია დაბალ საკვებ გარემოზე, კოკციდიები კალციუმის კარბონატის საფარით და აზოტის მძიმე აზოტის ფიქსაცია აზოტი. მნიშვნელოვან საკვებ ნივთიერებებს), სილიციუმის საფარით, შეუძლიათ სხვა პლანქტონის ფოტოსინთეზი და შერეული საკვები ნივთიერებების ფლაგელატების და ზოოპლანქტონის მწყემსების ძოვება.ზომის სიგრძე არის 0.6-დან 2500μm-მდე ექვივალენტური სფერული დიამეტრი.ფიტოპლანქტონის ზომისა და ფუნქციური დაჯგუფების მოდელის განაწილება ასახავს საერთო მახასიათებლებს, რომლებიც ჩანს თანამგზავრულ და ადგილზე დაკვირვებებში (იხ. ნახატები S1-დან S3-მდე).ციფრულ მოდელსა და დაკვირვებულ ოკეანეს შორის მსგავსება მიუთითებს იმაზე, რომ მოდელით განსაზღვრული პროვინციები შეიძლება გამოყენებულ იქნას insitu ოკეანეში.გთხოვთ, გაითვალისწინოთ, რომ ეს მოდელი მხოლოდ ფიტოპლანქტონის გარკვეულ მრავალფეროვნებას ასახავს და ოკეანის in situ მხოლოდ ფიზიკურ და ქიმიურ იძულებით დიაპაზონს.SAGE მეთოდს შეუძლია ადამიანებს საშუალება მისცეს უკეთ გაიგონ საზოგადოების მოდელის სტრუქტურის მაღალ რეგიონული კონტროლის მექანიზმი.
პლანქტონის თითოეულ ფუნქციურ ჯგუფში მხოლოდ ზედაპირული ბიომასის ჯამის (საშუალო დროით 20 წელი) ჩართვის შემთხვევაში, მონაცემთა განზომილება შეიძლება შემცირდეს.მას შემდეგ, რაც ადრეულმა კვლევებმა აჩვენა მათი მთავარი როლი საზოგადოების სტრუქტურის ჩამოყალიბებაში, იგი ასევე მოიცავდა ზედაპირული წყაროს ტერმინებს საკვები ნივთიერებების ნაკადებისთვის (აზოტის, რკინის, ფოსფატის და სილიციუმის მჟავის მიწოდება) [მაგ. (20, 21)].ფუნქციური ჯგუფების ჯამი ამცირებს პრობლემას 55-დან (51 პლანქტონი და 4 საკვები ნაკადი) 11 განზომილებამდე.ამ საწყის კვლევაში, ალგორითმის მიერ დაწესებული გამოთვლითი შეზღუდვების გამო, სიღრმისა და დროის ცვალებადობა არ იყო გათვალისწინებული.
SAGE მეთოდს შეუძლია განსაზღვროს მნიშვნელოვანი ურთიერთობები არაწრფივ პროცესებსა და ფუნქციური ჯგუფის ბიომასისა და საკვები ნივთიერებების ნაკადს შორის ურთიერთქმედების ძირითად მახასიათებლებს შორის.ევკლიდეს დისტანციური სწავლების მეთოდებზე დაფუძნებული 11-განზომილებიანი მონაცემების გამოყენებით (როგორიცაა K-საშუალებები) ვერ მოიპოვება სანდო და რეპროდუქციული პროვინციები (19, 22).ეს არის იმის გამო, რომ გაუსის ფორმა არ არის ნაპოვნი ძირითადი ელემენტების კოვარიანტობის ძირითად განაწილებაში, რომლებიც განსაზღვრავენ ეკოლოგიურ პროვინციას.ვორონოის უჯრედების K-საშუალებები (სწორი ხაზები) ვერ ინარჩუნებენ არა-გაუსის ძირითად განაწილებას.
პლანქტონის შვიდი ფუნქციური ჯგუფის ბიომასა და საკვები ნივთიერებების ოთხი ნაკადი ქმნის 11 განზომილებიან x ვექტორს.აქედან გამომდინარე, x არის ვექტორული ველი მოდელის ბადეზე, სადაც თითოეული ელემენტი xi წარმოადგენს მოდელის ჰორიზონტალურ ბადეზე განსაზღვრულ 11 განზომილებიან ვექტორს.თითოეული ინდექსი i ცალსახად განსაზღვრავს ბადის წერტილს სფეროზე, სადაც (lon, lat) = (φi, θi).თუ მოდელის ქსელის ერთეულის ბიომასა არის 1.2×10-3მგ ჩლ/მ3-ზე ნაკლები ან ყინულის დაფარვის მაჩვენებელი აღემატება 70%-ს, გამოიყენება ბიომასის მონაცემების ჟურნალი და განადგურდება.მონაცემები ნორმალიზებულია და სტანდარტიზებულია, ამიტომ ყველა მონაცემი არის [0-დან 1-მდე] დიაპაზონში, საშუალო ამოღებულია და მასშტაბირებულია ერთეულ დისპერსიამდე.ეს კეთდება იმისთვის, რომ მახასიათებლები (ბიომასა და საკვები ნივთიერებების ნაკადი) არ შემოიფარგლოს შესაძლო მნიშვნელობების დიაპაზონში არსებული კონტრასტით.კლასტერირება უნდა ასახავდეს ცვლილების ურთიერთკავშირს მახასიათებლებს შორის ძირითადი ალბათობის მანძილისგან და არა გეოგრაფიული მანძილისგან.ამ მანძილების რაოდენობრივი გაზომვით, მნიშვნელოვანი მახასიათებელი ჩნდება, ხოლო არასაჭირო დეტალები უგულებელყოფილია.ეკოლოგიური თვალსაზრისით, ეს აუცილებელია, რადგან მცირე ბიომასის მქონე ფიტოპლანქტონის ზოგიერთ ტიპს შეიძლება ჰქონდეს უფრო დიდი ბიოგეოქიმიური ეფექტი, როგორიცაა დიაზოტროფული ბაქტერიების მიერ აზოტის ფიქსაცია.მონაცემთა სტანდარტიზაციისა და ნორმალიზებისას ამ ტიპის კოვარიატები ხაზგასმული იქნება.
მაღალგანზომილებიანი სივრცის მახასიათებლების სიახლოვის ხაზგასმით დაბალი განზომილებიანი წარმოდგენით, t-SNE ალგორითმი გამოიყენება არსებული მსგავსი რეგიონების გასაგებად.წინა ნაშრომში, რომელიც მიზნად ისახავდა ღრმა ნერვული ქსელების შექმნას დისტანციური ზონდირების აპლიკაციებისთვის, გამოიყენა t-SNE, რომელმაც დაამტკიცა თავისი უნარი ძირითადი მახასიათებლების გამიჯვნაში (23).ეს არის აუცილებელი ნაბიჯი ფუნქციების მონაცემებში ძლიერი კლასტერიზაციის დასადგენად, არაკონვერგენტული გადაწყვეტილებების თავიდან აცილებისას (შენიშვნა S2).გაუსის ბირთვების გამოყენებით, t-SNE ინარჩუნებს მონაცემთა სტატისტიკურ თვისებებს ყოველი მაღალგანზომილებიანი ობიექტის 3D ფაზის სივრცის წერტილზე რუკების გამოსახვით, რითაც უზრუნველყოფს, რომ მსგავსი ობიექტების ალბათობა მაღალი და დაბალი მიმართულებით მაღალია. განზომილებიანი სივრცე (24).N მაღალი განზომილებიანი ობიექტების x1,…,xN სიმრავლის გათვალისწინებით, t-SNE ალგორითმი მცირდება Kullback-Leibler (KL) დივერგენციის მინიმიზაციის გზით (25).KL დივერგენცია არის საზომი იმისა, თუ რამდენად განსხვავდება ალბათობის განაწილება მეორე მითითების ალბათობის განაწილებისგან და შეუძლია ეფექტურად შეაფასოს მაღალი განზომილებიანი მახასიათებლების დაბალგანზომილებიან წარმოდგენებს შორის კორელაციის შესაძლებლობა.თუ xi არის i-ე ობიექტი N-განზომილებიან სივრცეში, xj არის j-ე ობიექტი N-განზომილებიან სივრცეში, yi არის i-ე ობიექტი დაბალგანზომილებიან სივრცეში და yj არის j-ე ობიექტი დაბალ განზომილებაში. -განზომილებიანი სივრცე, შემდეგ t -SNE განსაზღვრავს მსგავსების ალბათობას ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) და განზომილების შემცირების ნაკრებისთვის q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
სურათი 2A ასახავს ბიომასის და საკვები ნივთიერებების ნაკადის ვექტორების 11-განზომილებიანი კომბინაციის 3D-მდე შემცირების ეფექტს.t-SNE-ს გამოყენების მოტივაცია შეიძლება შევადაროთ ძირითადი კომპონენტის ანალიზის მოტივაციას (PCA), რომელიც იყენებს დისპერსიის ატრიბუტს მონაცემთა ფართობის/ატრიბუტის ხაზგასასმელად, რითაც ამცირებს განზომილებას.აღმოჩნდა, რომ t-SNE მეთოდი აღემატება PCA-ს, რათა უზრუნველყოს საიმედო და განმეორებადი შედეგები ეკო-მინისტრისთვის (იხ. შენიშვნა S2).ეს შეიძლება იყოს იმის გამო, რომ PCA-ს ორთოგონალურობის დაშვება არ არის შესაფერისი მაღალ არაწრფივ ინტერაქტიულ მახასიათებლებს შორის კრიტიკული ურთიერთქმედების დასადგენად, რადგან PCA ფოკუსირებულია ხაზოვან კოვარიანციულ სტრუქტურებზე (26).დისტანციური ზონდირების მონაცემების გამოყენებით, ლუნგა და სხვ.(27) გვიჩვენებს, თუ როგორ გამოვიყენოთ SNE მეთოდი რთული და არაწრფივი სპექტრული მახასიათებლების გამოსაყოფად, რომლებიც გადახრილია გაუსის განაწილებიდან.
(A) მოდელირებული ნუტრიენტებით მიწოდების მაჩვენებელი, ფიტოპლანქტონისა და ზოოპლანქტონის ფუნქციური ჯგუფის ბიომასა, შედგენილი t-SNE ალგორითმით და შეღებილი პროვინციების მიხედვით DBSCAN-ის გამოყენებით.თითოეული წერტილი წარმოადგენს წერტილს მაღალგანზომილებიან სივრცეში, როგორც ნაჩვენებია სურათზე 6B, წერტილების უმეტესობა აღბეჭდილია.ლილვები ეხება "t-SNE" ზომებს 1, 2 და 3. (B) პროვინციის გეოგრაფიული პროექცია, რომელიც ნაპოვნია DBSCAN-ის მიერ წარმოშობის გრძედი-გრძედი ბადეზე.ფერი უნდა ჩაითვალოს ნებისმიერ ფერად, მაგრამ უნდა შეესაბამებოდეს (A).
წერტილები t-SNE სკატერის ნახაზზე 2A სურათზე, შესაბამისად, დაკავშირებულია გრძედთან და გრძედთან.თუ ნახაზზე 2A ორი წერტილი ახლოსაა ერთმანეთთან, ეს იმის გამო ხდება, რომ მათი ბიომასა და საკვები ნივთიერებების ნაკადი მსგავსია და არა გეოგრაფიული სიახლოვის გამო.სურათზე 2A ფერები არის DBSCAN მეთოდის გამოყენებით აღმოჩენილი კლასტერები (28).მკვრივი დაკვირვებების ძიებისას, DBSCAN ალგორითმი იყენებს მანძილს 3D წარმომადგენლობაში წერტილებს შორის (ϵ = 0,39; ამ არჩევანის შესახებ ინფორმაციისთვის იხილეთ მასალები და მეთოდები), და მსგავსი წერტილების რაოდენობაა საჭირო კლასტერის დასადგენად (აქ 100 ქულა, იხილეთ ზემოთ).DBSCAN მეთოდი არ აკეთებს რაიმე ვარაუდს მონაცემებში კლასტერების ფორმის ან რაოდენობის შესახებ, როგორც ეს ნაჩვენებია ქვემოთ:
3) ყველა წერტილისთვის, რომელიც იდენტიფიცირებულია შორ მანძილზე, გაიმეორეთ ნაბიჯი 2 განმეორებით კასეტური საზღვრის დასადგენად.თუ ქულების რაოდენობა აღემატება დადგენილ მინიმალურ მნიშვნელობას, იგი ინიშნება როგორც კლასტერი.
მონაცემები, რომლებიც არ აკმაყოფილებს კლასტერის მინიმალურ წევრს და მანძილის ϵ მეტრიკას, ითვლება „ხმაურად“ და არ ენიჭება ფერი.DBSCAN არის სწრაფი და მასშტაბირებადი ალგორითმი O(n2) შესრულებით უარეს შემთხვევაში.მიმდინარე ანალიზისთვის, ეს ფაქტიურად შემთხვევითი არ არის.ქულების მინიმალური რაოდენობა განისაზღვრება ექსპერტიზის შეფასებით.შემდეგ მანძილის კორექტირების შემდეგ, შედეგი არ არის საკმარისად სტაბილური ≈±10 დიაპაზონში.ეს მანძილი დაყენებულია კავშირის (სურათი 6A) და ოკეანის დაფარვის პროცენტის (სურათი 6B) გამოყენებით.დაკავშირება განისაზღვრება, როგორც კლასტერების კომპოზიტური რაოდენობა და მგრძნობიარეა ϵ პარამეტრის მიმართ.ქვედა კავშირი მიუთითებს არასაკმარისად მორგებაზე, რეგიონების ხელოვნურად დაჯგუფებაზე.მაღალი კავშირი მიუთითებს ზედმეტად მორგებაზე.საფიქრებელია უფრო მაღალი მინიმუმის გამოყენება, მაგრამ თუ მინიმალური აღემატება ca-ს, შეუძლებელია საიმედო გადაწყვეტის მიღწევა.135 (დაწვრილებით იხილეთ მასალები და მეთოდები).
115 მტევანი იდენტიფიცირებული 2A სურათზე დაპროექტებულია 2B სურათზე ისევ დედამიწაზე.თითოეული ფერი შეესაბამება DBSCAN-ის მიერ გამოვლენილ ბიოგეოქიმიური და ეკოლოგიური ფაქტორების თანმიმდევრულ კომბინაციას.კლასტერების განსაზღვრის შემდეგ, ნახაზი 2A-ზე თითოეული წერტილის ასოციაცია კონკრეტულ გრძედთან და გრძედთან გამოიყენება კლასტერების დასაბრუნებლად გეოგრაფიულ არეალში.სურათი 2B ასახავს ამას იმავე კლასტერის ფერებით, როგორც ნახაზი 2A.მსგავსი ფერები არ უნდა იქნას განმარტებული, როგორც ეკოლოგიური მსგავსება, რადგან ისინი ენიჭება ალგორითმის მიერ კლასტერების აღმოჩენის თანმიმდევრობით.
2B ნახატზე მოცემული ტერიტორია თვისობრივად შეიძლება იყოს ოკეანის ფიზიკურ და/ან ბიოგეოქიმიაში დადგენილ არეალს.მაგალითად, სამხრეთ ოკეანეში მტევანი ზონა-სიმეტრიულია, ჩნდება ოლიგოტროფული მორევები და მკვეთრი გადასვლა მიუთითებს სავაჭრო ქარების გავლენას.მაგალითად, ეკვატორულ წყნარ ოკეანეში, აწევასთან დაკავშირებული სხვადასხვა რეგიონები ჩანს.
ეკო-პროვინციის ეკოლოგიური გარემოს გასაგებად, კლასტერში ეკოლოგიის შესაფასებლად გამოყენებული იქნა ბრეი-კურტისის (BC) სხვაობის ინდექსის (29) ვარიაცია.BC ინდიკატორი არის სტატისტიკური მონაცემი, რომელიც გამოიყენება ორ განსხვავებულ ობიექტს შორის საზოგადოების სტრუქტურის სხვაობის დასადგენად.BC გაზომვა გამოიყენება 51 სახეობის ფიტოპლანქტონისა და ზოოპლანქტონის ბიომასაზე BCninj = 1-2CninjSni + Snj
BCninj აღნიშნავს მსგავსებას ნი და კომბინაციის nj-ს შორის, სადაც Cninj არის ბიომასის ერთი ტიპის მინიმალური მნიშვნელობა, რომელიც არსებობს ორივე კომბინაციაში ni და nj, და Sni წარმოადგენს ყველა ბიომასის ჯამს, რომელიც არსებობს ორივე კომბინაციაში ni და Snj.BC განსხვავება მანძილის გაზომვის მსგავსია, მაგრამ მოქმედებს არაევკლიდურ სივრცეში, რომელიც, სავარაუდოდ, უფრო შესაფერისია ეკოლოგიური მონაცემებისა და მისი ინტერპრეტაციისთვის.
დიაგრამა 2B-ში გამოვლენილი თითოეული კლასტერისთვის შეიძლება შეფასდეს BC შიდაპროვინციული და ინტერპროვინციული მსგავსება.BC სხვაობა პროვინციის შიგნით ეხება განსხვავებას პროვინციის საშუალო ღირებულებასა და პროვინციის თითოეულ წერტილს შორის.ძვ.წ პროვინციებს შორის განსხვავება ეხება ერთ პროვინციასა და სხვა პროვინციებს შორის მსგავსებას.ნახაზი 3A გვიჩვენებს BC სიმეტრიულ მატრიცას (0, შავი: სრულიად შესაბამისი; 1, თეთრი: სრულიად განსხვავებული).გრაფიკის თითოეული ხაზი აჩვენებს მონაცემებს ნიმუშს.სურათი 3B გვიჩვენებს BC-ის შედეგების გეოგრაფიულ მნიშვნელობას დიაგრამა 3A-ზე თითოეული პროვინციისთვის.პროვინციისთვის დაბალ კვებით და საკვები ნივთიერებებით დაბალ ზონაში, სურათი 3B გვიჩვენებს, რომ ეკვატორისა და ინდოეთის ოკეანის ირგვლივ დიდი ტერიტორიების სიმეტრია ძირითადად მსგავსია, მაგრამ უფრო მაღალი განედები და ამაღლების არეები მნიშვნელოვნად განსხვავდება.
(A) ძვ.გაითვალისწინეთ მნიშვნელობების მოსალოდნელი სიმეტრია.(B) სვეტის (ან მწკრივის) სივრცითი პროექცია.დისტროფიულ წრეში მყოფი პროვინციისთვის შეფასდა BC მსგავსების საზომის გლობალური განაწილება და შეფასდა გლობალური 20-წლიანი საშუალო.შავი (BC = 0) ნიშნავს იგივე ფართობს, ხოლო თეთრი (BC = 1) არ ნიშნავს მსგავსებას.
სურათი 4A ასახავს განსხვავებას ძვ.დადგენილია კლასტერში საშუალო ფართობის საშუალო კომბინაციის გამოყენებით და განსხვავებულობის განსაზღვრა BC-ს და პროვინციის თითოეული ქსელის წერტილის საშუალოს შორის, აჩვენებს, რომ SAGE მეთოდს შეუძლია 51 სახეობის გამოყოფა ეკოლოგიური მსგავსების მიხედვით. მოდელის მონაცემები.51-ვე ტიპის საერთო საშუალო BC კლასტერის სხვაობა არის 0,102±0,0049.
(A, B და D) პროვინციის შიგნით BC სხვაობა შეფასებულია, როგორც საშუალო BC სხვაობა თითოეულ ბადის წერტილოვან საზოგადოებასა და საშუალო პროვინციას შორის და სირთულე არ მცირდება.(2) გლობალური საშუალო შიდაპროვინციული BC სხვაობა არის 0,227±0,117.ეს არის ამ ნაშრომის მიერ შემოთავაზებული ეკოლოგიურ მოტივაციაზე დაფუძნებული კლასიფიკაციის ნიშნული [მწვანე ხაზი (C)].(C) საშუალო პროვინციული BC სხვაობა: შავი ხაზი წარმოადგენს BC შიდაპროვინციულ განსხვავებას მზარდი სირთულით.2σ მოდის ეკო-პროვინციის იდენტიფიკაციის პროცესის 10 გამეორებიდან.DBSCAN-ის მიერ აღმოჩენილი პროვინციების მთლიანი სირთულისთვის, (A) გვიჩვენებს, რომ BC განსხვავება პროვინციაში არის 0,099, ხოლო სირთულის კლასიფიკაცია შემოთავაზებული (C) არის 12, რის შედეგადაც BC განსხვავება პროვინციაში არის 0,200.როგორც სურათზე ჩანს.(დ).
ნახაზზე 4B, პლანქტონის 51 ტიპის ბიომასა გამოიყენება ლონგჰერსტის პროვინციაში ძვ.წ.თითოეული პროვინციის საერთო საშუალო არის 0,227, ხოლო ბადის წერტილების სტანდარტული გადახრა BC პროვინციის სხვაობასთან დაკავშირებით არის 0,046.ეს უფრო დიდია ვიდრე სურათი 1B-ზე გამოვლენილი კლასტერი.სამაგიეროდ, შვიდი ფუნქციური ჯგუფის ჯამის გამოყენებით, ლონგჰერსტში BC საშუალო სეზონის შიდა განსხვავებები გაიზარდა 0,232-მდე.
გლობალური ეკო-პროვინციის რუკა შეიცავს უნიკალურ ეკოლოგიური ურთიერთქმედებების რთულ დეტალებს და გაუმჯობესებები განხორციელდა ლონგჰერსტის პროვინციის მთელი ეკოსისტემის სტრუქტურის გამოყენებით.ეკოლოგიის სამინისტროს მოსალოდნელია, რომ გაეცნოს ციფრული მოდელის ეკოსისტემის კონტროლის პროცესს, რაც ხელს შეუწყობს საველე სამუშაოების შესწავლას.ამ კვლევის მიზნით ასზე მეტი პროვინციის სრულად ჩვენება შეუძლებელია.შემდეგი ნაწილი წარმოგიდგენთ SAGE მეთოდს, რომელიც აჯამებს პროვინციებს.
პროვინციის ერთ-ერთი მიზანია ხელი შეუწყოს პროვინციის ადგილმდებარეობისა და მართვის გაგებას.საგანგებო სიტუაციების დასადგენად, მეთოდი ნახაზი 1B ასახავს ეკოლოგიურად მსგავსი პროვინციების ბუდეებს.ეკო-პროვინციები დაჯგუფებულია ეკოლოგიური მსგავსების საფუძველზე და პროვინციების ასეთ დაჯგუფებას ეწოდება AEP.დააყენეთ რეგულირებადი „სირთულე“ განსახილველი პროვინციების საერთო რაოდენობის მიხედვით.ტერმინი „სირთულე“ გამოიყენება, რადგან ის იძლევა საგანგებო ატრიბუტების დონის რეგულირების საშუალებას.მნიშვნელოვანი აგრეგაციების განსასაზღვრად, საშუალო პროვინციული BC სხვაობა 0.227 ლონგჰერსტისგან გამოიყენება, როგორც საორიენტაციო ნიშანი.ამ ნიშნის ქვემოთ გაერთიანებული პროვინციები აღარ ითვლება გამოსადეგად.
როგორც ნაჩვენებია სურათზე 3B, გლობალური ეკოლოგიური პროვინციები თანმიმდევრულია.BC პროვინციული განსხვავებების გამოყენებით, ჩანს, რომ ზოგიერთი კონფიგურაცია ძალიან "ჩვეულებრივია".გენეტიკისა და გრაფების თეორიის მეთოდებით შთაგონებული, „დაკავშირებული გრაფიკები“ გამოიყენება 100-ზე მეტი პროვინციის დასალაგებლად მათთვის ყველაზე მსგავსი პროვინციების მიხედვით.„დაკავშირების“ მეტრიკა აქ განისაზღვრება BC პროვინციული განსხვავების გამოყენებით (30).პროვინციების რაოდენობა, სადაც უფრო დიდი სივრცეა 100-ზე მეტი პროვინციის კლასიფიკაციისთვის, აქ შეიძლება მოხსენიებული იყოს როგორც სირთულე.AEP არის პროდუქტი, რომელიც აერთიანებს 100-ზე მეტ პროვინციას, როგორც ყველაზე დომინანტურ/უახლოეს ეკოლოგიურ პროვინციებს.თითოეული ეკოლოგიური პროვინცია მიეკუთვნება დომინანტურ/უაღრესად დაკავშირებული ეკოლოგიურ პროვინციას, რომელიც ყველაზე მეტად ჰგავს მათ.ეს აგრეგაცია, რომელიც განისაზღვრება ძვ.
შერჩეული სირთულე შეიძლება იყოს ნებისმიერი მნიშვნელობა 1-დან ფიგურის სრულ სირთულემდე.2A.უფრო დაბალი სირთულის შემთხვევაში, AEP შეიძლება გადაგვარდეს განზომილების ალბათობის შემცირების საფეხურის (t-SNE) გამო.დეგენერაცია ნიშნავს, რომ ეკოლოგიური პროვინციები შეიძლება მიენიჭოს სხვადასხვა AEP-ს გამეორებებს შორის, რითაც შეიცვლება დაფარული გეოგრაფიული არეალი.სურათი 4C ასახავს BC განსხვავებების გავრცელებას პროვინციებში მზარდი სირთულის AEP-ებში 10 განხორციელებაში (ილუსტრაცია ნახატ 1B-ზე).ნახაზზე 4C, 2σ (ლურჯი ფართობი) არის დეგრადაციის საზომი 10 განხორციელებაში და მწვანე ხაზი წარმოადგენს Longhurst-ის ნიშნულს.ფაქტებმა დაამტკიცეს, რომ 12-ის სირთულემ შეიძლება შეინარჩუნოს BC სხვაობა პროვინციაში Longhurst-ის ნიშნის ქვემოთ ყველა განხორციელებაში და შეინარჩუნოს შედარებით მცირე 2σ დეგრადაცია.მოკლედ, მინიმალური რეკომენდირებული სირთულე არის 12 AEP და საშუალო პროვინციული BC სხვაობა შეფასებული 51 პლანქტონის ტიპის გამოყენებით არის 0.198±0.013, როგორც ნაჩვენებია სურათზე 4D.პლანქტონის შვიდი ფუნქციური ჯგუფის ჯამის გამოყენებით, პროვინციის შიგნით BC სხვაობა არის 2σ ნაცვლად 0,198±0,004.შედარება BC განსხვავებებს შორის, რომელიც გამოითვლება შვიდი ფუნქციური ჯგუფის მთლიან ბიომასასთან ან პლანქტონის 51 ტიპის ბიომასასთან, გვიჩვენებს, რომ მიუხედავად იმისა, რომ SAGE მეთოდი გამოიყენება 51-განზომილებიანი სიტუაციისთვის, ის არის შვიდი ფუნქციური ჯგუფის მთლიანი ბიომასისთვის. ტრენინგისთვის.
ნებისმიერი კვლევის მიზნიდან გამომდინარე, შეიძლება ჩაითვალოს სირთულის სხვადასხვა დონე.რეგიონული კვლევები შეიძლება მოითხოვდეს სრულ სირთულეს (ანუ 115-ვე პროვინცია).როგორც მაგალითი და სიცხადისთვის, განიხილეთ მინიმალური რეკომენდებული სირთულის 12.
როგორც SAGE მეთოდის გამოყენების მაგალითი, აქ გამოყენებულია 12 AEP მინიმალური სირთულით 12, რათა გამოიკვლიონ გადაუდებელი თემის სტრუქტურის კონტროლი.სურათი 5 ასახავს AEP-ით დაჯგუფებულ ეკოლოგიურ შეხედულებებს (A-დან L-მდე): რედფილდის სტოქიომეტრიაში გეოგრაფიული არეალი (სურათი 5C), ფუნქციური ჯგუფის ბიომასის შემადგენლობა (სურათი 5A) და საკვები ნივთიერებების მიწოდება (სურათი 5B) შესრულებულია N Zoomed-ით.ნაჩვენებია თანაფარდობა (N:Si:P:Fe, 1:1:16:16×103).ამ უკანასკნელ პანელზე P გამრავლებული 16-ზე და Fe გამრავლებული 16×103-ზე, ასე რომ, სვეტოვანი დიაგრამა ფიტოპლანქტონის კვების მოთხოვნილებების ექვივალენტურია.
პროვინციები კლასიფიცირებულია 12 AEP-ად A-დან L. (A) ეკოსისტემების ბიომასა (mgC/m3) 12 პროვინციაში.(B) დაშლილი არაორგანული აზოტის (N), რკინის (Fe), ფოსფატის (P) და სილიციუმის მჟავას (Si) (მმოლ/მ3 წელიწადში) საკვები ნივთიერებების ნაკადის სიჩქარე.Fe და P მრავლდება 16-ზე და 16×103-ზე, შესაბამისად, ისე, რომ ზოლები სტანდარტიზებულია ფიტოპლანქტონის სტოიქიომეტრიის მოთხოვნების შესაბამისად.(C) გაითვალისწინეთ განსხვავება პოლარულ რეგიონებს, სუბტროპიკულ ციკლონებსა და ძირითად სეზონურ/აღმავალ რეგიონებს შორის.მონიტორინგის სადგურები მონიშნულია შემდეგნაირად: 1, SEATS;2, ALOHA;3, სადგური P;და 4, ღამურები.
იდენტიფიცირებული AEP უნიკალურია.არის გარკვეული სიმეტრია ეკვატორის გარშემო ატლანტისა და წყნარი ოკეანეებში და მსგავსი, მაგრამ გაფართოებული ტერიტორია არსებობს ინდოეთის ოკეანეში.ზოგიერთი AEP მოიცავს კონტინენტის დასავლეთ მხარეს, რომელიც დაკავშირებულია აღმართთან.სამხრეთ პოლუსის ცირკუპოლარული დინება განიხილება, როგორც დიდი ზონალური მახასიათებელი.სუბტროპიკული ციკლონი არის ოლიგოტროფული AEP-ის რთული სერია.ამ პროვინციებში აშკარაა ბიომასის განსხვავებების ნაცნობი ნიმუში პლანქტონით დომინირებულ ოლიგოტროფულ მორევებსა და დიატომებით მდიდარ პოლარულ რეგიონებს შორის.
ძალიან მსგავსი მთლიანი ფიტოპლანქტონის ბიომასის მქონე AEP-ებს შეიძლება ჰქონდეთ ძალიან განსხვავებული საზოგადოების სტრუქტურა და მოიცავდნენ სხვადასხვა გეოგრაფიულ არეალს, როგორიცაა D, H და K, რომლებსაც აქვთ მსგავსი მთლიანი ფიტოპლანქტონის ბიომასი.AEP H ძირითადად არსებობს ეკვატორულ ინდოეთის ოკეანეში და უფრო მეტი დიაზოტროფული ბაქტერიაა.AEP D გვხვდება რამდენიმე აუზში, მაგრამ ის განსაკუთრებით გამორჩეულია წყნარ ოკეანეში, ეკვატორული ამაღლების გარშემო მაღალი მოსავლიანობის ზონებში.ამ წყნარი ოკეანის პროვინციის ფორმა პლანეტარული ტალღის მატარებელს მოგვაგონებს.AEP D-ში ცოტაა დიაზობაქტერია და მეტი კონუსი.დანარჩენ ორ პროვინციასთან შედარებით, AEP K მხოლოდ არქტიკული ოკეანის მაღალმთიანეთშია ნაპოვნი და უფრო მეტი დიატომია და ნაკლები პლანქტონი.აღსანიშნავია, რომ ამ სამ რეგიონში პლანქტონის რაოდენობაც ძალიან განსხვავებულია.მათ შორის AEP K-ის პლანქტონის სიმრავლე შედარებით დაბალია, ხოლო AEP D და H შედარებით მაღალია.ამიტომ, მიუხედავად მათი ბიომასისა (და, შესაბამისად, Chl-a-ს მსგავსი), ეს პროვინციები საკმაოდ განსხვავებულია: Chl-ზე დაფუძნებული პროვინციების ტესტირებამ შეიძლება ვერ დააფიქსიროს ეს განსხვავებები.
ასევე აშკარაა, რომ ზოგიერთი AEPs ძალიან განსხვავებული ბიომასით შეიძლება იყოს მსგავსი ფიტოპლანქტონის საზოგადოების სტრუქტურის თვალსაზრისით.მაგალითად, ეს ჩანს AEP D-სა და E-ში. ისინი ახლოს არიან ერთმანეთთან, ხოლო წყნარ ოკეანეში AEP E ახლოს არის მაღალპროდუქტიულ AEPJ-თან.ანალოგიურად, არ არსებობს მკაფიო კავშირი ფიტოპლანქტონის ბიომასა და ზოოპლანქტონის სიმრავლეს შორის.
AEP შეიძლება გავიგოთ მათთვის მიწოდებული საკვები ნივთიერებების თვალსაზრისით (სურათი 5B).დიატომები არსებობს მხოლოდ იქ, სადაც არის სილიციუმის მჟავის საკმარისი მარაგი.ზოგადად, რაც უფრო მაღალია სილიციუმის მჟავას მარაგი, მით უფრო მაღალია დიატომის ბიომასა.დიატომები შეიძლება ნახოთ AEP A, J, K და L-ში. დიატომის ბიომასის თანაფარდობა სხვა ფიტოპლანქტონთან მიმართებაში განისაზღვრება N, P და Fe-ით, რომლებიც უზრუნველყოფილია დიატომის მოთხოვნილებასთან მიმართებაში.მაგალითად, AEP L დომინირებს დიატომებით.სხვა საკვებ ნივთიერებებთან შედარებით, Si-ს აქვს ყველაზე მაღალი მარაგი.ამის საპირისპიროდ, მაღალი პროდუქტიულობის მიუხედავად, AEP J-ს აქვს ნაკლები დიატომები და ნაკლები სილიციუმის მარაგი (ყველა და სხვა საკვებ ნივთიერებებთან შედარებით).
დიაზონიუმის ბაქტერიას აქვს აზოტის დაფიქსირების უნარი, მაგრამ ნელა იზრდება (31).ისინი თანაარსებობენ სხვა ფიტოპლანქტონებთან, სადაც რკინა და ფოსფორი გადაჭარბებულია არადიაზონური საკვები ნივთიერებების მოთხოვნილებასთან შედარებით (20, 21).აღსანიშნავია, რომ დიაზოტროფული ბიომასა შედარებით მაღალია, ხოლო Fe-ს და P-ის მარაგი შედარებით დიდია N-ის მიწოდებასთან შედარებით. ამგვარად, მიუხედავად იმისა, რომ მთლიანი ბიომასა AEP J-ში უფრო მაღალია, დიაზონიუმის ბიომასა AEP H-ში არის. უფრო დიდი ვიდრე J. გთხოვთ გაითვალისწინოთ, რომ AEP J და H გეოგრაფიულად ძალიან განსხვავებულია და H მდებარეობს ეკვატორულ ინდოეთის ოკეანეში.
თუ უნიკალური ეკოსისტემის სტრუქტურა არ იყოფა პროვინციებად, 12 AEP-ის ყველაზე დაბალი სირთულის მოდელებიდან მიღებული შეხედულებები არც ისე ნათელი იქნება.SAGE-ის მიერ გენერირებული AEP ხელს უწყობს ეკოსისტემის მოდელების რთული და მაღალგანზომილებიანი ინფორმაციის თანმიმდევრულ და ერთდროულ შედარებას.AEP ეფექტურად ხაზს უსვამს, თუ რატომ არ არის Chl კარგი და ალტერნატიული მეთოდი საზოგადოების სტრუქტურის ან ზოოპლანქტონის სიმრავლის დასადგენად უფრო მაღალ საკვებ ნივთიერებებზე.მიმდინარე კვლევის თემების დეტალური ანალიზი სცილდება ამ სტატიის ფარგლებს.SAGE მეთოდი საშუალებას გაძლევთ გამოიკვლიოთ სხვა მექანიზმები მოდელში, რაც უფრო ადვილია, ვიდრე წერტილიდან წერტილამდე დათვალიერება.
SAGE მეთოდი შემოთავაზებულია, რათა დაეხმაროს უკიდურესად რთული ეკოლოგიური მონაცემების გარკვევას გლობალური ფიზიკური/ბიოგეოქიმიური/ეკოსისტემური რიცხვითი მოდელებიდან.ეკოლოგიური პროვინცია განისაზღვრება ჯვარედინი პლანქტონის ფუნქციური ჯგუფების მთლიანი ბიომასით, t-SNE ალბათობის განზომილების შემცირების ალგორითმის გამოყენებით და კლასტერული ML მეთოდის DBSCAN-ის გამოყენებით.პროვინციული BC განსხვავება/გრაფიკის თეორია ბუდეების მეთოდისთვის გამოიყენება ძლიერი AEP-ის გამოსაყვანად, რომელიც შეიძლება გამოყენებულ იქნას გლობალური ინტერპრეტაციისთვის.მშენებლობის თვალსაზრისით, ეკო-პროვინცია და AEP უნიკალურია.AEP ბუდე შეიძლება მორგებული იყოს ორიგინალური ეკოლოგიური პროვინციის სრულ სირთულესა და 12 AEP-ის რეკომენდებულ მინიმალურ ზღურბლს შორის.ბუდე და AEP-ის მინიმალური სირთულის განსაზღვრა განიხილება, როგორც ძირითადი საფეხურები, რადგან ალბათობა t-SNE არღვევს <12 სირთულის AEP-ებს.SAGE მეთოდი გლობალურია და მისი სირთულე მერყეობს> 100 AEP-დან 12-მდე. სიმარტივისთვის, აქცენტი გაკეთებულია 12 გლობალური AEP-ის სირთულეზე.მომავალმა კვლევებმა, განსაკუთრებით რეგიონულმა კვლევებმა, შეიძლება გამოავლინოს გლობალური ეკო-პროვინციების უფრო მცირე სივრცითი ქვეჯგუფი და შეიძლება იყოს გაერთიანებული უფრო მცირე ფართობზე, რათა ისარგებლოს იგივე ეკოლოგიური შეხედულებებით, რომლებიც აქ განხილულია.მასში მოცემულია წინადადებები იმის შესახებ, თუ როგორ შეიძლება ამ ეკოლოგიური პროვინციების და მათგან მიღებული შეხედულებების გამოყენება შემდგომი ეკოლოგიური გაგებისთვის, მოდელების შედარების გასაადვილებლად და საზღვაო ეკოსისტემების მონიტორინგის პოტენციურად გასაუმჯობესებლად.
SAGE მეთოდით გამოვლენილი ეკოლოგიური პროვინცია და AEP ეფუძნება რიცხვითი მოდელის მონაცემებს.განმარტებით, რიცხვითი მოდელი არის გამარტივებული სტრუქტურა, რომელიც ცდილობს დაიჭიროს სამიზნე სისტემის არსი და სხვადასხვა მოდელს ექნება პლანქტონის განსხვავებული განაწილება.ამ კვლევაში გამოყენებული რიცხვითი მოდელი სრულად ვერ ასახავს ზოგიერთ დაკვირვებულ შაბლონს (მაგალითად, ეკვატორული რეგიონისა და სამხრეთ ოკეანის Chl შეფასებებში).რეალურ ოკეანეში მრავალფეროვნების მხოლოდ მცირე ნაწილია დაფიქსირებული და მეზო და ქვემეზოსკალები ვერ წყდება, რამაც შეიძლება გავლენა მოახდინოს საკვები ნივთიერებების ნაკადზე და უფრო მცირე მასშტაბის საზოგადოების სტრუქტურაზე.მიუხედავად ამ ხარვეზებისა, ირკვევა, რომ AEP ძალიან სასარგებლოა რთული მოდელების გაგებაში.შეფასებით, თუ სად არის მსგავსი ეკოლოგიური პროვინციები, AEP უზრუნველყოფს პოტენციური რიცხვითი მოდელის შედარების ინსტრუმენტს.ამჟამინდელი რიცხვითი მოდელი ასახავს დისტანციური ზონდირების ფიტოპლანქტონის Chl-a კონცენტრაციის საერთო ნიმუშს და პლანქტონის ზომისა და ფუნქციური ჯგუფის განაწილებას (შენიშვნა S1 და სურათი S1) (2, 32).
როგორც ნაჩვენებია 0.1 მგChl-a/m-3 კონტურის ხაზით, AEP იყოფა ოლიგოტროფულ და მეზოტროფულ არეალად (სურათი S1B): AEP B, C, D, E, F და G არის ოლიგოტროფული არეები, ხოლო დანარჩენი არეები არის მდებარეობს უმაღლესი ჩლ-ა.AEP გვიჩვენებს გარკვეულ მიმოწერას ლონგჰერსტის პროვინციასთან (სურათი S3A), მაგალითად, სამხრეთ ოკეანე და ეკვატორული წყნარი ოკეანე.ზოგიერთ რეგიონში AEP მოიცავს ლონგჰერსტის მრავალ რეგიონს და პირიქით.ვინაიდან განზრახვა ამ მხარეში და ლონგჰერსტის პროვინციების დელიმიტაციის განზრახვა განსხვავებულია, მოსალოდნელია, რომ იქნება განსხვავებები.მრავალი AEP ლონგჰერსტის პროვინციაში მიუთითებს, რომ მსგავსი ბიოგეოქიმიის მქონე ზოგიერთ რეგიონს შეიძლება ჰქონდეს ძალიან განსხვავებული ეკოსისტემის სტრუქტურა.AEP ავლენს გარკვეულ შესაბამისობას ფიზიკურ მდგომარეობებთან, როგორც ეს გამოვლინდა უკონტროლო სწავლის გამოყენებით (19), როგორიცაა მაღალი ამაღლების ქვეყნებში (მაგალითად, სამხრეთ ოკეანე და ეკვატორული წყნარი ოკეანე; სურათი S3, C და D).ეს მიმოწერები მიუთითებს იმაზე, რომ პლანქტონის საზოგადოების სტრუქტურაზე ძლიერ გავლენას ახდენს ოკეანის დინამიკა.ისეთ ადგილებში, როგორიცაა ჩრდილო ატლანტიკური, AEP გადის ფიზიკურ პროვინციებს.მექანიზმი, რომელიც იწვევს ამ განსხვავებებს, შეიძლება მოიცავდეს პროცესებს, როგორიცაა მტვრის ტრანსპორტირება, რამაც შეიძლება გამოიწვიოს სრულიად განსხვავებული კვების პროგრამები, თუნდაც მსგავს ფიზიკურ პირობებში.
ეკოლოგიის სამინისტრომ და AEP-მა აღნიშნეს, რომ მარტო Chl-ის გამოყენებით შეუძლებელია ეკოლოგიური კომპონენტების იდენტიფიცირება, როგორც ეს უკვე გააცნობიერა საზღვაო ეკოლოგიურმა საზოგადოებამ.ეს ჩანს AEP-ებში მსგავსი ბიომასის, მაგრამ მნიშვნელოვნად განსხვავებული ეკოლოგიური შემადგენლობით (როგორიცაა D და E).ამის საპირისპიროდ, AEP-ებს, როგორიცაა D და K, აქვთ ძალიან განსხვავებული ბიომასა, მაგრამ მსგავსი ეკოლოგიური შემადგენლობა.AEP ხაზს უსვამს, რომ ბიომასის, ეკოლოგიური შემადგენლობისა და ზოოპლანქტონის სიმრავლეს შორის ურთიერთობა რთულია.მაგალითად, მიუხედავად იმისა, რომ AEP J გამოირჩევა ფიტოპლანქტონისა და პლანქტონის ბიომასის თვალსაზრისით, AEP-ის A და L-ს აქვთ მსგავსი პლანქტონის ბიომასა, მაგრამ A-ს აქვს პლანქტონის უფრო მაღალი სიმრავლე.AEP ხაზს უსვამს, რომ ფიტოპლანქტონის ბიომასის (ან Chl) გამოყენება შეუძლებელია ზოოპლანქტონის ბიომასის პროგნოზირებისთვის.ზოოპლანქტონი არის მეთევზეობის კვების ჯაჭვის საფუძველი და უფრო ზუსტმა შეფასებებმა შეიძლება გამოიწვიოს რესურსების უკეთესი მართვა.მომავალი საზღვაო ფერის თანამგზავრები [მაგალითად, PACE (პლანქტონი, აეროზოლი, ღრუბელი და საზღვაო ეკოსისტემა)] შეიძლება უკეთესად იყოს განლაგებული, რათა დაეხმარონ ფიტოპლანქტონის საზოგადოების სტრუქტურის შეფასებას.AEP პროგნოზის გამოყენებამ შეიძლება ხელი შეუწყოს ზოოპლანქტონის შეფასებას კოსმოსიდან.მეთოდებს, როგორიცაა SAGE, ახალ ტექნოლოგიებთან ერთად და უფრო და უფრო მეტ საველე მონაცემებს, რომლებიც ხელმისაწვდომია სახმელეთო ჭეშმარიტების გამოკვლევებისთვის (როგორიცაა ტარა და შემდგომი კვლევა), ერთობლივად შეუძლიათ გადადგან ნაბიჯი თანამგზავრზე დაფუძნებული ეკოსისტემის ჯანმრთელობის მონიტორინგისკენ.
SAGE მეთოდი უზრუნველყოფს მოსახერხებელ გზას ზოგიერთი მექანიზმის შესაფასებლად, რომელიც აკონტროლებს პროვინციის მახასიათებლებს, როგორიცაა ბიომასა/Chl, წმინდა პირველადი წარმოება და საზოგადოების სტრუქტურა.მაგალითად, დიატომების ფარდობითი რაოდენობა განისაზღვრება Si, N, P და Fe მიწოდების დისბალანსით ფიტოპლანქტონის სტექიომეტრიულ მოთხოვნებთან შედარებით.დაბალანსებული მიწოდების მაჩვენებლით საზოგადოებაში დომინირებს დიატომები (L).როდესაც მიწოდების მაჩვენებელი დაუბალანსებელია (ანუ, სილიციუმის მიწოდება უფრო დაბალია, ვიდრე საკვები ნივთიერებების მოთხოვნა დიატომებზე), დიატომები მხოლოდ მცირე წილს შეადგენს (K).როდესაც Fe და P-ის მარაგი აღემატება N-ის მიწოდებას (მაგალითად, E და H), დიაზოტროფული ბაქტერიები ენერგიულად გაიზრდებიან.AEP-ის მიერ მოწოდებული კონტექსტის მეშვეობით კონტროლის მექანიზმების შესწავლა უფრო სასარგებლო გახდება.
ეკო-პროვინცია და AEP არის ტერიტორიები მსგავსი თემის სტრუქტურებით.დროის სერია გარკვეული ადგილიდან ეკოლოგიური პროვინციის ან AEP-ის ფარგლებში შეიძლება ჩაითვალოს საცნობარო პუნქტად და შეიძლება წარმოადგენდეს ეკოლოგიური პროვინციის ან AEP-ის მიერ დაფარულ ტერიტორიას.გრძელვადიანი ადგილზე მონიტორინგის სადგურები უზრუნველყოფენ ასეთ დროის სერიას.გრძელვადიანი in-situ მონაცემთა ნაკრები გააგრძელებს გამოუთვლელ როლს.საზოგადოების სტრუქტურის მონიტორინგის პერსპექტივიდან SAGE მეთოდი შეიძლება ჩაითვალოს, როგორც გზა, რომელიც დაეხმარება ახალი საიტების ყველაზე სასარგებლო მდებარეობის განსაზღვრას.მაგალითად, დროის სერია გრძელვადიანი ოლიგოტროფული ჰაბიტატის შეფასებიდან (ALOHA) არის ოლიგოტროფული არეალის AEP B-ში (სურათი 5C, ეტიკეტი 2).იმის გამო, რომ ALOHA ახლოს არის სხვა AEP-ის საზღვრებთან, დროის სერია შეიძლება არ იყოს მთელი არეალის წარმომადგენლობა, როგორც ადრე იყო შემოთავაზებული (33).იმავე AEP B-ში დროის სერია SEATS (სამხრეთ-აღმოსავლეთ აზიის დროის სერია) მდებარეობს სამხრეთ-დასავლეთ ტაივანში (34), სხვა AEP-ების საზღვრებიდან უფრო შორს (სურათი 5C, ეტიკეტი 1) და შეიძლება გამოყენებულ იქნას როგორც უკეთესი ადგილი მონიტორინგისთვის. AEPB.BATS (ბერმუდის ატლანტიკური დროის სერიის შესწავლა) დროის სერია (სურათი 5C, ეტიკეტი 4) AEPC-ში ძალიან ახლოს არის საზღვართან AEP C-სა და F-ს შორის, რაც მიუთითებს იმაზე, რომ AEP C-ის მონიტორინგი BATS დროის სერიების გამოყენებით შეიძლება პირდაპირ იყოს პრობლემატური.სადგური P AEP J-ში (სურათი 5C, ეტიკეტი 3) შორს არის AEP საზღვრიდან, ამიტომ უფრო წარმომადგენლობითია.ეკო-პროვინციასა და AEP-ს შეუძლია დაეხმაროს მონიტორინგის ჩარჩოს ჩამოყალიბებაში, რომელიც შესაფერისია გლობალური ცვლილებების შესაფასებლად, რადგან პროვინციების ნებართვა, შეაფასონ, თუ სად ხდება ადგილზე შერჩევის შესაძლებლობა.SAGE მეთოდი შეიძლება შემდგომ განვითარდეს კლიმატის მონაცემებზე გამოსაყენებლად დროის დაზოგვის ცვალებადობის შესაფასებლად.
SAGE მეთოდის წარმატება მიიღწევა მონაცემთა მეცნიერების/ML მეთოდებისა და დომენის სპეციფიკური ცოდნის ფრთხილად გამოყენებით.კონკრეტულად, t-SNE გამოიყენება განზომილების შემცირების შესასრულებლად, რომელიც ინარჩუნებს მაღალგანზომილებიანი მონაცემების კოვარიანულ სტრუქტურას და ხელს უწყობს კოვარიანტული ტოპოლოგიის ვიზუალიზაციას.მონაცემები განლაგებულია ზოლებისა და კოვარიანტების სახით (სურათი 2A), რაც მიუთითებს, რომ წმინდა დისტანციებზე დაფუძნებული ზომები (როგორიცაა K-საშუალებები) არ არის მიზანშეწონილი, რადგან ისინი ჩვეულებრივ იყენებენ გაუსიან (წრიულ) საფუძვლიან განაწილებას (განხილულია შენიშვნა S2-ში). .DBSCAN მეთოდი შესაფერისია ნებისმიერი კოვარიანტული ტოპოლოგიისთვის.სანამ ყურადღებას მიაქცევთ პარამეტრების დაყენებას, შესაძლებელია საიმედო იდენტიფიკაციის უზრუნველყოფა.t-SNE ალგორითმის გამოთვლითი ღირებულება მაღალია, რაც ზღუდავს მის ამჟამინდელ გამოყენებას მონაცემთა უფრო დიდი რაოდენობით, რაც ნიშნავს, რომ რთულია მისი გამოყენება ღრმა ან დროში ცვალებად ველებზე.t-SNE-ის მასშტაბურობაზე მუშაობა მიმდინარეობს.ვინაიდან KL მანძილის პარალელიზება მარტივია, t-SNE ალგორითმს აქვს კარგი პოტენციალი მომავალში გაფართოებისთვის (35).ჯერჯერობით, განზომილების შემცირების სხვა პერსპექტიული მეთოდები, რომლებიც უკეთესად შეამცირებენ ზომას, მოიცავს მრავალჯერადი მიახლოების და პროექციის (UMAP) ტექნიკას, მაგრამ შეფასება ოკეანის მონაცემების კონტექსტში აუცილებელია.უკეთესი მასშტაბურობის მნიშვნელობა არის, მაგალითად, გლობალური კლიმატის ან სხვადასხვა სირთულის მოდელების კლასიფიკაცია შერეულ ფენაზე.ტერიტორიები, რომლებიც ვერ იქნა კლასიფიცირებული SAGE-ის მიერ რომელიმე პროვინციაში, შეიძლება ჩაითვალოს ნახატ 2A-ში დარჩენილ შავ წერტილებად.გეოგრაფიულად, ეს ტერიტორიები ძირითადად მაღალ სეზონურ რაიონებშია, რაც ვარაუდობს, რომ დროთა განმავლობაში ცვალებადი ეკოლოგიური პროვინციების ხელში ჩაგდება უკეთ დაფარავს.
SAGE მეთოდის ასაგებად გამოყენებულია იდეები რთული სისტემებიდან/მონაცემთა მეცნიერებიდან, ფუნქციური ჯგუფების კლასტერების განსაზღვრის (11 განზომილებიანი სივრცეში ძალიან ახლოს ყოფნის შესაძლებლობა) და პროვინციების განსაზღვრის უნარის გამოყენებით.ეს პროვინციები ასახავს კონკრეტულ ტომებს ჩვენს 3D t-SNE ფაზის სივრცეში.ანალოგიურად, პუანკარეს ნაწილი შეიძლება გამოყენებულ იქნას ტრაექტორიის მიერ დაკავებული მდგომარეობის სივრცის „მოცულობის“ შესაფასებლად, რათა დადგინდეს „ნორმალური“ ან „ქაოტური“ ქცევა (36).სტატიკური 11-განზომილებიანი მოდელის გამოსასვლელად, მონაცემების 3D ფაზურ სივრცეში გადაქცევის შემდეგ დაკავებული მოცულობა შეიძლება აიხსნას ანალოგიურად.გეოგრაფიულ არეალსა და ტერიტორიას შორის ურთიერთობა 3D ფაზის სივრცეში მარტივი არ არის, მაგრამ ეს შეიძლება აიხსნას ეკოლოგიური მსგავსების თვალსაზრისით.ამ მიზეზით, უპირატესობა ენიჭება BC განსხვავებულობის უფრო ჩვეულებრივ ზომას.
სამომავლო სამუშაოები ხელახლა გამოიყენებს SAGE მეთოდს მონაცემების სეზონური ცვლილებისთვის, რათა შეფასდეს გამოვლენილი პროვინციებისა და AEP-ის სივრცითი ცვალებადობა.სამომავლო მიზანია ამ მეთოდის გამოყენება, რათა დადგინდეს რომელი პროვინციების დადგენა შესაძლებელია თანამგზავრული გაზომვების საშუალებით (როგორიცაა Chl-a, დისტანციური ზონდირების არეკვლა და ზღვის ზედაპირის ტემპერატურა).ეს საშუალებას მისცემს შეაფასოს ეკოლოგიური კომპონენტების დისტანციური ზონდირება და ეკოლოგიური პროვინციების და მათი ცვალებადობის მაღალი მოქნილი მონიტორინგი.
ამ კვლევის მიზანია SAGE მეთოდის დანერგვა, რომელიც განსაზღვრავს ეკოლოგიურ პროვინციას მისი უნიკალური პლანქტონის საზოგადოების სტრუქტურის მეშვეობით.აქ მოცემულია უფრო დეტალური ინფორმაცია ფიზიკური/ბიოგეოქიმიური/ეკოსისტემის მოდელისა და t-SNE და DBSCAN ალგორითმების პარამეტრების შერჩევის შესახებ.
მოდელის ფიზიკური კომპონენტები მოდის ოკეანის ცირკულაციისა და კლიმატის შეფასებიდან [ECCOv4;(37) გლობალური მდგომარეობის შეფასება, რომელიც აღწერილია (38).სახელმწიფო შეფასების ნომინალური რეზოლუციაა 1/5.უმცირესი კვადრატების მეთოდი ლაგრანგის მულტიპლიკატორის მეთოდით გამოიყენება საწყისი და სასაზღვრო პირობების და მოდელის შიდა პარამეტრების მისაღებად დაკვირვებით, რითაც წარმოიქმნება თავისუფალი გაშვებული MIT ზოგადი ციკლის მოდელი (MITgcm) (39), მოდელი ოპტიმიზაციის შემდეგ, შედეგები შეიძლება თვალყური ადევნეთ და დააკვირდეთ.
ბიოგეოქიმიას/ეკოსისტემას აქვს უფრო სრული აღწერა (ე.ი. განტოლებები და პარამეტრების მნიშვნელობები) (2).მოდელი ასახავს C, N, P, Si და Fe-ის ცირკულაციას არაორგანული და ორგანული აუზების მეშვეობით.აქ გამოყენებული ვერსია მოიცავს ფიტოპლანქტონის 35 სახეობას: მიკროპროკარიოტების 2 სახეობას და მიკროევკარიოტების 2 სახეობას (შესაფერისია დაბალი საკვები გარემოსთვის), 5 სახეობის Cryptomonas sphaeroides (კალციუმის კარბონატის საფარით), 5 სახეობის დიაზონიუმი (შეუძლია აზოტის დაფიქსირება, ასე რომ. ეს არ არის შეზღუდული) გახსნილი არაორგანული აზოტის ხელმისაწვდომობა), 11 დიატომი (წარმოქმნის სილიციუმურ საფარს), 10 შერეული მცენარეული ფლაგელატი (შეუძლია ფოტოსინთეზირება და სხვა პლანქტონის ჭამა) და 16 ზოოპლანქტონი (ძოვება სხვა პლანქტონზე).მათ უწოდებენ "ბიოგეოქიმიურ ფუნქციურ ჯგუფებს", რადგან მათ აქვთ განსხვავებული გავლენა საზღვაო ბიოგეოქიმიაზე (40, 41) და ხშირად გამოიყენება დაკვირვებისა და მოდელის კვლევებში.ამ მოდელში, თითოეული ფუნქციური ჯგუფი შედგება სხვადასხვა ზომის რამდენიმე პლანქტონისგან, 0,6-დან 2500 მკმ-მდე ეკვივალენტური სფერული დიამეტრით.
პარამეტრები, რომლებიც გავლენას ახდენენ ფიტოპლანქტონის ზრდაზე, ძოვებასა და ჩაძირვაზე, დაკავშირებულია ზომასთან და არსებობს სპეციფიკური განსხვავებები ფიტოპლანქტონის ექვს ფუნქციურ ჯგუფს შორის (32).მიუხედავად განსხვავებული ფიზიკური ჩარჩოებისა, მოდელის 51 პლანქტონის კომპონენტის შედეგები გამოყენებული იქნა უახლეს კვლევებში (42-44).
1992 წლიდან 2011 წლამდე ფიზიკური/ბიოგეოქიმიური/ეკოსისტემური დაწყვილების მოდელი 20 წლის განმავლობაში მუშაობდა.მოდელის გამოსავალი მოიცავს პლანქტონის ბიომასას, საკვები ნივთიერებების კონცენტრაციას და საკვები ნივთიერებების მიწოდების სიჩქარეს (DIN, PO4, Si და Fe).ამ კვლევაში ამ შედეგების 20 წლიანი საშუალო მაჩვენებელი გამოყენებული იქნა ეკოლოგიური პროვინციის შეყვანის სახით.Chl, პლანქტონის ბიომასისა და საკვები ნივთიერებების კონცენტრაციის განაწილება და ფუნქციური ჯგუფების განაწილება შედარებულია თანამგზავრულ და ადგილზე დაკვირვებებთან [იხ. (2, 44), შენიშვნა S1 და სურათი.S1-დან S3-მდე].
SAGE მეთოდისთვის, შემთხვევითობის მთავარი წყარო მოდის t-SNE საფეხურიდან.შემთხვევითობა აფერხებს განმეორებადობას, რაც ნიშნავს, რომ შედეგები არასანდოა.SAGE მეთოდი მკაცრად ამოწმებს სიმტკიცეს t-SNE და DBSCAN პარამეტრების ნაკრების განსაზღვრით, რომელსაც შეუძლია თანმიმდევრულად იდენტიფიცირება კლასტერების განმეორებისას.t-SNE პარამეტრის „გაურკვევლობის“ განსაზღვრა შეიძლება გავიგოთ, როგორც იმის განსაზღვრა, თუ რამდენად მაღალიდან დაბალ განზომილებაში რუქაზე უნდა იყოს დაცული მონაცემთა ლოკალური ან გლობალური მახასიათებლები.მიაღწია 400 და 300 გამეორების დაბნეულობას.
DBSCAN კლასტერიზაციის ალგორითმისთვის საჭიროა განისაზღვროს კლასტერში მონაცემთა წერტილების მინიმალური ზომა და მანძილი.მინიმალური რაოდენობა განისაზღვრება ექსპერტების ხელმძღვანელობით.ამ ცოდნამ იცის რა ერგება მიმდინარე რიცხვითი მოდელირების ჩარჩოსა და რეზოლუციას.მინიმალური რიცხვია 100. უფრო მაღალი მინიმალური მნიშვნელობა (<135-ზე ნაკლები, სანამ მწვანეს ზედა ზღვარი გაფართოვდება) შეიძლება ჩაითვალოს, მაგრამ ის ვერ შეცვლის აგრეგაციის მეთოდს, რომელიც დაფუძნებულია BC განსხვავებაზე.კავშირის ხარისხი (სურათი 6A) გამოიყენება ϵ პარამეტრის დასაყენებლად, რაც ხელს უწყობს უფრო მაღალ დაფარვას (სურათი 6B).დაკავშირება განისაზღვრება, როგორც კლასტერების კომპოზიტური რაოდენობა და მგრძნობიარეა ϵ პარამეტრის მიმართ.ქვედა კავშირი მიუთითებს არასაკმარისად მორგებაზე, რეგიონების ხელოვნურად დაჯგუფებაზე.მაღალი კავშირი მიუთითებს ზედმეტად მორგებაზე.ზედმეტად მორგება ასევე პრობლემურია, რადგან ის გვიჩვენებს, რომ თავდაპირველმა შემთხვევითმა გამოცნობებმა შეიძლება გამოიწვიოს არარეპროდუცირებადი შედეგები.ამ ორ უკიდურესობას შორის, მკვეთრი ზრდა (ჩვეულებრივ "იდაყვს" უწოდებენ) საუკეთესო ϵზე მიუთითებს.6A სურათზე ხედავთ პლატოს ფართობის მკვეთრ ზრდას (ყვითელი,> 200 მტევანი), რასაც მოჰყვება მკვეთრი შემცირება (მწვანე, 100 მტევანი), დაახლოებით 130-მდე, გარშემორტყმული ძალიან ცოტა მტევანით (ლურჯი, <60 მტევანი) ).სულ მცირე 100 ცისფერ უბანში ან ერთი გროვა დომინირებს მთელ ოკეანეზე (ϵ <0.42), ან ოკეანის უმეტესი ნაწილი არ არის კლასიფიცირებული და ითვლება ხმაურად (ϵ> 0.99).ყვითელ უბანს აქვს ძალიან ცვალებადი, განუმეორებელი კლასტერული განაწილება.როგორც ϵ მცირდება, ხმაური იზრდება.მკვეთრად მზარდ მწვანე ფართობს იდაყვი ეწოდება.ეს არის ოპტიმალური რეგიონი.მიუხედავად იმისა, რომ ალბათობა t-SNE გამოიყენება, BC სხვაობა პროვინციაში მაინც შეიძლება გამოყენებულ იქნას საიმედო კლასტერიზაციის დასადგენად.სურათი 6-ის (A და B) გამოყენებით დააყენეთ ϵ 0.39-ზე.რაც უფრო დიდია მინიმალური რიცხვი, მით უფრო მცირეა ϵ-ის მიღწევის ალბათობა, რომელიც იძლევა საიმედო კლასიფიკაციის საშუალებას და მით უფრო დიდია მწვანე ფართობი 135-ზე მეტი მნიშვნელობით. ამ ფართობის გაფართოება მიუთითებს იმაზე, რომ იდაყვის პოვნა უფრო რთული იქნება ან არსებული.
t-SNE-ის პარამეტრების დაყენების შემდეგ, ნაპოვნი კლასტერების მთლიანი რაოდენობა გამოყენებული იქნება კავშირის (A) და კლასტერისთვის (B) გამოყოფილი მონაცემების საზომად.წითელი წერტილი მიუთითებს დაფარვისა და დაკავშირების საუკეთესო კომბინაციაზე.მინიმალური რაოდენობა დგინდება ეკოლოგიასთან დაკავშირებული მინიმალური რაოდენობის მიხედვით.
ამ სტატიის დამატებითი მასალებისთვის იხილეთ http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
ეს არის ღია წვდომის სტატია, რომელიც ვრცელდება Creative Commons Attribution ლიცენზიის პირობებით.სტატია საშუალებას იძლევა შეუზღუდავი გამოყენება, გავრცელება და რეპროდუქცია ნებისმიერ საშუალებებში, იმ პირობით, რომ ორიგინალური ნამუშევარი სათანადოდ არის ციტირებული.
შენიშვნა: ჩვენ მხოლოდ გთხოვთ, მოგვაწოდოთ თქვენი ელ.ფოსტის მისამართი, რათა ადამიანმა, რომელსაც გვერდზე უწევთ რეკომენდაციას, იცოდეს, რომ გსურთ, ნახოს ელფოსტა და რომ ის არ არის სპამი.ჩვენ არ დავიჭერთ ელფოსტის მისამართებს.
ეს კითხვა გამოიყენება იმის შესამოწმებლად, ხართ თუ არა სტუმარი და თავიდან აიცილოთ ავტომატური სპამის გაგზავნა.
საზღვაო ეკოლოგიის გლობალური სამინისტრო გადაწყვეტილია რთული პრობლემების გადაჭრაში და იყენებს უკონტროლო ML-ს საზოგადოების სტრუქტურების შესასწავლად.
საზღვაო ეკოლოგიის გლობალური სამინისტრო გადაწყვეტილია რთული პრობლემების გადაჭრაში და იყენებს უკონტროლო ML-ს საზოგადოების სტრუქტურების შესასწავლად.
გამოქვეყნების დრო: იან-12-2021