Clarifying ecological complexity: unsupervised learning determines the global marine ecological province

វិធីសាស្រ្តសិក្សាដែលគ្មានការត្រួតពិនិត្យត្រូវបានស្នើឡើងដើម្បីកំណត់ខេត្តអេកូឡូស៊ីសមុទ្រពិភពលោក (ខេត្តអេកូ) ដោយផ្អែកលើរចនាសម្ព័ន្ធសហគមន៍ Plankton និងទិន្នន័យលំហូរសារធាតុចិញ្ចឹម។វិធីសាស្រ្តនៃខេត្តអេកូឡូស៊ីរួមបញ្ចូលគ្នាជាប្រព័ន្ធ (SAGE) អាចកំណត់អត្តសញ្ញាណខេត្តអេកូឡូស៊ីនៅក្នុងគំរូប្រព័ន្ធអេកូឡូស៊ីដែលមិនលីនេអ៊ែរខ្ពស់។ដើម្បីសម្របទៅនឹងភាពខុសគ្នានៃទិន្នន័យដែលមិនមែនជា Gaussian SAGE ប្រើការបង្កប់អ្នកជិតខាងដោយចៃដន្យ (t-SNE) ដើម្បីកាត់បន្ថយវិមាត្រ។ដោយមានជំនួយពីកម្មវិធីសំឡេងដែលផ្អែកលើក្បួនដោះស្រាយការចង្កោមលំហដែលផ្អែកលើដង់ស៊ីតេ (DBSCAN) ខេត្តអេកូឡូស៊ីជាងមួយរយអាចត្រូវបានកំណត់អត្តសញ្ញាណ។ដោយប្រើផែនទីតភ្ជាប់ជាមួយនឹងភាពខុសគ្នានៃអេកូឡូស៊ីជារង្វាស់ចម្ងាយ ខេត្តអេកូឡូស៊ីប្រមូលផ្តុំដ៏រឹងមាំ (AEP) ត្រូវបានកំណត់ជាកម្មវត្ថុតាមរយៈខេត្តអេកូឡូស៊ីដែលមានសំបុក។ដោយប្រើ AEPs ការគ្រប់គ្រងអត្រាផ្គត់ផ្គង់សារធាតុចិញ្ចឹមលើរចនាសម្ព័ន្ធសហគមន៍ត្រូវបានរុករក។ខេត្តអេកូ និង AEP គឺប្លែកពីគេ ហើយអាចជួយការបកស្រាយគំរូ។ពួកគេអាចជួយសម្រួលដល់ការប្រៀបធៀបរវាងគំរូ និងអាចបង្កើនការយល់ដឹង និងការត្រួតពិនិត្យប្រព័ន្ធអេកូឡូស៊ីសមុទ្រ។
ខេត្តគឺជាតំបន់ដែលជីវវិទ្យាស្មុគ្រស្មាញនៅលើសមុទ្រ ឬដីត្រូវបានរៀបចំជាតំបន់ដែលមានភាពស៊ីសង្វាក់គ្នា និងមានអត្ថន័យ (1).ខេត្តទាំងនេះមានសារៈសំខាន់ណាស់សម្រាប់ការប្រៀបធៀប និងទីតាំងផ្ទុយគ្នា កំណត់លក្ខណៈនៃការសង្កេត ការត្រួតពិនិត្យ និងការការពារ។អន្តរកម្មស្មុគ្រស្មាញ និងមិនមែនលីនេអ៊ែរ ដែលបង្កើតខេត្តទាំងនេះបង្កើតវិធីសាស្ត្ររៀនម៉ាស៊ីនគ្មានការត្រួតពិនិត្យ (ML) សមរម្យណាស់សម្រាប់ការកំណត់ខេត្តដោយវត្ថុបំណង ពីព្រោះភាពខុសគ្នានៅក្នុងទិន្នន័យគឺស្មុគស្មាញ និងមិនមែនជាហ្គោសៀន។នៅទីនេះ វិធីសាស្ត្រ ML ត្រូវបានស្នើឡើង ដែលកំណត់ជាប្រព័ន្ធនូវខេត្តអេកូឡូស៊ីសមុទ្រដែលមានតែមួយគត់ (ខេត្តអេកូ) ពីគំរូរូបវន្ត/ប្រព័ន្ធអេកូឡូស៊ីបីវិមាត្រពិភពលោក Darwin (3D) (2)។ពាក្យ "តែមួយគត់" ត្រូវបានប្រើដើម្បីបង្ហាញថាតំបន់ដែលបានកំណត់មិនត្រួតស៊ីគ្នាគ្រប់គ្រាន់ជាមួយតំបន់ផ្សេងទៀតទេ។វិធីសាស្រ្តនេះត្រូវបានគេហៅថាវិធីសាស្រ្តខេត្តអេកូឡូស៊ីរួមបញ្ចូលគ្នាប្រព័ន្ធ (SAGE) ។ដើម្បីអនុវត្តការចាត់ថ្នាក់ដែលមានប្រយោជន៍ វិធីសាស្ត្រក្បួនដោះស្រាយត្រូវអនុញ្ញាតឱ្យ (i) ការចាត់ថ្នាក់ជាសកល និង (ii) ការវិភាគពហុមាត្រដ្ឋាន ដែលអាចត្រូវបានដាក់បញ្ចូលក្នុងលំហ និងពេលវេលា (3) ។នៅក្នុងការស្រាវជ្រាវនេះ វិធីសាស្ត្រ SAGE ត្រូវបានស្នើឡើងជាលើកដំបូង ហើយខេត្តអេកូឡូស៊ីដែលបានកំណត់ត្រូវបានពិភាក្សា។ខេត្តអេកូអាចលើកកម្ពស់ការយល់ដឹងអំពីកត្តាដែលគ្រប់គ្រងរចនាសម្ព័ន្ធសហគមន៍ ផ្តល់ការយល់ដឹងដ៏មានប្រយោជន៍សម្រាប់យុទ្ធសាស្ត្រតាមដាន និងជួយតាមដានការផ្លាស់ប្តូរនៅក្នុងប្រព័ន្ធអេកូ។
ខេត្តនៅលើដីជាធម្មតាត្រូវបានចាត់ថ្នាក់តាមភាពស្រដៀងគ្នានៃអាកាសធាតុ (ទឹកភ្លៀង និងសីតុណ្ហភាព) ដី បន្លែ និងសត្វ ហើយត្រូវបានប្រើសម្រាប់ការគ្រប់គ្រងជំនួយ ការស្រាវជ្រាវជីវចម្រុះ និងការគ្រប់គ្រងជំងឺ (1, 4) ។ខេត្តសមុទ្រកាន់តែពិបាកកំណត់។សារពាង្គកាយភាគច្រើនមានមីក្រូទស្សន៍ដោយមានព្រំដែនសារធាតុរាវ។Longhurst et al ។(5) បានផ្តល់ចំណាត់ថ្នាក់ជាសកលដំបូងបង្អស់មួយរបស់ក្រសួងមហាសមុទ្រ ដោយផ្អែកលើលក្ខខណ្ឌបរិស្ថាន។និយមន័យនៃខេត្ត "Longhurst" ទាំងនេះរួមមានអថេរដូចជា អត្រានៃការលាយ ការដាក់កម្រិត និងការ irradiance ក៏ដូចជាបទពិសោធន៍ដ៏ទូលំទូលាយរបស់ Longhurst ក្នុងនាមជាអ្នកសង្កេតការណ៍សមុទ្រសមុទ្រ ដែលមានលក្ខខណ្ឌសំខាន់ៗផ្សេងទៀតសម្រាប់ប្រព័ន្ធអេកូឡូស៊ីសមុទ្រ។ជាឧទាហរណ៍ Longhurst ត្រូវបានប្រើប្រាស់យ៉ាងទូលំទូលាយ ដើម្បីវាយតម្លៃការផលិតបឋម និងលំហូរកាបូន ជំនួយជលផល និងផែនការក្នុងសកម្មភាពសង្កេតទីតាំង (5-9)។ដើម្បីកំណត់ខេត្តឱ្យកាន់តែច្បាស់ វិធីសាស្ត្រដូចជាតក្កវិជ្ជាស្រពិចស្រពិល និងការធ្វើចង្កោម/ស្ថិតិដែលមិនមានការត្រួតពិនិត្យតាមតំបន់ត្រូវបានប្រើ (9-14)។គោលបំណងនៃវិធីសាស្រ្តនេះគឺដើម្បីកំណត់អត្តសញ្ញាណរចនាសម្ព័ន្ធដែលមានអត្ថន័យដែលអាចកំណត់អត្តសញ្ញាណខេត្តនៅក្នុងទិន្នន័យសង្កេតដែលមាន។ជាឧទាហរណ៍ ខេត្តសមុទ្រថាមវន្ត (12) ប្រើផែនទីរៀបចំដោយខ្លួនឯងដើម្បីកាត់បន្ថយសំលេងរំខាន និងប្រើការចង្កោមតាមឋានានុក្រម (ផ្អែកលើដើមឈើ) ដើម្បីកំណត់ផលិតផលពណ៌សមុទ្រដែលបានមកពីផ្កាយរណបក្នុងតំបន់ [chlorophyll a (Chl-a) កម្ពស់បន្ទាត់ហ្វ្លុយអូរីសធម្មតា និង សារធាតុសរីរាង្គរំលាយពណ៌] និងវាលរូបវ័ន្ត (សីតុណ្ហភាពផ្ទៃសមុទ្រ និងជាតិប្រៃ សណ្ឋានដីថាមវន្តដាច់ខាត និងទឹកកកសមុទ្រ)។
រចនាសម្ព័ន្ធសហគមន៍របស់ Plankton មានការព្រួយបារម្ភ ពីព្រោះបរិស្ថានវិទ្យារបស់វាមានឥទ្ធិពលយ៉ាងខ្លាំងទៅលើកម្រិតសារធាតុចិញ្ចឹមខ្ពស់ ការស្រូបយកកាបូន និងអាកាសធាតុ។ទោះជាយ៉ាងណាក៏ដោយ វានៅតែជាគោលដៅដ៏លំបាក និងពិបាកកំណត់ក្នុងការកំណត់ខេត្តអេកូឡូស៊ីសកលដោយផ្អែកលើរចនាសម្ព័ន្ធសហគមន៍ Plankton ។ផ្កាយរណបពណ៌ទឹកសមុទ្រអាចផ្តល់នូវការយល់ដឹងយ៉ាងទូលំទូលាយទៅលើការចាត់ថ្នាក់នៃ phytoplankton ដែលមានលក្ខណៈតូចចង្អៀត ឬផ្តល់យោបល់អំពីគុណសម្បត្តិនៃក្រុមមុខងារ (15) ប៉ុន្តែបច្ចុប្បន្នពួកវាមិនអាចផ្តល់ព័ត៌មានលម្អិតអំពីរចនាសម្ព័ន្ធសហគមន៍បានទេ។ការស្ទង់មតិថ្មីៗ [ឧទាហរណ៍ Tara Ocean (16)] កំពុងផ្តល់នូវការវាស់វែងដែលមិនធ្លាប់មានពីមុនមកនៃរចនាសម្ព័ន្ធសហគមន៍។បច្ចុប្បន្ននេះ មានតែការសង្កេតនៅក្នុងកន្លែងតិចតួចប៉ុណ្ណោះនៅលើមាត្រដ្ឋានសកល (17) ។ការសិក្សាពីមុនបានកំណត់យ៉ាងទូលំទូលាយ "ខេត្តជីវគីមី" (12, 14, 18) ដោយផ្អែកលើការកំណត់នៃភាពស្រដៀងគ្នានៃជីវគីមី (ដូចជាផលិតកម្មបឋម Chl និងពន្លឺដែលមាន) ។នៅទីនេះ គំរូលេខត្រូវបានប្រើដើម្បីទិន្នផល [Darwin(2)] ហើយខេត្តអេកូឡូស៊ីត្រូវបានកំណត់ដោយយោងទៅតាមរចនាសម្ព័ន្ធសហគមន៍ និងលំហូរសារធាតុចិញ្ចឹម។គំរូលេខដែលប្រើក្នុងការសិក្សានេះមានការគ្របដណ្តប់ជាសកល ហើយអាចប្រៀបធៀបជាមួយទិន្នន័យវាលដែលមានស្រាប់ (17) និងវាលចាប់សញ្ញាពីចម្ងាយ (Note S1)។ទិន្នន័យគំរូលេខដែលប្រើក្នុងការសិក្សានេះមានអត្ថប្រយោជន៍នៃការគ្របដណ្តប់ជាសកល។ប្រព័ន្ធអេកូឡូស៊ីគំរូមាន 35 ប្រភេទនៃ phytoplankton និង 16 ប្រភេទនៃ zooplankton (សូមយោងទៅសម្ភារៈនិងវិធីសាស្រ្ត) ។ប្រភេទ Plankton គំរូមានអន្តរកម្មមិនត្រង់បន្ទាត់ជាមួយរចនាសម្ព័ន្ធដែលមិនមែនជា Gaussian ដូច្នេះវិធីសាស្ត្រវិនិច្ឆ័យសាមញ្ញមិនសមរម្យសម្រាប់ការកំណត់អត្តសញ្ញាណគំរូតែមួយគត់ និងស្របគ្នានៅក្នុងរចនាសម្ព័ន្ធសហគមន៍ដែលកំពុងរីកចម្រើន។វិធីសាស្រ្ត SAGE ដែលបានណែនាំនៅទីនេះផ្តល់នូវវិធីថ្មីដើម្បីពិនិត្យមើលលទ្ធផលនៃគំរូ Darwin ដ៏ស្មុគស្មាញ។
សមត្ថភាពបំប្លែងដ៏មានអានុភាពនៃបច្ចេកវិទ្យាទិន្នន័យ/ML អាចអនុញ្ញាតិឱ្យដំណោះស្រាយគំរូស្មុគស្មាញច្រើនលើសលប់ ដើម្បីបង្ហាញពីរចនាសម្ព័ន្ធស្មុគស្មាញ ប៉ុន្តែរឹងមាំនៅក្នុងភាពខុសគ្នានៃទិន្នន័យ។វិធីសាស្ត្ររឹងមាំត្រូវបានកំណត់ថាជាវិធីសាស្ត្រដែលអាចបង្កើតលទ្ធផលឡើងវិញដោយស្មោះត្រង់ក្នុងចន្លោះកំហុសដែលបានផ្តល់ឱ្យ។ទោះបីជានៅក្នុងប្រព័ន្ធសាមញ្ញក៏ដោយ ការកំណត់គំរូ និងសញ្ញាដ៏រឹងមាំអាចជាបញ្ហាប្រឈមមួយ។រហូតទាល់តែហេតុផលដែលនាំទៅដល់គំរូដែលបានសង្កេតត្រូវបានកំណត់ ភាពស្មុគស្មាញដែលកំពុងលេចឡើងអាចហាក់ដូចជាស្មុគស្មាញ/ពិបាកក្នុងការដោះស្រាយ។ដំណើរការសំខាន់នៃការកំណត់សមាសភាពនៃប្រព័ន្ធអេកូគឺមិនលីនេអ៊ែរនៅក្នុងធម្មជាតិ។អត្ថិភាពនៃអន្តរកម្មដែលមិនមែនជាលីនេអ៊ែរអាចបំភាន់ការចាត់ថ្នាក់ដ៏រឹងមាំ ដូច្នេះវាចាំបាច់ដើម្បីជៀសវាងវិធីសាស្រ្តដែលធ្វើឱ្យមានការសន្មត់ខ្លាំងអំពីការបែងចែកស្ថិតិជាមូលដ្ឋាននៃភាពខុសគ្នានៃទិន្នន័យ។ទិន្នន័យវិមាត្រខ្ពស់ និងមិនមែនលីនេអ៊ែរ គឺជារឿងធម្មតានៅក្នុងមហាសមុទ្រ ហើយអាចមានរចនាសម្ព័ន្ធចម្រុះជាមួយនឹងស្មុគ្រស្មាញ ស្មុគ្រស្មាញ មិនមែន Gaussian topology ។ទោះបីជាទិន្នន័យដែលមានរចនាសម្ព័ន្ធមិនប្រែប្រួល Gaussian អាចរារាំងការចាត់ថ្នាក់ដ៏រឹងមាំក៏ដោយ វិធីសាស្ត្រ SAGE គឺជារឿងប្រលោមលោកព្រោះវាត្រូវបានរចនាឡើងដើម្បីកំណត់អត្តសញ្ញាណចង្កោមជាមួយ topologies បំពាន។
គោលដៅនៃវិធីសាស្ត្រ SAGE គឺដើម្បីកំណត់អត្តសញ្ញាណគំរូដែលកំពុងលេចចេញជាវត្ថុបំណងដែលអាចជួយឱ្យការយល់ដឹងអំពីអេកូឡូស៊ីបន្ថែមទៀត។បន្ទាប់ពីដំណើរការការងារផ្អែកលើចង្កោមដែលស្រដៀងនឹង (19) អថេរលំហូរអេកូឡូស៊ី និងសារធាតុចិញ្ចឹមត្រូវបានប្រើដើម្បីកំណត់ចង្កោមតែមួយគត់នៅក្នុងទិន្នន័យ ដែលហៅថាខេត្តអេកូឡូស៊ី។វិធីសាស្រ្ត SAGE ដែលបានស្នើឡើងនៅក្នុងការសិក្សានេះ (រូបភាពទី 1) ដំបូងកាត់បន្ថយវិមាត្រពី 55 ទៅ 11 វិមាត្រ ដោយបូកសរុបក្រុមមុខងារ Plankton ដែលបានកំណត់អាទិភាពមួយ (សូមមើល សម្ភារៈ និងវិធីសាស្រ្ត)។ដោយប្រើវិធីសាស្ត្របង្កប់អ្នកជិតខាង t-random (t-SNE) ទំហំត្រូវបានកាត់បន្ថយបន្ថែមទៀតដោយការព្យាករណ៍ប្រូបាប៊ីលីតេទៅក្នុងលំហ 3D ។ការដាក់ចង្កោមដែលមិនមានការត្រួតពិនិត្យអាចកំណត់អត្តសញ្ញាណតំបន់ជិតស្និទ្ធខាងអេកូឡូស៊ី [ការចង្កោមលំហអាកាសដែលមានមូលដ្ឋានលើដង់ស៊ីតេ (DBSCAN) សម្រាប់កម្មវិធីផ្អែកលើសំឡេង]។ទាំង t-SNE និង DBSCAN អាចអនុវត្តបានចំពោះទិន្នន័យគំរូលេខនៃប្រព័ន្ធអេកូឡូស៊ីដែលមិនមែនជាលីនេអ៊ែរ។បន្ទាប់មកបោះបង់ខេត្តអេកូឡូស៊ីជាលទ្ធផលមកលើផែនដី។ខេត្តអេកូឡូស៊ីពិសេសជាងមួយរយត្រូវបានគេកំណត់អត្តសញ្ញាណ ដែលសមរម្យសម្រាប់ការស្រាវជ្រាវក្នុងតំបន់។ដើម្បីពិចារណាលើគំរូប្រព័ន្ធអេកូឡូស៊ីដែលស្របគ្នាជាសកល វិធីសាស្ត្រ SAGE ត្រូវបានប្រើដើម្បីប្រមូលផ្តុំខេត្តអេកូឡូស៊ីទៅជាខេត្តអេកូឡូស៊ីសរុប (AEP) ដើម្បីបង្កើនប្រសិទ្ធភាពនៃខេត្តអេកូឡូស៊ី។កម្រិតនៃការប្រមូលផ្តុំ (ហៅថា "ភាពស្មុគស្មាញ") អាចត្រូវបានកែតម្រូវទៅតាមកម្រិតនៃព័ត៌មានលម្អិតដែលត្រូវការ។កំណត់ភាពស្មុគស្មាញអប្បបរមានៃ AEP ដ៏រឹងមាំ។ការផ្តោតសំខាន់នៃការជ្រើសរើសគឺវិធីសាស្ត្រ SAGE និងការរុករកករណី AEP ស្មុគស្មាញតូចបំផុតដើម្បីកំណត់ការគ្រប់គ្រងនៃរចនាសម្ព័ន្ធសហគមន៍សង្គ្រោះបន្ទាន់។បន្ទាប់មក គំរូអាចត្រូវបានវិភាគ ដើម្បីផ្តល់ការយល់ដឹងអំពីអេកូឡូស៊ី។វិធីសាស្រ្តដែលបានណែនាំនៅទីនេះក៏អាចត្រូវបានប្រើសម្រាប់ការប្រៀបធៀបគំរូយ៉ាងទូលំទូលាយផងដែរ ឧទាហរណ៍ ដោយការវាយតម្លៃទីតាំងនៃខេត្តអេកូឡូស៊ីស្រដៀងគ្នាដែលរកឃើញក្នុងគំរូផ្សេងៗគ្នា ដើម្បីរំលេចភាពខុសគ្នា និងភាពស្រដៀងគ្នា ដើម្បីប្រៀបធៀបគំរូ។
(ក) គ្រោងការណ៍នៃលំហូរការងារសម្រាប់កំណត់ខេត្តអេកូឡូស៊ី;ការប្រើប្រាស់ផលបូកនៅក្នុងក្រុមមុខងារ ដើម្បីកាត់បន្ថយទិន្នន័យដើម 55 វិមាត្រទៅជាលទ្ធផលគំរូ 11 វិមាត្រ រួមទាំងជីវម៉ាស់នៃផ្លេនតុនដែលមានមុខងារ/សារធាតុចិញ្ចឹមចំនួនប្រាំពីរ និងអត្រាផ្គត់ផ្គង់សារធាតុចិញ្ចឹមចំនួនបួន។តម្លៃមិនច្បាស់លាស់ និងតំបន់គម្របទឹកកកជាប់បានយូរ។ទិន្នន័យត្រូវបានធ្វើឱ្យមានស្តង់ដារនិងស្តង់ដារ។ផ្តល់ទិន្នន័យ 11-dimensional ទៅ t-SNE algorithm ដើម្បីរំលេចការបន្សំលក្ខណៈស្រដៀងគ្នាតាមស្ថិតិ។DBSCAN នឹងជ្រើសរើសចង្កោមដោយប្រុងប្រយ័ត្នដើម្បីកំណត់តម្លៃប៉ារ៉ាម៉ែត្រ។ទីបំផុតការព្យាករទិន្នន័យត្រឡប់ទៅការព្យាកររយៈទទឹង/បណ្តោយ។សូមចំណាំថាដំណើរការនេះត្រូវបានធ្វើម្តងទៀត 10 ដង ពីព្រោះភាពចៃដន្យបន្តិចបន្តួចអាចត្រូវបានបង្កើតដោយអនុវត្ត t-SNE ។(ខ) ពន្យល់ពីរបៀបដើម្បីទទួលបាន AEP ដោយធ្វើម្តងទៀតនូវលំហូរការងារក្នុង (A) 10 ដង។សម្រាប់ការអនុវត្តនីមួយៗក្នុងចំណោមការអនុវត្តទាំង 10 នេះ ម៉ាទ្រីសនៃភាពស្រដៀងគ្នាអន្តរខេត្ត Bray-Curtis (BC) ត្រូវបានកំណត់ដោយផ្អែកលើជីវម៉ាស់នៃ 51 ប្រភេទ phytoplankton ។កំណត់ភាពខុសគ្នានៃ BC រវាងខេត្ត ចាប់ពីភាពស្មុគស្មាញ 1 AEP ដល់ភាពស្មុគស្មាញពេញលេញ 115។ ស្តង់ដារ BC ត្រូវបានកំណត់ដោយខេត្ត Longhurst ។
វិធីសាស្ត្រ SAGE ប្រើលទ្ធផលនៃគំរូលេខរូបវិទ្យា/ប្រព័ន្ធអេកូឡូស៊ី 3D សកល ដើម្បីកំណត់ខេត្តអេកូឡូស៊ី [Darwin (2);សូមមើលសម្ភារ និងវិធីសាស្រ្ត និងចំណាំ S1]។សមាសធាតុនៃប្រព័ន្ធអេកូឡូស៊ីមាន 35 ប្រភេទនៃ phytoplankton និង 16 ប្រភេទនៃ zooplankton ជាមួយនឹងក្រុមមុខងារចំនួនប្រាំពីរដែលបានកំណត់ជាមុន: prokaryotes និង eukaryotes សម្របខ្លួនទៅនឹងបរិស្ថានដែលមានសារធាតុចិញ្ចឹមទាប coccidia ជាមួយនឹងស្រទាប់កាល់ស្យូមកាបូណាត និងការជួសជុលអាសូតធ្ងន់ សារធាតុចិញ្ចឹមអាសូត (ជាធម្មតាបាត់ សារធាតុចិញ្ចឹមសំខាន់ៗ) ជាមួយនឹងការគ្របដណ្ដប់ដោយស៊ីលីកុន អាចបង្កើតរស្មីសំយោគរបស់ Plankton ផ្សេងទៀត និងការស៊ីស្មៅចម្រុះនៃសារធាតុចិញ្ចឹម flagellates និងហ្វូងសត្វផ្លាកតុន។វិសាលភាពទំហំគឺ 0.6 ទៅ 2500μm អង្កត់ផ្ចិតស្វ៊ែរសមមូល។ការចែកចាយគំរូនៃទំហំ phytoplankton និងការដាក់ជាក្រុមមុខងារ ចាប់យកលក្ខណៈទូទៅដែលឃើញនៅក្នុងការអង្កេតតាមផ្កាយរណប និងក្នុងកន្លែង (សូមមើលរូបភាព S1 ដល់ S3)។ភាពស្រដៀងគ្នារវាងគំរូលេខ និងមហាសមុទ្រដែលបានសង្កេត បង្ហាញថាខេត្តដែលកំណត់ដោយគំរូអាចអនុវត្តបានចំពោះមហាសមុទ្រនៅក្នុងទីតាំង។សូមចំណាំថា គំរូនេះចាប់បានតែភាពចម្រុះមួយចំនួននៃ phytoplankton ហើយមានតែជួរបង្ខំរាងកាយ និងគីមីមួយចំនួននៃមហាសមុទ្រនៅក្នុងទីតាំងប៉ុណ្ណោះ។វិធីសាស្ត្រ SAGE អាចឱ្យមនុស្សយល់កាន់តែច្បាស់អំពីយន្តការគ្រប់គ្រងក្នុងតំបន់ខ្ពស់នៃរចនាសម្ព័ន្ធសហគមន៍គំរូ។
ដោយរួមបញ្ចូលតែផលបូកនៃជីវម៉ាស់លើផ្ទៃ (ជាមួយនឹងពេលវេលាជាមធ្យម 20 ឆ្នាំ) នៅក្នុងក្រុមមុខងារ Plankton នីមួយៗ វិមាត្រនៃទិន្នន័យអាចត្រូវបានកាត់បន្ថយ។បន្ទាប់ពីការសិក្សាពីមុនបានបង្ហាញពីតួនាទីសំខាន់របស់ពួកគេក្នុងការកំណត់រចនាសម្ព័ន្ធសហគមន៍ វាក៏រួមបញ្ចូលលក្ខខណ្ឌប្រភពផ្ទៃសម្រាប់លំហូរសារធាតុចិញ្ចឹម (ការផ្គត់ផ្គង់អាសូត ជាតិដែក ផូស្វាត និងអាស៊ីតស៊ីលីកិក) [ឧទាហរណ៍ (20, 21)] ។ការបូកសរុបនៃក្រុមមុខងារកាត់បន្ថយបញ្ហាពី 55 (51 plankton និង 4 សារធាតុចិញ្ចឹម) ទៅ 11 វិមាត្រ។នៅក្នុងការសិក្សាដំបូងនេះ ដោយសារឧបសគ្គនៃការគណនាដែលកំណត់ដោយក្បួនដោះស្រាយ ភាពប្រែប្រួលនៃជម្រៅ និងពេលវេលាមិនត្រូវបានគេពិចារណានោះទេ។
វិធីសាស្ត្រ SAGE អាចកំណត់អត្តសញ្ញាណទំនាក់ទំនងសំខាន់ៗរវាងដំណើរការដែលមិនមែនជាលីនេអ៊ែរ និងលក្ខណៈសំខាន់ៗនៃអន្តរកម្មរវាងជីវម៉ាស់ក្រុមមុខងារ និងលំហូរសារធាតុចិញ្ចឹម។ការប្រើប្រាស់ទិន្នន័យ 11-dimensional ដោយផ្អែកលើវិធីសាស្រ្តសិក្សាពីចម្ងាយ Euclidean (ដូចជា K-means) មិនអាចទទួលបានខេត្តដែលអាចទុកចិត្តបាន និងអាចផលិតឡើងវិញបានទេ (19, 22)។នេះគឺដោយសារតែគ្មានរូបរាង Gaussian ត្រូវបានរកឃើញនៅក្នុងការចែកចាយជាមូលដ្ឋាននៃភាពខុសគ្នានៃធាតុសំខាន់ៗដែលកំណត់ខេត្តអេកូឡូស៊ី។K-means នៃកោសិកា Voronoi (បន្ទាត់ត្រង់) មិនអាចរក្សាការចែកចាយមូលដ្ឋានដែលមិនមែនជា Gaussian បានទេ។
ជីវម៉ាសនៃក្រុមមុខងារ Plankton ចំនួនប្រាំពីរ និងលំហូរសារធាតុចិញ្ចឹមចំនួន 4 បង្កើតបានជាវ៉ិចទ័រ 11 វិមាត្រ x ។ដូច្នេះ x គឺជាវាលវ៉ិចទ័រនៅលើក្រឡាចត្រង្គគំរូ ដែលធាតុនីមួយៗ xi តំណាងឱ្យវ៉ិចទ័រ 11 វិមាត្រដែលបានកំណត់នៅលើក្រឡាចត្រង្គផ្ដេកគំរូ។លិបិក្រមនីមួយៗខ្ញុំកំណត់ដាច់ដោយឡែកពីក្រឡាចត្រង្គមួយនៅលើស្វ៊ែរ ដែល (ឡុង, lat) = (ϕi, θi) ។ប្រសិនបើជីវម៉ាស់នៃឯកតាក្រឡាចត្រង្គគំរូមានតិចជាង 1.2 × 10-3mg Chl/m3 ឬអត្រាគ្របដណ្តប់លើទឹកកកលើសពី 70% នោះកំណត់ហេតុនៃទិន្នន័យជីវម៉ាស់ត្រូវបានប្រើប្រាស់ និងបោះចោល។ទិន្នន័យត្រូវបានធ្វើឱ្យមានលក្ខណៈធម្មតា និងមានលក្ខណៈស្តង់ដារ ដូច្នេះទិន្នន័យទាំងអស់ស្ថិតនៅក្នុងចន្លោះពី [0 ដល់ 1] មធ្យមត្រូវបានដកចេញ និងធ្វើមាត្រដ្ឋានទៅជាបំរែបំរួលឯកតា។នេះត្រូវបានធ្វើដូច្នេះលក្ខណៈ (ជីវម៉ាស និងលំហូរសារធាតុចិញ្ចឹម) មិនត្រូវបានកំណត់ដោយកម្រិតពណ៌នៅក្នុងជួរនៃតម្លៃដែលអាចធ្វើបាននោះទេ។ការដាក់ចង្កោមគួរតែចាប់យកទំនាក់ទំនងការផ្លាស់ប្តូរពីចម្ងាយប្រូបាប៊ីលីតេសំខាន់រវាងលក្ខណៈពិសេសជាជាងចម្ងាយភូមិសាស្ត្រ។តាមរយៈការគណនាចម្ងាយទាំងនេះ លក្ខណៈសំខាន់ៗនឹងលេចចេញមក ខណៈដែលព័ត៌មានលម្អិតដែលមិនចាំបាច់ត្រូវបានលុបចោល។តាមទស្សនៈអេកូឡូស៊ី នេះគឺជាការចាំបាច់ ពីព្រោះប្រភេទមួយចំនួននៃ phytoplankton ដែលមានជីវម៉ាសតិចតួចអាចមានឥទ្ធិពលគីមីជីវៈធំជាង ដូចជាការកំណត់អាសូតដោយបាក់តេរី diazotrophic ។នៅពេលធ្វើស្តង់ដារ និងធ្វើឱ្យទិន្នន័យមានលក្ខណៈធម្មតា ប្រភេទនៃ covariates ទាំងនេះនឹងត្រូវបានបន្លិច។
ដោយសង្កត់ធ្ងន់លើភាពជិតនៃលក្ខណៈពិសេសនៅក្នុងចន្លោះវិមាត្រខ្ពស់ក្នុងការតំណាងវិមាត្រទាប ក្បួនដោះស្រាយ t-SNE ត្រូវបានប្រើដើម្បីធ្វើឱ្យតំបន់ស្រដៀងគ្នាដែលមានស្រាប់កាន់តែច្បាស់។ការងារពីមុនដែលមានបំណងបង្កើតបណ្តាញសរសៃប្រសាទជ្រៅសម្រាប់កម្មវិធីចាប់សញ្ញាពីចម្ងាយបានប្រើ t-SNE ដែលបង្ហាញពីជំនាញរបស់វាក្នុងការបំបែកមុខងារសំខាន់ៗ (23)។នេះជាជំហានចាំបាច់ក្នុងការកំណត់អត្តសញ្ញាណការចង្កោមដ៏រឹងមាំក្នុងទិន្នន័យលក្ខណៈពិសេស ខណៈពេលដែលជៀសវាងដំណោះស្រាយមិនបញ្ចូលគ្នា (ចំណាំ S2)។ដោយប្រើខឺណែល Gaussian, t-SNE រក្សាលក្ខណៈសម្បត្តិស្ថិតិនៃទិន្នន័យដោយការគូសផែនទីវត្ថុដែលមានវិមាត្រខ្ពស់នីមួយៗទៅចំណុចមួយក្នុងលំហដំណាក់កាល 3D ដោយហេតុនេះធានាថាប្រូបាប៊ីលីតេនៃវត្ថុស្រដៀងគ្នាក្នុងទិសដៅខ្ពស់ និងទាបគឺខ្ពស់ក្នុងកម្រិតខ្ពស់។ ទំហំវិមាត្រ (24) ។ដែលបានផ្តល់ឱ្យសំណុំនៃវត្ថុវិមាត្រខ្ពស់ N x1,…,xN ក្បួនដោះស្រាយ t-SNE កាត់បន្ថយដោយការបង្រួមអប្បបរមានៃភាពខុសគ្នា Kullback-Leibler (KL) (25) ។KL divergence គឺជារង្វាស់នៃរបៀបដែលការចែកចាយប្រូបាប៊ីលីតេខុសគ្នាពីការចែកចាយប្រូបាប៊ីលីតេយោងទីពីរ ហើយអាចវាយតម្លៃយ៉ាងមានប្រសិទ្ធភាពនូវលទ្ធភាពនៃការជាប់ទាក់ទងគ្នារវាងតំណាងវិមាត្រទាបនៃលក្ខណៈវិមាត្រខ្ពស់។ប្រសិនបើ xi ជាវត្ថុ i-th ក្នុងលំហ N-dimensional, xj ជាវត្ថុ j-th ក្នុងលំហ N-dimensional, yi គឺជាវត្ថុ i-th ក្នុងលំហវិមាត្រទាប ហើយ yj គឺជាវត្ថុ j-th ក្នុងកម្រិតទាប។ -dimensional space បន្ទាប់មក t -SNE កំណត់ប្រូបាប៊ីលីតេនៃភាពស្រដៀងគ្នា ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2) និងសម្រាប់ការកំណត់កាត់បន្ថយវិមាត្រ q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
រូបភាពទី 2A បង្ហាញពីឥទ្ធិពលនៃការកាត់បន្ថយជីវម៉ាស់ និងវ៉ិចទ័រលំហូរសារធាតុចិញ្ចឹមនៃការរួមបញ្ចូលគ្នា 11 វិមាត្រទៅជា 3D ។ការលើកទឹកចិត្តនៃការអនុវត្ត t-SNE អាចត្រូវបានប្រៀបធៀបជាមួយនឹងការលើកទឹកចិត្តនៃការវិភាគសមាសភាគសំខាន់ (PCA) ដែលប្រើគុណលក្ខណៈបំរែបំរួលដើម្បីសង្កត់ធ្ងន់លើផ្ទៃ/គុណលក្ខណៈនៃទិន្នន័យ ដោយកាត់បន្ថយវិមាត្រ។វិធីសាស្ត្រ t-SNE ត្រូវបានរកឃើញថាល្អជាង PCA ក្នុងការផ្តល់នូវលទ្ធផលដែលអាចទុកចិត្តបាន និងអាចផលិតឡើងវិញបានសម្រាប់ក្រសួងបរិស្ថាន (សូមមើល Note S2)។នេះអាចមកពីការសន្មត់ orthogonality នៃ PCA មិនស័ក្តិសមសម្រាប់ការកំណត់អត្តសញ្ញាណអន្តរកម្មសំខាន់រវាងលក្ខណៈអន្តរកម្មដែលមិនមានលីនេអ៊ែរខ្ពស់ ពីព្រោះ PCA ផ្តោតលើរចនាសម្ព័ន្ធបំរែបំរួលលីនេអ៊ែរ (26)។ដោយប្រើទិន្នន័យចាប់សញ្ញាពីចម្ងាយ Lunga et al ។(27) បង្ហាញពីរបៀបប្រើវិធីសាស្ត្រ SNE ដើម្បីរំលេចលក្ខណៈពិសេសស្មុគ្រស្មាញ និងមិនលីនេអ៊ែរ ដែលខុសពីការចែកចាយ Gaussian ។
(ក) អត្រានៃការផ្គត់ផ្គង់សារធាតុចិញ្ចឹមតាមគំរូ ជីតូប្លាកតុន និងជីវម៉ាសដែលមានមុខងារជាក្រុមដែលគូរដោយ t-SNE algorithm និងពណ៌តាមខេត្តដោយប្រើ DBSCAN ។ចំណុចនីមួយៗតំណាងឱ្យចំណុចមួយនៅក្នុងលំហវិមាត្រខ្ពស់ ដូចដែលបានបង្ហាញក្នុងរូបភាពទី 6B ចំណុចភាគច្រើនត្រូវបានចាប់យក។Shafts សំដៅលើ "t-SNE" ទំហំ 1, 2 និង 3 ។ (ខ) ការព្យាករណ៍ភូមិសាស្ត្រនៃខេត្តដែលបានរកឃើញដោយ DBSCAN នៅលើក្រឡាចត្រង្គរយៈទទឹង-បណ្តោយនៃប្រភពដើម។ពណ៌គួរតែត្រូវបានចាត់ទុកថាជាពណ៌ណាមួយប៉ុន្តែគួរតែត្រូវគ្នាទៅនឹង (A) ។
ចំនុចនៅក្នុងគ្រោងការខ្ចាត់ខ្ចាយ t-SNE នៅក្នុងរូបភាពទី 2A ត្រូវបានទាក់ទងរៀងគ្នាជាមួយរយៈទទឹង និងរយៈបណ្តោយ។ប្រសិនបើចំនុចទាំងពីរនៅក្នុងរូបភាពទី 2A នៅជិតគ្នានោះ គឺដោយសារតែជីវម៉ាស់ និងសារធាតុចិញ្ចឹមរបស់វាស្រដៀងគ្នា មិនមែនដោយសារភាពជិតខាងភូមិសាស្ត្រនោះទេ។ពណ៌នៅក្នុងរូបភាពទី 2A គឺជាចង្កោមដែលបានរកឃើញដោយប្រើវិធីសាស្ត្រ DBSCAN (28) ។នៅពេលស្វែងរកការសង្កេតក្រាស់ ក្បួនដោះស្រាយ DBSCAN ប្រើចម្ងាយក្នុងតំណាង 3D រវាងចំណុច (ϵ = 0.39; សម្រាប់ព័ត៌មានអំពីជម្រើសនេះ សូមមើល សម្ភារៈ និងវិធីសាស្ត្រ) ហើយចំនួនចំណុចស្រដៀងគ្នាគឺតម្រូវឱ្យកំណត់ចង្កោម (នៅទីនេះ 100 ពិន្ទុ សូមមើលខាងលើ)។វិធីសាស្រ្ត DBSCAN មិនធ្វើការសន្មត់ណាមួយអំពីរូបរាង ឬចំនួននៃចង្កោមនៅក្នុងទិន្នន័យ ដូចដែលបានបង្ហាញខាងក្រោម៖
3) សម្រាប់ចំណុចទាំងអស់ដែលបានកំណត់ថាជាចម្ងាយនៅក្នុងនោះ សូមធ្វើជំហានទី 2 ម្តងហើយម្តងទៀតដើម្បីកំណត់ព្រំដែនចង្កោម។ប្រសិនបើចំនួនពិន្ទុធំជាងតម្លៃអប្បបរមាដែលបានកំណត់ វាត្រូវបានកំណត់ជាចង្កោម។
ទិន្នន័យដែលមិនត្រូវនឹងសមាជិកចង្កោមអប្បបរមា និងចម្ងាយ ϵ ម៉ែត្រត្រូវបានគេចាត់ទុកជា "សំឡេងរំខាន" ហើយមិនត្រូវបានកំណត់ពណ៌ទេ។DBSCAN គឺជាក្បួនដោះស្រាយរហ័ស និងអាចធ្វើមាត្រដ្ឋានបានជាមួយនឹងដំណើរការ O(n2) ក្នុងករណីដ៏អាក្រក់បំផុត។សម្រាប់ការវិភាគបច្ចុប្បន្ន វាមិនមែនជាការចៃដន្យទេ។ចំនួនពិន្ទុអប្បបរមាត្រូវបានកំណត់ដោយការវាយតម្លៃរបស់អ្នកជំនាញ។បន្ទាប់ពីការលៃតម្រូវចម្ងាយបន្ទាប់ពីនោះលទ្ធផលគឺមិនមានស្ថេរភាពគ្រប់គ្រាន់ក្នុងជួរនៃ≈±10។ចម្ងាយនេះត្រូវបានកំណត់ដោយប្រើការតភ្ជាប់ (រូបភាពទី 6A) និងភាគរយគ្របដណ្តប់មហាសមុទ្រ (រូបភាព 6B) ។ការតភ្ជាប់ត្រូវបានកំណត់ជាចំនួនសមាសធាតុនៃចង្កោម ហើយមានភាពរសើបចំពោះប៉ារ៉ាម៉ែត្រϵ។ការតភ្ជាប់ទាបបង្ហាញពីភាពសមមិនគ្រប់គ្រាន់ ការដាក់ជាក្រុមដោយសិប្បនិម្មិត។ការតភ្ជាប់ខ្ពស់បង្ហាញពីការពាក់លើស។វាអាចប្រើអប្បរមាខ្ពស់ ប៉ុន្តែប្រសិនបើអប្បបរមាលើសពី ca នោះវាមិនអាចទៅរួចទេក្នុងការសម្រេចបាននូវដំណោះស្រាយដែលអាចទុកចិត្តបាន។135 (សម្រាប់ព័ត៌មានលម្អិត សូមមើលសម្ភារៈ និងវិធីសាស្រ្ត)។
ចង្កោមចំនួន 115 ដែលត្រូវបានកំណត់ក្នុងរូបភាពទី 2A ត្រូវបានព្យាករលើផែនដីវិញក្នុងរូបភាពទី 2B ។ពណ៌នីមួយៗត្រូវគ្នាទៅនឹងការរួមបញ្ចូលគ្នាយ៉ាងស៊ីសង្វាក់គ្នានៃកត្តាជីវគីមី និងអេកូឡូស៊ីដែលកំណត់ដោយ DBSCAN ។នៅពេលដែលចង្កោមត្រូវបានកំណត់ ការផ្សារភ្ជាប់គ្នានៃចំណុចនីមួយៗក្នុងរូបភាពទី 2A ជាមួយនឹងរយៈទទឹង និងរយៈបណ្តោយជាក់លាក់មួយ ត្រូវបានប្រើដើម្បីបង្ហាញចង្កោមត្រឡប់ទៅតំបន់ភូមិសាស្រ្តវិញ។រូបភាពទី 2B បង្ហាញវាជាមួយនឹងពណ៌ចង្កោមដូចគ្នានឹងរូបភាពទី 2A ។ពណ៌ស្រដៀងគ្នាមិនគួរត្រូវបានបកស្រាយថាជាភាពស្រដៀងគ្នានៃអេកូឡូស៊ីទេព្រោះវាត្រូវបានចាត់តាំងដោយលំដាប់ដែលចង្កោមត្រូវបានរកឃើញដោយក្បួនដោះស្រាយ។
តំបន់នៅក្នុងរូបភាពទី 2B អាចមានគុណភាពស្រដៀងនឹងតំបន់ដែលបានបង្កើតឡើងនៅក្នុងរូបវិទ្យា និង/ឬជីវគីមីវិទ្យានៃមហាសមុទ្រ។ជាឧទាហរណ៍ ចង្កោមនៅមហាសមុទ្រខាងត្បូងមានលក្ខណៈស៊ីមេទ្រីជាមួយ oligotrophic vortices លេចឡើង ហើយការផ្លាស់ប្តូរយ៉ាងខ្លាំងបង្ហាញពីឥទ្ធិពលនៃខ្យល់ពាណិជ្ជកម្ម។ជាឧទាហរណ៍ នៅតំបន់អេក្វាទ័រប៉ាស៊ីហ្វិក តំបន់ផ្សេងៗគ្នាដែលទាក់ទងនឹងការកើនឡើងត្រូវបានគេមើលឃើញ។
ដើម្បីយល់ពីបរិស្ថានអេកូឡូស៊ីនៃខេត្តអេកូ ការប្រែប្រួលនៃសន្ទស្សន៍ភាពខុសគ្នា Bray-Curtis (BC) (29) ត្រូវបានប្រើដើម្បីវាយតម្លៃបរិស្ថានវិទ្យានៅក្នុងចង្កោម។សូចនាករ BC គឺជាទិន្នន័យស្ថិតិដែលប្រើដើម្បីកំណត់បរិមាណភាពខុសគ្នានៃរចនាសម្ព័ន្ធសហគមន៍រវាងគេហទំព័រពីរផ្សេងគ្នា។ការវាស់វែង BC គឺអាចអនុវត្តបានចំពោះជីវម៉ាសនៃ 51 ប្រភេទនៃ phytoplankton និង zooplankton BCninj = 1-2CninjSni + Snj
BCninj សំដៅលើភាពស្រដៀងគ្នារវាងការរួមបញ្ចូលគ្នា ni និងការរួមបញ្ចូលគ្នា nj ដែល Cninj គឺជាតម្លៃអប្បបរមានៃប្រភេទជីវម៉ាស់តែមួយដែលមាននៅក្នុងបន្សំទាំងពីរ ni និង nj ហើយ Sni តំណាងឱ្យផលបូកនៃជីវម៉ាស់ទាំងអស់ដែលមាននៅក្នុងបន្សំទាំងពីរ ni និង Snj ។ភាពខុសគ្នា BC គឺស្រដៀងគ្នាទៅនឹងរង្វាស់ចម្ងាយ ប៉ុន្តែដំណើរការនៅក្នុងលំហដែលមិនមែនជាអឺគ្លីដ ដែលទំនងជាសមស្របជាងសម្រាប់ទិន្នន័យអេកូឡូស៊ី និងការបកស្រាយរបស់វា។
សម្រាប់ចង្កោមនីមួយៗដែលបានកំណត់ក្នុងរូបភាពទី 2B ភាពស្រដៀងគ្នានៃ BC ក្នុងខេត្ត និងអន្តរខេត្តអាចត្រូវបានវាយតម្លៃ។ភាពខុសគ្នា BC នៅក្នុងខេត្តមួយ សំដៅលើភាពខុសគ្នារវាងតម្លៃមធ្យមនៃខេត្ត និងចំណុចនីមួយៗនៅក្នុងខេត្ត។ភាពខុសគ្នារវាងខេត្ត BC សំដៅលើភាពស្រដៀងគ្នារវាងខេត្តមួយ និងខេត្តផ្សេងទៀត។រូបភាពទី 3A បង្ហាញម៉ាទ្រីស BC ស៊ីមេទ្រី (0, ខ្មៅ: ដែលត្រូវគ្នាទាំងស្រុង; 1, ស: ខុសគ្នាទាំងស្រុង)។បន្ទាត់នីមួយៗនៅក្នុងក្រាហ្វបង្ហាញលំនាំនៅក្នុងទិន្នន័យ។រូបភាពទី 3B បង្ហាញពីសារៈសំខាន់ភូមិសាស្ត្រនៃលទ្ធផលនៃ BC នៅក្នុងរូបភាពទី 3A សម្រាប់ខេត្តនីមួយៗ។សម្រាប់ខេត្តនៅក្នុងតំបន់ដែលមានអាហារូបត្ថម្ភទាប និងសារធាតុចិញ្ចឹមទាប រូបភាពទី 3B បង្ហាញថាស៊ីមេទ្រីនៃតំបន់ធំជុំវិញខ្សែអេក្វាទ័រ និងមហាសមុទ្រឥណ្ឌាគឺស្រដៀងគ្នាជាមូលដ្ឋាន ប៉ុន្តែរយៈទទឹងខ្ពស់ និងតំបន់កើនឡើងគឺខុសគ្នាខ្លាំង។
(ក) កម្រិតនៃភាពខុសគ្នានៃ BC ដែលត្រូវបានវាយតម្លៃសម្រាប់ខេត្តនីមួយៗ ដោយផ្អែកលើកម្រិតមធ្យមនៃផ្ទៃផែនដីជាមធ្យម 20 ឆ្នាំនៃ 51 Plankton ។ចំណាំស៊ីមេទ្រីដែលរំពឹងទុកនៃតម្លៃ។(ខ) ការព្យាករលំហនៃជួរឈរ (ឬជួរដេក) ។សម្រាប់ខេត្តមួយនៅក្នុងរង្វង់ dystrophic ការចែកចាយសកលនៃវិធានការស្រដៀងគ្នា BC ត្រូវបានវាយតម្លៃ ហើយជាមធ្យម 20 ឆ្នាំសកលត្រូវបានវាយតម្លៃ។ខ្មៅ (BC = 0) មានន័យថាតំបន់ដូចគ្នា ហើយពណ៌ស (BC = 1) មានន័យថាមិនដូចគ្នាទេ។
រូបភាពទី 4A បង្ហាញពីភាពខុសគ្នានៃ BC ក្នុងខេត្តនីមួយៗក្នុងរូបភាពទី 2B ។កំណត់ដោយការប្រើបន្សំមធ្យមនៃតំបន់មធ្យមក្នុងចង្កោមមួយ និងកំណត់ភាពមិនដូចគ្នារវាង BC និងមធ្យមនៃចំណុចក្រឡាចត្រង្គនីមួយៗនៅក្នុងខេត្ត វាបង្ហាញថាវិធីសាស្ត្រ SAGE អាចបំបែកបានយ៉ាងត្រឹមត្រូវ 51 ប្រភេទដោយផ្អែកលើភាពស្រដៀងគ្នានៃបរិស្ថានវិទ្យា។ ទិន្នន័យគំរូ។ភាពមិនដូចគ្នានៃចង្កោមមធ្យម BC នៃប្រភេទទាំង 51 គឺ 0.102±0.0049។
(A, B, និង D) ភាពខុសគ្នា BC នៅក្នុងខេត្តត្រូវបានវាយតម្លៃថាជាភាពខុសគ្នាមធ្យម BC រវាងសហគមន៍ចំណុចក្រឡាចត្រង្គនីមួយៗ និងខេត្តមធ្យម ហើយភាពស្មុគស្មាញមិនត្រូវបានកាត់បន្ថយទេ។(2) ភាពខុសគ្នាជាមធ្យមក្នុងខេត្ត BC សកលគឺ 0.227±0.117។នេះជាគោលនៃការចាត់ថ្នាក់ដោយផ្អែកលើការលើកទឹកចិត្តអេកូឡូស៊ីដែលបានស្នើឡើងដោយការងារនេះ [បន្ទាត់បៃតងក្នុង (C)]។(គ) ភាពខុសប្លែកគ្នាជាមធ្យមក្នុងខេត្ត BC៖ បន្ទាត់ខ្មៅតំណាងឱ្យភាពខុសគ្នានៃ BC ក្នុងខេត្ត ជាមួយនឹងភាពស្មុគស្មាញកើនឡើង។2σ មកពីពាក្យដដែលៗចំនួន 10 នៃដំណើរការកំណត់អត្តសញ្ញាណខេត្តអេកូ។ចំពោះភាពស្មុគស្មាញសរុបនៃខេត្តដែលរកឃើញដោយ DBSCAN (A) បង្ហាញថាភាពមិនដូចគ្នានៃ BC នៅក្នុងខេត្តគឺ 0.099 ហើយការចាត់ថ្នាក់ភាពស្មុគស្មាញដែលស្នើឡើងដោយ (C) គឺ 12 ដែលបណ្តាលឱ្យមានភាពមិនដូចគ្នានៃ BC នៃ 0.200 នៅក្នុងខេត្ត។ដូចដែលរូបភាពបង្ហាញ។(D).
នៅក្នុងរូបភាពទី 4B ជីវម៉ាសនៃប្រភេទ plankton ចំនួន 51 ត្រូវបានប្រើដើម្បីតំណាងឱ្យភាពខុសគ្នានៃ BC ដែលសមមូលនៅក្នុងខេត្ត Longhurst ។មធ្យមភាគនៃខេត្តនីមួយៗគឺ 0.227 ហើយគម្លាតស្តង់ដារនៃចំណុចក្រឡាចត្រង្គដោយយោងទៅលើភាពខុសគ្នានៅក្នុងខេត្ត BC គឺ 0.046។នេះធំជាងចង្កោមដែលបានកំណត់ក្នុងរូបភាពទី 1B។ជំនួសមកវិញ ដោយប្រើផលបូកនៃក្រុមមុខងារទាំងប្រាំពីរ ភាពមិនដូចគ្នានៃ BC ក្នុងរដូវកាលជាមធ្យមនៅក្នុង Longhurst បានកើនឡើងដល់ 0.232។
ផែនទីខេត្តអេកូសកលផ្តល់នូវព័ត៌មានលម្អិតដ៏ស្មុគស្មាញនៃអន្តរកម្មអេកូឡូស៊ីតែមួយគត់ និងការកែលម្អត្រូវបានធ្វើឡើងក្នុងការប្រើប្រាស់រចនាសម្ព័ន្ធប្រព័ន្ធអេកូទាំងមូលនៃខេត្តឡុងហឺស។ក្រសួងបរិស្ថានត្រូវបានគេរំពឹងថានឹងផ្តល់ការយល់ដឹងអំពីដំណើរការនៃការគ្រប់គ្រងប្រព័ន្ធអេកូឡូស៊ីគំរូលេខ ហើយការយល់ដឹងនេះនឹងជួយដល់ការរុករកការងារវាល។ចំពោះគោលបំណងនៃការស្រាវជ្រាវនេះ គេមិនអាចបង្ហាញបានពេញលេញជាងមួយរយខេត្តទេ។ផ្នែកបន្ទាប់ណែនាំវិធីសាស្រ្ត SAGE ដែលសង្ខេបខេត្ត។
គោលបំណងមួយរបស់ខេត្តគឺលើកកម្ពស់ការយល់ដឹងអំពីទីតាំង និងការគ្រប់គ្រងខេត្ត។ដើម្បីកំណត់ស្ថានភាពអាសន្ន វិធីសាស្ត្រក្នុងរូបភាពទី 1B បង្ហាញពីការដាក់សំបុកនៃខេត្តដែលមានលក្ខណៈអេកូឡូស៊ីស្រដៀងគ្នា។ខេត្តអេកូត្រូវបានដាក់ជាក្រុមដោយផ្អែកលើភាពស្រដៀងគ្នានៃអេកូឡូស៊ី ហើយការដាក់ជាក្រុមនៃខេត្តបែបនេះត្រូវបានគេហៅថា AEP ។កំណត់ "ភាពស្មុគស្មាញ" ដែលអាចលៃតម្រូវបានដោយផ្អែកលើចំនួនខេត្តសរុបដែលត្រូវយកមកពិចារណា។ពាក្យ "ភាពស្មុគស្មាញ" ត្រូវបានប្រើព្រោះវាអនុញ្ញាតឱ្យកម្រិតនៃគុណលក្ខណៈសង្គ្រោះបន្ទាន់ត្រូវបានកែតម្រូវ។ដើម្បីកំណត់ការប្រមូលផ្តុំប្រកបដោយអត្ថន័យ ភាពខុសគ្នាជាមធ្យមក្នុងខេត្ត BC នៃ 0.227 ពី Longhurst ត្រូវបានប្រើជាគោល។ខាងក្រោមស្តង់ដារនេះ ខេត្តរួមគ្នាលែងត្រូវបានគេចាត់ទុកថាមានប្រយោជន៍ទៀតហើយ។
ដូចបង្ហាញក្នុងរូបភាពទី 3B ខេត្តអេកូឡូស៊ីសកលមានភាពស៊ីសង្វាក់គ្នា។ដោយប្រើភាពខុសគ្នា BC អន្តរខេត្ត វាអាចត្រូវបានគេមើលឃើញថាការកំណត់រចនាសម្ព័ន្ធមួយចំនួនគឺ "ជារឿងធម្មតា" ណាស់។ត្រូវបានបំផុសគំនិតដោយវិធីសាស្ត្រហ្សែន និងទ្រឹស្ដីក្រាហ្វ “ក្រាហ្វដែលភ្ជាប់គ្នា” ត្រូវបានប្រើដើម្បីតម្រៀបខេត្ត> 100 ដោយផ្អែកលើខេត្តដែលស្រដៀងនឹងពួកគេ។ម៉ែត្រ "ការតភ្ជាប់" នៅទីនេះត្រូវបានកំណត់ដោយប្រើភាពខុសគ្នានៃ BC អន្តរខេត្ត (30) ។ចំនួនខេត្តដែលមានទំហំធំជាងសម្រាប់ការចាត់ថ្នាក់នៃខេត្ត> 100 អាចត្រូវបានគេសំដៅនៅទីនេះថាជាភាពស្មុគស្មាញ។AEP គឺជាផលិតផលដែលចាត់ថ្នាក់ខេត្តច្រើនជាង 100 ជាខេត្តអេកូឡូស៊ីលេចធ្លោ/ជិតបំផុត។ខេត្តអេកូឡូស៊ីនីមួយៗត្រូវបានចាត់ឱ្យទៅជាខេត្តអេកូឡូស៊ីលេចធ្លោ/មានទំនាក់ទំនងខ្ពស់ដែលស្រដៀងនឹងខេត្តទាំងនោះបំផុត។ការប្រមូលផ្តុំនេះកំណត់ដោយភាពខុសគ្នានៃ BC អនុញ្ញាតឱ្យមានវិធីសាស្រ្តជាប់គាំងចំពោះបរិស្ថានវិទ្យាសកល។
ភាពស្មុគស្មាញដែលបានជ្រើសរើសអាចជាតម្លៃណាមួយពី 1 ទៅភាពស្មុគស្មាញពេញលេញនៃរូបភព។2Aនៅភាពស្មុគស្មាញទាប AEP អាចនឹងខូចដោយសារជំហានកាត់បន្ថយវិមាត្រដែលទំនង (t-SNE)។Degeneracy មានន័យថាខេត្តអេកូឡូស៊ីអាចត្រូវបានកំណត់ទៅ AEPs ផ្សេងគ្នារវាងការធ្វើឡើងវិញដោយហេតុនេះបានផ្លាស់ប្តូរតំបន់ភូមិសាស្រ្តដែលគ្របដណ្តប់។រូបភាពទី 4C បង្ហាញពីការរីករាលដាលនៃភាពមិនដូចគ្នានៃ BC នៅក្នុងខេត្តនៅក្នុង AEPs នៃភាពស្មុគស្មាញដែលកើនឡើងនៅទូទាំងការអនុវត្តចំនួន 10 (រូបភាពក្នុងរូបភាពទី 1B)។នៅក្នុងរូបភាព 4C, 2σ (ផ្ទៃពណ៌ខៀវ) គឺជារង្វាស់នៃការរិចរិលក្នុងការអនុវត្តចំនួន 10 ហើយបន្ទាត់ពណ៌បៃតងតំណាងឱ្យ Longhurst benchmark ។ការពិតបានបង្ហាញថាភាពស្មុគស្មាញនៃ 12 អាចរក្សាភាពខុសគ្នានៃ BC នៅក្នុងខេត្តនៅក្រោមស្តង់ដារ Longhurst ក្នុងការអនុវត្តទាំងអស់ និងរក្សាការរិចរិល 2σ តិចតួច។សរុបមក ភាពស្មុគស្មាញដែលបានណែនាំអប្បបរមាគឺ 12 AEPs ហើយភាពខុសគ្នាជាមធ្យមក្នុងខេត្ត BC ដែលត្រូវបានវាយតម្លៃដោយប្រើប្រភេទ plankton ចំនួន 51 គឺ 0.198±0.013 ដូចបង្ហាញក្នុងរូបភាព 4D។ដោយប្រើផលបូកនៃក្រុមមុខងារ Plankton ចំនួនប្រាំពីរ ភាពខុសគ្នា BC ជាមធ្យមនៅក្នុងខេត្តគឺ 2σ ជំនួសឱ្យ 0.198±0.004។ការប្រៀបធៀបរវាងភាពខុសគ្នា BC ដែលគណនាជាមួយនឹងជីវម៉ាស់សរុបនៃក្រុមមុខងារទាំងប្រាំពីរ ឬជីវម៉ាស់នៃប្រភេទ Plankton ទាំង 51 បង្ហាញថា ទោះបីជាវិធីសាស្ត្រ SAGE អាចអនុវត្តបានចំពោះស្ថានភាព 51 វិមាត្រក៏ដោយ វាគឺសម្រាប់ជីវម៉ាស់សរុបនៃក្រុមមុខងារទាំងប្រាំពីរ។ សម្រាប់ការបណ្តុះបណ្តាល។
អាស្រ័យលើគោលបំណងនៃការស្រាវជ្រាវណាមួយ កម្រិតផ្សេងគ្នានៃភាពស្មុគស្មាញអាចត្រូវបានពិចារណា។ការសិក្សាតាមតំបន់អាចទាមទារភាពស្មុគស្មាញពេញលេញ (ពោលគឺខេត្តទាំង 115)។ជាឧទាហរណ៍ និងសម្រាប់ភាពច្បាស់លាស់ សូមពិចារណាពីភាពស្មុគស្មាញដែលបានណែនាំអប្បបរមានៃ 12 ។
ជាឧទាហរណ៍នៃការប្រើប្រាស់នៃវិធីសាស្ត្រ SAGE 12 AEPs ដែលមានភាពស្មុគស្មាញអប្បបរមាចំនួន 12 ត្រូវបានប្រើនៅទីនេះ ដើម្បីស្វែងយល់ពីការគ្រប់គ្រងនៃរចនាសម្ព័ន្ធសហគមន៍សង្គ្រោះបន្ទាន់។រូបភាពទី 5 បង្ហាញពីការយល់ដឹងអំពីអេកូឡូស៊ីដែលដាក់ជាក្រុមដោយ AEP (ពី A ដល់ L)៖ នៅក្នុង Redfield stoichiometry វិសាលភាពភូមិសាស្ត្រ (រូបភាព 5C) សមាសភាពជីវម៉ាស់ក្រុមមុខងារ (រូបភាព 5A) និងការផ្គត់ផ្គង់សារធាតុចិញ្ចឹម (រូបភាព 5B) ត្រូវបានអនុវត្តដោយ N Zoomed ។សមាមាត្រ (N:Si:P:Fe, 1:1:16:16×103) ត្រូវបានបង្ហាញ។សម្រាប់បន្ទះក្រោយ P គុណនឹង 16 និង Fe គុណនឹង 16 × 103 ដូច្នេះក្រាហ្វរបារគឺស្មើនឹងតម្រូវការអាហារូបត្ថម្ភរបស់ phytoplankton ។
ខេត្តត្រូវបានចាត់ថ្នាក់ជា 12 AEPs A ដល់ L. (A) ជីវម៉ាស (mgC/m3) នៃប្រព័ន្ធអេកូក្នុងខេត្តចំនួន 12 ។(ខ) អត្រាលំហូរសារធាតុចិញ្ចឹមនៃអាសូតអសរីរាង្គរលាយ (N) ជាតិដែក (Fe) ផូស្វាត (P) និងអាស៊ីតស៊ីលីកិក (Si) (mmol/m3 ក្នុងមួយឆ្នាំ)។Fe និង P ត្រូវបានគុណនឹង 16 និង 16 × 103 រៀងគ្នា ដូច្នេះបន្ទះទាំងនោះត្រូវបានធ្វើឱ្យមានស្តង់ដារទៅនឹងតម្រូវការ phytoplankton stoichiometry ។(គ) ចំណាំភាពខុសគ្នារវាងតំបន់ប៉ូល ព្យុះស៊ីក្លូនត្រូពិច និងតំបន់សំខាន់ៗតាមរដូវ/ការកើនឡើង។ស្ថានីយ៍ត្រួតពិនិត្យត្រូវបានសម្គាល់ដូចខាងក្រោម: 1, កៅអី;2, អាឡូហា;3, ស្ថានីយ៍ P;និង 4, BATS ។
AEP ដែលបានកំណត់អត្តសញ្ញាណគឺមានតែមួយគត់។មានភាពស៊ីសង្វាក់គ្នាខ្លះនៅជុំវិញខ្សែអេក្វាទ័រនៅក្នុងមហាសមុទ្រអាត្លង់ទិក និងប៉ាស៊ីហ្វិក ហើយតំបន់ស្រដៀងគ្នា ប៉ុន្តែមានទំហំធំមាននៅក្នុងមហាសមុទ្រឥណ្ឌា។AEPs មួយចំនួនចាប់យកផ្នែកខាងលិចនៃទ្វីបដែលទាក់ទងនឹងការឡើងភ្នំ។ចរន្ត Circumpolar ប៉ូលខាងត្បូងត្រូវបានចាត់ទុកថាជាតំបន់ធំមួយ។ព្យុះស៊ីក្លូនត្រូពិចគឺជាស៊េរីស្មុគស្មាញនៃ oligotrophic AEP ។នៅក្នុងខេត្តទាំងនេះ គំរូដែលធ្លាប់ស្គាល់នៃភាពខុសគ្នានៃជីវម៉ាស់រវាង vortices oligotrophic ដែលគ្រប់គ្រងដោយ Plankton និងតំបន់ប៉ូលដែលសំបូរទៅដោយ diatom គឺជាក់ស្តែង។
AEPs ដែលមានជីវម៉ាស់ phytoplankton សរុបស្រដៀងគ្នាអាចមានរចនាសម្ព័ន្ធសហគមន៍ខុសគ្នាខ្លាំង និងគ្របដណ្តប់តំបន់ភូមិសាស្រ្តផ្សេងៗគ្នាដូចជា D, H និង K ដែលមានជីវម៉ាសសរុបរបស់ phytoplankton ស្រដៀងគ្នា។AEP H មានជាចម្បងនៅក្នុងមហាសមុទ្រឥណ្ឌាអេក្វាទ័រ ហើយមានបាក់តេរី diazotrophic ជាច្រើនទៀត។AEP D ត្រូវបានរកឃើញនៅក្នុងអាងជាច្រើន ប៉ុន្តែវាមានភាពលេចធ្លោជាពិសេសនៅក្នុងមហាសមុទ្រប៉ាស៊ីហ្វិកជុំវិញតំបន់ដែលមានទិន្នផលខ្ពស់នៅជុំវិញតំបន់អេក្វាទ័រ។រូបរាងនៃខេត្តប៉ាស៊ីហ្វិកនេះ គឺនឹកឃើញដល់រថភ្លើងរលកភពផែនដី។មាន diazobacteria តិចតួចនៅក្នុង AEP D និងកោណជាច្រើនទៀត។បើប្រៀបធៀបជាមួយខេត្តពីរផ្សេងទៀត AEP K ត្រូវបានរកឃើញតែនៅតំបន់ខ្ពង់រាបនៃមហាសមុទ្រអាកទិក ហើយមាន diatoms ច្រើន និង plankton តិចជាង។គួរកត់សម្គាល់ថាបរិមាណនៃ Plankton នៅក្នុងតំបន់ទាំងបីនេះក៏មានភាពខុសគ្នាខ្លាំងផងដែរ។ក្នុងចំនោមពួកគេ ភាពសម្បូរបែបនៃ Plankton នៃ AEP K គឺទាបខណៈពេលដែល AEP D និង H គឺខ្ពស់គួរសម។ដូច្នេះ ទោះបីជាជីវម៉ាស់របស់វា (ហើយដូច្នេះស្រដៀងទៅនឹង Chl-a) ខេត្តទាំងនេះគឺខុសគ្នាខ្លាំង៖ ការធ្វើតេស្តតាមខេត្តដែលមានមូលដ្ឋានលើ Chl ប្រហែលជាមិនចាប់យកភាពខុសគ្នាទាំងនេះទេ។
វាក៏ច្បាស់ដែរថា AEPs មួយចំនួនដែលមានជីវម៉ាស់ខុសគ្នាខ្លាំងអាចស្រដៀងគ្នាទាក់ទងនឹងរចនាសម្ព័ន្ធសហគមន៍ phytoplankton ។ឧទាហរណ៍ នេះអាចមើលឃើញនៅក្នុង AEP D និង E. ពួកគេនៅជិតគ្នា ហើយនៅមហាសមុទ្រប៉ាស៊ីហ្វិក AEP E គឺនៅជិត AEPJ ដែលមានផលិតភាពខ្ពស់។ស្រដៀងគ្នានេះដែរ មិនមានទំនាក់ទំនងច្បាស់លាស់រវាងជីវម៉ាស phytoplankton និងភាពសំបូរបែបរបស់ zooplankton ទេ។
AEP អាចត្រូវបានគេយល់នៅក្នុងលក្ខខណ្ឌនៃសារធាតុចិញ្ចឹមដែលបានផ្តល់ឱ្យពួកគេ (រូបភាព 5B) ។Diatoms មានតែនៅកន្លែងដែលមានការផ្គត់ផ្គង់អាស៊ីតស៊ីលីកច្រើន។ជាទូទៅការផ្គត់ផ្គង់អាស៊ីតស៊ីលីកកាន់តែខ្ពស់ ជីវម៉ាសរបស់ឌីអាតូមកាន់តែខ្ពស់។Diatoms អាចត្រូវបានគេមើលឃើញនៅក្នុង AEP A, J, K និង L. សមាមាត្រនៃ diatom biomass ទាក់ទងទៅនឹង phytoplankton ផ្សេងទៀតត្រូវបានកំណត់ដោយ N, P និង Fe ដែលបានផ្តល់ទាក់ទងទៅនឹងតម្រូវការ diatom ។ឧទាហរណ៍ AEP L ត្រូវបានគ្រប់គ្រងដោយ diatoms ។បើប្រៀបធៀបជាមួយសារធាតុចិញ្ចឹមផ្សេងទៀត Si មានការផ្គត់ផ្គង់ខ្ពស់បំផុត។ផ្ទុយទៅវិញ ទោះបីជាមានផលិតភាពខ្ពស់ក៏ដោយ ក៏ AEP J មាន diatoms តិច និងការផ្គត់ផ្គង់ស៊ីលីកូនតិច (ទាំងអស់ និងទាក់ទងទៅនឹងសារធាតុចិញ្ចឹមផ្សេងទៀត)។
បាក់តេរី Diazonium មានសមត្ថភាពជួសជុលអាសូត ប៉ុន្តែលូតលាស់យឺត (31) ។ពួកវារួមរស់ជាមួយ phytoplankton ផ្សេងទៀត ដែលជាតិដែក និងផូស្វ័រមានច្រើនហួសប្រមាណ ទាក់ទងទៅនឹងតម្រូវការសារធាតុចិញ្ចឹមដែលមិនមែនជា diazonium (20, 21)។គួរកត់សម្គាល់ថាជីវម៉ាស់ diazotrophic គឺខ្ពស់គួរសម ហើយការផ្គត់ផ្គង់ Fe និង P គឺមានទំហំធំទាក់ទងទៅនឹងការផ្គត់ផ្គង់ N. តាមវិធីនេះ ទោះបីជាជីវម៉ាស់សរុបនៅក្នុង AEP J ខ្ពស់ជាងក៏ដោយ ជីវម៉ាស់ diazonium នៅក្នុង AEP H គឺ ធំជាងនៅក្នុង J. សូមចំណាំថា AEP J និង H មានភូមិសាស្ត្រខុសគ្នាខ្លាំង ហើយ H មានទីតាំងនៅក្នុងមហាសមុទ្រឥណ្ឌាអេក្វាទ័រ។
ប្រសិនបើរចនាសម្ព័ន្ធប្រព័ន្ធអេកូតែមួយគត់មិនត្រូវបានបែងចែកទៅជាខេត្តទេ ការយល់ដឹងដែលទទួលបានពីគំរូស្មុគស្មាញទាបបំផុតទាំង 12 របស់ AEP នឹងមិនមានភាពច្បាស់លាស់នោះទេ។AEP បង្កើតដោយ SAGE ជួយសម្រួលដល់ការប្រៀបធៀបយ៉ាងស៊ីសង្វាក់គ្នា និងក្នុងពេលដំណាលគ្នានៃព័ត៌មានស្មុគស្មាញ និងវិមាត្រខ្ពស់ពីគំរូប្រព័ន្ធអេកូ។AEP សង្កត់ធ្ងន់យ៉ាងមានប្រសិទ្ធភាពថាហេតុអ្វីបានជា Chl មិនមែនជាវិធីសាស្ត្រល្អ និងជាជម្រើសដើម្បីកំណត់រចនាសម្ព័ន្ធសហគមន៍ ឬភាពសម្បូរបែបនៃសត្វផ្លាកតុននៅកម្រិតសារធាតុចិញ្ចឹមខ្ពស់។ការវិភាគលម្អិតនៃប្រធានបទស្រាវជ្រាវដែលកំពុងដំណើរការគឺហួសពីវិសាលភាពនៃអត្ថបទនេះ។វិធីសាស្ត្រ SAGE ផ្តល់នូវវិធីមួយដើម្បីស្វែងរកយន្តការផ្សេងទៀតនៅក្នុងគំរូដែលងាយស្រួលដោះស្រាយជាងការមើលពីចំណុចមួយទៅចំណុច។
វិធីសាស្ត្រ SAGE ត្រូវបានស្នើឡើងដើម្បីជួយបញ្ជាក់ពីទិន្នន័យអេកូឡូស៊ីដ៏ស្មុគស្មាញបំផុតពីគំរូលេខរូបវិទ្យា/ជីវគីមី/ប្រព័ន្ធអេកូឡូស៊ីសកល។ខេត្តអេកូឡូស៊ីត្រូវបានកំណត់ដោយជីវម៉ាស់សរុបនៃក្រុមមុខងារឆ្លងផ្លេកតុន ការអនុវត្តក្បួនដោះស្រាយការកាត់បន្ថយវិមាត្រប្រូបាប៊ីលីតេ t-SNE និងការចង្កោមដោយប្រើវិធីសាស្ត្រ ML ដែលមិនមានការត្រួតពិនិត្យ DBSCAN ។ទ្រឹស្ដីក្រាហ្វ/ភាពខុសគ្នា BC អន្តរខេត្តសម្រាប់វិធីសាស្ត្រដាក់សំបុកត្រូវបានអនុវត្តដើម្បីទទួលបាន AEP ដ៏រឹងមាំដែលអាចត្រូវបានប្រើសម្រាប់ការបកស្រាយជាសកល។បើនិយាយពីការសាងសង់វិញ គឺតំបន់អេកូ-ខេត្ត និង AEP មានតែមួយគត់។ការដាក់សំបុក AEP អាចត្រូវបានកែតម្រូវរវាងភាពស្មុគស្មាញពេញលេញនៃខេត្តអេកូឡូស៊ីដើម និងកម្រិតអប្បបរមាដែលបានណែនាំនៃ 12 AEPs ។ការដាក់សំបុក និងការកំណត់ភាពស្មុគស្មាញអប្បបរមានៃ AEP ត្រូវបានចាត់ទុកថាជាជំហានសំខាន់ៗ ពីព្រោះប្រូបាប៊ីលីតេ t-SNE ធ្វើឱ្យ AEPs នៃភាពស្មុគស្មាញ <12 ។វិធីសាស្ត្រ SAGE គឺមានលក្ខណៈសកល ហើយភាពស្មុគស្មាញរបស់វាមានចាប់ពី> 100 AEPs ដល់ 12។ សម្រាប់ភាពសាមញ្ញ ការផ្តោតអារម្មណ៍នាពេលបច្ចុប្បន្នគឺទៅលើភាពស្មុគស្មាញនៃ 12 AEPs សកល។ការស្រាវជ្រាវនាពេលអនាគត ជាពិសេសការសិក្សាក្នុងតំបន់អាចរកឃើញផ្នែកតូចៗនៃតំបន់អេកូឡូស៊ីសកលដែលមានប្រយោជន៍ ហើយអាចត្រូវបានប្រមូលផ្តុំនៅក្នុងតំបន់តូចមួយដើម្បីទាញយកអត្ថប្រយោជន៍ពីការយល់ដឹងអំពីអេកូឡូស៊ីដូចគ្នាដែលបានពិភាក្សានៅទីនេះ។វាផ្តល់នូវការផ្ដល់យោបល់អំពីរបៀបដែលខេត្តអេកូឡូស៊ីទាំងនេះ និងការយល់ដឹងដែលទទួលបានពីពួកវាអាចត្រូវបានប្រើសម្រាប់ការយល់ដឹងបន្ថែមអំពីអេកូឡូស៊ី ជួយសម្រួលការប្រៀបធៀបគំរូ និងបង្កើនសក្តានុពលក្នុងការត្រួតពិនិត្យប្រព័ន្ធអេកូឡូស៊ីសមុទ្រ។
ខេត្តអេកូឡូស៊ី និង AEP ដែលកំណត់ដោយវិធីសាស្ត្រ SAGE គឺផ្អែកលើទិន្នន័យនៅក្នុងគំរូលេខ។តាមនិយមន័យ គំរូលេខគឺជារចនាសម្ព័ន្ធសាមញ្ញ ដោយព្យាយាមចាប់យកខ្លឹមសារនៃប្រព័ន្ធគោលដៅ ហើយម៉ូដែលផ្សេងៗគ្នានឹងមានការចែកចាយ Plankton ខុសៗគ្នា។គំរូលេខដែលប្រើក្នុងការសិក្សានេះមិនអាចចាប់យកបានពេញលេញនូវគំរូដែលបានសង្កេតមួយចំនួន (ឧទាហរណ៍ នៅក្នុងការប៉ាន់ស្មាន Chl សម្រាប់តំបន់អេក្វាទ័រ និងមហាសមុទ្រខាងត្បូង)។មានតែផ្នែកតូចមួយនៃភាពចម្រុះនៅក្នុងមហាសមុទ្រពិតប្រាកដប៉ុណ្ណោះដែលត្រូវបានចាប់យក ហើយ meso និង sub-mesoscales មិនអាចដោះស្រាយបាន ដែលអាចប៉ះពាល់ដល់លំហូរសារធាតុចិញ្ចឹម និងរចនាសម្ព័ន្ធសហគមន៍ខ្នាតតូច។ទោះបីជាមានការខ្វះខាតទាំងនេះក៏ដោយ វាប្រែថា AEP មានប្រយោជន៍ខ្លាំងណាស់ក្នុងការជួយឱ្យយល់អំពីគំរូស្មុគស្មាញ។តាមរយៈការវាយតម្លៃកន្លែងដែលខេត្តអេកូឡូស៊ីស្រដៀងគ្នាត្រូវបានរកឃើញ AEP ផ្តល់នូវឧបករណ៍ប្រៀបធៀបគំរូលេខដែលមានសក្តានុពល។គំរូលេខបច្ចុប្បន្នចាប់យកគំរូទាំងមូលនៃកំហាប់ phytoplankton Chl-a ពីចម្ងាយ និងការចែកចាយទំហំ និងក្រុមមុខងារ (ចំណាំ S1 និងរូបភាព S1) (2, 32) ។
ដូចដែលបានបង្ហាញដោយបន្ទាត់វណ្ឌវង្ក 0.1 mgChl-a/m-3 AEP ត្រូវបានបែងចែកទៅជាតំបន់ oligotrophic និងតំបន់ mesotrophic (រូបភាព S1B): AEP B, C, D, E, F និង G គឺជាតំបន់ oligotrophic ហើយតំបន់ដែលនៅសល់គឺ មានទីតាំងនៅ Higher Chl-a ។AEP បង្ហាញពីការឆ្លើយឆ្លងមួយចំនួនជាមួយខេត្ត Longhurst (រូបភាព S3A) ឧទាហរណ៍ មហាសមុទ្រខាងត្បូង និងប៉ាស៊ីហ្វិកអេក្វាទ័រ។នៅក្នុងតំបន់មួយចំនួន AEP គ្របដណ្តប់តំបន់ Longhurst ជាច្រើន និងច្រាសមកវិញ។ដោយសារចេតនានៃការកំណត់ខេត្តនៅក្នុងតំបន់នេះ និង Longhurst មានភាពខុសប្លែកគ្នា វាត្រូវបានគេរំពឹងថានឹងមានភាពខុសគ្នា។AEPs ជាច្រើននៅក្នុងខេត្ត Longhurst បង្ហាញថាតំបន់មួយចំនួនដែលមានជីវគីមីវិទ្យាស្រដៀងគ្នាអាចមានរចនាសម្ព័ន្ធប្រព័ន្ធអេកូខុសគ្នាខ្លាំង។AEP បង្ហាញការឆ្លើយឆ្លងជាក់លាក់មួយជាមួយនឹងស្ថានភាពរូបវន្ត ដូចដែលបានបង្ហាញដោយប្រើការរៀនដែលគ្មានការត្រួតពិនិត្យ (19) ដូចជានៅក្នុងរដ្ឋដែលមានការកើនឡើងខ្ពស់ (ឧទាហរណ៍ មហាសមុទ្រខាងត្បូង និងប៉ាស៊ីហ្វិកអេក្វាទ័រ។ រូបភាព S3, C និង D)។ការឆ្លើយឆ្លងទាំងនេះបង្ហាញថារចនាសម្ព័ន្ធសហគមន៍របស់ Plankton ត្រូវបានជះឥទ្ធិពលយ៉ាងខ្លាំងដោយសក្ដានុពលមហាសមុទ្រ។នៅក្នុងតំបន់ដូចជាអាត្លង់ទិកខាងជើង AEP ឆ្លងកាត់ខេត្តជាក់ស្តែង។យន្តការដែលបណ្តាលឱ្យមានភាពខុសគ្នាទាំងនេះអាចរួមបញ្ចូលដំណើរការដូចជាការដឹកជញ្ជូនធូលី ដែលអាចនាំទៅរកកម្មវិធីអាហារូបត្ថម្ភខុសគ្នាទាំងស្រុង ទោះបីជាស្ថិតនៅក្រោមលក្ខខណ្ឌរាងកាយស្រដៀងគ្នាក៏ដោយ។
ក្រសួងបរិស្ថាន និង AEP បានចង្អុលបង្ហាញថា ការប្រើប្រាស់ Chl តែឯងមិនអាចកំណត់អត្តសញ្ញាណសមាសធាតុអេកូឡូស៊ីបានទេ ដូចដែលសហគមន៍បរិស្ថានវិទ្យាសមុទ្របានដឹងរួចហើយ។នេះត្រូវបានគេមើលឃើញនៅក្នុង AEPs ដែលមានជីវម៉ាស់ស្រដៀងគ្នា ប៉ុន្តែសមាសធាតុអេកូឡូស៊ីខុសគ្នាខ្លាំង (ដូចជា D និង E)។ផ្ទុយទៅវិញ AEPs ដូចជា D និង K មានជីវម៉ាស់ខុសគ្នាខ្លាំង ប៉ុន្តែសមាសធាតុអេកូឡូស៊ីស្រដៀងគ្នា។AEP សង្កត់ធ្ងន់ថា ទំនាក់ទំនងរវាងជីវម៉ាស សមាសភាពអេកូឡូស៊ី និងភាពសម្បូរបែបនៃសត្វផ្លាកតុន គឺស្មុគស្មាញ។ជាឧទាហរណ៍ ទោះបីជា AEP J មានភាពលេចធ្លោក្នុងលក្ខខណ្ឌនៃជីវម៉ាសផ្លាំងតុន និង Plankton ក៏ដោយ ក៏ AEP របស់ A និង L មានជីវម៉ាស់ Plankton ស្រដៀងគ្នា ប៉ុន្តែ A មានបរិមាណ Plankton ខ្ពស់ជាង។AEP សង្កត់ធ្ងន់ថា ជីវម៉ាស phytoplankton (ឬ Chl) មិនអាចប្រើដើម្បីទស្សន៍ទាយជីវម៉ាសរបស់ zooplankton បានទេ។Zooplankton គឺជាមូលដ្ឋានគ្រឹះនៃខ្សែសង្វាក់អាហារនេសាទ ហើយការប៉ាន់ប្រមាណត្រឹមត្រូវជាងនេះ អាចនាំឱ្យការគ្រប់គ្រងធនធានកាន់តែប្រសើរឡើង។ផ្កាយរណបពណ៌សមុទ្រនាពេលអនាគត [ឧទាហរណ៍ PACE (plankton, aerosol, cloud, and marine ecosystem)] ប្រហែលជាមានទីតាំងប្រសើរជាងមុន ដើម្បីជួយប៉ាន់ស្មានរចនាសម្ព័ន្ធសហគមន៍របស់ phytoplankton ។ការប្រើប្រាស់ការទស្សន៍ទាយ AEP អាចជួយសម្រួលដល់ការប៉ាន់ប្រមាណនៃ zooplankton ពីលំហ។វិធីសាស្រ្តដូចជា SAGE រួមជាមួយនឹងបច្ចេកវិទ្យាថ្មី និងទិន្នន័យវាលកាន់តែច្រើនដែលអាចរកបានសម្រាប់ការស្ទង់មតិការពិត (ដូចជា Tara និងការស្រាវជ្រាវតាមដាន) អាចរួមគ្នាបោះជំហានឆ្ពោះទៅរកការត្រួតពិនិត្យសុខភាពប្រព័ន្ធអេកូតាមផ្កាយរណប។
វិធីសាស្រ្ត SAGE ផ្តល់នូវមធ្យោបាយងាយស្រួលមួយដើម្បីវាយតម្លៃយន្តការមួយចំនួនដែលគ្រប់គ្រងលក្ខណៈខេត្ត ដូចជាជីវម៉ាស់/Chl ផលិតកម្មបឋមសុទ្ធ និងរចនាសម្ព័ន្ធសហគមន៍។ឧទាហរណ៍ ចំនួនដែលទាក់ទងនៃ diatoms ត្រូវបានកំណត់ដោយអតុល្យភាពនៅក្នុងការផ្គត់ផ្គង់ Si, N, P និង Fe ដែលទាក់ទងទៅនឹងតម្រូវការ phytoplankton stoichiometric ។នៅអត្រាផ្គត់ផ្គង់ដែលមានតុល្យភាព សហគមន៍ត្រូវបានគ្រប់គ្រងដោយ diatoms (L) ។នៅពេលដែលអត្រាផ្គត់ផ្គង់មិនមានតុល្យភាព (ពោលគឺការផ្គត់ផ្គង់ស៊ីលីកុនគឺទាបជាងតម្រូវការសារធាតុចិញ្ចឹមនៃ diatoms) diatoms គិតតែផ្នែកតូចមួយប៉ុណ្ណោះ Share (K)។នៅពេលដែលការផ្គត់ផ្គង់ Fe និង P លើសពីការផ្គត់ផ្គង់ N (ឧទាហរណ៍ E និង H) បាក់តេរី diazotrophic នឹងកើនឡើងយ៉ាងខ្លាំង។តាមរយៈបរិបទដែលផ្តល់ដោយ AEP ការរុករកយន្តការត្រួតពិនិត្យនឹងកាន់តែមានប្រយោជន៍។
Eco-Province និង AEP គឺជាតំបន់ដែលមានរចនាសម្ព័ន្ធសហគមន៍ស្រដៀងគ្នា។ស៊េរីពេលវេលាពីទីតាំងជាក់លាក់មួយនៅក្នុងខេត្តអេកូឡូស៊ី ឬ AEP អាចត្រូវបានចាត់ទុកថាជាចំណុចយោង ហើយអាចតំណាងឱ្យតំបន់គ្របដណ្តប់ដោយខេត្តអេកូឡូស៊ី ឬ AEP ។ស្ថានីយ៍ត្រួតពិនិត្យរយៈពេលវែងនៅនឹងកន្លែងផ្តល់នូវស៊េរីពេលវេលាបែបនេះ។សំណុំទិន្នន័យក្នុងទីតាំងរយៈពេលវែងនឹងបន្តដើរតួនាទីដែលមិនអាចគណនាបាន។តាមទស្សនៈនៃការត្រួតពិនិត្យរចនាសម្ព័ន្ធសហគមន៍ វិធីសាស្ត្រ SAGE អាចត្រូវបានគេមើលឃើញថាជាមធ្យោបាយមួយដើម្បីជួយកំណត់ទីតាំងដែលមានប្រយោជន៍បំផុតនៃគេហទំព័រថ្មី។ឧទាហរណ៍ ស៊េរីពេលវេលាពីការវាយតម្លៃលំនៅឋាន oligotrophic រយៈពេលវែង (ALOHA) គឺស្ថិតនៅក្នុង AEP B នៃតំបន់ oligotrophic (រូបភាព 5C, ស្លាកលេខ 2)។ដោយសារ ALOHA នៅជិតព្រំដែននៃ AEP មួយផ្សេងទៀត ស៊េរីពេលវេលាអាចមិនមែនជាតំណាងនៃតំបន់ទាំងមូល ដូចដែលបានស្នើពីមុន (33)។នៅក្នុង AEP B ដូចគ្នា ស៊េរីពេលវេលា SEATS (ស៊េរីម៉ោងអាស៊ីអាគ្នេយ៍) មានទីតាំងនៅភាគនិរតីនៃកោះតៃវ៉ាន់ (34) ឆ្ងាយពីព្រំដែននៃ AEPs ផ្សេងទៀត (រូបភាព 5C ស្លាកលេខ 1) ហើយអាចប្រើជាទីតាំងប្រសើរជាងមុនដើម្បីត្រួតពិនិត្យ។ AEPBស៊េរីពេលវេលា BATS (Bermuda Atlantic Time Series Study) (រូបភាពទី 5C, ស្លាកលេខ 4) នៅក្នុង AEPC គឺនៅជិតនឹងព្រំដែនរវាង AEP C និង F ដែលបង្ហាញថាការត្រួតពិនិត្យ AEP C ដោយប្រើស៊េរីពេលវេលា BATS អាចមានបញ្ហាដោយផ្ទាល់។ស្ថានីយ៍ P ក្នុង AEP J (រូបភាពទី 5C ស្លាកលេខ 3) គឺនៅឆ្ងាយពីព្រំដែន AEP ដូច្នេះវាគឺជាតំណាងច្រើនជាង។Eco-Province និង AEP អាចជួយបង្កើតក្របខណ្ឌត្រួតពិនិត្យដែលសមរម្យសម្រាប់ការវាយតម្លៃការផ្លាស់ប្តូរសកលព្រោះការអនុញ្ញាតរបស់ខេត្តក្នុងការវាយតម្លៃកន្លែងដែលការយកគំរូតាមកន្លែងអាចផ្តល់នូវការយល់ដឹងសំខាន់ៗ។វិធីសាស្ត្រ SAGE អាចត្រូវបានអភិវឌ្ឍបន្ថែមទៀត ដើម្បីអនុវត្តចំពោះទិន្នន័យអាកាសធាតុ ដើម្បីវាយតម្លៃភាពប្រែប្រួលដែលសន្សំសំចៃពេលវេលា។
ភាពជោគជ័យនៃវិធីសាស្ត្រ SAGE ត្រូវបានសម្រេចតាមរយៈការអនុវត្តយ៉ាងប្រុងប្រយ័ត្ននៃវិធីសាស្រ្តវិទ្យាសាស្ត្រទិន្នន័យ/ML និងចំណេះដឹងជាក់លាក់នៃដែន។ជាពិសេស t-SNE ត្រូវបានប្រើដើម្បីអនុវត្តការកាត់បន្ថយវិមាត្រ ដែលរក្សារចនាសម្ព័ន្ធនៃទិន្នន័យដែលមានវិមាត្រខ្ពស់ និងជួយសម្រួលដល់ការមើលឃើញនៃការបង្ហាញភាពប្រែប្រួល។ទិន្នន័យត្រូវបានរៀបចំជាទម្រង់ឆ្នូត និងគំលាត (រូបភាព 2A) ដែលបង្ហាញថាវិធានការផ្អែកលើចម្ងាយសុទ្ធសាធ (ដូចជា K-means) មិនសមស្របទេ ព្រោះជាធម្មតាពួកគេប្រើការចែកចាយមូលដ្ឋាន Gaussian (រាងជារង្វង់) (ពិភាក្សាក្នុង Note S2) .វិធីសាស្ត្រ DBSCAN គឺស័ក្តិសមសម្រាប់ topology ដែលមានលក្ខណៈដូចគ្នាបេះបិទ។ដរាបណាអ្នកយកចិត្តទុកដាក់លើការកំណត់ប៉ារ៉ាម៉ែត្រ ការកំណត់អត្តសញ្ញាណដែលអាចទុកចិត្តបានអាចត្រូវបានផ្តល់ជូន។ការចំណាយលើការគណនានៃ t-SNE algorithm គឺខ្ពស់ ដែលកំណត់កម្មវិធីបច្ចុប្បន្នរបស់វាទៅនឹងចំនួនទិន្នន័យធំជាង ដែលមានន័យថាវាពិបាកក្នុងការអនុវត្តចំពោះវាលជ្រៅ ឬពេលវេលាប្រែប្រួល។ការងារលើការធ្វើមាត្រដ្ឋាននៃ t-SNE កំពុងដំណើរការ។ដោយសារចម្ងាយ KL មានភាពងាយស្រួលក្នុងការប៉ារ៉ាឡែល t-SNE algorithm មានសក្តានុពលល្អសម្រាប់ការពង្រីកនាពេលអនាគត (35) ។រហូតមកដល់ពេលនេះ វិធីសាស្ត្រកាត់បន្ថយវិមាត្រដ៏ជោគជ័យផ្សេងទៀត ដែលអាចកាត់បន្ថយទំហំបានកាន់តែល្អ រួមមានបច្ចេកទេសការប៉ាន់ប្រមាណ និងការព្យាករ (UMAP) ដែលបង្រួបបង្រួម ប៉ុន្តែការវាយតម្លៃក្នុងបរិបទនៃទិន្នន័យមហាសមុទ្រគឺចាំបាច់។អត្ថន័យនៃការធ្វើមាត្រដ្ឋានបានល្អប្រសើរគឺឧទាហរណ៍ ការចាត់ថ្នាក់អាកាសធាតុសកល ឬគំរូដែលមានភាពស្មុគស្មាញខុសៗគ្នាលើស្រទាប់ចម្រុះ។តំបន់ដែលមិនត្រូវបានចាត់ថ្នាក់ដោយ SAGE នៅក្នុងខេត្តណាមួយអាចត្រូវបានចាត់ទុកថាជាចំណុចខ្មៅដែលនៅសល់ក្នុងរូបភាពទី 2A ។តាមភូមិសាស្ត្រ តំបន់ទាំងនេះភាគច្រើនស្ថិតនៅក្នុងតំបន់ដែលមានរដូវខ្ពស់ ដែលបង្ហាញថាការចាប់យកខេត្តអេកូឡូស៊ីដែលផ្លាស់ប្តូរតាមពេលវេលានឹងផ្តល់នូវការគ្របដណ្តប់កាន់តែប្រសើរ។
ដើម្បីបង្កើតវិធីសាស្រ្ត SAGE គំនិតពីប្រព័ន្ធស្មុគស្មាញ/វិទ្យាសាស្ត្រទិន្នន័យត្រូវបានប្រើប្រាស់ ដោយប្រើសមត្ថភាពក្នុងការកំណត់ចង្កោមនៃក្រុមមុខងារ (លទ្ធភាពនៃការនៅជិតគ្នាក្នុងចន្លោះ 11 វិមាត្រ) និងកំណត់ខេត្ត។ខេត្តទាំងនេះបង្ហាញពីបរិមាណជាក់លាក់នៅក្នុងចន្លោះដំណាក់កាល 3D t-SNE របស់យើង។ស្រដៀងគ្នានេះដែរ ផ្នែក Poincaré អាចត្រូវបានប្រើដើម្បីវាយតម្លៃ "បរិមាណ" នៃលំហរដ្ឋដែលកាន់កាប់ដោយគន្លងដើម្បីកំណត់អាកប្បកិរិយា "ធម្មតា" ឬ "វឹកវរ" (36) ។សម្រាប់លទ្ធផលគំរូ 11 វិមាត្រឋិតិវន្ត បរិមាណដែលបានកាន់កាប់បន្ទាប់ពីទិន្នន័យត្រូវបានបំប្លែងទៅជាលំហដំណាក់កាល 3D អាចត្រូវបានពន្យល់ស្រដៀងគ្នា។ទំនាក់ទំនងរវាងតំបន់ភូមិសាស្ត្រ និងតំបន់នៅក្នុងលំហដំណាក់កាល 3D គឺមិនសាមញ្ញទេ ប៉ុន្តែវាអាចត្រូវបានពន្យល់ក្នុងលក្ខខណ្ឌនៃភាពស្រដៀងគ្នានៃអេកូឡូស៊ី។សម្រាប់ហេតុផលនេះ រង្វាស់ភាពស្រដៀងគ្នា BC ធម្មតាត្រូវបានគេពេញចិត្ត។
ការងារនាពេលអនាគតនឹងប្រើប្រាស់ឡើងវិញនូវវិធីសាស្ត្រ SAGE សម្រាប់ទិន្នន័យផ្លាស់ប្តូរតាមរដូវកាល ដើម្បីវាយតម្លៃភាពប្រែប្រួលនៃទំហំនៃខេត្តដែលបានកំណត់ និង AEP ។គោលដៅនាពេលអនាគតគឺប្រើប្រាស់វិធីសាស្ត្រនេះ ដើម្បីជួយកំណត់ថាតើខេត្តណាខ្លះអាចកំណត់បានតាមរយៈការវាស់វែងតាមផ្កាយរណប (ដូចជា Chl-a ការឆ្លុះបញ្ចាំងពីចម្ងាយ និងសីតុណ្ហភាពផ្ទៃសមុទ្រ)។នេះនឹងអនុញ្ញាតឱ្យមានការវាយតម្លៃពីចម្ងាយនៃសមាសធាតុអេកូឡូស៊ី និងការត្រួតពិនិត្យប្រកបដោយភាពបត់បែនខ្ពស់នៃខេត្តអេកូឡូស៊ី និងភាពប្រែប្រួលរបស់វា។
គោលបំណងនៃការស្រាវជ្រាវនេះគឺដើម្បីណែនាំវិធីសាស្រ្ត SAGE ដែលកំណត់ខេត្តអេកូឡូស៊ីតាមរយៈរចនាសម្ព័ន្ធសហគមន៍ Plankton តែមួយគត់របស់វា។នៅទីនេះ ព័ត៌មានលម្អិតបន្ថែមអំពីគំរូរូបវិទ្យា/ជីវគីមី/ប្រព័ន្ធអេកូឡូស៊ី និងការជ្រើសរើសប៉ារ៉ាម៉ែត្រនៃក្បួនដោះស្រាយ t-SNE និង DBSCAN នឹងត្រូវបានផ្តល់ជូន។
សមាសធាតុរូបវន្តនៃគំរូបានមកពីការប៉ាន់ប្រមាណនៃចរន្តទឹកសមុទ្រ និងអាកាសធាតុ [ECCOv4;(37) ការប៉ាន់ប្រមាណរបស់រដ្ឋសកលដែលបានពិពណ៌នាដោយ (38) ។ដំណោះស្រាយបន្ទាប់បន្សំនៃការប៉ាន់ប្រមាណរបស់រដ្ឋគឺ 1/5 ។វិធីសាស្ត្រការេតិចបំផុតជាមួយវិធីសាស្ត្រមេគុណ Lagrangian ត្រូវបានប្រើដើម្បីទទួលបានលក្ខខណ្ឌដំបូង និងព្រំដែន និងប៉ារ៉ាម៉ែត្រគំរូខាងក្នុងដែលបានកែតម្រូវដោយការសង្កេត ដោយហេតុនេះបង្កើតគំរូវដ្តទូទៅ MIT ដែលដំណើរការដោយសេរី (MITgcm) (39) គំរូបន្ទាប់ពីការបង្កើនប្រសិទ្ធភាព លទ្ធផលអាច ត្រូវបានតាមដាន និងសង្កេត។
ជីវគីមីវិទ្យា/ប្រព័ន្ធអេកូឡូស៊ី មានការពិពណ៌នាពេញលេញជាង (ឧទាហរណ៍ សមីការ និងតម្លៃប៉ារ៉ាម៉ែត្រ) ក្នុង (2)។គំរូចាប់យកចរន្តឈាមរបស់ C, N, P, Si និង Fe តាមរយៈស្រះអសរីរាង្គ និងសរីរាង្គ។កំណែដែលបានប្រើនៅទីនេះរួមមាន 35 ប្រភេទនៃ phytoplankton: 2 ប្រភេទនៃ microprokaryotes និង 2 ប្រភេទ microeukaryotes (សមរម្យសម្រាប់បរិស្ថានដែលមានសារធាតុចិញ្ចឹមទាប), 5 ប្រភេទ Cryptomonas sphaeroides (ជាមួយថ្នាំកូតកាល់ស្យូមកាបូណាត), 5 ប្រភេទ diazonium (អាចជួសជុលអាសូត ដូច្នេះ វាមិនត្រូវបានកំណត់) ភាពអាចរកបាននៃអាសូតអសរីរាង្គដែលរលាយ) 11 diatoms (បង្កើតជាគម្របស៊ីលីកុន) flagellates បន្លែចម្រុះចំនួន 10 (អាចធ្វើរស្មីសំយោគ និងបរិភោគ plankton ផ្សេងទៀត) និង 16 Zooplankton (ស៊ីស្មៅនៅលើ plankton ផ្សេងទៀត) ។ទាំងនេះត្រូវបានគេហៅថា "ក្រុមមុខងារជីវគីមី" ព្រោះវាមានឥទ្ធិពលខុសៗគ្នាលើជីវគីមីវិទ្យាសមុទ្រ (40, 41) ហើយជារឿយៗត្រូវបានគេប្រើនៅក្នុងការសង្កេត និងការសិក្សាគំរូ។នៅក្នុងគំរូនេះ ក្រុមមុខងារនីមួយៗត្រូវបានផ្សំឡើងដោយ planktons ជាច្រើនដែលមានទំហំខុសៗគ្នា ដោយមានចន្លោះពី 0.6 ទៅ 2500 μm អង្កត់ផ្ចិតស្វ៊ែរសមមូល។
ប៉ារ៉ាម៉ែត្រដែលប៉ះពាល់ដល់ការលូតលាស់របស់ phytoplankton ការស៊ីស្មៅ និងការលិចគឺទាក់ទងទៅនឹងទំហំ ហើយមានភាពខុសគ្នាជាក់លាក់រវាងក្រុមមុខងារ phytoplankton ចំនួនប្រាំមួយ (32)។ទោះបីជាមានក្របខ័ណ្ឌរូបវន្តខុសៗគ្នាក៏ដោយ លទ្ធផលនៃសមាសធាតុ Plankton ចំនួន 51 នៃគំរូត្រូវបានប្រើប្រាស់ក្នុងការសិក្សាថ្មីៗមួយចំនួន (42-44)។
ចាប់ពីឆ្នាំ 1992 ដល់ឆ្នាំ 2011 គំរូនៃការភ្ជាប់រូបវ័ន្ត/ជីវគីមីវិទ្យា/ប្រព័ន្ធអេកូឡូស៊ីបានដំណើរការអស់រយៈពេល 20 ឆ្នាំ។លទ្ធផលនៃគំរូរួមមានជីវម៉ាស Plankton ការប្រមូលផ្តុំសារធាតុចិញ្ចឹម និងអត្រាផ្គត់ផ្គង់សារធាតុចិញ្ចឹម (DIN, PO4, Si និង Fe)។នៅក្នុងការសិក្សានេះ ជាមធ្យម 20 ឆ្នាំនៃទិន្នផលទាំងនេះត្រូវបានប្រើជាធាតុបញ្ចូលនៃខេត្តអេកូឡូស៊ី។Chl ការចែកចាយជីវម៉ាសរបស់ Plankton និងការប្រមូលផ្តុំសារធាតុចិញ្ចឹម និងការចែកចាយនៃក្រុមមុខងារត្រូវបានប្រៀបធៀបជាមួយនឹងការអង្កេតតាមផ្កាយរណប និងក្នុងកន្លែង [សូមមើល (2, 44) កំណត់ចំណាំ S1 និងរូបភាព។S1 ដល់ S3] ។
សម្រាប់វិធីសាស្ត្រ SAGE ប្រភពសំខាន់នៃភាពចៃដន្យបានមកពីជំហាន t-SNE ។ភាពចៃដន្យរារាំងការកើតឡើងដដែលៗ ដែលមានន័យថាលទ្ធផលមិនគួរឱ្យទុកចិត្ត។វិធីសាស្ត្រ SAGE ធ្វើតេស្តយ៉ាងម៉ត់ចត់នូវភាពរឹងមាំដោយកំណត់សំណុំនៃប៉ារ៉ាម៉ែត្រនៃ t-SNE និង DBSCAN ដែលអាចកំណត់អត្តសញ្ញាណចង្កោមជាប់លាប់នៅពេលធ្វើម្តងទៀត។ការកំណត់ "ភាពច្របូកច្របល់" នៃប៉ារ៉ាម៉ែត្រ t-SNE អាចត្រូវបានយល់ថាជាការកំណត់កម្រិតដែលការគូសផែនទីពីវិមាត្រខ្ពស់ទៅទាបគួរតែគោរពលក្ខណៈមូលដ្ឋាន ឬសកលនៃទិន្នន័យ។ឈានដល់ភាពច្របូកច្របល់នៃការធ្វើម្តងទៀត 400 និង 300 ។
សម្រាប់ក្បួនដោះស្រាយចង្កោម DBSCAN ទំហំអប្បបរមា និងចម្ងាយម៉ែត្រនៃចំណុចទិន្នន័យក្នុងចង្កោមចាំបាច់ត្រូវកំណត់។ចំនួនអប្បបរមាត្រូវបានកំណត់ក្រោមការណែនាំរបស់អ្នកជំនាញ។ចំនេះដឹងនេះដឹងពីអ្វីដែលស័ក្តិសមជាមួយក្របខណ្ឌគំរូលេខបច្ចុប្បន្ន និងដំណោះស្រាយ។ចំនួនអប្បបរមាគឺ 100 ។ តម្លៃអប្បបរមាខ្ពស់ជាង (តិចជាង <135 មុនពេលដែនកំណត់ខាងលើនៃពណ៌បៃតងកាន់តែទូលំទូលាយ) អាចត្រូវបានពិចារណា ប៉ុន្តែវាមិនអាចជំនួសវិធីសាស្ត្រប្រមូលផ្តុំដោយផ្អែកលើភាពស្រដៀងគ្នានៃ BC បានទេ។កម្រិតនៃការតភ្ជាប់ (រូបភាព 6A) ត្រូវបានប្រើដើម្បីកំណត់ប៉ារ៉ាម៉ែត្រ ϵ ដែលអំណោយផលដល់ការគ្របដណ្តប់ខ្ពស់ (រូបភាព 6B) ។ការតភ្ជាប់ត្រូវបានកំណត់ជាចំនួនសមាសធាតុនៃចង្កោម ហើយមានភាពរសើបចំពោះប៉ារ៉ាម៉ែត្រϵ។ការតភ្ជាប់ទាបបង្ហាញពីភាពសមមិនគ្រប់គ្រាន់ ការដាក់ជាក្រុមដោយសិប្បនិម្មិត។ការតភ្ជាប់ខ្ពស់បង្ហាញពីការពាក់លើស។Overfitting ក៏មានបញ្ហាផងដែរ ព្រោះវាបង្ហាញថាការស្មានដោយចៃដន្យដំបូងអាចនាំទៅរកលទ្ធផលដែលមិនអាចផលិតឡើងវិញបាន។រវាងចំណុចខ្លាំងទាំងពីរនេះ ការកើនឡើងយ៉ាងខ្លាំង (ជាទូទៅគេហៅថា "កែងដៃ") បង្ហាញពី ϵ ល្អបំផុត។នៅក្នុងរូបភាពទី 6A អ្នកឃើញការកើនឡើងយ៉ាងខ្លាំងនៅក្នុងតំបន់ខ្ពង់រាប (ពណ៌លឿង> 200 ចង្កោម) អមដោយការថយចុះយ៉ាងខ្លាំង (ពណ៌បៃតង 100 ចង្កោម) រហូតដល់ប្រហែល 130 ដែលហ៊ុំព័ទ្ធដោយចង្កោមតិចតួចបំផុត (ពណ៌ខៀវ <60 ចង្កោម) )នៅក្នុងតំបន់ពណ៌ខៀវយ៉ាងហោចណាស់ 100 ចង្កោមមួយគ្របដណ្ដប់លើមហាសមុទ្រទាំងមូល (ϵ <0.42) ឬភាគច្រើននៃមហាសមុទ្រមិនត្រូវបានចាត់ថ្នាក់ ហើយត្រូវបានចាត់ទុកថាជាសំឡេងរំខាន (ϵ> 0.99)។ផ្ទៃពណ៌លឿងមានការចែកចាយចង្កោមដែលប្រែប្រួលខ្លាំង និងមិនអាចផលិតឡើងវិញបាន។នៅពេលដែល ϵ ថយចុះ សំលេងរំខានកើនឡើង។តំបន់ពណ៌បៃតងដែលកើនឡើងយ៉ាងខ្លាំងត្រូវបានគេហៅថាកែងដៃ។នេះគឺជាតំបន់ល្អបំផុត។ទោះបីជាប្រូបាប៊ីលីតេ t-SNE ត្រូវបានប្រើក៏ដោយ ភាពស្រដៀងគ្នានៃ BC នៅក្នុងខេត្តនៅតែអាចប្រើដើម្បីកំណត់ចង្កោមដែលអាចទុកចិត្តបាន។ដោយប្រើរូបភាពទី 6 (A និង B) កំណត់ ϵ ដល់ 0.39 ។ចំនួនអប្បរមាកាន់តែធំ ប្រូបាប៊ីលីតេនៃការឈានដល់ ϵ កាន់តែតូច ដែលអនុញ្ញាតឱ្យមានការចាត់ថ្នាក់ដែលអាចទុកចិត្តបាន និងទំហំពណ៌បៃតងដែលមានតម្លៃធំជាង 135 ។ ការពង្រីកតំបន់នេះបង្ហាញថាកែងដៃនឹងពិបាករក ឬមិនមាន។ មាន។
បន្ទាប់ពីកំណត់ប៉ារ៉ាម៉ែត្រនៃ t-SNE ចំនួនសរុបនៃចង្កោមដែលបានរកឃើញនឹងត្រូវបានប្រើជារង្វាស់នៃការតភ្ជាប់ (A) និងភាគរយនៃទិន្នន័យដែលបានបម្រុងទុកសម្រាប់ចង្កោម (B) ។ចំណុចក្រហមបង្ហាញពីការរួមបញ្ចូលគ្នាដ៏ល្អបំផុតនៃការគ្របដណ្តប់ និងការតភ្ជាប់។ចំនួនអប្បបរមាត្រូវបានកំណត់យោងទៅតាមចំនួនអប្បបរមាដែលទាក់ទងនឹងបរិស្ថានវិទ្យា។
សម្រាប់សម្ភារៈបន្ថែមសម្រាប់អត្ថបទនេះ សូមមើល http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
នេះជាអត្ថបទបើកចំហដែលចែកចាយក្រោមលក្ខខណ្ឌនៃអាជ្ញាប័ណ្ណ Creative Commons Attribution License។អត្ថបទនេះអនុញ្ញាតឱ្យប្រើប្រាស់ដោយគ្មានការរឹតត្បិត ការចែកចាយ និងការផលិតឡើងវិញនៅក្នុងឧបករណ៍ផ្ទុកណាមួយក្រោមលក្ខខណ្ឌថាការងារដើមត្រូវបានលើកឡើងយ៉ាងត្រឹមត្រូវ។
ចំណាំ៖ យើងគ្រាន់តែស្នើឱ្យអ្នកផ្តល់អាសយដ្ឋានអ៊ីមែលរបស់អ្នកដើម្បីឱ្យអ្នកដែលអ្នកណែនាំទៅកាន់ទំព័រដឹងថាអ្នកចង់ឱ្យពួកគេឃើញអ៊ីមែល ហើយថាវាមិនមែនជាសារឥតបានការ។យើងនឹងមិនចាប់យកអាសយដ្ឋានអ៊ីមែលណាមួយឡើយ។
សំណួរនេះត្រូវបានប្រើដើម្បីសាកល្បងថាតើអ្នកជាអ្នកចូលមើល និងការពារការបញ្ជូនសារឥតបានការដោយស្វ័យប្រវត្តិ។
ក្រសួងបរិស្ថានសមុទ្រសកលបានប្តេជ្ញាចិត្តដោះស្រាយបញ្ហាស្មុគស្មាញ និងប្រើប្រាស់ ML ដែលមិនមានការត្រួតពិនិត្យដើម្បីរុករករចនាសម្ព័ន្ធសហគមន៍។
ក្រសួងបរិស្ថានសមុទ្រសកលបានប្តេជ្ញាចិត្តដោះស្រាយបញ្ហាស្មុគស្មាញ និងប្រើប្រាស់ ML ដែលមិនមានការត្រួតពិនិត្យដើម្បីរុករករចនាសម្ព័ន្ធសហគមន៍។

ពេលវេលាផ្សាយ៖ មករា-១២-២០២១