topimg

Удакладненне экалагічнай складанасці: навучанне без нагляду вызначае глабальную марскую экалагічную правінцыю

Прапануецца метад некантраляванага навучання для вызначэння глабальных марскіх экалагічных правінцый (экаправінцый) на аснове структуры супольнасці планктону і дадзеных аб патоку пажыўных рэчываў.Метад сістэматычнай інтэграванай экалагічнай правінцыі (SAGE) можа ідэнтыфікаваць экалагічныя правінцыі ў вельмі нелінейных мадэлях экасістэм.Каб адаптавацца да негаусавай каварыяцыі даных, SAGE выкарыстоўвае ўбудаванне выпадковых суседзяў (t-SNE), каб паменшыць памернасць.З дапамогай прыкладання шуму, заснаванага на алгарытме прасторавай кластарызацыі на аснове шчыльнасці (DBSCAN), можна вызначыць больш за сто экалагічных правінцый.Выкарыстоўваючы карту злучэнняў з экалагічнымі адрозненнямі ў якасці меры адлегласці, надзейную сукупную экалагічнаю правінцыю (AEP) аб'ектыўна вызначаюць праз укладзеныя экалагічныя правінцыі.Выкарыстанне AEPs, кантроль хуткасці забеспячэння пажыўных рэчываў у структуры супольнасці быў вывучаны.Эка-правінцыя і AEP унікальныя і могуць дапамагчы ў інтэрпрэтацыі мадэлі.Яны могуць палегчыць параўнанне паміж мадэлямі і могуць палепшыць разуменне і маніторынг марскіх экасістэм.
Правінцыі - гэта рэгіёны, дзе складаная біягеаграфія на моры або сушы арганізавана ў паслядоўныя і значныя вобласці (1).Гэтыя правінцыі вельмі важныя для параўнання і супрацьпастаўлення месцаў, характарыстыкі назіранняў, маніторынгу і аховы.Складаныя і нелінейныя ўзаемадзеянні, якія ствараюць гэтыя правінцыі, робяць метады некантралюемага машыннага навучання (ML) вельмі прыдатнымі для аб'ектыўнага вызначэння правінцый, таму што каварыяцыя ў дадзеных складаная і не адрозніваецца ад Гаўса.Тут прапануецца метад ML, які сістэматычна вызначае унікальныя марскія экалагічныя правінцыі (эка-правінцыі) з глабальнай трохмернай (3D) фізічнай/экасістэмнай мадэлі Дарвіна (2).Тэрмін «унікальны» выкарыстоўваецца, каб паказаць, што ідэнтыфікаваная вобласць недастаткова перасякаецца з іншымі абласцямі.Гэты метад называецца метадам сістэмнай інтэграванай экалагічнай правінцыі (SAGE).Каб выканаць карысную класіфікацыю, метад алгарытму павінен дазваляць (i) глабальную класіфікацыю і (ii) шматмаштабны аналіз, які можа быць укладзены/агрэгаваны ў прасторы і часе (3).У гэтым даследаванні ўпершыню быў прапанаваны метад SAGE і абмеркаваны выяўленыя экалагічныя правінцыі.Экаправінцыі могуць садзейнічаць разуменню фактараў, якія кантралююць структуру супольнасці, даюць карысную інфармацыю для стратэгій маніторынгу і дапамагаюць адсочваць змены ў экасістэме.
Наземныя правінцыі звычайна класіфікуюцца ў залежнасці ад падабенства клімату (ападкаў і тэмпературы), глебы, расліннасці і фауны і выкарыстоўваюцца для дапаможнага кіравання, даследаванняў біяразнастайнасці і барацьбы з хваробамі (1, 4).Марскія правінцыі цяжэй вызначыць.Большасць арганізмаў мікраскапічныя, з вадкімі межамі.Лонгхерст і інш.(5) Прадугледжана адна з першых глабальных класіфікацый Міністэрства акіянаграфіі на аснове ўмоў навакольнага асяроддзя.Вызначэнне гэтых правінцый «Лонгхерст» уключае такія зменныя, як хуткасць змешвання, стратыфікацыя і апрамяненне, а таксама вялікі вопыт Лонгхерста ў якасці марскога акіянолага, які мае іншыя важныя ўмовы для марскіх экасістэм.Longhurst шырока выкарыстоўваўся, напрыклад, для ацэнкі першаснай вытворчасці і патокаў вугляроду, дапамогі рыбалоўству і планавання мерапрыемстваў па назіранні на месцы (5-9).Для больш аб'ектыўнага вызначэння правінцый выкарыстоўваліся такія метады, як невыразная логіка і рэгіянальная некантраляваная кластэрызацыя/статыстыка (9-14).Мэта такіх метадаў - вызначыць значныя структуры, якія могуць ідэнтыфікаваць правінцыі ў наяўных дадзеных назіранняў.Напрыклад, дынамічныя марскія правінцыі (12) выкарыстоўваюць карты самаарганізацыі для памяншэння шуму і выкарыстоўваюць іерархічную (дрэвавую) кластэрызацыю для вызначэння прадуктаў марскіх колераў, атрыманых з рэгіянальных спадарожнікаў [хларафіл a (Chl-a), нармалізаваная вышыня лініі флуарэсцэнцыі і каляровае растворанае арганічнае рэчыва] і фізічнае поле (тэмпература і салёнасць паверхні мора, абсалютны дынамічны рэльеф і марскі лёд).
Структура супольнасці планктону выклікае заклапочанасць, таму што яго экалогія мае вялікі ўплыў на павышэнне ўзроўню пажыўных рэчываў, паглынанне вугляроду і клімат.Тым не менш, вызначыць глабальную экалагічную правінцыю на аснове структуры супольнасці планктону ўсё яшчэ застаецца складанай і няўлоўнай задачай.Марскія каляровыя спадарожнікі патэнцыйна могуць даць інфармацыю аб грубай класіфікацыі фітапланктону або прапанаваць перавагі функцыянальных груп (15), але ў цяперашні час яны не могуць даць падрабязную інфармацыю аб структуры супольнасці.Нядаўнія даследаванні [напрыклад, Tara Ocean (16)] забяспечваюць беспрэцэдэнтныя вымярэнні структуры супольнасці;у цяперашні час існуюць толькі рэдкія назіранні на месцы ў глабальным маштабе (17).Папярэднія даследаванні ў значнай ступені вызначылі «біягеахімічную правінцыю» (12, 14, 18), заснаваную на вызначэнні біяхімічных падабенстваў (такіх як першасная прадукцыя, Хл і даступнае святло).Тут лікавая мадэль выкарыстоўваецца для вываду [Darwin(2)], а экалагічная правінцыя вызначаецца ў адпаведнасці са структурай супольнасці і патокам пажыўных рэчываў.Лікавая мадэль, выкарыстаная ў гэтым даследаванні, мае глабальны ахоп і можа быць параўнана з існуючымі палявымі дадзенымі (17) і палямі дыстанцыйнага зандзіравання (Заўвага S1).Дадзеныя лікавай мадэлі, якія выкарыстоўваюцца ў гэтым даследаванні, маюць перавагу глабальнага ахопу.Мадэльная экасістэма складаецца з 35 відаў фітапланктону і 16 відаў зоапланктону (звярніцеся да матэрыялаў і метадаў).Мадэльныя тыпы планктону нелінейна ўзаемадзейнічаюць з негаусавымі каварыяцыйнымі структурамі, таму простыя дыягнастычныя метады не падыходзяць для выяўлення унікальных і паслядоўных мадэляў у новых структурах супольнасці.Прадстаўлены тут метад SAGE забяспечвае новы спосаб праверкі вынікаў складаных мадэляў Дарвіна.
Магутныя пераўтваральныя магчымасці тэхналогіі навукі аб даных/ML могуць дазволіць надзвычай складаныя мадэльныя рашэнні выявіць складаныя, але надзейныя структуры ў каварыяцыі даных.Надзейны метад вызначаецца як метад, які можа дакладна прайграць вынікі ў межах зададзенага дыяпазону памылак.Нават у простых сістэмах вызначэнне надзейных шаблонаў і сігналаў можа быць праблемай.Пакуль не будзе вызначана прычына, якая вядзе да назіранай мадэлі, узнікшая складанасць можа здавацца складанай/цяжкай для вырашэння.Ключавы працэс усталявання складу экасістэмы мае нелінейны характар.Існаванне нелінейных узаемадзеянняў можа ўвесці ў зман надзейную класіфікацыю, таму неабходна пазбягаць метадаў, якія робяць моцныя здагадкі аб базавым статыстычным размеркаванні каварыяцыі даных.Высокамерныя і нелінейныя даныя часта сустракаюцца ў акіянаграфіі і могуць мець каварыяцыйную структуру са складанай негаусавай тапалогіяй.Хаця даныя з негаусавай каварыяцыйнай структурай могуць перашкаджаць надзейнай класіфікацыі, метад SAGE з'яўляецца новым, таму што ён прызначаны для ідэнтыфікацыі кластараў з адвольнай тапалогіяй.
Мэта метаду SAGE - аб'ектыўная ідэнтыфікацыя новых заканамернасцей, якія могуць дапамагчы ў далейшым разуменні экалогіі.Пасля кластарнага працоўнага працэсу, падобнага да (19), экалагічныя зменныя і зменныя патоку пажыўных рэчываў выкарыстоўваюцца для вызначэння адзінага кластара ў дадзеных, які называецца экалагічнай правінцыяй.Метад SAGE, прапанаваны ў гэтым даследаванні (малюнак 1), спачатку зніжае памернасць з 55 да 11 вымярэнняў шляхам падсумоўвання функцыянальных груп планктону, вызначаных апрыёры (гл. Матэрыялы і метады).Выкарыстоўваючы метад убудавання t-выпадковых суседзяў (t-SNE), памер яшчэ больш памяншаецца шляхам праецыравання верагоднасці ў 3D-прастору.Некантраляваная кластэрызацыя можа ідэнтыфікаваць экалагічна блізкія вобласці [прасторавая кластэрызацыя на аснове шчыльнасці (DBSCAN) для прыкладанняў, заснаваных на шуме].І t-SNE, і DBSCAN дастасавальныя да дадзеных лічбавай мадэлі нелінейнай экасістэмы.Затым перапраецыруйце атрыманую экалагічную правінцыю на зямлю.Выяўлена больш за сто унікальных экалагічных правінцый, прыдатных для рэгіянальных даследаванняў.Каб разгледзець глабальна ўзгодненую мадэль экасістэмы, метад SAGE выкарыстоўваецца для аб'яднання экалагічных правінцый у агрэгаваныя экалагічныя правінцыі (AEP) для павышэння эфектыўнасці экалагічных правінцый.Узровень агрэгавання (так званы «складанасць») можа быць адрэгуляваны да неабходнага ўзроўню дэталізацыі.Вызначце мінімальную складанасць надзейнага АЭП.У цэнтры ўвагі выбару - метад SAGE і вывучэнне выпадкаў AEP найменшай складанасці для вызначэння кантролю над структурай надзвычайнага супольнасці.Пасля гэтага можна прааналізаваць заканамернасці, каб атрымаць экалагічнае разуменне.Метад, уведзены тут, таксама можа быць выкарыстаны для больш шырокага параўнання мадэляў, напрыклад, шляхам ацэнкі размяшчэння падобных экалагічных правінцый, знойдзеных у розных мадэлях, каб вылучыць адрозненні і падабенства, каб параўнаць мадэлі.
(A) Прынцыповая схема працоўнага працэсу для вызначэння экалагічнай правінцыі;выкарыстанне сумы ў функцыянальнай групе для звядзення зыходных 55-мерных даных да 11-мернай мадэлі, уключаючы біямасу сямі функцыянальных/пажыўных планктону і чатырох паказчыкаў забеспячэння пажыўнымі рэчывамі.Нязначнае значэнне мае і ўстойлівае ледзяное покрыва плошчы.Дадзеныя былі стандартызаваны і стандартызаваны.Дайце 11-мерныя даныя ў алгарытм t-SNE, каб вылучыць статыстычна падобныя камбінацыі прыкмет.DBSCAN старанна абярэ кластар, каб усталяваць значэнне параметра.Нарэшце, праецыруйце дадзеныя назад у праекцыю шыраты/даўгаты.Калі ласка, звярніце ўвагу, што гэты працэс паўтараецца 10 разоў, таму што прымяненне t-SNE можа выклікаць невялікую выпадковасць.(B) тлумачыць, як атрымаць AEP, паўтарыўшы працоўны працэс у (A) 10 разоў.Для кожнай з гэтых 10 рэалізацый была вызначана міжправінцыйная матрыца адрозненняў Брэя-Керціса (BC) на аснове біямасы 51 тыпу фітапланктону.Вызначце розніцу BC паміж правінцыямі, ад складанасці 1 AEP да поўнай складанасці 115. Эталон BC усталёўваецца правінцыяй Лонгхерст.
Метад SAGE выкарыстоўвае вынікі глабальнай трохмернай фізічнай/экасістэмнай лікавай мадэлі для вызначэння экалагічнай правінцыі [Дарвін (2);гл. матэрыялы і метады і нататку S1].Кампаненты экасістэмы складаюцца з 35 відаў фітапланктону і 16 відаў зоапланктону з сямю загадзя вызначанымі функцыянальнымі групамі: пракарыёты і эўкарыёты, прыстасаваныя да асяроддзя з нізкім утрыманнем пажыўных рэчываў, какцыдыі з карбанатным пакрыццём кальцыя і моцнай азотфіксацыяй. Азотныя пажыўныя рэчывы (звычайна адсутнічаюць). важныя пажыўныя рэчывы), з крамянёвым пакрыццём, могуць спрыяць фотасінтэзу іншага планктону і выпасу змешаных пажыўных рэчываў жгуціканосцаў і пастухоў зоапланктону.Дыяметр памеру складае ад 0,6 да 2500 мкм эквівалентнага сферычнага дыяметра.Мадэль размеркавання фітапланктону па памеры і функцыянальнай групоўцы адлюстроўвае агульныя характарыстыкі, якія назіраюцца пры спадарожнікавых і натурных назіраннях (гл. малюнкі S1-S3).Падабенства паміж лікавай мадэллю і назіраным акіянам паказвае, што правінцыі, вызначаныя мадэллю, могуць быць дастасавальныя да акіяна на месцы.Звярніце ўвагу, што гэтая мадэль ахоплівае толькі пэўную разнастайнасць фітапланктону і толькі пэўныя фізічныя і хімічныя дыяпазоны ўздзеяння акіяна in situ.Метад SAGE можа дазволіць людзям лепш зразумець вельмі рэгіянальны механізм кантролю мадэльнай структуры супольнасці.
Уключаючы толькі суму паверхневай біямасы (з сярэднім часам 20 гадоў) у кожнай функцыянальнай групе планктону, можна паменшыць памернасць дадзеных.Пасля таго, як ранейшыя даследаванні паказалі іх ключавую ролю ў стварэнні структуры супольнасці, яны таксама ўключалі тэрміны павярхоўных крыніц для патокаў пажыўных рэчываў (пастаўка азоту, жалеза, фасфатаў і крэмніевай кіслаты) [напрыклад, (20, 21)].Сумаванне функцыянальных груп памяншае праблему з 55 (51 планктон і 4 патокі пажыўных рэчываў) да 11 вымярэнняў.У гэтым першапачатковым даследаванні з-за вылічальных абмежаванняў, накладзеных алгарытмам, глыбіня і зменлівасць часу не ўлічваліся.
Метад SAGE здольны вызначыць важныя ўзаемасувязі паміж нелінейнымі працэсамі і ключавымі асаблівасцямі ўзаемадзеяння паміж біямасай функцыянальнай групы і патокам пажыўных рэчываў.Выкарыстанне 11-мерных дадзеных, заснаваных на эўклідавых метадах дыстанцыйнага навучання (такіх як K-сярэднія), не можа атрымаць надзейныя і ўзнаўляльныя правінцыі (19, 22).Гэта тлумачыцца тым, што ў базавым размеркаванні каварыяцыі ключавых элементаў, якія вызначаюць экалагічную правінцыю, не знойдзена формы Гаўса.K-сярэднія ячэек Варанога (прамыя) не могуць захоўваць негаусаўскае асноўнае размеркаванне.
Біямаса сямі функцыянальных груп планктону і чатырох патокаў пажыўных рэчываў утвараюць 11-мерны вектар x.Такім чынам, x з'яўляецца вектарным полем на сетцы мадэлі, дзе кожны элемент xi ўяўляе сабой 11-мерны вектар, вызначаны на гарызантальнай сетцы мадэлі.Кожны індэкс i адназначна вызначае кропку сеткі на сферы, дзе (даўжыня, шырыня) = (ϕi, θi).Калі біямаса мадэльнага блока сеткі складае менш за 1,2×10-3 мг Хл/м3 або ўзровень пакрыцця лёдам перавышае 70%, журнал дадзеных біямасы выкарыстоўваецца і адкідаецца.Дадзеныя нармалізаваны і стандартызаваны, таму ўсе даныя знаходзяцца ў дыяпазоне ад [0 да 1], сярэдняе выдаляецца і маштабуецца да адзінкі дысперсіі.Гэта робіцца для таго, каб характарыстыкі (біямаса і паток пажыўных рэчываў) не былі абмежаваныя кантрастам у дыяпазоне магчымых значэнняў.Кластэрызацыя павінна фіксаваць ўзаемасувязь змяненняў на аснове ключавой верагоднасці адлегласці паміж аб'ектамі, а не геаграфічнай адлегласці.Пры колькаснай ацэнцы гэтых адлегласцей выяўляюцца важныя асаблівасці, а непатрэбныя дэталі адкідаюцца.З экалагічнага пункту гледжання гэта неабходна, таму што некаторыя тыпы фітапланктону з невялікай біямасай могуць мець большы біягеахімічны эфект, напрыклад, фіксацыю азоту дыязатрофнымі бактэрыямі.Пры стандартызацыі і нармалізацыі даных гэтыя тыпы ковариат будуць вылучаны.
Падкрэсліваючы блізкасць функцый у высокамернай прасторы ў нізкамерным прадстаўленні, алгарытм t-SNE выкарыстоўваецца, каб зрабіць існуючыя падобныя вобласці больш выразнымі.Папярэдняя праца, накіраваная на стварэнне глыбокіх нейронавых сетак для прыкладанняў дыстанцыйнага зандзіравання, выкарыстоўвала t-SNE, які даказаў сваё майстэрства ў падзеле ключавых функцый (23).Гэта неабходны крок для ідэнтыфікацыі надзейнай кластэрызацыі ў дадзеных функцый, пазбягаючы пры гэтым неканвергентных рашэнняў (заўвага S2).Выкарыстоўваючы ядра Гаўса, t-SNE захоўвае статыстычныя ўласцівасці даных, супастаўляючы кожны высокамерны аб'ект з кропкай у трохмернай фазавай прасторы, тым самым гарантуючы, што верагоднасць падобных аб'ектаў у высокім і нізкім кірунках высокая ў высокім. мерная прастора (24).Улічваючы набор з N шматмерных аб'ектаў x1,…,xN, алгарытм t-SNE памяншае за кошт мінімізацыі разыходжання Кульбака-Лейблера (KL) (25).Дывергенцыя KL з'яўляецца мерай таго, наколькі адрозніваецца размеркаванне імавернасцей ад другога эталоннага размеркавання імавернасцей, і можа эфектыўна ацаніць магчымасць карэляцыі паміж нізкамернымі прадстаўленнямі высокамерных функцый.Калі xi - i-ы аб'ект у N-мернай прасторы, xj - j-ы аб'ект у N-мернай прасторы, yi - i-ы аб'ект у нізкамернай прасторы, а yj - j-ы аб'ект у нізкай -мернай прасторы, то t -SNE вызначае верагоднасць падабенства ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), а для набору памяншэння памернасці q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Малюнак 2A ілюструе эфект зніжэння вектараў біямасы і патоку пажыўных рэчываў 11-мернай камбінацыі ў 3D.Матывацыю прымянення t-SNE можна параўнаць з матывацыяй аналізу галоўных кампанентаў (PCA), які выкарыстоўвае дысперсійны атрыбут, каб падкрэсліць вобласць/атрыбут даных, тым самым памяншаючы памернасць.Было выяўлена, што метад t-SNE пераўзыходзіць PCA ў забеспячэнні надзейных і ўзнаўляемых вынікаў для эка-міністэрства (гл. Заўвагу S2).Гэта можа быць таму, што дапушчэнне артаганальнасць PCA не падыходзіць для вызначэння крытычных узаемадзеянняў паміж вельмі нелінейнымі інтэрактыўнымі функцыямі, таму што PCA факусуюць на лінейных структурах ковариации (26).Выкарыстоўваючы дадзеныя дыстанцыйнага зандзіравання, Лунга і інш.(27) паказвае, як выкарыстоўваць метад SNE, каб вылучыць складаныя і нелінейныя спектральныя асаблівасці, якія адхіляюцца ад размеркавання Гаўса.
(A) Змадэляваная хуткасць забеспячэння пажыўнымі рэчывамі, біямаса функцыянальнай групы фітапланктону і зоапланктону, складзеная алгарытмам t-SNE і афарбаваная па правінцыі з дапамогай DBSCAN.Кожная кропка ўяўляе сабой кропку ў шматмернай прасторы, як паказана на малюнку 6B, большасць кропак зафіксавана.Валы адносяцца да "t-SNE" памераў 1, 2 і 3. (B) Геаграфічная праекцыя правінцыі, знойдзеная DBSCAN на сетцы шырот і даўгот пачатка.Колер павінен разглядацца як любы колер, але павінен адпавядаць (А).
Кропкі на дыяграме рассейвання t-SNE на малюнку 2А адпаведна звязаны з шыратой і даўгатой.Калі дзве кропкі на малюнку 2A знаходзяцца блізка адна да адной, гэта таму, што іх біямаса і патокі пажыўных рэчываў падобныя, а не з-за геаграфічнай блізкасці.Колеры на малюнку 2A - гэта кластары, выяўленыя з дапамогай метаду DBSCAN (28).Пры пошуку шчыльных назіранняў алгарытм DBSCAN выкарыстоўвае адлегласць у 3D-прадстаўленні паміж кропкамі (ϵ = 0,39; для атрымання інфармацыі аб гэтым выбары гл. Матэрыялы і метады), а колькасць падобных кропак патрабуецца для вызначэння кластара (тут 100 балаў, глядзіце вышэй).Метад DBSCAN не робіць ніякіх здагадак аб форме або колькасці кластараў у дадзеных, як паказана ніжэй:
3) Для ўсіх кропак, ідэнтыфікаваных як у межах адлегласці, паўтарыце крок 2, каб вызначыць мяжу кластара.Калі колькасць балаў перавышае ўстаноўленае мінімальнае значэнне, ён пазначаецца як кластар.
Даныя, якія не адпавядаюць мінімальнаму паказчыку члена кластара і адлегласці ϵ, лічацца «шумам» і не атрымліваюць колер.DBSCAN - гэта хуткі і маштабаваны алгарытм з прадукцыйнасцю O(n2) у горшым выпадку.Для цяперашняга аналізу гэта насамрэч не выпадкова.Мінімальная колькасць балаў вызначаецца экспертнай ацэнкай.Пасля рэгулявання адлегласці вынік недастаткова стабільны ў дыяпазоне ≈±10.Гэта адлегласць усталёўваецца з дапамогай сувязі (малюнак 6A) і працэнтнага пакрыцця акіяна (малюнак 6B).Звязнасць вызначаецца як сукупная колькасць кластараў і адчувальная да параметру ϵ.Ніжэйшая сувязь паказвае на недастатковую адпаведнасць, штучную групоўку рэгіёнаў разам.Высокая сувязь сведчыць аб празмернасці.Можна ўявіць выкарыстанне больш высокага мінімуму, але калі мінімум перавышае ca, немагчыма дасягнуць надзейнага рашэння.135 (Больш падрабязна гл. Матэрыялы і метады).
115 кластараў, ідэнтыфікаваных на малюнку 2A, праецыруюцца назад на зямлю на малюнку 2B.Кожны колер адпавядае ўзгодненай камбінацыі біягеахімічных і экалагічных фактараў, вызначаных DBSCAN.Пасля таго, як кластары вызначаны, асацыяцыя кожнай кропкі на малюнку 2А з пэўнай шыратой і даўгатой выкарыстоўваецца для праецыравання кластараў назад у геаграфічную вобласць.Малюнак 2B ілюструе гэта з тымі ж колерамі кластараў, што і малюнак 2A.Падобныя колеры не варта трактаваць як экалагічнае падабенства, таму што яны прысвойваюцца ў парадку, у якім алгарытм выяўляе кластары.
Вобласць на малюнку 2B можа быць якасна падобная на ўсталяваную вобласць у фізічнай і/ці біягеахіміі акіяна.Напрыклад, навалы ў Паўднёвым акіяне зонасна-сіметрычныя, з'яўляюцца алігатрофныя віхуры, а рэзкі пераход паказвае на ўплыў пасатаў.Напрыклад, у экватарыяльнай частцы Ціхага акіяна бачныя розныя рэгіёны, звязаныя з уздымам.
Для таго, каб зразумець экалагічнае асяроддзе эка-правінцыі, для ацэнкі экалогіі ў кластары быў выкарыстаны варыянт індэкса рознасці Брэя-Кёрціса (БК) (29).Індыкатар BC - гэта статыстычныя даныя, якія выкарыстоўваюцца для колькаснай ацэнкі розніцы ў структуры супольнасці паміж двума рознымі сайтамі.Вымярэнне BC дастасавальна да біямасы 51 віду фітапланктону і заапланктону BCninj = 1-2CninjSni + Snj
BCninj адносіцца да падабенства паміж камбінацыяй ni і камбінацыяй nj, дзе Cninj - мінімальнае значэнне аднаго тыпу біямасы, якая існуе ў абедзвюх камбінацыях ni і nj, а Sni ўяўляе сабой суму ўсіх біямас, якія існуюць у абедзвюх камбінацыях ni і Snj.Розніца BC падобная да меры адлегласці, але дзейнічае ў неэўклідавай прасторы, якая, верагодна, больш падыходзіць для экалагічных даных і іх інтэрпрэтацыі.
Для кожнага кластара, пазначанага на малюнку 2B, можна ацаніць падабенства ўнутрыправінцыйнага і міжправінцыйнага БК.Розніца ў BC у межах правінцыі адносіцца да розніцы паміж сярэднім значэннем правінцыі і кожнай кропкай у правінцыі.Розніца паміж правінцыямі БК адносіцца да падабенства паміж адной правінцыяй і іншымі правінцыямі.На малюнку 3A паказана сіметрычная матрыца BC (0, чорны: цалкам адпавядае; 1, белы: зусім непадобны).Кожны радок на графіку паказвае шаблон у дадзеных.На малюнку 3B паказана геаграфічнае значэнне вынікаў да н.э. на малюнку 3A для кожнай правінцыі.Для правінцыі з нізкім узроўнем харчавання і пажыўнымі рэчывамі малюнак 3B паказвае, што сіметрыя вялікіх тэрыторый вакол экватара і Індыйскага акіяна ў асноўным падобная, але больш высокія шыроты і вобласці апвеллінга значна адрозніваюцца.
(A) Ступень розніцы ў BC, ацэненая для кожнай правінцыі на аснове глабальнага 20-гадовага сярэдняга глабальнага сярэдняга ўзроўню паверхні 51 планктону.Звярніце ўвагу на чаканую сіметрычнасць значэнняў.(B) Прасторавая праекцыя слупка (ці радка).Для правінцыі ў дыстрафічным крузе было ацэнена глабальнае размеркаванне паказчыка падабенства да н.э. і ацэнена глабальнае 20-гадовае сярэдняе значэнне.Чорны (BC = 0) азначае аднолькавую вобласць, а белы (BC = 1) азначае адсутнасць падабенства.
Малюнак 4A ілюструе розніцу ў БК у кожнай правінцыі на малюнку 2B.Вызначаецца з дапамогай сярэдняй камбінацыі сярэдняй плошчы ў кластары і вызначэння адрозненняў паміж BC і сярэднім значэннем кожнай кропкі сеткі ў правінцыі, гэта паказвае, што метад SAGE можа добра падзяліць 51 від на аснове экалагічнага падабенства тыпу дадзеныя мадэлі.Агульная сярэдняя кластарная розніца БК усіх 51 тыпу складае 0,102±0,0049.
(A, B і D) Розніца ў BC у межах правінцыі ацэньваецца як сярэдняя розніца ў BC паміж кожнай супольнасцю кропак сеткі і сярэдняй правінцыяй, і складанасць не зніжаецца.(2) Глабальная сярэдняя розніца ўнутры правінцый да нашай эры складае 0,227±0,117.Гэта эталон класіфікацыі, заснаванай на экалагічнай матывацыі, прапанаванай у гэтай працы [зялёная лінія ў (C)].(C) Сярэдняя ўнутрыправінцыяльная розніца да н.э.: чорная лінія ўяўляе ўнутрыправінцыйную розніцу да н.э. з узрастаючай складанасцю.2σ паходзіць з 10 паўтораў працэсу ідэнтыфікацыі экаправінцыі.Для агульнай складанасці правінцый, выяўленай DBSCAN, (A) паказвае, што рознасць BC у правінцыі роўная 0,099, а класіфікацыя складанасці, прапанаваная (C), роўная 12, у выніку чаго рознасць BC у правінцыі складае 0,200.як паказана на малюнку.(D).
На малюнку 4B біямаса 51 тыпу планктону выкарыстоўваецца для прадстаўлення эквівалентнай розніцы да нашай эры ў правінцыі Лонгхерст.Агульнае сярэдняе значэнне для кожнай правінцыі складае 0,227, а стандартнае адхіленне пунктаў сеткі адносна розніцы ў правінцыі Брытанскай Брытанскай Амерыкі складае 0,046.Гэта больш, чым кластар, пазначаны на малюнку 1B.Замест гэтага, выкарыстоўваючы суму сямі функцыянальных груп, сярэдняе ўнутрысезоннае адрозненне да н.э. у Лонгхерсце павялічылася да 0,232.
Карта глабальнай экалагічнай правінцыі змяшчае складаныя дэталі унікальнага экалагічнага ўзаемадзеяння і паляпшэнняў, зробленых у выкарыстанні ўсёй структуры экасістэмы правінцыі Лонгхерст.Чакаецца, што Міністэрства экалогіі дасць разуменне працэсу кіравання экасістэмай лікавай мадэлі, і гэта разуменне дапаможа вывучэнню палявых работ.Для гэтага даследавання немагчыма цалкам адлюстраваць больш за сто губерняў.У наступным раздзеле прадстаўлены метад SAGE, які абагульняе правінцыі.
Адной з мэтаў правінцыі з'яўляецца садзейнічанне разуменню месцазнаходжання і кіравання правінцыяй.Для вызначэння надзвычайных сітуацый метад на малюнку 1B ілюструе гнездаванне экалагічна падобных правінцый.Экаправінцыі згрупаваны на аснове экалагічнага падабенства, і такая група правінцый называецца AEP.Усталюйце рэгуляваную «складанасць» у залежнасці ад агульнай колькасці правінцый, якія трэба ўлічваць.Тэрмін «складанасць» выкарыстоўваецца таму, што дазваляе рэгуляваць узровень надзвычайных атрыбутаў.Для таго, каб вызначыць значныя агрэгацыі, сярэдняя ўнутрыправінцыйная розніца да н.э. у 0,227 ад Лонгхерста выкарыстоўваецца ў якасці эталона.Ніжэй гэтага арыенціра аб'яднаныя правінцыі больш не лічацца карыснымі.
Як паказана на малюнку 3B, глабальныя экалагічныя правінцыі ўзгодненыя.Выкарыстоўваючы міжправінцыйныя адрозненні БК, можна заўважыць, што некаторыя канфігурацыі вельмі «агульныя».Натхнёныя метадамі генетыкі і тэорыі графаў, «звязаныя графы» выкарыстоўваюцца для сартавання >100 правінцый на аснове найбольш падобных да іх правінцый.Метрыка «звязнасці» тут вызначаецца з дапамогай міжправінцыйнага адрознення да нашай эры (30).Колькасць правінцый з большай прасторай для класіфікацыі > 100 правінцый можа называцца тут складанасцю.AEP - гэта прадукт, які класіфікуе больш за 100 правінцый як найбольш дамінуючыя/бліжэйшыя экалагічныя правінцыі.Кожная экалагічная правінцыя прызначаецца да дамінуючай/вельмі звязанай экалагічнай правінцыі, якая найбольш падобная на іх.Гэта агрэгаванне, якое вызначаецца розніцай у BC, дазваляе выкарыстоўваць укладзены падыход да глабальнай экалогіі.
Абраная складанасць можа быць любым значэннем ад 1 да поўнай складанасці ФІГ.2А.Пры меншай складанасці AEP можа дэгенераваць з-за імавернаснага кроку памяншэння памернасці (t-SNE).Выраджэнне азначае, што экалагічныя правінцыі могуць быць прызначаны розным AEP паміж ітэрацыямі, тым самым змяняючы ахопленую геаграфічную вобласць.Малюнак 4C ілюструе распаўсюджванне адрозненняў да нашай эры ў правінцыях у AEP усё большай складанасці ў 10 рэалізацыях (ілюстрацыя на малюнку 1B).На малюнку 4C 2σ (сіняя вобласць) з'яўляецца мерай пагаршэння якасці ў 10 рэалізацыях, а зялёная лінія ўяўляе эталон Лонгхерста.Факты паказалі, што складанасць 12 можа ўтрымліваць розніцу ў BC у правінцыі ніжэй за эталон Лонгхерста ва ўсіх рэалізацыях і падтрымліваць адносна невялікую дэградацыю 2σ.Падводзячы вынік, мінімальная рэкамендуемая складанасць складае 12 AEP, а сярэдняя розніца ў BC ўнутры правінцыі, ацэненая з выкарыстаннем 51 тыпу планктону, складае 0,198±0,013, як паказана на малюнку 4D.Выкарыстанне сумы сямі функцыянальных груп планктону, сярэдняя розніца BC у межах правінцыі складае 2σ замест 0,198±0,004.Параўнанне розніц BC, разлічаных з агульнай біямасай сямі функцыянальных груп або біямасай усіх 51 тыпаў планктону, паказвае, што хоць метад SAGE прымяняецца да 51-мернай сітуацыі, ён для агульнай біямасы сямі функцыянальных груп Для навучання.
У залежнасці ад мэты любога даследавання можна разглядаць розныя ўзроўні складанасці.Рэгіянальныя даследаванні могуць патрабаваць поўнай складанасці (г.зн. усіх 115 правінцый).У якасці прыкладу і для яснасці разгледзім мінімальную рэкамендаваную складанасць 12.
У якасці прыкладу карыснасці метаду SAGE тут выкарыстоўваюцца 12 AEP з мінімальнай складанасцю 12 для вывучэння кантролю над структурай надзвычайнага супольнасці.Малюнак 5 ілюструе экалагічныя ідэі, згрупаваныя па AEP (ад A да L): у стэхіаметрыі Рэдфілда геаграфічная працягласць (малюнак 5C), склад біямасы функцыянальнай групы (малюнак 5A) і запас пажыўных рэчываў (малюнак 5B) выконваюцца N Zoomed.Паказана суадносіны (N:Si:P:Fe, 1:1:16:16×103).Для апошняй панэлі P, памножанае на 16, і Fe, памножанае на 16×103, такім чынам, гістаграма адпавядае харчовым патрэбам фітапланктону.
Правінцыі класіфікуюцца на 12 AEPs ад A да L. (A) Біямаса (мгC/м3) экасістэм у 12 правінцыях.(B) Хуткасць патоку пажыўных рэчываў растворанага неарганічнага азоту (N), жалеза (Fe), фасфату (P) і крэмніевай кіслаты (Si) (ммоль/м3 у год).Fe і P памнажаюцца на 16 і 16×103 адпаведна, так што палоскі стандартызаваны ў адпаведнасці з патрабаваннямі стэхіаметрыі фітапланктону.(C) Звярніце ўвагу на розніцу паміж палярнымі рэгіёнамі, субтрапічнымі цыклонамі і асноўнымі сезоннымі рэгіёнамі/рэгіёнамі ўздыму.Пункты маніторынгу абазначаюцца наступным чынам: 1, SEATS;2, ALOHA;3, станцыя П;і 4, БАЦ.
Ідэнтыфікаваны АЭП унікальны.Вакол экватара ў Атлантычным і Ціхім акіянах існуе некаторая сіметрыя, падобная, але павялічаная тэрыторыя існуе ў Індыйскім акіяне.Некаторыя AEP ахопліваюць заходні бок кантынента, звязаны з узыходжаннем.Цыркумпалярнае цячэнне Паўднёвага полюса разглядаецца як буйны занальны аб'ект.Субтрапічны цыклон — складаная серыя алігатрофных АЭП.У гэтых правінцыях знаёмая карціна адрозненняў біямасы паміж алігатрофнымі вірамі, дзе дамінуе планктон, і багатымі дыятомавымі палярнымі рэгіёнамі відавочная.
AEP з вельмі падобнай агульнай біямасай фітапланктону могуць мець вельмі розныя структуры супольнасці і ахопліваць розныя геаграфічныя вобласці, такія як D, H і K, якія маюць падобную агульную біямасу фітапланктону.AEP H у асноўным існуе ў экватарыяльнай частцы Індыйскага акіяна, і там больш дыязатрофных бактэрый.AEP D сустракаецца ў некалькіх басейнах, але ён асабліва прыкметны ў Ціхім акіяне вакол высокаўраджайных абласцей вакол экватарыяльнага апвеллінга.Форма гэтай ціхаакіянскай правінцыі нагадвае планетарны шлейф хваль.Дыязабактэрый у AEP D мала, а колбачак больш.У параўнанні з дзвюма іншымі правінцыямі, AEP K сустракаецца толькі ў высакагор'ях Паўночнага Ледавітага акіяна, і тут больш дыатамавых водарасцей і менш планктону.Варта адзначыць, што колькасць планктону ў гэтых трох рэгіёнах таксама моцна адрозніваецца.Сярод іх колькасць планктону AEP K адносна нізкая, а AEP D і H адносна высокая.Такім чынам, нягледзячы на ​​іх біямасу (і таму падобныя на Chl-a), гэтыя правінцыі даволі розныя: тэсціраванне правінцый на аснове Chl можа не ўлавіць гэтых адрозненняў.
Відавочна таксама, што некаторыя AEPs з вельмі рознай біямасай могуць быць падобныя з пункту гледжання структуры супольнасці фітапланктону.Напрыклад, гэта бачна ў AEP D і E. Яны блізкія адзін да аднаго, а ў Ціхім акіяне AEP E блізкі да высокапрадукцыйнага AEPJ.Падобным чынам няма дакладнай сувязі паміж біямасай фітапланктону і багаццем зоапланктону.
AEP можна зразумець з пункту гледжання пажыўных рэчываў, якія ім забяспечваюцца (малюнак 5B).Дыатамеі існуюць толькі там, дзе ёсць дастатковы запас крэмніевай кіслаты.Як правіла, чым вышэй запас крэмніевай кіслаты, тым вышэй біямаса дыятомавых водарасцяў.Дыатамеі можна ўбачыць у AEP A, J, K і L. Суадносіны біямасы дыятомавых водарасцей адносна іншага фітапланктону вызначаюцца N, P і Fe, якія забяспечваюцца адносна попыту на дыятомавыя водарасці.Напрыклад, у AEP L пераважаюць дыятамеі.У параўнанні з іншымі пажыўнымі рэчывамі, Si мае самы высокі запас.Наадварот, нягледзячы на ​​больш высокую прадукцыйнасць, у AEP J менш дыятомавых водарасцей і менш запасаў крэмнію (усё і адносна іншых пажыўных рэчываў).
Бактэрыі дыязонія валодаюць здольнасцю фіксаваць азот, але растуць павольна (31).Яны суіснуюць з іншым фітапланктонам, дзе жалеза і фосфар празмерныя ў параўнанні з попытам на пажыўныя рэчывы, не звязаныя з дыязоніем (20, 21).Варта адзначыць, што дыязатрофная біямаса адносна высокая, а запас Fe і P адносна вялікі ў параўнанні з запасам N. Такім чынам, хаця агульная біямаса ў AEP J вышэй, біямаса дыязонія ў AEP H роўная больш, чым у J. Звярніце ўвагу, што AEP J і H геаграфічна вельмі розныя, і H знаходзіцца ў экватарыяльнай частцы Індыйскага акіяна.
Калі унікальная структура экасістэмы не будзе падзелена на правінцыі, разуменне, атрыманае з 12 мадэляў самай нізкай складанасці AEP, не будзе такім ясным.AEP, створаны SAGE, палягчае ўзгодненае і адначасовае параўнанне складанай і шматмернай інфармацыі з мадэляў экасістэм.AEP эфектыўна падкрэслівае, чаму Chl не з'яўляецца добрым і альтэрнатыўным метадам вызначэння структуры супольнасці або багацця зоапланктону пры больш высокіх узроўнях пажыўных рэчываў.Падрабязны аналіз бягучых тэм даследаванняў выходзіць за рамкі гэтага артыкула.Метад SAGE забяспечвае спосаб вывучэння іншых механізмаў у мадэлі, з якім прасцей працаваць, чым прагляд кропка-кропка.
Метад SAGE прапануецца дапамагчы ўдакладніць надзвычай складаныя экалагічныя дадзеныя з глабальных фізічных/біягеахімічных/лікавых мадэляў экасістэм.Экалагічная правінцыя вызначаецца агульнай біямасай крос-планктонных функцыянальных груп, прымяненнем алгарытму памяншэння памернасці верагоднасці t-SNE і кластэрызацыяй з выкарыстаннем некантраляванага метаду ML DBSCAN.Для атрымання надзейнага AEP, які можна выкарыстоўваць для глабальнай інтэрпрэтацыі, прымяняецца міжправінцыйная тэорыя адрозненняў/графаў да н.э. для метаду ўкладзенасці.У будаўнічым плане Экаправінцыя і АЭП унікальныя.Укладзенасць AEP можна рэгуляваць паміж поўнай складанасцю зыходнай экалагічнай правінцыі і рэкамендаваным мінімальным парогам у 12 AEP.Укладванне і вызначэнне мінімальнай складанасці AEP лічацца ключавымі этапамі, таму што верагоднасць t-SNE выраджае AEP складанасці <12.Метад SAGE з'яўляецца глабальным, і яго складанасць вагаецца ад> 100 AEP да 12. Для прастаты ў цяперашні час у цэнтры ўвагі складанасць 12 глабальных AEP.Будучыя даследаванні, асабліва рэгіянальныя даследаванні, могуць знайсці меншую прасторавую падмноства глабальных экаправінцый карыснымі і могуць быць агрэгаваныя на меншай тэрыторыі, каб скарыстацца той жа экалагічнай ідэйнасцю, якая тут абмяркоўваецца.У ім даюцца прапановы аб тым, як гэтыя экалагічныя правінцыі і атрыманыя з іх веды можна выкарыстоўваць для далейшага экалагічнага разумення, палягчэння параўнання мадэляў і патэнцыйнага паляпшэння маніторынгу марскіх экасістэм.
Экалагічная правінцыя і AEP, вызначаныя метадам SAGE, заснаваны на дадзеных лікавай мадэлі.Па вызначэнні, лікавая мадэль - гэта спрошчаная структура, якая спрабуе ахапіць сутнасць мэтавай сістэмы, і розныя мадэлі будуць мець рознае размеркаванне планктону.Лікавая мадэль, якая выкарыстоўваецца ў гэтым даследаванні, не можа цалкам ахапіць некаторыя з назіраных заканамернасцей (напрыклад, у ацэнках Chl для экватарыяльнай вобласці і Паўднёвага акіяна).Толькі невялікая частка разнастайнасці ў рэальным акіяне захопліваецца, і меза- і субмезамаштабы не могуць быць вырашаны, што можа паўплываць на паток пажыўных рэчываў і меншую структуру супольнасці.Нягледзячы на ​​гэтыя недахопы, аказваецца, што AEP вельмі карысны, дапамагаючы зразумець складаныя мадэлі.Ацэньваючы, дзе знаходзяцца падобныя экалагічныя правінцыі, AEP дае патэнцыйны інструмент для параўнання лічбавай мадэлі.Цяперашняя лікавая мадэль адлюстроўвае агульную карціну дыстанцыйнага зандзіравання канцэнтрацыі фітапланктону Chl-a і размеркавання планктону па памеры і функцыянальнай групе (Заўвага S1 і малюнак S1) (2, 32).
Як паказана контурнай лініяй 0,1 мгХл-а/м-3, AEP дзеліцца на алігатрофную вобласць і мезатрофную вобласць (малюнак S1B): AEP B, C, D, E, F і G з'яўляюцца алігатрофнымі зонамі, а астатнія вобласці - размешчаны Вышэйшыя Хл-а.AEP паказвае некаторую адпаведнасць з правінцыяй Лонгхерст (малюнак S3A), напрыклад, Паўднёвым акіянам і экватарыяльнай часткай Ціхага акіяна.У некаторых рэгіёнах AEP ахоплівае некалькі рэгіёнаў Лонгхерста, і наадварот.Паколькі намеры размежаваць правінцыі ў гэтай галіне і Лонгхерсце адрозніваюцца, чакаецца, што будуць рознагалоссі.Множныя AEP у правінцыі Лонгхерст паказваюць, што пэўныя тэрыторыі з падобнай біягеахіміяй могуць мець вельмі розныя структуры экасістэм.AEP дэманструе пэўную адпаведнасць фізічным станам, што было выяўлена з дапамогай некантралюемага навучання (19), напрыклад, ва ўмовах высокага ўздыму (напрыклад, Паўднёвы акіян і экватарыяльная частка Ціхага акіяна; малюнак S3, C і D).Гэтыя адпаведнасці паказваюць, што на структуру супольнасці планктону моцна ўплывае дынаміка акіяна.У такіх раёнах, як Паўночная Атлантыка, AEP перасякае фізічныя правінцыі.Механізм, які выклікае гэтыя адрозненні, можа ўключаць у сябе такія працэсы, як перанос пылу, што можа прывесці да зусім розных праграм харчавання нават у аднолькавых фізічных умовах.
Міністэрства экалогіі і AEP адзначылі, што выкарыстанне толькі Chl не можа ідэнтыфікаваць экалагічныя кампаненты, як гэта ўжо ўсвядоміла марская экалагічная супольнасць.Гэта назіраецца ў AEP з падобнай біямасай, але істотна розным экалагічным складам (напрыклад, D і E).Наадварот, AEP, такія як D і K, маюць вельмі розную біямасу, але падобны экалагічны склад.AEP падкрэслівае, што ўзаемасувязь паміж біямасай, экалагічным складам і багаццем зоапланктону складаная.Напрыклад, хаця AEP J вылучаецца з пункту гледжання фітапланктону і біямасы планктону, A і L AEP маюць падобную біямасу планктону, але A мае большую колькасць планктону.AEP падкрэслівае, што біямаса фітапланктону (або Chl) не можа быць выкарыстана для прагназавання біямасы зоапланктону.Зоапланктон з'яўляецца асновай рыбалоўнага харчовага ланцуга, і больш дакладныя ацэнкі могуць прывесці да лепшага кіравання рэсурсамі.Будучыя марскія каляровыя спадарожнікі [напрыклад, PACE (планктон, аэразоль, воблака і марская экасістэма)] могуць быць у лепшым становішчы, каб дапамагчы ацаніць структуру супольнасці фітапланктону.Выкарыстанне прагназавання AEP патэнцыйна можа палегчыць ацэнку зоапланктону з космасу.Такія метады, як SAGE, у спалучэнні з новымі тэхналогіямі і ўсё большай колькасцю палявых даных, даступных для наземных праўдзівых абследаванняў (такіх як Тара і наступныя даследаванні), могуць разам зрабіць крок да спадарожнікавага маніторынгу здароўя экасістэм.
Метад SAGE забяспечвае зручны спосаб ацэнкі некаторых механізмаў, якія кантралююць характарыстыкі правінцыі, такія як біямаса/хл, чыстая першасная прадукцыя і структура супольнасці.Напрыклад, адносная колькасць дыятомавых водарасцяў вызначаецца дысбалансам у паступленні Si, N, P і Fe адносна стэхіаметрычных патрабаванняў фітапланктону.Пры збалансаванай хуткасці харчавання ў суполцы дамінуюць дыятамеі (L).Калі ўзровень прапановы незбалансаваны (гэта значыць, запас крэмнію ніжэйшы за патрэбнасць дыятомавых у пажыўных рэчывах), на дыятомавыя водарасці прыходзіцца толькі невялікая доля (K).Калі запас Fe і P перавышае запас N (напрыклад, E і H), дыязатрофныя бактэрыі будуць энергічна расці.Праз кантэкст, прадстаўлены AEP, вывучэнне механізмаў кантролю стане больш карысным.
Эка-правінцыя і AEP - гэта раёны з падобнымі грамадскімі структурамі.Часовы шэраг з пэўнага месца ў экалагічнай правінцыі або AEP можна разглядаць як кропку адліку і можа прадстаўляць тэрыторыю, ахопленую экалагічнай правінцыяй або AEP.Такія часовыя шэрагі забяспечваюць станцыі доўгатэрміновага назірання на месцы.Доўгатэрміновыя наборы дадзеных на месцы будуць працягваць адыгрываць невылічальную ролю.З пункту гледжання маніторынгу структуры супольнасці, метад SAGE можна разглядаць як спосаб дапамагчы вызначыць найбольш карыснае размяшчэнне новых сайтаў.Напрыклад, часовыя шэрагі доўгатэрміновай ацэнкі алігатрофнай асяроддзя пражывання (ALOHA) знаходзяцца ў AEP B алігатрофнай вобласці (малюнак 5C, пазнака 2).Паколькі ALOHA знаходзіцца блізка да мяжы іншага AEP, часовыя шэрагі не могуць быць рэпрэзентатыўнымі для ўсёй вобласці, як меркавалася раней (33).У тым жа AEP B часовы шэраг SEATS (часавы шэраг Паўднёва-Усходняй Азіі) знаходзіцца на паўднёвым захадзе Тайваня (34), далей ад межаў іншых AEP (малюнак 5C, пазнака 1), і можа выкарыстоўвацца як лепшае месца для маніторынгу АЭПБ.Часовы шэраг BATS (даследаванне часавых шэрагаў Бермудскіх астравоў у Атлантыцы) (малюнак 5C, пазнака 4) у AEPC знаходзіцца вельмі блізка да мяжы паміж AEP C і F, што паказвае на тое, што маніторынг AEP C з дапамогай часавых шэрагаў BATS можа быць непасрэдна праблематычным.Станцыя P у AEP J (малюнак 5C, пазнака 3) знаходзіцца далёка ад мяжы AEP, таму яна больш рэпрэзентатыўная.Eco-Province і AEP могуць дапамагчы стварыць сістэму маніторынгу, прыдатную для ацэнкі глабальных змен, таму што дазвол правінцый ацэньваць, дзе адбор проб на месцы можа даць ключавыя звесткі.Метад SAGE можа быць развіты для прымянення да кліматычных дадзеных для ацэнкі зменлівасці, якая эканоміць час.
Поспех метаду SAGE дасягаецца шляхам дбайнага прымянення метадаў навукі аб даных/ML і прадметна-спецыфічных ведаў​​.У прыватнасці, t-SNE выкарыстоўваецца для выканання памяншэння памернасці, якое захоўвае каварыяцыйную структуру высокаразмерных даных і палягчае візуалізацыю каварыяцыйнай тапалогіі.Дадзеныя размешчаны ў выглядзе палос і каварыяцый (малюнак 2A), што паказвае на тое, што меры, заснаваныя толькі на адлегласці (напрыклад, K-сярэднія), не падыходзяць, таму што яны звычайна выкарыстоўваюць Гаўсава (кругавое) базіснае размеркаванне (абмяркоўваецца ў Заўвазе S2) .Метад DBSCAN падыходзіць для любой каварыяцыйнай тапалогіі.Пакуль вы звяртаеце ўвагу на наладу параметраў, можна забяспечыць надзейную ідэнтыфікацыю.Вылічальныя выдаткі алгарытму t-SNE высокія, што абмяжоўвае яго цяперашняе прымяненне да большага аб'ёму даных, што азначае, што яго цяжка прымяніць да глыбокіх або зменлівых у часе палёў.Праца над маштабаванасцю t-SNE працягваецца.Паколькі адлегласць KL лёгка паралелізаваць, алгарытм t-SNE мае добры патэнцыял для пашырэння ў будучыні (35).Да гэтага часу іншыя перспектыўныя метады памяншэння памернасці, якія могуць лепш паменшыць памер, уключаюць метады набліжэння і праекцыі ўніфікаванага калектара (UMAP), але неабходная ацэнка ў кантэксце дадзеных аб акіяне.Сэнс лепшай маштабаванасці заключаецца, напрыклад, у класіфікацыі глабальных кліматаў або мадэляў рознай складанасці на змешаным узроўні.Вобласці, якія не могуць быць класіфікаваны SAGE ні ў адной правінцыі, можна разглядаць як астатнія чорныя кропкі на малюнку 2A.Геаграфічна гэтыя вобласці ў асноўным знаходзяцца ў вельмі сезонных раёнах, што сведчыць аб тым, што захоп экалагічных правінцый, якія змяняюцца з цягам часу, забяспечыць лепшы ахоп.
Для таго, каб пабудаваць метад SAGE, былі выкарыстаны ідэі складаных сістэм / навукі аб даных, выкарыстоўваючы здольнасць вызначаць кластары функцыянальных груп (магчымасць знаходзіцца вельмі блізка ў 11-мернай прасторы) і вызначаць правінцыі.Гэтыя правінцыі адлюстроўваюць пэўныя аб'ёмы ў нашай трохмернай фазавай прасторы t-SNE.Аналагічным чынам частка Пуанкарэ можа быць выкарыстана для ацэнкі "аб'ёму" прасторы стану, занятай траекторыяй, каб вызначыць "нармальнае" ці "хаатычнае" паводзіны (36).Для вываду статычнай 11-мернай мадэлі аб'ём, які займае пасля пераўтварэння даных у трохмерную фазавую прастору, можа быць растлумачаны аналагічным чынам.Адносіны паміж геаграфічнай вобласцю і тэрыторыяй у трохмернай фазавай прасторы няпростыя, але іх можна растлумачыць з пункту гледжання экалагічнага падабенства.Па гэтай прычыне перавагай з'яўляецца больш традыцыйная мера непадабенства.
У далейшай працы метад SAGE будзе паўторна выкарыстоўвацца для сезонных змен даных для ацэнкі прасторавай зменлівасці выяўленых правінцый і AEP.Будучая мэта складаецца ў тым, каб выкарыстаць гэты метад, каб дапамагчы вызначыць, якія правінцыі можна вызначыць з дапамогай спадарожнікавых вымярэнняў (напрыклад, Chl-a, адбівальная здольнасць дыстанцыйнага зандзіравання і тэмпература паверхні мора).Гэта дазволіць праводзіць дыстанцыйную ацэнку экалагічных кампанентаў і вельмі гнуткі маніторынг экалагічных правінцый і іх зменлівасці.
Мэта гэтага даследавання - пазнаёміць з метадам SAGE, які вызначае экалагічную правінцыю праз унікальную структуру супольнасці планктону.Тут будзе прадстаўлена больш падрабязная інфармацыя аб фізічнай/біягеахімічнай/экасістэмнай мадэлі і выбары параметраў алгарытмаў t-SNE і DBSCAN.
Фізічныя кампаненты мадэлі паходзяць з ацэнкі цыркуляцыі акіяна і клімату [ECCOv4;(37) глабальная ацэнка стану, апісаная (38).Імянное раздзяленне дзяржаўнай ацэнкі - 1/5.Метад найменшых квадратаў з метадам множніка Лагранжа выкарыстоўваецца для атрымання пачатковых і межавых умоў і ўнутраных параметраў мадэлі, скарэкціраваных шляхам назірання, тым самым ствараючы бесперапынную мадэль агульнага цыкла MIT (MITgcm) (39), мадэль Пасля аптымізацыі вынікі могуць адсочваць і назіраць.
Біягеахімія/экасістэма мае больш поўнае апісанне (напрыклад, ураўненні і значэнні параметраў) у (2).Мадэль фіксуе цыркуляцыю C, N, P, Si і Fe праз неарганічныя і арганічныя сажалкі.Версія, якая выкарыстоўваецца тут, уключае 35 відаў фітапланктону: 2 віды мікрапракарыёт і 2 віды мікраэўкарыёт (прыдатныя для асяроддзя з нізкім утрыманнем пажыўных рэчываў), 5 відаў Cryptomonas sphaeroides (з пакрыццём з карбанату кальцыя), 5 відаў дыязонію (можа фіксаваць азот, таму гэта не абмежавана) даступнасць растворанага неарганічнага азоту), 11 дыятомавых (утвараюць крэмніевае покрыва), 10 змешаных раслінных жгуціканосцаў (могуць фотасінтэзаваць і харчавацца іншым планктонам) і 16 заапланктону (пасуцца іншым планктонам).Іх называюць «біягеахімічнымі функцыянальнымі групамі», таму што яны па-рознаму ўплываюць на марскую біягеахімію (40, 41) і часта выкарыстоўваюцца ў назіраннях і мадэльных даследаваннях.У гэтай мадэлі кожная функцыянальная група складаецца з некалькіх планктону рознага памеру з дыяпазонам ад 0,6 да 2500 мкм эквівалентнага сферычнага дыяметра.
Параметры, якія ўплываюць на рост, выпас і апусканне фітапланктону, звязаны з памерам, і існуюць пэўныя адрозненні паміж шасцю функцыянальнымі групамі фітапланктону (32).Нягледзячы на ​​розныя фізічныя рамкі, вынікі 51 кампанента планктону мадэлі былі выкарыстаны ў шэрагу апошніх даследаванняў (42-44).
З 1992 па 2011 гады мадэль сувязі фізічнай/біягеахімічнай/экасістэмы дзейнічала 20 гадоў.Выхад мадэлі ўключае біямасу планктону, канцэнтрацыю пажыўных рэчываў і хуткасць паступлення пажыўных рэчываў (DIN, PO4, Si і Fe).У гэтым даследаванні 20-гадовае сярэдняе значэнне гэтых вынікаў выкарыстоўвалася ў якасці ўваходных дадзеных для экалагічнай правінцыі.Chl, размеркаванне біямасы планктону і канцэнтрацыі пажыўных рэчываў і размеркаванне функцыянальных груп параўноўваюцца са спадарожнікавымі і натурнымі назіраннямі [гл. (2, 44), Заўвага S1 і малюнак.S1 да S3].
Для метаду SAGE асноўнай крыніцай выпадковасці з'яўляецца этап t-SNE.Выпадковасць перашкаджае паўтаральнасці, што азначае, што вынікі ненадзейныя.Метад SAGE строга правярае ўстойлівасць шляхам вызначэння набору параметраў t-SNE і DBSCAN, якія могуць паслядоўна ідэнтыфікаваць кластары пры паўтарэнні.Вызначэнне «збянтэжанасці» параметра t-SNE можна разумець як вызначэнне ступені, у якой адлюстраванне ад высокіх да нізкіх памераў павінна паважаць лакальныя або глабальныя характарыстыкі даных.Дайшлі да блытаніны 400 і 300 ітэрацый.
Для алгарытму кластарызацыі DBSCAN неабходна вызначыць мінімальны памер і метрыку адлегласці кропак дадзеных у кластары.Мінімальная колькасць вызначаецца пад кіраўніцтвам спецыялістаў.Гэтыя веды ведаюць, што адпавядае бягучай аснове лікавага мадэлявання і дазволу.Мінімальная колькасць роўная 100. Можна разгледзець больш высокае мінімальнае значэнне (менш за <135 да таго, як верхняя мяжа зялёнага стане шырэй), але гэта не можа замяніць метад агрэгацыі, заснаваны на непадабенстве BC.Ступень злучэння (малюнак 6A) выкарыстоўваецца для ўстаноўкі параметра ϵ, які спрыяе больш высокаму ахопу (малюнак 6B).Звязнасць вызначаецца як сукупная колькасць кластараў і адчувальная да параметру ϵ.Ніжэйшая сувязь паказвае на недастатковую адпаведнасць, штучную групоўку рэгіёнаў разам.Высокая сувязь сведчыць аб празмернасці.Пераабсталяванне таксама праблематычна, таму што гэта паказвае, што першапачатковыя выпадковыя здагадкі могуць прывесці да неўзнаўляльных вынікаў.Паміж гэтымі дзвюма крайнімі значэннямі рэзкае павелічэнне (звычайна званае «локаць») паказвае на найлепшы ϵ.На малюнку 6A вы бачыце рэзкае павелічэнне плошчы плато (жоўтае,> 200 кластараў), а затым рэзкае памяншэнне (зялёны, 100 кластараў) прыкладна да 130, акружаных вельмі невялікай колькасцю кластараў (сіні, <60 кластараў) ).Прынамсі ў 100 блакітных абласцях альбо адзін кластар дамінуе над усім акіянам (ϵ <0,42), альбо большая частка акіяна не класіфікуецца і лічыцца шумам (ϵ> 0,99).Жоўтая вобласць мае вельмі зменлівае, неўзнаўляльнае размеркаванне кластараў.Калі ϵ памяншаецца, шум павялічваецца.Рэзка павялічваецца зялёная зона называецца локцем.Гэта аптымальны рэгіён.Нягледзячы на ​​​​тое, што выкарыстоўваецца верагоднасць t-SNE, для вызначэння надзейнай кластарызацыі ўсё яшчэ можна выкарыстоўваць рознасць BC у межах правінцыі.Выкарыстоўваючы малюнак 6 (A і B), усталюйце ϵ роўным 0,39.Чым большы мінімальны лік, тым меншая верагоднасць дасягнення ϵ, які дазваляе надзейна класіфікаваць, і тым большая зялёная зона са значэннем большым за 135. Павелічэнне гэтай вобласці паказвае, што локаць будзе цяжэй знайсці або не- існуючы.
Пасля ўстаноўкі параметраў t-SNE агульная колькасць знойдзеных кластараў будзе выкарыстоўвацца ў якасці меры падключэння (A) і працэнт даных, выдзеленых кластару (B).Чырвоная кропка паказвае найлепшае спалучэнне пакрыцця і сувязі.Мінімальная колькасць усталёўваецца ў адпаведнасці з мінімальнай колькасцю, звязанай з экалогіяй.
Для атрымання дадатковых матэрыялаў да гэтага артыкула, калі ласка, гл.
Гэта артыкул з адкрытым доступам, які распаўсюджваецца на ўмовах ліцэнзіі Creative Commons Attribution.Артыкул дазваляе неабмежаванае выкарыстанне, распаўсюджванне і прайграванне на любых носьбітах пры ўмове належнага цытавання арыгінальнага твора.
Заўвага: мы просім вас пазначыць свой адрас электроннай пошты толькі для таго, каб чалавек, якога вы рэкамендуеце на старонку, ведаў, што вы хочаце, каб ён убачыў электронны ліст і што гэта не спам.Мы не будзем захопліваць адрасы электроннай пошты.
Гэтае пытанне выкарыстоўваецца, каб праверыць, ці з'яўляецеся вы наведвальнікам, і прадухіліць аўтаматычную рассылку спаму.
Глабальнае міністэрства экалогіі мора настроена вырашаць складаныя праблемы і выкарыстоўвае ML без нагляду для вывучэння грамадскіх структур.
Глабальнае міністэрства экалогіі мора настроена вырашаць складаныя праблемы і выкарыстоўвае ML без нагляду для вывучэння грамадскіх структур.


Час публікацыі: 12 студзеня 2021 г