Се предлага метод на учење без надзор за да се одредат глобалните морски еколошки провинции (еко-провинции) врз основа на структурата на заедницата на планктон и податоците за флуксот на хранливи материи.Методот на систематска интегрирана еколошка провинција (SAGE) може да ги идентификува еколошките провинции во високо нелинеарни екосистемски модели.Со цел да се прилагоди на не-гаусовата коваријанса на податоците, SAGE користи вградување на случаен сосед (t-SNE) за да ја намали димензионалноста.Со помош на апликацијата за бучава базирана на алгоритам за просторно кластерирање базирано на густина (DBSCAN), може да се идентификуваат повеќе од сто еколошки провинции.Користејќи ја картата за поврзување со еколошките разлики како мерка за растојание, робусната агрегирана еколошка провинција (АЕП) објективно се дефинира преку вгнездени еколошки провинции.Користејќи AEPs, беше истражена контролата на стапката на снабдување со хранливи материи врз структурата на заедницата.Еко-провинцијата и AEP се единствени и можат да помогнат во интерпретацијата на моделот.Тие можат да ги олеснат споредбите помеѓу моделите и може да го подобрат разбирањето и следењето на морските екосистеми.
Провинциите се региони каде сложената биогеографија на море или копно е организирана во кохерентни и значајни области (1).Овие провинции се многу важни за споредување и спротивставување на локациите, карактеризирање на набљудувања, следење и заштита.Сложените и нелинеарни интеракции што ги создаваат овие провинции ги прават методите на машинско учење без надзор (ML) многу погодни за објективно одредување на провинциите, бидејќи коваријансата во податоците е сложена и не-гаусова.Овде, се предлага метод на ML, кој систематски ги идентификува единствените морски еколошки провинции (еко-провинции) од глобалниот тродимензионален (3D) физички/екосистемски модел на Дарвин (2).Терминот „уникатен“ се користи за да укаже дека идентификуваната област не се преклопува доволно со другите области.Овој метод се нарекува метод на системски интегрирана еколошка провинција (SAGE).За да се изврши корисна класификација, алгоритамскиот метод треба да дозволи (i) глобална класификација и (ii) анализа со повеќе размери што може да се вгнезди/соберат во просторот и времето (3).Во ова истражување, за прв пат беше предложен методот SAGE и се дискутираше за идентификуваните еколошки провинции.Еко-провинциите можат да промовираат разбирање на факторите кои ја контролираат структурата на заедницата, да обезбедат корисни сознанија за стратегиите за следење и да помогнат во следењето на промените во екосистемот.
Копнените провинции обично се класифицираат според сличностите во климата (врнежите и температурата), почвата, вегетацијата и фауната и се користат за помошно управување, истражување на биолошката разновидност и контрола на болести (1, 4).Потешко е да се дефинираат морските провинции.Повеќето организми се микроскопски, со граници на течност.Лонгхерст и сор.(5) Обезбедена една од првите глобални класификации на Министерството за океанографија врз основа на условите на животната средина.Дефиницијата на овие провинции „Лонгхарст“ вклучува променливи како што се стапката на мешање, стратификација и зрачење, како и долгогодишното искуство на Лонгхарст како морски океанограф, кој има други важни услови за морските екосистеми.Longhurst се користеше интензивно, на пример, за да се процени примарното производство и флуксот на јаглерод, да се помогне во риболовот и да се планираат активности за набљудување на самото место (5-9).Со цел пообјективно да се дефинираат провинциите, користени се методи како што се нејасна логика и регионално ненадгледувано кластерирање/статистички податоци (9-14).Целта на ваквите методи е да се идентификуваат значајни структури кои можат да ги идентификуваат провинциите во достапните податоци за набљудување.На пример, динамичните поморски провинции (12) користат самоорганизирани мапи за намалување на бучавата и користат хиерархиско (засновано на дрво) групирање за одредување производи од морска боја добиени од регионални сателити [хлорофил a (Chl-a), нормализирана висина на линијата за флуоресценција и обоена растворена органска материја] и физичко поле (температура и соленост на површината на морето, апсолутна динамична топографија и морски мраз).
Структурата на заедницата на планктонот е загрижувачка бидејќи неговата екологија има големо влијание врз повисоките нивоа на хранливи материи, апсорпцијата на јаглеродот и климата.Сепак, сè уште е предизвикувачка и неостварлива цел да се одреди глобална еколошка провинција врз основа на структурата на заедницата на планктон.Морските сателити во боја можат потенцијално да дадат увид во крупната класификација на фитопланктонот или да ги предложат предностите на функционалните групи (15), но тие во моментов не се во можност да дадат детални информации за структурата на заедницата.Неодамнешните истражувања [на пр. Тара Океан (16)] обезбедуваат невидени мерења на структурата на заедницата;во моментов, постојат само ретки набљудувања in-situ на глобално ниво (17).Претходните студии во голема мера ја определија „Биогеохемиската провинција“ (12, 14, 18) врз основа на определувањето на биохемиските сличности (како примарното производство, Chl и достапната светлина).Овде, нумеричкиот модел се користи за излез [Darwin(2)], а еколошката провинција се одредува според структурата на заедницата и флуксот на хранливи материи.Нумеричкиот модел што се користи во оваа студија има глобална покриеност и може да се спореди со постоечките теренски податоци (17) и полињата за далечинско набљудување (Забелешка S1).Податоците од нумеричкиот модел користени во оваа студија ја имаат предноста на глобалната покриеност.Моделот екосистем се состои од 35 видови на фитопланктон и 16 видови на зоопланктон (ве молиме погледнете ги материјалите и методите).Моделните типови на планктони комуницираат нелинеарно со не-Гаусови коваријантни структури, така што едноставните дијагностички методи не се погодни за идентификување на единствени и конзистентни обрасци во новите структури на заедницата.Методот SAGE воведен овде обезбедува нов начин за проверка на излезот на сложените Дарвинови модели.
Моќните трансформативни способности на науката за податоци/МЛ технологијата можат да овозможат претежно сложени моделски решенија да откријат сложени, но робусни структури во коваријансата на податоците.Робустен метод се дефинира како метод кој може верно да ги репродуцира резултатите во даден опсег на грешки.Дури и во едноставни системи, одредувањето робусни обрасци и сигнали може да биде предизвик.Сè додека не се утврди образложението што води до набљудуваната шема, сложеноста што се појавува може да изгледа комплицирана/тешка за решавање.Клучниот процес на поставување на составот на екосистемот е по нелинеарен карактер.Постоењето на нелинеарни интеракции може да ја збуни робусната класификација, па затоа е неопходно да се избегнат методите што прават силни претпоставки за основната статистичка дистрибуција на коваријансата на податоците.Високодимензионалните и нелинеарните податоци се вообичаени во океанографијата и може да имаат коваријансна структура со сложена, не-гаусова топологија.Иако податоците со не-Гаусова коваријансна структура може да ја попречат робусната класификација, методот SAGE е нов бидејќи е дизајниран да идентификува кластери со произволни топологии.
Целта на методот SAGE е објективно да се идентификуваат новите модели кои можат да помогнат во понатамошното еколошко разбирање.Следејќи го работниот тек заснован на кластери сличен на (19), еколошките и променливите флукс на хранливи материи се користат за да се одреди единствениот кластер во податоците, наречен еколошка провинција.Методот SAGE предложен во оваа студија (слика 1) прво ја намалува димензионалноста од 55 на 11 димензии со собирање на функционалните групи на планктон дефинирани априори (види Материјали и методи).Користејќи го методот на вградување на случаен сосед (t-SNE), големината дополнително се намалува со проектирање на веројатноста во 3D просторот.Ненадгледуваното кластерирање може да идентификува еколошки блиски области [просторно групирање засновано на густина (DBSCAN) за апликации базирани на бучава].И t-SNE и DBSCAN се применливи за инхерентните нелинеарни податоци за нумеричкиот модел на екосистемот.Потоа, репроектирај ја добиената еколошка провинција на земјата.Идентификувани се повеќе од сто уникатни еколошки провинции, погодни за регионални истражувања.Со цел да се разгледа глобално конзистентниот екосистемски модел, методот SAGE се користи за агрегација на еколошките провинции во збирни еколошки провинции (АЕП) за да се подобри ефикасноста на еколошките провинции.Нивото на агрегација (наречено „сложеност“) може да се прилагоди на потребното ниво на детали.Определете ја минималната сложеност на робустен AEP.Фокусот на изборот е методот SAGE и истражувањето на најмалите сложени случаи на AEP за да се утврди контролата на структурата на заедницата за итни случаи.Моделите потоа може да се анализираат за да се обезбедат еколошки сознанија.Методот воведен овде, исто така, може да се користи за споредба на модели поопширно, на пример, со евалуација на локациите на слични еколошки провинции пронајдени во различни модели за да се истакнат разликите и сличностите, за да се споредат моделите.
(А) Шематски дијаграм на работниот тек за одредување на еколошката провинција;користење на збирот во функционалната група за да се редуцираат оригиналните 55-димензионални податоци на излез од 11-димензионален модел, вклучувајќи ја биомасата од седум функционални/хранливи планктони и четири стапки на снабдување со хранливи материи.Занемарлива вредност и издржлива површина за покривање мраз.Податоците се стандардизирани и стандардизирани.Обезбедете 11-димензионални податоци за t-SNE алгоритмот за да се истакнат статистички слични комбинации на карактеристики.DBSCAN внимателно ќе го избере кластерот за да ја постави вредноста на параметарот.Конечно проектирајте ги податоците назад до проекцијата на географска должина/широчина.Ве молиме имајте предвид дека овој процес се повторува 10 пати бидејќи може да се генерира мала случајност со примена на t-SNE.(Б) објаснува како да се добие AEP со повторување на работниот тек во (А) 10 пати.За секоја од овие 10 имплементации, меѓупровинциската матрица на различноста на Bray-Curtis (BC) беше одредена врз основа на биомасата од 51 тип на фитопланктон.Определете ја разликата BC помеѓу провинциите, од сложеност 1 AEP до целосна сложеност 115. Реперот BC е поставен од провинцијата Лонгхурст.
Методот SAGE го користи излезот од глобалниот 3D физички/екосистемски нумерички модел за да ја дефинира еколошката провинција [Дарвин (2);види Материјали и методи и Забелешка S1].Компонентите на екосистемот се составени од 35 видови фитопланктон и 16 видови на зоопланктон, со седум предефинирани функционални групи: прокариоти и еукариоти приспособени на средини со ниска содржина на хранливи материи, кокцидии со обвивка од калциум карбонат и тешка фиксација на азот со недостаток на нутриенти. важни хранливи материи), со силициумска обвивка, можат да направат други планктонски фотосинтези и пасење мешани хранливи флагелати и сточари од зоопланктон.Распонот на големината е од 0,6 до 2500μm еквивалентен сферичен дијаметар.Дистрибуцијата на моделот на големината на фитопланктонот и функционалното групирање ги доловува севкупните карактеристики видени во сателитски и in-situ набљудувања (види слики S1 до S3).Сличноста помеѓу нумеричкиот модел и набљудуваниот океан покажува дека провинциите дефинирани со моделот може да бидат применливи за in-situ океанот.Ве молиме имајте предвид дека овој модел доловува само одредена разновидност на фитопланктон, и само одредени физички и хемиски опсези на присилување на океанот in situ.Методот SAGE може да им овозможи на луѓето подобро да го разберат високо регионалниот контролен механизам на моделската структура на заедницата.
Со вклучување само на збирот на површинската биомаса (со просечно време од 20 години) во секоја функционална група планктони, димензионалноста на податоците може да се намали.Откако претходните студии ја покажаа нивната клучна улога во поставувањето на структурата на заедницата, таа, исто така, вклучи термини за површински извор за флукс на хранливи материи (набавка на азот, железо, фосфат и силициумска киселина) [на пр. (20, 21)] .Збирот на функционалните групи го намалува проблемот од 55 (51 планктон и 4 флукс на хранливи материи) на 11 димензии.Во оваа првична студија, поради пресметковните ограничувања наметнати од алгоритмот, променливоста на длабочината и времето не беа земени предвид.
SAGE методот е во состојба да идентификува важни односи помеѓу нелинеарните процеси и клучните карактеристики на интеракциите помеѓу биомасата на функционалната група и флуксот на хранливи материи.Користењето на 11-димензионални податоци засновани на методите за учење на далечина на Евклид (како што се К-средства) не може да се добијат сигурни и репродуктивни провинции (19, 22).Тоа е затоа што не се наоѓа Гаусова форма во основната дистрибуција на ковариантноста на клучните елементи што ја дефинираат еколошката провинција.К-средината на Воронојските ќелии (прави линии) не можат да ја задржат не-гаусовата основна дистрибуција.
Биомасата од седум функционални групи на планктони и четири флукс на хранливи материи формираат 11-димензионален вектор x.Според тоа, x е векторско поле на моделската мрежа, каде што секој елемент xi претставува 11-димензионален вектор дефиниран на хоризонталната мрежа на моделот.Секој индекс i уникатно идентификува мрежна точка на сферата, каде што (lon, lat) = (ϕi, θi).Ако биомасата на моделската мрежна единица е помала од 1,2×10-3mg Chl/m3 или стапката на покриеност со мраз надминува 70%, се користи дневникот за податоци за биомаса и се фрла.Податоците се нормализирани и стандардизирани, така што сите податоци се во опсег од [0 до 1], средната вредност се отстранува и се скалира до единица варијанса.Ова е направено така што карактеристиките (биомаса и флукс на хранливи материи) не се ограничени со контрастот во опсегот на можните вредности.Кластерирањето треба да го опфати односот на промената од клучното растојание на веројатноста помеѓу карактеристиките, наместо од географското растојание.Со квантифицирање на овие растојанија, се појавуваат важни карактеристики, додека непотребните детали се отфрлаат.Од еколошка гледна точка, ова е неопходно бидејќи некои видови фитопланктон со мала биомаса може да имаат поголеми биогеохемиски ефекти, како што е фиксацијата на азот од диазотрофни бактерии.При стандардизирање и нормализирање на податоците, овие типови на коваријати ќе бидат истакнати.
Со нагласување на близината на карактеристиките во високодимензионалниот простор при нискодимензионално претставување, алгоритмот t-SNE се користи за да се направат појасни постоечките слични региони.Претходната работа насочена кон изградба на длабоки невронски мрежи за апликации за далечинско набљудување користеше t-SNE, која ја докажа својата вештина во одвојувањето на клучните карактеристики (23).Ова е неопходен чекор за да се идентификува робусното групирање во податоците за карактеристиките додека се избегнуваат неконвергентни решенија (забелешка S2).Со користење на Гаусови јадра, t-SNE ги зачувува статистичките својства на податоците со мапирање на секој високодимензионален објект до точка во 3D фазниот простор, со што се осигурува дека веројатноста за слични објекти во високи и ниски насоки е висока во високи димензионален простор (24).Со оглед на множеството од N високодимензионални објекти x1,…,xN, алгоритмот t-SNE се намалува со минимизирање на дивергенцијата Kullback-Leibler (KL) (25).KL дивергенцијата е мерка за тоа колку е различна дистрибуцијата на веројатност од втората референтна распределба на веројатност и може ефективно да ја оцени можноста за корелација помеѓу нискодимензионалните претстави на високодимензионалните карактеристики.Ако xi е i-ти објект во N-димензионален простор, xj е j-ти објект во N-димензионален простор, yi е i-ти објект во нискодимензионален простор, а yj е j-ти објект во низок -димензионален простор, потоа t -SNE ја дефинира веројатноста за сличност ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), а за множеството за намалување на димензионалноста q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
Слика 2А го илустрира ефектот на намалување на векторите на биомаса и флукс на хранливи материи од 11-димензионалната комбинација во 3D.Мотивацијата за примена на t-SNE може да се спореди со мотивацијата на анализата на главна компонента (PCA), која го користи атрибутот варијанса за да ја нагласи областа/атрибутот на податоците, а со тоа да ја намали димензионалноста.Утврдено е дека методот t-SNE е супериорен во однос на PCA во обезбедувањето сигурни и репродуктивни резултати за еко-министерството (види Забелешка S2).Ова може да биде затоа што претпоставката за ортогоналност на PCA не е погодна за идентификување на критичните интеракции помеѓу високо нелинеарни интерактивни карактеристики, бидејќи PCA се фокусира на линеарни коваријантни структури (26).Користејќи податоци за далечинско набљудување, Лунга и сор.(27) илустрира како да се користи методот SNE за да се истакнат сложените и нелинеарни спектрални карактеристики кои отстапуваат од Гаусовата распределба.
(А) Моделирана стапка на снабдување со хранливи материи, биомаса на функционална група на фитопланктон и зоопланктон, нацртана со алгоритмот t-SNE и обоена по провинција користејќи DBSCAN.Секоја точка претставува точка во високодимензионалниот простор, како што е прикажано на Слика 6Б, повеќето точки се заробени.Шахтите се однесуваат на „t-SNE“ големини 1, 2 и 3. (Б) Географската проекција на провинцијата пронајдена од DBSCAN на решетката географска должина на потеклото.Бојата треба да се смета како која било боја, но треба да одговара на (А).
Точките во дијаграмот за расејување t-SNE на Слика 2А соодветно се поврзани со географската ширина и должина.Ако двете точки на Слика 2А се блиску една до друга, тоа е затоа што нивната биомаса и флуксот на хранливи материи се слични, а не поради географската близина.Боите на Слика 2А се кластери откриени со помош на методот DBSCAN (28).Кога барате густи набљудувања, алгоритмот DBSCAN го користи растојанието во 3D претставувањето помеѓу точките (ε = 0,39; за информации за овој избор, видете Материјали и методи), а бројот на слични точки е потребен за да се дефинира кластерот (тука 100 поени, видете погоре).Методот DBSCAN не прави никакви претпоставки за обликот или бројот на кластери во податоците, како што е прикажано подолу:
3) За сите точки идентификувани како на растојание внатре, повторете го чекор 2 повторливо за да ја одредите границата на кластерот.Ако бројот на поени е поголем од поставената минимална вредност, тој се означува како кластер.
Податоците што не ги задоволуваат минималната метрика на кластерот и растојанието ϵ се сметаат за „шум“ и не им се доделува боја.DBSCAN е брз и скалабилен алгоритам со O(n2) перформанси во најлош случај.За сегашната анализа, таа всушност не е случајна.Минималниот број на бодови се утврдува со стручна евалуација.По прилагодувањето на растојанието потоа, резултатот не е доволно стабилен во опсег од ≈±10.Ова растојание е поставено со користење на поврзување (слика 6А) и процент на покриеност на океанот (Слика 6Б).Поврзаноста е дефинирана како композитен број на кластери и е чувствителна на параметарот ϵ.Пониската поврзаност укажува на недоволно вклопување, вештачки групирање региони заедно.Високата поврзаност укажува на преоптоварување.Замисливо е да се користи повисок минимум, но ако минимумот надминува ca, невозможно е да се постигне сигурно решение.135 (За повеќе детали, видете Материјали и методи).
115-те кластери идентификувани на Слика 2А се проектирани назад на земјата на Слика 2Б.Секоја боја одговара на кохерентна комбинација на биогеохемиски и еколошки фактори идентификувани од DBSCAN.Откако ќе се утврдат кластерите, поврзувањето на секоја точка на Слика 2А со одредена географска ширина и должина се користи за проектирање на кластерите назад во географската област.Слика 2Б го илустрира ова со истите бои на кластерот како Слика 2А.Слични бои не треба да се толкуваат како еколошка сличност, бидејќи тие се доделуваат според редоследот по кој алгоритмот ги открива кластерите.
Областа на Слика 2Б може да биде квалитативно слична на воспоставена област во физичката и/или биогеохемијата на океанот.На пример, кластерите во Јужниот Океан се зонско-симетрични, со појавување на олиготрофни вртлози, а острата транзиција укажува на влијанието на трговските ветрови.На пример, во екваторијалниот Пацифик, се гледаат различни региони поврзани со подемот.
Со цел да се разбере еколошката средина на Еко-провинцијата, беше користена варијација на индексот на разликата Бреј-Куртис (BC) (29) за да се оцени екологијата во кластерот.Индикаторот BC е статистички податок што се користи за квантифицирање на разликата во структурата на заедницата помеѓу две различни локации.Мерењето BC е применливо за биомасата на 51 вид фитопланктон и зоопланктон BCninj = 1-2CninjSni + Snj
BCninj се однесува на сличноста помеѓу комбинацијата ni и комбинацијата nj, каде што Cninj е минималната вредност на еден тип на биомаса што постои во двете комбинации ni и nj, а Sni го претставува збирот на сите биомаси што постојат во двете комбинации ni и Snj.Разликата BC е слична на мерката за растојание, но функционира во неевклидов простор, што веројатно ќе биде посоодветно за еколошки податоци и нивно толкување.
За секој кластер идентификуван на Слика 2Б, може да се процени сличноста на внатре-провинцискиот и меѓупровинцискиот BC.Разликата пред нашата ера во една провинција се однесува на разликата помеѓу просечната вредност на покраината и секоја точка во провинцијата.Разликата помеѓу провинциите пред нашата ера се однесува на сличноста помеѓу една провинција и други провинции.Слика 3А покажува симетрична BC матрица (0, црна: целосно соодветна; 1, бела: целосно различна).Секоја линија во графиконот покажува шема во податоците.Слика 3Б го прикажува географското значење на резултатите од п.н.е. на слика 3А за секоја провинција.За провинција во област со ниска исхрана и ниски хранливи материи, Слика 3Б покажува дека симетријата на големите области околу екваторот и Индискиот океан е во основа слична, но повисоките географски широчини и областите со нагорнина се значително различни.
(А) Степенот на разликата пред нашата ера оценува за секоја провинција врз основа на глобалниот 20-годишен просечен глобален просек на површината од 51 планктон.Забележете ја очекуваната симетрија на вредностите.(Б) Просторната проекција на колона (или ред).За провинција во дистрофичен круг, беше оценета глобалната дистрибуција на мерката за сличност BC и беше оценет глобалниот 20-годишен просек.Црното (BC = 0) значи иста област, а белото (BC = 1) значи дека нема сличност.
Слика 4А ја илустрира разликата во п.н.е. во секоја провинција на Слика 2Б.Утврдено со користење на просечната комбинација на просечната површина во кластерот и одредување на различноста помеѓу BC и средната вредност на секоја точка на мрежа во провинцијата, покажува дека методот SAGE може добро да одвои 51 вид врз основа на еколошката сличност. податоци за моделот.Вкупната просечна различност на кластерот BC на сите 51 типови е 0,102±0,0049.
(А, Б и Г) Разликата BC во покраината се оценува како просечна разлика BC помеѓу секоја заедница на мрежна точка и просечната провинција, а сложеноста не е намалена.(2) Глобалната просечна разлика меѓу провинциските пр.н.е. е 0,227±0,117.Ова е репер за класификација базирана на еколошка мотивација предложена од ова дело [зелена линија во (C)].(В) Просечна разлика помеѓу провинциските н.е.2σ доаѓа од 10 повторувања на процесот на идентификација на еко-провинцијата.За вкупната сложеност на провинциите откриени од DBSCAN, (A) покажува дека различноста BC во покраината е 0,099, а класификацијата на сложеност предложена од (C) е 12, што резултира со различност BC од 0,200 во провинцијата.како што покажува сликата.(Д).
На Слика 4Б, биомасата од 51 тип на планктони се користи за да се претстави еквивалентната разлика пред нашата ера во провинцијата Лонгхерст.Вкупниот просек на секоја провинција е 0,227, а стандардното отстапување на мрежните точки во однос на разликата во провинцијата п.н.е. е 0,046.Ова е поголемо од кластерот идентификуван на Слика 1Б.Наместо тоа, со користење на збирот на седумте функционални групи, просечната разлика помеѓу сезоните пред нашата ера во Лонгхерст се зголеми на 0,232.
Глобалната мапа на еко-провинција дава сложени детали за уникатните еколошки интеракции и направени се подобрувања во користењето на целата структура на екосистемот на провинцијата Лонгхурст.Се очекува Министерството за екологија да даде увид во процесот на контрола на екосистемот на нумеричкиот модел, а овој увид ќе помогне во истражувањето на теренската работа.За целите на ова истражување, не е можно целосно да се прикажат повеќе од сто провинции.Следниот дел го воведува методот SAGE кој ги сумира провинциите.
Една од целите на покраината е да промовира разбирање за локацијата и управувањето со покраината.За да се одредат итни ситуации, методот на Слика 1Б го илустрира гнездење на еколошки слични провинции.Еко-провинциите се групирани заедно врз основа на еколошката сличност, а таквата групација на провинции се нарекува AEP.Поставете прилагодлива „сложеност“ врз основа на вкупниот број на провинции што треба да се разгледаат.Терминот „комплексност“ се користи затоа што овозможува прилагодување на нивото на атрибути за итни случаи.Со цел да се дефинираат значајни агрегации, како репер се користи просечната разлика помеѓу провинцијата BC од 0,227 од Лонгхарст.Под овој репер, комбинираните провинции повеќе не се сметаат за корисни.
Како што е прикажано на Слика 3Б, глобалните еколошки провинции се кохерентни.Користејќи ги меѓупровинциските разлики пред нашата ера, може да се види дека некои конфигурации се многу „вообичаени“.Инспирирани од генетиката и методите на теоријата на графикони, „поврзаните графици“ се користат за подредување на > 100 провинции врз основа на провинциите кои се најслични на нив.Метриката за „поврзаност“ овде е одредена со користење на меѓупровинциска различност пред нашата ера (30).Бројот на провинции со поголем простор за класификација на> 100 провинции овде може да се наведе како сложеност.AEP е производ кој категоризира повеќе од 100 провинции како најдоминантни/најблиски еколошки провинции.Секоја еколошка провинција е доделена на доминантната/високо поврзаната еколошка провинција која е најслична на нив.Оваа агрегација утврдена со разликата BC овозможува вгнезден пристап кон глобалната екологија.
Избраната сложеност може да биде која било вредност од 1 до целосната сложеност на Сл.2А.При помала сложеност, AEP може да се дегенерира поради веројатниот чекор за намалување на димензионалноста (t-SNE).Дегенерација значи дека еколошките провинции може да се доделат на различни AEP помеѓу повторувањата, а со тоа да се промени опфатената географска област.Слика 4В го илустрира ширењето на разликите BC во провинциите во AEP со зголемена сложеност на 10 имплементации (илустрација на Слика 1Б).На слика 4C, 2σ (сина област) е мерка за деградација во 10 имплементации, а зелената линија го претставува реперот Лонгхерст.Фактите докажаа дека сложеноста на 12 може да ја задржи разликата BC во провинцијата под одредницата Longhurst во сите имплементации и да одржи релативно мала деградација 2σ.Сумирано, минималната препорачана сложеност е 12 AEPs, а просечната разлика помеѓу провинцијата BC, вреднувана со користење на 51 тип на планктони е 0,198±0,013, како што е прикажано на Слика 4Д.Користејќи го збирот од седум планктонски функционални групи, просечната разлика пред нашата ера во провинцијата е 2σ наместо 0,198±0,004.Споредбата помеѓу разликите BC пресметани со вкупната биомаса на седумте функционални групи или биомасата на сите 51 типови на планктони покажува дека иако методот SAGE е применлив за 51-димензионалната ситуација, тој е за вкупната биомаса на седумте функционални групи За обука.
Во зависност од целта на секое истражување, може да се разгледаат различни нивоа на сложеност.Регионалните студии може да бараат целосна сложеност (т.е. сите 115 провинции).Како пример и за јасност, земете ја минималната препорачана сложеност од 12.
Како пример за корисноста на методот SAGE, овде се користат 12 AEP со минимална сложеност од 12 за да се истражи контролата на структурата на заедницата за итни случаи.Слика 5 ги илустрира еколошките сознанија групирани според AEP (од А до Л): во стехиометријата на Редфилд, географската пространост (слика 5C), составот на биомасата на функционалната група (Слика 5А) и снабдувањето со хранливи материи (Слика 5Б) се изведуваат со N Zoomed.Прикажан е односот (N:Si:P:Fe, 1:1:16:16×103).За вториот панел, P помножено со 16 и Fe помножено со 16×103, така што столбестиот графикон е еквивалентен на нутритивните барања на фитопланктонот.
Провинциите се класифицирани во 12 AEP од A до L. (А) Биомаса (mgC/m3) на екосистеми во 12 провинции.(Б) Стапката на проток на хранливи материи на растворен неоргански азот (N), железо (Fe), фосфат (P) и силициумска киселина (Si) (mmol/m3 годишно).Fe и P се множат со 16 и 16×103, соодветно, така што лентите се стандардизирани според барањата за стехиометрија на фитопланктон.(В) Забележете ја разликата помеѓу поларните региони, суптропските циклони и главните сезонски/подигнувачки региони.Мониторинг станиците се означени на следниов начин: 1, СЕДИШТА;2, АЛОХА;3, станица P;и 4, ЛИЛЈАЦИ.
Идентификуваниот AEP е единствен.Постои одредена симетрија околу екваторот во Атлантскиот и Тихиот Океан, а слична, но зголемена област постои и во Индискиот Океан.Некои AEP ја прифаќаат западната страна на континентот поврзана со искачувањето.Циркуполарната струја на Јужниот пол се смета за голема зонална карактеристика.Суптропскиот циклон е комплексна серија на олиготрофни AEP.Во овие провинции, очигледен е познатиот модел на разлики во биомасата помеѓу олиготрофните вирови доминирани од планктони и поларните региони богати со дијатоми.
AEP со многу слична вкупна фитопланктонска биомаса може да имаат многу различни структури на заедницата и да покриваат различни географски области, како што се D, H и K, кои имаат слична вкупна фитопланктонска биомаса.AEP H главно постои во екваторијалниот Индиски Океан, а има повеќе дијазотрофни бактерии.AEP D се наоѓа во неколку басени, но тој е особено истакнат во Пацификот околу областите со висок принос околу екваторијалното издигнување.Обликот на оваа пацифичка провинција потсетува на воз со планетарен бран.Има малку диазобактерии во AEP D, и повеќе конуси.Во споредба со другите две провинции, AEP K се наоѓа само во висорамнините на Арктичкиот Океан, а има повеќе дијатоми и помалку планктони.Вреди да се напомене дека количината на планктони во овие три региони е исто така многу различна.Меѓу нив, изобилството на планктони на AEP K е релативно ниско, додека она на AEP D и H е релативно високо.Затоа, и покрај нивната биомаса (а со тоа и слични на Chl-a), овие провинции се сосема различни: тестирањето на провинцијата базирано на Chl може да не ги опфати овие разлики.
Исто така, очигледно е дека некои AEP со многу различна биомаса може да бидат слични во однос на структурата на заедницата на фитопланктоните.На пример, ова е видливо во AEP D и E. Тие се блиску еден до друг, а во Тихиот Океан, AEP E е блиску до високопродуктивниот AEPJ.Слично на тоа, не постои јасна врска помеѓу фитопланктонската биомаса и изобилството на зоопланктон.
AEP може да се разбере во однос на хранливите материи што им се обезбедуваат (Слика 5Б).Дијатомеите постојат само таму каде што има доволно залихи на силициумска киселина.Општо земено, колку е поголема понудата на силициумска киселина, толку е поголема биомасата на дијатомите.Дијатомеите може да се видат во AEP A, J, K и L. Односот на биомасата на дијатомите во однос на другите фитопланктони се одредува со N, P и Fe обезбедени во однос на побарувачката на дијатомите.На пример, AEP L е доминирана од дијатоми.Во споредба со другите хранливи материи, Si има најголема понуда.Спротивно на тоа, и покрај повисоката продуктивност, AEP J има помалку дијатоми и помалку снабдување со силикон (сите и во однос на другите хранливи материи).
Бактериите на дијазониум имаат способност да го поправаат азот, но растат бавно (31).Тие коегзистираат со други фитопланктони, каде што железото и фосфорот се прекумерни во однос на побарувачката за не-дијазониумски хранливи материи (20, 21).Вреди да се напомене дека диазотрофичната биомаса е релативно висока, а понудата на Fe и P е релативно голема во однос на понудата на N. На овој начин, иако вкупната биомаса во AEP J е поголема, биомасата на дијазониум во AEP H е поголема од онаа во J. Ве молиме имајте предвид дека AEP J и H се географски многу различни, а H се наоѓа во екваторијалниот Индиски Океан.
Ако уникатната структура на екосистемот не е поделена на провинции, сознанијата добиени од 12-те модели со најниска сложеност на AEP нема да бидат толку јасни.AEP генериран од SAGE го олеснува кохерентното и симултано споредување на сложени и високодимензионални информации од моделите на екосистемите.AEP ефективно нагласува зошто Chl не е добар и алтернативен метод за одредување на структурата на заедницата или изобилството на зоопланктон на повисоки нивоа на хранливи материи.Деталната анализа на тековните истражувачки теми е надвор од опсегот на овој напис.Методот SAGE обезбедува начин за истражување на други механизми во моделот што е полесен за ракување отколку гледањето од точка до точка.
Методот SAGE е предложен за да помогне во разјаснувањето на исклучително сложените еколошки податоци од глобалните физички/биогеохемиски/екосистемски нумерички модели.Еколошката провинција се определува со вкупната биомаса на вкрстено-планктонските функционални групи, примената на алгоритмот за намалување на димензионалноста на веројатноста t-SNE и кластерирањето со помош на ненадгледуваниот ML метод DBSCAN.Меѓупровинциската теорија за разлика/график BC за методот на гнездење се применува за да се изведе робустен AEP што може да се користи за глобално толкување.Во однос на изградбата, Еко-покраината и АЕП се единствени.Вгнездувањето AEP може да се прилагоди помеѓу целосната сложеност на оригиналната еколошка област и препорачаниот минимален праг од 12 AEP.Вгнездувањето и одредувањето на минималната сложеност на AEP се сметаат за клучни чекори, бидејќи веројатноста t-SNE ги дегенерира AEP со комплексност <12.Методот SAGE е глобален, а неговата сложеност се движи од> 100 AEP до 12. За поедноставност, сегашниот фокус е на сложеноста на 12 глобални AEPs.Идните истражувања, особено регионалните студии, може да најдат корисен помал просторен подмножество на глобалните еко-провинции и може да се соберат во помала област за да се искористат истите еколошки согледувања што се дискутирани овде.Тој дава предлози за тоа како овие еколошки провинции и увидите добиени од нив може да се користат за понатамошно еколошко разбирање, да се олесни споредбата на моделите и потенцијално да се подобри мониторингот на морските екосистеми.
Еколошката провинција и AEP идентификувани со методот SAGE се базираат на податоците во нумеричкиот модел.По дефиниција, нумеричкиот модел е поедноставена структура, која се обидува да ја долови суштината на целниот систем, а различни модели ќе имаат различна дистрибуција на планктони.Нумеричкиот модел користен во оваа студија не може целосно да опфати некои од набљудуваните обрасци (на пример, во проценките на Chl за екваторијалниот регион и Јужниот океан).Само мал дел од различноста во реалниот океан е заробен, а мезо и подмезоскалите не можат да се решат, што може да влијае на флуксот на хранливи материи и структурата на заедницата во помал обем.И покрај овие недостатоци, излегува дека AEP е многу корисен во помагањето да се разберат сложените модели.Со проценка каде се наоѓаат слични еколошки провинции, AEP обезбедува потенцијална алатка за споредба на нумерички модели.Тековниот нумерички модел ја доловува севкупната шема на концентрацијата на фитопланктонот Chl-a со далечинско набљудување и дистрибуцијата на големината на планктонот и функционалната група (Забелешка S1 и слика S1) (2, 32).
Како што е прикажано со контурната линија 0,1 mgChl-a/m-3, AEP е поделена на олиготрофна област и мезотрофна област (Слика S1B): AEP B, C, D, E, F и G се олиготрофни области, а останатите области се лоциран Високо Chl-a.AEP покажува одредена кореспонденција со провинцијата Лонгхарст (Слика S3A), на пример, Јужниот Океан и екваторијалниот Пацифик.Во некои региони, AEP покрива повеќе региони Longhurst, и обратно.Бидејќи намерата за разграничување на провинциите во оваа област и Лонгхарст е различна, се очекува да има разлики.Повеќекратните AEP во провинцијата Лонгхерст покажуваат дека одредени области со слична биогеохемија може да имаат многу различни екосистемски структури.AEP покажува одредена кореспонденција со физичките состојби, како што е откриено со користење на ненадгледувано учење (19), како што се државите со висок пораст (на пример, Јужниот Океан и екваторијалниот Пацифик; Слика S3, C и D).Овие кореспонденции покажуваат дека структурата на заедницата на планктонот е под силно влијание на динамиката на океаните.Во области како што е Северен Атлантик, АЕП поминува низ физички провинции.Механизмот што ги предизвикува овие разлики може да вклучува процеси како што е транспортот на прашина, што може да доведе до сосема различни програми за исхрана дури и при слични физички услови.
Министерството за екологија и АЕП посочија дека само со користење на Chl не може да се идентификуваат еколошките компоненти, како што заедницата на морската екологија веќе сфатила.Ова се гледа во AEP со слична биомаса, но значително различен еколошки состав (како што се D и E).Спротивно на тоа, AEP како D и K имаат многу различна биомаса, но сличен еколошки состав.AEP нагласува дека односот помеѓу биомасата, еколошкиот состав и изобилството на зоопланктон е комплексен.На пример, иако AEP J се издвојува во однос на фитопланктонот и планктонската биомаса, AEP на A и L имаат слична планктонска биомаса, но A има поголемо изобилство на планктони.AEP нагласува дека фитопланктонската биомаса (или Chl) не може да се користи за предвидување на биомасата на зоопланктонот.Зоопланктонот е основата на синџирот на храна за рибарство и попрецизни проценки може да доведат до подобро управување со ресурсите.Идните морски сателити во боја [на пример, PACE (планктон, аеросол, облак и морски екосистем)] може да бидат подобро позиционирани за да помогнат во проценката на структурата на заедницата на фитопланктонот.Користењето на AEP предвидување потенцијално може да ја олесни проценката на зоопланктонот од вселената.Методите како SAGE, заедно со новите технологии и сè повеќе теренски податоци достапни за приземни истражувања на вистината (како што се Tara и последователни истражувања), можат заеднички да направат чекор кон мониторинг на здравјето на екосистемот базиран на сателити.
Методот SAGE обезбедува пригоден начин за евалуација на некои механизми кои ги контролираат карактеристиките на провинцијата, како што се биомасата/Chl, нето примарното производство и структурата на заедницата.На пример, релативната количина на дијатоми е поставена со нерамнотежа во снабдувањето со Si, N, P и Fe во однос на стехиометриските барања на фитопланктонот.При избалансирана стапка на понуда, во заедницата доминираат дијатоми (L).Кога стапката на понуда е неурамнотежена (односно, понудата на силициум е помала од побарувачката за хранливи материи на диатомите), дијатомеите заземаат само мал дел Удел (К).Кога понудата на Fe и P ја надминува понудата на N (на пример, E и H), диазотрофните бактерии ќе се развиваат енергично.Преку контекстот обезбеден од AEP, истражувањето на контролните механизми ќе стане покорисно.
Еко-покраината и АЕП се области со слични структури на заедницата.Временската серија од одредена локација во еколошка провинција или AEP може да се смета како референтна точка и може да ја претставува областа опфатена со еколошката провинција или AEP.Долгорочните станици за следење на лице место обезбедуваат такви временски серии.Долгорочните множества на insitu податоци ќе продолжат да играат непроценлива улога.Од гледна точка на следење на структурата на заедницата, методот SAGE може да се гледа како начин да помогне да се одреди најкорисната локација на новите локации.На пример, временските серии од долгорочната проценка на олиготрофните живеалишта (ALOHA) се наоѓаат во AEP B на олиготрофната област (Слика 5C, ознака 2).Бидејќи ALOHA е блиску до границата на друг AEP, временските серии можеби не се репрезентативни за целата област, како што беше претходно предложено (33).Во истата AEP B, временската серија SEATS (временска серија на Југоисточна Азија) се наоѓа во југозападен Тајван (34), подалеку од границите на другите AEP (Слика 5C, ознака 1) и може да се користи како подобра локација за следење AEPB.Временската серија BATS (Бермудски атлантски временски серии студија) (Слика 5C, ознака 4) во AEPC е многу блиску до границата помеѓу AEP C и F, што покажува дека следењето на AEP C со користење на временските серии BATS може директно да биде проблематично.Станицата P во AEP J (слика 5C, ознака 3) е далеку од границата на AEP, па затоа е порепрезентативна.Еко-покраината и АЕП можат да помогнат да се воспостави рамка за мониторинг погодна за проценка на глобалните промени, бидејќи дозволата на провинциите да проценат каде земање примероци на лице место може да обезбеди клучни сознанија.Методот SAGE може дополнително да се развие за да се примени на климатските податоци за да се процени варијабилноста за заштеда на време.
Успехот на методот SAGE се постигнува преку внимателна примена на методите за наука за податоци/ML и знаење специфични за доменот.Поточно, t-SNE се користи за да се изврши намалување на димензијата, што ја зачувува структурата на коваријанса на високодимензионални податоци и ја олеснува визуелизацијата на топологијата на коваријанса.Податоците се подредени во форма на ленти и коваријанси (слика 2А), што покажува дека мерките засновани на далечина (како К-средства) не се соодветни бидејќи тие обично користат Гаусова (кружна) основа дистрибуција (дискутирано во Забелешка S2) .Методот DBSCAN е погоден за секоја топологија на коваријанса.Сè додека внимавате на поставувањето параметри, може да се обезбеди сигурна идентификација.Пресметковната цена на алгоритмот t-SNE е висока, што ја ограничува неговата моментална примена на поголемо количество податоци, што значи дека е тешко да се примени на длабоки полиња или полиња кои се менуваат во време.Работата на приспособливост на t-SNE е во тек.Бидејќи растојанието KL е лесно да се паралелизира, алгоритмот t-SNE има добар потенцијал за проширување во иднина (35).Досега, други ветувачки методи за намалување на димензионалноста кои можат подобро да ја намалат големината вклучуваат техники за унифицирано приближување и проекција (UMAP), но евалуацијата во контекст на океанските податоци е неопходна.Значењето на подобра приспособливост е, на пример, класификација на глобалните клими или модели со различна сложеност на мешан слој.Областите кои не можат да се класифицираат со SAGE во која било провинција може да се сметаат како преостанати црни точки на Слика 2А.Географски, овие области се главно во високо сезонски области, што сугерира дека освојувањето на еколошките провинции кои се менуваат со текот на времето ќе обезбеди подобра покриеност.
Со цел да се конструира SAGE методот, користени се идеи од сложени системи/наука за податоци, користејќи ја можноста за одредување кластери на функционални групи (можност да се биде многу блиску во 11-димензионален простор) и одредување на провинции.Овие провинции прикажуваат специфични томови во нашиот 3D т-СНЕ фазен простор.Слично на тоа, делот Поенкаре може да се користи за да се оцени „волуменот“ на состојбата на просторот окупиран од траекторијата за да се одреди „нормално“ или „хаотично“ однесување (36).За статичниот 11-димензионален излез на моделот, волуменот зафатен откако податоците ќе се конвертираат во 3D фазен простор може слично да се објасни.Врската помеѓу географската област и областа во 3D фазен простор не е едноставна, но може да се објасни во смисла на еколошка сличност.Поради оваа причина, се претпочита поконвенционалната мерка за различност на BC.
Идната работа повторно ќе го користи методот SAGE за сезонско менување на податоците за да се процени просторната варијабилност на идентификуваните провинции и AEP.Идната цел е да се користи овој метод за да се помогне да се одреди кои провинции може да се одредат преку сателитски мерења (како што се Chl-a, рефлексивноста на далечинско набљудување и температурата на површината на морето).Ова ќе овозможи далечинско набљудување проценка на еколошките компоненти и високо флексибилно следење на еколошките провинции и нивната варијабилност.
Целта на ова истражување е да се воведе методот SAGE, кој дефинира еколошка провинција преку нејзината единствена структура на заедницата на планктон.Овде ќе бидат дадени подетални информации за физичкиот/биогеохемискиот/екосистемскиот модел и изборот на параметри на алгоритмите t-SNE и DBSCAN.
Физичките компоненти на моделот доаѓаат од проценката на океанската циркулација и климата [ECCOv4;(37) глобалната проценка на состојбата опишана од (38).Номиналната резолуција на државната проценка е 1/5.Методот на најмали квадрати со Лагранжовиот метод на мултипликатор се користи за да се добијат почетните и граничните услови и внатрешните параметри на моделот приспособени со набљудување, а со тоа се генерира слободен модел на генерален циклус на МИТ (MITgcm) (39), моделот По оптимизацијата, резултатите можат да бидат следени и набљудувани.
Биогеохемијата/екосистемот има поцелосен опис (т.е. равенки и вредности на параметри) во (2).Моделот ја доловува циркулацијата на C, N, P, Si и Fe низ неоргански и органски езерца.Верзијата што се користи овде вклучува 35 видови на фитопланктон: 2 вида микропрокариоти и 2 вида микроеукариоти (погодни за средини со ниски хранливи материи), 5 видови Cryptomonas sphaeroides (со облога од калциум карбонат), 5 видови дијазониум (Може да го поправи азот, така што не е ограничена) достапноста на растворен неоргански азот), 11 дијатоми (формирајќи силициумска обвивка), 10 мешани вегетативни флагелати (може да фотосинтетизираат и да јадат други планктони) и 16 зоопланктон (пасат други планктони).Тие се нарекуваат „биогеохемиски функционални групи“ затоа што имаат различни ефекти врз морската биогеохемија (40, 41) и често се користат во студии за набљудување и модели.Во овој модел, секоја функционална група е составена од неколку планктони со различна големина, со распон од 0,6 до 2500 μm еквивалентен сферичен дијаметар.
Параметрите кои влијаат на растот, пасењето и тонењето на фитопланктонот се поврзани со големината и постојат специфични разлики помеѓу шесте функционални групи на фитопланктон (32).И покрај различните физички рамки, резултатите од 51 планктонска компонента на моделот се користени во голем број неодамнешни студии (42-44).
Од 1992 до 2011 година, моделот на физичко/биогеохемиско/екосистемско спојување работеше 20 години.Излезот на моделот вклучува планктонска биомаса, концентрација на хранливи материи и стапка на снабдување со хранливи материи (DIN, PO4, Si и Fe).Во оваа студија, 20-годишниот просек на овие резултати беше искористен како влез на Еколошката покраина.Chl, дистрибуцијата на планктонската биомаса и концентрацијата на хранливи материи и распределбата на функционалните групи се споредуваат со сателитски и in-situ набљудувања [види (2, 44), Забелешка S1 и слика.S1 до S3].
За методот SAGE, главниот извор на случајност доаѓа од чекорот t-SNE.Случајноста ја попречува повторливоста, што значи дека резултатите се несигурни.Методот SAGE ригорозно ја тестира робусноста со одредување на множество параметри на t-SNE и DBSCAN, кои можат постојано да ги идентификуваат кластерите кога се повторуваат.Утврдувањето на „збунетоста“ на параметарот t-SNE може да се сфати како одредување на степенот до кој мапирањето од високи до ниски димензии треба да ги почитува локалните или глобалните карактеристики на податоците.Достигна конфузија од 400 и 300 повторувања.
За алгоритмот за кластерирање DBSCAN, треба да се одреди минималната големина и метриката на растојанието на податочните точки во кластерот.Минималниот број се одредува под водство на експерти.Ова знаење знае што одговара на сегашната рамка за нумеричко моделирање и резолуција.Минималниот број е 100. Може да се земе предвид повисока минимална вредност (помалку од <135 пред горната граница на зелената боја да стане поширока), но не може да го замени методот на агрегација заснован на различноста BC.Степенот на поврзување (слика 6А) се користи за поставување на параметарот ϵ, што е погодно за поголема покриеност (Слика 6Б).Поврзаноста е дефинирана како композитен број на кластери и е чувствителна на параметарот ϵ.Пониското поврзување укажува на недоволно вклопување, вештачки групирање региони заедно.Високата поврзаност укажува на преоптоварување.Прекумерното поставување е исто така проблематично, бидејќи покажува дека првичните случајни нагаѓања може да доведат до неповторливи резултати.Помеѓу овие две крајности, наглото зголемување (обично наречено „лактот“) го покажува најдоброто ϵ.На Слика 6А, гледате нагло зголемување на површината на платото (жолто,> 200 кластери), проследено со нагло намалување (зелено, 100 кластери), до околу 130, опкружено со многу малку кластери (сино, <60 кластери) ).Во најмалку 100 сини области, или еден кластер доминира низ целиот океан (ε <0,42), или поголемиот дел од океанот не е класифициран и се смета за бучава (ε> 0,99).Жолтата област има многу променлива, нерепродуцирана кластерска дистрибуција.Како што ϵ се намалува, бучавата се зголемува.Нагло растечката зелена површина се нарекува лакт.Ова е оптимален регион.Иако се користи веројатноста t-SNE, различноста BC во покраината сè уште може да се користи за да се одреди веродостојното кластерирање.Користејќи ја сликата 6 (А и Б), поставете го ϵ на 0,39.Колку е поголем минималниот број, толку е помала веројатноста да се достигне ϵ што овозможува сигурна класификација, а зелената површина со вредност поголема од 135 е поголема. Зголемувањето на оваа површина покажува дека лактот ќе биде потешко да се најде или не постоечки.
По поставувањето на параметрите на t-SNE, вкупниот број на пронајдени кластери ќе се користи како мерка за поврзаноста (A) и процентот на податоци доделени на кластерот (B).Црвената точка ја покажува најдобрата комбинација на покриеност и поврзување.Минималниот број е поставен според минималниот број поврзан со екологијата.
За дополнителни материјали за овој напис, видете http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Ова е напис со отворен пристап дистрибуиран според условите на лиценцата за наведување на извор на Криејтив комонс.Статијата дозволува неограничена употреба, дистрибуција и репродукција на кој било медиум под услов оригиналното дело да биде правилно цитирано.
Забелешка: Ние само бараме од вас да ја наведете вашата е-адреса за лицето што го препорачувате на страницата да знае дека сакате да ја види е-поштата и дека не е спам.Нема да фаќаме никакви адреси на е-пошта.
Ова прашање се користи за да се тестира дали сте посетител и да се спречи автоматско поднесување спам.
Глобалното Министерство за морска екологија е решено да решава сложени проблеми и користи ненадгледувана ML за да ги истражува структурите на заедницата.
Глобалното Министерство за морска екологија е решено да решава сложени проблеми и користи ненадгледувана ML за да ги истражува структурите на заедницата.
Време на објавување: Јан-12-2021 година