Clarifying ecological complexity: unsupervised learning determines the global marine ecological province

Um método de aprendizagem não supervisionado é proposto para determinar províncias ecológicas marinhas globais (eco-províncias) com base na estrutura da comunidade planctônica e nos dados de fluxo de nutrientes.O método de província ecológica integrada sistemática (SAGE) pode identificar províncias ecológicas em modelos de ecossistemas altamente não lineares.Para se adaptar à covariância não gaussiana dos dados, o SAGE usa incorporação aleatória de vizinhos (t-SNE) para reduzir a dimensionalidade.Com a ajuda da aplicação de ruído baseada no algoritmo de agrupamento espacial baseado em densidade (DBSCAN), mais de cem províncias ecológicas podem ser identificadas.Usando o mapa de conectividade com diferenças ecológicas como medida de distância, uma província ecológica agregada robusta (AEP) é objetivamente definida através de províncias ecológicas aninhadas.Utilizando AEPs, foi explorado o controle da taxa de fornecimento de nutrientes na estrutura da comunidade.A Eco-província e a AEP são únicas e podem ajudar na interpretação do modelo.Podem facilitar comparações entre modelos e melhorar a compreensão e monitorização dos ecossistemas marinhos.
As províncias são regiões onde a biogeografia complexa do mar ou da terra está organizada em áreas coerentes e significativas (1).Estas províncias são muito importantes para comparar e contrastar localizações, caracterizar observações, monitorização e protecção.As interações complexas e não lineares que produzem essas províncias tornam os métodos de aprendizado de máquina não supervisionado (ML) muito adequados para determinar províncias objetivamente, porque a covariância nos dados é complexa e não gaussiana.Aqui, é proposto um método de ML, que identifica sistematicamente províncias ecológicas marinhas únicas (ecoprovíncias) a partir do modelo físico/ecossistêmico global tridimensional (3D) de Darwin (2).O termo “único” é utilizado para indicar que a área identificada não se sobrepõe suficientemente a outras áreas.Este método é denominado método de Província Ecológica Integrada de Sistemas (SAGE).Para realizar uma classificação útil, um método algorítmico precisa permitir (i) classificação global e (ii) análise multiescala que possa ser aninhada/agregada no espaço e no tempo (3).Nesta pesquisa, o método SAGE foi proposto pela primeira vez e as províncias ecológicas identificadas foram discutidas.As eco-províncias podem promover a compreensão dos factores que controlam a estrutura da comunidade, fornecer informações úteis para estratégias de monitorização e ajudar a acompanhar as mudanças no ecossistema.
As províncias terrestres são geralmente classificadas de acordo com as semelhanças de clima (precipitação e temperatura), solo, vegetação e fauna, e são utilizadas para gestão auxiliar, investigação sobre biodiversidade e controlo de doenças (1, 4).As províncias marinhas são mais difíceis de definir.A maioria dos organismos é microscópica, com limites fluidos.Longhurst et al.(5) Forneceu uma das primeiras classificações globais do Ministério da Oceanografia com base nas condições ambientais.A definição destas províncias “Longhurst” inclui variáveis como taxa de mistura, estratificação e irradiância, bem como a vasta experiência de Longhurst como oceanógrafo marinho, que possui outras condições importantes para os ecossistemas marinhos.Longhurst tem sido amplamente utilizado, por exemplo, para avaliar a produção primária e os fluxos de carbono, ajudar a pesca e planear actividades de observação in situ (5-9).Para definir as províncias de forma mais objectiva, têm sido utilizados métodos como a lógica difusa e agrupamentos/estatísticas regionais não supervisionados (9-14).O objectivo de tais métodos é identificar estruturas significativas que possam identificar províncias nos dados observacionais disponíveis.Por exemplo, províncias marinhas dinâmicas (12) usam mapas auto-organizados para reduzir o ruído e usam agrupamento hierárquico (baseado em árvore) para determinar produtos de cores marinhas derivados de satélites regionais [clorofila a (Chl-a), altura da linha de fluorescência normalizada e matéria orgânica dissolvida colorida] e campo físico (temperatura e salinidade da superfície do mar, topografia dinâmica absoluta e gelo marinho).
A estrutura da comunidade do plâncton é preocupante porque a sua ecologia tem uma grande influência nos níveis mais elevados de nutrientes, na absorção de carbono e no clima.No entanto, ainda é um objectivo desafiador e elusivo determinar uma província ecológica global baseada na estrutura da comunidade planctónica.Os satélites coloridos marinhos podem potencialmente fornecer informações sobre a classificação grosseira do fitoplâncton ou sugerir as vantagens dos grupos funcionais (15), mas atualmente não são capazes de fornecer informações detalhadas sobre a estrutura da comunidade.Pesquisas recentes [por exemplo, Tara Ocean (16)] estão a fornecer medições sem precedentes da estrutura comunitária;atualmente, existem apenas observações in situ esparsas em escala global (17).Estudos anteriores determinaram em grande parte a “Província Biogeoquímica” (12, 14, 18) com base na determinação de semelhanças bioquímicas (como produção primária, Chl e luz disponível).Aqui, o modelo numérico é usado para produzir [Darwin(2)], e a província ecológica é determinada de acordo com a estrutura da comunidade e o fluxo de nutrientes.O modelo numérico utilizado neste estudo tem cobertura global e pode ser comparado com dados de campo existentes (17) e campos de sensoriamento remoto (Nota S1).Os dados do modelo numérico utilizados neste estudo têm a vantagem da cobertura global.O ecossistema modelo consiste em 35 espécies de fitoplâncton e 16 espécies de zooplâncton (consulte materiais e métodos).Os tipos de plâncton modelo interagem de forma não linear com estruturas de covariância não gaussianas, portanto métodos simples de diagnóstico não são adequados para identificar padrões únicos e consistentes em estruturas comunitárias emergentes.O método SAGE apresentado aqui fornece uma nova maneira de verificar a saída de modelos complexos de Darwin.
Os poderosos recursos transformadores da tecnologia de ciência de dados/ML podem permitir que soluções de modelos extremamente complexos revelem estruturas complexas, mas robustas, na covariância de dados.Um método robusto é definido como aquele que pode reproduzir fielmente os resultados dentro de uma determinada faixa de erro.Mesmo em sistemas simples, determinar padrões e sinais robustos pode ser um desafio.Até que a lógica que leva ao padrão observado seja determinada, a complexidade emergente pode parecer complicada/difícil de resolver.O processo chave de definição da composição do ecossistema é de natureza não linear.A existência de interações não lineares pode confundir uma classificação robusta, por isso é necessário evitar métodos que façam suposições fortes sobre a distribuição estatística básica da covariância dos dados.Dados de alta dimensão e não lineares são comuns em oceanografia e podem ter uma estrutura de covariância com topologia complexa e não gaussiana.Embora dados com estrutura de covariância não gaussiana possam dificultar uma classificação robusta, o método SAGE é novo porque foi projetado para identificar clusters com topologias arbitrárias.
O objetivo do método SAGE é identificar objetivamente padrões emergentes que possam ajudar a aprofundar a compreensão ecológica.Seguindo um fluxo de trabalho baseado em cluster semelhante a (19), as variáveis ecológicas e de fluxo de nutrientes são usadas para determinar o único cluster nos dados, denominado província ecológica.O método SAGE proposto neste estudo (Figura 1) primeiro reduz a dimensionalidade de 55 para 11 dimensões, somando os grupos funcionais do plâncton definidos a priori (ver Materiais e Métodos).Usando o método de incorporação de vizinhos aleatórios (t-SNE), o tamanho é ainda mais reduzido projetando a probabilidade no espaço 3D.O agrupamento não supervisionado pode identificar áreas ecologicamente próximas [agrupamento espacial baseado em densidade (DBSCAN) para aplicações baseadas em ruído].Tanto o t-SNE quanto o DBSCAN são aplicáveis aos dados inerentes do modelo numérico não linear do ecossistema.Em seguida, reprojete a província ecológica resultante na terra.Foram identificadas mais de cem províncias ecológicas únicas, adequadas para investigação regional.A fim de considerar o modelo de ecossistema globalmente consistente, o método SAGE é utilizado para agregar as províncias ecológicas em províncias ecológicas agregadas (AEP) para melhorar a eficácia das províncias ecológicas.O nível de agregação (chamado “complexidade”) pode ser ajustado ao nível de detalhe necessário.Determine a complexidade mínima de um AEP robusto.O foco da seleção é o método SAGE e a exploração dos casos de AEP de menor complexidade para determinar o controle da estrutura comunitária de emergência.Os padrões podem então ser analisados para fornecer insights ecológicos.O método aqui apresentado também pode ser utilizado para comparação de modelos de forma mais extensiva, por exemplo, avaliando as localizações de províncias ecológicas semelhantes encontradas em diferentes modelos para destacar diferenças e semelhanças, de modo a comparar modelos.
(A) Diagrama esquemático do fluxo de trabalho para determinação da província ecológica;usando a soma no grupo funcional para reduzir os dados originais de 55 dimensões para um resultado de modelo de 11 dimensões, incluindo a biomassa de sete plânctons funcionais/nutrientes e quatro taxas de fornecimento de nutrientes.Valor insignificante e área de cobertura de gelo durável.Os dados foram padronizados e padronizados.Forneça dados de 11 dimensões ao algoritmo t-SNE para destacar combinações de recursos estatisticamente semelhantes.DBSCAN selecionará cuidadosamente o cluster para definir o valor do parâmetro.Finalmente, projete os dados de volta para a projeção de latitude/longitude.Observe que este processo é repetido 10 vezes porque uma ligeira aleatoriedade pode ser gerada pela aplicação do t-SNE.(B) explica como obter o AEP repetindo o fluxo de trabalho em (A) 10 vezes.Para cada uma dessas 10 implementações, a matriz de dissimilaridade interprovincial de Bray-Curtis (BC) foi determinada com base na biomassa de 51 tipos de fitoplâncton.Determine a diferença BC entre as províncias, desde a complexidade 1 AEP até a complexidade total 115. O benchmark BC é definido pela província de Longhurst.
O método SAGE utiliza o resultado do modelo numérico físico/ecossistêmico 3D global para definir a província ecológica [Darwin (2);ver Materiais e Métodos e Nota S1].Os componentes do ecossistema são compostos por 35 espécies de fitoplâncton e 16 espécies de zooplâncton, com sete grupos funcionais predefinidos: procariontes e eucariotos adaptados a ambientes de baixo teor de nutrientes, coccídios com revestimento de carbonato de cálcio e forte fixação de nitrogênio. nutrientes importantes), com cobertura siliciosa, pode fazer outra fotossíntese de plâncton e pastar flagelados de nutrientes mistos e pastores de zooplâncton.A extensão de tamanho é de diâmetro esférico equivalente de 0,6 a 2500 μm.O modelo de distribuição do tamanho do fitoplâncton e do agrupamento funcional captura as características gerais observadas nas observações de satélite e in situ (ver Figuras S1 a S3).A semelhança entre o modelo numérico e o oceano observado indica que as províncias definidas pelo modelo podem ser aplicáveis ao oceano in situ.Observe que este modelo captura apenas certa diversidade de fitoplâncton e apenas certas faixas de forçamento físico e químico do oceano in situ.O método SAGE pode permitir que as pessoas compreendam melhor o mecanismo de controle altamente regional da estrutura comunitária modelo.
Ao incluir apenas a soma da biomassa superficial (com um tempo médio de 20 anos) em cada grupo funcional do plâncton, a dimensionalidade dos dados pode ser reduzida.Depois de estudos anteriores terem demonstrado o seu papel fundamental na definição da estrutura da comunidade, também incluíram termos de fontes superficiais para fluxos de nutrientes (fornecimento de azoto, ferro, fosfato e ácido silícico) [por exemplo, (20, 21)] .A soma dos grupos funcionais reduz o problema de 55 (51 fluxos de plâncton e 4 fluxos de nutrientes) para 11 dimensões.Neste estudo inicial, devido às restrições computacionais impostas pelo algoritmo, a variabilidade de profundidade e tempo não foram consideradas.
O método SAGE é capaz de identificar relações importantes entre processos não lineares e características-chave de interações entre biomassa de grupos funcionais e fluxo de nutrientes.O uso de dados de 11 dimensões baseados em métodos euclidianos de ensino à distância (como K-means) não pode obter províncias confiáveis e reprodutíveis (19, 22).Isto ocorre porque nenhuma forma gaussiana é encontrada na distribuição básica da covariância dos elementos-chave que definem a província ecológica.As médias K das células de Voronoi (linhas retas) não podem reter a distribuição básica não gaussiana.
A biomassa de sete grupos funcionais do plâncton e quatro fluxos de nutrientes formam um vetor x de 11 dimensões.Portanto, x é um campo vetorial na grade do modelo, onde cada elemento xi representa um vetor de 11 dimensões definido na grade horizontal do modelo.Cada índice i identifica exclusivamente um ponto da grade na esfera, onde (lon, lat) = (ϕi, θi).Se a biomassa da unidade de grade do modelo for inferior a 1,2×10-3mg Chl/m3 ou a taxa de cobertura de gelo exceder 70%, o registro dos dados de biomassa será usado e descartado.Os dados são normalizados e padronizados, portanto, todos os dados estão no intervalo de [0 a 1], a média é removida e dimensionada para a variação unitária.Isto é feito para que as características (biomassa e fluxo de nutrientes) não sejam limitadas pelo contraste na faixa de valores possíveis.O agrupamento deve capturar a relação de mudança a partir da distância de probabilidade chave entre os recursos, em vez da distância geográfica.Ao quantificar essas distâncias, surgem características importantes, enquanto detalhes desnecessários são descartados.Do ponto de vista ecológico, isso é necessário porque alguns tipos de fitoplâncton com pouca biomassa podem ter maiores efeitos biogeoquímicos, como a fixação de nitrogênio por bactérias diazotróficas.Ao padronizar e normalizar os dados, esses tipos de covariáveis serão destacados.
Ao enfatizar a proximidade de características no espaço de alta dimensão na representação de baixa dimensão, o algoritmo t-SNE é usado para tornar mais claras regiões semelhantes existentes.Trabalhos anteriores destinados à construção de redes neurais profundas para aplicações de sensoriamento remoto utilizaram o t-SNE, que provou sua habilidade na separação de características-chave (23).Esta é uma etapa necessária para identificar agrupamentos robustos nos dados de recursos, evitando soluções não convergentes (nota S2).Usando kernels gaussianos, o t-SNE preserva as propriedades estatísticas dos dados mapeando cada objeto de alta dimensão para um ponto no espaço de fase 3D, garantindo assim que a probabilidade de objetos semelhantes nas direções alta e baixa seja alta em uma direção alta e baixa. espaço dimensional (24).Dado um conjunto de N objetos de alta dimensão x1,…,xN, o algoritmo t-SNE reduz minimizando a divergência de Kullback-Leibler (KL) (25).A divergência KL é uma medida de quão diferente é uma distribuição de probabilidade de uma segunda distribuição de probabilidade de referência e pode avaliar efetivamente a possibilidade de correlação entre representações de baixa dimensão de recursos de alta dimensão.Se xi é o i-ésimo objeto no espaço N-dimensional, xj é o j-ésimo objeto no espaço N-dimensional, yi é o i-ésimo objeto no espaço de baixa dimensão e yj é o j-ésimo objeto no espaço de baixa dimensão. -espaço dimensional, então t -SNE define a probabilidade de similaridade ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), e para o conjunto de redução de dimensionalidade q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
A Figura 2A ilustra o efeito da redução dos vetores de fluxo de biomassa e nutrientes da combinação de 11 dimensões para 3D.A motivação da aplicação do t-SNE pode ser comparada com a motivação da análise de componentes principais (PCA), que utiliza o atributo variância para enfatizar a área/atributo dos dados, reduzindo assim a dimensionalidade.O método t-SNE foi considerado superior ao PCA no fornecimento de resultados confiáveis e reprodutíveis para o Eco-Ministério (ver Nota S2).Isso pode ocorrer porque a suposição de ortogonalidade do PCA não é adequada para identificar interações críticas entre recursos interativos altamente não lineares, porque o PCA se concentra em estruturas de covariância linear (26).Usando dados de sensoriamento remoto, Lunga et al.(27) ilustra como usar o método SNE para destacar características espectrais complexas e não lineares que se desviam da distribuição gaussiana.
(A) Uma taxa de fornecimento de nutrientes modelada, biomassa do grupo funcional fitoplâncton e zooplâncton desenhada pelo algoritmo t-SNE e colorida por província usando DBSCAN.Cada ponto representa um ponto no espaço de alta dimensão, conforme mostrado na Figura 6B, a maioria dos pontos são capturados.Os eixos referem-se aos tamanhos 1, 2 e 3 do “t-SNE”. (B) A projeção geográfica da província encontrada pelo DBSCAN na grade de latitude-longitude da origem.A cor deve ser considerada como qualquer cor, mas deve corresponder a (A).
Os pontos no gráfico de dispersão t-SNE na Figura 2A estão associados respectivamente à latitude e longitude.Se os dois pontos da Figura 2A estão próximos um do outro, é porque os seus fluxos de biomassa e nutrientes são semelhantes, e não por proximidade geográfica.As cores na Figura 2A são clusters descobertos usando o método DBSCAN (28).Ao procurar observações densas, o algoritmo DBSCAN utiliza a distância na representação 3D entre os pontos (ϵ = 0,39; para informações sobre esta escolha, consulte Materiais e Métodos), e o número de pontos semelhantes é necessário para definir o cluster (aqui 100 pontos, veja acima).O método DBSCAN não faz suposições sobre a forma ou o número de clusters nos dados, conforme mostrado abaixo:
3) Para todos os pontos identificados como dentro da distância, repita a etapa 2 iterativamente para determinar o limite do cluster.Se o número de pontos for maior que o valor mínimo definido, é designado como cluster.
Os dados que não atendem ao membro mínimo do cluster e à métrica de distância ϵ são considerados “ruído” e não recebem uma cor.DBSCAN é um algoritmo rápido e escalável com desempenho O(n2) no pior caso.Para a análise atual, não é realmente aleatório.O número mínimo de pontos é determinado por avaliação de especialistas.Depois de ajustar a distância, o resultado não é suficientemente estável na faixa de ≈±10.Esta distância é definida utilizando a conectividade (Figura 6A) e a percentagem de cobertura oceânica (Figura 6B).A conectividade é definida como o número composto de clusters e é sensível ao parâmetro ϵ.A conectividade mais baixa indica ajuste insuficiente, agrupando artificialmente as regiões.Alta conectividade indica overfitting.É concebível utilizar um mínimo mais elevado, mas se o mínimo exceder ca, é impossível alcançar uma solução fiável.135 (Para mais detalhes, veja Materiais e Métodos).
Os 115 aglomerados identificados na Figura 2A são projetados de volta à Terra na Figura 2B.Cada cor corresponde a uma combinação coerente de fatores biogeoquímicos e ecológicos identificados pelo DBSCAN.Uma vez determinados os clusters, a associação de cada ponto da Figura 2A com uma latitude e longitude específicas é usada para projetar os clusters de volta à área geográfica.A Figura 2B ilustra isso com as mesmas cores de cluster da Figura 2A.Cores semelhantes não devem ser interpretadas como similaridade ecológica, pois são atribuídas pela ordem em que os clusters são descobertos pelo algoritmo.
A área na Figura 2B pode ser qualitativamente semelhante a uma área estabelecida na física e/ou biogeoquímica do oceano.Por exemplo, os aglomerados no Oceano Antártico são zona-simétricos, com o aparecimento de vórtices oligotróficos, e a transição acentuada indica a influência dos ventos alísios.Por exemplo, no Pacífico equatorial, observam-se diferentes regiões relacionadas com a ascensão.
Para compreender o ambiente ecológico da Eco-Província, uma variação do índice de diferença de Bray-Curtis (BC) (29) foi utilizada para avaliar a ecologia no cluster.O indicador BC é um dado estatístico usado para quantificar a diferença na estrutura da comunidade entre dois locais diferentes.A medição BC é aplicável à biomassa de 51 espécies de fitoplâncton e zooplâncton BCninj = 1-2CninjSni + Snj
BCninj refere-se à semelhança entre a combinação ni e a combinação nj, onde Cninj é o valor mínimo de um único tipo de biomassa que existe em ambas as combinações ni e nj, e Sni representa a soma de todas as biomassas que existem em ambas as combinações ni e Snj.A diferença BC é semelhante à medida de distância, mas opera em espaço não euclidiano, o que provavelmente será mais adequado para dados ecológicos e sua interpretação.
Para cada cluster identificado na Figura 2B, a semelhança entre BC intra-provincial e inter-provincial pode ser avaliada.A diferença BC dentro de uma província refere-se à diferença entre o valor médio da província e cada ponto da província.A diferença entre as províncias do BC refere-se à semelhança entre uma província e outras províncias.A Figura 3A mostra uma matriz BC simétrica (0, preto: completamente correspondente; 1, branco: completamente diferente).Cada linha no gráfico mostra um padrão nos dados.A Figura 3B mostra a significância geográfica dos resultados do BC na Figura 3A para cada província.Para uma província numa área de baixa nutrição e poucos nutrientes, a Figura 3B mostra que a simetria de grandes áreas em torno do equador e do Oceano Índico é basicamente semelhante, mas as latitudes mais altas e as áreas de ressurgência são significativamente diferentes.
(A) O grau de diferença BC avaliado para cada província com base na média global da superfície global de 20 anos de 51 plâncton.Observe a simetria esperada dos valores.(B) A projeção espacial de uma coluna (ou linha).Para uma província num círculo distrófico, avaliou-se a distribuição global da medida de similaridade BC e avaliou-se a média global de 20 anos.Preto (BC = 0) significa a mesma área e branco (BC = 1) significa sem semelhança.
A Figura 4A ilustra a diferença em BC dentro de cada província na Figura 2B.Determinado usando a combinação média da área média em um cluster e determinando a dissimilaridade entre o BC e a média de cada ponto da grade na província, mostra que o método SAGE pode separar bem 51 espécies com base na similaridade ecológica. dados do modelo.A dissimilaridade média geral do cluster BC de todos os 51 tipos é 0,102±0,0049.
(A, B e D) A diferença BC dentro da província é avaliada como a diferença média de BC entre cada comunidade de pontos da grelha e a província média, e a complexidade não é reduzida.(2) A diferença média global intra-provincial de BC é de 0,227±0,117.Este é o referencial da classificação baseada na motivação ecológica proposta por este trabalho [linha verde em (C)].(C) Diferença média intra-provincial de BC: A linha preta representa a diferença intra-provincial de BC com complexidade crescente.2σ vem de 10 repetições do processo de identificação da eco-província.Para a complexidade total das províncias descobertas pelo DBSCAN, (A) mostra que a dissimilaridade BC na província é 0,099, e a classificação de complexidade proposta por (C) é 12, resultando numa dissimilaridade BC de 0,200 na província.como mostra a imagem.(D).
Na Figura 4B, a biomassa de 51 tipos de plâncton é usada para representar a diferença BC equivalente na província de Longhurst.A média geral de cada província é de 0,227, e o desvio padrão dos pontos da grade com referência à diferença na província de BC é de 0,046.Isto é maior que o cluster identificado na Figura 1B.Em vez disso, usando a soma dos sete grupos funcionais, a dissimilaridade média intra-temporada do BC em Longhurst aumentou para 0,232.
O mapa global da eco-província fornece detalhes intrincados de interações ecológicas únicas e melhorias foram feitas no uso de toda a estrutura do ecossistema da província de Longhurst.Espera-se que o Ministério da Ecologia forneça informações sobre o processo de controle do ecossistema do modelo numérico, e essas informações ajudarão na exploração do trabalho de campo.Para efeitos desta investigação, não é possível apresentar na íntegra mais de cem províncias.A próxima seção apresenta o método SAGE que resume as províncias.
Um dos objectivos da província é promover a compreensão da localização e gestão da província.Para determinar situações de emergência, o método da Figura 1B ilustra a nidificação de províncias ecologicamente semelhantes.As eco-províncias são agrupadas com base na semelhança ecológica, e tal agrupamento de províncias é denominado AEP.Definir uma “complexidade” ajustável com base no número total de províncias a serem consideradas.O termo “complexidade” é utilizado porque permite ajustar o nível dos atributos de emergência.Para definir agregações significativas, a diferença média intra-provincial de BC de 0,227 em relação a Longhurst é utilizada como referência.Abaixo deste valor de referência, as províncias combinadas já não são consideradas úteis.
Conforme mostrado na Figura 3B, as províncias ecológicas globais são coerentes.Utilizando diferenças interprovinciais de BC, percebe-se que algumas configurações são muito “comuns”.Inspirados nos métodos da genética e da teoria dos grafos, os “gráficos conectados” são usados para classificar mais de 100 províncias com base nas províncias mais semelhantes a elas.A métrica de “conectividade” aqui é determinada usando a dissimilaridade interprovincial de BC (30).O número de províncias com maior espaço para classificação de >100 províncias pode ser aqui referido como complexidade.AEP é um produto que categoriza mais de 100 províncias como as províncias ecológicas mais dominantes/mais próximas.Cada província ecológica é atribuída à província ecológica dominante/altamente conectada que é mais semelhante a ela.Esta agregação determinada pela diferença BC permite uma abordagem aninhada da ecologia global.
A complexidade selecionada pode ser qualquer valor de 1 até a complexidade completa da FIG.2A.Em menor complexidade, o AEP pode degenerar devido à etapa de redução da dimensionalidade probabilística (t-SNE).A degeneração significa que as províncias ecológicas podem ser atribuídas a diferentes AEPs entre as iterações, alterando assim a área geográfica coberta.A Figura 4C ilustra a propagação das diferenças de BC dentro das províncias em AEPs de complexidade crescente em 10 implementações (ilustração na Figura 1B).Na Figura 4C, 2σ (área azul) é uma medida de degradação em 10 implementações, e a linha verde representa o benchmark Longhurst.Os fatos provaram que a complexidade de 12 pode manter a diferença de BC na província abaixo do benchmark Longhurst em todas as implementações e manter uma degradação 2σ relativamente pequena.Em resumo, a complexidade mínima recomendada é de 12 AEPs, e a diferença média intra-provincial de BC avaliada usando 51 tipos de plâncton é de 0,198±0,013, conforme mostrado na Figura 4D.Usando a soma de sete grupos funcionais de plâncton, a diferença média de BC dentro da província é 2σ em vez de 0,198±0,004.A comparação entre as diferenças de BC calculadas com a biomassa total dos sete grupos funcionais ou a biomassa de todos os 51 tipos de plâncton mostra que embora o método SAGE seja aplicável à situação de 51 dimensões, é para a biomassa total dos sete grupos funcionais Para treinamento.
Dependendo do objetivo de qualquer pesquisa, podem ser considerados diferentes níveis de complexidade.Os estudos regionais podem exigir complexidade total (ou seja, todas as 115 províncias).A título de exemplo e para maior clareza, considere a complexidade mínima recomendada de 12.
Como exemplo da utilidade do método SAGE, 12 AEPs com complexidade mínima de 12 são aqui utilizados para explorar o controle da estrutura comunitária de emergência.A Figura 5 ilustra os insights ecológicos agrupados por AEP (de A a L): Na estequiometria de Redfield, a extensão geográfica (Figura 5C), a composição da biomassa do grupo funcional (Figura 5A) e o fornecimento de nutrientes (Figura 5B) são realizados por N Zoomed.A proporção (N:Si:P:Fe, 1:1:16:16×103) é mostrada.Para o último painel, P multiplicado por 16 e Fe multiplicado por 16×103, portanto o gráfico de barras é equivalente às necessidades nutricionais do fitoplâncton.
As províncias são classificadas em 12 AEPs A a L. (A) Biomassa (mgC/m3) de ecossistemas em 12 províncias.(B) A taxa de fluxo de nutrientes de nitrogênio inorgânico dissolvido (N), ferro (Fe), fosfato (P) e ácido silícico (Si) (mmol/m3 por ano).Fe e P são multiplicados por 16 e 16×103, respectivamente, para que as tiras sejam padronizadas de acordo com os requisitos estequiométricos do fitoplâncton.(C) Observe a diferença entre regiões polares, ciclones subtropicais e principais regiões sazonais/ascendentes.As estações de monitoramento estão marcadas da seguinte forma: 1, ASSENTOS;2, ALOHA;3, estação P;e 4, MORRECIMENTOS.
O AEP identificado é único.Existe alguma simetria em torno do equador nos oceanos Atlântico e Pacífico, e existe uma área semelhante, mas ampliada, no Oceano Índico.Alguns AEPs abrangem o lado ocidental do continente associado à subida.A Corrente Circumpolar do Pólo Sul é considerada uma grande feição zonal.O ciclone subtropical é uma série complexa de AEP oligotróficos.Nestas províncias, o padrão familiar de diferenças de biomassa entre vórtices oligotróficos dominados por plâncton e regiões polares ricas em diatomáceas é óbvio.
AEPs com biomassa fitoplanctônica total muito semelhante podem ter estruturas comunitárias muito diferentes e cobrir diferentes áreas geográficas, como D, H e K, que possuem biomassa fitoplanctônica total semelhante.AEP H existe principalmente no Oceano Índico equatorial e há mais bactérias diazotróficas.AEP D é encontrada em diversas bacias, mas é particularmente proeminente no Pacífico em torno de áreas de alto rendimento em torno da ressurgência equatorial.A forma desta província do Pacífico lembra um trem de ondas planetárias.Existem poucas diazobactérias no AEP D e mais cones.Em comparação com as outras duas províncias, o AEP K só é encontrado nas terras altas do Oceano Ártico e há mais diatomáceas e menos plânctons.Vale ressaltar que a quantidade de plâncton nessas três regiões também é muito diferente.Entre eles, a abundância de plâncton da AEP K é relativamente baixa, enquanto a da AEP D e H é relativamente alta.Portanto, apesar da sua biomassa (e, portanto, semelhante à Chl-a), estas províncias são bastante diferentes: os testes de província baseados em Chl podem não captar estas diferenças.
É também óbvio que alguns AEPs com biomassas muito diferentes podem ser semelhantes em termos de estrutura da comunidade fitoplâncton.Por exemplo, isso é visível no AEP D e E. Eles estão próximos um do outro, e no Oceano Pacífico, o AEP E está próximo do altamente produtivo AEPJ.Da mesma forma, não existe uma ligação clara entre a biomassa do fitoplâncton e a abundância do zooplâncton.
AEP pode ser entendida em termos dos nutrientes que lhes são fornecidos (Figura 5B).As diatomáceas só existem onde há amplo suprimento de ácido silícico.Geralmente, quanto maior for o fornecimento de ácido silícico, maior será a biomassa das diatomáceas.As diatomáceas podem ser vistas em AEP A, J, K e L. A proporção da biomassa de diatomáceas em relação a outros fitoplânctons é determinada pelo N, P e Fe fornecidos em relação à procura de diatomáceas.Por exemplo, AEP L é dominado por diatomáceas.Comparado com outros nutrientes, o Si tem a maior oferta.Em contraste, apesar da maior produtividade, AEP J tem menos diatomáceas e menos fornecimento de silício (todos e em relação a outros nutrientes).
As bactérias diazônicas têm a capacidade de fixar nitrogênio, mas crescem lentamente (31).Eles coexistem com outros fitoplânctons, onde o ferro e o fósforo são excessivos em relação à demanda por nutrientes não diazônicos (20, 21).Vale ressaltar que a biomassa diazotrófica é relativamente alta, e a oferta de Fe e P é relativamente grande em relação à oferta de N. Dessa forma, embora a biomassa total na AEP J seja maior, a biomassa de diazônio na AEP H é maior do que em J. Observe que AEP J e H são geograficamente muito diferentes e H está localizado no Oceano Índico equatorial.
Se a estrutura única do ecossistema não for dividida em províncias, os conhecimentos obtidos a partir dos modelos de menor complexidade dos 12 AEP não serão tão claros.O AEP gerado pelo SAGE facilita a comparação coerente e simultânea de informações complexas e de alta dimensão de modelos ecossistêmicos.AEP enfatiza efetivamente por que o Chl não é um método bom e alternativo para determinar a estrutura da comunidade ou a abundância do zooplâncton em níveis mais elevados de nutrientes.Uma análise detalhada dos tópicos de pesquisa em andamento está além do escopo deste artigo.O método SAGE fornece uma maneira de explorar outros mecanismos no modelo que é mais fácil de manusear do que a visualização ponto a ponto.
O método SAGE é proposto para ajudar a esclarecer dados ecológicos extremamente complexos de modelos numéricos físicos/biogeoquímicos/ecossistêmicos globais.A província ecológica é determinada pela biomassa total de grupos funcionais de plâncton cruzado, pela aplicação do algoritmo de redução de dimensionalidade de probabilidade t-SNE e pelo agrupamento usando o método ML não supervisionado DBSCAN.A teoria da diferença/gráfico interprovincial BC para o método de aninhamento é aplicada para derivar um AEP robusto que pode ser usado para interpretação global.Em termos de construção, a Eco-Província e a AEP são únicas.O aninhamento de AEP pode ser ajustado entre a complexidade total da província ecológica original e o limite mínimo recomendado de 12 AEPs.O aninhamento e a determinação da complexidade mínima do AEP são considerados passos fundamentais, porque a probabilidade t-SNE degenera AEPs de complexidade <12.O método SAGE é global e sua complexidade varia de >100 AEPs a 12. Para simplificar, o foco atual está na complexidade de 12 AEPs globais.Pesquisas futuras, especialmente estudos regionais, podem considerar útil um subconjunto espacial menor das eco-províncias globais, e podem ser agregadas em uma área menor para aproveitar as mesmas percepções ecológicas discutidas aqui.Fornece sugestões sobre como estas províncias ecológicas e os conhecimentos obtidos a partir delas podem ser usados para uma maior compreensão ecológica, facilitar a comparação de modelos e potencialmente melhorar a monitorização dos ecossistemas marinhos.
A província ecológica e AEP identificadas pelo método SAGE baseiam-se nos dados do modelo numérico.Por definição, o modelo numérico é uma estrutura simplificada, tentando capturar a essência do sistema alvo, e diferentes modelos terão diferentes distribuições de plâncton.O modelo numérico utilizado neste estudo não consegue capturar completamente alguns dos padrões observados (por exemplo, nas estimativas de Chl para a região equatorial e o Oceano Antártico).Apenas uma pequena parte da diversidade do oceano real é capturada, e as meso e submesoescalas não podem ser resolvidas, o que pode afectar o fluxo de nutrientes e a estrutura da comunidade em menor escala.Apesar destas deficiências, verifica-se que o AEP é muito útil para ajudar a compreender modelos complexos.Ao avaliar onde se encontram províncias ecológicas semelhantes, o AEP fornece uma potencial ferramenta de comparação de modelos numéricos.O modelo numérico atual captura o padrão geral da concentração de Chl-a do fitoplâncton por sensoriamento remoto e a distribuição do tamanho e do grupo funcional do plâncton (Nota S1 e Figura S1) (2, 32).
Conforme mostrado pela linha de contorno de 0,1 mgChl-a/m-3, AEP é dividido em área oligotrófica e área mesotrófica (Figura S1B): AEP B, C, D, E, F e G são áreas oligotróficas, e as demais áreas são localizado em Chl-a superior.AEP mostra alguma correspondência com a província de Longhurst (Figura S3A), por exemplo, o Oceano Antártico e o Pacífico equatorial.Em algumas regiões, o AEP cobre várias regiões de Longhurst e vice-versa.Dado que a intenção de delimitar as províncias desta área e de Longhurst é diferente, espera-se que haja diferenças.Vários AEPs numa província de Longhurst indicam que certas áreas com biogeoquímica semelhante podem ter estruturas ecossistémicas muito diferentes.AEP exibe uma certa correspondência com estados físicos, conforme revelado usando aprendizagem não supervisionada (19), como em estados de alta ressurgência (por exemplo, o Oceano Antártico e o Pacífico equatorial; Figura S3, C e D).Estas correspondências indicam que a estrutura da comunidade do plâncton é fortemente influenciada pela dinâmica oceânica.Em áreas como o Atlântico Norte, o AEP atravessa províncias físicas.O mecanismo que causa estas diferenças pode incluir processos como o transporte de poeira, que pode levar a programas nutricionais completamente diferentes, mesmo sob condições físicas semelhantes.
O Ministério da Ecologia e a AEP salientaram que a utilização do Chl por si só não pode identificar componentes ecológicos, como a comunidade de ecologia marinha já percebeu.Isto é visto em AEPs com biomassa semelhante, mas com composição ecológica significativamente diferente (como D e E).Em contraste, AEPs como D e K têm biomassa muito diferente, mas composição ecológica semelhante.AEP enfatiza que a relação entre biomassa, composição ecológica e abundância de zooplâncton é complexa.Por exemplo, embora AEP J se destaque em termos de fitoplâncton e biomassa planctônica, os AEP's A e L possuem biomassa planctônica semelhante, mas A possui maior abundância de plâncton.AEP enfatiza que a biomassa do fitoplâncton (ou Chl) não pode ser usada para prever a biomassa do zooplâncton.O zooplâncton é a base da cadeia alimentar da pesca e estimativas mais precisas podem levar a uma melhor gestão dos recursos.Os futuros satélites marinhos coloridos [por exemplo, PACE (plâncton, aerossol, nuvem e ecossistema marinho)] podem estar melhor posicionados para ajudar a estimar a estrutura da comunidade do fitoplâncton.O uso da previsão AEP pode facilitar potencialmente a estimativa do zooplâncton do espaço.Métodos como o SAGE, juntamente com novas tecnologias e cada vez mais dados de campo disponíveis para pesquisas de verdade (como Tara e pesquisas de acompanhamento), podem, em conjunto, dar um passo em direção ao monitoramento da saúde dos ecossistemas por satélite.
O método SAGE fornece uma forma conveniente de avaliar alguns mecanismos que controlam as características da província, tais como biomassa/Chl, produção primária líquida e estrutura da comunidade.Por exemplo, a quantidade relativa de diatomáceas é determinada por um desequilíbrio no fornecimento de Si, N, P e Fe em relação às necessidades estequiométricas do fitoplâncton.Com uma taxa de abastecimento equilibrada, a comunidade é dominada por diatomáceas (L).Quando a taxa de oferta é desequilibrada (ou seja, a oferta de silício é inferior à demanda de nutrientes das diatomáceas), as diatomáceas respondem por apenas uma pequena porção (K).Quando o fornecimento de Fe e P excede o fornecimento de N (por exemplo, E e H), as bactérias diazotróficas crescerão vigorosamente.Através do contexto fornecido pela AEP, a exploração de mecanismos de controlo tornar-se-á mais útil.
A Eco-Província e a AEP são áreas com estruturas comunitárias semelhantes.A série temporal de um determinado local dentro de uma província ecológica ou AEP pode ser considerada um ponto de referência e pode representar a área coberta pela província ecológica ou AEP.Estações de monitoramento no local de longo prazo fornecem essas séries temporais.Os conjuntos de dados in situ de longo prazo continuarão a desempenhar um papel incalculável.Do ponto de vista da monitorização da estrutura da comunidade, o método SAGE pode ser visto como uma forma de ajudar a determinar a localização mais útil de novos locais.Por exemplo, a série temporal da avaliação de habitat oligotrófico de longo prazo (ALOHA) está no AEP B da área oligotrófica (Figura 5C, rótulo 2).Como o ALOHA está próximo do limite de outro AEP, a série temporal pode não ser representativa de toda a área, como sugerido anteriormente (33).No mesmo AEP B, a série temporal SEATS (Southeast Asian Time Series) está localizada no sudoeste de Taiwan (34), mais distante dos limites de outros AEPs (Figura 5C, rótulo 1), e pode ser usada como um local melhor para monitorar AEPB.A série temporal BATS (Bermuda Atlantic Time Series Study) (Figura 5C, rótulo 4) no AEPC está muito próxima da fronteira entre AEP C e F, o que indica que o monitoramento do AEP C usando séries temporais BATS pode ser diretamente problemático.A estação P no AEP J (Figura 5C, rótulo 3) está longe do limite do AEP, por isso é mais representativa.A Eco-Província e a AEP podem ajudar a estabelecer um quadro de monitorização adequado para avaliar as mudanças globais, porque a permissão das províncias para avaliar onde a amostragem no local pode fornecer informações importantes.O método SAGE pode ser desenvolvido para ser aplicado a dados climáticos para avaliar a variabilidade que economiza tempo.
O sucesso do método SAGE é alcançado por meio da aplicação cuidadosa de métodos de ciência de dados/ML e conhecimento específico de domínio.Especificamente, o t-SNE é usado para realizar a redução de dimensionalidade, o que preserva a estrutura de covariância de dados de alta dimensão e facilita a visualização da topologia de covariância.Os dados são organizados na forma de listras e covariâncias (Figura 2A), indicando que medidas puramente baseadas em distância (como médias K) não são apropriadas porque geralmente usam uma distribuição de base gaussiana (circular) (discutida na Nota S2). .O método DBSCAN é adequado para qualquer topologia de covariância.Contanto que você preste atenção à configuração dos parâmetros, uma identificação confiável poderá ser fornecida.O custo computacional do algoritmo t-SNE é alto, o que limita sua aplicação atual a uma quantidade maior de dados, o que significa que é difícil aplicá-lo em campos profundos ou variáveis no tempo.O trabalho sobre a escalabilidade do t-SNE está em andamento.Como a distância KL é fácil de paralelizar, o algoritmo t-SNE tem um bom potencial para expansão no futuro (35).Até agora, outros métodos promissores de redução de dimensionalidade que podem reduzir melhor o tamanho incluem técnicas de aproximação e projeção de variedade unificada (UMAP), mas a avaliação no contexto dos dados oceânicos é necessária.O significado de melhor escalabilidade é, por exemplo, classificar climas globais ou modelos com complexidade diferente numa camada mista.As áreas que não conseguem ser classificadas pelo SAGE em qualquer província podem ser consideradas como os restantes pontos pretos na Figura 2A.Geograficamente, estas áreas situam-se principalmente em áreas altamente sazonais, o que sugere que a captura de províncias ecológicas que mudam ao longo do tempo proporcionará uma melhor cobertura.
Para construir o método SAGE foram utilizadas ideias de sistemas complexos/ciência de dados, utilizando a capacidade de determinar clusters de grupos funcionais (possibilidade de estarem muito próximos em um espaço de 11 dimensões) e determinar províncias.Essas províncias representam volumes específicos em nosso espaço de fase 3D t-SNE.Da mesma forma, a parte de Poincaré pode ser usada para avaliar o “volume” do espaço de estados ocupado pela trajetória para determinar o comportamento “normal” ou “caótico” (36).Para a saída do modelo estático de 11 dimensões, o volume ocupado após os dados serem convertidos em um espaço de fase 3D pode ser explicado de forma semelhante.A relação entre área geográfica e área no espaço de fase 3D não é simples, mas pode ser explicada em termos de similaridade ecológica.Por esta razão, a medida de dissimilaridade BC mais convencional é preferida.
Trabalhos futuros irão reutilizar o método SAGE para dados que mudam sazonalmente para avaliar a variabilidade espacial das províncias identificadas e AEP.O objetivo futuro é usar este método para ajudar a determinar quais províncias podem ser determinadas através de medições de satélite (como Chl-a, refletividade de sensoriamento remoto e temperatura da superfície do mar).Isto permitirá a avaliação de componentes ecológicos por detecção remota e uma monitorização altamente flexível das províncias ecológicas e da sua variabilidade.
O objetivo desta pesquisa é apresentar o método SAGE, que define uma província ecológica através de sua estrutura única de comunidade planctônica.Aqui, serão fornecidas informações mais detalhadas sobre o modelo físico/biogeoquímico/ecossistema e a seleção de parâmetros dos algoritmos t-SNE e DBSCAN.
Os componentes físicos do modelo provêm da estimativa da circulação oceânica e do clima [ECCOv4;(37) a estimativa do estado global descrita por (38).A resolução nominal da estimativa de estado é 1/5.O método dos mínimos quadrados com o método do multiplicador Lagrangiano é usado para obter as condições iniciais e de contorno e os parâmetros do modelo interno ajustados pela observação, gerando assim um modelo de ciclo geral do MIT de execução livre (MITgcm) (39), o modelo Após a otimização, os resultados podem ser rastreado e observado.
A biogeoquímica/ecossistema tem uma descrição mais completa (ou seja, equações e valores de parâmetros) em (2).O modelo captura a circulação de C, N, P, Si e Fe através de lagoas inorgânicas e orgânicas.A versão usada aqui inclui 35 espécies de fitoplâncton: 2 espécies de microprocariontes e 2 espécies de microeucariotos (adequados para ambientes com baixo teor de nutrientes), 5 espécies de Cryptomonas sphaeroides (com revestimento de carbonato de cálcio), 5 espécies de diazônio (pode fixar nitrogênio, então (não é limitado) a disponibilidade de nitrogênio inorgânico dissolvido), 11 diatomáceas (formando uma cobertura siliciosa), 10 flagelados vegetativos mistos (podem fotossintetizar e comer outro plâncton) e 16 zooplâncton (pastam outro plâncton).Estes são chamados de “grupos funcionais biogeoquímicos” porque têm efeitos diferentes na biogeoquímica marinha (40, 41) e são frequentemente utilizados em observação e estudos de modelos.Neste modelo, cada grupo funcional é composto por vários plânctons de diferentes tamanhos, com uma extensão de 0,6 a 2500 μm de diâmetro esférico equivalente.
Os parâmetros que afectam o crescimento, o pastoreio e o afundamento do fitoplâncton estão relacionados com o tamanho, e existem diferenças específicas entre os seis grupos funcionais do fitoplâncton (32).Apesar das diferentes estruturas físicas, os resultados dos 51 componentes planctônicos do modelo foram utilizados em vários estudos recentes (42-44).
De 1992 a 2011, o modelo de acoplamento físico/biogeoquímico/ecossistema funcionou durante 20 anos.A saída do modelo inclui biomassa planctônica, concentração de nutrientes e taxa de fornecimento de nutrientes (DIN, PO4, Si e Fe).Neste estudo, a média de 20 anos desses resultados foi usada como entrada da Província Ecológica.Chl, a distribuição da biomassa planctônica e da concentração de nutrientes e a distribuição dos grupos funcionais são comparadas com observações de satélite e in situ [ver (2, 44), Nota S1 e figura.S1 a S3].
Para o método SAGE, a principal fonte de aleatoriedade vem da etapa t-SNE.A aleatoriedade dificulta a repetibilidade, o que significa que os resultados não são confiáveis.O método SAGE testa rigorosamente a robustez determinando um conjunto de parâmetros de t-SNE e DBSCAN, que podem identificar clusters de forma consistente quando repetidos.A determinação da “perplexidade” do parâmetro t-SNE pode ser entendida como a determinação do grau em que o mapeamento das dimensões altas para as baixas deve respeitar as características locais ou globais dos dados.Atingiu a confusão de 400 e 300 iterações.
Para o algoritmo de agrupamento DBSCAN, o tamanho mínimo e a métrica de distância dos pontos de dados no cluster precisam ser determinados.O número mínimo é determinado sob orientação de especialistas.Este conhecimento sabe o que se adapta à atual estrutura e resolução de modelagem numérica.O número mínimo é 100. Um valor mínimo mais elevado (menos de <135 antes do limite superior do verde se tornar mais largo) pode ser considerado, mas não pode substituir o método de agregação baseado na dissimilaridade BC.O grau de conexão (Figura 6A) é usado para definir o parâmetro ϵ, que conduz a uma maior cobertura (Figura 6B).A conectividade é definida como o número composto de clusters e é sensível ao parâmetro ϵ.A conectividade mais baixa indica ajuste insuficiente, agrupando artificialmente as regiões.Alta conectividade indica overfitting.O overfitting também é problemático porque mostra que suposições aleatórias iniciais podem levar a resultados não reproduzíveis.Entre estes dois extremos, um aumento acentuado (geralmente chamado de “cotovelo”) indica o melhor ϵ.Na Figura 6A, você vê um aumento acentuado na área do planalto (amarelo,> 200 aglomerados), seguido por uma diminuição acentuada (verde, 100 aglomerados), até cerca de 130, cercado por muito poucos aglomerados (azul, <60 aglomerados) ).Em pelo menos 100 áreas azuis, ou um cluster domina todo o oceano (ϵ <0,42), ou a maior parte do oceano não é classificada e é considerada ruído (ϵ> 0,99).A área amarela tem uma distribuição de cluster altamente variável e não reproduzível.À medida que ϵ diminui, o ruído aumenta.A área verde que aumenta acentuadamente é chamada de cotovelo.Esta é uma região ideal.Embora a probabilidade t-SNE seja usada, a dissimilaridade BC dentro da província ainda pode ser usada para determinar um agrupamento confiável.Usando a Figura 6 (A e B), defina ϵ como 0,39.Quanto maior o número mínimo, menor a probabilidade de atingir o ϵ que permite uma classificação confiável, e maior será a área verde com valor superior a 135. O alargamento desta área indica que o cotovelo será mais difícil de encontrar ou não. existente.
Após definir os parâmetros do t-SNE, o número total de clusters encontrados será utilizado como medida de conectividade (A) e o percentual de dados alocados ao cluster (B).O ponto vermelho indica a melhor combinação de cobertura e conectividade.O número mínimo é definido de acordo com o número mínimo relacionado à ecologia.
Para materiais suplementares para este artigo, consulte http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
Este é um artigo de acesso aberto distribuído sob os termos da Licença Creative Commons Attribution.O artigo permite uso, distribuição e reprodução irrestritos em qualquer meio, desde que a obra original seja devidamente citada.
Nota: Pedimos apenas que você forneça seu endereço de e-mail para que a pessoa que você recomenda para a página saiba que você deseja que ela veja o e-mail e que não é spam.Não capturaremos nenhum endereço de e-mail.
Esta pergunta é usada para testar se você é um visitante e evitar o envio automático de spam.
O Ministério Global de Ecologia Marinha está determinado a resolver problemas complexos e utiliza ML não supervisionado para explorar estruturas comunitárias.
O Ministério Global de Ecologia Marinha está determinado a resolver problemas complexos e utiliza ML não supervisionado para explorar estruturas comunitárias.

Horário da postagem: 12 de janeiro de 2021

Esclarecendo a complexidade ecológica: a aprendizagem não supervisionada determina a província ecológica marinha global