topimg

הבהרת המורכבות האקולוגית: למידה ללא פיקוח קובעת את המחוז האקולוגי הימי העולמי

מוצעת שיטת למידה ללא פיקוח לקביעת מחוזות אקולוגיים ימיים גלובליים (אקו-פרובינציות) בהתבסס על מבנה קהילת פלנקטון ונתוני שטף חומרי הזנה.שיטת המחוז האקולוגי המשולב השיטתי (SAGE) יכולה לזהות מחוזות אקולוגיים במודלים של מערכות אקולוגיות מאוד לא ליניאריות.על מנת להתאים את השונות הלא-גאוסית של הנתונים, SAGE משתמש בהטבעה אקראית (t-SNE) כדי להפחית את הממדיות.בעזרת אפליקציית הרעש המבוססת על אלגוריתם צפיפות מבוססי צפיפות (DBSCAN), ניתן לזהות יותר ממאה מחוזות אקולוגיים.באמצעות מפת הקישוריות עם הבדלים אקולוגיים כמדד מרחק, מחוז אקולוגי מצטבר חזק (AEP) מוגדר באופן אובייקטיבי באמצעות מחוזות אקולוגיים מקוננים.באמצעות AEPs, נחקרה השליטה בקצב אספקת החומרים התזונתיים על מבנה הקהילה.Eco-Province ו-AEP הם ייחודיים ויכולים לסייע בפרשנות מודלים.הם יכולים להקל על השוואות בין מודלים ועשויים לשפר את ההבנה והניטור של מערכות אקולוגיות ימיות.
מחוזות הם אזורים שבהם ביוגיאוגרפיה מורכבת על הים או היבשה מאורגנת לאזורים קוהרנטיים ומשמעותיים (1).מחוזות אלו חשובים מאוד להשוואה ולניגוד בין מיקומים, אפיון תצפיות, ניטור והגנה.האינטראקציות המורכבות והלא-לינאריות המייצרות את המחוזות הללו הופכות את שיטות למידת המכונה ללא פיקוח (ML) למתאימות מאוד לקביעת מחוזות באופן אובייקטיבי, מכיוון שהשונות בנתונים מורכבת ואינה גאוסית.כאן מוצעת שיטת ML המזהה באופן שיטתי מחוזות אקולוגיים ימיים ייחודיים (אקו-פרובינציות) מהמודל התלת מימדי (3D) הגלובלי של דרווין (2).המונח "ייחודי" משמש כדי לציין שהאזור המזוהה אינו חופף מספיק לאזורים אחרים.שיטה זו נקראת שיטת System Integrated Ecological Province (SAGE).על מנת לבצע סיווג שימושי, שיטת אלגוריתם צריכה לאפשר (i) סיווג גלובלי ו-(ii) ניתוח רב קנה מידה שניתן לקנן/לקבץ במרחב ובזמן (3).במחקר זה, הוצעה לראשונה שיטת SAGE ונדונו המחוזות האקולוגיים שזוהו.מחוזות אקולוגיים יכולים לקדם הבנה של הגורמים השולטים במבנה הקהילה, לספק תובנות שימושיות לאסטרטגיות ניטור ולעזור לעקוב אחר שינויים במערכת האקולוגית.
מחוזות יבשתיים מסווגים בדרך כלל על פי קווי דמיון באקלים (משקעים וטמפרטורה), קרקע, צמחייה ובעלי חיים, ומשמשים לניהול עזר, מחקר המגוון הביולוגי ובקרת מחלות (1, 4).קשה יותר להגדיר מחוזות ימיים.רוב האורגניזמים הם מיקרוסקופיים, עם גבולות נוזלים.Longhurst et al.(5) סיפק אחד הסיווגים העולמיים הראשונים של משרד האוקיאנוגרפיה על בסיס תנאי הסביבה.ההגדרה של מחוזות "לונגהרסט" אלה כוללת משתנים כמו קצב ערבוב, ריבוד וקרינה, וכן ניסיונו הרב של לונגהרסט כאוקיינוגרף ימי, שיש לו תנאים חשובים נוספים למערכות אקולוגיות ימיות.בלונגהרסט נעשה שימוש נרחב, למשל, להערכת ייצור ראשוני ושטפי פחמן, סיוע לדיג ותכנון פעילויות תצפית במקום (5-9).על מנת להגדיר מחוזות בצורה אובייקטיבית יותר, נעשה שימוש בשיטות כגון לוגיקה מטושטשת ואשכול / סטטיסטיקה אזורית ללא פיקוח (9-14).מטרתן של שיטות כאלה היא לזהות מבנים משמעותיים שיכולים לזהות מחוזות בנתוני התצפית הזמינים.לדוגמה, מחוזות ימיים דינמיים (12) משתמשים במפות מתארגנות עצמית כדי להפחית את הרעש, ומשתמשים בצביר היררכי (מבוסס עצים) כדי לקבוע מוצרי צבע ימיים שמקורם מלוויינים אזוריים [כלורופיל a (Chl-a), גובה קו פלואורסצנטי מנורמל ו חומר אורגני מומס צבעוני] ושדה פיזי (טמפרטורת פני הים ומליחות, טופוגרפיה דינמית מוחלטת וקרח ים).
המבנה הקהילתי של הפלנקטון מעורר דאגה מכיוון שלאקולוגיה שלו יש השפעה רבה על רמות גבוהות יותר של חומרים מזינים, ספיגת פחמן ואקלים.אף על פי כן, זו עדיין מטרה מאתגרת וחמקמקה לקבוע מחוז אקולוגי גלובלי המבוסס על מבנה קהילת הפלנקטון.לווייני צבע ימיים יכולים לספק תובנות לגבי הסיווג הגס של פיטופלנקטון או להציע את היתרונות של קבוצות פונקציונליות (15), אך כרגע הם אינם מסוגלים לספק מידע מפורט על מבנה הקהילה.סקרים אחרונים [למשל Tara Ocean (16)] מספקים מדידות חסרות תקדים של מבנה הקהילה;נכון לעכשיו, יש רק תצפיות דלילות באתר בקנה מידה עולמי (17).מחקרים קודמים קבעו במידה רבה את "המחוז הביוגאוכימי" (12, 14, 18) בהתבסס על קביעת קווי דמיון ביוכימיים (כגון ייצור ראשוני, Chl ואור זמין).כאן, המודל המספרי משמש לפלט [Darwin(2)], והפרובינציה האקולוגית נקבעת על פי מבנה הקהילה והשטף התזונתי.למודל המספרי המשמש במחקר זה יש כיסוי גלובלי וניתן להשוות אותו עם נתוני שדה קיימים (17) ושדות חישה מרחוק (הערה S1).לנתוני המודל המספרי המשמשים במחקר זה יתרון של כיסוי גלובלי.המערכת האקולוגית של המודל מורכבת מ-35 מינים של פיטופלנקטון ו-16 מינים של זואופלנקטון (נא לעיין בחומרים ובשיטות).סוגי פלנקטון מודלים מקיימים אינטראקציה לא ליניארית עם מבנים שיתופיות שאינם גאוסיים, ולכן שיטות אבחון פשוטות אינן מתאימות לזיהוי דפוסים ייחודיים ועקביים במבנים קהילתיים מתעוררים.שיטת SAGE שהוצגה כאן מספקת דרך חדשה לבדוק את הפלט של מודלים מורכבים של דארווין.
יכולות הטרנספורמציה החזקות של טכנולוגיית מדעי הנתונים/ML יכולות לאפשר לפתרונות מודל מורכבים ביותר לחשוף מבנים מורכבים אך חזקים בשונות נתונים.שיטה חזקה מוגדרת כשיטה שיכולה לשחזר נאמנה את התוצאות בטווח שגיאה נתון.אפילו במערכות פשוטות, קביעת דפוסים ואותות חזקים יכולה להיות אתגר.עד שייקבע הרציונל המוביל לדפוס הנצפה, המורכבות המתהווה עשויה להיראות מסובכת/קשה לפתרון.תהליך המפתח של קביעת הרכב המערכת האקולוגית אינו ליניארי באופיו.קיומן של אינטראקציות לא ליניאריות יכול לבלבל סיווג חזק, ולכן יש להימנע משיטות המניחות הנחות חזקות לגבי ההתפלגות הסטטיסטית הבסיסית של שיתוף פעולה של נתונים.נתונים גבוהים ממדיים ולא ליניאריים נפוצים באוקיאנוגרפיה ועשויים להיות בעלי מבנה שיתופיות עם טופולוגיה מורכבת שאינה גאוסית.למרות שנתונים עם מבנה שיתופיות לא גאוסית עשויים להפריע לסיווג חזק, שיטת SAGE היא חדשנית מכיוון שהיא נועדה לזהות אשכולות עם טופולוגיות שרירותיות.
המטרה של שיטת SAGE היא לזהות באופן אובייקטיבי דפוסים מתעוררים שעשויים לסייע להבנה אקולוגית נוספת.בעקבות זרימת עבודה מבוססת אשכולות הדומה ל-(19), משתני השטף האקולוגי והתזונתי משמשים לקביעת האשכול היחיד בנתונים, הנקרא המחוז האקולוגי.שיטת SAGE המוצעת במחקר זה (איור 1) מפחיתה תחילה את הממדיות מ-55 ל-11 ממדים על ידי סיכום הקבוצות הפונקציונליות של הפלנקטון שהוגדרו אפריורית (ראה חומרים ושיטות).באמצעות שיטת t-Random neighbor embedding (t-SNE), הגודל מצטמצם עוד יותר על ידי הקרנת ההסתברות לתוך המרחב התלת-ממדי.מקבץ לא מפוקח יכול לזהות אזורים קרובים מבחינה אקולוגית [מקבץ מרחבי מבוסס צפיפות (DBSCAN) עבור יישומים מבוססי רעש].גם t-SNE וגם DBSCAN ישימים לנתוני המודל המספרי הלא-לינארי המובנה של המערכת האקולוגית.ואז השליך מחדש את המחוז האקולוגי שנוצר על פני האדמה.זוהו יותר ממאה מחוזות אקולוגיים ייחודיים המתאימים למחקר אזורי.על מנת לשקול את מודל המערכת האקולוגית העקבית הגלובלית, נעשה שימוש בשיטת SAGE כדי לאגד את המחוזות האקולוגיים למחוזות אקולוגיים מצטברים (AEP) כדי לשפר את היעילות של המחוזות האקולוגיים.ניתן להתאים את רמת הצבירה (המכונה "מורכבות") לרמת הפירוט הנדרשת.קבע את המורכבות המינימלית של AEP חזק.מוקד הבחירה הוא שיטת SAGE ובחינת מקרי AEP הקטנים ביותר כדי לקבוע את השליטה במבנה קהילת החירום.לאחר מכן ניתן לנתח את הדפוסים כדי לספק תובנות אקולוגיות.השיטה שהוצגה כאן יכולה לשמש גם להשוואת מודלים באופן נרחב יותר, למשל, על ידי הערכת מיקומם של מחוזות אקולוגיים דומים שנמצאו במודלים שונים כדי להדגיש הבדלים ודמיון, כדי להשוות מודלים.
(א) תרשים סכמטי של זרימת העבודה לקביעת המחוז האקולוגי;שימוש בסכום בקבוצה הפונקציונלית כדי לצמצם את הנתונים המקוריים של 55 מימדים לפלט מודל 11 מימדי, כולל ביומסה של שבעה פלנקטון פונקציונלי/תזונתי וארבעה שיעורי אספקת חומרים מזינים.ערך זניח ושטח כיסוי קרח עמיד.הנתונים עברו סטנדרטים ותקניים.ספק נתונים 11 מימדיים לאלגוריתם t-SNE כדי להדגיש שילובי תכונות דומים סטטיסטית.DBSCAN יבחר בקפידה את האשכול כדי להגדיר את ערך הפרמטר.לבסוף הקרן את הנתונים בחזרה להקרנת קו הרוחב/קו האורך.שים לב שתהליך זה חוזר על עצמו 10 פעמים מכיוון שאקראיות קלה עשויה להיווצר על ידי יישום t-SNE.(ב) מסביר כיצד להשיג את ה- AEP על ידי חזרה על זרימת העבודה ב- (A) 10 פעמים.עבור כל אחד מ-10 היישומים הללו, נקבעה מטריצת אי-הדמיון הבין-מחוזית בריי-קרטיס (BC) בהתבסס על הביומסה של 51 סוגי פיטופלנקטון.קבע את ההבדל לפני הספירה בין מחוזות, ממורכבות 1 AEP למורכבות מלאה 115. מדד BC נקבע על ידי מחוז Longhurst.
שיטת SAGE משתמשת בפלט של המודל הגלובלי התלת-ממדי הפיזי/אקולוגי כדי להגדיר את המחוז האקולוגי [דרווין (2);ראה חומרים ושיטות והערה S1].מרכיבי המערכת האקולוגית מורכבים מ-35 מינים של פיטופלנקטון ו-16 מינים של זואופלנקטון, עם שבע קבוצות פונקציונליות מוגדרות מראש: פרוקריוטים ואיקריוטים המותאמים לסביבות דלות תזונה, קוקסידיות עם ציפוי סידן פחמתי וקיבוע חנקן כבד חומרי הזנה בחנקן חסרים (בדרך כלל חסרים). חומרים מזינים חשובים), עם כיסוי סיליקטי, יכולים לעשות פוטוסינתזה של פלנקטונים אחרים ולרעות דגמי מזינים מעורבים ורועי זואופלנקטונים.טווח הגודל הוא 0.6 עד 2500 מיקרומטר קוטר כדורי שווה ערך.התפלגות המודל של גודל הפיטופלנקטון והקיבוץ הפונקציונלי לוכדת את המאפיינים הכוללים הנראים בתצפיות לוויין ובמקום (ראה איורים S1 עד S3).הדמיון בין המודל המספרי לאוקיינוס ​​הנצפה מצביע על כך שמחוזות המוגדרים על ידי המודל עשויים להיות ישימים על האוקיינוס ​​במקום.שימו לב שמודל זה לוכד רק מגוון מסוים של פיטופלנקטון, ורק טווחי כפייה פיזיים וכימיים מסוימים של האוקיינוס ​​באתרו.שיטת SAGE יכולה לאפשר לאנשים להבין טוב יותר את מנגנון הבקרה האזורי ביותר של מבנה הקהילה המודל.
על ידי הכללת רק סכום הביומסה של פני השטח (עם זמן ממוצע של 20 שנה) בכל קבוצה פונקציונלית של פלנקטון, ניתן להפחית את הממדיות של הנתונים.לאחר שמחקרים קודמים הראו את תפקידם המרכזי בקביעת מבנה הקהילה, הוא כלל גם מונחי מקור פני השטח של שטפי תזונה (אספקה ​​של חנקן, ברזל, פוספט וחומצה סיליקית) [למשל (20, 21)].סיכום הקבוצות הפונקציונליות מפחית את הבעיה מ-55 (51 פלנקטון ו-4 שטפי תזונה) ל-11 ממדים.במחקר ראשוני זה, בשל האילוצים החישוביים שהוטלו על ידי האלגוריתם, לא נשקלו שונות העומק והזמן.
שיטת SAGE מסוגלת לזהות קשרים חשובים בין תהליכים לא ליניאריים ומאפיינים מרכזיים של אינטראקציות בין ביומסה קבוצתית פונקציונלית ושטף חומרי הזנה.שימוש בנתונים 11 מימדיים המבוססים על שיטות למידה מרחוק אוקלידיות (כגון K-means) אינו יכול להשיג מחוזות אמינים וניתנים לשחזור (19, 22).הסיבה לכך היא שלא נמצאה צורה גאוסית בהתפלגות הבסיסית של השונות של מרכיבי המפתח המגדירים את המחוז האקולוגי.ה-K-אמצעי של תאי Voronoi (קווים ישרים) אינם יכולים לשמור על ההפצה הבסיסית הלא-גאוסית.
הביומסה של שבע קבוצות פונקציונליות של פלנקטון וארבעה שטפי תזונה יוצרים וקטור x 11 ממדי.לכן, x הוא שדה וקטור ברשת המודל, כאשר כל אלמנט xi מייצג וקטור 11 מימדי המוגדר ברשת האופקית של הדגם.כל אינדקס i מזהה באופן ייחודי נקודת רשת על הכדור, כאשר (lon, lat) = (ϕi, θi).אם הביומסה של יחידת הרשת המודל קטנה מ-1.2×10-3mg Chl/m3 או ששיעור כיסוי הקרח עולה על 70%, יומן נתוני ביומסה משמש ומושלך.הנתונים מנורמלים וסטנדרטיים, כך שכל הנתונים נמצאים בטווח של [0 עד 1], הממוצע מוסר ומוגדל לשונות יחידה.זה נעשה כדי שהתכונות (ביומסה ושטף תזונתי) לא יהיו מוגבלות על ידי הניגוד בטווח הערכים האפשריים.אשכול צריך ללכוד את קשר השינוי ממרחק ההסתברות העיקרי בין התכונות ולא מהמרחק הגיאוגרפי.על ידי כימת המרחקים הללו, מופיעות תכונות חשובות, בעוד פרטים מיותרים נמחקים.מנקודת מבט אקולוגית, זה הכרחי מכיוון שסוגים מסוימים של פיטופלנקטון עם מעט ביומסה עשויים להיות בעלי השפעות ביוגיאוכימיות גדולות יותר, כגון קיבוע חנקן על ידי חיידקים דיאזוטרופים.בעת סטנדרטיזציה ומנרמל נתונים, סוגים אלה של משתנים משתנים יודגשו.
על ידי הדגשת הקרבה של תכונות במרחב בעל ממדים גבוהים בייצוג נמוך ממדים, נעשה שימוש באלגוריתם t-SNE כדי להבהיר אזורים דומים קיימים.עבודה קודמת שמטרתה בניית רשתות עצביות עמוקות עבור יישומי חישה מרחוק השתמשה ב-t-SNE, שהוכיחה את מיומנותו בהפרדת תכונות מפתח (23).זהו שלב הכרחי לזיהוי מקבץ חזק בנתוני התכונה תוך הימנעות מפתרונות לא מתכנסים (הערה S2).באמצעות גרעינים גאוסים, t-SNE משמר את המאפיינים הסטטיסטיים של הנתונים על ידי מיפוי כל אובייקט בעל מימד גבוה לנקודה במרחב הפאזה התלת-ממדית, ובכך מבטיח שההסתברות של עצמים דומים בכיוונים הגבוהים והנמוכים גבוהה ב-high- מרחב ממדי (24).בהינתן קבוצה של N אובייקטים בעלי ממדים גבוהים x1,...,xN, אלגוריתם t-SNE מפחית על ידי מזעור סטיית ה-Kullback-Leibler (KL) (25).סטיית KL היא מדד למידת השונה של התפלגות הסתברות מהתפלגות הסתברות התייחסות שנייה, ויכולה להעריך ביעילות את האפשרות של מתאם בין ייצוגים נמוכים ממדים של מאפיינים בעלי מימד גבוה.אם xi הוא האובייקט ה-I במרחב N-ממדי, xj הוא האובייקט ה-j במרחב ה-N-ממדי, yi הוא האובייקט ה-i במרחב הנמוך, ו-yj הוא העצם ה-j במרחב הנמוך. -מרחב ממדי, ואז t -SNE מגדיר את הסתברות הדמיון ppj∣i = exp(-∥xi-xj∥2/2σi2)∑k≠iexp(-∥xi-xk∥2/2σi2), ולקבוצת הפחתת הממדיות q∣j = (1+ ∥ yi-yj∥2)-1∑k≠i(1 +∥yj-yk∥2)-1
איור 2A ממחיש את ההשפעה של הפחתת וקטורי השטף הביו-מסה והמזון של השילוב בן 11 המימדים לתלת-ממד.ניתן להשוות את המוטיבציה של יישום t-SNE עם המוטיבציה של ניתוח רכיבים עיקריים (PCA), המשתמש בתכונת השונות כדי להדגיש את השטח/תכונה של הנתונים, ובכך להפחית את הממדיות.שיטת t-SNE נמצאה עדיפה על PCA במתן תוצאות אמינות וניתנות לשחזור עבור משרד הסביבה (ראה הערה S2).ייתכן שהסיבה לכך היא שהנחת האורתוגונליות של PCA אינה מתאימה לזיהוי אינטראקציות קריטיות בין תכונות אינטראקטיביות מאוד לא ליניאריות, מכיוון ש-PCA מתמקדת במבני קו-ווריאציה ליניאריים (26).באמצעות נתוני חישה מרחוק, Lunga et al.(27) ממחיש כיצד להשתמש בשיטת SNE כדי להדגיש תכונות ספקטרליות מורכבות ולא ליניאריות החורגות מההתפלגות גאוסית.
(א) מודל של קצב אספקת חומרי הזנה, ביומסה של קבוצת פיטופלנקטון וזואופלנקטון פונקציונלית, שצויר על ידי אלגוריתם t-SNE ונצבע לפי מחוז באמצעות DBSCAN.כל נקודה מייצגת נקודה בחלל הממדים הגבוהים, כפי שמוצג באיור 6B, רוב הנקודות נלכדות.פירים מתייחסים לגדלים "t-SNE" 1, 2 ו-3. (ב) ההקרנה הגיאוגרפית של המחוז שנמצאה על ידי DBSCAN על רשת קו הרוחב של המוצא.יש לראות את הצבע ככל צבע, אבל צריך להתאים ל-(A).
הנקודות בתרשים הפיזור t-SNE באיור 2A קשורות בהתאמה לקווי הרוחב והאורך.אם שתי הנקודות באיור 2A קרובות זו לזו, זה בגלל ששטפי הביומסה והנוטריינטים שלהן דומים, לא בגלל הקרבה הגיאוגרפית.הצבעים באיור 2A הם אשכולות שהתגלו בשיטת DBSCAN (28).כאשר מחפשים תצפיות צפופות, אלגוריתם DBSCAN משתמש במרחק בייצוג התלת-ממדי בין הנקודות (ϵ = 0.39; למידע על בחירה זו, ראה חומרים ושיטות), ומספר הנקודות הדומות נדרש להגדרת האשכול (כאן 100 נקודות, אנא ראה למעלה).שיטת DBSCAN אינה מניחה הנחות לגבי הצורה או מספר האשכולות בנתונים, כפי שמוצג להלן:
3) עבור כל הנקודות שזוהו כמרחק בתוך, חזור על שלב 2 באופן איטרטיבי כדי לקבוע את גבול האשכול.אם מספר הנקודות גדול מהערך המינימלי שנקבע, הוא מוגדר כאשכול.
נתונים שאינם עומדים במדד המינימלי של איבר האשכול ובמדד המרחק ϵ נחשבים ל"רעש" ולא מוקצה להם צבע.DBSCAN הוא אלגוריתם מהיר וניתן להרחבה עם ביצועי O(n2) במקרה הגרוע.עבור הניתוח הנוכחי, זה לא ממש אקראי.מספר הנקודות המינימלי נקבע על ידי הערכת מומחה.לאחר התאמת המרחק לאחר מכן, התוצאה אינה יציבה מספיק בטווח של ≈±10.מרחק זה נקבע באמצעות קישוריות (איור 6A) ואחוז כיסוי האוקיינוס ​​(איור 6B).קישוריות מוגדרת כמספר המשולב של אשכולות והיא רגישה לפרמטר ϵ.קישוריות נמוכה יותר מצביעה על התאמה לא מספקת, קיבוץ מלאכותי של אזורים יחד.קישוריות גבוהה מעידה על התאמת יתר.אפשר להעלות על הדעת להשתמש במינימום גבוה יותר, אבל אם המינימום עולה על ca, אי אפשר להגיע לפתרון אמין.135 (לפרטים נוספים, ראה חומרים ושיטות).
115 האשכולות המזוהים באיור 2A מוקרנים בחזרה על כדור הארץ באיור 2B.כל צבע מתאים לשילוב קוהרנטי של גורמים ביו-גיאוכימיים ואקולוגיים שזוהו על ידי DBSCAN.לאחר קביעת האשכולות, השיוך של כל נקודה באיור 2A עם קו רוחב וקו אורך ספציפיים משמש כדי להקרין את האשכולות בחזרה לאזור הגיאוגרפי.איור 2B ממחיש זאת עם אותם צבעי אשכול כמו איור 2A.אין לפרש צבעים דומים כדמיון אקולוגי, מכיוון שהם מוקצים לפי סדר גילוי האשכולות על ידי האלגוריתם.
האזור באיור 2B יכול להיות דומה מבחינה איכותית לאזור מבוסס בפיסיקה ו/או הביו-גיאוכימיה של האוקיינוס.לדוגמה, הצבירים באוקיינוס ​​הדרומי הם אזורים סימטריים, עם מערבולות אוליגוטרופיות, והמעבר החד מעיד על השפעת רוחות הסחר.לדוגמה, באוקיינוס ​​השקט המשווני נראים אזורים שונים הקשורים לעלייה.
על מנת להבין את הסביבה האקולוגית של המחוז האקו, נעשה שימוש בווריאציה של מדד ההבדלים בריי-קרטיס (BC) (29) כדי להעריך את האקולוגיה באשכול.אינדיקטור BC הוא נתונים סטטיסטיים המשמשים לכימות ההבדל במבנה הקהילה בין שני אתרים שונים.מדידת BC ישימה לביומסה של 51 מינים של פיטופלנקטון וזואופלנקטון BCninj = 1-2CninjSni + Snj
BCninj מתייחס לדמיון בין צירוף ni לשילוב nj, כאשר Cninj הוא הערך המינימלי של סוג ביומסה בודד שקיים בשני הצירופים ni ו-nj, ו-Sni מייצג את סכום כל הביומסה הקיימת בשני הצירופים ni ו-Snj.ההבדל לפני הספירה דומה למדידת המרחק, אך פועל במרחב לא אוקלידי, מה שסביר להניח שיתאים יותר לנתונים אקולוגיים ולפירושם.
עבור כל אשכול שזוהה באיור 2B, ניתן להעריך את הדמיון בין BC תוך-מחוזי ובין-מחוזי.ההפרש לפני הספירה בתוך מחוז מתייחס להפרש בין הערך הממוצע של המחוז לבין כל נקודה במחוז.ההבדל בין מחוזות לפני הספירה מתייחס לדמיון בין מחוז אחד למחוזות אחרים.איור 3A מציג מטריצת BC סימטרית (0, שחור: תואם לחלוטין; 1, לבן: שונה לחלוטין).כל שורה בגרף מציגה דפוס בנתונים.איור 3B מציג את המשמעות הגיאוגרפית של התוצאות של BC באיור 3A עבור כל מחוז.עבור מחוז באזור דל תזונה ודל תזונתי, איור 3B מראה שהסימטריה של אזורים גדולים סביב קו המשווה והאוקיינוס ​​ההודי דומה בעצם, אך קווי הרוחב הגבוהים יותר ואזורי העלייה שונים באופן משמעותי.
(א) מידת ההבדל BC שהוערך עבור כל מחוז בהתבסס על ממוצע 20 שנה ממוצע של פני השטח העולמי של 51 פלנקטון.שימו לב לסימטריה הצפויה של הערכים.(ב) ההשלכה המרחבית של עמודה (או שורה).עבור מחוז במעגל דיסטרופי, הוערכה ההתפלגות העולמית של מדד הדמיון לפני הספירה, והוערך הממוצע העולמי של 20 שנה.שחור (BC = 0) פירושו אותו אזור, ולבן (BC = 1) פירושו אין דמיון.
איור 4A ממחיש את ההבדל ב-BC בתוך כל מחוז באיור 2B.נקבע על ידי שימוש בשילוב הממוצע של השטח הממוצע באשכול, וקביעת השוני בין ה-BC והממוצע של כל נקודת רשת במחוז, הוא מראה ששיטת SAGE יכולה להפריד בין 51 מינים על סמך הדמיון האקולוגי. נתוני דגם.הבדל הממוצע הכולל של אשכול BC של כל 51 הסוגים הוא 0.102±0.0049.
(A, B, ו-D) ההבדל BC בתוך המחוז מוערך כהפרש BC הממוצע בין כל קהילת נקודות רשת לבין המחוז הממוצע, והמורכבות אינה מצטמצמת.(2) ההפרש הגלובלי הממוצע תוך-פרובינציאלי לפני הספירה הוא 0.227±0.117.זהו המדד של סיווג מבוסס מוטיבציה אקולוגית המוצע על ידי עבודה זו [קו ירוק ב-(C)].(ג) הבדל ממוצע לפני הספירה התוך-פרובינציאלי: הקו השחור מייצג את ההפרש התוך-פרובינציאלי לפני הספירה עם המורכבות הגוברת.2σ מגיע מ-10 חזרות על תהליך זיהוי המחוז האקולוגי.עבור המורכבות הכוללת של המחוזות שהתגלו על ידי DBSCAN, (A) מראה שהשוני לפני הספירה במחוז הוא 0.099, וסיווג המורכבות המוצע על ידי (C) הוא 12, וכתוצאה מכך אי הדמיון לפני הספירה של 0.200 במחוז.כפי שמראה התמונה.(ד).
באיור 4B, הביומסה של 51 סוגי פלנקטון משמשת כדי לייצג את ההבדל המקביל לפני הספירה במחוז לונגהרסט.הממוצע הכולל של כל מחוז הוא 0.227, וסטיית התקן של נקודות הרשת בהתייחס להפרש במחוז לפני הספירה היא 0.046.זה גדול יותר מהאשכול שזוהה באיור 1B.במקום זאת, תוך שימוש בסכום של שבע הקבוצות הפונקציונליות, השונות הממוצעת תוך-עונה לפני הספירה ב-Longhurst גדלה ל-0.232.
המפה העולמית של המחוז האקולוגי מספקת פרטים מורכבים של אינטראקציות אקולוגיות ייחודיות ושיפורים נעשו בשימוש בכל מבנה המערכת האקולוגית של מחוז לונגהרסט.משרד האקולוגיה צפוי לספק תובנה לגבי תהליך השליטה במערכת האקולוגית של המודל הנומרי, ותובנה זו תסייע לחקר עבודת השטח.לצורך מחקר זה, לא ניתן להציג באופן מלא יותר ממאה מחוזות.הסעיף הבא מציג את שיטת SAGE המסכמת את המחוזות.
אחת ממטרות המחוז היא לקדם הבנה של מיקומו וניהולו של המחוז.כדי לקבוע מצבי חירום, השיטה באיור 1B ממחישה את הקינון של מחוזות דומים מבחינה אקולוגית.מחוזות אקולוגיים מקובצים יחד על סמך דמיון אקולוגי, וקיבוץ כזה של מחוזות נקרא AEP.הגדר "מורכבות" מתכווננת על סמך המספר הכולל של המחוזות שיש לקחת בחשבון.המונח "מורכבות" משמש מכיוון שהוא מאפשר להתאים את רמת תכונות החירום.על מנת להגדיר אגרגציות משמעותיות, ההפרש הממוצע של BC תוך פרובינציאלי של 0.227 מ-Longhurst משמש כמדד.מתחת לרף זה, המחוזות המשולבים אינם נחשבים עוד שימושיים.
כפי שמוצג באיור 3B, המחוזות האקולוגיים העולמיים הם קוהרנטיים.באמצעות הבדלי BC בין-מחוזיים, ניתן לראות שחלק מהתצורות הן מאוד "נפוצות".בהשראת שיטות גנטיקה ותורת הגרפים, "גרפים מחוברים" משמשים למיון מעל 100 מחוזות על סמך המחוזות הדומים להם ביותר.מדד ה"קישוריות" כאן נקבע באמצעות אי-דמיון בין-מחוזי לפני הספירה (30).ניתן להתייחס למספר המחוזות עם שטח גדול יותר לסיווג של> 100 מחוזות כמורכבות.AEP הוא מוצר שמסווג יותר מ-100 מחוזות כמחוזות האקולוגיים הדומיננטיים/הקרובים ביותר.כל מחוז אקולוגי מוקצה למחוז האקולוגי הדומיננטי/המחובר ביותר הדומה לו ביותר.צבירה זו שנקבעת על ידי ההבדל BC מאפשר גישה מקוננת לאקולוגיה העולמית.
המורכבות שנבחרה יכולה להיות כל ערך מ-1 ועד למורכבות המלאה של איור.2א.במורכבות נמוכה יותר, AEP עשוי להתנוון עקב שלב הפחתת הממדיות ההסתברותית (t-SNE).ניוון פירושו שניתן להקצות מחוזות אקולוגיים ל-AEPs שונים בין איטרציות, ובכך לשנות את האזור הגיאוגרפי המכוסה.איור 4C ממחיש את התפשטות הבדלי BC בתוך מחוזות ב-AEPs במורכבות הולכת וגוברת על פני 10 יישומים (איור באיור 1B).באיור 4C, 2σ (אזור כחול) הוא מדד של השפלה ב-10 יישומים, והקו הירוק מייצג את רף Longhurst.עובדות הוכיחו שהמורכבות של 12 יכולה לשמור את ההבדל לפני הספירה במחוז מתחת לרף Longhurst בכל ההטמעות ולשמור על השפלה קטנה יחסית של 2σ.לסיכום, המורכבות המינימלית המומלצת היא 12 AEPs, וההבדל הממוצע בין מחוז לפני הספירה המוערך באמצעות 51 סוגי פלנקטונים הוא 0.198±0.013, כפי שמוצג באיור 4D.באמצעות סכום של שבע קבוצות פונקציונליות של פלנקטון, ההפרש הממוצע של BC בתוך המחוז הוא 2σ במקום 0.198±0.004.ההשוואה בין הבדלי ה-BC המחושבים עם הביומסה הכוללת של שבע הקבוצות הפונקציונליות או הביומסה של כל 51 סוגי הפלנקטונים מראה שלמרות ששיטת SAGE ישימה למצב של 51 מימדים, היא מיועדת לביומסה הכוללת של שבע הקבוצות הפונקציונליות. לאימון.
בהתאם למטרה של כל מחקר, ניתן לשקול רמות שונות של מורכבות.מחקרים אזוריים עשויים לדרוש מורכבות מלאה (כלומר, כל 115 המחוזות).כדוגמה ולשם הבהירות, שקול את המורכבות המינימלית המומלצת של 12.
כדוגמה לתועלת של שיטת SAGE, 12 AEPs עם מורכבות מינימלית של 12 משמשים כאן כדי לחקור את השליטה במבנה קהילת החירום.איור 5 ממחיש את התובנות האקולוגיות המקובצות לפי AEP (מ-A עד L): בסטוכיומטריה של Redfield, היקף גיאוגרפי (איור 5C), הרכב ביומסה קבוצתית פונקציונלית (איור 5A) ואספקת חומרי הזנה (איור 5B) מבוצעים על ידי N Zoomed.היחס (N:Si:P:Fe, 1:1:16:16×103) מוצג.עבור הלוח האחרון, P כפול 16 ו- Fe כפול 16×103, כך שגרף העמודות שווה ערך לדרישות התזונתיות של פיטופלנקטון.
המחוזות מסווגים ל-12 AEPs A עד L. (A) ביומסה (mgC/m3) של מערכות אקולוגיות ב-12 מחוזות.(ב) קצב השטף התזונתי של חנקן אנאורגני מומס (N), ברזל (Fe), פוספט (P) וחומצה סיליקית (Si) (ממול/מ"ק לשנה).Fe ו-P מוכפלים ב-16 וב-16×103, בהתאמה, כך שהרצועות מתוקנות לדרישות הסטוכיומטריה של פיטופלנקטון.(ג) שימו לב להבדל בין אזורי קוטב, ציקלונים סובטרופיים ואזורים עונתיים/עולים עיקריים.תחנות הניטור מסומנות כדלקמן: 1, מושבים;2, ALOHA;3, תחנה P;ו-4, עטלפים.
ה-AEP המזוהה הוא ייחודי.יש סימטריה מסוימת סביב קו המשווה באוקיינוס ​​האטלנטי והשקט, ואזור דומה אך מורחב קיים באוקיינוס ​​ההודי.חלק מה-AEPs חובקים את הצד המערבי של היבשת הקשור לעלייה.הזרם המעגלי של הקוטב הדרומי נחשב למאפיין אזורי גדול.ציקלון סובטרופי הוא סדרה מורכבת של AEP אוליגוטרופית.במחוזות אלה, הדפוס המוכר של הבדלי ביו-מסה בין מערבולות אוליגוטרופיות הנשלטות על ידי פלנקטון ואזורים קוטביים עשירים בדיאטומים ברור.
AEPs עם ביומסת פיטופלנקטון דומה מאוד יכולים להיות בעלי מבנים קהילתיים שונים מאוד ולכסות אזורים גיאוגרפיים שונים, כגון D, H ו-K, שיש להם ביומסה כוללת של פיטופלנקטון דומה.AEP H קיים בעיקר באוקיינוס ​​ההודי המשווני, ויש יותר חיידקים דיאזוטרופים.AEP D נמצא במספר אגנים, אך הוא בולט במיוחד באוקיינוס ​​השקט סביב אזורים בעלי תפוקה גבוהה מסביב לעלייה המשוונית.צורתו של מחוז זה באוקיינוס ​​השקט מזכירה רכבת גלים פלנטריים.יש מעט דיאזובקטריה ב-AEP D, ויותר קונוסים.בהשוואה לשני המחוזות האחרים, AEP K נמצא רק ברמות הגבוהות של האוקיינוס ​​הארקטי, ויש יותר דיאטומים ופחות פלנקטונים.ראוי לציין שגם כמות הפלנקטון בשלושת האזורים הללו שונה מאוד.ביניהם, שפע הפלנקטון של AEP K נמוך יחסית, בעוד של AEP D ו-H גבוה יחסית.לכן, למרות הביומסה שלהם (ולכן דומות ל-Chl-a), מחוזות אלה שונים בתכלית: ייתכן שבדיקות מחוז מבוססות Chl לא יכללו את ההבדלים הללו.
ברור גם שכמה AEPs עם ביומסה שונה מאוד עשויים להיות דומים מבחינת מבנה קהילת הפיטופלנקטון.לדוגמה, זה נראה ב-AEP D ו-E. הם קרובים זה לזה, ובאוקיינוס ​​השקט, AEP E קרוב ל-AEPJ היצרני ביותר.באופן דומה, אין קשר ברור בין ביומסה של פיטופלנקטון לבין שפע זואופלנקטון.
ניתן להבין את AEP במונחים של חומרים מזינים המסופקים להם (איור 5B).דיאטומים קיימים רק כאשר יש אספקה ​​מספקת של חומצה סיליקית.בדרך כלל, ככל שהאספקה ​​​​של חומצה סיליקית גבוהה יותר, כך הביומסה של דיאטומים גבוהה יותר.ניתן לראות דיאטומים ב-AEP A, J, K ו-L. היחס בין ביו-מסה דואטומית ביחס לפיטופלנקטון אחר נקבע על ידי ה-N, P וה-Fe הניתנים ביחס לדרישת הדיאטומים.לדוגמה, AEP L נשלט על ידי דיאטומים.בהשוואה לחומרים מזינים אחרים, לסי יש את האספקה ​​הגבוהה ביותר.לעומת זאת, למרות פרודוקטיביות גבוהה יותר, ל-AEP J יש פחות דיאטומים ופחות אספקת סיליקון (הכל ויחסית לחומרי מזון אחרים).
לחיידקי דיאזוניום יש את היכולת לקבע חנקן, אך גדלים לאט (31).הם מתקיימים יחד עם פיטופלנקטון אחר, שבו ברזל וזרחן מוגזמים ביחס לביקוש לחומרי תזונה שאינם דיאזוניום (20, 21).ראוי לציין שהביומסה הדיאזוטרופית גבוהה יחסית, וההיצע של Fe ו-P גדול יחסית לאספקת N. באופן זה, למרות שהביומסה הכוללת ב-AEP J גבוהה יותר, הביומסה של הדיאזוניום ב-AEP H היא גדול יותר מזה ב-J. שימו לב ש-AEP J ו-H שונים מאוד מבחינה גיאוגרפית, ו-H ממוקם באוקיינוס ​​ההודי המשווני.
אם מבנה המערכת האקולוגית הייחודית לא יחולק למחוזות, התובנות שיתקבלו ממודלים המורכבות הנמוכה ביותר של 12 AEP לא יהיו כל כך ברורות.ה-AEP שנוצר על ידי SAGE מאפשר השוואה קוהרנטית ובו-זמנית של מידע מורכב וגבוה ממדים ממודלים של מערכות אקולוגיות.AEP מדגישה ביעילות מדוע Chl אינה שיטה טובה וחלופית לקביעת מבנה קהילה או שפע זואופלנקטון ברמות תזונה גבוהות יותר.ניתוח מפורט של נושאי מחקר מתמשכים הוא מעבר להיקף של מאמר זה.שיטת SAGE מספקת דרך לחקור מנגנונים אחרים במודל שקל יותר לטפל בה מאשר צפייה מנקודה לנקודה.
שיטת SAGE מוצעת כדי לסייע בהבהרת נתונים אקולוגיים מורכבים ביותר ממודלים מספריים פיסיקליים/ביוגיאוכימיים/אקולוגיים גלובליים.הפרובינציה האקולוגית נקבעת על ידי הביומסה הכוללת של קבוצות פונקציונליות חוצות פלנקטון, יישום אלגוריתם הפחתת ממדיות של הסתברות t-SNE והקבוץ באמצעות שיטת ML ללא פיקוח DBSCAN.התיאוריה הבין-מחוזית BC ההבדל/גרף עבור שיטת הקינון מיושמת כדי להפיק AEP חזק שניתן להשתמש בו לפרשנות גלובלית.מבחינת בנייה, ה-Eco-Province ו-AEP הם ייחודיים.ניתן להתאים את קינון AEP בין המורכבות המלאה של המחוז האקולוגי המקורי לבין הסף המינימלי המומלץ של 12 AEPs.קינון וקביעת המורכבות המינימלית של AEP נחשבים כשלבי מפתח, מכיוון שההסתברות t-SNE תנוונת AEPs של פחות מ-12 מורכבות.שיטת SAGE היא גלובלית, והמורכבות שלה נעה בין> 100 AEPs ל-12. למען הפשטות, ההתמקדות הנוכחית היא במורכבות של 12 AEPs גלובליים.מחקר עתידי, במיוחד מחקרים אזוריים, עשוי למצוא שימושי תת-קבוצה מרחבית קטנה יותר של המחוזות האקולוגיים העולמיים, וייתכן שיצטברו באזור קטן יותר כדי לנצל את אותן תובנות אקולוגיות שנדונו כאן.הוא מספק הצעות כיצד ניתן להשתמש במחוזות אקולוגיים אלה ובתובנות שהושגו מהם להבנה אקולוגית נוספת, להקל על השוואת מודלים, ואפשר לשפר את הניטור של מערכות אקולוגיות ימיות.
המחוז האקולוגי ו-AEP שזוהו בשיטת SAGE מבוססים על הנתונים במודל המספרי.בהגדרה, המודל המספרי הוא מבנה פשוט, המנסה ללכוד את מהות מערכת המטרה, ולמודלים שונים תהיה חלוקה שונה של פלנקטון.המודל המספרי המשמש במחקר זה אינו יכול לתפוס באופן מלא חלק מהדפוסים שנצפו (לדוגמה, בהערכות Chl לאזור המשווני והאוקיינוס ​​הדרומי).רק חלק קטן מהמגוון באוקיינוס ​​האמיתי נלכד, ולא ניתן לפתור את ה-meso ואת תת-מזוסקאלים, מה שעשוי להשפיע על שטף התזונה ועל מבנה הקהילה בקנה מידה קטן יותר.למרות החסרונות הללו, מסתבר ש-AEP שימושי מאוד בסיוע בהבנת מודלים מורכבים.על ידי הערכה היכן נמצאים מחוזות אקולוגיים דומים, AEP מספק כלי פוטנציאלי להשוואת מודלים מספריים.המודל המספרי הנוכחי לוכד את הדפוס הכולל של חישה מרחוק ריכוז פיטופלנקטון Chl-a ואת התפלגות גודל הפלנקטון והקבוצה התפקודית (הערה S1 ואיור S1) (2, 32).
כפי שמוצג על ידי קו המתאר 0.1 mgChl-a/m-3, AEP מחולק לאזור אוליגוטרופי ואזור מזוטרופי (איור S1B): AEP B, C, D, E, F ו-G הם אזורים אוליגוטרופיים, והאזורים הנותרים הם ממוקם גבוה Chl-a.AEP מראה התכתבות מסוימת עם מחוז לונגהרסט (איור S3A), למשל, האוקיינוס ​​הדרומי והאוקיינוס ​​השקט המשווני.באזורים מסוימים, AEP מכסה מספר אזורי Longhurst, ולהיפך.מכיוון שהכוונה לתחם מחוזות באזור זה ובלונגהרסט שונה, צפוי שיהיו הבדלים.מספר AEPs במחוז Longhurst מצביעים על כך שלאזורים מסוימים עם ביו-גיאוכימיה דומה עשויים להיות מבנים שונים מאוד של מערכת אקולוגית.AEP מפגין התאמה מסוימת עם מצבים פיזיקליים, כפי שנחשף באמצעות למידה ללא פיקוח (19), כגון במצבי עלייה גבוהים (לדוגמה, האוקיינוס ​​הדרומי והאוקיינוס ​​השקט המשווני; איור S3, C ו-D).התכתבויות אלו מצביעות על כך שמבנה הקהילה של הפלנקטון מושפע מאוד מדינמיקת האוקיינוסים.באזורים כמו צפון האוקיינוס ​​האטלנטי, AEP חוצה מחוזות פיזיים.המנגנון הגורם להבדלים הללו עשוי לכלול תהליכים כמו הובלת אבק, מה שיכול להוביל לתוכניות תזונתיות שונות לחלוטין גם בתנאים פיזיים דומים.
משרד האקולוגיה ו-AEP ציינו כי שימוש ב-Chl לבדו אינו יכול לזהות מרכיבים אקולוגיים, כפי שקהילת האקולוגיה הימית כבר הבינה.זה נראה ב-AEPs עם ביומסה דומה אך בהרכב אקולוגי שונה באופן משמעותי (כגון D ו-E).לעומת זאת, ל-AEPs כגון D ו-K יש ביומסה שונה מאוד אך הרכב אקולוגי דומה.AEP מדגישה כי הקשר בין ביומסה, הרכב אקולוגי ושפע זואופלנקטון הוא מורכב.לדוגמה, למרות ש-AEP J בולט במונחים של פיטופלנקטון וביומסה של פלנקטון, ל-AEP של A ו-L יש ביומסת פלנקטון דומה, אבל ל-A יש שפע פלנקטון גבוה יותר.AEP מדגישה שלא ניתן להשתמש בביומסה של פיטופלנקטון (או Chl) כדי לחזות ביומסה זואופלנקטון.Zooplankton הוא הבסיס לשרשרת המזון של הדיג, והערכות מדויקות יותר עשויות להוביל לניהול משאבים טוב יותר.לווייני צבע ימיים עתידיים [לדוגמה, PACE (פלנקטון, אירוסול, ענן ומערכת אקולוגית ימית)] עשויים להיות ממוקמים טוב יותר כדי לעזור להעריך את מבנה הקהילה של פיטופלנקטון.שימוש בחיזוי AEP עשוי להקל על הערכת זואופלנקטון מהחלל.שיטות כמו SAGE, יחד עם טכנולוגיות חדשות, ועוד ועוד נתוני שטח זמינים עבור סקרי אמת קרקע (כגון טארה ומחקר המשך), יכולים לעשות במשותף צעד לקראת ניטור בריאות מערכת אקולוגית מבוסס לוויין.
שיטת SAGE מספקת דרך נוחה להעריך כמה מנגנונים השולטים במאפייני המחוז, כגון ביומסה/Chl, ייצור ראשוני נטו ומבנה קהילה.לדוגמה, הכמות היחסית של דיאטומים נקבעת על ידי חוסר איזון באספקת Si, N, P ו-Fe ביחס לדרישות הסטוכיומטריות של פיטופלנקטון.בקצב אספקה ​​מאוזן, הקהילה נשלטת על ידי דיאטומים (L).כאשר קצב האספקה ​​אינו מאוזן (כלומר, היצע הסיליקון נמוך מהביקוש התזונתי של דיאטומים), דיאטומים מהווים רק חלק קטן Share (K).כאשר ההיצע של Fe ו-P עולה על ההיצע של N (לדוגמה, E ו-H), החיידקים הדיאזוטרופים יגדלו בעוצמה.באמצעות ההקשר שמספק AEP, חקר מנגנוני הבקרה יהפוך שימושי יותר.
ה-Eco-Province ו-AEP הם אזורים עם מבנים קהילתיים דומים.ניתן להתייחס לסדרת הזמן ממיקום מסוים בתוך מחוז אקולוגי או AEP כנקודת ייחוס ויכולה לייצג את השטח המכוסה על ידי המחוז האקולוגי או AEP.תחנות ניטור ארוכות טווח באתר מספקות סדרות זמן כאלה.מערכי נתונים באתר ארוכי טווח ימשיכו למלא תפקיד בלתי ניתן לחישוב.מנקודת המבט של ניטור מבנה הקהילה, ניתן לראות בשיטת SAGE דרך לעזור לקבוע את המיקום השימושי ביותר של אתרים חדשים.לדוגמה, סדרת הזמן מהערכת בית גידול אוליגוטרופית ארוכת טווח (ALOHA) נמצאת ב-AEP B של האזור האוליגוטרופי (איור 5C, תווית 2).מכיוון ש-ALOHA קרובה לגבול של AEP אחר, ייתכן שסדרת הזמן אינה מייצגת את כל האזור, כפי שהוצע בעבר (33).באותו AEP B, סדרת הזמן SEATS (Southeast Asian Time Series) ממוקמת בדרום מערב טייוואן (34), רחוק יותר מהגבולות של AEPs אחרים (איור 5C, תווית 1), וניתן להשתמש בו כמיקום טוב יותר לניטור AEPB.סדרת הזמן של BATS (Bermuda Atlantic Time Series Study) (איור 5C, תווית 4) ב-AEPC קרובה מאוד לגבול בין AEP C ל-F, מה שמצביע על כך שניטור AEP C באמצעות סדרות זמן BATS עשוי להיות בעייתי ישירות.תחנה P ב-AEP J (איור 5C, תווית 3) רחוקה מגבול ה-AEP, ולכן היא מייצגת יותר.ה-Eco-Province ו-AEP יכולים לסייע בהקמת מסגרת ניטור המתאימה להערכת שינויים גלובליים, מכיוון שההרשאה של המחוזות להעריך היכן דגימה באתר יכולה לספק תובנות מפתח.ניתן לפתח עוד יותר את שיטת SAGE ליישום על נתוני אקלים כדי להעריך שונות חוסכת זמן.
הצלחת שיטת SAGE מושגת באמצעות יישום זהיר של שיטות מדעי נתונים/ML וידע ספציפי לתחום.באופן ספציפי, t-SNE משמש לביצוע הפחתת מימדיות, אשר משמרת את מבנה השונות של נתונים בעלי ממדים גבוהים ומקלה על הדמיה של טופולוגיית השונות.הנתונים מסודרים בצורה של פסים ושונות (איור 2A), מה שמצביע על כך שמדדים המבוססים על מרחק בלבד (כגון ממוצעי K) אינם מתאימים מכיוון שהם בדרך כלל משתמשים בהתפלגות בסיס גאוסית (עגולה) (שנדונה בהערה S2) .שיטת DBSCAN מתאימה לכל טופולוגיית שיתוף פעולה.כל עוד אתה שם לב להגדרת פרמטרים, ניתן לספק זיהוי אמין.העלות החישובית של אלגוריתם t-SNE היא גבוהה, מה שמגביל את היישום הנוכחי שלו לכמות גדולה יותר של נתונים, מה שאומר שקשה ליישם אותו על שדות עמוקים או משתנים בזמן.העבודה על המדרגיות של t-SNE בעיצומה.מכיוון שקל להקביל למרחק KL, לאלגוריתם t-SNE יש פוטנציאל טוב להתרחבות בעתיד (35).עד כה, שיטות מבטיחות אחרות להפחתת ממדיות שיכולות להפחית טוב יותר את הגודל כוללות טכניקות קירוב והקרנה סעפת מאוחדת (UMAP), אך יש צורך בהערכה בהקשר של נתוני אוקיינוס.המשמעות של מדרגיות טובה יותר היא, למשל, סיווג אקלים גלובלי או מודלים בעלי מורכבות שונה בשכבה מעורבת.אזורים שאינם מסווגים על ידי SAGE בכל מחוז יכולים להיחשב כנקודות השחורות הנותרות באיור 2A.מבחינה גיאוגרפית, אזורים אלו נמצאים בעיקר באזורים עונתיים מאוד, מה שמרמז כי לכידת מחוזות אקולוגיים המשתנים עם הזמן תספק כיסוי טוב יותר.
על מנת לבנות את שיטת SAGE, נעשה שימוש ברעיונות ממערכות מורכבות/מדע נתונים, תוך שימוש ביכולת לקבוע אשכולות של קבוצות פונקציונליות (האפשרות להיות קרובה מאוד במרחב 11 מימדי) ולקבוע מחוזות.מחוזות אלה מתארים נפחים ספציפיים במרחב השלב ה-t-SNE התלת-ממדי שלנו.באופן דומה, ניתן להשתמש בחלק ה- Poincaré כדי להעריך את "נפח" מרחב המצב שנכבש על ידי המסלול כדי לקבוע התנהגות "נורמלית" או "כאוטית" (36).עבור פלט המודל הסטטי של 11 מימדים, ניתן להסביר באופן דומה את נפח התפוס לאחר המרת הנתונים למרחב פאזה תלת מימדי.הקשר בין אזור גיאוגרפי לאזור בחלל פאזה תלת מימד אינו פשוט, אך ניתן להסביר אותו במונחים של דמיון אקולוגי.מסיבה זו, מועדף מדד אי-הדמיון המקובל יותר BC.
עבודה עתידית תעשה שימוש חוזר בשיטת SAGE לנתונים משתנים עונתיים כדי להעריך את השונות המרחבית של המחוזות שזוהו ושל AEP.המטרה העתידית היא להשתמש בשיטה זו כדי לעזור לקבוע אילו מחוזות ניתן לקבוע באמצעות מדידות לווין (כגון Chl-a, רפלקטיביות חישה מרחוק וטמפרטורת פני הים).זה יאפשר הערכת חישה מרחוק של רכיבים אקולוגיים וניטור גמיש ביותר של מחוזות אקולוגיים והשונות שלהם.
מטרת מחקר זה היא להציג את שיטת SAGE, המגדירה מחוז אקולוגי באמצעות מבנה קהילת הפלנקטון הייחודי שלו.כאן יסופק מידע מפורט יותר על המודל הפיזי/ביוגאוכימי/אקולוגי ובחירת הפרמטרים של האלגוריתמים t-SNE ו-DBSCAN.
המרכיבים הפיזיקליים של המודל מגיעים מהערכת זרימת האוקיינוס ​​והאקלים [ECCOv4;(37) אומדן המצב העולמי המתואר על ידי (38).הרזולוציה הנומינלית של אומדן המדינה היא 1/5.שיטת הריבועים הקטנים ביותר עם שיטת מכפיל Lagrangian משמשת כדי לקבל את התנאים ההתחלתיים והגבולים ואת הפרמטרים הפנימיים של המודל המותאמים על ידי תצפית, ובכך ליצור מודל מחזור כללי של MIT הפועל באופן חופשי (MITgcm) (39), המודל לאחר אופטימיזציה, התוצאות יכולות ניתן לעקוב ולצפות.
לביו-גיאוכימיה/מערכת אקולוגית יש תיאור שלם יותר (כלומר משוואות וערכי פרמטרים) ב-(2).המודל לוכד את מחזור הדם של C, N, P, Si ו-Fe דרך בריכות אנאורגניות ואורגניות.הגרסה המשמשת כאן כוללת 35 מינים של פיטופלנקטון: 2 מינים של מיקרו-פרוקריוטים ו-2 מינים של מיקרו-אוקריוטים (מתאים לסביבות דלת תזונה), 5 מינים של Cryptomonas sphaeroides (עם ציפוי סידן פחמתי), 5 מינים של דיאזוניום (יכול לתקן חנקן, כך זה לא מוגבל) הזמינות של חנקן אי-אורגני מומס), 11 דיאטומים (היוצרים כיסוי סיליקטי), 10 פלפלנטים מעורבים-וגטטיביים (יכולים לעשות פוטוסינתזה ולאכול פלנקטון אחר) ו-16 זואפלנקטון (רועה על פלנקטון אחר).אלה נקראות "קבוצות פונקציונליות ביו-גיאוכימיות" מכיוון שיש להן השפעות שונות על ביו-גיאוכימיה ימית (40, 41) והן משמשות לעתים קרובות בתצפית ובמחקרי מודלים.במודל זה, כל קבוצה פונקציונלית מורכבת ממספר פלנקטונים בגדלים שונים, עם טווח של 0.6 עד 2500 מיקרומטר קוטר כדורי שווה ערך.
הפרמטרים המשפיעים על גידול, רעייה ושקיעת פיטופלנקטון קשורים לגודל, ויש הבדלים ספציפיים בין שש קבוצות הפיטופלנקטון התפקודיות (32).למרות המסגרות הפיזיות השונות, התוצאות של 51 מרכיבי הפלנקטון של המודל שימשו במספר מחקרים עדכניים (42-44).
משנת 1992 עד 2011, מודל הצימוד הפיזי/ביוגאוכימי/אקולוגי פעל במשך 20 שנה.התפוקה של המודל כוללת ביומסה של פלנקטון, ריכוז חומרי הזנה וקצב אספקת חומרי הזנה (DIN, PO4, Si ו-Fe).במחקר זה, ממוצע 20 השנים של תפוקות אלו שימש כקלט של המחוז האקולוגי.Chl, התפלגות ביומסה פלנקטון וריכוז חומרי הזנה והתפלגות קבוצות פונקציונליות מושווים עם תצפיות לוויין ותצפיות באתר [ראה (2, 44), הערה S1 ואיור.S1 עד S3].
עבור שיטת SAGE, המקור העיקרי לאקראיות מגיע משלב t-SNE.אקראיות מעכבת את החזרה, מה שאומר שהתוצאות אינן אמינות.שיטת SAGE בודקת בקפדנות את החוסן על ידי קביעת קבוצה של פרמטרים של t-SNE ו-DBSCAN, שיכולים לזהות באופן עקבי אשכולות כאשר הם חוזרים על עצמם.ניתן להבין את קביעת "התמיהה" של פרמטר t-SNE כקביעת המידה שבה המיפוי מממדים גבוהים לנמוכים צריך לכבד את המאפיינים המקומיים או הגלובליים של הנתונים.הגיע לבלבול של 400 ו-300 איטרציות.
עבור אלגוריתם האשכולות DBSCAN, יש לקבוע את מדד הגודל והמרחק המינימלי של נקודות הנתונים באשכול.המספר המינימלי נקבע בהנחיית מומחים.ידע זה יודע מה מתאים למסגרת המודלים והרזולוציה הנוכחית.המספר המינימלי הוא 100. ניתן לשקול ערך מינימום גבוה יותר (פחות מ-135 לפני שהגבול העליון של הירוק הופך רחב יותר), אך הוא אינו יכול להחליף את שיטת הצבירה המבוססת על אי-הדמיון של BC.מידת החיבור (איור 6A) משמשת לקביעת הפרמטר ϵ, דבר המסייע לכיסוי גבוה יותר (איור 6B).קישוריות מוגדרת כמספר המשולב של אשכולות והיא רגישה לפרמטר ϵ.קישוריות נמוכה יותר מצביעה על התאמה לא מספקת, קיבוץ מלאכותי של אזורים יחד.קישוריות גבוהה מעידה על התאמת יתר.התאמת יתר היא גם בעייתית, מכיוון שהיא מראה שניחושים אקראיים ראשוניים עשויים להוביל לתוצאות בלתי ניתנות לשחזור.בין שני הקצוות הללו, עלייה חדה (המכונה בדרך כלל "מרפק") מציינת את ה-ϵ הטוב ביותר.באיור 6A רואים עלייה חדה בשטח הרמה (צהוב,> 200 אשכולות), ואחריה ירידה חדה (ירוק, 100 אשכולות), עד כ-130, מוקף במעט מאוד אשכולות (כחול, <60 אשכולות) ).לפחות ב-100 אזורים כחולים, צביר אחד שולט בכל האוקיינוס ​​(ϵ <0.42), או שרוב האוקיינוס ​​אינו מסווג ונחשב לרעש (ϵ> 0.99).לאזור הצהוב יש התפלגות אשכולות משתנה מאוד, בלתי ניתנת לשחזור.ככל ש-ϵ יורד, הרעש גדל.השטח הירוק הגדל בחדות נקרא מרפק.זהו אזור אופטימלי.למרות שההסתברות t-SNE משמשת, עדיין ניתן להשתמש בשוני BC בתוך המחוז לקביעת קיבוץ אמין.באמצעות איור 6 (A ו-B), הגדר את ϵ ל-0.39.ככל שהמספר המינימלי גדול יותר, ההסתברות להגיע ל-ϵ המאפשר סיווג אמין קטנה יותר, והשטח הירוק בעל ערך גדול מ-135 גדול יותר. הגדלה של אזור זה מצביעה על כך שיהיה קשה יותר למצוא את המרפק או לא- קיים.
לאחר קביעת הפרמטרים של t-SNE, המספר הכולל של אשכולות שנמצאו ישמש כמדד לקישוריות (A) ואחוז הנתונים שהוקצו לאשכול (B).הנקודה האדומה מציינת את השילוב הטוב ביותר של כיסוי וקישוריות.המספר המינימלי נקבע בהתאם למספר המינימלי הקשור לאקולוגיה.
לחומרים משלימים למאמר זה, ראה http://advances.sciencemag.org/cgi/content/full/6/22/eaay4740/DC1
זהו מאמר בגישה פתוחה המופץ תחת התנאים של רישיון הייחוס של Creative Commons.המאמר מאפשר שימוש, הפצה ושכפול ללא הגבלה בכל מדיום בתנאי שהיצירה המקורית מצוטטת כהלכה.
הערה: אנו מבקשים ממך לספק את כתובת המייל שלך רק כדי שהאדם עליו אתה ממליץ לעמוד ידע שאתה רוצה שהוא יראה את המייל ושלא מדובר בספאם.לא נלכד כתובות דוא"ל.
שאלה זו משמשת כדי לבדוק אם אתה מבקר ולמנוע שליחת דואר זבל אוטומטית.
המשרד העולמי לאקולוגיה ימית נחוש לפתור בעיות מורכבות ומשתמש ב-ML ללא פיקוח כדי לחקור מבני קהילה.
המשרד העולמי לאקולוגיה ימית נחוש לפתור בעיות מורכבות ומשתמש ב-ML ללא פיקוח כדי לחקור מבני קהילה.


זמן פרסום: 12 בינואר 2021