Analiza danych - Monitoring Ptaków Polski

Analiza danych

Podstawowe parametry

Rozpowszechnienie

Parametrem ilościowym, który charakteryzuje stopień zasiedlenia określonej przestrzeni przez dany gatunek jest rozpowszechnienie (inaczej: prewalencja), czyli procentowo wyrażona częstość jego występowania w obrębie zbioru równopolowych powierzchni próbnych. Występowanie jest tu oceniane w skali dwumianowej (jest/nie ma). Parametr ten można stosować do określenia stopnia zasiedlenia badanego obszaru w różnej skali przestrzennej, lecz jego wartość jest zależna również od wielkości wykorzystywanych powierzchni próbnych. Stąd też nieuprawnione są porównania rozpowszechnień ocenianych z użyciem powierzchni o różnej wielkości. Wartość wskaźnika rozpowszechnienia R wyrażana jest w skali procentowej i obliczana ze wzoru:

R = x/N * 100%

gdzie:
x – liczba powierzchni zajętych (tj. takich, na których stwierdzono dany gatunek),
N – liczba wszystkich kontrolowanych powierzchni.

Areał lęgowy

Kolejnym parametrem charakteryzującym wielkość przestrzeni zajętej przez gatunek jest areał lęgowy. Stosowany jest w przypadkach populacji, w których wykonuje się pełne liczenia (cenzusy) wszystkich lęgowych par gniazdujących w Polsce. Areał lęgowy wyrażony jest liczbą zasiedlonych przez gatunek powierzchni 10x10 km w granicach kraju. Areał jest rozpowszechnieniem ocenianym na zbiorze równopolowych powierzchni próbnych obejmujących całość kraju. Jako taki, areał lęgowy w znaczeniu używanym w niniejszych analizach jest tożsamy z wielkością używaną w analizach makroekologicznych pod nazwą area of occupancy (AOO).

Produktywność

Dane o produktywności monitorowanych populacji są pozyskiwane w 7 programach (MOG, MOP, MRY, MLK, MFGP, MPB, MPS). Wyniki są przedstawione za pomocą trzech parametrów: (a) sukces lęgowy – wskaźnik określający procentowy udział par, które odchowały młode w stosunku do liczby wszystkich par ze znanym końcowym efektem lęgu; (b) liczbę młodych na parę z sukcesem – średnia liczba piskląt w przeliczeniu na parę z lęgiem skutecznym (tj. takim, z którego ptaki wyprowadziły młode); (c) liczbę młodych na parę lęgową – średnia liczba piskląt w przeliczeniu na parę przystępującą do rozrodu.

Liczebność

W przypadku części gatunków, dla których wykonywane są cenzusy całości krajowej populacji gniazdowej, wynikiem monitoringu jest ocena całkowitej liczebności gatunku, w danym roku, na terenie Polski. W częściach analiz, tak uzyskana liczebność roczna jest skalowana względem liczebności w pierwszym roku badań (lub innym roku służącym jako rok referencyjny), dla zachowania spójności przy analizach trendów wykorzystujących wskaźniki liczebności rocznej (patrz niżej). Oceny całkowitej liczebności krajowej populacji można uzyskać również poprzez połączenie metodyki sondażowej (reprezentatywne próbkowanie lokalizacji powierzchni próbnych) z cenzusem wykonywanym w granicach tak wskazanych powierzchni. Takie dane pozyskiwane są w programie MFGP, gdzie zastosowanie losowania warstwowego (do wskazania powierzchni) oraz cenzusów (w obrębie powierzchni próbnych) pozwala nie tylko na uzyskanie corocznych wskaźników liczebności poszczególnych gatunków (patrz niżej), ale i na uzyskanie – poprzez ekstrapolację - oszacowań liczebności całych krajowych populacji.

Wskaźniki liczebności

Dla większości monitorowanych gatunków, wiodącym parametrem uzyskiwanym w badaniach monitoringowych jest wskaźnik (indeks) liczebności populacji lęgowej w danym roku. Ptaki są tu liczone z wykorzystaniem metodyki sondażowej, czyli na reprezentatywnych dla powierzchni Polski powierzchniach próbnych. To podejście jest stosowane w przypadku gatunków występujących stosunkowo licznie lub słabo wykrywalnych, gdzie niemożliwe jest uzyskanie w szybkim czasie wiarygodnej oceny faktycznej liczby par gniazdujących na danej powierzchni w danym roku. W takiej sytuacji, liczba osobników stwierdzanych w warunkach wysoce wystandaryzowanych kontroli powierzchni próbnej jest traktowana jako indeks rzeczywistej liczebności gatunku na badanym terenie. Wymaga to przyjęcia założenia, iż proporcja wykrywanych przez obserwatora osobników danego gatunku, choć daleka od 100%, nie zmienia się w sposób kierunkowy w kolejnych latach (Nichols et al. 2009), oraz że standaryzacja metod terenowych (termin kontroli, czas trwania kontroli, trasa przemarszu itd.), a także uwzględnienie kluczowych zmiennych zewnętrznych w modelowaniu wyników pozwala skutecznie kontrolować zmienność wykrywalności. Przy tak ustawionym planie eksperymentalnym, formalny indeks liczebności rocznej danego gatunku jest uzyskiwany jako oszacowanie efektu roku w modelach generalised estimating equations (GEE) względnie w uogólnionych mieszanych modelach liniowych (generalised linear mixed models; GLMM). Modele te uwzględniają efekt powierzchni jako czynnik losowy, tzn. biorą pod uwagę, iż liczenia ptaków wykonane na tych samych powierzchniach w kolejnych latach dają wyniki bardziej do siebie podobne niż wyniki liczeń z różnych powierzchni. Dodatkowo, wskaźniki roczne w analizowanym zbiorze są skalowane w relacji do roku referencyjnego (z reguły pierwszego lub ostatniego roku badań). Oznacza to, że wskaźniki uzyskiwane w kolejnych latach pokazują stosunek wartości wskaźnika w danym roku do wartości w roku referencyjnym. Przykładowo, wartość wskaźnika 1,30 (lub 130%) oznacza, że w danym roku wskaźnik ten był o 30% wyższy niż w roku referencyjnym, a wartość 0,90 oznacza wartość niższą o 10% w stosunku do roku referencyjnego.

Zagregowane wskaźniki liczebności

Wskaźniki zagregowane to wskaźniki uśredniające informację z kilkunastu-kilkudziesięciu wskaźników gatunkowych. W przypadku gatunków współwystępujących w zbliżonych siedliskach, tego typu wskaźniki mogą lepiej odzwierciedlać zmiany stanu określonych ekosystemów niż wskaźniki liczebności pojedynczych gatunków. Do obliczania indeksów zagregowanych użyto narzędzia MSI-tool (od Multi-Species Indicators) w wersji 3.0 działającego w środowisku R (Soldaat et al. 2017). MSI-tool pozwala na obliczenie zagregowanych indeksów dla danych gatunkowych uzyskanych zarówno w jednakowych oknach czasowych, jak i w różnych (niepokrywających się w pełni) oknach czasowych. Uśrednianie rocznych wartości indeksów poszczególnych gatunków bazuje tu na średnich geometrycznych, nie arytmetycznych. Skrypt z narzędziem dostępny jest na stronie Statistics Netherlands[1].

Trendy zmian wskaźników

Dane uzyskane na tych samych powierzchniach w kolejnych latach, umożliwiają śledzenie zmian opisanych wyżej parametrów, w tym wskaźników liczebności i rozpowszechnienia populacji ptaków. Dysponując serią parametrów z kolejnych lat można ilościowo określić nie tylko kierunek, ale również skalę i tempo zmian tychże parametrów. Najprostsze miary trendu bazują na ilorazie liczebności (wskaźników liczebności lub innych parametrów populacji) w dwóch kolejnych latach badań, określanym jako λ (lambda):

λ = Nt / N t-1

gdzie: Nt - wartość parametru w roku , N t-1 – wartość parametru w roku poprzedzającym rok . Po przekształceniu otrzymujemy:

Nt = λ * N t-1

Z powyższego wzoru wynika, że jeśli λ=1,00, to liczebność populacji w roku t nie zmienia się w stosunku do roku t–1 (przykładowo 30 par w danym roku = 1,00 × 30 par w roku poprzedzającym), czyli jest stabilna liczebnie. Analogicznie, jeśli λ=1,05, to liczebność populacji w danym roku wzrosła o 5% w stosunku do roku poprzedzającego (przykładowo, 105 par w roku t = 1,05 * 100 par w roku t-1). Dla wartości λ mniejszych od 1,00, odpowiednie wartości  będą maleć (populacja będzie zmniejszać liczebność lub rozpowszechnienie).

Dla serii corocznych pomiarów parametru Nt równanie to uogólnia się do wzoru opisującego wzrost wykładniczy wartości N (w szczególności liczebności populacji) jako funkcję czasu T, przy wartości początkowej N0:

NT = λT * N0

gdzie NT – wartość parametru po T latach od początku serii pomiarów, T – liczba lat, które upłynęły od pierwszego roku pomiarów, N0 – wartość parametru w pierwszym roku pomiarów.

Podstawowym, choć bardzo zgeneralizowanym, estymatorem wieloletniego trendu jest w takim układzie współczynnik λ oszacowany dla powyższego modelu. Jest on równoważny wartości λ liczonej dla każdej kolejnej pary lat i uśrednionej dla całej analizowanej serii parametrów rocznych (analizowanego okna czasowego). Wartości λ większe od 1 oznaczają trend rosnący, wartości mniejsze od 1 trend malejący, zaś odchylenie wartości λ od 1,00 kwantyfikuje tempo zmian. Posługiwanie się tak zdefiniowanym współczynnikiem tempa wzrostu populacji jako miarą trendu oznacza w istocie dopasowanie prostoliniowego trendu do serii zlogarytmowanych wartości rocznych analizowanego wskaźnika populacyjnego. Oczywiście, takie uproszczenie w wielu wypadkach nie jest rozwiązaniem optymalnym. Jego walorem jest jednak prostota i zasadność stosowania dla długich okien czasowych, w sytuacji gdy przedmiotem zainteresowania nie są wahania pomiędzy kolejnymi latami, lecz dominująca tendencja wieloletnia. W sytuacjach wymagających bardziej elastycznego podejścia, pakiet rtrim oferuje możliwość dopasowywania odmiennych wartości λ do wyróżnionych podzbiorów serii pomiarów rocznych. Bardzo użyteczną możliwością jest również dopasowanie do serii wskaźników rocznych linii trendu w wersji nieparametrycznej, a dokładniej z użyciem algorytmu loess lub lowess (robust locally weighted regression). To narzędzie doskonale rozwiązuje problem wizualizacji trendów w serii parametrów, ale – podobnie jak inne nieparametryczne regresje (np. spliny lub uogólnione modele addytywne [GAM]) – nie dostarcza konkretnych wartości liczbowych charakteryzujących dopasowaną linię trendu. Należy również zauważyć, że wartości wskaźników rocznych, które są wyskalowane w relacji do pierwszego roku badań (referencyjnego), same w sobie zawierają informację ilościową o rozmiarach zmian jakie zaszły w tym czasie (np. wartość wskaźnika wynosząca w danym roku 0,70 oznacza, że spadł on o 30% w relacji do pierwszego roku badań).

Dla potrzeb MPP trendy zmian rozpowszechnienia, liczebności oraz wskaźników liczebności zostały wyliczone z użyciem pakietu rtrim w środowisku R (Pannekoek et al. 2018). Pakiet ten jest nową implementacją algorytmu stosowanego do obliczeń trendów w pierwszych latach wdrażania programu MPP, obsługiwanego wtedy przez samodzielną aplikację TRIM (Pannekoek & van Strien 2005). Dane wsadowe dla rtrim obejmują „zagregowane” wyniki liczeń (patrz rozdz. 1.4.2.) uzyskane w ramach każdej powierzchni próbnej, a pakiet pozwala wyliczyć jednocześnie wskaźniki roczne jak i parametr λ. Wskaźniki liczebności są estymatorami punktowymi i pokazują stosunek liczebności określonego gatunku w danym roku do liczebności, jaką osiągał w pierwszym roku prowadzenia monitoringu (np. roku 2000 w MPPL oraz 2007 dla programów MPD i MPM). Miara niepewności oszacowania wskaźnika dla każdego roku charakteryzowana jest przez błąd standardowy (przekładający się na przedziały ufności: 95% przedział ufności ≈ 1,96 * błąd standardowy) i zależy od „naturalnej” zmienności wyników oraz ilości danych – w bieżącym przypadku rozpowszechnienia (liczby powierzchni, na których stwierdzono gatunek) i liczebności gatunku na powierzchniach próbnych. Im gatunek bardziej rozpowszechniony i liczniejszy, tym błąd oszacowania mniejszy. Oznacza to, iż dla słabo rozpowszechnionych lub/i mało licznych gatunków, ocena zmian liczebności (trendu) obarczona będzie dużym błędem, co praktycznie uniemożliwi wykrycie (niewielkich) zmian liczebności. Ponieważ kryteria klasyfikacji trendów używane w pakiecie rtrim (patrz tabela) są bezpośrednio związane z szerokością przedziału ufności, to im większy błąd oszacowania, tym mniejsza szansa, że trend zostanie zaklasyfikowany jako istotny, mimo że w rzeczywistości zmiany liczebności mają miejsce (inaczej mówiąc, kierunkowe zmiany liczebności populacji mogą pozostać niewykryte, gdy precyzja oceny jest niska). Dlatego, mimo że np. w programie MPPL notowane są wszystkie gatunki ptaków napotkane w terenie (średnio około 180 rocznie), dla części z nich dane są zbyt skąpe, by móc precyzyjnie oszacować zmiany ich liczebności.

Trendy rozpowszechnienia i liczebności klasyfikowane są według ścisłych reguł, określanych na podstawie kierunku i wielkości zmian liczebności (tabela 1). W zależności od precyzji oszacowania λ (szerokości 95% przedziałów ufności), kryteria oceny trendu implementowane w pakiecie rtrim wyróżniają sześć następujących kategorii zmian liczebności: populacja stabilna, umiarkowany i silny wzrost liczebności, umiarkowany i silny spadek liczebności oraz trend nieokreślony.

Tabela 1. Klasyfikacja trendów implementowana w pakiecie rtrim.

Kategoria trendu Opis Symbol
silny wzrost istotny wzrost, większy niż 5% na rok; dolna granica przedziału ufności >1,05 ↑↑
umiarkowany wzrost istotny wzrost, ale nie większy niż 5% na rok; dolna granica przedziału ufności między 1,00 a 1,05
stabilny brak istotnego wzrostu czy spadku i na pewno trend jest mniejszy niż 5% na rok; dolna granica przedziału ufności >0,95 a górna granica przedziału ufności <1,05 <->
nieokreślony brak istotnego wzrostu lub spadku, ale nie ma pewności, że trendy są mniejsze niż 5% na rok; dolna granica przedziału ufności <0,95 lub górna granica >1,05 ?
umiarkowany spadek istotny spadek, ale nie większy niż 5% na rok; górna granica przedziału ufności między 0,95 a 1,00
silny spadek istotny spadek większy niż 5% na rok; górna granica przedziału ufności >0,95 ↓↓

Trendy zmian wielkości areału lęgowego oraz produktywności były szacowane poprzez dopasowanie w środowisku obliczeniowym R modelu wykładniczego do odpowiedniej serii wcześniej wyliczonych wskaźników rocznych. Kategoria trendu została określona na podstawie wartości współczynnika λ zgodnie z kryteriami progowymi przedstawionymi w tabeli 2.

Tabela 2. Klasyfikacja trendów zmian wskaźników areału i produktywności.

Kategoria trendu Wartości progowe λ Symbol
silny wzrost λ > 1,061 ↑↑
umiarkowany wzrost 1,021 < λ < 1,06
stabilny 0.981 < λ < 1,02 <->
umiarkowany spadek 0,941 < λ < 0,98
silny spadek λ < 0,94 ↓↓

 

 

[1] https://www.cbs.nl/en-gb/society/nature-and-environment/indices-and-trends--trim--/msi-tool

Bogaart P., van der Loo M., Pannekoek J. 2020. rtrim: Trends and Indices for Monitoring Data. R package version 2.1.1. <https://CRAN.R-project.org/package=rtrim>.

Nichols JD, Thomas L, Coon PB 2009. Inferences about landbird abundance from count data: recent advances and future directions. Pp. 201-235 in: Thomson DL, Cooch EG & Conroy MJ (eds), Modeling Demographic Processes in Marked Populations. Springer.

Pannekoek J., Bogaart P., van der Loo M. 2018. Models and statistical methods in rtrim. Discussion paper. Statistics Netherlands, The Hague/Heerlen/Bonaire.

Pannekoek J., Van Strien A. J. 2005. TRIM 3 manual. Trends and indices for monitoring data. CBS, Statistics Netherlands, Voorburg, Netherlands.

Soldaat LL, Pannekoek J, Verweij RJT, van Turnhout CAM, van Strien AJ 2017. A Monte Carlo method to account for sampling error in multi-species indicators. Ecological Indicators 81: 340–347.

Strona korzysta z plików cookies w celu realizacji usług i zgodnie z Polityką Plików Cookies.
Możesz określić warunki przechowywania lub dostępu do plików cookies w Twojej przeglądarce.