2024/04/20 13:04

Gridowane dane obserwacyjne z Europy

Aby jednoznacznie określić obecność jakichkolwiek trendów temperatury w zmieniającym się bądź co bądź klimacie potrzebna jest jednorodna (homogeniczna) seria danych, najlepiej z maksymalnie dużej ilości  stacji. Wiele osób, które chcą zbadać zmienność temperatury w czasie, natrafia na duży problem ze znalezieniem danych, a nawet jeśli zbiorą wystarczającą ilość danych potrzebnych do stworzenia serii, powstaje problem określenia homogeniczności owych danych.

Użycie surowych danych może prowadzić do wykrycia trendów, czy korelacji tam, gdzie one w rzeczywistości nie występują, to z kolei prowadzić może do wyciągnięcia błędnych wniosków o charakterze zmian klimatycznych, jakie miały miejsce w ostatnich stu, czy dwustu latach.

Szeroko dostępne i znane zbiory danych w postaci bazy GHCN, czy opublikowanej serii danych z CRU nie pozwalają na jednoznaczne stwierdzenie homogeniczności serii, brakuje bowiem tzw. metadanych, w których zawarte byłyby informacje o działaniach mogących mieć poważny wpływ na pomiar – takimi działaniami mogą być na przykład zmiany urządzeń pomiarowych, lokalizacji stacji, terminów obserwacji, sposobu liczenia średniej temperatury, czy wreszcie postępująca urbanizacja obszaru w bezpośrednim otoczeniu stacji. Każde z tych działań powoduje, że seria danych staje się nieciągła – niehomogeniczna. Nieciągłości te można wyeliminować chociażby poprzez porównywanie serii danych ze stacji sąsiadujących – wprowadzenie zmian na jednej z nich zwykle skutkuje widocznymi zmianami w przebiegu różnic pomiędzy tymi stacjami.

Znacznie lepszym sposobem jest prowadzenie przez pewien czas obserwacji równoległych (z użyciem obu przyrządów pomiarowych, lub w obu miejscach, jeśli lokalizacja stacji uległa zmianie), co pozwala na jednoznaczne określenie różnic w pomiarach w celu ich wyeliminowania. Jest to jednak niemożliwe w przypadku zwykłego „poszukiwacza danych”. Ten ostatni musi albo samemu wykonać tytaniczną (i raczej skazaną na niepowodzenie) pracę polegającą na homogenizacji serii, albo polegać na danych surowych, z nadzieją że uśrednienie wartości z większego obszaru pośrednio wyeliminuje  problem.

Innym rozwiązaniem jest powołanie się na dane już przetworzone, w których określona została homogeniczność danych – i w rzeczy samej istnieje zbiór danych, który nie dość że został  częściowo poddany homogenizacji, to dodatkowo w wielu przypadkach posiada informacje na temat historycznych zmian dokonywanych na danej stacji. Zbiór ten został przygotowany przez European Climate Assessment i warto mu się przyjrzeć nieco bliżej.

Zbiór ECA&D składa się z dwóch podzbiorów. Jednym z nich jest zbiór danych określonych jako „non-blended” – dane przesyłane przez państwa biorące udział w projekcie zwykle nie są kompletne, szczególnie dane najnowsze (głównie z uwagi na czas, jaki musi być poświęcony na kontrolę jakości). Brakujące dane są uzupełniane w oparciu o depesze synoptyczne, lub uzupełniane danymi z innych stacji (oczywiście z zachowaniem odpowiednich procedur) jeśli stacje te położone są w odległości nie większej, niż 25 km, a różnica wysokości położenia stacji nie przekracza 50m. [1] Tak uzupełniona („wymieszana”) seria danych nosi nazwę blended.

Dalsze przetwarzanie danych oparto właśnie o serię blended. Dane te zostały poddane całej serii testów kontroli jakości, szerzej opisanej w tym dokumencie. Na podstawie serii ECA&D stworzono również wersję gridowaną, nazwaną E-OBS. Seria ta powstała specjalnie z myślą o użyciu w regionalnych modelach klimatycznych, oraz w analizie  zmian klimatycznych. Rozmiar siatki to 0.25 lub 0.50 stopnia, jest więc to siatka dość gęsta. Umieszczanie danych na takiej siatce eliminuje problem nierównomiernego rozmieszczenia stacji pomiarowych – próba wyciągnięcia prostej średniej z wszystkich stacji pomiarowych, bez uwzględnienia gęstości rozmieszczenia owych stacji, prowadzi do powstania szeregu artefaktów. Można to zobaczyć na przykładzie poniżej:

Rys. 1: Rozmieszczenie stacji wchodzących w skład bazy ECA&D

Jak widać stacje rozmieszczone są bardzo nierównomiernie – widać to szczególnie na przykładzie Holandii, czy Irlandii., gdzie ich ilość jest znacznie większa, niż na innych obszarach. W przypadku wyciągania prostej średniej arytmetycznej z wszystkich stacji otrzymamy artefakt – dane z małego obszaru będą mocno rzutowały na średnią całego obszaru. Gridowanie danych pozwala ominąć ten problem – wszystkie parametry z danych stacji są wrzucane na siatkę (grid), do tzw. gridboxów o jednakowym rozmiarze. Wartość danego parametru w gridboxie jest średnią wartością dla wszystkich stacji wchodzących do tego gridboxa.

Zbieranie i gridowanie danych w przypadku E-OBS szczegółowo opisano w Haylock et al. [1]. Można tam znaleźć istotne informacje – m.in. to, iż do wyliczenia średniej miesięcznej temperatury (i sum opadu) wyznaczono tylko te stacje, w których ilość braków danych w miesiącu nie przekracza 20%. Próg 20% został uznany za wystarczająco wysoki, by usunięciu z serii nie uległa zbyt duża liczba stacji i jednocześnie wystarczająco niski, by nie wprowadzać zbytniej nieścisłości w serii.

W celu stworzenia wynikowych gridów o rozdzielczości 0.25° i 0.50° w pierwszym kroku utworzono obróconą siatkę o rozdzielczości 0.1°x0.1° z „Biegunem Północnym” ulokowanym na 162W, 39.25N. Taka obrócona siatka (rotated grid) została wybrana w celu uzyskania niemal równego odstępu pomiędzy węzłami siatki na badanym obszarze. Wybór ten pozwolił również na osiągnięcie maksymalnego pokrycia przestrzennego przy minimalnej ilości gridboxów, tym samym zwiększenie wydajności obliczeniowej. Użycie zwykłej siatki wiązałoby się z większą gęstością siatki na północy Europy i mniejszą na południu. Dodatkowo obrócona siatka zgodna jest z wieloma regionalnymi modelami klimatycznymi.

Zmianie ulegała liczba stacji wchodzących w skład serii. W 1950 było to zaledwie nieco ponad 100 stacji mierzących temperaturę powietrza. W 1960 liczba ta przekraczała już znacznie 500 stacji. Liczba ta swe maksimum osiągnęła przed rokiem 2000, kiedy to w skład serii wchodziło ponad 1000 stacji. Od tej pory liczba stacji spadła do około 500. Brak świeżych danych wyjaśnić można m.in. długimi procesami kontroli jakości. Należy zwrócić uwagę, że baza E-OBS ulega ciągłym modyfikacjom. Od czasu opublikowania artykułu [1] minęło ponad 2 lata, podczas których liczby te uległy zmianie. Znaczące są również opisane problemy, z jakimi spotkał się zespół tworzący E-OBS w samych początkach pracy (luty 2005). Okazało się bowiem, że dysponują oni zbyt małą ilością stacji (około 250), by otrzymać jakikolwiek sensowny wynik. Dopiero po pewnym czasie dane zostały uzupełnione w zadowalającym stopniu.

Seria E-OBS charakteryzuje się również tym, iz oszacowano w niej błędy interpolacji – szczegóły w [1].

Jak już wspomniano, baza ECA&D zawiera informacje o historii stacji – przykładem takich metadanych mogą być na przykład informacje na temat Karlstad, czy też Brocken. Takie informacje są szalenie istotne, jeśli chcemy mieć pełny obraz konkretnej serii danych – bez tego bardzo trudno byłoby określić przyczyny potencjalnie wykrytych nieciągłości w serii. Po przykład daleko sięgać nie trzeba. Wystarczy odnieść się do pracy Legras et al.[2] gdzie poddano pod wątpliwość wykryte przez Le Mouël et al. [3] zależności pomiędzy zmianami aktywności Słońca a przebiegiem temperatury w wybranych stacjach. Przytaczany w [2] przykład nienaturalnej zmiany w przebiegu temperatury maksymalnej w Bolonii jest dość znaczący.

Rys. 2 Zmiany temperatury w Bolonii.

Rys. 2 przedstawia przebieg temperatur w Bolonii w latach 1814-2006. W przebiegu tym widać znaczny wzrost temperatury maksymalnej w latach 1865-1880, nie idący w parze z podobnym wzrostem temperatury minimalnej. W metadanych istnieje choć część informacji mogących rozwiązać ów problem. Po pierwsze, w 1867 roku zmieniono rodzaj instrumentu, po drugie w 1881 roku zmianie uległa lokalizacja stacji (tej informacji nie znajdziemy już w metadanych, jest to wyniki osobistego dochodzenia Legrasa).

Istnienie takich niehomogeniczności w zbiorze danych może spowodować wyciąganie błędnych wniosków i dostrzeganie korelacji tam, gdzie w rzeczywistości ich brak. Więcej na ten temat na Real Climate.

W połowie zeszłego roku pojawiła się również odpowiedź Kossobokova i Le Mouëla na zarzuty Legrasa. Jednak, jak wskazuje Tamino, sprawa nie jest taka prosta.

Porównanie danych

Na blogu prowadzę serię wpisów przedstawiających zmiany temperatury w Europie Środkowej, zdefiniowanej jako obszar pomiędzy 10E, 25E i 45N, 55N. Aktualnie możliwe jest porównanie moich własnych obliczeń z bazą danych E-OBS. Zaletą korzystania z bazy E-OBS jest szybkie i łatwe generowanie obrazów anomalii dla dowolnego obszaru Europy dla dowolnego okresu bazowego.

Rys. 3a. Średnie odchylenie temperartury w Europie Środkowej w styczniu 2011 (moje wyliczenia)

Rys. 3b. Średnie odchylenie temperatury w styczniu 2011 (E-OBS)
Rys. 4a. Średnie odchylenie temperatury w Europie Środkowej w grudniu 2010 (moje obliczenia).
Rys. 4b. Średnie odchylenie temperatury w Europie Środkowej w grudniu 2010 (E-OBS).

Jak widać rysunkach 3 i 4 a-b, różnice pomiędzy moją serią, a danymi EOBS są niewielkie – są one przede wszystkim spowodowane faktem, iż moja seria jest znacznie uboższa od tej, którą dysponuje E-OBS, jak i tym, w jaki sposób GrADS interpoluje dane ze stacji. Zgodność serii najlepiej widać w wynikach gridowania.

Rys. 5. Różnice pomiędzy CEU (moje wyliczenia) a E-OBS (12-to miesięczne średnie ruchome odchylenia od normy)
Rys. 6. Wartość różnicy CEU - E-OBS (12-to miesięczne średnie ruchome)

Wyniki (Rys. 5, 6) ewidentnie wskazują na wysoką zgodność mojej serii z danymi E-OBS. Widoczne różnice wahające się od -0.15 do +0.15 tłumaczyć można różnym doborem stacji oraz odmienną siatką – E-OBS korzysta z siatki 0.25°, natomiast moje wyniki zostały wygenerowane w oparciu o siatkę 2.5°. W ostatnich miesiącach różnica ta osiągnęła -0.15° (za 12 miesięcy do listopada 2010) – jest to efekt dużej rozbieżności, która pojawiła się pomiędzy seriami w ostatnich kilkunastu miesiącach, głównie w listopadzie 2010. Wg moich danych średnie odchylenie dla obszaru CEU wyniosło+2.11, z kolei wg danych E-OBS było to +2.50. W ostatnich miesiącach (grudzień 2010 i styczeń 2011) różnice te były znacznie mniejsze (kolejno -0.03° i -0.06°).

Zaletą gridowanej wersji ECA&D jest również możliwość szybkiego porównania zmian norm klimatycznych dla danego miesiąca w różnych okresach bazowych.

Rys 7a. Średnia temperatura lipca w okresie 1961-1990
Rys. 7b. Średnia temperatura lipca w okresie 1981-2010
Rys. 7c. Wartość różnicy w średnich temperaturach lipca pomiędzy okresem 1981-2010 a 1961-1990. Kliknij, aby powiększyć.

Rysunki 7a – 7c pokazują różnice w średniej temperaturze lipca w różnych okresach bazowych (1961-1990, 1981-2010). Te różnice wskazują na postępujące ocieplenie lipca w kolejnych wieloleciach.

Pobieranie danych

Dane meteorologiczne w dobowej rozdzielczości można pozyskać stąd. Należy tylko pamiętać, by wybierać serię „blended”. Część danych z brakujących stacji można uzyskać tutaj. Dla pobrania gridowanych danych w formacie netcdf wymagana jest rejestracja. Należy pamiętać, że pliki netcdf są bardzo duże – cała seria z lat 1950-2010 to spakowany plik netcdf o wielkości ~1GB, który po rozpakowaniu będzie miał wielkość ponad 4GB.

Przetworzone dane online

Zbiór już przetworzonych map znajduje się tutaj. Będzie on uaktualniany w razie pojawienia się świeżych danych. Dodatkowo od tego momentu na blogu będą pojawiać się analizy rozszerzone o dane E-OBS.

Dodatkowo stworzono serię średnich dobowych temperatur powietrza dla kilku obszarów zdefiniowanych jako:

  • POL (Polska) 14E-24E,49N-55N
  • CEU (Europa Środkowa) 10E-25E, 45N-55N
  • EEU (Europa Wschodnia) 25E-45E, 47N-58N
  • WEU (Europa Zachodnia) 11W-10E, 45N-59N
  • NEU (Europa Północna) 5E-41E,55N-72N
  • EU (Europa) 25W-60E, 28N-72N

Dane te (średnie dobowe temperatury powietrza) znajdują się tutaj. Nie zostały one jednak przeze mnie jeszcze analizowane.

Wpis ten jest rozszerzoną i poprawioną wersją artykułu ze strony głównej.


[1]
Haylock, M., Hofstra, N., Klein Tank, A., Klok, E., Jones, P., & New, M. (2008). A European daily high-resolution gridded data set of surface temperature and precipitation for 1950–2006 Journal of Geophysical Research, 113 (D20) DOI: 10.1029/2008JD010201

[2]
Legras, B., Mestre, O., Bard, E., & Yiou, P. (2010). A critical look at solar-climate relationships from long temperature series Climate of the Past, 6 (6), 745-758 DOI: 10.5194/cp-6-745-2010

[3]
Le Mouël, J., Kossobokov, V., & Courtillot, V. (2010). A solar pattern in the longest temperature series from three stations in Europe Journal of Atmospheric and Solar-Terrestrial Physics, 72 (1), 62-76 DOI: 10.1016/j.jastp.2009.10.009

Print Friendly, PDF & Email
0 0 votes
Article Rating
Subscribe
Powiadom o
3 komentarzy
Inline Feedbacks
View all comments
wezyr

super mapka.fajnie by było zobaczyć mapkę wartość różnicy w średnich temperaturach pomiędzy okresem 1981-2010 a 1961-1990 dla miesiąca stycznia.No cóż, apetyt rośnie w miarę jedzenia:)

wezyr

dzięki bardzo.jedna mapka a tyle mówi.

3
0
Would love your thoughts, please comment.x