Pogoda i Klimat

...modelowanie numeryczne

Monday, 21 February 2011 07:48

Dane obserwacyjne z Europy Featured

Written by 
Rate this item
(0 votes)

{jcomments on}

Aby jednoznacznie określić obecność jakichkolwiek trendów temperatury w zmieniającym się badź co bądź klimacie potrzebna jest jednorodna (homogeniczna) seria danych, najlepiej z maksymalnie dużej ilości stacji. Wiele osób, które chcą zbadac zmienność temperatury w czasie, natrafia na duży problem ze znalezieniem danych, a nawet jeśli zbiorą wystarczającą ilość danych potrzebnych do stworzenia serii, powstaje problem określenia homogeniczności owych danych.

 

Używanie surowych danych może prowadzić do wykrycia trendów, czy korelacji tam, gdzie one w rzeczywistości nie wystepują, to z kolei prowadzić może do wyciągnięcia błednych wniosków o charakterze zmian klimatycznych, jakie miały miesjce w ostatnich stu, czy dwustu latach.

Szeroko dostępne i znane zbiory danych w postaci bazy GHCN, czy opublikowanej serii danych z CRU nie pozwalają na jednoznaczne stwierdzenie homogeniczności serii, brakuje bowiem tzw. metadanych, w których zawarte byłyby informacje o działaniach mogących mieć poważny wpływ na pomiar - takimi działaniami mogą być na przykład zmiany urządzeń pomiarowych, lokalizacji stacji, terminów obserwacji, sposobu liczenia średniej temperatury, czy wreszcie postępująca urbanizacja obszaru w bezpośrednim otoczeniu stacji. Każde z tych działań powoduje, że seria danych staje się nieciągła - niehomogeniczna. Nieciągłości te można wyeliminować chociażby poprzez porównywanie serii danych ze stacji sąsiadujących - wprowadzenie zmian na jednej z nich zwykle skutkuje widocznymi zmianami w przebiegu różnic pomiędzy tymi stacjami.

Znacznie lepszym sposobem jest prowadzenie przez pewien czas obserwacji równoległych (z użyciem obu przyrządów pomiarowych, lub w obu miejscach, jeśli lokalizacja stacji uległa zmianie), co pozwala na jednoznaczne określenie różnic w pomiarach w celu ich wyeliminowania. Jest to jednak niemożliwe w przypadku zwykłego "poszukiwacza danych". Ten ostatni musi albo samemu wykonać tytaniczną (i raczej skazaną na niepowodzenie) pracę polegającą na homogenizacji serii, albo polegać na danych surowych, z nadzieją że uśrednienie wartości z większego obszaru pośrednio wyeliminuje problem.

Innym rozwiązaniem jest powołanie się na dane już przetworzone, w których określona została homogeniczność danych - i w rzeczy samej istnieje zbiór danych, który nie dość że został częściowo poddany homogenizacji, to dodatkowo w wielu przypadkach posiada informacje na temat historycznych zmian dokonywanych na danej stacji. Zbiór ten został przygotowany przez European Climate Assessment i warto mu się przyjrzeć nieco bliżej.

Zbiór ECA&D składa się z dwóch podzbiorów. Jednym z nich jest zbiór danych określonych jako "non-blended" - dane przesyłane przez państwa biorące udział w projekcie zwykle nie są kompletne, szczególnie dane najnowsze (głównie z uwagi na czas, jaki musi być poświęcony na kontrolę jakości). Brakujące dane są uzupełniane w oparciu o depesze synoptyczne, lub uzupełniane danymi z innych stacji (oczywiście z zachowaniem odpowiednich procedur) jeśli stacje te położone są w odległości nie większej, niż 25 km, a różnica wysokości położenia stacji nie przekracza 50m. [1] Tak uzupełniona ("wymieszana") seria danych nosi nazwę blended.

Dalsze przetwarzanie danych oparto właśnie o serię blended. Dane te zostały poddane całej serii testów kontroli jakości, szerzej opisanej w tym dokumencie. Na podstawie serii ECA&D stworzono również wersję gridowaną, nazwaną E-OBS. Seria ta powstała specjalnie z myślą o użyciu w regionalnych modelach klimatycznych, oraz w analizie zmian klimatycznych. Rozmiar siatki to 0.25 lub 0.50 stopnia, jest więc to siatka dość gęsta. Umieszczanie danych na takiej siatce eliminuje problem nierównomiernego rozmieszczenia stacji pomiarowych - próba wyciągnięcia prostej średniej z wszystkich stacji pomiarowych, bez uwzględnienia gęstości rozmieszczenia owych stacji, prowadzi do powstania szeregu artefaktów. Można to zobaczyć na przykładzie poniżej:

rozmieszczenie stacji

Rys. 1: Rozmieszczenie stacji wchodzących w skład bazy ECA&D

Jak widać stacje rozmieszczone są bardzo nierównomiernie - widać to szczególnie na przykładzie Holandii, czy Irlandii., gdzie ich ilość jest znacznie większa, niż na innych obszarach. W przypadku wyciągania prostej średniej arytmetycznej z wszystkich stacji otrzymamy artefakt - dane z małego obszaru będą mocno rzutowały na średnią całego obszaru. Gridowanie danych pozwala ominąć ten problem - wszystkie parametry z danych stacji są wrzucane na siatkę (grid), do tzw. gridboxów o jednakowym rozmiarze. Wartość danego parametru w gridboxie jest średnią wartością dla wszystkich stacji wchodzących do tego gridboxa.

Zbieranie i gridowanie danych w przypadku E-OBS szczegółowo opisano w Haylock et al. [1]. Można tam znaleźć istotne informacje - m.in. to, iż do wyliczenia średniej miesięcznej temperatury (i sum opadu) wyznaczono tylko te stacje, w których ilość braków danych w miesiącu nie przekracza 20%. Próg 20% został uznany za wystarczająco wysoki, by usunięciu z serii nie uległa zbyt duża liczba stacji i jednocześnie wystarczająco niski, by nie wprowadzać zbytniej nieścisłości w serii.

W celu stworzenia wynikowych gridów o rozdzielczości 0.25° i 0.50° w pierwszym kroku utworzono obróconą siatkę o rozdzielczości 0.1°x0.1° z "Biegunem Północnym" ulokowanym na 162W, 39.25N. Taka obrócona siatka (rotated grid) została wybrana w celu uzyskania niemal równego odstępu pomiędzy węzłami siatki na badanym obszarze. Wybór ten pozowlił również na osiągnięcie maksymalnego pokrycia przestrzennego przy minimalnej ilości gridboxów, tym samym zwiększenie wydajności obliczeniowej. Użycie zwykłej siatki wiązałoby się z większą gęstością siatki na północy Europy i mniejszą na południu. Dodatkowo obrócona siatka zgodna jest z wieloma regionalnymi modelami klimatycznymi.

Zmianie ulegała liczba stacji wchodzących w skład serii. W 1950 było to zaledwie nieco ponad 100 stacji mierzących temperaturę powietrza. W 1960 liczba ta przekraczała już znacznie 500 stacji. Liczba ta swe maksimum osiągnęła przed rokiem 2000, kiedy to w skład serii wchodziło ponad 1000 stacji. Od tej pory liczba stacji spadła do około 500. Brak świeżych danych wyjaśnić można m.in. długimi procesami kontroli jakości. Należy zwrócić uwagę, że baza E-OBS ulega ciągłym modyfikacjom. Od czasu opublikowania artykułu [1] minęło ponad 2 lata, podczas których liczby te uległy zmianie. Znaczące są również opisane problemy, z jakimi spotkał się zespół tworzący E-OBS w samych początkach pracy (luty 2005). Okazało się bowiem, że dysponują oni zbyt małą ilością stacji (około 250), by otrzymać jakikolwiek sensowny wynik. Dopiero po pewnym czasie dane zostały uzupełnione w zadowalającym stopniu.

Seria E-OBS charakteryzuje się również tym, iz oszacowano w niej błędy interpolacji - szczegóły w [1].

Jak już wspomniano, baza ECA&D zawiera informacje o historii stacji - przykładem takich metadanych mogą być na przykład informacje na temat Karlstad, czy też Brocken. Takie informacje są szalenie istotne, jeśli chcemy mieć pełny obraz konkretnej serii danych - bez tego bardzo trudno byłoby określić przyczyny potencjalnie wykrytych nieciągłości w serii. Po przykład daleko sięgać nie trzeba. Wystarczy odnieść się do pracy Legras et al.[2] gdzie poddano pod wątpliwość wykryte przez Le Mouel et al. [3] zależności pomiędzy zmianami aktywności Słońca a przebiegiem temperatury w wybranych stacjach. Przytaczany w [2] przykład nienaturalnej zmiany w przebiegu temperatury maksymalnej w Bolonii jest dość znaczący.

Bologna temp

Rys 2. Zmiany temperatury w Bolonii.

Rys 2 przedstawia przebieg temperatur w Bolonii w latach 1814-2006. W przebiegu tym widać znaczny wzrost temperatury maksymalnej w latach 1865-1880, nie idący w parze z podobnym wzrostem temperatury minimalnej. W metadanych istnieje choć część informacji mogących rozwiązać ów problem. Po pierwsze, w 1867 roku zmieniono rodzaj instrumentu, po drugie w 1881 roku zmianie uległa lokalizacja stacji (tej informacji nie znajdziemy już w metadanych, jest to wyniki osobistego dochodzenia Legrasa).

Istnienie takich niehomogeniczności w zbiorze danych może spowodować wyciąganie błędnych wniosków i dostrzeganie korelacji tam, gdzie w rzeczywistości ich brak. Więcej na ten temat na Real Climate.

Porównanie danych

Na blogu prowadzę serię wpisów przedstawiających zmiany temperatury w Europie Środkowej, zdefiniowanej jako obszar pomiędzy 10E, 25E i 45N, 55N. Aktualnie możliwe jest porównanie moich własnych obliczeń z bazą danych E-OBS. Zaletą korzystania z bazy E-OBS jest szybkie i łatwe generowanie obrazów anomalii dla dowolnego obszaru Europy dla dowolnego okresu bazowego.

 

Cru_jan2011

Rys 3a. Średnie odchylenie temperartury w Europie Środkowej w styczniu 2011 (moje wyliczenia)

ja2011_eobs

Rys 3b. Średnie odchylenie temperatury w styczniu 2011 (E-OBS)

cru_dec2010

Rys 4a. Średnie odchylenie temperatury w Europie Środkowej w grudniu 2010 (moje obliczenia).

eobs_dec2010

Rys 4b. Średnie odchylenie temperatury w Europie Środkowej w grudniu 2010 (E-OBS).

Jak widać rysunkach 3 i 4 a-b, różnice pomiędzy moją serią, a danymi EOBS są niewielkie - są one przede wszystkim spowodowane faktem, iż moja seria jest znacznie uboższa od tej, którą dyspionuje E-OBS, jak i tym, w jaki sposób GrADS interpoluje dane ze stacji. Zgodność serii najlepiej widać w wynikach gridowania.

ceueobs

Rys 5. Porównanie wyników gridowania danych - średnie odchylenia roczne 1950-2010

dla moich danych (czerwona linia), oraz E-OBS (linia niebieska)

Wyniki (Rys. 5) ewidentnie wskazują na wysoką zgodność mojej serii z danymi E-OBS.

Zaletą gridowanej wersji ECA&D jest również możliwość porównania zmian norm klimatycznych dla danego miesiąca w różnych okresach bazowych.

jul6190

Rys 6a. Średnia temperatura lipca w okresie 1961-1990

jul8110

Rys 6b. Średnia temperatura lipca w okresie 1981-2010

Rysunki 6a i 6b wskazują na różnice w średniej temperaturze lipca w różnych okresach bazowych (1961-1990, 1981-2010). Te różnice wskazują na postępujące ocieplenie lipca w kolejnych wieloleciach.

Pobieranie danych

Dane meteorologiczne w dobowej rozdzielczości można pozyskać stąd. Należy tylko pamiętać, by wybierać serię "blended". Część danych z brakujących stacji można uzyskać tutaj. Dla pobrania gridowanych danych w formacie netcdf wymagana jest rejestracja. Należy pamietać, że pliki netcdf są bardzo duże - cała seria z lat 1950-2010 to spakowany plik netcdf o wielkości ~1GB, który po rozpakowaniu będzie miał wielkość ponad 4GB.

Przetworzone dane online

Zbiór już przetworzonych map znajduje sie tutaj.

 

[1] Haylock, M.R., N. Hofstra, A.M.G. Klein Tank, E.J. Klok, P.D. Jones, and M. New (2008), A European daily high-resolution gridded data set of surface temperature and precipitation for 1950-2006. J. Geophys. Res., 113, D20119, doi:10.1029/2008JD010201.

[2] Legras, B., Mestre, O., Bard, E., and Yiou, P.: A critical look at solar-climate relationships from long temperature series, Clim. Past, 6, 745-758, doi:10.5194/cp-6-745-2010, 2010.

[3] Le Mou¨el, J.-L., Kossobokov, V., and Courtillot, V.: A solar pattern in the longest temperature series from three stations in Europe, J. Atmos. Solar-Terr. Phys., 72, 62–76, doi:10.1016/j.jastp.2009.
10.009, 2010.

Read 15546 times Last modified on Saturday, 13 October 2012 08:40
Login to post comments
You are here: Home Arktyka - Lód Dane Historyczne Dane obserwacyjne z Europy