Advancing non-linear methods for coupled data assimilation across the 
atmosphere-land interface

Finn, Tobias Sebastian

doi:10.17617/2.3381204

Item

ITEM ACTIONSEXPORT

Add to Basket

Local TagsRelease HistoryDetailsSummary

Released

Thesis

Advancing non-linear methods for coupled data assimilation across the atmosphere-land interface

MPS-Authors

Finn, Tobias Sebastian
IMPRS on Earth System Modelling, MPI for Meteorology, Max Planck Society;
Meteorologisches Institut, Universität Hamburg;

External Resource

No external resources are shared

Fulltext (restricted access)

There are currently no full texts shared for your IP range.

Fulltext (public)

BzE_Web_251_Finn.pdf
(Publisher version), 8MB

Supplementary Material (public)

There is no public supplementary material available

Citation

Finn, T. S. (2022). Advancing non-linear methods for coupled data assimilation across the atmosphere-land interface. PhD Thesis, Universität Hamburg, Hamburg. doi:10.17617/2.3381204.

Cite as: https://hdl.handle.net/21.11116/0000-000A-6DE8-7

Abstract

In this thesis, I present two complementary frameworks to improve data assimila-

tion in Earth system models, using the atmosphere-land interface as an exemplary

case. As processes and components in the Earth system are coupled via interfaces,

we would expect that assimilating observations from one Earth system component

into another would improve the initialization of both components. In contrast

to this expectation, it is often found that assimilation of atmospheric boundary

layer observations into the land surface does not improve the analysis of the latter

component. To disentangle the effects on the cross-compartmental assimilation, I

take a step back from operational methods and use the coupled atmosphere-land

modelling platform TerrSysMP in idealized twin experiments. I synthesize hourly

and sparsely-distributed 2-metre-temperature observations from a single "nature"

run. I subsequently assimilate these observations into the soil moisture with dif-

ferent types of data assimilation methods. Based on this experimental structure, I

test advanced data assimilation methods without model errors or biases.

As my ﬁrst framework, I propose to use localized ensemble Kalman ﬁlters for

the uniﬁcation of coupled data assimilation in Earth system models. To validate

this framework, I conduct comparison experiments with a localized ensemble

transform Kalman ﬁlter and a simpliﬁed extended Kalman ﬁlter, as similarly

used at the ECMWF. Based on my developed environment, I ﬁnd that we can

assimilate 2-metre-temperature observations to improve the soil moisture analysis.

In addition, hourly-updating the soil moisture with an ensemble Kalman ﬁlter

decreases the error within the soil moisture analysis by up to 50 % compared to

a daily-smoothing with a simpliﬁed extended Kalman ﬁlter. As a consequence,

observations from the atmospheric boundary layer can be directly assimilated

into the land surface model without a need of any intermediate interpolation,

as normally used in land surface data assimilation. The improvement suggests

that the land surface can be updated based on the same hourly cycle as used

for mesoscale data assimilation. My results therefore prove that a uniﬁcation of

methods for data assimilation across the atmosphere-land interface is possible.

As my second framework, I propose to use feature-based data assimilation to

stabilize cross-compartmental data assimilation. To validate this framework, I use

my implementation of an ensemble Kalman smoother that applies its analysis at

the beginning of an assimilation window and resembles 4DEnVar. This smoother

takes advantage of temporal dependencies in the atmosphere-land interface and

improves the soil moisture analysis compared to the ensemble Kalman ﬁlter by

10 %. Subsequently based on this smoother, I introduce ﬁngerprint operators as

observational feature extractor into cross-compartmental data assimilation. These

ﬁngerprint operators take advantage of characteristic ﬁngerprints in the difference between observations and model that point towards forecast errors, possibly in

another Earth system component. As main ﬁnding, this concept can condense the

information from the diurnal cycle in 2-metre-temperature observations into two

observational features. This condensation makes the soil moisture analysis more

robust against a miss-speciﬁed localization radius and errors in the observational

covariance.

Finally, I provide two new theoretical approaches to automatically learn such

observational features with machine learning. In the ﬁrst approach, I generalize

ensemble Kalman ﬁlter with observational features to a novel kernelized ensemble

transform Kalman ﬁlter.automatically This kernelized ﬁlter automatically con-

structs the feature extractor on the basis of the given ensemble data and a chosen

kernel function. In the second approach, I show that parameters within the data

assimilation can be learned by variational Bayes. In this way, we can ﬁnd whole

distributions for parameters in data assimilation and, thus, determining their un-

certainties. Furthermore, I prove the ensemble transform Kalman ﬁlter as a special

solution of variational Bayes in the linearized-Gaussian case. These results suggest

a possibility to specify the feature extractor as neural network and to train it with

variational Bayes. These two approaches therefore prove that developments in

machine learning can be used to extend data assimilation.

In dieser Arbeit stelle ich zwei unterschiedliche Frameworks vor, um die Ini-

tialisierung in gekoppelten Erdsystemmodellen für die Wettervorhersage zu

verbessern. Dabei benutze ich die Schnittstelle zwischen der Atmosphäre und der

Landoberﬂäche als Beispiel. Diese Schnittstelle bietet mir die Möglichkeit zu unter-

suchen, in wie weit gekoppelte Datenassimilierung möglich ist. Prozesse und Kom-

ponenten des Klimasystems sind über verschiedene Schnittstellen miteinander

verbunden. Von daher würden wir erwarten, dass Beobachtungen aus der atmo-

sphärischen Grenzschicht, auch die Initialisierung von Bodenmodellen verbessern,

allerdings wurde in verschiedenen vorangegangenden Studien gezeigt, dass dies

nicht der Fall ist. Um die Einﬂüsse von unterschiedlichen Fehler-Faktoren auf die

Datenassimilierung zu reduzieren, benutze ich Experimente, die im Vergleich zur

operationellen Wettervorhersage vereinfacht sind. Hierfür benutze ich das gekop-

pelte Atmosphären-Land Vorhersagemodel TerrSysMP. All diese Experimente

basieren auf einem Lauf ohne Datenassimilierung, den ich als meine "Natur"

deﬁniere. Aus diesem Naturlauf extrahiere ich künstliche 2-Meter-Temperatur

Beobachtungen, welche dann mit unterschiedlichen Datenassimilierungsverfahren

in die Bodenfeuchte assimiliert werden. Mit dieser Art von Experimenten teste ich

fortschrittliche und nicht-lineare Datenassimilierungsverfahren für die Atmosphären-

Land-Schnittstelle.

Als erstes Framework schlage ich vor, einen lokalisierten Ensemble-Kalman-Filter

für eine vereinheitlichte Datenassimilierung in Erdsystemmodellen zu verwenden.

Um dieses Framework zu validieren, mache ich Vergleichsexperimente mit dem

eben erwähnten lokalisierten Ensemble-Kalman-Filter und einem vereinfachten

Extended-Kalman-Filter, der in ähnlicher Form beim Europäischen Zentrum für

mittelfristige Wettervorhersage verwendet wird. Basierend auf meiner entwick-

elten Umgebung zeige ich, dass 2-Meter-Temperatur Beobachtungen dafür ver-

wendet werden können, um die Initialisierung der Bodenfeuchte zu verbessern.

Der lokalisierte Ensemble-Kalman Filter reduziert zusätzlich den Fehler in der Ini-

tialisierung der Bodenfeuchte um bis zu 50 %, im Vergleich zu dem vereinfachten

Extended-Kalman-Filter. Dies zeigt zum ersten Mal, dass Beobachtungen aus der

atmosphärischen Grenzschicht, direkt für die Initialisierung der Bodenfeuchte, ver-

wendet werden können, ohne den Umweg einer Interpolierung zu nehmen, wie

es bei dem vereinfachten Extended-Kalman-Filter der Fall ist. Darüberhinausge-

hend legen diese Verbesserungen nahe, dass die Landoberﬂäche mit der gleichen

stündlichen Aktualisierungs-Rate, wie die Atmosphäre, initialisiert werden kann.

Deshalb beweisen diese Ergebnisse, dass eine vereinheitlichte Datenassimilierung

über die Atmosphären-Land-Schnittstelle hinweg möglich ist.

Als zweites Framework schlage ich vor, anstatt von Beobachtungen, Merkmale dieser Beobachtung zu assimilieren. Dies kann die Assimilierung, über die

Atmosphären-Land Schnittstelle hinweg, verbessern. Um dieses Framework zu

validieren, führe ich einen Ensemble-Kalman-Smoother ein. Dieser Ensemble-

Kalman-Smoother initialisiert die Bodenfeuchte auf Basis eines Assimilierungs-

fensters, ähnlich dem variationsgetriebenem vierdimensionellem Verfahren. Mit

diesem Ensemble-Kalman-Smoother zeige ich, dass es möglich ist, zeitliche Ab-

hängigkeiten innerhalb der Atmospähren-Land-Schnittstelle in der Datenassimi-

lierung zu verwenden. Die Verwendung dieser Abhängigkeiten verbessert hierbei

die Initialisierung der Bodenfeuchte. Auf Basis dieser Methodik, führe ich Oper-

atoren ein, die Fingerabdrücke innerhalb von Beobachtungen ausnutzen. Diese

Fingerabdruck-Operatoren nutze ich dafür, um Vorhersage-Fehler in anderen

Komponenten des Erdsystems zu ﬁnden. Für die 2-Meter-Temperatur zeige ich,

dass Informationen aus dem Tagesverlauf der Temperatur in 2 unterschiedliche

Merkmale kondensiert werden können. Diese Kondensation macht die Initial-

isierung der Bodenfeuchte robuster gegen Störungen innerhalb der Lokalisierung

und der Beobachtungskovarianzen. Deshalb beweisen diese Ergebnisse, dass

die eingeführten Fingerabdruck-Operatoren, die Datenassimilierung über die

Atmosphären-Land Schnittstelle hinweg stabilisieren.

Als letzten Punkte führe ich zwei neue, theoretische, Ansätze ein, um solche

Beobachtungsmerkmale automatisch mit maschinellem Lernen zu ﬁnden. In

meinem ersten Ansatz zeige ich, dass der merkmal-basierte Ensemble-Kalman-

Filter unter dem Deckmantel des kernbasierten Ensemble-Transform-Kalman-

Filter generalisiert werden kann. Hierbei lernt die Datenassimilierung automa-

tisch die wichtigsten Beobachtungsmerkmale auf Basis der Ensemble Daten und

einem gewählten Kern. In meinem zweiten Ansatz, zeige ich, dass Parameter

des Ensemble-Kalman Filters mit variationsgetriebenen Bayesianischen Meth-

oden erlernt werden können. Mit dieser Bayesianischen Methode kann die

gesamte Wahrscheinlichkeitsverteilung der Parameter herausgefunden und so

Unsicherheiten, innerhalb dieser, dargestellt werden können. Zusätzlich beweise

ich, dass der Ensemble-Kalman-Filters eine spezielle Lösung dieses Ansatze im

linear-Gaussischen Fall ist. Als Konsequenz, deute ich an, dass wir die Beobach-

tungsmerkmale durch neuronale Netzwerke ersetzen können, die mit Hilfe dieses

Ansatze erlernt werden. Von daher beweisen diese beiden Ansätze, dass Entwick-

lungen im maschinellen Lernen dafür genutzt werden können, um Datenassimi-

lierungsmethoden zu erweitern und möglicherweise zu verbessern.