Abstract
In diesem Papier diskutieren wir theoretisch-methodologische Grundlagen zur Analyse so genannter Vollerhebungen,
also Datensätze, die Beobachtungen aller Elemente einer Population enthalten. Solche Datensätze
spielen vor allem in quantitativen Makro-Analysen politischer und sozialer Systeme eine Rolle, und ihre inhärenten
Probleme führen oft zu methodischer Verwirrung, die wir mit dem vorliegenden Essay verringern
wollen. Da Vollerhebungen nicht das Resultat einer Zufallsstichprobe sind, ist die Anwendung frequentistischer
Wahrscheinlichkeitskonzeptionen zur Begründung inferentieller statistischer Methoden nicht gegeben;
außerdem kann die statistische Unabhängigkeit der Beobachtungen voneinander nicht ohne weiteres angenommen
werden. Dennoch werden Vollerhebungsdaten durch stochastische Komponenten oder „Fehler“ beeinflusst.
Wir argumentieren, dass die Stochastizität der Daten in die Analyse einbezogen werden muss, etwa
in Form von Parameter-Varianzen, Signifikanztests, oder Konfidenzintervallen. Wir diskutieren verschiedene
theoretische Strategien, mit denen Analysen der Stochastizität begründet werden können, wobei wir vor allem
für die Annahme von Superpopulationen oder die Anwendung bayesianischer Ansätze plädieren.
This paper discusses the theoretical and methodological foundation for the analysis of apparent populations,
i.e., data sets that include observations of all elements of a population. Such data sets are commonly used in
quantitative macro studies of political or social systems. Our essay tries to reduce methodological problems
resulting from the fact that apparent population data are not the result of random sampling designs. First, the
lack of random sampling prevents the use of the frequentist interpretation of probability commonly employed
to justify inferential statistical methods. Second, with apparent populations, we cannot assume that observations
are statistically independent. We argue that apparent population data are subject to a variety of stochastic
processes, or “errors,” that have to be part of the analysis, for example through the investigation of parameter
variances, significance tests, or confidence intervals. We discuss several theoretical strategies to justify
the analysis of stochastic components of apparent populations, emphasizing in particular the concept of
superpopulations and the usefulness of Bayesian approaches.