hide
Free keywords:
adjective, universal dependencies, frequency, typology, relativizer, copula
Abstract:
The adjective has always been a puzzle despite the long-standing discussion in the previous literature, e.g., [Chomsky 1970; Dixon 1982]. Cross-linguistically, a substantial variation can be observed regarding the syntactic behavior of adjectives. Adjectives are more noun-like in some languages, while more verb-like in other languages [Wetzer 1992, 1996]. In some languages, adjectives are marked by a copula when used as predicates, while in other languages adjectives are used as predicates without any further marking. Likewise, adjectives behave differently across languages when used as modifiers.
The aim of this study is twofold. The first aim is to explain the cross-linguistic coding pattern of adjectives with reference to the form-frequency correspondence hypothesis [Zipf 1935; Haspelmath 2008; Haspelmath et al. 2014; Haspelmath 2021]. The second aim is to test the hypothesis, using cross-linguistic corpus data from the Universal Dependencies Corpora [Nivre et al. 2017] and the BCC Mandarin Corpus [Xun et al. 2016].
According to the form-frequency correspondence hypothesis, the more frequent forms are less likely to be marked with extra markers. Within the realm of adjectives, the effect of the form-frequency correspondence hypothesis can be understood as follows. Firstly, the relative frequency of the attributive use of adjectives correlates negatively with the probability of their co-occurrence with a relativizer; secondly, the relative frequency of the predicative use of adjectives correlates negatively with the probability of their co-occurrence with a copula. These hypotheses are tested using the logistic regression model on the basis of an 84-language sample from the Universal Dependencies Corpora, which is a suitable database for the purposes of the present study because it has cross-linguistically consistent annotation for parts of speech and their syntactic contexts. In addition, I have also tested the form-frequency correspondence hypothesis based on the data from the BCC Mandarin Chinese Corpus based on the frequency of different adjectives. These results have provided positive evidence for the form-frequency correspondence hypothesis.
Abstract:
Аннотация. Несмотря на то, что статус прилагательного обсуждается в ли-
тературе уже достаточно давно (см., например, [Chomsky 1970; Dixon 1982]), для
исследователей эта область до сих пор остается проблемной. Прилагательные
характеризуются значительной типологической вариативностью с точки зрения
синтаксиса. Если в одних языках они обнаруживают преимущественно имен-
ные свойства, то в других они скорее ведут себя, как глаголы [Wetzer 1992, 1996].
Так, в языках первого типа прилагательные, выступающие в качестве предика-
тов, требуют глагола-связки, в то время как в языках второго типа они высту-
пают в этой позиции без какого-либо дополнительного маркирования. Анало-
гичным образом прилагательные, выступающие в качестве определений, ведут
себя в разных языках по-разному.
В настоящем исследовании решаются две задачи. Первая из них заключается
в том, чтобы объяснить формальные свойства прилагательных в разных языках
с опорой на гипотезу о наличии корреляции между формой и частотностью [Zipf
1935; Haspelmath 2008; Haspelmath et al. 2014; Haspelmath 2021]. Вторая задача
заключается в том, чтобы протестировать эту гипотезу на материале различных
языков, используя данные корпусов Universal Dependencies Corpora [Nivre et al.
2017], а также BCC Mandarin Corpus [Xun et al. 2016].
Согласно гипотезе о наличии корреляции между формой и частотностью,
более частотные формы с меньшей вероятностью присоединяют дополнитель-
ные показатели. В области прилагательных эта гипотеза может быть сформу-
лирована следующим образом. Во-первых, предполагается, что относительная
460 Acta Linguistica Petropolitana. 17.1
частотность атрибутивного употребления прилагательного находится в отри-
цательной корреляции с вероятностью маркирования этого прилагательного
при помощи релятивизатора; во-вторых, предполагается, что относительная
частотность предикативного употребления прилагательного находится в от-
рицательной корреляции с вероятностью употребления этого прилагательного
с глаголом-связкой. Выдвинутые предположения проверяются методом логи-
стической регрессии на материале выборки из 84 языков, входящих в корпуса
Universal Dependencies Corpora: эта база данных представляется подходящей
для целей настоящего исследования, поскольку она содержит типологически
последовательную аннотацию частеречной принадлежности единиц, а также
синтактических контекстов, в которых они употребляются. Кроме того, я про-
тестировала рассматриваемую гипотезу на материале корпуса BCC Mandarin
Chinese Corpus, опираясь на частотность прилагательных. Результаты иссле-
дования подтверждают гипотезу о наличии корреляции между формой и ча-
стотностью.