The alternation between exterior locative cases and postpositions in Estonian web texts


locative cases, postpositions, constructional alternatives, language variation, probabilistic grammar, mixed models, Estonian, kohakäänded, kaassõnad, süntaktiline varieerumine, keele varieerumine, tõenäosuslik grammatika, segamudelid, eesti keel


Abstract. A probabilistic grammar approach to language assumes that grammatical knowledge has a probabilistic component and that this probabilistic knowledge of language is derived from language experience. It is assumed that the extent and nature of grammatical knowledge is reflected in language variation. In the present paper, the probabilistic variation patterns of the Estonian exterior locative cases and the corresponding postpositions are determined by exploring a large, manually annotated dataset of Estonian web texts. It is proposed that there are both similarities and differences in the morphosyntactic knowledge on the part of Estonian speakers as pertains to the three alternations: allative ~ peale ‘onto’, adessive ~ peal ‘on’, ablative ~ pealt ‘off’. The study points towards the stability and direction of the factors that have been found significant in the previous studies. Multivariate analysis of corpus data shows that the grammatical knowledge of Estonian exterior cases and the corresponding postpositions is probabilistic and regulated by both morphosyntactic and semantic factors.

Kokkuvõte. Jane Klavan: Eesti keele väliskohakäänete ja kaassõnade peal, peale, pealt kasutus eestikeelses veebis. Tõenäosusliku grammatika raamistikus eeldatakse, et grammatiline teadmine hõlmab endas tõenäosuslikku komponenti ja et see tõenäosuslik komponent pärineb suures osas keele kasutuse kogemusest. Sellistelt põhimõtetelt lähtuvate uurimuste eesmärgiks on mõõta grammatilise teadmise ulatust ja olemust nagu see peegeldub keelelises varieeruvuses. Esitan suuremahulise korpusuurimuse eesti keele väliskohakäänete ja nendega rööpselt tarvitatavate kaassõnade (peale, peal, pealt) paralleelsest kasutusest eestikeelsetel veebilehtedel. Korpusandmete multifaktoriaalne analüüs näitab, et grammatiline teadmine sellest rööpsest kasutusest on tõenäosuslik ja et seda reguleerivad nii morfosüntaktilised kui semantilised tegurid.


