The role of corpora in the work of the Language Consulting Service of the HUN-REN Hungarian Research Centre for Linguistics




language consulting, corpora, corpus querying, spelling problems, language use problems, Hungarian, keelenõustamine, korpused, korpuspäringud, keelekasutusprobleemid, õigekirjaprobleemid


Relying on Language Management Theory, the paper presents the use of corpus data in language consulting through the work of the Language Consulting Service (LCS) of the HUN-REN Hungarian Research Centre for Linguistics. In the development of language advice, it is essential to take into account the linguistic background, to apply a data-driven approach and, in some cases, to provide access to linguistic data related to specific language problems. The research is based on the LCS database of approximately 10,000 emails, and examines questions whose answering by language consultants was informed by a corpus-based investigation (124 inquiries). The results show that the use of corpus query interfaces is wellsuited for answering complex linguistic questions and for describing the usage of particular expressions. On the other hand, corpus data are rarely needed for answering questions on orthography, which constitute the bulk of inquiries that the LCS receives. In answering spelling questions, the basic aim is to communicate the spelling norm, thus the examination of usage is only necessary when spelling codification is absent or inconsistent. The paper presents a case study on a specific language use issue from the database, highlighting in detail the strategy used in the development of language advice, with a particular focus on the appropriate use of corpus query interfaces.

Kokkuvõte. Zsófia Ludányi: Korpuste roll HUN-REN Ungari keeleteaduse uurimiskeskuse keelenõustamisteenistuse töös. Keelekorraldusteooriale tuginedes tutvustab artikkel korpusandmete kasutamist keelenõustamisel Ungari Keeleteaduse Uurimiskeskuse HUN-REN keelenõustamisteenistuse (LCS) tegevuse näitel. Keelenõuteenuse arendamisel on oluline arvestada keeleteadusliku taustaga, rakendada andmepõhist lähenemist ning teatud juhtudel võimaldada juurdepääs konkreetsete keeleprobleemide lahendamiseks vajalikele keeleandmetele. Uuring põhineb LCS-i ligikaudu 10 000 e-kirjast koosneval andmebaasil ning analüüsib küsimusi, millele vastamisel keelenõustajad kasutasid korpuspõhiseid meetodeid (124 päringut). Tulemused näitavad, et korpusepäringute kasutamine on tõhus keeruliste keeleküsimuste lahendamisel ja spetsiifiliste väljendite kasutuse kirjeldamisel. Samas on korpusandmete kasutamine harva vajalik ortograafiaga seotud küsimuste puhul, mis moodustavad suure osa LCS-ile esitatavatest päringutest. Õigekirjaküsimustele vastamisel on peamine eesmärk edastada kehtiv õigekirjareegel, seega on kasutusuuringud vajalikud vaid siis, kui õigekirjareegel puudub või on ebajärjekindel. Artiklis tuuakse näitena välja juhtumiuuring ühest konkreetsest keelekasutusprobleemist andmebaasis, kirjeldades detailselt keelenõuannete väljatöötamiseks kasutatud strateegiat, keskendudes eriti korpusepäringute asjakohasele kasutamisele.


How to Cite

Ludányi, Z. (2024). The role of corpora in the work of the Language Consulting Service of the HUN-REN Hungarian Research Centre for Linguistics. Eesti Ja Soome-Ugri Keeleteaduse Ajakiri. Journal of Estonian and Finno-Ugric Linguistics, 15(2), 47–73.


