The Livonian-Estonian-Latvian Dictionary as a threshold to the era of language technological applications

  • Jack Rueter Department of Modern Languages, University of Helsinki
Keywords: Livonian, Uralic languages, “Kone” language programme, open-source, language-independent infrastructure, HFST, Giellatekno, morphological parser, spellcheckers, morphology-savvy web dictionary, intelligent computer-assisted language learning

Abstract

This article outlines the multiple use of electronic source materials from the Livonian-Estonian-Latvian Dictionary of 2012 in a “Kone Foundation” funded project for developing finite-state morphological parsers. It provides an introduction to the project, the language-independent Giellatekno infrastructure at Tromsø, Norway, and the materials utilized in the electronic manuscript of the dictionary. The introduction is followed by an extensive description of what has been developed on the Giellatekno infrastructure with explicit indications of where parallel projects might be initiated.

Kokkuvõte. Jack Rueter: Liivi-eesti-läti sõnaraamat lävepakuna keeletehnoloogiliste rakenduste ajastusse. Artikkel annab ülevaate elektroonilise lähtematerjali “Liivi-eesti-läti sõnaraamat 2012” mitmekülgsest kasutamisest Kone fondi rahastatud projektis morfoloogiliste analüsaatorite arendamiseks. Artikli sissejuhatav osa esitab sissevaate projekti ning Tromsøs loodud keelest sõltumatusse Giellatekno taristusse; tutvustatakse ka sõnastiku elektroonilises käsikirjas kasutatud materjale. Seejärel kirjeldatakse Giellatekno tarkvara arendusega loodud võimalusi ning tuuakse näiteid sellest, kuidas saab sarnaseid projekte algatada.

Märksõnad: liivi keel, uurali keeled, Kone keeleprogramm, avatud lähtekood, keelest sõltumatu infrastruktuur, HFST, Giellatekno, morfoloogiline analüsaator, õigekirjakontroll, “Morphology-savvy” veebisõnastik, arvutipõhine keeleõpe

Kubbõvõttõks. Jack Rueter: Līvõkīel-ēstikīel-lețkīel sõnārǭntõz nemē kīeltehnolōgilizt kȭlbatimizt āiga kīndõks. Kēra āndab iļļõvaņtļimiz iļ “Līvõkīel-ēstikīel-lețkīel sõnārǭntõ” amāpūoļiz kȭlbatõmiz, laz kazāntõg loptõb morfolōgiliži analīzijidi. Sīe projektrǭ āndaji um Kone fond. Kēra klīerõb īžpīlijizt Giellatekno infrastruktūrõ, mis um lūodõd Tromsøs Norvēgjis, ja sõnārǭntõ elektrōnilizõs kädkēras kȭlbatõd materiālidi. Nei īž kēra nīžõb iļ võimizt, mis tarmõb Giellatekno lūodõd programvīļa ja nägțõb, kui tämvītliži projektidi võib irgtõ.

Published
2014-07-01