Please use this identifier to cite or link to this item:
https://er.nau.edu.ua/handle/NAU/62610
Title: | Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitilization and Text Corpora Platform Generation. Part 1 |
Other Titles: | Українська редакція церковно-слов'янської мови (УРЦСМ): Потреба в оцифруванні і створенні платформи корпусів текстів. Частина 1 |
Authors: | Линтвар, Ольга Миколаївна Попович, Наталія Мафтеївна Луцків, Андрій Мирославович Міца, Олександр Володимирович Іванова, Андріана Олександрівна Lyntvar, Olha Popovych, Nataliya Lutskiv, Andriy Mitsa, Oleksandr Ivanova, Andriana |
Keywords: | Ukrainian Redaction of Church Slavonic URCS text analysis platform (software) parallel corpus comparable corpus NLP SketchEngine mova.info LancsBox 6.0 Українська редакція церковно-слов'янської мови платформа (програмне забезпечення) аналізу текстів УРЦСМ паралельний корпус порівнюваний корпус НЛП |
Issue Date: | 2023 |
Publisher: | CEUR Workshop Proceedings |
Citation: | Lyntvar O., Popovych N., Lutskiv A., Mitsa O., Ivanova A. Ukrainian Redaction of Church Slavonic (URCS): Needs for Digitilization and Text Corpora Platform Generation. Part 1 / N. Popovych, A. Lutskiv, O. Mitsa, O. Lyntvar, A. Ivanova // Computational Linguistics and Intelligent Systems. Vol. 2: Computational Linguistics Workshop. Kharkiv, 2023. P. 266-278 |
Abstract: | The article explores the issues of digitalization and possibilities of text corpus generation for the Ukrainian Redaction of Church Slavonic (URCS). This endangered language is still in use in Liturgical Services in certain regions of Ukraine (mostly Zakarpattia and Lviv Regions), as well as on bordering territories of Slovakia, Romania, and Poland. The given research is on its initial stage. It provides a brief overview of the URCS language history, and examines the interconnections between the Ukrainian language and URCS through examples from its usage in the modern Ukrainian language, as well as in Ukrainian literature of different genres and time periods. In addition, (4) the article suggests preservation and conservation approaches and strategies to URCS digitalization, including the creation of the text corpora platform, from both the user and developer perspectives, with the aim of ensuring its survival for future generations. The given article outlines a set of issues aimed at being solved through (1) the analysis and the classification of URCS text collections, (2) review of Ukrainian corpora and corpus tools available for Ukrainian speaking target users in the open access payment free as well as on reasonable fixed-price basis, (3) corpus-based analysis provided on the examples of URCS lemmas used in the modern Ukrainian language, in the texts of Ukrainian literature of different time periods as well as comparative analysis of URCS texts and their Ukrainian translations focusing on the accuracy, adequacy and faithfulness of specialized terminology and concepts. Furthermore, the article explores the potential of creating digital text corpora for URCS by utilizing modern technologies and methods by the interdisciplinary research team of linguists and IT experts. The creation of such a corpora platform could facilitate linguistic research, including studies on vocabulary, grammar, and syntax, as well as studies on the specific terminology, historical and cultural aspects of the language. The research also highlights the need for further collaboration among linguists, and digital experts to enhance the preservation and promotion of the URCS. У статті досліджуються питання оцифрування та можливості створення текстового корпусу для Української редакції церковнослов'янської мови (УРЦСМ). Ця рідковживана мова все ще використовується в богослужінні в деяких регіонах України (переважно Закарпатська та Львівська області), а також на прикордонних територіях Словаччини, Румунії та Польщі. Дослідження знаходиться на початковому етапі. У ньому подано короткий огляд мовної історії УРЦСМ, а також розглянуто взаємозв'язки між українською мовою та УРЦСМ на прикладах її вживання в сучасній українській мові, а також в українській літературі різних жанрів і часових періодів. Крім того, у статті пропонуються підходи та стратегії збереження УРЦСМ шляхом оцифрування, включно зі створенням платформи текстових корпусів, які враховують думки і погляди користувача і розробника ПЗ з метою її збереження для майбутніх поколінь. У цій статті окреслено коло питань, які планується вирішити шляхом (1) аналізу та класифікації збірок текстів УРЦСМ, (2) огляду українських корпусів та корпусних інструментів, доступних для україномовних цільових користувачів у відкритому доступі як на безоплатній, так і на фіксованій платній основі, (3) корпусний аналіз на прикладах лексем УРЦСМ, уживаних у сучасній українській мові, у текстах української літератури різних часових періодів, а також порівняльний аналіз текстів УРЦСМ та їхніх українських перекладів з акцентом на точність, адекватність і вірність спеціалізованої термінології та концепцій. Крім того, у статті досліджується потенціал створення цифрових текстових корпусів УРЦСМ із застосуванням сучасних технологій та методів міждисциплінарною дослідницькою групою лінгвістів та ІТ-експертів. Створення такої платформи може сприяти лінгвістичним дослідженням, зокрема дослідженням лексики, граматики та синтаксису, а також дослідженням специфічної термінології, історичних та культурних аспектів мови. Дослідження також підкреслює необхідність подальшої співпраці між лінгвістами та цифровими експертами для збереження та популяризації УРЦСМ. Translated with DeepL.com (free version) |
Description: | [1] V. Nimchuk, Yakoyu movoyu molylasya davnya Ukraina, Video, 2012. URL: https://www.youtube.com/watch?v=V_Lhfv5J4WA&t=334s&ab_channel=brownianbox [2] “Izbornyk. Istoriia Ukrainy IX-XVIII st. Pershodzherela ta interpretatsii”, (2003). URL: litopys.org.ua [3] V. Nimchuk, Ukrains’ka mova – svyashchenna mova, Liudyna i svit (1992), 11–12, 28–32. [4] V. Nimchuk, Literaturni movy Kyivs’koyi Rusi, Istoriya Ukrains’koyi kul’tury, 1 (2003). URL: http://litopys.org.ua/index.html [5] V. Nimchuk, Leksyka davn'orus'koi movy, Istoriia ukrains'koi movy: Leksyka i frazeolohiia, (1983), 29—163. [6] V. Nimchuk Davn'orus'ka spadschyna v leksytsi ukrains'koi movy, Kyiv, (1992). [7] M. Moser. Cerkovnoslov’jans’ka mova ukrajins’koji redakciji v dzerkali mizhnarodnoji slavistyki. Balcania et Slavia, 2, 2022, 133-142. [8] M. Skab, Mova Tserkvy v Ukraini kintsia XX – pochatku XXI st. yak chynnyk formuvannia natsional'noi svidomosti, Bohoslovs'kyj visnyk (2013), 8, 8-16. [9] N. Puriaeva, Ukrayns'ka mova v liturhijnij praktytsi ukrayns'kykh tserkov, Problemy humanitarnykh Nauk, Seriya «Filolohiya», (2018), 42, 128-146. [10] Univ Lavra of Holy Ascension (UGCC), (2007). URL: http://studyty.org.ua/index.php?option=com_files&Itemid=52; [11] Shevchuk S., Church Slavonic is the Official Liturgical Language of the UGCC (in Ukrainian), 2020. URL: https://synod.ugcc.ua/data/glava-ugkts-tserkovnoslovyanska-mova-ofitsiynoyuliturgiynoyu-movoyu-ugkts-4276/ [12] The Greek Catholic Eparchy of Mukachevo. (in Ukrainian), updated 2023. URL: https://mgce.uz.ua/ [13] H. Kuzems'ka, Yakoiu movoiu molylasia davnia Ukraina: Pravyla ukrains'koi transliteratsii tserkovnoslov'ians'kykh tekstiv, Kyiv, KZhD ”Sofiia”, 2012. [14] Meletii Smotrytskyi. Hramatyka / Pidhotovka faksymilnoho vydannia ta doslidzhennia pamiatky V. V. Nimchuka. — K.: Naukova dumka, (1979), 111. 492 . (Faksymile). [15] N. Dartchuk, O. Siruk, M. Langenbach, Ya. Khodakivska, and V. Sorokin, Corpus of the Ukrainian Language (Ukrainian) (2023). URL: http://www.mova.info/corpus.aspx?l1=209 [16] General Regionally Annotated Corpus of Ukrainian (GRAC) (Ukrainian, English), (2023). URL: http://uacorpus.org/Kyiv/ua [17] SketchEnengine platform, (2023). URL: https://www.sketchengine.eu/ [18] A. Lutskiv, N. Popovych, Big data-based approach to automated linguistic analysis effectiveness, Proceedings of the 2020 IEEE 3rd International Conference on Data Stream Mining and Processing, DSMP, Lviv, (2020), 438-443. [19] A. Lutskiv, N. Popovych, Big data approach to developing adaptable corpus tools CEUR Workshop Proceedings, Lviv, (2020) 374-395. [20] A. Lutskiv, N. Popovych, Adaptable Text Corpus Development for Specific Linguistic Research, Proceedings of IEEE International Scientific and Practical Conference Problems of Infocommunications. Science and Technology, Kyiv, (2019), 217-223. [21] O. Levy, Dependency-Based Word Embeddings, 2014, URL: https://www.aclweb.org/anthology/P14-2050 [22] Stanford CoreNLP 3.9.2 (updated 2018-11-29). URL: https://corenlp.run/ [23] R. M. Reese, A. S. Bhatia, Natural Language Processing with Java, 2 nd ed., Birmingham: Packt Publishing, (2018), 318. [24] Academic Dictionary of the Ukrainian Language, 2018. URL: http://sum.in.ua/ [25] Oxford Dictionaries API, 2023. URL: https://developer.oxforddictionaries.com/ [26] Glosbe API, 2023. URL: https://glosbe.com/a-api [27] A. Lutskiv, R. Lutsyshyn, Corpus-Based Translation Automation of Adaptable Corpus Translation Module, CEUR Workshop Proceedings, Lviv, (2021), 2870, 511–527. [28] O.V. Mitsa, H.V. Shumytska, V.V. Sharkan, N.F. Venzhynovych &H.I. Dulishkovych, Interactive map of dialects as the professional training tool for philology students, Information Technologies and Learning Tools, vol. 88, no. 2, , (2022), 126–138. doi: https://doi.org/10.33407/itlt.v88i2.4787 [29] M. Lupei, M. Shlahta, O.Mitsa, Y. Horoshko, H. Tsybko & V. Gorbachuk, Development of an Interactive Map Within the Implementation of Actual State and Public Directions, in 2022 12th International Conference on Advanced Computer Information Technologies (ACIT), IEEE, (2022), 384-387. [30] Create a new corpus from files, 2023. URL: https://www.sketchengine.eu/guide/create-corpusfrom-files/#toggle-id-1 [31] A. Solans’kyi, Promin dushi, Uzhhorod, (2017), 830. [32] The UCREL semantic analysis system, (2023). URL: https://www.researchgate.net/publication/228881331_The_UCREL_semantic_analysis_system [33] V. Brezina, P.Weill-Tessier, & A.McEnery, #LancsBox v. 5.x. [software], 2020. URL: http://corpora.lancs.ac.uk/lancsbox. [34] L.Bilen’ka-Svystovych, N. Rybak, Tserkovnoslovianska mova. Pidruchnyk zi slovnykom, 2012. [35] H. P. Klimchuk, Cerkovnoslov’jans’ki zapozychennja v publicystyci Mikhaila Grushevs’kogo, Filolohichni studii, 2009, 3, 53-64. |
URI: | https://er.nau.edu.ua/handle/NAU/62610 |
Appears in Collections: | Наукові роботи НПП, докторантів та аспірантів кафедри англійської філології і перекладу |
Files in This Item:
File | Description | Size | Format | |
---|---|---|---|---|
Ukrainian Redaction of Church Slavonic.pdf | 1.31 MB | Adobe PDF | View/Open |
Items in DSpace are protected by copyright, with all rights reserved, unless otherwise indicated.