Prototyp tłumaczenia automatycznego tekstów językoznawczych z języka polskiego na hiszpański
Loading...
Date
2019
Authors
Advisor
Editor
Journal Title
Journal ISSN
Volume Title
Publisher
Title alternative
Prototype of automatic translation of linguistic texts from Polish to Spanish
Prototipo de traducción automática de textos lingüísticos del polaco al español
Prototipo de traducción automática de textos lingüísticos del polaco al español
Abstract
Głównym celem rozprawy jest omówienie działania i budowy prototypu systemu tłumaczenia automatycznego (TA) opartego na regułach gramatycznych na platformie Apertium z licencją GNU GPL (General Public Licence, licencja wolnego i otwartego oprogramowania) oraz jego ewaluacja. W części teoretycznej pracy przedstawia się zarys historyczny i ogólną perspektywę TA, rozwój systemów TA na przestrzeni lat oraz teoretyczne podstawy językoznawstwa komputerowego i matematycznego, które stosuje techniki statystyczne, prawdopodobieństwo i schematy matematyczne do teoretycznego opisu języków w postaci formalnej. W części praktycznej rozprawy omawia się budowę prototypu systemu tłumaczenia automatycznego Apertium-spa-pol dla nowej pary języków (polski-hiszpański), opisując szczegółowo etap instalacji potrzebnych narzędzi platformy oraz budowę słowników morfologicznych i słownika dwujęzycznego. Analiza najczęstszych błędów i sekwencji jednostek leksykalnych zdań przetłumaczonych metodą bezpośrednią pozwala na wprowadzenie do systemu 22 podstawowe gramatyczne zasady transferu. W celu uruchomienia prototypu przedstawia się szczegółowy opis zasad transferu podstawowych sekwencji leksykalnych. Wreszcie, opisuje się ewaluację prototypu i wskazanie możliwych ścieżek rozwoju systemu.
The main purpose of the dissertation is to discuss the operation and construction of a prototype of rule-based machine translation system (MT) on Apertium platform with the GNU GPL (General Public License, free and open source software license) and its evaluation. The theoretical part of the thesis presents the historical outline and general perspective of MT, the development of MT systems over the years and the theoretical foundations of computational and mathematical linguistics, which apply statistical techniques, probability and mathematical schemes to describe theoretically formal languages. The practical part of the dissertation discusses the construction of a prototype of Apertium-spa-pol MT system for a new language pair (Polish-Spanish), describing in detail the installation of necessary platform tools and the construction of morphological dictionaries and a bilingual dictionary. The analysis of the most common errors and sequences of lexical units of sentences translated automatically through the direct method allows us to introduce 22 basic grammatical transfer rules into the system. In order to run the prototype, a detailed description of the rules for the transfer of basic lexical sequences is provided. Finally, the evaluation of the prototype is described and possible paths of system development are indicated.
El objetivo de la tesis es describir el funcionamiento y la construcción de un prototipo de sistema de traducción automática (TA) basado en reglas en la plataforma Apertium con GNU GPL (Licencia Pública General, licencia de software libre y de código abierto), así como su evaluación. La parte teórica de la tesis presenta un esquema histórico y perspectiva general de la TA, el desarrollo de los sistemas de TA a lo largo de los años y los fundamentos teóricos de la lingüística computacional y matemática que aplican técnicas estadísticas, probabilidad y esquemas matemáticos para describir teóricamente lenguajes formales. La parte práctica de la tesis analiza la construcción de un prototipo del sistema de TA Apertium-spa-pol para un nuevo par de idiomas (polaco-español), describiendo detalladamente la instalación de las herramientas necesarias de la plataforma, la construcción de diccionarios morfológicos y un diccionario bilingüe. El análisis de errores más comunes y de secuencias de unidades léxicas de oraciones traducidas automáticamente con el método directo nos permite introducir en el sistema 22 reglas básicas de transferencia. Para ejecutar el prototipo se proporciona una descripción detallada de las reglas para la transferencia de secuencias léxicas básicas. Finalmente, se describe la evaluación del prototipo y se indican las posibles perspectivas de desarrollo del sistema.
The main purpose of the dissertation is to discuss the operation and construction of a prototype of rule-based machine translation system (MT) on Apertium platform with the GNU GPL (General Public License, free and open source software license) and its evaluation. The theoretical part of the thesis presents the historical outline and general perspective of MT, the development of MT systems over the years and the theoretical foundations of computational and mathematical linguistics, which apply statistical techniques, probability and mathematical schemes to describe theoretically formal languages. The practical part of the dissertation discusses the construction of a prototype of Apertium-spa-pol MT system for a new language pair (Polish-Spanish), describing in detail the installation of necessary platform tools and the construction of morphological dictionaries and a bilingual dictionary. The analysis of the most common errors and sequences of lexical units of sentences translated automatically through the direct method allows us to introduce 22 basic grammatical transfer rules into the system. In order to run the prototype, a detailed description of the rules for the transfer of basic lexical sequences is provided. Finally, the evaluation of the prototype is described and possible paths of system development are indicated.
El objetivo de la tesis es describir el funcionamiento y la construcción de un prototipo de sistema de traducción automática (TA) basado en reglas en la plataforma Apertium con GNU GPL (Licencia Pública General, licencia de software libre y de código abierto), así como su evaluación. La parte teórica de la tesis presenta un esquema histórico y perspectiva general de la TA, el desarrollo de los sistemas de TA a lo largo de los años y los fundamentos teóricos de la lingüística computacional y matemática que aplican técnicas estadísticas, probabilidad y esquemas matemáticos para describir teóricamente lenguajes formales. La parte práctica de la tesis analiza la construcción de un prototipo del sistema de TA Apertium-spa-pol para un nuevo par de idiomas (polaco-español), describiendo detalladamente la instalación de las herramientas necesarias de la plataforma, la construcción de diccionarios morfológicos y un diccionario bilingüe. El análisis de errores más comunes y de secuencias de unidades léxicas de oraciones traducidas automáticamente con el método directo nos permite introducir en el sistema 22 reglas básicas de transferencia. Para ejecutar el prototipo se proporciona una descripción detallada de las reglas para la transferencia de secuencias léxicas básicas. Finalmente, se describe la evaluación del prototipo y se indican las posibles perspectivas de desarrollo del sistema.
Description
Wydział Neofilologii
Sponsor
Keywords
tłumaczenie automatyczne, systemy oparte na zasadach gramatycznych, Apertium, słownik, językoznawstwo komputerowe, machine translation, rule-based machine translation, dictionary, computational linguistics, traducción automática, sistemas basados en reglas, diccionario, lingüística computacional