Please use this identifier to cite or link to this item: https://hdl.handle.net/10593/25824
Title: Prototyp tłumaczenia automatycznego tekstów językoznawczych z języka polskiego na hiszpański
Other Titles: Prototype of automatic translation of linguistic texts from Polish to Spanish
Prototipo de traducción automática de textos lingüísticos del polaco al español
Authors: Kusicielek, Izabela
Advisor: Pawlik, Janusz. Promotor
Keywords: tłumaczenie automatyczne
systemy oparte na zasadach gramatycznych
Apertium
słownik
językoznawstwo komputerowe
machine translation
rule-based machine translation
dictionary
computational linguistics
traducción automática
sistemas basados en reglas
diccionario
lingüística computacional
Issue Date: 2019
Abstract: Głównym celem rozprawy jest omówienie działania i budowy prototypu systemu tłumaczenia automatycznego (TA) opartego na regułach gramatycznych na platformie Apertium z licencją GNU GPL (General Public Licence, licencja wolnego i otwartego oprogramowania) oraz jego ewaluacja. W części teoretycznej pracy przedstawia się zarys historyczny i ogólną perspektywę TA, rozwój systemów TA na przestrzeni lat oraz teoretyczne podstawy językoznawstwa komputerowego i matematycznego, które stosuje techniki statystyczne, prawdopodobieństwo i schematy matematyczne do teoretycznego opisu języków w postaci formalnej. W części praktycznej rozprawy omawia się budowę prototypu systemu tłumaczenia automatycznego Apertium-spa-pol dla nowej pary języków (polski-hiszpański), opisując szczegółowo etap instalacji potrzebnych narzędzi platformy oraz budowę słowników morfologicznych i słownika dwujęzycznego. Analiza najczęstszych błędów i sekwencji jednostek leksykalnych zdań przetłumaczonych metodą bezpośrednią pozwala na wprowadzenie do systemu 22 podstawowe gramatyczne zasady transferu. W celu uruchomienia prototypu przedstawia się szczegółowy opis zasad transferu podstawowych sekwencji leksykalnych. Wreszcie, opisuje się ewaluację prototypu i wskazanie możliwych ścieżek rozwoju systemu.
The main purpose of the dissertation is to discuss the operation and construction of a prototype of rule-based machine translation system (MT) on Apertium platform with the GNU GPL (General Public License, free and open source software license) and its evaluation. The theoretical part of the thesis presents the historical outline and general perspective of MT, the development of MT systems over the years and the theoretical foundations of computational and mathematical linguistics, which apply statistical techniques, probability and mathematical schemes to describe theoretically formal languages. The practical part of the dissertation discusses the construction of a prototype of Apertium-spa-pol MT system for a new language pair (Polish-Spanish), describing in detail the installation of necessary platform tools and the construction of morphological dictionaries and a bilingual dictionary. The analysis of the most common errors and sequences of lexical units of sentences translated automatically through the direct method allows us to introduce 22 basic grammatical transfer rules into the system. In order to run the prototype, a detailed description of the rules for the transfer of basic lexical sequences is provided. Finally, the evaluation of the prototype is described and possible paths of system development are indicated.
El objetivo de la tesis es describir el funcionamiento y la construcción de un prototipo de sistema de traducción automática (TA) basado en reglas en la plataforma Apertium con GNU GPL (Licencia Pública General, licencia de software libre y de código abierto), así como su evaluación. La parte teórica de la tesis presenta un esquema histórico y perspectiva general de la TA, el desarrollo de los sistemas de TA a lo largo de los años y los fundamentos teóricos de la lingüística computacional y matemática que aplican técnicas estadísticas, probabilidad y esquemas matemáticos para describir teóricamente lenguajes formales. La parte práctica de la tesis analiza la construcción de un prototipo del sistema de TA Apertium-spa-pol para un nuevo par de idiomas (polaco-español), describiendo detalladamente la instalación de las herramientas necesarias de la plataforma, la construcción de diccionarios morfológicos y un diccionario bilingüe. El análisis de errores más comunes y de secuencias de unidades léxicas de oraciones traducidas automáticamente con el método directo nos permite introducir en el sistema 22 reglas básicas de transferencia. Para ejecutar el prototipo se proporciona una descripción detallada de las reglas para la transferencia de secuencias léxicas básicas. Finalmente, se describe la evaluación del prototipo y se indican las posibles perspectivas de desarrollo del sistema.
Description: Wydział Neofilologii
URI: http://hdl.handle.net/10593/25824
Appears in Collections:Doktoraty (WN)
Doktoraty 2010-2021 /dostęp ograniczony, możliwy z komputerów w Bibliotece Uniwersyteckiej/

Files in This Item:
File Description SizeFormat 
Izabela Kusicielek_Rozprawa doktorska_2019.pdf
  Restricted Access
4.38 MBAdobe PDFView/Open
Show full item record



Items in AMUR are protected by copyright, with all rights reserved, unless otherwise indicated.