Doktoraty (WMiI)

Permanent URI for this collection

Browse

Recent Submissions

Now showing 1 - 20 of 97
  • Item
    Rozpoznawanie jednostek nazwanych i ekstrakcja informacji z dokumentów różnego typu
    (2025) Nowakowska, Gabriela; Górecki, Tomasz. Promotor
    Rozprawa doktorska prezentuje nowatorskie wykorzystanie metod rozpoznawania jednostek nazwanych i ekstrakcji informacji do przetwarzania dokumentów różnego typu. Praca składa się z czterech artykułów naukowych opublikowanych na konferencjach międzynarodowych. Rozdział 1 opisuje problem badawczy, motywację i uzyskane efekty oraz strukturę i zakres rozprawy. Zawiera także przegląd i podsumowanie załączonych artykułów. Rozdziały 2 i 3 przedstawiają prace badawcze związane z wykorzystaniem metod rozpoznawania jednostek nazwanych, które posłużyły jako część rozwiązania problemów zdefiniowanych w konkursach organizowanych w ramach międzynarodowych konferencji. Rozdział 2 zawiera opis systemu tłumaczenia powstałego w ramach WMT 2022. Rozdział 3 opisuje nowe modele lematyzacji jednostek nazwanych zastosowane w rozwiązaniu konkursu z Slavic NLP 2023. Rozdziały 4 i 5 dotyczą artykułów prezentujących modele sieci neuronowych powstałe w ramach prac wdrożeniowych. Rozdział 4 opisuje model TILT związany z pracą nad ekstrakcją informacji z dokumentów o dwuwymiarowej strukturze. W rozdziale 5 przedstawiono model STable do ekstrakcji danych tabelarycznych. Na końcu pracy znajdują się załączniki, w których zawarte są certyfikaty otrzymane od organizatorów konkursów, a także pierwsze strony uzyskanych patentów. Jako ostatnie zamieszczone zostały deklaracje o wkładzie współautorów. The thesis presents a novel use of named entity recognition and information extraction methods for processing documents of various types. The thesis consists of four scientific articles published at international conferences. Chapter 1 describes the research problem, motivation and results obtained, as well as the structure and scope of the thesis. It also includes an overview and summary of the attached articles. Chapters 2 and 3 present research work related to the use of named entity recognition methods, which served as part of the solution to problems defined in competitions held at international conferences. Chapter 2 describes the translation system developed as part of WMT 2022. Chapter 3 describes novel models for lemmatization of named entities used in solving the competition with Slavic NLP 2023. Chapters 4 and 5 are about articles presenting neural network models created as part of the industrial work. Chapter 4 describes the TILT model related to the work on extracting information from two-dimensional documents. Chapter 5 presents the STable model for extracting tabular data. At the end of the work are appendices that include certificates received from competition organizers, as well as the first pages of patents obtained. Lastly, declarations of the contributions of the co-authors are included.
  • Item
    Regularyzacja i estymacja macierzy kowariancji o strukturze liniowej
    (2024) Mieldzioc, Adam; Markiewicz, Augustyn. Promotor
    Niniejsza rozprawa poświęcona jest regularyzacji i estymacji macierzy kowariancji o strukturze liniowej, mających szerokie zastosowania w wielu dziedzinach nauki. Celem pracy jest zaproponowanie metody identyfikacji struktury liniowo ustrukturyzowanej macierzy kowariancji, a następnie dokonanie modyfikacji jej klasycznego estymatora za pomocą rzutowania ortogonalnego i strukturyzowanej metody kurczenia. Uzyskany w ten sposób estymator jest określony dodatnio oraz dobrze uwarunkowany. Ponadto, za pomocą badań symulacyjnych zweryfikowane zostały własności statystyczne proponowanego estymatora oraz dokonano porównania nowego estymatora z ustrukturyzowanym liniowo estymatorem największej wiarogodności. W pracy zaproponowane zostały dwa algorytmy: pierwszy służy do wyznaczania minimum odpowiedniej funkcji rozbieżności w zagadnieniu identyfikacji struktury kowariancji, natomiast drugi wykorzystywany jest do wyliczania estymatora macierzy kowariancji o strukturze liniowej za pomocą metody największej wiarogodności. The doctoral dissertation is dedicated to the regularization and estimation of linearly structured covariance matrices, which have broad applications in various fields. The aim of the thesis is to propose a method of identification of the structure of linearly structured covariance matrix, followed by the modification of its classical estimator using orthogonal projection and structured shrinkage method. The resulting estimator is positive definite and well conditioned. Moreover, the statistical properties are examined through simulation studies and compared with the linearly structured maximum likelihood estimator. Two algorithms are presented in the thesis: one for determination of the minimum of the appropriate divergence function that is used to identify the structure of covariance, and the second to compute the estimate of linearly structured covariance matrix being positive definite and well conditioned using maximum likelihood method.
  • Item
    Application of speech datasets management methods for the evaluation of Automatic Speech Recognition systems for Polish
    (2024) Junczyk, Michał; Jassem, Krzysztof. Promotor
    Automatic Speech Recognition (ASR) systems convert speech to text, supporting virtual assistants and transcription. The effectiveness of ASR depends on extensive and diverse speech data sets. The Polish language, spoken by over 50 million people, poses unique challenges for ASR systems due to its complex phonetic and morphological structure. This study examines issues with the accessibility and interoperability of public speech data sets, which hinder ASR system verification. It reviewed 53 public data sets, organizing 24 of them to create a quality assessment process. The selected sets contain nearly 400,000 recordings and 800 hours of speech from 5,000 speakers, used to compare 7 ASR systems and 25 models. The results revealed significant performance differences. The study improved data management and comparative analysis, enhancing the practical usability of Polish ASR data sets. Organized data sets BIGOS and PELCRA were used for comprehensive tests. Improved documentation and data analysis, along with available testing tools, facilitate test replication and validation of other studies using the same data sets. In summary, the research supports the practical application of Polish ASR data sets, promoting methods, tools, and best practices in ASR system evaluation. Systemy automatycznego rozpoznawania mowy (ASR) konwertują mowę na tekst, wspierając wirtualnych asystentów i transkrypcje. Skuteczność ASR zależy od obszernych i różnorodnych zbiorów danych mowy. Język polski, używany przez ponad 50 milionów ludzi, stawia unikalne wyzwania systemom ASR ze względu na złożoną strukturę fonetyczną i morfologiczną. Badanie analizuje problemy z dostępnością i interoperacyjnością publicznych zbiorów danych mowy, co utrudnia weryfikację systemów ASR. Zbadano 53 publiczne zbiory danych, uporządkowano 24 z nich, tworząc proces oceny jakości. Wyselekcjonowane zbiory zawierają prawie 400 000 nagrań i 800 godzin mowy od 5000 mówców, użytych do porównania 7 systemów ASR i 25 modeli. Wyniki ujawniły znaczne różnice w wydajności. Badanie poprawiło zarządzanie danymi i analizę porównawczą, zwiększając praktyczną użyteczność dostępność polskich zbiorów danych ASR. Uporządkowane zbiory BIGOS i PELCRA zostały wykorzystane do przekrojowych testów. Udoskonalona dokumentacja i analiza danych oraz dostępność narzędzi do testowania ułatwia powtórzenie testów, oraz walidację wyników innych badań z użyciem tych samych zbiorów danych. Podsumowując, badania wspierają praktyczne zastosowanie polskich zbiorów danych ASR, promując metody, narzędzia i dobre praktyki w ocenie systemów ASR.
  • Item
    Wieloskalowe modelowanie systemów biologicznych: obliczeniowe podejście do badania zjawisk naturalnych od poziomu komórki po ekosystemy
    (2024) Kokosza, Andrzej; Dyczkowski, Krzysztof. Promotor
    Badanie zjawisk naturalnych za pomocą symulacji komputerowych oferuje szerokie możliwości ze względu na złożoność, dynamiczną naturę wzorców obserwowanych w tych procesach. Te zjawiska, począwszy od mechanizmów komórkowych, po szeroko zakrojone dynamiki ekologiczne kształtujące nasze środowisko, prezentują unikalne zachowania i wyzwania. Niniejsza praca doktorska prezentuje rozwój i walidację kilku modeli obliczeniowych symulujących procesy biologiczne na różnych skalach. Celem dysertacji jest po pierwsze wykazanie, że modele obliczeniowe mogą dokładnie odtwarzać i przewidywać złożone systemy biologiczne na różnych skalach; po drugie zilustrowanie konieczności zastosowania różnorodnych podejść do modelowania zjawisk biologicznych; oraz po trzecie, pokazanie, że modele matematyczne można wykorzystać do walidacji lub kwestionowania istniejących teorii biologicznych oraz identyfikacji obszarów wymagających dalszych badań. Przedstawiam trzy modele specyficznych zjawisk naturalnych, które zostały zwalidowane na podstawie danych empirycznych. Obejmują one dyskretny model formowania wzorca naczyniowego w Arabidopsis thaliana, ciągły model długodystansowego przesyłania sygnału w drzewach oraz zaawansowaną hybrydową symulację pożarów lasów. Wyniki potwierdziły postawione założenia oraz pozwoliły ocenić przydatność stosowanych paradygmatów modelowania w różnych scenariuszach. The study of natural phenomena gives rich opportunities for those interested in modelling and simulations. The challenge they present lies in the complexity and dynamic nature of such patterns. These processes, ranging from the cellular mechanisms to the environmental or ecological dynamics challenge our understanding and push the boundaries of traditional scientific disciplines. This thesis shows the development and validation of several computational models that simulate complex biological processes. The goal of this dissertation is first to demonstrate that computational models can accurately replicate and predict complex biological systems across different scales; second to illustrate the necessity of diverse modelling approaches to address distinct biological phenomena; and third, to illustrate that mathematical models can be utilized to validate or challenge existing biological theories and identify areas requiring further investigation. I present three models of specific natural phenomena validated against empirical data. These include a discrete model for vascular pattern formation in Arabidopsis thaliana, a continuous model of long-distance signalling in birch trees, and an advanced hybrid simulation of wildfires. The results supported the assumptions posed, Additionally, they allowed us to assess the applicability of modelling paradigms used in different scenarios.
  • Item
    Wykorzystanie zasobów ustrukturyzowanych w neuronowych modelach języka
    (2024) Turski, Michał; Graliński, Filip. Promotor
    Większość badań w dziedzinie przetwarzania języka naturalnego koncentruje się na przetwarzaniu tekstu. Choć ten paradygmat jest bardzo skuteczny w wielu zastosowaniach, takich jak tłumaczenie maszynowe, automatyczne podsumowywanie i systemy dialogowe, nie potrafi w pełni wykorzystać bogactwa wielu dokumentów tworzonych przez i dla ludzi. Dokumenty przekazują znaczenie nie tylko przez warstwę tekstową, ale także poprzez swoją strukturę i cechy wizualne. Kluczowym wyzwaniem podejmowanym w tej pracy jest proponowanie rozwiązań rozszerzających najnowsze modele języka o wykorzystanie informacji strukturalnych celem poprawy jakości przetwarzania dokumentów. Niniejsza rozprawa składa się z pięciu prac naukowych w domenie rozumienia dokumentów i jest podzielona na dwie główne sekcje. Pierwsza sekcja dotyka problemu oceny modeli rozumienia dokumentów. Druga sekcja tej pracy podejmuje różne wyzwania w domenie rozumienia dokumentów, proponując innowacyjne rozwiązania mające na celu poprawę jakości modeli. Podsumowując, ta praca przyczynia się do rozwoju modeli rozumienia dokumentów, umożliwiając lepsze przetwarzanie i analizę dokumentów o bogatej strukturze. The majority of research in the field of Natural Language Processing is focused on processing plain text. While this paradigm is highly effective for numerous use cases, such as machine translation, summarization, and chatbots, it fails to fully harness the richness of many texts created by and for humans. Documents, on the other hand, convey meaning not only through their textual content but also through their structure and visual features. A key challenge tackled by this thesis is to develop solutions that combine recent advancements in language modeling with structural information to improve the processing and comprehension of documents. This thesis comprises five scientific papers in the domain of document understanding, divided into two main sections. The first section focuses on evaluating document understanding models. The second section of this thesis tackles various challenges in the document understanding domain, proposing innovative solutions to enhance model performance. Overall, this thesis contributes to the development of more accurate and useful document understanding models, enabling improved processing and comprehension of rich, structured documents.
  • Item
    Estymacja i testowanie macierzy kowariancji należących do podprzestrzeni kwadratowych
    (2024) John, Mateusz; Filipiak, Katarzyna. Promotor
    Celem rozprawy doktorskiej jest zaproponowanie testów dotyczących struktur kowariancyjnych w modelach podwójnie wielowymiarowych. Ze względu na hierarchiczny charakter rozważanych eksperymentów odpowiednimi strukturami są macierze blokowe. W pracy rozważa się struktury blokowe należące do podprzestrzeni kwadratowych. Proponowane testy obejmują test ilorazu wiarogodności, test wynikowy Rao oraz test Walda. Wymienione testy porównywane są ze sobą ze względu na szybkość zbieżności do granicznego rozkładu chi-kwadrat oraz moc. Do porównania użyto metod symulacyjnych. Ponadto, ponieważ w każdym rozważanym teście istotną rolę odgrywają estymatory największej wiarogodności nieznanych parametrów, w pracy pokazano, że estymatory te można uzyskać przez rzutowanie na odpowiednią podprzestrzeń kwadratową. Przedstawione wyniki zilustrowano na przykładzie danych rzeczywistych. The aim of the Ph. D. dissertation is to propose tests for covariance structures in doubly multivariate models. Due to the hierarchical nature of the considered experiments, block matrices are appropriate structures. The work considers block structures belonging to the quadratic subspaces. The proposed tests include the likelihood ratio test, the Rao score test and the Wald test. The mentioned tests are compared with each other in terms of the speed of convergence to the limiting chi-square distribution and the power. For the comparison simulation methods were used. Moreover, since the maximum likelihood estimators of unknown parameters have an important role in each considered test, the work shows that these estimators can be obtained by projecting onto an appropriate quadratic subspace. Presented results are illustrated using real data example.
  • Item
    Zastosowanie teorii zbiorów rozmytych w klasyfikacji dominującej dyscypliny naukowej autorów w naukometrii
    (2024) Szymula, Łukasz; Dyczkowski, Krzysztof. Promotor; Kwiek, Marek. Promotor
    Jednym z głównych zagadnień w naukometrii jest klasyfikacja dyscyplin naukowych autorów, co ma znaczący wpływ na ocenę ich dorobku naukowego. Tradycyjne metody, oparte na prostych algorytmach i ograniczonej interpretacji danych, często prowadzą do niejednoznaczności w klasyfikacji. W pracy zaproponowano zastosowanie teorii zbiorów rozmytych, stworzonej przez Lotfiego Zadeha, jako rozwiązanie tego problemu. Teoria ta pozwala na modelowanie nieprecyzyjności informacji i oferuje nowe perspektywy dla uzyskania jednoznacznej klasyfikacji dyscyplin w dużej skali. Głównym celem pracy jest zbadanie możliwości wykorzystania teorii zbiorów rozmytych do ulepszenia algorytmu klasyfikacji dominującej dyscypliny naukowej autorów posługując się wartością modalną. Przeprowadzone przeze mnie badania miały na celu nie tylko teoretyczne zrozumienie wpływu zastosowania tej teorii na klasyfikację, ale również praktyczne sprawdzenie skuteczności proponowanych modyfikacji na podstawie pełnej bibliometrycznej bazy danych Scopus udostępnionej w platformie ICSR Lab, Elsevier. Hipotezy badawcze skupiały się zarówno na możliwości zwiększenia jednoznaczności klasyfikacji poprzez identyfikację kluczowych pojęć z obszaru naukometrii, jak i na określeniu podobieństwa klasyfikacji uzyskanej przez zaproponowane modyfikacje z powszechnie stosowanym podejściem, które nie uwzględnia nieprecyzyjności informacji. W badaniu wykorzystano najpopularniejsze metody z teorii zbiorów rozmytych, dzięki którym usprawniono proces klasyfikacji dyscyplin naukowych autorów. Pierwsze zaproponowane rozwiązanie obejmowało wykorzystanie zmiennych lingwistycznych reprezentowanych przez trzy poziomy intensywności: niskie, średnie i wysokie. Kolejnym skutecznym rozwiązaniem okazało się zbudowanie sterowników rozmytych do tworzenia bardziej elastycznych reguł klasyfikacji. Ostatnie podejście obejmowało agregacje wartości rozmytych operatorami OWA. Dzięki tym trzem propozycjom, uzyskano bardziej jednoznaczną klasyfikację autorów w naukometrii. Wykorzystanie tej metody pozwoliło na poprawę jednoznacznej klasyfikacji z około 69% do ponad 95%. Dzięki zastosowanym modyfikacjom jednoznaczna klasyfikacja autorów wzrosłą zatem o ponad 37% w porównaniu do podejścia, które nie uwzględnia nieprecyzyjności informacji. Wyniki moich badań wskazują na znaczącą rolę stosowania teorii zbiorów rozmytych w naukometrii, co otwiera drogę do dalszych badań w obu dziedzinach. One of the main issues in Scientometrics is the classification of authors' scientific disciplines, which has a significant impact on the evaluation of their scientific output. Traditional methods, based on simple algorithms and limited interpretation of data, often lead to ambiguities in classification. This thesis proposes the use of fuzzy set theory, developed by Lotfi Zadeh, as a solution to this problem. This theory allows to model the imprecision of information and offers new perspectives for achieving unambiguous classification of disciplines on a large scale. The main purpose of the work is to explore the possibility of using fuzzy set theory to improve the classification algorithm of the authors' dominant scientific discipline using modal value. The study I conducted aimed not only to theoretically understand the impact of application of this theory on classification, but also to practically test the effectiveness of the proposed modifications on the basis of the full bibliometric database Scopus provided in the platform ICSR Lab, Elsevier. The research hypotheses focused both on the possibility of increasing the unambiguity of the classification by identifying key concepts from the field of Scientometrics, and on determining the similarity of the classification obtained by the proposed modifications with the commonly used approach that does not take into account imprecision of information. The study used the most popular methods from fuzzy set theory to improve classification process of the authors' scientific disciplines. The first proposed solution involved the use of linguistic variables represented by three levels of intensity: low, medium and high. Another effective solution was the construction of fuzzy controllers to create more flexible classification rules. The last approach involved aggregating fuzzy values with OWA operators. With these three proposals, a more unambiguous classification of authors in Scientometrics has been achieved. The use of this method improved the unambiguous classification from about 69% to over 95%. Thus, with the modifications used, the unambiguous classification of authors increased by more than 37% compared to an approach that does not take into consideration the imprecision of information. The results of my research indicate a significant role for the application of fuzzy set theory in Scientometrics, which opens the possibilities for further research in both fields.
  • Item
    Modele rekomendacyjne wspólnej filtracji w serwisach ogłoszeniowych
    (2024) Kwieciński, Robert; Górecki, Tomasz. Promotor; Filipowska, Agata Jolanta. Promotor pomocniczy
    W wielu praktycznych zastosowaniach liczba dostępnych produktów jest zbyt duża, by użytkownicy byli w stanie się z nimi zapoznać. Problem ten adresują systemy rekomendacyjne. W rozprawie przedstawiamy wyniki badań dotyczących modeli wspólnej filtracji w serwisach ogłoszeniowych, na przykładzie serwisów Grupy OLX. W prezentowanej pracy omawiamy szczególne cechy serwisów ogłoszeniowych mające wpływ na dobór metod rekomendacji oraz ewaluacji. Przedstawiamy wyniki ewaluacji offline oraz online dla istniejących modeli oraz pokazujemy przewagę modelu RP3Beta nad pozostałymi metodami. Przedstawiamy infrastrukturę pozwalającą na generowanie rekomendacji w czasie rzeczywistym oraz pokazujemy możliwość jej zastosowania dla wielu istniejących modeli rekomendacji. Prezentujemy wyniki testów A/B pokazujących skuteczność proponowanego rozwiązania. Wprowadzamy nową grafową metodę rekomendacji, P3LTR, będącą uogólnieniem modelu RP3Beta. Pokazujemy przewagę modelu P3LTR nad modelem RP3Beta pod względem metryk dokładności oraz pokrycia podczas ewaluacji offline. Proponujemy także nową grafową sieć neuronową, P3GNN. Pokazujemy jej przewagę pod względem metryk dokładności nad istniejącymi grafowymi sieciami neuronowymi. Prezentujemy także opublikowany przez autora zbiór danych oraz proces skutecznego wdrożenia omawianych rozwiązań w serwisach Grupy OLX. In many practical applications, the number of available products often exceeds what users can feasibly familiarize themselves with. Recommendation systems address this problem. In the dissertation, we present the results of a study on collaborative filtering models in online classifieds, using OLX Group’s websites as examples. In this work, we discuss the specific characteristics of online classifieds that influence the selection of recommendation and evaluation methods. We present offline and online evaluation results for existing models and show the advantage of the RP3Beta model over other methods. We present the infrastructure created to generate recommendations in real-time and show its applicability to many existing recommendation models. We present the results of A/B tests showing the effectiveness of the proposed solution. We introduce a new graph-based recommendation method, P3LTR, which is a generalisation of the RP3Beta model. We demonstrate the advantage of the P3LTR model over the RP3Beta model in terms of accuracy and coverage metrics during offline evaluation. We also propose a new graph neural network, P3GNN. We show its superiority in terms of accuracy metrics over existing graph neural networks. We also present a dataset published by the author and the process of successful implementation of the discussed solutions on OLX Group's websites.
  • Item
    Zaprojektowanie oraz implementacja systemu automatycznej korekcji błędów i normalizacji wyjścia z systemu rozpoznawania mowy
    (2024) Ziętkiewicz, Tomasz; Marciniak, Jacek. Promotor; Kubis, Marek. Promotor pomocniczy
    Niniejsza rozprawa prezentuje zaproponowane przez autora metody automatycznej korekty błędów i normalizacji wyjścia z systemów rozpoznawania mowy. Przy ich opracowaniu brany był pod uwagę wdrożeniowy kontekst prowadzonych badań, które odbywały się z myślą o zastosowaniu opracowanych modeli w ramach systemów dialogowego. Praca przedstawia ten kontekst i specyfikę rozwoju modeli korekty ASR w środowisku przemysłowym. Zaproponowana w pracy metoda korekty błędów "Otaguj i popraw" traktuje problem korekty błędów jako problem tagowania sekwencji operacjami edycyjnymi. W pracy można znaleźć szczegółowy opis metody z uwzględnieniem użytego zbioru operacji edycyjnych, procesu generowania tagów operacji edycyjnych oraz metody ich aplikowania do poprawianego zdania. Zaprezentowane są wyniki licznych eksperymentów przeprowadzonych z jej użyciem na zróżnicowanych danych. Przedstawiono również metodę przywracania znaków interpunkcyjnych "Otaguj i przywróć", wzorowaną na metodzie "Otaguj i popraw". Opisane podejście do problemów korekty i normalizacji wyjścia z systemu rozpoznawania mowy charakteryzuje się możliwością precyzyjnej kontroli nad działaniem metody, a także możliwością łatwej interpretacji jego działania. Możliwość zastosowania z tą metodą dowolnych modeli tagowania sprawia, że można ją dostosować do środowiska, w którym metoda ma być wdrożona, poprzez wybór modeli o dopasowanych do środowiska wymaganiach obliczeniowych. Cechy te stanowią o użyteczności zaproponowanych metod w środowiskach produkcyjnych. Przedstawiono również zastosowanie zaproponowanej metody korekty błędów do badania wpływu błędów ASR na efektywność modeli NLU. This dissertation presents proposed methods for automatic error correction and normalization of speech recognition results. The development of these methods took into account the context of their deployment within dialogue systems. The paper presents this context and the specifics of the development of ASR correction models in an industrial environment. The "Tag and correct" error correction method proposed in the paper treats the problem of error correction as a problem of tagging sequences with editing operations. The paper offers a detailed description of the method including the set of edit operations used, the process of generating tags of edit operations, and a method of applying them to a sentence being corrected. The results of numerous experiments carried out on diverse datasets are presented. The "Tag and restore" method of restoring punctuation marks, inspired by the "Tag and correct" method, is also presented. The described approach to the problems of correction and normalization of output from a speech recognition system is characterized by the possibility of precise control over the operation of the method. The ability to use any tagging model within this method makes it adaptable to the environment in which the method is to be deployed, by selecting models with computational requirements that match the environment resources. These features account for the usefulness of the proposed methods in production environments. The application of the proposed error correction method to study the impact of ASR errors on the efficiency of NLU models is also presented.
  • Item
    Nowe metody i zbiory danych do inteligentnego przetwarzania dokumentów
    (2024) Jurkiewicz, Dawid; Graliński, Filip. Promotor
    Rozprawa podejmuje dwa kluczowe obszary w ramach dziedziny inteligentnego przetwarzania dokumentów (ang. Intelligent Document Processing): identyfikację relewantnych fragmentów tekstu (ang. Span Identification) i problematykę rozumienia dokumentów (ang. Document Understanding). Duży nacisk położony jest na zmierzenie się z wyzwaniami związanymi z małą ilością dostępnych danych. Aby rozwiązać ten problem, zaproponowano zbiór danych dla identyfikacji relewantnych fragmentów tekstu na podstawie kilku przykładów oraz unikatową metodę do wyszukiwania podsekwencji na podstawie kilku przykładów. Oprócz rozwiązań bazujących na kilku przykładach, przedstawiono metody do identyfikacji i klasyfikacji fragmentów tekstu zawierających propagandę. Ponadto wprowadzono multimodalny model oparty na architekturze Transformer dla problematyki rozumienia dokumentów. Model rozumie semantykę tekstu, cechy wizualne i strukturę dokumentu oraz potrafi odpowiadać na różne sformułowania w języku naturalnym dotyczące dokumentu. Dodatkowo zaproponowano pierwszy zestaw zbiorów danych pozwalający społeczności na dokładną obserwację postępów w dziedzinie rozumienia dokumentów. Na koniec zaprezentowano wymagający konkurs dla problematyki rozumienia dokumentów zawierający nowatorskie pary typów pytań i odpowiedzi dla wielodomenowych, wielobranżowych i wielostronicowych dokumentów. This thesis aims to contribute innovative solutions and datasets to the Intelligent Document Processing (IDP) domain. The focus is set on two key areas within IDP: Span Identification (SI) and Document Understanding (DU). Significant emphasis is placed on addressing the challenges posed by low-data scenarios, which are prevalent in various business use cases. A few-shot SI dataset and a unique approach for sub-sequence matching with few examples are proposed to address this. Besides the few-shot setting, methods for identifying and classifying propaganda spans are presented. Furthermore, a multi-modal end-to-end Transformer-based model for Document Understanding is introduced. The model efficiently comprehends layout information, textual semantics, and visual cues present in the document and can answer various document-related questions posed in the natural language. Additionally, the first DU benchmark is proposed, allowing the community to measure the DU field's state accurately. Lastly, a challenging DU competition is showcased. The task features novel question and answer type pairs over multi-domain, multi-industry, and multi-page documents, encouraging the development of solutions with strong generalization capabilities in low-data regimes.
  • Item
    Zastosowanie zbiorów wypukłych do minimalnej reprezentacji różnic funkcji wypukłych w sensie Zalgallera
    (2024) Kolassa, Robert; Grzybowski, Jerzy. Promotor
    W rozprawie przedstawiono nowe podejście do znajdowania minimalnej reprezentacji różnic funkcji wypukłych (dc-funkcji) w sensie Zalgallera. Zastosowano wyniki badań Palaschke i Urbańskiego nad minimalnymi quasiróżniczkami Demyanova i Rubinova. W szczególności wprowadzono pojęcie maksymalnej pary zbiorów wypukłych ze wspólnym stożkiem recesji oraz powiązano takie pary z minimalnymi reprezentacjami danych dc-funkcji. W tym celu zastosowano dualność Minkowskiego. Ponadto zbadano własności dodawania i odejmowania Minkowskiego w rodzinie wypukłych zbiorów domkniętych o wspólnym stożku recesji. W rezultacie przedstawiono algorytm znajdowania maksymalnej pary równoważnej danej parze. Rozpatrywana jest również minimalna reprezentacja dc-funkcji, która jest zawężeniem różnicy funkcji podliniowych (ds-funkcji) do zwartego zbioru wypukłego. Wprowadzono pojęcie pary L-minimalnej, gdzie L jest zwartym zbiorem wypukłym. Pokazano, że minimalna reprezentacja w sensie Zalgallera zawężonej ds-funkcji odpowiada L-minimalnej parze zwartych zbiorów wypukłych. Udowodniono istnienie i jednoznaczność pary L-minimalnej równoważnej danej parze. Zaprezentowane w rozprawie nowe podejście może być pomocne w udzieleniu odpowiedzi na pytania postawione przez Zalgallera. The thesis presents a new approach to finding the minimal representation of the difference of convex functions (dc-functions) in the sense of Zalgaller. The results of research by Palaschke and Urbański on minimal quasidifferentials of Demyanov and Rubinov are applied. In particular, the notion of a maximal pair of convex sets with a common recession cone is introduced and related to a minimal representation of a given dc-function. Minkowski duality is applied for this purpose. Moreover, the properties of the Minkowski addition and subtraction in a family of closed convex sets with a common recession cone are investigated. As a result, an algorithm for finding the maximum pair equivalent to a given pair is presented. The minimal representation of a dc-function, which is a restriction of the difference of sublinear functions (ds-functions) to a convex compact set, is also examined. The concept of an L-minimal pair is introduced, where L is a convex compact set. It is showed that the minimal representation in the sense of Zalgaller of the restricted ds-function corresponds to the L-minimal pair of compact convex sets. The existence and uniqueness of an L-minimal pair equivalent to a given pair is proved. The new approach presented in the dissertation may be helpful in answering the questions posed by Zalgaller.
  • Item
    Optymalizacja i ewaluacja w wyzwaniach uczenia maszynowego
    (2023) Pokrywka, Jakub; Graliński, Filip. Promotor
    W celu rozwoju nowych metod uczenia maszynowego konieczna jest ich rzetelna ewaluacja. Niniejsza praca doktorska opisuje pewne aspekty metodyki tworzenia wyzwań uczenia maszynowego oraz technik opracowywania ich rozwiązań. Praca składa się z cyklu siedmiu artykułów opublikowanych w materiałach pokonferencyjnych międzynarodowych konferencji. Publikacje dotyczą przetwarzania języka naturalnego, widzenia komputerowego i prognozowania szeregów czasowych. W trzech z nich autor dysertacji jest jedynym autorem, w innych trzech jest pierwszym autorem, w ostatniej jest drugim autorem. Trzy prace wprowadzają nowe wyzwania, opisując metodologię pozyskania datasetu, podziału między danymi trenującymi i testowymi, doboru metryk ewaluacyjnych, przygotowywania baseline. Jedna praca opisuje usprawnienie istniejącego wyzwania oraz ewaluuje szereg modeli w ramach tego wyzwania. Pozostałe trzy prace prezentują rozwiązania do istniejących wyzwań i zawierają między innymi techniki optymalizacji modeli. To develop new machine learning methods, it is necessary to evaluate them reliably. This doctoral thesis discusses some aspects of preparing machine learning challenges and techniques for developing their solutions. The work consists of seven papers published in international conference proceedings concerning natural language processing, computer vision, and time series forecasting. The thesis author is the sole author of three of them, the first author of three others, and a second author of the remaining one. Three papers introduce new challenges, describing the methodology of dataset acquisition, preparation of dataset splits, choice of evaluation metric, and preparation of baselines. One paper reports the improvement of an existing challenge and evaluates various methods for it. The remaining three papers provide solutions to existing challenges, including model optimization techniques.
  • Item
    Wykorzystanie narzędzi robotyki w nauczaniu informatyki
    (2023) Borkowicz, Barbara; Szymański, Jerzy. Promotor; Juskowiak, Edyta. Promotor pomocniczy
    Wykorzystanie narzędzi robotyki w edukacji jest tematem zainteresowania osób związanych z nauczaniem już od dłuższego czasu. Wraz z postępem technologicznym na rynku pojawiają się coraz to nowe narzędzia mające na celu wsparcie rozwoju umiejętności uczniów oraz zwiększenie ich aktywności w toku nauki. Niniejsza praca ma na celu zbadanie skuteczności takich narzędzi w procesie edukacji informatycznej. Praca składa się z dwóch rozdziałów. Pierwszy zawiera studium literatury dotyczące roli nauczyciela i wyzwań w przygotowaniu do tego zawodu. Opisano również wyzwania w nauczaniu informatyki i umiejętności, które należy kształcić w procesie edukacji informatycznej oraz metody LEGO® Education, których celem jest promowanie praktycznej nauki i zdolności rozwiązywania problemów wśród uczniów. Drugi rozdział poświęcony jest badaniom mającym na celu analizę skuteczności narzędzi LEGO® Education w edukacji. Podzielone są na sześć etapów, w ramach których analizowany jest rozwój umiejętności miękkich oraz przedmiotowych u uczniów szkoły podstawowej, ponadpodstawowej oraz studentów. W ramach badań analizowano również wyzwania stojące przed nauczycielami podczas wdrażania narzędzi robotyki w klasie. Wyniki dostarczają cennych informacji o wykorzystaniu narzędzi informatyki w edukacji i mogą pomóc nauczycielom w podejmowaniu świadomych decyzji dotyczących włączenia ich do programu nauczania. The use of robotics tools in education has been a topic of interest for educators for a while. With technological advancements, new tools are emerging in the market aimed at supporting students' skill development and increasing their engagement in the learning process. This study aims to investigate the effectiveness of such tools in computer science education. The paper consists of two chapters. The first one includes a literature review on the role of teachers and the challenges involved in preparing for this profession. It also describes the challenges in teaching computer science and the skills that need to be developed in the process of computer science education. Additionally, it explores LEGO® Education methods, which promote hands-on learning and problem-solving abilities among students. The second chapter focuses on research aimed at analyzing the effectiveness of LEGO® Education tools in computer science education. The research is divided into six stages, which examine the development of both soft and subject-specific skills among elementary, secondary, and university students. The study also analyzes the challenges faced by teachers when implementing robotics tools in the classroom. The results provide valuable insights into the use of computer science tools in education and can assist teachers in making informed decisions regarding their inclusion in the curriculum.
  • Item
    Modele ewaluacji poprawności danych lingwistycznych pozyskanych metodą crowdsourcing
    (2023) Włodarczyk, Wojciech; Jassem, Krzysztof. Promotor
    Crowdsourcing pozwala na wykorzystanie zbiorowej inteligencji dużej grupy ludzi do rozwiązywania zadań z dziedzin takich jak sztuczna inteligencja, uczenie maszynowe i rozwój badań naukowych za pośrednictwem platform internetowych. Współcześnie badania nad rozwojem metody crowdsourcingu skupione są przede wszystkim w trzech obszarach: optymalizacji jakości pozyskanych danych, optymalizacji kosztu procesu oraz optymalizacji czasu trwania procesu. Niniejsza rozprawa skupia się na zagadnieniach związanych z optymalizacją jakości procesu crowdsourcingu dla zadań dotyczących danych lingwistycznych. Praca opisuje autorski model Dynamicznej Informacji Zwrotnej (DIZ), którego zadaniem jest generowanie informacji zwrotnej w sposób automatyczny. Rozprawa weryfikuje skuteczność tego modelu dla danych empirycznych oraz danych symulacyjnych. Analiza wyników przeprowadzonego eksperymentu wykazuje skuteczność modelu DIZ w poprawie jakości generowanej informacji zwrotnej, jednak jakość tego rozwiązana jest zależna od jakości oznaczeń tworzonych przez anotatorów. Crowdsourcing uses the collective intelligence of a large group of people to solve tasks in fields such as artificial intelligence, machine learning and scientific research development through online platforms. Nowadays, research on the development of the crowdsourcing method is focused primarily in three areas: optimization of the quality of acquired data, optimization of the cost of the process and optimization of the duration of the process. This dissertation focuses on issues related to optimizing the quality of the crowdsourcing process for tasks related to linguistic data. The work describes the author's Dynamic Feedback Model, whose task is to generate feedback automatically. The dissertation verifies the effectiveness of this model for empirical and simulation data. The analysis of the results of the experiment shows the effectiveness of the author's model in improving the quality of the generated feedback, but the quality of this solution depends on the quality of the markings created by annotators.
  • Item
    Mnożniki punktowe i ich własności
    (2023) Tomaszewski, Jakub; Płuciennik, Ryszard. Promotor; Leśnik, Karol. Promotor pomocniczy
    Celem tej rozprawy jest opis przestrzeni mnożników punktowych działających pomiędzy pewnymi klasami krat Banacha oraz sformułowanie pewnych warunków gwarantujących słabą zwartość operatorów mnożenia punktowego. Głównym wynikiem pierwszej części pracy jest pełen opis przestrzeni mnożników punktowych pomiędzy dwoma różnymi przestrzeniami Orlicza. Rozwiązujemy tym samym problem postawiony przez O'Neila w roku 1965. Ponadto otrzymujemy równoważny warunek na faktoryzację dwóch przestrzeni Orlicza. Drugi rozdział poświęcamy na uogólnienie powyższego wyniku na przestrzenie Musielaka-Orlicza oraz Calderóna-Łozanowskiego. Dowodzimy, że przestrzeń mnożników punktowych pomiędzy różnymi przestrzeniami Musielaka-Orlicza jest kolejną przestrzenią z tej klasy, generowaną przez uogólnioną funkcję dopełniająca. Uzyskujemy także analogiczny opis w przypadku pary przestrzeni Calderóna-Łozanowskiego. W ostatnim rozdziale badamy słabą zwartość w funkcyjnych kratach Banacha. Najważniejszym wynikiem tego rozdziału jest twierdzenie mówiące, że funkcyjna krata Banacha X jest 1-rozłącznie jednorodna wtedy i tylko wtedy, gdy spełnia kryterium Dunfforda-Pettisa, czyli zbiory relatywnie słabo zwarte pokrywają się z X-jednostajnie całkowalnymi. Podajemy także nowe przykłady krat 1-rozłącznie jednorodnych. Uzyskane wyniki pozwalają nam podać charakteryzacje słabo zwartych mnożników. The aim of this dissertation is to describe the space of pointwise multipliers acting between certain classes of Banach lattices and to formulate conditions implying weak compactness of pointwise multiplication operators. The main result of the first part is a complete description of the space of pointwise multipliers between two distinct Orlicz spaces. We thus solve the problem posed by O'Neil in 1965. Moreover, we obtain an equivalent condition for the factorization of two Orlicz spaces. The second chapter is devoted to the generalization of the above result to Musielak-Orlicz and Calderón-Łozanowski spaces. We prove that the space of pointwise multipliers between different Musielak-Orlicz spaces is another space of this class, generated by a generalized complemented function. We also obtain an analogous description in the case of a pair of Calderón- Łozanowski spaces. In the last chapter we study weak compactness in function Banach lattices. The main result of this chapter is the theorem stating that a function Banach lattice X is 1-disjointly homogeneous if and only if it satisfies the Dunfford-Pettis criterion, i.e. the relatively weakly compact sets coincide with the X-uniformly integrable sets. We also give new examples of a 1-disjointly homogeneous lattices. The obtained results allow us to characterize weakly compact multipliers.
  • Item
    Wielopoziomowe matematyczne modelowanie roślinności, gleby i pogody
    (2023) Makowski, Miłosz; Wygralak, Maciej. Promotor; Pałubicki, Wojciech. Promotor pomocniczy
    Niniejsza dysertacja przedstawia nowatorskie podejście do modelowania realistycznych ekosystemów roślinności w zmiennych warunkach klimatycznych. Poprzednie metody starały się zredukować złożoność obliczeniową poprzez przyjęcie geometrycznych uproszczeń roślin kosztem dokładności modelowania. Inne metody umożliwiały szczegółową reprezentację roślin, jednak nie były odpowiednie do symulacji dużych ekosystemów. W tej pracy proponuje się wielopoziomową reprezentację ekosystemów roślinnych, która łączy szczegółowość z wydajnością. Podejście to uwzględnia zjawiska biologiczne, takie jak wzrost, rozsiewanie, tropizm i konkurencja o zasoby, a także modeluje wzajemne oddziaływania między roślinnością, glebą i pogodą, w tym lokalną zmiennością klimatyczną. W celu symulacji cyklu hydrologicznego opracowano model dynamiki chmur, który uwzględnia parowanie roślin i gleby, formację chmur i opady atmosferyczne. Ponadto zamodelowano transport wody w glebie na podstawie właściwości gleby oraz grawitacji. Zaproponowana metoda pozwala na interaktywne symulacje setek tysięcy roślin, uwzględniając interakcje na poziomie lokalnego zróżnicowania klimatu i zachowując zgodność z biologicznymi modelami znanymi w leśnictwie, botanice i ekologii. Podsumowując, praca ta przyczynia się do rozwoju generowania realistycznych krajobrazów z roślinnością i pogodą, potencjalnie służąc jako środek do walidacji hipotez biologicznych. Przedstawiona metoda ma szerokie zastosowanie w dziedzinach takich jak ekologia, leśnictwo i architektura krajobrazu. This dissertation presents a novel approach for modeling realistic ecosystems of vegetation under variable climatic conditions. Prior methods either reduce computational complexity through coarse geometrical approximations or provide a very detailed representation that is unsuitable for large ecosystem simulations. Therefore, this research proposes a multi-scale representation of plant ecosystems that balances detail with efficiency. This approach captures biological features such as growth, seeding, tropism, and competition for resources while modeling the feedback between vegetation, soil, and weather, including local variations of climate. To simulate the hydrological cycle, the research develops a cloud dynamics model that handles evaporation of plants and soil, cloud formation, and precipitation. Additionally, the approach models water propagation in the soil based on soil properties and gravity. The proposed method can run interactive simulations of hundreds of thousands of plants, capturing interactions with local variations of climate while adhering to biological priors known in forestry, botany, and ecology research. Overall, this research contributes to the advancement of generating realistic outdoor landscapes of vegetation and weather, potentially serving as a means for validating biological hypotheses. This approach has broad applications in fields such as ecology, forestry, and landscape architecture.
  • Item
    Metody optymalizacji jakości w neuronowych systemach tłumaczenia maszynowego
    (2023) Nowakowski, Artur; Jassem, Krzysztof. Promotor; Lison, Maciej. Promotor pomocniczy
    Rozprawa doktorska przedstawia nowe metody optymalizacji jakości w neuronowych systemach tłumaczenia maszynowego. Praca składa się z siedmiu artykułów naukowych zaprezentowanych podczas konferencji o zasięgu międzynarodowym. Rozdział 1 opisuje problem badawczy, motywację, strukturę i zakres rozprawy. Zawiera przegląd oraz krótki opis załączonych artykułów, w tym informacje o autorach, miejscu i typie prezentacji, a także wkładzie autora rozprawy. Rozdziały od 2 do 5 prezentują prace badawcze dotyczące metod optymalizacji jakości w neuronowych systemach tłumaczenia maszynowego. Zawierają również opisy metod zastosowanych w rozwiązaniach konkursów organizowanych w ramach konferencji. W rozdziałach 6 do 8 przedstawiono artykuły opisujące prace rozwojowe. W ramach artykułów opisano neuronowe systemy tłumaczenia maszynowego opracowane w trakcie doktoratu wdrożeniowego. W załącznikach zamieszczono certyfikat otrzymany od organizatorów konferencji WMT 2022 oraz deklaracje o wkładzie współautorów każdego artykułu. The thesis presents new quality optimization methods in neural machine translation systems. It is based on seven scientific papers presented at international conferences. Chapter 1 introduces the research problem, motivation, structure and scope of the thesis. It provides an overview of the included papers, together with details on authors, venues, presentation type, and the contribution of the thesis author. The chapter also contains a short description of each paper included in the thesis. Chapters 2 to 5 present research papers on quality optimization methods in neural machine translation systems. They also include descriptions of methods applied in the solutions of shared tasks held at scientific conferences. Chapters 6 to 8 present development papers that describe real-world neural machine translation systems developed as part of participation in the Industrial PhD program. The appendices include a certificate from the WMT 2022 conference organizers and declarations of contribution from the co-authors of each paper.
  • Item
    O grafach Reeba i powiązanych obiektach
    (2022) Michalak, Łukasz Patryk; Marzantowicz, Wacław. Promotor; Kaluba, Marek. Promotor pomocniczy
    Niniejsza rozprawa przedstawia wyniki dotyczące grafów Reeba funkcji gładkich na rozmaitości. Jednym z podstawowych problemów w tej tematyce jest scharakteryzowanie grafów, które mogą być grafami Reeba określonych klas funkcji. Znacznie trudniejszym problemem jest pytanie o zbiór dopuszczalnych grafów Reeba funkcji na ustalonej rozmaitości. Korzystając z teorii Morse'a podajemy szereg twierdzeń realizacyjnych dla grafów Reeba, począwszy na wyznaczeniu możliwych rang cyklicznych występujących grafów Reeba, a skończywszy na opisaniu ich typów homeomorfizmu czy izomorfizmu. Z grafem Reeba związane są dwa rodzaje obiektów: epimorfizmy na grupę wolną, zwane epimorfizmami Reeba, oraz systemy hiperpowierzchni w rozmaitości. Przedstawiamy szereg własności tych obiektów i ich związków z grafami Reeba. W szczególności dowodzimy, że każdy epimorfizm z grupy podstawowej rozmaitości na grupę wolną jest indukowany przez system hiperpowierzchni, który nie rozspójnia tej rozmaitości. Pokazujemy także związek klas kobordyzmu obramowanego systemów hiperpowierzchni modulo dyfeomorfizmy rozmaitości z klasami silnej równoważności epimorfizmów na grupy wolne. Dokonujemy pełnego wyliczenia tych klas dla powierzchni. Uzyskane wyniki pozwalają rozszerzyć twierdzenia realizacyjne w celu scharakteryzowania epimorfizmów Reeba funkcji Morse'a.
  • Item
    Wybrane własności przestrzeni Orlicza-Lorentza
    (2022) Kończak, Joanna; Foralewski, Paweł. Promotor
    Główna część pracy jest poświęcona pewnym własnościom topologicznym i geometrycznym w funkcyjnych i ciągowych przestrzeniach Orlicza-Lorentza z normą Orlicza. Wykazana została równość norm Orlicza i Amemiyi oraz rozważono problem osiągania infimum w przypadku tej drugiej normy. Następnie pokazano równoważność zbieżności normowej i modularnej oraz wprowadzono wzór na normę funkcji charakterystycznej. W dalszej kolejności podano kryteria na porządkową ciągłość, własność Kadeca-Klee względem lokalnej zbieżności według miary, istnienie porządkowych, liniowo-izometrycznych kopii oraz własności monotonicznościowe. Zaprezentowano również odpowiednie własności dla podprzestrzeni elementów porządkowo ciągłych. Wyniki zastosowano do klasycznych przestrzeni Orlicza z normą Orlicza. Następnie badano własność lokalnej jednostajnej niekwadratowości w funkcyjnych przestrzeniach Orlicza-Lorentza z norma Luxemburga. Ponadto przedstawiono warunki dostateczne i konieczne na to, by punkt sfery jednostkowej był punktem niekwadratowym. Na końcu podano odpowiednie wnioski dotyczące przestrzeni Orlicza z normą Luxemburga.
  • Item
    Aproksymacja macierzy kowariancji wybranymi strukturami w modelach podwójnie wielowymiarowych
    (2021) Mokrzycka, Monika; Filipiak, Katarzyna. Promotor
    Przedmiotem badań niniejszej rozprawy jest aproksymacja rozbieżności między dwoma rozkładami prawdopodobieństwa o różnych macierzach kowariancji, wyrażonej za pomocą entropijnej lub kwadratowej funkcji straty. Rozważane są modele podwójnie wielowymiarowe pozwalające na analizę danych, w których występują dwa źródła zmienności, na przykład, gdy kilka cech obserwowanych jest wielokrotnie w czasie. Naturalną strukturą zależności jest wówczas iloczyn Kroneckera dwóch macierzy symetrycznych, określonych dodatnio. W pracy rozważa się również przypadki, gdy jeden z czynników ma dodatkowo strukturę macierzy kompletnej symetrii lub procesu autoregresji pierwszego rzędu. Algorytmy wyznaczania minimum odpowiedniej funkcji rozbieżności zastosowane zostały w badaniach symulacyjnych do identyfikacji struktury kowariancyjnej, do zaproponowania estymatorów struktur kowariancyjnych i zbadania ich własności statystycznych oraz w kontekście badania mocy testów, do pomiaru rozbieżności między zbiorami struktur kowariancyjnych rozważanych w procesie testowania hipotez. Wyniki algebraiczne zostały zinterpretowane na danych rzeczywistych.
Uniwersytet im. Adama Mickiewicza w Poznaniu
Biblioteka Uniwersytetu im. Adama Mickiewicza w Poznaniu
Ministerstwo Nauki i Szkolnictwa Wyższego