Doktoraty (WMiI)

Permanent URI for this collectionhttps://repozytorium.amu.edu.pl/handle/10593/769

Browse

Now showing 1 - 20 of 103

Oszacowania rozgrywanych liczb Ramseya
(2025) Adamski, Grzegorz; Bednarska-Bzdęga, Małgorzata. Promotor
Praca skupia się na oszacowaniach rozgrywanych liczb Ramseya. Dowodzimy m.in., że jeśli graf G nie jest dwudzielny, a H jest spójny, to rozgrywana liczba Ramseya dla pary (G, H) wynosi co najmniej (fi+1)v(H)+e(H)−2fi+1, gdzie fi jest złotą liczbą. Znajdujemy też dokładne wartości dla gry czworokąt vs. ścieżka. Ponadto prezentujemy metodę (pół)potencjału, która pozwala znajdować oszacowania rozgrywanych liczb Ramseya i dowodzimy, że jest ona uniwersalna. Pokazujemy też, że wiele ze znanych dowodów dotyczących rozgrywanych liczb Ramseya da się wyrazić w języku tej metody. The work focuses on estimates of online Ramsey numbers. We prove, among other things, that if a graph G is not bipartite and H is connected, then the online Ramsey number for the pair (G, H) is at least (phi+1)v(H)+e(H)−2phi+1, where phi is the golden ratio. We also determine the exact values for the game between a quadrilateral and a path. Furthermore, we present the (semi-)potential method, which allows for estimating online Ramsey numbers, and we prove that it is universal. We also show that many of the known proofs concerning online Ramsey numbers can be expressed in the language of this method.
Detektory Arakiego-Haaga, teoria Mourre’a i problem asymptotycznej zupełności w algebraicznej teorii pól kwantowych
(2025) Kruse, Janik; Dybalski, Wojciech. Promotor
Teoria rozpraszania opisuje asymptotyczną ewolucję układów oddziałujących cząstek. Kluczowym pojęciem w tej dziedzinie jest asymptotyczna zupełność, która jest dobrze zrozumiana w nierelatywistycznej mechanice kwantowej. Pozostaje ona otwartym i trudnym problemem w lokalnej relatywistycznej teorii pól kwantowych (QFT). Współczesne dowody asymptotycznej zupełności w mechanice kwantowej opierają się na oszacowaniu Mourre’a, oszacowaniach propagacyjnych oraz zbieżności obserwabli asymptotycznych, takich jak asymptotyczna prędkość. W QFT detektory Arakiego-Haaga stanowią naturalne obserwable asymptotyczne. Ich zbieżność jest warunkiem koniecznym dla asymptotycznej zupełności w QFT. W tej pracy dowodzimy zbieżności detektorów Arakiego Haaga na stanach o ograniczonej energii, które należą do absolutnie ciągłej części spektrum energii i pędu poniżej progu trójcząstkowego. Nasz dowód wykazuje podobieństwa do dowodów istnienia i zupełności operatorów falowych w mechanice kwantowej. W szczególności stosujemy metodę operatora sprzężonego Mourre’a do wyprowadzenia lokalnego oszacowania zaniku. Ponadto stosujemy metodę Mourre’a, aby wykazać regularność rezolwent (tzw. limiting absorption principle) dla operatorów energii i pędu w relatywistycznej QFT. W ten sposób odtworzyliśmy wyniki dotyczące własności spektralnych operatorów energii i pędu, takie jak brak osobliwego spektrum ciągłego. Scattering theory describes the asymptotic evolution of systems of interacting particles. A key concept in this area is asymptotic completeness, which is well-understood in non relativistic quantum mechanics but remains a challenging problem in local relativistic quantum field theory (QFT). Modern proofs of asymptotic completeness in quantum mechanics rely on a Mourre estimate, propagation estimates, and the convergence of asymptotic observables. In QFT, Araki–Haag detectors are natural candidates for asymptotic observables. Controlling their convergence is an important prerequisite for asymptotic completeness in QFT. We prove the convergence of Araki–Haag detectors on states of bounded energy that belong to the absolutely continuous part of the energy-momentum spectrum below the three particle threshold. Our proof shares similarities with proofs of the existence and completeness of wave operators in quantum mechanics. Notably, we apply Mourre’s conjugate operator method to derive a local decay estimate. Moreover, we employ Mourre’s method to derive a limiting absorption principle for the energy-momentum operators in relativistic QFT. The limiting absorption principle allows us to reproduce results on spectral properties of the energy momentum operators.
Generowanie i walidacja syntetycznych zbiorów danych obrazów do trenowania modeli sztucznej inteligencji w wizji komputerowej
(2025) Kałużny, Jacek; Dyczkowski, Krzysztof. Promotor; Pałubicki, Wojciech. Promotor pomocniczy
Niniejsza rozprawa doktorska dotyczy generowania i walidacji syntetycznych zbiorów danych obrazów do trenowania modeli w widzeniu komputerowym. Głównym celem pracy jest rozwiązanie problemów związanych z niedoborem danych oraz ich zmiennością˛ w kontekście trenowania solidnych i dokładnych modeli SI. Zaproponowano wieloaspektowe podejście obejmujące opracowanie nowych technik generowania danych syntetycznych, tworzenie realistycznych i zróżnicowanych zbiorów danych oraz rygorystyczną walidację tych zbiorów poprzez kompleksowe eksperymenty. Początkowa faza badań skupia się na rekonstrukcji botanicznych drzew na podstawie pojedynczych obrazów z wykorzystaniem zaawansowanych algorytmów uczenia maszynowego. Zaproponowana została metoda wykorzystująca "Radial Bounding Volumes" oraz dwumodalne modele wzrostu, aby dokładnie odtworzyć struktury 3D drzew. Technikę zwalidowano poprzez intensywne testy na rzeczywistych zbiorach danych, wykazując jej skuteczność w tworzeniu wysokiej jakości rekonstrukcji. Badania zostały rozszerzone na tworzenie syntetycznych zbiorów danych poprzez wykorzystywanie ControlNet zintegrowanego z Stable Diffusion do generowania realistycznych syntetycznych obrazów roślin. To autorskie podeście obejmuje szczegółowy proces tworzenia anotowanych obrazów, zapewniając, że zbiory danych są odpowiednie do trenowania modeli głębokiego uczenia. Ostatnia faza pracy obejmuje walidację syntetycznych zbiorów danych. Przeprowadzony został szereg eksperymentów porównujących wydajność modeli SI trenowanych na danych syntetycznych z tymi trenowanymi na danych rzeczywistych. Wyniki wskazują, że modele trenowane na powstałych syntetycznych zbiorach danych działają porównywalnie, a w niektórych przypadkach przewyższają modele trenowane na tradycyjnych zbiorach danych. To podkreśla potencjał danych syntetycznych do uzupełniania lub nawet zastępowania danych rzeczywistych w niektórych aplikacjach. Badania te wnoszą wkład w dziedzinę widzenia komputerowego poprzez dostarczenie solidnych metod generowania i walidacji danych syntetycznych, torując drogę do bardziej efektywnego i ekonomicznego trenowania modeli SI. Wyniki maja˛ istotne implikacje dla różnych zastosowań, w tym automatyzacji rolnictwa, badań biologicznych i innych. This thesis explores the generation and validation of synthetic image datasets for training models in computer vision. The core objective is to address the challenges of data scarcity and variability in training robust and accurate AI models. A multi-faceted approach was adopted, involving the development of novel techniques for synthetic data generation, the creation of realistic and diverse datasets, and the rigorous validation of these datasets through comprehensive experiments. The initial phase of the research focuses on the reconstruction of botanical trees from single images, leveraging advanced machine learning algorithms. A method was introduced using radial bounding volumes and bi-modal growth models to accurately reconstruct 3D tree structures. This technique was validated through extensive testing against real-world datasets, demonstrating its efficacy in producing high-fidelity reconstructions. Subsequently, the investigation was expanded to synthetic dataset creation, utilizing ControlNet integrated with Stable Diffusion to generate realistic synthetic images of various plants. This approach includes a detailed pipeline for generating annotated images, ensuring the datasets are suitable for training deep learning models for tasks. The final phase involves the validation of the synthetic datasets. A series of experiments were conducted to compare the performance of AI models trained on synthetic data versus those trained on real data. The results indicate that models trained on these synthetic datasets perform comparably to, and in some cases exceed, those trained on traditional datasets. This highlights the potential of synthetic data to supplement or even replace real data in certain applications. This research contributes to the field of computer vision by providing robust methods for synthetic data generation and validation, paving the way for more efficient and cost-effective training of AI models. The findings have significant implications for various applications, including agricultural automation, urban planning, and beyond.
Strategie działania inteligentnych systemów wspierających kształcenie operujące na danych nieprecyzyjnych
(2025) Szczepański, Marcin; Marciniak, Jacek. Promotor
Niniejsza praca ma na celu zaproponowanie metody adaptacji treści w kursie e-learningowym pozwalającej na wykorzystanie różnych zjawisk dydaktycznych. W rozprawie jest prezentowana architektura kursu z adaptacyjną zawartością, która posłuży do opracowania metody adaptacji opartej na wybranych nieprecyzyjnych danych dydaktycznych, wykorzystując sterowanie rozmyte. W pracy zostaje dokonany przegląd dostępnych innych rozwiązań w obszarze realizowania różnych strategii dydaktycznych. Praca ilustruje również problemy związane z pozyskiwaniem i przetwarzaniem różnych danych dydaktycznych oraz przedstawia metody modelowania danych nieprecyzyjnych. Ponadto, zostaje dokonana ewaluacja różnych sterowników rozmytych w porównaniu z wybranymi algorytmami uczenia maszynowego. Rozprawa prezentuje różne strategie działania inteligentnych systemów wspierających kształcenie, a także omówiony jest proces implementacji i pozyskiwania danych z kursu z adaptacyjną zawartością. This dissertation aims to propose a method for content adaptation in an e-learning course to leverage various learning phenomena. The study introduces a course architecture featuring adaptive content, which will serve as the foundation for developing an adaptation technique utilizing selected imprecise educational data through fuzzy control. The document surveys existing solutions within the domain of implementing various teaching strategies. It also delineates the challenges associated with acquiring and processing varied educational data, emphasizing the issue of modeling imprecise data. Furthermore, the effectiveness of various fuzzy controllers is compared with machine learning algorithms. Various strategies for the operation of intelligent tutoring systems are presented in the dissertation, along with discussions on the implementation process and data collection within a course with adaptive content.
Działania grup na rozmaitościach acyklicznych i rzeczywistych przestrzeniach rzutowych
(2025) Pulikowski, Jan; Pawałowski, Krzysztof M. Promotor
Do ważnych problemów dotyczących działań zwartych grupy Liego G na rozmaitościach gładkich należy opis pojawiających się zbiorów punktów stałych. Taki zbiór jest rozmaitością gładką, o ile działanie grupy G jest gładkie. Można więc zadać pytanie, jakie warunki są konieczne i wystarczające na to, by rozmaitość gładka była dyfeomorficzna ze zbiorem punktów stałych działania gładkiego grupy G na rozmaitości o specyficznych własnościach, np., na rozmaitości ściągalnej, jak dysk czy tez przestrzeń euklidesowa. W tym przypadku odpowiedzi na zadane pytanie udzielił Lowell Jones (gdy G jest p-grupa skończona), Krzysztof Pawałowski (gdy G jest torusem lub G jest rozszerzeniem p-grupy skończonej o torus) i Robert Oliver (gdy G jest grupa skończona, której rzad nie jest potęga liczby pierwszej). W rozprawie rozważa się działania gładkie grupy G na rozmaitościach gładkich, które są pseudo-równoważne z danym G-szablonem (tj. skończonym G-CW kompleksem spójnym o niepustym i spójnym zbiorze punktów stałych). Wyniki autorów wspomnianych powyżej dotyczą działań grup na rozmaitościach ściągalnych, tj. pseudo-równoważnych z jednym punktem. W rozprawie wyniki te rozszerzone są do działań grup G na rozmaitościach pseudo-równoważnych z G-szablonem mod-p acyklicznym (Twierdzenie 0.1) i acyklicznym (Twierdzenie 0.2). Przy dodatkowym założeniu, ze zbiory punków stałych są rozmaitościami stabilnie paralelizowalnymi, ich opis jest podany bez żadnego ograniczenia na G-szablon (Twierdzenie 0.3). Podano tez warunek konieczny i wystarczający na istnienie działania gładkiego grupy skończonej G (której rzad nie jest potęgą liczby pierwszej) bez punktów stałych na zwartej rozmaitości gładkiej pseudo-równoważnej z dowolnie zadanym G-szablonem (Twierdzenie 0.4). W szczególności, istnieje działanie gładkie skończonej grupy G bez punktów stałych na zwartej rozmaitości gładkiej pseudo-równoważnej z rzeczywista przestrzenią rzutowa parzysto-wymiarowa z trywialnym działaniem grupy G, wtedy i tylko wtedy, gdy G jest grupa Olivera. Wykazano też, ze każda skończona grupa Olivera posiada działanie gładkie bez punktów stałych na pewnej rzeczywistej przestrzeni rzutowej parzysto-wymiarowej (Twierdzenie 0.5). Among important problems concerning actions of compact Lie groups G on smooth manifolds is the description of the occurring fixed point sets. Such a set is a smooth manifold, assuming the action of the group G is smooth. Therefore, one may ask what are the necessary and sufficient conditions for a smooth manifold to be diffeomorphic to the fixed point set of a smooth action of G on a smooth manifold with specific properties, e.g, on a contractible manifold (such as a disk or Euclidean space). In the case of actions on contractible manifolds, the answer to the posed question goes back to Lowell Jones (when G is a finite p-group), Krzysztof Pawałowski (when G is a torus or G is an extension of a finite p-group by a torus) and Robert Oliver (when G is a finite group not of prime power order). In this thesis, one considers smooth actions of a group G on smooth manifolds which are pseudo-equivalent to a given G-template (i.e., a finite connected G-CW complex with non-empty and connected fixed point set). The results of authors mentioned above concern group actions on contractible manifolds, i.e., pseudo-equivalent to one point. In this thesis, the results are extended to actions of groups G on manifolds pseudo-equivalent to a mod-p acyclic G-template (Theorem 0.1) and an acyclic G-template (Theorem 0.2). Under the additional assumption that the fixed point sets in question are stably parallelizable, the description of the fixed point sets is obtained without any additional restriction on the G-template. Moreover, a necessary and sufficient condition is given for the existence of a smooth fixed point free action of a finite group G (not of prime power order) on a compact smooth manifold pseudo-equivalent to any given G-template (Theorem 0.4). In particular, the result shows that there exists a smooth fixed point free action of a finite group G on a compact smooth manifold pseudo-equivalent to an even-dimensional real projective space with the trivial action of G, if and only if G is an Oliver group. Finally, it is proven that each finite Oliver group G has a smooth fixed point free action on some even-dimensional real projective space (Theorem 0.5).
Tematy dotyczące robotyki topologicznej: o złożoności topologicznej przestrzeni Eilenberga-MacLane’a i efektywnej złożoności topologicznej
(2025) Espinosa Baro, Arturo; Marzantowicz, Wacław Bolesław. Promotor; Błaszczyk, Zbigniew. Promotor pomocniczy
W przedstawionej rozprawie doktorskiej omawiany kilka dotyczących relacji pomiędzy złożonością topologiczną, kategorią sekcyjną i grupami. Merytorycznie treść pracy podzielona jest na dwa główne nurty tematyczne. W pierwszej części dysertacji, badamy zagadnienia związane z opisem złożoności topologicznej, oznaczanej przez TC, przestrzeni Eilenberga-MacLane’a. Po pierwsze wprowadzamy pojęcie kategorii sekcyjnej monomorfizmów grup jako ogólne narzędzie do badań, które pozwala też opisać postawiony pierwotnie problem. Następnie uzyskujemy uogólnienie charakteryzacji Farbera, Grant, Luptona i Oprei TC grupy w terminach odwzorowań współzmienniczych do przestrzeni klasyfikujących pełne rodziny podgrup. Używając wprowadzonych pojęć określamy kanoniczną relatywną klasę i badamy jej własności. Dodatkowo pokazujemy, że do badania secat(H -> G) można wykorzystać pojęcie kohomologii Adamsona. Kolejno, uogólniamy określenie pojęcia istotnych klas kohomologii do przypadku dowolnych monomorfizmów grup, i konstruujemy bardziej ogólną wersję ciągu spektralnego Farbera-Meschera. To ostatnie pozwala uzyskać nowe ograniczenie na secat(H -> G), które wykorzystujemy aby otrzymać nowe ograniczenie dolne na ciągową i włóknistą złożoność topologiczną. Na koniec tej części podajemy charakteryzację TC grupy G w terminach A-genusu w sensie Clapp i Puppe. W drugiej części przedstawiamy pewne własności efektywnej topologicznej złożoności w sensie Błaszczyka i Kaluby dla przestrzeni z działaniem grupy. Po pierwsze wprowadzamy pojęcie efektywnej LS-kategorii, a następnie opisujemy związki pomiędzy efektywną złożonością topologiczną, kategorią i odwzorowaniem rzutowania na przestrzeń orbit w wybranych przypadkach podając obliczenia i przykłady. Na zakończenie podajemy warunki kohomologiczne pozwalające określić w jakich przypadkach efektywna złożoność topologiczna jest niezerowa w wymiarze dwa. In this dissertation we work on several problems concerning the relationship between topological complexity and sectional category, and groups. The work presented here can be divided in two main branches. In the first part of the thesis, we investigate topics related with the description of the topological complexity of Eilenberg-MacLane spaces. First we develop the notion of sectional category of group monomorphisms, as a more general framework of study and which contains the original problem, and we provide a generalization of a characterization from Farber, Grant, Lupton and Oprea of TC of a group in terms equivariant maps to the classifying space of full families of subgroups. We also develop a relative canonical class in this setting, and study its properties. Additionally, we introduce the notion of Adamson cohomology theory into the study of secat(H ->G). We will proceed as well to generalize the notion of essential cohomology classes to arbitrary group monomorphisms, and to build a more general version of the Farber-Mescher spectral sequence in order to get a new bound for secat(H -> G), which we will specialize to obtain new lower bounds of sequential and fiberwise TC. To finish this first part, we provide a characterization of TC of a group G in terms of the A-genus in the sense of Clapp and Puppe. In the second part, we switch our point of view, and consider, instead of K(G,1)-spaces, actions of groups over spaces, and so we investigate some properties of the effective topological complexity of Błaszczyk and Kaluba. First we develop a notion of effective LS-category, and then we observe the relationship between the effective TC and cat and the orbit map with respect to the action in some situations, giving several computations and examples. We will finish by providing cohomological arguments to determine cases in which such effective TC is non-zero in dimension two.
Rozpoznawanie jednostek nazwanych i ekstrakcja informacji z dokumentów różnego typu
(2025) Nowakowska, Gabriela; Górecki, Tomasz. Promotor
Rozprawa doktorska prezentuje nowatorskie wykorzystanie metod rozpoznawania jednostek nazwanych i ekstrakcji informacji do przetwarzania dokumentów różnego typu. Praca składa się z czterech artykułów naukowych opublikowanych na konferencjach międzynarodowych. Rozdział 1 opisuje problem badawczy, motywację i uzyskane efekty oraz strukturę i zakres rozprawy. Zawiera także przegląd i podsumowanie załączonych artykułów. Rozdziały 2 i 3 przedstawiają prace badawcze związane z wykorzystaniem metod rozpoznawania jednostek nazwanych, które posłużyły jako część rozwiązania problemów zdefiniowanych w konkursach organizowanych w ramach międzynarodowych konferencji. Rozdział 2 zawiera opis systemu tłumaczenia powstałego w ramach WMT 2022. Rozdział 3 opisuje nowe modele lematyzacji jednostek nazwanych zastosowane w rozwiązaniu konkursu z Slavic NLP 2023. Rozdziały 4 i 5 dotyczą artykułów prezentujących modele sieci neuronowych powstałe w ramach prac wdrożeniowych. Rozdział 4 opisuje model TILT związany z pracą nad ekstrakcją informacji z dokumentów o dwuwymiarowej strukturze. W rozdziale 5 przedstawiono model STable do ekstrakcji danych tabelarycznych. Na końcu pracy znajdują się załączniki, w których zawarte są certyfikaty otrzymane od organizatorów konkursów, a także pierwsze strony uzyskanych patentów. Jako ostatnie zamieszczone zostały deklaracje o wkładzie współautorów. The thesis presents a novel use of named entity recognition and information extraction methods for processing documents of various types. The thesis consists of four scientific articles published at international conferences. Chapter 1 describes the research problem, motivation and results obtained, as well as the structure and scope of the thesis. It also includes an overview and summary of the attached articles. Chapters 2 and 3 present research work related to the use of named entity recognition methods, which served as part of the solution to problems defined in competitions held at international conferences. Chapter 2 describes the translation system developed as part of WMT 2022. Chapter 3 describes novel models for lemmatization of named entities used in solving the competition with Slavic NLP 2023. Chapters 4 and 5 are about articles presenting neural network models created as part of the industrial work. Chapter 4 describes the TILT model related to the work on extracting information from two-dimensional documents. Chapter 5 presents the STable model for extracting tabular data. At the end of the work are appendices that include certificates received from competition organizers, as well as the first pages of patents obtained. Lastly, declarations of the contributions of the co-authors are included.
Regularyzacja i estymacja macierzy kowariancji o strukturze liniowej
(2024) Mieldzioc, Adam; Markiewicz, Augustyn. Promotor
Niniejsza rozprawa poświęcona jest regularyzacji i estymacji macierzy kowariancji o strukturze liniowej, mających szerokie zastosowania w wielu dziedzinach nauki. Celem pracy jest zaproponowanie metody identyfikacji struktury liniowo ustrukturyzowanej macierzy kowariancji, a następnie dokonanie modyfikacji jej klasycznego estymatora za pomocą rzutowania ortogonalnego i strukturyzowanej metody kurczenia. Uzyskany w ten sposób estymator jest określony dodatnio oraz dobrze uwarunkowany. Ponadto, za pomocą badań symulacyjnych zweryfikowane zostały własności statystyczne proponowanego estymatora oraz dokonano porównania nowego estymatora z ustrukturyzowanym liniowo estymatorem największej wiarogodności. W pracy zaproponowane zostały dwa algorytmy: pierwszy służy do wyznaczania minimum odpowiedniej funkcji rozbieżności w zagadnieniu identyfikacji struktury kowariancji, natomiast drugi wykorzystywany jest do wyliczania estymatora macierzy kowariancji o strukturze liniowej za pomocą metody największej wiarogodności. The doctoral dissertation is dedicated to the regularization and estimation of linearly structured covariance matrices, which have broad applications in various fields. The aim of the thesis is to propose a method of identification of the structure of linearly structured covariance matrix, followed by the modification of its classical estimator using orthogonal projection and structured shrinkage method. The resulting estimator is positive definite and well conditioned. Moreover, the statistical properties are examined through simulation studies and compared with the linearly structured maximum likelihood estimator. Two algorithms are presented in the thesis: one for determination of the minimum of the appropriate divergence function that is used to identify the structure of covariance, and the second to compute the estimate of linearly structured covariance matrix being positive definite and well conditioned using maximum likelihood method.
Application of speech datasets management methods for the evaluation of Automatic Speech Recognition systems for Polish
(2024) Junczyk, Michał; Jassem, Krzysztof. Promotor
Automatic Speech Recognition (ASR) systems convert speech to text, supporting virtual assistants and transcription. The effectiveness of ASR depends on extensive and diverse speech data sets. The Polish language, spoken by over 50 million people, poses unique challenges for ASR systems due to its complex phonetic and morphological structure. This study examines issues with the accessibility and interoperability of public speech data sets, which hinder ASR system verification. It reviewed 53 public data sets, organizing 24 of them to create a quality assessment process. The selected sets contain nearly 400,000 recordings and 800 hours of speech from 5,000 speakers, used to compare 7 ASR systems and 25 models. The results revealed significant performance differences. The study improved data management and comparative analysis, enhancing the practical usability of Polish ASR data sets. Organized data sets BIGOS and PELCRA were used for comprehensive tests. Improved documentation and data analysis, along with available testing tools, facilitate test replication and validation of other studies using the same data sets. In summary, the research supports the practical application of Polish ASR data sets, promoting methods, tools, and best practices in ASR system evaluation. Systemy automatycznego rozpoznawania mowy (ASR) konwertują mowę na tekst, wspierając wirtualnych asystentów i transkrypcje. Skuteczność ASR zależy od obszernych i różnorodnych zbiorów danych mowy. Język polski, używany przez ponad 50 milionów ludzi, stawia unikalne wyzwania systemom ASR ze względu na złożoną strukturę fonetyczną i morfologiczną. Badanie analizuje problemy z dostępnością i interoperacyjnością publicznych zbiorów danych mowy, co utrudnia weryfikację systemów ASR. Zbadano 53 publiczne zbiory danych, uporządkowano 24 z nich, tworząc proces oceny jakości. Wyselekcjonowane zbiory zawierają prawie 400 000 nagrań i 800 godzin mowy od 5000 mówców, użytych do porównania 7 systemów ASR i 25 modeli. Wyniki ujawniły znaczne różnice w wydajności. Badanie poprawiło zarządzanie danymi i analizę porównawczą, zwiększając praktyczną użyteczność dostępność polskich zbiorów danych ASR. Uporządkowane zbiory BIGOS i PELCRA zostały wykorzystane do przekrojowych testów. Udoskonalona dokumentacja i analiza danych oraz dostępność narzędzi do testowania ułatwia powtórzenie testów, oraz walidację wyników innych badań z użyciem tych samych zbiorów danych. Podsumowując, badania wspierają praktyczne zastosowanie polskich zbiorów danych ASR, promując metody, narzędzia i dobre praktyki w ocenie systemów ASR.
Wieloskalowe modelowanie systemów biologicznych: obliczeniowe podejście do badania zjawisk naturalnych od poziomu komórki po ekosystemy
(2024) Kokosza, Andrzej; Dyczkowski, Krzysztof. Promotor
Badanie zjawisk naturalnych za pomocą symulacji komputerowych oferuje szerokie możliwości ze względu na złożoność, dynamiczną naturę wzorców obserwowanych w tych procesach. Te zjawiska, począwszy od mechanizmów komórkowych, po szeroko zakrojone dynamiki ekologiczne kształtujące nasze środowisko, prezentują unikalne zachowania i wyzwania. Niniejsza praca doktorska prezentuje rozwój i walidację kilku modeli obliczeniowych symulujących procesy biologiczne na różnych skalach. Celem dysertacji jest po pierwsze wykazanie, że modele obliczeniowe mogą dokładnie odtwarzać i przewidywać złożone systemy biologiczne na różnych skalach; po drugie zilustrowanie konieczności zastosowania różnorodnych podejść do modelowania zjawisk biologicznych; oraz po trzecie, pokazanie, że modele matematyczne można wykorzystać do walidacji lub kwestionowania istniejących teorii biologicznych oraz identyfikacji obszarów wymagających dalszych badań. Przedstawiam trzy modele specyficznych zjawisk naturalnych, które zostały zwalidowane na podstawie danych empirycznych. Obejmują one dyskretny model formowania wzorca naczyniowego w Arabidopsis thaliana, ciągły model długodystansowego przesyłania sygnału w drzewach oraz zaawansowaną hybrydową symulację pożarów lasów. Wyniki potwierdziły postawione założenia oraz pozwoliły ocenić przydatność stosowanych paradygmatów modelowania w różnych scenariuszach. The study of natural phenomena gives rich opportunities for those interested in modelling and simulations. The challenge they present lies in the complexity and dynamic nature of such patterns. These processes, ranging from the cellular mechanisms to the environmental or ecological dynamics challenge our understanding and push the boundaries of traditional scientific disciplines. This thesis shows the development and validation of several computational models that simulate complex biological processes. The goal of this dissertation is first to demonstrate that computational models can accurately replicate and predict complex biological systems across different scales; second to illustrate the necessity of diverse modelling approaches to address distinct biological phenomena; and third, to illustrate that mathematical models can be utilized to validate or challenge existing biological theories and identify areas requiring further investigation. I present three models of specific natural phenomena validated against empirical data. These include a discrete model for vascular pattern formation in Arabidopsis thaliana, a continuous model of long-distance signalling in birch trees, and an advanced hybrid simulation of wildfires. The results supported the assumptions posed, Additionally, they allowed us to assess the applicability of modelling paradigms used in different scenarios.
Wykorzystanie zasobów ustrukturyzowanych w neuronowych modelach języka
(2024) Turski, Michał; Graliński, Filip. Promotor
Większość badań w dziedzinie przetwarzania języka naturalnego koncentruje się na przetwarzaniu tekstu. Choć ten paradygmat jest bardzo skuteczny w wielu zastosowaniach, takich jak tłumaczenie maszynowe, automatyczne podsumowywanie i systemy dialogowe, nie potrafi w pełni wykorzystać bogactwa wielu dokumentów tworzonych przez i dla ludzi. Dokumenty przekazują znaczenie nie tylko przez warstwę tekstową, ale także poprzez swoją strukturę i cechy wizualne. Kluczowym wyzwaniem podejmowanym w tej pracy jest proponowanie rozwiązań rozszerzających najnowsze modele języka o wykorzystanie informacji strukturalnych celem poprawy jakości przetwarzania dokumentów. Niniejsza rozprawa składa się z pięciu prac naukowych w domenie rozumienia dokumentów i jest podzielona na dwie główne sekcje. Pierwsza sekcja dotyka problemu oceny modeli rozumienia dokumentów. Druga sekcja tej pracy podejmuje różne wyzwania w domenie rozumienia dokumentów, proponując innowacyjne rozwiązania mające na celu poprawę jakości modeli. Podsumowując, ta praca przyczynia się do rozwoju modeli rozumienia dokumentów, umożliwiając lepsze przetwarzanie i analizę dokumentów o bogatej strukturze. The majority of research in the field of Natural Language Processing is focused on processing plain text. While this paradigm is highly effective for numerous use cases, such as machine translation, summarization, and chatbots, it fails to fully harness the richness of many texts created by and for humans. Documents, on the other hand, convey meaning not only through their textual content but also through their structure and visual features. A key challenge tackled by this thesis is to develop solutions that combine recent advancements in language modeling with structural information to improve the processing and comprehension of documents. This thesis comprises five scientific papers in the domain of document understanding, divided into two main sections. The first section focuses on evaluating document understanding models. The second section of this thesis tackles various challenges in the document understanding domain, proposing innovative solutions to enhance model performance. Overall, this thesis contributes to the development of more accurate and useful document understanding models, enabling improved processing and comprehension of rich, structured documents.
Estymacja i testowanie macierzy kowariancji należących do podprzestrzeni kwadratowych
(2024) John, Mateusz; Filipiak, Katarzyna. Promotor
Celem rozprawy doktorskiej jest zaproponowanie testów dotyczących struktur kowariancyjnych w modelach podwójnie wielowymiarowych. Ze względu na hierarchiczny charakter rozważanych eksperymentów odpowiednimi strukturami są macierze blokowe. W pracy rozważa się struktury blokowe należące do podprzestrzeni kwadratowych. Proponowane testy obejmują test ilorazu wiarogodności, test wynikowy Rao oraz test Walda. Wymienione testy porównywane są ze sobą ze względu na szybkość zbieżności do granicznego rozkładu chi-kwadrat oraz moc. Do porównania użyto metod symulacyjnych. Ponadto, ponieważ w każdym rozważanym teście istotną rolę odgrywają estymatory największej wiarogodności nieznanych parametrów, w pracy pokazano, że estymatory te można uzyskać przez rzutowanie na odpowiednią podprzestrzeń kwadratową. Przedstawione wyniki zilustrowano na przykładzie danych rzeczywistych. The aim of the Ph. D. dissertation is to propose tests for covariance structures in doubly multivariate models. Due to the hierarchical nature of the considered experiments, block matrices are appropriate structures. The work considers block structures belonging to the quadratic subspaces. The proposed tests include the likelihood ratio test, the Rao score test and the Wald test. The mentioned tests are compared with each other in terms of the speed of convergence to the limiting chi-square distribution and the power. For the comparison simulation methods were used. Moreover, since the maximum likelihood estimators of unknown parameters have an important role in each considered test, the work shows that these estimators can be obtained by projecting onto an appropriate quadratic subspace. Presented results are illustrated using real data example.
Zastosowanie teorii zbiorów rozmytych w klasyfikacji dominującej dyscypliny naukowej autorów w naukometrii
(2024) Szymula, Łukasz; Dyczkowski, Krzysztof. Promotor; Kwiek, Marek. Promotor
Jednym z głównych zagadnień w naukometrii jest klasyfikacja dyscyplin naukowych autorów, co ma znaczący wpływ na ocenę ich dorobku naukowego. Tradycyjne metody, oparte na prostych algorytmach i ograniczonej interpretacji danych, często prowadzą do niejednoznaczności w klasyfikacji. W pracy zaproponowano zastosowanie teorii zbiorów rozmytych, stworzonej przez Lotfiego Zadeha, jako rozwiązanie tego problemu. Teoria ta pozwala na modelowanie nieprecyzyjności informacji i oferuje nowe perspektywy dla uzyskania jednoznacznej klasyfikacji dyscyplin w dużej skali. Głównym celem pracy jest zbadanie możliwości wykorzystania teorii zbiorów rozmytych do ulepszenia algorytmu klasyfikacji dominującej dyscypliny naukowej autorów posługując się wartością modalną. Przeprowadzone przeze mnie badania miały na celu nie tylko teoretyczne zrozumienie wpływu zastosowania tej teorii na klasyfikację, ale również praktyczne sprawdzenie skuteczności proponowanych modyfikacji na podstawie pełnej bibliometrycznej bazy danych Scopus udostępnionej w platformie ICSR Lab, Elsevier. Hipotezy badawcze skupiały się zarówno na możliwości zwiększenia jednoznaczności klasyfikacji poprzez identyfikację kluczowych pojęć z obszaru naukometrii, jak i na określeniu podobieństwa klasyfikacji uzyskanej przez zaproponowane modyfikacje z powszechnie stosowanym podejściem, które nie uwzględnia nieprecyzyjności informacji. W badaniu wykorzystano najpopularniejsze metody z teorii zbiorów rozmytych, dzięki którym usprawniono proces klasyfikacji dyscyplin naukowych autorów. Pierwsze zaproponowane rozwiązanie obejmowało wykorzystanie zmiennych lingwistycznych reprezentowanych przez trzy poziomy intensywności: niskie, średnie i wysokie. Kolejnym skutecznym rozwiązaniem okazało się zbudowanie sterowników rozmytych do tworzenia bardziej elastycznych reguł klasyfikacji. Ostatnie podejście obejmowało agregacje wartości rozmytych operatorami OWA. Dzięki tym trzem propozycjom, uzyskano bardziej jednoznaczną klasyfikację autorów w naukometrii. Wykorzystanie tej metody pozwoliło na poprawę jednoznacznej klasyfikacji z około 69% do ponad 95%. Dzięki zastosowanym modyfikacjom jednoznaczna klasyfikacja autorów wzrosłą zatem o ponad 37% w porównaniu do podejścia, które nie uwzględnia nieprecyzyjności informacji. Wyniki moich badań wskazują na znaczącą rolę stosowania teorii zbiorów rozmytych w naukometrii, co otwiera drogę do dalszych badań w obu dziedzinach. One of the main issues in Scientometrics is the classification of authors' scientific disciplines, which has a significant impact on the evaluation of their scientific output. Traditional methods, based on simple algorithms and limited interpretation of data, often lead to ambiguities in classification. This thesis proposes the use of fuzzy set theory, developed by Lotfi Zadeh, as a solution to this problem. This theory allows to model the imprecision of information and offers new perspectives for achieving unambiguous classification of disciplines on a large scale. The main purpose of the work is to explore the possibility of using fuzzy set theory to improve the classification algorithm of the authors' dominant scientific discipline using modal value. The study I conducted aimed not only to theoretically understand the impact of application of this theory on classification, but also to practically test the effectiveness of the proposed modifications on the basis of the full bibliometric database Scopus provided in the platform ICSR Lab, Elsevier. The research hypotheses focused both on the possibility of increasing the unambiguity of the classification by identifying key concepts from the field of Scientometrics, and on determining the similarity of the classification obtained by the proposed modifications with the commonly used approach that does not take into account imprecision of information. The study used the most popular methods from fuzzy set theory to improve classification process of the authors' scientific disciplines. The first proposed solution involved the use of linguistic variables represented by three levels of intensity: low, medium and high. Another effective solution was the construction of fuzzy controllers to create more flexible classification rules. The last approach involved aggregating fuzzy values with OWA operators. With these three proposals, a more unambiguous classification of authors in Scientometrics has been achieved. The use of this method improved the unambiguous classification from about 69% to over 95%. Thus, with the modifications used, the unambiguous classification of authors increased by more than 37% compared to an approach that does not take into consideration the imprecision of information. The results of my research indicate a significant role for the application of fuzzy set theory in Scientometrics, which opens the possibilities for further research in both fields.
Modele rekomendacyjne wspólnej filtracji w serwisach ogłoszeniowych
(2024) Kwieciński, Robert; Górecki, Tomasz. Promotor; Filipowska, Agata Jolanta. Promotor pomocniczy
W wielu praktycznych zastosowaniach liczba dostępnych produktów jest zbyt duża, by użytkownicy byli w stanie się z nimi zapoznać. Problem ten adresują systemy rekomendacyjne. W rozprawie przedstawiamy wyniki badań dotyczących modeli wspólnej filtracji w serwisach ogłoszeniowych, na przykładzie serwisów Grupy OLX. W prezentowanej pracy omawiamy szczególne cechy serwisów ogłoszeniowych mające wpływ na dobór metod rekomendacji oraz ewaluacji. Przedstawiamy wyniki ewaluacji offline oraz online dla istniejących modeli oraz pokazujemy przewagę modelu RP3Beta nad pozostałymi metodami. Przedstawiamy infrastrukturę pozwalającą na generowanie rekomendacji w czasie rzeczywistym oraz pokazujemy możliwość jej zastosowania dla wielu istniejących modeli rekomendacji. Prezentujemy wyniki testów A/B pokazujących skuteczność proponowanego rozwiązania. Wprowadzamy nową grafową metodę rekomendacji, P3LTR, będącą uogólnieniem modelu RP3Beta. Pokazujemy przewagę modelu P3LTR nad modelem RP3Beta pod względem metryk dokładności oraz pokrycia podczas ewaluacji offline. Proponujemy także nową grafową sieć neuronową, P3GNN. Pokazujemy jej przewagę pod względem metryk dokładności nad istniejącymi grafowymi sieciami neuronowymi. Prezentujemy także opublikowany przez autora zbiór danych oraz proces skutecznego wdrożenia omawianych rozwiązań w serwisach Grupy OLX. In many practical applications, the number of available products often exceeds what users can feasibly familiarize themselves with. Recommendation systems address this problem. In the dissertation, we present the results of a study on collaborative filtering models in online classifieds, using OLX Group’s websites as examples. In this work, we discuss the specific characteristics of online classifieds that influence the selection of recommendation and evaluation methods. We present offline and online evaluation results for existing models and show the advantage of the RP3Beta model over other methods. We present the infrastructure created to generate recommendations in real-time and show its applicability to many existing recommendation models. We present the results of A/B tests showing the effectiveness of the proposed solution. We introduce a new graph-based recommendation method, P3LTR, which is a generalisation of the RP3Beta model. We demonstrate the advantage of the P3LTR model over the RP3Beta model in terms of accuracy and coverage metrics during offline evaluation. We also propose a new graph neural network, P3GNN. We show its superiority in terms of accuracy metrics over existing graph neural networks. We also present a dataset published by the author and the process of successful implementation of the discussed solutions on OLX Group's websites.
Zaprojektowanie oraz implementacja systemu automatycznej korekcji błędów i normalizacji wyjścia z systemu rozpoznawania mowy
(2024) Ziętkiewicz, Tomasz; Marciniak, Jacek. Promotor; Kubis, Marek. Promotor pomocniczy
Niniejsza rozprawa prezentuje zaproponowane przez autora metody automatycznej korekty błędów i normalizacji wyjścia z systemów rozpoznawania mowy. Przy ich opracowaniu brany był pod uwagę wdrożeniowy kontekst prowadzonych badań, które odbywały się z myślą o zastosowaniu opracowanych modeli w ramach systemów dialogowego. Praca przedstawia ten kontekst i specyfikę rozwoju modeli korekty ASR w środowisku przemysłowym. Zaproponowana w pracy metoda korekty błędów "Otaguj i popraw" traktuje problem korekty błędów jako problem tagowania sekwencji operacjami edycyjnymi. W pracy można znaleźć szczegółowy opis metody z uwzględnieniem użytego zbioru operacji edycyjnych, procesu generowania tagów operacji edycyjnych oraz metody ich aplikowania do poprawianego zdania. Zaprezentowane są wyniki licznych eksperymentów przeprowadzonych z jej użyciem na zróżnicowanych danych. Przedstawiono również metodę przywracania znaków interpunkcyjnych "Otaguj i przywróć", wzorowaną na metodzie "Otaguj i popraw". Opisane podejście do problemów korekty i normalizacji wyjścia z systemu rozpoznawania mowy charakteryzuje się możliwością precyzyjnej kontroli nad działaniem metody, a także możliwością łatwej interpretacji jego działania. Możliwość zastosowania z tą metodą dowolnych modeli tagowania sprawia, że można ją dostosować do środowiska, w którym metoda ma być wdrożona, poprzez wybór modeli o dopasowanych do środowiska wymaganiach obliczeniowych. Cechy te stanowią o użyteczności zaproponowanych metod w środowiskach produkcyjnych. Przedstawiono również zastosowanie zaproponowanej metody korekty błędów do badania wpływu błędów ASR na efektywność modeli NLU. This dissertation presents proposed methods for automatic error correction and normalization of speech recognition results. The development of these methods took into account the context of their deployment within dialogue systems. The paper presents this context and the specifics of the development of ASR correction models in an industrial environment. The "Tag and correct" error correction method proposed in the paper treats the problem of error correction as a problem of tagging sequences with editing operations. The paper offers a detailed description of the method including the set of edit operations used, the process of generating tags of edit operations, and a method of applying them to a sentence being corrected. The results of numerous experiments carried out on diverse datasets are presented. The "Tag and restore" method of restoring punctuation marks, inspired by the "Tag and correct" method, is also presented. The described approach to the problems of correction and normalization of output from a speech recognition system is characterized by the possibility of precise control over the operation of the method. The ability to use any tagging model within this method makes it adaptable to the environment in which the method is to be deployed, by selecting models with computational requirements that match the environment resources. These features account for the usefulness of the proposed methods in production environments. The application of the proposed error correction method to study the impact of ASR errors on the efficiency of NLU models is also presented.
Nowe metody i zbiory danych do inteligentnego przetwarzania dokumentów
(2024) Jurkiewicz, Dawid; Graliński, Filip. Promotor
Rozprawa podejmuje dwa kluczowe obszary w ramach dziedziny inteligentnego przetwarzania dokumentów (ang. Intelligent Document Processing): identyfikację relewantnych fragmentów tekstu (ang. Span Identification) i problematykę rozumienia dokumentów (ang. Document Understanding). Duży nacisk położony jest na zmierzenie się z wyzwaniami związanymi z małą ilością dostępnych danych. Aby rozwiązać ten problem, zaproponowano zbiór danych dla identyfikacji relewantnych fragmentów tekstu na podstawie kilku przykładów oraz unikatową metodę do wyszukiwania podsekwencji na podstawie kilku przykładów. Oprócz rozwiązań bazujących na kilku przykładach, przedstawiono metody do identyfikacji i klasyfikacji fragmentów tekstu zawierających propagandę. Ponadto wprowadzono multimodalny model oparty na architekturze Transformer dla problematyki rozumienia dokumentów. Model rozumie semantykę tekstu, cechy wizualne i strukturę dokumentu oraz potrafi odpowiadać na różne sformułowania w języku naturalnym dotyczące dokumentu. Dodatkowo zaproponowano pierwszy zestaw zbiorów danych pozwalający społeczności na dokładną obserwację postępów w dziedzinie rozumienia dokumentów. Na koniec zaprezentowano wymagający konkurs dla problematyki rozumienia dokumentów zawierający nowatorskie pary typów pytań i odpowiedzi dla wielodomenowych, wielobranżowych i wielostronicowych dokumentów. This thesis aims to contribute innovative solutions and datasets to the Intelligent Document Processing (IDP) domain. The focus is set on two key areas within IDP: Span Identification (SI) and Document Understanding (DU). Significant emphasis is placed on addressing the challenges posed by low-data scenarios, which are prevalent in various business use cases. A few-shot SI dataset and a unique approach for sub-sequence matching with few examples are proposed to address this. Besides the few-shot setting, methods for identifying and classifying propaganda spans are presented. Furthermore, a multi-modal end-to-end Transformer-based model for Document Understanding is introduced. The model efficiently comprehends layout information, textual semantics, and visual cues present in the document and can answer various document-related questions posed in the natural language. Additionally, the first DU benchmark is proposed, allowing the community to measure the DU field's state accurately. Lastly, a challenging DU competition is showcased. The task features novel question and answer type pairs over multi-domain, multi-industry, and multi-page documents, encouraging the development of solutions with strong generalization capabilities in low-data regimes.
Zastosowanie zbiorów wypukłych do minimalnej reprezentacji różnic funkcji wypukłych w sensie Zalgallera
(2024) Kolassa, Robert; Grzybowski, Jerzy. Promotor
W rozprawie przedstawiono nowe podejście do znajdowania minimalnej reprezentacji różnic funkcji wypukłych (dc-funkcji) w sensie Zalgallera. Zastosowano wyniki badań Palaschke i Urbańskiego nad minimalnymi quasiróżniczkami Demyanova i Rubinova. W szczególności wprowadzono pojęcie maksymalnej pary zbiorów wypukłych ze wspólnym stożkiem recesji oraz powiązano takie pary z minimalnymi reprezentacjami danych dc-funkcji. W tym celu zastosowano dualność Minkowskiego. Ponadto zbadano własności dodawania i odejmowania Minkowskiego w rodzinie wypukłych zbiorów domkniętych o wspólnym stożku recesji. W rezultacie przedstawiono algorytm znajdowania maksymalnej pary równoważnej danej parze. Rozpatrywana jest również minimalna reprezentacja dc-funkcji, która jest zawężeniem różnicy funkcji podliniowych (ds-funkcji) do zwartego zbioru wypukłego. Wprowadzono pojęcie pary L-minimalnej, gdzie L jest zwartym zbiorem wypukłym. Pokazano, że minimalna reprezentacja w sensie Zalgallera zawężonej ds-funkcji odpowiada L-minimalnej parze zwartych zbiorów wypukłych. Udowodniono istnienie i jednoznaczność pary L-minimalnej równoważnej danej parze. Zaprezentowane w rozprawie nowe podejście może być pomocne w udzieleniu odpowiedzi na pytania postawione przez Zalgallera. The thesis presents a new approach to finding the minimal representation of the difference of convex functions (dc-functions) in the sense of Zalgaller. The results of research by Palaschke and Urbański on minimal quasidifferentials of Demyanov and Rubinov are applied. In particular, the notion of a maximal pair of convex sets with a common recession cone is introduced and related to a minimal representation of a given dc-function. Minkowski duality is applied for this purpose. Moreover, the properties of the Minkowski addition and subtraction in a family of closed convex sets with a common recession cone are investigated. As a result, an algorithm for finding the maximum pair equivalent to a given pair is presented. The minimal representation of a dc-function, which is a restriction of the difference of sublinear functions (ds-functions) to a convex compact set, is also examined. The concept of an L-minimal pair is introduced, where L is a convex compact set. It is showed that the minimal representation in the sense of Zalgaller of the restricted ds-function corresponds to the L-minimal pair of compact convex sets. The existence and uniqueness of an L-minimal pair equivalent to a given pair is proved. The new approach presented in the dissertation may be helpful in answering the questions posed by Zalgaller.
Optymalizacja i ewaluacja w wyzwaniach uczenia maszynowego
(2023) Pokrywka, Jakub; Graliński, Filip. Promotor
W celu rozwoju nowych metod uczenia maszynowego konieczna jest ich rzetelna ewaluacja. Niniejsza praca doktorska opisuje pewne aspekty metodyki tworzenia wyzwań uczenia maszynowego oraz technik opracowywania ich rozwiązań. Praca składa się z cyklu siedmiu artykułów opublikowanych w materiałach pokonferencyjnych międzynarodowych konferencji. Publikacje dotyczą przetwarzania języka naturalnego, widzenia komputerowego i prognozowania szeregów czasowych. W trzech z nich autor dysertacji jest jedynym autorem, w innych trzech jest pierwszym autorem, w ostatniej jest drugim autorem. Trzy prace wprowadzają nowe wyzwania, opisując metodologię pozyskania datasetu, podziału między danymi trenującymi i testowymi, doboru metryk ewaluacyjnych, przygotowywania baseline. Jedna praca opisuje usprawnienie istniejącego wyzwania oraz ewaluuje szereg modeli w ramach tego wyzwania. Pozostałe trzy prace prezentują rozwiązania do istniejących wyzwań i zawierają między innymi techniki optymalizacji modeli. To develop new machine learning methods, it is necessary to evaluate them reliably. This doctoral thesis discusses some aspects of preparing machine learning challenges and techniques for developing their solutions. The work consists of seven papers published in international conference proceedings concerning natural language processing, computer vision, and time series forecasting. The thesis author is the sole author of three of them, the first author of three others, and a second author of the remaining one. Three papers introduce new challenges, describing the methodology of dataset acquisition, preparation of dataset splits, choice of evaluation metric, and preparation of baselines. One paper reports the improvement of an existing challenge and evaluates various methods for it. The remaining three papers provide solutions to existing challenges, including model optimization techniques.
Wykorzystanie narzędzi robotyki w nauczaniu informatyki
(2023) Borkowicz, Barbara; Szymański, Jerzy. Promotor; Juskowiak, Edyta. Promotor pomocniczy
Wykorzystanie narzędzi robotyki w edukacji jest tematem zainteresowania osób związanych z nauczaniem już od dłuższego czasu. Wraz z postępem technologicznym na rynku pojawiają się coraz to nowe narzędzia mające na celu wsparcie rozwoju umiejętności uczniów oraz zwiększenie ich aktywności w toku nauki. Niniejsza praca ma na celu zbadanie skuteczności takich narzędzi w procesie edukacji informatycznej. Praca składa się z dwóch rozdziałów. Pierwszy zawiera studium literatury dotyczące roli nauczyciela i wyzwań w przygotowaniu do tego zawodu. Opisano również wyzwania w nauczaniu informatyki i umiejętności, które należy kształcić w procesie edukacji informatycznej oraz metody LEGO® Education, których celem jest promowanie praktycznej nauki i zdolności rozwiązywania problemów wśród uczniów. Drugi rozdział poświęcony jest badaniom mającym na celu analizę skuteczności narzędzi LEGO® Education w edukacji. Podzielone są na sześć etapów, w ramach których analizowany jest rozwój umiejętności miękkich oraz przedmiotowych u uczniów szkoły podstawowej, ponadpodstawowej oraz studentów. W ramach badań analizowano również wyzwania stojące przed nauczycielami podczas wdrażania narzędzi robotyki w klasie. Wyniki dostarczają cennych informacji o wykorzystaniu narzędzi informatyki w edukacji i mogą pomóc nauczycielom w podejmowaniu świadomych decyzji dotyczących włączenia ich do programu nauczania. The use of robotics tools in education has been a topic of interest for educators for a while. With technological advancements, new tools are emerging in the market aimed at supporting students' skill development and increasing their engagement in the learning process. This study aims to investigate the effectiveness of such tools in computer science education. The paper consists of two chapters. The first one includes a literature review on the role of teachers and the challenges involved in preparing for this profession. It also describes the challenges in teaching computer science and the skills that need to be developed in the process of computer science education. Additionally, it explores LEGO® Education methods, which promote hands-on learning and problem-solving abilities among students. The second chapter focuses on research aimed at analyzing the effectiveness of LEGO® Education tools in computer science education. The research is divided into six stages, which examine the development of both soft and subject-specific skills among elementary, secondary, and university students. The study also analyzes the challenges faced by teachers when implementing robotics tools in the classroom. The results provide valuable insights into the use of computer science tools in education and can assist teachers in making informed decisions regarding their inclusion in the curriculum.
Modele ewaluacji poprawności danych lingwistycznych pozyskanych metodą crowdsourcing
(2023) Włodarczyk, Wojciech; Jassem, Krzysztof. Promotor
Crowdsourcing pozwala na wykorzystanie zbiorowej inteligencji dużej grupy ludzi do rozwiązywania zadań z dziedzin takich jak sztuczna inteligencja, uczenie maszynowe i rozwój badań naukowych za pośrednictwem platform internetowych. Współcześnie badania nad rozwojem metody crowdsourcingu skupione są przede wszystkim w trzech obszarach: optymalizacji jakości pozyskanych danych, optymalizacji kosztu procesu oraz optymalizacji czasu trwania procesu. Niniejsza rozprawa skupia się na zagadnieniach związanych z optymalizacją jakości procesu crowdsourcingu dla zadań dotyczących danych lingwistycznych. Praca opisuje autorski model Dynamicznej Informacji Zwrotnej (DIZ), którego zadaniem jest generowanie informacji zwrotnej w sposób automatyczny. Rozprawa weryfikuje skuteczność tego modelu dla danych empirycznych oraz danych symulacyjnych. Analiza wyników przeprowadzonego eksperymentu wykazuje skuteczność modelu DIZ w poprawie jakości generowanej informacji zwrotnej, jednak jakość tego rozwiązana jest zależna od jakości oznaczeń tworzonych przez anotatorów. Crowdsourcing uses the collective intelligence of a large group of people to solve tasks in fields such as artificial intelligence, machine learning and scientific research development through online platforms. Nowadays, research on the development of the crowdsourcing method is focused primarily in three areas: optimization of the quality of acquired data, optimization of the cost of the process and optimization of the duration of the process. This dissertation focuses on issues related to optimizing the quality of the crowdsourcing process for tasks related to linguistic data. The work describes the author's Dynamic Feedback Model, whose task is to generate feedback automatically. The dissertation verifies the effectiveness of this model for empirical and simulation data. The analysis of the results of the experiment shows the effectiveness of the author's model in improving the quality of the generated feedback, but the quality of this solution depends on the quality of the markings created by annotators.

Browse

Recent Submissions