Moce skalarne zbiorów rozmytych i nieprecyzyjne kwantyfikatory lingwistyczne

Scalar cardinalities of fuzzy sets and imprecise linguistic quantifiers


Rozprawa dotyczy teorii i zastosowań pojęcia mocy zbiorów rozmytych w kwantyfikacji lingwistycznej, kategoryzacji tekstów, a przede wszystkim – w sumaryzacji lingwistycznej baz danych. Pierwsza część pracy jest poświęcona konstrukcji ogólnej teorii względnej mocy skalarnej zbiorów rozmytych oraz wprowadzeniu pojęcia uogólnionej mocy skalarnej zbioru rozmytego indukowanej przez uogólnione liczby kardynalne typu FGCount wraz z normami triangularnymi. Druga część pracy rozpoczyna się od analizy metod numerycznej interpretacji zdań skwantyfikowanych lingwistycznie w przypadku użycia uogólnionych koncepcji mocy skalarnej wprowadzonych w pierwszej części. Głównym celem tej części pracy jest prezentacja systemu Quantirius – implementacji własnego podejścia interaktywnego do agregacji danych sterowanych kwantyfikatorami lingwistycznymi. Generowanie i ocena podsumowań lingwistycznych w zbiorach danych jest w systemie realizowana z wykorzystaniem pojęcia protoformy. Kluczowym elementem tej prezentacji jest idea dalszego przetwarzania zbioru wygenerowanych podsumowań. Przedstawiony algorytm wyboru podsumowań, które są najbardziej adekwatną reprezentacją informacji zawartych w zbiorze danych zawiera mechanizm redukcji podsumowań opartej o ich stopnie prawdziwości oraz wzajemną relację, tzn. inkluzję lub nakładanie się unimodalnych terminów lingwistycznych będących ich komponentami.
The work concerns the theory and applications of the notion of fuzzy sets cardinality in a linguistic quantification, text categorization problem and – first of all – in a linguistic summarization of databases. The first part of the work is devoted to the construction of the general theory of the relative scalar cardinality of fuzzy sets and the introduction of the notion of the generalized scalar cardinality of a fuzzy set induced by generalized cardinal numbers FGCount-type with triangular norms. The second part of the work starts with an analysis of the methods of numerical interpretation of linguistically quantified propositions with the general ideas of a scalar cardinality introduced in the first part. The main objective of this part of the work is the presentation of Quantirius system, our interactive approach to a linguistic quantifier driven aggregation of data. The mining and the assessment of validity degrees of linguistic summaries in databases is realized by means of the concept of a protoform. The key element of this presentation is an idea of a further processing of the set of generated summaries. The proposed algorithm is composed of a reduction mechanism of summaries based on linguistic terms inclusion and a reduction of summaries by means of the overlapping unimodal linguistic terms.


zbiory rozmyte, fuzzy sets, moce skalarne, scalar cardinalities, kwantyfikatory lingwistyczne, linguistic quantifiers, sumaryzacja lingwistyczna, linguistic summarization, bazy danych, databases






