Grupowa klasyfikacja danych niekompletnych – podejście nieimputacyjne z zastosowaniem we wspomaganiu diagnostyki guzów jajnika

dc.contributor.advisorWygralak, Maciej. Promotor
dc.contributor.authorWójtowicz, Andrzej
dc.date.accessioned2017-06-26T10:07:31Z
dc.date.available2017-06-26T10:07:31Z
dc.date.issued2017
dc.descriptionWydział Matematyki i Informatykipl_PL
dc.description.abstractW niniejszej pracy doktorskiej zająłem się problemem klasyfikacji danych niekompletnych. Motywacja do podjęcia badań ma swoje źródło w medycynie, gdzie bardzo często występuje zjawisko braku danych. Najpopularniejszą metodą radzenia sobie z tym problemem jest imputacja danych, będąca uzupełnieniem brakujących wartości na podstawie statystycznych zależności między cechami. W moich badaniach przyjąłem inną strategię rozwiązania tego problemu. Wykorzystując opracowane wcześniej klasyfikatory można przekształcić je do formy, która zwraca przedział możliwych predykcji. Następnie, poprzez zastosowanie operatorów agregacji oraz metod progowania, można dokonać finalnej klasyfikacji. W niniejszej pracy pokazuję jak dokonać ww. przekształcenia klasyfikatorów oraz jak wykorzystać strategie agregacji danych przedziałowych do klasyfikacji. Opracowane przeze mnie metody podnoszą jakość klasyfikacji danych niekompletnych w problemie wspomagania diagnostyki guzów jajnika. Dodatkowa analiza wyników na zewnętrznych zbiorach danych z repozytorium uczenia maszynowego Uniwersytetu Kalifornijskiego w Irvine (UCI) wskazuje, że przedstawione metody są komplementarne z imputacją. pl_PL
dc.description.abstractIn this doctoral dissertation I focus on the problem of classification of incomplete data. The motivation for the research comes from medicine, where missing data phenomena are commonly encountered. The most popular method of dealing with data missingness is imputation; that is, inserting missing data on the basis of statistical relationships among features. In my research I choose a different strategy for dealing with this issue. Classifiers of a type previously developed can be transformed to a form which returns an interval of possible predictions. In the next step, with the use of aggregation operators and thresholding methods, one can make a final classification. I show how to make such transformations of classifiers and how to use aggregation strategies for interval data classification. These methods improve the quality of the process of classification of incomplete data in the problem of ovarian tumour diagnosis. Additional analysis carried out on external datasets from the University of California, Irvine (UCI) Machine Learning Repository shows that the aforementioned methods are complementary to imputation.pl_PL
dc.identifier.urihttp://hdl.handle.net/10593/17969
dc.language.isoengpl_PL
dc.rightsinfo:eu-repo/semantics/openAccesspl_PL
dc.subjectdane niekompletnepl_PL
dc.subjectincomplete datapl_PL
dc.subjectklasyfikacjapl_PL
dc.subjectclassificationpl_PL
dc.subjectimputacjapl_PL
dc.subjectimputationpl_PL
dc.subjectoperatory agregacjipl_PL
dc.subjectaggregation operatorspl_PL
dc.titleGrupowa klasyfikacja danych niekompletnych – podejście nieimputacyjne z zastosowaniem we wspomaganiu diagnostyki guzów jajnikapl_PL
dc.title.alternativeEnsemble classification of incomplete data – a non-imputation approach with an application in ovarian tumour diagnosis supportpl_PL
dc.typeDysertacjapl_PL

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
phd_thesis_archive.pdf
Size:
1.06 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.47 KB
Format:
Item-specific license agreed upon to submission
Description:
Uniwersytet im. Adama Mickiewicza w Poznaniu
Biblioteka Uniwersytetu im. Adama Mickiewicza w Poznaniu
Ministerstwo Nauki i Szkolnictwa Wyższego