Zastosowanie teorii zbiorów rozmytych w klasyfikacji dominującej dyscypliny naukowej autorów w naukometrii
Loading...
Date
2024
Authors
Editor
Journal Title
Journal ISSN
Volume Title
Publisher
Title alternative
Application of Fuzzy Set Theory in Classifying Author’s Dominant Scientific Disciplines in Scientometrics
Abstract
Jednym z głównych zagadnień w naukometrii jest klasyfikacja dyscyplin naukowych autorów, co ma znaczący wpływ na ocenę ich dorobku naukowego. Tradycyjne metody, oparte na prostych algorytmach i ograniczonej interpretacji danych, często prowadzą do niejednoznaczności w klasyfikacji. W pracy zaproponowano zastosowanie teorii zbiorów rozmytych, stworzonej przez Lotfiego Zadeha, jako rozwiązanie tego problemu. Teoria ta pozwala na modelowanie nieprecyzyjności informacji i oferuje nowe perspektywy dla uzyskania jednoznacznej klasyfikacji dyscyplin w dużej skali. Głównym celem pracy jest zbadanie możliwości wykorzystania teorii zbiorów rozmytych do ulepszenia algorytmu klasyfikacji dominującej dyscypliny naukowej autorów posługując się wartością modalną. Przeprowadzone przeze mnie badania miały na celu nie tylko teoretyczne zrozumienie wpływu zastosowania tej teorii na klasyfikację, ale również praktyczne sprawdzenie skuteczności proponowanych modyfikacji na podstawie pełnej bibliometrycznej bazy danych Scopus udostępnionej w platformie ICSR Lab, Elsevier. Hipotezy badawcze skupiały się zarówno na możliwości zwiększenia jednoznaczności klasyfikacji poprzez identyfikację kluczowych pojęć z obszaru naukometrii, jak i na określeniu podobieństwa klasyfikacji uzyskanej przez zaproponowane modyfikacje z powszechnie stosowanym podejściem, które nie uwzględnia nieprecyzyjności informacji. W badaniu wykorzystano najpopularniejsze metody z teorii zbiorów rozmytych, dzięki którym usprawniono proces klasyfikacji dyscyplin naukowych autorów. Pierwsze zaproponowane rozwiązanie obejmowało wykorzystanie zmiennych lingwistycznych reprezentowanych przez trzy poziomy intensywności: niskie, średnie i wysokie. Kolejnym skutecznym rozwiązaniem okazało się zbudowanie sterowników rozmytych do tworzenia bardziej elastycznych reguł klasyfikacji. Ostatnie podejście obejmowało agregacje wartości rozmytych operatorami OWA. Dzięki tym trzem propozycjom, uzyskano bardziej jednoznaczną klasyfikację autorów w naukometrii. Wykorzystanie tej metody pozwoliło na poprawę jednoznacznej klasyfikacji z około 69% do ponad 95%. Dzięki zastosowanym modyfikacjom jednoznaczna klasyfikacja autorów wzrosłą zatem o ponad 37% w porównaniu do podejścia, które nie uwzględnia nieprecyzyjności informacji. Wyniki moich badań wskazują na znaczącą rolę stosowania teorii zbiorów rozmytych w naukometrii, co otwiera drogę do dalszych badań w obu dziedzinach.
One of the main issues in Scientometrics is the classification of authors' scientific disciplines, which has a significant impact on the evaluation of their scientific output. Traditional methods, based on simple algorithms and limited interpretation of data, often lead to ambiguities in classification. This thesis proposes the use of fuzzy set theory, developed by Lotfi Zadeh, as a solution to this problem. This theory allows to model the imprecision of information and offers new perspectives for achieving unambiguous classification of disciplines on a large scale. The main purpose of the work is to explore the possibility of using fuzzy set theory to improve the classification algorithm of the authors' dominant scientific discipline using modal value. The study I conducted aimed not only to theoretically understand the impact of application of this theory on classification, but also to practically test the effectiveness of the proposed modifications on the basis of the full bibliometric database Scopus provided in the platform ICSR Lab, Elsevier. The research hypotheses focused both on the possibility of increasing the unambiguity of the classification by identifying key concepts from the field of Scientometrics, and on determining the similarity of the classification obtained by the proposed modifications with the commonly used approach that does not take into account imprecision of information. The study used the most popular methods from fuzzy set theory to improve classification process of the authors' scientific disciplines. The first proposed solution involved the use of linguistic variables represented by three levels of intensity: low, medium and high. Another effective solution was the construction of fuzzy controllers to create more flexible classification rules. The last approach involved aggregating fuzzy values with OWA operators. With these three proposals, a more unambiguous classification of authors in Scientometrics has been achieved. The use of this method improved the unambiguous classification from about 69% to over 95%. Thus, with the modifications used, the unambiguous classification of authors increased by more than 37% compared to an approach that does not take into consideration the imprecision of information. The results of my research indicate a significant role for the application of fuzzy set theory in Scientometrics, which opens the possibilities for further research in both fields.
Description
Wydział Matematyki i Informatyki
Sponsor
Autor uzyskał środki finansowe w ramach finasowania z projektu badawczego z Narodowego Centrum Nauki PRELUDIUM BIS 1 nr UMO-2019/35/0/HS6/02591 pt. ,,Produktywność badawcza i wzorce współpracy w nauce globalnej. Ujęcie teoretyczne” kierowanego przez prof. dr. hab. Marka Kwieka.
Keywords
naukometria, teoria zbiorów rozmytych, bibliometryczna baza danych, scientometrics, fuzzy set theory, bibliometric database