Pozyskiwanie danych leksykalnych z tekstówelektronicznych (na materiale czasopisma naukowego)

dc.contributor.advisorWierzchoń, Piotr. Promotor
dc.contributor.authorParyzek, Piotr
dc.date.accessioned2011-10-28T08:46:40Z
dc.date.available2011-10-28T08:46:40Z
dc.date.issued2011-10-28T08:46:40Z
dc.description.abstractPraca dotyczy wybranych metod pozyskiwania, czyli ekscerpcji, informacji o charakterze leksykalnym z elektronicznych zbiorów tekstów.Jej celem jest, po pierwsze, sformułowanie nowych, oryginalnych metod, które mogą być użyteczne w pozyskiwaniu materiału do analiz leksykalnych, a następnie zbadanie ich na wybranym zbiorze tekstów.Planowano opracowanie metod niewymagających zaawansowanej znajomości programowania komputerowego, a jednocześnie umożliwiających uzyskanie wartościowych wyników, gdzie za wartościowość metody uznaje się daną wydajność ekscerpcyjną. Trzy sformułowane metody dopracowano i zoptymalizowano.Metoda ekscerpcji jednostek nowych dostarczyła ponad 1000 wyrazów nowych, niezarejestrowanych, metoda ekscerpcji kolokacji w oparciu o akronimy daje ponad 6000 jednostek, zaś metoda ekscerpcji kolokacji wykorzystująca końcówkę liczby mnogiej dała ponad 110 tysięcy wyodrębnionych jednostek.pl_PL
dc.description.abstractThe principal objective of the thesis is to exemplify, based on three specific and verified methods, that automation of successive steps of lexicographic data retrieval using customised procedures is possible. The common feature of all the three methods is the use of linguistic discriminants which instead of statistics or other mathematical means make it possible to discern the words or phrases of interest. The lexicographic methods developed and tested in the thesis include the retrieval of putative new words or collocations from English-language texts.pl_PL
dc.identifier.urihttp://hdl.handle.net/10593/1422
dc.language.isoplpl_PL
dc.subjectjęzykoznawstwo korpusowepl_PL
dc.subjectcorpus linguisticspl_PL
dc.subjectjęzyk angielskipl_PL
dc.subjectEnglish languagepl_PL
dc.subjectmetody automatycznepl_PL
dc.subjectautomatic methodspl_PL
dc.subjectleksykografiapl_PL
dc.subjectlexicographypl_PL
dc.titlePozyskiwanie danych leksykalnych z tekstówelektronicznych (na materiale czasopisma naukowego)pl_PL
dc.title.alternativeRetrieval of lexical data from electronic texts, based on data from a scientific journalpl_PL
dc.typeDysertacjapl_PL

Files

Original bundle
Now showing 1 - 1 of 1
Loading...
Thumbnail Image
Name:
Piotr Paryzek.pdf
Size:
1.49 MB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
1.58 KB
Format:
Item-specific license agreed upon to submission
Description:
Uniwersytet im. Adama Mickiewicza w Poznaniu
Biblioteka Uniwersytetu im. Adama Mickiewicza w Poznaniu
Ministerstwo Nauki i Szkolnictwa Wyższego