Narodowy Korpus Języka Polskiego – teoria i praktyka. Fakty, mity, potrzeby
Loading...
Date
2010
Authors
Advisor
Editor
Journal Title
Journal ISSN
Volume Title
Publisher
Instytut Językoznawstwa Wydział Neofilologii, UAM
Title alternative
The National Polish Language Corpus – Theory and Practices. Facts, Myths and Needs
Abstract
Wydaje się, że wszyscy twórcy korpusów przywiązują wagę do tego, żeby były one reprezentatywne i zrównoważone. Zaczynają się jednak pojawiać głosy, iż pojęcia te są mało precyzyjne. W niniejszym referacie autorka zamierza wyjść od przemyśleń na temat tych dwóch pojęć, zastanowić się, czy powinny być one ważne dla twórców korpusu i czy mamy jakąkolwiek alternatywę. Alternatywą może być stworzenie korpusu, którego dobór tekstów nie będzie niczego reprezentował poza samym sobą, a mianowicie teksty powinno się dobrać nie na zasadzie "reprezentatywności", ale na podstawie ich "celowości". Żeby określić celowość, należy się przyjrzeć potrzebom osób z nich korzystających. Należy też pamiętać, że z korpusów korzystają przede wszystkim nieinformatycy, zatem warto by było utworzyć narzędzie, które będzie miało łatwy, przyjazny dla użytkownika interfejs.
Dobrym wzorem będą tryby instalacji programów windowsowych. Instalatory często oferują co najmniej dwie możliwości wyboru: wersję standardową, dla mniej zorientowanego w opcjach i poniekąd we własnych potrzebach użytkownika, jak i wersję niestandardową dla użytkowników o wysokim stopniu świadomości własnych potrzeb, umożliwiającą zainstalowanie tylko tych składników, które są rzeczywiście potrzebne.
It may seem that all corpora creators aim at establishing representative and balanced corpora. But some think that those two concepts are not precise. The author analyses whether those two concepts are important for corpora creators and whether there is any alternative. One alternative is the creation of a corpus which would represent only itself – texts would be selected not on the basis of their "representative character" but their "aim". In order to determine the aim of the text, it is necessary to investigate the needs of text users. It should be also born in mind that corpora users are usually not computer scientists and therefore they need a user friendly interface. The installation mode of Windows may be a good example here. The installing software usually offers two installation modes: (i) a standard one for users who are not aware of their needs and (ii) an advanced one for users who know exactly what they need.
It may seem that all corpora creators aim at establishing representative and balanced corpora. But some think that those two concepts are not precise. The author analyses whether those two concepts are important for corpora creators and whether there is any alternative. One alternative is the creation of a corpus which would represent only itself – texts would be selected not on the basis of their "representative character" but their "aim". In order to determine the aim of the text, it is necessary to investigate the needs of text users. It should be also born in mind that corpora users are usually not computer scientists and therefore they need a user friendly interface. The installation mode of Windows may be a good example here. The installing software usually offers two installation modes: (i) a standard one for users who are not aware of their needs and (ii) an advanced one for users who know exactly what they need.
Description
Sponsor
Keywords
korpus języka polskiego, reprezentatywność korpusu, zrównoważenie korpusu, celowość korpusu
Citation
Comparative Legilinguistics, vol. 3, 2010, pp. 133-142.
Seria
ISBN
ISSN
2080-5926