Narodowy Korpus Języka Polskiego – teoria i praktyka. Fakty, mity, potrzeby

Loading...
Thumbnail Image

Date

2010

Advisor

Editor

Journal Title

Journal ISSN

Volume Title

Publisher

Instytut Językoznawstwa Wydział Neofilologii, UAM

Title alternative

The National Polish Language Corpus – Theory and Practices. Facts, Myths and Needs

Abstract

Wydaje się, że wszyscy twórcy korpusów przywiązują wagę do tego, żeby były one reprezentatywne i zrównoważone. Zaczynają się jednak pojawiać głosy, iż pojęcia te są mało precyzyjne. W niniejszym referacie autorka zamierza wyjść od przemyśleń na temat tych dwóch pojęć, zastanowić się, czy powinny być one ważne dla twórców korpusu i czy mamy jakąkolwiek alternatywę. Alternatywą może być stworzenie korpusu, którego dobór tekstów nie będzie niczego reprezentował poza samym sobą, a mianowicie teksty powinno się dobrać nie na zasadzie "reprezentatywności", ale na podstawie ich "celowości". Żeby określić celowość, należy się przyjrzeć potrzebom osób z nich korzystających. Należy też pamiętać, że z korpusów korzystają przede wszystkim nieinformatycy, zatem warto by było utworzyć narzędzie, które będzie miało łatwy, przyjazny dla użytkownika interfejs. Dobrym wzorem będą tryby instalacji programów windowsowych. Instalatory często oferują co najmniej dwie możliwości wyboru: wersję standardową, dla mniej zorientowanego w opcjach i poniekąd we własnych potrzebach użytkownika, jak i wersję niestandardową dla użytkowników o wysokim stopniu świadomości własnych potrzeb, umożliwiającą zainstalowanie tylko tych składników, które są rzeczywiście potrzebne.
It may seem that all corpora creators aim at establishing representative and balanced corpora. But some think that those two concepts are not precise. The author analyses whether those two concepts are important for corpora creators and whether there is any alternative. One alternative is the creation of a corpus which would represent only itself – texts would be selected not on the basis of their "representative character" but their "aim". In order to determine the aim of the text, it is necessary to investigate the needs of text users. It should be also born in mind that corpora users are usually not computer scientists and therefore they need a user friendly interface. The installation mode of Windows may be a good example here. The installing software usually offers two installation modes: (i) a standard one for users who are not aware of their needs and (ii) an advanced one for users who know exactly what they need.

Description

Sponsor

Keywords

korpus języka polskiego, reprezentatywność korpusu, zrównoważenie korpusu, celowość korpusu

Citation

Comparative Legilinguistics, vol. 3, 2010, pp. 133-142.

ISBN

DOI

Title Alternative

Rights Creative Commons

Creative Commons License

Uniwersytet im. Adama Mickiewicza w Poznaniu
Biblioteka Uniwersytetu im. Adama Mickiewicza w Poznaniu
Ministerstwo Nauki i Szkolnictwa Wyższego