Przejdź do treści

Narodowy Korpus Języka Polskiego

„Korpus językowy to zbiór tekstów, w którym szukamy typowych użyć słów i konstrukcji oraz innych informacji o ich znaczeniu i funkcji”. Korpus służy prowadzeniu badań językoznawczych, tworzeniu słowników,  podręczników języków obcych, wyszukiwarek uwzględniających polską odmianę i wielu innych narzędzi informatycznych służących pracy z językiem.

Polski korpus stworzony kilka lat temu przez naukowe konsorcjum zawiera ponad 250 milionów słów tekstu, ale z czasem, kiedy postępować będzie digitalizacja jeszcze pełniejszą formą korpusu może stać się Cyfrowa Biblioteka Narodowa Polona. Poza samym tekstem Korpusu tłumaczącym jego użycie, sposób oznaczania słów projekt udostępnił również kilka narzędzi informatycznych m.in. wyszukiwarki słów.

Korpus jest pracą zbiorową pod redakcją Adama Przepiórkowskiego, Mirosława Bańko, Rafała L. Górskiego, Barbary Lewandowskiej-Tomaszczyk.  Projekt realizowały: Instytut Podstaw Informatyki PAN (koordynator), Instytut Języka Polskiego PAN, Wydawnictwo Naukowe PWN, oraz Zakładu Językoznawstwa Komputerowego i Korpusowego Uniwersytetu Łódzkiego.

 

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *

Witryna wykorzystuje Akismet, aby ograniczyć spam. Dowiedz się więcej jak przetwarzane są dane komentarzy.