Narodowy Korpus Języka Polskiego

“Korpus językowy to zbiór tekstów, w którym szukamy typowych użyć słów i konstrukcji oraz innych informacji o ich znaczeniu i funkcji”. Korpus służy prowadzeniu badań językoznawczych, tworzeniu słowników,  podręczników języków obcych, wyszukiwarek uwzględniających polską odmianę i wielu innych narzędzi informatycznych służących pracy z językiem.

Polski korpus stworzony kilka lat temu przez naukowe konsorcjum zawiera ponad 250 milionów słów tekstu, ale z czasem, kiedy postępować będzie digitalizacja jeszcze pełniejszą formą korpusu może stać się Cyfrowa Biblioteka Narodowa Polona. Poza samym tekstem Korpusu tłumaczącym jego użycie, sposób oznaczania słów projekt udostępnił również kilka narzędzi informatycznych m.in. wyszukiwarki słów.

Korpus jest pracą zbiorową pod redakcją Adama Przepiórkowskiego, Mirosława Bańko, Rafała L. Górskiego, Barbary Lewandowskiej-Tomaszczyk.  Projekt realizowały: Instytut Podstaw Informatyki PAN (koordynator), Instytut Języka Polskiego PAN, Wydawnictwo Naukowe PWN, oraz Zakładu Językoznawstwa Komputerowego i Korpusowego Uniwersytetu Łódzkiego.

 

Dodaj komentarz

This site uses Akismet to reduce spam. Learn how your comment data is processed.

Close Menu