Narodowy Korpus Języka Polskiego

Narodowy Korpus Języka Polskiego (często skracane do NKJP) – korpus języka polskiego, uruchomiony w 2012 roku. Korpus został opracowany przez Instytut Podstaw Informatyki PAN, Instytut Języka Polskiego PAN, Wydawnictwo Naukowe PWN oraz Zakład Językoznawstwa Komputerowego i Korpusowego Uniwersytetu Łódzkiego[1]. Projekt został zrealizowany na zlecenie Ministerstwa Nauki i Szkolnictwa Wyższego.

Korpus zawiera słowa obejmujące literaturę polską, czasopisma codzienne oraz specjalistyczne, jak również nagrania dialogów oraz teksty z internetu. NKJP jest korpusem zróżnicowanym, to znaczy zawiera teksty z wielu różnych gatunków, rejestrów oraz stylów językowych[1].

NKJP umożliwia analizę morfosyntaktyczną przy pomocy specjalnego tagera o nazwie PANTERA stworzonego specjalnie na potrzeby projektu[2].

Przypisy

  1. a b O projekcie NKJP (pol.). nkjp.pl. [dostęp 2018-12-23].
  2. Bańko i in. 2012 ↓, s. 208.

Bibliografia